«ИСПОЛЬЗУЕМЫЕ ИНСТРУМЕНТЫ НАУЧНЫХ ДАННЫХ»
Компоненты науки о данных:
Основные компоненты науки о данных приведены ниже.
1. Статистика. Статистика — один из важнейших компонентов науки о данных. Статистика — это способ сбора и анализа числовых данных в большом количестве и извлечения из них осмысленных выводов.
2. Экспертиза в предметной области: в науке о данных экспертиза в предметной области связывает науку о данных воедино. Предметная экспертиза означает специализированные знания или навыки в определенной области. В науке о данных есть различные области, в которых нам нужны специалисты в предметной области.
3. Инжиниринг данных. Инжиниринг данных — это часть науки о данных, которая включает сбор, хранение, извлечение и преобразование данных. Инженерия данных также включает метаданные (данные о данных) к данным.
4. Визуализация. Визуализация данных подразумевает представление данных в визуальном контексте, чтобы люди могли легко понять значение данных. Визуализация данных упрощает доступ к огромному количеству данных в визуальных элементах.
5. Передовые вычисления: тяжелая работа в области науки о данных — это передовые вычисления. Расширенные вычисления включают проектирование, написание, отладку и поддержку исходного кода компьютерных программ.
6. Математика. Математика является важной частью науки о данных. Математика включает изучение количества, структуры, пространства и изменений. Для специалиста по данным важно знание хорошей математики.
7. Машинное обучение. Машинное обучение является основой науки о данных. Машинное обучение предназначено для обучения машины, чтобы она могла действовать как человеческий мозг. В науке о данных мы используем различные алгоритмы машинного обучения для решения проблем.
Инструменты для науки о данных
Ниже приведены некоторые инструменты, необходимые для науки о данных:
- Инструменты анализа данных: R, Python, Statistics, SAS, Jupyter, R Studio, MATLAB, Excel, RapidMiner.
- Хранилище данных: ETL, SQL, Hadoop, Informatica/Talend, AWS Redshift
- Инструменты визуализации данных: R, Jupyter, Tableau, Cognos.
- Инструменты машинного обучения: Spark, Mahout, Azure ML studio.