Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную информацию об использовании файлов cookies можно найти здесь, наши правила обработки персональных данных – здесь. Продолжая пользоваться сайтом, вы подтверждаете, что были проинформированы об использовании файлов cookies сайтом НИУ ВШЭ и согласны с нашими правилами обработки персональных данных. Вы можете отключить файлы cookies в настройках Вашего браузера.

  • A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
ФКН
Контакты
Руководство
Киселева Ирина Анатольевна
Заместитель декана факультета по учебной работе Киселева Ирина Анатольевна
Заместитель декана факультета по работе со студентами Шадрина Елена Викторовна
Отдел сопровождения учебного процесса очных программ бакалавриата и магистратуры: Начальник отдела Емельянова Мария Максимовна

Телефон:
+7 (831) 4320089
6403
email: memelyanova@hse.ru

Создание лабораторных работ по курсу "Анализ данных/Машинное обучение" на основе библиотеки Intel Data Analytics Acceleration Library

На сегодняшний день существует целая наука о данных (data science), которая изучает проблемы обработки, анализа и представления данных. В неё входит множество различных областей, такие как статистические методы, методы интеллектуального анализа данных (data mining), машинное обучение (machine learning), теория распознавания образов (pattern recognition), приложения искусственного интеллекта (AI) и так далее. Библиотека Intel DAAL будет интересна всем, кто имеет отношение к науке о данных и её областях.
       
В рамках совместного  проекта с Intel было подготовлено 11 лабораторных работ по анализу данных/машинному обучению с использованием библиотеки INTEL DAAL.

Руководитель проекта: профессор Калягин Валерий Александрович 

Исполнители: аспиранты факультета Гречихин Иван Сергеевич, Казаков Максим Анатольевич, Николаев Алексей Игоревич

1. Первичный анализ наборов данных
ПрезентацияCorrelationOutliers
Quantiles
Statistics
statistics.pystatistics.r
turkiye
2. Анализ главных компонент
Презентация
cs-data
LSA.py
SVD_PCA
SVD_PCA_DAAL.py
SVD_sklearn.py

3. Линейная регрессия
Презентация
daal_regression.py
preprocessing.py
scikit_regression.py

4. Наивный байесовский классификатор
Презентация
NB_DAAL_dense.py
NB_DAAL_sparse.py
NB_sklearn.py

5. Машина опорных векторов
Презентация
test
test_bin
train
train_bin
data
test2
SVM.java
svm.py
svm
6. Бустинг (AdaBoost, LogitBoost, BrownBoost)
Презентация
AdaBoost.py
AdaBoost
AdaBoosting.java
BrownBoost.java
LogitBoost.java

7. Нейронные сети
Презентация
__init__.py
daal_neural.py
preprocessing.py
scikit_neural.py

8. Кластеризация: алгоритмы K-means и EM
Презентация
cluster.py
cluster.R
EM.java
kmeans.java
quake.csv
quake_clear.csv

9. Ассоциативные правила
Презентация
daal_apriori.py
preprocessing.py
r_apriori.R

10. Онлайн обработка данных
Презентация
NB_DAAL_online.py
__init__.py
daal_online_ridge.py
preprocessing.py
FileGen.java
MomentsOnline.java
11. Распределённые вычисления
Презентация
Create_files.py
mpi_NaiveBayesDense.py
__init__.py
daal_mpi_ridge.py
preprocessing.pygenerate_files.pylow_order_moments_MPI.py