Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную информацию об использовании файлов cookies можно найти здесь, наши правила обработки персональных данных – здесь. Продолжая пользоваться сайтом, вы подтверждаете, что были проинформированы об использовании файлов cookies сайтом НИУ ВШЭ и согласны с нашими правилами обработки персональных данных. Вы можете отключить файлы cookies в настройках Вашего браузера.

  • A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Статья
Partitioning vertices of graphs into paths of the same length

Duginov O., Dmitriy Malyshev, Dmitriy Mokeev

Discrete Applied Mathematics. 2025. Т. 373. С. 179-195.

Глава в книге
ALOE: Boosting Large Language Model Fine-Tuning with Aggressive Loss-Based Elimination of Samples

Demidovskij A., Трутнев А. И., Тугарев А. М. et al.

In bk.: Frontiers in Artificial Intelligence and Applications: 27th European Conference on Artificial Intelligence, 19–24 October 2024, Santiago de Compostela, Spain. Vol. 392. IOS Press Ebooks, 2024. P. 3980-3986.

Препринт
The Gamma-Theta Conjecture holds for planar graphs

Taletskii D.

math. arXiv. Cornell University, 2024

Контакты

603093 Н.Новгород, ул. Родионова, д. 136, 406 к.

Тел: (831) 436-13-97
E-mail: kaf_pmi@hse.ru

Машинное обучение

2020/2021
Учебный год
RUS
Обучение ведется на русском языке
4
Кредиты

Преподаватель

Золотых Николай Юрьевич

Золотых Николай Юрьевич

Программа дисциплины

Аннотация

Курс посвящен изложению современных методов машинного обучения. Излагаются математические основы методов машинного обучения, основные алгоритмы, методы предобработки данных, основы теории машинного обучения. Практические задания выполняются с использованием библиотеки scikit-learn.
Цель освоения дисциплины

Цель освоения дисциплины

  • Подготовка к профессиональной деятельности в области машинного обучения
  • Развитие компетенций в области математических методов и информационных технологий.
Планируемые результаты обучения

Планируемые результаты обучения

  • Освоение основных теоретических положений методов машинного обучения
  • Овладение практическими навыками решения задач методами машинного обучения
  • Освоение основных теоретических положений машинного обучения
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение. Примеры практических задач
    • Содержательная постановка задачи машинного обучения. Связь с другими областями знания и практической деятельности. Основная терминология. Примеры практических задач обучения с учителем и без учителя. Обзор учебных материалов и ресурсов Интернет по тематике дисциплины
  • Метод наименьших квадратов
    Метод наименьших квадратов для решения задачи восстановления регрессии. Проверка значимости и доверительные интервалы для коэффициентов (регрессионный анализ). Анализ остатков. Переобучение в задаче восстановления регрессии. Методы борьбы с переобуче-нием: выбор подмножества признаков; гребневая («ридж») регрессия (регуляризация); метод «лассо».
  • Вероятностная постановка задачи обучения с учителем
    Регрессионная функция. Байесов классификатор. Принцип максимума апостериорной вероятности. Метод максимального правдоподобия. Наивный байесов классификатор. Метод ближайших соседей для задачи классификации и задачи восстановления регрессии. Теорема об оценке риска в методе ближайшего соседа
  • Статистические методы решения задач классификации
    Дискриминантные и дескриптивные (описательные) методы в задаче классификации. Линейный и квадратичный дискриминантный анализ. Логистическая регрессия
  • Нейронные сети
    Нейронная сеть. Универсальная теорема об аппроксимации (без доказательства). Алгоритм обратного распространения ошибки как градиентный метод. Борьба с переобучением с помощью регуляризации. Дропаут. Глубокое обучение. Сверточные слои, слои объединения.
  • Деревья решений
    Метод деревьев решений для решения задач машинного обучения. Алгоритм CART. Алгоритм С4.5. Отсечения.
  • Ансамбли решающих правил
    Комбинирование слабых решающих правил. Баггинг. Случайные леса. Бустинг. Алгоритм AdaBoost. Алгоритм градиентного бустинга деревьев решений (gradient boosted trees).
  • Задача обучения без учителя
    Задача обучения без учителя. Методы средних и медиан для решения задачи кластеризации. Методы решения задач иерархической кластеризации. Алгоритм PageRank. Алгоритм Apriori.
  • Метод опорных векторов
    Оптимальная разделяющая гиперплоскость. Сведение метода к задаче квадратичного программирования. Ядра и спрямляющие пространства в методе «машина опорных векторов».
  • 10. Элементы теории Вапника-Червоненкиса
    Размерность Вапника–Червоненкиса. Теорема о равномерной сходимости эмпириче-ской ошибки к ожидаемому риску в случае конечной размерности Вапника–Червоненкиса
Элементы контроля

Элементы контроля

  • неблокирующий Устный экзамен
  • неблокирующий Домашнее задание
  • неблокирующий Устный экзамен
  • неблокирующий Домашнее задание
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (4 модуль)
    0.5 * Домашнее задание + 0.5 * Устный экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Джеймс Г., Уиттон Д., Хасти Т. - Введение в статистическое обучение с примерами на языке R - Издательство "ДМК Пресс" - 2017 - 456с. - ISBN: 978-5-97060-495-3 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/93580

Рекомендуемая дополнительная литература

  • Флах П. - Машинное обучение. Наука и искусство построения алгоритмов, которые извлекают знания из данных - Издательство "ДМК Пресс" - 2015 - 400с. - ISBN: 978-5-97060-273-7 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/69955