We use cookies in order to improve the quality and usability of the HSE website. More information about the use of cookies is available here, and the regulations on processing personal data can be found here. By continuing to use the site, you hereby confirm that you have been informed of the use of cookies by the HSE website and agree with our rules for processing personal data. You may disable cookies in your browser settings.

  • A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Programming for Linguists

2020/2021
Academic Year
RUS
Instruction in Russian
3
ECTS credits
Delivered at:
Department of Applied Mathematics and Informatics (Faculty of Informatics, Mathematics, and Computer Science (HSE Nizhny Novgorod))
Course type:
Compulsory course
When:
4 year, 1 module

Instructor


Лепигина Анастасия Анатольевна

Программа дисциплины

Аннотация

Данный курс призван закрепить у студентов умение решать задачи, связанные с обработкой текста (токенизация, лемматизация и т.д.), а также расширить кругозор путем знакомства с некоторыми алгоритмами (сортировок, обхода графов и др.). Кроме того, знакомство с различными инструментами и особенностями языка Python и наличие большого количества оцениваемых работ помогает студентам получить больше опыта в программировании и улучшить качество владения языком Python.
Цель освоения дисциплины

Цель освоения дисциплины

  • Целями освоения дисциплины «Программирование для лингвистов» являются приобретение студентами навыков применения компьютерных технологий (в первую очередь, языка программирования Python) для решения возникающих на практике лингвистических задач, а также задач сортировки, обходов графа и нахождения в нем кратчайших путей, создания и использования собственных классов.
Планируемые результаты обучения

Планируемые результаты обучения

  • Студент решает задачу сортировки при помощи одного из рассмотренных алгоритмов
  • Студент решает задачи обхода графа в ширину и глубину, нахождения кратчайших путей, раскраски и визуализации графов.
  • Студент решает задачу создания собственных классов и их использования
  • Студент решает задачи токенизации, лемматизации текста и составления частотного словаря.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Инструменты обработки текста
    Использование модуля nltk для токенизации текста, mystem или pymorphy -- для лемматизации, составление частотного словаря.
  • Разбор и реализация некоторых алгоритмов сортировок
    Получение представления о задаче сортировки. Разбор и реализация двух алгоритмов сортировки: сортировка пузырьком и быстрая сортировка
  • Графы: разбор и реализация некоторых алгоритмов. Знакомство с networkx.
    Получение представления о графах, основных задачах и способах их решения. Реализация некоторых алгоритмов:: поиск в глубину и ширину, раскраска графа, алгоритм Дейкстры, Краскала. Решение задачи построения графа слов. Знакомство с модулем networkx, визуализация графов при помощи него.
  • ООП в питоне: создание классов, объектов, атрибутов и методов класса
    Получение представления о задании собственных классов и их использовании, реализация примера.
Элементы контроля

Элементы контроля

  • неблокирующий Практическое задание
  • неблокирующий Практическое задание
  • неблокирующий Практическое задание
  • неблокирующий Практическое задание
  • неблокирующий Практическое задание
  • неблокирующий Практическое задание
  • неблокирующий Практическое задание
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (1 модуль)
    0.15 * Практическое задание + 0.14 * Практическое задание + 0.14 * Практическое задание + 0.14 * Практическое задание + 0.14 * Практическое задание + 0.14 * Практическое задание + 0.15 * Практическое задание
Список литературы

Список литературы

Рекомендуемая основная литература

  • Алгоритмы и структуры данных (CDIO): Учебник / Царев Р.Ю., Прокопенко А.В. - Краснояр.:СФУ, 2016. - 204 с.: ISBN 978-5-7638-3388-1
  • Саммерфилд М. - Python на практике - Издательство "ДМК Пресс" - 2014 - 338с. - ISBN: 978-5-97060-095-5 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/66480

Рекомендуемая дополнительная литература

  • Алексеев В.Е., Таланов В.А. - Графы и алгоритмы - Национальный Открытый Университет "ИНТУИТ" - 2016 - 153с. - ISBN: 5-9556-0066-3 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/100593