• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Научно-исследовательский семинар "Основы анализа данных"

2021/2022
Учебный год
RUS
Обучение ведется на русском языке
4
Кредиты
Статус:
Курс обязательный
Когда читается:
2-й курс, 1, 2 модуль

Преподаватель

Программа дисциплины

Аннотация

Целью освоения дисциплины «Научно-исследовательский семинар» является изучение инструментов и подходов в современных исследований в области корпусной лингвистики и психолингвистике. Дисциплина включает в себя изучение трех разделов: Организация исследований, Исследования в корпусной лингвистике (библиотеки Python для анализа естественного языка, RStudio для анализа результатов исследований), Экспериментальные исследования (разработка онлайн экспериментов). В ходе курса учащиеся знакомятся с программами Zotero, RStudio (язык R), библиотеками Python (PsychoPy, nltk и т.д.). Студенты решают и сдают на оценку три лабораторные работы: создание библиографии в документе Google Doc, анализ частот встречаемости слов по английском и русском корпусах, проведение психолингвистического эксперимента. Итоговый контроль (экзамен) проводится в виде письменной работы. Блокирующие элементы контроля не предусмотрены. Для дистанционного сопровождения курса используется канал в MS Teams - https://teams.microsoft.com/l/team/19%3aIEEF5T6aBgoXqrZjNHUt3JRuIqJJlvaHCo2L-8fL6Vg1%40thread.tacv2/conversations?groupId=90163011-d6f8-4e0b-8b09-2c831a10d964&tenantId=21f26c24-0793-4b07-a73d-563cd2ec235f
Цель освоения дисциплины

Цель освоения дисциплины

  • Целью освоения дисциплины «Научно-исследовательский семинар» является изучение инструментов и подходов в современных исследований в области корпусной лингвистики и психолингвистике. Дисциплина включает в себя изучение трех разделов: Организация исследований, Исследования в корпусной лингвистике (библиотеки Python для анализа естественного языка, RStudio для анализа результатов исследований), Экспериментальные исследования (разработка онлайн экспериментов). В ходе курса учащиеся знакомятся с программами Zotero, RStudio (язык R), библиотеками Python (PsychoPy, nltk и т.д.).
Планируемые результаты обучения

Планируемые результаты обучения

  • Владеет способами аннотирования текстов в программе GATE DEVELOPER, анализа текстов с помощью библиотек на языке Python
  • владеет способами сбора данных психолингвистических экспериментов и их обработки в программе DMDX.
  • Может подготовить, загрузить данные и провести корреляционный анализ в программной среде RStudio.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Тема 1. Исследования в корпусной лингвистике
  • Тема 2. Исследования в психолингвистике
  • Тема 3. Математические модели в лингвистических исследованиях
Элементы контроля

Элементы контроля

  • неблокирующий Лабораторная работа - проведение эксперимента
  • неблокирующий Лабораторная работа по анализу текстов
  • неблокирующий Тест по Zotero
Промежуточная аттестация

Промежуточная аттестация

  • 2021/2022 учебный год 1 модуль
    0.6 * Лабораторная работа - проведение эксперимента + 0.4 * Тест по Zotero
  • 2021/2022 учебный год 2 модуль
    0.4 * 2021/2022 учебный год 2 модуль + 0.6 * Лабораторная работа по анализу текстов
Список литературы

Список литературы

Рекомендуемая основная литература

  • Cunningham, H., Gaizauskas, R. J., & Wilks, Y. (1996). A General Architecture for Language Engineering (GATE) - a new approach to Language Engineering R&D. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsarx&AN=edsarx.cmp-lg%2f9601009
  • Gernsbacher, M. A., & Traxler, M. J. (2006). Handbook of Psycholinguistics (Vol. 2nd ed). Amsterdam: Academic Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=187294
  • Trejo, O., & C. Figliozzi, P. (2017). R Programming By Example : Practical, Hands-on Projects to Help You Get Started with R. Birmingham: Packt Publishing. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1682395

Рекомендуемая дополнительная литература

  • Christina Schoushkoff. (2019). Handbook of Psycholinguistics. [N.p.]: Society Publishing. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=2014117
  • Cunningham, H., Tablan, V., Roberts, A., & Bontcheva, K. (2013). Getting more out of biomedical documents with GATE’s full lifecycle open source text analytics. Plos Computational Biology, 9(2), e1002854. https://doi.org/10.1371/journal.pcbi.1002854
  • Dąbrowska, E., & Divjak, D. (2015). Handbook of Cognitive Linguistics. Berlin: De Gruyter Mouton. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=nlebk&AN=1000461
  • Gillespie, C., & Lovelace, R. (2016). Efficient R Programming : A Practical Guide to Smarter Programming. Sebastopol, CA: O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1435808
  • McRae, K., Joanisse, M., & Spivey, M. (2012). The Cambridge Handbook of Psycholinguistics. New York: Cambridge University Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=466689
  • Medeiros, K. (2018). R Programming Fundamentals : Deal with Data Using Various Modeling Techniques. Birmingham: Packt Publishing. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1904978
  • Ren, K. (2016). Learning R Programming. Birmingham: Packt Publishing. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1409189