Нужны ли словари сегодня?
В этот раз участники клуба “ФиЛин” поговорили об особом разделе языкознания – корпусной лингвистике. Ребята смогли узнать, как можно получать данные о языке при помощи компьютерных технологий.
В этот раз участники клуба “ФиЛин” поговорили об особом разделе языкознания – корпусной лингвистике. Ребята смогли узнать, как можно получать данные о языке при помощи компьютерных технологий.
Корпус – это коллекция текстов, которая упорядочена при помощи специальных лингвистических меток. С помощью такой навигации можно найти примеры словоупотребления, причем сделать это будет быстро и легко. А ведь раньше ученым приходилось заниматься многочасовым поиском по словарям и справочникам, далеко не всегда содержащим актуальную информацию!
Ребята смогли познакомиться с устройством корпуса на конкретных примерах: академический руководитель ОП “Фундаментальная и прикладная лингвистика”, Алексей Юрьевич Малафеев показал, как работает англоязычный корпус COCA – Corpus of Contemporary American English (как Coca-Cola, только без "Cola", по остроумному замечанию сегодняшнего лектора).
После этого он упомянул и другие известные корпусы, такие, как Национальный корпус русского языка (НКРЯ) или, например, Corpus of Global Web-based English (GloWbE), насчитывающий 1,9 млрд знаков.
Прямо на лекции члены клуба увидели работу COCA на примере сочетаемости разных слов друг с другом – коллокаций. Сперва может показаться забавным, что в английском языке машина может сидеть: “Our car sits idle for a while”. Но в данном случае глагол to sit употребляется не в привычном значении – “сидеть”, а переводится как “быть, находиться, стоять”, поэтому всю фразу можно понять как: “Наша машина стоит без дела уже некоторое время”.
А если тебя, наш юный друг, будут ругать за неправильный предлог в выражении knock at the door , ты можешь смело возражать. Ведь сами американцы в разговорной речи выбирают разные варианты, что и фиксирует компьютер. А значит, не всё подчиняется школьным правилам.
В конце сегодняшней лекции ребята поняли, что методы компьютерной лингвистики могут быть полезны не только для специалистов данной области. Корпуса – это постоянно развивающийся ресурс, который открывает новые возможности к изучению языка.
Департамент прикладной лингвистики и иностранных языков: Доцент