• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Зачем лингвисту математика?

На этот вопрос разные люди могут ответить по-разному. У исследователей, занимающихся вопросами корпусной и компьютерной лингвистики, есть чёткое понимание того, как связаны между собой лингвистика и математика. А какой эту связь видят студенты «Фундаментальной и прикладной лингвистики»? Одна из студенток образовательной программы решила поделиться своими размышлениями на эту тему.

Зачем лингвисту математика?

Зачем на гуманитарном факультете нужны основы высшей математики, линейная алгебра и теория вероятностей? Лингвист – и программирование? Что за бред? Так или примерно так удивляются знакомые, когда я сдаю какой-нибудь технический предмет. Действительно, а математика-то зачем?

Когда-то достаточно давно мне встретился небольшой, но забавный рассказик Надежды Тэффи “Взамен политики”. Там гимназист, возвратившись с учебы, мучает свою семью вопросами: “Почему гимн-азия, а не гимн-африка?”, “кот-лета, а не кошка-зимы?” И вся семья, вместо того, чтобы обсуждать за обедом важные насущные вопросы, к примеру, о политике, включилась в эту игру. В ход пошли “хам-купоны” вместо “пан-талон”, “пиво-хлопок” вместо “вино-вата”, и даже “черно-петухатый“ вместо “бело-курый”.


В обычной жизни мы почти не задумываемся, почему и как образуются слова. Нет, конечно, падежи, роды и формы глагола всегда подчиняются каким-то правилам или же являются какими-либо исключениями, опять же прописанными в правилах. Но как, зачем и отчего это так – то есть те вопросы, которые и задавал гимназист в рассказике, – они никогда ведь не возникают, правда?

А между тем, язык, как любая знаковая система, имеет четко выраженные закономерности, описанные законами. И вот тут, если красоту языка призвана оценить филология, то законы, по которым образуются новые слова, правила их использования и все-все прочее – это сфера деятельности лингвистики. А тут уж без логики расчета не обойтись. А кто у нас отвечает за логику? Правильно, математика. Давайте докажем, что лингвистика – техническая наука?

Вот не знаете вы французского, но немного “дружите” с математикой. Тогда в ряду французских слов “tour, face, coucher, attacher, passage, orange, variété,rager, image, courage, révérence” вы без труда найдете пару в ряду русских “смелость, проход, лицо, почтение, привязывать, поездка, образ, разнообразие, лежать, апельсин, неистовствовать”. Понятно, чтопоездка – это tour, лицо –face, апельсин – orange, а образ – image. Дальше посложнее, но догадаться, чтоvariété –это разнообразие (вспомнивварьировать), аpassage – проход (отпассажир) все-таки можно. Ну, а если связать словокуражиться сосмелостью, фразу впасть в раж с неистовством, а реверанс с почтением, то пары courage – смелость, rager – неистовствовать, reverence- почтение складываются сами собой. Вотcoucher немного выпадает из ряда, но, решив прилечь на кушетку, пару coucher - лежать вы уже сложите самостоятельно. Логика и математический расчет – вот главные ваши инструменты.

Ну и задачка посложнее. Зная, что латинское словоfacere (делать) на испанском hacer, mulier (женщина) – mujer, а clarus (ясный) – claro, скажите - как на испанском вы обратитесь к сыну, если на латыни он filius?

Нет ничего проще. F меняем на h, li на j, us на o.  Получаем hi j o. Согласитесь, впечатляет? Без математической логики тут явно не обошлось.

А программирование-то причем, спросите вы? Ну, вот, к примеру, моя курсовая на первом курсе называлась “Частотный анализ сообщений в социальной сети «ВКонтакте»”. Раз речь шла о частоте – следовательно, в ходу были цифры. Мне предстояло создать частотный словарь слов из сообщений, которые я отправляла или получала вк. Частотные словари – очень распространенная в лингвистических исследованиях вещь. К слову сказать, один из самых известных русских частотных словарей был создан именно в Нижнем Новгороде, вернее, тогда в Горьком. Причем тогда он создавался практически вручную, ведь с компьютерами в то время в стране была напряженка. Представляете этот труд – когда нужно перелопатить тысячи текстов с миллионами слов, да еще и пересчитать их! Естественно, на все это уходил не один год. И как повезло нам, современным лингвистам, когда я, написав простую программку на Pyton-е, свой миллион слов из 70 тысяч сообщений посчитала буквально за секунды.

Покопаться в тексте и выявить в нем закономерности, в том числе, математические или статистические очень интересно. Вот, к примеру, моя вторая курсовая работа, уже на втором курсе, называется “Определение пола и возраста автора по тексту”. Представляете, текст – он почти как отпечатки пальцев. Слова, участвующие в тексте, запросто могут выдать и ваш пол, и ваш возраст. Но прежде чем текст исследовать – надо его определенным способом разметить, проанализировать, опять же подсчитать. В общем, не вдаваясь в подробности, скажу вам, что это задачка нейронных сетей и машинного обучения. Ну и на заметку: мужчины используют больше предлогов, а женщины – местоимений. Но не думайте, что узнав это и сымитировав текст за другой пол, вы сможете кого-то обмануть. Есть признаки речи, которые имитировать невозможно. Какие? Прикладные лингвисты своих секретов не выдают…

В общем, я набросала немножко мыслей о том, чем, зачем и как занимается прикладная лингвистика. Как видите, все гора-а-а-а-аздо интереснее, чем обычное программирование и филология. Да и пипл с ФИПЛ – народ особенный, уж поверьте.

Алина Костина
16 ФПЛ