• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

«Анализ, интерпретация, творчество»: в Нижнем Новгороде состоялся хакатон «Почтовое Digital: лингвистика и технологии»

В нижегородском кампусе Высшей школы экономики прошел междисциплинарный хакатон «Почтовое Digital: лингвистика и технологии» для учеников 9-11 классов. Старшеклассники под руководством менторов решали нестандартные задачи современной лингвистики и программирования.

«Анализ, интерпретация, творчество»: в Нижнем Новгороде состоялся хакатон «Почтовое Digital: лингвистика и технологии»

© Пресс-служба НИУ ВШЭ - Нижний Новгород

На основе корпуса почтовых открыток «Пишу тебе» необходимо было выполнить задание на выбор:

  • составить портрет эпохи по ключевым словам из открыток (ИТ и лингвистика)
  • построить социальную сеть отправителей почтовых открыток (ИТ и лингвистика)
  • составить лингвистическую задачу на основе почтовых открыток (лингвистика)

Для школьников участие в хакатоне - возможность прочувствовать особенности как фундаментальных, так и прикладных исследований на примере почтовых открыток, убедиться в актуальности междисциплинарного подхода и прокачать навыки командной работы и soft skills. А для студентов-менторов - это возможность принять участие в проектной работе, которая является неотъемлемой частью их профессиональной деятельности.

Маргарита Климова, организатор хакатона, академический руководитель программы «Фундаментальная и прикладная лингвистика»

Климова Маргарита Андреевна

Современная лингвистика активно использует компьютерные технологии, в частности для обработки больших массивов текстов, а также помогает сфере информационных технологий, предоставляя датасеты для обучения моделей. Участие в хакатоне позволяет узнать больше о компьютерных технологиях и современной лингвистике, а также о том, какие навыки требуются для профессионального успеха в данных областях.

Тимур Хусяинов, организатор хакатона, заместитель декана факультета гуманитарных наук

Хусяинов Тимур Маратович

Организация междисциплинарного хакатона — это отличный способ показать, что на самом деле разные области знания ближе, чем можно подумать. Задачи, предложенные участникам, этому активно способствуют. В качестве базы данных выступает цифровой корпус почтовых открыток "Пишу тебе", который объединяет изображения и тексты десятков тысяч русскоязычных и иностранных почтовых открыток за последние 140 лет, каждая из которых является самостоятельным артефактом культуры. Все это дает огромные возможности для творчества, анализа, интерпретации.

Предложенные задания максимально ориентированы на практику, а созданные решения могут быть полезны команде, создающей корпус почтовых открыток.

«Задание "Портрет эпохи" позволяет по-новому взглянуть на то, как искусственный интеллект может помочь в задаче визуализации исторических данных, а задание "Построй социальную сеть отправителей и получателей открыток" - наглядно проследить локальные истории семей и их знакомых по текстам связанных с ними открыток, — отмечает организатор хакатона, академический руководитель программы «Компьютерные науки и технологии» Борис Улитин.

Борис Улитин

Улитин Борис Игоревич

Основа лингвистики и ИТ — работа с текстами. Отличие лишь в том, с какой точки зрения данные направления рассматривают текст. Для лингвиста текст — это культурный феномен, для ИТ-специалиста — источник данных для анализа. Однако только в их совместном использовании проявляется наиболее интересная составляющая любого текста — исторический контекст, который и предлагается обнаружить участникам нашего хакатона.

Участники команды Selford решали задачу, связанную с разработкой приложения для социальной сети. С его помощью можно проследить, дату, место и человека, которому была отправлена открытка.

Йонас Келпшас, ученик 11 класса Лицея №38, команда Selford

Йонас Келпшас, ученик 11 класса Лицея №38, команда Selford

Мы успешно реализовали приложение для Android и разработали карту для сайта. Кроме того, использовали базу данных и получили данные через Excel. Мы составили алгоритм для поиска старинных фамилий из семейных архивов и планируем улучшать этот алгоритм, в том в том числе с использованием нейросети, например, ChatGPT для более точного поиска.

Мне кажется, получился довольно интересный продукт, нам интересно соединение ИТ и лингвистики.

Одним из заданий, предложенным участникам хакатона, — стало создание лингвистических задач с использованием корпуса почтовой переписки на составление портрета слова, на различение текста открытки, написанного человеком и сгенерированного нейросетью, и т.д. Лингвистическая задача призвана раскрыть закономерности языковой системы, должна содержать понятные пояснения и быть увлекательной для аудитории.

Маргарита Климова

Климова Маргарита Андреевна

Участникам, выбравшим лингвистическое задание, предлагалось по сути совершить путешествие в лингвистическое зазеркалье — попробовать себя в непривычной роли составителей задач, а не тех, кто их решает. Роль составителя зачастую оказывается сложнее, так как предполагает внимательное и скрупулезное отношение к языковому материалу, умение замечать необыкновенное в привычном.

Лингвистическую задачу выбрала команда "Con amore", что в переводе с латинского означает "с любовью" — именно такая подпись встречается наиболее часто в дореволюционных почтовых открытках

Команда "Con amore" (Кристина Филиппова, Елизавета Макарова, Анастасия Махоткина, Ольга Сенникова)

Мы создали портрет нашего слова, используя данные корпуса открыток, исследуя его употребление в текстах, синонимы и исторический контекст. Также одной из задач было отличить текст, созданный человеком, от сгенерированного нейросетью. 

Мы использовали корпусный менеджер для анализа текстов, искали синонимы и контексты для выбранных слов. Нам интересна лингвистика в целом и особенно возможности, которые она предоставляет в сочетании с современными информационными технологиями. 

Валентина Куликова, организатор хакатона, преподаватель факультета гуманитарных наук

Куликова Валентина Александровна

Задачи сразу были "апробированы" на остальных участниках хакатона — они вызвали интерес и были успешно решены. Особенно приятно было видеть креативный подход: помимо выполнения обязательных требований команда разработала не слишком очевидные, но грамотные подсказки. А в задаче на поиск отличий между реальной открыткой и текстом нейросети участники пошли дальше и сгенерировали текст не только для задачи, но и для ее решения. 

В решении задач старшеклассникам помогали студенты, направляя их в выборе методов и инструментов.

Борис Улитин

Улитин Борис Игоревич

Приятно отметить большую осознанность школьников в выборе задач. Ну, а со стороны организации мы усилили междисциплинарный аспект: все задачи содержат компоненты лингвистики и ИТ (как минимум, в части использования современных инструментов искусственного интеллекта).

Полученные на хакатоне навыки полезны как в учебных дисциплинах, так и в дальнейшем профессиональном развитии школьников. Ведь хакатон требует мобилизации не только интеллектуальных способностей для решения задачи, но и физических, поскольку необходимо получить наилучшее решение за ограниченный промежуток времени.

Маргарита Климова

Климова Маргарита Андреевна

В дальнейшем школьники смогут более профессионально смотреть на олимпиадные задачи по лингвистике, так как будут знать их внутреннее устройство и принципы разработки. Это полезно и для участия в олимпиадах, и для развития логического мышления в целом.

Проект «Почтовое Digital: лингвистика и технологии» реализован при поддержке городского конкурса молодежных проектов "Молодой Нижний".

Открыта регистрация на участие в digital-хакатоне весной 2024 года. После того, как будут определены даты и детали проведения, мы пришлем вам оповещение на электронную почту.

Зарегистрироваться