«Анализ, интерпретация, творчество»: в Нижнем Новгороде состоялся хакатон «Почтовое Digital: лингвистика и технологии»
В нижегородском кампусе Высшей школы экономики прошел междисциплинарный хакатон «Почтовое Digital: лингвистика и технологии» для учеников 9-11 классов. Старшеклассники под руководством менторов решали нестандартные задачи современной лингвистики и программирования.
На основе корпуса почтовых открыток «Пишу тебе» необходимо было выполнить задание на выбор:
- составить портрет эпохи по ключевым словам из открыток (ИТ и лингвистика)
- построить социальную сеть отправителей почтовых открыток (ИТ и лингвистика)
- составить лингвистическую задачу на основе почтовых открыток (лингвистика)
Для школьников участие в хакатоне - возможность прочувствовать особенности как фундаментальных, так и прикладных исследований на примере почтовых открыток, убедиться в актуальности междисциплинарного подхода и прокачать навыки командной работы и soft skills. А для студентов-менторов - это возможность принять участие в проектной работе, которая является неотъемлемой частью их профессиональной деятельности.
Маргарита Климова, организатор хакатона, академический руководитель программы «Фундаментальная и прикладная лингвистика»
Современная лингвистика активно использует компьютерные технологии, в частности для обработки больших массивов текстов, а также помогает сфере информационных технологий, предоставляя датасеты для обучения моделей. Участие в хакатоне позволяет узнать больше о компьютерных технологиях и современной лингвистике, а также о том, какие навыки требуются для профессионального успеха в данных областях.
Тимур Хусяинов, организатор хакатона, заместитель декана факультета гуманитарных наук
Организация междисциплинарного хакатона — это отличный способ показать, что на самом деле разные области знания ближе, чем можно подумать. Задачи, предложенные участникам, этому активно способствуют. В качестве базы данных выступает цифровой корпус почтовых открыток "Пишу тебе", который объединяет изображения и тексты десятков тысяч русскоязычных и иностранных почтовых открыток за последние 140 лет, каждая из которых является самостоятельным артефактом культуры. Все это дает огромные возможности для творчества, анализа, интерпретации.
Предложенные задания максимально ориентированы на практику, а созданные решения могут быть полезны команде, создающей корпус почтовых открыток.
«Задание "Портрет эпохи" позволяет по-новому взглянуть на то, как искусственный интеллект может помочь в задаче визуализации исторических данных, а задание "Построй социальную сеть отправителей и получателей открыток" - наглядно проследить локальные истории семей и их знакомых по текстам связанных с ними открыток, — отмечает организатор хакатона, академический руководитель программы «Компьютерные науки и технологии» Борис Улитин.
Борис Улитин
Основа лингвистики и ИТ — работа с текстами. Отличие лишь в том, с какой точки зрения данные направления рассматривают текст. Для лингвиста текст — это культурный феномен, для ИТ-специалиста — источник данных для анализа. Однако только в их совместном использовании проявляется наиболее интересная составляющая любого текста — исторический контекст, который и предлагается обнаружить участникам нашего хакатона.
Участники команды Selford решали задачу, связанную с разработкой приложения для социальной сети. С его помощью можно проследить, дату, место и человека, которому была отправлена открытка.
Йонас Келпшас, ученик 11 класса Лицея №38, команда Selford
Мы успешно реализовали приложение для Android и разработали карту для сайта. Кроме того, использовали базу данных и получили данные через Excel. Мы составили алгоритм для поиска старинных фамилий из семейных архивов и планируем улучшать этот алгоритм, в том в том числе с использованием нейросети, например, ChatGPT для более точного поиска.
Мне кажется, получился довольно интересный продукт, нам интересно соединение ИТ и лингвистики.
Одним из заданий, предложенным участникам хакатона, — стало создание лингвистических задач с использованием корпуса почтовой переписки на составление портрета слова, на различение текста открытки, написанного человеком и сгенерированного нейросетью, и т.д. Лингвистическая задача призвана раскрыть закономерности языковой системы, должна содержать понятные пояснения и быть увлекательной для аудитории.
Маргарита Климова
Участникам, выбравшим лингвистическое задание, предлагалось по сути совершить путешествие в лингвистическое зазеркалье — попробовать себя в непривычной роли составителей задач, а не тех, кто их решает. Роль составителя зачастую оказывается сложнее, так как предполагает внимательное и скрупулезное отношение к языковому материалу, умение замечать необыкновенное в привычном.
Лингвистическую задачу выбрала команда "Con amore", что в переводе с латинского означает "с любовью" — именно такая подпись встречается наиболее часто в дореволюционных почтовых открытках
Команда "Con amore" (Кристина Филиппова, Елизавета Макарова, Анастасия Махоткина, Ольга Сенникова)
Мы создали портрет нашего слова, используя данные корпуса открыток, исследуя его употребление в текстах, синонимы и исторический контекст. Также одной из задач было отличить текст, созданный человеком, от сгенерированного нейросетью.
Мы использовали корпусный менеджер для анализа текстов, искали синонимы и контексты для выбранных слов. Нам интересна лингвистика в целом и особенно возможности, которые она предоставляет в сочетании с современными информационными технологиями.
Валентина Куликова, организатор хакатона, преподаватель факультета гуманитарных наук
Задачи сразу были "апробированы" на остальных участниках хакатона — они вызвали интерес и были успешно решены. Особенно приятно было видеть креативный подход: помимо выполнения обязательных требований команда разработала не слишком очевидные, но грамотные подсказки. А в задаче на поиск отличий между реальной открыткой и текстом нейросети участники пошли дальше и сгенерировали текст не только для задачи, но и для ее решения.
В решении задач старшеклассникам помогали студенты, направляя их в выборе методов и инструментов.
Борис Улитин
Приятно отметить большую осознанность школьников в выборе задач. Ну, а со стороны организации мы усилили междисциплинарный аспект: все задачи содержат компоненты лингвистики и ИТ (как минимум, в части использования современных инструментов искусственного интеллекта).
Полученные на хакатоне навыки полезны как в учебных дисциплинах, так и в дальнейшем профессиональном развитии школьников. Ведь хакатон требует мобилизации не только интеллектуальных способностей для решения задачи, но и физических, поскольку необходимо получить наилучшее решение за ограниченный промежуток времени.
Маргарита Климова
В дальнейшем школьники смогут более профессионально смотреть на олимпиадные задачи по лингвистике, так как будут знать их внутреннее устройство и принципы разработки. Это полезно и для участия в олимпиадах, и для развития логического мышления в целом.
Проект «Почтовое Digital: лингвистика и технологии» реализован при поддержке городского конкурса молодежных проектов "Молодой Нижний".
Открыта регистрация на участие в digital-хакатоне весной 2024 года. После того, как будут определены даты и детали проведения, мы пришлем вам оповещение на электронную почту.