• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Наши научные статьи

Обзор научных статей, опубликованных в рамках финансирования НУГ.

 

Наши научные статьи

В ходе работы над проектом участники НУГ опубликовали и подготовили к публикации несколько научных статей. 

Опубликованы:

1. В Российском индексе научного цитирования (РИНЦ) опубликован сборник тезисов конференции «Экспериментальные исследования языка», где есть и статья по исследованию НУГ «КомпЛинг»:  Патракова Е. П., Микулинский А. Д., Хоменко А. Ю. Значимые признаки диагностирования недостоверной информации в речи // В кн. : Экспериментальные исследования языка: материалы конференции 2025. М.: Наш мир, 2025. С. 80–81.

Статья представляет информацию об экспериментальной лингвистической модели для выявления лжи в устной речи на основе анализа 32 вербальных и невербальных признаков, заимствованных из современных криминалистических методик. В исследовании использовались записи подготовленных и спонтанных монологов 20 респондентов, содержащих как достоверную, так и ложную информацию. Модель, основанная на алгоритме Random Forest, показала высокую надёжность (до 92% на тренировочной выборке), подтвердив эффективность комплексного подхода, при этом ключевыми маркерами оказались лексика движения, мимика и детализированность рассказа.

Патракова Е. П., Микулинский А. Д., Хоменко А. Ю. Значимые признаки диагностирования недостоверной информации в речи (PDF, 531 Кб) 



2. В рамках разработки исследовательской методики опубликована статья в журнале списка С: Khomenko A., Kasimova L., Sychugov E., Svyatogor M., Komratova A., Polina Domozhirova, Alina Aisina, Trofimov D., Bikbaeva K., Sloeva E., Smirnova D. Employing computational linguistic technologies and oculography to develop diagnostic tool for detecting autoaggressive tendencies in young people: a riveted gaze into “get rid of the shackles of this world” // Psychiatria Danubina. 2025. Vol. 37. No. Suppl. 1. P. 213–223.


В исследовании представлена разработка диагностического инструмента на основе интеграции  корпусного подхода и анализа мультимодального материала, в том числе движения глаз. Был создан и проанализирован обширный лингвистический. Мультимодальный  стимульный материал включал как вербальные, так и визуальные компоненты, а само исследование анализирует соматические реакции на стимулы. Статья освещает принципы корпусного исследования мультимодального материала, даёт методическую основу такого рода исследований, рассматривает статистические критерии анализа мультимодального материала.

Принята к публикации: 

В рамках конференции IX Калининградская школа по гуманитарной информатике (KDH-2025) принята к публикации статья: Жилина П.П. Создание корпуса устной речи для диагностических целей с использованием автоматических алгоритмов распознавания речи, KDH-2025, 2025. 

В работе проведен сравнительный анализ трёх моделей автоматического распознавания речи (ASR) – gigaam-v2-rnnt, whisper-large-v3-turbo и nemo-fastconformer-ru-rnnt – на аудиоматериале, подготовленном для создания специализированного корпуса русской речи, содержащего правдивые и ложные высказывания. Исследование включает количественную оценку по стандартным метрикам (WER, CER, WIL, WIP) и качественный лингвистический анализ ошибок автоматически созданных транскриптов. Модель gigaam-v2-rnnt продемонстрировала наилучшие показатели и устойчивость к смыслоизменяющим ошибкам. Однако все протестированные ASR-модели систематически не распознают диагностически значимые элементы спонтанной речи, критические для анализа достоверности высказываний. Для решения этой проблемы был разработан специализированный протокол аннотирования. Результаты исследования обосновывают необходимость применения гибридного подхода для формирования диагностических корпусов, пригодных для анализа.

Жилина П.П. Создание корпуса устной речи для диагностических целей с использованием автоматических алгоритмов распознавания речи, KDH-2025, 2025 (DOCX, 857 Кб) 

Отправлена на рецензирование: 

В журнал "Медиалингвистика" (список С) отправлена статья:  Хоменко А.Ю., Худякова М.В., Комратова А.Д., Жилина П.П., Патракова Е.П., Микулинский А.Д., Ефименко Н.О., Воронцова А.А., Зобнина Р.Е. Подготовка и разметка мультимодальных текстов для корпуса исследования достоверности / недостоверности продуцируемой информации

Статья посвящена созданию и аннотации специализированного мультимодального корпуса русскоязычной устной речи для исследования признаков достоверности/недостоверности информации. Корпус включает аудио- и видеозаписи подготовленных и спонтанных монологов 20 респондентов, содержащих как правдивые, так и ложные высказывания, сбалансированные по полу и возрасту. Предложен комплексный протокол многоуровневой разметки, интегрирующий вербальные (лексические, синтаксические), просодические (темп, паузы) и невербальные (мимика, жесты) признаки, с предварительным автоматическим транскрибированием (сравнение ASR-моделей показало преимущество *gigaam-v2-rnnt*) и последующей ручной валидацией. Статистический анализ с использованием Random Forest выявил ключевые маркеры недостоверности (например, количество деталей, экспрессивная лексика, движение лицевых мышц), подтвердив эффективность комплексного мультимодального подхода для автоматического выявления лжи в речи.


 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!
Сервис предназначен только для отправки сообщений об орфографических и пунктуационных ошибках.