Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную информацию об использовании файлов cookies можно найти здесь, наши правила обработки персональных данных – здесь. Продолжая пользоваться сайтом, вы подтверждаете, что были проинформированы об использовании файлов cookies сайтом НИУ ВШЭ и согласны с нашими правилами обработки персональных данных. Вы можете отключить файлы cookies в настройках Вашего браузера.
В статье проводится исследование методов глубокого обучения для решения новой задачи многоклассовой классификации текстов, а именно определения интересов пользователей с помощью текстовых сообщений. Мы использовали оригинальный набор данных из почти 90 тысяч текстовых сообщений с форумов, размеченных по десяти интересам. Мы экспериментировали с различными современными архитектурами нейронных сетей: рекуррентными и сверточными, а также с более простыми сетями с прямой связью. Точность классификации была оценена для различных архитектур, репрезентаций текстов и комбинаций признаков и параметров.
В настоящей работе речь пойдет об апробации интегративной методики атрибуционного анализа текста на русском языке, основанной на соединении результатов интерпретативного исследования материала и объективации этих результатов посредством математической статистики. Исследование построено по следующему алгоритму: 1) автоматическое извлечение из текста параметров, описывающих идиостиль с точки зрения прагматикона, тезауруса и лексикона автора; 2) поиск традиционных стиметрических текстовых данных; 3) присвоение веса каждому параметру; 4) построение математических моделей сравниваемых текстов; 5) сравнение математических моделей с целью выявления уровня их корреляции между собой. Поиск параметров, описывающих модель авторского идиостиля, ведется на основании подхода к тексту как к продукту деятельности конкретной языковой личности. Языковая личность автора описывается с позиции подхода Ю. Н. Караулова. Автоматическое извлечение предустановленных параметров осуществляется с помощью алгоритмов, сконструированных на ЯП Python. Для апробации алгоритма использованы тексты нежанровой художественной прозы разной тематики с заведомо известным авторством: "Наши» С. Д. Довлатова и «Обертон» В. П. Астафьева. Исследованием доказана работоспособность разработанной методики.
Актуальность представляемого исследования обусловлена отсутствием работ сравнительного харак- тера, в фокусе которых находится британский антимигрантский медиа-дискурс двух ключевых пе- риодов в новейшей истории миграционной политики – до и после Брексит. Методологической осно- вой работы послужили теории социальных акторов ван Левена (2008), концептуальная оппозиция «свой – чужой» Т. ван Дейка (1989), а также теория установления повестки дня М. МакКомбса и Д. Шоу (1972). С помощью комплексного анализа отобранного материала, последовательно применяя методы современной компьютерной лингвистики, авторы ставят перед собой задачи выявить измене- ния в тональности медиа-дискурса, определить ключевые стратегии репрезентации мигрантов как социальных акторов, а также проанализировать повестку дня СМИ различной политической направ- ленности относительно ключевого события – референдума о выходе Великобритании из ЕС. В ре- зультате полученные данные демонстрируют превалирование стратегии криминализации мигрантов в консервативных СМИ и их виктимизацию в СМИ либеральной направленности как до, так и после референдума. Однако в отношении антимигрантской риторики можно заключить, что после проведе- ния референдума и принятия решения о выходе из ЕС наблюдается сдвиг от однозначно негативной тональности текстов СМИ обоих взглядов к более нейтральной риторике. Анализ повестки дня пока- зал, что стимулы в виде значимых политических событий однозначно влияют на количество публи- каций в СМИ в целом. Однако предопределенные политическими взглядами изданий стратегии ре- презентации мигрантов диктуют использование ключевых слов с различной коннотацией.
В публикации рассматривается когнитивный механизм взаимодействия изобразительной и вербальной частей при декодировании смысла поликодовых текстов. Предлагается типология взаимодействия когнитивных структур, актуализированных гетерогенными составляющими поликодового текста.
В статье анализируются лингвистические средства, конструирующие гендерные стереотипы, которые могут способствовать или препятствовать успешной политической карьере женщины с точки зрения русскоязычных и англоязычных пользователей микроблога Твиттер. Результатом исследования является построение прототипических образов женщины-политика и выявление их структурных характеристик.
В статье рассматриваются актуальные словообразовательные средства выражения эксплицитной и имплицитной негативной оценки на материале заголовков электронных СМИ: анализируются структурно-семантические особенности медийных новообразований и условиях их употребления в целях речевого воздействия.
На материале дискурса власти в статье выявляются частотные идеологемы и аксиологемы современного политического дискурса. В результате автоматического сбора и обработки текстовых данных получен материал для лингвистического анализа: выявлены конкретные случаи реализации идеологем и аксиологем, определен актуализируемый говорящим аксиологический модус каждой из реализуемых единиц и речевые способы реализации идеологем и аксиологем.
В условиях современного мультикультурализма процесс коммуникации является основополагающим для многих аспектов и функций деловой среды. Постоянно растущие интеграционные процессы в сфере экономики и бизнеса, активизация миграционной активности населения, академическая мобильность вызывают необходимость овладения навыками межкультурной коммуникации (МКК), которые постепенно приобретают всё большую актуальность и значимость. Появляется осознание, что владение определённым уровнем знаний и навыков в сфере МКК становится необходимым слагаемым профессионального успеха в любой области. Основной целью предлагаемого исследования является выявление, насколько современные студенты как будущие специалисты готовы к жизни и деятельности в условиях мультикультурализма. Предпосылкой развития межкультурной компетенции является осознание культурных и национальных различий, в качестве основы которого рассматривается межкультурная сенситивность. Именно этот аспект был подвергнут анализу с помощью опросника «Шкала межкультурной сенситивности», разработанного Г. М. Ченом и Дж. Старостой. Опросник состоит из 24 утверждений и охватывает 5 факторов, которые его авторы включают в концепцию межкультурной сенситивности: включённость во взаимодействие, уважение культурных различий, степень уверенности в себе при коммуникации, удовольствие от взаимодействия, аналитический подход к общению. Исследование проводилось среди студентов бакалавриата и магистратуры Нижегородского кампуса НИУ ВШЭ в 2017–19 гг. В ходе исследования были подвергнуты анализу следующие аспекты: отношение к культурным особенностям и представителям других народов, самооценка восприятия ценностей своей и иной культуры, прогнозирование поведенческих реакций в условиях нахождения в международной среде. В процессе анализа рассматривалась зависимость уровня межкультурной сенситивности от пола респондентов, успеваемости, наличия у них опыта взаимодействия с представителями других культур. Среди участников выборки выявлены как открытость и готовность к общению, уважение к партнёру по коммуникации, так и настороженность и даже предубеждение к представителям иных культур.
Результаты данного исследования позволят найти более эффективный подход к решению проблемы повышения межкультурной компетенции в рамках образовательного процесса.
Настоящее исследование выдвигает концепцию прототипа программного обеспечения, основанную на интеграции анализа авторских компетенций с точки зрения структурированной языковой личности (ЯЛ) по Ю.Н. Караулову [Караулов 2010] и С.М. Вулу [Вул 2007] и объективации качественных исследовательских данных количественными [Bacciu, Morgia, La 2019], [Litvinova, Sboev, Panicheva 2018]. Интеграция количественного и качественного подходов позволяет сделать модель ЯЛ автора достаточно полной, всесторонне имитирующей оригинал и одновременно объективной.