Концепция сложности текста: нужно ли измерять текст в цифрах?
Интервью с профессором М.И. Солнышкиной
Как часто вы задумываетесь о том, что какие-то теории, правила, школьные темы, да что угодно можно было бы объяснить гораздо проще? Сталкиваетесь ли во время чтения с тем, что текст просто невозможно понять или запомнить с первого раза? Но самое главное: получается ли у вас, сталкиваясь с трудностями в текстах, сохранять мотивацию и желание учиться, читать, работать дальше? В настоящее время эта проблема становится все более и более актуальной, ведь вместе со временем меняются и люди, их способы восприятия и выражения информации. А в чем смысл информации, если она непонятна?
Недавно в нижегородском кампусе НИУ ВШЭ выступила Марина Ивановна Солнышкина, приглашенный лектор. Марина Ивановна – доктор филологических наук, профессор Казанского (Приволжского) Федерального Университета, автор двух монографий, составитель трех словарей, а также идейный вдохновитель и один из создателей Учебного корпуса русского языка и автоматического анализатора русского языка RuLingvа.
Однако и сама профессор какое-то время не задумывалась о существовании проблемы сложности текста, до одного момента…
“На самом деле, это довольно интересная для меня история. Когда я защитила докторскую диссертацию по лингвоперсонологии, я совсем не знала о существовании проблемы сложности текста. Но тогда меня привлекли к разработке заданий ЕГЭ по английскому языку, и я начала много работать с тестологами. Я лингвист, не педагог и не тестолог, но я поняла, что мне не хватает лингвистической составляющей в заданиях. Читабельность, про которую нам рассказали сразу (рассчитываемая на основе длины слова и предложения), снимает только часть проблемы, так как есть гораздо более серьезные вопросы. Ведь даже легкое задание можно сформулировать так сложно, что будет непонятно.
В диссертации одного из моих студентов, Александра Кисильникова, мы проводили сравнение английских и русских текстов, параллельно сопоставляли тексты одного уровня сложности. Тогда, в 2009-2016 гг., еще было мало литературы и работ, которые можно было цитировать. Так получилось, что осознание того, насколько малым количеством информации мы располагаем в этой сфере, заставило меня копать глубже и пытаться разобраться в этой теме”, – поделилась Марина Ивановна.
Важно обозначить, что сложность текста - это междисциплинарная проблема. Мы сталкиваемся с текстами на протяжении всей нашей жизни вне зависимости от сферы деятельности и интересов. При этом все мы разные, и наше восприятие, понимание текстов может колоссально различаться. Так в каких же сферах сложность текста оказывается значимой?
“Проводится очень много исследований на немецком и английском языках на материале медицинских текстов. Основная современная тенденция - правильное понимание пациентом поставленного ему диагноза, причин и способов лечения. Естественно, важно учитывать сложность текста и в написании рецептов по приему лекарственных препаратов, ведь необходимо доходчиво донести информацию. Безусловно, нельзя обойти стороной инструкции к различного рода инструментам, аппаратам, так как их основной целью должно быть четкое и понятное объяснение по эксплуатации предмета.
Юридические тексты – сфера, в которой нам, простым обывателям, тоже часто приходится сталкиваться с нечитаемыми и трудно воспринимаемыми текстами. Очевидно, некоторые из них специально пишутся так, чтобы скрыть часть информации, создания путаницы в голове.
Сложность текста так же значима для рекламы. Рекламщикам очень важно понимать, на что люди реагируют, на что нет. Некоторые крупные компании даже проводят эксперименты с использованием ЭЭГ и айтрекеров, чтобы попытаться разобраться, когда внимание потенциального покупателя уходит. В таких случаях привлекаются лингвисты.
Сложность текста важна в сфере образования. Например, есть некая доля несправедливости в ЕГЭ. Причем несправедливость возникает неосознанно. Задания составляют специалисты, но вот в чем загвоздка - тексты на ЕГЭ берутся сокращенные, адаптированные. Когда разработчик адаптирует текст, он работает с полным вариантом, он его уже читал и помнит. И когда он к сокращенному варианту задает вопросы, ему кажется, что там все просто, поскольку у разработчикав памяти сохраняется тот оригинальный текст, потому и отвечать легче. А школьники полным объёмом информации не располагают”, – объяснила Марина Ивановна.
Поэтому “трудность текста” понимается как (не)готовность читателя преодолевать препятствия, возникающие при чтении текста. Значит, в изучении важно учитывать не только сам текст и разрабатывать параметры его оценки, но и уделять должное внимание критериям, которые будут отражать сторону читателя. Индивидуальные характеристики читателя включают в себя различные аспекты: мотивы и цели (для чего вообще человеку читать текст, хочет ли он прилагать усилия), интеллектуальные возможности, возраст, опыт и познание мира… Библиопсихологической концепцией текста еще в начале 20 века занимался наш соотечественник Н. А. Рубакин, его работы также помогают в формировании этих самых критериев. Однако с тех исследований прошло много времени, а понимание их значимости появляется только сейчас.
“Мы идём в кильватере за американцами/британцами, отставание у нас достаточно большое. Зарубежные концепции не всегда можно адаптировать к русскому языку, потому что строй языков разный. При восприятии текста на русском языке основная сложность для неносителей языка - морфология, а для носителей языка - лексика (трудность определяется тем, какими словами вы владеете)”, – отмечает профессор.
Как же определять эту сложность? Какие единицы измерения брать? Длину текста? Предложения? Слова? Но ведь еще и шрифт может иметь дополнительные значения! Разумеется, все это играет важную роль, но как все-таки оценивать? Еще в 20 веке, в 1975 годом учеными была разработана одна из самых известных на сегодняшний день формула читабельности – Flesch-Kincaid Grade Level (FKGL). Многие формулы, созданные позднее, берут ее за основу, модифицируя, изменяя параметры под конкретные запросы (другой язык, особая сфера функционирования языка). Такая формула существует и для русского языка, в ее создании непосредственно участвовала сама Марина Ивановна.
На основании этих параметров разработаны автоматические инструменты оценки сложности текста: Lexile, TextInspector, Coh-Metrix, ReaderBench и RuLingva.
Также Марина Ивановна рассказала какие инструменты предпочитает сама:
“Coh-Metrix и TextInspector самые лучшие. Там серьезная научная база” - профессор отмечает, что “Однако при всей значимости нейронных сетей и искусственного интеллекта”, которые многие ученые используют в своих работах, “мы не всегда понимаем, что там происходит, на основании каких параметров машина осуществляет тот или иной выбор. Поэтому проф. Стивен Бекс (Stephen Bax), оценивая Coh-Metrix, мне сказал – нетранспарентна. Какие параметры принимаются в расчет, классифицируя текст тем или иным способом, не всегда понятно.”
Тогда возникает вопрос: значит ли это, что необходимо создать инструменты, упрощающие текст?
“Очень серьезная проблема, занимаемся этим в лаборатории. Но здесь больше политического (policy), стратегического аспекта, чем технического. Например, можно заменять синонимические выражения, различные синтаксические конструкции. Но педагоги боятся, что за этим последует упрощение контента. А мы ни в коем случае не за это.
В связи с этой проблемой, мы начали исследовать культурный аспект, учитывать его влияние: связь между поколениями утрачивается, нельзя отрицать “generation gap“" – отмечает Марина Ивановна.
Авторы: Нуртдинова Софья, Савина Арина, 22ФиПЛ