Ученые измерили непонятность научного текста

Для понимания современных научных текстов обывателю приходится зачастую проводить самостоятельное исследование — столько разных специальных терминов и обозначений могут наполнять текст. Дело в том, что объем научных знаний растет, сами по себе знания усложняются, а отдельные области науки углубляются и специализируются. Тут без особой, научной лексики не обойтись. Тем не менее читателям от этого не легче, и израильские ученые предложили своё решение проблемы перевода с научного на человеческий.

Израильские исследователи представили алгоритм, измеряющий понятность научного текста для обывателя. Описание программы можно найти на сайте PLoS One, на статьях этого же сайта алгоритм был протестирован.

Корень проблемы в понимании научных текстов обывателями — так называемое «проклятие знания». Вполне возможно, что вы сталкивались с ним, когда объясняли что-то, в чем сами разбираетесь, непосвященному человеку. Для человека, который хорошо разбирается в проблеме, становится трудно представить, что его собеседник не знает, что такое, например, экзопланеты или кванты. Из-за этого он не может объяснить значение сложных слов, и общение затрудняется. С учеными, особенно в технических областях и с узкой специализацией, это происходит постоянно.

Алгоритм израильских специалистов, который получил название De-Jargonizer, разбивает заданный текст на три категории. В первую категорию попадают слова из общего употребления — это 2000 самых распространенных слов и словосочетаний английского языка. Во вторую — редкие слова, с меньшей частотностью, а в третью — специализированные научные термины.

Программа анализирует текст на объем входящих слов всех трех категорий и выдает пользователю сумму очков от 0 до 100 баллов.

Для правильной работы алгоритма авторы программы загрузили в нее массив из 500 статей журналов издательства PLoS. Все статьи были посвящены науке и исследованиям. Ученые проанализировали аннотацию и краткое содержание. В результате выяснилось, что в аннотациях текстов по биологии содержится до десяти процентов научных терминов, а в кратком содержании — до восьми. Хотя краткое содержание понятнее, но до установленного исследованием уровня — два процента — ему далеко. При этом отмечается, что полный текст может содержать до 27% научной терминологии.

ПОХОЖИЕ СТАТЬИ

Новые статьи

0
Оставьте комментарий! Напишите, что думаете по поводу статьи.x