Технологии

LORELEI будет изучать малые языки

22 ноября 2017 0

абориген, старик, азия

 

В мире насчитывается около 7 тысяч языков, которые появились, развивались и формировались в разных частях света при разных условиях. Но все те же исторические и культурные условия «распорядились» так, что почти 2/3 населения Земли разговаривают только на 40 языках из всех существующих. Многие так называемые малые языки теряют свою функцию коммуникации и сохранения культуры, но их все еще можно изучать.

LORELEI

Специалисты из Университета Огайо объединились с Суперкомпьютерным центром для участия в проекте LORELEI — Low Resource Languages for Emergent Incidents («Малые языки для чрезвычайных ситуаций»). Главная цель объединения — изучение грамматики малых языков, сообщается в пресс-релизе Суперкомпьютерного центра Огайо.

Основная проблема с изучением малых языков — очень ограниченное количество носителей и источников информации по теме. Для того чтобы хорошо выучить такой язык, приходится сначала проштудировать похожие, родственные языки, а уже потом перейти к целевому. Исследователю-человеку на это нужно много времени, ресурсов и умений.

Что касается искусственных исследователей — компьютеров и им подобных, — то для редкого языка нужна значительная вычислительная мощность, которой не обладают обычные машины. Именно поэтому лингвисты из Огайо объединились с Суперкомпьютерным центром.

Проектом LORELEI руководит лингвист Уильям Шуллер, под его началом команда из программистов и специалистов языкознания разрабатывает алгоритм, который сможет эффективно анализировать грамматику малых языков. Цель всего проекта сугубо прикладная — с помощью алгоритма машина будет изучать малые языки, чтобы потом составлять сообщения об угрозах и природных катастрофах для народов, не говорящих на каких-либо других языках.

Чтобы нагляднее показать причину использования суперкомпьютеров, достаточно сравнить цифры: обычный сервер при изучении грамматики может анализировать одновременно 15 грамматических категорий, а суперкомпьютер — сразу 50.

К грамматическим категориям языка относятся все системы значений, которые используются при изучении грамматики. Примеры таких категорий — время, лицо, род, падеж, а также отдельные части речи: существительные, прилагательные, глаголы и т.д.

Малые языки

К так называемым малым языкам принято относить системы коммуникации, которыми пользуются немногочисленные, компактно проживающие народы. Если смотреть сугубо по нумерации, то таких языков куда больше, чем крупных, но, в отличие от гигантов — китайского, английского, испанского, хинди, арабского и русского, — малыми языками пользуется лишь 0,2% населения планеты.

На данный момент исчезающими объявлены 400 из малых языков планеты. В России есть два очага, в которых сконцентрированы исчезающие языки — Сибирь и Дальний Восток, населенные коренными народами.

Много исчезающих языков в среде американских индейцев, аборигенов Австралии и Океании, а также туземцев на побережье Индийского океана, например, в Индонезии.

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.

Рассказать друзьям

0 Комментариев

Подписаться на рассылку

Комментарии

Войти с помощью 

Присоединяйтесь к нам в социальных сетях

В наших группах вы можете узнать много нового и интересного, а так же - принять участие в опросах и конкурсах

Присоединиться
Присоединиться