Задачи проекта

На современном этапе своего развития арменистика остро нуждается в новых методах и лингвистических инструментах изучения структуры языка, которые позволили бы исследователям с достаточной степенью надежности верифицировать те или иные лингвистические гипотезы и модели, а также достичь принципиально новых научных результатов. Корпусно ориентированные исследования могут значительно способствовать разработке слабоизученных и постановке новых исследовательских проблем.

Восточноармянский национальный корпус (ВАНК) призван восполнить дефицит корпусных лингвистических ресурсов и предоставить в распоряжение лингвистов справочно-информационную систему по литературному варианту восточноармянского языка. Эта система оснащена мощным поисковым аппаратом и включает широкий диапазон восточноармянских текстов – от классических литературных произведений девятнадцатого века до диалогов, записанных на улицах Еревана в 2008 г.

Главная цель проекта – создание инструмента, который поможет лингвистам находить в восточноармянских текстах предложения и более крупные фрагменты, удовлетворяющие определенным поисковым критериям. ВАНК позволяет использовать в качестве критериев поиска следующие типы информации:
  • словоформы и лексемы
  • лексические и грамматические категории, словоизменительные типы
  • пунктуация и регистр

ВАНК позволяет также осуществлять контекстные запросы для поиска сочетаний нескольких слов.

Кроме того, в ВАНК возможен поиск в определенном подкорпусе текстов, например, в произведениях одного автора или в совокупности текстов, ограниченной определенным жанром или временем написания.

Позволяя исследовать образцы литературного варианта восточноармянского языка в разные периоды его существования, различные языковые жанры и типы дискурса, ВАНК может также использоваться как инструмент в преподавании восточноармянского языка. Пользователи, для которых армянский язык не является родным, а также лингвисты-типологи могут пользоваться английскими переводными эквивалентами, которые приписаны значительной части словоупотреблений ВАНК. Существуют и другие возможные сферы применения ВАНК – например, литературоведение, журналистика, история или культурология.

ВАНК является национальным корпусом армянского языка в том смысле, в котором этот термин используется в названии пионера корпусных технологий – Британского национального корпуса. ВАНК – это попытка представить современный восточноармянский язык во всей его полноте методами корпусной лингвистики. В корпусе представлено практически все разнообразие культурно и лингвистически значимых типов восточноармянских текстов.

ВАНК является проектом не только в области арменистики, но и, в не меньшей степени, в области корпусной лингвистики. В рамках проекта была разработана гибкая структура хранения данных и поисковая платформа, которая может использоваться для создания и использования корпусов других языков, для исследования возможностей статистических методов в описании языков и для разработки прикладных методов обработки языковых данных.