| |||||||||||||
|
Задачи проекта
На современном этапе своего развития арменистика остро нуждается в новых методах и лингвистических инструментах изучения структуры языка, которые позволили бы исследователям с достаточной степенью надежности верифицировать те или иные лингвистические гипотезы и модели, а также достичь принципиально новых научных результатов. Корпусно ориентированные исследования могут значительно способствовать разработке слабоизученных и постановке новых исследовательских проблем. Восточноармянский национальный корпус (ВАНК) призван восполнить дефицит корпусных лингвистических ресурсов и предоставить в распоряжение лингвистов справочно-информационную систему по литературному варианту восточноармянского языка. Эта система оснащена мощным поисковым аппаратом и включает широкий диапазон восточноармянских текстов – от классических литературных произведений девятнадцатого века до диалогов, записанных на улицах Еревана в 2008 г. Главная цель проекта – создание инструмента, который поможет лингвистам находить в восточноармянских текстах предложения и более крупные фрагменты, удовлетворяющие определенным поисковым критериям. ВАНК позволяет использовать в качестве критериев поиска следующие типы информации:
ВАНК позволяет также осуществлять контекстные запросы для поиска сочетаний нескольких слов. Кроме того, в ВАНК возможен поиск в определенном подкорпусе текстов, например, в произведениях одного автора или в совокупности текстов, ограниченной определенным жанром или временем написания. Позволяя исследовать образцы литературного варианта восточноармянского языка в разные периоды его существования, различные языковые жанры и типы дискурса, ВАНК может также использоваться как инструмент в преподавании восточноармянского языка. Пользователи, для которых армянский язык не является родным, а также лингвисты-типологи могут пользоваться английскими переводными эквивалентами, которые приписаны значительной части словоупотреблений ВАНК. Существуют и другие возможные сферы применения ВАНК – например, литературоведение, журналистика, история или культурология. ВАНК является национальным корпусом армянского языка в том смысле, в котором этот термин используется в названии пионера корпусных технологий – Британского национального корпуса. ВАНК – это попытка представить современный восточноармянский язык во всей его полноте методами корпусной лингвистики. В корпусе представлено практически все разнообразие культурно и лингвистически значимых типов восточноармянских текстов. ВАНК является проектом не только в области арменистики, но и, в не меньшей степени, в области корпусной лингвистики. В рамках проекта была разработана гибкая структура хранения данных и поисковая платформа, которая может использоваться для создания и использования корпусов других языков, для исследования возможностей статистических методов в описании языков и для разработки прикладных методов обработки языковых данных.
| ||||||||||||