ԱՐԵՎԱԿ-ի քերականական վերլուծիչ


ԱՐԵՎԱԿ-ում ընդգրկված տեքստերի էլեկտրոնային հավաքածուն մշակվել է ԱՐԵՎԱԿ-ի քերական
ական վերլուծիչի միջոցով: Այն ձևաբանական վերլուծման ծրագիր է, որը ստեղծվել է Կորպուս Թեքնոլոջիսի կողմից: ԱՐԵՎԱԿ-ի քերականական վերլուծիչը կցում է բառանիշի պիտակավորում յուրաքանչյուր բառաձևին, որի բառույթը առկա է ԱՐԵՎԱԿ-ի քերականական բառացանկում:

Ձեր ուշադրությանն ենք ներկայացնում ԱՐԵՎԱԿ-ի քերականական վերլուծիչի կողմից մշակված նմուշ:

Քերականական վերլուծությունը ապահովելու համար նախ և առաջ մշակվել է անվանական և բայական բառաթեքման տեսակների սպառիչ դասակարգման համակարգ: Ապա բառացանկի յուրաքանչյուր բառաթեքման ենթարկվող բառույթին կցվել է թեքման տեսակին համապատասխանող որոշակի պիտակ (օրինակ`N11): Արդյունքում ստեղծվել է ԱՐԵՎԱԿ-ի քերականական բառացանկը:

Ներկայումս ԱՐԵՎԱԿ-ի բառանիշ
ների 72.6%-ը ստանում է միանշանակ վերլուծություն, 17%-ը` ոչ միանշանակ, իսկ 7.5%-ը՝ չի վերլուծվում: Քերականական վերլուծությունը անմիջականորեն կախված է ժանրից: Հասկանալի պատճառներով ամենաշատ չվերլուծված բառերը բանավոր խոսքի տեքստերում են:

ԱՐԵՎԱԿ-ի Քերականական վերլուծիչ՝ ըստ վերլուծությունների տեսակների բաշխման  
2009 թ. հունվարի դրությամբ            
               
# վերլուծություն Մեկնաբա
նություններ

Գեղ. 

Գիտ. 

Մամուլ

Այլ գրավոր խոսք

Բանավոր խոսք

 Ընդամենը 

               
1 միանշանակ 75,4% 67,0% 72,6% 69,4% 65,2% 72,6%
               
2 համանուն բառեր 15,1% 9,6% 12,7% 12,3% 12,8% 13,3%
3 համանուն բառեր 1,8% 2,1% 2,0% 1,8% 1,6% 1,9%
4 - 7 համանուն բառեր 1,8% 2,1% 2,0% 1,8% 1,6% 1,9%
Միանշանակ ընդամենը՝ 18,7% 13,7% 16,7% 15,8% 16,0% 17,0%
               
1? վարկածային (բառարանում չընդգրկված) 0,0% 1,3% 0,6% 0,7% 0,2% 0,5%
               
0 չճանաչված 5,4% 11,9% 7,7% 7,0% 12,3% 7,5%
               
Հատուկ բառանիշեր՝ կիրիլիկ, լատիներեն, թվեր   0,3% 6,3% 2,8% 5,6% 6,0% 2,4%
               
Ընդամենը՝   100% 100% 100% 99% 100% 100%


Ոչ միանշանակ վերլուծություն (համանունություն)
Կանոնավոր և պատահական համանուն բառերը արևելահայերենում շատ տարածված են: Օրինակ` արևելահայերենի -ե (-e) խոնարհման բայերի անորոշ և վաղակատար դերբայների ձևերը սովորաբար համանուն են (գրել grel  ‘to write’): Որպես պատահական համանունության օրինակ կարելի է բերել հարգի բառաձևը, որը  վերլուծվում է և՛ որպես ածական՝ հարգի hargi  ‘respectable’, և՛ որպես հարգել hargel  բայի ստորադասական եղանակի երրորդ դեմքի եզակի թվի ներկա ժամանակի բառաձև: 

Ներկայումս ԱՐԵՎԱԿ-ի քերականական վերլուծիչը չի վերլուծում համատեքստային և շարահյուսական ինֆորմացիան. այն մշակում է միայն ձևաբանական ինֆորմացիան: Արդյունքում ԱՐԵՎԱԿ-ի քերականական հարցումները կարող են տալ համանուն վերլուծություններ, որոնք իրականում կարող են տարբերակվել՝ կախված համատեքստից: Հնարավոր սխալ վերլուծությունները կրճատելու համար անհրաժեշտ է ավելացնել սահմանափակող չափանիշներ, օր.՝ ավելացնել ևս մեկ բառաձև, որը կարող է լինել  համապատասխան համատեքստում: Բացի այդ համանուն դեպքերը կարող են ընդհանրապես բացառվել (տե՛ս Ընդլայնված որոնում բաժինը): Այդ դեպքում, սակայն, արդյունքների քանակը կարող է զգալի կերպով կրճատվել:

Երբեմն որոշակի հաճախակի հանդիպող դեպքերի համար քիչ հավանական համանունությունը հանվել է, օր.՝ աս գոյականի ներգոյական բառաձևը՝ ասում, որը համընկնում է ասել բայի անկատար դերբայի հետ:

Զրոյական վերլուծություն

Ներկայումս որոշ բառանիշներ չեն վերլուծվում, քանի որ դրանք բացակայում են ԱՐԵՎԱԿ-ի քերականական բառացանկից: Նման բառերը հիմնականում ընդգրկում են.

  • համեմատաբար վերջերս փոխ առնված բառերը, 
  • նորաբանությունները, 
  • որոշ ռուսերեն կամ անգլերեն բառերը, 
  • հապավումները, 
  • հատուկ անունները, 
  • տեխնիկական տերմինները, 
  • արևմտահայերեն ուղղագրությամբ բառերը, 
  • գրաբարի ուղղագրությամբ բառերը, 
  • տպագրական սխալները, 
  • բառացանկում չընդգրկված բառաթեքման տեսակների (հիմնականում բանավոր խոսքի դեպքում) բառերը, 
  • տեսածրման հետևանքվ առաջացած սխալները, 
  • բնագրում առկա տառասխալները: 

 

Տարվում են մշտական աշխատնքներ ԱՐԵՎԱԿ-ի բառացանկի բացթուղումները լրացնելու և տեքստերում առկա վրիպակներն ուղղելու ուղղությամբ: Մենք շատ երախտապարտ կլինենք նման թերությունների մասին Ձեր արձագանքի համար:


Հավանական վերլուծություն
Որոշ հապավումների համար ԱՐԵՎԱԿ-ի վերլուծական ծրագիրը առաջարկում է հավանական վերլուծության տարբերակներ (հիմնականում գծիկով և հոլովի/թվի վերջածանցին նախորդող հապավումների համար): Նման բառանիշների վերլուծություններում ավելացվում է հավանական բառույթը հարցական նշանով:

Վերլուծական կազմություններ
Ոչ համատեքստային քերականական վերլուծության արդյունքում արևելահայերենի բայական վերլուծական կազմությունների բաղադրիչ մասերը ներկայումս վերլուծվում են որպես առանձին ձևաբանական-շարահյուսական միավորներ: Նման վերլուծական կազմությունները կարելի է գտնել քերականական հարցումների միջոցով, որի համար անհրաժեշտ է միայն ավելացնել օժանդակ բայը: Օրինակ՝ անկատար դերբայի հարցումը, որին անմիջապես հետևում է  է ē  ‘to be’ օժանդակ բայը, կտա անկատար ժամանակի վերլուծական բայաձևերը: