Xuxen euskarazko zuzentzaile ortografikoa etorri zen lehendabizi eta hitzetan zeuden akatsak gorriz azpimarratu zituen. Bada, EHUko IXA taldeak ordenagailuei euskaraz irakasten jarraitzen du eta pausu bat gehiago eman du hitzetatik esaldietara pasatuz. Saroi sistema berriak esaldietan dauden akatsak detektatzen ditu.
Amagoia Mujika
2009ko Irailaren 25a
Ordenagailuak euskaraz ikasten ari dira. Lehendabizi Xuxen zuzentzaile ortografikoa etorri zen. Xuxenek hitzetan gertatzen diren akatsak detektatzen ditu. Bada, Euskal Herriko Unibertsitateko IXA taldeak lanean jarraitzen du eta pausu bat gehiago eman du; hitzetan ez ezik, sintagmetan eta esaldietan dauden zenbait errore detektatzeko modua sortu du.
Maite Oronoz Informatikan doktore berria da. IXA taldeko ikertzailea da 1996. urteaz geroztik, eta EHUko Informatika Fakultateko irakasle laguna da 2001etik hona. «IXA taldea oso handia da eta baditugu azpitaldeak. Horietako batean hizkuntzen irakaskuntzan eta erroreen detekzioan egiten dugu lan. Karrera bukatu eta tesiarekin hasi nintzen ni. Ortografia alorra landuta zegoen Xuxen zuzentzailearekin eta helburua irakaskuntzarako baliagarria den zerbait sortu eta zuzentzaile gramatikalaren bidean lanean hastea nuen», agertu du Oronozek.
«Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko baliabideen garapena: datak, postposizio-lokuzioak eta komunztadura» izenburua du tesiak eta bi zatitan banatuta dago. «Errore motak banatu egin ditut. Alde batetik, lauzpabost hitzetako leihoetan gertatzen diren erroreak daude, lokalak edo testuinguru mugatukoak. Datetan eta postposizio-lokuzioetan gertatzen direnak landu ditut eta tratatzeko errazagoak dira beti, esaldiko ordenan jarraian dauden hitzetan gertatzen direlako».
Adibidez, Donostian, 2009ko irailak 26a moduko data okerrak detektatzeko eta zuzentzeko edo zu buruz hitz egin bezalako postposizio erroredunak zuzentzeko modua sortu du Oronozek. «Horretarako tresna konkretu batzuk erabili ditut, lehendik ere bazeudenak. Hizkuntzaren tratamendu automatikoko bi tresna ezagun hartu eta euskararako gramatikak sortu ditut. Finean, euskararen tratamendurako erabili ditut aurretik bestelako hizkuntzetarako erabiltzen diren tresnak». XuxenG zuzentzaile gramatikalaren lehen bertsioan dagoeneko integratuta dago tresna horietako bat eta postposizio-lokuzioetan dauden erroreak detektatzeko eta zuzentzeko modua eskaintzen du.
Baina lauzpabost hitzeko egituratik harago joan da Oronoz bere tesian. Esaldietara egin du salto eta XuxenG harago eramateko aukera sortu du.
«Testuinguru zabaleko erroreak detektatzeko tresnarik ez dut topatu eta horregatik sortu dut Saroi sistema», agertu du. «Euskaraz esaldi bereko osagaiak ordena ezberdinetan antola daitezke. Horregatik da zaila komunztadurarekin gertatzen diren moduko erroreak detektatzeko gramatikak sortzea. Zuhaitzera jo beharra dago, esaldiaren egiturara, eta horretarako sortu da Saroi».
Saroi sistemak esaldiaren analisi zuhaitzak eraikitzen ditu, esaldiaren egitura eraikitzen du, eta gai da esaldi horretan dauden erroreak detektatzeko. «Helburua da zuhaitzetan informazio linguistikoa topatzea, kasu honetan erroreak topatzea».
Saroi tresna erabilgarria izan daiteke ordenagailuz lagundutako hizkuntzen irakaskuntzari begira, baita gramatika zuzentzaileentzat ere. Hala ere, oraindik ez da tresna erabilgarria. «Saroik azpitik analisi mordoa egiten ditu, informazio asko dauka eta hori guztia enpaketatzea eta testu batean aplikatzea ez da erraza. Egin ahal da, baina oraindik ikertu egin behar da nola murritz daitekeen informazio hori guztia eta nola txerta daitekeen testuak editatzen dituen programa baten barruan. Ez da batere erabilgarria esaldi bat zuzentzeko bost minutu behar izatea eta hori da falta zaiona, aplikazioa sinplifikatu eta eraginkorra egitea».
Ordenagailuak ez daki dena
Badu beste trabarik. «Ordenagailuak ez dauka munduko ezagutzarik. Beretzat hitzek ez daukate esanahirik eta askotan oso zaila da zerbait errorea den edo ez jakitea. Informazio semantikoa behar da, esanahiari buruzko informazioa, eta ordenagailuak ez dauka hori. Tresna horiek daukaten hutsunea hori da, ez daukatela ez munduaren ezagutzarik ez semantikarik, oraindik. Taldean batzuk dagoeneko ari dira semantikaren alorrean lanean». Horrek esan nahi du ordenagailuak oraindik ez direla gai den-dena zuzentzeko. «Gauza batzuk oso ondo zuzendu ditzake, errore argiak direlako. Baina beste batzuetan hutsuneak izango ditu».
Baina horretan ere ari dira lanean, hutsuneak konpontzen alegia. «Adibidez badago alor bat hitzen adiera desanbiguazioa deitzen zaiona. Esaldi batean baso hitza erabiltzen duzunean, ordenagailuak jakin behar du edalontziari buruz edo oihanari buruz ari zaren. Horretan ere lanean ari gara eta ordenagailua saiatzen da esaldiaren testuinguruaren arabera hitz horren benetako esanahia zein den jakiten». Esaldien arteko esanahi-lotura egiten ere ez dakite oraindik ordenagailuek. «Bidean gaude baina zaila da. Errore batzuk detektatzeko modua badago, baina beste batzuk detektatzea zaila da, hizkuntza oso anbiguoa delako. Gizakiok badakigu anbiguotasun hori ebazten baina ordenagailuak, oraindik, ez. Gu saiatzen gara gure tresnekin baina gauza batzuk benetan zailak dira».
Esandakoa, IXA taldeak ordenagailuei euskaraz irakasten jarraitzen du. «Baina ordenagailua ez da pertsona bat. Simulatu egiten du pertsona baten hizkuntza-ezagutza baina falta zaio bizitza, munduari buruzko ezagutza eta semantika», bukatu du Maite Oronozek.




