Idatzi: www.gaitu.eus. Bost axola euskaldunberriak garen, Iparraldekoak, bizkaitarrak, Athletic zaleak… Ordenagailuak proposatutako bost esaldi irakurtzea besterik ez dugu egin behar. Denetariko ahotsak, gizonezkoenak, emakumezkoenak (hauek faltan ditugu), desberdinak behar ditugu, makinek etorkizunean edozein euskaldunek esandakoak uler ditzan. Entrenamendu hutsa da.
Azken aste honetan, euskarak egin duen aurrerakada izugarria da. Ulertzeko erraza da: geroz eta gehiago, orduan eta hobeto. Makinentzako euskaltegi bat da Gaitu.eus. Egia esan, mundo osoko hizkuntz akademia herrikoitzat jo liteke Common Voice proiektua. Mozilla fundazioak abiatu zuen duela bost bat urte eta, gaur egun, euskara bihurtu da modako hizkuntza.
Mundo osoko 205 hizkuntzetan entrena dezakegu sistema. Librezale elkarteak abiatu zuen euskararen proiektua, eta Eusko Jaurlaritzaren atxikipena erabakiorra izan da.
“Euskararen aholku batzordeak esan zion Eusko Jaurlaritzari, hau bultzatu behar da”, azaldu du Marko Txopiteak, Librezale elkarteko kideak. Eta kanpaina medioetan eta, batipat, Euskal Telebistan azaldu zenetik, sekulako aurrera pausoa eman du. Pasa den asteazkenenan, euskaraz 13 ordu grabatu genituen euskaldunok. Egun bakarrean, 12.626 esaldi. Common Voice sistemako 205 hizkuntzek, euskara barne, 12.262 esaldi grabatzen dituzte egunero batazbesteko.
Astelehenean, munduko 205 hizkuntza horietatik, euskara 19. tokian zegoen. Asteazkenean, estatu-hizkuntz bi aurreratu zituen, pertisera eta italiera, munduko 17. tokian kokatuz. Eta gaurko, herri askotan maratoiak antolatu dituzte.
Zertarako? Adimen artifiziala entrenatzen ari gara honekin. “Sistemari euskara erakusten ari gatzaio.”, azaldu du Txopiteak. Esaldi bakoitzeko, makinak gure ñabardura guztiak erregistratzen ditu. Helburua ondorengoa da: etorkizunean, edozein euskaldunek, Siri e do Alexa, edo edozin call centerri euskaraz zerbait eskatzen badio, hark gu erraz ulertzea da. Horretarako ari gara makinak entrenatzen.
Euskaraz 487 ordu grabatu ditugu honezkero: 172.017 esaldi. Ehundaka euskaldunen ñabarduna, intonazio eta berezitasunekin. Ordenagailuak aurrean jartzen digun esaldia zuzen eta zintzo erreplikatu behar dugu, hori bai.
Adimen Artifiziala
Jadanik 8.000 lagunek baino gehiagok parte hartu dute adimen artifiziala auzolanean entrenatzeko ariketa honetan. Bost minutu baino gutxiago emango digu lan honek. Bost esaldi irakurri, eta ahal badugu (beharko genuke), beste hamar entzun eta balidatu. Sistemak gure ahotsa grabatzea eskatuko digu, baina grabatzen dugun esaldi bakoitzak birritan jaso behar du euskaldunon balekoa. Hau da, entzun botoia sakatuz, bost esaldi grabatu dituenak, beste euskaldun batzuek grabatu dituzten hamar esaldi entzun, eta zuzenak diren edo ez esan beharko luke. Balidazio prozesua da. Ez da nahiko guk gure ahotsa ematea, beste bi euskaldunek guk esandakoa zuzen dagoela behar dute.
Momentuz, desoreka dago eta gizonezkoen hainbat grabaketa deskartatzen ari da sistema. Zergatik? Beren ahotsa eman duten emakumezkoak askoz gutxiago direlako. Denetariko ahotsak behar ditu entzun eta ikasi makinak.