Adimen artifiziala

Aurpegian aurpegiak ezagutzeko lerroak dituen emakume baten bustoa.

Adimen artifiziala

Zer da adimen artifiziala? Eztabaida: existitzen al da “adimen” artifiziala? Zeintzuk dira adimen artifizial motak? Zer da arrakala digitala?

Nola eragiten dio jada adimen artifizialak eta nola eragingo dio laster gure bizitzako hainbat alderdiri eta zergatik da garrantzitsua arrakala digital mota desberdinak ahalik eta gehien ulertzea eta saihestea?

ADIMEN ARTIFIZIALA

Zer da adimen artifiziala? Adimena da benetan?

Horiek oso galdera konplexuak dira. Haiei erantzuteko, definizioak begiratzen saia gaitezke. “Artifiziala” hitzak gizakiak sortutakoa esan nahi du. “Adimen” hitzerako, berriz, bi definizio nagusi daude:

a) Ulertzeko gaitasuna.

b) Arazoak konpontzeko gaitasuna.

Lehenengo definizioa erabili ohi dugu norbait azkarra dela edo ez dela esateko. Baina ez genuke inoiz esango kalkulagailu bat adimentsua denik, eta, hala ere, badu buruketak ebazteko gaitasuna; adibidez, egin dezake zatiketa bat.

“Adimen” hitzak arazoak ekar ditzake, makinek hartutako erabakiak zuzenak izango direla pentsa dezakegulako, “adimendunak” direnez gero. Beraz, adimen hori “artifiziala” (gizakiak egina) izateari erreparatuko diogu. Horrela, ohartuko gara garrantzitsua dela zenbaterainoko kultura zientifikoa duten algoritmoen sortzaileek.

Horretaz guztiaz hitz egin ahal izateko, lehenik algoritmoa zer den ulertu behar dugu.

ALGORITMOAK

Zer da algoritmoa? Algoritmoa da jarraibide edo arau definitu, ez-anbiguoak, ordenatu eta finituen multzoa, eta arazo bat konpontzeko, zenbaketa bat egiteko, datuak prozesatzeko eta beste zeregin edo jarduera batzuk egiteko aukera ematen du. Algoritmo batek inputa behar du (sarrera) eta prozesuaren emaitza outputa izango da (irteera).

Algoritmo baten sarrera-datuak karratu gisa, algoritmoa kubo gisa, eta irteera-datuak zirkulu gisa.

Inputa edo sarrera: Prozesu baten hasierako datuak edo balioak dira, kalkulu edo jarduera bat egin ahal izateko beharrezko diren datuak edo balioak.

Outputa edo irteera: Algoritmo edo programa batek funtziona dezan, hasierako datu horiekin hainbat kalkulu eta funtzio egiten dira; hori da, hain zuzen, algoritmoaren prozesua. Prozesu horien emaitza irteerako edo outputeko datuak dira.

Sartzen ditugun datuek funtsezko zeregina dute.

ONURAK

Adimen artifizialaren onura batzuk honako hauek dira: zeregin nekagarriak automatizatzea, gizakiok egiten ditugun akatsak murriztea, erabaki informatuak hartzeko datuak aztertzea, diagnostikoetan eta prozedura medikoetan laguntza ematea, eta ibilgailu autonomoek aurrera egitea, besteak beste.
Behar bezala erabiliz gero, oso erabilgarria izan daitekeen adimen artifizial mota bat ikasketa automatikoa (Machine Learning) da. Ikasketa automatikoa erabiliz, sistema batek datuetatik ikas dezake eta esperientziaren bidez hobetu daiteke, programazio esplizitu batetik ikastera mugatu beharrean. Ahotsa ezagutzeko programak eta auto autonomoak ikasketa automatikoaren adibide dira.

ARRISKUAK

Zer da arrakala digitala?

Informazioaren eta komunikazioen teknologietarako sarbidean, erabileran edo eraginean gizarte-taldeen arteko edozein banaketa desberdin da. Talde horiek generoaren, geografiaren, geopolitikaren, kulturaren eta beste hainbat irizpideren arabera defini daitezke.

Algoritmoen emaitza sarrerako datuen (inputa) eta prozesuaren araberakoa dela ikusi dugu. Datuak pertsonek biltzen dituzte eta prozesuak pertsonek diseinatzen dituzte. Oso ohikoa da pertsonok aurreiritzi sozialak eta alborapen kognitiboak izatea edota pentsatzean erroreak egitea (logikoak, estatistikoak, etab.). Algoritmoek egileen alborapenak eta erroreak transmititzen dituzte, bai datuen bilketan, bai algoritmoen diseinuan.

Lagin-alborapena

Garrantzitsua al da hau? Zergatik?

Gaur egun, teknologiak norbaiti bizia alda liezaioketen erabakiak hartzen laguntzen du. Adibidez, adimen artifizialak erabaki dezake nork duen eskubidea banku-mailegu bat edo bizi-aseguru bat izateko, pertsona batek zer tratamendu mediko jaso behar duen edo nork eskura dezakeen lanpostu bat. Alborapenak badaude, gutxietsitako gutxiengoek galtzen ateratzeko aukera handiagoa dute.
Besteak beste, bi alborapen mota aurki ditzakegu adimen artifizialean, eta elkarrekin erlazionatuta daude.

Besteak beste, bi alborapen mota aurki ditzakegu adimen artifizialean, erlazionatuta daudenak.

1) Alborapen algoritmikoa edo «datuen alborapena», non algoritmoak datu alboratuak erabiliz entrenatzen diren.

2) Bestea alborapen soziala da. Hor ditugu gizarte gisa ditugun usteak eta arauak, «puntu itsuak» (adibidez, gu zuriak bagara, agian, ez gara ohartuko beltzek jasaten dituzten mespretxuez). Alborapen sozialak eragin nabarmena du alborapen algoritmikoan, eta alderantziz ere gertatzen da: alborapen sozialak gora egin dezake datuen alborapenaren hazkundeagatik, eta horrek alborapen sozial handiagoa ekarriko du, eta alborapen soziala handiagotzeak, datu gehiago alboratzea.

Ikasketa automatikoan oinarritutako datuak aztertzeko sistemek zenbait pertsona-talderen aurkako diskriminazioa erakusten dute; adibidez, aurpegia ezagutzeko teknologiek.

Algoritmo horiek hainbat arazo dituzte afro-amerikarrak eta asiarrak antzemateko orduan. Zergatik da hori arazo bat? Adibidez, ikerketa kriminaletan, algoritmoak norbait susmagarri gisa modu okerrean hautatzen badu, pertsona errugabe bat kaltetua gerta daiteke, eta erruduna aske geratu.


Baina zergatik gertatzen dira errore horiek? Erantzuna algoritmoak elikatu dituzten datuetan dago, hala nola, algoritmoak garatzeko erabili diren laginen datu multzoetan zuriak ez diren aurpegien gabezia erlatiboan. Mundu osoko koloredun pertsonen eta haien aurpegien ezaugarri eta azal-tonu anitzen irudikapen txarrak teknologian integratutako alborapen demografikoa deritzotena sorrarazten dute. Bestalde, poliziak Estatu Batuetan erabiltzen dituen datu-base kriminaletan pertsona beltz gehiegiren datuak gordetzen dira, eta horrek areagotu egiten du arrazen arteko aldea.

TALDE GUTXITUEK JASATEN DITUZTEN ALBORAPENAK: EUSKARAREN KASUA

Ikaskuntza automatikoko teknologien aurrerapen azkarrei esker, datu-multzo masiboekin entrenatu behar diren lengoaia-eredu handiak (Large language model edo LLM) eraiki daitezke. Ikusi dugunez, datuetatik ikasten duten sistemak eskuragarri dauden datuen mende daude. Munduko hizkuntzen proportzio handi bat hizkuntza-teknologia digitaletatik nabarmen baztertzeak eragin negatiboa du hizkuntza naturala prozesatzeko (Natural language processing edo NLP) eskuragarri dauden datuetan. Horrek lengoaia-eredu handiak osatzeko erabilitako hizkuntzen datu multzo handiei eragiten die. Teknologia horien erabiltzaileen ama-hizkuntza ez baldin bada eredu horiek erabiltzen dutena, desabantaila argian daude. Gaur egun, sistema horiek zenbait hizkuntza nagusiren alde egiten dute. Ingelesa gailentzen ari da, jakina, hizkuntza horretan dauden datu ugariengatik, eta horrek eten digital mota berria dakar.