Etiquetes

, , , ,

El concepte d’intel·ligència artificial s’està posicionant com a producte en forma d’assistents personals com Google Now o Cortana de Microsoft, que a partir de la informació que generem i que són capaços de capturar i interpretar, ens poden acabar avisant de possibles reunions, vols o quines notícies ens poden interessar. Tot i que l’àmbit de la IA és molt més ampli, per ara les limitacions tècniques i ètiques en limiten molt la seva aparença, fins al punt que el cas de Siri d’Apple, quan s’han provat els altres dos, no deixa de ser un reconeixement de veu maquillat, amb una comprensió limitadíssima i molt poques opcions. Que potser és millor a efectes pràctics, veient com pot espantar-nos que dos robots virtuals de Google o Microsoft puguin saber tant sobre nosaltres com per avançar-se a les nostres necessitats.Però la meva pregunta es dirigeix a un tema molt més concret: com ens hauríem de comunicar amb aquests sistemes d’intel·ligència artificial? Entre Google, Microsoft i Siri hi distingeixo tres models diferents:

1.- Google Now es basa en una comunicació passiva, pràcticament no cal dir-li res perquè ens sorprengui sabent ja el que necessitem. D’acord: pot semblar paranoic, però quan se’n coneix el funcionament i s’aprèn com escollir a quines dades té accés, per mi és el més pràctic de tots, tot i que requereix, al meu entendre, d’un domini avançat en privacitat i de molta atenció per saber què li estem “donant” en cada moment.

2.- Microsoft, amb Cortana, aposta plenament per una comunicació conversacional i el més semblant possible a la comunicació humana. Fet que presenta moltíssims interrogants, com ja ho va fer el seu robot a Twitter, en Tay: comprendre els tons de veu, construccions de frases entretallades, ironia o sàtira, i a més poder-los aplicar no només és un repte a nivell tecnològic sinó també cultural, perquè implica que per a respondre’ns, el robot en qüestió hauria de conèixer l’entorn, què és correcte i què no, i a quin tipus de persona es dirigeix -potser ens agrada l’humor negre, però potser som con en Sheldon Cooper i necessitem cartells que indiquin quan parlem amb sarcasme. Així que probablement, i sobretot en català, serà molt més complex veure-ho aviat.

3.- Apple, amb Siri, opta per limitar molt les opcions. Que, de fet, és la manera de fer-ho fàcil, evitar males interpretacions, o que hi hagi massa diferència entre idiomes. Però aquestes limitacions fan de Siri més aviat un accés directe a les opcions del telèfon, tot i que és capaç de reconèixer hores o ordres prou complexes com per tenir-lo en compte encara que a nivell de comunicació ofereixi poques opcions.

Però havent citat aquests tres assistents, cal destacar que la intel·ligència artificial no és només això, és un àmbit molt més gran, que s’utilitza tant en mineria de dades com en comportaments molt més simples. I quan pensem en com comunicar-nos-hi hem de veure els reptes que suposa cada possible opció, des d’un teclat amb el que escriure-hi comandes -com en la informàtica “de sempre” després de les targetes perforades- fins a algun tipus de dispositiu capaç de captar la nostra activitat cerebral per tal de detectar què volem sense haver-hi de parlar, passant per una comunicació en forma de comandes de veu curtes o amb converses complexes. Com més complex és per l’usuari (per exemple, escriure comandes tancades) més senzill és pel computador comprendre l’ordre i executar-la. Però s’entén que es busca simplificar al màxim la tasca de l’usuari, de manera que potser acaba sent més viable, amb el temps, llegir-nos els pensaments amb dispositius de lectura neuronal que fer que un robot entengui les ordre que li dicti un americà, un rus, un català de Vic o un japonès, cadascú amb el seu vocabulari, accent i entorn cultural concrets. I tot això també dependrà dels futurs usos que se’n derivin: no és el mateix utilitzar una eina assegut a l’ordinador que mentre es condueix, es cuina o es fa submarinisme.

Anuncis