A la recerca d’una psicometria universal
Ressenya
The measure of all mind
Evaluating Natural and Artificial Intelligence
José Hernández-Orallo
Cambridge University Press
Cambridge, 2017.
553 pàgines
Cambridge University Press
Mètode
Revista de Difusió de la Investigació
www.metode.cat
Número 96. Hivern 2017
Pàgina 99
(versió llarga)
Malgrat ser un dels tòpics més importants de la ciència, el qualificatiu intel·ligent (intelligent, smart, thinking, brainy…) és possiblement el terme més sobreutilitzat, i per tant desprestigiat, de finals del segle XX i principis del XXI. En l’actualitat qualsevol artefacte que vulga ser valorat ha d’etiquetar-se com a intel·ligent. No s’és res en aquests temps si no s’és intel·ligent. I qualsevol cosa pot qualificar-se d’intel·ligent: des de telèfons intel·ligents fins a la banca intel·ligent. La publicitat està fent un ús excessiu del terme i ens està marejant. Però, què és la intel·ligència? es pot mesurar la intel·ligència? les màquines poden ser intel·ligents? Ara son més necessaris que mai treballs rigorosos sobre la intel·ligència i la seua mesura, tant de la natural com de l’artificial. Per això em va alegrar trobar-me amb aquest llibre, que, encara que en principi semble pretensiós en el seu títol (all mind, i disculpeu-me, però sóc professor de lògica i per tant, per a mi, tot és tot, sense excepcions – quantificació universal -, i en el món real he vist pocs casos en els quals es puga aplicar, més encara si estem implicats els humans), és d’obligada lectura per a aquelles persones interessades a conèixer on ens portarà la intel·ligència artificial (IA).
La intel·ligència és un tret de la ment associat habitualment i de forma exclusiva als humans, per això la denominació d’animals racionals. Però ja fa anys que es va estendre el concepte als animals (no racionals?) i es va estudiar el seu comportament (psicologia comparada). Amb l’aparició dels primers ordinadors, aquesta facultat també es va traslladar a les màquines. Només cal recordar que al principi els ordinadors eren coneguts com a cervells electrònics (cerebros electrónicos). Per tot açò, el concepte d’intel·ligència és relliscós i difícil de definir. La cerca d’un únic tipus d’intel·ligència es va veure superat en el segle XX amb l’aparició de diferents teories psicològiques que advocaven per noves i múltiples intel·ligències. I en l’actualitat fins i tot es parla de la singularitat tecnològica i la superintel·ligència (qualsevol intel·lecte que excedisca l’acompliment cognitiu humà en pràcticament totes les àrees d’interès i capaç de millorar-se contínuament). Així, en aquest context ens sorgeix una primera pregunta: és possible un concepte unificat d’intel·ligència?
I sense una definició clara, normalitzada i àmpliament acceptada, el treball de mesurar-la es converteix en més complicat. Quan no disposem d’una definició precisa del que volem mesurar necessitem almenys fer ús d’una mesura pragmàtica. Els tests que ofereixen una única mitjana, el factor g (general intelligence) i el quocient intel·lectual (IQ – intelligence quotient), es queden curts davant l’extensió del concepte intel·ligència. Turing, quan els ordinadors eren encara més models computacionals teòrics que reals, va proposar una prova d’intel·ligència per a les màquines (Test de Turing o Imitation Game). Més coneguts són els més moderns CAPTCHA (Completely Automated Public Turing test to tell Computers and Humans Apart) que hem de superar per a demostrar a alguns serveis d’Internet que no som robots. Lofti Zadeh, pare dels sistemes difusos (Fuzzy Systems), va proposar el MIQ (The Machine IQ) per a mesurar el rendiment en una població de màquines, encara que únicament serveix per a comparar màquines d’un mateix període tecnològic. Açò ens porta a la segona pregunta: serem capaços d’establir un model per a mesurar la intel·ligència d’humans, animals i màquines de forma conjunta i integrada?
Aquest és un dels llibres que hem de llegir si estem cercant respostes a aquestes preguntes. No és un llibre divulgatiu ni de fàcil lectura. Està carregat de contingut tècnic i terminologia teòrica. Necessita d’uns coneixements mínims sobre el tema, però val la pena la seua lectura.
L’autor defineix el regne de la màquina (machine kingdom), generalització del regne animal que inclou l’Homo sapiens, els animals i les màquines, com el conjunt de tots els sistemes interactius, és a dir, amb sensors (entrades) i actuadors (eixides). Les fronteres entre les intel·ligències naturals (en humans i animals) i les artificials són cada vegada més borroses de manera que formen finalment un contínuum en el qual constantment apareixen nous híbrids entre aquestes. Necessitem noves eines que ens permeten treballar en les fronteres. Quan unes proves d’intel·ligència són validades per a un determinat grup, poden ser usades per a mesurar subjectes d’aquest grup, però la qüestió és si podem usar el test d’una disciplina en una altra. Sembla clar que no, almenys de forma directa i automàtica. Però podem avançar cap a açò.
I definit un regne únic que engloba tots els individus (agents) a analitzar ja podem intentar establir una psicometria universal, definida com l’anàlisi i desenvolupament d’eines de mesura per a l’avaluació de les característiques del comportament, incloent-hi les habilitats cognitives i els trets de personalitat. Aquestes eines han de treballar solament amb informació procedent de l’observació del comportament: de les entrades que rep i de les eixides que produeix. És per açò que són anomenades de caixa negra (black-box). En els humans hi ha diferents models per a representar els trets de personalitat (per exemple, The Big Five). I quant a les habilitats cognitives, aquestes no han de ser dependents de la cultura, per exemple. Però a més, hi ha trets innats i altres adquirits, confluint una certa proporció que és genètica i una altra part que és ambiental. Així, aquest és un dels aspectes clau si s’estudia la intel·ligència dels animals. La intel·ligència és la que ens permet abordar futurs problemes i no únicament una tasca concreta en l’actualitat. Per resumir, quines són aqueixes habilitats cognitives i trets de personalitat comunes a persones, animals i màquines que hem de mesurar?
Si volem que aquests instruments de mesura servisquen tant per a humans, animals, com per a màquines, han de tenir algunes característiques especials que no suposen un biaix en les mesures. Per exemple, hem de tenir en compte el llenguatge utilitzat, les interfícies i les recompenses i estímuls. En el llibre es planteja que aquests instruments han de ser no antropocèntrics, computacionals i significatius. Hi ha tres aspectes claus que ens ajudaran a fer les proves el més universals possibles: l’ús de diferents interfícies, els tests adaptatius segons anem obtenint major coneixement sobre l’agent que l’està fent i que siguen independents de la població sobre la qual s’aplica, de manera que funcionen sobre la totalitat del regne màquina. Si no podem usar les mateixes regles per a tots, almenys que puguem usar els mateixos principis per a construir totes les regles particulars. El que ens porta a una altra qüestió: quins són els criteris que hauria de complir una bateria única de proves d’intel·ligència?
La part nuclear del llibre s’aborda des de la visió algorítmica de la naturalesa i la cognició des d’una perspectiva computacional. Si podem representar els comportaments com algoritmes, aprofitarem la Algorithmic Information Theory (AIT) per a trobar respostes a algunes de les qüestions anteriorment plantejades. Apareix en aquest cas la noció de dificultat, i la seua quantificació (nombre de passos computacionals requerits), com l’embrió de la psicometria universal que cerquem. El C-test se’ns presenta com una primera aproximació per a abordar la subjectivitat de les proves psicomètriques, en els quals els ítems no són triats ad hoc i amb dificultats derivades de la seua aplicació a poblacions humanes.
Però, de moment, no aprofundim més en la qüestió. El llibre desenvolupa una exhaustiva explicació tècnica del tema. Aquesta ressenya no pretén desvetlar totes les respostes donades en el llibre, sinó plantejar les preguntes i motivar al lector perquè aborde la seua lectura. No se’n penedirà.
Faraón Llorens
Departament de Ciència de la Computació i Intel·ligència Artificial
Universitat d’Alacant