Més de vint anys estudiant el llenguatge natural
El Dr. Horacio RodrÃguez és un dels cientÃfics que va veure néixer l'actual grup de recerca en processament del llenguatge natural (GRPLN). L'Horacio es va interessar pel processament del llenguatge natural quan a Espanya era un tema gairebé desconegut. Actualment, el grup de recerca GRPLN del departament de llenguatges i sistemes de la UPC, compta amb més de vint investigadors i és reconegut a nivell internacional. Moltes empreses mostren el seu interès en aquest à mbit i ha esdevingut una lÃnia de recerca gairebé amb entitat pròpia. Ha nascut l'enginyeria LingüÃstica.
Per on començar? Pel començament...
Després d'intercanviar unes poques paraules, la meva curiositat em dugué a investigar qui era aquell cientÃfic interessat pel llenguatge natural. Fou tot un plaer descobrir que l'Horacio m'havia portat a un naixement!. Avui tinc moltes ganes de preguntar-li com va començar GRPLN?
|
Els orÃgens
|
Avui en dia...
|
|
He sentit a dir, que tu ets el pare del grup de recerca en processament de llenguatge natural. I on va néixer aquesta curiositat?
i qui va crear els grups de recerca en Processament del Llenguatge Natural aquà a Barcelona, a Donosti i a Madrid. A la resta del món la curiositat pel llenguatge natural neix conjuntament amb el naixement espanyol?
No, en aquells moments, fa més de vint anys, fora d'Espanya ja hi havia tradició en l'estudi del llenguatge natural, bà sicament en anglès.Fa més de vint-i-cinc anys, quan tu deuries començar a estudiar la teva carrera, la facultat d'informà tica encara no s'havia constituït com la coneixem ara. Què vares estudiar?
Jo vaig estudiar Enginyeria Industrial i FÃsica. Enginyeria Industrial i FÃsica? I amb aquest background, què et va atreure de la informà tica per conduir la teva vida cap a ella?
Quin fou el tema de la teva tesi doctoral?
Uf! Ja fa tants anys, i hem anat investigant tant... que es fa estrany parlar d'aquells orÃgens. Jo vaig estudiar la comunicació mà quina-persona en llenguatge natural. En aquell moment era una revolució... Mica a mica, les lÃnies han anat canviant. La teva tesi pot ser et queda una mica enrere en el temps... però pot ser et són més properes totes aquelles tesis que has dirigit tu des de llavors?
SÃ!. La veritat és que al principi érem molt pocs. La Felisa va marxar al poc temps i actualment treballa a la UNED. Aixà que jo he hagut de supervisar moltes tesis doctorals, ja en porto onze.Haver estat el director de tantes tesis doctorals implica un gran esforç i temps per part meva, però em sento molt satisfet en pensar que aquesta despesa energètica s'ha transformat en quelcom molt enriquidor. Al principi em vaig haver d'introduir en molts temes, això m'ha donat una visió més à mplia i m'ajuda molt sovint a poder fer enllaços entre temes molt diversos. Qui eren tots aquests doctorands?
Doncs molts del qui ara trobem com a professors del grup GRPLN. Vaig dirigir la tesi d'en LluÃs Padró, d'en LluÃs Mà rquez, d'en Jordi Turmo, l'AlÃcia Ageno, la Marta Gatius... entre d'altres.En l'actualitat, continues portant tantes tesis doctorals? |
Quines són les lÃnies actuals de la vostra recerca?
Amb tanta gent al grup, per força les lÃnies de recerca i els interessos són molt diversos. Hi ha qui té més interès en ela aspectes més teòrics de l'aprenentatge automà tic, i d'altres s'interessen per lÃnies que estan més lligades a les aplicacions, com la traducció automà tica i d'altres per la constitució de recursos i els processadors lingüÃstics.
Evidentment, això ve força condicionat pels projectes i pel finançament que rebem. L'any passat varem acabar diversos Projectes europeus, com ara CHIL o HOPS i ara estem treballant en tres projectes finançats pel Ministeri Espanyol. Quin són aquests tres projectes?
D'una banda estem treballant amb </Text-mess>. Aquest projecte està dirigit per l'AlÃcia Ageno. El seu nom és una broma sobre l'objectiu ampli del projecte, posar ordre als textos.
El contingut és molt variat, extracció d'informació, question-answering, recuperació d'informació... etc. Hi participen sis Universitat Espanyoles. D'altra banda també estem treballant amb un projecte que es diu Know. Know es centra en la creació d'eines d'ampli espectre pel tractament del llenguatge natural en aplicacions multilingües. I finalment, estem involucrats amb Open MT. Aquest darrer projecte està relacionat amb la traducció automà tica. Darrerament, nosaltres hem estat molt implicats en aquesta lÃnia. En el tema recursos tenim dues lÃnies bà siques: el desenvolupament d'ontologies lèxiques en la lÃnia de WordNet i el perfeccionament de la nostra lÃnia de processadors lingüÃstics. El nostre sistema, Freeling, s'ha convertit, grà cies als esforços d'en LluÃs Padró, en l'eina més utilitzada pel processament tant del castellà , com del català . Wordnet són bases de dades de paraules, xarxes de paraules relacionades. En un principi aquestes bases de dades només existien en anglès; però grà cies al projecte Europeu d'EuroWordNet s'ha estès a d'altres idiomes, com ara l'Espanyol i més tard el Català . En català ?
He sentit, però, que no només heu treballat en català , castellà i anglès; sinó que també heu estat treballant amb llengües més complexes com ara l'à rab. Parla'ns una mica d'aquest tema...
SÃ. Hem estat treballant finançats pel govern dels Estats Units en la creació d'un Wordnet de la llengua à rab, Arabic WordNet. Ha estat una feina molt interessant que varem acabar aquest darrer Nadal.
Imagino que treballar amb l'à rab és quelcom molt diferent a treballar amb llengües llatines. Quines han estat les majors dificultats?
És clar, l'à rab ha suposat un repte per a nosaltres. Hem treballat amb la col·laboració de dos lingüistes, un de SÃria, en Musa, i l'altre del LÃbia, en Sabri.
Pensa que, l'à rab parlant consta de vocals i consonants com la majoria de llengües; però els escrits eliminen les vocals i dificulten la feina. Nosaltres hem vocalitzat els textos amb els que treballà vem, és a dir hem inclòs les vocals. Aquesta tècnica també la trobareu en els llibres per a estudiar à rab per a principiant o a l'Alcorà . Ets capaç de parlar o llegir en à rab? Creus que iniciatives com aquesta ajuden a la integració cultural?
Per suposat! Crec que són aportacions molt positives per tal d'aconseguir una bona relació i comprensió entre llengües i països. A més, jo tinc un interès personal en aquests temes.
D'altra banda, els Projectes Europeus en sà mateixos ja em semblen una bona eina d'integració. Aquest només és un dels projectes que s'han dut a terme al grup GRPLN. Quines altres fites ha aconseguit el grup? Creus que encara us queda camà per recórrer? Aquesta feina no s'acaba mai. |
El futur del llenguatge natural
Com veus el futur del processament del llenguatge natural?
Actualment aquests temes de recerca estan en una bona època. Hi ha moltes empreses interessades en aquestes tècniques i en aquestes lÃnies de recerca. De fet, ja comença a tenir identitat pròpia; ja hi ha qui l'anomena l'Enginyeria LingüÃstica.
Pensa que de tota la història de l'estudi de la llengua, ara estem en un dels moments més plà cids. Quan varen sortir els traductors automà tics també es va produir un gran boom. Hi havia molta gent interessada en saber-ne més i millorar les tècniques acabades de néixer, però les expectatives eren pot ser, excessivament ambicioses. Ara l'interès continua viu, però també som més realistes i això és molt positiu. Jo animo a tot aquells qui sentin curiositat per aquests temes seguir els estudis superiors de mà ster i doctorats que oferta el nostre grup, dins dels cursos de postgraus d'Intel·ligència Artificial, ja que hi ha un gran mercat per endavant!
Pensa que de tota la història de l'estudi de la llengua, ara estem en un dels moments més plà cids. Quan varen sortir els traductors automà tics també es va produir un gran boom. Hi havia molta gent interessada en saber-ne més i millorar les tècniques acabades de néixer, però les expectatives eren pot ser, excessivament ambicioses. Ara l'interès continua viu, però també som més realistes i això és molt positiu. Jo animo a tot aquells qui sentin curiositat per aquests temes seguir els estudis superiors de mà ster i doctorats que oferta el nostre grup, dins dels cursos de postgraus d'Intel·ligència Artificial, ja que hi ha un gran mercat per endavant!
Contacte premsa:
ilapuente@lsi.upc.edu
