}

Tira la pregunta!

2014/04/01 Lopez-Gazpio, Iñigo - EHUko IXA Taldeko ikertzailea Iturria: Elhuyar aldizkaria

Ed. Andrei Kovalev (Follow)/350RF

Us recordeu de petits quan el professor acabi un tema "a veure, tireu les vostres preguntes!" quan diu? En aquest mateix moment començava el joc d'amagatall: l'espatlla de l'anterior company, darrere de la taula, darrere de la porta de la classe... qualsevol moviment de fuita ens servia per a no trobar-nos amb la mirada del professor. A tots aquests tímids els portem una bona notícia, ja que a partir d'avui la computadora suportarà els petons per nosaltres.

En les següents línies exposarem els inicis del sistema que, partint d'un corpus, generarà a nivell de frase preguntes de manera automàtica i massiva (aquests sistemes es coneixen com QG (Question Generator). Per a això, igual que fem en la cuina per a preparar un deliciós plat, en l'elaboració de preguntes també serà necessari seguir uns passos concrets. De fet, els passos a seguir per a crear automàticament preguntes i, per exemple, per a fer una pizza són molt similars. El procés que seguirem per a posar en marxa tota aquesta qüestió consta de quatre passos a seguir de manera seqüencial:

1. Processament del corpus d'entrada

Primer pas, orientat a processar --analitzar lingüísticament - el corpus d'entrada. Per tant, en aquest apartat tractarem d'obtenir la màxima informació a partir del corpus d'entrada. Si bé aquesta cerca d'informació es repeteix en diversos àmbits del processament del llenguatge, és una tasca fonamental si volem seguir endavant amb sentit comú. Per a abordar aquest apartat amb ganes, serà necessari utilitzar diferents recursos lingüístics, com a analitzadors sintàctics, analitzadors morfològics, analitzadors semàntics, lematizadores, tokenizadores, etc. Així, serem capaços d'identificar verbs --jugats i no jocs-, noms, adjectius, adverbis... en les frases originals, a més de paraules i els seus sintagmes nominals, casos declinativos de sintagma nominal, composicions sintagmàtiques entre verbs --verbs simples, compostos, auxiliars... --i la identificació de les dependències sintàctiques de les paraules de les frases.

Fins i tot quan ens dediquem a la cuina, sense adonar-nos, fem una anàlisi similar a aquest inicialització: preparem informació i eines. Primer agafem el manual que necessitem per a preparar el plat, després llegim els ingredients que necessitem, els enumerem i els busquem, i després col·loquem els útils que necessitem sobre la taula de la cuina per a realitzar els passos de la recepta sense traves.

2. Selecció de resultats de les preguntes

Una vegada que hem enumerat els plats de la recepta -millor que estiguem en la nostra nevera que a la botiga!-, el següent pas és anar per ells. Tomàquet i pernil en la nevera, formatge en la taula de la cuina, aigua en la font, farina en la balda, sal en l'armari... ; no obstant això, en lloc d'utilitzar els tomàquets de l'horta del seu avi, utilitzarem la salsa de tomàquet del dia anterior, que estava molt dolç i que segur que es queda molt bé.

En aquest segon pas del pregunta-creador que estem desenvolupant, igual que hem fet en la cuina, l'objectiu és anar buscant els millors resultats de les preguntes. En aquest apartat també és necessari utilitzar els recursos de processament natural del llenguatge, ja que hem de seleccionar els millors d'entre els components que hem classificat anteriorment. Aquesta selecció es pot realitzar a través de diferents fonts d'informació, com a xarxes semàntiques, diccionaris de vius i inanimats, bases de dades d'articles, notícies, institucions, personatges il·lustres, etc. Així, entre totes les paraules i sintagmes, triarem aquelles que ens donin més informació i, per tant, tindran més possibilitats que les preguntes que anem a generar siguin interessants.

3. Selecció d'enquestadors

Falta poc per a acabar, comencem a escalfar el forn i ja som capaços de fer olor el plat que estem preparant. Tenim els components damunt de la taula, els útils que necessitem. Per tant, ha arribat el moment de tacar-se les mans, ja que hem de preparar cadascun dels ingredients: formar la massa de farina, pelar i raspar el formatge, llevar les llavors al tomàquet, llevar les de repartiment de plàstic al pernil...

Així mateix, els treballs a realitzar en el procés de generació de preguntes són similars. De fet, hem analitzat el corpus i identificat els resultats de les preguntes, per la qual cosa per a poder seguir endavant necessitem tacar les mans, encara que sigui de manera virtual, perquè cal preparar els tipus de preguntes que generarem. L'elecció de la mena de pregunta, juntament amb l'interrogatiu, és una tasca relacionada amb el treball realitzat en fases anteriors. Així, si hem aconseguit identificar dates en el corpus d'entrada, seria lògic crear una pregunta de tipus temporal utilitzant per a això un interrogatiu “quan” o d'aquest tipus. Si, per contra, hem aconseguit identificar a personatges il·lustres, seria lògic que constituíssim una pregunta associada a un personatge, i en aquest cas s'utilitzés l'interrogatiu “qui”. Treballarem com s'ha explicat fins que s'hagi definit el tipus de pregunta per a tots els candidats identificats en la fase anterior.

4t Construcció de preguntes

Tenim tot preparat, només queda la recta final, és a dir, unificar tot el treball realitzat, però hem d'anar amb compte perquè un error d'última hora pot danyar tot el treball realitzat. Després de repassar tots els ingredients que hem preparat, comencem a treballar: s'estén el tomàquet sobre la massa de pizza, s'escampa el formatge i el pernil per damunt i es fica el plat en el forn. Ara només hem d'esperar uns vint minuts, mentrestant, preparem plats, coberts i gots fins que l'alarma del forn ens adverteixi que ha arribat l'hora de treure l'aliment.

En l'últim pas del sistema de generador de preguntes també haurem de fer tasques similars. És a dir, hem d'agafar la frase original i construir la pregunta a partir d'uns patrons i unes regles. A més, caldrà realitzar altres adaptacions, com l'eliminació de connectors, l'adequació de marques de puntuació, l'adaptació de casos i marques de verbs, etc., però no sols això, sinó que també es poden fer altres coses que se'ns ocorrin, ja que tot treball que tingui com a objectiu millorar les preguntes serà benvingut, com la resolució d'anàfores i l'exclusió d'informació aliena a les preguntes --resumir frases, alegia--.

Conclusions

Com heu vist, la posada en marxa d'un sistema de generació massiva de preguntes requereix quatre passos: processar el corpus d'entrada, seleccionar els resultats de les preguntes, seleccionar els qüestionaris i finalment construir les preguntes. Tan fàcil com fer una pizza!

Ed. Creat a partir de les imatges de la web http://openclipart.org. En domini públic

El sistema pregunta-creatiu que hem desenvolupat -que és un sistema molt bàsic de QG- i altres sistemes capaços de generar exercicis de manera automàtica són recursos estretament relacionats amb l'àmbit de l'ensenyament-aprenentatge, ja que redueixen considerablement el temps de preparació del material per part del professorat. En general, els sistemes automàtics de creació d'exercicis solen estar integrats en plataformes d'e-learning de major grandària, la qual cosa permet disposar d'un munt d'usuaris que participen i aprenen a canvi d'una petita càrrega de treball.

Per a acabar, a tots els tímids que hem esmentat al principi ja sabeu que les vostres vergonyes poden desaparèixer tan fàcilment com fer una pizza (encara que necessiteu una mica més de vint minuts), així que sortiu dels vostres amagatalls i tireu les vostres preguntes !

Bibliografia

Web oficial de Wikipedia, http://www.wikipedia.org.
Zona de l'aplicació Eihera del grup IXA http://ixa.si.ehu.es/ixa/produkzioak/1273220198
Zona de l'aplicació Eulia del grup IXA http://ixa.si.ehu.es/ixa/produkzioak/1274694158
Zona de l'aplicació Ixati del grup IXA http://ixa.si.ehu.es/ixa/produkzioak/1273220525
Aldabe, I.; López de Lacalle, M.; Maritxalar, M.; Martínez, E.; Uria, L.: Font: An Automatic Question Generator Based on Corpora and NLP Techniques. UPV/EHU.
Yao, X.; Bouma, G.; Zhang, I. Semantics-based Question Generation and Implementation. Johns Hopkins University, University of Groning. Saarland University.

Gai honi buruzko eduki gehiago

Elhuyarrek garatutako teknologia