ElkarOla: Tecnoloxías lingüísticas ao servizo dun territorio intelixente, industrial, inclusivo e multilingüe

2017/06/19 Leturia Azkarate, Igor - Informatikaria eta ikertzaileaElhuyar Hizkuntza eta Teknologia Iturria: Elhuyar aldizkaria

O proxecto ElkarOla é o resultado final de 15 anos de colaboración entre as organizacións máis representativas do País Vasco na investigación e desenvolvemento de tecnoloxías lingüísticas e da fala. Como mostra do traballo realizado, traballáronse tres demos que reflicten o que estas tecnoloxías poden facer en tres ámbitos estratéxicos.
Demo paira a área de fabricación avanzada. Trátase dun sistema de teleasistencia de realidade aumentada paira o seu uso entre un experto e un empregado. Ed. Igor Leturia

ElkarOla é un proxecto de investigación estratéxica desenvolvido en 2015 e 2016 no ámbito das tecnoloxías lingüísticas e da fala. Exemplos destas tecnoloxías son as ferramentas paira a tradución, a xestión da información (buscadores, extracción de información, análise de sentimentos), os recursos lingüísticos (dicionarios, corpus, correctores) e as ferramentas paira a fala (coñecemento da fala, creación da fala). O proxecto traballou especialmente paira o eúscaro, pero tamén paira outras linguas locais e próximas.

Elhuyar, os grupos de investigación da UPV-EHU Ixa e Aholab, o centro tecnolóxico Vicomtech-IK4 e a fundación Tecnalia Research & Innovation, en coordinación con Elhuyar.

Cinco institucións levamos 15 anos colaborando na investigación e desenvolvemento de tecnoloxías lingüísticas e de fala paira o eúscaro. Con carácter previo a este proxecto realizáronse outro catro:Hizking21 (2002-2004), AnHitz (2006-2008), BerbaTek (2009-2011) e Ber2Tek (2012-2014). Mentres que os anteriores estaban orientados á industria das linguas, ElkarOla pon énfases nas áreas de RIS3 Euskadi.

A Estratexia de Especialización Intelixente RIS3 é una estratexia rexional impulsada desde Europa, orientada á innovación e o desenvolvemento. Nesta estratexia, cada rexión, tendo en conta as súas capacidades produtivas e potencialidades, define e concentra recursos e investimentos en áreas estratéxicas. No caso da CAPV, RIS3 Euskadi establece tres prioridades: fabricación avanzada, enerxía, biociencias e saúde.

Aínda que as tecnoloxías lingüísticas e de fala non se atopan entre estas prioridades, son una importante liña transversal con aplicación en todas elas. Neste sentido, ElkarOla, ademais da investigación básica, tamén se levou a cabo a investigación aplicada nas áreas mencionadas do RIS3 e, a través da transferencia tecnolóxica, comercializáronse e socializado diversas ferramentas e aplicacións.

Demos paira áreas prioritarias

O demo en biociencia e saúde é un buscador de termos e relacións sanitarias. Ed. Igor Leturia

Como resultado final do proxecto, desenvolvemos tres demos que reflicten a posible contribución destas tecnoloxías e da colaboración entre as entidades do consorcio nestas áreas do RIS3.

O demo paira o campo da fabricación avanzada é un sistema de teleasistencia de realidade aumentada paira o seu uso entre un experto e un operario. Este demo demostra en que poden contribuír as tecnoloxías lingüísticas e de fala nunha contorna industrial ruidoso. Se o operario quere ter as mans libres paira traballar, porase uns smartglass ou terá á súa disposición una tablet. O experto axudaralle de forma remota a través doutra tablet ou computador. O experto recibirá en tempo real o que o empregado indique e o que vexa co seu tablet ou lentes. Así, o experto informará verbalmente ao traballador, pero dado que o traballador pode atoparse nunha contorna ruidosa provocado polas máquinas, o sistema transcribe automaticamente (mediante coñecemento de fala) e traduce (mediante tradución automática) estas instrucións para que chegue por escrito ao traballador. Este texto será mostrado ao empregado no seu dispositivo, en tempo real, sobre o que está a ver e guiado paso a paso na súa tarefa. Ademais, a aplicación mostrará ao traballador en realidade aumentada as instrucións a distancia, mediante frechas e similares.

O demo biociencias e saúde é un buscador de termos e relacións sanitarias.Este primeiro prototipo dun buscador de relacións entre entidades médicas (enfermidades e medicamentos) e as mesmas funciona sobre un corpus de extractos de artigos científicos en castelán sobre temas médicos. Este corpus foi etiquetaxe manualmente paira adestrar e avaliar un sistema de detección automática de reaccións adversas a medicamentos. Entre as entidades etiquetadas atópanse, por unha banda, os medicamentos xenéricos, as marcas de medicamentos e as sustancias e, por outro, as enfermidades e os síntomas. Entre as relacións etiquetadas atópanse as causas (que causa produce a enfermidade) e os tratamentos (con que medicamento trátase ou a enfermidade). No buscador pódense realizar procuras por entidades ou relacións e ver gráficamente as entidades e relacións detectadas en cada documento.

Demo dun axente de diálogo paira o servizo de atención ao cliente. Ed. Igor Leturia

Por último, paira dispor dunha demo territorial desenvolvemos un axente de diálogo paira o servizo de atención ao cliente. Os servizos de atención ao cliente son un elemento crave paira ofrecer un servizo de calidade nalgúns sectores, pero moitos destes servizos contan con tarefas ou fases repetitivas de baixo valor (identificación de usuario, cumplimentación de formularios, consultas sinxelas…). As tecnoloxías dos sistemas de diálogo, xunto co procesamiento da linguaxe natural e a intelixencia artificial, permiten automatizar este tipo de tarefas para que os técnicos poidan utilizar o tempo de forma máis eficiente. O demo é un sistema de diálogo integrado nunha interfaz web no que se utilizan técnicas de procesamiento da linguaxe natural e algoritmos estatísticos de clasificación paira identificar ao usuario e a que departamento débese transferir o evento descrito polo usuario. As respostas do sistema danse tanto por texto como por síntese de fala e pódense dar ordes tanto escritas como verbais.

Gai honi buruzko eduki gehiago

Elhuyarrek garatutako teknologia