}

Ordinadors sense teclat

1994/10/01 Otaolaurretxi, Jon Iturria: Elhuyar aldizkaria

Fins ara sempre hem vist els ordinadors amb els seus teclats, però últimament també han aparegut els que funcionen sense teclat. Coneixen l'escriptura personal i recullen les dades directament en la pantalla amb un llapis.

Antigament les màquines d'escriure mecàniques, com les antigues Underwood, es van utilitzar durant molts anys. Després, en la dècada dels 70, IBM va treure màquines elèctriques de boles i últimament s'han multiplicat els microordinadors per a escriure textos. En l'ordinador es poden fer moltes coses a través del processament de text: tallar una part, pegar-la en un altre lloc, canviar els tipus de lletra, augmentar el rang de línies, etc. No obstant això, tant en màquines antigues com en l'ordinador, sempre hi ha teclat per a escriure el text abans d'imprimir.

Escrit a mà com en la pantalla en blanc, l'ordinador sense teclat reconeix l'escriptura i la guarda digitalitzada. Aquest text es pot consultar informàticament.

No obstant això, avui dia, en el qual s'estan renovant els costums per onsevulla, apareixen ordinadors sense teclat. Gràcies als avanços en miniaturització, els fabricants d'ordinadors han aconseguit que màquines tan potents com les anteriors s'hagin ficat en una grandària mitjana i de 2 centímetres de gruix. Es poden utilitzar en el taller, en el bus, al carrer i en qualsevol lloc. I és que, sense arribar als 500 grams de pes, aquests aparells disposen de pantalla i unitat central de procés. El teclat se substitueix per un llapis que permet escriure directament en la pantalla (com si s'escrivís en la pàgina). Sota el nom de Newton, Apple ha tret aquest aparell. El PDA ( Personal Digital Assistant ) és la paraula que generalment s'utilitza per a designar aquests aparells i consta bàsicament de “fulla” (pantalla) per a escriure l'ordinador, l'agenda i les notes.

Per a utilitzar aquests ordinadors no fa falta saber molt, ja que n'hi ha prou amb saber escriure. Però l'ordinador té en el seu interior els sistemes informàtics més desenvolupats: pantalla sensible, processador RISC, xarxes neuronals, etc. Tots ells són necessaris per a dur a terme el treball que pot realitzar qualsevol nen, per a conèixer les lletres escrites.

Aquesta operació la realitzem tots els dies automàticament quan llegim, i intuïtivament identifiquem més que lletres. Quan trobem una paraula desconeguda, primer hem de desxifrar-la i prendre consciència del seu significat, i després la identifiquem amb facilitat. Coneixem els caràcters des del context. No obstant això, com sabrà la màquina si I ( majúscula i) o l (bilingüe minúscula)? És 0 (zero) o o o (vocal)? L'ordinador, francament, no sol estar ben format amb intel·ligència i sol ser difícil conèixer l'escriptura.

Els ordinadors utilitzen per a això els programes OCR ( Optical Character Recognition ). Aquests programes es van iniciar en la dècada dels 80 amb un futur prometedor. En diversos bancs, departaments administratius i oficines es podien informatitzar els documents que contenien milers de tones de paper i, de pas, hi havia un mercat de milions de dòlars per als programadors.

Qualsevol tecnologia utilitzada per al reconeixement de caràcters té en primer lloc l'etapa de numerización. El document passa per un escàner per a extreure la imatge informàtica. Per a aquesta operació l'escàner disposa d'una barra de díodes de llum que il·lumina cadascuna de les parts del document. La llum reflectida en el paper és analitzada per l'escàner, decidint si és blanca o negra.

Una vegada finalitzada aquesta operació, es tracta d'una imatge formada per punts negres i blancs que no tenen cap organització lògica. El programa de reconeixement determinarà a continuació els caràcters d'aquests conjunts de punts. Una vegada identificats els caràcters es codificaran en el sistema binari per a la seva posterior utilització en l'ordinador.

Existeixen dos sistemes d'identificació de caràcters: el matricial i el topològic. En el sistema matricial, el programa conté una llista o col·lecció de models i compara cada caràcter que troba en el document amb els quals conté en la seva col·lecció. Hi ha molts problemes. Per exemple, si els caràcters del document estan massa pròxims entre si, és difícil que el sistema els tracti individualment. En aquest cas troba un gran nombre de punts i no s'assembla a res de la seva col·lecció.

A més, si el document o paper original no és de bona qualitat (paper dolent, groguenc, etc.). si és així), és difícil identificar caràcters. A més, a vegades pot ocórrer que en el document original s'utilitzi un tipus especial de lletra, i que el programa en la seva col·lecció no el tingui. En aquest cas el programa ha de “aprendre” aquests caràcters. El programa mostra un a un els caràcters que no coneix i l'usuari ha d'identificar-los des del teclat. Els caràcters així identificats s'afegeixen a la col·lecció perquè serveixin en una pròxima ocasió.

El mètode topològic es basa en la definició lògica del caràcter i en les línies verticals, horitzontals, corbes, línies, etc. té en compte. El programa coneix aquestes formes bàsiques i identifica el propi caràcter.

Mitjançant aproximacions i afinaments repetits, aquests programes identifiquen correctament més del 96% dels caràcters. Això significa que en la pàgina normal escrita queden 180 caràcters de mitjana desconeguts. El lector normal s'adona fàcilment d'aquests errors i sap com és el text correctament. No obstant això, si aquest text amb errors ha de ser posteriorment informatitzat, el resultat obtingut en molts casos no és acceptable. Per això, es tendeix a recórrer a xarxes neuronals per a millorar la identificació de caràcters. A través d'aquestes xarxes, per exemple, si el caràcter “o” és un cercle perfecte, s'identifica com a vocal “o” i identifica que si el cercle “0” no és perfecte és una xifra zero.

Les xarxes neuronals utilitzen neurones com a element bàsic i estan connectades entre si mitjançant sinapsi (Veure Elhuyar. Ciència i Tècnica. Número 79. Gener 1994. “Xarxa neuronal artificial”. A. D. Tàpia Florez). La principal barrera d'aquest sistema és la necessitat d'una gran capacitat informàtica, i els microordinadors que tenim en l'actualitat no arriben a això. Una de les solucions que s'aplica actualment és la mescla de xarxes neuronals i mètodes tradicionals. El programa l'identifica en una primera volta amb un mètode matricial o topològic i després només es tracten els caràcters amb problemes amb xarxes neuronals.

L'empresa Microsoft, que realitza el sistema operatiu MS DOS de microordinadors, ha desenvolupat el seu propi sistema. El programa analitza els caràcters d'un en un i quan troba algun dubte se serveix de la “metakaractera”. Per exemple, quan té el dubte de “ha(nr)i” (és a dir, “n” o “r”) decideix amb un diccionari ortogràfic.

Els programes d'ordinador per a conèixer l'escriptura tenen ja nombroses aplicacions en qualsevol oficina. Una d'aquestes aplicacions és la de les oficines de correus. De fet, en col·locar-se el codi postal en la portada, la distribució es realitza automàticament. En els bancs també s'utilitzen sistemes automàtics d'identificació de lletres de canvi, però per descomptat, aquests sistemes no poden contenir errors pel fet que els diners estan inclosos.

Existeixen sistemes que coneixen les dades introduïdes manualment. En escriure les dades en una pantalla, aquests han de ser capaces de suportar els esforços mecànics que es produeixen en l'escriptura manual. Mitjançant aquestes pantalles, taules o PDA s'ha obert una nova era a la indústria informàtica a través de programes de reconeixement d'escriptura. El model Newton d'Apple ha suposat un gran avanç. El preu d'aquest ordinador sense teclat és de 1.000 dòlars, però està a punt de treure el model EO i costarà entre 2.000 i 3.400 dòlars. A més de conèixer l'escriptura, el telèfon i el fax estaran integrats i tot això funcionarà sense teclats ni cables.

Gai honi buruzko eduki gehiago

Elhuyarrek garatutako teknologia