Estadística i veritat
2009/05/01 Etxeberria Murgiondo, Juanito - EHUko irakaslea. Hezkuntzako Ikerkuntzaren eta Diagnosi Metodoen Saila Iturria: Elhuyar aldizkaria
Són molts els que barregen estadístiques amb estadístiques. L'estadística és una branca de les matemàtiques encarregada de recopilar, organitzar i analitzar les dades numèriques. I no sols això, sinó que ens ajuda a resoldre els problemes i prendre decisions que sorgeixen en el disseny dels experiments. Malgrat la seva curta història com a disciplina científica, té una llarga antiguitat com a eina de síntesi i publicació d'informació numèrica. L'extensió de l'estadística i la seva funció instrumental s'estén a totes les branques de la ciència.
En aquells casos en els quals no es disposi de dades de tots els elements de la població objecte d'estudi, es treballarà en condicions d'incertesa i aleatorietat per a preparar les conclusions. En aquests casos, l'anàlisi inferencial de les dades utilitza una metodologia estadística per a estimar paràmetres desconeguts, contrastar hipòtesis concretes, preveure comportaments futurs, prendre decisions, realitzar diagnòstics individuals i col·lectius, quantificar la incertesa i fins i tot limitar el marge d'error. Així s'anuncia el temps, l'estat de salut d'una persona, la comparació entre els resultats de tots dos procediments, la fiabilitat dels components d'una màquina al llarg de diversos anys. Les previsions concretes haurien de ser: demà hi ha una probabilitat de pluja del 87%, tens el cervell malament amb un 93% de probabilitat, o la bombeta A és millor que la B amb un marge d'error del 5%. Però no sembla que l'home del temps, ni el metge, ni el venedor de bombetes prenguin la tasca de determinar el grau d'error dels seus pronòstics.
Cal destacar, a més, que les nocions de bogeria i incertesa confonen a vegades la intuïció. Així, en un col·lectiu de 30 persones, la probabilitat que hi hagi dues persones que compleixin els anys en el mateix dia és superior a la que no existeixi, és a dir, superior al 50%. Amb tan sols trenta persones sembla mentida, però la teoria de la probabilitat "demostra" que la probabilitat que l'aniversari ocorri alhora és major que la probabilitat que no ocorri alhora.
Un procés d'anàlisi inferencial de dades ens condueix a la definició de la població, la determinació de la grandària de la mostra i la selecció dels elements, el mesurament de les variables de l'objecte d'estudi, l'anàlisi de les dades i la presentació dels resultats. En cadascuna d'aquestes etapes podem fer errors, que en alguns casos són difícils de quantificar. L'objectiu de la inferència estadística serà quantificar la probabilitat de cada possible error. No obstant això, igual que es poden mentir amb el llenguatge, amb els números també es poden mentir, manipulant els resultats, dividint la informació, guardant una part en la butxaca posterior, o presentant els resultats de manera fraudulenta...
Vegem dos exemples bastant ingenus. En els dos gràfics adjunts es mostren els perfils de dues carreres amb gran continuïtat al País Basc. En un d'ells, en el Tour de França apareixen diversos ports de muntanya que els ciclistes pugen al llarg de 159,5 quilòmetres, entre ells Tourmalet --2.114 metres d'altura-. L'altre gràfic correspon a la carrera Behobia-Sant Sebastià. En aquesta carrera, els corredors uneixen als dos pobles, corrent aproximadament 20 quilòmetres. Es tracta bàsicament d'un recorregut pla amb els alts més alts, Gaintxurizketa, amb 84 metres. Observa els perfils que apareixen en els dos gràfics: són similars. Les escales utilitzades per a crear gràfics són molt diferents, però m'han permès dissenyar dos perfils molt similars. Dades molt diferents però gràfics iguals. També es poden veure exemples en contra tots els dies.
Anem ara a Oñati. Per a veure que és un poble se sap. Però en la revista Concelupetik (publicada en Oñati), en explicar el nombre de visitants del municipi en 2007, apareix un petit error.
Per a començar, el que sorprèn és la precisió del titular: "20.293 turistes van visitar Oñati en 2007". Sorgeixen dubtes i preguntes sobre aquest tema. Compten tots els que fan un volt al voltant de la universitat? I tots els que acudeixen el dia del Corpus? I tots els que van a Arantzazu? I tots els que van a les coves d'Arrikrutz? Com aconsegueixen comptar tots amb aquesta mena de precisió? Sent tan bonic Oñati i amb tants turistes, no són pocs? Mitjana inferior a 60 per dia.
Una vegada llegida la notícia, s'aclareixen els nostres dubtes: 20.293 persones passen per l'oficina de turisme. En el títol es barregen tots dos conceptes: mostra i població estadística. Lamentablement, aquest tipus d'errors es cometen amb una freqüència molt elevada en les presentacions de resultats estadístics.
L'estadística és una eina que ajuda a conèixer la “veritat” d'una realitat i ens envaeix en diferents àmbits de la vida. No obstant això, el mal ús i els excessos estadístics a vegades justifiquen les reticències estadístiques d'una part de la població. L'única vacuna contra aquest mal ús és la major formació estadística.
Crec que és el moment de reivindicar la inclusió de més conceptes estadístics en el currículum escolar de matemàtiques. Estadística per a la vida, o una cosa semblant... O, bé, per què no les Matemàtiques per a la Vida? Ajudaria a reduir l'anumerismo "social" i, amb això, ens ajudaria a estar alerta davant els mals usos de l'estadística. I és que, encara que els números no esmenti, els mentiders són onze.
Juanito Etxeberria Murgiondo. Professor de la UPV. Departament de Recerca i Mètodes de Diagnòstic en Educació.
Gai honi buruzko eduki gehiago
Elhuyarrek garatutako teknologia