Estatística e verdade
2009/05/01 Etxeberria Murgiondo, Juanito - EHUko irakaslea. Hezkuntzako Ikerkuntzaren eta Diagnosi Metodoen Saila Iturria: Elhuyar aldizkaria
Son moitos os que mesturan estatísticas con estatísticas. A estatística é una rama das matemáticas encargada de recompilar, organizar e analizar os datos numéricos. E non só iso, senón que nos axuda a resolver os problemas e tomar decisións que xorden no deseño dos experimentos. A pesar da súa curta historia como disciplina científica, ten una longa antigüidade como ferramenta de síntese e publicación de información numérica. A extensión da estatística e a súa función instrumental esténdese a todas as ramas da ciencia.
Naqueles casos nos que non se dispoña de datos de todos os elementos da poboación obxecto de estudo, traballarase en condicións de incerteza e aleatoriedad paira preparar as conclusións. Nestes casos, a análise inferencial dos datos utiliza una metodoloxía estatística paira estimar parámetros descoñecidos, contrastar hipóteses concretas, prever comportamentos futuros, tomar decisións, realizar diagnósticos individuais e colectivos, cuantificar a incerteza e mesmo limitar a marxe de erro. Así se anuncia o tempo, o estado de saúde dunha persoa, a comparación entre os resultados de ambos os procedementos, a fiabilidade dos compoñentes dunha máquina ao longo de varios anos. As previsións concretas deberían ser: mañá hai una probabilidade de choiva do 87%, tes o cerebro mal cun 93% de probabilidade, ou a lámpada A é mellor que a B cunha marxe de erro do 5%. Pero non parece que o home do tempo, nin o médico, nin o vendedor de lámpadas tomen a tarefa de determinar o grao de erro dos seus prognósticos.
Cabe destacar, ademais, que as nocións de tolemia e incerteza confunden ás veces a intuición. Así, nun colectivo de 30 persoas, a probabilidade de que haxa dúas persoas que cumpran os anos no mesmo día é superior á de que non exista, é dicir, superior ao 50%. Con tan só trinta persoas parece mentira, pero a teoría da probabilidade "demostra" que a probabilidade de que os aniversarios ocorra á vez é maior que a probabilidade de que non ocorra á vez.
Un proceso de análise inferencial de datos condúcenos á definición da poboación, a determinación do tamaño da mostra e a selección dos elementos, a medición das variables do obxecto de estudo, a análise dos datos e a presentación dos resultados. En cada una destas etapas podemos facer erros, que nalgúns casos son difíciles de cuantificar. O obxectivo da inferencia estatística será cuantificar a probabilidade de cada posible erro. Con todo, do mesmo xeito que se poden mentir coa linguaxe, cos números tamén se poden mentir, manipulando os resultados, dividindo a información, gardando una parte no peto traseiro, ou presentando os resultados de forma fraudulenta...
Vexamos dous exemplos bastante inxenuos. Nos dous gráficos adxuntos móstranse os perfís de dúas carreiras con gran continuidade no País Vasco. Nun deles, no Tour de Francia aparecen varios portos de montaña que os ciclistas soben ao longo de 159,5 quilómetros, entre eles Tourmalet --2.114 metros de altura-. O outro gráfico corresponde á carreira Behobia-San Sebastián. Nesta carreira, os corredores unen aos dous pobos, correndo aproximadamente 20 quilómetros. Trátase basicamente dun percorrido chairo cos altos máis altos, Gaintxurizketa, con 84 metros. Observa os perfís que aparecen nos dous gráficos: son similares. As escalas utilizadas paira crear gráficos son moi diferentes, pero me permitiron deseñar dous perfís moi similares. Datos moi diferentes pero gráficos iguais. Tamén se poden ver exemplos en contra todos os días.
Imos agora a Oñati. Paira ver que é un pobo sábese. Pero na revista Concelupetik (publicada en Oñati), ao explicar o número de visitantes do municipio en 2007, aparece un pequeno erro.
Paira empezar, o que sorprende é a precisión do titular: "20.293 turistas visitaron Oñati en 2007". Xorden dúbidas e preguntas respecto diso. Contan todos os que dan una volta ao redor da universidade? E todos os que acoden o día do Corpus? E todos os que van a Arantzazu? E todos os que van ás covas de Arrikrutz? Como conseguen contar todos con este tipo de precisión? Sendo tan bonito Oñati e con tantos turistas, non son poucos? Media inferior a 60 por día.
Una vez lida a noticia, acláranse as nosas dúbidas: 20.293 persoas pasan pola oficina de turismo. No título mestúranse ambos os conceptos: mostra e poboación estatística. Lamentablemente, este tipo de erros cométense cunha frecuencia moi elevada nas presentacións de resultados estatísticos.
A estatística é una ferramenta que axuda a coñecer a “verdade” dunha realidade e invádenos en diferentes ámbitos da vida. Con todo, o mal uso e os excesos estatísticos ás veces xustifican as reticencias estatísticas dunha parte da poboación. A única vacina contra este mal uso é a maior formación estatística.
Creo que é o momento de reivindicar a inclusión de máis conceptos estatísticos no currículo escolar de matemáticas. Estatística paira a vida, ou algo parecido... Ou, ben, por que non as Matemáticas paira a Vida? Axudaría a reducir o "anumerismo social" e, con iso, axudaríanos a estar alerta ante os malos usos da estatística. E é que, aínda que os números non mente, os mentireiros son once.
Juanito Etxeberria Murgiondo. Profesor da UPV. Departamento de Investigación e Métodos de Diagnóstico en Educación.
Gai honi buruzko eduki gehiago
Elhuyarrek garatutako teknologia