La insoportable cantidad de cifras y más cifras…

numeros_carretera.jpg
Uno abre el periódico o carga una página en Internet y se encuentra con miles de datos. Datos de cuántos accidentes se han producido, cuántos coches tenemos en el parque automovilístico, datos por días, semanas, meses, años… Hay que ver qué peligroso es el fin de semana, oiga. O sin ir más lejos, lo último en interpretación de cifras: ¿cuál es el día de la semana más peligroso para circular con el coche?

Datos, datos por todas partes. Pero, ¿realmente con tanta cifra sabemos qué estamos leyendo? Existen cientos de estudios, perdón, “estudios” que se limitan a escoger cifras y sacar extrañas conclusiones, cuando no se limitan a generar una noticia sin pies ni cabeza, un mero titular sin “chicha ni limoná”. Seamos serios, presentar un estudio en condiciones es algo que pueden hacer con solvencia las grandes empresas y las grandes instituciones que se dedican a promover y trabajar día a día en educación y seguridad vial. Generar noticias a partir de números es algo que puede hacer más gente.

¿A qué viene todo esto? Principalmente es una lucha particular por tratar de escapar de la tiranía del dato. La tiranía del lugar que ocupamos en una lista determinada. La tiranía de no separar el grano de la paja y declarar que son algunos días de la semana los culpables de que haya más accidentes de tráfico. O el tiempo atmosférico, las condiciones de las vías o un fallo aleatorio. Nunca se asume que la primera causa de accidente parte de las personas.

Sin profundizar mucho más en ese aspecto psicológico tan arraigado en la sociedad como es el hecho de que, fundamentalmente, la culpa es de los demás, voy a ilustrar con un ejemplo cómo es posible extraer informaciones sin sentido a partir de un pequeño conjunto de datos. El conjunto de datos no es más que los días de 2010 que tuvieron mayor cantidad de incidentes de circulación. Y son datos verídicos y muy interesantes… si se interpretan correctamente.

Los crudos datos

numeros.jpg

|*Día*| *Nº Accidentes*|
|Lunes 8 de marzo| 9.684|
|Lunes 11 de enero| 8.765|
|Viernes 29 de octubre| 7.827|
|Viernes 3 de diciembre| 7.619|
|Viernes 30 de abril| 7.515|
|Lunes 29 de noviembre| 7.490|
|Martes 2 de noviembre| 7.450|
|Viernes 2 de julio| 7.359|
|Viernes 1 de octubre| 7.347|
|Lunes 4 de octubre| 7.332|

Supuesto 1: los números siempre dicen verdades como puños

Alarmado, me doy cuenta de que pude haberme precipitado. Ciertamente los lunes y viernes son los días más peligrosos según 2010. He pecado de prepotencia, pero puedo publicar una noticia titulada: “Lunes y viernes, los días más peligrosos para circular”. Me doy por satisfecho y cambio mis hábitos vitales para que mis fines de semana sean desde el jueves por la tarde hasta el sábado noche. Problema resuelto.

Supuesto 2: intuímos que hay un cierto patrón

En un acceso de lucidez reparamos rápidamente en el patrón oculto tras los números:

  • Viernes 29 de octubre: víspera del puente de Todos los Santos
  • Viernes 3 de diciembre: víspera del puente de la Constitución
  • Viernes 30 de abril: víspera del puente del 2 de mayo en Madrid, posiblemente del Día del Trabajo en otros lugares
  • Martes 2 de noviembre: regreso del puente de todos los Santos
  • Viernes 2 de julio: ¿operación salida?

En este caso nos quedamos sin noticia. Los lunes y los viernes no son per se los días más peligrosos de la semana, pero sí que es cierto que es cuando suelen coincidir la marcha para vacaciones y la vuelta de las mismas (respectivamente en viernes y en lunes). Pero, espera: los lunes 11 de enero y 8 de marzo no representan salidas vacacionales, ¡ja!

En esos días hubo fuertes nevadas y tiempo muy desfavorable. Son casos particulares de los que no se puede extraer una conclusión (más que la de que el tiempo inestable influye en la accidentalidad). En ese tipo de situaciones los alcances suelen ser muchos más que en condiciones normales. Y no nos olvidemos que no se puede ver en esos números cosas como: la intensidad de los alcances (¿simple rozadura o siniestro total?), las zonas donde más alcances se producen (¿Madrid capital o el km XX de la carretera Y?), qué tipo de conductor, qué tipo de coche, de día o de noche… En fin, mil matices que dan la validez al estudio que haya comprobado todas las variables y presentado un estudio bien hecho. Acorde a las reglas de procedimiento.

¿A quién perjudica la sobredosis de datos?

En mi opinión la sobredosis de datos e informaciones “gratuitas” perjudica a las bases de la Educación Vial, y de forma indirecta a la Seguridad Vial en sí misma. Primero porque desvía la atención del principal problema, que es la falta de concienciación, sentido común y responsabilidad generalizada en las carreteras. Segundo porque afianza en el subconsciente la existencia de “factores externos imponderables” que “provocan” accidentes, retenciones, incomodidad o situaciones de riesgo.

Ambas cosas son nefastas para dar el paso necesario hacia una sociedad más implicada con la seguridad en carretera, con la observación de las normas de tráfico y con una tendencia cada vez menor a “salir cuando sale Vicente”. En general este tipo de uso de los datos no beneficia a nadie ni forma parte de ninguna iniciativa productiva. Los estudios serios es posible que sean muy densos o algo áridos, pero al menos tendremos la seguridad de que las conclusiones que saquen serán, como mínimo, útiles.

Fotos | Teosaurio, jfgornet, aNieto2k

  • Josep Camós

    Te aplaudiría con las orejas, pero me da pereza.

    No me mires así. Ya lo decía Ricardo Galli: a mayor calidad del post, menor calidad del comentario suscitado. 😛

    No, en serio. Realmente a veces me pregunto en qué piensan los artífices de los “estudios” cuando escupen cifras como quien canta números del bingo, si son plenamente conscientes del valor de una gota de agua en el océano como contraposición al valor que toma esa misma gota de agua en el desierto y, finalmente, si persiguen algún fin que no sea el de la autopromoción.

    Bueno, no me lo pregunto. Tengo mis prejuicios.

    • Gracias, es algo que me da mucho que pensar porque todos los días veo 100 noticias (por decir un número discreto) con muchos datos que si se quedasen en tan solo datos, estaría bien. Pero lo malo es encontrar interpretaciones contrapuestas con la misma base.

      En fin, creo que lo de la autopromoción es bastante cierto. Ahora que no se si algún día esto mejorará o simplemente irá a peor con cada vez más “medios” en el mercado.

  • pepserra

    Es que no se por que me da que estos individuos que vomitan cifras a discrecion no tienen mucha idea de en que consiste el metodo cientifico(la madre del cordero).

    Es decir los ensayos controlados, la significacion estadistica, la p, grupo control, grupo activo, ponderacion, tasa, etc etc ….

    Metodo que entre otras cosas ha servido para que podamos desplazarnos con vehiculos…. en fin na mas !!

  • pepserra

    Yo puedo hacer u estudio chulisimo, con 100000 personas (conductores o no ) que si no uso herramientas potentes estadisticas o una buena metodologia …en fin un buen diseño….NO VALE PARA NADA… perdon …si vale….para llenar la seccion de reportajes baratos de TV barrio sesamo