El sitio contiene los mejores consejos, trucos y soluciones a los problemas que pueda encontrar. Secretos, trucos de la vida, historias y todo lo relacionado con la vida y las relaciones.

“Cómo mentir con las estadísticas” por Darell Huff. Cómo mentir con las estadísticas

12

Sesgo de muestreo

En 1948, durante la carrera presidencial en los Estados Unidos en la noche de las elecciones Truman (demócratas) contra Dewey (republicanos), el Chicago Tribune publicó quizás su titular más famoso, DEWEY DERROTA A TRUMAN (ver foto). Inmediatamente después del cierre de los colegios electorales, el periódico realizó una encuesta, convocando a un número enorme (suficiente para una muestra) de votantes, y todo presagiaba una contundente victoria para Dewey. La foto muestra a Truman, el ganador de la 48ª elección, riendo. ¿Qué salió mal?

Se llamó a personas por casualidad y en un número suficiente, pero en el año 48 el teléfono estaba disponible solo para personas de ciertos ingresos y rara vez se encontraba entre personas con pocos ingresos. Así, el propio método de votación introduce una enmienda a la distribución de votos. La muestra no tuvo en cuenta un estrato bastante amplio de votantes de Truman (por regla general, los demócratas tienen una gran proporción de votos entre los pobres), para quienes el teléfono, a su vez, no estaba disponible. Esta selección se llama sesgada.

Elija el promedio correcto (promedio bien elegido)

Imagine una empresa en la que un gerente recibe 25 mil, su adjunto 7,6 mil, los altos directivos 5,5 mil, los mandos medios 3,5 mil, los gerentes subalternos 2,5 mil y los trabajadores ordinarios 1, 4 mil (libras abstractas) por mes.
Y nuestra tarea es presentar la información sobre la empresa de forma positiva. Podemos escribir que el salario promedio en la empresa es X, pero ¿qué significa el promedio? Considere las opciones posibles (vea el diagrama a continuación): La media aritmética de algún conjunto finito X = {xi} es un número m igual a la media (X) de la ecuación:
"Cómo mentir con las estadísticas" por Darell Huff. Cómo mentir con las estadísticas

"Cómo mentir con las estadísticas" por Darell Huff. Cómo mentir con las estadísticas
Esta es la información más inútil desde el punto de vista de un empleado: 3.472 salarios promedio, pero ¿qué hace una cifra tan alta? Debido a los altos salarios de la gerencia, lo que crea la ilusión de que el empleado recibirá la misma cantidad. Desde el punto de vista del empleado, este valor no es particularmente informativo.
Por supuesto, el arte popular no pasó por alto esta característica del “tamaño medio” en forma de media aritmética.

Los funcionarios comen carne, yo como repollo. En promedio, comemos rollos de repollo.

La mediana de alguna distribución P (X) (X = {xi}) es un valor m tal que satisface la siguiente ecuación: En pocas palabras, la mitad de los trabajadores obtienen más que este valor y la mitad menos, exactamente la mitad del valor. ¡distribución! Estas estadísticas son bastante informativas para los empleados de la empresa, ya que permiten determinar cómo se relaciona el salario del empleado con la mayoría de los empleados. La moda de un conjunto finito X = {xi} es el número m que ocurre con mayor frecuencia en X. En este caso, la moda puede ser lo más informativo para una persona que va a empezar a trabajar en una determinada empresa.
"Cómo mentir con las estadísticas" por Darell Huff. Cómo mentir con las estadísticas

Así, dependiendo de la situación, el valor medio puede entenderse como cualquiera de los valores anteriores (en principio y no solo de ellos). Por lo tanto, es fundamental comprender cómo se calcula este promedio.

Y 10 experimentos fallidos más sobre los que no hemos escrito

¡Pongamos un periódico corriente en ácido sulfúrico y la revista TV Park en agua destilada! ¿Siente la diferencia? No le pasó nada a la revista, ¡el papel está como nuevo! Nuestra investigación informa que la pasta de dientes de Doake es un 23% más efectiva que la competencia, ¡gracias al polvo de dientes del Dr. Cornish! (Que probablemente contenía β-caroteno y la fórmula secreta del bosque – nota del autor). Puede que se sorprenda, pero la investigación se llevó a cabo e incluso se publicó un informe técnico. Y el experimento demostró que la pasta de dientes es un 23% más eficaz que la competencia (sea lo que sea que eso signifique). ¿Pero esta es solo la historia completa?
"Cómo mentir con las estadísticas" por Darell Huff. Cómo mentir con las estadísticas

En realidad, la muestra para el experimento fue solo de una docena de personas (según Darrell Huff y el libro ya mencionado). ¡Esta es exactamente la muestra que necesita para obtener resultados! Digamos que lanzamos una moneda cinco veces. ¿Cuál es la probabilidad de que caiga cabezas las cinco veces? (1/2) 5 = 1/32. Solo la una treinta y dos, no puede ser solo una coincidencia que las cinco cabezas aparezcan, ¿verdad? Ahora imaginemos que repetimos este experimento 50 veces. Al menos uno de estos intentos tendrá éxito. Escribiremos sobre ello en el informe, y todos los demás experimentos no irán a ninguna parte. Así, recibiremos datos exclusivamente aleatorios que encajan perfectamente en nuestra tarea.

Jugando con la balanza

Suponga que mañana necesita demostrar en una reunión que nos hemos puesto al día con la competencia, pero los números no convergen un poco, ¿qué debemos hacer? ¡Muevamos un poco la escala! Incluso el renombrado New York Times, famoso por su trabajo de datos de calidad, ha publicado un gráfico completamente confuso como este (observe el salto de 800k a 1,5 m en el centro de la escala). (ejemplo de Howard Wainer. The American Statistician, 1984.)
"Cómo mentir con las estadísticas" por Darell Huff. Cómo mentir con las estadísticas

Elegimos 100%

Imaginemos que el año pasado la leche costaba 10 kopeks por litro y el pan costaba 10 kopeks por barra. Este año la leche ha bajado de precio 5 kopeks y el pan ha subido 20. Atención a la pregunta, ¿qué queremos demostrar?
Imaginemos que el año pasado es el 100%, la base para los cálculos. Luego la leche bajó un 50% de precio y el pan aumentó un 200%, un promedio de 125%, lo que significa que los precios en general aumentaron un 25%. Intentemos de nuevo, que el año actual sea 100%, lo que significa que los precios de la leche fueron del 200% el año pasado y del pan del 50%. Esto significa que los precios del año pasado fueron en promedio un 25% más altos.
"Cómo mentir con las estadísticas" por Darell Huff. Cómo mentir con las estadísticas

"Cómo mentir con las estadísticas" por Darell Huff. Cómo mentir con las estadísticas

Recopile datos que harán que sus conclusiones sean aún más sesgadas.

El primer paso para recopilar estadísticas es determinar qué desea analizar. Los estadísticos llaman a la información en esta etapa la población. Luego, define una subclase de datos que, cuando se analizan, deben representar a toda la población como un todo. Cuanto más grande y precisa sea la muestra, más precisos serán los resultados de la investigación.

Por supuesto, hay diferentes formas de estropear una muestra estadística por accidente o intencionalmente:

  • Sesgo de selección. Este error se produce cuando las personas que participan en el estudio se identifican como un grupo que no representa a toda la población.
  • Muestreo aleatorio. Ocurre cuando se analiza información fácilmente disponible en lugar de intentar recopilar datos representativos. Por ejemplo, un canal de noticias podría realizar una encuesta política entre sus espectadores. Sin preguntar a las personas que ven otros canales (o que no ven televisión en absoluto), no se puede decir que los resultados de dicho estudio reflejarán la realidad.
  • Rechazo de los encuestados a participar. Tal error estadístico ocurre cuando algunas personas no responden a las preguntas formuladas en un estudio estadístico. Esto conduce a una visualización incorrecta de los resultados. Por ejemplo, si un estudio hace la pregunta: “¿Alguna vez ha engañado a su cónyuge?” Como resultado, parecerá que las trampas son raras.
  • Encuestas de libre acceso. Cualquiera puede participar en estas encuestas. A menudo ni siquiera se comprueba cuántas veces respondió una misma persona a las preguntas. Un ejemplo son varias encuestas en Internet. Es muy interesante pasarlos, pero no se pueden considerar objetivos.

La belleza del sesgo de selección es que es probable que alguien, en algún lugar, realice una encuesta no científica que respalde cualquier teoría que tenga. Así que busque en la web la encuesta que desee o cree la suya propia.

Elija resultados que apoyen sus ideas

Dado que las estadísticas usan números, nos parece que prueban de manera convincente cualquier idea. La estadística se basa en cálculos matemáticos complejos que, si se manejan mal, pueden conducir a resultados completamente opuestos.

Para demostrar las fallas en el análisis de datos, el matemático inglés Francis Anscombe creó el cuarteto Anscombe. Consiste en cuatro conjuntos de datos numéricos que se ven completamente diferentes en los gráficos.

"Cómo mentir con las estadísticas" por Darell Huff. Cómo mentir con las estadísticas

La figura X1 es un diagrama de dispersión estándar; X2 es una curva que primero sube y luego baja; X3: una línea que se eleva ligeramente hacia arriba con un rebasamiento en el eje Y; X4: datos en el eje X, excepto por un sobreimpulso ubicado en lo alto de ambos ejes.

Para cada una de las gráficas, las siguientes afirmaciones son verdaderas:

  • La media de x para cada conjunto de datos es 9.
  • La media de y para cada conjunto de datos es 7.5.
  • La varianza (dispersión) de la variable x es 11 y la variable y es 4,12.
  • La correlación entre las variables xey para cada conjunto de datos es 0,816.

Si viéramos estos datos solo en forma de texto, pensaríamos que las situaciones son completamente iguales, aunque los gráficos lo refutan.

Por lo tanto, Enscombe sugirió que primero visualice los datos y solo luego saque conclusiones. Por supuesto, si desea engañar a alguien, omita este paso.

Cree gráficos que resalten los resultados deseados

La mayoría de la gente no tiene tiempo para hacer su propio análisis estadístico. Esperan que les muestre gráficos que resuman toda su investigación. Los gráficos bien diseñados deben reflejar ideas que se ajusten a la realidad. Pero también pueden resaltar los datos que desea mostrar.

Omita los nombres de algunos parámetros, cambie ligeramente la escala en el eje de coordenadas, no explique el contexto. Para que puedas convencer a todos de que tienes razón.

Por supuesto, oculta las fuentes.

Si cita abiertamente sus fuentes, es fácil para las personas verificar sus hallazgos. Por supuesto, si está tratando de que todos estén cerca de su dedo, nunca diga cómo llegó a sus conclusiones.

Por lo general, en artículos y estudios, las fuentes siempre se citan. Sin embargo, es posible que las obras originales no se proporcionen en su totalidad. Lo principal es que la fuente responde las siguientes preguntas:

  • ¿Cómo se recopilaron los datos? ¿Se entrevistó a las personas por teléfono? ¿O fue detenido en la calle? ¿O fue una encuesta de Twitter? El método de recopilación de información puede indicar ciertos errores de selección.
  • ¿Cuándo se conocieron? La investigación se vuelve obsoleta rápidamente y las tendencias cambian, por lo que el momento de la recopilación de información influye en las conclusiones.
  • ¿Quién los recogió? Hay poca credibilidad en la investigación de la empresa tabacalera sobre la seguridad del tabaquismo.
  • ¿Quién fue entrevistado? Esto es especialmente importante para las encuestas de opinión pública. Si un político realiza una encuesta entre quienes simpatizan con él, los resultados no reflejarán la opinión de toda la población.

Cómo mentir usando estadísticas – Parte 2

Continuamos analizando cómo se puede engañar a las personas al usar estadísticas incorrectamente. Publicación anterior

Selección media

A menudo puede escuchar la palabra “promedio” en noticias y anuncios. Pero, ¿qué es malo? ¡Hay media aritmética, media geométrica, media armónica y la lista continúa! Y la elección inapropiada (accidental o deliberadamente) de la media puede distorsionar significativamente los resultados.

Consideremos un ejemplo. Supongamos que tenemos tres personas: la abuela Elena Anatolyevna con una pensión de 8.000, el administrador del sistema Vasya con un salario de 40.000 y el millonario Pavel Umnov, que gana exactamente un millón al mes.

Si simplemente calculamos la media aritmética sumando sus salarios y dividiendo por 3, ¡obtenemos que es igual a 350 mil rublos! Queda por complacer a la abuela con esta noticia.

En una escala logarítmica, estos valores ni siquiera se ven demasiado separados. Línea roja – media aritmética

Para tales casos, una media como la mediana es más adecuada. Este es el valor que divide todos nuestros datos en dos partes iguales (en términos de cantidad). El valor medio de este ejemplo sería el salario del administrador del sistema Vasya – 40 000. Antes y después de ella hay el mismo número de personas (una a la vez). Entonces podríamos llamar a Vasya una persona con un salario promedio, todos los que reciben menos que Vasya, con un ingreso pequeño, más ricos.

Sin embargo, con la ayuda de la mediana, sería posible, por el contrario, ocultar valores muy destacados (hacia arriba o hacia abajo)

Plegable no plegable

Piense en el sistema de calificación de cinco puntos en la escuela. Imagínese que el estudiante de séptimo grado Danil escribió un dictado para 5, y su compañero de clase Leonardo decidió escribirlo de derecha a izquierda y recibió un dos. ¡Dividimos 5 entre 2 y obtenemos que Danil escribió el dictado 2.5 veces mejor! ¿Derecha?

Equivocado. Las puntuaciones son una variable nominal artificial que expresa numéricamente las calificaciones verbales de excelente, bueno, etc. ¿Es “insatisfactorio” exactamente 2,5 veces peor que “excelente”?

Por lo tanto, no es matemáticamente significativo calcular los puntajes promedio para las calificaciones o para cualquier prueba.

Muestreo sesgado

Según los datos de votación por Internet, el 100% de las personas utilizan Internet

Antes que cualquier estadística, puede mentir si recopila los datos incorrectamente. Un ejemplo clásico es la carrera presidencial estadounidense de 1948: Dewey contra Truman. El Chicago Tribune realizó una encuesta inmediatamente después del cierre de los colegios electorales, llamando a un gran número de personas. Y según los resultados, prediciendo un rotundo éxito, Dewey publicó un periódico con el titular ” DEWEY gana a Truman “. La foto muestra a Truman riendo, ganador de las elecciones de 1948, con este mismo periódico en sus manos.

¿Algo salió mal? El periódico llamó por teléfono a un número suficiente de votantes para la muestra, y de hecho al azar. Solo el enfoque en sí era incorrecto: el teléfono en ese momento no estaba disponible para la población pobre, la mayor parte del cual era el apoyo de Truman.

Otro ejemplo son los salarios de los graduados prometidos por las universidades. En los EE. UU., Incluso fue a los tribunales: los graduados argumentaron que los datos sobre salarios eran artificialmente altos. Pero el punto es completamente diferente: es solo que solo las personas que están satisfechas con ellos comparten datos sobre sus ganancias con la universidad.

Visualización “visual”

Hay mil y una formas de embellecer los datos. Por ejemplo, visualícelos visualmente. Puede ayudar a leer gráficos aburridos y, si se hace con un poco de engaño, es más rentable presentarlos.

A continuación se muestra un gráfico del consumo de cerveza estadounidense en millones de barriles y la participación de Schlitz. ¡Es realmente impresionante!

Pero pongamos este gráfico en una forma más rigurosa: muestre los datos con puntos y comience el eje y desde cero:

Ya no parece tan impresionante. Al trazar puntos en el gráfico en forma de barriles, las personas perciben visualmente no la parte superior de los barriles, sino su volumen. Y cuando el lado del cañón se agranda 2 veces, ¡el volumen aumenta 8 veces! En esta escala, el eje y que comienza en 100 ayuda.

He aquí otro ejemplo. Maravillosas infografías que muestran cuánto dinero se gasta en la lucha contra las enfermedades y sus muertes.

La idea es genial. Sin embargo, eche un vistazo más de cerca a los números. El precio con un círculo naranja es aproximadamente 2 veces menor que con uno rosa. ¡Pero el círculo rosa es 4 veces más grande!

Los autores prefirieron hacer que el radio del círculo dependiera del precio. ¡Pero visualmente no percibimos el radio en absoluto, sino el área de la figura! Y la fórmula para el área de un círculo depende del radio cuadráticamente

Esta infografía se puede mejorar aún más colocando las mismas enfermedades en la misma línea. Así es como se ve la versión revisada:

La visualización no solo es más creíble, sino que también transmite claramente la idea: algunas enfermedades no son tan peligrosas como el dinero que se gasta en ellas, y la lucha contra otras carece de fondos suficientes.

Un ejemplo de visualización de alta calidad

El gráfico muestra el tamaño del ejército de Napoleón. El punto de la extrema derecha es Moscú, desde donde comienza la retirada, que se muestra con una franja negra. El gráfico de tiempo y temperatura también está vinculado al programa de retiro. ¡Muy claro!

Acerca del libro “Cómo mentir usando estadísticas” de Darell Huff

En este libro de fama mundial, Darell Huff analiza las diversas formas en que se utilizan incorrectamente las estadísticas para engañar y manipular al público. Todos los días intentan influenciarte para animarte a comprar algún producto “necesario” o elegir al candidato “adecuado”: ​​”¡Gracias a la pasta” Clean Teeth “, la formación de caries se reduce en un 23%!”; “La política N es apoyada por el 85% de los ciudadanos” … ¿Cómo entender qué tan confiables son ciertos datos? ¿Cómo son los cálculos? ¿Qué se tiene en cuenta y qué queda detrás de escena? El autor desvela las herramientas secretas de los estadísticos y equipa el lector con conocimientos que le ayudarán a comprender todos los entresijos de esta ciencia y no permitirá confusiones.

anotación

En este libro de fama mundial, Darell Huff analiza las diversas formas en que se utilizan incorrectamente las estadísticas para engañar y manipular al público. Todos los días intentan influenciarte para animarte a comprar algún producto “necesario” o elegir al candidato “adecuado”: ​​”¡Gracias a la pasta” Clean Teeth “, la formación de caries se reduce en un 23%!”; “La política N es apoyada por el 85% de los ciudadanos” … ¿Cómo entender qué tan confiables son estos o aquellos datos? ¿Cómo se hace el cálculo? ¿Qué se tiene en cuenta y qué se deja entre bastidores? El autor revela las herramientas secretas de los estadísticos y dota al lector de conocimientos que le ayudarán a comprender todas las complejidades de esta ciencia y no le permitirán ser engañado.

Fuentes utilizadas y enlaces útiles sobre el tema: https://habr.com/ru/post/217545/ https://Lifehacker.ru/4-sposoba-lgat-pri-pomoshhi-statistiki/ https://pikabu.ru / story / kaklgat_s_pomoshchyu_statistiki_chast_2_6113007 https://lifeinbooks.net/chto-pochitat/kak-lgat-pri-pomoshhi-statistiki-darell-haff/ https://coollib.net/b/331961-kat-plgat-

Fuente de grabación: lastici.ru

This website uses cookies to improve your experience. We'll assume you're ok with this, but you can opt-out if you wish. Accept Read More