Il sito contiene i migliori consigli, trucchi e soluzioni ai problemi che potresti incontrare. Segreti, trucchi di vita, storie e tutto ciò che riguarda la vita e le relazioni.

“Come mentire con le statistiche” di Darell Huff. Come mentire con le statistiche

14

Bias di campionamento

Nel 1948, durante la corsa presidenziale negli Stati Uniti nella notte delle elezioni Truman (Democratici) contro Dewey (Repubblicani), il Chicago Tribune pubblicò forse il suo titolo più famoso, DEWEY DEFEATS TRUMAN (vedi foto). Subito dopo la chiusura dei seggi elettorali, il giornale ha condotto un sondaggio, chiamando un numero enorme (sufficiente per un campione) di elettori, e tutto ha preannunciato una clamorosa vittoria per Dewey. La foto mostra Truman, il vincitore della 48esima elezione, che ride. Che cosa è andato storto?

Le persone venivano telefonate per caso e in numero sufficiente, ma nel 48 ° anno il telefono era disponibile solo per le persone di un certo reddito e raramente si trovava tra le persone con poco reddito. Pertanto, lo stesso metodo di votazione introduce un emendamento alla distribuzione dei voti. Il campione non ha preso in considerazione uno strato abbastanza ampio di elettori di Truman (di regola, i democratici hanno una grande quota di voti tra i poveri), per i quali il telefono, a sua volta, non era disponibile. Questa selezione è chiamata parziale.

Scegli la media giusta (media ben scelta)

Immagina un’azienda in cui un manager riceve 25mila, il suo vice ne riceve 7,6mila, i top manager – 5,5mila, i quadri – 3,5mila, i dirigenti junior – 2,5mila e i lavoratori ordinari – 1, 4mila (sterline astratte) al mese.
E il nostro compito è presentare le informazioni sull’azienda in una luce positiva. Possiamo scrivere che lo stipendio medio in azienda è X, ma cosa significa media? Considera le possibili opzioni (vedi il diagramma sotto): La media aritmetica di un insieme finito X = {xi} è un numero m uguale alla media (X) dell’equazione:
"Come mentire con le statistiche" di Darell Huff. Come mentire con le statistiche

"Come mentire con le statistiche" di Darell Huff. Come mentire con le statistiche
Questa è l’informazione più inutile dal punto di vista di un dipendente: 3.472 salari medi, ma cosa rende una cifra così alta? A causa degli alti stipendi della direzione, che crea l’illusione che il dipendente riceverà lo stesso importo. Dal punto di vista del dipendente, questo valore non è particolarmente informativo.
Naturalmente, l’arte popolare non ha aggirato questa caratteristica della “dimensione media” sotto forma di media aritmetica

I funzionari mangiano carne, io mangio cavoli. In media, mangiamo involtini di cavolo.

La mediana di una certa distribuzione P (X) (X = {xi}) è un valore tale m da soddisfare la seguente equazione: In poche parole, metà dei lavoratori ottiene più di questo valore e metà meno – esattamente la metà del distribuzione! Queste statistiche sono abbastanza informative per i dipendenti dell’azienda, in quanto consentono di determinare in che modo lo stipendio del dipendente è correlato alla maggior parte dei dipendenti. La modalità di un insieme finito X = {xi} è il numero m che si verifica più spesso in X. In questo caso, la moda può essere la più istruttiva per una persona che inizierà a lavorare in una determinata azienda.
"Come mentire con le statistiche" di Darell Huff. Come mentire con le statistiche

Pertanto, a seconda della situazione, il valore medio può essere inteso come uno qualsiasi dei valori sopra (in linea di principio e non solo). Pertanto, è di fondamentale importanza capire come viene calcolata questa media.

E altri 10 esperimenti infruttuosi di cui non abbiamo scritto

Mettiamo un normale giornale in acido solforico e la rivista TV Park in acqua distillata! Senti la differenza? Alla rivista non è successo niente: la carta è come nuova! La nostra ricerca riporta che il dentifricio Doake’s Toothpaste è del 23% più efficace della concorrenza, grazie al Dr Cornish’s Tooth Powder! (Che probabilmente conteneva β-carotene e la formula segreta della foresta – nota dell’autore). Potreste essere sorpresi, ma la ricerca è stata effettivamente svolta e persino pubblicato un rapporto tecnico. E l’esperimento ha dimostrato che il dentifricio è del 23% più efficace della concorrenza (qualunque cosa significhi). Ma questa è solo l’intera storia?
"Come mentire con le statistiche" di Darell Huff. Come mentire con le statistiche

In realtà, il campione per l’esperimento era solo una dozzina di persone (secondo Darrell Huff e il libro già citato). Questo è esattamente il campione di cui hai bisogno per ottenere risultati! Diciamo che lanciamo una moneta cinque volte. Qual è la probabilità che atterrerai testa tutte e cinque le volte? (1/2) 5 = 1/32. Solo trentadue, non può essere solo una coincidenza che tutte e cinque le teste vengano fuori, vero? Ora immaginiamo di ripetere questo esperimento 50 volte. Almeno uno di questi tentativi avrà successo. Ne parleremo nel rapporto e tutti gli altri esperimenti non andranno da nessuna parte. Pertanto, riceveremo esclusivamente dati casuali che si adattano perfettamente al nostro compito.

Giocando con la bilancia

Supponiamo che domani sia necessario dimostrare in una riunione che abbiamo raggiunto la concorrenza, ma i numeri non convergono un po ‘, cosa dovremmo fare? Spostiamo un po ‘la scala! Anche il rinomato New York Times, rinomato per la qualità del lavoro sui dati, ha pubblicato un grafico completamente confuso come questo (si noti il ​​salto da 800k a 1,5m al centro della scala). (esempio tratto da Howard Wainer. The American Statistician, 1984.)
"Come mentire con le statistiche" di Darell Huff. Come mentire con le statistiche

Scegliamo il 100%

Immaginiamo che l’anno scorso il latte sia costato 10 copechi per litro e il pane 10 copechi per pagnotta. Quest’anno il prezzo del latte è sceso di 5 copechi e il pane è cresciuto di 20. Attenzione alla domanda, cosa vogliamo dimostrare?
Immaginiamo che lo scorso anno sia il 100%, la base per i calcoli. Poi il prezzo del latte è sceso del 50% e il pane è aumentato del 200%, una media del 125%, il che significa che i prezzi in generale sono aumentati del 25%. Riproviamo, lasciamo che l’anno in corso sia al 100%, il che significa che i prezzi del latte erano del 200% l’anno scorso e il pane del 50%. Ciò significa che l’anno scorso i prezzi erano in media più alti del 25%!
"Come mentire con le statistiche" di Darell Huff. Come mentire con le statistiche

"Come mentire con le statistiche" di Darell Huff. Come mentire con le statistiche

Raccogli i dati che renderanno le tue conclusioni ancora più distorte

Il primo passaggio nella raccolta delle statistiche è determinare cosa si desidera analizzare. Gli statistici chiamano le informazioni in questa fase la popolazione. Successivamente, è necessario definire una sottoclasse di dati che, una volta analizzata, dovrebbe rappresentare l’intera popolazione nel suo insieme. Più grande e accurato è il campione, più accurati saranno i risultati della ricerca.

Naturalmente, ci sono diversi modi per rovinare un campione statistico accidentalmente o intenzionalmente:

  • Bias di selezione. Questo errore si verifica quando le persone che prendono parte allo studio si identificano come un gruppo che non rappresenta l’intera popolazione.
  • Campionamento Casuale. Si verifica quando vengono analizzate informazioni prontamente disponibili anziché cercare di raccogliere dati rappresentativi. Ad esempio, un canale di notizie potrebbe condurre un’indagine politica tra i suoi spettatori. Senza chiedere alle persone che guardano altri canali (o non guardano affatto la TV), non si può dire che i risultati di tale studio rifletteranno la realtà.
  • Rifiuto degli intervistati di partecipare. Un tale errore statistico si verifica quando alcune persone non rispondono alle domande poste in uno studio statistico. Ciò porta a una visualizzazione errata dei risultati. Ad esempio, se uno studio pone la domanda: “Hai mai tradito il tuo coniuge?” Di conseguenza, sembrerà che barare sia raro.
  • Sondaggi ad accesso libero. Chiunque può prendere parte a tali sondaggi. Spesso non viene nemmeno verificato quante volte la stessa persona ha risposto alle domande. Un esempio sono i vari sondaggi su Internet. È molto interessante superarli, ma non possono essere considerati oggettivi.

Il bello del bias di selezione è che qualcuno, da qualche parte, è probabile che conduca un’indagine non scientifica che sosterrà qualunque teoria tu abbia. Quindi cerca sul web il sondaggio che desideri o creane uno tuo.

Scegli risultati che supportano le tue idee

Poiché le statistiche utilizzano numeri, ci sembra che dimostrino in modo convincente qualsiasi idea. La statistica si basa su complessi calcoli matematici che, se mal gestiti, possono portare a risultati completamente opposti.

Per dimostrare i difetti nell’analisi dei dati, il matematico inglese Francis Anscombe ha creato il quartetto Anscombe. Consiste di quattro serie di dati numerici che appaiono completamente diversi sui grafici.

"Come mentire con le statistiche" di Darell Huff. Come mentire con le statistiche

La figura X1 è un grafico a dispersione standard; X2 è una curva che prima sale e poi scende; X3 – una linea che sale leggermente verso l’alto, con un overshoot sull’asse Y; X4 – dati sull’asse X, ad eccezione di un overshoot situato in alto su entrambi gli assi.

Per ciascuno dei grafici, le seguenti affermazioni sono vere:

  • La media di x per ogni set di dati è 9.
  • La media di y per ogni set di dati è 7,5.
  • La varianza (dispersione) della variabile x è 11 e la variabile y è 4,12.
  • La correlazione tra le variabili x e y per ogni set di dati è 0,816.

Se vedessimo questi dati solo sotto forma di testo, penseremmo che le situazioni siano completamente le stesse, anche se i grafici lo smentiscono.

Pertanto, Enscombe ha suggerito di visualizzare prima i dati e solo successivamente di trarre conclusioni. Ovviamente, se vuoi fuorviare qualcuno, salta questo passaggio.

Crea grafici che evidenziano i risultati desiderati

La maggior parte delle persone non ha tempo per fare la propria analisi statistica. Si aspettano che tu mostri loro dei grafici che riassumono tutte le tue ricerche. I grafici ben progettati dovrebbero riflettere idee che si adattano alla realtà. Ma possono anche evidenziare i dati che vuoi mostrare.

Omettere i nomi di alcuni parametri, modificare leggermente la scala sull’asse delle coordinate, non spiegare il contesto. Così puoi convincere tutti che hai ragione.

In ogni caso, nascondi le fonti

Se citi apertamente le tue fonti, è facile per le persone verificare i tuoi risultati. Naturalmente, se stai cercando di mettere tutti intorno al tuo dito, non dire mai come sei arrivato alle tue conclusioni.

Di solito, negli articoli e negli studi, sono sempre indicati i riferimenti alle fonti. Allo stesso tempo, le opere originali potrebbero non essere fornite integralmente. La cosa principale è che la fonte risponde alle seguenti domande:

  • Come sono stati raccolti i dati? Le persone sono state intervistate per telefono? O è stato fermato per strada? O era un sondaggio su Twitter? Il metodo di raccolta delle informazioni può indicare alcuni errori di selezione.
  • Quando si sono conosciuti? La ricerca diventa rapidamente obsoleta e le tendenze cambiano, quindi la tempistica della raccolta delle informazioni influenza le conclusioni.
  • Chi li ha raccolti? C’è poca credibilità nella ricerca della compagnia del tabacco sulla sicurezza del fumo.
  • Chi è stato intervistato? Ciò è particolarmente importante per i sondaggi di opinione pubblica. Se un politico conduce un sondaggio tra coloro che simpatizzano con lui, i risultati non rifletteranno l’opinione dell’intera popolazione.

Come mentire usando le statistiche – Parte 2

Continuiamo ad analizzare come puoi fuorviare le persone utilizzando le statistiche in modo errato. Messaggio precedente

Selezione media

Puoi spesso sentire la parola “media” nelle notizie e negli annunci. Ma cosa significa? C’è media aritmetica, media geometrica, media armonica e l’elenco potrebbe continuare! E una scelta inappropriata (accidentalmente o deliberatamente) della media può distorcere significativamente i risultati.

Consideriamo un esempio. Supponiamo di avere tre persone: la nonna Elena Anatolyevna con una pensione di 8.000, l’amministratore di sistema Vasya con uno stipendio di 40.000 e il milionario Pavel Umnov, che guadagna esattamente un milione al mese

Se calcoliamo semplicemente la media aritmetica sommando i loro stipendi e dividendo per 3, otteniamo che è pari a 350 mila rubli! Resta da accontentare la nonna con questa notizia

Su una scala logaritmica, questi valori non sembrano nemmeno troppo distanti. Linea rossa – media aritmetica

In questi casi, una media come la mediana è più adatta. Questo è il valore che divide tutti i nostri dati in due parti uguali (per quantità). Il valore medio per questo esempio sarebbe lo stipendio dell’amministratore di sistema Vasya – 40.000. Prima e dopo di lei c’è lo stesso numero di persone (una alla volta). Quindi potremmo chiamare Vasya una persona con uno stipendio medio, tutti quelli che ricevono meno di Vasya – con un piccolo reddito, più – ricchi.

Tuttavia, con l’aiuto della mediana, sarebbe possibile, al contrario, nascondere valori molto prominenti (su o giù)

Pieghevole non pieghevole

Pensa al sistema di valutazione in cinque punti a scuola. Immagina che un bambino di settima elementare Danil abbia scritto un dettato per 5, e il suo compagno di classe Leonardo abbia deciso di scriverlo da destra a sinistra e abbia ricevuto un due. Dividiamo 5 per 2 e otteniamo che Danil abbia scritto il dettato 2,5 volte meglio! Giusto?

Sbagliato. I punteggi sono una variabile nominale artificiosa che esprime numericamente voti verbali di eccellente, buono e così via. “Insoddisfacente” è esattamente 2,5 volte peggiore di “eccellente”?

Pertanto, non è matematicamente significativo calcolare i punteggi medi per i voti o per qualsiasi test.

Campionamento parziale

Secondo i dati sulle votazioni su Internet, il 100% delle persone utilizza Internet

Prima di qualsiasi statistica, puoi mentire se raccogli i dati in modo errato. Un classico esempio è la corsa presidenziale statunitense del 1948: Dewey contro Truman. Il Chicago Tribune ha condotto un sondaggio subito dopo la chiusura dei seggi elettorali, chiamando un numero enorme di persone. E secondo i risultati, prevedendo un clamoroso successo, Dewey ha pubblicato un giornale con il titolo ” DEWEY vince Truman “. La foto mostra un Truman che ride, vincitore delle elezioni del 1948, con questo giornale tra le mani

Qualcosa è andato storto? Il giornale ha telefonato a un numero sufficiente di elettori per il campione, anzi a caso. Solo l’approccio in sé era sbagliato: il telefono in quel momento non era disponibile per la popolazione povera, la maggior parte della quale era il sostegno di Truman.

Un altro esempio sono gli stipendi dei laureati promessi dalle università. Negli Stati Uniti è persino andato in tribunale: i laureati hanno sostenuto che i dati sugli stipendi sono stati gonfiati artificialmente. Ma il punto è completamente diverso: è solo che solo le persone soddisfatte condividono i dati sui loro guadagni con l’università.

Visualizzazione “visiva”

Ci sono mille e uno modi per abbellire i dati. Ad esempio, visualizzali visivamente. Può aiutare a leggere grafici noiosi e, se fatto con un po ‘di trucco, è più redditizio presentarli.

Ecco un grafico del consumo di birra negli Stati Uniti in milioni di barili e la quota di Schlitz. È davvero impressionante!

Ma mettiamo questo grafico in una forma più rigorosa: visualizza i dati con punti e inizia l’asse y da zero:

Non sembra più così impressionante. Quando si tracciano punti sul grafico sotto forma di barili, le persone percepiscono visivamente non le parti superiori dei barili, ma il loro volume. E quando il lato della canna viene ingrandito di 2 volte, il volume aumenta di 8 volte! Su tale scala, l’asse y che inizia da 100 aiuta.

Ecco un altro esempio. Meravigliose infografiche che mostrano quanti soldi vengono spesi per combattere le malattie e le loro morti

L’idea è fantastica. Tuttavia, dai un’occhiata più da vicino ai numeri. Il prezzo con un cerchio arancione è circa 2 volte inferiore rispetto a uno rosa. Ma il cerchio rosa è 4 volte più grande!

Gli autori hanno preferito che il raggio del cerchio dipendesse dal prezzo. Ma non percepiamo visivamente il raggio, ma l’area della figura! E la formula per l’area di un cerchio dipende dal raggio in modo quadratico

Questa infografica può essere resa ancora migliore mettendo le stesse malattie sulla stessa linea. Ecco come appare la versione rivista:

La visualizzazione non è solo più credibile, ma trasmette anche chiaramente l’idea: alcune malattie non sono pericolose quanto il denaro viene speso per esse e la lotta contro altre è sottofinanziata.

Un esempio di visualizzazione di alta qualità

Il grafico mostra le dimensioni dell’esercito di Napoleone. Il punto di estrema destra è Mosca, da dove inizia la ritirata, indicata da una striscia nera. Anche il grafico dell’ora e della temperatura è collegato al programma del ritiro. Molto chiaro!

Sul libro “Come mentire usando le statistiche” di Darell Huff

In questo libro famoso in tutto il mondo, Darell Huff discute i vari modi in cui le statistiche vengono utilizzate in modo improprio per ingannare e manipolare il pubblico. Ogni giorno cercano di influenzarti per incoraggiarti ad acquistare qualche prodotto “necessario” o per scegliere il candidato “giusto”: “Grazie alla pasta” Clean Teeth “la formazione di carie si riduce del 23%!”; “La politica N è supportata dall’85% dei cittadini” … Come capire quanto siano affidabili determinati dati? Come sono i calcoli? Cosa si tiene in considerazione e cosa resta dietro le quinte? L’autore svela gli strumenti segreti di statistici ed equipaggi il lettore con una conoscenza che aiuterà a comprendere tutte le complessità di questa scienza e non permetterà confusione.

annotazione

In questo libro famoso in tutto il mondo, Darell Huff discute i vari modi in cui le statistiche vengono utilizzate in modo improprio per ingannare e manipolare il pubblico. Ogni giorno cercano di influenzarti per incoraggiarti ad acquistare qualche prodotto “necessario” o per scegliere il candidato “giusto”: “Grazie alla pasta” Clean Teeth “la formazione di carie si riduce del 23%!”; “La politica N è sostenuta dall’85% dei cittadini” … Come capire quanto siano affidabili questo o quel dato? Come viene eseguito il calcolo? Di cosa si tiene conto e di cosa si lascia dietro le quinte? L’autore rivela gli strumenti segreti degli statistici e fornisce al lettore la conoscenza che aiuterà a comprendere tutte le complessità di questa scienza e non ti permetterà di essere fuorviato.

Fonti utilizzate e link utili sull’argomento: https://habr.com/ru/post/217545/ https://Lifehacker.ru/4-sposoba-lgat-pri-pomoshhi-statistiki/ https://pikabu.ru / story / kaklgat_s_pomoshchyu_statistiki_chast_2_6113007 https://lifeinbooks.net/chto-pochitat/kak-lgat-pri-pomoshhi-statistiki-darell-haff/ https://coollib.net/b/331961-kat-plgat-

Fonte di registrazione: lastici.ru

This website uses cookies to improve your experience. We'll assume you're ok with this, but you can opt-out if you wish. Accept Read More