{"id":347401,"date":"2021-11-27T12:47:00","date_gmt":"2021-11-27T09:47:00","guid":{"rendered":"https:\/\/inform.com.de\/?p=347401"},"modified":"2021-05-07T18:08:35","modified_gmt":"2021-05-07T15:08:35","slug":"comment-mentir-avec-les-statistiques-par-darell-huff-comment-mentir-avec-les-statistiques","status":"publish","type":"post","link":"https:\/\/inform.com.de\/fr\/comment-mentir-avec-les-statistiques-par-darell-huff-comment-mentir-avec-les-statistiques\/","title":{"rendered":"\u00ab\u00a0Comment mentir avec les statistiques\u00a0\u00bb par Darell Huff. Comment mentir avec les statistiques"},"content":{"rendered":"<h2>Biais d&rsquo;\u00e9chantillonnage<\/h2>\n<p>En 1948, lors de la course pr\u00e9sidentielle aux \u00c9tats-Unis le soir de l&rsquo;\u00e9lection Truman (d\u00e9mocrates) contre Dewey (r\u00e9publicains), le Chicago Tribune publie peut-\u00eatre son titre le plus c\u00e9l\u00e8bre, <a href=\"http:\/\/www.chicagotribune.com\/news\/politics\/chi-chicagodays-deweydefeats-story,0,6484067.story\" target=\"_blank\" rel=\"noopener nofollow\" class=\"external external_icon\">DEWEY DEFEATS TRUMAN<\/a> (voir photo). Imm\u00e9diatement apr\u00e8s la fermeture des bureaux de vote, le journal a men\u00e9 un scrutin, appelant un nombre \u00e9norme (assez pour un \u00e9chantillon) d&rsquo;\u00e9lecteurs, et tout annonce une victoire retentissante pour Dewey. La photo montre Truman, le vainqueur de la 48e \u00e9lection, en train de rire. Qu&rsquo;est ce qui ne s&rsquo;est pas bien pass\u00e9?<\/p>\n<p>Les gens ont \u00e9t\u00e9 appel\u00e9s par hasard et en nombre suffisant, mais au cours de la 48e ann\u00e9e, le t\u00e9l\u00e9phone n&rsquo;\u00e9tait disponible que pour les personnes ayant un certain revenu et \u00e9tait rarement trouv\u00e9 chez les personnes \u00e0 faible revenu. Ainsi, le mode de scrutin lui-m\u00eame introduit un amendement \u00e0 la r\u00e9partition des voix. L&rsquo;\u00e9chantillon n&rsquo;a pas pris en compte une strate assez large d&rsquo;\u00e9lecteurs de Truman (en r\u00e8gle g\u00e9n\u00e9rale, les d\u00e9mocrates ont une part importante des voix parmi les pauvres), pour qui le t\u00e9l\u00e9phone, \u00e0 son tour, n&rsquo;\u00e9tait pas disponible. Cette s\u00e9lection est appel\u00e9e biais\u00e9e.<\/p>\n<h2>Choisissez la bonne moyenne (moyenne bien choisie)<\/h2>\n<p>Imaginez une entreprise dans laquelle un directeur re\u00e7oit 25 mille, son adjoint en re\u00e7oit 7,6 mille, les cadres sup\u00e9rieurs &#8211; 5,5 mille, les cadres moyens &#8211; 3,5 mille, les cadres subalternes &#8211; 2,5 mille et les travailleurs ordinaires &#8211; 1, 4 mille (livres abstraites) par mois.<br \/>\nEt notre t\u00e2che est de pr\u00e9senter les informations sur l&rsquo;entreprise sous un jour positif. Nous pouvons \u00e9crire que le salaire moyen dans l&rsquo;entreprise est X, mais que signifie la moyenne? Consid\u00e9rez les options possibles (voir le diagramme ci-dessous): La moyenne arithm\u00e9tique d&rsquo;un ensemble fini X = {xi} est un nombre m \u00e9gal \u00e0 la moyenne (X) de l&rsquo;\u00e9quation:<br \/><a href=\"https:\/\/inform.com.de\/wp-content\/uploads\/2021\/04\/post-196179-607bfa93b5718.png\" data-rel=\"lightbox-image-bGlnaHRib3g=\" data-rl_title=\"\" data-rl_caption=\"\" title=\"\"><img decoding=\"async\" class=\"SDStudio-light-box-enable SDStudio-editor-tools-md-imp\" src=\"https:\/\/inform.com.de\/wp-content\/uploads\/2021\/04\/post-196179-607bfa93b5718.png\" alt=\"&quot;Comment mentir avec les statistiques&quot; par Darell Huff. Comment mentir avec les statistiques\" ><\/a>  <\/p>\n<p><a href=\"https:\/\/inform.com.de\/wp-content\/uploads\/2021\/04\/post-196179-607bfa94b140b.png\" data-rel=\"lightbox-image-bGlnaHRib3g=\" data-rl_title=\"\" data-rl_caption=\"\" title=\"\"><img decoding=\"async\" class=\"SDStudio-light-box-enable SDStudio-editor-tools-md-imp\" src=\"https:\/\/inform.com.de\/wp-content\/uploads\/2021\/04\/post-196179-607bfa94b140b.png\" alt=\"&quot;Comment mentir avec les statistiques&quot; par Darell Huff. Comment mentir avec les statistiques\" ><\/a><br \/>\nC&rsquo;est l&rsquo;information la plus inutile du point de vue d&rsquo;un employ\u00e9 &#8211; 3.472 salaire moyen, mais qu&rsquo;est-ce qui fait un chiffre aussi \u00e9lev\u00e9? En raison des salaires \u00e9lev\u00e9s de la direction, ce qui cr\u00e9e l&rsquo;illusion que l'employ\u00e9 recevra le m\u00eame montant. Du point de vue de l'employ\u00e9, cette valeur n&rsquo;est pas particuli\u00e8rement informative.<br \/>\nBien s\u00fbr, l&rsquo;art populaire n&rsquo;a pas contourn\u00e9 cette caract\u00e9ristique de la \u00ab\u00a0taille moyenne\u00a0\u00bb sous la forme d&rsquo;une moyenne arithm\u00e9tique<\/p>\n<blockquote>\n<p>Les fonctionnaires mangent de la viande, je mange du chou. En moyenne, nous mangeons des rouleaux de chou.<\/p>\n<\/blockquote>\n<p>La m\u00e9diane d&rsquo;une certaine distribution P (X) (X = {xi}) est une valeur m telle qu&rsquo;elle satisfait l&rsquo;\u00e9quation suivante: En termes simples, la moiti\u00e9 des travailleurs obtiennent plus que cette valeur, et la moiti\u00e9 moins &#8211; exactement le milieu de la Distribution! Ces statistiques sont assez informatives pour les employ\u00e9s de l&rsquo;entreprise, car elles permettent de d\u00e9terminer comment le salaire de l'employ\u00e9 se rapporte \u00e0 la majorit\u00e9 des employ\u00e9s. Le mode d&rsquo;un ensemble fini X = {xi} est le nombre m qui appara\u00eet le plus souvent dans X. Dans ce cas, la mode peut \u00eatre la plus informative pour une personne qui va commencer \u00e0 travailler dans une entreprise donn\u00e9e.<br \/><a href=\"https:\/\/inform.com.de\/wp-content\/uploads\/2021\/04\/post-196179-607bfa9567618.png\" data-rel=\"lightbox-image-bGlnaHRib3g=\" data-rl_title=\"\" data-rl_caption=\"\" title=\"\"><img decoding=\"async\" class=\"SDStudio-light-box-enable SDStudio-editor-tools-md-imp\" src=\"https:\/\/inform.com.de\/wp-content\/uploads\/2021\/04\/post-196179-607bfa9567618.png\" alt=\"&quot;Comment mentir avec les statistiques&quot; par Darell Huff. Comment mentir avec les statistiques\" ><\/a>  <\/p>\n<p>Ainsi, selon la situation, la valeur moyenne peut \u00eatre comprise comme n&rsquo;importe laquelle des valeurs ci-dessus (en principe et pas seulement d&rsquo;elles). Par cons\u00e9quent, il est fondamental de comprendre comment cette moyenne est calcul\u00e9e.<\/p>\n<h2>Et 10 autres exp\u00e9riences infructueuses sur lesquelles nous n&rsquo;avons pas \u00e9crit<\/h2>\n<p>Mettons un journal ordinaire dans de l&rsquo;acide sulfurique et le magazine TV Park dans de l&rsquo;eau distill\u00e9e! Sentir la diff\u00e9rence? Rien n&rsquo;est arriv\u00e9 au magazine &#8211; le papier est comme neuf! Nos recherches rapportent que le dentifrice Doake est 23% plus efficace que la concurrence, gr\u00e2ce \u00e0 la poudre dentaire du Dr Cornish! (Qui contenait probablement du \u03b2-carot\u00e8ne et la formule secr\u00e8te de la for\u00eat &#8211; note de l&rsquo;auteur.) Vous pourriez \u00eatre surpris, mais la recherche a en fait \u00e9t\u00e9 men\u00e9e et a m\u00eame publi\u00e9 un rapport technique. Et l&rsquo;exp\u00e9rience a montr\u00e9 que le dentifrice est 23% plus efficace que la concurrence (quoi que cela signifie). Mais est-ce juste toute l&rsquo;histoire?<br \/><a href=\"https:\/\/inform.com.de\/wp-content\/uploads\/2021\/04\/post-196179-607bfa96486df.png\" data-rel=\"lightbox-image-bGlnaHRib3g=\" data-rl_title=\"\" data-rl_caption=\"\" title=\"\"><img decoding=\"async\" class=\"SDStudio-light-box-enable SDStudio-editor-tools-md-imp\" src=\"https:\/\/inform.com.de\/wp-content\/uploads\/2021\/04\/post-196179-607bfa96486df.png\" alt=\"&quot;Comment mentir avec les statistiques&quot; par Darell Huff. Comment mentir avec les statistiques\" ><\/a>  <\/p>\n<p>En r\u00e9alit\u00e9, l&rsquo;\u00e9chantillon pour l&rsquo;exp\u00e9rience n&rsquo;\u00e9tait qu&rsquo;une douzaine de personnes (selon Darrell Huff et le livre d\u00e9j\u00e0 mentionn\u00e9). C&rsquo;est exactement l&rsquo;exemple dont vous avez besoin pour obtenir des r\u00e9sultats! Disons que nous lan\u00e7ons une pi\u00e8ce cinq fois. Quelle est la probabilit\u00e9 qu&rsquo;il atterrira des t\u00eates toutes les cinq fois? (1\/2) 5 = 1\/32. Juste une heure trente-deux, \u00e7a ne peut pas \u00eatre une simple co\u00efncidence que les cinq t\u00eates se l\u00e8vent, n&rsquo;est-ce pas? Imaginons maintenant que nous r\u00e9p\u00e9tions cette exp\u00e9rience 50 fois. Au moins une de ces tentatives r\u00e9ussira. Nous en parlerons dans le rapport, et toutes les autres exp\u00e9riences ne m\u00e8neront nulle part. Ainsi, nous recevrons exclusivement des donn\u00e9es al\u00e9atoires qui s&rsquo;int\u00e8grent parfaitement dans notre t\u00e2che.<\/p>\n<h2>Jouer avec la balance<\/h2>\n<p>Supposons que demain vous ayez besoin de montrer lors d&rsquo;une r\u00e9union que nous avons rattrap\u00e9 la concurrence, mais que les chiffres ne convergent pas un peu, que devons-nous faire? D\u00e9pla\u00e7ons un peu l&rsquo;\u00e9chelle! M\u00eame le c\u00e9l\u00e8bre New York Times, r\u00e9put\u00e9 pour son travail de donn\u00e9es de qualit\u00e9, a publi\u00e9 un graphique compl\u00e8tement d\u00e9routant comme celui-ci (notez le saut de 800k \u00e0 1,5 m au centre de l&rsquo;\u00e9chelle). (exemple de Howard Wainer. The American Statistician, 1984.)<br \/><a href=\"https:\/\/inform.com.de\/wp-content\/uploads\/2021\/04\/post-196179-607bfa9b190a4.png\" data-rel=\"lightbox-image-bGlnaHRib3g=\" data-rl_title=\"\" data-rl_caption=\"\" title=\"\"><img decoding=\"async\" class=\"SDStudio-light-box-enable SDStudio-editor-tools-md-imp\" src=\"https:\/\/inform.com.de\/wp-content\/uploads\/2021\/04\/post-196179-607bfa9b190a4.png\" alt=\"&quot;Comment mentir avec les statistiques&quot; par Darell Huff. Comment mentir avec les statistiques\" ><\/a>  <\/p>\n<h2>Nous choisissons 100%<\/h2>\n<p>Imaginons que l&rsquo;ann\u00e9e derni\u00e8re, le lait co\u00fbtait 10 kopecks par litre et le pain 10 kopecks par pain. Cette ann\u00e9e, le prix du lait a baiss\u00e9 de 5 kopecks, tandis que le pain a augment\u00e9 de 20. Attention \u00e0 la question, que voulons-nous prouver?<br \/>\nImaginons que l&rsquo;ann\u00e9e derni\u00e8re soit \u00e0 100%, la base des calculs. Ensuite, le prix du lait a chut\u00e9 de 50% et le pain a augment\u00e9 de 200%, une moyenne de 125%, ce qui signifie que les prix ont augment\u00e9 en g\u00e9n\u00e9ral de 25%. Essayons \u00e0 nouveau, que l&rsquo;ann\u00e9e en cours soit \u00e0 100%, ce qui signifie que les prix du lait \u00e9taient de 200% l&rsquo;ann\u00e9e derni\u00e8re et du pain de 50%. Cela signifie que les prix de l&rsquo;ann\u00e9e derni\u00e8re \u00e9taient en moyenne 25% plus \u00e9lev\u00e9s!<br \/><a href=\"https:\/\/inform.com.de\/wp-content\/uploads\/2021\/04\/post-196179-607bfa9c465a4.png\" data-rel=\"lightbox-image-bGlnaHRib3g=\" data-rl_title=\"\" data-rl_caption=\"\" title=\"\"><img decoding=\"async\" class=\"SDStudio-light-box-enable SDStudio-editor-tools-md-imp\" src=\"https:\/\/inform.com.de\/wp-content\/uploads\/2021\/04\/post-196179-607bfa9c465a4.png\" alt=\"&quot;Comment mentir avec les statistiques&quot; par Darell Huff. Comment mentir avec les statistiques\" ><\/a>  <\/p>\n<p><a href=\"https:\/\/inform.com.de\/wp-content\/uploads\/2021\/04\/post-196179-607bfa9d6e417.png\" data-rel=\"lightbox-image-bGlnaHRib3g=\" data-rl_title=\"\" data-rl_caption=\"\" title=\"\"><img decoding=\"async\" class=\"SDStudio-light-box-enable SDStudio-editor-tools-md-imp\" src=\"https:\/\/inform.com.de\/wp-content\/uploads\/2021\/04\/post-196179-607bfa9d6e417.png\" alt=\"&quot;Comment mentir avec les statistiques&quot; par Darell Huff. Comment mentir avec les statistiques\" ><\/a><\/p>\n<h2>Collectez des donn\u00e9es qui rendront vos conclusions encore plus biais\u00e9es<\/h2>\n<p>La premi\u00e8re \u00e9tape de la collecte de statistiques consiste \u00e0 d\u00e9terminer ce que vous souhaitez analyser. Les statisticiens appellent des informations \u00e0 ce stade la population. Ensuite, vous devez d\u00e9finir une sous-classe de donn\u00e9es qui, une fois analys\u00e9e, doit repr\u00e9senter la population enti\u00e8re dans son ensemble. Plus l&rsquo;\u00e9chantillon est volumineux et pr\u00e9cis, plus les r\u00e9sultats de la recherche seront pr\u00e9cis.<\/p>\n<p>Bien s\u00fbr, il existe diff\u00e9rentes mani\u00e8res de g\u00e2cher un \u00e9chantillon statistique par accident ou intentionnellement:<\/p>\n<ul>\n<li><strong>Biais de s\u00e9l\u00e9ction.<\/strong> Cette erreur survient lorsque les personnes participant \u00e0 l&rsquo;\u00e9tude s&rsquo;identifient comme un groupe qui ne repr\u00e9sente pas l&rsquo;ensemble de la population.<\/li>\n<li><strong>\u00c9chantillonnage al\u00e9atoire.<\/strong> Se produit lorsque des informations facilement disponibles sont analys\u00e9es plut\u00f4t que d&rsquo;essayer de collecter des donn\u00e9es repr\u00e9sentatives. Par exemple, une cha\u00eene d&rsquo;information peut mener une enqu\u00eate politique aupr\u00e8s de ses t\u00e9l\u00e9spectateurs. Sans demander aux gens qui regardent d&rsquo;autres cha\u00eenes (ou ne regardent pas du tout la t\u00e9l\u00e9vision), on ne peut pas dire que les r\u00e9sultats d&rsquo;une telle \u00e9tude refl\u00e9teront la r\u00e9alit\u00e9.<\/li>\n<li><strong>Refus des r\u00e9pondants de participer.<\/strong> Une telle erreur statistique se produit lorsque certaines personnes ne r\u00e9pondent pas aux questions pos\u00e9es dans une \u00e9tude statistique. Cela conduit \u00e0 un affichage incorrect des r\u00e9sultats. Par exemple, si une \u00e9tude pose la question \u00abAvez-vous d\u00e9j\u00e0 tromp\u00e9 votre conjoint?\u00bb En cons\u00e9quence, il semblera que la tricherie est rare.<\/li>\n<li><strong>Sondages en acc\u00e8s libre.<\/strong> Tout le monde peut participer \u00e0 de telles enqu\u00eates. Souvent, on ne v\u00e9rifie m\u00eame pas combien de fois la m\u00eame personne a r\u00e9pondu aux questions. Un exemple est diverses enqu\u00eates sur Internet. Il est tr\u00e8s int\u00e9ressant de les passer, mais ils ne peuvent \u00eatre consid\u00e9r\u00e9s comme objectifs.<\/li>\n<\/ul>\n<p>La beaut\u00e9 du biais de s\u00e9lection est que quelqu&rsquo;un, quelque part, est susceptible de mener une enqu\u00eate non scientifique qui soutiendra la th\u00e9orie que vous avez. Il vous suffit donc de rechercher sur le Web le sondage que vous souhaitez ou de cr\u00e9er le v\u00f4tre.<\/p>\n<h2>Choisissez des r\u00e9sultats qui soutiennent vos id\u00e9es<\/h2>\n<p>Puisque les statistiques utilisent des nombres, il nous semble qu&rsquo;elles prouvent de mani\u00e8re convaincante toute id\u00e9e. Les statistiques reposent sur des calculs math\u00e9matiques complexes qui, s&rsquo;ils sont mal g\u00e9r\u00e9s, peuvent conduire \u00e0 des r\u00e9sultats compl\u00e8tement oppos\u00e9s.<\/p>\n<p>Pour d\u00e9montrer les failles de l&rsquo;analyse des donn\u00e9es, le math\u00e9maticien anglais Francis Anscombe a cr\u00e9\u00e9 le quatuor Anscombe. Il se compose de quatre ensembles de donn\u00e9es num\u00e9riques qui semblent compl\u00e8tement diff\u00e9rents sur les graphiques.<\/p>\n<p><a href=\"https:\/\/inform.com.de\/wp-content\/uploads\/2021\/04\/post-196179-607bfa9e7aa18.png\" data-rel=\"lightbox-image-bGlnaHRib3g=\" data-rl_title=\"\" data-rl_caption=\"\" title=\"\"><img decoding=\"async\" class=\"SDStudio-light-box-enable SDStudio-editor-tools-md-imp\" src=\"https:\/\/inform.com.de\/wp-content\/uploads\/2021\/04\/post-196179-607bfa9e7aa18.png\" alt=\"&quot;Comment mentir avec les statistiques&quot; par Darell Huff. Comment mentir avec les statistiques\" ><\/a><\/p>\n<p>La figure X1 est un nuage de points standard; X2 est une courbe qui monte d&rsquo;abord puis redescend; X3 &#8211; une ligne qui monte l\u00e9g\u00e8rement vers le haut, avec un d\u00e9passement sur l&rsquo;axe Y; X4 &#8211; donn\u00e9es sur l&rsquo;axe X, \u00e0 l&rsquo;exception d&rsquo;un d\u00e9passement situ\u00e9 en hauteur sur les deux axes.<\/p>\n<p>Pour chacun des graphiques, les affirmations suivantes sont vraies:<\/p>\n<ul>\n<li>La moyenne de x pour chaque ensemble de donn\u00e9es est de 9.<\/li>\n<li>La moyenne de y pour chaque ensemble de donn\u00e9es est de 7,5.<\/li>\n<li>La variance (dispersion) de la variable x est de 11 et la variable y est de 4,12.<\/li>\n<li>La corr\u00e9lation entre les variables x et y pour chaque ensemble de donn\u00e9es est de 0,816.<\/li>\n<\/ul>\n<p>Si nous ne voyions ces donn\u00e9es que sous forme de texte, nous penserions que les situations sont compl\u00e8tement les m\u00eames, bien que les graphiques le r\u00e9futent.<\/p>\n<p>Par cons\u00e9quent, Enscombe vous a sugg\u00e9r\u00e9 de visualiser d&rsquo;abord les donn\u00e9es, puis de tirer des conclusions seulement. Bien s\u00fbr, si vous voulez induire quelqu&rsquo;un en erreur, sautez cette \u00e9tape.<\/p>\n<h2>Cr\u00e9ez des graphiques qui mettent en \u00e9vidence les r\u00e9sultats souhait\u00e9s<\/h2>\n<p>La plupart des gens n&rsquo;ont pas le temps de faire leur propre analyse statistique. Ils s&rsquo;attendent \u00e0 ce que vous leur montriez des graphiques r\u00e9sumant l&rsquo;ensemble de vos recherches. Des graphiques bien con\u00e7us doivent refl\u00e9ter des id\u00e9es qui correspondent \u00e0 la r\u00e9alit\u00e9. Mais ils peuvent \u00e9galement mettre en \u00e9vidence les donn\u00e9es que vous souhaitez afficher.<\/p>\n<p>Omettez les noms de certains param\u00e8tres, modifiez l\u00e9g\u00e8rement l&rsquo;\u00e9chelle sur l&rsquo;axe des coordonn\u00e9es, n&rsquo;expliquez pas le contexte. Ainsi, vous pouvez convaincre tout le monde que vous avez raison.<\/p>\n<h2>Par tous les moyens, cachez les sources<\/h2>\n<p>Si vous citez ouvertement vos sources, il est facile pour les gens de v\u00e9rifier vos d\u00e9couvertes. Bien s\u00fbr, si vous essayez de mettre tout le monde autour de votre doigt, ne dites jamais comment vous en \u00eates arriv\u00e9 \u00e0 vos conclusions.<\/p>\n<p>Habituellement, dans les articles et les \u00e9tudes, les sources sont toujours cit\u00e9es. Dans le m\u00eame temps, les \u0153uvres originales peuvent ne pas \u00eatre fournies dans leur int\u00e9gralit\u00e9. L&rsquo;essentiel est que la source r\u00e9ponde aux questions suivantes:<\/p>\n<ul>\n<li><strong>Comment les donn\u00e9es ont-elles \u00e9t\u00e9 collect\u00e9es?<\/strong> Les gens ont-ils \u00e9t\u00e9 interview\u00e9s par t\u00e9l\u00e9phone? Ou a-t-il \u00e9t\u00e9 arr\u00eat\u00e9 dans la rue? Ou \u00e9tait-ce un sondage Twitter? La m\u00e9thode de collecte des informations peut indiquer certaines erreurs de s\u00e9lection.<\/li>\n<li><strong>Quand se sont-ils rencontr\u00e9s?<\/strong> La recherche devient rapidement d\u00e9pass\u00e9e et les tendances changent, de sorte que le moment de la collecte des informations influence les conclusions.<\/li>\n<li><strong>Qui les a collect\u00e9s?<\/strong> Les recherches de la soci\u00e9t\u00e9 de tabac sur l&rsquo;innocuit\u00e9 du tabagisme sont peu cr\u00e9dibles.<\/li>\n<li><strong>Qui a \u00e9t\u00e9 interview\u00e9?<\/strong> Ceci est particuli\u00e8rement important pour les sondages d&rsquo;opinion publique. Si un politicien m\u00e8ne une enqu\u00eate parmi ceux qui sympathisent avec lui, les r\u00e9sultats ne refl\u00e9teront pas l&rsquo;opinion de l&rsquo;ensemble de la population.<\/li>\n<\/ul>\n<h2>Comment mentir en utilisant les statistiques &#8211; Partie 2<\/h2>\n<p>Nous continuons \u00e0 analyser comment vous pouvez induire les gens en erreur en utilisant des statistiques de mani\u00e8re incorrecte. Post pr\u00e9c\u00e9dent<\/p>\n<p><strong>S\u00e9lection moyenne<\/strong><\/p>\n<p>Vous pouvez souvent entendre le mot \u00abmoyen\u00bb dans les nouvelles et les publicit\u00e9s. Mais qu&rsquo;est-ce que c&rsquo;est m\u00e9chant? Il y a la moyenne arithm\u00e9tique, la moyenne g\u00e9om\u00e9trique, la moyenne harmonique et la liste est longue! Et un choix inappropri\u00e9 (accidentellement ou d\u00e9lib\u00e9r\u00e9ment) de la moyenne peut fausser consid\u00e9rablement les r\u00e9sultats.<\/p>\n<p>Prenons un exemple. Supposons que nous ayons trois personnes: la grand-m\u00e8re Elena Anatolyevna avec une pension de 8000, l&rsquo;administrateur syst\u00e8me Vasya avec un salaire de 40000 et le millionnaire Pavel Umnov, qui gagne exactement un million par mois.<\/p>\n<p>Si nous calculons simplement la moyenne arithm\u00e9tique en additionnant leurs salaires et en divisant par 3, nous obtenons qu&rsquo;elle est \u00e9gale \u00e0 <strong>350 mille roubles<\/strong>! Reste \u00e0 faire plaisir \u00e0 grand-m\u00e8re avec cette nouvelle<\/p>\n<p>Sur une \u00e9chelle logarithmique, ces valeurs ne semblent m\u00eame pas trop \u00e9loign\u00e9es. Ligne rouge &#8211; moyenne arithm\u00e9tique<\/p>\n<p>Pour de tels cas, une moyenne telle que la m\u00e9diane convient mieux. C&rsquo;est la valeur qui divise toutes nos donn\u00e9es en deux parties \u00e9gales (en termes de quantit\u00e9). La valeur m\u00e9diane pour cet exemple serait le salaire de l&rsquo;administrateur syst\u00e8me Vasya &#8211; 40 000. Avant et apr\u00e8s elle, il y a le m\u00eame nombre de personnes (une \u00e0 la fois). Ensuite, nous pourrions appeler Vasya une personne avec un salaire moyen, toute personne qui re\u00e7oit moins que Vasya &#8211; avec un petit revenu, plus &#8211; riche<\/p>\n<p>Cependant, \u00e0 l&rsquo;aide de la m\u00e9diane, il serait possible, au contraire, de masquer des valeurs tr\u00e8s importantes (\u00e0 la hausse ou \u00e0 la baisse)<\/p>\n<p><strong>Pliant non pliable<\/strong><\/p>\n<p>Pensez au syst\u00e8me de notation en cinq points \u00e0 l&rsquo;\u00e9cole. Imaginez qu&rsquo;un \u00e9l\u00e8ve de septi\u00e8me Danil ait \u00e9crit une dict\u00e9e pour 5, et que son camarade de classe Leonardo ait d\u00e9cid\u00e9 de l&rsquo;\u00e9crire de droite \u00e0 gauche et en ait re\u00e7u deux. Nous divisons 5 par 2 et nous obtenons que Danil a \u00e9crit la dict\u00e9e <strong>2,5 fois<\/strong> mieux! Droite?<\/p>\n<p>Tort. Les scores sont une variable nominale artificielle qui exprime num\u00e9riquement les notes verbales d&rsquo;excellence, de bonne, etc. Est-ce que \u00abinsatisfaisant\u00bb est exactement 2,5 fois pire que \u00abexcellent\u00bb?<\/p>\n<p>Ainsi, <strong>il n&rsquo;est pas<\/strong> math\u00e9matiquement <strong>significatif de<\/strong> calculer les notes moyennes pour les notes ou pour tout test<strong>.<\/strong><\/p>\n<p><strong>\u00c9chantillonnage biais\u00e9<\/strong><\/p>\n<blockquote>\n<p>Selon les donn\u00e9es de vote par Internet, 100% des personnes utilisent Internet<\/p>\n<\/blockquote>\n<p>Avant toute statistique, vous pouvez mentir si vous collectez les donn\u00e9es de mani\u00e8re incorrecte. Un exemple classique est la course pr\u00e9sidentielle am\u00e9ricaine de 1948: Dewey contre Truman. Le Chicago Tribune a men\u00e9 un sondage imm\u00e9diatement apr\u00e8s la fermeture des bureaux de vote, appelant un grand nombre de personnes. Et selon les r\u00e9sultats pr\u00e9disant un succ\u00e8s retentissant, Dewey a publi\u00e9 un journal avec le titre \u00ab<strong>DEWEY Wins Truman<\/strong> \u00bb. La photo montre un Truman en riant, vainqueur des \u00e9lections de 1948, avec ce journal m\u00eame entre ses mains<\/p>\n<p>Un probl\u00e8me est survenu? Le journal a t\u00e9l\u00e9phon\u00e9 \u00e0 un nombre suffisant d&rsquo;\u00e9lecteurs pour l&rsquo;\u00e9chantillon, et m\u00eame au hasard. Seule l&rsquo;approche elle-m\u00eame \u00e9tait erron\u00e9e &#8211; le t\u00e9l\u00e9phone \u00e0 l&rsquo;\u00e9poque n&rsquo;\u00e9tait pas disponible pour la population pauvre, dont la majeure partie \u00e9tait le soutien de Truman.<\/p>\n<p>Un autre exemple est le salaire des dipl\u00f4m\u00e9s promis par les universit\u00e9s. Aux \u00c9tats-Unis, il est m\u00eame all\u00e9 aux tribunaux &#8211; les dipl\u00f4m\u00e9s ont fait valoir que les donn\u00e9es sur les salaires \u00e9taient artificiellement \u00e9lev\u00e9es. Mais le point est compl\u00e8tement diff\u00e9rent: c&rsquo;est juste que seules les personnes qui en sont satisfaites partagent des donn\u00e9es sur leurs revenus avec l&rsquo;universit\u00e9.<\/p>\n<p><strong>Visualisation \u00ab\u00a0visuelle\u00a0\u00bb<\/strong><\/p>\n<p>Il existe mille et une fa\u00e7ons d&rsquo;enrichir les donn\u00e9es. Par exemple, visualisez-les visuellement. Cela peut aider \u00e0 lire des graphiques ennuyeux, et si cela est fait avec un peu de ruse, il est plus rentable de les pr\u00e9senter.<\/p>\n<p>Voici un graphique de la consommation de bi\u00e8re am\u00e9ricaine en millions de barils et de la part de Schlitz. Il est vraiment impressionnant!<\/p>\n<p>Mais mettons ce graphique sous une forme plus rigoureuse: affichez les donn\u00e9es avec des points et d\u00e9marrez l&rsquo;axe des y \u00e0 partir de z\u00e9ro:<\/p>\n<p>Cela ne semble plus si impressionnant. Lors du tra\u00e7age des points sur le graphique sous forme de barils, les gens ne per\u00e7oivent pas visuellement le dessus des barils, mais leur volume. Et lorsque le c\u00f4t\u00e9 du canon est agrandi de 2 fois, le volume augmente de 8 fois! Sur une telle \u00e9chelle, l&rsquo;axe des y commen\u00e7ant \u00e0 100 aide.<\/p>\n<p>Voici un autre exemple. De merveilleuses infographies qui montrent combien d&rsquo;argent est d\u00e9pens\u00e9 pour lutter contre les maladies et leurs d\u00e9c\u00e8s<\/p>\n<p>L&rsquo;id\u00e9e est g\u00e9niale. Cependant, regardez de plus pr\u00e8s les chiffres. Le prix avec un cercle orange est environ 2 fois moins \u00e9lev\u00e9 qu&rsquo;avec un rose. Mais le cercle rose est 4 fois plus grand!<\/p>\n<p>Les auteurs ont pr\u00e9f\u00e9r\u00e9 faire d\u00e9pendre le rayon du cercle du prix. Mais nous ne percevons pas du tout le rayon, mais l&rsquo;aire de la figure! Et la formule de l&rsquo;aire d&rsquo;un cercle d\u00e9pend du rayon quadratiquement<\/p>\n<p>Cette infographie peut \u00eatre encore meilleure en pla\u00e7ant les m\u00eames maladies sur la m\u00eame ligne. Voici \u00e0 quoi ressemble la version r\u00e9vis\u00e9e:<\/p>\n<p>La visualisation est non seulement plus cr\u00e9dible, mais transmet \u00e9galement clairement l&rsquo;id\u00e9e: certaines maladies ne sont pas aussi dangereuses que de l&rsquo;argent y est d\u00e9pens\u00e9, et la lutte contre d&rsquo;autres est sous-financ\u00e9e.<\/p>\n<p><strong>Un exemple de visualisation de haute qualit\u00e9<\/strong><\/p>\n<p>Le graphique montre la taille de l&rsquo;arm\u00e9e de Napol\u00e9on. Le point d&rsquo;extr\u00eame droite est Moscou, d&rsquo;o\u00f9 commence la retraite, repr\u00e9sent\u00e9e par une bande noire. Le graphique de temps et de temp\u00e9rature est \u00e9galement li\u00e9 au programme de retraite. Tr\u00e8s clair!<\/p>\n<h2>\u00c0 propos du livre \u00ab\u00a0Comment mentir en utilisant les statistiques\u00a0\u00bb de Darell Huff<\/h2>\n<p>Dans ce livre de renomm\u00e9e mondiale, Darell Huff discute des diff\u00e9rentes fa\u00e7ons dont les statistiques sont utilis\u00e9es \u00e0 mauvais escient pour tromper et manipuler le public. Chaque jour, ils essaient de vous influencer pour vous inciter \u00e0 acheter un produit \u00abn\u00e9cessaire\u00bb ou \u00e0 choisir le \u00abbon\u00bb candidat: \u00abGr\u00e2ce \u00e0 la p\u00e2te\u00ab Clean Teeth \u00bb, la formation de caries est r\u00e9duite de 23%!\u00bb; \u00abLa politique N est soutenue par 85% des citoyens\u00bb&#8230; Comment comprendre la fiabilit\u00e9 de certaines donn\u00e9es? Comment sont les calculs? Ce qui est pris en compte et ce qui reste dans les coulisses? L&rsquo;auteur r\u00e9v\u00e8le les outils secrets des statisticiens et \u00e9quipe le lecteur avec des connaissances qui aideront \u00e0 comprendre toutes les subtilit\u00e9s de cette science et ne permettront pas la confusion.<\/p>\n<h3>annotation<\/h3>\n<p>Dans ce livre de renomm\u00e9e mondiale, Darell Huff discute des diff\u00e9rentes fa\u00e7ons dont les statistiques sont utilis\u00e9es \u00e0 mauvais escient pour tromper et manipuler le public. Chaque jour, ils essaient de vous influencer pour vous inciter \u00e0 acheter un produit \u00abn\u00e9cessaire\u00bb ou \u00e0 choisir le \u00abbon\u00bb candidat: \u00abGr\u00e2ce \u00e0 la p\u00e2te\u00ab Clean Teeth \u00bb, la formation de caries est r\u00e9duite de 23%!\u00bb; \u00abLa politique N est soutenue par 85% des citoyens\u00bb&#8230; Comment comprendre la fiabilit\u00e9 de certaines donn\u00e9es? Comment se fait le calcul? Qu&rsquo;est-ce qui est pris en compte et que reste-t-il dans les coulisses? L&rsquo;auteur r\u00e9v\u00e8le les outils secrets des statisticiens et dote le lecteur de connaissances qui aideront \u00e0 comprendre toutes les subtilit\u00e9s de cette science et ne vous permettront pas de vous tromper.<\/p>\n<p>Sources utilis\u00e9es et liens utiles sur le sujet: <a href=\"https:\/\/habr.com\/ru\/post\/217545\/\" target=\"_blank\" rel=\"noopener nofollow\" class=\"external external_icon\">https:\/\/habr.com\/ru\/post\/217545\/<\/a> <a href=\"https:\/\/lifehacker.ru\/4-sposoba-lgat-pri-pomoshhi-statistiki\/\" target=\"_blank\" rel=\"noopener nofollow\" class=\"external external_icon\">https:\/\/Lifehacker.ru\/4-sposoba-lgat-pri-pomoshhi-statistiki\/<\/a> <a href=\"https:\/\/pikabu.ru\/story\/kak_lgat_s_pomoshchyu_statistiki__chast_2_6113007\" target=\"_blank\" rel=\"noopener nofollow\" class=\"external external_icon\">https:\/\/pikabu.ru \/ story \/ kak<em>lgat_s_pomoshchyu_statistiki<\/em>_chast_2_6113007<\/a> <a href=\"https:\/\/lifeinbooks.net\/chto-pochitat\/kak-lgat-pri-pomoshhi-statistiki-darell-haff\/\" target=\"_blank\" rel=\"noopener nofollow\" class=\"external external_icon\">https:\/\/lifeinbooks.net\/chto-pochitat\/kak-lgat-pri-pomoshhi-statistiki-darell-haff\/<\/a> <a href=\"https:\/\/coollib.net\/b\/331961-kak-lgat-pri-pomoschi-statistiki\" target=\"_blank\" rel=\"noopener nofollow\" class=\"external external_icon\">https:\/\/coollib.net\/b\/331961-kat-<\/a><\/p>\n<div id=\"PostUnique_PostSource\" style=\"padding-top: 50px\">Source d&rsquo;enregistrement:  <a target=\"_blank\" rel=\"noopener nofollow\" href=\"\/\/lastici.ru\" class=\"external external_icon\">lastici.ru<\/a><\/div>\n","protected":false},"excerpt":{"rendered":"<p>En plus des types de moyennes, il existe de nombreuses fa\u00e7ons de confondre, de tromper ou simplement d&rsquo;attirer l&rsquo;acheteur avec des chiffres. Les statistiques sont un outil important pour les sp\u00e9cialistes du marketing, avec son aide, vous pouvez tirer de telles conclusions et rapports que les clients cr\u00e9eront une file d&rsquo;attente m\u00eame pour un produit m\u00e9diocre.<\/p>\n","protected":false},"author":1,"featured_media":196180,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":"","_wp_rev_ctl_limit":""},"categories":[407],"tags":[],"class_list":["post-347401","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-du-repos"],"_links":{"self":[{"href":"https:\/\/inform.com.de\/fr\/wp-json\/wp\/v2\/posts\/347401","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/inform.com.de\/fr\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/inform.com.de\/fr\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/inform.com.de\/fr\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/inform.com.de\/fr\/wp-json\/wp\/v2\/comments?post=347401"}],"version-history":[{"count":0,"href":"https:\/\/inform.com.de\/fr\/wp-json\/wp\/v2\/posts\/347401\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/inform.com.de\/fr\/wp-json\/wp\/v2\/media\/196180"}],"wp:attachment":[{"href":"https:\/\/inform.com.de\/fr\/wp-json\/wp\/v2\/media?parent=347401"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/inform.com.de\/fr\/wp-json\/wp\/v2\/categories?post=347401"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/inform.com.de\/fr\/wp-json\/wp\/v2\/tags?post=347401"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}