{"id":347298,"date":"2021-11-27T13:06:00","date_gmt":"2021-11-27T10:06:00","guid":{"rendered":"https:\/\/inform.com.de\/?p=347298"},"modified":"2021-05-07T17:36:31","modified_gmt":"2021-05-07T14:36:31","slug":"darell-huffin-kuinka-valehdella-tilastojen-kanssa-kuinka-valehdella-tilastojen-kanssa","status":"publish","type":"post","link":"https:\/\/inform.com.de\/fi\/darell-huffin-kuinka-valehdella-tilastojen-kanssa-kuinka-valehdella-tilastojen-kanssa\/","title":{"rendered":"Darell Huffin &#8221;Kuinka valehdella tilastojen kanssa&#8221;. Kuinka valehdella tilastojen kanssa"},"content":{"rendered":"<h2>N\u00e4ytteenoton puolueellisuus<\/h2>\n<p>Vuonna 1948, presidentin kilpailun aikana Yhdysvalloissa vaalien iltana Truman (demokraatit) vastaan \u200b\u200bDewey (republikaanit), Chicago Tribune julkaisi ehk\u00e4 tunnetuimman otsikkonsa <a href=\"http:\/\/www.chicagotribune.com\/news\/politics\/chi-chicagodays-deweydefeats-story,0,6484067.story\" target=\"_blank\" rel=\"noopener nofollow\" class=\"external external_icon\">DEWEY DEFEATS TRUMAN<\/a> (katso kuva). Heti \u00e4\u00e4nestyspaikkojen sulkemisen j\u00e4lkeen sanomalehti suoritti kyselyn, jossa kutsuttiin valtava m\u00e4\u00e4r\u00e4 (tarpeeksi otosta varten) \u00e4\u00e4nest\u00e4ji\u00e4, ja kaikki ilmoitti Deweyn r\u00e4ike\u00e4n voiton. Kuvassa Truman, 48. vaalien voittaja, nauraa. Mik\u00e4 meni vikaan?<\/p>\n<p>Ihmisille soitettiin sattumalta ja riitt\u00e4v\u00e4sti, mutta 48. vuonna puhelin oli vain tiettyjen tulojen omaavien ihmisten k\u00e4ytett\u00e4viss\u00e4, ja sit\u00e4 l\u00f6ydettiin harvoin pienituloisten joukosta. N\u00e4in ollen \u00e4\u00e4nestysmenetelm\u00e4 itsess\u00e4\u00e4n tuo mukanaan muutoksen \u00e4\u00e4nten jakautumiseen. Otoksessa ei otettu huomioon melko laajaa Trumanin \u00e4\u00e4nest\u00e4jien joukkoa (demokraateilla on p\u00e4\u00e4s\u00e4\u00e4nt\u00f6isesti suuri osuus \u00e4\u00e4nist\u00e4 k\u00f6yhien keskuudessa), joille puhelin puolestaan \u200b\u200bei ollut k\u00e4ytett\u00e4viss\u00e4. T\u00e4t\u00e4 valintaa kutsutaan puolueelliseksi.<\/p>\n<h2>Valitse oikea keskiarvo (hyvin valittu keskiarvo)<\/h2>\n<p>Kuvittele yritys, jossa johtaja vastaanottaa 25 tuhatta, h\u00e4nen sijaisensa 7,6 tuhatta, ylimm\u00e4n johdon &#8211; 5,5 tuhatta, keskijohdon &#8211; 3,5 tuhatta, ylimm\u00e4n johdon &#8211; 2,5 tuhatta ja tavallisten ty\u00f6ntekij\u00f6iden &#8211; 1,4 tuhatta (abstraktia puntaa) kuukaudessa.<br \/>\nJa meid\u00e4n teht\u00e4v\u00e4mme on esitt\u00e4\u00e4 tietoa yrityksest\u00e4 positiivisessa valossa. Voimme kirjoittaa, ett\u00e4 yrityksen keskipalkka on X, mutta mit\u00e4 keskim\u00e4\u00e4r\u00e4inen tarkoittaa? Harkitse mahdollisia vaihtoehtoja (katso alla oleva kaavio): Joidenkin \u00e4\u00e4rellisten joukkojen aritmeettinen keskiarvo X = {xi} on luku m, joka on yht\u00e4l\u00f6n keskiarvo (X):<br \/><a href=\"https:\/\/inform.com.de\/wp-content\/uploads\/2021\/04\/post-196179-607bfa93b5718.png\" data-rel=\"lightbox-image-bGlnaHRib3g=\" data-rl_title=\"\" data-rl_caption=\"\" title=\"\"><img decoding=\"async\" class=\"SDStudio-light-box-enable SDStudio-editor-tools-md-imp\" src=\"https:\/\/inform.com.de\/wp-content\/uploads\/2021\/04\/post-196179-607bfa93b5718.png\" alt=\"Darell Huffin &quot;Kuinka valehdella tilastojen kanssa&quot;. Kuinka valehdella tilastojen kanssa\" ><\/a>  <\/p>\n<p><a href=\"https:\/\/inform.com.de\/wp-content\/uploads\/2021\/04\/post-196179-607bfa94b140b.png\" data-rel=\"lightbox-image-bGlnaHRib3g=\" data-rl_title=\"\" data-rl_caption=\"\" title=\"\"><img decoding=\"async\" class=\"SDStudio-light-box-enable SDStudio-editor-tools-md-imp\" src=\"https:\/\/inform.com.de\/wp-content\/uploads\/2021\/04\/post-196179-607bfa94b140b.png\" alt=\"Darell Huffin &quot;Kuinka valehdella tilastojen kanssa&quot;. Kuinka valehdella tilastojen kanssa\" ><\/a><br \/>\nT\u00e4m\u00e4 on ty\u00f6ntekij\u00e4n kannalta hy\u00f6dytt\u00f6min tieto &#8211; 3 372 keskipalkkaa, mutta mik\u00e4 tekee siit\u00e4 niin korkean luvun? Johdon korkeiden palkkojen takia, mik\u00e4 luo illuusion siit\u00e4, ett\u00e4 ty\u00f6ntekij\u00e4 saa saman m\u00e4\u00e4r\u00e4n. Ty\u00f6ntekij\u00e4n kannalta t\u00e4m\u00e4 arvo ei ole erityisen informatiivinen.<br \/>\nTietysti kansantaide ei ohittanut t\u00e4t\u00e4 &#8221;keskikoon&#8221; ominaisuutta aritmeettisen keskiarvon muodossa<\/p>\n<blockquote>\n<p>Virkamiehet sy\u00f6v\u00e4t lihaa, min\u00e4 kaalia. Keskim\u00e4\u00e4rin sy\u00f6mme kaalirullia.<\/p>\n<\/blockquote>\n<p>Jonkin jakauman mediaani P (X) (X = {xi}) on sellainen arvo m, ett\u00e4 se t\u00e4ytt\u00e4\u00e4 seuraavan yht\u00e4l\u00f6n: Yksinkertaisesti sanottuna puolet ty\u00f6ntekij\u00f6ist\u00e4 saa enemm\u00e4n kuin t\u00e4m\u00e4 arvo ja puolet v\u00e4hemm\u00e4n &#8211; t\u00e4sm\u00e4lleen jakelu! N\u00e4m\u00e4 tilastotiedot ovat varsin informatiivisia yrityksen ty\u00f6ntekij\u00f6ille, koska niiden avulla voit m\u00e4\u00e4ritt\u00e4\u00e4, kuinka ty\u00f6ntekij\u00e4n palkka korreloi suurimman osan ty\u00f6ntekij\u00f6ist\u00e4. \u00c4\u00e4rellisen joukon tila X = {xi} on luku m, joka esiintyy useimmin X: ss\u00e4. T\u00e4ss\u00e4 tapauksessa muoti voi olla kaikkein informatiivisinta henkil\u00f6lle, joka aikoo aloittaa ty\u00f6skentelyn tietyss\u00e4 yrityksess\u00e4.<br \/><a href=\"https:\/\/inform.com.de\/wp-content\/uploads\/2021\/04\/post-196179-607bfa9567618.png\" data-rel=\"lightbox-image-bGlnaHRib3g=\" data-rl_title=\"\" data-rl_caption=\"\" title=\"\"><img decoding=\"async\" class=\"SDStudio-light-box-enable SDStudio-editor-tools-md-imp\" src=\"https:\/\/inform.com.de\/wp-content\/uploads\/2021\/04\/post-196179-607bfa9567618.png\" alt=\"Darell Huffin &quot;Kuinka valehdella tilastojen kanssa&quot;. Kuinka valehdella tilastojen kanssa\" ><\/a>  <\/p>\n<p>T\u00e4ten tilanteen mukaan keskiarvo voidaan ymm\u00e4rt\u00e4\u00e4 mill\u00e4 tahansa yll\u00e4 olevista arvoista (periaatteessa eik\u00e4 vain niist\u00e4). Siksi on pohjimmiltaan t\u00e4rke\u00e4\u00e4 ymm\u00e4rt\u00e4\u00e4, kuinka t\u00e4m\u00e4 keskiarvo lasketaan.<\/p>\n<h2>Ja viel\u00e4 10 ep\u00e4onnistunutta kokeilua, joista emme ole kirjoittaneet<\/h2>\n<p>Laitetaan tavallinen sanomalehti rikkihappoon ja TV Park -lehti tislattuun veteen! Tunne erilaisuus? Lehdelle ei tapahtunut mit\u00e4\u00e4n &#8211; lehti on kuin uusi! Tutkimusraporttimme Doaken hammastahna on 23% tehokkaampi kuin kilpailu, tohtori Cornishin hammastahnan ansiosta! (Joka todenn\u00e4k\u00f6isesti sis\u00e4lsi \u03b2-karoteenia ja mets\u00e4n salaisen kaavan &#8211; kirjoittajan huomautus.) Saatat olla yll\u00e4ttynyt, mutta tutkimus toteutettiin ja jopa julkaistiin tekninen raportti. Ja kokeilu osoitti, ett\u00e4 hammastahna on 23% tehokkaampi kuin kilpailu (mit\u00e4 se tarkoittaa). Mutta onko t\u00e4m\u00e4 vain koko tarina?<br \/><a href=\"https:\/\/inform.com.de\/wp-content\/uploads\/2021\/04\/post-196179-607bfa96486df.png\" data-rel=\"lightbox-image-bGlnaHRib3g=\" data-rl_title=\"\" data-rl_caption=\"\" title=\"\"><img decoding=\"async\" class=\"SDStudio-light-box-enable SDStudio-editor-tools-md-imp\" src=\"https:\/\/inform.com.de\/wp-content\/uploads\/2021\/04\/post-196179-607bfa96486df.png\" alt=\"Darell Huffin &quot;Kuinka valehdella tilastojen kanssa&quot;. Kuinka valehdella tilastojen kanssa\" ><\/a>  <\/p>\n<p>Todellisuudessa kokeilun otos oli vain tusina ihmist\u00e4 (Darrell Huffin ja jo mainitun kirjan mukaan). T\u00e4m\u00e4 on juuri n\u00e4yte, jota tarvitset saadaksesi tuloksia! Sanotaan, ett\u00e4 k\u00e4\u00e4nn\u00e4mme kolikkoa viisi kertaa. Mik\u00e4 on todenn\u00e4k\u00f6isyys, ett\u00e4 laskeudut p\u00e4\u00e4h\u00e4n kaikki viisi kertaa? (1\/2) 5 = 1\/32. Vain yksi kolmekymment\u00e4kaksi, ei voi olla vain sattumaa, ett\u00e4 kaikki viisi p\u00e4\u00e4t\u00e4 nousee yl\u00f6s, eik\u00f6 niin? Kuvitellaan nyt, ett\u00e4 toistamme t\u00e4m\u00e4n kokeen 50 kertaa. Ainakin yksi n\u00e4ist\u00e4 yrityksist\u00e4 onnistuu. Kirjoitamme siit\u00e4 raportissa, ja kaikki muut kokeet eiv\u00e4t mene mihink\u00e4\u00e4n. Siten saamme yksinomaan satunnaisia \u200b\u200btietoja, jotka sopivat t\u00e4ydellisesti teht\u00e4v\u00e4\u00e4mme.<\/p>\n<h2>Pelataan asteikolla<\/h2>\n<p>Oletetaan, ett\u00e4 huomenna sinun on n\u00e4ytett\u00e4v\u00e4 kokouksessa, ett\u00e4 olemme saaneet kilpailun kiinni, mutta numerot eiv\u00e4t l\u00e4henn\u00e4 toisiaan, mit\u00e4 meid\u00e4n pit\u00e4isi tehd\u00e4? Siirret\u00e4\u00e4n asteikkoa v\u00e4h\u00e4n! Jopa tunnettu New York Times, joka on tunnettu laadukkaasta dataty\u00f6ss\u00e4\u00e4n, on julkaissut t\u00e4llaisen t\u00e4ysin sekavan graafin (huomaa hyppy 800k: sta 1,5m: iin asteikon keskell\u00e4). (esimerkki Howard Wainerilta. American Statistician, 1984.)<br \/><a href=\"https:\/\/inform.com.de\/wp-content\/uploads\/2021\/04\/post-196179-607bfa9b190a4.png\" data-rel=\"lightbox-image-bGlnaHRib3g=\" data-rl_title=\"\" data-rl_caption=\"\" title=\"\"><img decoding=\"async\" class=\"SDStudio-light-box-enable SDStudio-editor-tools-md-imp\" src=\"https:\/\/inform.com.de\/wp-content\/uploads\/2021\/04\/post-196179-607bfa9b190a4.png\" alt=\"Darell Huffin &quot;Kuinka valehdella tilastojen kanssa&quot;. Kuinka valehdella tilastojen kanssa\" ><\/a>  <\/p>\n<h2>Valitsemme 100%<\/h2>\n<p>Kuvitelkaamme, ett\u00e4 viime vuonna maito maksoi 10 kopiota litrasta ja leip\u00e4 oli 10 kopiota leip\u00e4\u00e4 kohti. T\u00e4n\u00e4 vuonna maidon hinta on laskenut 5 kopeikkaa ja leip\u00e4 20: ll\u00e4. Huomio kysymykseen, mit\u00e4 haluamme todistaa?<br \/>\nKuvitellaan, ett\u00e4 viime vuosi on 100%, laskelmien perusta. Maidon hinta laski sitten 50% ja leip\u00e4 nousi 200%, keskim\u00e4\u00e4rin 125%, mik\u00e4 tarkoittaa, ett\u00e4 hinnat yleens\u00e4 nousivat 25%. Yritet\u00e4\u00e4n uudelleen, olkoon kuluva vuosi 100%, mik\u00e4 tarkoittaa, ett\u00e4 maidon hinnat olivat viime vuonna 200% ja leip\u00e4 50%. T\u00e4m\u00e4 tarkoittaa, ett\u00e4 viime vuonna hinnat olivat keskim\u00e4\u00e4rin 25% korkeammat!<br \/><a href=\"https:\/\/inform.com.de\/wp-content\/uploads\/2021\/04\/post-196179-607bfa9c465a4.png\" data-rel=\"lightbox-image-bGlnaHRib3g=\" data-rl_title=\"\" data-rl_caption=\"\" title=\"\"><img decoding=\"async\" class=\"SDStudio-light-box-enable SDStudio-editor-tools-md-imp\" src=\"https:\/\/inform.com.de\/wp-content\/uploads\/2021\/04\/post-196179-607bfa9c465a4.png\" alt=\"Darell Huffin &quot;Kuinka valehdella tilastojen kanssa&quot;. Kuinka valehdella tilastojen kanssa\" ><\/a>  <\/p>\n<p><a href=\"https:\/\/inform.com.de\/wp-content\/uploads\/2021\/04\/post-196179-607bfa9d6e417.png\" data-rel=\"lightbox-image-bGlnaHRib3g=\" data-rl_title=\"\" data-rl_caption=\"\" title=\"\"><img decoding=\"async\" class=\"SDStudio-light-box-enable SDStudio-editor-tools-md-imp\" src=\"https:\/\/inform.com.de\/wp-content\/uploads\/2021\/04\/post-196179-607bfa9d6e417.png\" alt=\"Darell Huffin &quot;Kuinka valehdella tilastojen kanssa&quot;. Kuinka valehdella tilastojen kanssa\" ><\/a><\/p>\n<h2>Ker\u00e4\u00e4 tietoja, jotka tekev\u00e4t johtop\u00e4\u00e4t\u00f6ksist\u00e4si entist\u00e4 puolueellisempia<\/h2>\n<p>Ensimm\u00e4inen vaihe tilastojen ker\u00e4\u00e4misess\u00e4 on m\u00e4\u00e4ritt\u00e4\u00e4, mit\u00e4 haluat analysoida. Tilastotieteilij\u00e4t kutsuvat t\u00e4ss\u00e4 vaiheessa tietoja v\u00e4est\u00f6ksi. Seuraavaksi sinun on m\u00e4\u00e4ritelt\u00e4v\u00e4 alaluokka tietoja, joiden analysoituna tulisi edustaa koko populaatiota kokonaisuutena. Mit\u00e4 suurempi ja tarkempi n\u00e4yte on, sit\u00e4 tarkemmat tutkimustulokset ovat.<\/p>\n<p>Tietysti on olemassa erilaisia \u200b\u200btapoja pilata tilastollinen otos vahingossa tai tahallaan:<\/p>\n<ul>\n<li><strong>Valintaperuste.<\/strong> T\u00e4m\u00e4 virhe tapahtuu, kun tutkimukseen osallistuvat ihmiset tunnistavat itsens\u00e4 ryhm\u00e4ksi, joka ei edusta koko v\u00e4est\u00f6\u00e4.<\/li>\n<li><strong>Satunnainen n\u00e4ytteenotto.<\/strong> Tapahtuu, kun helposti saatavilla olevaa tietoa analysoidaan eik\u00e4 yritet\u00e4 ker\u00e4t\u00e4 edustavaa tietoa. Esimerkiksi uutiskanava saattaa tehd\u00e4 poliittisen kyselyn katsojiensa keskuudessa. Kyselem\u00e4tt\u00e4 ihmisi\u00e4, jotka katsovat muita kanavia (tai eiv\u00e4t katso televisiota ollenkaan), ei voida sanoa, ett\u00e4 t\u00e4llaisen tutkimuksen tulokset kuvastavat todellisuutta.<\/li>\n<li><strong>Vastaajien kielt\u00e4ytyminen osallistumasta.<\/strong> T\u00e4llainen tilastovirhe tapahtuu, kun jotkut ihmiset eiv\u00e4t vastaa tilastollisessa tutkimuksessa esitettyihin kysymyksiin. T\u00e4m\u00e4 johtaa virheelliseen tulosten n\u00e4ytt\u00e4miseen. Esimerkiksi jos tutkimuksessa kysyt\u00e4\u00e4n: &#8221;Oletko koskaan huijannut puolisoasi?&#8221; T\u00e4m\u00e4n seurauksena n\u00e4ytt\u00e4\u00e4 silt\u00e4, \u200b\u200bett\u00e4 huijaaminen on harvinaista.<\/li>\n<li><strong>Vapaa p\u00e4\u00e4sy kyselyihin.<\/strong> Kuka tahansa voi osallistua t\u00e4llaisiin kyselyihin. Usein ei edes tarkisteta, kuinka monta kertaa sama henkil\u00f6 vastasi kysymyksiin. Esimerkkin\u00e4 ovat erilaiset Internet-kyselyt. On eritt\u00e4in mielenkiintoista ohittaa ne, mutta niit\u00e4 ei voida pit\u00e4\u00e4 objektiivisina.<\/li>\n<\/ul>\n<p>Valintapoikkeaman kauneus on, ett\u00e4 joku, jostain, todenn\u00e4k\u00f6isesti suorittaa ep\u00e4tieteellisen tutkimuksen, joka tukee mit\u00e4 tahansa teoriaasi. Joten etsi vain verkosta haluamasi kysely tai luo oma.<\/p>\n<h2>Valitse ideasi tukevat tulokset<\/h2>\n<p>Koska tilastoissa k\u00e4ytet\u00e4\u00e4n lukuja, n\u00e4ytt\u00e4\u00e4 silt\u00e4, \u200b\u200bett\u00e4 ne todistavat vakuuttavasti mink\u00e4 tahansa idean. Tilastot perustuvat monimutkaisiin matemaattisiin laskelmiin, jotka v\u00e4\u00e4rin k\u00e4siteltyin\u00e4 voivat johtaa t\u00e4ysin vastakkaisiin tuloksiin.<\/p>\n<p>Tietojen analysoinnin puutteiden osoittamiseksi englantilainen matemaatikko Francis Anscombe loi Anscombe-kvartetin. Se koostuu nelj\u00e4st\u00e4 numeerisesta tiedosta, jotka n\u00e4ytt\u00e4v\u00e4t t\u00e4ysin erilaisilta kaavioilta.<\/p>\n<p><a href=\"https:\/\/inform.com.de\/wp-content\/uploads\/2021\/04\/post-196179-607bfa9e7aa18.png\" data-rel=\"lightbox-image-bGlnaHRib3g=\" data-rl_title=\"\" data-rl_caption=\"\" title=\"\"><img decoding=\"async\" class=\"SDStudio-light-box-enable SDStudio-editor-tools-md-imp\" src=\"https:\/\/inform.com.de\/wp-content\/uploads\/2021\/04\/post-196179-607bfa9e7aa18.png\" alt=\"Darell Huffin &quot;Kuinka valehdella tilastojen kanssa&quot;. Kuinka valehdella tilastojen kanssa\" ><\/a><\/p>\n<p>Kuvio X1 on tavallinen sirontakaavio; X2 on k\u00e4yr\u00e4, joka ensin nousee yl\u00f6s ja putoaa sitten alas; X3 &#8211; viiva, joka nousee hieman yl\u00f6sp\u00e4in, yhden ylityksen Y-akselilla; X4 &#8211; X-akselin tiedot, lukuun ottamatta yht\u00e4 ylityst\u00e4, joka sijaitsee korkealla molemmilla akseleilla.<\/p>\n<p>Seuraavat lauseet ovat totta jokaisen kaavion kohdalla:<\/p>\n<ul>\n<li>Kunkin tietojoukon x: n keskiarvo on 9.<\/li>\n<li>Kunkin tietojoukon y: n keskiarvo on 7,5.<\/li>\n<li>X-muuttujan varianssi (hajonta) on 11 ja y-muuttuja on 4,12.<\/li>\n<li>Kunkin tietojoukon muuttujien x ja y v\u00e4linen korrelaatio on 0,816.<\/li>\n<\/ul>\n<p>Jos n\u00e4emme n\u00e4m\u00e4 tiedot vain tekstimuodossa, luulemme, ett\u00e4 tilanteet ovat t\u00e4ysin samat, vaikka kaaviot kumoavat t\u00e4m\u00e4n.<\/p>\n<p>Siksi Enscombe ehdotti, ett\u00e4 visualisoit ensin tiedot ja vasta sitten teet johtop\u00e4\u00e4t\u00f6kset. Tietenkin, jos haluat johtaa jotakuta harhaan, ohita t\u00e4m\u00e4 vaihe.<\/p>\n<h2>Luo kaaviot, jotka korostavat haluamasi tulokset<\/h2>\n<p>Useimmilla ihmisill\u00e4 ei ole aikaa tehd\u00e4 omaa tilastollista analyysi\u00e4\u00e4n. He odottavat sinun n\u00e4ytt\u00e4v\u00e4n heille kaavioita, joissa on yhteenveto kaikesta tutkimuksestasi. Hyvin suunniteltujen kaavioiden tulisi heijastaa todellisuuteen sopivia ideoita. Mutta he voivat my\u00f6s korostaa tietoja, jotka haluat n\u00e4ytt\u00e4\u00e4.<\/p>\n<p>J\u00e4t\u00e4 pois joidenkin parametrien nimet, muuta koordinaattiakselin asteikkoa hieman, \u00e4l\u00e4 selit\u00e4 kontekstia. Joten voit vakuuttaa kaikki, ett\u00e4 olet oikeassa.<\/p>\n<h2>Piilota l\u00e4hteet kaikin keinoin<\/h2>\n<p>Jos mainitset avoimesti l\u00e4hteesi, ihmisten on helppo tarkistaa havainnot. Tietenkin, jos yrit\u00e4t saada kaikki sormesi ymp\u00e4rille, \u00e4l\u00e4 koskaan kerro, kuinka p\u00e4\u00e4dyit johtop\u00e4\u00e4t\u00f6ksiisi.<\/p>\n<p>Yleens\u00e4 artikkeleissa ja tutkimuksissa viitataan aina l\u00e4hteisiin. Samanaikaisesti alkuper\u00e4isi\u00e4 teoksia ei v\u00e4ltt\u00e4m\u00e4tt\u00e4 toimiteta kokonaisuudessaan. T\u00e4rkeint\u00e4 on, ett\u00e4 l\u00e4hde vastaa seuraaviin kysymyksiin:<\/p>\n<ul>\n<li><strong>Kuinka tiedot ker\u00e4ttiin?<\/strong> Haastateltiinko ihmisi\u00e4 puhelimitse? Vai pys\u00e4ytettiink\u00f6 se kadulla? Vai oliko se Twitter-kysely? Tietojen ker\u00e4\u00e4mismenetelm\u00e4 voi osoittaa tiettyj\u00e4 valintavirheit\u00e4.<\/li>\n<li><strong>Milloin he tapasivat?<\/strong> Tutkimus vanhenee nopeasti ja suuntaukset muuttuvat, joten tiedonkeruun ajoitus vaikuttaa johtop\u00e4\u00e4t\u00f6ksiin.<\/li>\n<li><strong>Kuka ne ker\u00e4si?<\/strong> Tupakointiyrityksen tupakoinnin turvallisuutta koskevassa tutkimuksessa on vain v\u00e4h\u00e4n uskottavuutta.<\/li>\n<li><strong>Ket\u00e4 haastateltiin?<\/strong> T\u00e4m\u00e4 on erityisen t\u00e4rke\u00e4\u00e4 yleisen mielipidekyselyn kannalta. Jos poliitikko tekee kyselyn h\u00e4nen kanssaan sympatisoivien joukossa, tulokset eiv\u00e4t heijasta koko v\u00e4est\u00f6n mielipidett\u00e4.<\/li>\n<\/ul>\n<h2>Kuinka valehdella tilastojen avulla &#8211; osa 2<\/h2>\n<p>Analysoimme edelleen, kuinka voit johtaa ihmisi\u00e4 harhaan k\u00e4ytt\u00e4m\u00e4ll\u00e4 v\u00e4\u00e4rin tilastoja. Edellinen viesti<\/p>\n<p><strong>Keskitasoinen valinta<\/strong><\/p>\n<p>Voit usein kuulla sanan &#8221;keskiarvo&#8221; uutisissa ja mainoksissa. Mutta mit\u00e4 tarkoittaa? On aritmeettinen keskiarvo, geometrinen keskiarvo, harmoninen keskiarvo ja luettelo jatkuu! Ep\u00e4asianmukainen (vahingossa tai tarkoituksella) keskiarvon valinta voi v\u00e4\u00e4rist\u00e4\u00e4 tuloksia merkitt\u00e4v\u00e4sti.<\/p>\n<p>Tarkastellaan esimerkki\u00e4. Oletetaan, ett\u00e4 meill\u00e4 on kolme ihmist\u00e4: iso\u00e4iti Elena Anatolyevna 8000 el\u00e4kkeell\u00e4, j\u00e4rjestelm\u00e4nvalvoja Vasya 40 000 palkalla ja miljon\u00e4\u00e4ri Pavel Umnov, joka ansaitsee tasan miljoonan kuukaudessa<\/p>\n<p>Jos laskemme yksinkertaisesti aritmeettisen keskiarvon lis\u00e4\u00e4m\u00e4ll\u00e4 heid\u00e4n palkkansa ja jakamalla 3: lla, saamme, ett\u00e4 se on <strong>350 tuhatta ruplaa<\/strong>! J\u00e4\u00e4 viel\u00e4 miellytt\u00e4\u00e4 iso\u00e4iti\u00e4 t\u00e4m\u00e4n uutisen kanssa<\/p>\n<p>Logaritmisella asteikolla n\u00e4m\u00e4 arvot eiv\u00e4t edes n\u00e4yt\u00e4 liian kaukana toisistaan. Punainen viiva &#8211; aritmeettinen keskiarvo<\/p>\n<p>T\u00e4llaisissa tapauksissa mediaanin kaltainen keskiarvo sopii paremmin. T\u00e4m\u00e4 on arvo, joka jakaa kaikki tietomme kahteen yht\u00e4 suureen osaan (m\u00e4\u00e4r\u00e4n mukaan). T\u00e4m\u00e4n esimerkin mediaaniarvo olisi j\u00e4rjestelm\u00e4nvalvojan Vasyan palkka &#8211; 40 000. Ennen h\u00e4nt\u00e4 ja sen j\u00e4lkeen on sama m\u00e4\u00e4r\u00e4 ihmisi\u00e4 (yksi kerrallaan). Sitten voisimme kutsua Vasya henkil\u00f6ksi, jolla on keskipalkka, jokainen, joka saa v\u00e4hemm\u00e4n kuin Vasya &#8211; pienill\u00e4 tuloilla, enemm\u00e4n &#8211; rikkaille.<\/p>\n<p>Mediaanin avulla olisi kuitenkin p\u00e4invastoin mahdollista piilottaa hyvin n\u00e4kyv\u00e4t (yl\u00f6s tai alas) arvot<\/p>\n<p><strong>Taittamaton taittamaton<\/strong><\/p>\n<p>Ajattele viiden pisteen luokitusj\u00e4rjestelm\u00e4\u00e4 koulussa. Kuvittele, ett\u00e4 seitsem\u00e4nnen luokan oppilas Danil kirjoitti sanelun viidelle, ja h\u00e4nen luokkatoverinsa Leonardo p\u00e4\u00e4tti kirjoittaa sen oikealta vasemmalle ja sai kaksi. Jaamme 5 kahdella ja saamme, ett\u00e4 Danil kirjoitti sanelun <strong>2,5 kertaa<\/strong> paremmin! Eik\u00f6?<\/p>\n<p>V\u00e4\u00e4r\u00e4. Pisteet ovat keksitty nimellinen muuttuja, joka ilmaisee numeerisesti sanallisia arvosanoja erinomaiset, hyv\u00e4t ja niin edelleen. Onko &#8221;ep\u00e4tyydytt\u00e4v\u00e4&#8221; t\u00e4sm\u00e4lleen 2,5 kertaa huonompi kuin &#8221;erinomainen&#8221;?<\/p>\n<p>Siksi <strong>ei ole<\/strong> matemaattisesti <strong>merkityksellist\u00e4<\/strong> laskea arvosanojen tai mink\u00e4\u00e4n testin keskim\u00e4\u00e4r\u00e4isi\u00e4 pisteit\u00e4<strong>.<\/strong><\/p>\n<p><strong>Puolueellinen n\u00e4ytteenotto<\/strong><\/p>\n<blockquote>\n<p>Internet-\u00e4\u00e4nestystietojen mukaan 100% ihmisist\u00e4 k\u00e4ytt\u00e4\u00e4 Interneti\u00e4<\/p>\n<\/blockquote>\n<p>Voit valehdella ennen tilastoja, jos ker\u00e4\u00e4t tietoja v\u00e4\u00e4rin. Klassinen esimerkki on Yhdysvaltain vuoden 1948 presidenttikisa: Dewey vs. Truman. Chicago Tribune suoritti kyselyn heti \u00e4\u00e4nestyspaikkojen sulkemisen j\u00e4lkeen ja kutsui valtavan m\u00e4\u00e4r\u00e4n ihmisi\u00e4. Tulosten mukaan ennustamalla mahtavaa menestyst\u00e4 Dewey julkaisi sanomalehden otsikolla &#8221; <strong>DEWEY voittaa Trumanin<\/strong> &#8221;. Kuvassa n\u00e4kyy naurava Truman, vuoden 1948 vaalien voittaja, juuri t\u00e4m\u00e4n sanomalehden k\u00e4dess\u00e4<\/p>\n<p>Jotain meni pieleen? Sanomalehti soitti otokseen riitt\u00e4v\u00e4n m\u00e4\u00e4r\u00e4n \u00e4\u00e4nest\u00e4ji\u00e4 ja todellakin satunnaisia. Ainoastaan \u200b\u200bl\u00e4hestymistapa itsess\u00e4\u00e4n oli v\u00e4\u00e4r\u00e4 &#8211; k\u00f6yh\u00e4n v\u00e4est\u00f6n k\u00e4ytett\u00e4viss\u00e4 ei ollut tuolloin puhelinta, josta suurin osa oli Trumanin tukea.<\/p>\n<p>Toinen esimerkki on yliopistojen lupaamat valmistuneiden palkat. Yhdysvalloissa se meni jopa tuomioistuimiin &#8211; tutkinnon suorittaneet v\u00e4ittiv\u00e4t, ett\u00e4 palkkatiedot olivat keinotekoisesti paisutettuja. Mutta asia on t\u00e4ysin erilainen: vain ihmiset, jotka ovat tyytyv\u00e4isi\u00e4 heihin, jakavat tietoja tuloistaan \u200b\u200byliopiston kanssa.<\/p>\n<p><strong>&#8221;Visuaalinen&#8221; visualisointi<\/strong><\/p>\n<p>On tuhat yht\u00e4 tapaa kaunistaa tietoja. Esimerkiksi visualisoi ne visuaalisesti. Se voi auttaa lukemaan tylsi\u00e4 kaavioita, ja jos se tehd\u00e4\u00e4n v\u00e4h\u00e4n temppuilla, on kannattavampaa esitt\u00e4\u00e4 ne.<\/p>\n<p>T\u00e4ss\u00e4 on kaavio Yhdysvaltojen oluen kulutuksesta miljoona tynnyri\u00e4 ja Schlitzin osuus. H\u00e4n on todella vaikuttava!<\/p>\n<p>Mutta laitetaan t\u00e4m\u00e4 kaavio tiukempaan muotoon: n\u00e4yt\u00e4 tiedot pisteill\u00e4 ja aloita y-akseli nollasta:<\/p>\n<p>Ei tunnu en\u00e4\u00e4 niin vaikuttavalta. Piirrett\u00e4ess\u00e4 kuvaajan pisteit\u00e4 tynnyrein\u00e4, ihmiset eiv\u00e4t visuaalisesti havaitse tynnyrien yl\u00e4osaa, vaan niiden m\u00e4\u00e4r\u00e4\u00e4. Ja kun tynnyrin sivua suurennetaan 2 kertaa, \u00e4\u00e4nenvoimakkuus kasvaa 8 kertaa! T\u00e4llaisessa mittakaavassa y-akseli, joka alkaa arvosta 100, auttaa.<\/p>\n<p>T\u00e4ss\u00e4 on toinen esimerkki. Upeat infografiikat, jotka osoittavat, kuinka paljon rahaa k\u00e4ytet\u00e4\u00e4n tautien ja niist\u00e4 johtuvien kuolemien torjuntaan<\/p>\n<p>Idea on hieno. Katsokaa kuitenkin tarkemmin numeroita. Hinta oranssilla ympyr\u00e4ll\u00e4 on noin 2 kertaa pienempi kuin vaaleanpunaisella. Mutta vaaleanpunainen ympyr\u00e4 on 4 kertaa suurempi!<\/p>\n<p>Kirjoittajat halusivat tehd\u00e4 ympyr\u00e4n s\u00e4teen hinnasta riippuvaisen. Mutta visuaalisesti ei havaita lainkaan s\u00e4dett\u00e4, vaan kuvan pinta-alaa! Ja ympyr\u00e4n pinta-alan kaava riippuu s\u00e4teest\u00e4 neli\u00f6llisesti<\/p>\n<p>T\u00e4t\u00e4 infografiaa voidaan tehd\u00e4 viel\u00e4kin paremmaksi sijoittamalla samat sairaudet samalle riville. Tarkistettu versio n\u00e4ytt\u00e4\u00e4 t\u00e4lt\u00e4:<\/p>\n<p>Visualisointi ei ole pelk\u00e4st\u00e4\u00e4n uskottavampaa, vaan se my\u00f6s selke\u00e4sti v\u00e4litt\u00e4\u00e4 ajatuksen: jotkut sairaudet eiv\u00e4t ole niin vaarallisia kuin niihin k\u00e4ytet\u00e4\u00e4n rahaa, ja taistelu toisia vastaan \u200b\u200bon alirahoitettua.<\/p>\n<p><strong>Esimerkki korkealaatuisesta visualisoinnista<\/strong><\/p>\n<p>Kaavio n\u00e4ytt\u00e4\u00e4 Napoleonin armeijan koon. \u00c4\u00e4rimm\u00e4inen oikea kohta on Moskova, josta vet\u00e4ytyminen alkaa, mustalla raidalla. Aika- ja l\u00e4mp\u00f6tilakaavio on my\u00f6s linkitetty vet\u00e4ytymisohjelmaan. Eritt\u00e4in selke\u00e4!<\/p>\n<h2>Tietoja Darell Huffin kirjasta &#8221;Kuinka valehdella tilastojen avulla&#8221;<\/h2>\n<p>T\u00e4ss\u00e4 maailmankuulussa kirjassa Darell Huff k\u00e4sittelee erilaisia \u200b\u200btapoja, joilla tilastoja k\u00e4ytet\u00e4\u00e4n v\u00e4\u00e4rin yleis\u00f6n pett\u00e4miseen ja manipulointiin. Joka p\u00e4iv\u00e4 he yritt\u00e4v\u00e4t vaikuttaa sinuun kannustaakseen sinua ostamaan jonkin &#8221;tarpeellisen&#8221; tuotteen tai valitsemaan &#8221;oikean&#8221; ehdokkaan: &#8221;&#8221; Clean Teeth &#8221;-pastan ansiosta karieksen muodostuminen v\u00e4henee 23%!&#8221;; &#8221;85% kansalaisista tukee N-politiikkaa&#8221; &#8230; Kuinka ymm\u00e4rt\u00e4\u00e4 kuinka luotettavat tietyt tiedot ovat? Kuinka laskelmat ovat? Mik\u00e4 otetaan huomioon ja mik\u00e4 on kulissien takana? Kirjoittaja paljastaa tilastojen salaiset ty\u00f6kalut ja varustaa lukijalle tietoa, joka auttaa ymm\u00e4rt\u00e4m\u00e4\u00e4n t\u00e4m\u00e4n tieteen kaikki monimutkaisuudet eik\u00e4 salli sekaannusta.<\/p>\n<h3>merkint\u00e4<\/h3>\n<p>T\u00e4ss\u00e4 maailmankuulussa kirjassa Darell Huff k\u00e4sittelee erilaisia \u200b\u200btapoja, joilla tilastoja k\u00e4ytet\u00e4\u00e4n v\u00e4\u00e4rin yleis\u00f6n pett\u00e4miseen ja manipulointiin. Joka p\u00e4iv\u00e4 he yritt\u00e4v\u00e4t vaikuttaa sinuun kannustaakseen sinua ostamaan jonkin &#8221;v\u00e4ltt\u00e4m\u00e4tt\u00f6m\u00e4n&#8221; tuotteen tai valitsemaan &#8221;oikean&#8221; ehdokkaan: &#8221;&#8221; Clean Teeth &#8221;-pastan ansiosta karieksen muodostuminen v\u00e4henee 23%!&#8221;; &#8221;85% kansalaisista tukee N-politiikkaa&#8221; &#8230; Kuinka ymm\u00e4rt\u00e4\u00e4 kuinka luotettava t\u00e4m\u00e4 tai toinen data on? Kuinka laskenta tehd\u00e4\u00e4n? Mit\u00e4 otetaan huomioon ja mik\u00e4 j\u00e4\u00e4 kulissien taakse? Kirjoittaja paljastaa tilastotieteilij\u00f6iden salaiset ty\u00f6kalut ja antaa lukijalle tietoa, joka auttaa ymm\u00e4rt\u00e4m\u00e4\u00e4n t\u00e4m\u00e4n tieteen kaikki monimutkaisuudet eik\u00e4 anna sinun johtaa harhaan.<\/p>\n<p>K\u00e4ytetyt l\u00e4hteet ja hy\u00f6dyllisi\u00e4 linkkej\u00e4 aiheesta: <a href=\"https:\/\/habr.com\/ru\/post\/217545\/\" target=\"_blank\" rel=\"noopener nofollow\" class=\"external external_icon\">https:\/\/habr.com\/ru\/post\/217545\/<\/a> <a href=\"https:\/\/lifehacker.ru\/4-sposoba-lgat-pri-pomoshhi-statistiki\/\" target=\"_blank\" rel=\"noopener nofollow\" class=\"external external_icon\">https:\/\/Lifehacker.ru\/4-sposoba-lgat-pri-pomoshhi-statistiki\/<\/a> <a href=\"https:\/\/pikabu.ru\/story\/kak_lgat_s_pomoshchyu_statistiki__chast_2_6113007\" target=\"_blank\" rel=\"noopener nofollow\" class=\"external external_icon\">https:\/\/pikabu.ru \/ story \/ kak<em>lgat_s_pomoshchyu_statistiki<\/em>_chast_2_6113007<\/a> <a href=\"https:\/\/lifeinbooks.net\/chto-pochitat\/kak-lgat-pri-pomoshhi-statistiki-darell-haff\/\" target=\"_blank\" rel=\"noopener nofollow\" class=\"external external_icon\">https:\/\/lifeinbooks.net\/chto-pochitat\/kak-lgat-pri-pomoshhi-statistiki-darell-haff\/<\/a> <a href=\"https:\/\/coollib.net\/b\/331961-kak-lgat-pri-pomoschi-statistiki\" target=\"_blank\" rel=\"noopener nofollow\" class=\"external external_icon\">https:\/\/coollib.net\/b\/331961-kat-plgat-<\/a><\/p>\n<div id=\"PostUnique_PostSource\" style=\"padding-top: 50px\">:  <a target=\"_blank\" rel=\"noopener nofollow\" href=\"\/\/lastici.ru\" class=\"external external_icon\">lastici.ru<\/a><\/div>\n","protected":false},"excerpt":{"rendered":"<p>Keskiarvotyyppien lis\u00e4ksi on olemassa monia tapoja sekoittaa, pett\u00e4\u00e4 tai yksinkertaisesti houkutella ostaja numeroilla. Tilastot ovat t\u00e4rke\u00e4 ty\u00f6kalu markkinoijille, joiden avulla voit tehd\u00e4 sellaisia \u200b\u200bjohtop\u00e4\u00e4t\u00f6ksi\u00e4 ja raportteja, ett\u00e4 asiakkaat luovat jonon jopa surkealle tuotteelle.<\/p>\n","protected":false},"author":1,"featured_media":196180,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":"","_wp_rev_ctl_limit":""},"categories":[408],"tags":[],"class_list":["post-347298","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-levata"],"_links":{"self":[{"href":"https:\/\/inform.com.de\/fi\/wp-json\/wp\/v2\/posts\/347298","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/inform.com.de\/fi\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/inform.com.de\/fi\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/inform.com.de\/fi\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/inform.com.de\/fi\/wp-json\/wp\/v2\/comments?post=347298"}],"version-history":[{"count":0,"href":"https:\/\/inform.com.de\/fi\/wp-json\/wp\/v2\/posts\/347298\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/inform.com.de\/fi\/wp-json\/wp\/v2\/media\/196180"}],"wp:attachment":[{"href":"https:\/\/inform.com.de\/fi\/wp-json\/wp\/v2\/media?parent=347298"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/inform.com.de\/fi\/wp-json\/wp\/v2\/categories?post=347298"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/inform.com.de\/fi\/wp-json\/wp\/v2\/tags?post=347298"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}