{"id":340981,"date":"2021-06-28T15:19:00","date_gmt":"2021-06-28T12:19:00","guid":{"rendered":"https:\/\/inform.com.de\/?p=340981"},"modified":"2021-06-26T18:06:43","modified_gmt":"2021-06-26T15:06:43","slug":"quest-ce-que-big-date-reponse-simple-pour-tout-le-monde-big-data-grande-responsabilite-gros-stress-et-argent","status":"publish","type":"post","link":"https:\/\/inform.com.de\/fr\/quest-ce-que-big-date-reponse-simple-pour-tout-le-monde-big-data-grande-responsabilite-gros-stress-et-argent\/","title":{"rendered":"Qu&rsquo;est-ce que Big Date? R\u00e9ponse simple pour tout le monde. Big Data &#8211; grande responsabilit\u00e9, gros stress et argent"},"content":{"rendered":"<h2>Une excursion dans l&rsquo;histoire et les statistiques<\/h2>\n<p>L&rsquo;expression \u00abbig data\u00bb est apparue en 2008 avec la main l\u00e9g\u00e8re de Clifford Lynch. Dans un num\u00e9ro sp\u00e9cial de la revue Nature, l&rsquo;expert a appel\u00e9 la croissance explosive des flux d&rsquo;informations &#8211; le big data. Dans ce document, il a pris toutes les baies de donn\u00e9es h\u00e9t\u00e9rog\u00e8nes de plus de 150 Go par jour.<\/p>\n<p>D&rsquo;apr\u00e8s les calculs statistiques des agences d&rsquo;analyse en 2005, le monde fonctionnait avec 4 \u00e0 5 exaoctets d&rsquo;informations (4 \u00e0 5 milliards de gigaoctets), apr\u00e8s 5 ans, le volume de m\u00e9gadonn\u00e9es est pass\u00e9 \u00e0 0,19 zettaoctets (1 ZB = 1024 EB). En 2012, les chiffres sont pass\u00e9s \u00e0 1,8 ZB et en 2015 \u00e0 7 ZB. Les experts pr\u00e9voient que d&rsquo;ici 2020, les syst\u00e8mes de Big Data exploiteront entre 42 et 45 zettaoctets d&rsquo;informations.<\/p>\n<p>Jusqu&rsquo;en 2011, les technologies du big data n&rsquo;\u00e9taient consid\u00e9r\u00e9es que comme une analyse scientifique et n&rsquo;avaient pas de solution pratique. Cependant, la quantit\u00e9 de donn\u00e9es a augment\u00e9 de fa\u00e7on exponentielle et le probl\u00e8me des \u00e9normes quantit\u00e9s d&rsquo;informations non structur\u00e9es et h\u00e9t\u00e9rog\u00e8nes est devenu pertinent au d\u00e9but de 2012. La mont\u00e9e en fl\u00e8che de l&rsquo;int\u00e9r\u00eat pour le Big Data est clairement visible dans Google Trends.<\/p>\n<p>Les mastodontes du commerce num\u00e9rique &#8211; Microsoft, IBM, Oracle, EMC et autres &#8211; ont rejoint le d\u00e9veloppement de la nouvelle direction. Depuis 2014, le big data est \u00e9tudi\u00e9 dans les universit\u00e9s, mis en \u0153uvre dans les sciences appliqu\u00e9es &#8211; ing\u00e9nierie, physique, sociologie.<\/p>\n<h2>Qu&rsquo;est-ce que le Big Data?<\/h2>\n<p>Le Big Data est une technologie de traitement de l&rsquo;information qui d\u00e9passe des centaines de t\u00e9raoctets et qui cro\u00eet de fa\u00e7on exponentielle au fil du temps.<\/p>\n<p>Ces donn\u00e9es sont si volumineuses et complexes qu&rsquo;aucun des outils de gestion de donn\u00e9es traditionnels ne peut les stocker ou les traiter efficacement. Une personne n&rsquo;est pas en mesure d&rsquo;analyser ce volume. Pour cela, des algorithmes sp\u00e9ciaux ont \u00e9t\u00e9 d\u00e9velopp\u00e9s, qui, apr\u00e8s analyse du big data, donnent \u00e0 une personne des r\u00e9sultats compr\u00e9hensibles.<\/p>\n<p>Le Big Data comprend des p\u00e9taoctets (1024 t\u00e9raoctets) ou des exaoctets (1024 p\u00e9taoctets) d&rsquo;informations qui repr\u00e9sentent des milliards ou des billions d&rsquo;enregistrements par des millions de personnes, toutes issues de sources diff\u00e9rentes (Internet, ventes, centre de contact, m\u00e9dias sociaux, appareils mobiles). En r\u00e8gle g\u00e9n\u00e9rale, les informations sont mal structur\u00e9es et souvent incompl\u00e8tes et indisponibles.<\/p>\n<h2>Ce que les entreprises font du Big Data<\/h2>\n<p>Les op\u00e9rateurs cellulaires et les moteurs de recherche ont \u00e9t\u00e9 les premiers \u00e0 travailler avec le big data, ou avec le \u00abbig data\u00bb. Les moteurs de recherche recevaient de plus en plus de requ\u00eates et le texte \u00e9tait plus lourd que les chiffres. Un paragraphe de texte prend plus de temps \u00e0 travailler qu&rsquo;une transaction financi\u00e8re. L&rsquo;utilisateur attend que le moteur de recherche traite la demande en une fraction de seconde &#8211; il est inacceptable que cela fonctionne m\u00eame pendant une demi-minute. Par cons\u00e9quent, les moteurs de recherche ont \u00e9t\u00e9 les premiers \u00e0 commencer \u00e0 travailler avec la parall\u00e9lisation lorsqu&rsquo;ils travaillent avec des donn\u00e9es.<\/p>\n<p>Un peu plus tard, diverses organisations financi\u00e8res et d\u00e9taillants se sont joints \u00e0 eux. Leurs transactions elles-m\u00eames ne sont pas si importantes, mais le Big Data appara\u00eet en raison du fait qu&rsquo;il y a beaucoup de transactions.<\/p>\n<p>La quantit\u00e9 de donn\u00e9es augmente en g\u00e9n\u00e9ral pour tout le monde. Par exemple, les banques disposaient de beaucoup de donn\u00e9es auparavant, mais elles n&rsquo;exigeaient pas toujours des principes de fonctionnement, comme pour les grands. Ensuite, les banques ont commenc\u00e9 \u00e0 travailler davantage avec les donn\u00e9es clients. Ils ont commenc\u00e9 \u00e0 proposer des d\u00e9p\u00f4ts plus flexibles, des pr\u00eats, des tarifs diff\u00e9rents et ont commenc\u00e9 \u00e0 analyser les transactions de plus pr\u00e8s. Cela exigeait d\u00e9j\u00e0 des m\u00e9thodes de travail rapides.<\/p>\n<p>D\u00e9sormais, les banques souhaitent analyser non seulement les informations internes, mais \u00e9galement les informations de tiers. Ils veulent recevoir des donn\u00e9es volumineuses du m\u00eame commerce de d\u00e9tail, ils veulent savoir \u00e0 quoi une personne d\u00e9pense de l&rsquo;argent. Sur la base de ces informations, ils essaient de faire des offres commerciales.<\/p>\n<p>D\u00e9sormais, toutes les informations sont li\u00e9es entre elles. Le commerce de d\u00e9tail, les banques, les op\u00e9rateurs t\u00e9l\u00e9coms et m\u00eame les moteurs de recherche s&rsquo;int\u00e9ressent d\u00e9sormais aux donn\u00e9es de chacun.<\/p>\n<h2>Que devrait \u00eatre un sp\u00e9cialiste du Big Data<\/h2>\n<p>Les donn\u00e9es \u00e9tant situ\u00e9es sur un cluster de serveurs, une infrastructure plus complexe est utilis\u00e9e pour les traiter. Cela met beaucoup de stress sur la personne qui travaille avec &#8211; le syst\u00e8me doit \u00eatre tr\u00e8s fiable.<\/p>\n<p>Rendre un serveur unique fiable est facile. Mais lorsqu&rsquo;il y en a plusieurs, la probabilit\u00e9 d&rsquo;une chute augmente proportionnellement au nombre, et la responsabilit\u00e9 de l&rsquo;ing\u00e9nieur de donn\u00e9es qui travaille avec ces donn\u00e9es augmente \u00e9galement.<\/p>\n<p>Un analyste big data doit comprendre qu&rsquo;il peut toujours recevoir des donn\u00e9es incompl\u00e8tes voire incorrectes. Il a \u00e9crit le programme, a fait confiance \u00e0 ses r\u00e9sultats, puis a d\u00e9couvert qu&rsquo;en raison de la chute d&rsquo;un serveur sur mille, une partie des donn\u00e9es avait \u00e9t\u00e9 d\u00e9sactiv\u00e9e et toutes les conclusions \u00e9taient incorrectes.<\/p>\n<p>Prenez la recherche de texte, par exemple. Disons que tous les mots sont class\u00e9s par ordre alphab\u00e9tique sur plusieurs serveurs (pour le dire tr\u00e8s simplement et conditionnellement). Et puis l&rsquo;un d&rsquo;eux s&rsquo;est \u00e9teint, tous les mots avec la lettre \u00ab\u00a0K\u00a0\u00bb ont disparu. La recherche a cess\u00e9 de donner le mot \u00abcin\u00e9ma\u00bb. Puis toutes les nouvelles disparaissent et l&rsquo;analyste fait la fausse conclusion que les gens ne sont plus int\u00e9ress\u00e9s par les cin\u00e9mas.<\/p>\n<p>Par cons\u00e9quent, un scientifique du Big Data doit conna\u00eetre les principes de travail des niveaux les plus bas &#8211; serveurs, \u00e9cosyst\u00e8mes, planificateurs de t\u00e2ches &#8211; aux programmes de plus haut niveau &#8211; biblioth\u00e8ques d&rsquo;apprentissage automatique, analyse statistique, etc. Il doit comprendre les principes du mat\u00e9riel, du mat\u00e9riel informatique et de tout ce qui y est configur\u00e9.<\/p>\n<p>Pour le reste, vous devez tout savoir de la m\u00eame mani\u00e8re que lorsque vous travaillez avec de petites donn\u00e9es. Vous avez besoin de math\u00e9matiques, vous devez \u00eatre capable de programmer et \u00eatre particuli\u00e8rement familiaris\u00e9 avec les algorithmes de calcul distribu\u00e9, pour pouvoir les appliquer aux principes habituels du travail avec des donn\u00e9es et de l&rsquo;apprentissage automatique.<\/p>\n<h2>Quels outils et technologies Big Data sont utilis\u00e9s<\/h2>\n<p>\u00c9tant donn\u00e9 que les donn\u00e9es sont stock\u00e9es sur un cluster, une infrastructure sp\u00e9ciale est n\u00e9cessaire pour les utiliser. L&rsquo;\u00e9cosyst\u00e8me le plus populaire est Hadoop. De nombreux syst\u00e8mes diff\u00e9rents peuvent y fonctionner: biblioth\u00e8ques sp\u00e9ciales, planificateurs, outils d&rsquo;apprentissage automatique et bien plus encore. Mais avant tout, ce syst\u00e8me est n\u00e9cessaire pour analyser de grandes quantit\u00e9s de donn\u00e9es gr\u00e2ce \u00e0 l&rsquo;informatique distribu\u00e9e.<\/p>\n<p>Par exemple, nous recherchons le tweet le plus populaire sur un millier de serveurs. Sur un serveur, nous ferions simplement une table et c&rsquo;est tout. Ici, nous pouvons faire glisser toutes les donn\u00e9es vers nous et recalculer. Mais ce n&rsquo;est pas correct, car cela prend beaucoup de temps.<\/p>\n<p>Par cons\u00e9quent, il existe Hadoop avec les paradigmes Map Reduce et le framework Spark. Au lieu de tirer des donn\u00e9es vers eux-m\u00eames, ils envoient des sections de programme \u00e0 ces donn\u00e9es. Le travail se d\u00e9roule en parall\u00e8le, en mille fils. Ensuite, vous obtenez un \u00e9chantillon de milliers de serveurs, sur la base desquels vous pouvez s\u00e9lectionner le tweet le plus populaire.<\/p>\n<p>Map Reduce est un paradigme plus ancien, Spark est plus r\u00e9cent. Avec son aide, ils obtiennent des donn\u00e9es \u00e0 partir de clusters et y cr\u00e9ent des mod\u00e8les d&rsquo;apprentissage automatique.<\/p>\n<h2>March\u00e9 du Big Data en Russie<\/h2>\n<p><a href=\"https:\/\/inform.com.de\/wp-content\/uploads\/2021\/06\/cb096a3741400bff23e3611c62eedbb7-1.png\" data-rel=\"lightbox-image-bGlnaHRib3g=\" data-rl_title=\"\" data-rl_caption=\"\"  title=\"\"><img decoding=\"async\" class=\"SDStudio-light-box-enable SDStudio-editor-tools-md-imp\" src=\"https:\/\/inform.com.de\/wp-content\/uploads\/2021\/06\/cb096a3741400bff23e3611c62eedbb7-1.png\" alt=\"Qu&#039;est-ce que Big Date? R\u00e9ponse simple pour tout le monde. Big Data - grande responsabilit\u00e9, gros stress et argent\" ><\/a><\/p>\n<p>Le monde entier, y compris la Russie, utilise la technologie Big Data dans les services bancaires, de communication et de vente au d\u00e9tail. Les experts estiment qu&rsquo;\u00e0 l&rsquo;avenir, la technologie sera utilis\u00e9e par l&rsquo;industrie des transports, les industries p\u00e9troli\u00e8re et gazi\u00e8re et alimentaire, ainsi que par l&rsquo;\u00e9nergie.<\/p>\n<p>Les analystes d&rsquo;IDC ont reconnu la Russie comme le plus grand march\u00e9 r\u00e9gional pour le BDA. Les revenus sont estim\u00e9s \u00e0 pr\u00e8s de 1,4 milliard de dollars cette ann\u00e9e et repr\u00e9senteront 40% des investissements totaux dans le secteur des applications de big data et de business intelligence.<\/p>\n<h2>Quels m\u00e9tiers existe-t-il dans le domaine du Big Data<\/h2>\n<p>Les deux principales professions sont les analystes et les ing\u00e9nieurs de donn\u00e9es.<\/p>\n<p>L&rsquo;analyste travaille principalement avec des informations. Il s&rsquo;int\u00e9resse aux donn\u00e9es tabulaires, il est engag\u00e9 dans les mod\u00e8les. Ses responsabilit\u00e9s incluent l&rsquo;agr\u00e9gation, le nettoyage, l&rsquo;augmentation et la visualisation des donn\u00e9es. Autrement dit, l&rsquo;analyste Big Data est le lien entre les informations brutes et l&rsquo;entreprise.<\/p>\n<p>L&rsquo;analyste a deux axes principaux de travail. Premi\u00e8rement, il peut transformer les informations re\u00e7ues, tirer des conclusions et les pr\u00e9senter sous une forme compr\u00e9hensible.<\/p>\n<p>Deuxi\u00e8mement, les analystes d\u00e9veloppent des applications qui fonctionneront et produiront des r\u00e9sultats automatiquement. Par exemple, faites une pr\u00e9vision pour le march\u00e9 boursier tous les jours.<\/p>\n<p>L&rsquo;ing\u00e9nieur dattier est une sp\u00e9cialit\u00e9 de niveau inf\u00e9rieur. C&rsquo;est la personne qui doit assurer le stockage, le traitement et la livraison des informations \u00e0 l&rsquo;analyste. Mais l\u00e0 o\u00f9 il y a approvisionnement et nettoyage, leurs responsabilit\u00e9s peuvent se chevaucher.<\/p>\n<p>L&rsquo;ing\u00e9nieur Bigdata obtient tout le travail acharn\u00e9. Si les syst\u00e8mes ont \u00e9chou\u00e9 ou si l&rsquo;un des serveurs a disparu du cluster, il se connecte. C&rsquo;est un travail tr\u00e8s exigeant et stressant. Le syst\u00e8me peut s&rsquo;arr\u00eater le week-end et apr\u00e8s les heures, et l&rsquo;ing\u00e9nieur doit agir rapidement.<\/p>\n<p>Ce sont deux professions principales, mais il y en a d&rsquo;autres aussi. Ils apparaissent lorsque des algorithmes de calcul parall\u00e8le sont ajout\u00e9s \u00e0 des t\u00e2ches li\u00e9es \u00e0 l&rsquo;intelligence artificielle. Par exemple, un ing\u00e9nieur PNL. C&rsquo;est un programmeur qui s&rsquo;occupe du traitement du langage naturel, en particulier dans les cas o\u00f9 il est n\u00e9cessaire non seulement de trouver des mots, mais de saisir le sens du texte. Ces ing\u00e9nieurs \u00e9crivent des programmes pour les robots de discussion et les syst\u00e8mes de dialogue, les assistants vocaux et les centres d&rsquo;appels automatis\u00e9s.<\/p>\n<p>Il y a des situations o\u00f9 vous devez classer des milliards d&rsquo;images, faire de la mod\u00e9ration, filtrer les choses inutiles et trouver des images similaires. Ces professions recoupent davantage la vision par ordinateur.<\/p>\n<h2>Combien de temps dure la formation<\/h2>\n<p>Nous nous entra\u00eenons depuis un an et demi. Ils sont divis\u00e9s en six quarts. Certains se concentrent sur la programmation, d&rsquo;autres sur l&rsquo;utilisation de bases de donn\u00e9es et d&rsquo;autres encore sur les math\u00e9matiques.<\/p>\n<p>Contrairement, par exemple, \u00e0 la facult\u00e9 d&rsquo;IA, il y a moins de math\u00e9matiques ici. Il n&rsquo;y a pas une telle emphase sur le calcul et l&rsquo;alg\u00e8bre lin\u00e9aire. La connaissance des algorithmes de calcul distribu\u00e9 est plus n\u00e9cessaire que les principes du calcul.<\/p>\n<p>Mais un an et demi suffit pour un vrai travail avec le traitement de Big Data uniquement si une personne a une exp\u00e9rience de travail avec des donn\u00e9es ordinaires et en g\u00e9n\u00e9ral dans l&rsquo;informatique. Le reste des \u00e9tudiants apr\u00e8s avoir obtenu leur dipl\u00f4me de la facult\u00e9 est encourag\u00e9 \u00e0 travailler avec des donn\u00e9es petites et moyennes. Ce n&rsquo;est qu&rsquo;apr\u00e8s cela qu&rsquo;un sp\u00e9cialiste peut \u00eatre autoris\u00e9 \u00e0 travailler avec de grands. Apr\u00e8s la formation, il vaut la peine de travailler en tant que data scientist &#8211; pour appliquer l&rsquo;apprentissage automatique sur diff\u00e9rentes quantit\u00e9s de donn\u00e9es.<\/p>\n<p>Lorsqu&rsquo;une personne obtient un emploi dans une grande entreprise &#8211; m\u00eame si elle a de l&rsquo;exp\u00e9rience -, le plus souvent, elle ne sera pas admise tout de suite \u00e0 de grandes quantit\u00e9s de donn\u00e9es, car le co\u00fbt de l&rsquo;erreur y est beaucoup plus \u00e9lev\u00e9. Les erreurs dans les algorithmes peuvent ne pas \u00eatre d\u00e9tect\u00e9es imm\u00e9diatement, ce qui entra\u00eenera des pertes importantes.<\/p>\n<h2>Comment fonctionne la technologie Big-Data?<\/h2>\n<p><a href=\"https:\/\/inform.com.de\/wp-content\/uploads\/2021\/06\/29d0da44092a2cc8c8f182d6bd50b393-1.png\" data-rel=\"lightbox-image-bGlnaHRib3g=\" data-rl_title=\"\" data-rl_caption=\"\"  title=\"\"><img decoding=\"async\" class=\"SDStudio-light-box-enable SDStudio-editor-tools-md-imp\" src=\"https:\/\/inform.com.de\/wp-content\/uploads\/2021\/06\/29d0da44092a2cc8c8f182d6bd50b393-1.png\" alt=\"Qu&#039;est-ce que Big Date? R\u00e9ponse simple pour tout le monde. Big Data - grande responsabilit\u00e9, gros stress et argent\" ><\/a><\/p>\n<p>Les utilisateurs du r\u00e9seau social Facebook t\u00e9l\u00e9chargent des photos, des vid\u00e9os et effectuent des actions chaque jour pour des centaines de t\u00e9raoctets. Peu importe le nombre de personnes participant au d\u00e9veloppement, elles ne pourront pas faire face au flux constant d&rsquo;informations. Pour d\u00e9velopper davantage le service et rendre les sites plus confortables &#8211; pour mettre en \u0153uvre des recommandations de contenu intelligentes, afficher des publicit\u00e9s pertinentes pour l&rsquo;utilisateur, des centaines de milliers de t\u00e9raoctets sont transmis \u00e0 l&rsquo;algorithme et re\u00e7oivent des informations structur\u00e9es et compr\u00e9hensibles.<\/p>\n<p>En comparant une \u00e9norme quantit\u00e9 d&rsquo;informations, on y trouve des relations. Ces relations avec une certaine probabilit\u00e9 peuvent pr\u00e9dire l&rsquo;avenir. L&rsquo;intelligence artificielle permet de trouver et d&rsquo;analyser une personne.<\/p>\n<p>Le r\u00e9seau neuronal scanne des milliers de photos, vid\u00e9os, commentaires &#8211; ces centaines de t\u00e9raoctets de big data et donne le r\u00e9sultat: combien de clients satisfaits quittent le magasin, s&rsquo;il y aura un embouteillage dans les prochaines heures, quelles discussions sont populaires sur le r\u00e9seau social, et bien plus encore.<\/p>\n<p><strong>M\u00e9thodes de travail avec le Big Data:<\/strong><\/p>\n<ul>\n<li>Apprentissage automatique<\/li>\n<li>Analyse des sentiments<\/li>\n<li>Analyse des r\u00e9seaux sociaux<\/li>\n<li>Association des r\u00e8gles d&rsquo;apprentissage<\/li>\n<li>Analyse de l&rsquo;arborescence de classification<\/li>\n<li>Algorithmes g\u00e9n\u00e9tiques<\/li>\n<li>Analyse de r\u00e9gression<\/li>\n<\/ul>\n<h3>Techniques d&rsquo;analyse et de traitement<\/h3>\n<p><a href=\"https:\/\/inform.com.de\/wp-content\/uploads\/2021\/04\/post-264852-607d2129d5641.jpg\" data-rel=\"lightbox-image-bGlnaHRib3g=\" data-rl_title=\"\" data-rl_caption=\"\"  title=\"\"><img decoding=\"async\" class=\"SDStudio-light-box-enable SDStudio-editor-tools-md-imp\" src=\"https:\/\/inform.com.de\/wp-content\/uploads\/2021\/04\/post-264852-607d2129d5641.jpg\" alt=\"Qu&#039;est-ce que Big Date? R\u00e9ponse simple pour tout le monde. Big Data - grande responsabilit\u00e9, gros stress et argent\" ><\/a><br \/>\nLes principales m\u00e9thodes d&rsquo;analyse de grandes quantit\u00e9s d&rsquo;informations sont les suivantes:<\/p>\n<ol>\n<li>Analyse approfondie, classification des donn\u00e9es. Ces techniques provenaient de technologies permettant de travailler avec des informations structur\u00e9es conventionnelles dans de petits tableaux. Cependant, le nouvel environnement utilise des algorithmes math\u00e9matiques avanc\u00e9s bas\u00e9s sur les progr\u00e8s dans le domaine num\u00e9rique.<\/li>\n<li>Crowdsourcing. Au c\u0153ur de cette technologie se trouve la capacit\u00e9 de recevoir et de traiter des flux de milliards d&rsquo;octets provenant de sources multiples. Le nombre fini de \u00ab\u00a0fournisseurs\u00a0\u00bb n&rsquo;est limit\u00e9 par rien. Est-ce juste la puissance du syst\u00e8me.<\/li>\n<li>Test fractionn\u00e9. Plusieurs \u00e9l\u00e9ments sont s\u00e9lectionn\u00e9s dans le tableau, qui sont compar\u00e9s les uns aux autres alternativement \u00ab\u00a0avant\u00a0\u00bb et \u00ab\u00a0apr\u00e8s\u00a0\u00bb le changement. Les tests AB aident \u00e0 d\u00e9terminer quels facteurs ont le plus grand impact sur les \u00e9l\u00e9ments. Par exemple, en utilisant le test fractionn\u00e9, vous pouvez effectuer un grand nombre d&rsquo;it\u00e9rations en s&rsquo;approchant progressivement d&rsquo;un r\u00e9sultat fiable.<\/li>\n<li>Pr\u00e9vision. Les analystes essaient de d\u00e9finir \u00e0 l&rsquo;avance certains param\u00e8tres du syst\u00e8me, puis v\u00e9rifient le comportement de l&rsquo;objet en fonction de l&rsquo;arriv\u00e9e de grandes quantit\u00e9s d&rsquo;informations.<\/li>\n<li>Apprentissage automatique. L&rsquo;intelligence artificielle \u00e0 l&rsquo;avenir est capable d&rsquo;absorber et de traiter de grandes quantit\u00e9s de donn\u00e9es non syst\u00e9matiques, puis de les utiliser pour l&rsquo;auto-\u00e9tude.<\/li>\n<li>Analyse de l&rsquo;activit\u00e9 du r\u00e9seau. Les techniques de Big Data sont utilis\u00e9es pour rechercher les r\u00e9seaux sociaux, les relations entre les titulaires de comptes, les groupes et les communaut\u00e9s. Sur cette base, les publics cibles sont cr\u00e9\u00e9s par les int\u00e9r\u00eats, la g\u00e9olocalisation, l&rsquo;\u00e2ge et d&rsquo;autres param\u00e8tres.<\/li>\n<\/ol>\n<h2>Exploration de donn\u00e9es &#8211; comment le Big Data est collect\u00e9 et trait\u00e9<\/h2>\n<p>Le chargement de donn\u00e9es volumineuses dans une base de donn\u00e9es relationnelle traditionnelle \u00e0 des fins d&rsquo;analyse prend beaucoup de temps et d&rsquo;argent. Pour cette raison, des approches particuli\u00e8res sont apparues pour collecter et analyser les informations. Pour recevoir puis extraire des informations, ils les combinent et les placent dans un \u00ablac de donn\u00e9es\u00bb. \u00c0 partir de l\u00e0, les programmes d&rsquo;intelligence artificielle, utilisant des algorithmes complexes, recherchent des mod\u00e8les r\u00e9p\u00e9titifs.<\/p>\n<p>Le stockage et le traitement ont lieu avec les outils suivants:<\/p>\n<ul>\n<li><strong>Apache HADOOP<\/strong> est un syst\u00e8me de traitement de donn\u00e9es orient\u00e9 batch. Le syst\u00e8me stocke et suit les informations sur plusieurs machines et s&rsquo;adapte \u00e0 plusieurs milliers de serveurs.<\/li>\n<li><strong>HPPC<\/strong> est une plate-forme open source d\u00e9velopp\u00e9e par LexisNexis Risk Solutions. HPPC est connu sous le nom de Data Analytics Supercomputer (DAS), prenant en charge le traitement des donn\u00e9es par lots et en temps r\u00e9el. Le syst\u00e8me utilise des supercalculateurs et des grappes d&rsquo;ordinateurs conventionnels.<\/li>\n<li><strong>Storm<\/strong> &#8211; traite les informations en temps r\u00e9el. Utilise la licence publique open source Eclipse.<\/li>\n<\/ul>\n<h2>A quoi cela sert?<\/h2>\n<p>Plus nous en savons sur un objet ou un ph\u00e9nom\u00e8ne sp\u00e9cifique, plus nous comprenons pr\u00e9cis\u00e9ment l&rsquo;essence et pouvons pr\u00e9dire l&rsquo;avenir. En capturant et en traitant les flux de donn\u00e9es provenant de capteurs, d&rsquo;Internet et des op\u00e9rations transactionnelles, les entreprises peuvent pr\u00e9dire avec assez de pr\u00e9cision la demande de produits, et les services d&rsquo;urgence peuvent pr\u00e9venir les catastrophes d&rsquo;origine humaine. Voici quelques exemples en dehors des affaires et du marketing de la fa\u00e7on dont les technologies de Big Data sont utilis\u00e9es:<\/p>\n<ul>\n<li>Soins de sant\u00e9. Plus de connaissances sur les maladies, plus d&rsquo;options de traitement, plus d&rsquo;informations sur les m\u00e9dicaments &#8211; tout cela nous permet de lutter contre des maladies consid\u00e9r\u00e9es comme incurables il y a 40 \u00e0 50 ans.<\/li>\n<li>Pr\u00e9vention des catastrophes naturelles et caus\u00e9es par l&rsquo;homme. Les pr\u00e9visions les plus pr\u00e9cises dans ce domaine sauvent des milliers de vies. La t\u00e2che des machines intelligentes est de collecter et de traiter une vari\u00e9t\u00e9 de lectures de capteurs et, sur leur base, d&rsquo;aider les gens \u00e0 d\u00e9terminer la date et le lieu d&rsquo;un \u00e9ventuel cataclysme.<\/li>\n<li>Les organismes d&rsquo;application de la loi. Les m\u00e9gadonn\u00e9es sont utilis\u00e9es pour pr\u00e9dire les pics de criminalit\u00e9 dans diff\u00e9rents pays et prendre des mesures de dissuasion l\u00e0 o\u00f9 la situation l&rsquo;exige.<\/li>\n<\/ul>\n<h2>Big data dans les affaires et le marketing<\/h2>\n<p>Les strat\u00e9gies de d\u00e9veloppement commercial, les activit\u00e9s de marketing, la publicit\u00e9 sont bas\u00e9es sur l&rsquo;analyse et travaillent avec les donn\u00e9es disponibles. Les grands tableaux permettent de \u00abpelleter\u00bb d&rsquo;\u00e9normes quantit\u00e9s de donn\u00e9es et, en cons\u00e9quence, d&rsquo;ajuster la direction de d\u00e9veloppement d&rsquo;une marque, d&rsquo;un produit, d&rsquo;un service aussi pr\u00e9cis\u00e9ment que possible.<\/p>\n<p>Par exemple, les ench\u00e8res RTB dans la publicit\u00e9 contextuelle fonctionnent avec le Big Data, ce qui vous permet de diffuser efficacement des offres commerciales \u00e0 un public cible d\u00e9di\u00e9, et non \u00e0 tout le monde.<\/p>\n<p>Quels sont les avantages pour l&rsquo;entreprise:<\/p>\n<ul>\n<li>Cr\u00e9ation de projets tr\u00e8s susceptibles de devenir demand\u00e9s par les utilisateurs et les acheteurs.<\/li>\n<li>Etude et analyse des besoins clients avec le service existant de l&rsquo;entreprise. Sur la base du calcul, le travail du personnel de service est corrig\u00e9.<\/li>\n<li>R\u00e9v\u00e9ler la fid\u00e9lit\u00e9 et l&rsquo;insatisfaction de la client\u00e8le en analysant une vari\u00e9t\u00e9 d&rsquo;informations provenant de blogs, de r\u00e9seaux sociaux et d&rsquo;autres sources.<\/li>\n<li>Attirer et fid\u00e9liser le public cible gr\u00e2ce \u00e0 un travail analytique avec de grandes quantit\u00e9s d&rsquo;informations.<\/li>\n<\/ul>\n<p>Les technologies sont utilis\u00e9es pour pr\u00e9dire la popularit\u00e9 des produits, par exemple en utilisant le service Google Trends et Yandex. Wordstat (pour la Russie et la CEI).<\/p>\n<p>Les m\u00e9thodes Big Data sont utilis\u00e9es par toutes les grandes entreprises &#8211; IBM, Google, Facebook et les soci\u00e9t\u00e9s financi\u00e8res &#8211; VISA, Master Card, ainsi que par les minist\u00e8res du monde entier. Par exemple, en Allemagne, l&rsquo;octroi des allocations de ch\u00f4mage a \u00e9t\u00e9 r\u00e9duit, en calculant que certains citoyens les re\u00e7oivent sans raison. Ainsi, il a \u00e9t\u00e9 possible de revenir au budget d&rsquo;environ 15 milliards d&rsquo;euros.<\/p>\n<p>Le r\u00e9cent scandale Facebook d\u00fb \u00e0 la fuite de donn\u00e9es des utilisateurs sugg\u00e8re que les volumes d&rsquo;informations non structur\u00e9es augmentent et m\u00eame les mastodontes de l&rsquo;\u00e8re num\u00e9rique ne peuvent pas toujours garantir leur confidentialit\u00e9 totale.<br \/><a href=\"https:\/\/inform.com.de\/wp-content\/uploads\/2021\/04\/post-264852-607d212bc2d2c.png\" data-rel=\"lightbox-image-bGlnaHRib3g=\" data-rl_title=\"\" data-rl_caption=\"\"  title=\"\"><img decoding=\"async\" class=\"SDStudio-light-box-enable SDStudio-editor-tools-md-imp\" src=\"https:\/\/inform.com.de\/wp-content\/uploads\/2021\/04\/post-264852-607d212bc2d2c.png\" alt=\"Qu&#039;est-ce que Big Date? R\u00e9ponse simple pour tout le monde. Big Data - grande responsabilit\u00e9, gros stress et argent\" ><\/a><\/p>\n<p>Par exemple, Master Card utilise le Big Data pour emp\u00eacher les transactions frauduleuses avec les comptes clients. Ainsi, il est possible d&rsquo;\u00e9conomiser plus de 3 milliards de dollars US de vol par an.<\/p>\n<p>Dans le domaine du jeu, le big data permet d&rsquo;analyser le comportement des joueurs, d&rsquo;identifier les pr\u00e9f\u00e9rences d&rsquo;un public actif et, sur cette base, de pr\u00e9dire le niveau d&rsquo;int\u00e9r\u00eat pour le jeu.<br \/><a href=\"https:\/\/inform.com.de\/wp-content\/uploads\/2021\/04\/post-264852-607d212cd0389.jpg\" data-rel=\"lightbox-image-bGlnaHRib3g=\" data-rl_title=\"\" data-rl_caption=\"\"  title=\"\"><img decoding=\"async\" class=\"SDStudio-light-box-enable SDStudio-editor-tools-md-imp\" src=\"https:\/\/inform.com.de\/wp-content\/uploads\/2021\/04\/post-264852-607d212cd0389.jpg\" alt=\"Qu&#039;est-ce que Big Date? R\u00e9ponse simple pour tout le monde. Big Data - grande responsabilit\u00e9, gros stress et argent\" ><\/a><\/p>\n<p>Aujourd&rsquo;hui, les entreprises en savent plus sur leurs clients que nous en savons sur nous-m\u00eames, c&rsquo;est pourquoi les campagnes publicitaires pour Coca-Cola et d&rsquo;autres entreprises sont un succ\u00e8s retentissant.<\/p>\n<h2>Probl\u00e8mes avec le Big-Data<\/h2>\n<p>Big Date nous donne des perspectives et des opportunit\u00e9s sans pr\u00e9c\u00e9dent, mais cela soul\u00e8ve \u00e9galement des probl\u00e8mes et des questions qui doivent \u00eatre abord\u00e9s:<\/p>\n<ul>\n<li>Confidentialit\u00e9 des donn\u00e9es &#8211; Les Big-Data que nous g\u00e9n\u00e9rons aujourd&rsquo;hui contiennent de nombreuses informations sur notre vie personnelle, \u00e0 la confidentialit\u00e9 desquelles nous avons tous les droits. De plus en plus, il nous est demand\u00e9 de trouver un \u00e9quilibre entre la quantit\u00e9 de donn\u00e9es personnelles que nous divulguons et la commodit\u00e9 qu&rsquo;offrent les applications et services Big Date.<\/li>\n<li>Protection des donn\u00e9es &#8211; m\u00eame si nous d\u00e9cidons que nous sommes satisfaits du fait que quelqu&rsquo;un dispose de nos donn\u00e9es dans un but pr\u00e9cis, pouvons-nous lui faire confiance pour la s\u00fbret\u00e9 et la s\u00e9curit\u00e9 de nos donn\u00e9es?<\/li>\n<li>Discrimination contre les donn\u00e9es &#8211; lorsque toutes les informations seront connues, sera-t-il acceptable de discriminer des personnes sur la base de donn\u00e9es de leur vie personnelle? Nous utilisons d\u00e9j\u00e0 les cotes de cr\u00e9dit pour d\u00e9cider qui peut emprunter de l&rsquo;argent, et l&rsquo;assurance d\u00e9pend \u00e9galement fortement des donn\u00e9es. Nous devrions nous attendre \u00e0 \u00eatre analys\u00e9s et \u00e9valu\u00e9s plus en d\u00e9tail, mais il faut veiller \u00e0 ce que cela ne complique pas la vie de ceux qui ont moins de ressources et un acc\u00e8s limit\u00e9 \u00e0 l&rsquo;information.<\/li>\n<\/ul>\n<p>L&rsquo;accomplissement de ces t\u00e2ches est une partie importante des grandes dates, et elles doivent \u00eatre trait\u00e9es par les organisations qui souhaitent utiliser ces donn\u00e9es. Ne pas le faire peut rendre l&rsquo;entreprise vuln\u00e9rable, non seulement du point de vue de sa r\u00e9putation, mais \u00e9galement du point de vue juridique et financier.<\/p>\n<h2>L&rsquo;essor incroyable de Big Date<\/h2>\n<p>Tout a commenc\u00e9 par une explosion de la quantit\u00e9 de donn\u00e9es que nous avons cr\u00e9\u00e9es depuis le d\u00e9but de l&rsquo;\u00e8re num\u00e9rique. Cela est en grande partie d\u00fb au d\u00e9veloppement des ordinateurs, d&rsquo;Internet et des technologies capables de \u00abcapturer\u00bb des donn\u00e9es dans le monde qui nous entoure. Les donn\u00e9es \u00e0 elles seules ne sont pas une nouvelle invention. M\u00eame avant l&rsquo;\u00e8re des ordinateurs et des bases de donn\u00e9es, nous utilisions des enregistrements de transactions papier, des enregistrements clients et des fichiers d&rsquo;archives, qui sont des donn\u00e9es. Les ordinateurs, en particulier les feuilles de calcul et les bases de donn\u00e9es, nous ont facilit\u00e9 le stockage et l&rsquo;organisation des donn\u00e9es \u00e0 grande \u00e9chelle. Tout \u00e0 coup, les informations sont devenues disponibles d&rsquo;un simple clic de souris.<\/p>\n<p>Cependant, nous avons parcouru un long chemin depuis les tables et bases de donn\u00e9es d&rsquo;origine. Aujourd&rsquo;hui, tous les deux jours, nous cr\u00e9ons autant de donn\u00e9es que nous en avons re\u00e7ues depuis le tout d\u00e9but jusqu&rsquo;\u00e0 l&rsquo;an 2000. C&rsquo;est vrai, tous les deux jours. Et la quantit\u00e9 de donn\u00e9es que nous cr\u00e9ons continue de cro\u00eetre rapidement; d&rsquo;ici 2020, la quantit\u00e9 d&rsquo;informations num\u00e9riques disponibles passera d&rsquo;environ 5 zettaoctets \u00e0 20 zettaoctets.<\/p>\n<p>De nos jours, presque chaque action que nous entreprenons laisse sa marque. Nous g\u00e9n\u00e9rons des donn\u00e9es \u00e0 chaque fois que nous allons en ligne, lorsque nous transf\u00e9rons nos smartphones \u00e9quip\u00e9s d&rsquo;un module de recherche, lorsque nous parlons avec nos amis via les r\u00e9seaux sociaux ou les chats, etc. En outre, la quantit\u00e9 de donn\u00e9es g\u00e9n\u00e9r\u00e9es par la machine augmente \u00e9galement rapidement. Les donn\u00e9es sont g\u00e9n\u00e9r\u00e9es et distribu\u00e9es lorsque nos appareils domestiques intelligents communiquent entre eux ou avec leurs serveurs domestiques. Les \u00e9quipements industriels des usines et usines sont de plus en plus \u00e9quip\u00e9s de capteurs qui accumulent et transmettent des donn\u00e9es.<\/p>\n<p>Le terme \u00abBig-Data\u00bb fait r\u00e9f\u00e9rence \u00e0 la collecte de toutes ces donn\u00e9es et \u00e0 notre capacit\u00e9 \u00e0 les utiliser \u00e0 notre avantage dans un large \u00e9ventail de domaines, y compris les affaires.<\/p>\n<h2>Perspectives d&rsquo;utilisation de Big Date<\/h2>\n<p>La blockchain et le Big Data sont deux technologies \u00e9volutives et compl\u00e9mentaires. Depuis 2016, la blockchain est largement discut\u00e9e dans les m\u00e9dias. Il s&rsquo;agit d&rsquo;une technologie de base de donn\u00e9es distribu\u00e9e s\u00e9curis\u00e9e par cryptographie pour stocker et transmettre des informations. La protection des informations priv\u00e9es et confidentielles est un probl\u00e8me urgent et futur de Big Data que la blockchain peut r\u00e9soudre.<\/p>\n<p>Presque tous les secteurs ont commenc\u00e9 \u00e0 investir dans l&rsquo;analyse du Big Data, mais certains investissent plus que d&rsquo;autres. Selon IDC, ils d\u00e9pensent davantage en services bancaires, en fabrication discr\u00e8te, en fabrication de processus et en services professionnels. Selon l&rsquo;\u00e9tude de Wikibon, les revenus provenant des ventes de programmes et de services sur le march\u00e9 mondial en 2018 s&rsquo;\u00e9levaient \u00e0 42 milliards de dollars et en 2027, ils d\u00e9passeront la barre des 100 milliards de dollars.<\/p>\n<p>Neimeth estime que la blockchain repr\u00e9sentera jusqu&rsquo;\u00e0 20% du march\u00e9 total du big data d&rsquo;ici 2030, g\u00e9n\u00e9rant jusqu&rsquo;\u00e0 100 milliards de dollars de revenus annuels. Cela surpasse les marges combin\u00e9es de PayPal, Visa et Mastercard.<\/p>\n<p>L&rsquo;analyse du Big Data sera importante pour le suivi des transactions et permettra aux entreprises de blockchain de d\u00e9couvrir des sch\u00e9mas cach\u00e9s et de d\u00e9terminer avec qui elles interagissent sur la blockchain.<\/p>\n<h2>R\u00e9sum\u00e9<\/h2>\n<p>Nous avons appris ce qu&rsquo;est le Big Data? Nous avons examin\u00e9 le fonctionnement de cette technologie, pour quels tableaux d&rsquo;informations sont utilis\u00e9s. Nous nous sommes familiaris\u00e9s avec les principes et les m\u00e9thodes de travail avec le Big Data.<\/p>\n<p>Nous vous recommandons de lire The Human Face of Big Data par Rick Smolan et Jennifer Erwitt, et Introduction to Data Mining par Michael Steinbach, Vipin Kumar et Pang-Ning Tan.<\/p>\n<p>Sources utilis\u00e9es et liens utiles sur le sujet: <a href=\"https:\/\/www.calltouch.ru\/glossary\/big-data\/\" target=\"_blank\" rel=\"noopener nofollow\" class=\"external external_icon\">https:\/\/www.calltouch.ru\/glossary\/big-data\/<\/a> <a href=\"https:\/\/mining-cryptocurrency.ru\/big-data\/\" target=\"_blank\" rel=\"noopener nofollow\" class=\"external external_icon\">https:\/\/Mining-CryptoCurrency.ru\/big-data\/<\/a> <a href=\"https:\/\/geekbrains.ru\/posts\/gu_big_data_faculty\" target=\"_blank\" rel=\"noopener nofollow\" class=\"external external_icon\">https:\/\/geekbrains.ru\/posts\/gu_big_data_faculty<\/a> <a href=\"https:\/\/clubshuttle.ru\/tehnologiya-big-data-prostymi-slovami\" target=\"_blank\" rel=\"noopener nofollow\" class=\"external external_icon\">https: \/\/clubshuttle.ru\/tehnologiya-big-data-prostymi-slovami<\/a><\/p>\n<div id=\"PostUnique_PostSource\" style=\"padding-top: 50px\">Source d&rsquo;enregistrement:  <a target=\"_blank\" rel=\"noopener nofollow\" href=\"\/\/lastici.ru\" class=\"external external_icon\">lastici.ru<\/a><\/div>\n","protected":false},"excerpt":{"rendered":"<p>Qu&rsquo;est-ce que le Big Data et \u00e0 quoi sert-il. Comment fonctionne le Big Data. Comment les technologies Big Data sont utilis\u00e9es dans le marketing et les affaires.<\/p>\n","protected":false},"author":1,"featured_media":388082,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":"","_wp_rev_ctl_limit":""},"categories":[363,257,429,286,330],"tags":[],"class_list":["post-340981","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-affaires","category-divers","category-lordinateur","category-les-technologies","category-pour-hommes"],"_links":{"self":[{"href":"https:\/\/inform.com.de\/fr\/wp-json\/wp\/v2\/posts\/340981","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/inform.com.de\/fr\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/inform.com.de\/fr\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/inform.com.de\/fr\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/inform.com.de\/fr\/wp-json\/wp\/v2\/comments?post=340981"}],"version-history":[{"count":0,"href":"https:\/\/inform.com.de\/fr\/wp-json\/wp\/v2\/posts\/340981\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/inform.com.de\/fr\/wp-json\/wp\/v2\/media\/388082"}],"wp:attachment":[{"href":"https:\/\/inform.com.de\/fr\/wp-json\/wp\/v2\/media?parent=340981"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/inform.com.de\/fr\/wp-json\/wp\/v2\/categories?post=340981"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/inform.com.de\/fr\/wp-json\/wp\/v2\/tags?post=340981"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}