Le Big Data désigne l’ensemble des données numériques produites par l’utilisation des nouvelles technologies.
Cela regroupe les données :
provenant des échanges de courriels, des conversations sur les réseaux sociaux, des transactions de commerce électronique effectuées, de bases de données métiers, de fichiers disponibles en lignes (image, vidéo, son, texte). A titre d’exemple sur Facebook seulement, nous envoyons 10 millions de messages par jour, « Likons » 4,5 millions de fois et téléchargeons 350 millions de nouvelles photos chaque jour,
émises par tous les objets connectées, capteurs industriels, smartphones, compteurs intelligents, assistants individuels …
utilisées pour la géolocalisation et le gps …
Le Big Data s’est développé avec l’arrivée des solutions de stockage en ligne, Le Cloud, et l’augmentation de la puissance de calcul des Supercalculateurs.
Toutes ces données aussi disparates soient elles fournissent une masse gigantesque d’information, gisement idéal pour les analystes en tout genre afin de définir une tendance ou une prédiction, de dresser des profils, d’anticiper des risques et de suivre des phénomènes en temps réel dans des domaines aussi variés que la recherche scientifique, la politique, la communication, la médecine, la météorologie, l'écologie, la finance, le commerce.
Le Big Data ou mégadonnées est caractérisé par cinq critères les 5V :
Le Volume caractérise les quantités astronomiques de données générées chaque seconde. Il suffit de penser à tous les e-mails, tweets, photos, vidéos, les données des capteurs que nous produisons et partageons chaque seconde.
La Vélocité caractérise la vitesse à laquelle la nouvelle donnée est générée et se déplace. Le Big Data nous permet aujourd’hui d’analyser les données pendant qu’elles sont générées, sans avoir à les analyser dans des bases de données.
La Variété caractérise les différents types de données que nous utilisons. Dans le passé, nous nous appuyions principalement sur des données structurées. Le type que nous pouvions organiser en tableau, telles que les transactions de vente par client, région, etc. Les données moins structurées, telles que des fichiers texte, des photos, du contenu vidéo, etc. étaient en grande partie ignorées. Aujourd'hui, nous pouvons utiliser et analyser une grande variété de données, y compris le texte écrit, la parole, le ton de notre voix, ainsi que des données biométriques, des photographies et du contenu vidéo.
La véracité caractérise la faible fiabilité et le désordre qui règnent dans la donnée. Celle-ci manque trop souvent de qualité et de précision, ce qui la rend peu contrôlable. L'une des missions du big data est d'apporter un peu d'ordre à tout cela non pas en organisant la donnée, mais plutôt en filtrant son accès et en permettant d'y associer les analytiques qui correspondent aux besoins des utilisateurs.
La Valeur caractérise la valeur marchande que va prendre la donnée après traitement et analyse. La Valeur est une notion très importante. Il est indispensable que les entreprises évaluent la rentabilité d’une récolte de données avant de se lancer dans des projets Big Data sans avoir clairement compris et définit les avantages, inconvénients et les coûts d’un tel investissement…
Aujourd’hui, le Big Data est devenu omniprésent et indispensable dans notre vie de tous les jours, aussi bien privée que professionnelle, avec tous ses avantages et ses limites.
Comments