Le Big Data en quelques mots ?
L'expression « big data » a été vue pour la première fois en octobre 1997 avec l’apparition du web et du numérique.
Chaque jour les données se multiplient par l’utilisation de plus en plus importantes des ordinateurs, tablettes, téléphones, applications, cookies... Ces données sont transmises puis stockées dans des Data Bases et Data Centers a des fins d’analyses.
Tous les secteurs sont concernés par la collecte de data : L’agro-alimentaire, le transport, le commerce, l’e-commerce, le service, le BTP, les services publics ....
Du Big Data au Smart Data.
C’est la conséquence de l’analyse de ces megadonnées: Le Smart Data. Il permet d’aider les entreprises à mettre en place une meilleure expérience client grâce à une réduction possible des risques et une meilleure prise de décisions.
Cependant, beaucoup de perspectives de traitement du Big Data sont encore méconnues ou insoupçonnées par les organisations.
De nombreux experts et spécialistes de la data considèrent le Big Data comme l’un des grands défis de cette décennie. Un baromètre Big Data Index réalisé en 2014 par EMC et IDC montre que 70 % des données des entreprises ne sont pas utilisées.
Aujourd’hui les utilisateurs métiers cherchent à comprendre et à exploiter ces données de façon simple et efficace.
Comment exploiter le Big Data ?
Pour exploiter le Big Data, il faut commencer par étudier les différents types de données disponibles.
- Dans un premier temps les données structurées qui sont utilisables et internes à l'entreprise. On comprend par données structurées; les sources de données qui ont été générées par l’entreprise : les données de ventes, clients, processus : Datawarehouse, CRM, ERP...
- Viennent ensuite les données externes à l’entreprise, celles qui ne sont pas générées directement. Les sources dites « Open-Data »: des données en libre accès récoltées lors de sondages, panels, études, partenaires...
- Pour finir, il est primordial de s’intéresser aux données non-structurées, le Big Data. Ces données provenant essentiellement du numérique ou des données non traitées par l’entreprise disponibles dans un format qui n’est pas directement utilisable.
L'étape primordiale pour l'exploitation du Big Data est l’internalisation et la mise au format de toutes ces sources de données.
La mesure et l’association des données
On va chercher à analyser des structures existantes et des associations possibles dans les données afin d’arriver à comprendre le relation entre les causes et les effets d’une activité pour pouvoir établir des conclusions et des décisions.
La visualisation des données
La Data Visualisation est la dernière étape du traitement des données. Comme le propose les logiciels Tableau Software et Qlik Sense, la "Data Viz" va permettre de visualiser de façon graphiques ces associations de données complexes et comprendre les interactions entre-elles. Tout utilisateur métier peut alors analyser et comprendre les données afin de prendre des décisions : c’est une étape essentielle dans une logique de diffusion de l’information.