vendredi 27 avril 2018

C’est quoi le big data ?

 

bid data
Photo by smarnad

Comme d’habitude, je vais vous donner une définition simple du big data.
Regarderons ensuite quelques exemples de l’utilisation du big data dans la vie quotidienne.
Quelle drôle d’image pour illustrer pour le big data ?Eh bien, vous verrez que : Non pas tant que ça.
Je vous expliquerai pourquoi j’ai utilisé cette image pour le big data.
Depuis l’explosion d’Internet, les données sont partout : même à des endroits où on ne les attend pas. Nous verrons à quoi et comment elles sont utilisées : c’est le big data.
Commençons par voir ce qu’est le big data.

Le BIG DATA : Tout enregistrer

L’idée générale du big data, c’est d’enregistrer beaucoup de données (le plus possible). D’ailleurs si l’on traduit : Big Data, on obtient quelque chose comme « Grande Donnée » ou « Données importantes ». Voici un petit tableau qui explique les volumes des données enregistrées dans le monde entier (ces tableaux ont été créés à l’aide de données du magazine « Fortune »).
PériodeVolume
des dinosaures à 2003Il s’est enregistré 5 exabytes de données en tout (5 EB ou 5Eo = 5 millions de TB ou To)
(5 milliards de GB) voir « ko Mo Go To Po Eo Zo Yo …« 
 en 2011 5 EB étaient produits en 2 jours
 en 2013 5 EB étaient produits en 10 minutes
je vous laisse imaginer la suite… Surtout que maintenant, de plus en plus de personnes sont à la fois équipés de smartphone en plus de leur ordinateur. Ces smartphones générant eux-aussi des données.

 

Qui enregistre ?

Tout et n’importe quoi peut émettre des données. Ces données pourront être enregistrées pour être ré-utilisées après (ou pas).
Quelques exemples : 
  • Assez classique et je pense que vous vous en doutez un peu :
    • Les sites sur lesquels vous surfez,
    • Les mails ou messages que vous envoyez ou recevez,
    • Les applications de vos smartphones,
    • Les conversations téléphoniques,
  • et quelques autres, dont vous vous ne doutiez peut être pas :
    • Votre alarme de maison, si elle est relié à un central téléphonique,
    • Les volets électriques s’ils peuvent être commandés à distance,
    • Les thermostats s’ils sont commandés à distances, et en général beaucoup d’équipements de domotique.
    • Et bien évidemment, tout ce qui peut se connecter à Internet, comme par exemple :
      • Les GPS,
      • Vos machines de Fitness, si elles sont capables d’enregistrer vos performances,
      • Vos réfrigérateurs connectés,
      • Vos téléviseurs connectés,
Vous voyez que la liste peut être très longue !

Mais surtout, c’est pourquoi faire ?

L’objectif ultime de cette collecte, c’est de mieux connaitre le consommateur que nous sommes et pouvoir nous proposer des produits toujours plus adaptés à nos besoins, et bien évidemment au final de nous vendre quelque chose. 
A l’aide du big data, les produits proposés seront ciblés plus finement et en fonction de plus de critères que ceux généralement utilisés. 
Je vais vous donner quelques exemples, et vous allez comprendre beaucoup mieux.
Exemple 1 :
Commençons par un exemple très simple.
Vous vous connectez à un site d’achat en ligne. Vous choisissez un appareil photo numérique que vous ajoutez à votre panier.
Alors, le site vous propose un choix de carte mémoire, car vous en aurez besoin. Mais il ne vous propose pas n’importe qu’elle carte:
  1. car il sait que vous êtes un accro de la photo. En effet, il y a quelques temps, vous avez déjà cherché et acheté des articles liés à la photo numérique sur ce même site. Il vous proposera une carte adaptée à vos besoins.
  2. D’autres internautes ont acheté le même appareil photo que vous et ont choisi des cartes mémoire, le site vous proposera les mêmes cartes commandés par des milliers d’internautes avant vous.

Exemple 2 :
Vous êtes accro au fitness que vous pratiquez chez vous sur votre vélo elliptique.
Vous l’avez paramétré et il a enregistré votre poids, taille, age et sexe.
A chaque fois que vous l’utilisez, celui enregistre votre rythme cardiaque, le temps passé et les calories brûlées. Vous vous connectez régulièrement sur Internet et vous êtes content de voir que vos performances s’améliorent.
Dès lors que vous connectez à Internet, les publicités que l’on vous propose sont ciblées :
  • des produits vitaminés pour sportifs,
  • des nouveaux appareils pour équiper votre salle de fitness,
  • des tenues de sports,
  • etc …
  • mais on pourrait aller plus loin :
la société commercialisant le vélo elliptique vend son fichier de données aux compagnies d’assurance. 
Ces compagnies font le ratio : taille/poids/sexe/activité physique : vous êtes en forme, donc on vous propose des réductions sur « vos contrats santé » !
Exemple 3 :
Votre réfrigérateur est connecté. Il sait que vous avez un petit faible pour le chocolat, mais, il connaît également tous les produits que vous achetez car il enregistre tout ce qui rentre et tout ce qui sort.
Toutes ces données sont vendues à des sites Internet. Avec vos comportements alimentaires et vos achats, on peut en déduire que vous êtes célibataire car vous n’achetez que des portions d’une seule part.
Ne soyez pas étonné si vous recevez beaucoup de publicité pour des clubs de rencontre et même des soirées de rencontre autour du chocolat.

Exemple 4 :
Vous arrivez dans une région que vous ne connaissez pas. Votre GPS a fait du bon boulot, il vous a emmené exactement à l’endroit où vous vouliez aller, mais il connecté et il n’a pas fait que ça.
Vous allumez votre smartphone, et il vous propose le musée Picasso à quelques kilomètres. Quelle étrange coïncidence, il y a quelques mois vous aviez déjà visité un musée Picasso dans une autre ville ! Coïncidence, avez-vous dit ???
Attention, tous les exemples que je vous ai proposé sont imaginaires (quoi que !). Car pour l’instant le big data se limite encore un peu en interne aux entreprises. Mais certaines entreprises commencent à vendre les informations qu’elles ont récupéré et ce n’est que le début d’un immense marché de données.
N’oubliez pas que tout est stocké et peut être analysé. Cela peut aller jusqu’à vos mails qui seront ensuite analysés pour mieux vous connaitre. 

Des données non structurées, mais les 3V.

Le stockage d’un tel volume de données a nécessité de revoir le mode d’enregistrement des données. Normalement pour stocker un volume de données importants, on utilise des bases de données (je suis en train de rédiger expliquant les bases de données), mais le volume étant tellement important que cela n’était pas possible. Il a fallu repenser le stockage. Pour ce nouveau mode de stockage on applique les règles des 3 V :
  • Volume : Il faut stocker énormément d’information
  • Variété : Il faut stocker beaucoup de données de toutes sortes.
  • Vélocité : Il faut pouvoir avoir accès rapidement à toutes ces données.

En conclusion

Sur Internet, on voit souvent « big brother is watching you ». (traduit littéralement par « le grand frère vous regarde », mais qu’on pourrait comprendre par : « on vous espionne ») en référence au livre de George Orwell « 1984 ». 
J’ai lu ce livre, il y a très longtemps, livre que j’avais adoré d’ailleurs.
Dans ce livre, écrit en 1949, Orwell imaginait un monde en 1984, dans lequel, les habitants étaient surveillés en permanence. Et bien, je crois que l’on peut dire depuis l’avènement du big data, nous sommes surveillés en permanence, heureusement pas pour les mêmes raisons que dans le livre d’Orwell ! (que je vous invite à lire ou à relire.)

0 commentaires: