Mon premier choc frontal avec la puissance du big data fut lorsque je travaillais pour un géant allemand du e-commerce. C’était à ce moment-là que j’ai compris la différence abyssale qui séparait un site de e-commerce lambda du site d’un leader mondial du e-commerce. Bien-sûr, j’avais bien avant cela une connaissance tout à fait théorique de ce qu’est le big data, mais c’en est autre chose que de voir le résultat en direct sur un business.
Big data in action
Ce qui différencie un site de e-commerce moyen d’un site hyper rentable, c’est que sur un site optimisé, si l’on visite la page des berceaux ou d’un article pour bébés et que l’on visualise également un article masculin comme une cravate dans la même période, l’algorithme du site va conclure qu’il a affaire à un jeune papa cadre et se mettra à proposer la dernière perceuse pour gagner du temps pour les bricolages domestiques. Si l’on navigue par contre vers des lits superposés et vers les outils de jardinage, le site conclura qu’il s’agit d’une famille nombreuse habitant dans une maison individuelle. Donc qui a probablement une voiture et une vie stressante par les embouteillages ; il proposera peut-être une bicyclette ou un vélo d’appartement pour faire du sport le week-end.
Le plus drôle dans tout cela est que ces suggestions sont généralement d’une efficacité foudroyante : peut-être que vous n’achèterez pas la bicyclette proposée sur le champ, mais vers la fin du mois, quand vous serez lessivé et que vous chercherez un moyen de vous détendre, vous serez content de revoir cette proposition dans une publicité adSense intercalée dans vos résultats de recherche. L’effet du big data peut induire un gain tout à fait considérable sur le nombre de transactions ainsi que sur le montant du panier moyen sur le site. Cette partie du site, qui génère les suggestions, est si critique qu’elle n’est pas traitée en interne mais confiée à des entreprises dont c’est l’unique service. Les suggestions, les articles proposés ainsi que les remises proposées, sont chargées de manière asynchrone sur les pages web du site à mesure que l’utilisateur avance dans sa navigation.
Les entreprises combinant commerce physique et commerce électronique vous proposent généralement la wifi gratuite dans leurs magasins, pour pouvoir combiner les informations de navigation avec les informations de localisation provenant du monde réel. Vous serez alors très surpris de voir une promotion alléchante sur le lave-vaisselle de vos rêves le soir, après avoir passé une partie de l’après-midi à vous balader dans le rayon électroménager de votre supermarché.
Tous sous l’effet du big data
Rétrospectivement, quand je liste tous les livres que j’ai déjà lus dans les domaines de l’innovation et de l’entrepreneuriat (The Innovator’s Dilema, The Innovator’s DNA, The Lean Startup, Business Model Generation, Crossing The Chasm,…), je me rends compte qu’ils ont tous été suggérés successivement par le moteur d’Amazon alors que moi-même je n’avais aucune prédisposition particulière et aucun signe évident d’un intérêt particulier pour le sujet.
Facebook avec ses bientôt 2 milliards d’utilisateurs actifs mensuellement, est l’exemple type de l’utilisation majestueuse de la toute-puissance du big data pour effectuer une mutation générale de son business, se transformant d’un réseau social au plus grand empire de médias jamais construit. Lorsque Facebook avait atteint quelques centaines de millions d’utilisateurs, j’avais lu des articles disant que le réseau social sera confronté à un énorme problème de pertinence de son fil d’actualité. S’il continuait à afficher les posts dans l’ordre chronologique, le fil d’actu sera vite ingérable.
C’était sans compter sur la puissance du big data, l’ingéniosité des équipes de Facebook et la vision de ses dirigeants. Actuellement, lorsque vous publiez un post, et que ce post intéresse vos contacts A et B par exemple, alors l’algorithme décidera qu’il s’agit probablement de sport et que ce post intéressera probablement vos contacts U et V. Si par contre ce post intéresse vos contacts A et C, c’est qu’il s’agit probablement de musique et qu’il est susceptible d’intéresser vos contacts U et W. etc. Tout ceci est fait de manière tout à fait automatique, sans aucune intervention humaine. Au final, vous ne verrez pas tous les posts de vos contacts ; et ceux que vous verrez ne seront pas dans l’ordre chronologique. C’est toute la magie et la puissance du big data, capable de requêter une base de données de plusieurs téraoctets, répartie sur plusieurs continents, à la recherche de l’information la plus pertinente, alliées à de l’IA et du deep learning.
C’est grâce à ce genre d’algorithmes que Facebook, YouTube (et d’autre comme Twitter récemment) arrivent à détecter les informations à très forte viralité capables de se propager par capillarité à travers des dizaines de millions de personnes. C’est également grâce à cela que Facebook se positionne aujourd’hui comme l’innovation de rupture qui remplacera probablement la presse traditionnelle, puisque l’information se diffuse et trouve son chemin dans une communauté de façon très optimale. L’ironie est que ce phénomène a été mis en lumière par Twiter, qui n’a jamais réussi à le faire aboutir.
Big Data vs Expert
Le Big Data est souvent perçu comme un complément voire même une alternative à l’expertise. En effet, si l’on dispose d’une énorme quantité d’informations économiques, démographiques ou autres, l’on est capable de mettre en lumière des tendances cachées ou des variations invisibles à l’œil nu qui prendraient des années d’études théoriques à expliquer ou à mettre en évidence sinon. Ceci est également valable pour le domaine médical comme on le verra bientôt. Ceci explique que les dirigeants de Google ont longtemps plaidé pour l’accès anonymisé aux dossiers médicaux afin de détecter des phénomènes, comme les liens entre maladies et certains médicaments (on se souvient encore de l’affaire du Mediator et de la valvulopathie cardiaque) ou encore les épidémies, au tout début de leur occurrence.
Big Data contre le cancer
En 2014, Google, à travers sa filiale Ventures, a investi 130 millions de dollars dans une startup dénommée Flatiron Health. Ventures a également investi dans DNAnexus, qui traite la génétique et le séquençage et l’exploitation des informations du génome humain pour la recherche en bio-informatique utilisant le big data. Le but de Flatiron Health est de soigner le cancer avec l’aide du big data : imaginons un instant que l’on puisse, grâce à la magie du big data, à extraire de l’énorme base de données mondiale de tous les malades du cancer, une combinaison de médicaments, de mode de vie, d’alimentation, de comportement, de manipulations, etc… qui retarde le développement des tumeurs au point de permettre au malade d’avoir un mode de vie normal et une espérance de vie normale. Alors, dans ce cas-là, on pourra dire que le cancer, qui n’a pas été vaincu par la physique, par la chimie ni par la biologie, sera vaincu par l’informatique et les mathématiques. Ça serait une première révolution du genre dans l’histoire de l’humanité.
Un monde de possibilités
Le big data est défini par les cinq V : Volume, Variety, Velocity, Veracity et Value. Nous venons de parcourir un minuscule échantillon des immenses possibilités offertes par le big data. Si nous parlons business autours du big data, il existe deux directions : horizontale, sur les techniques d’analyse et d’exploitation des données, et verticale, dans l’utilisation de ces techniques et leur application à un domaine particulier. Dans la première, la startup Big Mama est la locomotive algérienne mais ne devrait pas être la seule à occuper le terrain, tant il y a à faire. Quant aux applications verticales, chaque business doit considérer, sérieusement, la possibilité de générer, récolter et exploiter les données qu’il génère. Ceci peut avoir deux types de conséquences sur son activité. D’abord et surtout, il lui permettra d’optimiser son action et gagner en efficacité face à la concurrence. Dans le domaine du commerce par exemple, récolter des quantités de données de ses points de vente permettrait, avec le big data, de choisir la position optimale de son prochain point de vente. Ceci permettrait également de définir une politique de prix dynamique, optimale, en fonction du lieu de vente.
Mais le big data peut également lui permettra de proposer à ses clients un service à très forte valeur ajoutée. Par exemple, dans le domaine du recrutement, LinkedIn propose un service d’un nouveau type consistant à sélectionner pour les recruteurs les candidats idéaux en fonction des spécifications du poste à pourvoir et du parcourt du candidat. Ceci permet aux clients en question de raccourcir considérablement leur processus de recrutement.
Les possibilités sont infinies. Dans une ère ou le coût du stockage a baissé drastiquement, la récolte possible, les couches logiciels open source, les méthodes d’analyse matures et la plus-value offerte extrêmement conséquente et même décisive pour la plupart des business, il devrait se créer un grand nombre de startups offrant ce genre de services.