Grâce au Web et à l'importance grandissante du big data (données massives), les entreprises disposent aujourd'hui de moyens phénoménaux pour recueillir un maximum d'informations sur les consommateurs. Un exemple frappant est celui de Dansk Supermarked.
La plus grande chaîne de supermarchés du Danemark s'est récemment associée à Infosys, un prestataire indien de services informatiques, pour croiser plusieurs bases de données sur ses clients (âge, sexe, profession, lieu de résidence, etc.). L'objectif ? Être en mesure de proposer à chacun d'eux des rabais taillés sur mesure, avec une incroyable précision.
Le hic, c'est qu'une telle précision peut finir par faire froid dans le dos de nombreux consommateurs. C'est d'ailleurs sur ce phénomène-là que misent des sites Web comme ReputationDefender.com, qui offrent aux particuliers la possibilité d'effacer toutes leurs données personnelles en ligne en échange d'une poignée de dollars.
La question saute aux yeux : comment trouver un juste milieu entre la volonté - tout à fait légitime - des entreprises d'offrir de meilleurs services et le souci des individus - tout aussi légitime - de préserver leur vie privée ?
«On parle beaucoup de big data, mais ce terme englobe tout et son contraire. L'important, c'est d'utiliser le data disponible avec intelligence : pas besoin que celui-ci soit big, pourvu qu'il soit pertinent, c'est-à-dire judicieux pour l'entreprise comme pour ses clients», a dit en avril Ethan Song, le pdg de Frank & Oak, une firme montréalaise de vente en ligne de vêtements pour homme, lors de l'événement Hors-Jeu du concepteur québécois de jeux vidéo Ludia.
Une utilisation judicieuse, donc. Mais qu'est-ce à dire, au juste ? C'est ce qu'ont voulu savoir Tommaso Valletti et Jiahua Wu, deux professeurs d'économie de l'Imperial College Business School de Londres. Dans le cadre de leur étude intitulée «Big Data vs. Small Data», ils ont ainsi concocté un modèle de calcul économétrique visant à déterminer la meilleure stratégie à adopter pour une entreprise souhaitant utiliser des données sur sa clientèle - actuelle et potentielle - afin d'accroître ses profits. Cela leur a permis de faire trois trouvailles :
> Lien. Il y a bel et bien un lien entre le niveau d'investissement d'une entreprise dans le big data et la tolérance des consommateurs à l'utilisation par celle-ci de leurs données personnelles, en ce sens que plus une entreprise en veut, moins les consommateurs sont disposés à lui en dévoiler.
> Surinvestissement. Les entreprises ont, en général, tendance à investir trop dans le big data, ayant le réflexe de récolter plus de données que nécessaire.
> Avantage du small data. Les entreprises ont, en général, intérêt à moins investir dans le big data et plus dans le small data (données individuelles). Ce qui signifie qu'elles gagneraient à chercher à en savoir moins, mais mieux, sur leur clientèle.
«Une centaine d'observations pointues concernant une cible précise se révèlent nettement plus payantes pour les entreprises que de vouloir absolument tout savoir sur l'ensemble de leurs clients», résument les deux économistes.
Une conclusion corroborée par nul autre que... le directeur de la recherche de Google ! Peter Norvig, l'Américain à l'origine des algorithmes du moteur de recherche, a dévoilé en 2010 que le rapport entre la qualité des solutions et la quantité des données se présentait toujours sous la forme d'une courbe en S :
> D'abord, lorsqu'on a trop peu de données, la qualité est insuffisante pour en tirer quoi que ce soit de profitable.
> Puis, arrive un moment où on a juste assez de données pour voir bondir les possibilités offertes par leur utilisation.
> Enfin, vient un autre moment où il ne sert plus à rien d'accumuler les données, car elles ne permettent plus de gagner en qualité.