Le poids colossal des "données noires" dans les entreprises

Un centre de données du groupe français OVHcloud à Beauharnois, près de Montréal, en février 2017 au Québec - - © 2019 AFP
1,3 milliard de giga-octets soit l’équivalent d’1,3 milliard de DVD en haute définition. C'est le poids gigantesque de données froides générées par les entreprises chaque jour dans le monde.
Ces données froides - également appelées "données noires" ou encore "dark data", "données oubliées" - constituent l'ensemble des données collectées par les entreprises qui ne sont que très rarement voire jamais consultées et exploitées par les entreprises.
Elles sont générées par les interactions quotidiennes des utilisateurs, employés, clients, prestataires extérieurs. Elles englobent à la fois des données techniques (fichiers de log des serveurs), mais aussi les données de géolocalisation, les emails et fichiers attachés, les données d’anciens employés, des présentations, des résultats financiers, des enregistrements d’appels clients etc...
Et l’usage croissant des objets connectés (IOT) entraine dans le même temps une production massive de ces données froides.
52% des données stockées dans le monde
Globalement, elles représenteraient a minima 52% des données stockées dans le monde, pour une entreprise cela peut se compter en millions voire en milliards de fichiers. Des entreprises qui sont bien incapables de quantifier le volume de données dormantes par rapport aux données exploitables et exploitées.
Ces données qui dorment dans leurs serveurs ou les centres de données tiers (datacenter) leur coûtent en plus de l'argent. Elles encombrent d'abord les espaces de stockage (ce qui fait grimper la facture de ce poste de dépense pour l'entreprise) et consomment de l'énergie pour rien.
Selon une étude de "Le GreenIT", ces données comptent pour jusqu’à 14% de l’empreinte environnementale du numérique en France, soit 2,3 millions de tonnes de CO2 émises, des chiffres néanmoins très difficiles à vérifier mais une chose est sûre: ils ont tendance à augmenter de manière exponentielle chaque année.
2 milliards d'euros par mois
Côté finances, elles coûteraient 2 milliards d’euros chaque mois aux entreprises à l’échelle mondiale selon une étude du cabinet américain IDC.
"Cette inflation est due à certaines obligations légales transposées à la data, à la vie quotidienne des entreprises mais aussi et surtout à la peur des entreprises d'effacer ces données sur le mode 'on ne sait jamais'", explique à BFM Business, Emmanuelle Ertel, directrice générale Innovation & Trust du groupe Tessi, une entreprise de services qui se propose justement de faire le tri dans ces données (une centaine de clients en France, essentiellement dans le secteur banque & assurance).
Pour autant, la question ne semble pas encore mobiliser les entreprises et leurs directions.
"C'est un sujet prioritaire qui n'est pas priorisé. La plupart des entreprises estime que ces données froides ne génèrent pas un coût important mais avec la flambée des prix de l'électricité, le coût du stockage dans les datacenters (calculé au giga-octet, NDLR) risque bien de flamber également", prévient Emmanuelle Ertel.
Les entreprises ont "peur" d'effacer des données
Par ailleurs, la loi impose aux entreprises d'effacer certaines données. Ainsi, les données personnelles ne peuvent être conservées indéfiniment: une durée de conservation doit être déterminée par le responsable de traitement en fonction de l’objectif ayant conduit à la collecte de ces données. Ce principe de conservation limitée des données personnelles est prévu par le RGPD et la loi Informatique et Libertés.
Problème, "les politiques d'archivage sont souvent hétérogènes et au final, on ne sait pas où est la donnée notamment dans les PME qui disposent de peu de ressources. Plus l'entreprise est petite, plus elle accumule. Un peu comme le grand public qui reproduit ses habitudes du papier avec la data. Le premier problème, c'est donc l'accès" ,souligne la spécialiste.
Ensuite, il s'agit de faire le tri entre les données froides qui doivent le rester, les données froides exploitables et les données froides à supprimer définitivement.
"Peu d'entreprises sont conscientes de la richesse de leurs données froides, c'est un patrimoine mais on ne le voit pas. Pour le reste, il faut arrêter d'avoir peur dans la suppression des données, surtout quand la loi l'exige" affirme la responsable.
Et de mettre en avant différentes actions: "repenser l'archivage, établir des politiques de purges dans le respect des normes, établir les moyens d'exploitation, le tout dans une logique de comptabilité carbone".