Le « Deep Web » constitue-t-il un enjeu de communication pour les entreprises ?

La simple évocation de la notion de « Deep Web » (« Web profond » en français) suffit à faire tressaillir les esprits et y associer aussitôt les connotations les plus sulfureuses dont médias et experts en cybersurveillance brandissent souvent le spectre. Pourtant, cette sorte d’Internet parallèle et méconnu n’est pas qu’un repère de terroristes et de trafiquants en tout genre. Il s’y déroule aussi beaucoup de conversations et de publications qui échappent à l’indexation classique des moteurs de recherche. Tour d’horizon d’un espace digital qui peut s’avérer utile en certains cas pour des stratégies de veille et de communication.

Contrairement à ce que la pensée commune véhicule fréquemment, Internet ne se restreint pas uniquement au périmètre digital du Web sur lequel plus de 4 milliards de personnes se connectent et surfent quotidiennement. Cet espace familier des internautes n’est en fait qu’une infime partie d’Internet. S’il est assimilé à ce dernier, c’est parce que son accès est aisé grâce à des navigateurs comme Chrome, Firefox, Safari ou Edge (pour ne citer que les plus importants) qui fonctionnent selon un protocole technique qui permet de passer de site en site et de consulter les contenus qui sont proposés, voire d’en éditer soi-même. Ce territoire s’appelle le « World Wide Web ». D’où le fameux acronyme www qui précède les adresses des sites Web. En revanche, Internet est nettement plus vaste puisqu’il inclut d’autres fonctionnalités comme le courrier électronique, la messagerie instantanée, les réseaux de partage de fichiers en « peer-to-peer ». Dans cette galaxie Internet, on trouve aussi un réseau spécifique appelé Darknet qui requiert des logiciels spéciaux (comme Tor, le plus célèbre d’entre eux) pour y pénétrer et évoluer de manière « underground ». C’est l’addition de tous ces réseaux hors « World Wide Web » qui constitue le fameux « Deep Web ».

Le jeu des 4 familles du Deep Web

Un point commun unit toutes les briques du « Deep Web ». Elles ne sont pas spontanément visibles depuis un navigateur traditionnel car elles échappent aux filets algorithmiques des moteurs de recherche qui indexent en permanence les contenus estampillés « www ». Experts en informatique, les Américains Chris Sherman et Gary Price ont distingué quatre catégories majeures formant le Deep Web. La première est qualifiée de « web opaque » (1). Cet ensemble englobe des pages qui pourraient être techniquement indexables mais qui ne le sont pas parce que leur créateur a choisi de les rendre non-indexables par les robots de Google et consorts. La deuxième catégorie est assimilée au « web privé ». Là aussi, les pages possèdent les critères techniques nécessaires à l’indexation mais échappent au radar des moteurs car elles ont un mot de passe ou un système de cryptage pour bloquer l’accès au premier venu.

La troisième catégorie dite « web propriétaire » (assez similaire dans l’esprit à la seconde) est aussi à l’écart car elle exige des mots de passe et des codes utilisateurs pour être visualisée. C’est par exemple le cas de services bancaires en ligne ou même de sites personnels partagés par une petite fraction d’individus. La dernière catégorie dite « web invisible » est celle qui alimente les spéculations les plus fortes car elle fonctionne sur des formats techniques non-reconnaissables par Google et ses concurrents et nécessitant des logiciels ad hoc pour y naviguer. C’est dans cette portion que se situe le sulfureux Darknet où contrebandiers, truands, terroristes, pirates informatiques et compagnie se livrent à des activités illégales.

Le « Dark social » en ligne de mire

Mises bout à bout, les catégories du « Deep Web » représentent un volume de données et de contenus bien plus astronomique que la pointe émergée et publique qu’est le « World Wide Web ». Ce volume est estimé à 500 fois plus abondant que le Web de M. Toutlemonde et pèserait environ 96% de l’intégralité d’Internet (2) ! Autant dire que le Big Data collecté sur le Web ouvert devient un nain digital comparé à cette masse digitale vertigineuse ! Sans parler de l’affinage potentiel exceptionnel en termes d’informations que semble receler le « Deep Web ». Dans ce dernier, il est un gisement de données qui fait fortement saliver les convoitises des agences et des entreprises. Celui-ci a été baptisé « Dark Social ». Mais cette fois, rien à voir avec le Darknet où grouillent des profils peu recommandables. Ce concept fait référence à toutes les données échangées sur les réseaux sociaux mais non-accessibles publiquement. On y trouve notamment les messageries sociales de type Messenger, WhatsApp, Telegram dont l’usage est en croissance soutenue par les consommateurs pour communiquer efficacement mais sans copier la terre entière.

D’après une étude menée par The Atlantic, la part du dark social dans l’ensemble des échanges sur les réseaux sociaux atteindrait plus de 56% (3). Pas étonnant dans ces circonstances que l’on assiste depuis deux ans au développement d’agents conversationnels (plus connus sous le nom de chatbots) par les marques et les entreprises. Pouvoir engager un dialogue plus direct et immédiat permet en retour de glaner des informations plus fines (peut-être plus sincères aussi ?) qui n’auraient sans doute pas été partagées en mode public. Le phénomène est en tout cas loin d’être une lubie de communicant. La régie publicitaire américaine Radium One a publié en 2017 une étude intitulée « The Dark side of Mobile sharing ». Il en ressort que le Dark Social concerne des publics qui sont nettement plus rétifs à laisser des infos sur les réseaux sociaux publics et qui se tournent volontiers les messageries privées. Les consommateurs de plus de 55 ans représenteraient ainsi 46% des utilisateurs de messageries privées, dans quasiment tous les secteurs (4). On comprend dès lors mieux pourquoi des pans entiers du Deep Web commencent à aiguiser les intérêts (d’autant que les objets connectés et les assistants personnels comme Amazon Echo et Google Home vont à leur tour générer des mégadonnées) et à voir l’apparition progressive de moteurs de recherche capables d’aller piocher dans les données non structurées et/ou cachées du Web profond. A l’instar du programme Memex développé par l’agence d’Etat américaine DARPA (Defense Advanced Research Projects Agency) bien que son objectif premier soit de repérer et lutter contre les trafics qui sévissent sur le Deep Web et Darknet en particulier.

Veille & signaux faibles : vers une granularité plus pointue ?

Au-delà du Dark Social, le Deep Web constitue une autre opportunité pour les entreprises : augmenter significativement le spectre et la puissance de leur veille informationnelle. Aujourd’hui, il existe de nombreux logiciels performants pour repérer des thématiques conversationnelles naissantes, cartographier des communautés en ligne, évaluer l’influence réelle de profils sociaux ou encore mieux comprendre les interactions entre groupes et les propagations de contenus qui en résultent. Néanmoins, le périmètre relève toujours du Web public qu’il s’agisse de sites, de réseaux sociaux ou de forums de discussion. Si le Deep Web devient possiblement lisible avec de nouvelles technologies de datamining et de veille, il est fort à parier que la granularité des informations récoltées s’en trouvera largement accrue. Les offensives réputationnelles d’activistes et les cyberattaques pour voler des données contre les entreprises se préparent aussi dans les profondeurs d’Internet. Un signal faible repéré sur Twitter ou autre est peut-être déjà la manifestation d’une crise dont les prémisses ont démarré sur le Deep Web.

Fondateur et président de l’éditeur de solutions de veille KB Crawl, Bruno Etienne considère que cette veille dans les couches basse d’Internet doit s’imposer comme une priorité stratégique pour les entreprises même si tout n’est pas encore techniquement faisable (5) : « Pour l’heure il est techniquement impossible de veiller le darkweb de façon automatisée. Car pour infiltrer les réseaux du darkweb, hyper-contrôlés, il faut forcément appliquer une démarche humaine. Les hackers qui y sévissent veillent à la sûreté des échanges. Et ils ont toujours un coup d’avance ! Si veiller le darkweb reste utopique en 2018, accéder aux milliards de pages du deepweb est devenu une possibilité sur laquelle les organisations à fort enjeu économique ou stratégique ne peuvent plus faire l’impasse ».

Jusqu’où placer le curseur ?

Bien qu’il soit plus compliqué à investir et nécessite des compétences pointues, le Deep Web va inéluctablement s’inviter à l’agenda stratégique des communicants et des marketeurs. Si elle assure aujourd’hui la fortune et la puissance des GAFA, la donnée informationnelle est de plus en plus fondamentale dans l’élaboration de stratégies de communication et marketing pertinentes et efficaces. Accéder plus profondément au Deep Web et ses divers recoins constitue une ressource supplémentaire. Mais comme pour les données issues du World Wide Web, le respect de certaines règles et l’usage à bon escient vont également aller de pair à mesure que le Deep Web devient exploitable. C’est là tout l’aspect délicat et sans doute paradoxal du sujet ! Si le Deep Web et ses corollaires sont autant usités, c’est justement pour se tenir à l’écart des moteurs de recherche et des logiciels de veille classiques. Qu’il s’agisse d’individus désireux de protéger leur vie privée et leurs données personnelles ou d’opposants en lutte contre des régimes dictatoriaux, le Deep Web est une alternative au World Wide Web qui est scruté sous toutes les coutures (ou presque).

Or, à en juger par les régulières levées de boucliers contre le pistage intensif des internautes et les régulations de plus en plus drastiques (comme le récent RGPD), la quadrature du cercle est loin d’être résolue, Deep Web y compris. Jusqu’où ne pas aller trop loin et de façon intrusive tout en pouvant disposer d’une connaissance fine et représentative de son écosystème et de ses acteurs ? Sans doute en cultivant des rapports de confiance entre les différentes parties prenantes qui incitent alors à l’échange plutôt qu’en donnant le sentiment qu’on extorque des données à l’insu des personnes qui choisissent de les rendre inaccessibles. Le débat est loin d’être clos et rebondira même avec le Deep Web.

Sources

– (1) – Théo Roux – « Dark Analytics : les entreprises à l’assaut du Deep Web » – L’Atelier Numérique – 29 mai 2017
– (2) – Ibid.
– (3) – Ibid.
– (4) – Ibid.
– (5) – Cynthia Glock – « #Cyberdayinfo. Veiller le deepweb, nouvel objectif stratégique des organisations ? » – CyberDay.info – 6 juin 2018

Pour en savoir plus



Un commentaire sur “Le « Deep Web » constitue-t-il un enjeu de communication pour les entreprises ?

Laisser un commentaire


Votre adresse de messagerie ne sera pas publiée.