Chelsea Degonville
Peu de gens connaissent réellement l’existence de la face cachée du web. Beaucoup sont même étonnés lorsque ils apprennent que les moteurs de recherches utilisés habituellement n’indexent qu’une infime partie du contenu réellement présent dans l’Internet. Il existe également une nuance entre le dark web, le deep web, et le dark net que l’on confond souvent. Ces termes semblent proches mais font références à des nuances particulières qu’il convient de distinguer. Le contenu présent sur le deep web représente 96% du contenu total du web, non indexable et non traçable. Cela correspond à 500 fois la taille estimée du web de surface que nous utilisons tous. Cette répartition est d’ailleurs très souvent représentée par un iceberg, dont la partie cachée est toujours la plus importante…
Ces termes de deep web et dark net sont assez évocateurs et laissent entendre qu’il ne s’agit pas, à première vue, de quelque chose de positif… Ces noms peuvent même paraître un peu effrayants et beaucoup de gens ne savent pas réellement à quoi ils font référence. La première idée qui nous vient quand nous pensons « dark web » est généralement liée à la vente illicite de drogues, de réseaux pédophiles, de ventes d’armes, ou de réseaux criminels en tout genre. Mais si ce web caché et obscur est celui de la transgression, là où tout semble possible, ne serait-il pas probable que des espaces de libertés se créent sur le même modèle ? Cette partie du web est obscure car elle est inconnue et inaccessible à la plupart des utilisateurs, mais elle existe et représente à elle seule presque la globalité des sites présents sur Internet. Sauf que ces sites ne sont pas indexés par nos navigateurs habituels…
Il nous faut donc nous interroger sur cet espace virtuel que constitue ce web obscur. Selon un article de The Journal of Electronic Publishing publié 2011, la recherche sur Internet pourrait s’apparenter de façon imagée à un filet de pêche que l’on jetterait à la surface de l’eau. Les plus grandes richesses se trouvent toujours en profondeur, tout comme certaines informations du Web qui ne sont pas indexées par les moteurs de recherches. Il y a donc un web de surface que nous utilisons tous les jours via nos moteurs de recherches comme Google, qui vont chercher des informations indexées. C’est à ce moment que l’on peut se rendre compte que la masse de contenus et d’informations qui nous est accessible via Google n’est en fait qu’une infime partie de tous les contenus réellement présents sur Internet. Les pages situées sur cette partie cachée d’Internet ne sont pas référencées par nos moteurs de recherches, comme nous allons l’expliquer plus loin. Le deep web représente un espace de liberté quasi-totale et non-réglementée permet à des individus de vendre à peu près tout ce qui existe sur la planète, y compris des humains.
La face immergée de l’iceberg…
Le dark web est une petite partie du deep web. Il ne s’y limite pas et il est connecté à Internet. Il ne faut pas confondre le « dark web » avec le « dark net ». Accéder au dark web demande des logiciels et des protocoles particuliers. C’est le contenu du World Wide Web qui se trouve sur le dark net. Le dark net est donc un réseau overlay, c’est-à-dire qui se superpose à un autre réseau et qui utilise des protocoles particuliers (notamment l’anonymisation qui est un point central). Le partage se fait donc de façon anonyme et les individus qui communiquent par ce biais ne risquent pas (ou peu) d’être remarqués par le gouvernement par exemple. De manière générale nous pourrions dire que le dark net désigne surtout l’accès à des sites non-commerciaux, souvent associés à des activités illégales. Le dark web désigne ainsi le contenu, et le dark net représente quant à lui l’infrastructure de la mise en ligne de ce contenu.
Pourquoi les navigateurs comme Google ne référencent pas les sites situés dans le deep web ?
Le fonctionnement de l’indexation est assez compliqué mais nous allons tenter de l’expliquer plus simplement. Les moteurs de recherches traditionnels des robots d’indexation qui suivent des hyperliens à partir d’une page pivot. Les hyperliens sont donc retenus par le système et permettent de repérer la fréquence des visites. Il s’agit donc d’un logiciel qui va explorer de façon automatique le web et qui collecte le contenu qui s’y trouve. Cela permet ainsi aux moteurs de recherches d’indexer ces informations. Pour qu’une page soit indexée, il faut qu’elle soit statique et liée à d’autres pages par des hyperliens. Si le robot d’indexation (le « web spider » en anglais, qui fait référence à une immense toile d’araignée) ne suit pas certaines règles, des ressources peuvent alors lui échapper. Le contenu présent dans le web profond se trouvent généralement sur des pages dynamique, dont les hyperliens sont créés à la demande et peuvent changer constamment. Les moteurs de recherches habituels ne peuvent donc pas indexer ces pages mouvantes. Les fichiers sont partagés grâce à des ordinateurs connectés à Internet qui portent l’information recherchée. C’est également ce qu’on appelle du peer-to-peer ou P2P, qui est un modèle de réseau informatique dans lequel chaque client est également un serveur. Cette méthode rend difficile la localisation. Comme nous allons le voir, il est également possible de passer par des navigateurs particuliers pour échapper à cette indexation.
Le deep web est donc bien différent du web de surface (accessible via nos moteurs de recherches traditionnels). Les contenus du deep web sont situés dans des bases de données qui ne produisent que des résultats dynamiques qui répondent à une requête directe. Il s’agit donc de la partie d’Internet qui n’est pas indexée et dans lequel tout le monde peut créer un site Internet. Nous allons voir comment il est possible d’y accéder et quels sont les différents contenus que l’on peut y trouver.
Des navigateurs bien spécifiques…
Tor (The Onion Router) est l’un des navigateurs les plus connus permettant d’accéder au contenu présent sur le deep web. Il fait donc partie du dark net (qui rappelons le est un système de peer-to-peer qui rend anonyme l’utilisation de ses internautes). Le téléchargement et l’installation de ce navigateur est parfaitement légale et pour cet exercice j’ai pu l’installer avec un ami qui fréquente souvent le deep web. Lorsque on utilise Tor, notre requête passe par une multitude serveurs comme nous l’avons vu plus tôt, ce qui permet de protéger son adresse IP, et donc de ne pas être reconnu. Tor signifie donc le « réseau en couche d’oignon », c’est-à-dire qu’il est composé de plusieurs couches qui correspondent à ces différents serveurs. Une fois le navigateur lancé, j’ai pu commencer à faire des requêtes sur ce navigateur. Si l’on accède à la librairie Tor, il est possible de consulter une liste de mots-clés fréquemment recherchés par les utilisateurs, qui représentent des thèmes ou des catégories de contenus.
Comme dans notre exemple ci-dessous, réalisé sur mon ordinateur, nous pouvons voir qu’il existe une multitude de catégories de contenus, comme par exemple « drugs », « nutrition », « religion », ou encore mieux « so-called-terrorist-documents ». Nous voyons donc que les contenus sont extrêmement divers et variés, il n’existe évidemment pas sur le deep web des contenus exclusivement illicites ! Il s’agit tout d’abord d’une très grande mine d’informations qui regorgent de contenus scientifiques, littéraires, politiques etc. Il ne faut pas oublier de démystifier le deep web, qui ne contient absolument pas que des contenus dangereux et interdits. Cependant il faut toujours y naviguer avec advertance et attention.
Lorsque je tape le mot « armes » dans la barre de recherches je tombe ensuite sur des résultats présentés dans la capture d’écran ci-dessous :
On ne cherche pas ce que l’on cherche sur le deep web comme sur Google. Comme nous l’avons vu, les contenus ne sont pas indexés. Il est donc impossible de tomber sur une page de résultats comme sur nos navigateurs traditionnels. Pour rechercher sur le deep web il faut savoir ce que l’on cherche et donc taper une adresse précise. La page ci-dessous présente des sites .com ou .fr, il s’agit donc de résultats correspondant au web de surface. Avec la personne qui m’a guidée sur le deep web, j’ai pu avoir accès à des url précises, dont l’extension n’était plus .com ou .fr :
J’ai donc poursuivi mon avancée dans le web obscur. En sélectionnant différents liens je suis tombée sur des sites proposant l’achat d’armes par exemple. Lors de mes recherches, j’ai eu l’occasion de me rendre sur un autre site qui propose différents produits selon des catégories bien définies. Décidant d’explorer la catégorie « faussaires », je suis tombée sur la possibilité d’acheter 15 faux billets de 20€ pour la somme de 195€, qui correspond en fait à 0, 26956 btc. Il s’agit en fait d’une monnaie spécifique et virtuelle, comme dans les jeux vidéo où il existe souvent une monnaie fictive qui permet d’acheter des objets ou des vies. Cette monnaie s’appelle le bitcoins. Elle correspond à une certaine somme en euros et elle est intraçable. Il suffit de convertir une somme voulue en euros en bitcoins afin de pouvoir acheter quelque chose sur le deep web.
Cette monnaie est apparue en 2OO9, et permet un système de paiement peer-to-peer et crypté. Elle a été inventée par Satoshi Nakamoto. Il existe même un cours du bitcoin, que j’ai pu trouver facilement sur le site bitcoin.fr.
Ce système permet de fonctionner sans passer par les banques. Il est ainsi possible d’effectuer toutes sortes de transactions partout dans le monde, sans limites, et de façon anonyme. IL faut pour cela se créer un compte, comme sur n’importe quel site marchand en ligne.
Le deep web, un espace de liberté malgré tout ?
Le deep web semble bien être un espace virtuel où tout est possible, de l’achat d’armes en passant par la pédopornographie. Si ce web caché permet à des individus de s’adonner à toutes sortes de pratiques illicites comme nous avons pu le voir plus tôt, il paraît alors acceptable qu’il soit également un espace de liberté pour des populations ou des communautés opprimées, mais également un espace de communication et d’échanges à part entière. L’anonymisation provoque énormément de dérives et laisse cours à la cybercriminalité, mais elle permet également à des individus qui n’en n’ont pas le droit pour des raisons diverses, de s’exprimer librement sans être reconnus. Le dark web n’est pas seulement utilisé par des trafiquants d’armes ou autre, mais également par des personnes opprimées par des Etats totalitaires par exemple.
Depuis la série d’attentats perpétrés entre le 7 et le 9 janvier en France, l’utilisation d’Internet et du web est au cœur des préoccupations. La question se pose concernant l’utilisation de ces derniers dans le processus de recrutement, de communication et de préparation de ces actes criminels. Dans un article LaCroix sur le dark web, Solange Ghernaouti directrice du Swiss Cybersecurity Advisory & Research Group, à l’Université de Lausanne explique que
« Les criminels ont recours à ce type de technologies pour anonymiser leurs échanges d’informations, ne pas être identifiés ni localisés, et de ce fait, ne pas être inquiétés par les forces de l’ordre. En rendant impossible la surveillance ou les filatures numériques, TOR permet l’anonymat et d’avancer masqué dans l’Internet.»
Il est également très aisé de se faire escroquer sur le deep web selon mon ami, puisqu’il m’explique que « c’est très difficile de savoir si l‘on doit faire confiance à quelqu’un. Les vendeurs peuvent changer les adresses, ce qui pose beaucoup de problèmes quand on veut être sûr d’obtenir ce que l’on veut ! C’est pour ça que je n’ai jamais rien acheté via le deep web. Je m’y rends plutôt dans un but informationnel et pour accéder à des ressources cachées que ne propose pas forcément Google etc. Je m’intéresse aussi au réseau anonymous par exemple et il n’y a que là que je puisse trouver des infos et contacter des gens… », me dit-il lorsque je lui pose la question de la sécurité des achats sur le deep web.
L’espace anonyme que propose le deep web est selon Solange Ghernaouti un reflet de notre réalité sociale. Elle explique dans cet article que le web permet de faciliter les actions criminelles, et surtout son passage à l’acte puisqu’il permet l’anonymat. En effet, il semble plus facile de passer à l’acte se sachant anonyme et à l’abri derrière son écran…
Cependant le dark web est aussi l’espace de ceux qui n’ont pas droit à la parole où encore de ceux qui souhaitent préserver leur intimité et leur identité comme les dissidents d’états non démocratiques par exemple. Certains artistes décident même de s’aventurer dans cet océan virtuel caché, comme nous l’explique Elsa Trujillo dans son article sur Microsoft, regards sur le numérique. Un producteur de musique électronique relativement connu, Aphex Twin, a commencé a fait ses premiers pas sur le deep web. Il pense que celui-ci permettrait de mieux contrôler la portée et la diffusion de ces morceaux, contrairement à Facebook ou Twitter qui empêchent parfois une publicité cohérente. Il s’agirait ainsi de retrouver un espace dénué de toute publicité et de toute pollution visuelle pour se recentrer sur l’essence même de la musique.
Nous voyons donc que le deep web est un espace de liberté sans limites et très paradoxal. Il propose à la fois des armes, drogues, et pire encore, mais il permet aussi à des individus privés de leurs droits les plus fondamentaux de s’exprimer en tout anonymat. La multiplication et la montée des terrorismes posent également la question de la régulation impossible de cet espace mouvant et sombre. Le deep web pourrait devenir un véritable problème pour les autorités qui souhaitent de plus en plus imposer une surveillance du net, notamment avec le projet de loi sur le renseignement adopté en mai 2015 par l’Assemblée Nationale en France. Cette adoption s’est réalisée et ce malgré une opposition massive de la part de la population française. Le deep web reste alors un espace de liberté avant d’être le terrain de la cybercriminalité qui ne fait qu’utiliser l’anonymat comme moyen d’action et de communication.
***
Bibliographie / Webographie
- Bergman, M.K., « White The Deep Web : Surfacing Hidden Value », The Journal of Electronic Publishing, 2001. URL : http://quod.lib.umich.edu/cgi/t/text/text-idx?c=jep;view=text;rgn=main;idno=3336451.0007.104
- « Web, 4% seulement du contenu est visible, où se cache le Deep Web ? », GinjFo, archive, 2016, URL : http://www.ginjfo.com/actualites/divers/web-4-seulement-du-contenu-est-visible-ou-se-cache-le-deep-web-20150528
- « La face cachée du dark web », Flore Thomasset avec Frédérique Schneider, le 08/12/2015, URL : http://www.la-croix.com/Ethique/Sciences-Ethique/Sciences/La-face-cachee-du-dark-Web-2015-12-08-1390141
- bitcoins.fr, le site d’informations sur le bitcoin. URL: https://bitcoin.fr/qu-est-ce-que-bitcoin/
- Terbium Labs, « The truth about darknet » URL:https://terbiumlabs.com/darkwebstudy.html
- Revue Réseaux ; 2016/3-4 (n° 197-198), Crime en ligne, 300 pp., Edition La Découverte
- LévyPierre, « Au-delà de Google. Les voies de « l’intelligence collective » », Multitudes, 1/2009 (n° 36), p. 45-52.URL :http://www.cairn.info/revue-multitudes-2009-1-page-45.htm
- Jérôme Wysocki, L’Obs, Le deep web, bientôt dernier espace de liberté sur internet ?, le 12 avril 2015 à 20h02, Url : http://tempsreel.nouvelobs.com/tech/20150410.OBS6927/le-deep-web-bientot-dernier-espace-de-liberte-sur-internet.html
- La quadrature du net, Internet et libertés, L’Assemblée nationale vote la surveillance de masse des citoyens français!, le 5 mais 2015. URL: https://www.laquadrature.net/fr/lassemblee-nationale-vote-la-surveillance-de-masse-des-citoyens-francais
- BulingeFranck, Moinet Nicolas, « Introduction », Hermès, La Revue, 3/2016 (n° 76), p. 14-21.
URL : http://www.cairn.info/revue-hermes-la-revue-2016-3-page-14.htm
- Microsoft: Regards sur le numérique, Le deep web : un nouvel espace de liberté pour les artistes ?, 29 septembre 2014, URL : https://rslnmag.fr/le-deep-web-un-nouvel-espace-de-liberte-pour-les-artistes/