Le Dark web en chiffres

chiffres du 28 janvier 2021

Le Dark web fait souvent l’objet de fantasmes, en raison du type de contenu que l’on peut y trouver. Le grand public ne dispose que de peu d’éléments d’information objective sur ce périmètre.

Cette publication, basée sur les données collectées par Aleph Search Dark depuis octobre 2014, a pour but d’apporter des éléments volumétriques pour mieux connaître le Dark web. Pour simplifier l’approche, nous aborderons ici le réseau Tor (les sites en .onion), qui constitue la partie la plus importante de ce que nous nommons le Dark web. Les réseaux moins connus tels que i2p ou Freenet ne seront pas inclus dans les chiffres présentés ici.

Le Dark web : un périmètre restreint

Contrairement à son image de créature tentaculaire insaisissable, le Dark web est un périmètre relativement restreint. En décembre 2020, nous dénombrions « seulement » 76 300 sites actifs (sites accessibles).

En prenant en compte la pratique du mirroring*, qui consiste à créer des copies de sites à des adresses différentes, le Dark web se limite même à 18 000 sites. En effet, certains sites sont répliqués en de très nombreux exemplaires (ou « miroirs »).

Ainsi, un site qui propose de multiplier vos bitcoins par 200 a été « cloné » sur plus de 5 000 adresses différentes. En additionnant tous les miroirs des sites disposant chacun de plus de 100 miroirs, nous arrivons à un volume de 54 000 domaines.

Nous pouvons donc considérer que 70% de la masse totale des domaines onion actifs à ce jour est composée des miroirs de seulement 62 sites.
* Cette thématique fera l’objet d’un article dédié.

Le Mirroring de masse, une pratique intensifiée
depuis la pandémie Covid 19

La pratique de mirroring de masse semble s’être intensifiée à l’occasion de la pandémie de covid-19.

Le graphique ci-contre montre la détection de nouveaux sites par Aleph Search Dark entre le mois de décembre 2017 et le mois de décembre 2020.

Entre le 1er mars 2020 et le 1er juillet 2020, ce sont plusieurs dizaines de milliers de nouveaux domaines qui ont ainsi été détectés.

Nous observons même un pic significatif durant la dernière semaine de mai 2020, avec la détection de 5 650 domaines. Il s’agit dans la très grande majorité de miroirs de sites qui proposent des opérations financières au caractère pour le moins douteux.

Evolution des sites miroirs du Dark Web

Le tableau ci-dessous donne les noms des dix sites les plus dupliqués et le nombre de miroirs créés durant cette période de quatre mois.

Nom du site

Miroirs

[Official & Original] BITCOIN x200 Service

3 966

HD Wiki

1 305

Automated Paypal And Credit Card Market

1 230

Amazon Gift Cards

1 195

Buy Real Money | The Way

1 185

Stolen Cards | Plastic Sharks

1 170

Best Financial Service

1 132

Fast Money | Accounts & Transfers

1 119

Millionaire Private Club

1 118

easyCARDS

1 109

Captures d’écran des pages d’accueil des 10 sites les plus dupliqués

Capture d'écran des pages accueil des 10 sites les plus dupliqués sur le Dark Web

Une courte durée de vie des sites

Ces très nombreux miroirs, dont la finalité reste à déterminer, auront pour la plupart probablement disparu dans quelques mois, éventuellement remplacés par d’autres miroirs.

Une des caractéristiques propres au Dark web est en effet sa très grande volatilité : les sites ont une durée de vie moyenne très courte. Si nous nous basons sur les domaines actifs à ce jour, leur durée de vie moyenne n’est que de neuf mois. Si nous analysons les 300 000 domaines onion détectés par Aleph Search Dark depuis octobre 2014, cette longévité moyenne tombe à sept mois et demi.

Cette faible durée de vie moyenne ne doit pas occulter la longévité de certains sites dont la création est antérieure à la mise en service de notre moteur de recherche. Le graphique ci-contre donne la répartition par « âge moyen » des sites onions actifs à ce jour.

Parmi les sites actifs les plus anciens, nous pouvons citer à titre d’exemple.

Nom du site
Imperial Library of Trantor
We Fight Censorship
DeepSec
ccPal Store – CCs, CVV2s, PayPals, Ebay accounts and more
HSmon – The Hidden Service monitor
Keybase
Euro Guns – Number one guns dealer in onionland
Executive Outcomes
Rent-A-Hacker
US Fake ID Store – Drivers Licenses for most states with real holograms
Répartition des domaines du dark web par ancienneté

Capture d’écrans des sites actifs les plus anciens

Sites actifs les plus anciens

Les langues présentes sur le Dark

Pour finir, quelques éléments sur les communautés linguistiques présentes sur le Dark web.

Sans réelle surprise, l’écrasante majorité des sites onion est anglophone. L’anglais est en effet la langue choisie dès lors que la cible d’un site est un public international.

Si nous faisons abstraction des miroirs et que nous ne considérons que les 18 000 sites uniques, nous constatons qu’en dehors des sites anglophones, la répartition des communautés linguistiques les plus représentées est la suivante :

Répartition des langues du dark web
Un volume de 3 000 sites est de langue indéterminée, le plus souvent en raison du contenu non rattachable à une langue (fichiers bruts de fuites de données).