Je vais vous parler dans cet article de MEMEX, le moteur de recherche du deepweb de l’armée américaine. Je parlerai aussi du site Darknetstats et du Darkweb. Mais je vais commencer par une petite introduction sur ce qu’est le Deepweb.

Sous licence CC BY-SA 4.0. Crédit : Aliqismet Aliyev

Qu’est ce que le Deepweb ?

Le Deepweb (ou web profond) est une partie de l’Internet qui n’est pas accessible avec les moteurs de recherche classique. Pour plusieurs raisons, les sites du Deepweb ne sont pas accessibles par ces moteurs de recherches. Soit, ils ne sont pas référencés volontairement. Soit, ils ne sont pas accessibles par les robots de moteurs de recherches pour d’autres raisons (les forums ou les bases de données par exemple sont difficiles à référencer).

Théoriquement dans ces cas, le robot du moteur de recherche ne référencera pas les pages ou le site.Dans ce cas, pour l’Internet mondial (et Google) le site n’existera pas (ou du moins, ne sera pas visible).

Le Deepweb renferme également une partie d’activités illégale qui s’appelle le Darknet ou Darkweb

 

 

MEMEX, moteur de recherche bodybuildé du Deepweb

MEMEX est développé par la DARPA (Department of défense) des États-Unis. L’enjeu pour MEMEX va être de répertorier les sites qui n’ont pas le fichier robots.txt qui permet habituellement aux moteurs de recherche d’indexer un site web.

Le but du projet serait de renforcer la lutte contre les trafics mondiaux (trafic de biens, trafic de drogue, trafic d’êtres humains), mais sous cette couverture pourrait se trouver l’idée d’une surveillance de masse. Ce ne serait pas la première fois que les services de renseignements US développeraient des outils de surveillance de masse.

Caractéristiques de MEMEX

D’après un article paru sur le site Affordance.info (source en bas de page) les grandes lignes du projet MEMEX seraient de :

  • passer outre les instructions du fichier robots.txt
  • indexer les sites « hors-réseau » comme ceux du réseau TOR
  • indexer également les « publicités » et autres « annonces sexuelles » (= les pages habituellement exclues de l’index de Google) pour en tirer des données d’usage géolocalisées (pour – par exemple – répondre à la question « qui a regardé des publicités pour des escort-girls et dans quelle ville ? » ou « qui cherche une Milf Anal Interracial au Texas »)
  • disposer de fonctionnalités très puissantes liées à la reconnaissance d’images (de « patterns » – motifs plus exactement), probablement en lien avec – notamment – des technologies de reconnaissance faciale
  • aller également fouiller dans le Dark Web mais aussi dans les protocoles du Dark Net.
  • intégrer un module de visualisation en graphe (un peu à la manière de Gephi) et serait capable de représenter sur le même graphe à la fois des pages web mais aussi les numéros de téléphone ou emails des utilisateurs les ayant consulté
  • ne pas être lien avec la NSA (bon là d’accord c’est assez peu crédible, d’autant que parmi les 17 partenaires connus du projet – dont bon nombre d’universités – on trouve Sotera Defense Solutions, un des fournisseurs officiels de technologie de la NSA, cette société ayant, sur le projet Memex, fourni le logiciel assurant la partie « navigateur »)
  • rester en phase « bêta » pendant 2 ans avant d’être – peut-être – partiellement ouvert au (grand ?) public

De plus:

  • le développeur principal en charge du projet est Christopher White, spécialiste du Big Data et cheville ouvrière de « l’Open Governement » de l’ère Obama.
  • le tout pour un budget estimé entre 10 et 20 millions de dollars.
  • la baseline du projet se résume à la formule suivante : « comment rendre visible l’invisible »

Au coeur du Darknet avec Darknetstats

Pour visiter les tréfonds du web, je vous conseille de faire un tour sur le site Darknetstats qui contient les dernières infos en matière de Darkweb.

On y retrouve pêle-mêle des informations sur des arrestations dans le cadre de trafics en tout genre (drogue, arme à feu).

Plus étonnant encore, on y trouve également la liste des différents marchés (markets) avec une petite description de chaque market, le niveau de sécurité, les commissions, les produits proposés presque autant d’informations qu’une société cotée en Bourse.

On retrouve même une section « scam market » qui répertorie les markets ayant arnaqués des clients (à éviter donc).

Le mieux est encore d’aller faire un tour sur le site pour s’en rendre compte.

Attention les liens vers le Darkweb sont en .onion, il faudra donc veiller à utiliser TOR pour y accéder.

Cet article est uniquement à des fins d’informations, faites attention si vous allez sur des sites du Darkweb, n’achetez rien sous peine de voir la douane débarquer chez vous !

Retrouvez également l’article « Welcome to the Darknet: The Underground for the Underground » que j’avais publié en 2017

Sources:

 

DeepwebMemex

Darkweb

Share This