Guide

Ce guide a pour but de vous aider à identifier la méthode de chiffrage utilisée sur votre message. Il vous indique les tests à effectuer et, en fonction des résultats, vers quoi vous tourner le plus probablement.
Il part du principe que le texte que vous cherchez à obtenir est en français, sans particularité (vous aurez des difficultés à obtenir un résultat clair sur "La Disparition"), et sera plus d'autant plus fiable que votre texte est long.

Dans un premier temps, il s'agit de savoir de quoi est constitué le message. Les analyses suivantes seront alors différentes.

Le message ne contient que des lettres.

Le premier test à effectuer est une analyse de fréquences des lettres dans le message.
La répartition des fréquences en français, ressemble à cela :
Fréquences en français
Il existe donc, pour un texte normal, un pic identifiable pour le E.
L'ordre des lettres, de la plus fréquente à la moins fréquente, est le suivant : E ASINT RLUOD CPM VGFBQH XJYZKW
Voici les pourcentages détaillés :

A B C D E F G H I J K L M
8.40 % 1.06 % 3.03 % 4.18 % 17.26 % 1.12 % 1.27 % 0.92 % 7.34 % 0.31 % 0.05 % 6.01 % 2.96 %
N O P Q R S T U V W X Y Z
7.13 % 5.26 % 3.01 % 0.99 % 6.55 % 8.08 % 7.07 % 5.74 % 1.32 % 0.04 % 0.45 % 0.30 % 0.12 %

En fonction du résultat, vous pouvez être confrontés aux 4 possibilités suivantes :

Si le graphique que vous obtenez ressemble sensiblement à celui présenté ci-dessus, vous avez certainement affaire à une transposition. Les lettres du message sont mises pour elles-mêmes mais ne sont pas dans le bon ordre.

Si le graphique que vous obtenez possède des fréquences similaires à celles indiquées ci-dessus mais réparties différemment et sur d'autres lettres, il s'agit d'un simple système de substitution monoalphabétique. Dans ce cas, comme dans le précédent, il est possible d'identifier un pic (fréquence comprise entre 14 et 20%) qui représente le E.
NB : si vous avez un graphique sensiblement proche de celui présenté ci-dessus mais pas de pic clair pour le E, il est possible que vous ayez affaire à une substitution simple à représentation multiple du E.

Si le graphique est plus "plat", que les fréquences des lettres sont presque les mêmes pour toutes les lettres, il va vous falloir faire d'autres tests afin de déterminer la méthode employée.
Calculez l'indice de coïncidence (IC) avec différents intervalles, pour tenter de trouver l'intervalle qui vous donnera des résultats proches de l'IC d'un texte en français, c'est-à-dire 0,074.

Si vous trouvez une valeur convenable, il est fort possible que ce soit une substitution polyalphabétique : vérifiez les fréquences des lettres pour chacune des sous-portions du texte. Si vous obtenez des graphiques proches de celui de référence mais décalé, cherchez du côté du chiffre de Trithème, Vigenère, Beaufort (et sa variante à l'allemande) ou Gronsfeld.
Si les histogrammes ne sont pas semblables à l’histogramme théorique, il peut d'agir d'une substitution polyalphabétique à alphabets incohérents et parallèles ou incohérents et non parallèles.

Si vous ne trouvez pas une valeur convenable, il est possible que l'unité chiffrante ne soit pas la lettre, il faut revoir l'analyse en découpant le texte en bigrammes ou polygrammes (3 lettres ou plus). Une analyse des répétitions dans le texte peut vous aider à déterminer l'unité.

Si l'unité chiffrante est la lettre : il peut s'agir d'une des substitutions polyalphabétiques évoquées précédemment avec une clef très longue ou infinie. Il peut s'agir plus spécialement du procédé autoclave.

Si l'unité chiffrante est le bigramme, vous pouvez être confrontés à une des 3 situations suivantes :

Le message ne comporte que 5 lettres et 25 bigrammes maximum : il peut s'agir d'une simple substitution monoalphabétique basée sur un carré de 25. Les 5 lettres étant utilisées à la fois comme index de ligne et comme index de colonne.

Le message ne comporte que 10 lettres et pas plus de 100 bigrammes, analysez les associations des lettres dans les bigrammes.

Vous pouvez identifier 2 groupes de 5 lettres : celles toujours en première position dans le bigramme et celle toujours en deuxième et il n'existe pas plus de 25 bigrammes différents. Il s'agit probablement d'une substitution à l'aide d'un carré de 25.

Vous pouvez identifier 2 groupes de 5 lettres : chaque lettre n'étant jamais associée avec elle-même ou une autre lettre de son groupe et il n'existe pas plus de 50 bigrammes différents. Il s'agit probablement d'une substitution homophonique à l'aide d'un carré de 25 à 2 représentations.
La même lettre peut, par contre, se trouver indifféremment en première ou deuxième position dans le bigramme.

Une lettre peut être associée avec elle-même ou les 9 autres et il n'y a pas plus de 100 bigrammes différents : en fonction de la répartition des fréquences vous pouvez être confrontés à une substitution homophonique à l'aide d'un carré de 25 à 4 représentations ou de type appareil à bande ou un tableau de 100 bigrammes.

Le message comporte plus de 10 lettres et plus de 100 bigrammes :

Si votre message contient 26 lettres et que les fréquences des bigrammes sont différenciées, vous pouvez avoir affaire à une substitution simple par bigramme, un répertoire ou un tableau chiffrant de plusieurs centaines de bigrammes.
Sinon, envisagez une substitution homophonique à renversement de fréquences avec un tableau de 25 ou un tableau de chiffrement.

Si votre message ne contient pas plus de 25 lettres, que vous avez des bigrammes fréquents, rares et très rares et aucun bigramme double, vous pouvez être confrontés à deux systèmes différents : le chiffre de Playfair ou le carré de 25 à 16 représentations.
En ce qui concerne le carré de 25 à 16 représentations, une lettre dans un bigramme ne peut pas être associée avec plus de 16 autres lettres différentes.
En ce qui concerne le chiffre de Playfair, plusieurs inverses de bigrammes fréquents sont eux aussi fréquents.

Si l'unité chiffrante est le polygramme (3 lettres ou plus) : il s'agit probablement d'un code ou d'un répertoire.

Si seulement quelques lettres sont présentes :
- Il n'y a que 2 lettres différentes : il peut s'agir de l'alphabet bilitère de Francis Bacon.
- Il n'y a que 3 lettres différentes : il peut s'agir de l'alphabet trilitère de Francis Bacon.
- Il n'y a que 9 lettres différentes : il peut s'agir du chiffre de Collon.
- Il n'y a que les lettres A, D, F, G, V, X : il s'agit du chiffre ADFGVX.

Le message ne contient que des chiffres.

Tout comme pour les messages ne contenant que des lettres, la première chose à faire est une analyse des fréquences, tout d'abord des chiffres seuls, puis des bigrammes si ce n'est pas probant ou des polygrammes en dernier lieu.

Si seuls deux ou trois chiffres sont plus fréquents que les autres, il est probable que le message ait été chiffré via le système monôme-binôme.

Si vous avez identifié que les messages est construit avec des bigrammes et qu'il n'y en a pas plus de 26, il est probable que ce soit une substitution simple par bigramme où un bigramme correspond à une lettre.
Particularité : si vous n'avez que 5 chiffres différents, dirigez-vous du côté du carré de Polybe.

Si vous avez plus de 26 bigrammes, il peut s’agir d’un système de substitution à une représentation par lettre. L'analyse est la même que pour les messages ne contenant que 10 lettres différentes.

Si le message n'est pas découpé de manière régulière (groupes de 1 à 5 chiffres), il peut s'agir d'un système de chiffrage basé sur un livre.

Le message contient des symboles ou des caractères spéciaux.

Si le message comporte des symboles et qu'il n'y en a que 26 différents maximum, remplacez arbitrairement chaque symbole différent par une lettre. Vous aurez ainsi un message ne comportant que des lettres et vous pourrez effectuer les analyses nécessaires via ce site.

S'il y a plus de 26 symboles différents, il est possible que vous ayez affaire, entre autre, à un système de code ou de répertoire, un symbole remplaçant alors un mot ou un groupe de mots. Mais vous pouvez être confrontés à une des autres solutions proposés dans les deux cas précédents, les ponctuations et les chiffres pouvant, eux aussi, être chiffrés.

Si ce sont des caractères spéciaux, il est possible que ce soit un des systèmes de chiffrement moderne.