Criptografía (CCCXXXVI): Criptoanálisis a una carta cifrada de Carlos I (I)

Criptografía (CCCXXXVI): Criptoanálisis a una carta cifrada de Carlos I (I)

En este post voy a intentar el criptoanálisis a una carta cifrada que Gómez Suárez de Figueroa, embajador en Génova, envió a Carlos I de España y V del Sacro Imperio Romano Germánico (en la imagen que ilustra este post en un retrato de la época en la que se escribió la carta. Fuente wikipedia).

La carta en cuestión se conserva en el Archivo General de Simancas (AGS), está fechada el 6 de septiembre de 1534, consta de ocho (8) páginas, aunque yo sólo voy a utilizar la primera de ellas para la parte esencial del criptoanálisis, y se encuentra parcialmente cifrada.

Antes de criptoanalizar la carta, la pongo en su contexto histórico: en 1528, Génova pasó de mantener lazos muy estrechos con Francia a la alianza con Carlos I de España y V del Sacro Imperio Romano Germánico, siendo Gómez Suárez de Figueroa su primer embajador en la República de Génova, quien desempeñó el cargo desde 1529 hasta su muerte en1569, jugando un papel clave en la política española en Italia durante el siglo XVI; mantuvo correspondencia constante con la corte imperial, informando sobre política italiana, movimientos militares y diplomacia mediterránea.

Empiezo con el criptoanálisis:

1.- La carta a criptoanalizar presenta en su primera y sexta hoja, respectivamente, sendos párrafos parcialmente cifrados que me pueden dar ya las primeras pistas sobre la asignación de dos símbolos a sus correspondientes letras del alfabeto.

Es decir, parece claro que el primer símbolo que aparece detrás de los textos en claro de ambos párrafos se correspondería con la letra 'd' y el segundo con la 'e', leyéndose en los textos descifrados:

"y si asi es v.mta. sera mas particularmte avisado de..."

y

"Asi mismo he dado cuenta de..."

Además, en la página 4 hay otro párrafo cifrado que me puede dar una pista sobre otra asignación de un símbolo a letra del alfabeto correspondiente.

Es decir, creo que lo más probable es que ese símbolo se sorresponda con la letra 'a'.

Aunque hay otros párrafos parcialmente cifrados que me podrían servir para ratificar las asignaciones anteriores e incluso para inferir nuevas asignaciones, de momento me voy a quedar con los dos primeros, es decir con las asignaciones de los símbolos a las letras 'd' y 'e', aunque creo que el tercero es también muy significativo y me lo guardo para más adelante.

Si consigo ratificar que la asignación de ambos signos es correcta habré dado un paso muy importante para lograr criptoanalizar la carta con éxito; tal y como decía en este post no es una buena idea dejar texto en claro sin cifrar, porque se pueden dar pistas importantes a los criptoanalistas.

Como se puede observar en la imagen anterior, de ser cierta la conjetura sobre la letra 'e', ésta estaría en el texto en claro en 84 ocasiones, lo que supone un 17,18% respecto al total de símbolos (489) de la primera hoja de la carta. Esto parece ratificar completamente la hipótesis, ya que el porcentaje de letras 'e', la más frecuente en español, que se espera encontrar en un texto escrito en español es de entorno a un 13,68% y el porcentaje obtenido es incluso mayor.

Continúo:

Por otra parte, el bigrama 'de' es uno de los más frecuente en español, y con la asignación de letras realizada hasta el momento, tal y como se puede ver en la figura anterior, el bigrama 'de' aparecería 17 veces (3,48% respecto al total).

Además, la letra 'd' aparecería en el texto en claro en 36 ocasiones, lo que representa un 7,36 % respecto al total de símbolos. El porcentaje de letras 'd' que se espera encontrar en un texto escrito en español es de aproximadamente el 5,86%.

Por tanto, hasta el momento tenemos lo siguiente:

Por lo que entiendo que queda ratificada mi hipótesis sobre la asignación de letras realizada hasta el momento.

Por otra parte, los tres bigramas más frecuente en español que empiezan por 'e' son: 'es', 'en', 'el' y 'er'.

En la imagen anterior se muestra que, en concreto, hay un símbolo que sigue inmediatamente a la 'e' en 19 ocasiones (3,89%), el último de los bigramas enmarcados en color azul; otro lo hace 12 veces (2,46%), el enmarcado en color morado; otro lo hace en 10 ocasiones (2,05%), el enmarcado en color verde; y, finalmente, otro en 9 ocasiones (1,84%), el enmarcado en color naranja.

Adicionalmente, cuento y establezo los porcentajes de aparición correspondientes a: 's', 'n', 'l' y 'r', datos que me pueden servir posteriormente para apoyar ciertas de las conjeturas que haga.

Por lo que hasta ahora tenemos:

Nos quedamos con todo esto, pero antes de conjeturar sobre la asignación de la letras: 's', 'n', 'l' y 'r', que son las útimas letras de los bigramas analizados, voy a intentar identificar otros símbolos, ya que éstos pueden aportar bastante para confirmar dichas asignaciones.

El trigrama más frecuente en español es 'que', por lo que intento detectar cuál es la secuencia de tres símbolos consecutivos más frecuente que termina con el símbolo que he asignado a la 'e'.

Tal y como se ve en la figura anterior, el trigrama 'que' aparece en 7 ocasiones (1,44% del total de trigramas que se pueden formar).

Por lo que hasta ahora tenemos:

Y en la décima línea ya puedo leer: 'duque de', por lo que creo voy bien.

Ahora voy a intentar averiguar si el símbolo que he dicho antes que podría corresponderse con la 'a' puede serlo conforme a su frecuencia de aparición.

Lo que parece confirmar que, efectivamente, ese símbolo se corresponde con la 'a', ya que aparece en 57 ocasiones (11,65%) y se espera que la letra 'a' aparezca en el texto en claro con una frecuencia entorno al 12,53% .

Y hasta aquí la primera parte de este criptoanálisis, para no hacer excesivamente largo este post. ¿Cómo podríamos seguir? En breve publicaré la segunda parte de este criptoanálisis (iré corrigiendo los errores que he podido cometer).

Para finalizar esta entrada decir que, si no me he equivodao en lo que llevo de criptoanálisis, me llama la atención lo fácil que está resultado esto y, en principio, entiendo que esta circunstancia se debe a:

- El error que se comete al dejar texto sin cifrar en algunos párrafos, lo que me ha permitido obtener símbolos correspondientes a las dos vocales más frecuentes del español ('e' y 'a') y a una consonante de frecuencia media ('d'). Además, como consecuencia, he obtenido uno de los trigramas más frecuente en español: 'de'.

- Los porcentajes obtenidos para las letras son muy similares a las frecuencias esperadas para ellas en un texto en claro escrito en español. lo que me lleva a pensar que, o bien se trata de una sustitución simple monoalfabética, en cuyo caso se trataría de un cifrado débil, o bien tratándose de una sustitución homofónica, que es lo que se espera de un cifrado de la época, se ha cometido un error de diseño en la tabla de homónos o se ha empleado muy mayoritariamente un único homófono por letra, o las dos cosas. En cualquier caso, está claro que la frecuencia de las letras correspondientes al español en el texto en claro se ha trasladado a los símbolos de la carta cifrada.

Quizás también te interese:

Comentarios