Ir al contenido principal

Criptografía (CCCXXXVI): Criptoanálisis a una carta cifrada de Carlos I (I)

En este post voy a intentar el criptoanálisis a una carta cifrada que Gómez Suárez de Figueroa, embajador en Génova, envió a Carlos I de España y V del Sacro Imperio Romano Germánico (en la imagen que ilustra este post en un retrato de la época en la que se escribió la carta. Fuente wikipedia).

La carta en cuestión se conserva en el Archivo General de Simancas (AGS), está fechada el 6 de septiembre de 1534, consta de ocho (8) páginas, aunque yo sólo voy a utilizar la primera de ellas para la parte esencial del criptoanálisis, y se encuentra parcialmente cifrada.

Antes de criptoanalizar la carta, la pongo en su contexto histórico: en 1528, Génova pasó de mantener lazos muy estrechos con Francia a la alianza con Carlos I de España y V del Sacro Imperio Romano Germánico, siendo Gómez Suárez de Figueroa su  primer embajador en la República de Génova, quien desempeñó el cargo desde 1529 hasta su muerte en1569, jugando un papel clave en la política española en Italia durante el siglo XVI; mantuvo correspondencia constante con la corte imperial, informando sobre política italiana, movimientos militares y diplomacia mediterránea.

Empiezo con el criptoanálisis:

1.- La carta a criptoanalizar presenta en su primera y sexta hoja, respectivamente, sendos párrafos parcialmente cifrados que me pueden dar ya las primeras pistas sobre la asignación de dos símbolos a sus correspondientes letras del alfabeto.
Es decir, parece claro que el primer símbolo que aparece detrás de los textos en claro de ambos párrafos se correspondería con la letra 'd' y el segundo con la 'e', leyéndose en los textos descifrados:

"y si asi es v.mta. sera mas particularmte avisado de..."

y

"Asi mismo he dado cuenta de..."

Además, en la página 4 hay otro párrafo cifrado que me puede dar una pista sobre otra asignación de un símbolo a letra del alfabeto correspondiente.
Es decir, creo que lo más probable es que ese símbolo se sorresponda con la letra 'a'.

Aunque hay otros párrafos parcialmente cifrados que me podrían servir para ratificar las asignaciones anteriores e incluso para inferir nuevas asignaciones, de momento me voy a quedar con los dos primeros, es decir con las asignaciones de los símbolos a las letras 'd' y 'e', aunque creo que el tercero es también muy significativo y me lo guardo para más adelante.

Si consigo ratificar que la asignación de ambos signos es correcta habré dado un paso muy importante para lograr criptoanalizar la carta con éxito; tal y como decía en este post no es una buena idea dejar texto en claro sin cifrar, porque se pueden dar pistas importantes a los criptoanalistas.
Como se puede observar en la imagen anterior, de ser cierta la conjetura sobre la letra 'e', ésta estaría en el texto en claro en 84 ocasiones, lo que supone un 17,18% respecto al total de símbolos (489) de la primera hoja de la carta. Esto parece ratificar completamente la hipótesis, ya que el porcentaje de letras 'e', la más frecuente en español, que se espera encontrar en un texto escrito en español es de entorno a un 13,68% y el porcentaje obtenido es incluso mayor.

Continúo:
Por otra parte, el bigrama 'de' es uno de los más frecuente en español, y con la asignación de letras realizada hasta el momento, tal y como se puede ver en la figura anterior, el bigrama 'de' aparecería 17 veces (3,48% respecto al total).

Además, la letra 'd' aparecería en el texto en claro en 36 ocasiones, lo que representa un 7,36 % respecto al total de símbolos. El porcentaje de letras 'd' que se espera encontrar en un texto escrito en español es de aproximadamente el 5,86%.

Por tanto, hasta el momento tenemos lo siguiente:
Por lo que entiendo que queda ratificada mi hipótesis sobre la asignación de letras realizada hasta el momento.

Por otra parte, los tres bigramas más frecuente en español que empiezan por 'e' son: 'es',  'en', 'el'  y 'er'.
En la imagen anterior se muestra que, en concreto, hay un símbolo que sigue inmediatamente a la 'e' en 19 ocasiones (3,89%), el último de los bigramas enmarcados en color azul; otro lo hace 12 veces (2,46%), el enmarcado en color morado; otro lo hace en 10 ocasiones (2,05%), el enmarcado en color verde; y, finalmente, otro en 9 ocasiones (1,84%), el enmarcado en color naranja.

Adicionalmente, cuento y establezo los porcentajes de aparición correspondientes a: 's', 'n', 'l' y 'r', datos que me pueden servir posteriormente para apoyar ciertas de las conjeturas que haga.
Por lo que hasta ahora tenemos:
Nos quedamos con todo esto, pero antes de conjeturar sobre la asignación de la letras: 's', 'n', 'l' y 'r', que son las útimas letras de los bigramas analizados, voy a intentar identificar otros símbolos, ya que éstos pueden aportar bastante para confirmar dichas asignaciones.

El trigrama más frecuente en español es 'que', por lo que intento detectar cuál es la secuencia de tres símbolos consecutivos más frecuente que termina con el símbolo que he asignado a la 'e'.
Tal y como se ve en la figura anterior, el trigrama 'que' aparece en 7 ocasiones (1,44% del total de trigramas que se pueden formar).

Por lo que hasta ahora tenemos:
Y en la décima línea ya puedo leer: 'duque de', por lo que creo voy bien.

Ahora voy a intentar averiguar si el símbolo que he dicho antes que podría corresponderse con la 'a' puede serlo conforme a su frecuencia de aparición.
Lo que parece confirmar que, efectivamente, ese símbolo se corresponde con la 'a', ya que aparece en 57 ocasiones (11,65%) y se espera que la letra 'a' aparezca en el texto en claro con una frecuencia entorno al  12,53% .
Y hasta aquí la primera parte de este criptoanálisis, para no hacer excesivamente largo este post. ¿Cómo podríamos seguir? En breve publicaré la segunda parte de este criptoanálisis (iré corrigiendo los errores que he podido cometer).

Para finalizar esta entrada decir que, si no me he equivodao en lo que llevo de criptoanálisis, me llama la atención lo fácil que está resultado esto y, en principio, entiendo que esta circunstancia se debe a:

- El error que se comete al dejar texto sin cifrar en algunos párrafos, lo que me ha permitido obtener símbolos correspondientes a las dos vocales más frecuentes del español ('e' y 'a') y a una consonante de frecuencia media ('d'). Además, como consecuencia, he obtenido uno de los trigramas más frecuente en español: 'de'.

- Los porcentajes obtenidos para las letras son muy similares a las frecuencias esperadas para ellas en un texto en claro escrito en español. lo que me lleva a pensar que, o bien se trata de una sustitución simple monoalfabética, en cuyo caso se trataría de un cifrado débil, o bien tratándose de una sustitución homofónica, que es lo que se espera de un cifrado de la época, se ha cometido un error de diseño en la tabla de homónos o se ha empleado muy mayoritariamente un único homófono por letra, o las dos cosas. En cualquier caso, está claro que la frecuencia de las letras correspondientes al español en el texto en claro se ha trasladado a los símbolos de la carta cifrada.

Quizás también te interese:


Comentarios

Entradas populares de este blog

Criptografía (I): cifrado Vigenère y criptoanálisis Kasiski

Hace unos días mi amigo Iñaki Regidor ( @Inaki_Regidor ), a quien dedico esta entrada :), compartió en las redes sociales un post titulado "Criptografía: el arte de esconder mensajes"  publicado en uno de los blogs de EiTB . En ese post se explican ciertos métodos clásicos para cifrar mensajes , entre ellos el cifrado de Vigenère , y , al final del mismo, se propone un reto consistente en descifrar un mensaje , lo que me ha animado a escribir este post sobre el método Kasiski  para atacar un cifrado polialfabético ( conociendo la clave descifrar el mensaje es muy fácil, pero lo que contaré en este post es la forma de hacerlo sin saberla ). El mensaje a descifrar es el siguiente: LNUDVMUYRMUDVLLPXAFZUEFAIOVWVMUOVMUEVMUEZCUDVSYWCIVCFGUCUNYCGALLGRCYTIJTRNNPJQOPJEMZITYLIAYYKRYEFDUDCAMAVRMZEAMBLEXPJCCQIEHPJTYXVNMLAEZTIMUOFRUFC Como ya he dicho el método de Vigenère es un sistema de sustitución polialfabético , lo que significa que, al contrario que en un sistema...

¿Qué significa el emblema de la profesión informática? (I)

Todas o muchas profesiones tienen un emblema que las representa simbólicamente y en el caso de la  informática: " es el establecido en la resolución de 11 de noviembre de 1977  para las titulaciones universitarias superiores de informática, y  está constituido por una figura representando en su parte central  un  núcleo toroidal de ferrita , atravesado por  hilos de lectura,  escritura e inhibición . El núcleo está rodeado por  dos ramas : una  de  laurel , como símbolo de recompensa, y la otra, de  olivo , como  símbolo de sabiduría. La  corona  será la  de la casa real  española,  y bajo el escudo se inscribirá el acrónimo de la organización. ". Veamos los diferentes elementos tomando como ejemplo el emblema del COIIE/EIIEO (Colegio Oficial de Ingenieros en Informática del País Vasco/ Euskadiko Informatikako Ingeniarien Elkargo Ofiziala ) . Pero no sólo el COIIE/EIIEO adopta el emblem...

Criptografía (XXIII): cifrado de Hill (I)

En este post me propongo explicar de forma comprensible lo que he entendido sobre el cifrado de Hill , propuesto por el matemático Lester S. Hill , en 1929, y que se basa en emplear una matriz como clave  para cifrar un texto en claro y su inversa para descifrar el criptograma correspondiente . Hay tres cosas que me gustan de la criptografía clásica, además de que considero que ésta es muy didáctica a la hora de comprender los sistemas criptográficos modernos: la primera de ellas es que me "obliga" a repasar conceptos de matemáticas aprendidos hace mucho tiempo y, desgraciadamente, olvidados también hace demasiado tiempo, y, por consiguiente, que, como dice  Dani , amigo y coautor de este blog, me "obliga" a hacer "gimnasia mental"; la segunda es que, en la mayoría de las ocasiones, pueden cifrarse y descifrase los mensajes, e incluso realizarse el criptoanálisis de los criptogramas, sin más que un simple lápiz y papel, es decir, para mi es como un pasat...