Ir al contenido principal

Criptografía (CCCXLI): Criptoanálisis a una carta cifrada del cardenal de Tortosa (II)

En este post comencé con el criptoanálisis de una carta cifrada que el cardenal de Tortosa (Adriano de Utrecht), posteriormente el papa Adriano VI (en la imagen que ilustra este post. Fuente: wikipedia), envía a Carlos I de España y V del Sacro Imperio Romano Germánico, y en éste continúo donde lo dejé.

En dicho post establecí el signo que se muestra en la figura siguiente como un homófono candidato a representar la letra 'e'.
Y, por tanto, en una aproximación preliminar del texto en claro obtuve lo siguiente:
A partir de aquí voy a intentar buscar patrones.

Lo que voy a hacer en primer lugar es buscar el siguiente patrón para intentar identificar símbolos consecutivos que podrían representar el trigrama 'que', el más frecuente en español:

- Cadenas de 3 signos consecutivos (trigramas) cuyo último signo sea el que he identificado que se correspondería con la 'e', que aparezcan un número relativamente elevado de veces en el criptograma (tal y como digo, el trigrama 'que' es el más frecuente en español), cuya frecuencia de aparición del primer signo en el criptograma sea baja y cuya frecuencia de aparición del segundo signo sea alta (hay que considerar que en muchas ocasiones, en el castellano de la época, la 'b' y 'v' se esbribían como 'u' y, además, la 'u' está presente en muchas frases estereotipadas y tratamientos: "Guarde nuestro Señor la uida", "Muy humilde uasallo que sus manos uesa", "Vuestra magestad", "Vuestra alteza", ..., por lo que se espera que la 'u' tenga una frecuencia de aparición alta en un texto escrito en el español de la época).
El trigrama que mejor cumple el patrón buscado es el primero de los enmarcados en color rojo, ya que de entre los terminados en el homófono asignado a la letra 'e' es el que más veces aparece en el criptograma (5), su primer signo presenta una frecuencia de aparición baja (1,46 %; 7 veces) y su segundo símbolo tiene una frecuencia de aparición alta (6,67 %; 32 veces).

Por tanto, los dos primeros homófonos que lo conforman tienen una probabilidad alta de corresponderse con las letras 'q' y 'u', respectivamente.

Además, si ese trigrama fuera 'que', el segundo de los trigramas enmarcados tiene también muy altas posibilidades de ser 'que', ya que su primer signo también presenta una frecuencia de aparición baja (0,42 %; 2 veces). Esto, unido a que la forma del primer signo de este segundo trigrama es muy similar a la del primer signo del primer trigrama y, a mayor abundamiento, ambos se parecen a la letra 'q', hace que el primer signo del segundo trigrama sea más que sospechoso de ser un homófono de la letra 'q'. El parecido de las formas de los signos, tanto entre sí como con las letras a las que representan, era un error de diseño cometido con frecuencia en la época, en la que parece que se primaba la facilidad de cifrado y descifrado en detrimento de la seguridad.

En lo que respecta a los otros dos trigramas que terminan con los dos últimos símbolos del primer trigrama, no creo que ninguno de ellos pueda corresponderse con 'que'; en el primer caso porque el primero de sus signos presenta una frecuencia de aparición alta (4,38%; 21 veces) y en el segundo caso porque el primero de sus símblos tiene una frecuencia de aparición media (1,88 %; 9 veces), y, por tanto, ninguno de ellos cumpliría con el patrón buscado.

Una vez asignados los homófonos, en la segunda fila veo que quedaría una 'q' sola, por lo que el signo suigiente tiene que represntar necesariamente a la 'u'.

Todavía puedo sacar algo más. En las filas 2 y 4 quedan sendos bigramas 'qu' solos, por lo que los signos que los siguen deben ser necesariamente vocales.

Por tanto, hasta el momento, tenemos lo siguiente:
Ahora voy a buscar el siguiente patrón para intentar identificar signos consecutivos que podrían representar el bigrama 'de', el significativamente más frecuente en español de los terminados en 'e':

- Cadenas de 2 signos consecutivos (bigramas) que terminen con el signo que hemos asociado a la letra 'e' y que más veces aparezcan en el criptograma.
El primero de los signos del primer bigrama, si hasta ahora no me he equivocado, no podría ser la 'd', ya que lo he asignado a la 'u', por lo que lo más probable es que la 'd' sea el primer signo del segundo o tercer bigrama (los enmarcados en color rojo en la figura anterior). Desde luego, ambos no pueden ser homófonos de la 'd' puesto que la suma de frecuencias de aparición de ambos excede por mucho de la esperada para la letra 'd' en un texto escrito en español. No me atrevo a decir cuál es la 'd', pero en cualquier caso ambos serían consonantes, ya que la 'e' es precedida muy mayoritariamente por una consonante, y me apunto que ambos son candidatos a ser la 'd'.

- Voy ahora a buscar los bigramas con mayor frecuencia de aparición en el criptograma que empiecen por la letra que he asignado a la 'e', ya que el segundo símbolo de éstos será con casi total seguridad una consonante.
Voy a considerar sólo los tres bigramas más frecuentes (los enmarcados en color rojo en la figura anterior) y, por tanto, el segundo signo de cada uno de ellos sería una consonante. Adicionalmente a esto, decir que los bigramas más frecuentes en español que empiezan por 'e' son: 'es', 'en', 'el' y 'er', es decir, la letra 'e' suele preceder a las consonantes de mayor frecuencia ('s', 'r', 'n') o a la 'l' (una consonante de frecuencia media). Por tanto, hasta ahora tenemos lo siguiente:
Una vez hecho esto, observo que el símbolo que aparece en la tabla completa de frecuencias (ver siguiente figura) es un candidato firme a corresponderse con la 'a', ya que tras las consonantes que he identificado se queda, con diferencia, como el segundo símbolo más frecuente en el criptograma, y la letra 'a' es la segunda letra más frecuente en español.
Por tanto, hasta ahora tenemos:
Y hasta aquí este segundo post. En breve pondré una tercera entrada con la continuación del criptoanálisis. ¿Qué más se puede hacer? Esto no es una ciencia exacta y se requieren grandes dosis de imaginación, paciencia y, porque no decirlo, suerte. No es fácil, ya decía yo en un post anterior que este tipo de criptosistemas eran muy robustos para su época, y que sólo, como es el caso, los errores de diseño y utilización posibilitan la realización de un criptoanális con éxito, pero aún así no es fácil. 

Quizás también te interese:

Comentarios

Entradas populares de este blog

Criptografía (I): cifrado Vigenère y criptoanálisis Kasiski

Hace unos días mi amigo Iñaki Regidor ( @Inaki_Regidor ), a quien dedico esta entrada :), compartió en las redes sociales un post titulado "Criptografía: el arte de esconder mensajes"  publicado en uno de los blogs de EiTB . En ese post se explican ciertos métodos clásicos para cifrar mensajes , entre ellos el cifrado de Vigenère , y , al final del mismo, se propone un reto consistente en descifrar un mensaje , lo que me ha animado a escribir este post sobre el método Kasiski  para atacar un cifrado polialfabético ( conociendo la clave descifrar el mensaje es muy fácil, pero lo que contaré en este post es la forma de hacerlo sin saberla ). El mensaje a descifrar es el siguiente: LNUDVMUYRMUDVLLPXAFZUEFAIOVWVMUOVMUEVMUEZCUDVSYWCIVCFGUCUNYCGALLGRCYTIJTRNNPJQOPJEMZITYLIAYYKRYEFDUDCAMAVRMZEAMBLEXPJCCQIEHPJTYXVNMLAEZTIMUOFRUFC Como ya he dicho el método de Vigenère es un sistema de sustitución polialfabético , lo que significa que, al contrario que en un sistema...

¿Qué significa el emblema de la profesión informática? (I)

Todas o muchas profesiones tienen un emblema que las representa simbólicamente y en el caso de la  informática: " es el establecido en la resolución de 11 de noviembre de 1977  para las titulaciones universitarias superiores de informática, y  está constituido por una figura representando en su parte central  un  núcleo toroidal de ferrita , atravesado por  hilos de lectura,  escritura e inhibición . El núcleo está rodeado por  dos ramas : una  de  laurel , como símbolo de recompensa, y la otra, de  olivo , como  símbolo de sabiduría. La  corona  será la  de la casa real  española,  y bajo el escudo se inscribirá el acrónimo de la organización. ". Veamos los diferentes elementos tomando como ejemplo el emblema del COIIE/EIIEO (Colegio Oficial de Ingenieros en Informática del País Vasco/ Euskadiko Informatikako Ingeniarien Elkargo Ofiziala ) . Pero no sólo el COIIE/EIIEO adopta el emblem...

Criptografía (XXIII): cifrado de Hill (I)

En este post me propongo explicar de forma comprensible lo que he entendido sobre el cifrado de Hill , propuesto por el matemático Lester S. Hill , en 1929, y que se basa en emplear una matriz como clave  para cifrar un texto en claro y su inversa para descifrar el criptograma correspondiente . Hay tres cosas que me gustan de la criptografía clásica, además de que considero que ésta es muy didáctica a la hora de comprender los sistemas criptográficos modernos: la primera de ellas es que me "obliga" a repasar conceptos de matemáticas aprendidos hace mucho tiempo y, desgraciadamente, olvidados también hace demasiado tiempo, y, por consiguiente, que, como dice  Dani , amigo y coautor de este blog, me "obliga" a hacer "gimnasia mental"; la segunda es que, en la mayoría de las ocasiones, pueden cifrarse y descifrase los mensajes, e incluso realizarse el criptoanálisis de los criptogramas, sin más que un simple lápiz y papel, es decir, para mi es como un pasat...