Criptografía (CCCXLII): Criptoanálisis a una carta cifrada del cardenal de Tortosa (III)

En dos entradas anteriores (ver post 1 y post 2) he ido desarrollando el criptoanálisis de una carta cifrada que el cardenal de Tortosa (Adriano de Utrecht), posteriormente el papa Adriano VI (en la imagen que ilustra este post. Fuente: wikipedia), envía a Carlos I de España y V del Sacro Imperio Romano Germánico, y en ésta continúo donde lo dejé.

En la aproximación obtenida hasta el momento, he identificado dos símbolos candidatos a ser las letras 'e' y 'a', respectivamente, dos símbolos candidatos a ser la 'q' y uno que se correspondería con la 'u'.

Además, he determinado que cuatro símbolos representarían sendas consonantes en el texto en claro y dos serían vocales.

Continúo buscando el siguiente patrón para intentar identificar signos consecutivos que podrían representar el bigrama 'ar', el más frecuente en español de los que comienzan con 'a':

- Cadenas de 2 signos consecutivos (bigramas) que empiecen por el signo que hemos asignado a la letra 'a', exluidas aquellas cuyo segundo símbolo sea un símbolo ya asignado o esté identificado como homófono de una vocal, y que más veces aparezcan en el criptograma.

Tal y como se observa en la figura anterior, el candidato más probable a ser un homófono de la 'r' es el segundo de los símbolos del primer bigrama de entre los enmarcados en color rojo. Además, de forma análoga a lo que dije en este post con respecto a símbolos con formas parecidas (en ese caso con respecto a los homófonos candidatos a ser la letra 'q'), se puede ver que la forma del segundo signo del segundo de los bigramas enmarcados en rojo es el reflejo horizontal del segundo signo del primer brigrama, por lo que el segundo signo del segundo bigrama es más que sospechoso de ser también un homófono de la letra 'r'. Lo que, adicionalmente, parece confirmarse al estar la suma de frecuencias de ambos símbolos en línea con la que se espera para la letra 'r' en un texto escrito en español.

Voy a continuar buscando el siguiente patrón para intentar identificar signos consecutivos que podrían representar el bigrama 'la', el más frecuente en español de los que terminan con 'a':

- Cadenas de 2 signos consecutivos (bigramas) que terminen por el signo que hemos asignado a la letra 'a', exluidas aquellas cuyo primer símbolo sea un símbolo ya asignado o esté identificado como homófono de una vocal, y que más veces aparezcan en el criptograma.

No lo veo claro, en este caso las frecuencias de aparición están bastante planas, por lo que de momento no voy a hace ninguna asignación.

Una vez asignado un homófono para una de las consonantes de alta frecuencia ('r'), voy a ver si consigo identificar uno para cada una de las otras dos consonantes de alta frecuencia ('s' y 'n'), y, adicionalmente, otro para la 't'. Para ello, vuelvo a los trigramas para intentar identificar símbolos consecutivos que podrían representar el trigrama 'ent', el segundo más frecuente en español y el primero que comienza por 'e', o 'est', el segundo trigrama que empieza por 'e' más frecuente. Busco el siguiente patrón:

- Cadenas de 3 signos consecutivos (trigramas) distintos cuyo primer símbolo sea el que he identificado que se correspondería con la 'e', el segundo un signo no identificado como vocal y no asignado todavía de frecuencia alta y el tercero un símbolo no identificado como vocal y no asignado todavía de frecuencia media.

La verdad es que a la vista de lo que obtengo me surge la duda de si está en el criptograma alguno de esos trigramas, pero realizo un análisis más en profundidad, por si acaso sí que está al menos uno de los dos.

Los trigramas tachados los descarto por no cumplir el patrón en lo que se refiere a los requisitos establecidos para las frecuencias de aparición del segundo y/o tercer dígito.

Como digo el número de apariciones entiendo que no es significativo, pero me fijo en la aplicación concreta en el criptograma para cada uno de los trigramas que no están tachados, suponiendo que cada uno de ellos es primero 'ent' y después 'est', y en el primer trigrama veo (añadiendo también la 'r' que he obtenido anteriormente) que si el primero de los trigramas fuera 'ent' se podría leer 'entre' en la primera línea. Ya decía yo en este post que a la hora de criptoanalizar un texto no está mal tener un poco de suerte.

Por tanto, voy a considerar que el segundo símbolo del primer trigrama es la 'n' y el tercero la 't'. Bueno, esto no tiene que ser así necesariamente, si no lo fuera desharía estas dos asignaciones y seguiría a partir de un análisis más exhaustivo de los bigramas.

Hasta el momento tengo lo siguiente:

Puedo intituir alguna otra cosa, pero, como también decía en este post, a la hora de criptoanalizar un texto hay que tener paciencia para no precipitarse con suposiciones no suficientemente fundadas, lo que nos puede llevar a un punto de difícil solución.

En resumen: tengo los homófonos de las letras 'e' y 'a' (las dos letras más frecuentes en castellano), uno para cada letra, que aparecen con mayor frecuencia, y lo mismo para dos de las consonantes de mayor frecuencia, la 'r' y la 'n'. Si consigo identificar el homónimo de la 'o' (tercera letra más frecuente) que aparece con mayor frecuencia y lo mismo para la 's' (la cuarta letra de mayor frecuencia y la consonante de mayor frecuencia) habré dado un paso decisivo para terminar el criptoanálisis con éxito. Para ello, voy a buscar bigramas que no incluyan ninguno de los símbolos asignados hasta el momento, en los que ambos símbolos sean distintos, tengan una frecuencia alta de aparición, que el primer símbolo no sea uno de los identificados como consonante, que el segundo no sea uno de los identificados como vocal y que se repitan el mayor número de veces ('os' es un bigrama muy frecuente en español y el primero que empieza por 'o').

A la vista de obtenido, creo que el primer símbolo del bigrama enmarcado en color rojo que se encuentra más a la derecha podría ser un homófono de la 'o' y el segundo de la 's', lo que me lleva a la siguiente aproximación:

Pero, es que, además, el primer símbolo de los bigramas enmarcados en color rojo situados más a la izquierda podría representar a la misma letra que el primer signo del situado más a la derecha, es decir, ser también un homófono de la 'o', lo que encaja muy bien porque la suma de la frecuencia de ambos homófonos está muy cerca de lo esperado para la letra 'o' en un texto escrito en castellano. Nótese, además, que se puede decir que la forma de ambos hómofonos es similar, por lo que se incrementa la probabilidad de que ambos representen a la misma letra. Pruebo, y si detecto que no puedo ser, echaré para atrás este paso.

Lo hago y ya puedo ver, al menos, una palabra más, por lo que creo que es correcto, pero antes de poner la nueva aproximación, a la vista de los bigramas anteriores, podría ser que el segundo dígito de los dos bigramas enmarcados en color rojo y situados más a la izquierda también sean homófonos de la misma letra, es decir, de la 's'. En este caso, la suma de frecuencias de ambos homófonos queda por encima de lo esperado para la 's', pero creo que es posible que esto sea así. Cabe decir también lo mismo que lo dicho para los dos homófonos anteriores en cuanto a sus formas. Al igual que antes, pruebo, y si detecto que no puedo ser, echaré para atrás este paso.

La verdad es que lo de localizar palabras descifradas o parcialmente descifradas se complica con esto del castellano antiguo, en aquella época hablaban raro y escribían más turbio aún, pero ya puedo ver alguna que otra palabra más e intuir otras; sólo he enmarcado en color rojo las más evidentes, ya que como digo hay que tener paciencia para no equivocarse demasiado.

A la vista de esta última aproximación creo que no va a ser necesario buscar más patrones, ya que, a partir de las palabras que se intuyen y de las que sucesivamente vayan adivinándose va a ser muy fácil descifrar completamente la carta, pero eso ya lo dejo para un cuarto y último post.

Quizás también te interese:

Criptografía (I): cifrado Vigenère y criptoanálisis Kasiski

Hace unos días mi amigo Iñaki Regidor ( @Inaki_Regidor ), a quien dedico esta entrada :), compartió en las redes sociales un post titulado "Criptografía: el arte de esconder mensajes" publicado en uno de los blogs de EiTB . En ese post se explican ciertos métodos clásicos para cifrar mensajes , entre ellos el cifrado de Vigenère , y , al final del mismo, se propone un reto consistente en descifrar un mensaje , lo que me ha animado a escribir este post sobre el método Kasiski para atacar un cifrado polialfabético ( conociendo la clave descifrar el mensaje es muy fácil, pero lo que contaré en este post es la forma de hacerlo sin saberla ). El mensaje a descifrar es el siguiente: LNUDVMUYRMUDVLLPXAFZUEFAIOVWVMUOVMUEVMUEZCUDVSYWCIVCFGUCUNYCGALLGRCYTIJTRNNPJQOPJEMZITYLIAYYKRYEFDUDCAMAVRMZEAMBLEXPJCCQIEHPJTYXVNMLAEZTIMUOFRUFC Como ya he dicho el método de Vigenère es un sistema de sustitución polialfabético , lo que significa que, al contrario que en un sistema...

El blog de García Larragan y Cía

Buscar este blog

Criptografía (CCCXLII): Criptoanálisis a una carta cifrada del cardenal de Tortosa (III)

Etiquetas

Comentarios

Publicar un comentario

Entradas populares de este blog

Criptografía (I): cifrado Vigenère y criptoanálisis Kasiski

Criptografía (XXIII): cifrado de Hill (I)

¿Qué significa el emblema de la profesión informática? (I)