Ir al contenido principal

Criptografía (LV): ¿Sabías que...? (XI)

En el
post anterior conté cómo dos de los protagonistas de la novela "Viaje al centro de la tierra" de Julio Verne, el profesor Otto Lidenbrock y su sobrino Axel, consiguen descifrar un criptograma escrito en un alfabético rúnico por el alquimista islandés Arne Saknussemm y que ocultaba el secreto de la entrada al camino a seguir para llegar al centro de la tierra (un cráter concreto de un volcán también islandés).

En mi opinión el proceso de descifrado de dicho criptograma, como no podía ser de otra forma, está muy bien contado en la novela por su genial autor, desde la conjetura inicial realizada por el profesor sobre la lengua en la que estaría escrito el texto en claro, pasando por la identificación del método de cifrado utilizado (transposición de columnas simple) y la determinación de la disposición de los caracteres incluidos en cada una de las columnas de la tabla empleada, hasta la resolución final del enigma (escritura inversa del texto en claro antes de la transposición, es decir, en sentido contrario al habitual, y que no deja de ser otro sistema de transposición más, aunque el más básico; alteración del orden de los caracteres del texto en claro siguiendo un criterio predeterminado para lograr el efecto de difusión en un criptograma).

Tal y como decía en el post anterior, el criptograma que aparece en la novela y el texto obtenido tras sustituir cada carácter rúnico por el correspondiente a nuestro alfabeto son los siguientes (el primer carácter rúnico se corresponde con una doble "m"):
¿Cómo intentaría yo descifrar este criptograma?.

Considerando que cada carácter del criptograma se corresponda con un único carácter del texto en claro, y viceversa, cosa que yo supondría que es lo más probable, lo primero que yo me preguntaría es qué tipo de criptosistema utilizó Arne Saknussemm para ocultar su secreto: transposición, sustitución monoalfabética o sustitución polialfabética, y para dar respuesta a esta primera pregunta calcularía el Índice de Coincidencia (IC) del criptograma, es decir, la probabilidad de que dos caracteres tomados al azar del criptograma resulten ser iguales.

Si no me he equivocado al calcularlo: IC = 0,0697.

Con lo que creo que se puede descartar la sustitución polialfabética, ya que este IC es muy superior al de una distribución uniforme (aquella en la que cada símbolo o carácter del alfabeto ocurre con la misma frecuencia), valor al que se aproximaría en el caso de haberse empleado un criptosistema de sustitución polialfabética, y, por tanto, podemos pensar que el tipo de cifrado es de transposición o de sustitución monoalfabética simple, o una combinación de ambos.

El profesor no tiene ninguna duda de que cada carácter de nuestro alfabeto en el texto en claro se corresponde con su correspondiente carácter rúnico en el criptograma, pero esto no tendría que ser necesariamente así. Pensemos, por ejemplo, en un cifrado tipo César en el que hubiera una sustitución de cada carácter de nuestro alfabeto por el carácter rúnico que se encuentre tres posiciones más adelante con respecto a la que le corresponda a su equivalente en el alfabeto rúnico. De esta forma, por ejemplo, el carácter "a" de nuestro alfabeto sería sustituido en el criptograma por el símbolo correspondiente a la "d" en el alfabeto rúnico.

Si esto fuera como piensa el profesor la utilización del alfabeto rúnico, en mi opinión, no aportaría ningún valor criptográfico al sistema de cifrado utilizado (lo único es que sería más fácil descifrar el criptograma si se conoce dicho alfabeto, aunque ni siquiera esto sería estrictamente necesario, y que envuelve a este en un cierto halo de misterio), mientras que si hubiera una sustitución de los caracteres de nuestro alfabeto por otro distinto de su equivalente en el alfabeto rúnico se conseguiría un cierto efecto de confusión en el criptograma, dotando de mayor robustez al cifrado.

¿Podríamos intentar averiguar si cada carácter de nuestro alfabeto se sustituye en el criptograma por su equivalente?, o, lo que creo que es lo mismo, ¿Podríamos saber si no se ha utilizado un sistema de sustitución monoalfabética?.

Para ello yo acudiría a un análisis de frecuencias, de la siguiente manera:
En la novela el profesor establece la hipótesis de que la lengua en la que está escrito el texto en claro es el latín. Pues bien, comparando la frecuencia de aparición de los caracteres rúnicos en el criptograma con la frecuencia de aparición de sus caracteres equivalentes en nuestro alfabeto, se observa que el porcentaje de aparición de los primeros se aproxima bastante, salvo algún caso que comentaré después, al de los segundos en un texto escrito en latín, español o inglés, lo que creo que puede decir que cada carácter rúnico del criptograma se corresponde con su carácter equivalente en nuestro alfabeto. Así, por ejemplo, el carácter rúnico que se corresponde con la "e" es el que significativamente más veces aparece en el criptograma y el significativamente más frecuente en los tres idiomas considerados, por lo que obtengo la conclusión de que se puede descartar también la sustitución monoalfabética como criptosistema empleado en el cifrado, y, por tanto, conjeturar que lo más probable es que el tipo de este sea de transposición.

La hipótesis del profesor se basa en parte en la proporción de vocales frente a consonantes, ya que esta es mayor en las lenguas meridionales que en los idiomas del norte, mucho más ricos en consonantes, y, efectivamente, ese es un buen indicador si el sistema empleado en el cifrado es el de transposición, lo que tal y como digo es lo más probable. Si esto último fuera así, el porcentaje de vocales del criptograma, y como el sistema usado sería de transposición también en el texto en claro, en comparación con el que se espera encontrar en un texto escrito en cada uno de los tres idiomas citados sería:
Lo que unido a que en el análisis de frecuencias anterior la letra "t" aparece en el criptograma con una frecuencia bastante superior a la que se esperaría en un texto en español y la "h" no aparece en el criptograma siendo una letra muy frecuente en inglés, creo que puede indicar que el profesor tenía razón, es decir, el latín es la lengua más probable en la que se encontraría escrito el texto en claro.

Pero yo haría un último intento para confirmarlo. Para ello acudiría otra vez al Índice de Coincidencia:
Como se observa el IC del criptograma está un poco más próximo al del latín (como no lo he encontrado en Internet, lo he estimado a partir de un fragmento con 27.890 caracteres de la Eneida de Virgilio). Aunque la diferencia no es significativa creo que esta circunstancia, junto con la anterior más la observación realizada por el profesor de que como Saknussemm era un hombre instruido, al no haberlo escrito en su lengua nativa (el islandés), es de suponer que podría haber utilizado preferentemente el latín (en boga entre las personas cultas en el siglo XVI), puede también indicar que, efectivamente, lo más probable es que esta sea la lengua en la que está escrita el texto en claro.

Recapitulemos: hasta el momento no he hecho más que ratificar, aunque utilizando algunos argumentos adicionales, las conclusiones a las que llega el profesor en la novela; el criptosistema empleado es de transposición y la lengua más probable en la que está escrito el texto en claro es el latín.

Puede que parezca que ambas hipótesis no son gran cosa, pero son la base para intentar un criptoanálisis con éxito.

A partir de aquí el profesor deduce que el sistema de cifrado empleado es el de transposición por columnas simple; entiendo que debido a que el criptograma está divido en bloques o grupos (21) de caracteres, los primeros con una longitud de 7 símbolos y los últimos de 6, lo que le lleva, tal y como expliqué en el post anterior, a dar con la disposición correcta de los caracteres del texto en claro antes del cifrado por transposición de columnas simple (se habría utilizado una tabla de 7 filas y 21 columnas).

Lástima que no se diera cuenta de que antes de ello, en una fase previa de cifrado, Saknussemm había utilizado la escritura inversa del texto en claro (otro método de transposición), de lo que sólo se percata por pura casualidad su sobrino Axel y lo que a mi me lleva a concluir que el criptoanálisis no es una ciencia exacta, es decir, no es únicamente método, sino que se necesitan además grandes dosis de intuición y, por qué no decirlo, de suerte.

Comentarios

Entradas populares de este blog

Criptografía (I): cifrado Vigenère y criptoanálisis Kasiski

Hace unos días mi amigo Iñaki Regidor ( @Inaki_Regidor ), a quien dedico esta entrada :), compartió en las redes sociales un post titulado "Criptografía: el arte de esconder mensajes"  publicado en uno de los blogs de EiTB . En ese post se explican ciertos métodos clásicos para cifrar mensajes , entre ellos el cifrado de Vigenère , y , al final del mismo, se propone un reto consistente en descifrar un mensaje , lo que me ha animado a escribir este post sobre el método Kasiski  para atacar un cifrado polialfabético ( conociendo la clave descifrar el mensaje es muy fácil, pero lo que contaré en este post es la forma de hacerlo sin saberla ). El mensaje a descifrar es el siguiente: LNUDVMUYRMUDVLLPXAFZUEFAIOVWVMUOVMUEVMUEZCUDVSYWCIVCFGUCUNYCGALLGRCYTIJTRNNPJQOPJEMZITYLIAYYKRYEFDUDCAMAVRMZEAMBLEXPJCCQIEHPJTYXVNMLAEZTIMUOFRUFC Como ya he dicho el método de Vigenère es un sistema de sustitución polialfabético , lo que significa que, al contrario que en un sistema de

Criptografía (XXIII): cifrado de Hill (I)

En este post me propongo explicar de forma comprensible lo que he entendido sobre el cifrado de Hill , propuesto por el matemático Lester S. Hill , en 1929, y que se basa en emplear una matriz como clave  para cifrar un texto en claro y su inversa para descifrar el criptograma correspondiente . Hay tres cosas que me gustan de la criptografía clásica, además de que considero que ésta es muy didáctica a la hora de comprender los sistemas criptográficos modernos: la primera de ellas es que me "obliga" a repasar conceptos de matemáticas aprendidos hace mucho tiempo y, desgraciadamente, olvidados también hace demasiado tiempo, y, por consiguiente, que, como dice  Dani , amigo y coautor de este blog, me "obliga" a hacer "gimnasia mental"; la segunda es que, en la mayoría de las ocasiones, pueden cifrarse y descifrase los mensajes, e incluso realizarse el criptoanálisis de los criptogramas, sin más que un simple lápiz y papel, es decir, para mi es como un pasat

¿Qué significa el emblema de la profesión informática? (I)

Todas o muchas profesiones tienen un emblema que las representa simbólicamente y en el caso de la  informática: " es el establecido en la resolución de 11 de noviembre de 1977  para las titulaciones universitarias superiores de informática, y  está constituido por una figura representando en su parte central  un  núcleo toroidal de ferrita , atravesado por  hilos de lectura,  escritura e inhibición . El núcleo está rodeado por  dos ramas : una  de  laurel , como símbolo de recompensa, y la otra, de  olivo , como  símbolo de sabiduría. La  corona  será la  de la casa real  española,  y bajo el escudo se inscribirá el acrónimo de la organización. ". Veamos los diferentes elementos tomando como ejemplo el emblema del COIIE/EIIEO (Colegio Oficial de Ingenieros en Informática del País Vasco/ Euskadiko Informatikako Ingeniarien Elkargo Ofiziala ) . Pero no sólo el COIIE/EIIEO adopta el emblema establecido en dicha resolución, sino que éste se adopta también como im