Ir al contenido principal

Criptografía (CCXVIII): ¿Sabías que...? (XVIII)

En esta ocasión criptografía en un relato corto sobre Sherlock Holmes del escritor británico Arthur Conan Doyle, "Los bailarines" ('The adventure of the Dancing Men'). Quizá la obra de este escritor más famosa en la que se ve involucrada la criptografía.

En este relato Hilton Cubitt, un hacendado del condado de Norfolk pide ayuda a Holmes para desentrañar el misterio de una serie de mensajes compuestos por monigotes que parecen estar bailando. Estos mensajes ponen muy nerviosa a su esposa, una americana llamada Elsie Patrick con la que lleva casado un año.

El caso es que, tras recibir su mujer una carta de América, ésta la leyó, se puso pálida y la arrojó al fuego. No le comentó nada a su marido y él tampoco le preguntó nada, ya que antes de casarse, tras decirle que no tenía nada de lo que avergonzarse y confesarle que en el pasado había tenido en su vida algunas compañías muy desagradables, le dijo que quería olvidarse de ellas y preferiría no mencionar nunca el pasado. Si aceptaba casarse con ella, Hilton Cubitt le tendría que permitir guardar silencio sobre todo lo que sucedió hasta el momento en que se casasen. Cosa a la que Hilton Cubitt accedió.

A partir de esa primera carta, van apareciendo una serie de mensajes con monigotes similares y a medida que su mujer los va viendo se aterroriza cada vez más, por lo que Hilton Cubitt llega al convencimiento de que su esposa no sólo sabía lo que significaban esos extraños mensajes, sino que también sabía quién era el que los dejaba, y, si como sospechaba, ella estaba siendo amenazada, haría todo lo posible por protegerla.

El primero de los mensajes que Hilton Cubitt entrega a Holmes es el siguiente:
Llegados a ese punto era evidente que esos monigotes significaban algo, es decir, eran en realidad un criptograma y Holmes estaba convencido de poder descifrarlo. Sin embargo, este criptograma tenía muy pocos símbolos, por lo que poco o nada podía hacer con él, y le pidió a Hilton Cubitt que regresara a Norfolk, que hiciera una copia exacta de todo nuevo mensaje con monigotes que pudiera aparecer y que se los hiciera llegar.

Bueno, con independencia de cómo Holmes consigue descifrar los criptogramas, como se verá más adelante coincido con él en la mayoría de las cosas, voy a intentar descifrar este criptograma a mi manera.

Para ello y como siempre, lo primero que hago es establecer como premisas básicas para el criptoanálisis tanto el idioma en el que estaría escrito el texto en claro como el tipo de criptosistema utilizado.

Creo que no es mucho suponer, por: la nacionalidad del autor, el idioma en el que se escribió el original de este relato corto, el lugar donde se desarrolla su trama y la nacionalidad de sus personajes (Holmes y Watson incluidos) que el idioma en el que está escrito el texto en claro de los criptogramas es el inglés. ¡Elemental querido Watson! :).

Por otra parte, Holmes llega a la conclusión de que se trata de un cifrado de sustitución simple monoalfabética, es decir, que cada monigote o símbolo representa siempre en los criptogramas a una misma letra del texto en claro, cosa que podría ser así o no, pero que también voy a asumir como premisa básica para el descifrado debido a que para realizar las oportunas comprobaciones para ratificar o desechar esta hipótesis debería disponer de un texto cifrado de bastante mayor longitud que la del primer criptograma (sólo tiene 15 símbolos) e incluso que la de todos ellos juntos (en total hay 62 monigotes). Además, como estos criptogramas aparecen en un relato corto no creo que el criptosistema empleado tenga una mayor complejidad que el indicado :)

Adicionalmente y antes de empezar el criptoanálisis, Holmes cree razonable suponer que los monigotes que aparecen llevando una bandera representan en los criptogramas la misma letra del texto en claro que aquellos de la misma forma que no la llevan, y que su única función consistía en separar las palabras de una frase. Conclusión a la que llega al ver cómo se distribuyen en los criptogramas los monigotes que llevan bandera. Premisa que yo también asumo.

Dicho esto, los criptogramas a descifrar son los siguientes:
Lo primero que hago es un análisis de frecuencias de estos monigotes, es decir contar las veces que cada uno de ellos aparece en esos cinco criptogramas y comparar el porcentaje total de dichas apariciones en todos los criptogramas con el que, más o menos, se espera para la aparición de las letras en un texto en claro escrito en inglés (la tabla que figura a la derecha):
Con tan pocos símbolos (en total 62) el análisis de frecuencias es muy poco fiable, pero aún así puedo distinguir con facilidad qué símbolo o monigote se corresponde con la letra 'E', que tal y como se observa en la tabla de la derecha es la más frecuente con diferencia en inglés. Por tanto, voy a considerar que el símbolo que aparece 17 veces en los criptogramas se corresponde con la letra 'E' en los correspondientes textos planos, lo que me da una primera aproximación a los mismos:
Del análisis de frecuencias, con tan pocos símbolos en los criptogramas, no me atrevo a sacar más conclusiones, aunque quizá me sirva después para asociar otros símbolos a letras.

A partir de aquí, creo que sólo me queda continuar con un ataque de texto claro conocido (en ingles 'Known plain text attack'), es decir, voy a tratar de ir infiriendo o deduciendo palabras que muy probablemente estén en los textos en claro para ir descifrando los criptogramas poco a poco. Para empezar con este tipo de ataque, una de las ideas que tiene Holmes y que creo que también se me habría ocurrido a mí, es que si los mensajes van dirigidos a la esposa de Hilton Cubitt, Elsie Patrick, el nombre "ELSIE" es muy probable que aparezca en éstos. Si esto fuera así, ya que he asociado a un monigote la letra 'E', sólo tengo que buscar palabras de 5 letras que empiecen y terminen por 'E' y cuyos monigotes en su parte central sean distintos entre sí y a la propia 'E'. Y veo que hay dos palabras en las que encaja lo anterior, con lo que llego a una segunda aproximación:
Y no sólo el nombre "ELSIE" encaja en esas dos palabras, sino que en ambas los símbolos centrales son los mismos, por lo que serían la misma palabra en ambos textos en claro, y una de ellas se encuentra al principio de la frase y la otra al final, lugares donde, al menos yo, esperaría que con mayor probabilidad se encontrara un nombre en un frase. No creo que todo esto se pueda producir por mera casualidad, por lo que supongo que voy bien.

Y es aquí donde la cosa se complica para mí, yo sólo soy un aficionado a la criptografía y un aprendiz de criptoanalista y, por supuesto, no puedo compararme con un genio como Holmes, aunque creo que algo de ayuda tuvo de Arthur Conan Doyle para descifrar los mensajes :), pero es que, además, los criptogramas que yo he conseguido y utilizado en esta entrada presentan, al menos, dos errores en el cuarto de ellos, lo que creo que me pone en clara desventaja frente a Holmes :) y, por tanto, los corrijo a continuación (en la figura en la que se muestra el análisis de frecuencias ya están corregidos) para seguir intentando el descifrado (tacho los símbolos que creo erróneos y añado justo después los que yo entiendo que deberían figurar en lugar de éstos):
 
Tras esta corrección, creo que el primero de los símbolos del cuarto criptograma podría corresponderse con la 'N', el tercero con la 'V' y el último con la 'R'. Todo ello debido a que: "NEVER" es la palabra más frecuente  de 5 letras en inglés con 'E' en la segunda y cuarta posiciones (nótese que este cuarto criptograma está formado por una única palabra, ya que no hay en él ningún monigote con bandera, y que en este caso soy yo quien hace un poco de trampas, ya que he obtenido este dato de Internet y Holmes no podía haberlo buscado ahí :)) y a que, además, parece una palabra adecuada en un mensaje de este tipo, sobre todo cuando por el relato que realiza Hilton Cubitt se puede sospechar que realmente fue escrito por Elsie Patrick como contestación a un mensaje previo, conclusión a la que también llega Holmes. Lo que me lleva a una tercera aproximación:
A partir de aquí, creo que se puede deducir fácilmente el monigote que representa la 'H', ya que parece que la segunda palabra del primer criptograma sería "HERE", pero se me acaban las ideas y lo único que se me ocurre es volver al análisis de frecuencias para ver si soy capaz de asignar los monigotes correspondientes a la tres únicas letras que me faltan de entre aquellas con la frecuencia de aparición más alta en inglés. Tengo: 'E', 'I', 'N', 'S', 'H' y 'R', y me faltan: 'T', 'A'  y 'O'.

El primer símbolo del primer criptograma es el segundo monigote que más se repite si consideramos todos los textos cifrados (5 veces; 8,06%) y creo que, a la vista de la última palabra de ese primer criptograma, en la que este mismo símbolo se encuentra entre 'L' y 'N', probablemente sea una vocal, es decir, las letras candidatas más probables a las que asignar ese monigote son: 'A' u 'O', y, por consiguiente, el segundo monigote del primer criptograma probablemente sea una consonante, ya que se trataría de una palabra de dos letras que empezaría por vocal. Por tanto, ya que la segunda palabra sería "HERE", sólo se me ocurre "AM" como palabra más probables para ser la primera. Con la identificación de la "H", la de esta primera palabra del primer criptograma más alguna palabra que adivino una vez obtenido lo anterior llego a una cuarta aproximación a los textos en claro, la siguiente:
Y hasta aquí lo que me da mi capacidad y talento como criptoanalista (poco en ambos casos), pero pongo la solución completa a la que llega Holmes:
Es decir, en español y con la ayuda del traductor:

Criptograma 1: ESTOY AQUÍ ABE SLANEY
Criptograma 2: EN ELRIGES
Criptograma 3: VEN ELSIE
Criptograma 4: NUNCA
Criptograma 5: ELSIE PREPARATE PARA ENCONTRARTE CON TU DIOS

Recomiendo la lectura completa de este relato corto y, aunque no quiero hacer 'spoiler', comento que Holmes consigue que el culpable del asesinato que se produce se delate a sí mismo mandándole el siguiente mensaje cifrado:
¿Cuál es el texto en claro correspondiente a este criptograma?

Y para finalizar una última curiosidad: parece ser que la utilización de la criptografía en este relato corto de Arthur Conan Doyle constituye un guiño de admiración hacia el escritor norteamericano Edgar Allan Poe, porque, además de ser bien conocida la influencia que este último tuvo sobre el primero, Edgar Allan Poe también utilizó un criptosistema de este tipo en su relato corto "El escarabajo de oro" y utilizó el mismo método para descifrarlo (Ver este post donde lo explico).

Comentarios

  1. El texto en claro correspondiente al criptograma con el que Holmes consigue que el culpable del asesinato se delate a sí mismo es: COME HERE AT ONCE

    ResponderEliminar

Publicar un comentario

Entradas populares de este blog

Criptografía (I): cifrado Vigenère y criptoanálisis Kasiski

Hace unos días mi amigo Iñaki Regidor ( @Inaki_Regidor ), a quien dedico esta entrada :), compartió en las redes sociales un post titulado "Criptografía: el arte de esconder mensajes"  publicado en uno de los blogs de EiTB . En ese post se explican ciertos métodos clásicos para cifrar mensajes , entre ellos el cifrado de Vigenère , y , al final del mismo, se propone un reto consistente en descifrar un mensaje , lo que me ha animado a escribir este post sobre el método Kasiski  para atacar un cifrado polialfabético ( conociendo la clave descifrar el mensaje es muy fácil, pero lo que contaré en este post es la forma de hacerlo sin saberla ). El mensaje a descifrar es el siguiente: LNUDVMUYRMUDVLLPXAFZUEFAIOVWVMUOVMUEVMUEZCUDVSYWCIVCFGUCUNYCGALLGRCYTIJTRNNPJQOPJEMZITYLIAYYKRYEFDUDCAMAVRMZEAMBLEXPJCCQIEHPJTYXVNMLAEZTIMUOFRUFC Como ya he dicho el método de Vigenère es un sistema de sustitución polialfabético , lo que significa que, al contrario que en un sistema de

Criptografía (XXIII): cifrado de Hill (I)

En este post me propongo explicar de forma comprensible lo que he entendido sobre el cifrado de Hill , propuesto por el matemático Lester S. Hill , en 1929, y que se basa en emplear una matriz como clave  para cifrar un texto en claro y su inversa para descifrar el criptograma correspondiente . Hay tres cosas que me gustan de la criptografía clásica, además de que considero que ésta es muy didáctica a la hora de comprender los sistemas criptográficos modernos: la primera de ellas es que me "obliga" a repasar conceptos de matemáticas aprendidos hace mucho tiempo y, desgraciadamente, olvidados también hace demasiado tiempo, y, por consiguiente, que, como dice  Dani , amigo y coautor de este blog, me "obliga" a hacer "gimnasia mental"; la segunda es que, en la mayoría de las ocasiones, pueden cifrarse y descifrase los mensajes, e incluso realizarse el criptoanálisis de los criptogramas, sin más que un simple lápiz y papel, es decir, para mi es como un pasat

¿Qué significa el emblema de la profesión informática? (I)

Todas o muchas profesiones tienen un emblema que las representa simbólicamente y en el caso de la  informática: " es el establecido en la resolución de 11 de noviembre de 1977  para las titulaciones universitarias superiores de informática, y  está constituido por una figura representando en su parte central  un  núcleo toroidal de ferrita , atravesado por  hilos de lectura,  escritura e inhibición . El núcleo está rodeado por  dos ramas : una  de  laurel , como símbolo de recompensa, y la otra, de  olivo , como  símbolo de sabiduría. La  corona  será la  de la casa real  española,  y bajo el escudo se inscribirá el acrónimo de la organización. ". Veamos los diferentes elementos tomando como ejemplo el emblema del COIIE/EIIEO (Colegio Oficial de Ingenieros en Informática del País Vasco/ Euskadiko Informatikako Ingeniarien Elkargo Ofiziala ) . Pero no sólo el COIIE/EIIEO adopta el emblema establecido en dicha resolución, sino que éste se adopta también como im