Ir al contenido principal

Criptografía (CCXIV): ¿Sabías que...? (XIV)

Decía en este post sobre cosas curiosas de la criptografía que hay multitud de novelas y películas en las que se hace referencia a la criptología (criptografía y criptoanálisis), e incluso que tratan ésta como parte principal de su trama.

Algunos ejemplos de películas son: `The Imitation Game' ("Descifrando Enigma", 2014), 'National Treasure: Book of Secrets' ("La búsqueda 2: el diario secreto", 2007) y 'The Da Vinci Code' ("El código Da Vinci'', 2006), y  en esta entrada me voy a referir a otra película también muy famosa sobre esta temática: 'Zodiac'dirigida por David Fincher y protagonizada por Jake Gyllenhaal en 2007. 

Esta película, basada en hechos reales, cuenta la historia de un asesino en serie, "el asesino del Zodiaco", que cometió al menos siete asesinatos en el área de la Bahía de San Francisco y alrededores a finales de la década de 1960 y principios de los 70, y que tras sus crímenes enviaba mensajes cifrados a los periódicos burlándose de la policía y retándoles a que le identificaran y lo detuvieran.

A día de hoy, los crímenes atribuidos al "asesino del Zodiaco" continúan sin resolverse, y sólo muy recientemente, tras más de 50 años, se ha conseguido descifrar el criptograma que se conoce como Z-340 (o simplemente 340), ya que consta de 340 caracteres.

La verdad es que, aunque conocía algo la historia en la que se basa y el criptosistema utilizado por el asesino, hasta hace muy poco no la había visto, y tras ello me he animado a escribir este post. 

En esta entrada voy a referirme al primero de los criptogramas que envío. "El asesino del zodiaco" dividió el criptograma en tres partes y las mandó el 1 de agosto de 1969, en senda cartas, a las redacciones del 'Vallejo Times Herald', el 'San Francisco Chronicle' y el 'San Francisco Examiner', respectivamente. El criptograma en cuestión tenía 408 caracteres y, por tanto, se le conoce como Z-408 (o simplemente 408) y supuestamente desvelaba su identidad.

- Primer parte del criptograma Z-408 (136 caracteres):
Segunda parte del criptograma Z-408 (136 caracteres):
Tercera parte del criptograma Z-408 (136 caracteres):
El asesino exigía que las tres partes del criptograma fueran publicadas en las respectivas primeras páginas de los citados diarios. De lo contrario, continuaría matando.

Como veremos más adelante, las personas que consiguieron descifrarlo, evidentemente, tuvieron que establecer una serie de premisas iniciales, que venían dadas, pero que creo conveniente recordar:

1.- El mensaje en claro estaría escrito en inglés.

2.- Para el cifrado se habría usado un criptosistema de los llamados de "lápiz y papel", ya que en esa época el asesino muy raramente podría haber tenido acceso a otro tipo de criptosistemas.  

3.- Los tres criptogramas formarían realmente parte del mismo criptograma, es decir, el criptosistema empleado sería el mismo en los tres casos y la clave utilizada en el cifrado también sería la misma, ya que si no su descifrado se podría complicar mucho.

4.- Contando el número de símbolos distintos que aparecen en el criptograma se observa que son muchos más que las letras del alfabeto inglés (26), por lo que lo más probable es que el criptosistema empleado fuera el de sustitución homofónica, es decir, aquel en el que cada letra del texto en claro se puede sustituir por varios símbolos distintos en el criptograma conforme a una clave (tabla de homófonos), que indica los símbolos que pueden sustituir a las letras del texto en claro y que se mantiene durante todo proceso de cifrado del mensaje. Este tipo de criptosistema, del que ya he escrito varias entradas en este blog, pretende imposibilitar o, al menos, dificultar el criptoanálisis basado en el análisis de frecuencias correspondiente al alfabeto original, en este caso el inglés, para determinar el símbolo que sustituye a cada una de las letras. Aunque no lo voy a hacer, supongo que lo primero que hicieron los encargados de descifrarlo fue el análisis de frecuencias de los símbolos que aparecen en el criptograma sin obtener ninguna conclusión válida, por lo que parece que el asesino había asignado un mayor número de homófonos a las letras más frecuentes del inglés que los que había hecho corresponder a las menos frecuentes, consiguiendo así aplanar la frecuencia de todos los símbolos en el criptograma.  

Y es aquí donde entiendo que no quedaba otra opción que intentar descifrar el criptograma mediante un ataque de texto claro conocido (en ingles 'Known plain text attack'), ya que la fuerza bruta tampoco estaba disponible en esa época, es decir, se trataba de ir infiriendo o deduciendo palabras que muy probablemente estuvieran en el mensaje descifrado y que fueran "el hilo del que tirar del ovillo". Después de todo, ¿De qué hablaría un psicópata asesino en el texto en claro?: palabras como 'kill', 'killer', 'killed', 'killing',... parece que tenían muchas probabilidades de aparecer en el texto en claro y, si se lograba encajar con éxito alguna o parte de ellas, apoyándose en otras palabras frecuentes en inglés, o parte de ellas, que también fuera posible inferir se podía conseguir descifrar el criptograma poco a poco.

Esto es lo que debieron pensar Donald Harden, un profesor de secundaria, y su esposa Bettye, que tan sólo una semana después de su recepción consiguieron descifrar el criptograma, al menos parcialmente, porque no lograron descifrar sus últimos dieciocho caracteres. ¿Puede ser que esos dieciocho caracteres ocultaran la identidad del asesino?, ya que éste dijo en la carta que acompañó a la parte del criptograma que envió al 'San Francisco Chronicle' que en el mensaje cifrado se encontraba su identidad ('in this cipher is my identity'). No lo sé, a día de hoy esos dieciocho caracteres continúan siendo un misterio, aunque hay quien conjetura que podrían contener el pseudónimo ("Zodiac", "el asesino del Zodiaco" o similar), ya que, tal y como se verá más adelante, en el propio texto en claro el asesino dice que no va a dar su nombre ('I WILL NOT GIVE YOU MY NAME...').

Pero, ¿Cómo lograron descifrarlo? Pues tengo entendido que de la forma que he comentado anteriormente, es decir, en esencia, dedujeron palabras que probablemente estuvieran en el texto en claro escrito por un psicópata asesino (en terminología criptográfica 'cribs', por ejemplo: 'kill' y sus variantes) y fueron encajándolas en el criptograma para que les sirvieran de base para descifrarlo. En este sentido, yo creo que "el asesino del Zodiaco" cometió algún error que hizo más fácil el ataque de texto claro conocido: como los símbolos que aparecen repetidos de forma consecutiva en el criptograma, lo que unido a que "LL" es el bigrama de doble letra significativamente más frecuente en inglés y suponiendo que ambas letras estuvieran contenidas en la misma palabra, permitió encajar la palabra 'kill', sus variantes y otras palabras muy frecuentes ('will', all',... ) y tener ya así el "hilo del que tirar del ovillo".
Aplicando lo anteriormente mencionado y considerando que el egocentrismo, íntimamente relacionado con la falta de empatía, es uno de los principales rasgos de los psicópatas, los Harden pensaron que muy probablemente el texto en claro comenzara con la palabra 'I' ("Yo"), lo que supongo que, junto con el encaje de la palabra 'kill', les llevó de forma muy fácil a una primera aproximación del texto en claro y, en consecuencia, a una primera aproximación de la tabla de homófonos empleada por el asesino.
Razón por la que parece que el asesino no eran tan listo o, al menos, mucho menos de lo que él se creía, porque su criptograma, en mi opinión, además de los símbolos  repetidos de forma consecutiva que he mencionado antes, presentaba dos vulnerabilidades adicionales:

1.- Un mensaje excesivamente largo (408 caracteres) cifrado con la misma clave (la misma tabla de homófonos).

2.- Se "repite más que el ajo": la palabra 'kill' y sus derivadas aparecen en una cantidad muy elevada y, como cualquier aprendiz de criptología sabe, yo mismo incluido, repetirse en exceso no es una buena elección cuando se desea mantener el secreto. Lo mismo se puede decir sobre su egocentrismo que, aún en esta primera aproximación, se ve que le lleva a repetir la palabra 'I' hasta la saciedad, con lo que hay otra repetición que se puede explotar.

Todo ello no sólo deja la puerta abierta a un criptoanálisis con éxito basado en un ataque de texto claro conocido, sino que lo facilita enormemente.    

No voy a continuar con el ataque de texto claro conocido, eso se lo dejo a los lectores de este blog que estén interesados en hacer el ejercicio para completarlo, pero siguiendo con esta misma idea se puede obtener el texto en claro sin demasiada dificultad.

Es decir: 'ILIKEKILLINGPEOPLEBECAUSEITISSOMUCHFUNITISMOREFUNTHANKILLINGWILDGAMEINTHEFORRESTBECAUSEMANISTHEMOSTDANGEROUSANIMALOFALLTOKILLSOMETHINGGIVESMETHEMOSTTHRILLINGEXPERIENCEITISEVENBETTERTHANGETTINGYOURROCKSOFFWITHAGIRLTHEBESTPARTOFITISTHATWHENIDIEIWILLBEREBORNINPARADICEANDALLTHEIHAVEKILLEDWILLBECOMEMYSLAVESIWILLNOTGIVEYOUMYNAMEBECAUSEYOUWILLTRYTOSLOIDOWNORSTOPMYCOLLECTINGOFSLAVESFORMYAFTERLIFEEBEORIETEMETHHPITI'.

Corrigiendo alguna falta de ortografía, lo que parece que era habitual en las comunicaciones del asesino, o letra mal cifrada quedaría algo así como:

'I LIKE KILLING PEOPLE BECAUSE IT IS SO MUCH FUN IT IS MORE FUN THAN KILLING WILD GAME IN THE FOREST BECAUSE MAN IS THE MOST DANGEROUS ANIMAL OF ALL TO KILL SOMETHING GIVES ME THE MOST THRILLING EXPERIENCE IT IS EVEN BETTER THAN GETTING YOUR ROCKS OFF WITH A GIRL THE BEST PART OF IT IS THAT WHEN I DIE I WILL BE REBORN IN PARADISE AND ALL THE I HAVE KILLED WILL BECOME MY SLAVES I WILL NOT GIVE YOU MY NAME BECAUSE YOU WILL TRY TO SLOW DOWN OR STOP MY COLLECTING OF SLAVES FOR MY AFTER LIFE EBEORIETEMETHHPITI'.

Con lo que el texto en claro traducido al español sería, más o menos, el siguiente:

"ME GUSTA MATAR GENTE PORQUE ES MUCHO MÁS DIVERTIDO QUE MATAR ANIMALES SALVAJES EN EL BOSQUE, PORQUE EL HOMBRE ES EL ANIMAL MÁS PELIGROSO DE TODOS. MATAR ALGO ES LA EXPERIENCIA MÁS EXCITANTE. ES AÚN MEJOR QUE ACOSTARSE CON UNA CHICA. LO MEJOR DE TODO ESTO ES QUE, CUANDO ME MUERA, RENACERÉ EN EL PARAÍSO Y TODOS A LOS QUE HE MATADO SERÁN MIS ESCLAVOS. NO OS DARÉ MI NOMBRE PORQUE TRATARÁN DE RETRASAR O DETENER MI RECOLECCIÓN DE ESCLAVOS PARA MI VIDA EN EL MÁS ALLÁ EBEORIETEMETHHPITI".

Todo lo que parece tener sentido, y no me refiero a lo que expresa (algo sólo digno de una mente muy enferma), excepto los últimos dieciocho caracteres, enmarcados en color verde en la figura anterior, cuyo descifrado a día de hoy continúa siendo un misterio.

Con lo que la tabla de homófonos empleada por el asesino fue la siguiente:
Al margen de este primer criptograma y tal y como he dicho al principio, a día de hoy, el conocido como criptograma Z-340 (o simplemente 340) ha tardado más de cincuenta años en descifrarse, pero esto será objeto, si es el caso, de un post posterior, aunque ya adelanto que el "asesino del Zodiaco" se esmeró algo más para mantener el secreto que en el primer criptograma, utilizando un criptosistema que combinaba la sustitución homofónica con  la transposición.

Y como cu
riosidad final, comentar que en la película 'Dirty Harry' ("Harry el sucio", 1971), que a su vez sale en esta película, el personaje de 
Scorpio, un asesino en serie al que perseguía el detective Harry Callahan, papel interpretado por Clint Eastwood, está inspirado en "el asesino del Zodiaco". Las similitudes son evidentes y van más allá de que el villano de esta última película tenga como pseudónimo un signo del zodiaco y que ambos asesinos en serie, el de ficción y el de la vida real, operaran en San Francisco.

Comentarios

Entradas populares de este blog

Criptografía (I): cifrado Vigenère y criptoanálisis Kasiski

Hace unos días mi amigo Iñaki Regidor ( @Inaki_Regidor ), a quien dedico esta entrada :), compartió en las redes sociales un post titulado "Criptografía: el arte de esconder mensajes"  publicado en uno de los blogs de EiTB . En ese post se explican ciertos métodos clásicos para cifrar mensajes , entre ellos el cifrado de Vigenère , y , al final del mismo, se propone un reto consistente en descifrar un mensaje , lo que me ha animado a escribir este post sobre el método Kasiski  para atacar un cifrado polialfabético ( conociendo la clave descifrar el mensaje es muy fácil, pero lo que contaré en este post es la forma de hacerlo sin saberla ). El mensaje a descifrar es el siguiente: LNUDVMUYRMUDVLLPXAFZUEFAIOVWVMUOVMUEVMUEZCUDVSYWCIVCFGUCUNYCGALLGRCYTIJTRNNPJQOPJEMZITYLIAYYKRYEFDUDCAMAVRMZEAMBLEXPJCCQIEHPJTYXVNMLAEZTIMUOFRUFC Como ya he dicho el método de Vigenère es un sistema de sustitución polialfabético , lo que significa que, al contrario que en un sistema de

Criptografía (XXIII): cifrado de Hill (I)

En este post me propongo explicar de forma comprensible lo que he entendido sobre el cifrado de Hill , propuesto por el matemático Lester S. Hill , en 1929, y que se basa en emplear una matriz como clave  para cifrar un texto en claro y su inversa para descifrar el criptograma correspondiente . Hay tres cosas que me gustan de la criptografía clásica, además de que considero que ésta es muy didáctica a la hora de comprender los sistemas criptográficos modernos: la primera de ellas es que me "obliga" a repasar conceptos de matemáticas aprendidos hace mucho tiempo y, desgraciadamente, olvidados también hace demasiado tiempo, y, por consiguiente, que, como dice  Dani , amigo y coautor de este blog, me "obliga" a hacer "gimnasia mental"; la segunda es que, en la mayoría de las ocasiones, pueden cifrarse y descifrase los mensajes, e incluso realizarse el criptoanálisis de los criptogramas, sin más que un simple lápiz y papel, es decir, para mi es como un pasat

¿Qué significa el emblema de la profesión informática? (I)

Todas o muchas profesiones tienen un emblema que las representa simbólicamente y en el caso de la  informática: " es el establecido en la resolución de 11 de noviembre de 1977  para las titulaciones universitarias superiores de informática, y  está constituido por una figura representando en su parte central  un  núcleo toroidal de ferrita , atravesado por  hilos de lectura,  escritura e inhibición . El núcleo está rodeado por  dos ramas : una  de  laurel , como símbolo de recompensa, y la otra, de  olivo , como  símbolo de sabiduría. La  corona  será la  de la casa real  española,  y bajo el escudo se inscribirá el acrónimo de la organización. ". Veamos los diferentes elementos tomando como ejemplo el emblema del COIIE/EIIEO (Colegio Oficial de Ingenieros en Informática del País Vasco/ Euskadiko Informatikako Ingeniarien Elkargo Ofiziala ) . Pero no sólo el COIIE/EIIEO adopta el emblema establecido en dicha resolución, sino que éste se adopta también como im