Ir al contenido principal

Criptografía (CCLXXII): Ataque 'Hill Climbing' a la sustitución simple monoalfabética

Decía en este post que iba a desarrollar el algoritmo 'Hill Climbing' para atacar criptogramas cifrados mediante sustitución simple monoalfabética utilizandla calificación o puntuación basada en las estadísticas de tetragramas de la aptitud ('fitness') de los textos que se vayan descifrando con las sucesivas claves a probar. Todo ello, con objeto de obtener la clave correcta empleada en el cifrado.

El algoritmo que voy a implementar puede representarse gráficamente de la siguiente manera:

1.- En primer lugar, se generará la clave con la que se iniciará la secuencia de descifrados, pero no será aleatoria, sino que como clave inicial se generará aquella conforme a la frecuencia relativa de los caracteres (monogramas) del criptograma con respecto a las letras del idioma en el que esté escrito el texto en claro.

Es decir, si el idioma es el español, la letra "E" de la clave (el alfabeto de sustitución) será la que aparezca con mayor frecuencia en el criptograma, la letra "A" del alfabeto de la clave se corresponderá con la segunda con mayor frecuencia de aparición en el criptograma, y así sucesivamente.

El orden de frecuencia de aparición de las letras (de mayor a menor) considerado para el español e inglés es el siguiente (ver este post):

a) Español:

['E','A','O','S','R','N','I','D','L','C','T','U','M','P','B','G','Y','V','Q','H','F','Z','J','Ñ','X','W','K']

b) Inglés:

['E','T','A','O','I','N','S','H','R','D','L','C','U','M','W','F','G','Y','P','B','V','K','J','X','Q','Z']

además, se inicializarán: la mejor calificación o puntuación de la aptitud del texto descifrado ('fitness') y el límite máximo de iteraciones sin mejora a realizar antes de dar por finalizada la ejecución del algoritmo.

2.- Se obtiene el texto descifrado y se califica su aptitud ('fitness').

3.- Si se ha obtenido una mejora, es decir, el 'fitness' del texto descifrado es mayor que el mejor 'fitness' obtenido hasta el momento, entonces se pondrá como mejor clave la utilizada en el descifrado del texto y como mejor 'fitness' el obtenido en este descifrado, y se pondrá a cero el número de iteraciones sin mejora. Nótese que la primera vez siempre habrá mejora, ya que el mejor 'fitness' se ha inicializado con un número negativo grande.

Mientras que si no ha habido mejora se incrementará en una unidad el número de iteraciones sin mejora y en el caso de que éste haya superado el límite prestablecido el algoritmo finalizará.

4.- La nueva clave (alfabeto de sustitución) a utilizar en el siguiente descifrado será la mejor clave hasta el momento en la que se permutarán (intercambiarán) dos letras al azar.

En un próximo post pondré un script en python con esta implementación, lo ejecutaré con varios criptogramas de diferentes tamaños, para comprobar su eficacia y eficiencia, y comentaré los resultados obtenidos.

Quizás también te interese:

Comentarios

Entradas populares de este blog

Criptografía (I): cifrado Vigenère y criptoanálisis Kasiski

Hace unos días mi amigo Iñaki Regidor ( @Inaki_Regidor ), a quien dedico esta entrada :), compartió en las redes sociales un post titulado "Criptografía: el arte de esconder mensajes"  publicado en uno de los blogs de EiTB . En ese post se explican ciertos métodos clásicos para cifrar mensajes , entre ellos el cifrado de Vigenère , y , al final del mismo, se propone un reto consistente en descifrar un mensaje , lo que me ha animado a escribir este post sobre el método Kasiski  para atacar un cifrado polialfabético ( conociendo la clave descifrar el mensaje es muy fácil, pero lo que contaré en este post es la forma de hacerlo sin saberla ). El mensaje a descifrar es el siguiente: LNUDVMUYRMUDVLLPXAFZUEFAIOVWVMUOVMUEVMUEZCUDVSYWCIVCFGUCUNYCGALLGRCYTIJTRNNPJQOPJEMZITYLIAYYKRYEFDUDCAMAVRMZEAMBLEXPJCCQIEHPJTYXVNMLAEZTIMUOFRUFC Como ya he dicho el método de Vigenère es un sistema de sustitución polialfabético , lo que significa que, al contrario que en un sistema de

¿Qué significa el emblema de la profesión informática? (I)

Todas o muchas profesiones tienen un emblema que las representa simbólicamente y en el caso de la  informática: " es el establecido en la resolución de 11 de noviembre de 1977  para las titulaciones universitarias superiores de informática, y  está constituido por una figura representando en su parte central  un  núcleo toroidal de ferrita , atravesado por  hilos de lectura,  escritura e inhibición . El núcleo está rodeado por  dos ramas : una  de  laurel , como símbolo de recompensa, y la otra, de  olivo , como  símbolo de sabiduría. La  corona  será la  de la casa real  española,  y bajo el escudo se inscribirá el acrónimo de la organización. ". Veamos los diferentes elementos tomando como ejemplo el emblema del COIIE/EIIEO (Colegio Oficial de Ingenieros en Informática del País Vasco/ Euskadiko Informatikako Ingeniarien Elkargo Ofiziala ) . Pero no sólo el COIIE/EIIEO adopta el emblema establecido en dicha resolución, sino que éste se adopta también como im

Criptografía (XXIII): cifrado de Hill (I)

En este post me propongo explicar de forma comprensible lo que he entendido sobre el cifrado de Hill , propuesto por el matemático Lester S. Hill , en 1929, y que se basa en emplear una matriz como clave  para cifrar un texto en claro y su inversa para descifrar el criptograma correspondiente . Hay tres cosas que me gustan de la criptografía clásica, además de que considero que ésta es muy didáctica a la hora de comprender los sistemas criptográficos modernos: la primera de ellas es que me "obliga" a repasar conceptos de matemáticas aprendidos hace mucho tiempo y, desgraciadamente, olvidados también hace demasiado tiempo, y, por consiguiente, que, como dice  Dani , amigo y coautor de este blog, me "obliga" a hacer "gimnasia mental"; la segunda es que, en la mayoría de las ocasiones, pueden cifrarse y descifrase los mensajes, e incluso realizarse el criptoanálisis de los criptogramas, sin más que un simple lápiz y papel, es decir, para mi es como un pasat