Ir al contenido principal

Criptografía (XXXII): ¿Sabías que...? (VIII)

En el post anterior llegué a una primera tabla de homófonos candidatos para intentar descifrar un criptograma cifrado con la clave "Bocho" en la guerra civil española y en éste avanzo en su descifrado hasta obtener el texto en claro.

1.- Continúo intentando identificar más candidatos a través de los bigramas más frecuentes.

Una vez establecidos los candidatos a ser la "E" y la "A", los bigramas más frecuentes en español que empiezan por "O" son: "OS", "ON" y "OR".

los bigramas repetidos (3 o mas veces) que se observan en el criptograma y que terminan por los candidatos establecidos hasta el momento para la "S", "N" o "R" son los siguientes:

Bigr. F.
05343
23343
82343
53383
28733
49734
53465
91463
53123
01823
05273
91273
01774
33773
53173

Por tanto, creo que con bastante probabilidad (atendiendo a los resultados obtenidos hasta el momento - descartando inicialmente aquellos bigramas repetidos que comienzan con candidatos ya establecidos a ser la "E" y "A" -, a los hómofonos que aparecen precediendo a los candidatos a ser la "S", "N" o "R" en dichos bigramas y a la frecuencia estándar de cada letra en el idioma español) los homófonos "49" y "82" son candidatos a ser la "O".

E: 53 (17,27%), 04 (15,91%), 91 (14,55%), 88 (14,09%), 28 (11,82%).
A: 01 (10,91%), 23 (10, 91%), 33 (10,91%), 05 (10,45%), 54 (10,45%).
O: 49 (9,55%), 82 (7,73%).
S: 34 (11,36%), 38 (9,55%), 73 (9,09%), 46 (8,64%), 12 (8,18%), 82 (7,73%), 27 (7,27%), 77 (7,27%), 17 (5,45%).
R: 34 (11,36%), 38 (9,55%), 73 (9,09%), 46 (8,64%), 12 (8,18%), 82 (7,73%), 27 (7,27%), 77 (7,27%), 17 (5,45%).
N: 34 (11,36%), 38 (9,55%), 73 (9,09%), 46 (8,64%), 12 (8,18%), 82 (7,73%), 27 (7,27%), 77 (7,27%), 17 (5,45%).
I: 51 (4,55%).
D: 51 (4,55%).
C: 51 (4,55%).

Una vez que he establecido que "49" puede corresponderse con la "O", como éste precede al "73" en cuatro ocasiones, "73" es más probable que sea la "S" en el texto en claro, al igual que "83" (5,00%), al que precede en 3 ocasiones, podría corresponderse con "S", "N" o "R" (más probable que sea la "S" considerando los bigramas más frecuentes en español, pero más probable que sea la "N" conforme a la frecuencia estimada de aparición en el texto en claro de esta última letra, que es a la que sustituiría).

E: 53 (17,27%), 04 (15,91%), 91 (14,55%), 88 (14,09%), 28 (11,82%).
A: 01 (10,91%), 23 (10, 91%), 33 (10,91%), 05 (10,45%), 54 (10,45%).
O: 49 (9,55%), 82 (7,73%).
S: 34 (11,36%), 38 (9,55%), 73 (9,09%)46 (8,64%), 12 (8,18%), 82 (7,73%), 27 (7,27%), 77 (7,27%), 17 (5,45%), 83 (5,00%).
R: 34 (11,36%), 38 (9,55%), 73 (9,09%), 46 (8,64%), 12 (8,18%), 82 (7,73%), 27 (7,27%), 77 (7,27%), 17 (5,45%), 83 (5,00%).
N: 34 (11,36%), 38 (9,55%), 73 (9,09%), 46 (8,64%), 12 (8,18%), 82 (7,73%), 27 (7,27%), 77 (7,27%), 17 (5,45%), 83 (5,00%).
I: 51 (4,55%).
D: 51 (4,55%).
C: 51 (4,55%).

¿Podemos intentar averiguar si el homófono "82" se corresponde a una vocal (hasta ahora candidato a ser la "O") o a una consonante (hasta ahora candidato a ser la "S", "R" o "N")?. Si acudimos al criptograma observamos que el homófono "82" precede mayoritariamente a candidatos a ser la "S", "R", o "N" (en 9 ocasiones) frente a candidatos a ser la "E" (en 2 ocasiones), por lo que creo que el homófono "82" probablemente se corresponda con la "O".

E: 53 (17,27%), 04 (15,91%), 91 (14,55%), 88 (14,09%), 28 (11,82%).
A: 01 (10,91%), 23 (10, 91%), 33 (10,91%), 05 (10,45%), 54 (10,45%).
O: 49 (9,55%), 82 (7,73%).
S: 34 (11,36%), 38 (9,55%), 73 (9,09%)46 (8,64%), 12 (8,18%), 27 (7,27%), 77 (7,27%), 17 (5,45%), 83 (5,00%).
R: 34 (11,36%), 38 (9,55%), 73 (9,09%), 46 (8,64%), 12 (8,18%), 27 (7,27%), 77 (7,27%), 17 (5,45%), 83 (5,00%).
N: 34 (11,36%), 38 (9,55%), 73 (9,09%), 46 (8,64%), 12 (8,18%), 27 (7,27%), 77 (7,27%), 17 (5,45%), 83 (5,00%).
I: 51 (4,55%).
D: 51 (4,55%).
C: 51 (4,55%).

Una vez que he establecido que "82" puede corresponderse con la "O", como éste precede al "34" en tres ocasiones, es más probable que "34" sea la "S" en el texto en claro.

E: 53 (17,27%), 04 (15,91%), 91 (14,55%), 88 (14,09%), 28 (11,82%).
A: 01 (10,91%), 23 (10, 91%), 33 (10,91%), 05 (10,45%), 54 (10,45%).
O: 49 (9,55%), 82 (7,73%).
S: 34 (11,36%), 38 (9,55%), 73 (9,09%)46 (8,64%), 12 (8,18%), 27 (7,27%), 77 (7,27%), 17 (5,45%), 83 (5,00%).
R: 34 (11,36%), 38 (9,55%), 73 (9,09%), 46 (8,64%), 12 (8,18%), 27 (7,27%), 77 (7,27%), 17 (5,45%), 83 (5,00%).
N: 34 (11,36%), 38 (9,55%), 73 (9,09%), 46 (8,64%), 12 (8,18%), 27 (7,27%), 77 (7,27%), 17 (5,45%), 83 (5,00%).
I: 51 (4,55%).
D: 51 (4,55%).
C: 51 (4,55%).

2.- Intento identificar más candidatos y confirmar los ya establecidos en base a los trigramas repetidos en el criptograma.

En el criptograma sólo se observa un trigrama repetido que comienza por los candidatos a ser la "E": "531297" (2 veces).

Considerando los resultados obtenidos hasta el momento, que los trigramas más frecuentes en español que comienzan por "E" son: "EST", "EDE", "ESP", "ENC", "ENT", "ESE" y "ERE", y la frecuencia de aparición estimada para el carácter al que sustituiría el homófono "97" en el texto en claro (4,09%), creo que éste podría corresponderse con la "T" (aunque también podría corresponderse con la "C" y con menor probabilidad con la "P"). Por si acaso, anoto que podría ser cualquiera de las tres, pero con mayor probabilidad de ser la "T".

E: 53 (17,27%), 04 (15,91%), 91 (14,55%), 88 (14,09%), 28 (11,82%).
A: 01 (10,91%), 23 (10, 91%), 33 (10,91%), 05 (10,45%), 54 (10,45%).
O: 49 (9,55%), 82 (7,73%).
S: 34 (11,36%), 38 (9,55%), 73 (9,09%)46 (8,64%), 12 (8,18%), 27 (7,27%), 77 (7,27%), 17 (5,45%), 83 (5,00%).
R: 34 (11,36%), 38 (9,55%), 73 (9,09%), 46 (8,64%), 12 (8,18%), 27 (7,27%), 77 (7,27%), 17 (5,45%), 83 (5,00%).
N: 34 (11,36%), 38 (9,55%), 73 (9,09%), 46 (8,64%), 12 (8,18%), 27 (7,27%), 77 (7,27%), 17 (5,45%), 83 (5,00%).
I: 51 (4,55%).
D: 51 (4,55%).
C: 51 (4,55%), 97 (4,09%).
T: 97 (4,09%).
P: 97 (4,09%).

Por otra parte, en el criptograma se observan dos trigramas repetidos que comienzan por los candidatos a ser la "A": "017733" y "055238", ambos repetidos 2 veces.

Considerando los resultados obtenidos hasta el momento ("01" y "33" son candidatos a ser la "A") y que los trigramas más frecuentes en español que comienzan por "A" son: "ARA"y "ADO", parece confirmarse que "77" es un candidato muy probable a ser la "R".

3.- Intento depurar un poco la lista de candidatos obtenida hasta el momento y añadir alguno más.

Los bigramas más frecuentes en español que empiezan por las consonantes de mayor frecuencia ("S", "R" y "N") y que terminan en vocal son "RA" y "RE", y entre los bigramas repetidos (3 o más veces) el homófono "38" precede en tres ocasiones al "04" (candidato a ser "E"") y en otras tres al "01" (candidato a ser "A"), por lo que "38" es más probable que se corresponda con la "R" que con "S" o "N".

Por otra parte, si el "97" fuera la "T", la "C" o la "P" los homófonos que le siguen muy probablemente sean vocales o se correspondan con la "R". Los homófonos que siguen al "97" en el criptograma son los siguientes: "01", "04", "23", "33", "42", "53", "61", "63" y "88". Con lo que, conforme a la frecuencia estimada de aparición de la letra a la que cada uno de ellos sustituiría en el texto en claro, los homófonos "61" (7,73%) y "63" (7,73%) son candidatos a ser la "O", "R" o "I", y "42" (5,91%) podría corresponderse con "R", "I" o incluso, aunque con menor probabilidad, con la "U".

¿Podemos intentar averiguar a qué caracteres es más probable que se correspondan los homófonos "61" y "63" (hasta ahora ambos son candidatos a ser la "O", "I" o "R")?. Si acudimos al criptograma observamos que el homófono "61" precede mayoritariamente a candidatos a ser la "S", "R", o "N" (en 7 ocasiones) frente a 1 candidato a ser vocal, por lo que creo que el homófono "61" probablemente se corresponda con la "O", mientras que el hómofono "63" precede únicamente a candidatos a ser vocales (en 7 ocasiones), por lo que creo que el homófono "63" probablemente se corresponda con la "R" o "I".

Una vez que hemos establecido que "61" puede corresponderse con la "O", si acudimos al criptograma, observamos que éste precede  a los siguientes homófonos que todavía no hemos asignado como candidatos: "03" (6,36%), "31" (5,00%), "50" (5,00%), "55" (0,45%), "59" (3,18%), "67" (4,09%), "72" (3,18%) y "98" (4,55%). Por lo que, conforme a la frecuencia estándar de cada letra en el idioma español y a los bigramas más frecuentes en este idioma, probablemente "03" se corresponda con "S", "R" o "N".

Ahora, fijándonos en el criptograma, vemos que éste comienza con un candidato a ser la "E" ("28"), asumiendo que esto es así, el homófono que le sigue ("83") es muy probable que se corresponda con "S" o "N", por lo que descartamos, al menos inicialmente, que "83" sea candidato a ser la "R".

Por todo ello, hasta el momento:

E: 53 (17,27%), 04 (15,91%), 91 (14,55%), 88 (14,09%), 28 (11,82%).
A: 01 (10,91%), 23 (10, 91%), 33 (10,91%), 05 (10,45%), 54 (10,45%).
O: 49 (9,55%), 61 (7,73%)82 (7,73%).
S: 34 (11,36%), 38 (9,55%), 73 (9,09%)46 (8,64%), 12 (8,18%), 27 (7,27%), 77 (7,27%), 03 (6,36%), 17 (5,45%), 83 (5,00%).
R: 34 (11,36%), 38 (9,55%), 73 (9,09%), 46 (8,64%), 12 (8,18%), 63 (7,73%), 27 (7,27%), 77 (7,27%), 03 (6,36%), 42 (5,91%), 17 (5,45%).
N: 34 (11,36%), 38 (9,55%), 73 (9,09%), 46 (8,64%), 12 (8,18%), 27 (7,27%), 77 (7,27%), 03 (6,36%), 17 (5,45%), 83 (5,00%).
I: 63 (7,73%), 42 (5,91%), 51 (4,55%).
D: 51 (4,55%).
C: 51 (4,55%), 97 (4,09%).
T: 97 (4,09%).
U: 42 (5,91%).
P: 97 (4,09%).

4.- Con la tabla de hómofonos obtenida hasta el momento, voy a intentar una primera aproximación al texto en claro, a ver si obtengo alguna pista adicional (palabras, parte de ellas, etc.), seleccionando un máximo de 5 homófonos candidatos por letra, de la siguiente manera:

- Para cada letra elijo aquellos candidatos que he marcado como más probables en orden decreciente de la frecuencia estimada de aparición de la letra a la que sustituirían en el texto en claro.

- Posteriormente incluyo para cada letra los siguientes candidatos que figuren en la tabla en el  mismo orden que el indicado en el punto anterior, descartando en esta primera aproximación aquellos homófonos que figuren como candidatos a ser otra letra.

Es decir:

E: 53 (17,27%), 04 (15,91%), 91 (14,55%), 88 (14,09%), 28 (11,82%).
A: 01 (10,91%), 23 (10, 91%), 33 (10,91%), 05 (10,45%), 54 (10,45%).
O: 61 (7,73%)82 (7,73%), 49 (9,55%).
S: 34 (11,36%)73 (9,09%)46 (8,64%)83 (5,00%), 12 (8,18%).
R: 38 (9,55%)77 (7,27%), 63 (7,73%), 27 (7,27%) , 03 (6,36%).
N: 17 (5,45%).
I: 42 (5,91%).
C: 51 (4,55%).
T: 97 (4,09%).

Lógicamente se trata de una primera aproximación y prestaré especial atención a los candidatos a ser las consonantes más frecuentes ("S", "R" y "N"), ya que pueden estar intercambiados entre sí debido a que no es fácil distinguir entre ellas, ni por su frecuencia de aparición en un texto en claro escrito en español, ni por los bigramas más frecuentes en dicho idioma.

Con esta tabla de homófonos el texto en claro sería en una primera aproximación algo parecido a lo siguiente:

E S 72 A R A 57 E 64 A R I S E S R O 62 E A 21 E A 21 E E S 08
A 52 62 E 98 E R E S 25 93 14 52 E O 31 S A 45 E 52 R 93 22 A A 48 93
O S E 57 E S 10 56 E 57 E 78 A S 57 36 65 31 R 65 R A 19 A E S E 43
A 24 A R E 08 A E 59 E R R 78 A S O R E 95 72 A S 19 O R 19 E R
N 16 E 14 45 O 39 15 E 65 36 R E S 86 S O R 56 E 30 A 43 E 14 62 E R
E E 14 93 S 30 E S I E 65 O A E R A S E 56 T R 98 A C E 95 95 O
R E S E 65 18 A C A O E S 43 A R 93 A 78 A 16 E 94 24 O S 93 E S
21 O 43 E E N T E A R E A S O N 50 A 30 A R E 50 O S 43 O 57 E
62 E 59 E S 08 O S 99 56 E A 13 R 67 A R 95 R A S 95 E 00 S 93 65 57
E 87 22 62 A 57 E R A 72 E R I A 62 E S 99 31 E 13 A S R E E 84 47
62 E A R S E E S 56 S A 69 O 36 R A R O R E 62 O 22 00 A 43 E S
36 A R A 67 R E 85 E R 93 25 43 E 67 A R E 45 A 52 R A 78 E 78 R O
S E 58 93 O S I S A 09 00 62 36 A S E A 59 E S 08 E 47 31 21 R E 65
A S 22 O S N 72 65 31 I 65 S E A 09 52 O S 67 95 R R E 65 A 22 O S
21 93 C R O S E S E S 98 A S 36 65 A R 43 O 98 E 14 E 50 E 22 31 A
50 A 32 E S 98 A S R R 22 A O S E 57 65 E 43 A T A 18 E S E 02 56
95 A R A R 69 78 O S 72 E R 95 E S A 90 R A 94 A 59 O 55 56 E 24 86
E 21 A A 78 O S 50 I 78 I O S A 95 N E 67 E R A A E R A 50 65 A
59 O 50 93 98 E R E 10 00 E E S 98 A S A R E 56 S E A 09 19 E S 22
O S 21 A C 93 O S E N 26 A R 00 50 A O 50 A S 50 E A S 57 36 A 43
O S E 45 A 52 R A C A E S 90 E R A S 44 A 10 31 E A S 72 E S S
E 74 E 62 62 E 52 A E S 84 A 65 29 31 93 S A 32 O 72 65 O E 57 67 E C
36 O A E N 36 00 50 R A R A S R E 21 R A T A 09 E S T E E N 47
O N R 25 I 43 A R A R R E 31 S I R A 41 I 78 O S R A 90 93 R E
44 32 86 R 92 E S C I A C E S O R E 81 56 I E 95 E 36 A 21 O E 14
E 09 E S T O 59 E 98 E S 93 C O 67 E 65 E 47 R A 21 86 C 98 A O S
E S 95 E 85 E 65 93 21 A S 16 S 86 47 62 R 78 O 75 E 36 O 09 E 22 O S
59 A 37 93 09 A E 84 67 E S O E S 08 A 93 S A 98 93 A T I 48 E 32 R
E R E 22 31 E S 08 A 57 31 21 E N A 95 R O 62 14 O 75 47 R E 18 93 E
R E S T E R E R E S E 02 00 95 A R E 21 E N 81 00 E E S 47 E R
O R E S 47 E 22 36 O 67 A N A 25 R 62 93 21 A 21 R E A 43 R 26 A 65
E S 08 E 24 65 O 69 E 78 T A

Menudo galimatías, ya dije que no era tarea fácil, porque salvo las palabras o parte de ellas (de cuatro o más letras) que he marcado en azul no veo mucho más, y puedo descartar algunas de ellas, bien por el contexto (homófonos ya establecidos como candidatos) o bien porque si fuera así implicaría que dos homófonos de la misma decena se corresponderían con una misma letra en el texto en claro, lo que no puede ser conforme a la vulnerabilidad indicada al respecto en el post anterior.

No lo veo claro, pero no me desanimo y lo voy a intentar localizando:

4.1.- Nuevos candidatos y posibles errores a la hora de asignar homófonos hasta el momento (los marcados en color azul):

ES72ARA57E64ARISESRO62EA21EA21EES08
A5262E98ERES25931452EO31SA45E52R9322AA4893
OSE57ES1056E57E78AS57366531R65RA19AESE43
A24ARE08AE59ERR78ASORE9572AS19OR19ER
N16E1445O3915E6536RES86SOR56E30A43E1462ER
EE1493S30ESIE65OAERASE56TR98ACE9595O
RESE6518ACAOES43AR93A78A16E9424OS93ES
21O43EENTEAREASON50A30ARE50OS43O57E
62E59ES08OS9956EA13R67AR95RAS95E00S936557
E872262A57ERA72ERIA62ES9931E13ASREE8447
62EARSEES56SA69O36RARORE62O2200A43ES
36ARA67RE85ER932543E67ARE45A52RA78E78RO
SE5893OSISA09006236ASEA59ES08E473121RE65
AS22OSN726531I65SEA0952OS6795RRE65A22OS
2193CROSESES98AS3665AR43O98E14E50E2231A
50A32ES98ASRR22AOSE5765E43ATA18ESE0256
95ARAR6978OS72ER95ESA90RA94A59O5556E2486
E21AA78OS50I78IOSA95NE67ERAAERA5065A
59O509398ERE1000EES98ASARE56SEA0919ES22
OS21AC93OSEN26AR0050AO50AS50EAS5736A43
OSE45A52RACAES90ERAS44A1031EAS72ESS
E74E6262E52AES84A65293193SA32O7265OE5767EC
36OAEN360050RARASRE21RATA09ESTEEN47
ONR25I43ARARRE31SIRA41I78OSRA9093RE
443286R92ESCIACESORE8156IE95E36A21OE14
E09ESTO59E98ES93CO67E65E47RA2186C98AOS
ES95E85E659321AS16S864762R78O75E36O09E22OS
59A379309AE8467ESOES08A93SA9893ATI48E32R
ERE2231ES08A573121ENA95RO6214O7547RE1893E
RESTERERESE020095ARE21EN8100EES47ER
ORES47E2236O67ANA25R629321A21REA43R26A65
ES08E2465O69E78TA

El homófono "95" (5,91%) aparece repetido de forma consecutiva en una ocasión. Las letras más frecuentes repetidas en español, considerando que ambos homófonos se encuentren dentro de la misma palabra, son: "LL", "RR" y "CC" (menos frecuentemente "NN"), por lo que es posible que el homófono "95" se corresponda con cualquiera de ellas, lo que también puede encajar conforme a la frecuencia estimada de aparición de dichas letras en el texto en claro si fueran sustituidas en el criptograma por este homófono (en este caso la que peor se ajusta sería la "C"). Lo dicho es también aplicable al homófono "62" (6,36%), que aparece de forma consecutiva también en una ocasión. Sin embargo, por los homófonos que preceden y siguen inmediatamente a ese doble "95", voy a marcar como más probable que éste se corresponde con la "R", ya que entiendo que la palabra "CERRO" es más probable que "CELLO".

Ahora me fijo en la cadena "SRR" ("34", "77", "63"), que según esta primera aproximación aparecería en el texto en claro. No se me ocurre nada que pudiera justificarla, salvo que "SR" sea la abreviatura de Señor, por lo que creo que queda claro que me he equivocado al asignar esos homófonos como candidatos a esas letras (en uno, dos o los tres casos). En el caso del homófono "34" lo he considerado como uno de los candidatos más probables a ser la "S" y lo mismo ocurre con el "77" como candidato a ser la "R", mientras que el "63" he dicho anteriormente que se podía corresponder con la "R" (en la primera aproximación así lo he considerado) o con la "I" y, por tanto, en la siguiente aproximación consideraré que se corresponde con la "I".

4.2.- Homófonos candidatos a formar parte de palabras de cuatro letras muy frecuentes en español: "PARA", "PERO", "ESTE", "ESTA" y "ESTO" (los marcados en color azul):
ES72ARA57E64ARISESRO62EA21EA21EES08
A5262E98ERES25931452EO31SA45E52R9322AA4893
OSE57ES1056E57E78AS57366531R65RA19AESE43
A24ARE08AE59ERR78ASORE9572AS19OR19ER
N16E1445O3915E6536RES86SOR56E30A43E1462ER
EE1493S30ESIE65OAERASE56TR98ACE9595O
RESE6518ACAOES43AR93A78A16E9424OS93ES
21O43EENTEAREASON50A30ARE50OS43O57E
62E59ES08OS9956EA13R67AR95RAS95E00S936557
E872262A57ERA72ERIA62ES9931E13ASREE8447
62EARSEES56SA69O36RARORE62O2200A43ES
36ARA67RE85ER932543E67ARE45A52RA78E78RO
SE5893OSISA09006236ASEA59ES08E473121RE65
AS22OSN726531I65SEA0952OS6795RRE65A22OS
2193CROSESES98AS3665AR43O98E14E50E2231A
50A32ES98ASRR22AOSE5765E43ATA18ESE0256
95ARAR6978OS72ER95ESA90RA94A59O5556E2486
E21AA78OS50I78IOSA95NE67ERAAERA5065A
59O509398ERE1000EES98ASARE56SEA0919ES22
OS21AC93OSEN26AR0050AO50AS50EAS5736A43
OSE45A52RACAES90ERAS44A1031EAS72ESS
E74E6262E52AES84A65293193SA32O7265OE5767EC
36OAEN360050RARASRE21RATA09ESTEEN47
ONR25I43ARARRE31SIRA41I78OSRA9093RE
443286R92ESCIACESORE8156IE95E36A21OE14
E09ESTO59E98ES93CO67E65E47RA2186C98AOS
ES95E85E659321AS16S864762R78O75E36O09E22OS
59A379309AE8467ESOES08A93SA9893ATI48E32R
ERE2231ES08A573121ENA95RO6214O7547RE1893E
RESTERERESE020095ARE21EN8100EES47ER
ORES47E2236O67ANA25R629321A21REA43R26A65
ES08E2465O69E78TA

Tomo nota de los posibles homófonos a ser la "P" ("PARA" y "PERO") conforme a esta primera aproximación: "72" (3,18%), "95" (5,91%), "43" (5,45%) y "47" (3,64%), aunque los más probables son "72" y "47" por la estimación realizada en cuanto a la frecuencia de aparición de la letra a la que sustituirían en el texto en claro (los otros dos presentan mucha frecuencia de aparición según la estimación realizada para la letra "P" en el texto en claro). Además descarto que el "95" sea la "P" porque como he dicho antes aparece repetido de forma consecutiva en el criptograma.

Y ahora de los candidatos a ser la "T" ("ESTE", "ESTA" y "ESTO"): "72" (3,18%), "08" (3,18%), "43" (5,45%), "21" (6,82), "36" (5,45%), "98" (4,55%), "22" (5,00 %), "90" (1,36%), 84 (1,36%), "47" (3,64%) y "78" (5,00%), descartando inicialmente a: "21", "90" y "84", ya que presentan una frecuencia estimada de aparición de la "T" en el texto en claro bien bastante por encima de la que se espera, caso del "21", o bien bastante por debajo, caso de "90" y "84".

Además, se observa que el homófono "08" formaría algunas de estas palabras en cuatro ocasiones (el "98" en tres, pero ya he establecido el "97" - de la misma decena - como candidato muy probable a ser la "T" y el "47" en dos, aunque ya he establecido que también es candidato muy probable a ser la "P", mientras que el resto sólo una vez), por lo que marco al homófono "08" como más probables a ser la "T" y, posteriormente, tomo nota del resto (excepto del "98", por lo ya indicado):

5.- Con todo lo anterior, la tabla de candidatos quedaría de la siguiente forma:

E: 53 (17,27%), 04 (15,91%), 91 (14,55%), 88 (14,09%), 28 (11,82%).
A: 01 (10,91%), 23 (10, 91%), 33 (10,91%), 05 (10,45%), 54 (10,45%).
O: 49 (9,55%), 61 (7,73%)82 (7,73%).
S: 34 (11,36%), 38 (9,55%), 73 (9,09%)46 (8,64%), 12 (8,18%), 27 (7,27%), 77 (7,27%), 03 (6,36%), 17 (5,45%), 83 (5,00%).
R: 34 (11,36%), 38 (9,55%), 73 (9,09%), 46 (8,64%), 12 (8,18%), 63 (7,73%), 27 (7,27%), 77 (7,27%), 03 (6,36%), 62 (6,36%), 42 (5,91%), 95 (5,91%), 17 (5,45%).
N: 34 (11,36%), 38 (9,55%), 73 (9,09%), 46 (8,64%), 12 (8,18%), 27 (7,27%), 77 (7,27%), 03 (6,36%), 62 (6,36%), 95 (5,91%), 17 (5,45%), 83 (5,00%).
I: 63 (7,73%), 42 (5,91%), 51 (4,55%).
D: 51 (4,55%).
L: 62 (6,36%), 95 (5,91%).
C: 62 (6,36%), 95 (5,91%), 51 (4,55%), 97 (4,09%).
T: 36 (5,45%), 43 (5,45%), 22 (5,00 %), 78 (5,00%), 97 (4,09%), 47 (3,64%), 08 (3,18%), 72 (3,18%),
U: 42 (5,91%).
P: 97 (4,09%), 47 (3,64%), 72 (3,18%).

Y vuelvo a intentarlo con los nuevos candidatos y mismo criterio que en la primera aproximación, es decir:

E: 53 (17,27%), 04 (15,91%), 91 (14,55%), 88 (14,09%), 28 (11,82%).
A: 01 (10,91%), 23 (10, 91%), 33 (10,91%), 05 (10,45%), 54 (10,45%).
O: 61 (7,73%)82 (7,73%), 49 (9,55%).
S: 34 (11,36%)73 (9,09%)46 (8,64%)83 (5,00%), 12 (8,18%).
R: 38 (9,55%)77 (7,27%), 95 (5,91%), 27 (7,27%) , 03 (6,36%). .
N: 17 (5,45%).
I: 63 (7,73%), 42 (5,91%).
L: 62 (6,36%).
C: 51 (4,55%).
T: 97 (4,09%)08 (3,18%), 36 (5,45%), 43 (5,45%), 22 (5,00 %).
P: 47 (3,64%)72 (3,18%).

Con lo que tras esta segunda aproximación el texto en claro sería algo parecido a lo siguiente (marco en azul las posibles palabras más significativas que podrían estar descifradas o parcialmente descifradas):

E S P A R A 57 E 64 A R I S E S R O L E A 21 E A 21 E E S T
A 52 L E 98 E R E S 25 93 14 52 E O 31 S A 45 E 52 R 93 T A A 48 93
O S E 57 E S 10 56 E 57 E 78 A S 57 T 65 31 I 65 I A 19 A E S E T
A 24 A R E T A E 59 E R I 78 A S O R E R P A S 19 O R 19 E R
N 16 E 14 45 O 39 15 E 65 T R E S 86 S O R 56 E 30 A T E 14 L E R
E E 14 93 S 30 E S I E 65 O A E R A S E 56 T I 98 A C E R R O
R E S E 65 18 A C A O E S T A R 93 A 78 A 16 E 94 24 O S 93 E S
21 O T E E N T E A R E A S O N 50 A 30 A R E 50 O S T O 57 E
L E 59 E S T O S 99 56 E A 13 I 67 A R R I A S R E 00 S 93 65 57
E 87 T L A 57 E R A P E R I A L E S 99 31 E 13 A S R E E 84 P
L E A R S E E S 56 S A 69 O T R A R O R E L O T 00 A T E S
T A R A 67 R E 85 E R 93 25 T E 67 A R E 45 A 52 R A 78 E 78 I O
S E 58 93 O S I S A 09 00 L T A S E A 59 E S T E P 31 21 I E 65
A S T O S N P 65 31 I 65 S E A 09 52 O S 67 R I R E 65 A T O S
21 93 C I O S E S E S 98 A S T 65 A R T O 98 E 14 E 50 E T 31 A
50 A 32 E S 98 A S R I T A O S E 57 65 E T A T A 18 E S E 02 56
R A R A R 69 78 O S P E R R E S A 90 R A 94 A 59 O 55 56 E 24 86
E 21 A A 78 O S 50 I 78 I O S A R N E 67 E R A A E R A 50 65 A
59 O 50 93 98 E R E 10 00 E E S 98 A S A R E 56 S E A 09 19 E S T
O S 21 A C 93 O S E N 26 A R 00 50 A O 50 A S 50 E A S 57 T A T
O S E 45 A 52 R A C A E S 90 E R A S 44 A 10 31 E A S P E S S
E 74 E L L E 52 A E S 84 A 65 29 31 93 S A 32 O P 65 O E 57 67 E C
T O A E N T 00 50 I A R A S R E 21 I A T A 09 E S T E E N P
O N I 25 I T A R A R R E 31 S I R A 41 I 78 O S R A 90 93 R E
44 32 86 R 92 E S C I A C E S O R E 81 56 I E R E T A 21 O E 14
E 09 E S T O 59 E 98 E S 93 C O 67 E 65 E P R A 21 86 C 98 A O S
E S R E 85 E 65 93 21 A S 16 S 86 P L I 78 O 75 E T O 09 E T O S
59 A 37 93 09 A E 84 67 E S O E S T A 93 S A 98 93 A T I 48 E 32 R
E R E T 31 E S T A 57 31 21 E N A R R O L 14 O 75 P R E 18 93 E
R E S T E R E R E S E 02 00 R A R E 21 E N 81 00 E E S P E R
O R E S P E T T O 67 A N A 25 I L 93 21 A 21 R E A T I 26 A 65
E S T E 24 65 O 69 E 78 T A

En mi opinión, lo más significativo de esta aproximación es:

- En la antepenúltima y penúltima filas se adivinan 2 palabras seguidas: "ESPERO RESPECTO", lo que significaría que el homófono que corresponde a la primera "T" ("22") se corresponde realmente con la "C" en el texto en claro.

- En la octava y novena fila podría leerse "ELEMENTOS" si el homófono "59" se corresponde con la "M" y el "12" con la "N" en lugar de con la "S".

- En la undécima y duodécima fila podría leerse "EMPLEARSE" si el homófono "84" se corresponde con la "M".

- Más abajo podría leerse "SUPLICO" si los homófonos "86" y "78" se corresponden con la "U" y "C", respectivamente, y "DESARROLLO" si "21" y "14" se corresponden con "D" y "L", respectivamente, y "17" se corresponde con "S" en lugar de "N".

6.- Por lo que creo que voy relativamente bien y rehago y reordeno la tabla de candidatos para realizar una nueva aproximación (marco en azul los homófonos que pertenecen a las palabras descifradas o parcialmente descifradas del texto en claro):

E: 53 (17,27%), 04 (15,91%), 91 (14,55%), 88 (14,09%), 28 (11,82%).
A: 33 (10,91%)05 (10,45%), 01 (10,91%), 23 (10, 91%), 54 (10,45%).
O: 49 (9,55%)61 (7,73%), 82 (7,73%).
S: 46 (8,64%), 17 (5,45%)83 (5,00%)34 (11,36%)73 (9,09%), 27 (7,27%), 77 (7,27%).
R: 38 (9,55%), 03 (6,36%)95 (5,91%)77 (7,27%), 34 (11,36%), 73 (9,09%), 27 (7,27%), 42 (5,91%).
N: 12 (8,18%), 34 (11,36%), 73 (9,09%), 27 (7,27%), 77 (7,27%).
I: 63 (7,73%), 42 (5,91%), 51 (4,55%).
D: 21 (6,82%), 51 (4,55%).
L: 14 (3,18%), 62 (6,36%).
C: 22 (5,00 %), 78 (5,00%)51 (4,55%), 97 (4,09%).
T: 36 (5,45%)08 (3,18%)97 (4,09%), 43 (5,45%), 72 (3,18%),
U: 86 (2,27%), 42 (5,91%).
M: 59 (3,18%), 84 (1,36%).
P: 47 (3,64%)72 (3,18%), 97 (4,09%).

Selecciono los homófonos de la tabla con el mismo criterio que en las dos anteriores aproximaciones:

E: 53 (17,27%)04 (15,91%)91 (14,55%), 88 (14,09%), 28 (11,82%).
A: 33 (10,91%)05 (10,45%), 01 (10,91%), 23 (10, 91%), 54 (10,45%).
O: 49 (9,55%)61 (7,73%)82 (7,73%).
S: 46 (8,64%)17 (5,45%)83 (5,00%)34 (11,36%)73 (9,09%).
R: 38 (9,55%)03 (6,36%)95 (5,91%)77 (7,27%), 27 (7,27%).
N: 12 (8,18%).
I: 63 (7,73%), 42 (5,91%).
D: 21 (6,82%).
L: 14 (3,18%)62 (6,36%).
C: 22 (5,00 %)78 (5,00%)51 (4,55%).
T: 36 (5,45%)08 (3,18%)97 (4,09%), 43 (5,45%).
U: 86 (2,27%).
M: 59 (3,18%), 84 (1,36%).
P: 47 (3,64%)72 (3,18%).

Con lo que en una tercera aproximación el texto en claro sería algo parecido a lo siguiente:

E S P A R A 57 E 64 A R I S E S R O L E A D E A D E E S T
A 52 L E 98 E R E S 25 93 L 52 E O 31 N A 45 E 52 R 93 C A A 48 93
O N E 57 E S 10 56 E 57 E C A S 57 T 65 31 I 65 I A 19 A E S E T
A 24 A R E T A E M E R I C A N O R E R P A N 19 O R 19 E R
S 16 E L 45 O 39 15 E 65 T R E S U S O R 56 E 30 A T E L L E R
E E L 93 S 30 E S I E 65 O A E R A N E 56 T I 98 A C E R R O
R E S E 65 18 A C A O E S T A R 93 A C A 16 E 94 24 O N 93 E N
D O T E E S T E A R E A S O S 50 A 30 A R E 50 O S T O 57 E
L E M E N T O S 99 56 E A 13 I 67 A R R I A S R E 00 S 93 65 57
E 87 C L A 57 E R A P E R I A L E S 99 31 E 13 A S R E E M P
L E A R S E E S 56 S A 69 O T R A R O R E L O C 00 A T E S
T A R A 67 R E 85 E R 93 25 T E 67 A R E 45 A 52 R A C E C I O
S E 58 93 O S I S A 09 00 L T A S E A M E S T E P 31 D I E 65
A S C O N S P 65 31 I 65 S E A 09 52 O S 67 R I R E 65 A C O S
D 93 C I O S E S E S 98 A S T 65 A R T O 98 E L E 50 E C 31 A
50 A 32 E N 98 A S R I C A O S E 57 65 E T A T A 18 E S E 02 56
R A R A R 69 C O S P E R R E S A 90 R A 94 A M O 55 56 E 24 U
E D A A C O N 50 I C I O S A R S E 67 E R A A E R A 50 65 A
M O 50 93 98 E R E 10 00 E E S 98 A S A R E 56 S E A 09 19 E S C
O S D A C 93 O S E S 26 A R 00 50 A O 50 A S 50 E A S 57 T A T
O S E 45 A 52 R A C A E S 90 E R A S 44 A 10 31 E A S P E S S
E 74 E L L E 52 A E S M A 65 29 31 93 N A 32 O P 65 O E 57 67 E C
T O A E S T 00 50 I A R A S R E D I A T A 09 E N T E E S P
O S I 25 I T A R A R R E 31 S I R A 41 I C O S R A 90 93 R E
44 32 U R 92 E N C I A C E S O R E 81 56 I E R E T A D O E L
E 09 E S T O M E 98 E N 93 C O 67 E 65 E P R A D U C 98 A O S
E S R E 85 E 65 93 D A S 16 S U P L I C O 75 E T O 09 E CO S
M A 37 93 09 A E M 67 E N O E S T A 93 N A 98 93 A T I 48 E 32 R
E R E C 31 E S T A 57 31 D E S A R R O L L O 75 P R E 18 93 E
R E N T E R E R E S E 02 00 R A R E D E S 81 00 E E S P E R
O R E S P E C T O 67 A S A 25 I L 93 D A D R E A T I 26 A 65
E S T E 24 65 O 69 E C T A

Y ya puedo ver e intuir otras palabras en el texto en claro ("AMERICANO", "CLASE", "MATERIALES", "CONDICIONES", "ACONDICIONARSE", "ESTUDIAR", "URGENCIA"...), lo que me permite ir corrigiendo y completando la tabla de homófonos y, tras diversas aproximaciones, llegar al siguiente resultado:

E: 53 (17,27%)04 (15,91%)91 (14,55%), 28 (11,82%).
A: 88 (14,09%)33 (10,91%)05 (10,45%)54 (10,45%).
O: 49 (9,55%)61 (7,73%)82 (7,73%), 23(10,91%).
S: 46 (8,64%)17 (5,45%)83 (5,00%)57 (5,00%).
R: 38 (9,55%)03 (6,36%)95 (5,91%), 65 (8,64%).
N: 12 (8,18%)73 (9,09%)34 (11,36%).
I: 63 (7,73%), 93 (9,55%), 42 (5,91%), 01 (10,91%).
D: 21 (6,82%), 50 (5,00%), 77 (7,27%).
L: 14 (3,18%)62 (6,36%), 43 (5,45%).
C: 22 (5,00 %)78 (5,00%), 98 (4,55%)51 (4,55%).
T: 36 (5,45%)08 (3,18%)72 (3,18%)97 (4,09%).
U: 86 (2,27%), 00 (3,64%), 31 (5,00%), 56 (4,09%).
M: 59 (3,18%), 84 (1,36%), 27 (7,27%), 09 (3,18%).
P: 47 (3,64%), 24 (1,82%), 67 (4,09%), 90 (1,36%).
B: 52 (3,18%), 25 (1,82%), 19 (1,82%).
G: 92 (0,45%), 30 (1,36%), 02 (0,91%).
V: 48 (0,91%), 18 (1,36%)75 (0,91%).
Y: 16 (1,36%), 87 (0,45%), 32 (1,82%)69 (1,36%).
Q: 10 (1,36%), 99 (0,91%), 55 (0,45%), 29 (0,45%), 81 (0,91%).
H: 13 (0,91%), 74 (0,45%), 41 (0,45%), 58 (0,45%).
F: 45 (1,82%), 85 (0,91%).
Z: 26 (0,91%), 44 (0,91%).
X: 64(0,45%), 94 (0,91%), 37 (0,45%).
K: 39 (0,45%), 15 (0,45%).

E S T A M O S E X A M I N A N D O L A I D E A D E E S T
A B L E C E R E N B I L B A O U N A F A B R I C A A V I
O N E S E N Q U E S E C O N S T R U I R I A B I E N E L
A P A R A T O A M E R I C A N O M A R T I N B O M B E R
S Y E L F O K K E R T R E S U N O R U E G O L E L L A M
E A L I N G E N I E R O A E R O N A U T I C O C E R R O
D E S E R V I C I O E N L A M I A C O Y E X P O N I E N
D O L E E S T A I D E A N O S D I G A D A D O S L O S E
L E M E N T O S Q U E A H I P O D R I A N R E U N I R S
E Y C L A S E M A T E R I A L E S Q U E H A N D E E M P
L E A R S E E N U N O Y O T R O M O D E L O C U A L E S
T I M A P R E F E R I B L E P A R A F A B R I C A C I O
N A H I O S I S I M U L T A N E A M E N T E P U D I E R
A N C O N S T R U I R S E A M B O S P R I M E R A C O N
D I C I O N E S E N C O N T R A R L O C A L A D E C U A
D O Y E N C O N D I C I O N E S R E L A T I V A S E G U
R I D A D Y C O N T E R R E N O P R O X I M O Q U E P U
E D A A C O N D I C I O N A R S E P A R A A E R O D R O
M O D I C E M E Q U E E N C A S O R E U N A A M B A S C
O N D I C I O N E S Z A M U D I O D O N D E I N S T A L
O S E F A B R I C A E S P E R A N Z A Q U E A N T E S S
E H A L L A B A E N M A R Q U I N A Y O T R O A S P E C
T O A E S T U D I A R I N M E D I A T A M E N T E E S P
O S I B I L I D A D R E U N I R A H I C O N R A P I D E
Z Y U R G E N C I A C A S O R E Q U I E R E T O D O E L
E M E N T O M E C A N I C O P A R A P R O D U C C I O N
E S R E F E R I D A S Y S U P L I C O V E T O M E C O N
M A X I M O E M P E N O E S T A I N I C I A T I V A Y M
E D E C U E N T A S U D E S A R R O L L O V P R E V I A
M E N T E D E M E S E G U R I D A D E S Q U E E S P E R
O R E S P E C T O P O S I B I L I D A D R E A L I Z A R
E S T E P R O Y E C T O

Es decir el texto en claro sería algo así como:

"Estamos examinando la idea de establecer en Bilbao una fábrica aviones en que se construiría bien el aparato americano Martin Bombers y el Fokker tres uno. Ruégole llame al ingenerio aeronáutico Cerro de servicio en Lamiaco y exponiéndole esta idea nos diga dados los elementos que ahí podrían reunirse y clase de materiales que han de emplearse en uno y otro modelo cuál estima preferible para fabricación ahí o si simultáneamente pudieran construirse ambos. Primera condición es encontrar local adecuado y en condiciones relativa seguridad y con terreno próximo que pueda acondicionarse para aeródromo. Díceme que en caso reúna ambas condiciones Zamudio donde instalose fábrica Esperanza que antes se hallaba en Marquina y otro aspecto a estudiar inmediatamente es posibilidad reunir ahí con rapidez y urgencia caso requiere todo elemento mecánico para producciones referidas y suplico VE tome con máximo empeño esta iniciativa y me dé cuenta su desarrollo v previamente deme seguridades que espero respecto posibilidad realizar este proyecto".


Y la tabla de homófonos empleada en el cifrado sería (sólo figuran los homófonos que aparecen en el criptograma):


Comentarios

Publicar un comentario

Entradas populares de este blog

Criptografía (I): cifrado Vigenère y criptoanálisis Kasiski

Hace unos días mi amigo Iñaki Regidor ( @Inaki_Regidor ), a quien dedico esta entrada :), compartió en las redes sociales un post titulado "Criptografía: el arte de esconder mensajes"  publicado en uno de los blogs de EiTB . En ese post se explican ciertos métodos clásicos para cifrar mensajes , entre ellos el cifrado de Vigenère , y , al final del mismo, se propone un reto consistente en descifrar un mensaje , lo que me ha animado a escribir este post sobre el método Kasiski  para atacar un cifrado polialfabético ( conociendo la clave descifrar el mensaje es muy fácil, pero lo que contaré en este post es la forma de hacerlo sin saberla ). El mensaje a descifrar es el siguiente: LNUDVMUYRMUDVLLPXAFZUEFAIOVWVMUOVMUEVMUEZCUDVSYWCIVCFGUCUNYCGALLGRCYTIJTRNNPJQOPJEMZITYLIAYYKRYEFDUDCAMAVRMZEAMBLEXPJCCQIEHPJTYXVNMLAEZTIMUOFRUFC Como ya he dicho el método de Vigenère es un sistema de sustitución polialfabético , lo que significa que, al contrario que en un sistema de

¿Qué significa el emblema de la profesión informática? (I)

Todas o muchas profesiones tienen un emblema que las representa simbólicamente y en el caso de la  informática: " es el establecido en la resolución de 11 de noviembre de 1977  para las titulaciones universitarias superiores de informática, y  está constituido por una figura representando en su parte central  un  núcleo toroidal de ferrita , atravesado por  hilos de lectura,  escritura e inhibición . El núcleo está rodeado por  dos ramas : una  de  laurel , como símbolo de recompensa, y la otra, de  olivo , como  símbolo de sabiduría. La  corona  será la  de la casa real  española,  y bajo el escudo se inscribirá el acrónimo de la organización. ". Veamos los diferentes elementos tomando como ejemplo el emblema del COIIE/EIIEO (Colegio Oficial de Ingenieros en Informática del País Vasco/ Euskadiko Informatikako Ingeniarien Elkargo Ofiziala ) . Pero no sólo el COIIE/EIIEO adopta el emblema establecido en dicha resolución, sino que éste se adopta también como im

Criptografía (XXIII): cifrado de Hill (I)

En este post me propongo explicar de forma comprensible lo que he entendido sobre el cifrado de Hill , propuesto por el matemático Lester S. Hill , en 1929, y que se basa en emplear una matriz como clave  para cifrar un texto en claro y su inversa para descifrar el criptograma correspondiente . Hay tres cosas que me gustan de la criptografía clásica, además de que considero que ésta es muy didáctica a la hora de comprender los sistemas criptográficos modernos: la primera de ellas es que me "obliga" a repasar conceptos de matemáticas aprendidos hace mucho tiempo y, desgraciadamente, olvidados también hace demasiado tiempo, y, por consiguiente, que, como dice  Dani , amigo y coautor de este blog, me "obliga" a hacer "gimnasia mental"; la segunda es que, en la mayoría de las ocasiones, pueden cifrarse y descifrase los mensajes, e incluso realizarse el criptoanálisis de los criptogramas, sin más que un simple lápiz y papel, es decir, para mi es como un pasat