Solución al último reto de esteganografía que he puesto en este blog y en el que el protagonista era el coronavirus.
El enunciado del reto decía lo siguiente:
"Como bien sabemos todos, el coronavirus es el causante de una pandemia a nivel mundial de la infección o enfermedad (COVID-19) por este virus.
Tal y como nos cuenta wikipedia, el coronavirus tiene como material genético una sola cadena o cadena sencilla de ARN de sentido positivo, por lo que se clasifica como un virus de ARN monocatenario positivo y, si no lo he entendido mal, el ARN de los virus de cadena positiva es idéntico al ARNm viral (ARN mensajero, que es el encargado de "transferir o comunicar" el código genético), por lo tanto, funciona como tal y puede ser inmediatamente traducido por la célula huésped.
El ARNm contiene la codificación para generar una cadena específica de aminoácidos de acuerdo con las reglas especificadas por el código genético, que está formado por un grupo de tres bases nitrogenadas (triplete) o codón (unidad de codificación), cuya presencia en la cadena polinucleotídica del ARNm codifica o da lugar a la presencia de un aminoácido en la cadena polipeptídica.
Por favor, si alguien ha entendido algo que me lo explique. No me he enterado de nada de lo que he dicho :).
Bueno, asumiendo el riesgo altamente probable de decir alguna tontería, que espero no se me tenga en cuenta, explico de forma simplificada lo que he entendido: una molécula de ARNm está compuesta por moléculas más pequeñas, llamadas nucleótidos, cada una de ellas formada por tres bases nitrogenadas, de entre las siguientes: adenina (A), citosina (C), guanina (G) y uracilo (U). Es decir, podemos imaginarnos una hebra compuesta por una larga serie de grupos de tres letras, por ejemplo: AUGUCCUAC ... CACUGA.
El conocimiento y utilización del ARNm es fundamental para obtener la solución al COVID-19. ¿Puedes decirme cuál es la solución para detener la pandemia?".
Y como recurso asociado al reto se proporcionaba el siguiente: coronavirus.png.
Solución: es fácil darse cuenta de que al final del fichero de imagen asociado al reto (coronavirus.png) hay un archivo comprimido, ya que para ello basta con abrirlo con un editor hexadecimal:
Abro el archivo de imagen con un software de compresión de archivos (en mi caso utilizo '7-Zip') e intento extraer el archivo (Codons_mRNA.txt) que contiene el fichero comprimido, pero está protegido con una contraseña.
En este tipo de retos y con ficheros de imagen .png suelo utilizar el software 'zsteg' a ver si obtengo algo de información oculta, y veo que éste no sólo detecta el archivo comprimido (.zip) que hay al final del archivo de imagen, sino que, además, detecta que hay una cadena de texto ("SARS-CoV-2") oculta en los bits menos significativos de la imagen, es decir, que se ha utilizado la técnica conocida como LSB (bit menos significativo o, en inglés, 'least significant bit') para ocultar esa cadena de texto:
Para aquellos que prefieran utilizar herramientas en windows, también se podría haber detectado la cadena de texto oculta utilizando el software 'StegSolve':
E incluso para aquellos que no quieren instalar nada, también se podría haber detectado la cadena de texto oculta utilizando alguna herramienta 'on-line', como la siguiente:
Pero, ¿qué significa "SARS-CoV-2"?. Es el nombre científico del coronavirus (no confundir con COVID-19, que es el nombre científico de la infección o enfermedad por coronavirus, no del virus). Pues bien, intento extraer de nuevo el archivo de texto (Codons_mRNA.txt) que contiene el archivo comprimido utilizando "SARS-CoV-2" como contraseña, y efectivamente es la password correcta.
Abro el archivo de texto extraído (Codons_mRNA.txt) y veo una "hebra" compuesta por una larga serie de letras (se utilizan las siguientes: "A", "C", "G" y "U"), que tal y como dice el enunciado del reto sería una molécula de ARN mensajero (ARNm o, en inglés, mRNA) compuesta por grupos de tres letras (codones o, en inglés, codons). Cada uno de estos grupos da lugar a la presencia de un aminoácido.
Para decodificar los aminoácidos que están codificados en los grupos de tres letras o codones - grupos de tres bases nitrogenadas, de entre las siguientes: adenina (A), citosina (C), guanina (G) y uracilo (U) - que se observan en la molécula de ARN mensajero investigo por Internet y doy con la siguiente tabla:
La decodificación es muy fácil:
En primer lugar lo hago manualmente con los grupos de tres letras que se observan en el fichero Codons_mRNA.txt (al final de este post pongo un script en python que lo hace):
AUG: METIONINA (START)
CUA: LEUCINA
UCU: SERINA
AAA: LISINA
CCA: PROLINA
GUU: VALINA
CAG: GLUTAMINA
GGG: GLICINA
CAU: HISTIDINA
AUC: ISOLEUCINA
AAA: LISINA
CUA: LEUCINA
UCU: SERINA
GGA: GLICINA
CCU: PROLINA
UCG: SERINA
UUC: FENILALANINA
AGA: ARGININA
AAU: ASPARAGINA
GUG: VALINA
ACU: TREONINA
AAG: LISINA
AUU: ISOLEUCINA
CUC: LEUCINA
GUA: VALINA
GGG: GLICINA
ACG: TREONINA
UGU: CISTEINA
GCA: ALANINA
UGA: STOP CODON
Y, finalmente, lo único que queda es saber la relación entre la lista de aminoácidos y la clave que aparece al final del archivo Codons_mRNA.txt:
CLAVE: 1 6 3 3 3 3 4 5 3 5 2 1 4 3 5 1 4 9 2 2 3 5 2 5 4 8 3 1
El primer codón, "AUG", es el codón de inicio de la traducción que indica a la maquinaria celular el lugar de la cadena en el que comienza la traducción del ARN mensajero, mientras que el último codón, "UGA", es un codón de terminación, codón de parada, codón sin sentido o codón stop que no identifica a ningún aminoácido según el código genético y su función es acotar el mensaje cifrado del ARN mensajero.
Pues bien, si excluidos el primer y último codones contamos el número de aminoácidos nos da un total de 28 aminoácidos, lo que coincide con el número de dígitos de la clave. ¿Casualidad?. Yo diría que no, y ¿si cada uno de los dígitos determinara, a modo de índice, una letra de la denominación del aminoácido correspondiente?.
Pruebo a ver si es así:
AUG METIONINA (START)
CUA: LEUCINA, 1, "L"
UCU: SERINA, 6, "A"
AAA: LISINA, 3, "S"
CCA: PROLINA, 3, "O"
GUU: VALINA, 3, "L"
CAG: GLUTAMINA, 3, "U"
GGG: GLICINA, 4, "C"
CAU: HISTIDINA, 5, "I"
AUC: ISOLEUCINA, 3, "O"
AAA: LISINA, 5, "N"
CUA: LEUCINA, 2, "E"
UCU: SERINA, 1, "S"
GGA: GLICINA, 4, "C"
CCU: PROLINA, 3, "O"
UCG: SERINA, 5, "N"
UUC: FENILALANINA, 1, "F"
AGA: ARGININA, 4, "I"
AAU: ASPARAGINA, 9, "N"
GUG: VALINA, 2, "A"
ACU: TREONINA, 2, "R"
AAG: LISINA, 3, "S"
AUU: ISOLEUCINA, 5, "E"
CUC: LEUCINA, 2, "E"
GUA: VALINA, 5, "N"
GGG: GLICINA, 4, "C"
ACG: TREONINA, 8, "A"
UGU: CISTEINA, 3, "S"
GCA: ALANINA, 1, "A"
UGA: STOP CODON
Y ya he obtenido la solución a este reto: LASOLUCIONESCONFINARSEENCASA
Es decir: LA SOLUCION ES CONFINARSE EN CASA
Y a mí no me queda duda de que mientras llega la solución contra el virus (el coronavirus o "SARS-CoV-2") en forma de vacuna, no antes de un año o año y medio, la única solución para detener la pandemia de la infección o enfermedad (COVID-19) por coronavirus es el confinamiento, ya que sólo de esta manera se conseguirá detener la propagación del virus, con el fin último de evitar contagios, no colapsar el sistema sanitario y salvar vidas.
Y ya, para terminar este post, dejo un pequeño script en python para decodificar los aminoácidos que están codificados en los grupos de tres letras o codones y obtener la solución a este reto utilizando la clave proporcionada:
#!/usr/bin/env python
rnam_code=[
'UUU','FENILALANINA','UUC','FENILALANINA','UUA','LEUCINA','UUG','LEUCINA',
'CU','LEUCINA',
'AUU','ISOLEUCINA','AUC','ISOLEUCINA','AUA','ISOLEUCINA',
'AUG','METIONINA (START)',
'GU','VALINA',
'UC','SERINA',
'CC','PROLINA',
'AC','TREONINA',
'GC','ALANINA',
'UAU','TIROSINA','UAC','TIROSINA','UAA','STOP CODON','UAG','STOP CODON',
'CAU','HISTIDINA','CAC','HISTIDINA','CAA','GLUTAMINA','CAG','GLUTAMINA',
'AAU','ASPARAGINA','AAC','ASPARAGINA','AAA','LISINA','AAG','LISINA',
'GAU','ACIDO ASPARTICO','GAC','ACIDO ASPARTICO','GAA','ACIDO GLUTAMICO','GAG','ACIDO GLUTAMICO',
'UGU','CISTEINA','UGC','CISTEINA','UGA','STOP CODON','UGG','TRIPTOFANO',
'CG','ARGININA',
'AGU','SERINA','AGC','SERINA','AGA','ARGININA','AGG','ARGININA',
'GG','GLICINA',
]
def decode_rnam(rnam,key):
string=""
j=0
for i in range(0,len(rnam),3):
codon=rnam[i:i+3]
if codon in rnam_code:
codon_index=rnam_code.index(codon)
if codon=='AUG' or codon=='UAA' or codon=='UAG' or codon=='UGA':
print '[+]',codon,rnam_code[codon_index+1]
else:
key_index=int(key[j])
aminoacido=rnam_code[codon_index+1]
print '[+]',codon,aminoacido,key_index,aminoacido[key_index-1:key_index]
string+=aminoacido[key_index-1:key_index]
j+=1
elif rnam[i:i+2] in rnam_code:
key_index=int(key[j])
aminoacido=rnam_code[rnam_code.index(rnam[i:i+2])+1]
print '[+]',codon,aminoacido,key_index,aminoacido[key_index-1:key_index]
string+=aminoacido[key_index-1:key_index]
j+=1
else:
print '[-] Codon no encontrado',codon
j+=1
print '[+] Texto decodificado:',string
while True:
rnam=raw_input('Introduzca el codigo RNAm a decodificar: ')
if len(rnam)%3!=0:
print '[-] La longitud del codigo RNAm a decodificar debe ser multiplo de 3'
else:
key=raw_input('Introduzca los digitos de la clave para decodificar separados por un espacio: ').split()
decode_rnam(rnam,key)
break
Si se ejecuta se ve la solución al reto:
******** PRÓXIMO RETO
Reto 37: "Transposición 3D".
El enunciado del reto decía lo siguiente:
"Como bien sabemos todos, el coronavirus es el causante de una pandemia a nivel mundial de la infección o enfermedad (COVID-19) por este virus.
Tal y como nos cuenta wikipedia, el coronavirus tiene como material genético una sola cadena o cadena sencilla de ARN de sentido positivo, por lo que se clasifica como un virus de ARN monocatenario positivo y, si no lo he entendido mal, el ARN de los virus de cadena positiva es idéntico al ARNm viral (ARN mensajero, que es el encargado de "transferir o comunicar" el código genético), por lo tanto, funciona como tal y puede ser inmediatamente traducido por la célula huésped.
El ARNm contiene la codificación para generar una cadena específica de aminoácidos de acuerdo con las reglas especificadas por el código genético, que está formado por un grupo de tres bases nitrogenadas (triplete) o codón (unidad de codificación), cuya presencia en la cadena polinucleotídica del ARNm codifica o da lugar a la presencia de un aminoácido en la cadena polipeptídica.
Por favor, si alguien ha entendido algo que me lo explique. No me he enterado de nada de lo que he dicho :).
Bueno, asumiendo el riesgo altamente probable de decir alguna tontería, que espero no se me tenga en cuenta, explico de forma simplificada lo que he entendido: una molécula de ARNm está compuesta por moléculas más pequeñas, llamadas nucleótidos, cada una de ellas formada por tres bases nitrogenadas, de entre las siguientes: adenina (A), citosina (C), guanina (G) y uracilo (U). Es decir, podemos imaginarnos una hebra compuesta por una larga serie de grupos de tres letras, por ejemplo: AUGUCCUAC ... CACUGA.
El conocimiento y utilización del ARNm es fundamental para obtener la solución al COVID-19. ¿Puedes decirme cuál es la solución para detener la pandemia?".
Y como recurso asociado al reto se proporcionaba el siguiente: coronavirus.png.
Solución: es fácil darse cuenta de que al final del fichero de imagen asociado al reto (coronavirus.png) hay un archivo comprimido, ya que para ello basta con abrirlo con un editor hexadecimal:
Abro el archivo de imagen con un software de compresión de archivos (en mi caso utilizo '7-Zip') e intento extraer el archivo (Codons_mRNA.txt) que contiene el fichero comprimido, pero está protegido con una contraseña.
En este tipo de retos y con ficheros de imagen .png suelo utilizar el software 'zsteg' a ver si obtengo algo de información oculta, y veo que éste no sólo detecta el archivo comprimido (.zip) que hay al final del archivo de imagen, sino que, además, detecta que hay una cadena de texto ("SARS-CoV-2") oculta en los bits menos significativos de la imagen, es decir, que se ha utilizado la técnica conocida como LSB (bit menos significativo o, en inglés, 'least significant bit') para ocultar esa cadena de texto:
Para aquellos que prefieran utilizar herramientas en windows, también se podría haber detectado la cadena de texto oculta utilizando el software 'StegSolve':
E incluso para aquellos que no quieren instalar nada, también se podría haber detectado la cadena de texto oculta utilizando alguna herramienta 'on-line', como la siguiente:
Pero, ¿qué significa "SARS-CoV-2"?. Es el nombre científico del coronavirus (no confundir con COVID-19, que es el nombre científico de la infección o enfermedad por coronavirus, no del virus). Pues bien, intento extraer de nuevo el archivo de texto (Codons_mRNA.txt) que contiene el archivo comprimido utilizando "SARS-CoV-2" como contraseña, y efectivamente es la password correcta.
Abro el archivo de texto extraído (Codons_mRNA.txt) y veo una "hebra" compuesta por una larga serie de letras (se utilizan las siguientes: "A", "C", "G" y "U"), que tal y como dice el enunciado del reto sería una molécula de ARN mensajero (ARNm o, en inglés, mRNA) compuesta por grupos de tres letras (codones o, en inglés, codons). Cada uno de estos grupos da lugar a la presencia de un aminoácido.
Para decodificar los aminoácidos que están codificados en los grupos de tres letras o codones - grupos de tres bases nitrogenadas, de entre las siguientes: adenina (A), citosina (C), guanina (G) y uracilo (U) - que se observan en la molécula de ARN mensajero investigo por Internet y doy con la siguiente tabla:
La decodificación es muy fácil:
En primer lugar lo hago manualmente con los grupos de tres letras que se observan en el fichero Codons_mRNA.txt (al final de este post pongo un script en python que lo hace):
AUG: METIONINA (START)
CUA: LEUCINA
UCU: SERINA
AAA: LISINA
CCA: PROLINA
GUU: VALINA
CAG: GLUTAMINA
GGG: GLICINA
CAU: HISTIDINA
AUC: ISOLEUCINA
AAA: LISINA
CUA: LEUCINA
UCU: SERINA
GGA: GLICINA
CCU: PROLINA
UCG: SERINA
UUC: FENILALANINA
AGA: ARGININA
AAU: ASPARAGINA
GUG: VALINA
ACU: TREONINA
AAG: LISINA
AUU: ISOLEUCINA
CUC: LEUCINA
GUA: VALINA
GGG: GLICINA
ACG: TREONINA
UGU: CISTEINA
GCA: ALANINA
UGA: STOP CODON
Y, finalmente, lo único que queda es saber la relación entre la lista de aminoácidos y la clave que aparece al final del archivo Codons_mRNA.txt:
CLAVE: 1 6 3 3 3 3 4 5 3 5 2 1 4 3 5 1 4 9 2 2 3 5 2 5 4 8 3 1
El primer codón, "AUG", es el codón de inicio de la traducción que indica a la maquinaria celular el lugar de la cadena en el que comienza la traducción del ARN mensajero, mientras que el último codón, "UGA", es un codón de terminación, codón de parada, codón sin sentido o codón stop que no identifica a ningún aminoácido según el código genético y su función es acotar el mensaje cifrado del ARN mensajero.
Pues bien, si excluidos el primer y último codones contamos el número de aminoácidos nos da un total de 28 aminoácidos, lo que coincide con el número de dígitos de la clave. ¿Casualidad?. Yo diría que no, y ¿si cada uno de los dígitos determinara, a modo de índice, una letra de la denominación del aminoácido correspondiente?.
Pruebo a ver si es así:
AUG METIONINA (START)
CUA: LEUCINA, 1, "L"
UCU: SERINA, 6, "A"
AAA: LISINA, 3, "S"
CCA: PROLINA, 3, "O"
GUU: VALINA, 3, "L"
CAG: GLUTAMINA, 3, "U"
GGG: GLICINA, 4, "C"
CAU: HISTIDINA, 5, "I"
AUC: ISOLEUCINA, 3, "O"
AAA: LISINA, 5, "N"
CUA: LEUCINA, 2, "E"
UCU: SERINA, 1, "S"
GGA: GLICINA, 4, "C"
CCU: PROLINA, 3, "O"
UCG: SERINA, 5, "N"
UUC: FENILALANINA, 1, "F"
AGA: ARGININA, 4, "I"
AAU: ASPARAGINA, 9, "N"
GUG: VALINA, 2, "A"
ACU: TREONINA, 2, "R"
AAG: LISINA, 3, "S"
AUU: ISOLEUCINA, 5, "E"
CUC: LEUCINA, 2, "E"
GUA: VALINA, 5, "N"
GGG: GLICINA, 4, "C"
ACG: TREONINA, 8, "A"
UGU: CISTEINA, 3, "S"
GCA: ALANINA, 1, "A"
UGA: STOP CODON
Y ya he obtenido la solución a este reto: LASOLUCIONESCONFINARSEENCASA
Es decir: LA SOLUCION ES CONFINARSE EN CASA
Y a mí no me queda duda de que mientras llega la solución contra el virus (el coronavirus o "SARS-CoV-2") en forma de vacuna, no antes de un año o año y medio, la única solución para detener la pandemia de la infección o enfermedad (COVID-19) por coronavirus es el confinamiento, ya que sólo de esta manera se conseguirá detener la propagación del virus, con el fin último de evitar contagios, no colapsar el sistema sanitario y salvar vidas.
Y ya, para terminar este post, dejo un pequeño script en python para decodificar los aminoácidos que están codificados en los grupos de tres letras o codones y obtener la solución a este reto utilizando la clave proporcionada:
#!/usr/bin/env python
rnam_code=[
'UUU','FENILALANINA','UUC','FENILALANINA','UUA','LEUCINA','UUG','LEUCINA',
'CU','LEUCINA',
'AUU','ISOLEUCINA','AUC','ISOLEUCINA','AUA','ISOLEUCINA',
'AUG','METIONINA (START)',
'GU','VALINA',
'UC','SERINA',
'CC','PROLINA',
'AC','TREONINA',
'GC','ALANINA',
'UAU','TIROSINA','UAC','TIROSINA','UAA','STOP CODON','UAG','STOP CODON',
'CAU','HISTIDINA','CAC','HISTIDINA','CAA','GLUTAMINA','CAG','GLUTAMINA',
'AAU','ASPARAGINA','AAC','ASPARAGINA','AAA','LISINA','AAG','LISINA',
'GAU','ACIDO ASPARTICO','GAC','ACIDO ASPARTICO','GAA','ACIDO GLUTAMICO','GAG','ACIDO GLUTAMICO',
'UGU','CISTEINA','UGC','CISTEINA','UGA','STOP CODON','UGG','TRIPTOFANO',
'CG','ARGININA',
'AGU','SERINA','AGC','SERINA','AGA','ARGININA','AGG','ARGININA',
'GG','GLICINA',
]
def decode_rnam(rnam,key):
string=""
j=0
for i in range(0,len(rnam),3):
codon=rnam[i:i+3]
if codon in rnam_code:
codon_index=rnam_code.index(codon)
if codon=='AUG' or codon=='UAA' or codon=='UAG' or codon=='UGA':
print '[+]',codon,rnam_code[codon_index+1]
else:
key_index=int(key[j])
aminoacido=rnam_code[codon_index+1]
print '[+]',codon,aminoacido,key_index,aminoacido[key_index-1:key_index]
string+=aminoacido[key_index-1:key_index]
j+=1
elif rnam[i:i+2] in rnam_code:
key_index=int(key[j])
aminoacido=rnam_code[rnam_code.index(rnam[i:i+2])+1]
print '[+]',codon,aminoacido,key_index,aminoacido[key_index-1:key_index]
string+=aminoacido[key_index-1:key_index]
j+=1
else:
print '[-] Codon no encontrado',codon
j+=1
print '[+] Texto decodificado:',string
while True:
rnam=raw_input('Introduzca el codigo RNAm a decodificar: ')
if len(rnam)%3!=0:
print '[-] La longitud del codigo RNAm a decodificar debe ser multiplo de 3'
else:
key=raw_input('Introduzca los digitos de la clave para decodificar separados por un espacio: ').split()
decode_rnam(rnam,key)
break
Si se ejecuta se ve la solución al reto:
******** PRÓXIMO RETO
Reto 37: "Transposición 3D".
Comentarios
Publicar un comentario