Ir al contenido principal

Criptografía (CCXXVII): El algoritmo RC4 (I)

RC4
('
Rivest Cipher 4') es un criptosistema diseñado 
en 1987 por Ronald Rivest, uno de los inventores del cifrado RSA.

Es un algoritmo de cifrado simétrico (se utiliza la misma clave para cifrar y para descifrar) y de flujo ('Stream cipher'), es decir, opera habitualmente byte a byte sobre un texto en claro o mensaje a cifrar y una secuencia cifrante, pero puede operar sobre cualquier tamaño (bit a bit,...).

Aunque se utilizó de forma extendida en algunos de los protocolos más populares como TLS ('Transport Layer Security'), para proporcionar comunicaciones seguras por  Internet, WEP ('Wired Equivalent Privacy'), para añadir seguridad en las redes inalámbricas, actualmente se considera que es un algoritmo inseguro.

Básicamente, el algoritmo RC4 consiste en tres etapas:

1.- Inicialización del vector de estado (KSA, key-scheduling algorithm):

Convierte una clave (K) o semilla en una permutación inicial del vector de estado (S).

Al principio de esta etapa, el vector de estado (S) de 256 elementos se carga con todos los números secuenciales desde 0 a 255.

El emisor y receptor comparten una misma clave (K, cifrado simétrico). RC4 admite claves de 1 hasta 256 bytes de longitud, aunque típicamente se utilizan claves de longitud entre 5 y 16 bytes (40 - 128 bits).

En esta primera etapa del algoritmo RC4 se desordenan los 256 elementos del vector de estado (S) a partir de la clave secreta (K) compartida por emisor y receptor, iterándose por cada elemento de S de la siguiente manera (en el siguiente ejemplo K="CLAVE"):

1.1.- K="CLAVE"

1.2.- Desde i = 0 hasta 255

1.2.1.- Si = i

1.3.- j=0

1.4.- Desde i = 0 hasta 255

1.4.1.- j = (j + Si + ASCII_DEC(Ki mod longitud_clave(K))) mod 256

1.4.2.- Intercambiar_valores(SiSj)

Es decir:

- Para i = 0:  j = 0 + 0 + 67 = 67; S0 = 67S67 = 0

Para i = 1:  j = 67 +1 + 76 = 144; S1 = 144S144 = 1

Para i = 2:  j = 144 + 2 + 65 = 211; S2 = 211S211 = 2

Para i = 3:  j = 211 + 3 + 86 = 44; S3 = 44S44 = 3

...

2.- Generación del flujo de cifrado (PRGA, pseudo-random generation algorithm):

Partiendo del vector de estado (S) obtenido en la etapa anterior se genera el flujo de cifrado o secuencia cifrante pseudoaleatoria KS.

En cada iteración del algoritmo se obtiene un byte del flujo de cifrado y se intercambian dos elementos del vector de estado (S). El flujo de cifrado tendrá la misma longitud que el mensaje a cifrar (M) o texto en claro (en el siguiente ejemplo M ="EJEMPLO CIFRADO"):

2.1.- M="EJEMPLO CIFRADO"; i = 0; j = 0

2.2.- Desde l = 0 hasta longitud_mensaje(M) - 1

2.2.1.- i = (i + 1) mod 256

2.2.2.- j = (j + Si) mod 256

2.2.3.- Intercambiar_valores(SiSj)

2.2.4.- KSl = S(Si+Sj) mod 256

Es decir:

- Para l = 0:  i = 1; j = 144; S1 = 213S144 = 144; KS0 = 212

- Para l = 1:  i = 2; j = 164; S2 = 83S164 = 20; KS1 = 236

- Para l = 2:  i = 3; j = 76; S3 = 28S76 = 168; KS2 = 164

- Para l = 3:  i = 4; j = 193; S4 = 207S193 = 117; KS3 = 169 

...

3.- Cifrado:

XOR de cada byte del mensaje a cifrar con cada byte de la secuencia cifrante obtenida en el paso anterior:

3.1.- Desde i = 0 longitud_mensaje(M) - 1

3.1.1.- Ci = XOR(ASCII_DEC(Mi), KSi)

Creo un pequeño script en python:

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# Implemención en python del algoritmo RC4
def KSA(K):
    longitud_clave = len(K)
    print('[+] Longitud de la clave ............', longitud_clave)
    print('')
    print('*** Inicialización del vector de estado (KSA, key-scheduling algorithm)')
    print('[+] Carga del vector de estado (S) con los números secuenciales del 0 al 255')
    for i in range(256):
        S.append(i)
    j=0
    print('[+] Intercambio de elementos del vector de estado (S)')
    for i in range(256):
        j = (j + S[i] + ord(K[i % longitud_clave])) % 256
        S[i],S[j] = S[j],S[i]
def PRGA(M):
    longitud_mensaje = len(M)
    print('[+] Longitud del mensaje a cifrar ...', longitud_mensaje)
    print('')
    print('*** Generación del flujo de cifrado (PRGA, pseudo-random generation algorithm)')
    print('[+] Generación de la secuencia cifrante pseudoaleatoria KS')
    i=j=0
    for l in range(longitud_mensaje):
        i = (i + 1) % 256
        j = (j + S[i]) % 256
        S[i],S[j] = S[j],S[i]
        k = S[(S[i] + S[j])% 256]
        KS.append(k)
def XOR(M):
    longitud_mensaje = len(M)
    print('')
    print('*** Cifrado: XOR de cada byte mensaje a cifrar con cada byte secuencia cifrante)')
    for i in range(longitud_mensaje):
        C.append(ord(M[i])^KS[i])
S=[]
M = 'EJEMPLO CIFRADO'
K = 'CLAVE'
print('')
print('[+] Clave ...........................', K)
KSA(K)
# print(S)
KS=[]
print('')
print('[+] Mensaje a cifrar ................', M)
PRGA(M)
# print(KS)
C=[]
XOR(M)
print('[+] Criptograma ....................', C)

Y lo ejecuto:

Gráficamente, para cifrar:
Y para descifrar bastará con realizar la operación XOR de cada byte del criptograma con cada byte de la secuencia cifrante para obtener el texto en claro.

En el próximo post comprobaré que no me he equivocado y ejecutaré el script con ejemplos obtenidos de la wikipedia.

Comentarios

Entradas populares de este blog

Criptografía (I): cifrado Vigenère y criptoanálisis Kasiski

Hace unos días mi amigo Iñaki Regidor ( @Inaki_Regidor ), a quien dedico esta entrada :), compartió en las redes sociales un post titulado "Criptografía: el arte de esconder mensajes"  publicado en uno de los blogs de EiTB . En ese post se explican ciertos métodos clásicos para cifrar mensajes , entre ellos el cifrado de Vigenère , y , al final del mismo, se propone un reto consistente en descifrar un mensaje , lo que me ha animado a escribir este post sobre el método Kasiski  para atacar un cifrado polialfabético ( conociendo la clave descifrar el mensaje es muy fácil, pero lo que contaré en este post es la forma de hacerlo sin saberla ). El mensaje a descifrar es el siguiente: LNUDVMUYRMUDVLLPXAFZUEFAIOVWVMUOVMUEVMUEZCUDVSYWCIVCFGUCUNYCGALLGRCYTIJTRNNPJQOPJEMZITYLIAYYKRYEFDUDCAMAVRMZEAMBLEXPJCCQIEHPJTYXVNMLAEZTIMUOFRUFC Como ya he dicho el método de Vigenère es un sistema de sustitución polialfabético , lo que significa que, al contrario que en un sistema de

Criptografía (XXIII): cifrado de Hill (I)

En este post me propongo explicar de forma comprensible lo que he entendido sobre el cifrado de Hill , propuesto por el matemático Lester S. Hill , en 1929, y que se basa en emplear una matriz como clave  para cifrar un texto en claro y su inversa para descifrar el criptograma correspondiente . Hay tres cosas que me gustan de la criptografía clásica, además de que considero que ésta es muy didáctica a la hora de comprender los sistemas criptográficos modernos: la primera de ellas es que me "obliga" a repasar conceptos de matemáticas aprendidos hace mucho tiempo y, desgraciadamente, olvidados también hace demasiado tiempo, y, por consiguiente, que, como dice  Dani , amigo y coautor de este blog, me "obliga" a hacer "gimnasia mental"; la segunda es que, en la mayoría de las ocasiones, pueden cifrarse y descifrase los mensajes, e incluso realizarse el criptoanálisis de los criptogramas, sin más que un simple lápiz y papel, es decir, para mi es como un pasat

¿Qué significa el emblema de la profesión informática? (I)

Todas o muchas profesiones tienen un emblema que las representa simbólicamente y en el caso de la  informática: " es el establecido en la resolución de 11 de noviembre de 1977  para las titulaciones universitarias superiores de informática, y  está constituido por una figura representando en su parte central  un  núcleo toroidal de ferrita , atravesado por  hilos de lectura,  escritura e inhibición . El núcleo está rodeado por  dos ramas : una  de  laurel , como símbolo de recompensa, y la otra, de  olivo , como  símbolo de sabiduría. La  corona  será la  de la casa real  española,  y bajo el escudo se inscribirá el acrónimo de la organización. ". Veamos los diferentes elementos tomando como ejemplo el emblema del COIIE/EIIEO (Colegio Oficial de Ingenieros en Informática del País Vasco/ Euskadiko Informatikako Ingeniarien Elkargo Ofiziala ) . Pero no sólo el COIIE/EIIEO adopta el emblema establecido en dicha resolución, sino que éste se adopta también como im