Hash en Informática Forense: Uso de MD5, SHA-1, SHA-256 y SHA-512 en Evidencia Digital

30 de junio de 2026

Comparte esta entrada:

WhatsApp X (Twitter) Telegram LinkedIn Email Facebook Pinterest

Hash en Informática Forense: Uso de MD5, SHA-1, SHA-256 y SHA-512 en Evidencia Digital 3

Hash en Informática Forense: Uso de MD5, SHA-1, SHA-256 y SHA-512 en Evidencia Digital

Raymond Orta Martínez, Abogado, Perito en Informática Forense +58(414)3220886

En informática forense, la tendencia actual es utilizar funciones hash criptográficas de la familia SHA-2 o superiores. A continuación se resume el estado de aceptación de los algoritmos más comunes para la identificación e integridad de evidencias digitales:

Algoritmo	Longitud	Estado actual	Uso recomendado
SHA-1	160 bits	Aceptación limitada	Solo para compatibilidad o comparación con herramientas antiguas. No se recomienda como hash único.
SHA-224	224 bits	Aceptado	Poco utilizado en informática forense.
SHA-256	256 bits	Altamente recomendado	Estándar actual para adquisición y verificación de evidencias.
SHA-384	384 bits	Aceptado	Adecuado para casos que requieren mayor margen de seguridad.
SHA-512	512 bits	Altamente recomendado	Muy utilizado junto con SHA-256 en laboratorios forenses.

Situación de cada algoritmo

SHA-1

Definido en FIPS PUB 180-1.
Produce un hash de 160 bits.
Desde 2017 se demostraron colisiones prácticas (ataque SHAttered).
NIST dejó de recomendarlo para aplicaciones criptográficas.
Aún aparece en numerosas herramientas forenses (FTK Imager, EnCase, X-Ways, Autopsy) únicamente por compatibilidad con procedimientos anteriores.

SHA-256

Definido en FIPS 180-4.
Actualmente es el estándar internacional más utilizado.
No existen ataques prácticos que comprometan su utilización para identificación de evidencias.
Es el algoritmo preferido por organismos gubernamentales y laboratorios forenses.

SHA-384 y SHA-512

También pertenecen a la familia SHA-2.
Ofrecen un margen de seguridad superior.
Son plenamente aceptados en procesos judiciales y periciales.

Recomendación pericial actual

En un dictamen pericial moderno es recomendable indicar, por ejemplo:

«La integridad de la evidencia fue verificada mediante el cálculo de las funciones hash MD5 y SHA-256.»

o preferiblemente:

«La integridad de la evidencia fue verificada mediante el cálculo de las funciones hash SHA-256 y SHA-512.»

¿Por qué muchos peritos siguen usando MD5?

Aunque MD5 también presenta colisiones criptográficas, sigue apareciendo en informes forenses porque:

millones de evidencias históricas fueron identificadas con MD5;
numerosas bases de datos de archivos conocidos (NSRL, HashKeeper, etc.) aún contienen hashes MD5;
sirve como identificador adicional, pero no debería utilizarse como único mecanismo de verificación.

Buenas prácticas (2026)

La mayoría de las guías técnicas internacionales recomiendan:

calcular SHA-256 como hash principal;
opcionalmente calcular SHA-512 como segundo hash;
incluir MD5 únicamente por razones de compatibilidad cuando la herramienta lo genere automáticamente.

En consecuencia, para una experticia informática actual, la práctica más sólida consiste en documentar SHA-256 (o SHA-256 + SHA-512) como mecanismo principal de verificación de integridad de la evidencia digital.

redacta exahustivo articulo sobre el uso de los hash desde el md5 hasta el sha-512 pro contras y recomentaciones para peritos para informaticaforense.com

Voy a preparar el artículo como texto publicable, con enfoque técnico-pericial y recomendaciones prácticas para dictámenes, cadena de custodia y uso en herramientas forenses. Verificaré primero estándares y fuentes vigentes para no basarlo solo en memoria.

Una precisión importante: en uso forense hay que distinguir entre “seguridad criptográfica general” y “verificación de integridad/identificación de evidencia”. Esa diferencia explica por qué MD5 y SHA-1 todavía aparecen en herramientas periciales, aunque ya no sean recomendables como hash único.Pensó durante 41s

Las referencias técnicas usadas incluyen NIST FIPS 180-4, que estandariza SHA-1 y la familia SHA-2; NIST FIPS 202, sobre SHA-3; la posición de SWGDE sobre MD5 y SHA-1 en informática forense; el RFC 6151 sobre las limitaciones criptográficas de MD5; y la política de NIST sobre retiro progresivo de SHA-1.

Uso de funciones hash en informática forense: del MD5 al SHA-512, ventajas, limitaciones y recomendaciones para peritos

Introducción

En informática forense, las funciones hash constituyen una de las herramientas técnicas más importantes para la identificación, preservación y verificación de integridad de evidencias digitales. Su uso se encuentra presente en la adquisición de discos duros, memorias USB, teléfonos móviles, imágenes forenses, archivos extraídos, respaldos, registros, correos electrónicos, videos, capturas web, bases de datos y cualquier otro objeto digital susceptible de ser ofrecido como evidencia en un procedimiento judicial, arbitral, administrativo o investigativo.

Sin embargo, todavía existe confusión frecuente entre abogados, jueces, fiscales, investigadores y algunos peritos sobre el verdadero alcance probatorio del hash. Un hash no convierte automáticamente un archivo en prueba válida; no sustituye la cadena de custodia; no prueba por sí solo la autoría de un documento; no acredita necesariamente el origen de un archivo; y tampoco demuestra que la evidencia fue legalmente obtenida. Lo que sí permite es verificar, con alto grado de certeza técnica, si un conjunto de datos se mantiene idéntico desde el momento en que fue calculado el valor hash.

En términos prácticos, el hash funciona como una huella digital matemática del objeto digital. Si el contenido cambia, aunque sea en un solo bit, el resultado hash debe cambiar. Esta característica hace que el hash sea indispensable para demostrar que una imagen forense, un archivo o una extracción digital no fue alterada después de su adquisición, traslado, análisis o presentación.

La discusión actual no es si deben usarse hashes en informática forense. La respuesta es afirmativa. La verdadera discusión es cuáles algoritmos deben usarse, cuáles deben evitarse como mecanismo único, cómo documentarlos en un dictamen pericial y qué valor real tienen frente a un cuestionamiento técnico o judicial.

Este artículo examina el uso de los algoritmos MD5, SHA-1, SHA-224, SHA-256, SHA-384 y SHA-512, sus ventajas, desventajas, riesgos conocidos y recomendaciones prácticas para peritos en informática forense.

Qué es una función hash criptográfica

Una función hash criptográfica es un algoritmo matemático que recibe una entrada de datos de longitud variable y produce una salida de longitud fija, conocida como resumen, digest, huella digital o valor hash.

Por ejemplo, un archivo de 5 KB, una imagen forense de 500 GB o un video de 2 GB pueden ser procesados por una función hash. El resultado será siempre una cadena alfanumérica de longitud fija, dependiendo del algoritmo utilizado.

MD5 produce 128 bits. SHA-1 produce 160 bits. SHA-256 produce 256 bits. SHA-384 produce 384 bits. SHA-512 produce 512 bits.

La utilidad forense deriva de varias propiedades:

Primero, la determinación. El mismo archivo, procesado por el mismo algoritmo, debe producir siempre el mismo hash.

Segundo, el efecto avalancha. Una mínima modificación del contenido debe generar un hash totalmente diferente.

Tercero, la resistencia a preimagen. A partir del hash no debería ser factible reconstruir el archivo original.

Cuarto, la resistencia a segunda preimagen. Dado un archivo determinado, no debería ser factible crear otro archivo distinto con el mismo hash.

Quinto, la resistencia a colisiones. No debería ser factible encontrar dos archivos distintos que produzcan el mismo hash.

Estas propiedades deben entenderse de forma técnica. Ningún algoritmo ofrece imposibilidad absoluta. Lo que se evalúa es la factibilidad computacional de romper esas propiedades con los recursos disponibles en un momento histórico determinado.

El hash en la práctica forense

En informática forense, el hash se utiliza principalmente para cinco funciones:

Identificación de evidencia digital.
Verificación de integridad.
Comparación entre original, copia e imagen forense.
Filtrado de archivos conocidos o irrelevantes.
Documentación técnica dentro de la cadena de custodia.

Cuando un perito adquiere una imagen forense de un disco duro, lo recomendable es calcular el hash de la fuente y el hash de la imagen obtenida. Si ambos valores coinciden, se fortalece técnicamente la afirmación de que la imagen es una reproducción bit a bit del soporte examinado.

Cuando se trabaja con archivos individuales, el hash permite demostrar que el archivo analizado es el mismo que fue recolectado, exportado o entregado. Esto es especialmente importante en casos de correos electrónicos, videos descargados, capturas web, bases de datos, mensajes de aplicaciones, documentos PDF, archivos comprimidos, registros de servidores y evidencias obtenidas desde plataformas en línea.

El hash también se utiliza para búsquedas en bases de datos de archivos conocidos. Por ejemplo, listas de archivos del sistema operativo, software legítimo, malware, material previamente identificado, imágenes conocidas o archivos de interés investigativo. En estos casos, el hash permite acelerar el análisis al comparar grandes volúmenes de archivos sin necesidad de abrirlos uno por uno.

Lo que el hash no demuestra

Uno de los errores más comunes en informes periciales es atribuir al hash un alcance probatorio mayor del que realmente tiene.

El hash no prueba la autoría de un archivo. Si un documento de Word tiene un hash determinado, ello no demuestra quién lo escribió.

El hash no prueba la licitud de la obtención. Una evidencia puede estar íntegra desde el punto de vista técnico, pero haber sido obtenida mediante un procedimiento cuestionable.

El hash no prueba contexto. Un archivo puede ser idéntico, pero su interpretación depende de metadatos, ubicación, sistema de archivos, fechas, rutas, usuarios, permisos, registros y demás elementos de análisis.

El hash no sustituye la cadena de custodia. La cadena de custodia documenta quién obtuvo, recibió, trasladó, almacenó, manipuló y analizó la evidencia. El hash es un mecanismo técnico de control de integridad, pero no reemplaza la documentación procedimental.

El hash no prueba que la evidencia no fue alterada antes del cálculo. Solo permite afirmar que no se detectan cambios desde el momento en que el hash fue calculado y correctamente registrado.

Esta precisión es fundamental en dictámenes periciales. El perito debe evitar expresiones absolutas como “el hash prueba la autenticidad total del archivo”. Es más correcto afirmar que “el hash permite verificar la integridad del archivo desde el momento de su cálculo, en relación con el objeto digital identificado”.

MD5: uso histórico, ventajas y limitaciones

MD5, siglas de Message Digest Algorithm 5, fue durante muchos años uno de los algoritmos más usados en informática forense. Produce un resumen de 128 bits y su representación hexadecimal tiene 32 caracteres.

Ventajas del MD5

MD5 es rápido. Esta fue una de las razones de su amplia adopción en laboratorios forenses, herramientas de adquisición, sistemas de comparación de archivos y bases de datos de hashes.

MD5 es compatible con herramientas antiguas. Muchas versiones de EnCase, FTK Imager, X-Ways, Autopsy, Cellebrite, Magnet, herramientas de línea de comandos y sistemas de archivo forense han soportado MD5 por décadas.

MD5 sigue apareciendo en bases de datos históricas. Muchas listas de archivos conocidos, sistemas de filtrado y repositorios antiguos fueron construidos con MD5.

MD5 es útil como identificador adicional. Cuando se utiliza junto con SHA-256 o SHA-512, puede servir como dato complementario para comparación con bases heredadas.

Desventajas del MD5

MD5 está criptográficamente roto para propósitos que requieran resistencia fuerte a colisiones. Existen ataques conocidos que permiten generar colisiones de forma práctica. Esto significa que dos archivos diferentes pueden ser diseñados para producir el mismo hash MD5.

Por esta razón, MD5 no debe usarse como único algoritmo para la verificación de evidencia digital en un dictamen moderno. Tampoco debe utilizarse como base única para firmas digitales, certificados, validaciones de seguridad, integridad crítica o identificación probatoria de contenido cuando exista un escenario adversarial.

El problema principal no es que en un caso ordinario aparezcan espontáneamente dos archivos distintos con el mismo MD5. El verdadero riesgo es que un actor técnicamente capacitado pueda preparar archivos con colisiones intencionales. En informática forense, donde se trabaja con evidencia potencialmente manipulada, adversarial o litigiosa, ese riesgo no puede ignorarse.

Recomendación sobre MD5

MD5 puede documentarse como hash secundario, histórico o de compatibilidad. No debe ser el hash principal ni el único hash de una evidencia.

Una redacción prudente sería:

“Adicionalmente, por razones de compatibilidad con herramientas forenses y bases de datos históricas, se calculó el hash MD5, sin perjuicio de que la verificación principal de integridad se realizó mediante SHA-256.”

SHA-1: transición desde el estándar histórico hacia el desuso

SHA-1 produce un resumen de 160 bits y fue ampliamente adoptado en seguridad informática, certificados digitales, repositorios de código, herramientas forenses y sistemas de control de integridad. Durante años se consideró más robusto que MD5.

Ventajas del SHA-1

SHA-1 tiene mayor longitud que MD5. Su digest de 160 bits proporcionó durante mucho tiempo un margen de seguridad superior al de MD5.

SHA-1 tiene amplia compatibilidad en herramientas forenses. Numerosas aplicaciones de adquisición, análisis y verificación todavía lo generan automáticamente.

SHA-1 sigue siendo útil en bases de datos de identificación de archivos. Muchas bases de referencia de software conocido, sistemas de filtrado y repositorios forenses utilizan SHA-1 como mecanismo de identificación.

Desventajas del SHA-1

SHA-1 también presenta vulnerabilidades frente a ataques de colisión. Las colisiones prácticas demostradas contra SHA-1 llevaron a su progresiva eliminación en contextos criptográficos críticos.

NIST ha recomendado la migración desde SHA-1 hacia SHA-2 o SHA-3. En seguridad informática moderna, SHA-1 no debe emplearse para nuevas aplicaciones que requieran alta resistencia criptográfica.

En materia forense, el debate es más matizado. Algunos organismos técnicos reconocen que MD5 y SHA-1 pueden seguir teniendo utilidad para verificación de integridad y file identification, siempre que se entienda su limitación y no se usen para aplicaciones criptográficas fuertes. No obstante, la mejor práctica actual exige migrar a SHA-256 o superior.

Recomendación sobre SHA-1

SHA-1 puede aceptarse como hash complementario, especialmente cuando la herramienta lo genera junto con otros algoritmos, cuando se necesita comparación con bases históricas o cuando el caso involucra evidencia previamente adquirida con ese algoritmo.

No debe ser usado como hash único en una experticia nueva, salvo que existan razones técnicas justificadas, y aun en ese caso debería complementarse con SHA-256 u otro algoritmo más robusto.

Una redacción adecuada sería:

“El hash SHA-1 fue calculado como valor complementario de identificación, manteniéndose como algoritmo principal de verificación el SHA-256.”

SHA-224: algoritmo aceptado, pero poco práctico en informática forense

SHA-224 pertenece a la familia SHA-2 y genera un resumen de 224 bits. Técnicamente es más robusto que SHA-1, pero su uso en informática forense es poco frecuente.

Ventajas del SHA-224

SHA-224 forma parte de la familia SHA-2. Ofrece mayor seguridad que MD5 y SHA-1. Puede ser adecuado en ciertos entornos técnicos donde se requiera un digest más corto que SHA-256.

Desventajas del SHA-224

Su principal desventaja es la escasa adopción práctica. Pocas herramientas forenses lo utilizan por defecto. La mayoría de los laboratorios, normas internas y flujos de trabajo prefieren SHA-256, SHA-384 o SHA-512.

Además, si el perito puede elegir SHA-256, no existe una razón práctica fuerte para preferir SHA-224 en una adquisición forense ordinaria.

Recomendación sobre SHA-224

No se recomienda como estándar principal para informática forense. Aunque técnicamente pertenece a la familia SHA-2, resulta menos conveniente que SHA-256 por razones de interoperabilidad, costumbre pericial, soporte en herramientas y claridad judicial.

SHA-256: estándar recomendado para evidencia digital

SHA-256 es actualmente el algoritmo más recomendable como hash principal en informática forense. Produce un resumen de 256 bits y pertenece a la familia SHA-2.

Ventajas del SHA-256

SHA-256 ofrece un equilibrio adecuado entre seguridad, velocidad, compatibilidad y aceptación técnica. Es ampliamente soportado por herramientas forenses modernas y por sistemas operativos, librerías criptográficas, utilidades de línea de comandos y entornos de laboratorio.

Su longitud de 256 bits proporciona un margen de seguridad suficiente para verificación de integridad de evidencia digital en investigaciones ordinarias y complejas.

SHA-256 tiene reconocimiento técnico internacional. Es utilizado en múltiples estándares, protocolos y prácticas de seguridad informática. Para fines periciales, su uso permite explicar de manera clara y defendible que se aplicó un algoritmo moderno, robusto y aceptado.

Desventajas del SHA-256

SHA-256 es más lento que MD5 y SHA-1, aunque en equipos modernos esta diferencia rara vez justifica usar algoritmos débiles como mecanismo principal.

En adquisiciones de gran tamaño, como discos de varios terabytes, el cálculo de hash puede incrementar el tiempo total del procedimiento. No obstante, este costo operativo está justificado por la necesidad de preservar y demostrar la integridad de la evidencia.

Otra desventaja relativa es que algunas bases antiguas de hashes no siempre contienen SHA-256, aunque esta situación ha venido cambiando progresivamente.

Recomendación sobre SHA-256

SHA-256 debe ser el algoritmo mínimo recomendado como hash principal en nuevas adquisiciones forenses. En la mayoría de los casos, basta con SHA-256 como valor principal, acompañado opcionalmente de MD5 o SHA-1 para compatibilidad.

Una redacción sólida sería:

“La verificación principal de integridad de la evidencia digital fue realizada mediante algoritmo SHA-256, por tratarse de una función hash criptográfica de la familia SHA-2, ampliamente aceptada para la identificación y control de integridad de objetos digitales.”

SHA-384: opción robusta, pero menos usada

SHA-384 pertenece también a la familia SHA-2 y produce un resumen de 384 bits. Es más robusto que SHA-256 en términos de longitud de salida, aunque menos usado en la práctica forense cotidiana.

Ventajas del SHA-384

Ofrece mayor margen de seguridad que SHA-256. Puede ser útil en entornos de alta exigencia, sistemas gubernamentales, infraestructuras críticas, evidencia de especial sensibilidad o políticas internas que requieran algoritmos superiores a 256 bits.

Desventajas del SHA-384

Tiene menor adopción práctica que SHA-256. Muchas herramientas forenses no lo generan de forma predeterminada. También produce valores más largos, lo que puede dificultar ligeramente la lectura en informes, actas y documentos de cadena de custodia.

En la mayoría de las investigaciones, SHA-384 no aporta una ventaja pericial decisiva frente a SHA-256, salvo que exista una política institucional o exigencia técnica específica.

Recomendación sobre SHA-384

Puede utilizarse como alternativa robusta, pero no es imprescindible. Si se emplea, debe documentarse correctamente y preferiblemente acompañarse de SHA-256 para facilitar compatibilidad con otros laboratorios y herramientas.

SHA-512: máxima robustez dentro de SHA-2

SHA-512 produce un resumen de 512 bits y es uno de los algoritmos más robustos de la familia SHA-2. En informática forense, su uso es perfectamente aceptable y recomendable cuando se busca mayor margen de seguridad.

Ventajas del SHA-512

SHA-512 ofrece una salida más larga y mayor resistencia teórica frente a ataques de colisión. Es una opción sólida para evidencia de alta sensibilidad, casos complejos, evidencia de gran valor probatorio o investigaciones donde se prevé un fuerte cuestionamiento técnico.

En ciertas arquitecturas de 64 bits, SHA-512 puede tener un rendimiento eficiente. Esto dependerá de la implementación, del procesador, del software utilizado y del tipo de datos procesados.

SHA-512 transmite una práctica conservadora y robusta. En dictámenes periciales, su uso como complemento de SHA-256 puede reforzar la defensa técnica del procedimiento.

Desventajas del SHA-512

El valor resultante es más largo. Esto puede hacer más pesada su transcripción en actas, informes o cuadros comparativos.

No todas las herramientas antiguas lo soportan. En ambientes donde se requiere interoperabilidad con plataformas heredadas, SHA-256 suele ser más práctico.

También puede generar una falsa impresión de necesidad absoluta. Para la mayoría de las evidencias digitales, SHA-256 es suficiente como hash principal. SHA-512 es excelente, pero no siempre indispensable.

Recomendación sobre SHA-512

SHA-512 es recomendable como segundo hash robusto cuando la herramienta lo permita. Una práctica especialmente sólida consiste en calcular SHA-256 y SHA-512.

Una redacción sugerida sería:

“La evidencia fue identificada y verificada mediante los algoritmos SHA-256 y SHA-512, ambos pertenecientes a la familia SHA-2, a los fines de reforzar la trazabilidad técnica y el control de integridad del objeto digital examinado.”

SHA-2 frente a SHA-3

Aunque este artículo se concentra en los algoritmos desde MD5 hasta SHA-512, conviene mencionar SHA-3. SHA-3 no es una simple continuación de SHA-2; utiliza una construcción interna diferente basada en Keccak. Fue estandarizado como alternativa moderna y complementaria.

En informática forense, SHA-3 todavía no tiene la misma adopción práctica que SHA-256. Muchas herramientas forenses comerciales y de código abierto siguen priorizando MD5, SHA-1, SHA-256 y SHA-512. No obstante, SHA-3 es técnicamente válido y puede tener creciente relevancia en el futuro.

La recomendación práctica actual es simple: para la mayoría de los peritos, SHA-256 debe ser el estándar mínimo principal; SHA-512 puede utilizarse como complemento robusto; SHA-3 puede aceptarse cuando la herramienta lo soporte, pero no es todavía el algoritmo más común en flujos de trabajo forenses tradicionales.

Tabla comparativa de algoritmos

Algoritmo	Longitud	Estado técnico	Uso forense recomendado
MD5	128 bits	Criptográficamente débil frente a colisiones	Solo como hash complementario o de compatibilidad
SHA-1	160 bits	En transición hacia retiro en seguridad criptográfica	Solo como complemento, legado o comparación con bases históricas
SHA-224	224 bits	Familia SHA-2, técnicamente aceptable	Poco recomendable por baja adopción práctica
SHA-256	256 bits	Robusto y ampliamente aceptado	Hash principal recomendado
SHA-384	384 bits	Robusto, menor uso cotidiano	Alternativa válida en casos de mayor exigencia
SHA-512	512 bits	Muy robusto	Recomendable como complemento fuerte de SHA-256

Hash de imagen forense y hash de archivos individuales

El perito debe distinguir entre hash de imagen forense y hash de archivos individuales.

El hash de imagen forense se calcula sobre la totalidad del objeto adquirido: disco, partición, volumen, imagen E01, RAW, AFF u otro formato. Su utilidad principal es verificar que la copia forense corresponde al objeto adquirido.

El hash de archivos individuales se calcula sobre documentos, imágenes, videos, correos, bases de datos o elementos extraídos de una imagen o sistema. Su utilidad es identificar y controlar la integridad de cada objeto específico.

Ambos niveles pueden coexistir. En un caso complejo, lo correcto puede ser calcular:

Hash del dispositivo o medio original, cuando sea técnicamente posible.
Hash de la imagen forense adquirida.
Hash de los segmentos o contenedores, si aplica.
Hash de los archivos extraídos relevantes.
Hash del informe, anexos digitales o paquete final entregado.

Esta estructura permite reconstruir técnicamente el recorrido de la evidencia desde la adquisición hasta la presentación.

Hash en formatos forenses: RAW, E01, AFF y contenedores

Cuando se trabaja con imágenes RAW, el hash suele calcularse sobre la copia bit a bit. Si la imagen es fiel al soporte original, el hash de la fuente y el hash de la imagen deberían coincidir.

En formatos como E01, el asunto requiere mayor precisión. E01 es un formato contenedor que puede incluir compresión, metadatos, segmentos, notas, información del examinador y otros campos. Por ello, debe diferenciarse entre el hash del contenido adquirido y el hash del archivo contenedor. Algunas herramientas reportan el hash del flujo lógico de evidencia, no necesariamente el hash simple del archivo E01 como archivo del sistema operativo.

Esta distinción debe documentarse. Si el perito no la explica, una contraparte técnica podría cuestionar por qué el hash calculado externamente sobre el archivo E01 no coincide con el hash reportado internamente por la herramienta.

La redacción debe ser precisa:

“El valor hash reportado corresponde al flujo de datos adquiridos por la herramienta forense, no al hash externo del archivo contenedor E01 considerado como archivo independiente del sistema operativo.”

Hash en evidencia obtenida de internet

En evidencias provenientes de internet, redes sociales, páginas web, sistemas en la nube o plataformas de streaming, el hash es igualmente útil, pero su alcance debe interpretarse correctamente.

Si el perito descarga un archivo HTML, una captura en PDF, un video, una imagen, un archivo WARC, un respaldo JSON, un correo electrónico en formato EML o un paquete ZIP, el hash identifica ese objeto descargado o generado. No prueba por sí solo que el contenido remoto no haya cambiado antes o después de la captura.

En estos casos, deben documentarse además:

URL o identificador de origen.
Fecha y hora de acceso.
Zona horaria.
Herramienta utilizada.
Versión del navegador.
Dirección IP pública, si es relevante.
Método de preservación.
Capturas de pantalla.
Código fuente o archivo preservado.
Hash de cada archivo resultante.

En evidencias web, el hash debe integrarse con acta de inspección, metodología, trazabilidad, metadatos y registro técnico del procedimiento.

Hash en videos, imágenes y documentos PDF

Los archivos multimedia presentan una particularidad: cualquier cambio de codificación, compresión, metadatos, miniaturas, etiquetas internas o estructura del contenedor modifica el hash.

Por ejemplo, si un video MP4 es abierto y exportado nuevamente por un editor, aunque visualmente parezca idéntico, su hash cambiará. Si un PDF es abierto por un software que actualiza metadatos internos, también puede cambiar. Si una imagen es reenviada por WhatsApp, generalmente será recomprimida y tendrá un hash distinto al archivo original.

Por ello, el perito debe evitar afirmar que dos archivos son diferentes en contenido perceptible solo porque sus hashes no coinciden. La falta de coincidencia hash prueba diferencia binaria, no necesariamente diferencia visual, auditiva o semántica.

En estos casos, puede ser necesario complementar el hash con análisis de metadatos, comparación perceptual, examen de estructura de archivo, análisis de codificación, fotogramas clave, firmas de cámara, EXIF, cuantización, compresión y demás elementos técnicos.

Hash y cadena de custodia

La cadena de custodia es el registro documentado de la recolección, preservación, traslado, almacenamiento, análisis y presentación de la evidencia.

El hash es un componente técnico de control dentro de esa cadena, pero no la reemplaza.

Un procedimiento correcto debe registrar:

Identificación del objeto digital.
Persona que lo recolecta.
Fecha y hora de recolección.
Lugar o sistema de origen.
Herramienta utilizada.
Método de adquisición.
Algoritmos hash empleados.
Valores hash obtenidos.
Medio de almacenamiento.
Custodios sucesivos.
Verificaciones posteriores.
Incidentes o anomalías.
Condiciones de embalaje, sellado o preservación.
Firma o identificación de los intervinientes.

La cadena de custodia sin hash es técnicamente débil en evidencia digital. Pero un hash sin cadena de custodia también es insuficiente desde el punto de vista probatorio.

Hash y prueba judicial

En juicio, el hash suele ser usado para responder preguntas como:

¿El archivo analizado es el mismo que fue recolectado?

¿La imagen forense fue alterada después de su adquisición?

¿La copia entregada a las partes coincide con la evidencia preservada?

¿El archivo presentado como anexo es idéntico al archivo examinado por el perito?

¿El dispositivo fue adquirido de forma reproducible?

¿Existe correspondencia entre el reporte de la herramienta y los archivos entregados?

Para que el hash tenga valor probatorio, el informe debe explicar de forma comprensible qué algoritmo fue utilizado, qué objeto fue procesado, cuándo se calculó el valor, con qué herramienta, bajo qué condiciones y qué verificación posterior fue realizada.

No basta con colocar una cadena hexadecimal al final del informe. El perito debe explicar su función dentro de la metodología.

Pros y contras generales del uso de hash en informática forense

Ventajas

El hash permite verificar integridad de forma objetiva.

Permite comparar evidencia original, copia e imagen forense.

Reduce discusiones subjetivas sobre alteración de archivos.

Facilita la identificación de archivos conocidos.

Permite detectar cambios mínimos.

Apoya la cadena de custodia.

Facilita la reproducibilidad del análisis.

Permite auditoría técnica por otro perito.

Es aceptado internacionalmente como práctica forense.

Desventajas o limitaciones

No prueba autoría.

No prueba licitud de obtención.

No prueba autenticidad contextual.

No detecta alteraciones anteriores al cálculo.

Depende de la correcta conservación del valor hash.

Puede ser mal interpretado por operadores jurídicos.

Los algoritmos débiles pueden ser cuestionados.

Diferencias de formato o contenedor pueden generar confusión.

No sustituye el análisis pericial del contenido.

No evita errores humanos en adquisición, rotulado o documentación.

Recomendaciones prácticas para peritos

Primera recomendación: usar SHA-256 como mínimo

Toda nueva adquisición forense debería incluir SHA-256 como algoritmo principal. Es el punto de equilibrio más razonable entre seguridad, compatibilidad y aceptación técnica.

Segunda recomendación: agregar SHA-512 cuando sea posible

En casos de alta relevancia, evidencia sensible o posible contradicción técnica, es recomendable calcular SHA-256 y SHA-512.

Tercera recomendación: no usar MD5 como único hash

MD5 puede seguir documentándose por compatibilidad, pero no debe ser el único valor hash en un informe actual.

Cuarta recomendación: no usar SHA-1 como único hash

SHA-1 puede ser útil como complemento o para comparación con bases antiguas, pero debe evitarse como hash principal único.

Quinta recomendación: documentar herramienta y versión

Debe indicarse el software utilizado para el cálculo: FTK Imager, EnCase, X-Ways, Autopsy, Magnet, Cellebrite, hashdeep, sha256sum, PowerShell Get-FileHash u otra herramienta. También debe indicarse versión, sistema operativo y fecha del procedimiento.

Sexta recomendación: calcular hash lo más temprano posible

El hash debe calcularse en el momento más cercano posible a la recolección o adquisición. Mientras más tarde se calcule, mayor será el espacio para cuestionamientos sobre alteraciones previas.

Séptima recomendación: verificar nuevamente antes de analizar

Antes de iniciar análisis sobre una copia, debe verificarse que el hash coincida con el registrado durante la adquisición o recepción.

Octava recomendación: verificar antes de entregar

Antes de entregar evidencia digital, anexos o copias a tribunal, fiscalía, cliente, contraparte o árbitro, debe recalcularse el hash y documentarse la coincidencia.

Novena recomendación: diferenciar hash de fuente, imagen y archivo

El informe debe decir exactamente qué se hasheó. No es lo mismo el hash del disco físico, el hash de la imagen RAW, el hash interno de un E01, el hash de un archivo extraído o el hash de un ZIP que contiene anexos.

Décima recomendación: evitar transcripciones manuales sin control

Las cadenas hash son largas y pueden contener errores de transcripción. Es recomendable incluirlas en tablas, anexos digitales, archivos de manifiesto y, cuando sea posible, códigos QR o archivos CSV/TXT firmados o preservados.

Fórmula recomendada para dictámenes periciales

Un modelo de redacción técnica podría ser:

“A los fines de preservar y verificar la integridad de la evidencia digital, se procedió al cálculo de valores hash criptográficos sobre el objeto digital examinado. Se utilizó como algoritmo principal SHA-256, complementado con SHA-512, generándose los correspondientes valores de identificación digital. Dichos valores permiten verificar que el objeto digital analizado conserva identidad binaria con el objeto preservado al momento de la adquisición, sin que ello sustituya la cadena de custodia ni constituya por sí solo determinación de autoría, origen o licitud de obtención.”

Otra fórmula más breve:

“La integridad de la evidencia fue verificada mediante SHA-256. El valor hash obtenido fue registrado en el acta técnica y posteriormente verificado antes del análisis, constatándose coincidencia entre la evidencia adquirida y la evidencia examinada.”

Para casos con MD5 y SHA-1:

“Los valores MD5 y SHA-1 se calcularon únicamente como identificadores complementarios y por razones de compatibilidad con herramientas y bases de datos forenses. La verificación principal de integridad se realizó mediante SHA-256.”

Ejemplo de tabla para informe pericial

Evidencia	Tipo	Algoritmo	Valor hash	Herramienta	Fecha
Disco Samsung 1TB S/N XXXXX	Imagen forense	SHA-256	[valor]	FTK Imager 4.7.1.2	[fecha]
Disco Samsung 1TB S/N XXXXX	Imagen forense	SHA-512	[valor]	FTK Imager 4.7.1.2	[fecha]
archivo_video.mp4	Archivo extraído	SHA-256	[valor]	PowerShell Get-FileHash	[fecha]
evidencia_web.zip	Contenedor digital	SHA-256	[valor]	sha256sum	[fecha]

Errores frecuentes que deben evitarse

El primer error es afirmar que un archivo es auténtico solo porque tiene hash. El hash prueba integridad desde su cálculo, no autenticidad integral.

El segundo error es usar solo MD5 en informes modernos. Esto abre espacio a impugnaciones innecesarias.

El tercer error es no indicar qué objeto fue hasheado. Un valor hash sin identificación precisa del objeto carece de utilidad pericial suficiente.

El cuarto error es no documentar la herramienta utilizada. La reproducibilidad exige indicar software, versión y entorno.

El quinto error es confundir hash de archivo con hash de contenido visible. Dos imágenes visualmente iguales pueden tener hashes distintos si fueron comprimidas o si cambiaron sus metadatos.

El sexto error es no recalcular el hash antes del análisis. Si el archivo fue copiado varias veces, debe verificarse que la copia de trabajo coincide con la evidencia preservada.

El séptimo error es no preservar el reporte generado por la herramienta. Los logs de adquisición, archivos de reporte y manifiestos forman parte del soporte técnico de la conclusión pericial.

Conclusión

El uso de funciones hash es una práctica indispensable en informática forense. Desde MD5 hasta SHA-512, cada algoritmo tiene un contexto histórico, una utilidad práctica y una limitación técnica que el perito debe conocer.

MD5 y SHA-1 no han desaparecido del mundo forense porque siguen presentes en herramientas, bases de datos y flujos de trabajo heredados. Sin embargo, su uso debe ser complementario y no principal. Las vulnerabilidades conocidas frente a colisiones impiden recomendarlos como únicos mecanismos de verificación en experticias actuales.

SHA-256 debe considerarse el estándar mínimo recomendable para nuevas adquisiciones y verificaciones de evidencia digital. SHA-512 es una opción robusta para reforzar procedimientos de alta exigencia. SHA-384 también es aceptable, aunque menos usado. SHA-224, pese a pertenecer a SHA-2, tiene menor utilidad práctica en informática forense. SHA-3 representa una alternativa moderna, aunque todavía no ha desplazado en la práctica pericial cotidiana a SHA-256.

El perito debe recordar que el hash no es una formalidad decorativa del informe. Es un mecanismo técnico de trazabilidad, control y verificación. Mal usado, genera falsa seguridad. Bien usado, fortalece la cadena de custodia, facilita la reproducibilidad del análisis y permite defender técnicamente la integridad de la evidencia ante tribunales, fiscalías, árbitros, auditores y contrapartes técnicas.

La recomendación final es clara: en informática forense contemporánea, utilice SHA-256 como hash principal; complemente con SHA-512 cuando sea posible; conserve MD5 o SHA-1 solo para compatibilidad; documente herramienta, versión, objeto procesado, fecha, hora y alcance del cálculo; y explique siempre que el hash prueba integridad técnica desde el momento de su generación, no autoría, licitud ni autenticidad absoluta del contenido.

Fuentes:

Eastlake, D., & Jones, P. (2001). US Secure Hash Algorithm 1 (SHA1) (RFC 3174). RFC Editor. https://doi.org/10.17487/RFC3174

National Institute of Standards and Technology. (2015). Secure Hash Standard (SHS) (FIPS PUB 180-4). U.S. Department of Commerce. https://doi.org/10.6028/NIST.FIPS.180-4

National Institute of Standards and Technology. (2015). SHA-3 Standard: Permutation-Based Hash and Extendable-Output Functions (FIPS PUB 202). U.S. Department of Commerce. https://doi.org/10.6028/NIST.FIPS.202

National Institute of Standards and Technology. (2022, December 15). NIST retires SHA-1 cryptographic algorithm. https://www.nist.gov/news-events/news/2022/12/nist-retires-sha-1-cryptographic-algorithm

National Institute of Standards and Technology. (2022, December 15). NIST transitioning away from SHA-1 for all applications. https://www.nist.gov/news-events/news/2022/12/nist-transitioning-away-sha-1-all-applications

Rivest, R. (1992). The MD5 Message-Digest Algorithm (RFC 1321). RFC Editor. https://doi.org/10.17487/RFC1321

Scientific Working Group on Digital Evidence. (2019). SWGDE position on the use of MD5 and SHA1 hash algorithms in digital and multimedia forensics. SWGDE. https://www.swgde.org/wp-content/uploads/2023/11/2019-09-29-SWGDE-Position-on-the-Use-of-MD5-and.pdf

Stevens, M., Bursztein, E., Karpman, P., Albertini, A., & Markov, Y. (2017). The first collision for full SHA-1. In J. Katz & H. Shacham (Eds.), Advances in Cryptology – CRYPTO 2017 (Lecture Notes in Computer Science, Vol. 10401, pp. 570–596). Springer. https://doi.org/10.1007/978-3-319-63688-7_19

Turner, S., & Chen, L. (2011). Updated Security Considerations for the MD5 Message-Digest and the HMAC-MD5 Algorithms (RFC 6151). RFC Editor. https://doi.org/10.17487/RFC6151

Fuentes recomendadas

Para un artículo técnico-pericial en informaticaforense.com, yo usaría como fuentes principales:

National Institute of Standards and Technology. (2015). Secure Hash Standard (SHS) (FIPS PUB 180-4). U.S. Department of Commerce. https://doi.org/10.6028/NIST.FIPS.180-4

Turner, S., & Chen, L. (2011). Updated Security Considerations for the MD5 Message-Digest and the HMAC-MD5 Algorithms (RFC 6151). RFC Editor. https://doi.org/10.17487/RFC6151

Comparte esta entrada:

WhatsApp X (Twitter) Telegram LinkedIn Email Facebook Pinterest