[eside-ghost] ¿Ficheros iguales?
AngelD
angeld en froga.net
Jue Abr 26 13:14:03 CEST 2007
On Thu, April 26, 2007 12:57, Juanval wrote:
> On 4/26/07, Pablo Pérez <pablofausto en gmail.com> wrote:
>
>> Hola
>>
>>
>> Tengo dos carpetas con 5000 ficheros tiff cada una y los 5000 ficheros
>> de una y otra carpeta son los mismos pero con nombres diferentes. Quiero
>> hacer un script para casar los ficheros que son iguales y se me ocurre
>> utilizar md5sum para comprobar si un fichero es igual a otro a través
>> de su checksum. ¿Es un método infalible? ¿Es posible que dos ficheros
>> diferente den el mismo checksum? ¿Que más puedo comprobar a parte del
>> checksum?
>
> Hummm en caso de que hubiera una coincidencia en el md5, tendrías 4
> archivos con el mismo hash (dos archivos iguales en cada carpeta), en lugar
> de 2 (uno por carpeta), como debería ser. Asi que si tienes mas de 2
> archivos con el mismo hash, trátalos a mano, que tardarás menos. Y los
> demás, script al canto :P
La coincidencia ocasional es prácticamente imposible (pensar que el
prácticamente está tachado). Si nos remitimos a este texto de
kriptópolis[1],
...
En general, para un hash de n bits, la probabilidad de encontrar otro
mensaje con el mismo hash que el primero ha de ser el que marca la
probabilidad pura y dura: 2^(-n). Con n=128, un atacante necesitaría
probar con 2^128 mensajes para encontrar un hash igual al de otro mensaje
dado.
...
diciendo el 'man' de 'md5sum' que usa 128-bit y si el 'bc' no me engaña:
2 ^ 128 = 340282366920938463463374607431768211456 (son 40 dígitos)
es prácticamente imposible conseguir que dos ficheros con la misma suma
de manera accidental. Tienes más probabilidades de que te toque la
lotería, te caiga un rallo o incluso que llegues a la luna, si mis
cálculos son correctos.
Saludos --- Angel
[1]http://www.kriptopolis.org/sha-1-y-las-colisiones-de-cumpleanos
Más información sobre la lista de distribución eside-ghost