[eside-ghost] Hash de ficheros

Bruno Gonzalez stenyak en gmail.com
Dom Mar 25 15:10:28 CEST 2012


- Los archivos más pequeños los tengo versionados con GIT en unos cuantos
servidores, así que están seguros (y automáticamente sin redundancia, no
como con HG).

- Los archivos grandes importantes (videos y fotos propias) no suman más de
20 gigas, así que también les tengo hechos backups en varios equipos (con
rsyncs warretes).

- Los archivos grandes menos importantes (pelis, series, música, ebooks,
isos, etc) suman cientos de gigas, pero ya tienen un backup en su hábitat
natural: las redes P2P.

La catalogación es para ese último grupo de archivos. No suelo
modificarlos, y si lo hiciera, es dificil que se mantenga el tamaño exacto
del archivo (dato que entra en los hashes que calculo).

En cualquier caso, la eliminación de duplicados la haré manualmente por si
acaso; sólo quiero detectar los candidatos.

2012/3/25 Iñigo Garcia <igarmer en gmail.com>

> A mi me daría miedo, en relación a los backups, de dar dos ficheros por
> similares porque coincidan únicamente el hash de los primeros bytes (sobre
> todo en ficheros tipo ofimáticos).
>
> Si han modificado contenido fuera de los primeros megas, puedes perder
> versiones de ficheros en las copias.
>
> Yo usuaria para este fin, alguna solución de de-duplicación de las copias.
> Quizás te sea de utilidad algo como Opendedup...
>
> El 25 de marzo de 2012 14:33, Pablo Garaizar Sagarminaga <
> garaizar en deusto.es> escribió:
>
> Hola,
>>
>> el Sun, 25 Mar 2012 14:28:52 +0200 Bruno Gonzalez <stenyak en gmail.com>
>> decía:
>>
>> >     head "$1" -c $((1024*1024))
>>
>> Como bien dice el refrán, "lo importante no es como empieza, sino cómo
>> acaba", así que quizá sea mejor cambiar head por tail para evitar
>> posibles colisiones, ¿no?
>>
>> --
>>  Pablo Garaizar Sagarminaga
>>  Universidad de Deusto
>>  Avda. de las Universidades 24
>>  48007 Bilbao - Spain
>>
>>  Phone:       +34-94-4139000 Ext 2512
>>  Fax:                  +34-94-4139101
>>
>> _______________________________________________
>> eside-ghost mailing list
>> eside-ghost en listas.deusto.es
>> https://listas.deusto.es/mailman/listinfo/eside-ghost
>>
>
>
> _______________________________________________
> eside-ghost mailing list
> eside-ghost en listas.deusto.es
> https://listas.deusto.es/mailman/listinfo/eside-ghost
>



-- 
Saludos,
     Bruno González

_______________________________________________
Jabber: stenyak AT gmail.com
http://www.stenyak.com
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <https://listas.deusto.es/mailman/private/eside-ghost/attachments/20120325/1ffce784/attachment-0001.html>


Más información sobre la lista de distribución eside-ghost