domenica 6 giugno 2010

Come far fuori i doppioni

Anche se l'hard disk del mio notebook ha dimensioni nettamente superiori rispetto al mio attuale fabbisogno, ogni tanto ci tengo a fare un po' d'ordine eliminando qualche doppione (può capitarmi di scaricare di nuovo un file che non ricordavo di aver già prelevato tempo prima, per esempio). Effettuare questo genere di pulizia "a manina" sarebbe un'impresa improba, oltre che soggetta a un margine di errore non trascurabile: infatti non è detto che due file con lo stesso nome e dimensione siano uguali, così come due file potrebbero essere identici pur essendo caratterizzati da nomi e date diversi. Per automatizzare la ricerca e l'eliminazione dei file duplicati mi servo di un programmino freeware per Windows che ho scoperto per caso tempo fa su Google Gruppi, quando ancora ero solita bazzicare da quelle parti: sto parlando di DoubleKiller. Ecco qui di seguito un'"istantanea" della scheda Options, nella quale si possono configurare le varie impostazioni.


Il programma permette di confrontare i file in base a un'opportuna combinazione di criteri selezionabili sotto la voce «assume files to be the same, if...»: il nome («names are identical»), la dimensione («sizes are identical»), la data di ultima modifica («dates are identical»), e infine il criterio che meglio degli altri permette di distinguere due file, ovvero il checksum CRC32CRC32-checksums are identical»). Quest'ultimo è un numero che si può considerare come una sorta di impronta digitale di un file, e viene calcolato elaborandone l'intero contenuto... ma solamente se ciò è indispensabile, ossia se gli eventuali altri criteri non hanno evidenziato differenze, allo scopo di non rallentare il programma senza che ve ne sia la necessità. A dire il vero non è impossibile che due file con uguali dimensioni e checksum siano in realtà differenti... ma la probabilità che ciò accada è all'incirca la stessa di trovare due esseri umani con identiche impronte digitali.
Nella casella «folders» della scheda Options è possibile aggiungere [+] o rimuovere [-] elementi all'elenco di cartelle alle quali il programma limiterà la ricerca di duplicati, indicando se tale ricerca andrà estesa alle sottocartelle oppure no.
Nella casella «limit scan to files matching these masks» è possibile indicare al programma uno o più schemi che i nomi dei file da ricercare devono soddisfare, come una particolare estensione (ad esempio, *.bmp per le immagini bitmap).
Se nella casella «exclude files matching these masks» compare un segno di spunta accanto a un certo schema, allora quel particolare tipo di file verrà escluso dalla ricerca, per non correre il rischio di arrecare danno al sistema.
Nell'area «leave out the following files» è possibile selezionare le dimensioni e gli attributiread only» – sola lettura, «hidden» – nascosto, «archive» – archivio, «system» – di sistema) dei file da escludere dalla ricerca.
Inoltre, anche se il programma non prevede una vera e propria installazione, è possibile salvarne le impostazioni nel registro di Windows selezionando «save settings in registry»; se non lo fai, chiudendo il programma le scelte fatte andranno perdute, e al successivo riavvio verranno caricate le impostazioni di default.
A questo punto, dopo aver selezionato le opzioni che fanno al caso tuo, sei pronto per avviare la ricerca dei file duplicati, cliccando sul pulsante Run. Il risultato della scansione compare nella scheda DoubleKiller: i file duplicati (o triplicati, quadruplicati...) sono raggruppati nell'apposito riquadro (l'alternanza del colore di sfondo e delle icone aiuta a distinguere i vari insiemi), e per ciascuno di essi è indicato il nome («Filename»), il percorso («Path»), la dimensione («Size»), la data («Date») e il checksum («CRC32»). Tutti questi elementi dovrebbero essere sufficienti per decidere se e quali file eliminare. Cliccando sull'icona alla sinistra di un file nell'elenco, al suo interno comparirà una crocetta che sta ad indicare che il file è stato contrassegnato per la rimozione. Oltre alla procedura appena descritta, quella cosiddetta manuale, ne esiste anche una automatica, che però non consente di controllare con altrettanta precisione quali file verranno rimossi; in particolare, cliccando sui pulsanti «Check the first dupes» e «Check the last dupes», tutti i file di ciascun insieme tranne uno vengono contrassegnati per la rimozione.
Dopo aver selezionato i file superflui, puoi decidere se cancellarliDelete checked files») oppure, qualora tu non sia sicuro al 100% che i file possano essere eliminati, spostarli in una cartella di backupMove checked files...»), per cancellarli eventualmente in un secondo momento oppure ripristinarli.
Nel primo caso il programma ti chiederà se vuoi davvero continuare, comunicandoti il numero e la dimensione totale dei file che stai per eliminare e avvisandoti che essi verranno cancellati direttamente, non spostati nel Cestino (la guida sottolinea che scegliendo «» i tuoi file finiranno nel grande serbatoio dei bit da qualche parte lassù nel paradiso ;-)).


Nel secondo caso ti verrà chiesto di indicare la cartella di destinazione. In entrambi i casi il programma ti avviserà che nella lista dei risultati sono rimasti alcuni file singoli (perché di alcuni insiemi tutti i file tranne uno sono stati cancellati o spostati) e ti domanderà se desideri che questi elementi vengano rimossi dalla lista. Di norma credo che tu possa tranquillamente rispondere di sì...


Last but not least... ti consiglio di adottare una certa cautela nell'utilizzo del programma (ad esempio, a meno di non sapere bene ciò che si sta facendo, meglio lasciar stare la cartella C:\Windows) e se possibile di leggere per intero la guida contenuta nella scheda Help, riassunta da me in questo post (purtroppo la traduzione in italiano non è disponibile). Se si tratta di file importanti, per evitare di combinare pasticci è una buona idea aprire con un doppio clic i file ricavati dalla scansione per verificarne il contenuto prima di procedere alla cancellazione... ma, se vuoi andare proprio sul sicuro, sappi che esiste una versione Pro a pagamento ($19.95 / 14.95 €), la quale, oltre ad offrire un'interfaccia multilingue e varie altre funzionalità aggiuntive, supporta il confronto byte per byte.

Nessun commento:

Posta un commento