Nell'informatica, il software tar (acronimo per tape archive) permette di generare dei file utili per l'archiviazione e il backup, sia su memorie di massa che su dispositivi a nastro magnetico utilizzando il formato omonimo. Tale formato è stato reso uno standard da POSIX.1-1998 e dal successivo POSIX.1-2001. Oltre a poter immagazzinare più file, cosa che si traduce nella possibilità di accumulare dentro un singolo file migliaia di file diversi (packing), si aggiunge la conservazione delle informazioni del file system, quali l'utente, il gruppo e i permessi, data e ora, e la struttura delle directory. Secondo la tradizione Unix "ogni programma, una sola funzione", tar non supporta direttamente la compressione.
Dal momento che tar è stato sviluppato originariamente per l'uso con dispositivi ad accesso sequenziale, quali appunto le unità a nastro, porta con sé un piccolo prezzo da pagare in termini di prestazioni per quanto riguarda l'estrazione di un singolo file, dal momento che il software deve leggere l'intero archivio per localizzarlo. Ormai l'utilizzo dell'opzione -f è utilizzata per indicare il file da utilizzare per le operazioni di scrittura o rilettura dell'archivio. Comunemente un file prodotto da tar viene denominato tarball.
tar è comunemente utilizzato in unione con un'utility esterna di compressione dati, quali ad esempio gzip, bzip2 o, non più in uso, compress, dal momento che da solo non ha la capacità di comprimere i file. Si potrebbe pensare che ciò richieda più passaggi, mentre l'operatore pipe di Unix permette di combinare i due passaggi in una sola riga di comando. Inoltre, la versione GNU di tar supporta le opzioni a riga di comando -z (gzip), -j (bzip2), e -Z (compress), che abilitano la compressione per il file che viene creato.
Per creare un file con tar, utilizza i seguenti comandi:
Semplice file di tar: tar -cf nome_tarball.tarfile_da_archiviare1file_da_archiviare2...
Per archiviare e comprimere in due passi:
tar -cf nome_tarball.tarfile_da_archiviare1file_da_archiviare2...
gzip nome_tarball.tar
Per archiviare e comprimere in un passo solo:
tar -cf - file_da_archiviare1file_da_archiviare2... | gzip -c > nome_tarball.tar.gz
Per estrarre i file dall'archivio, utilizza i seguenti comandi:
Semplice file di tar: tar -xf nome_tarball.tar
Un passaggio alla volta:
gunzip nome_tarball.tar.gz
tar -xf nome_tarball.tar
Tutto insieme:
gunzip -c nome_tarball.tar.gz | tar -xf -
Per utilizzare bzip2 invece di gzip, è sufficiente sostituire con bzip2 dove viene utilizzato gzip e bunzip2 dove gunzip viene utilizzato nelle varie righe di comando.
Utilizzando il flag della compressione previsto per il tar di GNU:
Per comprimere:
Utilizzando gzip: tar -czf nome_tarball.tgzfile_da_archiviare1file_da_archiviare2...
Utilizzando bzip2: tar -cjf nome_tarball.tbz2file_da_archiviare1file_da_archiviare2 ...
Utilizzando compress: tar -cZf nome_tarball.tar.Zfile_da_archiviare1file_da_archiviare2...
Utilizzando un altro programma di compressione: tar --use-compress-program=name_of_program -cf nome_tarball.tar.XXXfile_da_archiviare1file_da_archiviare2 ...
Per decomprimere ed estrarre i file dall'archivio:
Archivio compresso con gzip: tar -xzf nome_tarball.tar.gz
Archivio compresso con bzip2: tar -xjf nome_tarball.tar.bz2
Archivio compresso con compress: tar -xZf nome_tarball.tar.Z
Archivio compresso con altro programma di compressione: tar --use-compress-program=nome_del_programma -xf nome_tarball.tar.XXX
Ricorda che:
c: crea archivi
x: estrae i file dall'archivio
v: scorre la lista dei file, generalmente evitato nella creazione/estrazione in quanto potrebbe produrre un lungo output inutile
Una limitazione dei primi drive a nastro era che i dati potevano essere scritti solo in blocchi da 512 byte. Un file tar è la concatenazione di uno o più file, ognuno di essi preceduti da un'intestazione. Il file viene trascritto inalterato tranne la sua lunghezza: viene arrotondato ai multipli di 512 byte, lo spazio che avanza viene riempito con zeri (0x00). La fine del file viene contrassegnata con almeno due blochi vuoti (quindi 1Kbyte).
L'intestazione viene codificata in ASCII per aumentare la portabilità dei file: spostare un file tar da una piattaforma con un certo sistema di ordinamento dei byte ad un'altra con diverso ordinamento, creerebbe problemi.
I campi definiti dal formato tar originale, sono elencati nella tabella seguente. Quando un campo non viene usato, viene riempito con degli zero. L'intestazione è discostata con dei byte di zero per formare i blocchi da 512.