Parchive
Parchive est un systĂšme correcteur d'erreurs qui peut ĂȘtre appliquĂ© Ă un ensemble de fichiers pour permettre leur reconstruction lorsqu'un ou plusieurs de ces fichiers sont manquants, incomplets ou endommagĂ©s.
Historique
Les groupes Usenet Ă©taient originellement conçus pour des conversations informelles et n'Ă©taient donc pas conçus pour ĂȘtre un moyen de transmission fiable. Une des limitations pour les conversations Ă©tait que les messages Ă©taient gĂ©nĂ©ralement concis et limitĂ©s au texte en ASCII 7-bit.
Pour passer des données binaires de 8 bits sur un canal de 7 bits et utiliser Usenet pour les transférer, diverses techniques ont été conçues comme uuencoding et Base64. Plus tard les logiciels Usenet ont permis l'usage de l'ASCII étendu 8 bit, ainsi de nouvelles méthodes comme yEnc sont apparues.
Alors que le problÚme de transmission des données était résolu, la fiabilité d'Usenet laissait à désirer. En 2001, Tobis Rieper et Stefan Wehlus ont proposé Parity Volume Set specification 1.0. En transmettant des données supplémentaires et en utilisant la correction d'erreur Reed-Solomon, un utilisateur peut reconstruire les données manquantes à partir d'un téléchargement incomplet.
Vue d'ensemble
Les fichiers par et par2 sont utilisĂ©s pour rĂ©parer les fichiers endommagĂ©s en se basant sur leur modĂšle binaire. Le nom par vient de paritĂ©. Ces fichiers peuvent ĂȘtre utilisĂ©s pour reconstruire des fichiers endommagĂ©s ou pour rĂ©cupĂ©rer des fichiers manquants dans un ensemble de fichiers. Par exemple, si une archive dĂ©coupĂ©e en 47 fichiers a Ă©tĂ© tĂ©lĂ©chargĂ©e, mais qu'un seul d'entre eux est manquant, un fichier par tĂ©lĂ©chargĂ© peut ĂȘtre utilisĂ© pour reconstruire le fichier manquant.
Versions
Il y a deux versions incompatibles (1 et 2) des spécifications du format.
Pour la version 1, en considĂ©rant les fichiers f1, f2, âŠ, fn, la Parchive sera constituĂ©e d'un fichier d'index (f.par) et d'un certain nombre de volume de paritĂ© (f.p01, f.p02, etc.). Si on a tous les fichiers originaux sauf un seul (par exemple, f2), il est possible de crĂ©er le fichier manquant (f2) Ă partir de tous les fichiers originaux plus n'importe lequel des volumes de paritĂ©. De plus, il est possible de recrĂ©er deux fichiers manquant Ă partir de deux volumes de paritĂ©s, et ainsi de suite.
Les fichiers index (*.par dans la version 1 et *.par2 dans la version 2) ne sont pas nĂ©cessaires pour rĂ©cupĂ©rer des donnĂ©es. Les index sont uniquement des hashages qui permettent d'identifier rapidement les fichiers cibles, et leur contenu est dupliquĂ© dans chacun des volumes de paritĂ©s. Les fichiers index sont utilisĂ©s pour vĂ©rifier rapidement s'il y a une erreur afin de savoir si des fichiers de paritĂ©s supplĂ©mentaires sont nĂ©cessaires. Ils Ă©taient plus utiles dans la version 1 oĂč les volumes de paritĂ©s Ă©taient plus gros que les index. Tous les fichiers de donnĂ©es Par contiennent l'index en entier, mais la vĂ©rification la plus facile de la complĂ©tude est d'utiliser un simple fichier index.
La plus importante des limitations trouvĂ©e dans l'utilisation rĂ©elle des Parchives Ă©tait lorsqu'une erreur d'un seul bit dans un fichier forçait l'algorithme Ă mettre Ă l'Ă©cart le fichier en entier. Pour amĂ©liorer cette situation, une deuxiĂšme version de Parchive a Ă©tĂ© crĂ©Ă©e, qui dĂ©coupait tous les fichiers sources en blocs plus petits. Ces petits blocs peuvent ĂȘtre vus comme des fichiers Parchives eux-mĂȘmes ; si suffisamment de blocs sont prĂ©sents, tous les autres blocs peuvent ĂȘtre recrĂ©Ă©s.
Les fichiers PAR2 utilisent en général la convention de nommage : fichier.vol000+01.PAR2, fichier.vol001+02.PAR2, fichier.vol003+04.PAR2, fichier.vol007+06.PAR2, etc. Les éléments +01, +02, etc. dans les noms de fichiers indiquent le nombre de blocs qu'ils contiennent. Si un fichier index d'un téléchargement indique que 4 blocs sont manquants, la façon la plus simple de réparer les fichiers sera de télécharger le fichier fichier.vol003+04.PAR2. Cependant, grùce à la redondance, le fichier fichier.vol007+06.PAR2 est également acceptable.
Autres utilisations
Les fichiers Parchives peuvent ĂȘtre utilisĂ©s dans d'autre cadres que les transmissions Usenet.
- Lorsqu'on utilise des CD-R bon marché, il est possible d'insérer des données de redondance, en gravant des Parchives avec les données.
- Certains logiciels utilisant Parchive peuvent dĂ©couper un fichier source en plusieurs fichiers plus petits, pour s'abstraire des limitations imposĂ©es par des systĂšmes comme FAT32. MĂȘme avec 0% de redondance, le logiciel peut reconstruire le fichier original Ă partir des petites parties.
Logiciels
- Microsoft Windows: QuickPar, MultiPar, Parchive, Parbuddy
- Mac OS X: MacPAR deLuxe
- GNU/Linux: Parchive, PyPar2