Archivematica 1.7.2 is a legacy release, and these documents are no longer being maintained.

Guide de démarrage rapide Archivematica

Ce guide décrit le processus de transfert et d’acquisition d’Archivematica aux fins d’essais. Il est destiné aux personnes qui ne connaissent pas Archivematica et désirent le mettre à l’essai. Il ne s’agit pas d’un guide d’installation Archivematica aux fins de développement ou de production. Pour ce faire, consultez plutôt Installation. Avant de commencer, vous devriez être sensibilisé au OAIS Reference Model (Système ouvert d’archivage d’information) et être à l’aise avec les acronymes SIP, AIP et DIP.

Ce guide aborde les processus de base d’un transfert standard, et non les fonctionnalités avancées d’Archivematica. Pour savoir comment traiter du contenu plus complexe, consultez le Guide de l’utilisateur. Les instructions qui suivent s’appliquent au bac à sable et à une machine virtuelle Archivematica, à moins d’avis à l’effet du contraire.

Après avoir pris connaissance de ce guide, vous pourrez :

  • Créer un transfert standard dans Archivematica
  • Créer un AIP et un DIP à partir du transfert
  • Examiner l’identification d’un fichier
  • Examiner la normalisation des fichiers
  • Automatiser un pipeline Archivematica

Sur cette page :

Tâche #0 – Installer votre espace d’essai Archivematica

Si vous n’avez pas accès à la version intégrale d’Archivematica, vous pouvez procéder de l’une de deux façons pour faire l’essai du logiciel : le bac à sable Archivematica hébergé ou une machine virtuelle (VM) Archivematica installée localement.

Utilisation du bac à sable

Artefactual maintains an Archivematica sandbox with the following credentials:

Le bac à sable permet de mettre à l’essai la version la plus récente d’Archivematica. Veuillez noter que le site Web est réinitialisé automatiquement tous les jours. Les paquets que vous créez ne seront pas conservés en permanence. Il est également possible qu’un autre utilisateur en fasse l’essai en même temps que vous, c’est pourquoi vous verrez peut-être les changements apportés par d’autres utilisateurs lorsque vous utilisez le logiciel.

Le site de démonstration est modifié en direct et n’est pas modéré. À des fins de sécurité, les transferts d’essai sont restreints aux échantillons de données que fournit Artefactual. Les utilisateurs qui désirent mettre à l’essai leurs propres données peuvent télécharger le bac Vagrant (voir ci-dessous) et effectuer des essais localement.

Note

Si vous utilisez le bac à sable, vous pouvez passer à la Tâche #1.

Installing on a virtual machine using Vagrant

Avertissement

This virtual machine is not intended to be used in production. It targets developers or experienced users willing to try out Archivematica using Vagrant. If you want to start using Archivematica in production, please refer to the other methods of installations explained under this manual.

This guide will setup a new Oracle VirtualBox virtual machine with Archivematica installed on your computer. It works on most operating systems, including MacOS X, Linux, Windows, FreeBSD and others.

Minimum system requirements: 4GB RAM; 10GB disk space.

Install Vagrant and VirtualBox

  1. Install VirtualBox from https://www.virtualbox.org/ (or use your package manager). VirtualBox 5.1.18 or newer is required.
  2. Install Vagrant from http://www.vagrantup.com/ (or use your package manager). Vagrant 1.9.3 or newer is required. Be aware that Ubuntu 14.04 installs Vagrant 1.4.3, which does not meet the requirements.

Spin it up

  1. using your computer’s command-line interface, create a new directory and open it. The location doesn’t matter, but you’ll need to return to it later - all further command line operations should be run from inside the directory.

    mkdir archivematica-vagrant && cd archivematica-vagrant
    
  2. Initialize the current directory to be a Vagrant environment.

    vagrant init artefactual/archivematica
    
  3. Run Vagrant (again, from the same directory where you saved the Vagrantfile).

    vagrant up
    

    Vagrant will download our custom box and boot it in VirtualBox. The download can take anywhere from a few minutes to an hour or more, depending on the speed of your connection, as the box is fairly large (approx 3.2 GB in size).

This will take a while. It depends on your computer, but it could take up to an hour. Your computer may be very slow while Archivematica is being provisioned - be sure to save any work and be prepared to step away from your computer while Archivematica is building.

Lorsque l’assemblage est terminé, vous pouvez accéder à votre machine virtuelle :

vagrant ssh

Vous pouvez également accéder à votre milieu Archivematica à l’aide de votre navigateur :

To get the Storage Service API key, go to http://10.10.10.20:8000 and click on the Administration tab. In the left sidebar, click on Users, then click on Edit for the default user. Scrolling down, you will see the API key for the default user at the bottom of the screen. Copy this into the API key field when prompted during installation.

Tâche #1 – Commencer un transfert standard

A transfer is any set of one or more files that you decide to process as a group. It can come from any storage system to which Archivematica has been connected. To start your first transfer, go to the Archivematica transfer dashboard - the main page of either the sandbox or your Archivematica VM. You can also access the transfer page by clicking on the Transfer tab in your Archivematica instance.

Le processus de transfert est constitué d’une série de microservices, qui sont à leur tour constitués de travaux.

Note

Un microservice est un groupe d’actions qui a un but spécifique dans Archivematica. Vérifier si votre transfert est conforme aux exigences de transfert d’Archivematica est un microservice.

Note

Un travail est une action distincte d’un microservice. Est donc un travail, l’action de déplacer le contenu de votre transfert vers un répertoire de traitement.

Chaque microservice peut être développé en cliquant sur le nom du microservice. Vous pouvez ainsi voir tous les travaux de ce microservice. Vous pouvez visualiser la commande de chaque travail en cliquant sur l’icône d’engrenage, à droite du nom du travail, qui ouvrira une nouvelle fenêtre contenant l’information sur les commandes. En cliquant sur Show arguments, vous verrez la commande Python qu’utilise Archivematica pour exécuter le travail.

Les travaux deviennent verts lorsqu’ils ont été exécutés correctement, et rouges dans le cas contraire.

Étapes :

  1. Assurez-vous de sélectionner ‘Standard’ dans la case type de transfert.
  2. Saisissez un nom pour votre transfert (à votre guise).
  3. Cliquez sur naviguer pour examiner le contenu disponible. Assurez-vous de cliquer sur l’icône dossier pour développer les arborescences de répertoires.
  4. Cherchez le répertoire images dans SampleTransfers, et cliquez ensuite sur Ajouter.
  5. Le répertoire sélectionné s’affichera sous la case de sélection.
  6. Cliquez sur le bouton vert Commencer le transfert pour lancer le transfert.
  7. Lorsque vous êtes invité à le faire, prenez les décisions nécessaires. Par contre, ne sélectionnez rien qui interromprait le transfert (c.-à-d. quoi que ce soit qui mentionne « Rejeter »). Pour en savoir plus sur les points de décisions, consultez la documentation de l’onglet de transfert.
  8. Lorsque vous êtes arrivé au microservice Identifier le format de fichier, arrêtez et lisez la section suivante.

Examen des formats de fichiers

Il n’est pas essentiel de consulter la commande de chaque travail, mais il est recommandé d’examiner les résultats du microservice Identifier le format de fichier. Un des travaux les plus importants d’Archivematica est d’identifier les formats de fichiers et ensuite de préserver ces fichiers le mieux possible.

Étapes :

  1. Lorsque vous êtes invité à le faire, sélectionnez un outil d’identification de formation de fichier (Siegfried et Fido sont les options les plus robustes).
  2. Lorsque l’identification du format de fichier est terminée, cliquez sur l’icône engrenage, à droite du nom de travail, pour ouvrir la page du travail.
  3. Sur la page du travail, sous STDOUT, vous verrez de l’information similaire à ce qui suit :
IDCommand UUID: 8cc792b4-362d-4002-8981-a4e808c04b24
File: (9305a71e-5180-4c49-b93e-c934d7a433dc) /var/archivematica/sharedDirectory/currentlyProcessing/demo-test-f706d98d-faa6-450f-92c7-b608f1106f2e/objects/pictures/MARBLES.TGA
fmt/402

Command output: fmt/402
/var/archivematica/sharedDirectory/currentlyProcessing/demo-test-f706d98d-faa6-450f-92c7-b608f1106f2e/objects/pictures/MARBLES.TGA identified as a Truevision TGA Bitmap 2.0

Cette information signifie que le fichier MARBLES.TGA a été identifié comme un format Truevision TGA Bitmap 2.0. Archivematica utilise PRONOM, un registre d’information technique maintenu par les National Archives of the UK, aux fins d’identification des fichiers et pour informer la normalisation, la caractérisation et d’autres événements de manipulation de fichiers. Archivematica identifie un fichier TGA comme étant fmt/402 (format 402), l’identificateur de format PRONOM d’un fichier Truvision TGA Bitmap 2.0. Il devrait y avoir une section STDOUT similaire pour chaque élément du transfert.

Archivematica continuera de traiter votre transfert en arrière-plan. Lorsque vous êtes arrivé au microservice Création d’un SIP à partir du transfert, lisez la section suivante.

Création d’un SIP

Le dernier microservice de l’onglet Transfert est Création d’un SIP à partir du transfert. Ce dernier travail, à savoir Création de SIP(s), vous permet d’aller directement à l’onglet Acquisition ou d’envoyer le transfert au backlog. Pour en savoir plus sur le backlog, consultez la documentation du backlog.

Étapes :

  1. Lorsque vous êtes invité à le faire, sélectionnez Créer un seul SIP et continuer le traitement.

Tâche #2 – Création d’AIP et de DIP

La fonction primaire d’Archivematica est de produire des Paquets d’information archivés (AIP - Archival Information Packages) et des Paquets d’information diffusés (DIP - Dissemination Information Packages) à partir de SIP. Vous venez de créer un SIP dans l’onglet Transfert. C’est dans l’onglet Acquisition que vous lancez le microservice qui crée l’AIP et le DIP.

Étapes :

  1. Cliquez sur l’onglet Acquisition.
  2. Prenez les décisions nécessaires (mais encore une fois, ne sélectionnez rien qui mentionne « Rejeter »). Pour en savoir plus sur les points de décisions présents dans Acquisition, consultez la documentation de l’onglet Acquisition.
  3. Lorsque vous arrivez au point de décision Normaliser, arrêtez et lisez la section suivante.

Normalisation

Acquisition, tout comme Transfert, comporte plusieurs microservices, le plus important étant Normaliser. La normalisation consiste à convertir votre contenu numérisé en formats appropriés aux fins de stockage à long terme (pour un AIP) et d’accès (pour un DIP). Lorsque vous arrivez au microservice Normalisation, vous devrez déterminer comment normaliser le contenu.

Étapes :

  1. Sélectionnez Normaliser aux fins de préservation et d’accès lorsque vous êtes invité à le faire. En sélectionnant cette option, vous dites à Archivematica que vous désirez créer une copie de préservation (AIP) et une copie d’accès (DIP) du contenu de votre SIP.
  2. Lorsque la normalisation est terminée, vous êtes invité à approuver la normalisation. Avant de l’approuver, cliquez sur la petite icône de page, à côté du menu déroulant.
  3. Le Rapport de normalisation s’affichera dans un onglet séparé. La manière de lire cette information est décrire plus loin.
  4. Dans votre onglet principal, cliquez sur l’onglet Planification de la préservation en haut de la page. Lorsque cet onglet est ouvert, lancez une recherche sur « SVG » (ou tout format de fichier que vous souhaitez examiner). Cliquez sur le nom du format de fichier.
  5. Deux onglets devraient maintenant être ouverts : le Rapport de normalisation et la page Planification de la préservation. Retournez au Rapport de normalisation et examinez les deux sections qui suivent.

Examen de la normalisation à des fins de préservation

Le Rapport de normalisation précise si le contenu de votre SIP a fait l’objet d’une normalisation. Cette prise d’écran présente le rapport pour lion.svg, un graphique vectoriel adaptable, avec les colonnes de préservation surlignées.

A row of the Normalization Report with the preservation columns indicated by a red box.

Si vous retournez à l’onglet Planification de la préservation où vous avez effectué la recherche pour trouver SVG, vous constaterez que les fichiers SVG sont considérés comme un format de préservation. Le Rapport de normalisation indique alors :

  • La normalisation de préservation a été tentée
  • La normalisation de préservation n’a pas échoué.
  • L’image était déjà en format de préservation.

Grosso modo, cela signifie que la normalisation de préservation a été lancée, mais qu’Archivematica a constaté que le fichier était déjà sous forme de format de préservation, et n’a donc rien fait.

Examen de la normalisation à des fins d’accès

Cette prise d’écran illustre le rapport lion.svg, avec les colonnes d’accès surlignées.

A row of the Normalization Report with the access columns indicated by a red box.

Pour la normalisation d’accès le rapport indique ce qui suit :

  • La normalisation d’accès a été tentée
  • La normalisation d’accès n’a pas échoué.
  • L’image n’était pas en format d’accès.

Pour examiner ce que cela signifie pour lion.svg, nous devrons aller plus loin dans l’onglet Planification de la préservation.

Étapes :

  1. Retournez à l’onglet Planification de la préservation.
  2. Défilez vers le bas et trouvez la section Normalisation, dans la barre latérale de gauche. Cliquez sur Règles.
  3. Effectuez une recherche « Scalable Vector Graphics » (ou tout autre format de fichier à analyser).

Les résultats donnent les règles d’accès et de normalisation des fichiers SVG. À la colonne Commande, on constate que le format d’accès privilégié pour un SVP est PDF. Archivematica suit ces règles pour créer des copies d’accès, ce qui nous permet de conclure d’après le Rapport de normalisation qu’une copie PDF du fichier SVG a bien été créée pour le DIP. Vous pouvez le confirmer en vérifiant le résultat de la commande du travail Normaliser aux fins d’accès (comme vous l’avez fait précédemment pour le travail Identifier le format de fichier) ou en examinant le DIP après qu’il a été stocké.

Continuez le traitement de votre Acquisition, et arrêtez lorsque vous arrivez aux points de décisions AIP et DIP.

Tâche #3 - Stockage des AIP et des DIP

L’outil Archivematica est excellent pour créer des paquets. Dans un environnement de production, le stockage se fait hors d’Archivematica dans un système de stockage privilégié par l’utilisateur ou l’institution. Mais aux fins de la présente démonstration, nous sauvegarderons notre AIP et notre DIP dans l’unité de stockage interne par défaut d’Archivematica.

Il faut toujours stocker les AIP en premier. Étant donné que les paquets sont plus petits, les options de stockage des DIP sont les premières à être affichées, et il est tentant de les stocker immédiatement. Si quelque chose ne fonctionne pas avec votre AIP, il vous faudrait alors supprimer le DIP des systèmes de stockage et d’accès. En traitant l’AIP en premier, vous pourrez stocker les DIP et y donner accès en sachant que l’AIP est sécurisé.

Étapes :

  1. Traitez votre acquisition jusqu’à ce que les microservices Stocker l’AIP et Télécharger le DIP vous demandent un point de décision.
  2. Sélectionnez « Stocker l’AIP » dans le menu déroulant Stocker l’AIP.
  3. Dans quelques instants, un autre point de décision vous invitera à sélectionner un lieu de stockage pour votre AIP. Une seule option devrait s’afficher, à savoir « Stocker l’AIP dans le répertoire standard Archivematica ». Sélectionnez cette option.
  4. Lorsque l’AIP a été stocké correctement, vous pouvez maintenant passer au DIP. Comme il n’y a pas de VM Archivematica locale ni de bac à sable connecté à un système d’accès, sélectionnez « Stocker le DIP » sous Télécharger le DIP.
  5. Vous serez invité à sélectionner un lieu de stockage pour votre DIP. Une seule option devrait s’afficher, à savoir «Stocker le DIP dans le répertoire standard Archivematica ». Sélectionnez cette option.

Vos AIP et DIP sont maintenant stockés dans l’unité de stockage interne d’Archivematica. Le déroulement des opérations d’Archivematica est maintenant terminé!

Tâche #4 - Examen des AIP et des DIP

Maintenant que votre AIP et votre DIP sont stockés, vous pouvez les examiner.

Examen de l’AIP

Étapes :

  1. Cliquez sur l’onglet Dossier de stockage des archives. Votre AIP devrait être affiché dans les résultats de recherche, mais s’il n’y figure pas, effectuez une recherche en utilisant le nom que vous lui avez attribué à la Tâche #1.
  2. Selon la version Archivematica que vous utilisez, lorsque vous cliquez sur le nom de l’AIP, la page Détails de l’AIP s’ouvrira ou l’AIP sera téléchargé immédiatement. Si vous vous trouvez sur la page Détails de l’AIP, cliquez sur le bouton « télécharger ».
  3. Ouvrez l’AIP après le téléchargement. Votre ordinateur doit être doté d’un programme ayant la capacité d’ouvrir des fichiers 7zip. Si nécessaire, vous pouvez télécharger 7Zip ici : http://www.7-zip.org/download.html
  4. Lorsque l’AIP a été extrait, naviguez dans les dossiers jusqu’à ce que vous trouviez le répertoire des objets. Ce répertoire contient les images originales de votre transfert et les copies de préservation. Vous pouvez comparer les formats de fichier du répertoire d’objets avec les règles qui se trouvent dans l’onglet Planification de la préservation.
  5. Consultez les dossiers jusqu’à ce que vous trouviez le fichier METS et ouvrez-le dans un navigateur ou un éditeur de texte. Son nom ressemblera à « METS.7e58760a-e357-4165-9428-26f5bb2ba8ee.xml ».
  6. Trouvez le marqueur <mets:fileSec> dans le METS. Dans le fileSec, vous devriez pouvoir trouver de l’information sur tous les éléments de votre transfert original. Ils se trouvent dans la section marquée <mets:fileGrp USE=”original”>. Lorsque vous défilez vers le bas, vous pouvez voir de l’information complémentaire pour chaque copie de préservation. Il s’agit de la section marquée <mets:fileGrp USE=”preservation”>.

Le fichier METS.xml est très long, parce qu’il contient toute l’information de vos fichiers, ainsi que des procédés et outils qui sont intervenus dans ces fichiers originaux. Pour en savoir plus sur le contenu et la structure du fichier METS, consultez le wiki Archivematica.

Examen du DIP

Note

Cette section ne s’applique que si vous utilisez une VM, puisque le bac à sable Archivematica interdit l’accès au Service de stockage.

Étapes :

  1. In order to retrieve the DIP, you need to access the Archivematica Storage Service. Add « :8000 » to the end of your Archivematica VM’s URL (i.e. http://10.10.10.20:8000/).
  2. Dans le Service de stockage, cliquez sur l’onglet Paquets.
  3. Il y a une boîte de recherche à l’extrême droite de la page. Cherchez votre DIP en saisissant le nom que vous lui avez attribué à la Tâche #1.
  4. Deux résultats devraient être affichés : votre AIP et votre DIP, dans la colonne « Type ».
  5. Après avoir déterminé le fichier correspondant à votre DIP, cliquez sur « Télécharger ».
  6. Une fois téléchargé, ouvrez le DIP. Votre ordinateur doit être doté d’un programme ayant la capacité d’ouvrir des fichiers TAR. 7Zip, peut ouvrir ce genre de fichiers : http://www.7-zip.org/download.html
  7. Après avoir extrait le DIP, ouvrez le répertoire d’objets, qui contient les copies d’accès créés à partir de vos images originales. Vous pouvez comparer les formats de fichiers du répertoire d’objets avec les règles qui se trouvent dans l’onglet Planification de la préservation.
  8. Le DIP contient également un répertoire de vignettes, soit de petites versions JPG de vos images. Si l’image n’a pu être convertie en format JPG (comme dans le cas des fichiers SVG), une icône générique est alors insérée.

Tâche #5 – Automatisation du déroulement des opérations au moyen d’une configuration

En cliquant sur l’onglet Administration, vous ouvrez l’écran de configurations de traitement d’Archivematica, la façon la plus élémentaire d’automatiser Archivematica. Tous les points de décisions soulevés dans l’essai d’Archivematica, aux étapes 1 à 3, peuvent être automatisés ici. On l’utilise couramment lorsqu’on sait que la même décision sera prise pour un point de décision.

Étapes :

  1. Cliquez sur l’onglet Administration. Vous verrez une seule configuration de traitement appelée « par défaut ».
  2. Examinez les différentes options et apportez les changements nécessaires. Vous reconnaîtrez les options d’après les points de décisions des tâches antérieures.

Exemple : vous désirez automatiser l’algorithme et le niveau de compression, parce que vous désirez toujours utiliser le même outil de compression et le même niveau de compression pour vos paquets. Pour régler les configurations de traitement de la compression :

  1. Cochez la case à côté de Sélectionner l’algorithme de compression.
  2. Dans le menu déroulant de droite, sélectionnez un algorithme de compression - 7z using bzip2 est celui qui est le plus couramment utilisé.
  3. Cochez la case à côté de Sélectionnez le niveau de compression
  4. Dans le menu déroulant de droite, sélectionnez un niveau de compression - 5 - mode de compression normal donne un bon équilibre entre la vitesse et la taille.

Il est recommandé d’effectuer plusieurs essais dans Archivematica avant de paramétrer les configurations de traitement. Lorsque vous connaîtrez mieux Archivematica, vous reconnaîtrez les points de décisions répétitifs, que vous pourrez alors automatiser au moyen de configurations de traitement.

Autres façons de s’initier à Archivematica

Ce tutoriel couvre un déroulement d’opérations élémentaire dans Archivematica. Pour vous renseigner sur la manière de traiter du contenu plus complexe, veuillez consulter le Guide de l’utilisateur.

Les tâches ci-haut reposent sur Archivematica Worksheet qui avait été développé par Justin Simpson pour la HEAP-AIM25 Network Meeting en novembre 2016. La feuille de travail présente d’autres exemples de déroulements d’opérations dans Archivematica. Vous pouvez la télécharger à Archivematica Camp Github repo. N’hésitez pas à utiliser cette feuille de travail à des fins personnelles ou encore dans un contexte d’apprentissage – le fichier de licence est à la fin.

Retour en haut de page

Archivematica 1.7.2

License

Archivematica documentation by Artefactual Systems Inc. is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.

Creative Commons License