Archivematica 1.11.2 is a legacy release, and these documents are no longer being maintained.

Guide de démarrage rapide Archivematica

This guide walks you through the Archivematica transfer and ingest process for testing purposes. It is intended for people who are new to Archivematica and looking to test it out. This is not a guide to install Archivematica for development or production - please see Installation for full installation instructions. Before you start, you should know a bit about the OAIS Reference Model enough that the acronyms SIP, AIP, and DIP make sense.

Ce guide aborde les processus de base d’un transfert standard, et non les fonctionnalités avancées d’Archivematica. Pour savoir comment traiter du contenu plus complexe, consultez le Guide de l’utilisateur. Les instructions qui suivent s’appliquent au bac à sable et à une machine virtuelle Archivematica, à moins d’avis à l’effet du contraire.

Après avoir pris connaissance de ce guide, vous pourrez :

  • Créer un transfert standard dans Archivematica
  • Créer un AIP et un DIP à partir du transfert
  • Examiner l’identification d’un fichier
  • Examiner la normalisation des fichiers
  • Automatiser un pipeline Archivematica

Sur cette page :

Tâche #0 – Installer votre espace d’essai Archivematica

Si vous n’avez pas accès à la version intégrale d’Archivematica, vous pouvez procéder de l’une de deux façons pour faire l’essai du logiciel : le bac à sable Archivematica hébergé ou une machine virtuelle (VM) Archivematica installée localement.

Utilisation du bac à sable

Artefactual maintains an Archivematica sandbox with the following credentials:

Le bac à sable permet de mettre à l’essai la version la plus récente d’Archivematica. Veuillez noter que le site Web est réinitialisé automatiquement tous les jours. Les paquets que vous créez ne seront pas conservés en permanence. Il est également possible qu’un autre utilisateur en fasse l’essai en même temps que vous, c’est pourquoi vous verrez peut-être les changements apportés par d’autres utilisateurs lorsque vous utilisez le logiciel.

Le site de démonstration est modifié en direct et n’est pas modéré. À des fins de sécurité, les transferts d’essai sont restreints aux échantillons de données que fournit Artefactual. Les utilisateurs qui désirent mettre à l’essai leurs propres données peuvent télécharger le bac Vagrant (voir ci-dessous) et effectuer des essais localement.

Note

Si vous utilisez le bac à sable, vous pouvez passer à la Tâche #1.

Installation sur une machine virtuelle utilisant Vagrant

Avertissement

Cette machine virtuelle n’est pas destinée à être utilisée en production. Elle s’adresse aux développeurs ou utilisateurs expérimentés désireux d’essayer Archivematica en utilisant Vagrant. Si vous voulez commencer à utiliser Archivematica en production, veuillez vous référer aux autres méthodes d’installation expliquées dans ce manuel.

This guide will set up a new Oracle VirtualBox virtual machine with Archivematica installed on your computer. It works on most operating systems, including MacOS X, Linux, Windows, FreeBSD and others.

Minimum system requirements: 4GB RAM; 10GB disk space.

Installer Vagrant et VirtualBox

  1. Install VirtualBox from https://www.virtualbox.org/ (or use your package manager). VirtualBox 5.2.18 or newer is required.
  2. Install Vagrant from https://www.vagrantup.com/ (or use your package manager). Vagrant 2.1.4 or newer is required.

Spin it up

  1. Using your computer’s command-line interface, create a new directory and open it. The location doesn’t matter, but you’ll need to return to it later - all further command line operations should be run from inside the directory. Also, if you add some folders to it, they will be available under local-transfers.

    mkdir archivematica-vagrant && cd archivematica-vagrant
    
  2. Initialiser le répertoire courant pour qu’il soit dans l’environnement Vagrant.

    vagrant init artefactual/archivematica
    
  3. Exécutez Vagrant (encore une fois, à partir du même répertoire où vous avez enregistré le fichier Vagrant).

    vagrant up
    

Vagrant will download our custom box and boot it in VirtualBox. The download can take anywhere from a few minutes to an hour or more, depending on the speed of your connection, as the box is fairly large (approx 3.4 GB in size).

This will take a while. It depends on your computer, but it could take up to an hour. Your computer may be very slow while Archivematica is being provisioned - be sure to save any work and be prepared to step away from your computer while Archivematica is building.

Once it’s done provisioning, you can log in to your virtual machine:

vagrant ssh

You can now access your Archivematica instance through the web browser:

Tâche #1 – Commencer un transfert standard

A transfer is any set of one or more files that you decide to process as a group. It can come from any storage system to which Archivematica has been connected. To start your first transfer, go to the Archivematica transfer dashboard - the main page of either the Archivematica sandbox or your Archivematica VM. You can also access the transfer page by clicking on the Transfer tab in your Archivematica instance.

The transfer process is made up of a series of microservices, which are in turn made up of jobs.

Note

A microservice is a group of actions that accomplish a specific goal within Archivematica. Verifying that your transfer complies with Archivematica’s transfer requirements is a microservice.

Note

A job is a discrete action within a microservice. Moving the contents of your transfer to a processing directory is a job.

Each microservice can be expanded if you click on the microservice name. This allows you to see every job that makes up the microservice. You can view the command for each job by clicking on the gear icon to the right of each job name which will open a new window that lists the command information. Clicking on Show arguments will list the exact python command that Archivematica uses to run the job.

Les travaux deviennent verts lorsqu’ils ont été exécutés correctement, et rouges dans le cas contraire.

Étapes :

  1. Assurez-vous de sélectionner ‘Standard’ dans la case type de transfert.
  2. Saisissez un nom pour votre transfert (à votre guise).
  3. Cliquez sur naviguer pour examiner le contenu disponible. Assurez-vous de cliquer sur l’icône dossier pour développer les arborescences de répertoires.
  4. Cherchez le répertoire images dans SampleTransfers, et cliquez ensuite sur Ajouter.
  5. Le répertoire sélectionné s’affichera sous la case de sélection.
  6. Cliquez sur le bouton vert Commencer le transfert pour lancer le transfert.
  7. Lorsque vous êtes invité à le faire, prenez les décisions nécessaires. Par contre, ne sélectionnez rien qui interromprait le transfert (c.-à-d. quoi que ce soit qui mentionne « Rejeter »). Pour en savoir plus sur les points de décisions, consultez la documentation de l’onglet de transfert.
  8. When you reach the Identify file format microservice, stop and read the next section.

Examen des formats de fichiers

You do not need to consult the command for every job, but we do recommend taking a look at the output of the Identify file format microservice. One of Archivematica’s most important jobs is to identify file formats and then preserve those files as best as possible.

Étapes :

  1. When you are prompted, select Yes to identify file formats.
  2. Lorsque l’identification du format de fichier est terminée, cliquez sur l’icône engrenage, à droite du nom de travail, pour ouvrir la page du travail.
  3. Sur la page du travail, sous STDOUT, vous verrez de l’information similaire à ce qui suit :
IDCommand UUID: 8cc792b4-362d-4002-8981-a4e808c04b24
File: (9305a71e-5180-4c49-b93e-c934d7a433dc) /var/archivematica/sharedDirectory/currentlyProcessing/demo-test-f706d98d-faa6-450f-92c7-b608f1106f2e/objects/pictures/MARBLES.TGA
fmt/402

Command output: fmt/402
/var/archivematica/sharedDirectory/currentlyProcessing/demo-test-f706d98d-faa6-450f-92c7-b608f1106f2e/objects/pictures/MARBLES.TGA identified as a Truevision TGA Bitmap 2.0

The above tells us that the file MARBLES.TGA was identified as a Truevision TGA Bitmap 2.0. Archivematica uses PRONOM, a registry of technical information maintained by the National Archives of the UK, for file identification and to inform normalization, characterization, and other file-manipulation events. Archivematica identifies a TGA file as fmt/402 (format 402), which is the PRONOM format identifier for a Truvision TGA Bitmap 2.0. There should be a similar STDOUT section for each item in your transfer.

Archivematica will continue processing your transfer in the background. When you reach the Create SIP from Transfer microservice, read the next section.

Création d’un SIP

The final microservice on the Transfer tab is Create SIP from Transfer. The final job, Create SIP(s), allows you to either proceed directly to the Ingest tab or to send the transfer to the backlog. For more information on the backlog, check out the backlog documentation.

Étapes :

  1. Lorsque vous êtes invité à le faire, sélectionnez Créer un seul SIP et continuer le traitement.

Tâche #2 – Création d’AIP et de DIP

The primary function of Archivematica is to produce Archival Information Packages (AIPs) and Dissemination Information Packaes (DIPs) from SIPs. You just created a SIP on the Transfer tab. The Ingest tab is where you run microservices that create the AIP and the DIP.

Étapes :

  1. Cliquez sur l’onglet Acquisition.
  2. Prenez les décisions nécessaires (mais encore une fois, ne sélectionnez rien qui mentionne « Rejeter »). Pour en savoir plus sur les points de décisions présents dans Acquisition, consultez la documentation de l’onglet Acquisition.
  3. Lorsque vous arrivez au point de décision Normaliser, arrêtez et lisez la section suivante.

Normalisation

Ingest, like Transfer, is also made up of a series of microservices. The most significant microservice that takes place during ingest is Normalize. Normalization is the process of converting your digital content into appropriate formats for long-term storage (for an AIP) and access (for a DIP). When you reach the Normalization microservice, you will be prompted to decide how you would like to normalize your content.

Étapes :

  1. Sélectionnez Normaliser aux fins de préservation et d’accès lorsque vous êtes invité à le faire. En sélectionnant cette option, vous dites à Archivematica que vous désirez créer une copie de préservation (AIP) et une copie d’accès (DIP) du contenu de votre SIP.
  2. Lorsque la normalisation est terminée, vous êtes invité à approuver la normalisation. Avant de l’approuver, cliquez sur la petite icône de page, à côté du menu déroulant.
  3. Le Rapport de normalisation s’affichera dans un onglet séparé. La manière de lire cette information est décrire plus loin.
  4. Dans votre onglet principal, cliquez sur l’onglet Planification de la préservation en haut de la page. Lorsque cet onglet est ouvert, lancez une recherche sur « SVG » (ou tout format de fichier que vous souhaitez examiner). Cliquez sur le nom du format de fichier.
  5. Deux onglets devraient maintenant être ouverts : le Rapport de normalisation et la page Planification de la préservation. Retournez au Rapport de normalisation et examinez les deux sections qui suivent.

Examen de la normalisation à des fins de préservation

Le Rapport de normalisation précise si le contenu de votre SIP a fait l’objet d’une normalisation. Cette prise d’écran présente le rapport pour lion.svg, un graphique vectoriel adaptable, avec les colonnes de préservation surlignées.

A row of the Normalization Report with the preservation columns indicated by a red box.

Si vous retournez à l’onglet Planification de la préservation où vous avez effectué la recherche pour trouver SVG, vous constaterez que les fichiers SVG sont considérés comme un format de préservation. Le Rapport de normalisation indique alors :

  • La normalisation de préservation a été tentée
  • La normalisation de préservation n’a pas échoué.
  • L’image était déjà en format de préservation.

Grosso modo, cela signifie que la normalisation de préservation a été lancée, mais qu’Archivematica a constaté que le fichier était déjà sous forme de format de préservation, et n’a donc rien fait.

Examen de la normalisation à des fins d’accès

Cette prise d’écran illustre le rapport lion.svg, avec les colonnes d’accès surlignées.

A row of the Normalization Report with the access columns indicated by a red box.

Pour la normalisation d’accès le rapport indique ce qui suit :

  • La normalisation d’accès a été tentée
  • La normalisation d’accès n’a pas échoué.
  • L’image n’était pas en format d’accès.

Pour examiner ce que cela signifie pour lion.svg, nous devrons aller plus loin dans l’onglet Planification de la préservation.

Étapes :

  1. Retournez à l’onglet Planification de la préservation.
  2. Défilez vers le bas et trouvez la section Normalisation, dans la barre latérale de gauche. Cliquez sur Règles.
  3. Effectuez une recherche « Scalable Vector Graphics » (ou tout autre format de fichier à analyser).

Les résultats donnent les règles d’accès et de normalisation des fichiers SVG. À la colonne Commande, on constate que le format d’accès privilégié pour un SVP est PDF. Archivematica suit ces règles pour créer des copies d’accès, ce qui nous permet de conclure d’après le Rapport de normalisation qu’une copie PDF du fichier SVG a bien été créée pour le DIP. Vous pouvez le confirmer en vérifiant le résultat de la commande du travail Normaliser aux fins d’accès (comme vous l’avez fait précédemment pour le travail Identifier le format de fichier) ou en examinant le DIP après qu’il a été stocké.

Continuez le traitement de votre Acquisition, et arrêtez lorsque vous arrivez aux points de décisions AIP et DIP.

Tâche #3 - Stockage des AIP et des DIP

L’outil Archivematica est excellent pour créer des paquets. Dans un environnement de production, le stockage se fait hors d’Archivematica dans un système de stockage privilégié par l’utilisateur ou l’institution. Mais aux fins de la présente démonstration, nous sauvegarderons notre AIP et notre DIP dans l’unité de stockage interne par défaut d’Archivematica.

Il faut toujours stocker les AIP en premier. Étant donné que les paquets sont plus petits, les options de stockage des DIP sont les premières à être affichées, et il est tentant de les stocker immédiatement. Si quelque chose ne fonctionne pas avec votre AIP, il vous faudrait alors supprimer le DIP des systèmes de stockage et d’accès. En traitant l’AIP en premier, vous pourrez stocker les DIP et y donner accès en sachant que l’AIP est sécurisé.

Étapes :

  1. Process your ingest until the Store AIP and Upload DIP microservices prompt you for a decision point.
  2. Sélectionnez « Stocker l’AIP » dans le menu déroulant Stocker l’AIP.
  3. Dans quelques instants, un autre point de décision vous invitera à sélectionner un lieu de stockage pour votre AIP. Une seule option devrait s’afficher, à savoir « Stocker l’AIP dans le répertoire standard Archivematica ». Sélectionnez cette option.
  4. Lorsque l’AIP a été stocké correctement, vous pouvez maintenant passer au DIP. Comme il n’y a pas de VM Archivematica locale ni de bac à sable connecté à un système d’accès, sélectionnez « Stocker le DIP » sous Télécharger le DIP.
  5. Vous serez invité à sélectionner un lieu de stockage pour votre DIP. Une seule option devrait s’afficher, à savoir «Stocker le DIP dans le répertoire standard Archivematica ». Sélectionnez cette option.

Vos AIP et DIP sont maintenant stockés dans l’unité de stockage interne d’Archivematica. Le déroulement des opérations d’Archivematica est maintenant terminé!

Tâche #4 - Examen des AIP et des DIP

Maintenant que votre AIP et votre DIP sont stockés, vous pouvez les examiner.

Examen de l’AIP

Étapes :

  1. Cliquez sur l’onglet Dossier de stockage des archives. Votre AIP devrait être affiché dans les résultats de recherche, mais s’il n’y figure pas, effectuez une recherche en utilisant le nom que vous lui avez attribué à la Tâche #1.
  2. Selon la version Archivematica que vous utilisez, lorsque vous cliquez sur le nom de l’AIP, la page Détails de l’AIP s’ouvrira ou l’AIP sera téléchargé immédiatement. Si vous vous trouvez sur la page Détails de l’AIP, cliquez sur le bouton « télécharger ».
  3. Once it’s downloaded, open the AIP. You will need to a program capable of opening 7zip files installed on your computer. If required, you can download 7Zip here: https://www.7-zip.org/download.html
  4. Lorsque l’AIP a été extrait, naviguez dans les dossiers jusqu’à ce que vous trouviez le répertoire des objets. Ce répertoire contient les images originales de votre transfert et les copies de préservation. Vous pouvez comparer les formats de fichier du répertoire d’objets avec les règles qui se trouvent dans l’onglet Planification de la préservation.
  5. Consultez les dossiers jusqu’à ce que vous trouviez le fichier METS et ouvrez-le dans un navigateur ou un éditeur de texte. Son nom ressemblera à « METS.7e58760a-e357-4165-9428-26f5bb2ba8ee.xml ».
  6. Trouvez le marqueur <mets:fileSec> dans le METS. Dans le fileSec, vous devriez pouvoir trouver de l’information sur tous les éléments de votre transfert original. Ils se trouvent dans la section marquée <mets:fileGrp USE=”original”>. Lorsque vous défilez vers le bas, vous pouvez voir de l’information complémentaire pour chaque copie de préservation. Il s’agit de la section marquée <mets:fileGrp USE=”preservation”>.

The METS.xml file is very long because it contains all of the information about your files as well as information about the processes and tools that acted on those original files. For more information about the contents and structure of the METS file, check out the METS page in the metadata section.

Examen du DIP

Note

Cette section ne s’applique que si vous utilisez une VM, puisque le bac à sable Archivematica interdit l’accès au Service de stockage.

Étapes :

  1. In order to retrieve the DIP, you need to access the Archivematica Storage Service. Add « :8000 » to the end of your Archivematica VM’s URL (i.e. http://10.10.10.20:8000/).
  2. Dans le Service de stockage, cliquez sur l’onglet Paquets.
  3. Il y a une boîte de recherche à l’extrême droite de la page. Cherchez votre DIP en saisissant le nom que vous lui avez attribué à la Tâche #1.
  4. Deux résultats devraient être affichés : votre AIP et votre DIP, dans la colonne « Type ».
  5. Après avoir déterminé le fichier correspondant à votre DIP, cliquez sur « Télécharger ».
  6. Once it’s downloaded, open the DIP. You will need to a program capable of opening tar files installed on your computer. 7Zip, mentioned above, can open TAR files: https://www.7-zip.org/download.html
  7. Après avoir extrait le DIP, ouvrez le répertoire d’objets, qui contient les copies d’accès créés à partir de vos images originales. Vous pouvez comparer les formats de fichiers du répertoire d’objets avec les règles qui se trouvent dans l’onglet Planification de la préservation.
  8. Le DIP contient également un répertoire de vignettes, soit de petites versions JPG de vos images. Si l’image n’a pu être convertie en format JPG (comme dans le cas des fichiers SVG), une icône générique est alors insérée.

Tâche #5 – Automatisation du déroulement des opérations au moyen d’une configuration

En cliquant sur l’onglet Administration, vous ouvrez l’écran de configurations de traitement d’Archivematica, la façon la plus élémentaire d’automatiser Archivematica. Tous les points de décisions soulevés dans l’essai d’Archivematica, aux étapes 1 à 3, peuvent être automatisés ici. On l’utilise couramment lorsqu’on sait que la même décision sera prise pour un point de décision.

Étapes :

  1. Cliquez sur l’onglet Administration. Vous verrez une seule configuration de traitement appelée « par défaut ».
  2. Examinez les différentes options et apportez les changements nécessaires. Vous reconnaîtrez les options d’après les points de décisions des tâches antérieures.

Exemple : vous désirez automatiser l’algorithme et le niveau de compression, parce que vous désirez toujours utiliser le même outil de compression et le même niveau de compression pour vos paquets. Pour régler les configurations de traitement de la compression :

  1. Cochez la case à côté de Sélectionner l’algorithme de compression.
  2. Dans le menu déroulant de droite, sélectionnez un algorithme de compression - 7z using bzip2 est celui qui est le plus couramment utilisé.
  3. Cochez la case à côté de Sélectionnez le niveau de compression
  4. Dans le menu déroulant de droite, sélectionnez un niveau de compression - 5 - mode de compression normal donne un bon équilibre entre la vitesse et la taille.

Il est recommandé d’effectuer plusieurs essais dans Archivematica avant de paramétrer les configurations de traitement. Lorsque vous connaîtrez mieux Archivematica, vous reconnaîtrez les points de décisions répétitifs, que vous pourrez alors automatiser au moyen de configurations de traitement.

Autres façons de s’initier à Archivematica

Ce tutoriel couvre un déroulement d’opérations élémentaire dans Archivematica. Pour vous renseigner sur la manière de traiter du contenu plus complexe, veuillez consulter le Guide de l’utilisateur.

Retour en haut de page

Archivematica 1.11.2

License

Archivematica documentation by Artefactual Systems Inc. is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.

Creative Commons License