menu

Arkade 5 v2.10.0 oversikt alle metadata input og posisjon i METS

Arkade 5 v2.10.0 oversikt alle metadata input og posisjon i METS

av
(423 poeng) 1 3 11
publisert i Veiledere Mai 19, 2023
redigert Mai 19, 2023 av

Arkade 5 v2.10.0 release 16.05.2023 er testet med skjermdumper under for et Noark 5 dummy-uttrekk for både SIP og AIP arkivpakker.

  • SIP (Submission Information Package) er versjonen av bevaringsobjektet som mottas i arkivdepotet som aksesjon.
  • AIP (Archival Information Package) er versjonen av bevaringsobjektet som er tilrettelagt for langtidsbevaring i arkivdepotet.

Se også Arkade 5 v2.10.0 mangler i dokumentasjon #167

# info.xml med alle metadata fra SIP og AIP pakking #

Arkade 5 pakking er gjort med at hvert metadata-felt har fått en prefiks som identifiserer seksjon og løpenummer innen seksjon:
 - A - Beskrivelse av arkiv: A01-A07, der A03 Overføringstype er faste verdier (valgt "NEW")
 - A03 valgbare verdier: NEW, SUPPLEMENT, REPLACEMENT, TEST, VERSION, OTHER
 - A - Fra før: A01 Arkivbeskrivelse, A02 Avtalenr
 - A - Nytt: A03 Overføringstype, A04 Arkivsystemtype, A05 Prosjektnavn, A06 Pakkenummer, A07 Referansekode)
 - A - Alle metadata lagres som mets:altRecordId elementer som attributter,
 - A - Unntatt A04 Overføringstype som lagres som mets:metsHdr attributt

 - B - Arkivskaper: B01 - B05 (mets:agent)
 - C - Overfører: C01 - C05 (mets:agent)
 - D - Produsent: D01 - D05 (mets:agent)
 - E - Eier: E01 - E05 (mets:agent)
 - F - Skaper: F01 - F05 (mets:agent, den som pakker med Arkade)
 - G - Mottaker: G01 (mets:agent som er Depot)
 - H - System: H01 - H04, der H03 Type er faste verdier Noark3/4/5, Fagsystem, Siard
 - I - Uttrekkssystem: I01 - I04, der I03 Type er faste verdier Noark3/4/5, Fagsystem, Siard
 - J - Noark felter (som strengt tatt gjelder for alle typer uttrekk!), begge er datoformat
 - J01 - Startdato, f. eks. 01.01.2014 (som blir lagret annet datoformat i METS)
 - J02 - Sluttdato, f. eks. 01.01.2014 (som blir lagret annet format i METS)
 - K - Uttrekksdato: K01, f. eks. 13.03.2019 (som blir lagret annet format i METS)
 - L - Merkelapp: L01, f. eks. Radioknapp "Egendefinert" = 1599_013 Documaster DOTS (2014-2018)

B til F: alle mets:agent over har sine note elementer spesifisert i siste note der et fullt sett er "notescontent:Address,Telephone,Email", tilsvarende for System og Uttrekkssystem fullt sett er "notescontent:Version,Type,TypeVersion"

Resulterende <uuid>xml som "info.xml" filer med alle metadata
 - Arkade 5 v2.10.0 Noark5 SIP info.xml
 - Arkade 5 v2.10.0 Noark5 AIP info.xml

Prefiks i kategoriene A - L over gjør at det er enkelt å finne igjen hvor inntastede metadata i SIP og AIP pakking er blitt lagret i <uuid>.xml "info.xml" som også er lagret inne i DIAS SIP og AIP pakkene i DIAS rot dias-mets.xml.

Unntakene er følgende metadata elementer
 - A03 Overføringstype => mets:metsHdr attributt RECORDSTATUS="NEW" i vårt eksempel
 - J01 Startdato og J02 Sluttdato => mets:altRecordId attributter STARTDATE og ENDDATE
 - K01 Uttrekksdato => mets:metsHdr CREATEDATE="2019-03-13T00:00:00" i vårt eksempel
 - L01 Merkelapp => mets:mets attributt LABEL
 - SIP og AIP unike uuid => mets:mets attributt OBJID
 - SIP vs SIP => mets:mets attributt TYPE="SIP" vs "AIP"

Merknader:
 - A04 Prosjektnavn ikke blir med i en pakke hvis ikke A03 Overføringstype er valgt med en verdi (bug?)!
 - A04... info.xml har ikke med attributtet, mens dias-mets.xml har met attributtet med tom tekstverdi
 - H04 Typeversjon (System) blir kun med hvis H03 Type (System) = Noark5

 - I04 Typeversjon ("Uttrekks"-System) blir kun med hvis I03 Type ("Uttrekks"-System) = Noark5
 - K01 ... bruken av CREATEDATE som Uttrekkdato er en tøyning av METS-elementet som egentlig er ment som skapelsesdato for METS-filen selv (dokumenter hvis jeg tar feil her, uansett er det en viktig dato for vår bevaringsstrategi)

# Skjermdumper av resulterende SIP og AIP #

Merk at vi pakker ut SIP og AIP .tar filer i unzipped folder, altså analyserer DIAS IP pakkestrukturer med mapper og filer

# AIP vs SIP i METS info.xml #

type = SIP vs AIP

SIP vs AIP 1

<uuid>.tar og dias-mets.xml har ulik timestamp, størrelse og sjekksum i SIP vs AIP.

SIP vs AIP 2

# Noark 5 SIP #

SIP-01

En SIP pakking tar ikke med Arkade 5 testrapporter, her Noark 5-testene. I stedet lagres disse i egen mappe parallelt med <uuid>.tar "uttrekksfil" og <uuid>.xml "info.xml" parallelt med at Arkade 5 pakker SIP-pakken.

SIP-02

Utpakket <uuid>.tar DIAS SIP pakkestruktur (SIP og AIP hovedmappe ser like ut)

SIP-03

SIP \content\ har et Noark 5 dummy-uttrekk (SIP og AIP har pakket samme uttrekk)

SIP-04

SIP \descriptive_metadata\ er tom

SIP-05

SIP \administrative_metadata\ har

 - Kopi av arkivuttrekk.xml fra Noark 5-uttrekket og tilhørende addml.xsd skjema
 - dias-premis.xml er en liten fil med uuid og at format er tar (med tilhørende .xsd skjema)
 - csv-filene er PRONOM PID filformatanalyse som blir med når SIP pakking har avkrysset "[v] Inkluder formatinformasjon for dokumentfiler". Der er både en statistikkfil med teller antall formater og om de er arkivformat, samt en komplett csv fil for alle filer i \content\dokumenter mappen (det må dokumenteres hvilke andre mappenavn her som støttes utover \dokumenter)
 - Alle filer her finnes også i et AIP-uttrekk med inkludert PRONOM PID filformatanalyse

SIP-06

# Noark 5 AIP #

En AIP pakke tar kun med med <uuid>.tar "uttrekksfil" og <uuid>.xml "info.xml" i hovedmappe for AIP-pakken.

AIP-01

Utpakket <uuid>.tar DIAS AIP pakkestruktur (SIP og AIP hovedmappe ser like ut)

AIP-02

AIP \content\ har et Noark 5 dummy-uttrekk (SIP og AIP har pakket samme uttrekk)

AIP-03

AIP \descriptive_metadata\ er IKKE tom (innholdet i disse ser likevel "uferdig" ut, beta?)

AIP-04

AIP \administrative_metadata\ har

 - Kopi av arkivuttrekk.xml fra Noark 5-uttrekket og tilhørende addml.xsd skjema
 - dias-premis.xml er en liten fil med uuid og at format er tar (med tilhørende .xsd skjema)
 - csv-filene er PRONOM PID filformatanalyse som blir med når SIP pakking har avkrysset "[v] Inkluder formatinformasjon for dokumentfiler". Der er både en statistikkfil med teller antall formater og om de er arkivformat, samt en komplett csv fil for alle filer i \content\dokumenter mappen (det må dokumenteres hvilke andre mappenavn her som støttes utover \dokumenter)
 - Alle filer over finnes også i et SIP-uttrekk med inkludert PRONOM PID filformatanalyse
 - \administrative_metadata\repository_operations\ finnes kun i en AIP-pakke (ikke i SIP-pakke)

AIP-05

administrative_metadata\repository_operations\ har:
 - arkade-log.xml er en full punktvis logg over testene utført
   Her Noark 5-testene N5.01 til N5.64
   Merk at denne filen burde vært lagret i ekstern mappe SIP testrapporter!
 - administrative_metadata\repository_operations\testrapporter\ mappe med tester

AIP-06

administrative_metadata\repository_operations\testrapporter\
 - testrapport i filformaten html, json, pdf/a og xml

AIP-07

# Skjermdumper pakking av Noark 5-uttrekk #

Merk at vi pakker fra samme uttrekk/test både SIP først og så AIP etterpå, derav får testene våre samme IP uuid for begge pakkene SIP og AIP!

Arkade 5 setup

Arkade 5-01

Arkade 5-02

Arkade 5-03

Arkade 5-04

Arkade 5-06

Arkade 5-07

Arkade 5-08

Arkade 5-09

Arkade 5-10

Arkade 5-11

Arkade 5-12

Arkade 5-13

Arkade 5-14

Arkade 5-15

Velkommen!

Søk etter svar, still spørsmål og bidra med kunnskap sammen med norges felleskap på felter som arkiv, konservering og formidling. Alle er velkomne som medlemmer! Her er terskelen for å spørre veldig lav.


Kunngjøringer :

Artikkelmodulen vil snart bli tilgjengelig!