Arkade 5 v2.10.0 release 16.05.2023 er testet med skjermdumper under for et Noark 5 dummy-uttrekk for både SIP og AIP arkivpakker.
- SIP (Submission Information Package) er versjonen av bevaringsobjektet som mottas i arkivdepotet som aksesjon.
- AIP (Archival Information Package) er versjonen av bevaringsobjektet som er tilrettelagt for langtidsbevaring i arkivdepotet.
Se også Arkade 5 v2.10.0 mangler i dokumentasjon #167
# info.xml med alle metadata fra SIP og AIP pakking #
Arkade 5 pakking er gjort med at hvert metadata-felt har fått en prefiks som identifiserer seksjon og løpenummer innen seksjon:
- A - Beskrivelse av arkiv: A01-A07, der A03 Overføringstype er faste verdier (valgt "NEW")
- A03 valgbare verdier: NEW, SUPPLEMENT, REPLACEMENT, TEST, VERSION, OTHER
- A - Fra før: A01 Arkivbeskrivelse, A02 Avtalenr
- A - Nytt: A03 Overføringstype, A04 Arkivsystemtype, A05 Prosjektnavn, A06 Pakkenummer, A07 Referansekode)
- A - Alle metadata lagres som mets:altRecordId elementer som attributter,
- A - Unntatt A04 Overføringstype som lagres som mets:metsHdr attributt
- B - Arkivskaper: B01 - B05 (mets:agent)
- C - Overfører: C01 - C05 (mets:agent)
- D - Produsent: D01 - D05 (mets:agent)
- E - Eier: E01 - E05 (mets:agent)
- F - Skaper: F01 - F05 (mets:agent, den som pakker med Arkade)
- G - Mottaker: G01 (mets:agent som er Depot)
- H - System: H01 - H04, der H03 Type er faste verdier Noark3/4/5, Fagsystem, Siard
- I - Uttrekkssystem: I01 - I04, der I03 Type er faste verdier Noark3/4/5, Fagsystem, Siard
- J - Noark felter (som strengt tatt gjelder for alle typer uttrekk!), begge er datoformat
- J01 - Startdato, f. eks. 01.01.2014 (som blir lagret annet datoformat i METS)
- J02 - Sluttdato, f. eks. 01.01.2014 (som blir lagret annet format i METS)
- K - Uttrekksdato: K01, f. eks. 13.03.2019 (som blir lagret annet format i METS)
- L - Merkelapp: L01, f. eks. Radioknapp "Egendefinert" = 1599_013 Documaster DOTS (2014-2018)
B til F: alle mets:agent over har sine note elementer spesifisert i siste note der et fullt sett er "notescontent:Address,Telephone,Email", tilsvarende for System og Uttrekkssystem fullt sett er "notescontent:Version,Type,TypeVersion"
Resulterende <uuid>xml som "info.xml" filer med alle metadata
- Arkade 5 v2.10.0 Noark5 SIP info.xml
- Arkade 5 v2.10.0 Noark5 AIP info.xml
Prefiks i kategoriene A - L over gjør at det er enkelt å finne igjen hvor inntastede metadata i SIP og AIP pakking er blitt lagret i <uuid>.xml "info.xml" som også er lagret inne i DIAS SIP og AIP pakkene i DIAS rot dias-mets.xml.
Unntakene er følgende metadata elementer
- A03 Overføringstype => mets:metsHdr attributt RECORDSTATUS="NEW" i vårt eksempel
- J01 Startdato og J02 Sluttdato => mets:altRecordId attributter STARTDATE og ENDDATE
- K01 Uttrekksdato => mets:metsHdr CREATEDATE="2019-03-13T00:00:00" i vårt eksempel
- L01 Merkelapp => mets:mets attributt LABEL
- SIP og AIP unike uuid => mets:mets attributt OBJID
- SIP vs SIP => mets:mets attributt TYPE="SIP" vs "AIP"
Merknader:
- A04 Prosjektnavn ikke blir med i en pakke hvis ikke A03 Overføringstype er valgt med en verdi (bug?)!
- A04... info.xml har ikke med attributtet, mens dias-mets.xml har met attributtet med tom tekstverdi
- H04 Typeversjon (System) blir kun med hvis H03 Type (System) = Noark5
- I04 Typeversjon ("Uttrekks"-System) blir kun med hvis I03 Type ("Uttrekks"-System) = Noark5
- K01 ... bruken av CREATEDATE som Uttrekkdato er en tøyning av METS-elementet som egentlig er ment som skapelsesdato for METS-filen selv (dokumenter hvis jeg tar feil her, uansett er det en viktig dato for vår bevaringsstrategi)
# Skjermdumper av resulterende SIP og AIP #
Merk at vi pakker ut SIP og AIP .tar filer i unzipped folder, altså analyserer DIAS IP pakkestrukturer med mapper og filer
# AIP vs SIP i METS info.xml #
type = SIP vs AIP
<uuid>.tar og dias-mets.xml har ulik timestamp, størrelse og sjekksum i SIP vs AIP.
# Noark 5 SIP #
En SIP pakking tar ikke med Arkade 5 testrapporter, her Noark 5-testene. I stedet lagres disse i egen mappe parallelt med <uuid>.tar "uttrekksfil" og <uuid>.xml "info.xml" parallelt med at Arkade 5 pakker SIP-pakken.
Utpakket <uuid>.tar DIAS SIP pakkestruktur (SIP og AIP hovedmappe ser like ut)
SIP \content\ har et Noark 5 dummy-uttrekk (SIP og AIP har pakket samme uttrekk)
SIP \descriptive_metadata\ er tom
SIP \administrative_metadata\ har
- Kopi av arkivuttrekk.xml fra Noark 5-uttrekket og tilhørende addml.xsd skjema
- dias-premis.xml er en liten fil med uuid og at format er tar (med tilhørende .xsd skjema)
- csv-filene er PRONOM PID filformatanalyse som blir med når SIP pakking har avkrysset "[v] Inkluder formatinformasjon for dokumentfiler". Der er både en statistikkfil med teller antall formater og om de er arkivformat, samt en komplett csv fil for alle filer i \content\dokumenter mappen (det må dokumenteres hvilke andre mappenavn her som støttes utover \dokumenter)
- Alle filer her finnes også i et AIP-uttrekk med inkludert PRONOM PID filformatanalyse
# Noark 5 AIP #
En AIP pakke tar kun med med <uuid>.tar "uttrekksfil" og <uuid>.xml "info.xml" i hovedmappe for AIP-pakken.
Utpakket <uuid>.tar DIAS AIP pakkestruktur (SIP og AIP hovedmappe ser like ut)
AIP \content\ har et Noark 5 dummy-uttrekk (SIP og AIP har pakket samme uttrekk)
AIP \descriptive_metadata\ er IKKE tom (innholdet i disse ser likevel "uferdig" ut, beta?)
AIP \administrative_metadata\ har
- Kopi av arkivuttrekk.xml fra Noark 5-uttrekket og tilhørende addml.xsd skjema
- dias-premis.xml er en liten fil med uuid og at format er tar (med tilhørende .xsd skjema)
- csv-filene er PRONOM PID filformatanalyse som blir med når SIP pakking har avkrysset "[v] Inkluder formatinformasjon for dokumentfiler". Der er både en statistikkfil med teller antall formater og om de er arkivformat, samt en komplett csv fil for alle filer i \content\dokumenter mappen (det må dokumenteres hvilke andre mappenavn her som støttes utover \dokumenter)
- Alle filer over finnes også i et SIP-uttrekk med inkludert PRONOM PID filformatanalyse
- \administrative_metadata\repository_operations\ finnes kun i en AIP-pakke (ikke i SIP-pakke)
administrative_metadata\repository_operations\ har:
- arkade-log.xml er en full punktvis logg over testene utført
Her Noark 5-testene N5.01 til N5.64
Merk at denne filen burde vært lagret i ekstern mappe SIP testrapporter!
- administrative_metadata\repository_operations\testrapporter\ mappe med tester
administrative_metadata\repository_operations\testrapporter\
- testrapport i filformaten html, json, pdf/a og xml
# Skjermdumper pakking av Noark 5-uttrekk #
Merk at vi pakker fra samme uttrekk/test både SIP først og så AIP etterpå, derav får testene våre samme IP uuid for begge pakkene SIP og AIP!