menu

arrow_back Hvordan og med hvilket verktøy migrere xml-filer/uttrekk til database?

av
(423 poeng) 1 3 11
i Elektroniske arkiver
228 visninger
0 stemmer

I depot håndterer vi ofte xml-filer av ulik opprinnelse
- Gamle ADDML 7.3-uttrekk der hver tabell i uttrekket er en xml-fil med tilhørende metadata i ADDML-filen
- SIARD-uttrekk som produserer en xml-fil per tabell, i tillegg til LOBs for Binære (BLOB) og Karakterbasert (CLOB) filer
- Andre xml-filer, ofte som hjelpefiler i produksjonslinjen

Hvordan kan vi ta en generell XML-fil og få lastet den opp til en database?
- Hvilke verktøy støtter en slik migrering av data?
- Hvordan gjøres dette?
- Ønsker å fritt kunne velge xml elementer og derunder atributter opp til tabell(er) i databasen

Eksempel:
- Vi har et SIARD-uttrekk vi har pakket ut med passordbeskyttede filer
- table8.xml har både et felt med unik referanse til fil og felt med atributt peker til LOB (file="rec1.bin")
- table 11.xml har passordet til nevnte fil, i tillegg til også en unik referanse til filen
- Behov for et verktøy som kan migrere til 2 tabeller i en database med innholdet over
- Så kan vi lage en SQL for å lage en kobling mellom LOB filnavn og passord og eksportere en liste med filnavn og passord pr. rad i listen

1 svar

Akseptert svar
1 stemme
 
Akseptert svar

Vi benytter er XML-databasen BaseX og xquery-spørringer for å hente ut rapporter. Dette gjør vi både med SIARD og Noark-uttrekk som vi mottar - så lenge det ikke er brukt alt for mange xml-schema i datasettet. Jeg antar at andre XML-databaser også kan fungere fint.

Noen eksempler på bruksområder:

  • Anonymisering av datasett
  • Fjerne skjermede data fra Noark-uttrekk
  • Hente unike data fra et bestemt felt i et SIARD-uttrekk
  • Sammenstille data i SIARD-uttrekk

Når vi jobber med SIARD-filer bruker vi metadata.xml-filen aktivt, slik at spørringene forholder seg til de opprinnelige tabell- og feltnavnene. Tabell- og kolonnenummer som etableres ved migrering til SIARD-formatet har vi opplevd som ustabile. Dette kan være på grunn av at det blir brukt forskjellige verktøy for å produsere SIARD-uttrekkene, men også fordi databaser fra samme fagsystem kan ha variasjoner.

av
(169 poeng) 1 1 6
akseptert av

1 kommentar

0
Kan BaseX definere dynamisk koblingen mellom tabell- og feltnavn fra SIARD metadata.xml mot xquery-spørringer?

Velkommen!

Søk etter svar, still spørsmål og bidra med kunnskap sammen med norges felleskap på felter som arkiv, konservering og formidling. Alle er velkomne som medlemmer! Her er terskelen for å spørre veldig lav.


Kunngjøringer :

Artikkelmodulen vil snart bli tilgjengelig!