menu

arrow_back Har noen en best practice mht avlevering av nettsider - eksempelvis en gammel versjon av kommunens nettsider?

av
(110 poeng) 1 6
i Elektroniske arkiver
338 visninger
0 stemmer

Om man ikke har definert sin fremgangsmåte som best practice, er jeg likevel interessert i innspill til metodikk, verktøy, krav til tilhørende dokumentasjon, hva som tas vare på mv.

1 svar

Akseptert svar
1 stemme

Vi bevarer nettsider i WARC-format for å få med metadata om innhøstingen. Både i ukomprimert og i gzip-komprimert tilstand.
Vi har også akseptert WACZ (https://github.com/webrecorder/wacz-format) som legger til data for raskere innsyn i de høstede nettstedene.

De siste årene har vi valgt å bruke verktøy fra https://webrecorder.net for innhøstingen. Chrome-tillegget "Archiveweb.page" er enkelt å bruke for de aller fleste og høster det som vises på skjermen.
Ellers har vi primært brukt den gamle browsertrix docker-installasjonen for automatisert høsting av større nettsteder. Det er nyttig å sette opp høsting av et helt nettsted uten at en må klikke seg gjennom alle sidene.
Vi har også brukt verktøyet webrecorder desktop for å høste fra sosiale medier - og har positive erfaringer fra innhøsting av Facebook, Twitter og Instagram ved hjelp av Webrecorder Desktop.

Både Webrecorder Desktop og Chrome-tillegget kan hente frem og vise høstede nettsider på en enkel måte.

En liten utfordring med innhøsting er at flere nettsteder krever innlogging. Dette medfører at brukeropplysninger om personen som er innlogget ofte blir med i arkivuttrekket.

av
(169 poeng) 1 1 6

Velkommen!

Søk etter svar, still spørsmål og bidra med kunnskap sammen med norges felleskap på felter som arkiv, konservering og formidling. Alle er velkomne som medlemmer! Her er terskelen for å spørre veldig lav.


Kunngjøringer :

Artikkelmodulen vil snart bli tilgjengelig!