Vi bevarer nettsider i WARC-format for å få med metadata om innhøstingen. Både i ukomprimert og i gzip-komprimert tilstand.
Vi har også akseptert WACZ (https://github.com/webrecorder/wacz-format) som legger til data for raskere innsyn i de høstede nettstedene.
De siste årene har vi valgt å bruke verktøy fra https://webrecorder.net for innhøstingen. Chrome-tillegget "Archiveweb.page" er enkelt å bruke for de aller fleste og høster det som vises på skjermen.
Ellers har vi primært brukt den gamle browsertrix docker-installasjonen for automatisert høsting av større nettsteder. Det er nyttig å sette opp høsting av et helt nettsted uten at en må klikke seg gjennom alle sidene.
Vi har også brukt verktøyet webrecorder desktop for å høste fra sosiale medier - og har positive erfaringer fra innhøsting av Facebook, Twitter og Instagram ved hjelp av Webrecorder Desktop.
Både Webrecorder Desktop og Chrome-tillegget kan hente frem og vise høstede nettsider på en enkel måte.
En liten utfordring med innhøsting er at flere nettsteder krever innlogging. Dette medfører at brukeropplysninger om personen som er innlogget ofte blir med i arkivuttrekket.