Create WARC-files from Internet Archive snapshots, explained in a Dutch Python Notebook
Welkom!
Dit is een tool om WARC-bestanden te creëren vanuit URL's. In het voorbeeld is een snapshot gebruikt van The Internet Archive (https://archive.org/).
- Open het notebook, bijvoorbeeld in VScode of Jupyter Notebook
- Volg de stappen om de tool te configureren
- Voer het script uit door bovenaan deze pagina te klikken op 'Run All'
- Controleer of het genereren van een WARC-bestand is gelukt, door te bestandslocatie die is ingegeven bij
path
te openen - Bekijk het WARC-bestand via https://replayweb.page/
Bronnen: