Skip to content
This repository has been archived by the owner on Apr 27, 2019. It is now read-only.
/ archiver Public archive

Nástroj pro archivaci webových stránek na Wayback Machine

Notifications You must be signed in to change notification settings

UbuntuCZ/archiver

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

9 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

archiver

Link crawler pro archivování webů do Wayback Machine.

Fáze 1

Získání URL adres všech stránek projektu Ubuntu.cz.

mvn test
mvn compile exec:java

Pokud chcete získat adresy z vlastních stránek, předejte jejich seznam pomocí -Dexec.args="...".

mvn compile exec:java -Dexec.args="https://example.com/ https://www.example.com/ https://foo.example.com/"

Fáze 2

Nahrání obsahu stránek do archivu Wayback Machine.

for file in ./out/*.txt; do
    bash scripts/archive-to-waybackmachine.sh "$file"
done