Скрипт позволяет выкачать самые популярные репозитории с гитхаба
git clone https://github.com/Omrigan/github-repo-downloader
cd github-repo-downloader
pip install -r requirements.txt
python download.py --repos_number 1
Команда python download.py --repos_number 100
позволяет выкачать
первые 100 самых популярных репозиториев с кодом на питоне из гитхаба.
Аргуемент --repos_number
можно не указывать, тогда репозитории будут
выкачиваться в вечном цикле.
Выполнение программы можно прервать в любой момент. В таком случае,
рекомендуется выполнить команду python download.py --clear
.
Команда удалит те репозитории, которые не получилось выкачать до конца.
Скрипт позволяет докачивать данные после прерывания.
Этот скрипт использует библиотеку GitPython
. Ее удобно использовать,
чтобы продолжить изучение репозиториев. Например, можно извлечть ветку коммитов,
и рассматривать ее как временной ряд.