Skip to content

sanederchik/interns-test-march-21

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

7 Commits
 
 
 
 

Repository files navigation

interns-test-march-21

Задачи

  1. Есть сайт https://yandex.ru/covid19/stat. Нужно написать парсер, который бы получал данные о заражениях, смертях и тестах в динамике по всем странам на графике и формировал бы CSV файл на каждый момент начала запуска парсера.

image

  1. Нужно написать SQL-выражение, которое бы складывало полученные из п.1 данные в следующую таблицу:

image

  • Название таблицы: ydata_main_data

  • Первичный ключ: составной, на основе полей PK

  • Индексы: version_dt, обычный

  1. Из полученной таблицы ydata_main_data нужно составить таблицу ydata_detail_main_data, дедублицировав записи на основе поля version_dt (брать самое последнее). Нужно показать 2 способа, как это сделать.

  2. Основывясь на данных таблицы ydata_detail_main_data составить SQL-запрос, который позволит посчитать следующие метрики на каждую из дат data_date:

  • Те страны и значение метрики "Смерти / Ср.Заражения за 14 дат назад", где показатель выше X% (выбрать самостоятельно), отсортировав страны по убыванию данной метрики.

  • Те страны и значение метрики "Заражения / Тесты", отфильтровав только те страны, где показатель метрики выше X% (выбрать самостоятельно) и ТОП-5 самых маленьких значений "Смерти / Ср. Заражения".

    Полученный датасет отсортировать по убыванию метрики "Заражения / Тесты".

  1. (бонус). Запустить REST-API на Flask, которон бы позволило получать данные из ydata_detail_main_data, вводя в query params параметры: country - название страны, по которой нужны данные, data_date - дата, на которую нужны данные.

  2. Весь код положить в форк данного проекта у себя на странице.

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published