Skip to content

wilfordaf/DataAnalyst-Test

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 
 
 

Repository files navigation

Junior Data Analyst Test Task

Задание: Проанализировать трейдинговую активность наших юзеров

Комментарий: Финтех компания разрабатывает и поддерживает свою собственную трейдинговую платформу. Данные trading_data_copy.csv в приложении.

Логику ответа и анализируемые данные можно определить самостоятельно, но хотелось бы получить ответы на следующие вопросы:

  1. Какое торговое поведение свойственно юзерам по регионам и платформам? В чем сходства и различия?
  2. Исходя из общих поведенческих паттернов, на какие сегменты можно разбить юзеров?
  3. Проанализировать данные, написать выводы и дать ответ на вопрос Топ-менеджменту “Как прошли последние 3 месяца деятельности компании и в частности какие результаты за Июнь?”.

Результаты по вопросам:

  1. Сходства:

    • Во многих регионах и платформах средний заработок пользователя и общий результат по всем транзакция отрицательный, кроме платформы Web-Mobile - на ней по всем регионам наблюдается прибыль.
    • Самой непопулярной платформой во всех регионах является Mobile Web (минимальное количество пользователей также принадлежит этой платформе в Non-Reg Europe с показателем 1 пользователь)
    • В большинстве регионов наиболее популярной платформой является Web (минимальное количество пользователей также принадлежит этой платформе в America (LATAM) с показателем 38306 пользователей)
    • В большинстве регионов платформа iOS является самой убыточной в пересчёте на пользователя.

    Различия:

    • Регион Africa по распределению пользователей довольно сильно отличается от остальных: самая популярная платформа Android, самая убыточная на пользователя - Mobile Web.
    • Заметна значительная разница между общим количеством пользователей в регионах. Так, в China всего 223 уникальных аккаунта, в то время, как, к примеру, в Africa их ~5000, хотя техническое развитие и общее количество населения этих регионов несопоставимы.
  2. В своей работе я реализовал 4 базовых паттерна поведения на основе 2 критериев: среднее количество торговых операций в день и средний доход от операции по сравнению со средним в регионе и на платформе пользователя. Семантическое название классов отвечает его контенту. Получили, что пользователей, количество ставок больше среднего по региону и платформе, но при этом прибыль меньше средней - нет. Самый распространённый класс - пассивный с доходом, таких пользователей около ~75%. К слову люди, относящиеся к этому классу, единственные, кто в среднем имеют прибыль. Прибыль таких пользователей окупается проигрышем пассивных пользователей с убытком, таких ~25%, общая сумма их проигрыша превышает доход всех остальных. Выборка класса активных пользователей с доходом выше среднего по платформе и региону слишком мала, выводы по ней будут нерепрезентативны.

  3. Полученная таблица является не совсем репрезентативной, ведь доступные данные окачиваются на дате 10-06-22, таким образом дать объективный анализ последнего месяца - Июня - проблематично. Если попробовать экстраполировать параметры, то можно заметить отрицательную динамику в количестве пользователей (~1000 за 10 дней при норме ~10000). В случае pnl_sum нельзя дать однозначного прогноза, однако можно предположить, что он несколько стабилизируется, т.к. новичков регистрируется значительно меньше, чем в прошлых 2 месяцах. Я думаю, что это связано с сезоном отпусков, в среднем человек не хочет проводить свободное время за торговлей. Если сравнивать Апрель и Май, то можно увидеть положительную динамику в количестве зарегистрировавшихся пользователей (+9,4%), при этом сумма сильно снизилась. Возможно, это связано с тем, что прибыло много неопытных пользователей, благодаря рекламной кампании.

About

Test task for Junior Data Analyst position

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published