-
Kategori yönetiminin saatlik olarak belirli dosya formatında istediği veriler
- Herbir ürün kategorisi için farklı kullanıcılar tarafından en fazla görüntülenen 10 ürün.
- Herbir ürün kategorisi için farklı kullanıcılar tarafından en fazla satın alınan 10 ürün.
- Her bir ürün kategorisi için (satın alma / görüntülenme) sayısı
-
Pazarlama departmanı için gerçek zamanlı analizler
- Son 5 dakika içinde ürün görüntüleyen kullanıcılar
- Son 5 dakika içinde ürün görüntülenen kategoriler
- Son 5 dakika içinde ürün görüntülenen platformlar
-
Kullanıcılara ürün tavsiye etmek için id numarasi verilen kullanıcının incelediği 5 ürünü dönen bir API
Teknoloji | Kullanımı |
---|---|
Linux | Sistem Linux üzerinde kurulmuştur. Ubuntu dağıtımı |
Kafka | Sistemler için ortak veri platformu |
PostgreSQL | Temizlenen verilerin yazıldığı DB. |
Docker | Kafka ve PostgreSQL |
Python3.8 | Sistemin yazıldığı dil |
Spark | Kafka' dan veriyi okuyup, temizleyip DB' ye yazmak için |
Flask | API yazabilmek için |
SQLAlchemy | API için veritabanı sorgularını daha kolay yapmak için kullanıldı |
Pandas | CSV dosyalarını oluşturmak için |
Reponun root dizinindeki config.yml dosyasında
Kafka
,PostgreSQL
bağlantı bilgilerini girebilirsiniz
Kurulum ve daha fazla bilgi için modüllere tıklayınız. Modülleri kendi dizinlerinden çalıştırın.
Modül | Yaptığı iş |
---|---|
data_produce | Gönderilen data dosyalarını Kafka' ya yazar. |
data_consumer | Kafka' dan veri okur ve PostgreSQL' e yazar |
category_management | DB' den verileri okuyarak kategori yönetimi için istenen csv dosyalarını elde eder. |
marketing_department | Pazarlama departmanının talep ettiği gerçek zamanlı analizler gerçekleştirir |
api | Kullanıcılara ürün tavsiye etmek için belirli kullanıcının incelediği 5 ürünü döner |
Bu işlemleri saatlik olarak gerçekleştirmek için AirFlow kullanılabilir.
Yazdığım sorgular ile ilgili bilgi almak için