Skip to content

Teknofest 2024 Türkçe Doğal Dil İşleme Yarışması Serbest Kategoride birincilik elde eden projemizin reposudur.

License

Notifications You must be signed in to change notification settings

Renicames/MindLaw

Repository files navigation

MindLaw - Türk Hukuku Üzerine Eğitilmiş T5 Tabanlı Chatbot

MindLaw, T5 modelinin Renicames tarafından geliştirilmiş 14,854 veriden oluşan bir veri setiyle eğitilerek hazırlanmış bir Yapay Zeka Danışmanlık Hizmeti (ChatBot) projesidir. Bu proje, kullanıcıların Türk hukuku ile ilgili sorularına doğru ve hızlı yanıtlar sunmayı amaçlamaktadır.

Bu Projeye Katkıda Bulunma

Projemize katkıda bulunmak istiyorsanız, lütfen CONTRIBUTING dosyasına göz atın.

Projenin Amacı ve Motivasyonu

MindLaw, Türk hukuk sistemine dair doğru ve hızlı bilgiye erişim sağlamak amacıyla geliştirilmiştir. Türkiye’nin çeşitli hukuk kaynaklarından derlenen verilerle oluşturulan bu proje, kullanıcıların hukuki sorularına etkin çözümler sunmayı hedeflemektedir. Projede kullanılan veri seti, Renicames tarafından ülkemizde ilk kez açık kaynak olarak paylaşılan, Türk hukuku üzerine özel olarak hazırlanmış bir soru-cevap veri setidir. Bu veri seti, Türk Anayasası ve diğer yasal belgelerden derlenmiş olup, Türkiye'de hukuk alanında yapay zeka kullanımı için önemli bir adım teşkil etmektedir.

Proje Arayüzü

image

Veri Seti Geliştirme Süreci

Veri setimizin geliştirilme süreci aşağıdaki adımları içermektedir:

  1. Araştırma: Türk Anayasası, çeşitli hukuk siteleri ve diğer yasal belgeler kapsamlı bir şekilde incelenmiştir.
  2. Veri Toplama: Resmi kaynaklardan hukuki veriler titizlikle toplanmıştır.
  3. Veri Temizleme: Toplanan veriler, tekrar eden bilgilerden arındırılarak yapılandırılmıştır.
  4. Veri Seti Oluşturma: Temizlenmiş veriler, modelin eğitimi için kullanılmak üzere JSON formatında bir veri setine dönüştürülmüştür. Veri setinde toplam 14,854 soru-cevap çifti bulunmaktadır.

Veri Setine erişmek için buraya tıklayabilirsiniz.

Model Detayları

Model Şeması

Model Şeması

Model Bilgisi

Projede, T5 Base modeli kullanılmıştır ve bu model, hukuk veri seti ile eğitilerek özelleştirilmiştir.

Performans Değerlendirmesi

Modelimizin performansı ROUGE (Recall-Oriented Understudy for Gisting Evaluation) metrikleri ile değerlendirilmiştir. Aşağıdaki görselde, T5 Base modelinin ROUGE-1, ROUGE-2 ve ROUGE-L değerleri gösterilmektedir:

ROUGE Değerleri

T5 Base modelinin parametre optimizasyonu sonuçları ise aşağıda verilmiştir:

Parametre Optimizasyonu

Kullanım

Projeyi kendi bilgisayarınızda çalıştırmak için aşağıdaki adımları izleyin:

  1. Bu projeyi klonlayın:

    git clone https://github.com/Renicames/MindLaw.git
  2. Gerekli bağımlılıkları yükleyin:

    cd Mindlaw
    pip install -r requirements.txt
  3. Chatbot'u başlatın:

    cd WebSite
    python mindlaw.py

Youtube Linki

Projemizin tanıtım videosunu izlemek için tıklayın.

Lisans

Bu proje Apache 2.0 Lisansı ile lisanslanmıştır. Detaylar için LICENSE dosyasına bakabilirsiniz.


About

Teknofest 2024 Türkçe Doğal Dil İşleme Yarışması Serbest Kategoride birincilik elde eden projemizin reposudur.

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published