Nis 2025 – Haz 2025
GemmaTR
GemmaTR, Türkçe sohbet botu kaynaklarının eksikliğini gidermek için Google Gemma modelini Unsloth ve LoRA ile Google Colab üzerinde ince ayarladığım bir Türkçe LLM projesidir. 400.000 Türkçe Wikipedia girdisi ve hukuk, eğitim, tarım odaklı 50.000 soru-cevap çifti içeren veri seti oluşturdum, dört farklı model geliştirdim ve modelleri Hugging Face üzerinden topluluğun erişimine sundum.
Genel Bakış
GemmaTR, Türkçe sohbet botu kaynaklarının eksikliğini gidermek için Google Gemma modelini Unsloth ve LoRA ile Google Colab üzerinde ince ayarladığım bir Türkçe LLM projesidir. 400.000 Türkçe Wikipedia girdisi ve hukuk, eğitim, tarım odaklı 50.000 soru-cevap çifti içeren veri seti oluşturdum, dört farklı model geliştirdim ve modelleri Hugging Face üzerinden topluluğun erişimine sundum.
Problem
Türkçe kullanıcılar, özellikle hukuk, eğitim ve tarım gibi alan odaklı soru-cevap çalışmaları için İngilizceye kıyasla daha az açık ve özelleştirilmiş LLM kaynağına sahip.
Teknik Yaklaşım
Büyük bir Türkçe veri seti hazırladım, Google Gemma modelini Unsloth ve LoRA ile ince ayarladım ve Google Colab üzerinde 40 saatlik eğitim sürecinde dört model varyantı geliştirdim.
Sonuç
GemmaTR, Türkçe LLM ince ayar çalışmasını Hugging Face üzerinden görünür hale getirdi ve Türkçe NLP için daha güçlü bir açık model sinyali oluşturdu.