Ana içeriğe atla

“Başarılı Bir Türkçe Büyük Dil Modelini Sıfırdan Eğitmek – Ne Kadar Metin Verisine İhtiyacımız Var?”

Bilişim Dergisi

Tarih:  Date -

📌 Bilişim Dergisi 2025 / Sayı 199’da Yayında

Türkçe dilinde büyük dil modeli (LLM) geliştirme süreci, veri kaynaklarının sınırlılığı nedeniyle önemli zorluklar barındırmaktadır. Prof. Dr. Murat Karakaya’nın kaleme aldığı bu makale, Türkçe bir LLM’yi sıfırdan eğitmenin veri gereksinimlerini ve başarıyı etkileyen temel faktörleri ele almaktadır.

Makale kapsamında:

  • Başarılı bir LLM eğitimi için ihtiyaç duyulan yaklaşık veri miktarına dair öngörüler sunuluyor,
  • Açık kaynaklı dil modellerinin Türkçeye uyarlanabilirliği değerlendiriliyor,
  • Telif hakkı sorunları, veri kalitesi, etik kaygılar ve model eğitimi sırasında izlenmesi gereken stratejiler tartışılıyor.

Özellikle akademisyenler, araştırmacılar, yapay zeka geliştiricileri ve kamu/özel sektör kuruluşları için yol gösterici nitelikte olan bu çalışma, Türkçe doğal dil işleme alanındaki gelişmelere katkı sağlamayı amaçlamaktadır.

📄 Makaleye ulaşmak için: https://www.bilisimdergisi.org.tr/bilisim-dergisi-2025-sayi-199

🗓️ Yayın: Bilişim Dergisi – Sayı 199, 2025