🇹🇷 Kayra-1 Stable

Kayra-1 Stable, ~100M parametreli Türkçe instruction-tuned dil modelidir.

📊 Model Özellikleri

  • Parametre Sayısı: ~100 Milyon
  • Context Window: 512 token
  • Vocab Size: 32,000
  • Eğitim Süresi: ~11 saat (T4 GPU)

📈 Performans Metrikleri

Metrik kayra-1-exp kayra-1 İyileşme
Validation Loss 3.75 2.14 ↓ %43
Perplexity 42.5 8.5 ↓ %80
Factuality ~%20 ~%60 ↑ 3x

🚀 Kullanım

from transformers import AutoModelForCausalLM, AutoTokenizer

# Model ve tokenizer yükle
model = AutoModelForCausalLM.from_pretrained(
    "sixfingerdev/kayra-1",
    trust_remote_code=True
)
tokenizer = AutoTokenizer.from_pretrained("sixfingerdev/kayra-stable")

# Soru sor
def generate_response(prompt):
    formatted = f"### Soru: {prompt}\n\n### Cevap:"
    inputs = tokenizer(formatted, return_tensors="pt")
    
    # token_type_ids varsa kaldır (model kullanmıyor)
    if "token_type_ids" in inputs:
        del inputs["token_type_ids"]
    
    outputs = model.generate(
        **inputs,
        max_new_tokens=100,
        temperature=0.15,
        do_sample=True,
        top_p=0.9,
        repetition_penalty=1.3
    )
    
    response = tokenizer.decode(outputs[0], skip_special_tokens=True)
    return response.split("### Cevap:")[-1].strip()

# Örnek kullanım
print(generate_response("Türkiye'nin başkenti neresidir?"))
print(generate_response("Python nedir?"))
print(generate_response("Nasılsın?"))

Örnek Çıktılar:

# # # Soru : Türkiye'nin başkenti ner esidir? # # # Cevap : Ankara, Türkiye'nin başkenti ve ikinci en kalabalık şehri ; İstanbul ise, Türkiye'nin en kalabalık şehridir. Boğaz'ın iki yak asında kurulu tek şehirdir. Boğaz'ın iki yak asında kurulu tek şehirdir. Boğaz, Türkiye'nin en kalabalık şehri, ekonomik merkezi ve aynı zamanda Avrupa'nın en kalabalık şehridir. Boğaz, Türkiye'nin en kalabalık şehri ve aynı zamanda Avrupa'nın en kalabalık şehridir. Boğaz, Türkiye'nin en kalabalık şehridir ve aynı zamanda dünya genelinde de büyük bir nüfus uyla da
# # # Soru : Ankara'da kaç a harfi vardır? # # # Cevap : Ankara'da iki farklı harf ten oluşur. Örneğin : - * * * * : Ankara'da bir adet olan " * * ( Türkçe : " Türk " ), Türk ve Yunan alfab elerinden oluşan bir Türk harf lerinden biridir. Bu harf ler, Türkiye Türkç esinde " Türk " olarak kabul edilir. Ancak, bazı durumlarda " Türk " kelimesi daha yaygın olarak kullanılır. Örneğin : - * * * : Türk ve Yunan alfab elerinde kullanılan " Türk " kelimesi, Türk ve Yunan alfab elerinde kullanılan " Türk "
# # # Soru : Nasıl sın? # # # Cevap : Merhaba! Bugün sana nasıl yardımcı olabilir im? Size yardımcı olmak için bur aday ım. Lütfen bana nasıl yardımcı olabilir im? Size yardımcı olmak için bur aday ım. Lütfen bana nasıl yardımcı olabilir im? Lütfen bana nasıl yardımcı olabilir im? Lütfen bana nasıl yardımcı olabilir im? Lütfen bana nasıl yardımcı olabilir im? Lütfen bana nasıl yardımcı olabilir im? Lütfen bana nasıl yardımcı olabilir im? Lütfen bana nasıl yardımcı olabilir im? Lütfen bana nasıl yardımcı olabilir im? Lütfen bana nasıl yardımcı olabilir im? Lütfen bana nasıl yardımcı olabilir
# # # Soru : Bir yıl kaç gündür? # # # Cevap : Bir yıl, bir yılda yaklaşık 6 milyon kilometre yol kat ederek, bir yıl boyunca en uzun süre rekorunu elinde tutuyor. Bu rekor, birçok insan tarafından büyük bir başarıya imza atıyor. Ancak, bu rekor un yanı sıra, dünya çapında en çok satan spor dergisi olarak kabul edilen ve dünyanın en iyi spor dergisi olarak kabul edilen derg inin adı " The Last of Us " oldu. Bu derg inin adı, genellikle " The Last of Us " ( Türkçe : " The Last of Us " ) veya " The Last of
# # # Soru : En popüler video oyunları nelerdir? # # # Cevap : " Popüler video oyunları arasında'Örnek Oyun 1've'Örnek Oyun 2'bulunuyor. " Örnek Oyun 3've'Örnek Oyun 4'bulunuyor. " Örnek Oyun 4've'Örnek Oyun 5'bulunuyor. " Örnek Oyun 5've'Örnek Oyun 6'bulunuyor. " Örnek Oyun 7've'Örnek Oyun 8'bulunuyor. " Örnek Oyun 8've'Örnek Oyun 9'bulunuyor. " Örnek Oyun 8've'Örnek Oyun 9'bulunuyor. " Örnek Oyun 9
# # # Soru : Yapay zeka nedir? # # # Cevap : Yapay zeka, insan zek asını taklit eden bilgisayar sistemleri dir. Makine öğren imi ve yapay zekâ da makine öğren mesi gibi alanlarda kullanılır. A I, veri analizi yaparak daha iyi sonuçlar elde edebilir. A I, verilerin analiz edilmesini sağlar ve bu sayede daha verimli kararlar alınmasını sağlar. A I, verileri analiz ederek daha etkili sonuçlar elde edilebilir. A I, veri analizi yaparken kullanılan algorit maların temelini oluşturur. A I, veriler deki verilere göre sınıflandır ılır ve bu verilere göre model lenir. A I, veri analizi için

✅ Test Sonuçları

  • Türkiye'nin başkenti? → Ankara ✅
  • Atatürk doğum yılı? → 1881 ✅
  • En kalabalık şehir? → İstanbul ✅
  • Factuality Skoru: %60

⚠️ Bilinen Limitasyonlar

  1. Tokenizer: Bazı kelimeleri parçalıyor (örn: Python → Py th on)
  2. Hallucination: %40 yanlış bilgi üretebilir
  3. Context: 512 token limiti
  4. Reasoning: Karmaşık mantık yürütme zayıf

📝 Prompt Formatı

    ### Soru: {soru}
    
    ### Cevap: {model yanıtı}

🔮 V2 Roadmap

  1. ✅ Tokenizer düzeltme (NFC + Whitespace)
  2. ✅ Model boyutunu artırma (350M+)
  3. ✅ Daha fazla veri ile fine-tuning
  4. ✅ RLHF implementasyonu

📄 Lisans

MIT License


Not: Bu bir base modeldir. Production kullanımı için test edilmelidir.

Downloads last month
37
Safetensors
Model size
0.1B params
Tensor type
F32
·
BOOL
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Datasets used to train sixfingerdev/kayra-1

Space using sixfingerdev/kayra-1 1

Collection including sixfingerdev/kayra-1