Google, Gemma 3 tabanlı yeni açık kaynak çeviri modeli TranslateGemma’yı duyurdu. 55 lisanı destekleyen model ailesi, farklı donanımlar için üç sürümle geliyor.
Google, açık yüklü Gemma 3 modeli üzerine inşa edilen yeni bir açık çeviri model ailesini duyurdu. TranslateGemma ismi verilen bu yeni model seti, şirket tarafından “açık çeviri alanında değerli bir adım” olarak tanımlanıyor. TranslateGemma, İspanyolca, Fransızca, Çince ve Hintçe üzere yaygın lisanların de ortalarında bulunduğu 55 farklı lisanı destekliyor.
Duyuru, ChatGPT Translate’in çabucak akabinde geldi
TranslateGemma’nın tanıtımı, OpenAI’nin ChatGPT Translate özelliğini duyurmasından yalnızca saatler sonra yapıldı. ChatGPT Translate, söz kelime çeviri yerine ton ve bağlamı muhafazaya odaklanmasıyla öne çıkıyor. Araç, otomatik lisan algılamanın yer aldığı çift panelli bir arayüz sunuyor ve bu yapısıyla Google Translate gibisi tahlilleri andırıyor.
Farklı gereksinimlere nazaran üç model seçeneği
Google, TranslateGemma’yı 4B, 12B ve 27B olmak üzere üç farklı parametre boyutuyla kullanıma sundu. Şirketin paylaştığı bilgilere nazaran 12B’lik model, WMT24++ benchmark testlerinde, temel Gemma 3 27B modelinden daha âlâ sonuçlar verdi.
Geliştiriciler açısından bu durum değerli bir avantaj sağlıyor. Daha az parametreyle misal hatta daha âlâ performans sunan modeller, daha yüksek süreç suratı ve daha düşük gecikme mühleti manasına geliyor.

Mobil aygıtlardan buluta kadar geniş kullanım alanı
Google, 4B modelin taşınabilir aygıtlar için optimize edildiğini, 12B modelin ise günlük kullanıcıların dizüstü bilgisayarlarında rahatlıkla çalışabileceğini belirtiyor. En büyük model olan 27B ise tek bir NVIDIA H100 üzere güçlü bulut donanımlarına muhtaçlık duyuyor.
Vistra imaj çeviri benchmark testlerinde yapılan denemelerde, TranslateGemma’nın görsellerin içindeki metinleri çevirme konusunda da başarılı sonuçlar verdiği söz ediliyor. Üstelik bu yetenek, modelin bilhassa bu alan için eğitilmemiş olmasına karşın elde edilmiş durumda.
İki etaplı eğitim süreci dikkat çekiyor
Google, bu düzeydeki performansın gerisinde iki etaplı özel bir eğitim süreci olduğunu vurguluyor. Birinci basamakta, Gemma 3 modelleri; insan çevirileri ile Gemini modelleri tarafından üretilen yüksek kaliteli sentetik datalar kullanılarak kontrollü ince ayar sürecinden geçirildi.
İkinci evrede ise pekiştirmeli öğrenme devreye alındı. Bu süreçte MetricX-QE ve AutoMQM üzere gelişmiş kıymetlendirme metriklerini kullanan ödül modelleri, çevirilerin daha doğal ve bağlama uygun hale gelmesini sağladı.
Kaggle ve Hugging Face üzerinden erişilebiliyor
TranslateGemma modelleri, denemek yahut kendi projelerinde kullanmak isteyenler için Kaggle ve Hugging Face üzerinden indirilebilir durumda. Google, bu modellerin açık kaynak ekosisteminde yeni çeviri tahlillerinin önünü açmasını hedefliyor.
Kaynak: Chip

COMMENTS