Kendini Geliştiren Agent: MiniMax M2.7

Bir modelin kendi hatalarından öğrenmesi fikri yeni değil. Ama bunu gerçekten çalışır hale getirmek başka bir şey.

MiniMax bu hafta M2.7 modelini duyurdu. İddianın özü şu: model, çözemediği kodlama sorularını tekrar deniyor. Başarısız adımları analiz ederek iterasyon yapıyor. Buna self-evolving agent mimarisi diyorlar.

SWE-Bench Pro sonuçları

SWE-Bench, gerçek GitHub sorunlarını çözme testleri üzerine kurulu; skor ne kadar yüksekse model o kadar kullanılabilir anlamına geliyor.

M2.7, SWE-Bench Pro'da %56.22 aldı. Karşılaştırma için: GLM-5.1 bu hafta %53.1 ile öne çıkmıştı. MiniMax M2.7, birkaç gün arayla onu geçti.

Bu, aynı haftanın iki farklı açık kaynak modelinin birbirini kovaladığı anlamına geliyor. Rekabet daralmış durumda.

Self-evolving ne demek?

Modelin çalışma mantığı şöyle: bir soruyu çözmeye çalışır, başarısız olursa hata mesajını okur, neyi yanlış yaptığını analiz eder ve farklı bir yol dener. Bu döngü tek bir inference içinde gerçekleşiyor.

Geleneksel modeller tek seferlik tahmin yapar. M2.7 ise bir kod editörünün terminal çıktısına bakıp düzeltme olasılığını değerlendiriyor.

Açık kaynak, ama kısmi

Model ağırlıkları HuggingFace'te mevcut. Ancak eğitim kodu ve self-evolution pipeline'ının tamamı yayınlanmadı. Bu noktada kamuya açık olan, modelin davranışı; mimarinin tamamı değil.

Açık kaynak tartışması bu ayrımla her geçen gün daha karmaşık bir hal alıyor.