OpenAI GPT-5.4: Bilgisayar Kullanımı ve Finansal Eklentiler
OpenAI, GPT-5.4 modelini bilgisayar kullanım modu, Excel ve Google Sheets entegrasyonu ve yüzde 47 daha az token tüketimi ile piyasaya sürdü.
OpenAI, GPT-5.3 Instant'ın yalnızca iki gün ardından yeni amiral gemisi modeli GPT-5.4'ü duyurdu. İki varyant mevcut: tüm ücretli ChatGPT abonelerine açılan GPT-5.4 Thinking ve yalnızca Pro ile Enterprise kullanıcılarına sunulan GPT-5.4 Pro.
Lansmandaki en büyük başlık bilgisayar kullanımı. GPT-5.4, OpenAI'ın Codex ve API üzerinden yerel bilgisayar kullanım yetenekleriyle gelen ilk genel amaçlı modeli. Kod yazarak Playwright gibi kütüphaneler üzerinden bilgisayar işletebiliyor, ekran görüntülerine bakarak fare ve klavye komutları verebiliyor. OSWorld-Verified testinde başarı oranı yüzde 75.0'a ulaştı; GPT-5.2'deki yüzde 47.3 ve insanların yüzde 72.4'lük performansını geride bıraktı.
Token verimliliği için de yeni bir mekanizma var. Tool Search sistemi, tüm araç tanımlarını prompt'a yığmak yerine modelin ihtiyaç duyduğunda araç tanımlarını çekebilmesini sağlıyor. Scale'in MCP Atlas benchmark'ında 36 MCP sunucusuyla çalışan testlerde, bu yaklaşım aynı doğruluğu koruyarak toplam token tüketimini yüzde 47 azalttı.
Kodlama tarafında GPT-5.4, SWE-Bench Pro'da GPT-5.3-Codex ile eşit veya daha iyi performans gösterirken daha düşük gecikme sunuyor. Codex'teki yeni /fast modu desteklenen modellerde 1.5 kat hızlanma sağlıyor. Deneysel "Playwright Interactive" becerisi ise kodlama ve bilgisayar kullanımını birleştirerek web ve Electron uygulamalarını görüntüsel olarak debug etmeye olanak tanıyor.
Finans sektörü için özel bir hamle de geldi. ChatGPT for Excel ve Google Sheets beta sürümü, ChatGPT'yi doğrudan hesap tablolarına gömüyor. FactSet, MSCI, Third Bridge ve Moody's entegrasyonları piyasa verilerini tek bir iş akışında birleştiriyor. OpenAI'ın dahili yatırım bankacılığı benchmark'ında model performansı GPT-5 ile yüzde 43.7'den GPT-5.4 Thinking ile yüzde 88.0'a fırladı.
Halüsinasyonlarda da ciddi iyileşme var. Kullanıcıların daha önce hata bildirdiği sorgularda GPT-5.4'ün bireysel iddiaları yüzde 33 daha az yanlış, tüm yanıtları ise yüzde 18 daha az hatalı çıkıyor. GDPval testinde 44 meslek grubunda GPT-5.4, profesyonellere yüzde 83.0 oranında eşleşti veya onları geçti.
API'de 1 milyon tokena kadar bağlam penceresi destekleniyor ancak 272.000 tokeni aşan istekler için fiyat ikiye katlanıyor. Fiyatlandırma: GPT-5.4 için 1M input tokeni 2.50 dolar, output 15 dolar. GPT-5.4 Pro için input 30, output 180 dolar. Batch ve Flex seçenekleri yarım fiyat sunuyor.
Güvenlik tarafında OpenAI, GPT-5.4 Thinking'in düşünce zincirinde aldatma eğiliminin düşük olduğunu gösteren yeni bir değerlendirme yayınladı. "Model, muhakemesini gizleme yeteneğinden yoksun" görünüyor ve düşünce zinciri izleme etkili bir güvenlik aracı olmayı sürdürüyor.
GPT-5.4, "yanıt üretme"nin ötesine geçip sürdürülebilir profesyonel iş akışlarına geçişi temsil ediyor. Araç düzenleme, bilgisayar etkileşimi, uzun bağlam ve gerçek iş çıktılarını bir arada sunması, ajansal sistemlerin üretimde daha uygulanabilir hale geldiği anlamına geliyor.


