0850 441 46 28 info@imbt.net ATATÜRK MAH 865 SK NO:51/1 09:00-17:30
Son Haberler
Samsung Yeni Nesil 10nm DRAM Üretimini Beklenmedik Bir Kararla Belirsiz Süreliğine Durdurdu Piyasayı şaşırtan rakamlar: Tesla bu kez uzmanları utandırdı Windows Güncellemeleri Sonrası Yazıcı Krizi: Nisan 2026 Patch Day Yeni Sorunlar Getirdi Microsoft Rakip Bulut Sistemlerinde Windows Server İçin Fahiş Fiyat Uygulamakla Suçlanıyor Apple’ın sıradaki büyük planı ortaya çıktı: Altı yeni ürün kategorisi yolda Redmi Note 17 Pro Max sızdı: Akıllı telefon değil, adeta taşınabilir güç kaynağı X, “Topluluklar” altyapısını kapatma kararı aldı iPhone Ultra: İşte katlanabilir Apple cihazının tasarımı Assassin’s Creed: Black Flag Resynced resmi olarak tanıtıldı Toprağın dijital zırhı: Çin'in algoritmaları dünyayı doyurabilir mi? Microsoft Windows 11 İşletim Sistemine Entegre İnternet Hız Testi Özelliğini Getirdi Tesla'da çifte zafer: Gelir ve kâr el ele yükseldi Samsung Yeni Nesil 10nm DRAM Üretimini Beklenmedik Bir Kararla Belirsiz Süreliğine Durdurdu Piyasayı şaşırtan rakamlar: Tesla bu kez uzmanları utandırdı Windows Güncellemeleri Sonrası Yazıcı Krizi: Nisan 2026 Patch Day Yeni Sorunlar Getirdi Microsoft Rakip Bulut Sistemlerinde Windows Server İçin Fahiş Fiyat Uygulamakla Suçlanıyor Apple’ın sıradaki büyük planı ortaya çıktı: Altı yeni ürün kategorisi yolda Redmi Note 17 Pro Max sızdı: Akıllı telefon değil, adeta taşınabilir güç kaynağı X, “Topluluklar” altyapısını kapatma kararı aldı iPhone Ultra: İşte katlanabilir Apple cihazının tasarımı Assassin’s Creed: Black Flag Resynced resmi olarak tanıtıldı Toprağın dijital zırhı: Çin'in algoritmaları dünyayı doyurabilir mi? Microsoft Windows 11 İşletim Sistemine Entegre İnternet Hız Testi Özelliğini Getirdi Tesla'da çifte zafer: Gelir ve kâr el ele yükseldi

Gemini 3 Flash'ın görsel muhakeme ile kod yürütmeyi birleştiren yeni yeteneği: Agentic Vision

Google, Gemini 3 Flash için Agentic Vision yeteneklerini duyurdu. Şirket, Gemini gibi ileri seviye modellerin genellikle dünyayı tek bir statik bakışta işlediğini belirtiyor. Bu modeller, mikroçipteki seri numarası veya

28.01.2026 09:00 2 dk okuma 29 görüntülenme
Gemini 3 Flash'ın görsel muhakeme ile kod yürütmeyi birleştiren yeni yeteneği: Agentic Vision

Google, Gemini 3 Flash için Agentic Vision yeteneklerini duyurdu. Şirket, Gemini gibi ileri seviye modellerin genellikle dünyayı tek bir statik bakışta işlediğini belirtiyor. Bu modeller, mikroçipteki seri numarası veya uzaktaki bir sokak levhası gibi ince ayrıntıları kaçırırlarsa, tahmin yapmak zorunda kalıyor. Gemini 3 Flash'taki Agentic Vision ise görüntü anlamayı statik bir eylemden ajansal bir sürece dönüştürüyor. Agentic Vision'ı Gemini 3 Flash modelinin, cevapları görsel kanıtlara dayandırarak görüntüyle ilgili görevleri daha doğru hale getirmek için geliştirdiği yeni bir yetenek olarak tanımlayabiliriz. 

Model, görsel muhakemeyi, Agentic Vision tarafından desteklenen ilk araçlardan biri olan kod yürütme ile birleştirerek, görüntüleri adım adım yakınlaştırmak, incelemek ve işlemek için planlar oluşturuyor. Şirketin belirttiğine göre; Gemini 3 Flash ile kod yürütmeyi etkinleştirmek, çoğu görme ölçütünde (benchmarkında) tutarlı bir şekilde yüzde 5 ila 10 arasında kalite artışı sağlıyor. 

Agentic Vision, özellikle “Düşün, Harekete Geç, Gözlemle" döngüsünü kullanıyor. Düşün adımında model, kullanıcı sorgusunu ve ilk görüntüyü analiz ederek çok adımlı bir plan oluşturuyor. Hareket et adımında model, görüntüleri aktif olarak işlemek veya analiz etmek için Python kodu oluşturuyor ve bu kodu çalıştırıyor. Gözlemle adımında ise dönüştürülen görüntü, modelin bağlam penceresine ekleniyor. Bu son adım, modelin nihai yanıtı oluşturmadan önce yeni verileri daha iyi bir bağlamda incelemesini sağlıyor.

Şirketin paylaştığı bilgilere göre Gemini 3 Flash, kendisine verilen bir görüntüyü sadece tanımlamanın ötesinde, kod çalıştırarak doğrudan tuval üzerine çizim yapabiliyor ve böylece mantığını temellendirebiliyor. Bununla beraber, Gemini 3 Flash, görüntüdeki ince ayrıntıları algıladığında yakınlaştırıyor. Agentic Vision'ın yüksek yoğunluklu tabloları ayrıştırabildiği ve bulguları görselleştirmek için Python kodunu çalıştırabildiği de belirtiliyor. Kısacası görsellere zoom yapabilen, bir görselde bulunan elin parmaklarını sayabilen ve aritmetik hesaplar yapabilen bir görme yeteneğinden söz ediyoruz. 

Agentic Vision yeteneği, Thinking modeli ile Gemini uygulamasına sunulmaya başlanıyor. Geliştiriciler, bu yeni yeteneğe Google AI Studio ve Vertex AI'daki Gemini API ile erişebilir. 

Teklif Al