Araştırma yapay zekanın temel zayıflığını ortaya çıkardı: Yüzde 26 doğru okuyabildi

Yapay Zekanın Saat ve Takvimleri Okuma Konusundaki Güçsüzlüğü Araştırma İle Gözler Önüne Serildi

Edinburgh Üniversitesi’nden Rohit Saxena liderliğinde yürütülen bir araştırma, Uluslararası Temsillerin Öğrenimi Konferansı (ICLR) 2025’te sunuldu ve 18 Mart’ta arXiv platformunda yayımlandı. Yapılan araştırma, yapay zekanın analog saatleri ve takvim tarihlerini okuma konusunda ne kadar başarısız olduğunu ortaya koydu. Ancak, bulgular henüz hakem değerlendirmesinden geçmedi.

Saxena, yapılan araştırma ile ilgili olarak “Çoğu insan erken yaşta saat okumayı ve takvim kullanmayı öğrenir. Bu çalışma, yapay zeka sistemlerinin gerçek dünyadaki zamana duyarlı görevlerde ne kadar eksik olduğunu gözler önüne seriyor” dedi.

Araştırma kapsamında Meta’nın Llama 3.2-Vision, Anthropic’in Claude-3.5 Sonnet, Google’ın Gemini 2.0 ve OpenAI’ın GPT-4o modellerine özel hazırlanan saat ve takvim görselleri sunuldu. Ancak yapılan testler sonucunda, modellerin saatleri yalnızca %38,7 oranında, takvim tarihlerini ise sadece %26,3 oranında doğru okuyabildiği ortaya çıktı.

Yapılan değerlendirmelerde, yapay zekanın görsel algılama ve mekânsal düşünme konularında yetersiz kaldığı belirtildi. Saxena, “Analog saat okumak, yalnızca görüntü tanıma değil; açı ölçmek, örtüşen akrep-yelkovanı ayırt etmek ve farklı tasarımlarla başa çıkmak anlamına gelir” açıklamasında bulundu.

Araştırma aynı zamanda takvim hesaplamalarında da benzer zayıf sonuçlar elde edildiğini ortaya koydu. Örneğin, “Yılın 153. günü hangi güne denk gelir?” gibi sorulara yapay zeka sistemlerinin çoğu zaman hatalı yanıt verdiği görüldü. Bu tür sorular, sadece bilgiye değil, tutarlı mantıksal düşünme becerisine dayanmaktadır.

Sonuç olarak, araştırma yapay zeka sistemlerinin hala insan benzeri sezgi, soyutlama ve mantık ile hareket edemediğini ve özellikle zaman algısı gibi temel görevlerde insan varlığına duyulan ihtiyacı açıkça ortaya koyuyor.

Related Posts

Bu soruları sormayın: Yapay zekayı zorlayan konular

Yeni bir araştırmaya göre, ChatGPT gibi yapay zeka sohbet botlarının karmaşık düşünme gerektiren sorulara verdiği yanıtlar, basit sorulara kıyasla çok daha fazla karbon salımına yol açıyor.

Elon Musk’ın Yapay Zekâ girişiminin aylık 1 milyar dolar masrafı var

Elon Musk’ın üzerinde fazlasıyla durduğu yeni yapay zekâ şirketi xAI, adeta para yutan bir canavara dönüşmüş durumda.

Adobe Firefly uygulaması iOS ve Android için çıktı

Adobe’nin yapay zeka temelli uygulaması hem iOS hem de Android platformunda kullanıcıların beğenisine sunuldu.

Tahmin edilenlerin 2 katını aştı ve hala büyüyor: Bilim insanları korkutan veriyi paylaştı

Dünya’nın enerji dengesizliği tahmin edilenden çok daha hızlı artıyor ve bilim insanları bu durumu hala tam olarak açıklayamıyor. Yeni yayımlanan verilere göre, gezegenin Güneş’ten aldığı enerjiyle uzaya geri yaydığı enerji arasındaki fark son yıllarda beklenenden iki kat fazla büyüdü. 2023 yılında bu fark metrekare başına 1.8 watt’a ulaştı ve bu, iklim modellerinin öngördüğünden iki kat daha yüksek.

Kediniz kokunuzu tanıyor olabilir

Evcil kediler, sahiplerinin ve bir yabancının doğal kokusuna farklı şekilde tepki veriyor.

Hangi iPhone’lar yeni iOS 19 güncellemesini alacak?

Apple’ın isim değişikliği yapacağı konuşulan yeni yazılım sürümü iOS 19 bir diğer adıyla iOS 26, bazı iPhone’lara gelmeyecek.