Ölçme, Seçme ve Yerleştirme Merkezi (ÖSYM) tarafından 20-21
Haziran tarihlerinde gerçekleştirilen Yükseköğretim Kurumları Sınavı (YKS), bu yıl yapay zeka modellerinin performans testine sahne oldu. İki milyonu aşkın adayın katıldığı sınava, teknoloji içerik üreticisi ve MEF Üniversitesi Endüstri Mühendisliği Bölümü öğrencisi 20 yaşındaki Alp Ünlü tarafından Claude isimli yapay zeka asistanının iki farklı modeli dahil edildi. Yapılan denemede modellerden biri üstün başarı göstererek derece yaparken, diğeri bir milyon barajını dahi aşamadı.
YKS sorularını cevap anahtarlarından arındırarak Opus 4.8 ve Haiku 4.5 modellerine yükleyen Ünlü, sistemlere yanlışların doğruları götürdüğünü belirterek emin olmadıkları soruları boş bırakmaları yönünde komut verdi. Geçtiğimiz yıl sınava giren yapay zeka araçlarından ChatGPT'nin 650 bin, DeepSeek'in 21 bin ve Gemini'ın 27 bininci olduğu biliniyor. Aktarılan bilgilere göre, bu kez Claude modellerinin sınava tabi tutulduğu süreçte, modellerin sınavı tamamlama süreleri ve elde ettikleri netler arasında büyük bir uçurum ortaya çıktı.
MODELLER ARASINDAKİ FARK NEDEN BU KADAR BÜYÜK?
Sınavı sadece bir dakika içinde tamamlayan Haiku modeli, başlangıçta Temel Yeterlilik Testi'nde (TYT) 85, Alan Yeterlilik Testleri'nde (AYT) 52 net yapacağını öngörmesine rağmen sırasıyla 18 ve 7.25 net elde edebildi. Buna karşılık soruları yaklaşık 40 dakikada çözen Opus modeli, matematik testinin 30'uncu sorusunda kredi sınırına takılarak beş saatlik bir bekleme süresi yaşamasına rağmen dereceye girmeyi başardı. Bilişim Uzmanı Osman Demircan'ın değerlendirmesine göre, bu devasa farkın temel nedeni yapay zeka mimarilerindeki önceliklendirme stratejilerinden kaynaklanıyor. Haiku gibi modeller anlık veri işleme ve hıza odaklanırken, Opus gibi gelişmiş versiyonlar derin akıl yürütme ve matematiksel öğrenme algoritmalarını kullanıyor. Bu durum, eğitimde yapay zeka araçlarının kullanım amacına göre seçilmesi gerektiği gerçeğini ortaya koyuyor.
UZMANLAR YKS SONUÇLARINI NASIL DEĞERLENDİRİYOR?
Eğitim Uzmanı ve Psikolojik Danışman Cihan Yeşilyurt, iki modelin elde ettiği sonuçların çok uçlarda olduğunu belirtti. Bu yıl TYT'nin geçtiğimiz yıla kıyasla daha çözülebilir, AYT'nin ise daha ölçücü bir yapıya sahip olduğuna dikkat çeken Yeşilyurt, aday sıralamalarının geçen yıldan farklı olacağını öngörüyor. Uzmanlar, yapay zeka sistemlerinin veri işleme ve mantıksal çıkarım yeteneklerinin giderek geliştiğini, önümüzdeki yıllarda bu tür dil modellerinin üniversite sınavlarında birinci sıraya yerleşme ihtimalinin güçlü bir olasılık olduğunu ifade ediyor.





