AI sohbet botları zihin teorisi geliştirdi mi? Ne yapıyoruz ve bilmiyoruz.

Leila · 28 Mar 2023

Zihin okuma biz insanlar arasında çok yaygın. Medyumların iddia ettiği gibi, her bireyin deneyimini dolduran sıcak bilinç akışlarına erişim sağlayarak ya da mentalistlerin iddia ettiği gibi, bir düşünceyi kafalarından istedikleri gibi çıkararak değil. Günlük akıl okuma daha inceliklidir: insanların yüzlerini ve hareketlerini fark ederiz, ne söylediklerini dinler ve sonra kafalarından neler döndüğüne karar verir veya tahmin ederiz.

Psikologlar arasında, bu tür sezgisel psikolojiye -bizimkinden farklı zihinsel durumları diğer insanlara atfetme yeteneği- zihin kuramı denir ve yokluğu veya bozulması otizm, şizofreni ve diğer gelişimsel engellerle ilişkilendirilmiştir. Zihin teorisi, iletişim kurmamıza ve birbirimizi anlamamıza yardımcı olur; edebiyattan ve filmlerden keyif almamızı, oyun oynamamızı ve sosyal çevremizi anlamamızı sağlar. Birçok yönden yetenek, insan olmanın önemli bir parçasıdır.

Ya bir makine zihinleri de okuyabilseydi?

Geçenlerde, Stanford İşletme Enstitüsü’nde psikolog olan Michal Kosinski, tam olarak şu argümanı ileri sürdü: OpenAI’nin ChatGPT ve GPT-4 gibi büyük dil modelleri — İnternetten çok miktarda metin üzerinde eğitilmiş bir sonraki sözcük tahmin motorları — bir teori zihni geliştirdi. Çalışmaları hakem denetiminden geçmedi, ancak bugünlerde sıkça sorulan soruyu yanıtlamaya çalışan bilişsel bilimciler arasında incelemeye ve tartışmaya yol açtı – ChatGPT bunu yapabilir mi? bu? – ve onu daha sağlam bilimsel araştırma alanına taşıyın. Bu modellerin kapasiteleri nelerdir ve kendi zihinlerimiz hakkındaki anlayışımızı nasıl değiştirebilirler?

Berkeley’deki California Üniversitesi’nden bir psikolog ve araştırma yapan ilk araştırmacılardan biri olan Alison Gopnik, “Psikologlar, ChatGPT’de olduğu anlaşılan, yalnızca onlarla etkileşimlerinizle ilgili anekdotlara dayanan küçük çocukların yetenekleri hakkındaki iddiaları kabul etmezler” dedi. Theory of Mind 1980’lerde ele alındı. “Çok dikkatli ve titiz testler yapmalısınız.”

Önceki araştırma Dr. Kosinski, burun şekli, kafa açısı ve duygusal ifade gibi yüz özelliklerini analiz etmek için eğitilmiş sinir ağlarının, insanların siyasi görüşlerini ve cinsel yönelimlerini şaşırtıcı bir doğrulukla (ilk durumda yaklaşık yüzde 72 ve ilk durumda yaklaşık yüzde 80) tahmin edebildiğini gösterdi. durum). ilk durumda yüzde). ikinci durum). Büyük dil modelleri üzerine yaptığı son çalışma, çocukların diğer insanlara yanlış inançlar atfetme becerilerini ölçen klasik zihin kuramı testleri kullanıyor.

Yeni nesil sohbet robotları

5 haritadan 1

Cesur yeni bir dünya. Yapay zekadan güç alan yeni nesil sohbet robotları, teknolojinin internet ekonomisini alt üst edip edemeyeceğini, günümüzün güç merkezlerini geçmişe dönüştürüp endüstrinin yeni devlerini yaratıp yaratmayacağını görmek için bir kapışmaya yol açtı. İşte bilmeniz gereken botlar:

ChatGPT. Araştırma laboratuvarı OpenAI tarafından geliştirilen yapay zeka dil modeli ChatGPT, karmaşık soruları yanıtlama, şiir yazma, kod oluşturma, tatil planlama ve dilleri çevirme becerisiyle Kasım ayından bu yana manşetlerde yer alıyor. Mart ortasında kullanıma sunulan en son sürüm olan GPT-4, görüntülere bile yanıt verebilir (ve Tek Tip Çubuk Sınavını geçebilir).

Am. ChatGPT’nin ilk çıkışından iki ay sonra OpenAI’nin lider yatırımcısı ve ortağı Microsoft, internet arama motoru Bing’e neredeyse her konuda açık metin konuşmaları yapabilen benzer bir sohbet robotu ekledi. Ancak, piyasaya sürüldükten sonra çok fazla dikkat çeken şey, botun zaman zaman yanlış, yanıltıcı ve garip tepkileri oldu.

ernie Arama devi Baidu, Çin’in ilk büyük rakibini Mart ayında ChatGPT’ye sundu. Gelişmiş Temsil Yoluyla Bilgi Entegrasyonunun kısaltması olan Ernie’nin ilk çıkışı, botun vaat edilen “canlı” bir gösteriminin kaydedildiğinin ortaya çıkmasının ardından bir fiyaskoyla sonuçlandı.

Ünlü bir örnek, Anne adlı bir kızın bilyeyi sepetten bir kutuya taşıdığı ve Sally adlı başka bir kızın bakmadığı Sally-Anne testidir. Araştırmacılar, Sally’nin bilyeyi nerede arayacağını bilmek için, bir izleyicinin zihin teorisini uygulaması ve Sally’nin algısal kanıtları ve inanç oluşumu üzerine düşünmesi gerektiğini iddia etti: Sally, Anne’nin misketi kutuya koyduğunu görmedi, bu yüzden hala ona inanıyor. en son bıraktığı yerde, sepette.

doktor Kosinski, bu zihin kuramı testlerinin 40 benzersiz varyasyonuyla 10 ana dil modeli sundu – Sally-Anne testi gibi, bir kişinin (Sally) yanlış bir inanç oluşturduğu durumların açıklamaları. Daha sonra modellere bu durumlarla ilgili sorular sorarak, ilgili karakterlere yanlış inançlar atfedip atamayacaklarını ve davranışlarını doğru bir şekilde tahmin edip etmeyeceklerini görmeleri için onları zorladı. Kasım 2022’de yayınlanan GPT-3.5’in bunu yüzde 90 oranında, Mart 2023’te yayınlanan GPT-4’ün ise yüzde 95 oranında yaptığını buldu.

Sonuç? Makinelerin bir zihin teorisi vardır.

Ancak bu sonuçlar yayınlandıktan kısa bir süre sonra, Harvard Üniversitesi’nden bir psikolog olan Tomer Ullman, istemlerdeki küçük ayarlamaların en gelişmiş büyük dil modellerinin bile ürettiği yanıtları tamamen değiştirebileceğini gösteren bir dizi deneyle yanıt verdi. Bir kap şeffaf olarak tanımlanırsa, makineler kimsenin içini görebileceği sonucuna varmaz. Makineler bu durumlarda insanların söylediklerini dikkate almakta zorlanıyor, bazen bir nesnenin bir kabın içinde mi yoksa üzerinde mi olduğunu anlayamıyordu.

Carnegie Mellon Üniversitesi’nde bir bilgisayar bilimcisi olan Maarten Sap, 1.000’den fazla zihin kuramı testini büyük dil modellerine besledi ve ChatGPT ve GPT-4 gibi en gelişmiş dönüştürücülerin zamanın yalnızca yüzde 70’ini geçtiğini buldu. (Yani test durumlarında anlatılan kişilere yanlış inançlar atfetmede yüzde 70 başarılı oldular.) Verileri ile Dr. Kosinski’nin nedeni testlerdeki farklılıklar olabilir, ancak Dr. Sap, zamanın yüzde 95’inde bile gerçek zihin teorisinin kanıtı olmadığını söyledi. Makineler tipik olarak kalıplar nedeniyle başarısız oluyor, soyut düşünceye giremiyor ve sıklıkla “yanlış korelasyonlar” kuruyor, dedi.

doktor Ullman, son birkaç on yılda makine öğrenimi araştırmacılarının bilgisayar modellerinde insan bilgisinin esnekliğini yakalamak için mücadele ettiğini belirtti. Bu zorluk, her heyecan verici yeniliğin arkasında yatan bir “gölge keşif” dedi. Araştırmacılar, dil modellerinin bir soru sorulmadan önce gereksiz bilgilerle hazırlandığında genellikle yanlış veya alakasız cevaplar verdiğini göstermiştir; Bazı sohbet robotları, konuşan kuşlar hakkındaki varsayımsal tartışmalardan o kadar rahatsız oldular ki, sonunda kuşların konuşabileceğini iddia ettiler. Akıl yürütmeleri, girdilerindeki küçük değişikliklere duyarlı olduğu için, bilim adamları bu makinelerin bilgilerini “kırılgan” olarak etiketlediler.

doktor Gopnik, büyük dil modellerinin zihin teorisini kendi genel görelilik anlayışıyla karşılaştırdı. “Kelimelerin ne olduğunu bilecek kadar okudum,” dedi. “Ama benden yeni bir tahminde bulunmamı ya da Einstein’ın teorisinin bize yeni bir fenomen hakkında ne söylediğini söylememi isteseydiniz, aklım gerçekten teoride olmadığı için kararsız kalırdım.” diğer rasyonel düşünce mekanizmalarıyla birleştirilmiş insan zihni teorisi olduğunu söyledi; deneme karşısında güçlü duruyor.

Genel olarak Dr. Kosinski’nin çalışması ve ona verilen yanıtlar, bu makinelerin yeteneklerinin insanların yetenekleriyle karşılaştırılıp karşılaştırılamayacağı tartışmasını besledi – bu, doğal dil işlemeyi inceleyen araştırmacıları bölen bir tartışma. Bu makineler stokastik papağanlar mı, yoksa dünya dışı zekalar mı, yoksa düzenbazlar mı? 2022’de yapılan bir saha araştırması, yanıt veren 480 araştırmacının yüzde 51’inin büyük dil modellerinin sonunda “doğal dili önemsiz olmayan bir anlamda anlayabileceğine” inandığını ve yüzde 49’unun yapamayacağına inandığını ortaya çıkardı.

doktor Ullman, makine anlayışı veya makine zihni teorisi olasılığını dışlamaz, ancak insan yeteneklerini insan olmayan şeylere atfetmekten çekinir. Fritz Heider ve Marianne Simmel’in 1944’te yaptığı ve katılımcılara iki üçgen ve bir dairenin etkileşim içinde olduğu bir animasyon filminin gösterildiği ünlü bir çalışmadan bahsetti. Deneklerden filmde olanları yazmaları istendiğinde hemen hepsi şekilleri insan olarak tanımlamıştır.

“İki boyutlu dünyada aşıklar şüphesiz; bir katılımcı, iki numaralı küçük üçgen ve sevimli daire” diye yazdı. “Üçgen-Bir (bundan sonra kötü adam olarak anılacaktır) genç aşkı gözetliyor. Ah!”

İnsan davranışını inançlar, arzular, niyetler ve düşüncelerden bahsederek açıklamak doğaldır ve çoğu zaman toplumsal olarak gereklidir. Bu eğilim kim olduğumuzun merkezinde yer alır – o kadar merkezidir ki bazen aklı olmayan şeylerin, en azından bizimki gibi zihinlerin zihinlerini okumaya çalışırız.

AI sohbet botları zihin teorisi geliştirdi mi? Ne yapıyoruz ve bilmiyoruz.

Leila

Global Mod