2024, yapay zekanın “ileriye doğru sıçraması” nasıl olacak?

Leila · 8 Ocak 2024

Kasım ayında San Francisco'da düzenlenen bir etkinlikte yapay zeka şirketi OpenAI'nin CEO'su Sam Altman'a sektörün 2024'te ne gibi sürprizler getireceği soruldu.

Bay Altman, OpenAI'nin ChatGPT'si gibi çevrimiçi sohbet robotlarının “kimsenin beklemediği bir adım atacağını” hemen yanıtladı.

Yanında oturan Google yöneticisi James Manyika başını salladı ve “Buna bir artı daha” dedi.

Yapay zeka sektörü bu yıl önemli bir özellikle karakterize edilecek: ilerlemeler birbiri üzerine inşa edildiğinden ve yapay zekanın yeni medya türleri üretmesine, insan düşüncesini yeni yollarla taklit etmesine ve fiziksel dünyaya yayılmasına olanak sağladığından, teknolojide dikkate değer derecede hızlı bir gelişme. Dünya yeni nesil robotların istilasına uğradı.

Önümüzdeki aylarda DALL-E ve Midjourney gibi yapay zeka destekli görüntü oluşturucular hem videoları hem de sabit görüntüleri anında sunacak. Ve yavaş yavaş ChatGPT gibi sohbet robotlarıyla birleşecekler.

Bu, sohbet robotlarının dijital metnin çok ötesine geçebileceği ve fotoğrafları, videoları, çizelgeleri, diyagramları ve diğer medyayı işleyebileceği anlamına gelir. İnsan düşüncesine daha benzer davranışlar sergiliyorlar ve matematik ve fen bilimleri gibi alanlarda giderek daha karmaşık hale gelen görevlerin üstesinden geliyorlar. Teknoloji robotlara geçtikçe dijital dünyanın dışındaki sorunların çözümüne de yardımcı olacak.

Bu gelişmelerin çoğu, ileri teknolojiye sahip araştırma laboratuvarlarında ve teknik ürünlerde ortaya çıkmaya başladı. Ancak 2024 yılında bu ürünlerin performansı ciddi oranda artacak ve çok daha fazla kişi tarafından kullanılacak.

Yeni bir yapay zeka girişimi olan Adept'in CEO'su David Luan, “Yapay zekanın hızlı gelişimi devam edecek” dedi. “Bu kaçınılmaz.”

OpenAI, Google ve diğer teknoloji şirketleri, temel sistemlerin oluşturulma şekli nedeniyle yapay zekayı diğer teknolojilerden çok daha hızlı geliştiriyor.

Çoğu yazılım uygulaması mühendisler tarafından satır satır bilgisayar koduyla oluşturulur ve bu genellikle yavaş ve sıkıcı bir süreçtir. Şirketler yapay zekayı daha hızlı geliştiriyor çünkü teknoloji sinir ağlarına, dijital verileri analiz ederek becerileri öğrenebilen matematiksel sistemlere dayanıyor. Bir sinir ağı, Vikipedi makaleleri, kitaplar ve internetteki dijital metinler gibi verilerdeki kalıpları tespit ederek kendi başına metin üretmeyi öğrenebilir.

Bu yıl teknoloji şirketleri yapay zeka sistemlerine görüntüler, sesler ve daha fazla metin dahil insanların hayal edebileceğinden daha fazla veri sağlamayı planlıyor. Bu sistemler, bu farklı veri türleri arasındaki ilişkileri öğrendikçe, giderek daha karmaşık hale gelen sorunları çözmeyi ve onları fiziksel dünyadaki hayata hazırlamayı öğrenirler.

(Haberler geçen ay OpenAI ve Microsoft'a yapay zeka sistemleriyle ilgili haber içeriğinin telif hakkı ihlali nedeniyle dava açtı.)

Bunların hiçbiri yapay zekanın yakın zamanda insan beynine ayak uydurabileceği anlamına gelmiyor. Yapay zeka şirketleri ve girişimciler, “yapay genel zeka” adını verdikleri şeyi (insan beyninin yapabileceği her şeyi yapabilen bir makine) yaratmayı hedeflerken, bu hala göz korkutucu bir görev olmaya devam ediyor. Tüm hızlı ilerlemelere rağmen yapay zeka henüz emekleme aşamasındadır.

Yapay zekanın bu yıl nasıl değişeceğine ilişkin, yeteneklerinde daha fazla ilerlemeye yol açacak kısa vadeli gelişmelerden başlayarak bir kılavuzu burada bulabilirsiniz.

Anlık videolar

Şimdiye kadar yapay zeka destekli uygulamalar öncelikle istemlere yanıt olarak metin ve hareketsiz görüntüler üretiyordu. Örneğin DALL-E, “Golden Gate Köprüsü'nden bir gergedan dalıyor” gibi sorgulardan saniyeler içinde fotogerçekçi görüntüler oluşturabiliyor.

Ancak bu yıl OpenAI, Google, Meta ve New York merkezli Runway gibi şirketlerin, insanların video oluşturmak için de kullanabileceği görüntü oluşturucuları kullanıma sunması bekleniyor. Bu şirketler zaten kısa metin istemlerinden anında videolar oluşturabilen prototip araçları geliştirdiler.

Teknoloji şirketleri muhtemelen görüntü ve video oluşturucuların gücünü sohbet robotlarına entegre ederek sohbet robotlarını daha güçlü hale getirecek.

“Çok modlu” sohbet robotları

Başlangıçta ayrı araçlar olarak geliştirilen sohbet robotları ve görüntü oluşturucular yavaş yavaş birleşiyor. OpenAI geçen yıl ChatGPT'nin yeni bir sürümünü piyasaya sürdüğünde, chatbot hem görseller hem de metin üretebiliyordu.

Yapay zeka şirketleri “çok modlu” sistemler inşa ediyor, bu da yapay zekanın birden fazla medya türünü işleyebileceği anlamına geliyor. Bu sistemler, fotoğrafları, metinleri ve muhtemelen diyagramlar, çizelgeler, sesler ve videolar da dahil olmak üzere diğer medya türlerini analiz ederek becerileri öğrenir ve böylece kendi metinlerini, resimlerini ve seslerini üretebilirler.

Hepsi bu degil. Sistemler aynı zamanda farklı medya türleri arasındaki ilişkileri de öğrendiğinden, bir medya türünü anlayabilir ve diğeriyle yanıt verebilir. Başka bir deyişle, birisi chatbot'a bir resim gönderebilir ve o da metinle yanıt verir.

Meta'nın üretken yapay zeka grubuna liderlik eden Ahmad Al-Dahle, “Teknoloji daha akıllı ve daha kullanışlı hale geliyor” dedi. “Daha fazla şey yapacak.”

Multimodal sohbet robotları, tıpkı salt metinden oluşan sohbet robotlarının hata yaptığı gibi hata yapar. Teknoloji şirketleri insan gibi düşünebilen chatbotlar geliştirerek hataları azaltmaya çalışıyor.

Daha iyi “gerekçe”

Bay Altman yapay zekanın ileriye doğru bir adım attığından bahsederken, “akıl yürütme” konusunda daha iyi olan ve karmaşık matematik problemlerini çözme ve ayrıntılı bilgisayar programları oluşturma gibi daha karmaşık görevleri üstlenmelerine olanak tanıyan sohbet robotlarından bahsediyor.

Amaç, bir sorunu bir dizi farklı adımla dikkatli ve mantıksal olarak çözebilecek ve her adımın bir sonrakini oluşturacağı sistemler oluşturmaktır. İnsanlar en azından bazı durumlarda böyle düşünüyor.

Önde gelen bilim insanları, chatbotların gerçekten bu şekilde mantık yürütüp yürütemeyeceği konusunda hemfikir değiller. Bazıları bu sistemlerin internet verilerinde gördükleri davranışları tekrarlarken sadece düşünüyor gibi göründüğünü iddia ediyor. Ancak OpenAI ve diğerleri matematik, bilgisayar programlama, fizik ve diğer doğa bilimleri gibi konulardaki karmaşık sorulara daha güvenilir yanıtlar verebilecek sistemler geliştiriyor.

Yapay zeka girişimi Cohere'i yöneten eski Google araştırmacısı Nick Frosst, “Sistemler ne kadar güvenilir olursa, o kadar popüler hale gelirler” dedi.

Chatbotlar daha iyi akıl yürütebilirse “Yapay Zeka ajanlarına” dönüşebilirler.

“Yapay zeka ajanları”

Şirketler, yapay zeka sistemlerine karmaşık sorunları adım adım çözmeyi öğreterek, sohbet robotlarının sizin adınıza yazılım uygulamalarını ve web sitelerini kullanma yeteneğini de geliştirebilir.

Araştırmacılar esas olarak sohbet robotlarını yapay zeka aracısı adı verilen yeni bir tür otonom sisteme dönüştürüyorlar. Bu, sohbet robotlarının yazılım uygulamalarını, web sitelerini ve e-tablolar, çevrimiçi takvimler ve seyahat siteleri dahil diğer çevrimiçi araçları kullanabileceği anlamına gelir. İnsanlar daha sonra sıkıcı ofis işlerini sohbet robotlarına kaydırabilirler. Ancak bu ajanlar aynı zamanda işleri tamamen ellerinden de alabilirler.

Chatbot'lar halihazırda küçük ölçekte aracı görevi görüyor. Toplantıları planlayabilir, dosyaları düzenleyebilir, verileri analiz edebilir ve çubuk grafikler oluşturabilirsiniz. Ancak bu araçlar her zaman olması gerektiği gibi çalışmayabilir. Aracılar daha karmaşık görevler için kullanıldığında tamamen başarısız olurlar.

Bu yıl yapay zeka şirketleri daha güvenilir temsilciler sunacak. Bay Luan, “Tüm sıkıcı, sıradan bilgisayar işlerini bir temsilciye devredebilmelisiniz” dedi.

Bu, QuickBooks gibi bir uygulamada harcamaların takip edilmesini veya Workday gibi bir uygulamada tatil günlerinin kaydedilmesini içerebilir. Uzun vadede yazılım ve internet hizmetlerinin ötesinde robotik dünyasına da yayılacak.

Daha akıllı robotlar

Geçmişte robotlar, her zaman aynı boyut ve şekildeki kutuları toplamak gibi aynı görevi tekrar tekrar gerçekleştirmek üzere programlanıyordu. Ancak sohbet robotlarının temelini oluşturan teknolojinin aynısını kullanan araştırmacılar, robotlara daha önce hiç görmedikleri daha karmaşık görevleri bile yerine getirme yeteneği veriyor.

Tıpkı sohbet robotlarının büyük miktardaki dijital metni analiz ederek bir cümledeki sonraki kelimeyi tahmin etmeyi öğrenebilmesi gibi, bir robot da nesnelerin çarpıldığı, kaldırıldığı ve hareket ettirildiği sayısız videoyu analiz ederek fiziksel dünyada ne olacağını tahmin etmeyi öğrenebilir.

“Bu teknolojiler muazzam miktarda veriyi emebilir. Ve verileri emdikçe dünyanın nasıl çalıştığını, fiziğin nasıl çalıştığını ve nesnelerle nasıl etkileşime gireceklerini öğrenebilirler” dedi robotik girişimi Covariant'ı yöneten eski OpenAI araştırmacısı Peter Chen.

Bu yıl yapay zeka, çamaşırhanede gömlek katlayan veya depodaki eşya yığınlarını sıralayan mekanik kollar gibi perde arkasında çalışan robotlara yeni bir ivme kazandıracak. Elon Musk gibi teknoloji devleri de fark yaratmak için çalışıyor insansı robotlar insanların evlerine giriyor.

2024, yapay zekanın “ileriye doğru sıçraması” nasıl olacak?

Leila

Global Mod