Werner Herzog ile Bitmeyen Bir Sohbet Bize Yapay Zeka Hakkında Ne Öğretebilir?



Werner Herzog ile Bitmeyen Bir Sohbet Bize Yapay Zeka Hakkında Ne Öğretebilir?

Üzerinde web sitesi Sonsuz SohbetAlman film yapımcısı Werner Herzog ve Sloven filozof Slavoj Žižek her şey ve her şey hakkında halka açık bir sohbet yapıyor. Tartışmaları ilgi uyandırıyor, çünkü bu entelektüeller İngilizce konuşurken farklı aksanlara sahipler ve eksantrik sözcük seçimlerine yönelik eğilimden bahsetmiyorum bile. Ancak ortak bir noktaları daha var: Her iki ses de derin sahte ve bu ayırt edici aksanlarda konuştukları metin yapay zeka tarafından üretiliyor.

Bu konuşmayı bir uyarı olarak kurdum. Makine öğrenimi denen şeydeki gelişmeler, derin sahteleri (inanılmaz derecede gerçekçi ama sahte görüntüler, videolar veya konuşmalar) oluşturmayı çok kolay ve kalitelerini çok iyi hale getirdi. Aynı zamanda, dil üreten yapay zeka, büyük miktarlarda metni hızlı ve ucuz bir şekilde ortaya çıkarabilir. Birlikte, bu teknolojiler sonsuz bir sohbeti sahnelemekten daha fazlasını yapabilir. Bizi bir dezenformasyon okyanusunda boğma kapasiteleri var.

Belirli bir görevi tekrar tekrar yerine getirirken iyileştirmek üzere bir algoritmayı “eğitmek” için büyük miktarlarda veri kullanan bir yapay zeka tekniği olan makine öğrenimi, hızlı bir büyüme aşamasından geçiyor. Bu, konuşma sentezi, insanların anlayabileceği ifadeler üreten sistemler dahil olmak üzere tüm bilgi teknolojisi sektörlerini yeni seviyelere itiyor. İnsanlar ve makineler arasındaki sınır boşluğuyla ilgilenen biri olarak, her zaman büyüleyici bir uygulama bulmuşumdur. Bu nedenle, makine öğrenimindeki bu ilerlemeler, ses sentezi ve ses klonlama teknolojisinin, küçük, aşamalı iyileştirmelerin uzun bir geçmişinden sonra, son birkaç yıl içinde dev sıçramalarla gelişmesine izin verdiğinde, not aldım.

Bir şeye rastladığımda Sonsuz Sohbet başladı. örnek konuşma sentezi programı Coqui TTS denir. Dijital alandaki birçok proje, daha önce bilinmeyen bir yazılım kitaplığı veya açık kaynaklı program bulmakla başlar. Gelişen bir kullanıcı topluluğu ve bol miktarda belgeyle birlikte bu araç setini keşfettiğimde, ünlü bir sesi klonlamak için gerekli tüm malzemelere sahip olduğumu biliyordum.

Werner Herzog’un çalışmalarını, kişiliğini ve dünya görüşünü takdir eden biri olarak, her zaman onun sesinden ve konuşma tarzından etkilenmişimdir. Pop kültürü Herzog’u gerçek bir çizgi filme dönüştürdüğü için neredeyse yalnız değilim: kamera hücreleri ve işbirlikleri şunları içerir: Simpsonlar, Rick ve Morty ve Madagaskar Penguenleri. Bu yüzden, kurcalamak için birinin sesini seçmeye gelince, daha iyi bir seçenek yoktu – özellikle de o sesi saatlerce dinlemek zorunda kalacağımı bildiğim için. Göz ardı edilemeyecek bir ağırlık taşıyan kuru konuşmasını ve ağır Alman aksanını duymaktan sıkılmanız neredeyse imkansız.

Herzog’un sesini klonlamak için bir eğitim seti oluşturmak, sürecin en kolay kısmıydı. Röportajları, seslendirmeleri ve sesli kitap çalışması arasında, bir makine öğrenimi modelini eğitmek veya benim durumumda, mevcut bir modele ince ayar yapmak için toplanabilecek tam anlamıyla yüzlerce saatlik konuşma var. Bir makine öğrenimi algoritmasının çıktısı genellikle, sinir ağının tüm eğitim verileriyle eğitildiği döngüler olan “dönemlerde” gelişir. Algoritma daha sonra her dönemin sonunda sonuçları örnekleyerek, programın ne kadar iyi ilerlediğini değerlendirmek için araştırmacıya gözden geçirmesi için materyal verebilir. Werner Herzog’un sentetik sesiyle, modelin her çağda geliştiğini duymak, sesinin dijital alemde yavaş yavaş hayat bulmasıyla mecazi bir doğuma tanık olmak gibi hissettirdi.

Tatmin edici bir Herzog sesim olduğunda, ikinci bir ses üzerinde çalışmaya başladım ve sezgisel olarak Slavoj Žižek’i seçtim. Herzog gibi, Žižek’in de ilginç, tuhaf bir aksanı, entelektüel alanda ilgili bir varlığı ve sinema dünyasıyla bağlantıları var. Kısmen polemik tutkusu ve bazen tartışmalı fikirleri sayesinde bir şekilde popüler bir yıldız haline geldi.

Bu noktada, projemin son formatının ne olacağından hâlâ emin değildim ama tüm ses klonlama sürecinin ne kadar kolay ve pürüzsüz olduğuna şaşırmış biri olarak, bunun herhangi biri için bir uyarı olduğunu biliyordum. kim dikkat ederdi. Deepfake’ler çok iyi ve yapılması çok kolay hale geldi; sadece bu ay, Microsoft duyurdu VALL-E adlı yeni konuşma sentezi aracı araştırmacılar, yalnızca üç saniyelik kaydedilmiş sese dayalı olarak herhangi bir sesi taklit edebildiğini iddia ediyor. Bir güven kriziyle yüzleşmek üzereyiz ve buna tamamen hazırlıksızız.

Bu teknolojinin büyük miktarlarda dezenformasyon üretme kapasitesini vurgulamak için hiç bitmeyen bir konuşma fikrine karar verdim. Sadece büyük bir dil modeline (iki katılımcının her biri tarafından yazılan metinlere göre ince ayar yapılmış) ve konuşmanın gidişatını kontrol etmek için basit bir programa ihtiyacım vardı, böylece akışı doğal ve inandırıcı olurdu.

Özünde, dil modelleri zaten mevcut olan bir dizi kelime verildiğinde, bir dizideki bir sonraki kelimeyi tahmin eder. Bir dil modeline ince ayar yaparak, o kişi için çok sayıda konuşma dökümüne sahip olmanız koşuluyla, belirli bir kişinin muhtemelen hakkında konuşacağı stil ve kavramları çoğaltmak mümkündür. Mevcut olan önde gelen ticari dil modellerinden birini kullanmaya karar verdim. İşte o zaman, sentetik ses biçimi de dahil olmak üzere, onu dinlemek için gerekenden daha kısa sürede sahte bir diyalog oluşturmanın zaten mümkün olduğu aklıma geldi. Bu bana proje için bariz bir isim verdi: Sonsuz Konuşma. Birkaç aylık çalışmanın ardından geçen Ekim ayında internette yayınladım. Sonsuz Konuşma da 11 Şubat’tan itibaren şu adreste gösterilecek: Hizasızlık Müzesi San Francisco’da sanat enstalasyonu.

Tüm parçalar yerine oturduğunda, projeye başladığımda aklıma gelmeyen bir şeye hayret ettim. Gerçek hayattaki kişilikleri gibi, Herzog ve Žižek’in benim chatbot versiyonlarım da genellikle felsefe ve estetik konuları etrafında sohbet ediyor. Bu konuların ezoterik doğası nedeniyle, dinleyici, modelin ara sıra ürettiği saçmalıkları geçici olarak görmezden gelebilir. Örneğin, AI Žižek’in Alfred Hitchcock’a bakış açısı, ünlü yönetmeni bir dahi ve alaycı bir manipülatör olarak görmek arasında gidip geliyor; başka bir tutarsızlıkta, gerçek Herzog herkesin bildiği gibi tavuklardan nefret eder, ancak yapay zeka taklitçisi bazen kümes hayvanlarından şefkatle bahsediyor. Gerçek postmodern felsefe karışık olarak okunabileceğinden, bir problem Žižek’in kendisi kaydettiSonsuz Sohbet’teki netlik eksikliği, imkansız çelişkilerden ziyade derin bir belirsizlik olarak yorumlanabilir.

Bu muhtemelen projenin genel başarısına katkıda bulunmuştur. Infinite Conversation’ın yüzlerce ziyaretçisi bir saatten fazla dinledi ve bazı durumlarda insanlar çok daha uzun süre dinlediler. Web sitesinde de belirttiğim gibi, Infinite Conversation ziyaretçileri için ümidim, chatbot’ların söyledikleri üzerinde çok fazla durmamaları, ancak bu teknoloji ve sonuçları hakkında farkındalık kazanmalarıdır; AI tarafından üretilen bu gevezelik makul görünüyorsa, politikacıların itibarını lekelemek, iş liderlerini dolandırmak veya insan tarafından bildirilen haberler gibi görünen yanlış bilgilerle insanların dikkatini dağıtmak için kullanılabilecek gerçekçi görünen konuşmaları hayal edin.

Ama parlak bir taraf var. Infinite Conversation ziyaretçileri, Werner Herzog ve Slavoj Žižek’in yatıştırıcı seslerini uykuya dalmak için bir tür beyaz gürültü olarak kullandıklarını bildiren artan sayıda dinleyiciye katılabilir. Bu, içine girebileceğim bu yeni teknolojinin bir kullanımı.

Bu bir görüş ve analiz yazısıdır ve yazar veya yazarlar tarafından ifade edilen görüşler mutlaka o kişiye ait değildir. Bilimsel amerikalı.



Kaynak : https://www.scientificamerican.com/article/what-an-endless-conversation-with-werner-herzog-can-teach-us-about-ai/

Yorum yapın

SMM Panel PDF Kitap indir