Bir Yapay Zeka Gerçekten Kendi 'Gizli Dilini' İcat Etti mi? İşte Bildiklerimiz

DALL-E 2'deki bir videodan ekran görüntüsü. (Açık AI)

Yeni nesil yapay zeka (AI) modelleri, bir metin istemine dayalı olarak talep üzerine 'yaratıcı' görüntüler üretebilir. beğenileri resim , Orta Yolculuk , ve DALL-E 2 başlıyor yaratıcı içeriğin yapılma şeklini değiştirin telif hakkı ve fikri mülkiyet açısından etkileri olan.

Bu modellerin çıktıları genellikle çarpıcı olsa da, sonuçlarını tam olarak nasıl ürettiklerini bilmek zordur. Geçen hafta ABD'deki araştırmacılar, DALL-E 2 modelinin nesneler hakkında konuşmak için kendi gizli dilini icat etmiş olabileceğine dair ilgi çekici bir iddiada bulundular.

DALE-2'nin gizli bir dili var.
'Apoploe vesrreaitais' kuşlar anlamına gelir.
'Contarra ccetnxniams luryca tanniounons' böcekler veya zararlılar anlamına gelir.

Komut istemi: 'Apoploe vesrreaitais Contarra ccetnxniams luryca tanniounons'u yiyor' böcek yiyen kuşların görüntülerini veriyor.

Bir iplik (1/n)🧵 pic.twitter.com/VzWfsCFnZo



— Giannis Daras (@giannis_daras) 31 Mayıs 2022

Araştırmacılar, DALL-E 2'nin metin altyazıları içeren görüntüler oluşturmasını ve ardından ortaya çıkan (anlamsız) altyazıları sisteme geri beslemesini sağlayarak, DALL-E 2'nin düşündüğü sonucuna vardılar. Vicoot'lar anlamına geliyor ' sebzeler ', süre Wa ch zod reaDaha fazla ' anlamına gelir bir balinanın yiyebileceği deniz canlıları '.

Bu iddialar büyüleyici ve eğer doğruysa, bu tür büyük AI modeli için önemli güvenlik ve yorumlanabilirlik etkileri olabilir. Peki tam olarak neler oluyor?

DALL-E 2'nin gizli bir dili var mı?

DALL-E 2 muhtemelen 'gizli bir dile' sahip değildir. Kendine ait olduğunu söylemek daha doğru olabilir. kelime bilgisi – ama o zaman bile kesin olarak bilemeyiz.

Her şeyden önce, bu aşamada herhangi bir iddiayı doğrulamak çok zor. DALL-E 2 ve diğer büyük AI modelleri , çünkü yalnızca bir avuç araştırmacı ve yaratıcı uygulamacı bunlara erişebilir.

Herkese açık olarak paylaşılan (örneğin Twitter'da) herhangi bir görüntü, oldukça büyük bir tuz tanesi ile çekilmelidir, çünkü bunlar, bir insan tarafından AI tarafından oluşturulan birçok çıktı görüntüsü arasından 'kiraz toplanmıştır'.

Erişimi olanlar bile bu modelleri ancak sınırlı şekillerde kullanabilirler. Örneğin, DALL-E 2 kullanıcıları görüntüleri oluşturabilir veya değiştirebilir, ancak (henüz) yapay zeka sistemiyle, örneğin sahne arkası kodunu değiştirerek daha derinlemesine etkileşime giremez.

Bu şu anlama gelir ' açıklanabilir yapay zeka ' Bu sistemlerin nasıl çalıştığını anlamak için yöntemler uygulanamaz ve davranışlarını sistematik olarak araştırmak zordur.

O zaman neler oluyor?

Bir olasılık, 'anlamsız' ifadelerin İngilizce olmayan dillerdeki kelimelerle ilgili olmasıdır. Örneğin, apoplos kuşların görüntülerini yaratıyor gibi görünen , Latince'ye benzer. Apodidae , bir kuş türü ailesinin iki terimli adıdır.

Bu makul bir açıklama gibi görünüyor. Örneğin, DALL-E 2, İngilizce olmayan birçok kelimeyi içeren internetten alınan çok çeşitli veriler üzerinde eğitildi.

Benzer şeyler daha önce de oldu: büyük doğal dil AI modelleri tesadüfen bilgisayar kodu yazmayı öğrendim kasıtlı eğitim olmadan.

Her şey jetonlarla mı ilgili?

Bu teoriyi destekleyen bir nokta, AI dil modellerinin metni sizin ve benim yaptığımız gibi okumadığı gerçeğidir. Bunun yerine, giriş metnini işlemeden önce 'belirteçlere' bölerler.

Farklı 'belirteçleştirme' yaklaşımları farklı sonuçları var. Her kelimeyi bir jeton olarak ele almak sezgisel bir yaklaşım gibi görünüyor, ancak aynı jetonların farklı anlamları olduğunda soruna neden oluyor (örneğin, tenis oynarken ve ateş başlatırken 'maç' kelimesinin nasıl farklı anlamlara geldiği gibi).

Öte yandan, her karakteri bir simge olarak ele almak, daha az sayıda olası simge üretir, ancak her biri çok daha az anlamlı bilgi iletir.

DALL-E 2 (ve diğer modeller) olarak adlandırılan bir arada yaklaşım kullanır bayt çifti kodlaması (BPE). Bazı anlamsız kelimeler için BPE temsillerini incelemek, bunun 'gizli dili' anlamada önemli bir faktör olabileceğini düşündürmektedir.

bu 'gizli dil' çoğunlukla belirteç etkileri gibi görünüyor. tersini de yapabilirsiniz:

1) wikipedia'dan iki 'Actinopterygii' ve 'Placodermi' balık ailesi seçtim
2) dalle'yi 'placoactin knunfidg' ile uyardı
3) dalle sürekli olarak balık görüntüleri oluşturur https://t.co/ndAe7MURyg pic.twitter.com/1kHk5NWJb3

- rapha gontijo lopes (@iraphas13) 3 Haziran 2022

resmin tamamı değil

'Gizli dil' aynı zamanda 'çöp içeri, çöp dışarı' ilkesinin bir örneği olabilir. DALL-E 2 'Ne hakkında konuştuğunu bilmiyorum' diyemez, bu nedenle verilen giriş metninden her zaman bir tür görüntü üretecektir.

Her iki durumda da, bu seçeneklerin hiçbiri neler olup bittiğinin tam açıklamaları değildir. Örneğin, anlamsız sözcüklerden tek tek karakterleri çıkarmak, oluşturulan görüntüleri çok özel şekillerde bozmak . Ve görünüşe göre, anlamsız sözler, üretmek için mutlaka bir araya gelmiyor. tutarlı bileşik görüntüler (kapakların altında gerçekten gizli bir 'dil' olsaydı yapacakları gibi).

Bu neden önemli

Entelektüel merakın ötesinde, bunlardan herhangi birinin gerçekten önemli olup olmadığını merak ediyor olabilirsiniz.

Cevap Evet. DALL-E'nin 'gizli dili', bir düşmana karşı 'düşmanca saldırı' örneğidir. makine öğrenme sistem: Yapay zekanın iyi işlemediği girdileri bilerek seçerek sistemin amaçlanan davranışını kırmanın bir yolu.

Düşman saldırılarının endişe verici olmasının bir nedeni, modele olan güvenimize meydan okumalarıdır. AI anlamsız kelimeleri istenmeyen şekillerde yorumlarsa, anlamlı kelimeleri istenmeyen şekillerde de yorumlayabilir.

Düşman saldırıları da güvenlik endişelerini artırıyor. DALL-E 2 filtreleri, kullanıcıların zararlı veya kötüye kullanım amaçlı içerik oluşturmasını önlemek için giriş metnini filtreler, ancak anlamsız kelimelerden oluşan 'gizli bir dil', kullanıcıların bu filtreleri aşmasına izin verebilir.

Son araştırmalar düşmanca keşfetti ' tetikleyici ifadeler ' bazı dil AI modelleri için - modelleri ırkçı, zararlı veya önyargılı içerik yaymak için güvenilir bir şekilde tetikleyebilen 'bölgeleme vuruşları' gibi kısa saçma ifadeler. Bu araştırma, devam eden çabaların bir parçasıdır. anlamak ve kontrol etmek karmaşık derin öğrenme sistemlerinin verilerden nasıl öğrendiği.

Son olarak, DALL-E 2'nin 'gizli dili' gibi fenomenler yorumlanabilirlik endişelerini artırıyor. Bu modellerin bir insanın beklediği gibi davranmasını istiyoruz, ancak anlamsız kelimelere yanıt olarak yapılandırılmış çıktılar görmek beklentilerimizi karıştırıyor.

Mevcut endişelere ışık tutmak

2017'deki hullabaloo'yu bazı Facebook sohbet botları üzerinden hatırlayabilirsiniz. kendi dilini icat etti '. Mevcut durum, sonuçların ilgili olması bakımından benzerdir – ancak 'Skynet dünyayı ele geçirmeye geliyor' anlamında değil.

Bunun yerine, DALL-E 2'nin 'gizli dili', verilerin sağlamlığı, güvenliği ve yorumlanabilirliği ile ilgili mevcut endişeleri vurgulamaktadır. derin öğrenme sistemleri .

Bu sistemler daha geniş çapta kullanılabilir hale gelene kadar - ve özellikle, daha geniş bir İngiliz olmayan kültürel geçmişe sahip kullanıcılar bunları kullanana kadar - neler olup bittiğini gerçekten bilemeyeceğiz.

Ancak bu arada, kendi AI görüntülerinizden bazılarını oluşturmayı denemek isterseniz, ücretsiz olarak temin edilebilen daha küçük bir modele göz atabilirsiniz, DALL-E mini . Modeli yönlendirmek için hangi kelimeleri kullandığınıza dikkat edin (İngilizce veya anlamsız - çağrınız).

Aaron J. Snoswell , Doktora Sonrası Araştırma Görevlisi, Hesaplamalı Hukuk ve Yapay Zeka Sorumluluğu, Queensland Teknoloji Üniversitesi .

Bu makale şuradan yeniden yayınlandı: Konuşma Creative Commons lisansı altında. Okumak orijinal makale .

Hakkımızda

Sağlık, Mekan, Doğa, Teknoloji Ve Çevre Hakkında Bağımsız, Kanıtlanmış Raporlar.