DALL-E 3 çok daha ayrıntılı görüntüler üretiyor ve ChatGPT'ye entegre edilecek

DALL-E 3 çok daha ayrıntılı görüntüler üretiyor ve ChatGPT'ye entegre edilecek

OpenAI, yapay zeka destekli görüntü sentezleme modelinin en son yinelemesi olan DALL-E 3'ü tanıttı.

Bu sürüm, ChatGPT ile sorunsuz entegrasyona sahip ve modelin karmaşık açıklamalarla doğru bir şekilde eşleşen görüntüler oluşturmasına olanak tanıyor. Ayrıca, önceki sürümler için bir zorluk olan etiket ve altyazı gibi görüntüdeki metinlerin oluşturulmasını da yönetiyor. Model, ChatGPT Plus ve Enterprise kullanıcıları için Ekim ayı başında kullanıma sunulacak.

DALL-E 3, öncekiler gibi, yazılı istemlerden benzersiz görüntüler oluşturan bir metinden resme oluşturucudur. DALL-E 3'ün spesifik teknik detayları açıklanmamış olsa da, modelin önceki versiyonlar gibi, bir kısmı Shutterstock gibi fotoğraf stoklarından alınan, insan eliyle oluşturulmuş milyonlarca görüntü üzerinde eğitildiği varsayılabilir. Yeni model muhtemelen yenilikçi eğitim yöntemleri ve artırılmış bir hesaplamalı eğitim süresi içeriyor.

OpenAI'nin DALL-E 3 için hazırladığı örnek görüntüler, modelin komutları doğru bir şekilde takip etme becerisi bakımından diğer görüntü sentezleme modellerinden daha iyi performans gösterdiğini ortaya koyuyor. DALL-E 3 tarafından üretilen görüntüler, verilen talimatları tam olarak takip ediyor ve minimum bozulma ile nesneler yaratıyor gibi görünüyor. OpenAI, DALL-E 3'ün eller gibi karmaşık ayrıntıları DALL-E 2'den daha etkili bir şekilde geliştirdiğini vurguluyor.

DALL-E 3 ayrıca, selefi için zor bir özellik olan görüntülere metin yerleştirme konusunda da gelişmiş bir yetenek sergiliyor. Örneğin, bir terapist koltuğundaki avokadoyu tanımlayan ve "İçim çok boş" diyen bir araç ipucu, bir konuşma balonunda tam olarak bu ifadenin temsil edildiği bir karikatür avokadonun ortaya çıkmasına neden oldu.

OpenAI, DALL-E 3'ün ChatGPT üzerine "yerel olarak inşa edildiğini" vurguluyor. Bu entegrasyon, kullanıcıların yapay zeka asistanını bir beyin fırtınası ortağı olarak kullanarak konuşma modunda görüntüleri geliştirmelerine olanak tanıyacak. Bu aynı zamanda ChatGPT'nin mevcut konuşmanın bağlamına göre görüntüler oluşturabileceği ve potansiyel olarak yenilikçi olasılıkların önünü açabileceği anlamına geliyor. Microsoft'un OpenAI teknolojisini kullanan Bing Chat AI asistanının Mart ayından bu yana konuşma sırasında görüntüler ürettiğini belirtmek gerekir.