Yolculuğun ortasında bir rakiple karşılaşılıyor! Google AI, 4 büyük ineğin bir iş kurduğunu, Imagen teknolojisini ücretsiz denediğini ve 120 milyon melek finansmanı kazandığını gösteriyor

Orijinal kaynak: Qubit

Resim kaynağı: Sınırsız Yapay Zeka tarafından oluşturulmuştur

Yapay zeka resminin tahtına oturan MidJourney, sonunda güçlü bir rakibin yolunu açtı.

En yeni rakip Ideogram, birdenbire doğdu. Başlangıçta, çok fazla ilgi çekmek için ücretsiz kayıttan yararlanıyordu.

En dikkat çekici özellik: Resimdeki metni tam olarak oluşturun, NVIDIA bilim adamı Fan Linxi bunu doğrudan "Bitti, Yolculuk Ortası" çizmek için kullandı.

Arkasındaki şirket, Ideogram AI, Google AI'nın toplu olarak ayrılan 4 büyük ineği resmettiği, Toronto'da bulunan ve 16,5 milyon ABD Doları (yaklaşık 120 milyon dolar) tutarında tohum turu finansmanı ile gelen girişimci bir projedir. yuan).

Kurucu ekibin ilk 4 üyesinin tamamı Google Vincent grafik araştırması Imagen makalesinin yazarlarından oluşur ve difüzyon modelleri konusunda üst düzey bir araştırma ekibi oluşturur.

Google'ın uzun süredir sakladığı ve herkes tarafından oynanmayan ileri düzey araştırma sonuçları nihayet açıklandı.

Ideogram AI tohum turu a16z ve Index Ventures tarafından yönetildi.

Bireysel yatırımcılar arasında OpenAI kurucu üyesi Andrej Karpathy, takviyeli öğrenme gurusu Pieter Abbeel, Node.js kurucusu Ryan Dahl, GitHub kurucu ortağı ** gibi iyi bilinen isimler de var. Tom Preston-Werner** ve ark.

Ekibin eski patronu, eski Google beyin lideri Jeff Dean bile katıldı.

Kurucu ekibin tamamının teknik geçmişe sahip olmasına rağmen, Ideogram AI, tanıtım ve tanıtım açısından da nettir ve herkesi doğrudan 𝕏 üzerindeki ikinci oluşturma etiketini kullanmaya davet ederek bir viral pazarlama dalgası başlattı.

Yapay zeka, metni doğru şekilde çizmeyi öğrenir

Yapay zekanın metni doğru bir şekilde çizmesine izin vermek her zaman bir sorun olmuştur. Her ne kadar SDXL ve Midjourney'in yeni kısmi yeniden çizim işlevleri gelişmiş olsa da netizenlerden gelen geri bildirimlerin başarı oranı çok yüksek olmadı ve tekrarlanan denemeler gerekiyor.

İdeogram bu sıkıntılı noktayı çözdükten sonra doğrudan netizenler tarafından oynandı.

Metnin tabela üzerinde görünmesi ve aynı zamanda ortam ışığına ve gölgeye uyum sağlaması sorun değil.

Latte art yapmak sorun değil.

Soyut tarzdaki posterler de uygun tarzlara sahip yazı tipleri ile karşımıza çıkabilir.

Tek kelimeyle marka logosu üretkenlik özellikleriyle doludur.

Netizenlerin paylaştığı kısa sözlerden de, metin çizmenin başarı olasılığını artıracak "büyü"nün de çok basit olduğu, sadece tek bir kelime olduğu görülüyor:

tipografi (baskı dizgisi)

Ancak Çinceye hakim olma konusunda pek iyi olmaması üzücü.

Metnin yanı sıra, Ideogram'ın görüntü oluşturma kapasitesi ve çıktı kalitesi MidJourney ve Stable Diffusion ile karşılaştırılabilir.

Imagen ile tamamen aynı teknolojiyi kullanıyorsanız, dil kodlama modeli olarak OpenAI CLIP yerine Google T5'i kullanmak, Ideogram'ın bilgi istemi sözcüklerindeki mekansal ilişki açıklamasını daha iyi anladığı anlamına gelir.

Birisi bunu tutarlı bir stile sahip bir dizi görüntü oluşturmak için başarıyla kullandı.

Video oluşturma aracı Pika Labs ile birleştirildiğinde doğrudan film fragmanı tarzında kısa filmler üretebilir.

Diffüzyon Modeli En İyi Araştırma Ekibi

Ideogram AI'nin kurucu ekibi, 4'ü Google Imagen'in ortak yazarı olan 7 kişiden oluşuyor.

Bunların arasında ortak yazar Mohammad Norouzi CEO'dur. Toronto Üniversitesi'nde Bilgisayar Bilimleri alanında doktorası sırasında Google ML Doktora Bursunu aldı.

Mezun olduktan sonra 7 yıl boyunca Google Brain'e katıldı. Model oluşturmanın yanı sıra, Google Nöral Makine Çevirisi ekibinin orijinal bir üyesiydi ve Hinton ekibinin kendi kendini denetleyen karşılaştırmalı öğrenme çerçevesi SimCLR'nin ortak yazarıydı.

Ortak yazar William Chan (Chen Junle) yeni şirketin CTO'sudur. Kanada'daki Waterloo Üniversitesi'nde ve Carnegie Mellon Üniversitesi'nde eğitim görmüştür.

2012 yılında Google'a katıldığında önce makine öğrenimi reklam projesi yaptı, ardından NLP araştırması için Google Brain'e transfer oldu.

Üçüncü ortak yazar Chitwan Saharia Bombay Teknoloji Enstitüsü'nden mezun oldu, 2019'da Google'a katıldı ve şu anda Ideogram'ın kurucu ortağıdır.

Dördüncü kurucu ortak Dr. Jonathan Ho** UC Berkeley'den mezun oldu, bir yıl OpenAI'de çalıştı ve ardından Google'a katıldı.

Imagen makalesine katkıda bulunanlardan biri olmasının yanı sıra, aynı zamanda gürültü giderici difüzyon modelinin temel çalışmasıdır "Gürültü Giderici Difüzyon Olasılık Modelleri". Bu makalenin ortak yazarlarından biri olan Pieter Abbeel aynı zamanda bir ideogram AI yatırımcısı.

Kurucu ekipteki diğer üç kişi olan Shayaan Abdullah, Twitter'da makine öğrenimi mühendisiydi, bu yıl Nisan ayında ayrıldı ve ardından Ideogram AI'ya katıldı.

Jacob Lu, Ideogram'a katılmadan önce Amazon'da ve diğer şirketlerde çalışmış bir yazılım mühendisidir; Jenny Lei, Ideogram AI'ya katılmadan önce Google'da çalışmış bir yazılım mühendisliği stajyeridir.

** hâlâ video oluşturmamız gerekiyor **

Ideogram AI'nin dört ortak yaratıcısı, Google sırasında Imagen Video video oluşturmanın takip çalışmasını da tamamladı.

Bir yıl önce ise 1280*768 çözünürlükte ve saniyede 24 kare yüksek çözünürlüklü video klip neslini hayata geçirdi.

Aslında bu yılın Mart ayında Qubit, yatırım piyasasından melek tur değerlemelerinin 100 milyon ABD dolarına ulaştığını, daha fazla risk sermayesinin para vermek istediğini ancak yetişemediğini, yatırım yapamadığını ve girişimcilikleri hakkında daha fazla haber aldığını öğrendi. yön:

** Gelecekte sadece görüntü üretimi değil, aynı zamanda video üretimi de. **

Imagen veya Imagen Video'dan bağımsız olarak Google, güvenlik ve etik kaygılar nedeniyle hiçbir zaman demoları, API'leri veya açık kaynak kodlarını yayınlamamıştır.

Araştırma sonuçlarının uygulamaya dönüştürülememesi, son yıllarda Google'dan ayrılan birçok girişimcinin karşılaştığı ortak sorundur.

Örneğin, Transformer'ın büyük model tarafındaki sekiz yazarından Cohere'in kurucusu Aidan Gomez, bir keresinde ayrılma nedeninin *"Google'da büyük modelin gerçek gücünü göremedim" olduğunu söylemişti. *.

Ashish Vaswani ve Niki Parmar'ın Adept AI ve Essential AI'yi başlatmak için Google'dan ayrılmasının nedeni de "Google, mevcut ürünleri optimize etmek için Transformer'ı kullanmak istiyor ve biz de yeni ürünler oluşturmak istiyoruz".

Daha sonra bu araştırmacıların korktuğu şey gerçekten de gerçekleşti:

Her ne kadar Mayıs 2021 (ChatGPT eğitim verileri için son tarihten önce) Google bir LaMDA diyalog modeli ve bir sohbet robotu geliştirmiş olsa da, ürünün piyasaya sürülmesiyle ilgili çok fazla endişe var ve son olarak** 18 ay sonra, yan tarafta doğrudan halka açıldıChatGPT** ve ilgi odağı oldu.

……

Bu dersleri öğrendikten sonra yeni kurulan Ideogram AI da mümkün olduğu kadar açık olma ve öncelikle kullanıcıları oyuna çekme duruşunu benimsedi.

İlk etapta 1000 kişilik test kontenjanı açıklanmıştı ancak kısa sürede doldu.

Görünüşe göre bugün bazı kotalar açıldı ve kübitler sabah kayıt olduklarında kuyrukla karşılaşmadılar.

Kısacası koltuk sayısı yine de sınırlı olmalı, ilgilenenlerin acele etmesi gerekiyor.

Deneme adresi:

Referans bağlantısı: [1] /öğle yemeği [2] [3] [4]

View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Reward
  • Comment
  • Repost
  • Share
Comment
0/400
No comments
  • Pin
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate App
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)