Tengah perjalanan bertemu saingan! Google AI melukis 4 sapi besar memulai bisnis, mencoba teknologi Imagen secara gratis, dan memenangkan 120 juta pembiayaan malaikat

Sumber asli: Qubit

Sumber gambar: Dihasilkan oleh AI Tanpa Batas‌

MidJourney, di atas takhta lukisan AI, akhirnya mengantarkan lawan yang kuat.

Penantang terbaru Ideogram lahir entah dari mana, awalnya ia mengandalkan registrasi gratis untuk menarik banyak perhatian.

Fitur yang paling menarik perhatian: Menghasilkan teks secara tepat dalam gambar, ilmuwan NVIDIA Fan Linxi langsung menggunakannya untuk menggambar "Sudah berakhir, Tengah Perjalanan".

Perusahaan di baliknya, Ideogram AI, adalah proyek kewirausahaan Google AI yang melukis 4 sapi besar yang berangkat secara kolektif, berlokasi di Toronto, dan mendapatkan pembiayaan putaran awal sebesar US$16,5 juta (sekitar 120 juta yuan).

4 anggota pertama dari tim pendiri semuanya adalah penulis makalah Imagen penelitian grafik Google Vincent, yang membentuk tim peneliti model difusi terbaik.

Hasil riset lanjutan yang sekian lama disembunyikan Google dan belum diketahui semua orang akhirnya dirilis oleh mereka.

Putaran unggulan Ideogram AI dipimpin oleh a16z dan Index Ventures.

Ada juga tokoh terkenal di kalangan investor individu, seperti anggota pendiri OpenAI Andrej Karpathy, guru pembelajaran penguatan Pieter Abbeel, pendiri Node.js Ryan Dahl, salah satu pendiri GitHub ** Tom Preston-Werner** dkk.

Bahkan bos lama tim, mantan pemimpin otak Google Jeff Dean juga berpartisipasi.

Terlepas dari kenyataan bahwa tim pendiri semuanya berlatar belakang teknis, Ideogram AI juga tegas dalam hal publisitas dan promosi, dan secara langsung meminta semua orang untuk menggunakan tag kreasi kedua pada 𝕏, yang memulai gelombang pemasaran viral.

AI belajar menggambar teks secara akurat

Selalu menjadi masalah jika AI menggambar teks secara akurat. Meskipun fungsi menggambar ulang sebagian SDXL dan Midjourney telah meningkat, namun tingkat keberhasilan umpan balik dari netizen belum terlalu tinggi, dan diperlukan upaya berulang kali.

Setelah Ideogram mengatasi masalah ini, langsung dimainkan oleh netizen.

Tidak masalah membiarkan teks muncul pada tanda dan beradaptasi dengan cahaya dan bayangan sekitar pada saat yang bersamaan.

Tidak apa-apa membuat seni latte.

Poster bergaya abstrak juga dapat muncul dengan font dengan gaya yang sesuai.

Singkatnya, logo merek penuh dengan atribut produktivitas.

Terlihat juga dari kata-kata cepat yang dibagikan oleh netizen bahwa "mantra" untuk meningkatkan kemungkinan keberhasilan menggambar teks juga sangat sederhana, cukup satu kata:

tipografi (penataan huruf pencetakan)

Namun sayang sekali ia kurang pandai menguasai bahasa Mandarin.

Selain teks, kemampuan pembuatan gambar dan kualitas keluaran Ideogram sebanding dengan MidJourney dan Stable Diffusion.

Jika Anda menggunakan teknologi yang sama persis dengan Imagen, maka menggunakan Google T5 sebagai pengganti OpenAI CLIP sebagai model pengkodean bahasa berarti Ideogram memiliki pemahaman yang lebih kuat tentang deskripsi hubungan spasial dalam kata-kata cepat.

Seseorang telah berhasil menggunakannya untuk menghasilkan sekumpulan gambar dengan gaya yang konsisten.

Dikombinasikan dengan alat pembuat video Pika Labs, dapat langsung memproduksi film pendek ala trailer film.

Tim Peneliti Teratas Model Difusi

Tim pendiri Ideogram AI terdiri dari 7 orang, 4 di antaranya merupakan rekan penulis Google Imagen.

Di antara mereka, rekan penulis Mohammad Norouzi adalah CEO. Ia menerima Beasiswa Ph.D. Google ML selama gelar Ph.D. di bidang Ilmu Komputer di Universitas Toronto.

Setelah lulus, ia bergabung dengan Google Brain selama 7 tahun. Selain menghasilkan model, ia juga merupakan anggota asli tim Google Neural Machine Translation, dan salah satu penulis kerangka pembelajaran kontrastif SimCLR yang diawasi sendiri oleh tim Hinton.

Rekan penulis William Chan (Chen Junle) adalah CTO perusahaan baru, pernah belajar di Universitas Waterloo di Kanada dan Universitas Carnegie Mellon.

Saat bergabung dengan Google pada tahun 2012, dia pertama kali mengerjakan proyek periklanan pembelajaran mesin, lalu dipindahkan ke Google Brain untuk penelitian NLP.

Rekan penulis ketiga Chitwan Saharia lulus dari Institut Teknologi Bombay, bergabung dengan Google pada tahun 2019, dan kini menjadi salah satu pendiri Ideogram.

Salah satu pendiri keempat Dr. Jonathan Ho** lulus dari UC Berkeley, bekerja di OpenAI selama satu tahun, dan kemudian bergabung dengan Google.

Selain menjadi kontributor inti makalah Imagen, ia juga merupakan karya dasar model difusi denoising "Model Probabilistik Difusi Denoising". Pieter Abbeel, salah satu penulis makalah ini, juga merupakan investor di Ideogram AI.

Tiga orang lainnya dalam tim pendiri, Shayaan Abdullah adalah seorang insinyur pembelajaran mesin di Twitter, keluar pada bulan April tahun ini, dan kemudian bergabung dengan Ideogram AI.

Jacob Lu adalah insinyur perangkat lunak yang bekerja di Amazon dan perusahaan lain sebelum bergabung dengan Ideogram; Jenny Lei adalah karyawan magang rekayasa perangkat lunak yang bekerja di Google sebelum bergabung dengan Ideogram AI.

masih perlu melakukan pembuatan video

Keempat pencipta Ideogram AI bersama juga menyelesaikan pekerjaan lanjutan pembuatan video Imagen Video di Google.

Setahun yang lalu, mereka telah merealisasikan pembuatan klip video definisi tinggi dengan resolusi 1280*768 dan 24 frame per detik.

Faktanya, pada bulan Maret tahun ini, Qubit mengetahui dari pasar investasi bahwa penilaian angel round mereka mencapai 100 juta dolar AS, lebih banyak VC yang ingin memberikan uang tetapi tidak dapat mengejar, tidak dapat berinvestasi, dan lebih banyak berita tentang kewirausahaan mereka. arah:

**Tidak hanya generasi gambar, tetapi juga generasi video di masa depan. **

Terlepas dari Imagen atau Imagen Video, Google tidak pernah merilis demo, API, atau kode sumber terbuka karena pertimbangan keamanan dan etika.

Hasil penelitian tidak dapat diubah menjadi aplikasi, yang merupakan masalah umum yang dihadapi oleh banyak pengusaha yang meninggalkan Google dalam beberapa tahun terakhir.

Misalnya, di antara delapan penulis Transformer di sisi model besar, Aidan Gomez, pendiri Cohere, pernah mengatakan bahwa alasan keluarnya adalah *"Saya tidak melihat kekuatan sebenarnya dari model besar di Google" *.

Alasan Ashish Vaswani dan Niki Parmar meninggalkan Google untuk memulai Adept AI dan Essential AI juga "Google ingin menggunakan Transformer untuk mengoptimalkan produk yang sudah ada, dan kami ingin membuat produk baru".

Belakangan, apa yang ditakutkan para peneliti tersebut memang terjadi:

Meskipun Mei 2021 (lebih awal dari batas waktu data pelatihan ChatGPT) Google telah mengembangkan model dialog LaMDA dan chatbot, namun ada terlalu banyak kekhawatiran dalam peluncuran produk tersebut, dan akhirnya** 18 bulan kemudian, langsung dibuka untuk umum di sebelahChatGPT** dan mencuri perhatian.

......

Setelah mempelajari pembelajaran ini, Ideogram AI yang baru didirikan juga telah mengadopsi sikap seterbuka mungkin dan pertama-tama menarik pengguna untuk bermain.

Kuota pengujian 1.000 orang pada awalnya diumumkan, tetapi kuota tersebut terisi dalam waktu singkat.

Nampaknya beberapa kuota sudah dibuka hari ini, dan qubit tidak menemui antrian saat mendaftar di pagi hari.

Singkatnya, jumlah kursi harus tetap dibatasi, dan mereka yang berminat harus bergegas.

Alamat percobaan:

Tautan referensi: [1] /meluncurkan [2] [3] [4]

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
0/400
Tidak ada komentar
  • Sematkan
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)