Midjourney зустрічає суперника! Google AI малює 4 великих корів. Розпочніть бізнес, безкоштовно спробуйте технологію Imagen і виграйте 120 мільйонів ангельського фінансування

Перше джерело: Qubit

Джерело зображення: створено Unbounded AI‌

MidJourney, на троні живопису штучного інтелекту, нарешті започаткував сильного суперника.

Найновіший претендент, Ідеограма, народився на порожньому місці.Спочатку він покладався на безкоштовну реєстрацію, щоб привернути багато уваги.

Особливість, яка найбільше привертає увагу: Точне генерування тексту на зображенні, науковець NVIDIA Фан Лінсі безпосередньо використав її, щоб намалювати "Все закінчилось, Midjourney".

Компанія, що стоїть за нею, Ideogram AI, є підприємницьким проектом Google AI, який малює 4 великих корів, які колективно покинули, розташовану в Торонто, і залучили початкове фінансування в розмірі 16,5 мільйонів доларів США (близько 120 мільйонів юань).

Перші 4 члени команди засновників є авторами дослідницької роботи Google Vincent graph Research Imagen, утворюючи найкращу дослідницьку команду моделей дифузії.

Результати передових досліджень, які Google так довго приховував і в які не всі грали, нарешті були опубліковані ними.

Початковий раунд Ideogram AI очолили a16z і Index Ventures.

Серед індивідуальних інвесторів також є відомі особи, такі як засновник OpenAI Андрій Карпаті, гуру навчання з підкріпленням Пітер Аббіл, засновник Node.js Райан Дал, співзасновник GitHub ** Том Престон-Вернер** та ін.

Навіть старий бос команди, колишній головний керівник Google Джефф Дін також брав участь.

Незважаючи на те, що команда засновників має технічну освіту, Ideogram AI також однозначний з точки зору реклами та просування.Він прямо закликав усіх використовувати другий тег створення на 𝕏, що почало хвилю вірусного маркетингу.

ШІ вчиться правильно малювати текст

Завжди було проблемою дозволити ШІ точно малювати текст. Хоча нові функції часткового перемальовування SDXL і Midjourney покращилися, але рівень успішності відгуків користувачів мережі був не дуже високим, тому потрібні повторні спроби.

Щойно Ideogram вирішила цю проблему, користувачі мережі безпосередньо почали її використовувати.

Це не проблема, щоб текст з'явився на вивісці та одночасно адаптувався до навколишнього світла та тіні.

Приготувати латте-арт — це нормально.

Плакати в абстрактному стилі також можуть придумати шрифти з відповідними стилями.

Одним словом, логотип бренду насичений атрибутами продуктивності.

З підказок, якими поділилися користувачі мережі, також видно, що «заклинання» для збільшення ймовірності успіху малювання тексту також дуже просте, лише одне слово:

типографіка (друкарський набір)

Але шкода, що не дуже добре володіє китайською.

Окрім тексту, здатність Ideogram генерувати зображення та якість виводу можна порівняти з MidJourney та Stable Diffusion.

Якщо ви використовуєте ту саму технологію, що й Imagen, то використання Google T5 замість OpenAI CLIP як моделі кодування мови означає, що Ideogram краще розуміє опис просторових відносин у словах підказок.

Хтось успішно використав це для створення набору зображень із узгодженим стилем.

У поєднанні з інструментом генерації відео Pika Labs він може створювати короткометражні фільми у стилі трейлерів.

Краща дослідницька команда Diffusion Model

Команда засновників Ideogram AI складається з 7 осіб, 4 з яких є співавторами Google Imagen.

Серед них співавтор Мохаммад Норузі є генеральним директором. Він отримав стипендію Google ML Ph.D. під час свого докторського ступеня з комп’ютерних наук в Університеті Торонто.

Після закінчення навчання він приєднався до Google Brain на 7 років. Окрім генерації моделей, він також був першим членом команди Google Neural Machine Translation і співавтором самоконтрольованої контрастної навчальної системи SimCLR команди Hinton.

Співавтор Вільям Чан (Chen Junle) є технічним директором нової компанії, навчався в університеті Ватерлоо в Канаді та університеті Карнегі-Меллона.

Коли він приєднався до Google у 2012 році, він спочатку займався рекламним проектом машинного навчання, а потім перейшов у Google Brain для дослідження НЛП.

Третій співавтор Chitwan Saharia закінчив Бомбейський технологічний інститут, приєднався до Google у 2019 році та зараз є співзасновником Ideogram.

Четвертий співзасновник доктор Джонатан Хо** закінчив Каліфорнійський університет у Берклі, рік працював у OpenAI, а потім приєднався до Google.

Крім того, що він є основним учасником статті Imagen, він також є основоположником моделі зменшення шуму дифузії "Denoising Diffusion Probabilistic Models". Пітер Аббіл, один із співавторів цієї статті, також є інвестор в Ideogram AI.

Інші три людини в команді засновників, Шаяан Абдулла, був інженером машинного навчання в Twitter, пішов у квітні цього року, а потім приєднався до Ideogram AI.

Джейкоб Лу – інженер-програміст, який працював в Amazon та інших компаніях до того, як приєднатися до Ideogram; Дженні Лей – стажист із розробки програмного забезпечення, який працював у Google до того, як приєднатися до Ideogram AI.

** ще потрібно створити відео **

Чотири спільні творці Ideogram AI також завершили подальшу роботу зі створення відео Imagen Video під час Google.

Рік тому реалізовано створення відеороликів високої чіткості з роздільною здатністю 1280*768 і 24 кадрами в секунду.

Фактично, у березні цього року Qubit дізнався з інвестиційного ринку, що їхня оцінка ангелів сягнула 100 мільйонів доларів США, більше венчурних капіталовкладачів хотіли дати гроші, але не змогли наздогнати, не могли інвестувати, а також більше новин про їхню підприємницьку діяльність. напрямок:

** Не лише створення зображень, але й створення відео в майбутньому. **

Незалежно від Imagen або Imagen Video, Google ніколи не випускав демонстрації, API або коди з відкритим вихідним кодом з міркувань безпеки та етики.

Результати досліджень не можна перетворити на програми, що є типовою проблемою для багатьох підприємців, які залишили Google в останні роки.

Наприклад, засновник Cohere Ейдан Гомес, один із восьми авторів Transformer на боці великої моделі, сказав, що причиною відходу було «Я не бачив справжньої сили великої моделі в Google».

Причина, по якій Ашиш Васвані та Нікі Пармар залишили Google, щоб створити Adept AI та Essential AI, також полягає в тому, що «Google хоче використовувати Transformer для оптимізації існуючих продуктів, і ми хочемо створювати нові продукти».

Пізніше те, чого боялися ці дослідники, справді сталося:

Незважаючи на те, що травень 2021 (раніше кінцевого терміну підготовки даних ChatGPT) Google розробила модель діалогу LaMDA і чат-бота, але надто багато проблем із запуском продукту, і нарешті** через 18 місяців, був відкритий для публіки в сусідньому будинкуChatGPT** і привернув увагу.

……

Вивчивши ці уроки, нещодавно створений Ideogram AI також зайняв позицію бути максимально відкритим і першим залучати користувачів до гри.

Спочатку була оголошена квота на тестування в 1000 осіб, але вона швидко вичерпалася.

Здається, сьогодні відкрили якісь квоти, і кубіти не зустріли черги, коли реєструвалися вранці.

Одним словом, кількість місць ще обмежена, а бажаючі поспішають.

Пробна адреса:

Посилання на посилання: [1] /запуск [2] [3] [4]

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити