Midjourney встречает соперника! Искусственный интеллект Google рисует четырех больших коров. Начните бизнес, бесплатно попробуйте технологию Imagen и выиграйте 120 миллионов ангельских денег.

Первоисточник: Кубит

Источник изображения: Создано Unbounded AI‌

MidJourney, восседавшая на троне ИИ-живописи, наконец-то представила себе сильного противника.

Новый претендент, Ideogram, родился из ниоткуда. Поначалу он полагался на бесплатную регистрацию, чтобы привлечь много внимания.

Самая привлекательная функция: Точная генерация текста на картинке. Ученый NVIDIA Фан Линьси напрямую использовал ее, чтобы нарисовать "Все кончено, середина пути".

Компания Ideogram AI, стоящая за этим проектом, представляет собой предпринимательский проект, в котором ИИ Google рисует четырех больших коров, которые вместе ушли, расположенные в Торонто, и получили начальный раунд финансирования в размере 16,5 миллионов долларов США (около 120 миллионов долларов США). юаней).

Все первые четыре члена команды основателей являются авторами документа Imagen об исследовании графов Google Vincent, образуя ведущую исследовательскую группу диффузионных моделей.

Результаты передовых исследований, которые Google так долго скрывал и которыми не все пользовались, наконец-то были ими обнародованы.

Посевной раунд Ideogram AI возглавили a16z и Index Ventures.

Среди индивидуальных инвесторов также есть известные фигуры, такие как один из основателей OpenAI Андрей Карпати, гуру обучения с подкреплением Питер Аббил, основатель Node.js Райан Даль, соучредитель GitHub ** Том Престон-Вернер** и др.

Даже старый босс команды, бывший руководитель отдела Google Джефф Дин, также принял участие.

Несмотря на то, что у команды основателей есть техническое образование, Ideogram AI также однозначен с точки зрения рекламы и продвижения.Он напрямую призывал всех использовать второй тег создания на 𝕏, что положило начало волне вирусного маркетинга.

ИИ учится точно рисовать текст

Всегда было проблемой позволить ИИ точно рисовать текст. Хотя новые функции частичной перерисовки SDXL и Midjourney улучшились, процент успешных отзывов от пользователей сети не очень высок, и требуются повторные попытки.

Как только Ideogram решила эту болевую точку, пользователи сети начали напрямую играть в нее.

Нет проблем позволить тексту появиться на знаке и одновременно адаптироваться к окружающему свету и тени.

Делать латте-арт — это нормально.

Для плакатов в абстрактном стиле также можно использовать шрифты соответствующего стиля.

Одним словом, логотип бренда полон атрибутов продуктивности.

Из подсказок, которыми поделились пользователи сети, также можно увидеть, что «заклинание», повышающее вероятность успешного рисования текста, также очень простое, всего одно слово:

типография (полиграфия, верстка)

Но жаль, что он не очень хорошо владеет китайским языком.

Помимо текста, возможности генерации изображений и качество вывода Ideogram сопоставимы с MidJourney и Stable Diffusion.

Если вы используете ту же технологию, что и Imagen, то использование Google T5 вместо OpenAI CLIP в качестве модели языкового кодирования означает, что Ideogram лучше понимает описание пространственных отношений в словах-подсказках.

Кто-то успешно использовал его для создания набора изображений в едином стиле.

В сочетании с инструментом создания видео Pika Labs он может напрямую создавать короткометражные фильмы в стиле трейлеров к фильмам.

Лучшая исследовательская группа по модели диффузии

Команда основателей Ideogram AI состоит из 7 человек, 4 из которых являются соавторами Google Imagen.

Среди них соавтор Мохаммад Норузи, являющийся генеральным директором.Он получил стипендию Google ML Ph.D. во время работы над докторской диссертацией в области компьютерных наук в Университете Торонто.

После окончания учебы он проработал 7 лет в Google Brain. Помимо создания моделей, он также был одним из первых членов команды Google Neural Machine Translation и соавтором системы самоконтролируемого контрастивного обучения SimCLR команды Hinton.

Соавтор Уильям Чан (Чэнь Джунлэ) — технический директор новой компании, учился в Университете Ватерлоо в Канаде и Университете Карнеги-Меллон.

Когда он присоединился к Google в 2012 году, он сначала занимался рекламным проектом по машинному обучению, а затем перешел в Google Brain для исследований НЛП.

Третий соавтор Читван Сахария окончил Бомбейский технологический институт, присоединился к Google в 2019 году и сейчас является соучредителем Ideogram.

Четвертый соучредитель, доктор Джонатан Хо**, окончил Калифорнийский университет в Беркли, год проработал в OpenAI, а затем присоединился к Google.

Помимо того, что он является одним из основных авторов статьи Imagen, он также является основоположником модели шумоподавляющей диффузии "Вероятностные модели шумоподавляющей диффузии". Питер Аббил, один из соавторов этой статьи, также является инвестор в Ideogram AI.

Остальные три человека из команды основателей, Шаяан Абдулла, работали инженером по машинному обучению в Twitter, ушли из компании в апреле этого года, а затем присоединились к Ideogram AI.

Джейкоб Лу — инженер-программист, который до прихода в Ideogram работал в Amazon и других компаниях; Дженни Лей — стажер по разработке программного обеспечения, которая работала в Google до прихода в Ideogram AI.

** еще нужно сделать генерацию видео **

Четыре совместных создателя Ideogram AI также завершили последующую работу по созданию видео Imagen Video в Google.

Год назад реализована генерация видеоклипов высокой четкости с разрешением 1280*768 и частотой 24 кадра в секунду.

Фактически, в марте этого года Qubit узнал на инвестиционном рынке, что оценка их ангельского раунда достигла 100 миллионов долларов США, все больше венчурных капиталистов хотели дать деньги, но не смогли догнать, не смогли инвестировать, и еще больше новостей об их предпринимательской деятельности. направление:

** Не только генерация изображений, но и генерация видео в будущем. **

Независимо от Imagen или Imagen Video, Google никогда не выпускала демо-версии, API или открытые исходные коды из соображений безопасности и этики.

Результаты исследований невозможно преобразовать в приложения — это распространенная проблема, с которой сталкиваются многие предприниматели, ушедшие из Google в последние годы.

Например, среди восьми авторов Transformer, занимающихся большой моделью, основатель Cohere Эйдан Гомес однажды сказал, что причиной ухода было "Я не видел реальной силы большой модели в Google".

Причина, по которой Ашиш Васвани и Ники Пармар покинули Google, чтобы основать Adept AI и Essential AI, также заключается в том, что "Google хочет использовать Transformer для оптимизации существующих продуктов, а мы хотим создавать новые продукты".

Позже то, чего опасались эти исследователи, действительно произошло:

Хотя май 2021 года (раньше крайнего срока получения данных для обучения ChatGPT) Google разработала диалоговую модель LaMDA и чат-бота, но при запуске продукта возникает слишком много проблем, и, наконец** 18 месяцев спустя, был открыт для публики непосредственно у соседней двериChatGPT** и привлек к себе всеобщее внимание.

……

Усвоив эти уроки, недавно созданная компания Ideogram AI также взяла на себя задачу быть максимально открытой и в первую очередь привлекать пользователей к игре.

Первоначально была объявлена квота тестирования в 1000 человек, но она быстро заполнилась.

Кажется, сегодня были открыты какие-то квоты, и кубиты не встретились с очередью при регистрации утром.

Короче говоря, количество мест все равно должно быть ограничено, а желающим стоит поторопиться.

Пробный адрес:

Справочная ссылка: [1] /запуск [2] [3] [4]

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить