منتصف الرحلة يلتقي منافس! جوجل ترسم 4 بقرات كبيرة بالذكاء الاصطناعي لتبدأ مشروعًا تجاريًا، وجرب تقنية Imagen مجانًا، واربح 120 مليون تمويل ملائكي

المصدر الأصلي: Qubit

مصدر الصورة: تم إنشاؤها بواسطة Unbounded AI‌

منتصف الرحلة، على عرش الرسم بالذكاء الاصطناعي، بشرت أخيرًا بخصم قوي.

أحدث المتنافسين، Ideogram، ولد من العدم. في البداية، اعتمد على التسجيل المجاني لجذب الكثير من الاهتمام.

الميزة الأكثر لفتًا للانتباه: إنشاء نص في الصورة بدقة، استخدمها عالم NVIDIA Fan Linxi مباشرةً لرسم "لقد انتهى الأمر، منتصف الرحلة".

الشركة التي تقف وراء ذلك، Ideogram AI، هي مشروع ريادي تابع لشركة Google AI لرسم 4 أبقار كبيرة غادرت بشكل جماعي، ومقرها في تورونتو، وحصلت على تمويل أولي بقيمة 16.5 مليون دولار أمريكي (حوالي 120 مليون دولار أمريكي) يوان).

أول 4 أعضاء في الفريق المؤسس هم جميعهم مؤلفو ورقة Imagen لأبحاث الرسم البياني لـ Google Vincent، ويشكلون فريق بحث رفيع المستوى لنماذج الانتشار.

لقد تم أخيرًا إصدار نتائج البحث المتقدمة التي أخفتها Google لفترة طويلة ولم يتم تشغيلها من قبل الجميع.

تمت قيادة جولة Ideogram AI الأولية بواسطة a16z وIndex Ventures.

هناك أيضًا شخصيات معروفة بين المستثمرين الأفراد، مثل العضو المؤسس لـ OpenAI أندريه كارباثي، وخبير التعلم المعزز بيتر أبيل، ومؤسس Node.js ريان دال، والمؤسس المشارك لـ GitHub ** توم بريستون-فيرنر ** وآخرون.

حتى رئيس الفريق القديم، قائد العقل السابق في Google جيف دين شارك أيضًا.

وبغض النظر عن حقيقة أن جميع أعضاء الفريق المؤسس لديهم خلفيات تقنية، فإن Ideogram AI لا لبس فيه أيضًا من حيث الدعاية والترويج، فقد دعا الجميع بشكل مباشر إلى استخدام علامة الإنشاء الثانية على 𝕏، والتي بدأت موجة من التسويق الفيروسي.

يتعلم الذكاء الاصطناعي رسم النص بدقة

لقد كانت دائمًا مشكلة السماح للذكاء الاصطناعي برسم النص بدقة. على الرغم من تحسن وظائف إعادة الرسم الجزئي الجديدة لـ SDXL وMidjourney، إلا أن معدل نجاح التعليقات من مستخدمي الإنترنت لم يكن مرتفعًا جدًا، ويتطلب الأمر محاولات متكررة.

بمجرد أن قام Ideogram بحل نقطة الألم هذه، تم تشغيلها مباشرة بواسطة مستخدمي الإنترنت.

لا توجد مشكلة في السماح للنص بالظهور على اللافتة والتكيف مع الضوء المحيط والظل في نفس الوقت.

لا بأس أن تصنع فن اللاتيه.

يمكن أيضًا أن تأتي الملصقات ذات النمط التجريدي بخطوط ذات أنماط مناسبة.

باختصار، شعار العلامة التجارية مليء بالسمات الإنتاجية.

يمكن أيضًا أن نرى من الكلمات السريعة التي شاركها مستخدمو الإنترنت أن "التهجئة" لزيادة احتمالية نجاح رسم النص هي أيضًا بسيطة جدًا، فقط كلمة واحدة:

** الطباعة ** (تنضيد الطباعة)

لكن من المؤسف أنه ليس جيدًا في إتقان اللغة الصينية.

بصرف النظر عن النص، فإن قدرة Ideogram على توليد الصور وجودة الإخراج قابلة للمقارنة مع MidJourney وStable Diffusion.

إذا كنت تستخدم نفس تقنية Imagen تمامًا، فإن استخدام Google T5 بدلاً من OpenAI CLIP كنموذج ترميز اللغة يعني أن Ideogram لديه فهم أقوى لوصف العلاقة المكانية في الكلمات السريعة.

لقد استخدمه شخص ما بنجاح لإنشاء مجموعة من الصور بأسلوب ثابت.

ومن خلال دمجه مع أداة إنشاء الفيديو Pika Labs، يمكنه إنتاج أفلام قصيرة مباشرة بأسلوب إعلانات الأفلام.

فريق البحث الأعلى لنموذج الانتشار

يتكون الفريق المؤسس لشركة Ideogram AI من 7 أشخاص، 4 منهم مؤلفون مشاركين في Google Imagen.

من بينهم، المؤلف المشارك محمد نوروزي هو الرئيس التنفيذي، وقد حصل على منحة Google ML Ph.D. أثناء حصوله على درجة الدكتوراه في علوم الكمبيوتر في جامعة تورنتو.

بعد التخرج، انضم إلى Google Brain لمدة 7 سنوات، بالإضافة إلى إنشاء النماذج، كان أيضًا عضوًا أصليًا في فريق الترجمة الآلية العصبية من Google، ومؤلفًا مشاركًا لإطار التعلم التقابلي الخاضع للإشراف الذاتي لفريق هينتون SimCLR.

المؤلف المشارك وليام تشان (تشن جونلي) هو المدير التنفيذي للتكنولوجيا في الشركة الجديدة، وقد درس في جامعة واترلو في كندا وجامعة كارنيجي ميلون.

عندما انضم إلى Google في عام 2012، قام أولاً بمشروع إعلاني للتعلم الآلي، ثم انتقل بعد ذلك إلى Google Brain لإجراء أبحاث البرمجة اللغوية العصبية.

المؤلف المشارك الثالث Chitwan Saharia تخرج من معهد بومباي للتكنولوجيا، وانضم إلى Google في عام 2019، وهو الآن المؤسس المشارك لشركة Ideogram.

المؤسس المشارك الرابع، الدكتور جوناثان هو**، تخرج من جامعة كاليفورنيا في بيركلي، وعمل في OpenAI لمدة عام، ثم انضم إلى Google.

بالإضافة إلى كونه مساهمًا أساسيًا في ورقة إيماجين، فهو أيضًا العمل التأسيسي لنموذج انتشار تقليل الضوضاء "النماذج الاحتمالية لانتشار تقليل الضوضاء". بيتر أبيل، أحد المؤلفين المشاركين في هذه الورقة، هو أيضًا مستثمر في Ideogram AI.

أما الأشخاص الثلاثة الآخرون في الفريق المؤسس، شيان عبد الله، فقد كان مهندسًا للتعلم الآلي في تويتر، وقد غادر في أبريل من هذا العام، ثم انضم إلى Ideogram AI.

جاكوب لو هو مهندس برمجيات عمل في Amazon وشركات أخرى قبل انضمامه إلى Ideogram؛ Jenny Lei هو متدرب في هندسة البرمجيات عمل في Google قبل انضمامه إلى Ideogram AI.

** لا تزال بحاجة إلى إنشاء الفيديو **

أكمل المبدعون الأربعة المشتركون لـ Ideogram AI أيضًا أعمال متابعة إنشاء الفيديو Imagen Video خلال Google.

منذ عام مضى، حققت إنتاج مقاطع فيديو عالية الوضوح بدقة 1280*768 و24 إطارًا في الثانية.

في الواقع، في شهر مارس من هذا العام، علمت شركة Qubit من سوق الاستثمار أن تقييمها الاستثماري وصل إلى 100 مليون دولار أمريكي، وأن المزيد من أصحاب رأس المال المغامر أرادوا التبرع بالمال لكنهم لم يتمكنوا من اللحاق بالركب، ولم يتمكنوا من الاستثمار، والمزيد من الأخبار حول ريادة الأعمال الخاصة بهم. اتجاه:

** ليس فقط توليد الصور، ولكن أيضًا إنشاء الفيديو في المستقبل. **

بغض النظر عن Imagen أو Imagen Video، لم تقم Google مطلقًا بإصدار عروض توضيحية أو واجهات برمجة التطبيقات أو أكواد مفتوحة المصدر نظرًا لاعتبارات أمنية وأخلاقية.

لا يمكن تحويل نتائج الأبحاث إلى تطبيقات، وهي مشكلة شائعة واجهها العديد من رواد الأعمال الذين تركوا Google في السنوات الأخيرة.

على سبيل المثال، من بين مؤلفي Transformer الثمانية من جانب النماذج الكبيرة، قال Aidan Gomez، مؤسس Cohere، ذات مرة إن سبب المغادرة هو *"لم أر القوة الحقيقية للنموذج الكبير في Google" *.

السبب وراء مغادرة Ashish Vaswani وNiki Parmar لشركة Google لبدء Adept AI وEssential AI هو أيضًا "تريد Google استخدام Transformer لتحسين المنتجات الحالية، ونريد إنشاء منتجات جديدة".

وفي وقت لاحق، حدث بالفعل ما كان يخشاه هؤلاء الباحثون:

على الرغم من أن مايو 2021 (أي قبل الموعد النهائي لبيانات تدريب ChatGPT) قد طورت Google نموذج حوار LaMDA وروبوت دردشة، إلا أن هناك الكثير من المخاوف بشأن إطلاق المنتج، وأخيرًا** بعد 18 شهرًا، **تم فتحه مباشرة للجمهور من المنزل المجاور ChatGPT وسرق الأضواء.

……

بعد أن تعلمت هذه الدروس، تبنت Ideogram AI المنشأة حديثًا أيضًا موقفًا يتمثل في كونها منفتحة قدر الإمكان وتجذب المستخدمين للعب أولاً.

تم الإعلان في البداية عن حصة اختبارية لـ 1000 شخص، لكنها امتلأت في وقت قصير.

يبدو أنه تم فتح بعض الحصص اليوم، ولم تواجه الكيوبتات قائمة انتظار عند التسجيل في الصباح.

باختصار، يجب أن يظل عدد المقاعد محدودا، وعلى المهتمين أن يسارعوا.

عنوان المحاكمة:

الرابط المرجعي: [1] /يطلق [2] [3] [4]

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت