31 серпня перша партія великомасштабних модельних продуктів Китаю пройшла для протоколу «Тимчасові заходи щодо управління службами генеративного штучного інтелекту» та може бути офіційно запущена для надання послуг громадськості. Перша партія з 8 запущених великомасштабних моделей включає Baidu Wenxin Yiyan, великомасштабну модель Skylark від Byte, великомасштабну модель Baichuan від Baichuan Intelligent і Zhipu Qingyan під керівництвом компанії зі штучного інтелекту Zhipu Huazhang, розташованої в Цинхуа.
З початку цього року великі моделі користуються надзвичайною популярністю та є місцем змагання для великих виробників у всьому світі.Усі великі технологічні компанії випустили власні великі моделі, представляючи грандіозну подію «Битви 100 моделей».
Велика модель стимулює розвиток цифрової економіки
Починаючи з 31 серпня, користувачі можуть завантажити «Wenxin Yiyan APP» у магазині програм або увійти на «офіційний веб-сайт Wenxin Yiyan», щоб випробувати його. Baidu також відкриє серію нещодавно реконструйованих власних додатків ШІ, що дозволить користувачам відчути чотири основні можливості генеративного ШІ: розуміння, генерація, логіка та пам’ять.
Джерело: офіційний сайт Wenxinyiyan
Робін Лі, засновник, голова правління та генеральний директор Baidu, якось сказав, що великомасштабні моделі проникатимуть у все більше сфер. Цифрова економіка, керована великомасштабними моделями, буде глибоко інтегрована з реальною економікою та ставатиме сильнішою, кращою та економіки, створюють значну додаткову вартість, спричиняють економічний і соціальний розвиток і глибокі зміни в промисловості.
Відомо, що за останні десять років Baidu інвестувала понад 140 мільярдів юанів у дослідження та розробки, ставши компанією зі штучного інтелекту з чотирирівневим компонуванням повного стека додатків, моделей, фреймворків і чіпів, досягаючи повного завершення. -кінцева оптимізація та лідерство в галузі на всіх рівнях.Технологія власної розробки.
Джерело: «Звіт про дослідження великої моделі штучного інтелекту Китаю»
Також рано вранці 31 числа Baichuan Intelligence також оголосила, що її велику модель було зареєстровано через «Тимчасові заходи щодо управління службами генеративного штучного інтелекту» та відкрита для громадськості. Користувачі можуть увійти на офіційний веб-сайт, щоб пережити це.
Baichuan Intelligence була заснована 10 квітня 2023 року колишнім генеральним директором Sogou Ван Сяочуанем. Основна команда складається з найкращих талантів ШІ з відомих технологічних компаній, таких як Sogou, Baidu, Huawei, Microsoft, Byte і Tencent. Лише через чотири місяці після заснування Baichuan Intelligent випустила три великі мовні моделі загального призначення, у тому числі Baichuan-7B, першу в країні велику мовну модель з відкритим кодом із 7 мільярдами параметрів, яку можна комерціалізувати безкоштовно, і Baichuan-53B, велику модель мови з 53 мільярдами параметрів. зачекайте.
Джерело: офіційний веб-сайт Baichuan Smart
HKUST Xunfei офіційно випустив «Когнітивну модель Xunfei Spark» 6 травня цього року. HKUST Xunfei сказав, що до 24 жовтня цього року Xunfei Xinghuo проведе загальний порівняльний аналіз моделі з ChatGPT. У звіті про оцінку великомасштабної моделі, опублікованому MIT Technology Review China 17 серпня, Xunfei Xinghuo V2.0 посів перше місце із загальною оцінкою 81,5 бала і був названий «найрозумнішою» великомасштабною моделлю в Китаї.
Глобальні великі моделі цвітуть більше
Штучний інтелект переходить із хмари на термінал. З глобальної точки зору такі виробники, як Google, Microsoft і Apple, також розробляють великі моделі терміналів, і полегшення стало важливим напрямком розвитку для розгортання великих моделей у терміналах.
Джерело: DragonImages
У травні цього року Google випустив PaLM2, велику модель, яка підходить для edge. Зокрема, існує чотири специфікації великої моделі PaLM2, а саме Gecko (Гекко), Otter (Видра), Bison (Бізон) і Unicorn (Єдиноріг). Серед них Gecko дуже легкий і працює на мобільних пристроях. Більш легка, але якісніша модель може значно підвищити ефективність висновків і знизити витрати на обслуговування, дозволяючи додаткам моделі адаптуватися до більшої кількості програм і користувачів, що робить можливим розгортання AI edge.
У липні Apple офіційно оголосила про запуск розробки AppleGPT, приєднавшись до битви за великомасштабні моделі ШІ терміналу. Відомо, що AppleGPT — це інструмент штучного інтелекту, розроблений компанією Apple на основі фреймворку Ajax, який вона сама розробила, і зараз він проходить невелике внутрішнє тестування в Apple.
Джерело: Pixabay
У той же час Microsoft відкрила модель навчання DeepSpeedChat і LLaMA з відкритим вихідним кодом Meta, що швидко спричинило тренд навчання на основі LLaMA серед розробників ШІ, прискоривши проникнення таких методів навчання, як Lora. Мається на увазі, що моделі Deepspeed і Lora надають розробникам малого та середнього бізнесу повні інструменти для недорогого та швидкого навчання їхніх власних «малих моделей», прискорюючи встановлення шаблонів розподілу градієнтів для великих моделей.
Що стосується виробників мікросхем, то на конференції MWC 2023 компанія Qualcomm випустила першу в світі демонстрацію на стороні терміналу Stable Diffusion, яка працює на телефоні Android. Згідно з повідомленнями, параметри моделі Stable Diffusion перевищують 1 млрд. Qualcomm використовує свій програмний стек AI для кількісної оцінки, компіляції та оптимізації апаратного прискорення моделі, щоб вона могла успішно працювати на мобільних телефонах, оснащених мобільною платформою Snapdragon 8 другого покоління. .
Джерело: Pixabay
Велика модель "додаток" і "нагляд" йдуть рука об руку
У березні цього року ChatGPT 3.5, новий чат-робот зі штучним інтелектом, запущений OPEN AI, стартап-компанією з Кремнієвої долини, продемонстрував свою дивовижну здатність вести діалог. Лише за два місяці кількість активних користувачів ChatGPT досягла 100 мільйонів щомісяця, що зробило його найшвидше зростаючим споживчим додатком в історії.
Зіштовхнувшись із можливостями та проблемами, пов’язаними з генеративним штучним інтелектом, країни мають різні думки щодо того, як регулювати штучний інтелект. Китай, Сполучені Штати, Європейський Союз та інші країни або регіони швидко відреагували, тоді як Сінгапур та Індія оголосили, що наразі не планують регулювати ШІ.
15 серпня в Китаї було офіційно введено в дію «Тимчасові заходи щодо управління службами генеративного штучного інтелекту», що вважається першим у світі законодавством щодо генеративного штучного інтелекту.
Джерело: Pixabay
Впроваджуючи правила та положення, «Заходи» додатково заохочують інноваційне застосування технології генеративного штучного інтелекту в різних галузях і сферах, а також підтримують різні організації в інноваціях технології генеративного штучного інтелекту, створенні ресурсів даних, перетворенні та застосуванні, запобіганні ризикам тощо Співпрацювати для сприяння створенню інфраструктури генеративного штучного інтелекту та публічних навчальних платформ ресурсів даних.
Люди в галузі сказали, що із запровадженням «Заходів» очікується, що велика модель штучного інтелекту поступово увійде в стадію конкуренції за нативні програми та боротьби за промислове впровадження через конкуренцію параметрів.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
Скільки томів має «Битва великих моделей»?
Джерело: Всесвітня Інтернет-конференція
31 серпня перша партія великомасштабних модельних продуктів Китаю пройшла для протоколу «Тимчасові заходи щодо управління службами генеративного штучного інтелекту» та може бути офіційно запущена для надання послуг громадськості. Перша партія з 8 запущених великомасштабних моделей включає Baidu Wenxin Yiyan, великомасштабну модель Skylark від Byte, великомасштабну модель Baichuan від Baichuan Intelligent і Zhipu Qingyan під керівництвом компанії зі штучного інтелекту Zhipu Huazhang, розташованої в Цинхуа.
З початку цього року великі моделі користуються надзвичайною популярністю та є місцем змагання для великих виробників у всьому світі.Усі великі технологічні компанії випустили власні великі моделі, представляючи грандіозну подію «Битви 100 моделей».
Велика модель стимулює розвиток цифрової економіки
Починаючи з 31 серпня, користувачі можуть завантажити «Wenxin Yiyan APP» у магазині програм або увійти на «офіційний веб-сайт Wenxin Yiyan», щоб випробувати його. Baidu також відкриє серію нещодавно реконструйованих власних додатків ШІ, що дозволить користувачам відчути чотири основні можливості генеративного ШІ: розуміння, генерація, логіка та пам’ять.
Робін Лі, засновник, голова правління та генеральний директор Baidu, якось сказав, що великомасштабні моделі проникатимуть у все більше сфер. Цифрова економіка, керована великомасштабними моделями, буде глибоко інтегрована з реальною економікою та ставатиме сильнішою, кращою та економіки, створюють значну додаткову вартість, спричиняють економічний і соціальний розвиток і глибокі зміни в промисловості.
Відомо, що за останні десять років Baidu інвестувала понад 140 мільярдів юанів у дослідження та розробки, ставши компанією зі штучного інтелекту з чотирирівневим компонуванням повного стека додатків, моделей, фреймворків і чіпів, досягаючи повного завершення. -кінцева оптимізація та лідерство в галузі на всіх рівнях.Технологія власної розробки.
Також рано вранці 31 числа Baichuan Intelligence також оголосила, що її велику модель було зареєстровано через «Тимчасові заходи щодо управління службами генеративного штучного інтелекту» та відкрита для громадськості. Користувачі можуть увійти на офіційний веб-сайт, щоб пережити це.
Baichuan Intelligence була заснована 10 квітня 2023 року колишнім генеральним директором Sogou Ван Сяочуанем. Основна команда складається з найкращих талантів ШІ з відомих технологічних компаній, таких як Sogou, Baidu, Huawei, Microsoft, Byte і Tencent. Лише через чотири місяці після заснування Baichuan Intelligent випустила три великі мовні моделі загального призначення, у тому числі Baichuan-7B, першу в країні велику мовну модель з відкритим кодом із 7 мільярдами параметрів, яку можна комерціалізувати безкоштовно, і Baichuan-53B, велику модель мови з 53 мільярдами параметрів. зачекайте.
HKUST Xunfei офіційно випустив «Когнітивну модель Xunfei Spark» 6 травня цього року. HKUST Xunfei сказав, що до 24 жовтня цього року Xunfei Xinghuo проведе загальний порівняльний аналіз моделі з ChatGPT. У звіті про оцінку великомасштабної моделі, опублікованому MIT Technology Review China 17 серпня, Xunfei Xinghuo V2.0 посів перше місце із загальною оцінкою 81,5 бала і був названий «найрозумнішою» великомасштабною моделлю в Китаї.
Глобальні великі моделі цвітуть більше
Штучний інтелект переходить із хмари на термінал. З глобальної точки зору такі виробники, як Google, Microsoft і Apple, також розробляють великі моделі терміналів, і полегшення стало важливим напрямком розвитку для розгортання великих моделей у терміналах.
У травні цього року Google випустив PaLM2, велику модель, яка підходить для edge. Зокрема, існує чотири специфікації великої моделі PaLM2, а саме Gecko (Гекко), Otter (Видра), Bison (Бізон) і Unicorn (Єдиноріг). Серед них Gecko дуже легкий і працює на мобільних пристроях. Більш легка, але якісніша модель може значно підвищити ефективність висновків і знизити витрати на обслуговування, дозволяючи додаткам моделі адаптуватися до більшої кількості програм і користувачів, що робить можливим розгортання AI edge.
У липні Apple офіційно оголосила про запуск розробки AppleGPT, приєднавшись до битви за великомасштабні моделі ШІ терміналу. Відомо, що AppleGPT — це інструмент штучного інтелекту, розроблений компанією Apple на основі фреймворку Ajax, який вона сама розробила, і зараз він проходить невелике внутрішнє тестування в Apple.
У той же час Microsoft відкрила модель навчання DeepSpeedChat і LLaMA з відкритим вихідним кодом Meta, що швидко спричинило тренд навчання на основі LLaMA серед розробників ШІ, прискоривши проникнення таких методів навчання, як Lora. Мається на увазі, що моделі Deepspeed і Lora надають розробникам малого та середнього бізнесу повні інструменти для недорогого та швидкого навчання їхніх власних «малих моделей», прискорюючи встановлення шаблонів розподілу градієнтів для великих моделей.
Що стосується виробників мікросхем, то на конференції MWC 2023 компанія Qualcomm випустила першу в світі демонстрацію на стороні терміналу Stable Diffusion, яка працює на телефоні Android. Згідно з повідомленнями, параметри моделі Stable Diffusion перевищують 1 млрд. Qualcomm використовує свій програмний стек AI для кількісної оцінки, компіляції та оптимізації апаратного прискорення моделі, щоб вона могла успішно працювати на мобільних телефонах, оснащених мобільною платформою Snapdragon 8 другого покоління. .
Велика модель "додаток" і "нагляд" йдуть рука об руку
У березні цього року ChatGPT 3.5, новий чат-робот зі штучним інтелектом, запущений OPEN AI, стартап-компанією з Кремнієвої долини, продемонстрував свою дивовижну здатність вести діалог. Лише за два місяці кількість активних користувачів ChatGPT досягла 100 мільйонів щомісяця, що зробило його найшвидше зростаючим споживчим додатком в історії.
Зіштовхнувшись із можливостями та проблемами, пов’язаними з генеративним штучним інтелектом, країни мають різні думки щодо того, як регулювати штучний інтелект. Китай, Сполучені Штати, Європейський Союз та інші країни або регіони швидко відреагували, тоді як Сінгапур та Індія оголосили, що наразі не планують регулювати ШІ.
15 серпня в Китаї було офіційно введено в дію «Тимчасові заходи щодо управління службами генеративного штучного інтелекту», що вважається першим у світі законодавством щодо генеративного штучного інтелекту.
Впроваджуючи правила та положення, «Заходи» додатково заохочують інноваційне застосування технології генеративного штучного інтелекту в різних галузях і сферах, а також підтримують різні організації в інноваціях технології генеративного штучного інтелекту, створенні ресурсів даних, перетворенні та застосуванні, запобіганні ризикам тощо Співпрацювати для сприяння створенню інфраструктури генеративного штучного інтелекту та публічних навчальних платформ ресурсів даних.
Люди в галузі сказали, що із запровадженням «Заходів» очікується, що велика модель штучного інтелекту поступово увійде в стадію конкуренції за нативні програми та боротьби за промислове впровадження через конкуренцію параметрів.