¿Cuántos volúmenes tiene "La batalla de las grandes modelos"?

Fuente: Conferencia Mundial de Internet

El 31 de agosto, el primer lote de productos modelo a gran escala de China se registró a través de las "Medidas provisionales para la gestión de servicios de inteligencia artificial generativa" y se puede lanzar oficialmente en línea para brindar servicios al público. El primer lote de 8 modelos a gran escala que se lanzará incluye Baidu Wenxinyiyan, el modelo a gran escala Skylark de Byte, el modelo a gran escala Baichuan de Baichuan Intelligent, Zhipu Qingyan de la empresa de inteligencia artificial con sede en Tsinghua Zhipu Huazhang, etc.

Desde principios de este año, los modelos a gran escala extremadamente populares siempre han sido la pista de competencia para los fabricantes globales. Todas las principales empresas de tecnología han lanzado sus propios modelos a gran escala, presentando una gran ocasión de "Cien Guerras de Modelos".

Los grandes modelos impulsan el desarrollo de la economía digital

A partir del 31 de agosto, los usuarios pueden descargar la "APLICACIÓN Wenxin Yiyan" en la tienda de aplicaciones o iniciar sesión en el "sitio web oficial de Wenxin Yiyan" para experimentarla. Baidu también abrirá un lote de aplicaciones nativas de IA recientemente reconstruidas, que permitirán a los usuarios experimentar las cuatro capacidades principales de la IA generativa: comprensión, generación, lógica y memoria.

Fuente: sitio web oficial de Wenxinyiyan

Robin Li, fundador, presidente y director ejecutivo de Baidu, dijo una vez que los grandes modelos penetrarán cada vez en más campos. La economía digital, impulsada por los grandes modelos como clave, se integrará profundamente con la economía real y se volverá más fuerte y mejor. y más grande, creando un valor incremental considerable y provocando cambios profundos en el desarrollo económico y social y en las industrias.

Se entiende que en los últimos diez años, Baidu ha invertido más de 140 mil millones de yuanes en investigación y desarrollo acumulados, convirtiéndose en una empresa de inteligencia artificial con un diseño completo de cuatro capas de aplicaciones, modelos, marcos y chips, logrando soluciones finales. optimización completa y tener la clave para liderar la industria en todos los niveles Tecnología de desarrollo propio.

Fuente: "Informe de investigación de mapas de modelos grandes de inteligencia artificial de China"

También en la madrugada del día 31, Baichuan Intelligence también anunció que su modelo grande ha sido registrado a través de las "Medidas provisionales para la gestión de servicios de inteligencia artificial generativa" y está abierto al público. Los usuarios pueden iniciar sesión en el sitio web oficial para experimentalo.

Baichuan Intelligence fue fundada por el ex director ejecutivo de Sogou, Wang Xiaochuan, el 10 de abril de 2023. El equipo central está compuesto por los mejores talentos de inteligencia artificial de empresas de tecnología reconocidas como Sogou, Baidu, Huawei, Microsoft, Byte y Tencent. Sólo cuatro meses después de su creación, Baichuan Intelligent ha lanzado tres modelos de lenguaje de gran tamaño de uso general, incluido Baichuan-7B, el primer modelo de lenguaje de gran tamaño de código abierto del país con 7 mil millones de parámetros que se puede comercializar de forma gratuita, y Baichuan-53B, un gran modelo de lenguaje de gran tamaño. Modelo de lenguaje con 53 mil millones de parámetros.Espera.

Fuente: sitio web oficial de Baichuan Intelligent

iFlytek lanzó oficialmente el “iFlytek Spark Cognitive Large Model” el 6 de mayo de este año. iFlytek dijo que para el 24 de octubre de este año, iFlytek Spark logrará una evaluación comparativa de modelo universal contra ChatGPT. En el informe de evaluación de modelos a gran escala publicado por MIT Technology Review China el 17 de agosto, Xunfei Xinghuo V2.0 ocupó el primer lugar con una puntuación total de 81,5 puntos y fue llamado el modelo a gran escala "más inteligente" de China.

Los grandes modelos globales florecen más

La inteligencia artificial pasa de la nube al terminal. Desde una perspectiva global, fabricantes como Google, Microsoft y Apple también están haciendo esfuerzos en modelos de terminales a gran escala, y el peso ligero se ha convertido en una dirección de desarrollo importante para la implementación de modelos a gran escala en terminales.

Fuente: DragonImages

En mayo de este año, Google lanzó PaLM2, un modelo grande adecuado para el borde. Específicamente, hay cuatro especificaciones del modelo grande PaLM2, a saber, Gecko (Gecko), Otter (Otter), Bison (Bison) y Unicorn (Unicorn). Entre ellos, Gecko es muy liviano y funciona en dispositivos móviles. Un modelo más liviano pero de mayor calidad puede mejorar significativamente la eficiencia de la inferencia y reducir los costos del servicio, permitiendo que las aplicaciones posteriores del modelo se adapten a más aplicaciones y usuarios, haciendo posible la implementación de IA en el borde.

En julio, Apple anunció oficialmente el lanzamiento del desarrollo de AppleGPT y se unió a la batalla de los modelos grandes de IA de terminales. Se entiende que AppleGPT es una herramienta de inteligencia artificial desarrollada por Apple basada en su marco Ajax de desarrollo propio y que actualmente se está probando a pequeña escala dentro de Apple.

Fuente: Pixabay

Al mismo tiempo, Microsoft ha abierto el modelo de entrenamiento DeepSpeedChat y Meta LLaMA de código abierto, lo que ha generado rápidamente una tendencia de entrenamiento basado en LLaMA entre los desarrolladores de IA, acelerando la penetración de métodos de entrenamiento como Lora. Se entiende que los modelos Deepspeed y Lora proporcionan a los desarrolladores pequeños y medianos herramientas completas para un entrenamiento rápido y de bajo costo de sus propios "modelos pequeños", acelerando el establecimiento de patrones de distribución de gradientes para modelos grandes.

En términos de fabricantes de chips, Qualcomm lanzó la primera demostración del lado del terminal Stable Diffusion del mundo ejecutándose en un teléfono Android en la conferencia MWC 2023. Según los informes, el modelo Stable Diffusion tiene más de mil millones de parámetros. Qualcomm utiliza su pila de software de inteligencia artificial para cuantificar, compilar y optimizar el modelo para la aceleración de hardware, lo que lo hace funcionar con éxito en teléfonos móviles equipados con la plataforma móvil Snapdragon 8 de segunda generación. .

Fuente: Pixabay

La "aplicación" y la "supervisión" de modelos grandes van de la mano

En marzo de este año, la nueva herramienta de chatbot de IA ChatGPT 3.5 lanzada por la startup OPEN AI de Silicon Valley demostró capacidades conversacionales asombrosas. En sólo dos meses, los usuarios activos mensuales de ChatGPT alcanzaron los 100 millones, lo que la convierte en la aplicación de consumo de más rápido crecimiento de la historia.

Frente a las oportunidades y desafíos que trae la IA generativa, los países tienen diferentes opiniones sobre cómo regular la IA. China, Estados Unidos, la Unión Europea y otros países o regiones respondieron rápidamente, mientras que Singapur e India anunciaron que no planeaban regular la IA por el momento.

El 15 de agosto, se implementaron oficialmente las "Medidas provisionales para la administración de servicios de IA generativa" de China, que se consideran la primera legislación sobre IA generativa del mundo.

Fuente: Pixabay

Al implementar las reglas y regulaciones, las "Medidas" alientan aún más la aplicación innovadora de la tecnología de inteligencia artificial generativa en diversas industrias y campos, y apoyan a varias organizaciones en la innovación de la tecnología de inteligencia artificial generativa, la construcción, transformación y aplicación de recursos de datos, y la prevención de riesgos. Colaborar para promover la construcción de infraestructura de inteligencia artificial generativa y plataformas públicas de recursos de datos de capacitación.

Los conocedores de la industria dijeron que con la implementación de las "Medidas", se espera que los grandes modelos de IA entren gradualmente en la etapa de lucha por las aplicaciones nativas y la implementación industrial a partir de parámetros.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
0/400
Sin comentarios
  • Anclado
Opera con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)