La ola de reducción de precios de modelos grandes ha llegado, los costos de desarrollo de aplicaciones de IA han disminuido significativamente.

robot
Generación de resúmenes en curso

La ola de reducción de precios de grandes modelos llega, las aplicaciones de IA enfrentan nuevas oportunidades

El 21 de mayo, un conocido proveedor de servicios en la nube anunció una drástica reducción en los precios de las llamadas API de su modelo de lenguaje de gran tamaño. Entre ellos, el precio de entrada del modelo superior Qwen-Long se redujo de 0.02 yuanes/ mil tokens a 0.5 yuanes/ millón de tokens, una reducción del 97%.

Recientemente, la compañía también lanzó el modelo de código abierto Qwen1.5-110B con una escala de parámetros de 110 mil millones. Según se informa, este modelo superó a modelos similares de 70 mil millones de parámetros en varias pruebas de referencia y ocupó el primer lugar en una conocida lista de grandes modelos de código abierto.

La estrategia combinada de "reducción de precios + código abierto" se está convirtiendo en un consenso entre los fabricantes de grandes modelos a nivel mundial. Esto ayuda a resolver dos grandes problemas que enfrentan los desarrolladores de aplicaciones de IA: el precio excesivo de las API de grandes modelos y la calidad insatisfactoria de los modelos de código abierto. Esta medida espera impulsar la amplia implementación de aplicaciones de IA.

De hecho, desde mayo, varios proveedores de grandes modelos han lanzado productos a bajo precio o han implementado reducciones de precios:

  • El precio de la API del modelo MoE de una empresa de cuantificación de código abierto es solo alrededor del uno por ciento de un modelo conocido.
  • Una empresa de IA ha reducido el precio de uso de su modelo de versión personal de 5 yuanes/ millón de tokens a 1 yuan/ millón de tokens.
  • Una empresa internacional de IA de renombre lanzó un nuevo modelo, con un rendimiento similar pero a mitad de precio.
  • El precio de entrada para la inferencia del modelo de un gigante tecnológico ha bajado a 0.0008 yuanes por mil Tokens
  • Un conocido proveedor de servicios en la nube anunció que sus dos principales modelos estarán completamente gratis.
  • Una empresa de tecnología de voz ha declarado que su API estará disponible de forma gratuita para siempre.

Los expertos de la industria creen que la reducción de precios de las API de modelos grandes puede deberse a la disminución de costos provocada por los avances en la tecnología de inferencia. Esto proporciona más opciones para los desarrolladores y se espera que estimule el desarrollo de aplicaciones de IA.

Además de reducir precios, ofrecer modelos en diversas especificaciones también es un medio importante para impulsar la implementación de aplicaciones. Los proveedores de servicios en la nube mencionados anteriormente han lanzado recientemente 8 grandes modelos de lenguaje con entre 500 millones y 110 mil millones de parámetros para adaptarse a diferentes necesidades de escenarios:

  • Modelos de pequeña escala (0.5B-14B) se pueden implementar en dispositivos finales como teléfonos móviles y PC.
  • Modelos a gran escala (72B-110B) soportan aplicaciones empresariales y de investigación.
  • Modelos de tamaño mediano ( como 32B) buscan un equilibrio entre rendimiento, eficiencia y uso de recursos.

Además, la empresa también ha abierto el código de modelos especializados en comprensión visual, comprensión de audio y generación de código. Los expertos de la industria señalan que el potencial de aplicación de los modelos grandes en dispositivos finales no debe ser subestimado.

Con el rápido desarrollo de la tecnología de modelos grandes y la aceleración de la comercialización, las oportunidades en la cadena industrial relacionada merecen atención, incluyendo:

  1. Fabricantes de chips, dispositivos y módulos en el campo de la comunicación óptica
  2. Empresas que ofrecen servicios de optimización, programación y alquiler de potencia de cálculo
  3. Fabricantes de equipos de minería
  4. Proveedor de soluciones de refrigeración para centros de datos
  5. Empresa de plataforma de computación en el borde
  6. Operador de telecomunicaciones
  7. Empresa de tecnología de visualización de datos

Por supuesto, el proceso de comercialización de los grandes modelos y el desarrollo tecnológico aún presentan incertidumbres, que son factores de riesgo potenciales. Con la rápida evolución de la industria, seguiremos atentos a las últimas novedades en este ámbito.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 4
  • Compartir
Comentar
0/400
ProposalManiacvip
· hace14h
Otro caso típico que parece una reducción de precios pero en realidad es una estrategia de acaparamiento. Los que entienden, entienden.
Ver originalesResponder0
DeFiCaffeinatorvip
· 08-03 03:45
¿Caída del 97%? ¡Se ha desatado!
Ver originalesResponder0
degenonymousvip
· 08-03 03:43
Cocinará más barato el próximo año.
Ver originalesResponder0
RektButSmilingvip
· 08-03 03:35
¿Es realmente una reducción de precios o un ataque de reducción dimensional?
Ver originalesResponder0
  • Anclado
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)