La vague de baisse des prix des grands modèles arrive, le coût de développement des applications d'IA diminue considérablement.

robot
Création du résumé en cours

La vague de réduction des prix des grands modèles arrive, le développement d'applications AI accueille de nouvelles opportunités

Le 21 mai, un fournisseur de services cloud renommé a annoncé une réduction drastique des prix des appels d'API pour son modèle de langage de grande taille. Parmi eux, le prix d'entrée du modèle phare Qwen-Long est passé de 0,02 CNY/1000 tokens à 0,5 CNY/1 million de tokens, soit une baisse de 97 %.

Récemment, l'entreprise a également publié un modèle open source avec une échelle de paramètres atteignant 110 milliards, le Qwen1.5-110B. Selon les informations, ce modèle a surpassé plusieurs modèles concurrents de 70 milliards de paramètres dans divers tests de référence et se classe au premier rang dans un classement de modèles open source bien connu.

La stratégie combinée "réduction de prix + open source" devient un consensus parmi les grands fournisseurs de modèles à l'échelle mondiale. Cela aide à résoudre les deux principaux problèmes auxquels sont confrontés les développeurs d'applications AI : le coût élevé des API de grands modèles et la qualité insuffisante des modèles open source. Cette initiative pourrait favoriser le déploiement généralisé des applications AI.

En fait, depuis mai, plusieurs fournisseurs de grands modèles ont lancé des produits à bas prix ou mis en œuvre des réductions de prix :

  • La tarification de l'API du modèle MoE open source d'une certaine société de quantification n'est qu'environ un pour cent de celle d'un modèle bien connu.
  • Une entreprise d'IA a réduit le prix d'appel de son modèle personnel de 5 yuans/1 million de tokens à 1 yuan/1 million de tokens
  • Une entreprise internationale d'IA de renommée mondiale a lancé un nouveau modèle, avec des performances équivalentes mais un prix réduit de moitié.
  • Le prix d'entrée pour l'inférence du modèle d'un géant technologique a été réduit à 0,0008 yuan/1000 Tokens
  • Un fournisseur de services cloud bien connu a annoncé que ses deux principaux modèles seraient entièrement gratuits.
  • Une entreprise de technologie vocale a déclaré que son API sera ouverte gratuitement à vie.

Les experts estiment que la baisse des prix des API de grands modèles pourrait être due à la réduction des coûts résultant des avancées technologiques en matière d'inférence. Cela offre plus de choix aux développeurs et pourrait stimuler le développement d'applications AI.

En plus de la réduction des prix, la fourniture de modèles de différentes spécifications est également un moyen important de promouvoir l'application. Les fournisseurs de services cloud mentionnés ci-dessus ont récemment lancé huit grands modèles de langage, avec des paramètres variant de 500 millions à 110 milliards, afin de répondre aux besoins de différents scénarios:

  • Modèle de petite échelle (0.5B-14B) pouvant être déployé sur des appareils tels que des téléphones mobiles, des PC, etc.
  • Modèle à grande échelle (72B-110B) prend en charge les applications de niveau entreprise et de niveau recherche.
  • Les modèles de taille moyenne ( comme 32B) recherchent un équilibre entre performance, efficacité et utilisation des ressources.

De plus, l'entreprise a également ouvert des modèles spécialisés pour la compréhension visuelle, la compréhension audio et la génération de code. Les experts du secteur soulignent que le potentiel d'application des grands modèles sur les dispositifs terminaux ne doit pas être sous-estimé.

Avec le développement rapide de la technologie des grands modèles et l'accélération de la commercialisation, les opportunités dans la chaîne industrielle liée méritent d'être examinées, y compris :

  1. Fabricants de puces, dispositifs et modules dans le domaine de la communication optique
  2. Entreprises fournissant des services d'optimisation, de planification et de location de puissance de calcul
  3. Fabricants d'équipements de puissance de calcul
  4. Fournisseurs de solutions de refroidissement pour centres de données
  5. Société de plateforme de calcul en périphérie
  6. Opérateur de télécommunications
  7. Entreprise de technologie de visualisation des données

Bien sûr, le processus de commercialisation des grands modèles et le développement technologique restent incertains, ce qui constitue des facteurs de risque potentiels. Avec l'évolution rapide de l'industrie, nous continuerons à surveiller les dernières tendances dans ce domaine.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • 3
  • Partager
Commentaire
0/400
DeFiCaffeinatorvip
· Il y a 21h
Chute de 97 % ? Ça s'est emballé.
Voir l'originalRépondre0
degenonymousvip
· Il y a 21h
Fried à un prix plus bas l'année prochaine.
Voir l'originalRépondre0
RektButSmilingvip
· Il y a 21h
Est-ce une baisse de prix ou une attaque par dévaluation?
Voir l'originalRépondre0
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)