大模型降價潮來襲 AI應用開發成本大幅下降

robot
摘要生成中

大模型降價潮來襲,AI應用開發迎新機遇

5月21日,一家知名雲服務提供商宣布大幅下調其大語言模型的API調用價格。其中,頂級模型Qwen-Long的輸入價格從0.02元/千tokens降至0.5元/百萬tokens,降幅高達97%。

此前不久,該公司還發布了參數規模達1100億的開源模型Qwen1.5-110B。據介紹,這一模型在多項基準測試中超越了同類70億參數模型,並在某知名開源大模型排行榜上位居榜首。

"降價+開源"的組合策略正成爲全球大模型廠商的共識。這有助於解決AI應用開發者面臨的兩大痛點:大模型API價格過高,以及開源模型質量不夠理想。此舉有望推動AI應用的廣泛落地。

事實上,5月以來已有多家大模型提供商推出低價產品或實施降價:

  • 某量化公司開源的MoE模型API定價僅爲某知名模型的百分之一左右
  • 某AI公司將其個人版模型調用價格從5元/百萬tokens降至1元/百萬tokens
  • 某國際知名AI公司推出新版模型,性能相當但價格減半
  • 某科技巨頭旗下模型的推理輸入定價降至0.0008元/千Tokens
  • 某知名雲服務商宣布旗下兩大主力模型全面免費
  • 某語音技術公司表示其API將永久免費開放

業內人士認爲,大模型API紛紛降價,可能源於推理技術進步帶來的成本下降。這爲開發者提供了更多選擇,有望刺激AI應用開發。

除了降價,提供多種規格的模型也是推動應用落地的重要手段。前述雲服務商近期推出了從5億到1100億參數不等的8款大語言模型,以適應不同場景需求:

  • 小規模模型(0.5B-14B)可部署在手機、PC等終端設備
  • 大規模模型(72B-110B)支持企業級和科研級應用
  • 中等規模模型(如32B)則在性能、效率和資源佔用間尋求平衡

此外,該公司還開源了視覺理解、音頻理解、代碼生成等專用模型。業內專家指出,大模型在終端設備上的應用潛力不容忽視。

隨着大模型技術快速發展和商業化加速,相關產業鏈上的機會值得關注,包括:

  1. 光通信領域的芯片、器件和模塊廠商
  2. 提供算力優化、調度和租賃服務的公司
  3. 生產算力設備的廠商
  4. 數據中心散熱解決方案提供商
  5. 邊緣計算平台公司
  6. 電信運營商
  7. 數據可視化技術公司

當然,大模型的商業化進程和技術發展仍存在不確定性,這些都是潛在的風險因素。隨着行業的快速演進,我們將持續關注這一領域的最新動態。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 3
  • 分享
留言
0/400
DeFiCaffeinatorvip
· 23小時前
暴降97%?卷起来了
回復0
degenonymousvip
· 23小時前
炒到明年更便宜
回復0
RektButSmilingvip
· 08-03 03:35
究竟是降价还是降维打击
回復0
交易,隨時隨地
qrCode
掃碼下載 Gate APP
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)