大模型降价潮来袭 AI应用开发成本大幅下降

robot
摘要生成中

大模型降价潮来袭,AI应用开发迎新机遇

5月21日,一家知名云服务提供商宣布大幅下调其大语言模型的API调用价格。其中,顶级模型Qwen-Long的输入价格从0.02元/千tokens降至0.5元/百万tokens,降幅高达97%。

此前不久,该公司还发布了参数规模达1100亿的开源模型Qwen1.5-110B。据介绍,这一模型在多项基准测试中超越了同类70亿参数模型,并在某知名开源大模型排行榜上位居榜首。

"降价+开源"的组合策略正成为全球大模型厂商的共识。这有助于解决AI应用开发者面临的两大痛点:大模型API价格过高,以及开源模型质量不够理想。此举有望推动AI应用的广泛落地。

事实上,5月以来已有多家大模型提供商推出低价产品或实施降价:

  • 某量化公司开源的MoE模型API定价仅为某知名模型的百分之一左右
  • 某AI公司将其个人版模型调用价格从5元/百万tokens降至1元/百万tokens
  • 某国际知名AI公司推出新版模型,性能相当但价格减半
  • 某科技巨头旗下模型的推理输入定价降至0.0008元/千Tokens
  • 某知名云服务商宣布旗下两大主力模型全面免费
  • 某语音技术公司表示其API将永久免费开放

业内人士认为,大模型API纷纷降价,可能源于推理技术进步带来的成本下降。这为开发者提供了更多选择,有望刺激AI应用开发。

除了降价,提供多种规格的模型也是推动应用落地的重要手段。前述云服务商近期推出了从5亿到1100亿参数不等的8款大语言模型,以适应不同场景需求:

  • 小规模模型(0.5B-14B)可部署在手机、PC等终端设备
  • 大规模模型(72B-110B)支持企业级和科研级应用
  • 中等规模模型(如32B)则在性能、效率和资源占用间寻求平衡

此外,该公司还开源了视觉理解、音频理解、代码生成等专用模型。业内专家指出,大模型在终端设备上的应用潜力不容忽视。

随着大模型技术快速发展和商业化加速,相关产业链上的机会值得关注,包括:

  1. 光通信领域的芯片、器件和模块厂商
  2. 提供算力优化、调度和租赁服务的公司
  3. 生产算力设备的厂商
  4. 数据中心散热解决方案提供商
  5. 边缘计算平台公司
  6. 电信运营商
  7. 数据可视化技术公司

当然,大模型的商业化进程和技术发展仍存在不确定性,这些都是潜在的风险因素。随着行业的快速演进,我们将持续关注这一领域的最新动态。

此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 3
  • 分享
评论
0/400
DeFiCaffeinatorvip
· 18小时前
暴降97%?卷起来了
回复0
degenonymousvip
· 18小时前
炒到明年更便宜
回复0
RektButSmilingvip
· 18小时前
究竟是降价还是降维打击
回复0
交易,随时随地
qrCode
扫码下载 Gate APP
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)