Пришла волна снижения цен на большие модели, стоимость разработки AI-приложений существенно снизилась.

robot
Генерация тезисов в процессе

Падение цен на большие модели, новые возможности для разработки AI-приложений

21 мая известный провайдер облачных услуг объявил о значительном снижении цен на API вызовы для своей большой языковой модели. В частности, цена ввода для топовой модели Qwen-Long снизилась с 0,02 юаня за тысячу токенов до 0,5 юаня за миллион токенов, что составляет снижение на 97%.

Некоторое время назад компания также выпустила открытое модель Qwen1.5-110B с параметрами объемом 110 миллиардов. Как сообщается, эта модель превзошла аналогичные модели с 70 миллиардами параметров в нескольких бенчмарках и заняла первое место в известном рейтинге открытых крупных моделей.

Комбинированная стратегия "снижение цен + открытый исходный код" становится общим признанием среди глобальных производителей больших моделей. Это помогает решить две основные проблемы, с которыми сталкиваются разработчики AI-приложений: высокая цена API больших моделей и недостаточное качество открытых моделей. Этот шаг, вероятно, будет способствовать широкому внедрению AI-приложений.

На самом деле, с мая уже несколько крупных поставщиков моделей выпустили товары по низким ценам или снизили цены:

  • Цены на API модели MoE, открытой некоторой количественной компанией, составляют всего около одного процента от цен известной модели.
  • Одна AI компания снизила цену на вызов своей персональной модели с 5 юаней за миллион токенов до 1 юаня за миллион токенов
  • Известная международная компания в области ИИ выпустила новую версию модели, производительность такая же, но цена вдвое ниже.
  • Цены на ввод данных для модели, принадлежащей одному из технологических гигантов, снизились до 0.0008 юаней за 1000 токенов
  • Известный облачный провайдер объявил о полном бесплатном доступе к своим двум основным моделям.
  • Одна компания, занимающаяся голосовыми технологиями, заявила, что ее API будет доступен бесплатно навсегда.

Эксперты считают, что снижение цен на API больших моделей, возможно, связано со снижением затрат, вызванным прогрессом в технологии вывода. Это предоставляет разработчикам больше возможностей и, вероятно, стимулирует разработку приложений ИИ.

Помимо снижения цен, предложение различных моделей также является важным способом продвижения применения. Упомянутый провайдер облачных услуг недавно представил 8 крупных языковых моделей с количеством параметров от 500 миллионов до 110 миллиардов, чтобы удовлетворить различные потребности в сценариях:

  • Модели малого масштаба (0.5B-14B) могут быть развернуты на мобильных устройствах, ПК и других конечных устройствах.
  • Модель большого масштаба (72B-110B) поддерживает корпоративные и научные приложения
  • Модели среднего размера (, такие как 32B), стремятся к балансу между производительностью, эффективностью и использованием ресурсов.

Кроме того, компания открыла исходный код специализированных моделей для визуального понимания, аудио понимания и генерации кода. Эксперты отрасли отмечают, что потенциал применения больших моделей на конечных устройствах нельзя недооценивать.

С быстрым развитием технологий больших моделей и ускорением коммерциализации, возможности в соответствующей цепочке поставок заслуживают внимания, включая:

  1. Производители чипов, устройств и модулей в области оптической связи
  2. Компании, предоставляющие услуги оптимизации вычислительной мощности, диспетчеризации и аренды
  3. Производители оборудования для вычислительной мощности
  4. Поставщик решений по охлаждению дата-центров
  5. Компания платформы крайних вычислений
  6. Операторы связи
  7. Компания по технологиям визуализации данных

Конечно, процесс коммерциализации больших моделей и развитие технологий по-прежнему имеют неопределенности, и все это является потенциальными факторами риска. С учетом быстрого развития отрасли мы будем продолжать следить за последними новостями в этой области.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 3
  • Поделиться
комментарий
0/400
DeFiCaffeinatorvip
· 08-03 03:45
Снижение на 97%? Все закрутилось!
Посмотреть ОригиналОтветить0
degenonymousvip
· 08-03 03:43
Доведите до более низкой цены к следующему году
Посмотреть ОригиналОтветить0
RektButSmilingvip
· 08-03 03:35
Что именно: снижение цен или удар по уровням?
Посмотреть ОригиналОтветить0
  • Закрепить