Спад цін на великі моделі, нові можливості для розробки AI-додатків
21 травня відомий постачальник хмарних послуг оголосив про значне зниження цін на виклики API своїх великих мовних моделей. Зокрема, ціна на вхідні дані для найкращої моделі Qwen-Long знизилась з 0,02 юаня за тисячу токенів до 0,5 юаня за мільйон токенів, що становить зниження на 97%.
Нещодавно компанія також випустила відкриту модель Qwen1.5-110B з параметрами масштабом до 110 мільярдів. За інформацією, ця модель перевершила аналогічні моделі з 70 мільярдами параметрів у кількох бенчмарках і зайняла перше місце у відомому рейтингу відкритих великих моделей.
Комбінована стратегія "зниження цін + відкритий код" стає загальною згода серед світових виробників великих моделей. Це допоможе вирішити дві основні проблеми, з якими стикаються розробники AI-додатків: занадто висока ціна API великих моделей та недостатня якість відкритих моделей. Цей крок має потенціал для сприяння широкому впровадженню AI-додатків.
Насправді, з травня вже кілька постачальників великих моделей запустили недорогі продукти або впровадили зниження цін:
Ціни на API моделі MoE, розробленої певною кількістю компаній, становлять лише близько одного відсотка від ціни відомої моделі.
Одна AI компанія знизила ціну на виклик свого особистого моделі з 5 юанів за мільйон токенів до 1 юаня за мільйон токенів
Відома міжнародна AI-компанія випустила нову версію моделі, яка має таку ж продуктивність, але вдвічі дешевша.
Ціна на вхідні дані інференції моделі, що належить певному технологічному гіганту, знизилася до 0,0008 юанів за тисячу токенів
Відомий постачальник хмарних послуг оголосив про повну безкоштовність своїх двох основних моделей
Одна з компаній, що займаються голосовими технологіями, заявила, що її API буде безкоштовно доступним назавжди.
Експерти вважають, що зниження цін на API великих моделей може бути викликане зниженням витрат, пов'язаним із прогресом у технології виведення. Це надає розробникам більше вибору та має потенціал стимулювати розробку AI-додатків.
Окрім зниження ціни, надання різних специфікацій моделей також є важливим засобом для реалізації застосування. Вищезгаданий постачальник хмарних послуг нещодавно випустив 8 великих мовних моделей з параметрами від 500 мільйонів до 110 мільярдів, щоб відповідати різним вимогам сценаріїв:
Невелика модель ( 0.5B-14B ) може бути розгорнута на мобільних телефонах, ПК та інших термінальних пристроях
Масштабна модель (72B-110B) підтримує підприємницькі та наукові застосування
Моделі середнього розміру (, такі як 32B), шукають баланс між продуктивністю, ефективністю та використанням ресурсів.
Крім того, компанія також відкрила вихідні коди для спеціалізованих моделей, таких як візуальне розуміння, аудіорозуміння та генерація коду. Експерти галузі зазначають, що потенціал застосування великих моделей на термінальних пристроях не можна ігнорувати.
З розвитком технологій великих моделей та прискоренням комерціалізації, можливості в пов'язаних галузях варто звернути увагу, зокрема:
Виробники чіпів, пристроїв та модулів у сфері оптичного зв'язку
Компанії, що надають послуги з оптимізації потужності, розподілу та оренди
Виробники обладнання для обчислювальної потужності
Постачальник рішень для охолодження дата-центрів
Компанія платформи крайових обчислень
Оператор зв'язку
Компанія з технологій візуалізації даних
Звичайно, процес комерціалізації великих моделей та технологічний розвиток все ще мають невизначеність, і це все потенційні ризикові фактори. З огляду на швидкий розвиток галузі, ми будемо постійно стежити за останніми новинами в цій сфері.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
10 лайків
Нагородити
10
4
Поділіться
Прокоментувати
0/400
ProposalManiac
· 18год тому
Ще один типовий випадок, який, здається, є зниженням цін, насправді є захопленням території. Ті, хто розуміє, знають.
Спад цін на великі моделі: витрати на розробку AI-додатків суттєво знижуються
Спад цін на великі моделі, нові можливості для розробки AI-додатків
21 травня відомий постачальник хмарних послуг оголосив про значне зниження цін на виклики API своїх великих мовних моделей. Зокрема, ціна на вхідні дані для найкращої моделі Qwen-Long знизилась з 0,02 юаня за тисячу токенів до 0,5 юаня за мільйон токенів, що становить зниження на 97%.
Нещодавно компанія також випустила відкриту модель Qwen1.5-110B з параметрами масштабом до 110 мільярдів. За інформацією, ця модель перевершила аналогічні моделі з 70 мільярдами параметрів у кількох бенчмарках і зайняла перше місце у відомому рейтингу відкритих великих моделей.
Комбінована стратегія "зниження цін + відкритий код" стає загальною згода серед світових виробників великих моделей. Це допоможе вирішити дві основні проблеми, з якими стикаються розробники AI-додатків: занадто висока ціна API великих моделей та недостатня якість відкритих моделей. Цей крок має потенціал для сприяння широкому впровадженню AI-додатків.
Насправді, з травня вже кілька постачальників великих моделей запустили недорогі продукти або впровадили зниження цін:
Експерти вважають, що зниження цін на API великих моделей може бути викликане зниженням витрат, пов'язаним із прогресом у технології виведення. Це надає розробникам більше вибору та має потенціал стимулювати розробку AI-додатків.
Окрім зниження ціни, надання різних специфікацій моделей також є важливим засобом для реалізації застосування. Вищезгаданий постачальник хмарних послуг нещодавно випустив 8 великих мовних моделей з параметрами від 500 мільйонів до 110 мільярдів, щоб відповідати різним вимогам сценаріїв:
Крім того, компанія також відкрила вихідні коди для спеціалізованих моделей, таких як візуальне розуміння, аудіорозуміння та генерація коду. Експерти галузі зазначають, що потенціал застосування великих моделей на термінальних пристроях не можна ігнорувати.
З розвитком технологій великих моделей та прискоренням комерціалізації, можливості в пов'язаних галузях варто звернути увагу, зокрема:
Звичайно, процес комерціалізації великих моделей та технологічний розвиток все ще мають невизначеність, і це все потенційні ризикові фактори. З огляду на швидкий розвиток галузі, ми будемо постійно стежити за останніми новинами в цій сфері.