A onda de redução de preços dos grandes modelos chegou, novas oportunidades para o desenvolvimento de aplicações de IA
No dia 21 de maio, um conhecido fornecedor de serviços em nuvem anunciou uma redução significativa no preço das chamadas de API do seu modelo de linguagem de grande escala. Entre eles, o preço de entrada do modelo topo de linha Qwen-Long caiu de 0,02 yuan/ mil tokens para 0,5 yuan/ milhão de tokens, uma redução de até 97%.
Recentemente, a empresa lançou um modelo de código aberto com uma escala de parâmetros de 110 bilhões, o Qwen1.5-110B. Segundo informações, este modelo superou modelos concorrentes de 70 bilhões de parâmetros em vários testes de referência e ficou em primeiro lugar em um conhecido ranking de grandes modelos de código aberto.
"Desconto + Código Aberto" é uma estratégia combinada que está se tornando um consenso entre os fabricantes de grandes modelos em todo o mundo. Isso ajuda a resolver duas grandes dores enfrentadas pelos desenvolvedores de aplicações de IA: o preço elevado da API de grandes modelos e a qualidade insatisfatória dos modelos de código aberto. Essa medida promete impulsionar a ampla implementação de aplicações de IA.
Na verdade, desde maio, várias empresas de grandes modelos lançaram produtos a preços baixos ou implementaram reduções de preço:
O preço da API do modelo MoE de uma empresa de quantificação de código aberto é apenas cerca de um por cento do de um modelo conhecido.
Uma empresa de IA reduziu o preço da chamada do seu modelo pessoal de 5 yuan/1 milhão de tokens para 1 yuan/1 milhão de tokens
Uma conhecida empresa internacional de IA lançou um novo modelo, com desempenho equivalente mas com preço reduzido pela metade.
O preço de entrada para a inferência do modelo de um grande gigante da tecnologia caiu para 0,0008 yuan/1.000 Tokens
Um conhecido fornecedor de serviços em nuvem anunciou que os seus dois principais modelos estão agora completamente gratuitos.
Uma empresa de tecnologia de voz anunciou que a sua API estará disponível gratuitamente para sempre.
Os especialistas da indústria acreditam que a queda nos preços das APIs de grandes modelos pode ser resultado da redução de custos trazida pelos avanços na tecnologia de inferência. Isso oferece mais opções para os desenvolvedores e tem potencial para estimular o desenvolvimento de aplicações de IA.
Além da redução de preços, oferecer modelos em várias especificações também é um meio importante para promover a implementação de aplicações. Os provedores de serviços em nuvem mencionados anteriormente lançaram recentemente 8 grandes modelos de linguagem com parâmetros variando de 500 milhões a 110 bilhões, para atender às diferentes necessidades de cenários:
Modelos em pequena escala (0.5B-14B) podem ser implantados em dispositivos terminais como telemóveis, PCs, etc.
O modelo em larga escala (72B-110B) suporta aplicações empresariais e de pesquisa.
Modelos de tamanho médio ( como 32B) buscam um equilíbrio entre desempenho, eficiência e consumo de recursos.
Além disso, a empresa também abriu o código de modelos especializados em compreensão visual, compreensão de áudio e geração de código. Especialistas da indústria apontam que o potencial de aplicação de grandes modelos em dispositivos finais não pode ser ignorado.
Com o rápido desenvolvimento da tecnologia de grandes modelos e a aceleração da comercialização, as oportunidades na cadeia industrial relacionada merecem atenção, incluindo:
Fabricantes de chips, dispositivos e módulos na área de comunicação óptica
Empresas que oferecem serviços de otimização, agendamento e locação de poder computacional
Fabricantes de equipamentos de mineração
Fornecedor de soluções de refrigeração para centros de dados
Empresa de plataforma de computação de borda
Operadora de telecomunicações
Empresa de tecnologia de visualização de dados
Claro, o processo de comercialização e o desenvolvimento tecnológico dos grandes modelos ainda apresentam incertezas, que são fatores de risco potenciais. Com a rápida evolução da indústria, continuaremos a acompanhar as últimas novidades neste campo.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
10 gostos
Recompensa
10
3
Partilhar
Comentar
0/400
DeFiCaffeinator
· 21h atrás
Queda de 97%? Enrolou-se
Ver originalResponder0
degenonymous
· 21h atrás
Fritar até ficar mais barato no próximo ano
Ver originalResponder0
RektButSmiling
· 21h atrás
Será que é uma redução de preço ou um ataque de redução de dimensão?
A onda de queda de preços dos grandes modelos chegou, os custos de desenvolvimento de aplicações de IA caíram significativamente.
A onda de redução de preços dos grandes modelos chegou, novas oportunidades para o desenvolvimento de aplicações de IA
No dia 21 de maio, um conhecido fornecedor de serviços em nuvem anunciou uma redução significativa no preço das chamadas de API do seu modelo de linguagem de grande escala. Entre eles, o preço de entrada do modelo topo de linha Qwen-Long caiu de 0,02 yuan/ mil tokens para 0,5 yuan/ milhão de tokens, uma redução de até 97%.
Recentemente, a empresa lançou um modelo de código aberto com uma escala de parâmetros de 110 bilhões, o Qwen1.5-110B. Segundo informações, este modelo superou modelos concorrentes de 70 bilhões de parâmetros em vários testes de referência e ficou em primeiro lugar em um conhecido ranking de grandes modelos de código aberto.
"Desconto + Código Aberto" é uma estratégia combinada que está se tornando um consenso entre os fabricantes de grandes modelos em todo o mundo. Isso ajuda a resolver duas grandes dores enfrentadas pelos desenvolvedores de aplicações de IA: o preço elevado da API de grandes modelos e a qualidade insatisfatória dos modelos de código aberto. Essa medida promete impulsionar a ampla implementação de aplicações de IA.
Na verdade, desde maio, várias empresas de grandes modelos lançaram produtos a preços baixos ou implementaram reduções de preço:
Os especialistas da indústria acreditam que a queda nos preços das APIs de grandes modelos pode ser resultado da redução de custos trazida pelos avanços na tecnologia de inferência. Isso oferece mais opções para os desenvolvedores e tem potencial para estimular o desenvolvimento de aplicações de IA.
Além da redução de preços, oferecer modelos em várias especificações também é um meio importante para promover a implementação de aplicações. Os provedores de serviços em nuvem mencionados anteriormente lançaram recentemente 8 grandes modelos de linguagem com parâmetros variando de 500 milhões a 110 bilhões, para atender às diferentes necessidades de cenários:
Além disso, a empresa também abriu o código de modelos especializados em compreensão visual, compreensão de áudio e geração de código. Especialistas da indústria apontam que o potencial de aplicação de grandes modelos em dispositivos finais não pode ser ignorado.
Com o rápido desenvolvimento da tecnologia de grandes modelos e a aceleração da comercialização, as oportunidades na cadeia industrial relacionada merecem atenção, incluindo:
Claro, o processo de comercialização e o desenvolvimento tecnológico dos grandes modelos ainda apresentam incertezas, que são fatores de risco potenciais. Com a rápida evolução da indústria, continuaremos a acompanhar as últimas novidades neste campo.