Büyük model fiyat indirimleri başladı, AI uygulama geliştirme yeni fırsatlar sunuyor
21 May'da, tanınmış bir bulut hizmeti sağlayıcısı, büyük dil modeli API çağrı fiyatlarını önemli ölçüde düşürdüğünü duyurdu. Bunlar arasında, en üst düzey model olan Qwen-Long'un giriş fiyatı 0.02 CNY/1000 token'dan 0.5 CNY/1 milyon token'a düşerek %97'lik bir azalma yaşadı.
Kısa bir süre önce, şirket 110 milyar parametre ölçeğine sahip Qwen1.5-110B açık kaynak modelini de yayınladı. Bu modelin, birçok kıyaslama testinde benzer 70 milyar parametreli modelleri geride bıraktığı ve tanınmış bir açık kaynak büyük model sıralamasında birinci sırada yer aldığı bildirildi.
"Fiyat düşürme + açık kaynak" birleşim stratejisi, dünya genelindeki büyük model üreticilerinin ortak görüşü haline gelmektedir. Bu, AI uygulama geliştiricilerinin karşılaştığı iki büyük sorunu çözmeye yardımcı olur: büyük model API'lerinin çok yüksek fiyatları ve açık kaynak modellerinin yeterince ideal kalitede olmaması. Bu adım, AI uygulamalarının geniş çapta uygulanmasını teşvik etme umudunu taşımaktadır.
Aslında, Mayıs ayından bu yana birçok büyük model sağlayıcısı düşük fiyatlı ürünler piyasaya sürdü veya fiyatları düşürdü:
Bir kuantum şirketinin açık kaynaklı MoE modeli API fiyatı, belirli bir ünlü modelin yaklaşık yüzde biri kadardır.
Bir AI şirketi kişisel model çağrı fiyatını 5 yuan/milyon token'dan 1 yuan/milyon token'a düşürdü.
Dünyaca ünlü bir AI şirketi yeni bir modelini tanıttı, performansı eşit ancak fiyatı yarı yarıya düştü.
Bir teknoloji devine ait modelin çıkarım girdi fiyatı 0.0008 TL/1000Token'a düştü.
Tanınmış bir bulut hizmet sağlayıcısı, iki ana modelinin tamamen ücretsiz olacağını duyurdu.
Bir ses teknolojisi şirketi, API'sinin sonsuza dek ücretsiz olacağını açıkladı.
Sektör uzmanları, büyük model API'lerinin fiyatlarının düşmesinin, muhtemelen çıkarım teknolojisindeki ilerlemelerden kaynaklanan maliyet düşüşünden kaynaklandığını düşünüyor. Bu durum, geliştiricilere daha fazla seçenek sunuyor ve AI uygulama geliştirmeyi teşvik etmesi bekleniyor.
Fiyat indirimlerinin yanı sıra, çeşitli boyutlarda modeller sunmak da uygulama uygulanmasını teşvik etmenin önemli bir yoludur. Önceki bulut hizmeti sağlayıcıları, farklı senaryo ihtiyaçlarına uyum sağlamak için 5 milyardan 1100 milyara kadar parametreye sahip 8 büyük dil modeli sundu.
Küçük ölçekli model (0.5B-14B), telefon, PC gibi son cihazlara dağıtılabilir.
Büyük ölçekli model (72B-110B), kurumsal ve akademik uygulamaları destekler.
Orta ölçekli model (, 32B ) gibi, performans, verimlilik ve kaynak kullanımı arasında bir denge arar.
Ayrıca, şirket görsel anlama, ses anlama, kod üretimi gibi özel modelleri de açık kaynak olarak yayınladı. Sektör uzmanları, büyük modellerin son cihazlardaki uygulama potansiyelinin göz ardı edilemeyeceğini belirtiyor.
Büyük model teknolojisinin hızlı gelişimi ve ticarileşmenin hızlanması ile ilgili endüstri zincirindeki fırsatlar dikkate değerdir, bunlar arasında:
Işık iletişimi alanında çip, cihaz ve modül üreticileri
Hesap gücü optimizasyonu, zamanlama ve kiralama hizmetleri sunan şirket
Madencilik gücü cihazları üreten üreticiler
Veri merkezi soğutma çözümü sağlayıcıları
Kenar Hesaplama Platformu Şirketi
Telekomünikasyon Operatörü
Veri Görselleştirme Teknolojileri Şirketi
Elbette, büyük modellerin ticarileşme süreci ve teknik gelişimi hala belirsizlikler barındırıyor, bunlar potansiyel risk faktörleri. Sektörün hızlı evrimiyle birlikte, bu alandaki en son gelişmeleri yakından takip edeceğiz.
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Büyük model fiyat düşüşleri başladı, AI uygulama geliştirme maliyetleri büyük ölçüde düştü.
Büyük model fiyat indirimleri başladı, AI uygulama geliştirme yeni fırsatlar sunuyor
21 May'da, tanınmış bir bulut hizmeti sağlayıcısı, büyük dil modeli API çağrı fiyatlarını önemli ölçüde düşürdüğünü duyurdu. Bunlar arasında, en üst düzey model olan Qwen-Long'un giriş fiyatı 0.02 CNY/1000 token'dan 0.5 CNY/1 milyon token'a düşerek %97'lik bir azalma yaşadı.
Kısa bir süre önce, şirket 110 milyar parametre ölçeğine sahip Qwen1.5-110B açık kaynak modelini de yayınladı. Bu modelin, birçok kıyaslama testinde benzer 70 milyar parametreli modelleri geride bıraktığı ve tanınmış bir açık kaynak büyük model sıralamasında birinci sırada yer aldığı bildirildi.
"Fiyat düşürme + açık kaynak" birleşim stratejisi, dünya genelindeki büyük model üreticilerinin ortak görüşü haline gelmektedir. Bu, AI uygulama geliştiricilerinin karşılaştığı iki büyük sorunu çözmeye yardımcı olur: büyük model API'lerinin çok yüksek fiyatları ve açık kaynak modellerinin yeterince ideal kalitede olmaması. Bu adım, AI uygulamalarının geniş çapta uygulanmasını teşvik etme umudunu taşımaktadır.
Aslında, Mayıs ayından bu yana birçok büyük model sağlayıcısı düşük fiyatlı ürünler piyasaya sürdü veya fiyatları düşürdü:
Sektör uzmanları, büyük model API'lerinin fiyatlarının düşmesinin, muhtemelen çıkarım teknolojisindeki ilerlemelerden kaynaklanan maliyet düşüşünden kaynaklandığını düşünüyor. Bu durum, geliştiricilere daha fazla seçenek sunuyor ve AI uygulama geliştirmeyi teşvik etmesi bekleniyor.
Fiyat indirimlerinin yanı sıra, çeşitli boyutlarda modeller sunmak da uygulama uygulanmasını teşvik etmenin önemli bir yoludur. Önceki bulut hizmeti sağlayıcıları, farklı senaryo ihtiyaçlarına uyum sağlamak için 5 milyardan 1100 milyara kadar parametreye sahip 8 büyük dil modeli sundu.
Ayrıca, şirket görsel anlama, ses anlama, kod üretimi gibi özel modelleri de açık kaynak olarak yayınladı. Sektör uzmanları, büyük modellerin son cihazlardaki uygulama potansiyelinin göz ardı edilemeyeceğini belirtiyor.
Büyük model teknolojisinin hızlı gelişimi ve ticarileşmenin hızlanması ile ilgili endüstri zincirindeki fırsatlar dikkate değerdir, bunlar arasında:
Elbette, büyük modellerin ticarileşme süreci ve teknik gelişimi hala belirsizlikler barındırıyor, bunlar potansiyel risk faktörleri. Sektörün hızlı evrimiyle birlikte, bu alandaki en son gelişmeleri yakından takip edeceğiz.