Gelombang penurunan harga model besar datang, biaya pengembangan aplikasi AI turun secara signifikan.

robot
Pembuatan abstrak sedang berlangsung

Gelombang Penurunan Harga Model Besar Datang, Pengembangan Aplikasi AI Menyambut Peluang Baru

Pada 21 Mei, sebuah penyedia layanan cloud terkenal mengumumkan penurunan signifikan dalam harga panggilan API untuk model bahasa besar mereka. Di antaranya, harga input untuk model unggulan Qwen-Long turun dari 0,02 yuan/seribu tokens menjadi 0,5 yuan/million tokens, dengan penurunan mencapai 97%.

Baru-baru ini, perusahaan tersebut juga meluncurkan model sumber terbuka Qwen1.5-110B dengan skala parameter mencapai 110 miliar. Dikenal, model ini mengungguli model 7 miliar parameter sejenis dalam beberapa pengujian acuan, dan menduduki peringkat teratas di salah satu daftar peringkat model besar sumber terbuka yang terkenal.

Strategi kombinasi "penurunan harga + sumber terbuka" sedang menjadi konsensus di antara produsen model besar global. Ini membantu mengatasi dua masalah utama yang dihadapi pengembang aplikasi AI: harga API model besar yang terlalu tinggi, serta kualitas model sumber terbuka yang kurang ideal. Langkah ini diharapkan dapat mendorong penerapan AI yang lebih luas.

Sejak bulan Mei, telah ada beberapa penyedia model besar yang meluncurkan produk dengan harga rendah atau menerapkan penurunan harga:

  • Harga API model MoE yang diopen-source oleh suatu perusahaan kuantitatif hanya sekitar satu persen dari model terkenal tertentu.
  • Sebuah perusahaan AI menurunkan harga pemanggilan model versi pribadi dari 5 yuan/1 juta tokens menjadi 1 yuan/1 juta tokens
  • Sebuah perusahaan AI terkenal internasional meluncurkan model versi baru, dengan kinerja yang setara tetapi harganya setengah.
  • Harga input inference model di bawah raksasa teknologi tertentu turun menjadi 0,0008 yuan/seribu Tokens
  • Salah satu penyedia layanan cloud terkemuka mengumumkan bahwa dua model utama mereka kini sepenuhnya gratis
  • Sebuah perusahaan teknologi suara menyatakan bahwa API-nya akan dibuka secara gratis selamanya.

Para ahli industri percaya bahwa penurunan harga API model besar mungkin disebabkan oleh penurunan biaya yang dihasilkan dari kemajuan teknologi inferensi. Ini memberikan lebih banyak pilihan bagi pengembang dan diharapkan dapat merangsang pengembangan aplikasi AI.

Selain penurunan harga, menyediakan berbagai spesifikasi model juga merupakan cara penting untuk mendorong penerapan. Penyedia layanan cloud yang disebutkan sebelumnya baru-baru ini meluncurkan 8 model bahasa besar dengan jumlah parameter yang bervariasi dari 500 juta hingga 1100 miliar, untuk memenuhi kebutuhan berbagai skenario:

  • Model skala kecil (0.5B-14B) dapat di-deploy di perangkat terminal seperti ponsel, PC, dan lainnya
  • Model berskala besar (72B-110B) mendukung aplikasi tingkat perusahaan dan penelitian.
  • Model skala menengah ( seperti 32B) mencari keseimbangan antara kinerja, efisiensi, dan penggunaan sumber daya.

Selain itu, perusahaan tersebut juga telah membuka sumber model khusus untuk pemahaman visual, pemahaman audio, dan generasi kode. Para ahli industri menunjukkan bahwa potensi aplikasi model besar di perangkat terminal tidak boleh diabaikan.

Dengan perkembangan cepat teknologi model besar dan percepatan komersialisasi, peluang di rantai industri terkait layak diperhatikan, termasuk:

  1. Produsen chip, perangkat, dan modul di bidang komunikasi optik
  2. Perusahaan yang menyediakan layanan optimasi, penjadwalan, dan penyewaan daya komputasi
  3. Produsen perangkat penghasil daya komputasi
  4. Penyedia solusi pendinginan pusat data
  5. Perusahaan platform komputasi tepi
  6. Penyedia layanan telekomunikasi
  7. Perusahaan teknologi visualisasi data

Tentu saja, proses komersialisasi model besar dan perkembangan teknologinya masih memiliki ketidakpastian, semua ini merupakan faktor risiko yang potensial. Seiring dengan evolusi cepat industri, kami akan terus memantau dinamika terbaru di bidang ini.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • 3
  • Bagikan
Komentar
0/400
DeFiCaffeinatorvip
· 21jam yang lalu
Anjlok 97%? Terlipat!
Lihat AsliBalas0
degenonymousvip
· 21jam yang lalu
Berkelanjutan lebih murah tahun depan
Lihat AsliBalas0
RektButSmilingvip
· 21jam yang lalu
Apakah itu penurunan harga atau serangan dimensi?
Lihat AsliBalas0
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)