Gelombang Penurunan Harga Model Besar Datang, Pengembangan Aplikasi AI Menyambut Peluang Baru
Pada 21 Mei, sebuah penyedia layanan cloud terkenal mengumumkan penurunan signifikan dalam harga panggilan API untuk model bahasa besar mereka. Di antaranya, harga input untuk model unggulan Qwen-Long turun dari 0,02 yuan/seribu tokens menjadi 0,5 yuan/million tokens, dengan penurunan mencapai 97%.
Baru-baru ini, perusahaan tersebut juga meluncurkan model sumber terbuka Qwen1.5-110B dengan skala parameter mencapai 110 miliar. Dikenal, model ini mengungguli model 7 miliar parameter sejenis dalam beberapa pengujian acuan, dan menduduki peringkat teratas di salah satu daftar peringkat model besar sumber terbuka yang terkenal.
Strategi kombinasi "penurunan harga + sumber terbuka" sedang menjadi konsensus di antara produsen model besar global. Ini membantu mengatasi dua masalah utama yang dihadapi pengembang aplikasi AI: harga API model besar yang terlalu tinggi, serta kualitas model sumber terbuka yang kurang ideal. Langkah ini diharapkan dapat mendorong penerapan AI yang lebih luas.
Sejak bulan Mei, telah ada beberapa penyedia model besar yang meluncurkan produk dengan harga rendah atau menerapkan penurunan harga:
Harga API model MoE yang diopen-source oleh suatu perusahaan kuantitatif hanya sekitar satu persen dari model terkenal tertentu.
Sebuah perusahaan AI menurunkan harga pemanggilan model versi pribadi dari 5 yuan/1 juta tokens menjadi 1 yuan/1 juta tokens
Sebuah perusahaan AI terkenal internasional meluncurkan model versi baru, dengan kinerja yang setara tetapi harganya setengah.
Harga input inference model di bawah raksasa teknologi tertentu turun menjadi 0,0008 yuan/seribu Tokens
Salah satu penyedia layanan cloud terkemuka mengumumkan bahwa dua model utama mereka kini sepenuhnya gratis
Sebuah perusahaan teknologi suara menyatakan bahwa API-nya akan dibuka secara gratis selamanya.
Para ahli industri percaya bahwa penurunan harga API model besar mungkin disebabkan oleh penurunan biaya yang dihasilkan dari kemajuan teknologi inferensi. Ini memberikan lebih banyak pilihan bagi pengembang dan diharapkan dapat merangsang pengembangan aplikasi AI.
Selain penurunan harga, menyediakan berbagai spesifikasi model juga merupakan cara penting untuk mendorong penerapan. Penyedia layanan cloud yang disebutkan sebelumnya baru-baru ini meluncurkan 8 model bahasa besar dengan jumlah parameter yang bervariasi dari 500 juta hingga 1100 miliar, untuk memenuhi kebutuhan berbagai skenario:
Model skala kecil (0.5B-14B) dapat di-deploy di perangkat terminal seperti ponsel, PC, dan lainnya
Model berskala besar (72B-110B) mendukung aplikasi tingkat perusahaan dan penelitian.
Model skala menengah ( seperti 32B) mencari keseimbangan antara kinerja, efisiensi, dan penggunaan sumber daya.
Selain itu, perusahaan tersebut juga telah membuka sumber model khusus untuk pemahaman visual, pemahaman audio, dan generasi kode. Para ahli industri menunjukkan bahwa potensi aplikasi model besar di perangkat terminal tidak boleh diabaikan.
Dengan perkembangan cepat teknologi model besar dan percepatan komersialisasi, peluang di rantai industri terkait layak diperhatikan, termasuk:
Produsen chip, perangkat, dan modul di bidang komunikasi optik
Perusahaan yang menyediakan layanan optimasi, penjadwalan, dan penyewaan daya komputasi
Produsen perangkat penghasil daya komputasi
Penyedia solusi pendinginan pusat data
Perusahaan platform komputasi tepi
Penyedia layanan telekomunikasi
Perusahaan teknologi visualisasi data
Tentu saja, proses komersialisasi model besar dan perkembangan teknologinya masih memiliki ketidakpastian, semua ini merupakan faktor risiko yang potensial. Seiring dengan evolusi cepat industri, kami akan terus memantau dinamika terbaru di bidang ini.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
Gelombang penurunan harga model besar datang, biaya pengembangan aplikasi AI turun secara signifikan.
Gelombang Penurunan Harga Model Besar Datang, Pengembangan Aplikasi AI Menyambut Peluang Baru
Pada 21 Mei, sebuah penyedia layanan cloud terkenal mengumumkan penurunan signifikan dalam harga panggilan API untuk model bahasa besar mereka. Di antaranya, harga input untuk model unggulan Qwen-Long turun dari 0,02 yuan/seribu tokens menjadi 0,5 yuan/million tokens, dengan penurunan mencapai 97%.
Baru-baru ini, perusahaan tersebut juga meluncurkan model sumber terbuka Qwen1.5-110B dengan skala parameter mencapai 110 miliar. Dikenal, model ini mengungguli model 7 miliar parameter sejenis dalam beberapa pengujian acuan, dan menduduki peringkat teratas di salah satu daftar peringkat model besar sumber terbuka yang terkenal.
Strategi kombinasi "penurunan harga + sumber terbuka" sedang menjadi konsensus di antara produsen model besar global. Ini membantu mengatasi dua masalah utama yang dihadapi pengembang aplikasi AI: harga API model besar yang terlalu tinggi, serta kualitas model sumber terbuka yang kurang ideal. Langkah ini diharapkan dapat mendorong penerapan AI yang lebih luas.
Sejak bulan Mei, telah ada beberapa penyedia model besar yang meluncurkan produk dengan harga rendah atau menerapkan penurunan harga:
Para ahli industri percaya bahwa penurunan harga API model besar mungkin disebabkan oleh penurunan biaya yang dihasilkan dari kemajuan teknologi inferensi. Ini memberikan lebih banyak pilihan bagi pengembang dan diharapkan dapat merangsang pengembangan aplikasi AI.
Selain penurunan harga, menyediakan berbagai spesifikasi model juga merupakan cara penting untuk mendorong penerapan. Penyedia layanan cloud yang disebutkan sebelumnya baru-baru ini meluncurkan 8 model bahasa besar dengan jumlah parameter yang bervariasi dari 500 juta hingga 1100 miliar, untuk memenuhi kebutuhan berbagai skenario:
Selain itu, perusahaan tersebut juga telah membuka sumber model khusus untuk pemahaman visual, pemahaman audio, dan generasi kode. Para ahli industri menunjukkan bahwa potensi aplikasi model besar di perangkat terminal tidak boleh diabaikan.
Dengan perkembangan cepat teknologi model besar dan percepatan komersialisasi, peluang di rantai industri terkait layak diperhatikan, termasuk:
Tentu saja, proses komersialisasi model besar dan perkembangan teknologinya masih memiliki ketidakpastian, semua ini merupakan faktor risiko yang potensial. Seiring dengan evolusi cepat industri, kami akan terus memantau dinamika terbaru di bidang ini.