Daya Komputasi Layanan: Model Bisnis Baru di Era Model Besar
Dengan munculnya tren model besar di bidang kecerdasan buatan, Daya Komputasi semakin menjadi model bisnis yang baru. Meskipun antusiasme "mengolah ramuan" model besar akhirnya akan mereda, penyedia layanan Daya Komputasi perlu bersiap-siap dan segera menyesuaikan arah strategis.
Baru-baru ini, seorang pemuda yang lulus dari Universitas Tsinghua selama tiga tahun telah melatih model besar meteorologi Pangu dengan jumlah parameter mencapai miliaran. Model ini menggunakan data cuaca global selama 40 tahun dan melakukan pelatihan awal selama sekitar dua bulan dengan menggunakan 200 kartu GPU. Berdasarkan harga pasar saat ini, biaya pelatihan proyek ini mungkin melebihi 2 juta yuan. Dan jika itu adalah pelatihan model besar umum, biayanya mungkin meningkat seratus kali lipat.
Saat ini, China telah memiliki lebih dari seratus model besar dengan skala 10 miliar parameter. Namun, industri secara umum menghadapi masalah kekurangan GPU kelas atas. Biaya Daya Komputasi yang tinggi dan kurangnya Daya Komputasi serta dana menjadi masalah nyata yang dihadapi banyak perusahaan.
Permintaan yang tinggi untuk GPU kelas atas adalah masalah yang diakui di industri. Pada puncaknya, harga satu unit NVIDIA A100 melonjak hingga dua hingga tiga ratus ribu yuan, dan sewa bulanan untuk server A100 juga meroket menjadi 50-70 ribu yuan. Meskipun demikian, masih ada perusahaan yang kesulitan mendapatkan chip yang diperlukan. Seorang eksekutif di industri cloud computing menyatakan bahwa meskipun permintaan pelanggan untuk sumber daya GPU kelas atas sangat tinggi, pasokan saat ini sulit untuk sepenuhnya memenuhi permintaan pasar yang luas.
Menghadapi situasi ini, para pelaku industri umumnya percaya bahwa seiring dengan semakin ketatnya persaingan di pasar model besar, pasar akan perlahan-lahan kembali ke rasionalitas, dan perusahaan-perusahaan akan menyesuaikan strategi dan mengendalikan biaya berdasarkan perubahan ekspektasi.
Untuk mengatasi kekurangan Daya Komputasi, perusahaan telah mengambil berbagai metode. Beberapa perusahaan meningkatkan efisiensi pelatihan dengan menggunakan data berkualitas lebih tinggi. Beberapa perusahaan berfokus pada peningkatan kemampuan infrastruktur, mencapai operasi stabil di atas 1000 Kcal. Ada juga perusahaan yang memilih untuk beralih dari arsitektur komputasi awan ke arsitektur superkomputer, atau menggunakan platform dalam negeri untuk pelatihan dan inferensi model besar.
Daya Komputasi telah menjadi model layanan baru. Layanan daya komputasi didasarkan pada beragam daya komputasi, terhubung melalui jaringan daya komputasi, bertujuan untuk menyediakan industri baru yang efektif dalam daya komputasi. Ini tidak hanya mencakup daya komputasi, tetapi juga mencakup pengemasan sumber daya seperti penyimpanan dan jaringan secara terintegrasi, untuk menyelesaikan pengiriman daya komputasi dalam bentuk API.
Dalam rantai industri daya komputasi, perusahaan hulu terutama menyediakan sumber daya dasar daya komputasi, perusahaan tengah bertanggung jawab atas produksi dan pasokan daya komputasi, sedangkan perusahaan hilir memanfaatkan layanan daya komputasi untuk layanan nilai tambah. Saat ini, penagihan berdasarkan jumlah dan paket tahunan/bulanan adalah model penagihan layanan daya komputasi yang umum.
Seiring dengan normalisasi permintaan komputasi berkinerja tinggi untuk model besar, layanan daya komputasi dengan cepat membentuk rantai industri dan model bisnis yang unik. Meskipun saat ini terjadi kekurangan GPU kelas atas dan biaya daya komputasi yang tinggi, situasi ini bersifat sementara. Dalam jangka panjang, penyedia layanan daya komputasi perlu selalu siap menghadapi perubahan pasar dan menyesuaikan strategi mereka tepat waktu ketika gelombang model besar kembali menjadi lebih rasional.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
20 Suka
Hadiah
20
6
Bagikan
Komentar
0/400
Token_Sherpa
· 07-10 00:38
lmao penambangan gpu lagi... kita tidak pernah belajar, kan?
Lihat AsliBalas0
ZenZKPlayer
· 07-09 11:31
Dianggap Bodoh atau lebih murah untuk naik cloud?
Lihat AsliBalas0
GameFiCritic
· 07-07 02:38
Berapa banyak keuntungan yang harus dikorbankan untuk biaya pelatihan, melihatnya saja sudah membuat hati berdebar.
Lihat AsliBalas0
GweiTooHigh
· 07-07 02:34
Kartu Daya Komputasi Penambang sudah dalam perjalanan~
Lihat AsliBalas0
ShibaOnTheRun
· 07-07 02:31
Kurang apa pun tidak boleh kurang Daya Komputasi ya
Daya Komputasi yang Terbatas di Era Model Besar: Bagaimana Perusahaan Menghadapi Biaya Pelatihan yang Tinggi
Daya Komputasi Layanan: Model Bisnis Baru di Era Model Besar
Dengan munculnya tren model besar di bidang kecerdasan buatan, Daya Komputasi semakin menjadi model bisnis yang baru. Meskipun antusiasme "mengolah ramuan" model besar akhirnya akan mereda, penyedia layanan Daya Komputasi perlu bersiap-siap dan segera menyesuaikan arah strategis.
Baru-baru ini, seorang pemuda yang lulus dari Universitas Tsinghua selama tiga tahun telah melatih model besar meteorologi Pangu dengan jumlah parameter mencapai miliaran. Model ini menggunakan data cuaca global selama 40 tahun dan melakukan pelatihan awal selama sekitar dua bulan dengan menggunakan 200 kartu GPU. Berdasarkan harga pasar saat ini, biaya pelatihan proyek ini mungkin melebihi 2 juta yuan. Dan jika itu adalah pelatihan model besar umum, biayanya mungkin meningkat seratus kali lipat.
Saat ini, China telah memiliki lebih dari seratus model besar dengan skala 10 miliar parameter. Namun, industri secara umum menghadapi masalah kekurangan GPU kelas atas. Biaya Daya Komputasi yang tinggi dan kurangnya Daya Komputasi serta dana menjadi masalah nyata yang dihadapi banyak perusahaan.
Permintaan yang tinggi untuk GPU kelas atas adalah masalah yang diakui di industri. Pada puncaknya, harga satu unit NVIDIA A100 melonjak hingga dua hingga tiga ratus ribu yuan, dan sewa bulanan untuk server A100 juga meroket menjadi 50-70 ribu yuan. Meskipun demikian, masih ada perusahaan yang kesulitan mendapatkan chip yang diperlukan. Seorang eksekutif di industri cloud computing menyatakan bahwa meskipun permintaan pelanggan untuk sumber daya GPU kelas atas sangat tinggi, pasokan saat ini sulit untuk sepenuhnya memenuhi permintaan pasar yang luas.
Menghadapi situasi ini, para pelaku industri umumnya percaya bahwa seiring dengan semakin ketatnya persaingan di pasar model besar, pasar akan perlahan-lahan kembali ke rasionalitas, dan perusahaan-perusahaan akan menyesuaikan strategi dan mengendalikan biaya berdasarkan perubahan ekspektasi.
Untuk mengatasi kekurangan Daya Komputasi, perusahaan telah mengambil berbagai metode. Beberapa perusahaan meningkatkan efisiensi pelatihan dengan menggunakan data berkualitas lebih tinggi. Beberapa perusahaan berfokus pada peningkatan kemampuan infrastruktur, mencapai operasi stabil di atas 1000 Kcal. Ada juga perusahaan yang memilih untuk beralih dari arsitektur komputasi awan ke arsitektur superkomputer, atau menggunakan platform dalam negeri untuk pelatihan dan inferensi model besar.
Daya Komputasi telah menjadi model layanan baru. Layanan daya komputasi didasarkan pada beragam daya komputasi, terhubung melalui jaringan daya komputasi, bertujuan untuk menyediakan industri baru yang efektif dalam daya komputasi. Ini tidak hanya mencakup daya komputasi, tetapi juga mencakup pengemasan sumber daya seperti penyimpanan dan jaringan secara terintegrasi, untuk menyelesaikan pengiriman daya komputasi dalam bentuk API.
Dalam rantai industri daya komputasi, perusahaan hulu terutama menyediakan sumber daya dasar daya komputasi, perusahaan tengah bertanggung jawab atas produksi dan pasokan daya komputasi, sedangkan perusahaan hilir memanfaatkan layanan daya komputasi untuk layanan nilai tambah. Saat ini, penagihan berdasarkan jumlah dan paket tahunan/bulanan adalah model penagihan layanan daya komputasi yang umum.
Seiring dengan normalisasi permintaan komputasi berkinerja tinggi untuk model besar, layanan daya komputasi dengan cepat membentuk rantai industri dan model bisnis yang unik. Meskipun saat ini terjadi kekurangan GPU kelas atas dan biaya daya komputasi yang tinggi, situasi ini bersifat sementara. Dalam jangka panjang, penyedia layanan daya komputasi perlu selalu siap menghadapi perubahan pasar dan menyesuaikan strategi mereka tepat waktu ketika gelombang model besar kembali menjadi lebih rasional.