Hiburan & Gaya Hidup

DeepSeek: Model AI Efisien yang Mengubah Peta Persaingan Teknologi Global

ImanK - Selasa, 28 Januari 2025

DeepSeek: Model AI Efisien yang Mengubah Peta Persaingan Teknologi Global

Mesin pencarian deepseek AI. Foto Tangkapan Layar

Ukuran text:

Dengarkan Berita:

MerahPutih.com - DeepSeek, sebuah laboratorium riset AI asal China mendadak mengguncang Silicon Valley setelah merilis model sumber terbuka yang dengan cepat mengalahkan model-model terkemuka di industri, seperti OpenAI GPT-4.

Berdasarkan penelitian yang diterbitkan oleh perusahaan ini, DeepSeek-R1 menunjukkan kemampuan lebih unggul daripada beberapa model terdepan dalam hal kemampuan matematika dan penalaran.

Bahkan, dalam banyak metrik penting seperti kapasitas, biaya, dan keterbukaan—DeepSeek berhasil memberi tantangan serius bagi perusahaan-perusahaan AI besar dari Barat.

Baca juga:

Apa Itu DeepSeek AI? Pesaing Terberat ChatGPT yang Mengubah Dunia Artificial intelligence

Mengapa DeepSeek Menjadi Sorotan?

Keberhasilan DeepSeek menunjukkan dampak tak terduga dari perang teknologi antara AS dan China. Pembatasan ekspor yang diberlakukan oleh pemerintah AS telah membatasi kemampuan perusahaan-perusahaan teknologi China untuk bersaing di bidang AI dengan cara tradisional, yakni dengan meningkatkan jumlah chip dan memperpanjang waktu pelatihan model.

Akibatnya, sebagian besar perusahaan China berfokus pada aplikasi berbasis AI ketimbang membangun model-model AI mereka sendiri.

Namun, dengan peluncuran terbarunya, DeepSeek membuktikan bahwa ada cara lain untuk meraih kesuksesan, yaitu dengan merombak struktur dasar model AI dan menggunakan sumber daya yang terbatas secara lebih efisien.

Menurut Marina Zhang, seorang profesor di University of Technology Sydney yang mempelajari inovasi China, "DeepSeek mengoptimalkan penggunaan perangkat lunak untuk mengatasi keterbatasan sumber daya. Mereka mengadopsi metode open source, yang memadukan keahlian kolektif dan mendorong inovasi bersama. Pendekatan ini tidak hanya mengatasi kendala sumber daya, tetapi juga mempercepat pengembangan teknologi canggih," dikutip dari WIRED, Selasa (28/1/2024).

Baca juga:

Apa Itu PC AI? Panduan Lengkap tentang Komputer Berbasis Kecerdasan Buatan

Dari Hedge Fund ke AI Startup

DeepSeek dimulai dengan nama Fire-Flyer, cabang riset deep learning dari High-Flyer, sebuah hedge fund kuantitatif terkemuka di China yang didirikan pada tahun 2015.

High-Flyer berhasil mengumpulkan lebih dari 100 miliar RMB (sekitar $15 miliar), menjadikannya salah satu hedge fund kuantitatif terbesar di negara tersebut.

Sebagai bagian dari kegiatan analisanya, High-Flyer telah mengumpulkan GPU dan membangun superkomputer untuk menganalisis data finansial.

Kemudian pada 2023, Liang, yang memiliki gelar master dalam ilmu komputer, memutuskan untuk mengalihkan sumber daya hedge fund tersebut untuk membangun DeepSeek, dengan tujuan mengembangkan model-model AI canggih, dan mungkin suatu saat menciptakan kecerdasan buatan umum (AGI).

Keputusan tersebut, meskipun terdengar berisiko, ternyata membuahkan hasil. DeepSeek kini menjadi salah satu perusahaan AI terkemuka di China yang tidak bergantung pada pendanaan dari raksasa teknologi seperti Baidu, Alibaba, atau ByteDance.

Baca juga:

Dewan Pers:

"DeepSeek mewakili generasi baru perusahaan teknologi China yang lebih mengutamakan kemajuan teknologi jangka panjang daripada komersialisasi cepat," ujar Zhang.

Tim Peneliti Muda

Liang merekrut tim riset yang mayoritas terdiri dari mahasiswa PhD dari universitas-universitas ternama di China seperti Peking University dan Tsinghua University, yang sangat bersemangat untuk membuktikan kemampuan mereka.

Banyak di antara mereka yang telah dipublikasikan dalam jurnal-jurnal terkemuka dan memenangkan penghargaan di konferensi internasional, namun minim pengalaman industri.

Pendekatan rekrutmen ini menciptakan budaya perusahaan yang kolaboratif dan memungkinkan tim untuk memanfaatkan sumber daya komputasi yang melimpah untuk mengeksplorasi proyek riset yang lebih tidak konvensional.

Baca juga:

Ramalan Zodiak 29 Januari 2025: Asmara dan Karier, Apakah Saling Mendukung atau Bertentangan?

"Generasi muda ini tidak hanya memiliki ambisi pribadi, tetapi juga komitmen yang kuat untuk memajukan posisi China sebagai pemimpin global dalam inovasi," kata Zhang.

Keterbatasan Bukan Penghalang

Pada Oktober 2022, pemerintah AS mulai memberlakukan kontrol ekspor yang membatasi akses perusahaan-perusahaan China ke chip canggih seperti Nvidia H100.

Pembatasan ini memunculkan tantangan besar bagi DeepSeek. Meski perusahaan ini sudah memiliki stok 10.000 chip A100, mereka membutuhkan lebih banyak untuk bersaing dengan OpenAI dan Meta.

Liang mengungkapkan bahwa kendala utama yang dihadapi DeepSeek bukanlah masalah pendanaan, tetapi pembatasan ekspor chip canggih.

Untuk mengatasinya, DeepSeek mengembangkan metode pelatihan model yang lebih efisien dengan memanfaatkan berbagai trik rekayasa, seperti skema komunikasi kustom antara chip, pengurangan ukuran field untuk menghemat memori, dan penggunaan pendekatan mix-of-models yang inovatif. Berbagai inovasi ini memungkinkan DeepSeek untuk menghemat daya komputasi yang diperlukan untuk melatih model mereka.

Model DeepSeek terbaru bahkan memerlukan hanya sepuluh persen daya komputasi dibandingkan model Llama 3.1 milik Meta, menurut riset yang dilakukan oleh Epoch AI.

Model Sumber Terbuka

Keterbukaan DeepSeek untuk membagikan inovasi mereka ke publik mendapatkan apresiasi besar dari komunitas riset AI global.

Banyak perusahaan AI China yang mengembangkan model sumber terbuka sebagai cara untuk mengejar ketertinggalan dari pesaing-pesaing Barat, karena model ini dapat menarik lebih banyak pengguna dan kontributor yang dapat membantu model tersebut berkembang.

Baca juga:

Lirik Lagu Margogo Ijur Bari dan Terjemahannya: Terima Kasih Untukmu Ayah Ibuku

“DeepSeek telah menunjukkan bahwa model-model canggih dapat dibangun dengan sumber daya yang lebih sedikit, dan bahwa norma-norma model-building saat ini masih memiliki banyak ruang untuk dioptimalkan,” ujar Wendy Chang, seorang analis kebijakan di Mercator Institute for China Studies.

Berkat pendekatan efisien ini, DeepSeek dapat meruntuhkan pandangan yang ada mengenai keterbatasan sumber daya komputasi China dan menunjukkan bahwa potensi AI China lebih besar daripada yang diperkirakan sebelumnya.

Keberhasilan DeepSeek mengubah paradigma pengembangan AI dengan mengoptimalkan penggunaan sumber daya yang terbatas dan mengadopsi model sumber terbuka bukan hanya memberikan tantangan baru bagi perusahaan-perusahaan AI besar Barat, tetapi juga membuka jalan bagi inovasi lebih lanjut di industri AI global.

Dan pembatasan ekspor AS yang bertujuan untuk memperlambat kemajuan AI China kini malah memicu lahirnya pendekatan-pendekatan baru yang semakin memperkaya ekosistem AI dunia.

#DeepSeek AI #Artificial Intelligence #Kecerdasan Buatan #ChatGPT #AI #Meta #China