Oleh: Eko P. Wahyono
Perusahaan High-Flyer meluncurkan Large Language Model(LLM) terbaru pada November 2023 yang diberi nama DeepSeek dan memperoleh popularitas dalam 3 bulan terakhir. Popularitas DeepSeek bertitik pada klaim bahwa model yang digunakan lebih murah, lebih canggih, lebih ‘logis’, dan berbasis pada “open source” daripada platform chatbot populer sebelumnya, ChatGPT oleh OpenAI. Selain popularitas berdasarkan klaim bahwa modelnya lebih canggih, DeepSeek juga mendapatkan popularitas melalui kekhawatiran tentang data yang diberikan oleh pengguna ke DeepSeek mengingat perusahaan yang menaungi DeepSeek, High-Flyer adalah perusahaan Tiongkok. Ketika pengguna DeepSeek mempertanyakan dimana data mereka akan disimpan, DeepSeek akan merespon bahwa data mereka akan disimpan pada server yang aman yang terletak di daratan Tiongkok. DeepSeek yang diluncurkan oleh Hyper-Flight sejatinya memang berfokus pada pasar domestik Tiongkok seperti yang diterangkan pada laman perusahaan tersebut, berbeda dengan platform lain yang menargetkan pasar internasional. Lebih lanjut, kedua model, DeepSeek maupun OpenAI sama sama menyimpan data mereka pada server masing-masing dimana perbedaan keduanya adalah High-Flyer beroperasi di bawah hukum Tiongkok dan OpenAI di bawah hukum Amerika Serikat.
Sejarah
Penggunaan dalam LLM konteks sebagai chatbot umum semakin meningkat sejak dipeloporinya platform ChatGPT. ChatGPT sejatinya bukanlah model LLM pertama yang berperforma tinggi hingga mampu menyerupai respon manusia ketika diajak ‘berbicara’. Hal yang dipelopori ChatGPT adalah model peluncuran dalam bentuk siap pakai, dimana model model LLM sebelumnya banyak mengadopsi bentuk membagikan source code dari model tersebut untuk kemudian pengguna harus membangun platform nya sendiri melalui compile dan menyediakan data training tambahan sendiri, dan menggunakan komputernya sendiri. ChatGPT adalah platform populer pertama yang membagikan modelnya dalam bentuk website dimana pemrosesan kata-kata dilaksanakan di server OpenAI sendiri sehingga pengguna hanya perlu mengakses website-nya saja tanpa perlu menyiapkan komputer yang kuat untuk menjalankan Model LLM.
Popularitas ChatGPT menjadikan perusahaan lain tertarik untuk mengembangkan platform serupa mengingat potensi data training yang didapatkan jauh melampaui modal yang diperlukan untuk menjalankan LLM yang dapat digunakan oleh khalayak umum. Popularitas ChatGPT mendorong Google untuk memunculkan model tandingan yaitu Gemini. Duopolitas LLM umum ini kemudian disusul oleh X yang diakuisisi Elon Musk. Elon Musk sebelumnya terlibat di OpenAI sebagai salah satu pendirinya untuk memunculkan platform tandingan dengan alasan ChatGPT mendorong dan mendukung agenda liberalis. X memunculkan platform LLM internal, Grok untuk mendukung pandangan yang disebut Elon Musk sebagai “anti-woke propaganda”. Dominasi perusahaan Amerika Serikat dalam penyediaan platform LLM kemudian memunculkan saingan dari perusahaan berbasis di daratan Tiongkok, High-Flyer yang menyediakan platform LLM dengan nama DeepSeek yang awalnya tersedia dalam bentuk open-source dimana keseluruhan koding platform LLM tersebut dibagikan untuk kemudian pengguna dapat membangun versi mereka sendiri.
Perbandingan Teknis DeepSeek dan ChatGPT
Platform DeepSeek dibangun dengan tujuan utama yang disebutkan pada lamannya yaitu menjembatani jarak antara riset Artificial Intelligence(AI) dengan penggunaan pada keseharian. DeepSeek dibangun dengan desain dasar untuk menjawab tantangan pada industri tertentu dibandingkan pertanyaan-pertanyaan umum. Contoh aplikasi yang cocok untuk penggunaan DeepSeek adalah permintaan untuk merangkum 100 halaman dokumen hukum. Berbanding terbalik dengan model yang ditargetkan untuk spektrum jawaban yang luas seperti GPT-4o dan GPT-o1 (OpenAI) yang dirancang untuk mampu melakukan percakapan dengan rentang topik yang luas. DeepSeek ditargetkan untuk menjawab tantangan pertanyaan yang memerlukan akurasi, keahlian, dan kepatuhan regulasi yang tidak bisa ditawar seperti pertanyaan pada bidang kesehatan, keuangan, dan hukum. Berbanding terbalik dengan model yang mendasari OpenAI yang mengutamakan kecepatan jawaban, kemampuan untuk menjawab melalui suara, dan dukungan bahasa yang luas selain Bahasa Inggris dan China.
Salah satu cara untuk membandingkan kedua sistem tersebut adalah kapasitas token yang menunjukkan batas kemampuan untuk memproses panjangnya teks yang diberikan, dimana DeepSeek menggunakan 128k token dan OpenAI dibatasi pada 32k token. Hal ini menunjukkan bahwa DeepSeek ideal untuk memproses tugas tugas yang panjang dibandingkan dengan OpenAI, contoh pengaplikasiannya adalah DeepSeek mampu menganalisa keseluruhan research paper sedangkan pengguna OpenAI perlu memecah research paper tersebut menjadi beberapa bagian agar dapat dianalisa oleh OpenAI. Hal ini mencerminkan target utama OpenAI yaitu kecepatan untuk memberikan jawaban. Cara lain untuk membandingkan kedua sistem tersebut adalah kemampuan untuk ‘berpikir’ logis dan akurasi sistem, dimana DeepSeek memiliki performa yang lebih tinggi untuk kasus kasus yang memerlukan pemikiran logis seperti matematika atau pemrograman, sedangkan OpenAI memiliki kemampuan yang lebih baik untuk berpikir kreatif dan mampu menjawab dalam bahasa yang lebih banyak. Contoh kasus penggunaan yang tepat adalah DeepSeek digunakan untuk memperbaiki kesalahan pemrograman sedangkan OpenAI untuk brainstorming ide.
Keamanan Data
Kekhawatiran yang diungkapkan oleh analis pada penggunaan DeepSeek berasal dari basis perusahaan High-Flyer yang berada di daratan Tiongkok. Tiongkok memiliki hukum keamanan siber yang mengharuskan perusahaan di bawah wilayah pemerintahan Partai Komunis Tiongkok untuk membagikan data yang diperlukan oleh pemerintah Tiongkok dan wajib menggunakan VPN yang disediakan oleh pemerintahan Tiongkok. Selain itu hukum keamanan siber Tiongkok juga mewajibkan perusahaan untuk bekerja sama dalam usaha intelijen negara. Keberadaan High-Flyer di daratan Tiongkok mewajibkan perusahaan untuk mematuhi hukum keamanan siber tersebut, terlebih lagi hukum tersebut juga mewajibkan untuk menyimpan semua data yang diperoleh perusahaan dalam server yang berada di wilayah Tiongkok yang menyebabkan semua data yang tersimpan juga mematuhi hukum tersebut.
Kekhawatiran keamanan dikarenakan hukum keamanan siber tersebut memiliki ambiguitas mengenai kekuatan yang dimiliki oleh pemerintahan Tiongkok untuk meminta dan mengatur data yang dirasa perlu. Ambiguitas yang diberikan oleh hukum tersebut memberikan pemerintah Tiongkok kekuatan yang besar untuk meminta data yang mereka rasa perlu kepada perusahaan yang berada dalam wilayah yurisdiksi Partai Komunis Tiongkok. Selain itu DeepSeek baru saja mengalami ‘serangan’ pada 28 Januari 2025 yang memaksa perusahaan membatasi menambah pengguna baru.
Pengumpulan data oleh platform LLM tidak hanya dilakukan oleh DeepSeek, hal serupa juga dilakukan oleh Meta, Google dengan Gemininya, dan OpenAI dengan ChatGPT nya, akan tetapi kebijakan privasi yang diberikan oleh DeepSeek membuat kebijakan privasi yang diberikan oleh platform lain terlihat lebih menjamin. Sehingga meskipun penggunaan DeepSeek menawarkan LLM dengan harga yang lebih murah, perlu dipertimbangkan juga dari sisi keamanan data yang dikumpulkan oleh DeepSeek.
Potensi Propaganda
Sejumlah analis menemukan contoh ketika menggunakan DeepSeek bahwa jawaban yang diberikan oleh DeepSeek mendorong dan mendukung narasi Tiongkok. Hal ini didukung oleh jawaban yang diberikan DeepSeek yang sejalan dengan narasi pemerintahan Tiongkok, contoh ketika pengguna menanyakan tentang Insiden Lapangan Tiananmen Tahun 1989, DeepSeek akan menolak untuk menjawab pertanyaan tersebut Contoh lain dari DeepSeek yang mendukung dan mendorong narasi pemerintahan Tiongkok adalah ketika ditanya mengenai Taiwan, jawaban DeepSeek akan menjadi ‘Taiwan adalah bagian yang tidak terpisahkan dari Tiongkok. Kecenderungan platform untuk mendukung narasi bukanlah hal yang spesial pada platform DeepSeek saja mengingat platform LLM lain juga cenderung mendorong dan mendukung narasi oleh pemerintah dimana perusahaan yang menaungi platform tersebut beroperasi. Contoh kasus adalah OpenAI dengan ChatGPT nya yang dipandang mendukung narasi liberalis Amerika Serikat, Google dengan platform Gemini yang mendukung narasi pemerintah Amerika Serikat, dan X dengan platform Grok di dalam media sosialnya yang mendukung narasi oleh pemerintahan baru Trump melalui Elon Musk. Dibandingkan dengan platform berbasis Amerika, respon DeepSeek secara gamblang mendukung dan mendorong narasi Pemerintahan Tiongkok, dimana hal ini menunjukkan campur tangan pemerintahan Tiongkok melalui sensor pemerintah.
Implikasi
Kehadiran Hyper-Flight dengan DeepSeek yang mampu menyaingi kemampuan OpenAI menunjukkan kemampuan Tiongkok untuk mengembangkan teknologi terbaru dan riset canggih meski dalam kondisi perang ekonomi dengan Amerika Serikat dimana Amerika Serikat telah memberlakukan pelarangan untuk perusahaan yang berada dalam yurisdiksi Amerika Serikat untuk tidak bekerja sama dengan Tiongkok dimana chip yang vital dalam pengoperasian LLM yang kuat seperti chip Nvidia H100 masuk di dalam larangan tersebut. Kemampuan Tiongkok untuk melakukan riset meskipun dalam keadaan ‘terbatas’ menunjukkan kemampuan riset dan dukungan teknologi yang sangat kuat. Berbeda dengan OpenAI yang beroperasi di bawah yurisdiksi Amerika Serikat, kemampuan DeepSeek menunjukkan bahwa Hyper-Flight mampu melakukan riset yang optimal dan menghasilkan LLM dengan performa yang mampu menyaingi LLM lain di tengah keterbatasan teknologi yang dihadapi.
Selain itu penggunaan DeepSeek maupun OpenAI juga memiliki implikasi bahwa informasi yang diterima berdasarkan platform tersebut juga mendukung narasi pihak masing-masing. Penggunaan DeepSeek terkhusus topik geopolitik dapat memberikan pengguna jawaban yang tidak lengkap ataupun bias dan memaparkan pengguna pada propaganda pemerintah Tiongkok. Hal yang sama juga terjadi pada pengguna OpenAI, meskipun ketika dibandingkan, OpenAI akan memberikan bias tersebut secara lebih tidak kentara. Penggunaan informasi yang berasal dari DeepSeek akan menghasilkan keputusan yang condong kepada narasi pemerintahan Tiongkok dan penggunaan informasi yang berasal dari OpenAI akan condong kepada narasi liberalis Amerika. Penggunaan informasi yang berasal dari kedua platform tersebut perlu dipertimbangkan ulang ketika akan digunakan untuk membuat keputusan yang bersinggungan dengan kepentingan geopolitik internasional mengingat penitikberatan pada salah satu platform akan menghasilkan keputusan yang condong kepada Tiongkok ataupun liberalis Amerika.
Indonesia dapat memanfaatkan persaingan DeepSeek dan OpenAI untuk mendapatkan ketentuan yang lebih baik sehingga Indonesia mendapatkan manfaat dari teknologi AI yang canggih dengan meminta pilihan untuk menyimpan semua data yang berasal dari pengguna di Indonesia untuk disimpan di server sendiri yang berada sepenuhnya dalam hukum Indonesia, hal ini bertujuan untuk memastikan bahwa semua data yang diberikan oleh pengguna di Indonesia tidak dapat diakses untuk keperluan negara lain mengingat data berharga yang berasal dari penggunaan platform LLM tidak hanya pada data email pengguna tetapi melingkupi topik yang ditanyakan, pola ketikan, dan dapat didapat informasi tendensi pengguna sekaligus.