Akhirnya Mesin Mengalahkan Manusia dalam Memahami Visual


Mesin mengungguli manusia dalam menjawab pertanyaan teks. (Foto: Unsplash/ Philipp Katzenberger)
ALIBABA berhasil menempati posisi pertama dalam Papan Peringkat VQA (Visual Question Answering) global terbaru. Hasilnya lebih baik daripada kinerja manusia dalam konteks yang sama. Hal ini merupakan pertama kalinya mesin mengungguli manusia dalam memahami gambar untuk menjawab pertanyaan teks.
Algoritme Alibaba mencatat tingkat akurasi hingga 81,26 persen dalam menjawab pertanyaan terkait gambar, dibandingkan dengan kinerja manusia yang hanya mencapai 80,83 persen (pada bagian standar pengujian).
Baca Juga:
Tantangan yang diselenggarakan setiap tahun sejak 2015 oleh CVPR konferensi visual terkemuka di seluruh duniaini menarik para pemain industri global termasuk Facebook, Microsoft, dan Universitas Stanford. Evaluasi tersebut menyajikan gambar dan pertanyaan terkait dengan Bahasa natural. Para peserta diminta untuk menjawab secara akurat dengan Bahasa yang natural. Tahun ini, tantangan berisi lebih dari 250 ribu gambar dan 1,1 juta pertanyaan.

"Kami bangga dapat mencapai tonggak keberhasilan lainnya dalam kecerdasan mesin, yang menggarisbawahi upaya berkelanjutan kami dalam mendorong penelitian dan pengembangan di bidang AI terkait,” kata Si Luo, Head of Natural Language Processing (NLP), Alibaba DAMO Academy dalam keterangan resminya.
Terobosan kecerdasan mesin dalam menjawab pertanyaan terkait gambar dapat terwujud berkat desain algoritme inovatif dari Alibaba DAMO Academy, inisiatif penelitian dan pengembangan global Alibaba Group.
Dengan memanfaatkan teknologinya tim Alibaba mampu membuat kemajuan yang signifikan tidak hanya dalam menganalisis gambar dan memahami maksud dari pertanyaan. Tetapi juga memberikan jawaban dengan alasan yang tepat sambil mengungkapkannya dalam gaya percakapan seperti manusia.
Baca Juga:
Teknologi VQA telah diterapkan secara luas di seluruh ekosistem Alibaba. Misalnya, fitur chatbot cerdas Alibaba, Alime Shop Assistant, yang digunakan oleh puluhan ribu pedagang di platform ritel Alibaba.

"Dengan adanya teknologi ini, bukan berarti manusia akan digantikan oleh robot suatu hari nanti. Sebaliknya, kami yakin bahwa mesin yang lebih cerdas dapat digunakan untuk membantu pekerjaan dan kehidupan sehari-hari, sehingga, manusia dapat berfokus pada tugas-tugas kreatif yang paling mereka kuasai," tambah Luo.
Si Luo juga menambahkan VQA dapat digunakan di berbagai area. Misalnya, saat mencari produk di situs e-commerce, untuk mendukung analisis gambar medis untuk diagnosis penyakit awal, serta untuk teknologi mengemudi cerdas.
"Asisten AI akan secara otomatis menawarkan analisis dasar foto yang diambil oleh kamera dalam mobil," tutupnya. (ikh)
Baca Juga:
Bagikan
Berita Terkait
Samsung Sedang Kembangkan HP Lipat Baru, Bakal Saingi iPhone Fold

Sense Lite, Inovasi Baru JBL dengan Teknologi OpenSound dan Adaptive Bass Boost

Chip A19 dan A19 Pro Milik iPhone 17 Muncul di Geekbench, Begini Hasil Pengujiannya

Xiaomi 16 Pro Bisa Jadi Ancaman Buat Samsung Galaxy S26 Pro, Apa Alasannya?

OPPO Find X9 dan X9 Pro Bakal Hadir dengan Baterai Jumbo, Meluncur 28 Oktober 2025

Spesifikasi Lengkap iPhone 17: Hadir dengan Layar Lebih Besar dan Kamera Super Canggih

iPhone 17 Air Resmi Rilis dengan Bodi Tertipis, ini Spesifikasi dan Harganya

iPhone 17 Pro dan 17 Pro Max Punya Desain Baru, Pakai Chip A19 Pro dan Kamera 8x Zoom

iPhone 17 Air Masih Kalah dari Samsung Galaxy S26 Edge, Baterainya Jadi Sorotan

Desain OPPO Find X9 Terungkap, Bakal Bawa Bezel Baru dan Paling Tipis di Kelasnya
