Blueprint AI Multimodal untuk Aplikasi Dunia Nyata

Ilustrasi artificial intelligence (AI).-- FOTO PIXABAY

Berdasarkan analisis terhadap makalah yang dipublikasikan di repositori terbuka arXiv sepanjang 2024, sekitar 88,9 persen studi AI multimodal hanya melibatkan dua jenis data: visi (gambar) dan bahasa.

 

Keterbatasan itu, menurut para peneliti, menghambat potensi AI untuk memecahkan permasalahan kompleks yang membutuhkan sumber informasi lebih beragam.

 

’’Bayangkan mobil tanpa pengemudi yang mampu memadukan data dari kamera, sensor, dan kondisi lingkungan sekitar. Dengan pemahaman yang lebih menyeluruh, mobil semacam itu akan jauh lebih aman dalam menghadapi situasi sulit,” jelas tim peneliti dalam laporannya.

 

Contoh lainnya datang dari bidang medis. Yakni AI yang mampu menggabungkan catatan klinis, data laboratorium, dan informasi genetik. Metode itu akan lebih akurat dalam mendiagnosis penyakit atau mempercepat penemuan obat baru.

 

Profesor Haiping Lu, pemimpin penelitian dari School of Computer Science dan Centre for Machine Intelligence di University of Sheffield, menegaskan perlunya pergeseran paradigma dalam pengembangan AI.

 

’’AI memang telah banyak mencapai kemajuan dalam bidang visi dan bahasa. Tetapi dunia nyata jauh lebih kaya dan kompleks,” kata Lu.

 

’’Untuk menghadapi tantangan global seperti pandemi, energi berkelanjutan, dan perubahan iklim, kita membutuhkan AI multimodal. AI yang dapat memadukan lebih banyak jenis data dan keahlian lintas disiplin,” katanya.

 

Profesor Lu menambahkan bahwa riset itu tidak hanya menawarkan teori. Melainkan peta jalan implementatif untuk membawa AI keluar dari laboratorium. Yakni dengan menitikberatkan pada aspek keselamatan, keandalan, dan kegunaan praktis.

Tag
Share