Tech

AI Sudah Bisa “Membaca” Otak Manusia

Contoh-contoh gambar yang dihasilkan teknologi AI Stable Diffusion dari aktivitas yang tercatat di otak

Bagaimana jadinya kalau teknologi kecerdasan buatan (AI) bisa mengubah imajinasi manusia jadi kenyataan? Mungkin, banyak di antara kalian mengira itu mustahil, padahal sebenarnya sudah ada ilmuwan yang berhasil melakukannya.

Baru-baru ini, sejumlah peneliti dari Universitas Osaka menemukan Stable Diffusion, generator gambar berbasis AI, mampu mengenali aktivitas otak, lalu menerjemahkannya ke dalam gambar beresolusi tinggi. Gambar yang diciptakan sangat akurat, bahkan tanpa dilatih atau dipoles sedikit pun. Mereka mempublikasikan temuannya Desember lalu. 

Videos by VICE

Tim peneliti awalnya memprediksi representasi laten berupa model data gambar dari sinyal fMRI (Functional Magnetic Resonance Imaging), yang kemudian diproses dan ditambahkan noise melalui proses difusi. Setelah itu, mereka memecahkan representasi teks dari sinyal fMRI dalam korteks visual yang lebih tinggi untuk dijadikan input menghasilkan gambar final.

Tangkapan layar gambar yang dihasilkan Stable Diffusion dari aktivitas otak
Tangkapan layar gambar yang dihasilkan Stable Diffusion dari aktivitas otak

Dalam penelitian terdahulu, kebanyakan modelnya masih perlu dilatih dan disempurnakan hingga tercipta rekonstruksi gambar beresolusi tinggi. Masalahnya, tidak mudah melatih model yang kompleks, sedangkan sampel yang tersedia di bidang ilmu saraf untuk melatih modelnya sangat terbatas. Sebelumnya juga tidak ada peneliti yang menghasilkan gambar pakai model difusi seperti yang dilakukan dalam studi terbaru.

Menurut para peneliti, baru kali ini ada studi yang menyuguhkan interpretasi kuantitatif suatu model dari perspektif biologis. Diagram yang tersedia dalam penelitian menunjukkan korelasi antara rangsangan dan tingkat noise (sinyal yang muncul akibat rangsangan tersebut) di otak. Semakin tinggi noise yang dihasilkan rangsangan, maka resolusi gambar yang akan ditampilkan pun semakin besar. Selanjutnya ada diagram yang menunjukkan keterlibatan berbagai jaringan di otak, serta bagaimana jaringan-jaringan itu menghilangkan noise pada saat gambar direkonstruksi.

Tangkapan layar kualitas gambar yang dihasilkan sesuai tingkat noise dalam otak
Tangkapan layar kualitas gambar yang dihasilkan sesuai tingkat noise dalam otak

“Hasilnya menunjukkan, informasi gambar akan dikompres dalam lapisan bottleneck pada tahap awal proses pemodelan difusi terbalik. Seiring berjalannya proses penghilangan noise, disosiasi fungsional di antara lapisan U-Net muncul dalam korteks visual: lapisan pertama cenderung menunjukkan detail-detail halus di area visual awal, sedangkan lapisan bottleneck sesuai dengan informasi tingkat tinggi di area semantik yang lebih ventral,” kata para peneliti dalam studinya.

Penelitian di masa lalu telah menampilkan contoh-contoh gambar yang dihasilkan dari gelombang otak dan fungsi otak tertentu. Pada 2014, misalnya, seniman Shanghai Jody Xiong menghubungkan 16 orang penyandang disabilitas dengan balon cat melalui biosensor EEG. Peserta diminta memecahkan balon pakai pikiran, lalu membuat lukisan dengan cat tersebut. Di contoh lain, yang juga menggunakan EEG, seniman Lia Chavez mengadakan pameran yang bertujuan mengajak pengunjung menciptakan pertunjukan suara dan cahaya sendiri. Selama pameran, mereka memakai headset EEG yang akan mentransfer sinyal listrik di otak ke sistem A/V, yang akan memantulkan suara dan cahaya dari gelombang otak.

Seiring bertambah majunya teknologi generator berbasis AI, semakin besar peluang melatih model AI supaya bisa dihubungkan dengan otak manusia. Awal tahun lalu, tim peneliti dari Radboud University, Belanda, menggunakan data fMRI dari 1.050 wajah unik untuk melatih jaringan AI generatif, pendahulu Stable Diffusion. Jaringan itu lalu mengubah hasil pencitraan otak menjadi gambar sungguhan. Temuannya menunjukkan, AI mampu melakukan rekonstruksi stimulus yang tak tertandingi. Sementara dalam penelitian Universitas Osaka, model difusi yang populer belakangan ini mampu merekonstruksi hasil fMRI menjadi gambar beresolusi tinggi.