Speech2Face ialah satu kecerdasan buatan (AI) canggih yang sedang diusahakan oleh para saintis di MIT. AI ini mampu mengagak dan melakar wajah seseorang hanya dengan menerusi suara mereka.
Daripada suara sahaja, banyak sebenarnya kita dapat agak tentang individu tersebut. Yang paling mudah ialah jantina dan umur mereka. Tetapi AI canggih ini mampu buat lebih lagi apabila ia turut dapat mengagak bentuk wajah pemilik suara itu sendiri.

Walaupun wajah yang dilakar tidaklah sangat teliti namun lakaran kasarnya tetap mengagumkan kerana ketepatan ia dengan wajah pemilik suara. Ia boleh menentukan dengan agak tepat bentuk hidung, tulang pipi atau rahang seseorang daripada suara mereka sahaja, kerana struktur hidung dan tulang lain di muka kita menentukan cara kita berbunyi.
“Model kami direka bentuk untuk mendedahkan korelasi statistik yang wujud antara ciri wajah dan suara individu dalam data latihan,” kata pencipta Speech2Face.
“Data latihan yang kami gunakan ialah koleksi video pendidikan daripada YouTube, dan tidak mewakili secara sama rata seluruh penduduk dunia. Oleh itu, model ini —seperti mana-mana model pembelajaran mesin lain—terjejas oleh pengagihan data yang tidak sekata ini.”

Etnik ialah satu lagi faktor Speech2Face boleh mengesan dengan ketepatan daripada hanya beberapa milisaat mendengar suara seseorang, kerana orang daripada kumpulan etnik yang sama cenderung untuk berkongsi ciri yang serupa. AI mempertimbangkan beberapa pembolehubah dan kadangkala memberikan hasil yang menakjubkan, tetapi ia masih dalam proses.
Dalam beberapa keadaan, AI masih menghadapi masalah untuk menentukan penampilan pemilik suara tersebut. Loghat bahasa pertuturan dan nada suara semuanya menyumbang kepada ketidakpadanan jantina, umur dan etnik yang besar.
Sebagai contoh, lelaki dengan suara yang sangat tinggi sering dikenal pasti sebagai perempuan, manakala perempuan dengan suara yang dalam dikenal pasti sebagai lelaki. Orang Asia yang fasih berbahasa Inggeris juga kelihatan kurang Asia berbanding ketika bercakap bahasa ibunda mereka.

Walaupun masih tidak lengkap, namun pencapaian AI ini untuk mampu melakar dengan agak tepat wajah hanya berdasarkan suara. Mungkin alat ini suatu hari nanti akan dapat membantu polis dalam mengesan penjenayah?
Untuk baca artikel-artikel yang berkaitan, anda boleh klik pada pautan di bawah: