
Sukoharjonews.com – Teknologi kecerdasan buatan berkembang dengan kecepatan luar biasa. Setelah model AI yang dapat membuat gambar dari kata-kata Anda dan berkomunikasi dengan Anda, kini Microsoft telah mengembangkan VALL-E, AI yang dapat meniru suara apa pun yang didengarnya hanya dalam tiga detik. Tidak seperti banyak alat AI lainnya, VALL-E dapat mereplikasi emosi dan nada pembicara, bahkan saat membuat rekaman kata-kata yang tidak pernah diucapkan oleh pembicara asli. Berikut detailnya…
Dilansir dari Gizmochina, Rabu (11/1/2023), microsoft baru-baru ini merilis alat kecerdasan buatan yang dikenal sebagai VALL-E yang dapat mereplikasi suara orang. Alat ini hanya menggunakan rekaman 3 detik dari suara tertentu sebagai prompt untuk menghasilkan konten, dan dilatih pada 60.000 jam data ucapan bahasa Inggris. Model AI mampu mereplikasi emosi dan nada pembicara, bahkan saat membuat rekaman kata-kata yang tidak pernah diucapkan oleh pembicara asli.
Ini adalah kemajuan signifikan dalam bidang ucapan yang dihasilkan AI, karena model sebelumnya hanya mampu mereplikasi suara, tetapi tidak dapat mereplikasi emosi atau nada pembicara. Makalah dari Universitas Cornell menggunakan VALL-E untuk mensintesis beberapa suara, dan beberapa contoh karya tersedia di GitHub.
Meskipun sampel suara yang dibagikan oleh Microsoft memiliki kualitas yang beragam, beberapa terdengar alami, sementara yang lain jelas dihasilkan oleh mesin dan terdengar seperti robot. Namun, seiring dengan peningkatan teknologi AI, rekaman yang dihasilkan kemungkinan besar akan menjadi lebih meyakinkan.
Namun, ada kekhawatiran tentang implikasi etis dari teknologi ini. Saat kecerdasan buatan menjadi lebih kuat, suara yang dihasilkan oleh VALL-E dan teknologi serupa akan menjadi lebih meyakinkan, yang dapat membuka pintu bagi panggilan spam realistis yang meniru suara orang sungguhan yang diketahui oleh calon korban. Politisi dan figur publik lainnya juga dapat ditiru, yang dapat menyebabkan penyebaran informasi palsu di media sosial.
Selain itu, ada masalah keamanan. Beberapa bank menggunakan teknologi pengenalan suara untuk memverifikasi identitas penelepon, tetapi jika suara yang dihasilkan AI menjadi lebih meyakinkan, pendeteksian dapat menjadi lebih sulit jika penelepon menggunakan suara VALL-E. Selain itu, teknologi ini juga dapat memengaruhi aktor suara, karena layanan mereka mungkin tidak diperlukan lagi jika suara yang dihasilkan AI menjadi lebih realistis.
VALL-E adalah alat AI mengesankan yang berpotensi merevolusi bidang sintesis suara. Namun, itu juga menimbulkan beberapa masalah etika dan keamanan. Penting bagi perusahaan seperti Microsoft untuk mengembangkan langkah-langkah untuk mengatur penggunaan VALL-E guna memastikannya digunakan untuk kebaikan, dan bukan untuk tujuan jahat. (nano)



Facebook Comments