Pidato Multibahasa Masif Meta untuk Mendefinisikan Ulang Batasan Bahasa

Ilustrasi. (Foto: Gizmochina)

Sukoharjonews.com – Proyek pidato multibahasa merupakan lompatan maju yang signifikan dalam memajukan teknologi bahasa dan mempromosikan keragaman linguistik global. Proyek-proyek ini menggunakan model bahasa AI untuk mengenali dan menghasilkan ucapan dalam beragam bahasa, seringkali mencakup ribuan latar belakang linguistik yang beragam.

Dilansir dari Gizmochina, Kamis (25/5/2023), dengan memanfaatkan pendekatan inovatif, seperti menggabungkan sumber data yang tidak konvensional atau menggunakan pembelajaran representasi wicara yang diawasi sendiri, proyek wicara multibahasa bertujuan untuk mendobrak hambatan dan memberdayakan individu untuk berkomunikasi, belajar, dan mengakses informasi dalam bahasa asli mereka.

Meta telah merilis prestasi terbarunya dalam model bahasa AI dengan proyek Massively Multilingual Speech (MMS) yang inovatif, membedakannya dari sekadar replika ChatGPT. Dalam langkah menuju inovasi yang belum pernah terjadi sebelumnya, MMS Meta menawarkan kemampuan untuk mengenali dan menghasilkan ucapan dalam rangkaian lebih dari 4.000 bahasa lisan, melampaui kemampuan pendahulunya.

Tidak puas dengan merahasiakan terobosan ini, Meta telah memutuskan untuk membuka MMS, mengundang peneliti untuk memanfaatkan dan memperluas fondasinya. Dengan melakukan itu, Meta bertujuan untuk menguasai pelestarian keragaman bahasa dan mendorong kemajuan kolaboratif di lapangan.

Pengenalan ucapan tradisional dan model text-to-speech memerlukan pelatihan ekstensif pada kumpulan data audio yang luas, lengkap dengan label transkripsi yang cermat yang memfasilitasi algoritme pembelajaran mesin. Namun, banyak bahasa yang terancam punah, terutama yang ditemukan di luar negara industri, tidak memiliki data yang komprehensif, sehingga berisiko punah sama sekali.

Mengakui kesulitan ini, Meta mengadopsi pendekatan cerdik dengan memanfaatkan teks-teks agama yang diterjemahkan. Teks-teks ini, seperti Alkitab, menawarkan beragam penafsiran linguistik yang telah menjalani pemeriksaan ekstensif untuk penelitian terjemahan bahasa berbasis teks.

Menggunakan model wav2vec 2.0 untuk pembelajaran representasi ucapan yang diawasi sendiri, Meta semakin menyempurnakan kegunaan data dengan melatih model penyelarasan. Sinergi antara sumber data yang tidak ortodoks dan pemodelan ucapan yang diawasi sendiri menghasilkan hasil yang luar biasa. Evaluasi komparatif terhadap Whisper OpenAI mengungkapkan keunggulan MMS, mencapai pengurangan 50% dalam tingkat kesalahan kata sambil melampaui cakupan bahasa Whisper dengan faktor mengejutkan sebesar 11.

Dengan dirilisnya MMS sebagai proyek penelitian sumber terbuka, Meta bercita-cita untuk membalikkan tren teknologi yang mengikis keragaman linguistik, seringkali membatasi dukungan pada 100 bahasa paling umum yang disukai oleh raksasa teknologi.

Membayangkan dunia di mana teknologi bantuan, teks-ke-ucapan, dan bahkan teknologi virtual dan augmented reality memungkinkan individu untuk berkomunikasi dan belajar dalam bahasa ibu mereka, Meta berharap dapat menginspirasi pelestarian dan vitalitas bahasa di seluruh dunia. (nano)

Nano Sumarno:
Tinggalkan Komentar