A Meta forradalmi lépése a nyelvek megmentéséért

a nyelvek megmentése

A világon több ezer nyelv és dialektus létezik, amelyek a különböző közösségek és kultúrák kifejezőeszközei. Azonban sok nyelvet a kihalás fenyegeti, mivel már egyre kevesebb ember beszéli őket.

Azonban a Facebook anyacége, a Meta egy nagy projektbe kezdett a nyelvek felismerése és fordítása terén, egy új lehetőség nyílt meg a nyelvek megmentésére és népszerűsítésére.

Míg a Google Translate csak 133 nyelven elérhető, addig a Meta  MI (mesterséges intelligencia) modellje több mint ezer nyelvet képes felismerni és kommunikálni, lehetővé téve a kihalásra ítélt nyelvek számára, hogy újra felfedezzék őket a modern világban. 

Az egyik észt egyetem fejlesztett egy fordítómotort, amely 23 finnugor nyelvet képes fordítani. Ez egy nagy előrelépés a kevésbé elterjedt nyelvek számára, amelyek eddig nem voltak elérhetők a nyilvános fordítóprogramokban, lehetőséget nyújtva a kisebb nyelvű közösségek számára, hogy könnyebben kommunikáljanak a világ többi részével.

A Meta a projekttel kapcsolatban hozzáférhetővé tette a modelljét a GitHub kódtárhelyen.

A Meta reméli, hogy ez a lépés hozzájárul a beszédalkalmazások, a többnyelvű üzenetküldés és akár a bármilyen nyelven használható virtuális valóság rendszerek fejlődéséhez.

Az ilyen nyelvi programok fejlesztésekor nagy adatbázisra van szükség, de a kevésbé beszélt nyelvekhez kevesebb adat áll rendelkezésre. Azonban egy új megközelítéssel megoldották ezt a problémát. Átképezték 2020-ban fejlesztett modelljüket, hogy hang alapján tanulja meg az új nyelveket anélkül, hogy nagy mennyiségű adatra lenne szükség.

Ehhez az Újszövetség hangfelvételeit használták, amelyek egy internetes adatbázisban 1107 nyelven voltak elérhetők, valamint egy címkézetlen forrásból, amely 3809 nyelven tartalmazta az Újszövetség felvételeit.

Az első lépés az volt, hogy javították a beszédhangokat és a szöveges adatokat, ezután egy algoritmussal a kísérő szövegekhez igazították a hangfelvételeket. Ezt követően újraalkalmazták a folyamatot egy másik algoritmus segítségével, amely az új adatokat tanulta.

Ennek az új módszernek köszönhetően a kutatók "gyorsan és nagyon kevés adatból" képesek beszédrendszereket építeni olyan nyelvekből is, amelyeket viszonylag kevés ember beszél. A Meta modellje már több mint ezer nyelven képes beszélgetni, és több mint négyezer nyelvet ismer fel.

Ugyanakkor a csapat felhívja a figyelmet arra, hogy még mindig előfordulhatnak pontatlanságok és hibás szóhasználat a rendszerben, azt is elismerték, hogy ez a modell több "elfogult" szóhasználatot tartalmaz más modellekhez képest, bár ez az arány csak 0,7 százalék.

A Meta által végzett kutatás és fejlesztés jelentős lépést jelent a nyelvek fennmaradása terén. Az új modell lehetővé teszi, hogy a kisebb nyelvek és dialektusok is helyet kapjanak a digitális kommunikációban.

Ez az előrelépés nemcsak a nyelvek megőrzését és népszerűsítését szolgálja, hanem a különböző kultúrák közötti párbeszédet és megértést is elősegíti.