Meta, компанията майка на Facebook и Instagram, обяви плановете си да използва Библията и други религиозни текстове за обработка на над 4000 езика с крайната цел да запази тези езици. Но защо са решили да използват именно Писанието?
В усилията си да събере данни за своя проект за масова многоезична реч (MMS), изследователският екип на Meta Artificial Intelligence иска да използва Библията и други религиозни текстове, за да се справи с плашещата перспектива за събиране на такива данни за хиляди езици, тъй като съществуващите набори от речеви данни в момента са на не повече от 100 езика.
Обръщайки се към Библията, която е преведена по целия свят и налична в аудиозаписи на съответните преводи, изследователите успяват да създадат набор от данни за четене на Новия завет на повече от 1100 езика, които обхващат средно 32 часа данни на всеки език.
За да покрие 27-те книги и 260-те глави в Новия завет, Meta използва данни от Bible.com, GoTo.Bible и FaithComesByHearing.com, включително оригинален текст, както и аудиозаписи.
След това екипът на Meta AI надгражда тази работа, като използва „неозначени записи на различни други християнски религиозни текстове“ и докато те се изричат предимно от мъже, изследователите на Meta вярват, че езиковите модели „се представят еднакво добре, както за мъжки, така и за женски гласове“.
Christian Post


