Facebook maak FLORES-101-datastel in die openbaar beskikbaar om taalhindernisse te verbreek

Deur die datastel van hoë gehalte in die openbaar bekend te maak, hoop Facebook dat navorsers die werk aan veeltalige vertaalmodelle soos M2M-100 sal versnel en vertaalmodelle in meer tale sal ontwikkel, veral in gevalle wat nie noodwendig Engels behels nie.


FLORES-101 stel navorsers in staat om vinnig veeltalige vertaalmodelle soos M2M-100 te toets en te verbeter. Dit fokus op tale soos Oerdoe wat tans nie uitgebreide datastelle het vir navorsing oor natuurlike taalverwerking nie. Beeldkrediet: ANI
  • Land:
  • Verenigde State

Facebook het open-sourceFLORES-101 , 'n veel-tot-baie meertalige vertaling maatstafdata vir 101 tale, om taalhindernisse af te breek en navorsers te bemagtig om meer diverse vertaalhulpmiddels te skep, het die reus op sosiale netwerke Vrydag gesê.

Masjienvertaling help om die taalhindernisse tussen mense en inligting te oorbrug. Die evaluering van hoe goed vertaalstelsels presteer, was egter 'n groot uitdaging vir AI-navorsers. FLORES-101 bied die broodnodige oop en maklik toeganklike manier om betroubare meting van hoë kwaliteit, betroubare meting van prestasie van baie tot baie vertalingsmodelle uit te voer.

FLORES-101 stel navorsers in staat om meertalige vertaling vinnig te toets en te verbeter modelle soos M2M-100. Dit fokus op tale soos Oerdoe wat tans nie uitgebreide datastelle het vir navorsing oor natuurlike taalverwerking nie.



Met hierdie hulpmiddel sal navorsers vir die eerste keer die kwaliteit van vertalings betroubaar kan meet deur 10 100 verskillende vertalerigtings, byvoorbeeld direk van Hindi na Thai of Swahili. Die datastel bevat dieselfde stel sinne in alle tale, waardeur navorsers die prestasie van enige vertalingsrigting kan evalueer.

'Vir miljarde mense, veral nie-Engelssprekendes, bly taal 'n fundamentele struikelblok vir toegang tot inligting en vrye kommunikasie met ander mense. Alhoewel daar die afgelope paar jaar 'n groot vooruitgang was in die vertaling van masjiene, beide op Facebook AI Research (FAIR) en elders het 'n handjievol tale die meeste baat gevind by hierdie pogings. As die doel is om hierdie taalhindernisse af te breek en mense nader aan mekaar te bring, moet ons ons horisonne verbreed, 'Facebook het in 'n blogpos geskryf.

Deur die datastel van hoë gehalte, Facebook, openbaar te maak hoop dat navorsers die werk aan meertalige vertaling sal versnel modelle soos M2M-100 en ontwikkel vertaalmodelle in meer tale, veral in gevalle wat nie noodwendig Engels behels nie.

Ek dink [FLORES] is 'n baie opwindende bron om die voorstelling van baie tale in die masjienvertaalgemeenskap te verbeter

Graham Neubig, professor aan die Carnegie Mellon University Language Technology Institute in die Skool vir Rekenaarwetenskap.