据印度《经济时报》9月2日报道,Facebook的研究人员已经开发出了一种更快、更准确的方法,使用人工智能翻译乌尔都语和缅甸语等低资源语言。
据《福布斯》杂志报道,这项突破将在自然语言处理顶级会议 EMNLP上展示。由于Facebook这一社交媒体巨头使用自动语言翻译来帮助世界各地的用户阅读适用他们的语言的帖子,因此这一突破对其可能很重要。
Facebook人工智能研究院 ( FAIR )部门的团队,从维基百科等公开网站中获取大量不同语言的不同文本,以此来提升机器翻译 (MT)。
需要注意的是,这些文本是相互独立的。“建立一个平行语料库很复杂,因为你需要找到精通两种语言的人来创建它。例如,如果你想建立一个葡萄牙语和尼泊尔语的平行语料库,需要找到精通这两种语言的人,这是非常困难的,”研究科学家兼FAIR巴黎研究实验室主任Antoine Bordes表示:“另一方面,建立葡萄牙语和尼泊尔语单语语料库非常容易:无论它们是否为平行句子,也不管它们谈论的是否为同一件事,你只需要从葡萄牙语和尼泊尔语网站下载网页就可以了。”
大多数语言翻译计算机系统使用单语语料库和平行语料库来学习。Bordes称:“我们方法的新颖之处在于,只用从单语语料中提升MT系统,我们不需要任何平行语料。理想化来说,如果一本书是用外语写的,我们可以用我们的模型将其翻译成英语。”
免责声明:本文由用户投稿,(图文、音视频)均由用户自行上传分享,文章内容不代表本站立场,本站不对其内容的真实性、完整性、准确性给予任何担保、暗示和承诺,仅供读者参考,文章版权归原作者所有。若您的权利被侵害,请联系本站在线客服进行删除。