对于那些不熟悉道格拉斯亚当斯科幻小说的人来说,让我解释一下。该巴贝尔鱼是滑溜溜的虚构的动物,占用了居住在人类耳道,利用他们的神经系统,以提供任何他们听到的语言即时翻译。
在现实世界中,到目前为止,我们必须与人力和软件口译员合作,尽力跟上。但百度研究公司新推出的人工智能工具,名为STACL,可以大大加快速度。它使用复杂类型的自然语言处理,只落后几个字,并通过预测未来保持不变。
百度硅谷人工智能实验室的首席科学家梁煌说:“值得注意的是,它预测并预测说话者将来会说几秒钟。” “这是人类口译员一直使用的技术 - 而且对解释技术的实际应用至关重要。”
STACL(具有预期和可控延迟的同声翻译)工具可与在联合议期间坐在展位内的人工口译相媲美。这些人的工作很艰苦。作为一个说话,口译员必须同时倾听,翻译和用另一种语言说话,通常只落后几句话。这是一项艰巨的任务,联合国口译员通常在团队中工作,轮班时间只有10到30分钟。
需要那种并行处理的任务 - 听,翻译,说话 - 似乎非常适合计算机。但直到现在,对他们来说也太难了。最好的“实时”翻译系统仍然执行所谓的连续翻译,在这种翻译中,他们等待每个句子结束,然后再用另一种语言呈现它。这些系统提供了非常准确的翻译,但它们很慢。
Huang告诉IEEE Spectrum,同声传译的重大挑战来自各种语言的词序差异。“在联合国,有一个着名的笑话,一个从德语翻译成英语的翻译会暂停,似乎陷入困境,”他说。“如果你问为什么,他们会说我正在等待德语动词。”在英语中,动词在句子的早期出现,他解释说,而在德语中它出现在句子的最后。
STACL通过根据过去看到的所有句子预测动词来解决这个问题。对于他们目前的论文,百度研究人员对新闻专线文章进行了STACL的培训,其中同样的故事以多种语言出现。因此,它擅长对涉及国际的句子进行预测。
黄先生给出了一个中文句子的例子,最直接的翻译是“习法国总统访问表达赞赏。”然而,STACL会从句子开头猜测访问会顺利进行,并将其翻译成英文。正如“习对法国总统的访问表示赞赏”。
对于他们目前的论文,研究人员展示了其从中文翻译成英语的两种语言(两种语言在字序上有很大差异)。“原则上,它可以适用于任何语言对,”黄说。“有关于所有其他语言的数据。我们还没有完成这些实验。“
显然,STACL可能会犯错误。如果法国总统的访问进展不顺利,习近而表示遗憾和沮丧,那么翻译就会有一个明显的错误。目前,它无法纠正错误。“人类翻译会道歉,但我们目前的系统没有能力修改错误,”黄说。
但是,系统是可调节的,用户将能够在速度和准确度之间进行权衡。如果STACL被编程为具有更长的延迟 - 比原始文本落后五个字而不是三个字落后 - 它更有可能使事情正确。
通过在特定主题中训练它也可以使其更准确,以便它理解将出现在例如医学会议的演示中的可能句子。“就像一个人类同声传译员一样,它需要在活动前做一些功课,”黄说。
Huang表示,STACL将于11月1日在百度世界大任雪案件会上进行演示,届时它将提供的实时同声翻译。目的是最终将这种能力放入消费者的口袋中。百度之前已经展示了一个用于逐句翻译的原型消费设备,Huang说他的团队计划将STACL整合到该小工具中。
目前,STACL致力于文本到文本的翻译和语音到文本的翻译。为了使其对消费者设备有用,研究人员希望掌握语音到语音的翻译。这将需要将语音合成集成到系统中。当语音一次只合成几个单词,而不知道整个句子的结构时,使它听起来自然是一个挑战。
Huang说,他的目标是让普通大众更容易获得即时翻译服务。但他指出,STACL“并非打算取代人类口译员 - 特别是对于需要精确和一致翻译的高风险情况。”毕竟,没有人希望AI成为国际事件的中心,因为它错误地预测了习的表达赞赏或遗憾。
本文由来源于财鼎国际(www.hengpunai.cn)