设为首页 - 加入收藏 ASP站长网(Aspzz.Cn)- 科技、建站、经验、云计算、5G、大数据,站长网!
热搜: 创业者 手机 数据
当前位置: 首页 > 站长资讯 > 动态 > 正文

"你打篮球像蔡徐坤":微信翻译这个bug是怎么回事?(3)

发布时间:2019-03-08 11:40 所属栏目:15 来源:品玩
导读:如果因为集外词和领域不匹配而出了错,你也不能怪它。没学过的东西,它又怎么可能会呢? 微信 AI 的官方网站 可能原因 4:奇怪单词+无法引入常识 这个原因也是由 NMT 的工作原理导致的。 NMT 对于长句子、段落,甚

如果因为集外词和领域不匹配而出了错,你也不能怪它。没学过的东西,它又怎么可能会呢?

微信 AI 的官方网站

可能原因 4:奇怪单词+无法引入常识

这个原因也是由 NMT 的工作原理导致的。

NMT 对于长句子、段落,甚至一整篇文章的翻译效果很不错。这得益于它的机制,在翻译某个词时能够贴合上下文的语境。

但是在短句上,它就不一定灵了——特别是当这个句子完全不通顺的时候。

可能因为在"you play basketball like caixukun"这句话中,caixukun 是一个非常奇怪的单词。它既没有出现在任何一本英语辞典当中,看上去跟句子的上下文也没什么关系。

微信翻译的训练,可能发生在蔡徐坤成为 NBA 中国新春贺岁大使之前

人类在翻译的时候,能够参考已有的常识、知识,翻不出来也可以去查资料。NMT 却做不到这一点,当它在工作的时候,它并不具备一个常识库可以去参考。

而且,这一点并不是微信做不好——现在去用同样的句子考考 Google Translate,得到的结果也不令人完全满意。

“这个(无法引入常识的)问题不仅体现在翻译任务上,还包括阅读理解、问答等任务。如何在这一点上做改进,是个很有趣的方向,大家也都还在探索,”王夏表示。

所以,微信做错了吗?

上述情况如若出现,必然会导致翻译错误,因为?NMT 就是这样工作的。就算不发生在微信上,也会发生在 Google Translate,或者任何其他一个基于 NMT 的翻译产品上。这样来看,微信产品本身没有任何过错。

但微信团队并非完全无辜的。因为除了技术上,bug 出现也有可能是流程管控上出了问题。

在一个9亿用户量级的全民级 app 里,开发任何功能都应该经过仔细的论证,上线前也应该有严格的测试,尽量确保万无一失。然而,微信的前工程师曾透露,至少在微信翻译上线时候并非如此。

当时,工程师在知乎上是这样回答的:

说来腾讯/微信也不是第一次出这种问题了。

去年腾讯 AI 负责博鳌亚洲论坛的同声传译,直接把一个基于 seq2seq 的机翻系统带过去了,先是把“一带一路”翻译成了“一条公路和一条腰带”和“道路和传送带”,接着又干脆抽风罢工。

“数据量大,活糙敢干。”

这是韩辰对这次微信翻译 bug 的评价。

接受硅星人采访时,一位不愿意透露姓名的蔡徐坤粉丝说,不希望看到有个别人通过技术的手段,去纵容针对艺人的网络暴力。

(编辑:ASP站长网)

网友评论
推荐文章
    热点阅读