Google翻译内核升级 称误差再降超55%.从思维观点看,人工智能不仅限于逻辑思维,要考虑形象思维、灵感思维才能促进人工智能的突破性的发展,数学常被认为是多种学科的基础科学,数学也进入语言、思维领域,人工智能学科也必须借用数学工具,数学不仅在标准逻辑、 模糊数学等范围发挥作用,数学进入人工智能学科,它们将互相促进而更快地发展。
近期,Google 翻译悄然升级了其翻译内核。据 Google 官方提供的数据显示,Google 翻译搭载的 Google 的神经机器翻译(GNMT:Google Neural Machine Translation)系统使用了当前最先进的训练技术,因而提升了机器翻译水平,将翻译误差再度降低了 55%-85%。
Google 展示的翻译模型质量
十多年前,Google 发布了 Google 翻译,早年基于短语的统计机器翻译,会将输入句子分解成词和短语,然后对它们进行独立翻译。这种翻译方式的劣势非常明显:句子中原本完整的信息被碎片化,无法连贯地进行表达。而这种现象在英中互译的情况下显得尤其明显。
而 Google 神经机器翻译则将输入的句子作为一个整体翻译。
以中英翻译为例,Google 神经机器翻译首先将这句中文的词编码成一个向量列表,其中每个向量都表示了到目前为止所有被读取到的词的含义(编码器“Encoder”)。读取完整个句子,解码器就开始工作——一次生成英语句子的一个词(解码器“Decoder”)。
上图展示了 Google 神经机器翻译的中英翻译原理
为了在每一步都生成翻译正确的词,解码器重点注意了与生成英语词最相关编码的中文向量的权重分布。
在被首次提出时,神经机器翻译系统在中等规模的数据集上就与基于短语的翻译系统水平相当。
现在,Google 方面表示,通过让神经机器翻译战胜在非常大型的数据集上工作的许多挑战,打造了在速度和准确度上都更好翻译的系统。
目前,Google 神经机器翻译系统已投入到了中文-英语的翻译中。现在,移动版和网页版的 Google 翻译的中英翻译已完全使用神经机器翻译——每天大约 1800 万条翻译。
有经过大型数据集考验的 Google 神经机器翻译系统加持,最新的 Google 翻译效果究竟如何呢?
我们做了一个简单的比较测试。当然,还是在中英翻译场景下。
测试场景:PC 端 Google 翻译网页版
随机选择了一则英文消息,原文如下:
Since COVID-19 began, we’ve heard from our retail and brand manufacturing partners that they’re hungry for more insights on how consumer interests are changing, given fluctuations in consumer demand. We see these changes reflected in how people are searching on Google. Last month, there were spikes in search interest for household supplies and jigsaw puzzles as people spent more time at home. This month we’ve seen surging interest for sewing machines and baking materials in the U.S., and tetherball sets and chalk in the United Kingdom and Australia.
Businesses are using a variety of resources to understand changing consumer interests—including Google Trends, social listening, surveys, and their own data—in order to help make decisions on the fly. But if they don’t know what to look for, there isn’t an easy way to understand which product categories are gaining in popularity, and might pose an OPPOrtunity.
That’s why we’re launching a rising retail categories tool on Think with Google. It Surfaces fast-growing, product-related categories in Google Search, the locations where they’re growing, and the queries associated with them. This is the first time we’ve provided this type of insight on the product categories that people are searching for.
旧版 Google 翻译给出的英译中结果:
升级后 Google 翻译给出的英译中新结果,红色标记字部分为与旧翻译结果的不同地方。新版翻译具体如下:
对比两段翻译结果,可以看出区别还挺大的。整体而言,新版翻译结果中标红文字的表述明显更符合汉语的语法和表述习惯。
另外,最后一段的翻译结果优化则更为明显,对 Google 产品名称“Think with Google”进行了准确识别,避免了乱翻译的尴尬。
确实更智能啦!
人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,主要包括计算机实现智能的原理、制造类似于人脑智能的计算机,使计算机能实现更高层次的应用。人工智能将涉及到计算机科学、心理学、哲学和语言学等学科。可以说几乎是自然科学和社会科学的所有学科,其范围已远远超出了计算机科学的范畴,人工智能与 思维科学的关系是实践和理论的关系,人工智能是处于思维科学的技术应用层次,是它的一个应用分支。
免责声明:
① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。
② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341
软考中级精品资料免费领
- 历年真题答案解析
- 备考技巧名师总结
- 高频考点精准押题
- 资料下载
- 历年真题
193.9 KB下载数265
191.63 KB下载数245
143.91 KB下载数1148
183.71 KB下载数642
644.84 KB下载数2756