百度自然语言负责人吴华:基于神经网络的机器翻译,我们比 ...

[Copy link]
see6686 | reply0 | 2021-10-19 21:27:43 | 显示全部楼层 |Reading mode
Author: Xin Zhiyuan
新智元报道

作者:胡祥杰

:COO、执行总编、主编、高级编译、编缉、运营总监、客户经理、咨询总监、行政助理等 9 大岗位全面开放。

简历投递:jobs@aiera.com.cn

HR WeChat:13552313024

新智元为COO和执行总编提供最崇高高贵百万的年薪鼓励;为骨干员工提供最完好的培训体系、高于业界均匀程度的工资和奖金。

加盟新智元,与人工智能业界领袖携手改变世界。

【新智元导读】12month21日,百度举行机器翻译技术开放日。本次开放日主要向外界传递的一个主题是:百度早于谷歌和微软,在一年前已经推出最近很火的基于神经网络的机器翻译(NMT)系统。

新智元讯 2016year12month21日,百度举行机器翻译技术开放日。 百度技术委员会联席主席、自然语言技术负责人吴华博士作技术陈述,她说,百度早在1年多以前就率先发布了世界上首个互联网基于神经网络的机器翻译(NMT)系统,引领机器翻译进入神经网络翻译时代。

神经网络翻译技术从2014year9月提出,百度2015year5月上线首个互联网NMT系统。本年9月,谷歌、微软等公司也相继发布NMT系统。

NMT技术缘何遭到追捧?据吴华介绍,它抑制了传统方法将句子分割为不同片段停止翻译的缺点,而是充实操作上下文信息,对句子停止整体的编码和解码,从而产生更为流畅的译文。

据介绍,当时百度翻译技术人员系统化地提出了一整套处置方案。譬如,通过引入SMT中的特征处置NMT系统集外词(OOV)无法翻译、译文不完好(漏词)的问题,借助算法改进将解码速度提升数十倍;提出首个基于深度进修的多语言翻译框架,处置数据稀疏问题;同时将模型压缩70倍便于挪动用户在本地运行等。

目前,百度翻译撑持全球28种语言互译、756个翻译标的目的,每日响应过亿次的翻译恳求。此外,百度翻译还开放了API接口。目前已有超过2万个第三方应用接入。华为、OPPO、中兴、三星等手机厂商,金山词霸、灵格斯词霸、敦煌网等众多产均接入了百度翻译API。世界常识产权组织(WIPO)也将百度翻译API集成到官网,供用户将专利信息翻译成不同语种查询。

不外,吴华对新智元介绍说,百度翻译如今的准确率只能说是有70分左右,离90分的准确率还有很远的间隔。此外,如今整个百度翻译的商业形式是To C 的,To B业务目前还没有展开,但是以后会考虑。

处置数据稀疏的问题


NMT 模型近几年来的开展中一个核心问题,就是处置数据稀疏。

在承受新智元的采访时,吴华说:

其实不管是神经网络翻译技术,还是以前统计机器翻译技术都是基于双语语料的,比如中英的翻译是一句中文和一句完全翻译好的英文对照的,之后才能提供翻译效劳。但是,并不是所有的语言之间的语料都是很充实的,英文和中文,英文和法语之间可能比拟照较充实一些,但比如中文和日本、韩语就比较少。

为理处置这个问题,百度以前基于统计翻译的时候,提出了疏轴的语言,这个方法做的比其他公司好。在NMT技术下,是借鉴和其他语种的语料优势来翻译的,当时提出这个方法的时候发表在国际会议上得到了很高的评价。

这个技术本质上还是处置数据稀疏的问题,因为NMT这种机制能够多个语言一起进修。谷歌如今也是在这个技术上,用多个语言一起训练然后共享参数,共享参数的目的是为了借鉴其他语种语料的优势,来处置语料稀疏的翻译质量问题。本年11月份谷歌提出了Zero-shot的方法,实际上也是处置数据稀疏的问题。


NMT 的不足

开放日现场,记者问到,NMTandSMT(基于统计的机器翻译)的区别。吴华说,SMT不管是基于短语还是句法的,都还是在部门解码,没有看全句最优。但NMT的好处是先看整个句子的意思,然后再翻译。这个过程就会表示出来仿佛理解了一句话的意思,所以在选择翻译词的时候,愈加符合这个句子的语意一些。这也就是为什么NMT在翻译长句的时候好一些。但NMT没有真正处置语义问题,虽然它很长一段时间都是主导。

她说:“NMT的优势实际也很明显,因为NMT还只不外是高级一点的形式识此外技术,所以没有真正处置语义的问题。”

与谷歌翻译的比照

谈到谷歌翻译与百度翻译的比照。吴华认为,谷歌翻译在基于统计的机器翻译上做得很好,处于领先地位,但是在基于神经网络的机器翻译上,百度走在了前面。并且,谷歌翻译是以英语为中心的,百度翻译的中心是中文。此外,在语音的翻译上,百度要领先一些。


她说:“谷歌翻译是处在一个领先地位的,但我们的优势在于,在基于神经网络的技术上,我们是有点领先的。谷歌翻译发新闻通稿,里面也引用了我们很多之前发表的一些文章,这个大家假如关注的话能够查到。在神经网络这条线上我们是走在前面的,虽然他们在统计翻译里还是走在前面的。”

她还补充道:“在线上的翻译系统里,我们在白话翻译上实际上是明显超越谷歌的,这一点大家能够随意去尝尝看看。”

新智元招聘

职位 运营总监

职位年薪:36- 50万(工资+奖金)

工作地点:北京-海淀区

所属部门:运营部

陈述请示对象:COO

部属人数:2people

年龄要求:25 year 至 35 year

性别要求:不限

工作年限:3 年以上

语 言:英语6级(海外留学布景优先)

职位描述

    负责大型会展赞助商及参展商拓展、发掘潜在客户等工作,人工智能及机器人财富标的目的

    擅长斥地市场,并与潜在客户成立良好的人际关系

    深度理解人工智能及机器人财富及相关市场情况,随时掌握市场动态

    主动协调部门之间项目合作,组织好跨部门间的合作,具备良好的影响力

    率领团队完成营业额目的,并监控打点项目情况

    负责公司平台运营方面的战略方案、合作方案的制定与施行

岗位要求

    大学本科以上学历,硕士优先,要求有较高英语沟通才能

    3年以上商务拓展经历,有团队打点经历,熟悉商务部门整体打点工作

    对传统全案公关、传统整合传布整体方案、策略性整体方案有深邃见解

    具有敏锐的市场洞察力和准确的客户阐发才能、较强的团队统筹打点才能

    具备优良的时间打点、抗压才能和多任务规划统筹执行才能

    有广泛的TMT领域人脉资源、有甲方市场部工作经历优先考虑

    有媒体广告部、市场部,top20公关公司市场拓展部经历者优先

新智元欢送有志之士前来面试,更多招聘岗位请访问新智元公众号。

There are more resources in this post

What do you need Sign in Can I download or view it without an account?Join now Scan and login on wechat

x
Translated by the Internet, your translation resource information platform, pay attention to the official account [translation information]-Official account:fanyi899
You need to log in before you can reply Sign in | Join now Scan and login on wechat

Integral rules of this edition

15

theme

22

Post

64

integral

Registered members

Rank: 2

integral
64