如何评价“搜狗世界互联网大会发实时机器翻译技术或让同声传 ...

[Copy link]
see4744 | reply20 | 2022-1-7 07:49:09 | 显示全部楼层 |Reading mode
大家都说的很好了,我提供一个不同的视角吧。
同传现在已经是一个相对比较成熟(但还有待规范)的行业了,需求随着国内外交流的加剧,也在不断增大。很多之前不需要翻译、同传的场合,慢慢的也有同传的渗透,比如公司内部讨论、知乎Live等等新的场景。客户越来越多,不知道大家有没有想过,客户对于翻译的需求是什么?仅仅是语言转换吗?
从功能上说,我觉得搜狗的翻译某一天,会有技术能力实现无缝的转换,只是时间问题。毕竟对于技术的发展,尤其是本土的创新,从大的趋势上看,我们应该支持、拥抱和保持乐观,而不是用个例去否定技术的进步性,打压创新和探索的积极性。
但是很多场景下,你会发现,翻译的存在意义是很多元的,不仅仅是为了翻译而翻译。
翻译的最终目的,是沟通。
而沟通本身,就是一种微妙的艺术,而不是纯科学。也有知友提到了,翻译是一个再创造的过程,而再创造的程度、标准,是非常主观的,没有标准答案。比如上面有个例子中提到UN同传——我们可能认为这句话点到为止就可以了,但是代表们却认为一定要把比喻中的本体说出来,但是对听众来说,也许知道了这个本体也并没有什么意义。作为翻译,在从听到说那么短的时间内,要做出判断、取舍和选词,是很有挑战的一件事。一场会下来精疲力竭,往往累的不是语言,而是语言背后对权力的权衡、形势的判断以及风险的预判。
因此很多场合下,译员并不是作为一个语言转换机器而存在的,他们是一个调解者。曾经有客户说过,我们需要翻译去为我们争取思考的时间;我们需要翻译去替我们化解激烈的矛盾;有一个第三方在场,我们有时还可以“不厚道”地归咎于翻译没翻到位从而争取自身利益的保障。很感激客户的坦诚,从我个人来说,作为一个纯技术派出身的翻译,刚出道的时候,在被客户投诉时,往往会非常自责陷入自我怀疑的情绪,认为是自己功力不足。但是后来经历的项目多了,也就看清楚一件事背后复杂性,慢慢地可以放下包袱,问心无愧地享受这个过程了。
不知道我表达清楚了吗。也许有一天搜狗、或者谷歌、或者百度,以及各位程序员,可以从机器的角度非常精确的做到字对字的翻译,功能上是可以替代的。但是情感上,或者情境上,人与人之间的互动能够达到的效果,是机器翻译没有办法替代的部分。所以在做翻译大概五年的时间里,我并不会担心机器会让我们失业,但是我会担心那些拥有语言技能和商业技能的专业人士,能够比翻译这个第三方更完美和顺畅地促进沟通,为企业更有效率地创造价值。
不过从这个角度看,一名好的翻译不应该仅仅关注语言转换的部分,而是一个综合素质都很厉害的专业人士——快速学习能力、沟通能力、谈判能力、临场应变、抗压能力,以及从业时必须要具备的时间管理、自我品牌管理、客户关系维护、问题解决能力等等外延技能。这样的能力在手,不管在哪一行,恐怕都不会担心失业,也不会担心搜狗会取代这个职业。因为任何所谓“成功”,从来考察的都是多个要素的综合体,而不是纯粹的技术本身。
希望这个答案,给很多提出这个问题的学生朋友,提供一些指导和信心。自律、坚持、磨练、进步、明智、反思,我们的目标是通过一份工作去挖掘、培养这些良好的品质,自我成长,而不是追求某一个具体的职位。“同传”这个身份不会给你带来任何光环,除非你知道你拥有的比“同传”多得多。
Translated by the Internet, your translation resource information platform, pay attention to the official account [translation information]-Official account:fanyi899
b433777 | 2022-1-7 07:49:20 | 显示全部楼层
大家都说的很好了,我提供一个不同的视角吧。
同传现在已经是一个相对比较成熟(但还有待规范)的行业了,需求随着国内外交流的加剧,也在不断增大。很多之前不需要翻译、同传的场合,慢慢的也有同传的渗透,比如公司内部讨论、知乎Live等等新的场景。客户越来越多,不知道大家有没有想过,客户对于翻译的需求是什么?仅仅是语言转换吗?
从功能上说,我觉得搜狗的翻译某一天,会有技术能力实现无缝的转换,只是时间问题。毕竟对于技术的发展,尤其是本土的创新,从大的趋势上看,我们应该支持、拥抱和保持乐观,而不是用个例去否定技术的进步性,打压创新和探索的积极性。
但是很多场景下,你会发现,翻译的存在意义是很多元的,不仅仅是为了翻译而翻译。
翻译的最终目的,是沟通。
而沟通本身,就是一种微妙的艺术,而不是纯科学。也有知友提到了,翻译是一个再创造的过程,而再创造的程度、标准,是非常主观的,没有标准答案。比如上面有个例子中提到UN同传——我们可能认为这句话点到为止就可以了,但是代表们却认为一定要把比喻中的本体说出来,但是对听众来说,也许知道了这个本体也并没有什么意义。作为翻译,在从听到说那么短的时间内,要做出判断、取舍和选词,是很有挑战的一件事。一场会下来精疲力竭,往往累的不是语言,而是语言背后对权力的权衡、形势的判断以及风险的预判。
因此很多场合下,译员并不是作为一个语言转换机器而存在的,他们是一个调解者。曾经有客户说过,我们需要翻译去为我们争取思考的时间;我们需要翻译去替我们化解激烈的矛盾;有一个第三方在场,我们有时还可以“不厚道”地归咎于翻译没翻到位从而争取自身利益的保障。很感激客户的坦诚,从我个人来说,作为一个纯技术派出身的翻译,刚出道的时候,在被客户投诉时,往往会非常自责陷入自我怀疑的情绪,认为是自己功力不足。但是后来经历的项目多了,也就看清楚一件事背后复杂性,慢慢地可以放下包袱,问心无愧地享受这个过程了。
不知道我表达清楚了吗。也许有一天搜狗、或者谷歌、或者百度,以及各位程序员,可以从机器的角度非常精确的做到字对字的翻译,功能上是可以替代的。但是情感上,或者情境上,人与人之间的互动能够达到的效果,是机器翻译没有办法替代的部分。所以在做翻译大概五年的时间里,我并不会担心机器会让我们失业,但是我会担心那些拥有语言技能和商业技能的专业人士,能够比翻译这个第三方更完美和顺畅地促进沟通,为企业更有效率地创造价值。
不过从这个角度看,一名好的翻译不应该仅仅关注语言转换的部分,而是一个综合素质都很厉害的专业人士——快速学习能力、沟通能力、谈判能力、临场应变、抗压能力,以及从业时必须要具备的时间管理、自我品牌管理、客户关系维护、问题解决能力等等外延技能。这样的能力在手,不管在哪一行,恐怕都不会担心失业,也不会担心搜狗会取代这个职业。因为任何所谓“成功”,从来考察的都是多个要素的综合体,而不是纯粹的技术本身。
希望这个答案,给很多提出这个问题的学生朋友,提供一些指导和信心。自律、坚持、磨练、进步、明智、反思,我们的目标是通过一份工作去挖掘、培养这些良好的品质,自我成长,而不是追求某一个具体的职位。“同传”这个身份不会给你带来任何光环,除非你知道你拥有的比“同传”多得多。
Translated by the Internet, your translation resource information platform, pay attention to the official account [translation information]-Official account:fanyi899
元直的心凹 | 2022-1-7 07:49:43 | 显示全部楼层
我不是科技工作者,但是作为一个伪Geek,对科技界的大新闻还是很关注的。
打上半年开始就在立这个flag了,从Google的神经网络翻译系统到搜狗的杀死同传。今儿看到这些个新闻标题,我王尼玛就特么很不乐意了。
同声传译或成历史!搜狗自研机器同传亮相世界互联网大会
搜狗世界互联网大会发实时机器翻译技术,或让同声传译失业
如果将来翻译上出现偏差,你们是要负责任的。
嘴炮打的震天响,实际视频的翻译效果高中英语水平就看得出还差得远得远,这已经很能说明问题了。视频里的译文错误和传达上的偏差,且不论在正式的工作场合,就是本科生的课堂上这么搞估计都会被老师劝回家种地。你狗取代同传之前,先超越谷歌翻译吼不吼啊?
这是谷歌发布大新闻当天我的朋友圈测试截图。


上面那些中学生都不会犯的错误,哪一个不是极其低级也极其严重的翻译事故?
我认为这恰恰反映了机器最大的局限。语言是活的,译员在接到消息后本身也在不断地判断,一些个人习惯之类的无意义言辞也不会帮他再说一遍,有时甚至还需要实时纠正发言人的口误。不举栗子了,一举例就被敏感词。所以我认为机器一朝过不了图灵这一关,就一日不能像围棋一样单靠一个先进的算法,模仿的足够好便可以打败人类译员。我不否认语料库的积累和科技的发展,但是我觉得鄙人再学个新专业可能比AI发展到这程度,能稍微快点儿。
很多人就是看不到信息无损(至少从表意层面上)转换和传播的难度和价值,甚至觉得机翻中的机器味儿还挺萌的。但是你就看看这谷歌大法的翻译质量,还有搜狗居然好意思腆着脸演示出来要取代同传的那个质量,外事无小事啊,真到了外交层面上你敢托付这样的机器对外传达一国之策?你再看看这浓浓的逐字逐译的重新定义英语的神特么机器翻译腔,你确定别人能理解?那我们干嘛还逼着自己看各种参考书,用脑力来经年累月地同自己的中式英语誓死斗争?行文流畅尚不可达,就更不要提文学翻译这种智力密集型的再创作在忠实原著的基础上给跨语言跨文化读者带来的审美享受了。现在的大环境是学英语的技术盲,搞技术的对英语行文最基本的审美和评判能力都没有。那下次再取代同传之前,你们起码先自己处理好机式英语的问题吼不吼啊?
且不谈实际翻译过程中寻找理论和经验依托不断决策和解决问题的过程。
就简单说说单是翻译的准备就是机器和算法目前所不能胜任的智力劳动。
1.翻译的前提是理解。
以翻译为目的的阅读是一个追求真相的过程。这种真相体现在五个层面。一是事实真相,即保证译文起码要符合原文意在反映的客观事实。二是逻辑真相,即文本的因果,联系乃至谋篇布局的合理性。三是寓意真相,即文学翻译中典故、寓言乃至想象与表达意图的一致。四是美学真相,即传达文学作品中的形式美和韵律美,乃至准确反映非文学作品行文的流畅得体和言语力度。五是语言真相,即一种语言的成语有时可以用来弥补另一种语言表达上的不足和缺失。
2.理解的前提是批判性阅读。
所谓批判性阅读,是指认真、积极、深入的分析性阅读,是在特定文本中发现信息的思想和技巧。人类的思维使我们能够根据已有的知识、常识或逻辑深入思考阅读的内容是否正确,逻辑是否连贯,并对特定文本信息进行评价甚至根据译入语逻辑表达的习惯重新谋篇布局。我们需要据此理解、查证文字背后的客观事实;分析作者的写作意图;发现和澄清歧义;保证译文语气连贯行文流畅甚至发现原文中的问题。一篇文本,当我开始翻译的时候,才发现很多时候有些在阅读中一扫而过以为理解了的东西实际上并没有真正读懂。这种批判性阅读和对理解深度的要求,受过良好训练的人类尚且需要付出极大精力,遑论图灵测试都没可能活过几轮的机器,也别再吹还需要双语对应翻译的机翻了,而这种翻译方法本就是译者大忌。
虽然我非常支持人工智能的发展,但就这么说吧,真到了人工智能发展到能够理解自然语言的强人工智能阶段,同传还能不能混饭都是小得不能再小的小事儿。这种程度的人工智能几乎有能力涵盖人类社会生活的方方面面,其为社会和产业结构带来的震荡远非工业革命的大规模下岗潮所能比拟。现阶段的弱人工智能主要是三件事情,一个是帮助译员提高标准化文本的翻译效率,第二可以服务于精度要求不高的日常翻译(我有些法语文本都是用谷歌翻译过来快速浏览个大概),还有就是为鱼龙混杂的市场淘汰一批低端二把刀译员。我当然支持人工智能的发展,这是高新技术,是历史的行程,我怎么能不支持,这对译员来说也是很大的。有朝一日倘若真被取代了大不了转行,我祝福人工智能取得重大突破,发展一个。
但是这个姿势就跳出来雷人,强行作古职业同传。
还真是叫人忍俊不禁呢。:-)

There are more resources in this post

What do you need Sign in Can I download or view it without an account?Join now Scan and login on wechat

x
Translated by the Internet, your translation resource information platform, pay attention to the official account [translation information]-Official account:fanyi899
藏獒47 | 2022-1-7 07:50:13 | 显示全部楼层
我真的看不下去这个问题底下的有些回答。好像他们只能接受我们这些学同传的,做同传的看到搜狗的即时翻译,马上痛哭流涕,感叹生不逢时,最后卷铺盖回家才好,看到有人指出这个东西现在还不太行,一下子就比搜狗内部参与开发的人还要激动,一味只是在那里阴阳怪气,俨然我们已经成为一群冥顽不化的人,不承认自己是时代巨轮下的蚂蚁一般。
请你们别再自high了,这种需要造势的新闻标题上,记者都不忘加一个“或”字,而且这个问题下有两个搜狗业内团队的人,自己都不敢说“同传马上就要下岗”。
谁也别扯什么“未来一定会被取代”,100年后也叫未来,那时候跟你我还有关系吗?
比同传技术含量低的职业多了去了,怎么没见被取代,现在还好好的呢?
alphago把李世石打败了,难道人就不下棋了吗!
拜托你们,和同传业内人士以及搜狗业内人士一样,摆正心态,面对现实,我们客观一点,好不好?
----------------------------------原答案分割线-----------------------------------
很喜欢
@陈伟 的回答,因为他作为一个业内人士,能够客观地看待机器翻译与人力翻译之间的不同特征和差距。我完全不懂技术,只能从一个学同传的学生角度谈一下自己的看法。
作为一个学同传的,未来很有可能要踏入同传这个行业。但前有谷歌翻译,现有搜狗翻译,人们纷纷唱衰同传这个行业。我每次都怀着忐忑的心情点开新闻,但每次都安心而归。
我有两个观点和陈伟一致:
1.随着技术的发展,目前的效果只是一个开始。
2.但现在的机器翻译水平完全无法取代人工翻译,同传更是如此。而且现在机器翻译的表现远远称不上合格。我相信新闻里那些摘下同传设备,转而依赖搜狗即时翻译的外国听众也会赞同我这一点。
不说虚的,咱们来看看视频里的机器同声传译到底表现如何:
王小川:“那么在这里面,我要开始畅想,未来的路在什么地方?”
机器翻译:So in this, I want to think about it. Where is the future of the future?

可以看出,目前机器翻译的一大特征就是机械性.
这个特征在“Where is the future of the future?”有所体现。由于机器无法体会上下文,所以出现了这么一个语焉不详的句子,但人工翻译熟知讲话的语境,所以如果是我,我就会翻成"what is the future of (the development) of search engine?"
另外,“那么在这里面”其实只是王小川的一句无甚意义的衔接句,一个“so”就足可以解决问题,如果说成so in this,老外就会不懂:in what?what does your "this" mean?
那么更深入一步,机器将如何识别同样文字在不同语境下的意义?比如:
1.那么在这里面,我要开始畅想,未来的路在什么地方?
2.那么在这里面,其实是有一只猫的。
从一个行外人的角度,我想这个技术问题想必要通过很长时间的发展才能被攻克。
王小川:“从我自己的一个描述(:)搜索的未来就是人工智能时代的皇冠。为什么这么说呢?
机器翻译:A description of my own. The future of search is the crown of Artificial Interlligence era. Why do you say that?

弊端仍旧是过于机械。我会处理为:"I would say that XXXX. Why would I say so?"
而且机器翻译的结果暴露出机器仍旧需要学习如何断句。比如:
王小川:我会认为搜索的未来(,)就是问答机器人。
机器翻译:I will think the future of search. The QA Robot.

类似的问题在短短的1branch50秒里出现很多,这也证明机器翻译与人力翻译仍有不小的距离。现在的机器同声传译,其实也只有【机器即时机翻】的效果,离同传还很远。(加粗字为11month24日添加)
总之,从一个同传学生的角度来看,目前还看不到威胁(未来的事情谁说得准?),相信比我一个学生水平更高的同传业内人士,也会有相同的看法。
从我个人的私心,我当然希望这玩意儿几十年内别发展起来(不然我拿什么吃饭),但科技高速发展的洪流不是一两个人可以阻挡的。
Translated by the Internet, your translation resource information platform, pay attention to the official account [translation information]-Official account:fanyi899
Beiwutounei | 2022-1-7 07:50:20 | 显示全部楼层
我女儿在家说中文,在幼儿园说英文。现在她们两岁半。
最近她们总是跟我说:妈妈我要那个饼干在桌子上。
我说好。于是就把饼干放在桌子上。
然后她们就开始大哭。
几次之后我终于明白怎么回事。
这是典型由翻译不畅引起的沟通危机。

------------------------------------
有必要陈述一下我的观点,引用一句话:
Interpreters will never be replaced by technology, they will be replaced by interpreters who use technology.
----Bill Woods
Translated by the Internet, your translation resource information platform, pay attention to the official account [translation information]-Official account:fanyi899
我爱Sunhine | 2022-1-7 07:51:06 | 显示全部楼层
不断看到有新的回答,其中有许多人工智能从业者,认为自然语言理解与输出不是一个非p问题,肯定是可以在一定期限内解决的。我必须补充一下在这方面的一些看法。
首先,翻译并不是机械的语言转换。它是具有创造性的活动。翻译理论也强调在口译中最重要的是“达意”,要“脱离语言外壳”。高端译员和入门译员的差异并不只在于处理语料的速度较快、可以瞬间应用的字词组合较多。翻译归根结底是交流,其中人的因素是极其重要的。好的译员(也是同声传译译员的及格线)不应该是鹦鹉学舌,而应该在理解后进行输出。在工作时,必须在瞬间做出判断以找出尽可能最好的表达方式,而这些判断是基于对讲者意图的理解而做出的。这不仅仅是语言上的判断,其中还有价值判断。同样一句话、同样的字词组合,在不同语境下的表达目的是不一样的。不同的讲者在不同的场合即使表达的是同一个意思,也要根据情况不同而使用不同的词句,译者要做社会身份方面的判断。这方面机器翻译的判断能力比较弱。
另外还有一个很现实的问题:讲者大部分不是完美的。许多讲者在说话时有非常多的重复、冗余、矛盾、语言混乱。在不影响意图的情况下,同传译员应该去芜存菁,尽力简洁地表达实际含义,甚至改变句式,选择更好的逻辑结构。这和纯粹的语言转换不在一个层次上。即使讲者的母语非常流畅,其中也有文化的因素必须考虑。许多表达,如果死扣住原文,字对字翻译过去,异国听众会有严重的理解障碍。
我虽然不是人工智能从业者,也知道这种程度的强智能对于现在的人工智能领域来说仍然是可望不可即的。就像另一个答主所说,如果这种程度的强智能也已经可以实现,那问题就已经不仅仅限于同声传译一行,人们所应该做出的应对也不仅仅是“不要学同声传译”这么简单了。到那时,或许工作都失去了意义。
P.S.我觉得这个问题和机器人能不能超过书法家,Auto摄像模式能不能取代摄影师一样,都问得有些歪。能够评判出优劣的作品,并不等于能够机械式量化评判标准。归根结底,是人在做判断,是人才有价值。
===
今天学校有UN资深译员来做讲座,分享了不少故事。中国代表团的要求很高,一些谚语翻出了准确意思,但没有用原来的意象,就会投诉译员(虽然翻译质量很高)。受过这么多年训练,堪称中英语对全球最高水平的UN汉语同传箱,在做了多年程式化主题,并且在UN字对字、追求准确、不过度要求目标语地道优雅流畅的前提下,依然会有一些错误和妥协,你怎么要求机器做得更好?能用到同传的会议,级别都不低,一个错误就是致命的。面对汉语这种高情景语言,你放心交给机器?翻错了怎么办?
另外请大家不要高估语音模拟技术。出来效果不够自然的话,要让市场接受也很难。看字幕的效果也不好。
笔译的机器辅助翻译姑且都需要大量语料积累,更别说更不定形的口语表达。语料库可是很贵的,机器口译的高频次表达积累成本也可能会比较高,不值得用。
另外汉语是高情景语言,我认为要让机器理解是比较难的,要保证低失误率更难。看搜狗这次发布的效果就知道了,翻出来的英文没法看。
归根结底,效果不好,准确率没有保证,用户体验不一定好,成本不一定低。
我觉得,要让我们失业,恕我直言,还早呢。
Translated by the Internet, your translation resource information platform, pay attention to the official account [translation information]-Official account:fanyi899
方芳可可逗 | 2022-1-7 07:51:36 | 显示全部楼层
谢邀,作为从前的程序猿,今天的口译民工,只想说,呵呵。
1.谁知道演讲稿是不是他们的同传程序已经自己学习过一遍了。。。。语料库里肯定也没少放老大的演讲吧。
2.我不否认在旅游业等精度要求低的行业可以用,意思差不多到了就行,碰到商务谈判你还真敢用机器啊,合同条款、数额错了你找搜狗赔么?
3.国际会议啥的,还是不能轻易用机器吧,国家脸往哪儿搁?
4.我还在等机器学得会反讽、笑话、双关,并且能联系上下文的那天。
5.机器拿到的语料那么杂,至少得先学会分清,哪个是好的哪个是坏的,该跟谁学吧。
6.多数大型的会议都会涉及商业机密,口译员都不一定能提前拿到资料,你还要搞个联网的机器帮你实时把会议信息传到服务器上去么?会议同步直播出去了,还收得到门票钱么?并购合同信息先漏出去了,公司还干么?还有无数off the record的会议呢?
个人认为,低端口译本来就是迟早被淘汰的,就像普通的电子表价格从几百块降到三四块简直是历史的必然。高端市场会受到一点冲击,但影响还不至于那么大,就像瑞士名表,依然会很贵,很贵。。。
也许机器最后会取代这个行业,但我想不是这几年。

哦BTW, 有些公司都还没有知己知彼,就敢说自己能干掉一个行业么。
Translated by the Internet, your translation resource information platform, pay attention to the official account [translation information]-Official account:fanyi899
这种言论每天都有,最近最火的大概是讯飞了。玩了一个简单的,截图博大家一笑。要知道讯飞的语音识别技术已经是国内一流,但机器翻译还是无法囊括人类思维的多变,以及人类讲话的即兴。



机器尚且get不到一些东西






看到了吗,如果speaker说话的时候经过思考,有迟疑,有重复,机器还是无法鉴别和更正的。“大力推进”就会变成“大理石推进”。



最后,开心滴唱了两首歌儿歌(第一首是《种太阳)。它暴走了

There are more resources in this post

What do you need Sign in Can I download or view it without an account?Join now Scan and login on wechat

x
Translated by the Internet, your translation resource information platform, pay attention to the official account [translation information]-Official account:fanyi899
熊关漫道劳 | 2022-1-7 07:52:53 | 显示全部楼层
川总在世界互联网大会上演示的实时语音翻译技术是我们团队完成的,11month17日演示之后在网络上引起了很多人的讨论——就是机器翻译是不是能替代同传,翻译人才是不是要失业?

        从技术的角度来看,机器翻译现在完全取代人工翻译是不现实的,机器翻译的效果以及稳定性较人工而言仍存在差距,比如在重大国际会议、书面翻译这种比较严谨的场合,机器翻译受制于效果仍无法被使用。但是不可否认的是,目前机器翻译的技术已经在颠覆整个翻译的产业,无论是从辅助译员提升翻译效率来看,还是从辅助旅游出行用户降低跨语言交流难度来看,都说明今后机器翻译颠覆甚至取代人工翻译都是有可能的,但是会是一个渐进性的替代,替代的过程一定是从垂直领域的弱人工智能到通用领域的强人工智能,这个替代的周期长短取决于机器翻译技术本身的发展和翻译数据量的不断扩充。从目前的情况来看,技术本身仍有很多难题要攻克,尽管NMT技术已经取得突破,但是仍有很多问题亟需解决,比如突发性的犯傻,另外就是用于机器翻译的双语平行语料的积累难度比较大,目前针对口语等场景的语料获取和标注的成本会更高,而口语翻译和公文合同等逻辑性较强的翻译任务相比,语言的灵活性和变化会更多,对数据的需求也会更大。

        结合我们本次实时语音翻译技术来看,这次演示涵盖了语音识别and机器翻译两个技术方向,语音识别的部分今年7月份在极客公园·奇点大会上已经进行过演示,传送门:王小川在奇点大会演示的实时上屏技术是如何实现的? - internet - 知乎 而本次将识别和机翻结合在一起则是业界首次基于神经网络的“实时机器翻译”技术在大型活动上的展示,语音识别准确率97%的准确率和翻译90%的准确率可以证明我们在这方面的能力。

        stay4年以前这两个方向是完全不同的两个专业领域,有着完全不同的pipeline,复杂并且严重依赖领域经验,但是随着人工智能的兴起,深度学习逐渐成为主流,整个机器学习的流程pipeline从复杂变得简单,特别是端到端的技术让整个建模过程更加简单清晰,语音识别和机器翻译会更多的被看做相同的seq2seq的方法,方法也逐渐趋同,技术间的交叉也比较明显,比如attention我们在语音识别和机器翻译都在使用,因此基于语音方面的积累,我们快速建立起了搜狗自有的机器翻译NMT框架,同时数据方面,搜狗输入法、搜索等产品积累的数据,可以更好地为复杂的神经网络模型提供支持,很好提升了模型的泛化能力,在口语、旅游等多个领域较其他机翻产品取得较明显的优势。
        但是在NMT框架下,仍然很清楚的认识到,目前机器翻译的建模框架仍然在不断演进和进步,state-of-art的方法仍没有形成,目前系统翻译效果突发性的犯傻一方面是模型层面需要进一步打磨,模型的结构上可以继续做深,谷歌8layerEncoder+Attention+8layerDecoder的方式已经算是目前最疯狂的做法,最终上线更多依赖工程化和运算力的优化,除此之外就是建模的细节,比如实体词、集外词的处理;另外一方面,数据量现在仍然远远不够,深度神经网络具备很强的拟合和泛化能力,但是性能的不稳定很大程度在于数据量仍然远远不够,模型的Variance仍然不小,因此机器翻译效果的提升不是一日之功,但是随着运算力+data+技术的不断累积,目前的效果只是一个开始。

        因此从大的发展趋势来,机器翻译技术接近甚至超过大部分译员的翻译能力是有可能的,这也是为什么我们觉得机器翻译会在未来大大压缩翻译人才的就业空间的原因,未来专业翻译人员的准入门槛和培训成本会越来越高,工作机会也会变少,因此就像川总微博提到的择业还需谨慎。

利益相关:搜狗语音翻译团队
Translated by the Internet, your translation resource information platform, pay attention to the official account [translation information]-Official account:fanyi899
绕青柔劫 | 2022-1-7 07:53:07 | 显示全部楼层
第五届互联网大会于11month7Solstice9日在浙江乌镇举行,期间,搜狗公司CEO王小川接受了网易科技等媒体采访。
对于此前行业内饱受争议的同声传译事件,王小川表示,同声传译技术本身离成熟是有距离的,企业需要用心去打磨自身技术,现在对机器服务技术就进行过度的宣传是不好的。
详见:王小川:搜狗明年将会发布战略级产品
Translated by the Internet, your translation resource information platform, pay attention to the official account [translation information]-Official account:fanyi899
You need to log in before you can reply Sign in | Join now Scan and login on wechat

Integral rules of this edition

24

theme

24

Post

84

integral

Registered members

Rank: 2

integral
84