语料库和记忆库有什么区别,两者是一样的吗?

[Copy link]
see2617 | reply3 | 2022-1-12 13:38:37 | 显示全部楼层 |Reading mode
双语平行语料库主要用于翻译领域或语言学领域,而翻译记忆库一般只用于翻译领域。但从两者所收录的语料、结构和作用角度分析,它们确实存在许多共同之处。
双语平行语料库:语料是语言的记录,是研究语言和翻译的重要素材。按照一定的语言原则,运用随机抽样方法收集自然出现的连续的语言,运用文本或话语片段建成的具有一定容量的大型电子文本库就是一个语料库。语料库主要分为三类:可比语料库、多语语料库和平行语料库。多语语料库用于研究翻译文本的风格,为研究翻译文本提供有效的参考系数;可比语料库在翻译研究中最具应用潜力,主要用于研究深层次的翻译问题,如翻译规范性等;平行语料库,主要有词语级别、句子级别和段落级别平行语料库,同时它还分为单向平行语料库和双向平行语料库,其主要应用于翻译实践、翻译教学、翻译研究、译员培训、词典编撰和机器翻译等领域,是与翻译领域最接近的一种语料库。双语平行语料库与其他语料库最大区别在于所收集的语料类型和所涉及的语料处理过程。双语平行语料库收集的都是原语与目的语一一对应的双语语料,包括词词对应,句句对应,段段对应或是篇篇对应,有些平行语料库需要句子长度对应的语料。语料对应程度和翻译质量将直接影响双语平行语料库的质量和建设进程。双语平行语料库除了要对所收集的语料精挑细选,进行格式和标记处理,还需对语料进行最为重要的对齐处理。语料对齐的精准程度关系到整个平行语料库的存亡。
翻译记忆库:翻译记忆库是一种用于储存原文与对应译文的语言数据库。翻译记忆库主要存在于计算机辅助翻译系统中,它凭借计算机高速处理能力将待翻译原文与库中每一个原语句子进行匹对分析,然后根据匹配率进行排名,将达到译者要求的匹配率的库中原文的译文瞬间显示给译者参考,协助译员完成翻译工作;在译员对一个新翻译单元(如句子)翻译完毕后,记忆库会自动将刚才完成的译文与原文组成完全匹配对并收录到记忆库中,记忆库规模通过此动作得到不断扩充。翻译记忆库主要协助译者开展工作,译者得到达到自己设定的匹配率要求的原文的译文后,可根据实际情况,完全采用译文或略作修改后使用或完全不使用。如果译者选择完全采用匹配率达到100%的已有原文的译文,记忆库将不会修改已有的译文也不会重新收录新的译文;如果译者对已有译文进行修改后再使用,记忆库将对新的原文与译文配对,并收录到记忆库中;对于记忆库没有提供参考译文的“新原文”,记忆库同样会将翻译后的译文与原文配对并收录到库中。在此过程中,记忆库收录的都是匹配率达100%的精确对齐的语料。翻译记忆库记录了译者从开始使用记忆库以来翻译过的所有原文和对应的译文,是译者翻译轨迹的最佳见证。无论是翻译工作者个体还是翻译团队,只要他们一直使用已建立的记忆库并没有改变所从事的翻译领域,翻译记忆库对他们的作用将会越来越显现。当记忆库伴随他们工作至一定时间或一定量时,它给翻译工作带来的变化会从量变上升到质变,译者们也会越来越依赖记忆库。
                                                                    摘自《从双语平行语料库到翻译记忆库》作者:李毅鹏
Translated by the Internet, your translation resource information platform, pay attention to the official account [translation information]-Official account:fanyi899
玫玫88 | 2022-1-12 13:39:24 | 显示全部楼层
双语平行语料库主要用于翻译领域或语言学领域,而翻译记忆库一般只用于翻译领域。但从两者所收录的语料、结构和作用角度分析,它们确实存在许多共同之处。
双语平行语料库:语料是语言的记录,是研究语言和翻译的重要素材。按照一定的语言原则,运用随机抽样方法收集自然出现的连续的语言,运用文本或话语片段建成的具有一定容量的大型电子文本库就是一个语料库。语料库主要分为三类:可比语料库、多语语料库和平行语料库。多语语料库用于研究翻译文本的风格,为研究翻译文本提供有效的参考系数;可比语料库在翻译研究中最具应用潜力,主要用于研究深层次的翻译问题,如翻译规范性等;平行语料库,主要有词语级别、句子级别和段落级别平行语料库,同时它还分为单向平行语料库和双向平行语料库,其主要应用于翻译实践、翻译教学、翻译研究、译员培训、词典编撰和机器翻译等领域,是与翻译领域最接近的一种语料库。双语平行语料库与其他语料库最大区别在于所收集的语料类型和所涉及的语料处理过程。双语平行语料库收集的都是原语与目的语一一对应的双语语料,包括词词对应,句句对应,段段对应或是篇篇对应,有些平行语料库需要句子长度对应的语料。语料对应程度和翻译质量将直接影响双语平行语料库的质量和建设进程。双语平行语料库除了要对所收集的语料精挑细选,进行格式和标记处理,还需对语料进行最为重要的对齐处理。语料对齐的精准程度关系到整个平行语料库的存亡。
翻译记忆库:翻译记忆库是一种用于储存原文与对应译文的语言数据库。翻译记忆库主要存在于计算机辅助翻译系统中,它凭借计算机高速处理能力将待翻译原文与库中每一个原语句子进行匹对分析,然后根据匹配率进行排名,将达到译者要求的匹配率的库中原文的译文瞬间显示给译者参考,协助译员完成翻译工作;在译员对一个新翻译单元(如句子)翻译完毕后,记忆库会自动将刚才完成的译文与原文组成完全匹配对并收录到记忆库中,记忆库规模通过此动作得到不断扩充。翻译记忆库主要协助译者开展工作,译者得到达到自己设定的匹配率要求的原文的译文后,可根据实际情况,完全采用译文或略作修改后使用或完全不使用。如果译者选择完全采用匹配率达到100%的已有原文的译文,记忆库将不会修改已有的译文也不会重新收录新的译文;如果译者对已有译文进行修改后再使用,记忆库将对新的原文与译文配对,并收录到记忆库中;对于记忆库没有提供参考译文的“新原文”,记忆库同样会将翻译后的译文与原文配对并收录到库中。在此过程中,记忆库收录的都是匹配率达100%的精确对齐的语料。翻译记忆库记录了译者从开始使用记忆库以来翻译过的所有原文和对应的译文,是译者翻译轨迹的最佳见证。无论是翻译工作者个体还是翻译团队,只要他们一直使用已建立的记忆库并没有改变所从事的翻译领域,翻译记忆库对他们的作用将会越来越显现。当记忆库伴随他们工作至一定时间或一定量时,它给翻译工作带来的变化会从量变上升到质变,译者们也会越来越依赖记忆库。
                                                                    摘自《从双语平行语料库到翻译记忆库》作者:李毅鹏
Translated by the Internet, your translation resource information platform, pay attention to the official account [translation information]-Official account:fanyi899
他都是赌 | 2022-1-12 13:40:13 | 显示全部楼层
语料库是一种数据库,存放了大量的真实语言材料,更多的用于语言研究。翻译记忆库是双语平行语料库,属于语料库的一种,更多的应用于翻译领域。配合计算机辅助翻译软件使用,对于那些已经翻译过的内容在下一次遇到时计算机可以自动进行翻译。这对重复性高、任务量大的翻译内容而言,翻译记忆库可以很大程度上的减轻译员的工作量。
Translated by the Internet, your translation resource information platform, pay attention to the official account [translation information]-Official account:fanyi899
一无所有977 | 2022-1-12 13:40:36 | 显示全部楼层
确切地说,记忆库是属于语料库的一种
语料库中存放的是在语言的实际使用中真实出现过的语言材料,但是必须经过加工处理才能使用,通常需要借助语料检索工具才能使用,比如Antacontc\Paracontcetc.
了解这个问题首先要分清语料库的分类有哪些?
可比语料库、多语语料库和平行语料库
其中,Memory bank属于平行语料库,在计算机辅助翻译当中,记忆库都是中英对照的文本,而平行语料库就是中英文对照的文本。所以语料库和记忆库两者是属于包含和被包含的关系。记忆库是在翻译的过程中,扮演着十分重要的角色,基于记忆库的丰富程度以及准确率,可以快速且高质量地完成你的翻译。在计算机辅助翻译中,机器会自动把记忆库与翻译文本进行最高程度的匹配,同时,也会把翻译文本自动存储到记忆库当中,扩大记忆库,也提高记忆库的质量。
那接下来又要讲到记忆库,或者平行语料库的制作方法了:
这就需要语料对齐:指把原文和译文两个语种的文档实现句子级的一一对应以形成规范的句对。
我一般会使用tmxmall语料对齐工具
在线对齐-Tmxmall这款对齐工具,页面操作按钮简单易懂,实操能力极强,如下图所示


支持单文档对齐(原文和译文存放在一个文档当中)和双文档对齐(原文和译文分别存放在两个文档当中)
上传文档之后,只需要简单地对文档进行切分、上移、下移、合并等操作即可,最终根据个人需求导出desired格式(支持tmx\xlsx\txt)
希望可以帮助到你~

There are more resources in this post

What do you need Sign in Can I download or view it without an account?Join now Scan and login on wechat

x
Translated by the Internet, your translation resource information platform, pay attention to the official account [translation information]-Official account:fanyi899
You need to log in before you can reply Sign in | Join now Scan and login on wechat

Integral rules of this edition

18

theme

18

Post

66

integral

Registered members

Rank: 2

integral
66