双语平行语料库的制作流程.docx
- 文档编号:23396453
- 上传时间:2023-05-16
- 格式:DOCX
- 页数:14
- 大小:2.79MB
双语平行语料库的制作流程.docx
《双语平行语料库的制作流程.docx》由会员分享,可在线阅读,更多相关《双语平行语料库的制作流程.docx(14页珍藏版)》请在冰豆网上搜索。
双语平行语料库的制作流程
双语平行语料库的制作流程
Step1.用ABBYYAligner软件对齐中英双语文档,并导出tmx文本。
步骤如下:
1.启动ABBYYAligner,如下图:
2.点击“文件图标”导入英文文档
英文文档导入后会自动弹出对话框,在对话框中选择中文文档导入,如下图:
3.点击Align,利用该软件自动对齐,结果如下图:
Align
接下来需要手动修改,将文档中没有对齐的地方整理对齐。
(为了确保准确和高效,建议首先整理上图中标色部分,这是该软件自动识别标出的有可能没有对齐的句子。
把这些修改完后,再从头到尾检查一遍,修改其余没检测出来的未对齐句子。
)
修改后如图:
4.点击ExporttoTMX,保存对齐之后的tmx文本
Step2.利用trados软件,将Step1中的tmx文本导入记忆库,并从记忆库中导出新的tmx文本。
步骤如下:
1.启用SDLTradosStudio2011,如下图:
2.点击左上角“升级翻译记忆库”
点击“添加文件”,
点击“关闭”
点击“是”。
3.打开该翻译记忆库,则左侧“翻译记忆库”下方出现该记忆库。
选中该记忆库,右击,选择“导出”
完成,关闭Trados。
Step3.利用HeartsomeTMXEditor软件,对上一步中得到的tmx文本“降噪”。
步骤如下:
1.运行HeartsomeTMXEditor,如下图:
2.点击“文件”,选择“打开TMX文件”,如下图:
选择从trados记忆库中导出的tmx文本,点击“打开”,如下图:
3.点击“编辑”,在下拉列表中选择“清除所有标记”,如下图:
点击“确定”,“降噪”完成。
4.点击“文件”→“保存”。
5.从文件夹中找到该文本,用记事本打开,如图:
点击“文件”→“另存为”txt文本,如下图:
点击“保存”,关闭HeartsomeTMXEditor。
Step4.利用TMX-ParaConV软件,从上一步得到的txt中英文本中分别导出中文txt文本和英文txt文本。
步骤如下:
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 双语 平行 语料库 制作 流程