搭建属于自己的机器翻译系统.docx

上传人:小** 文档编号:23344191 上传时间:2021-06-07 格式:DOCX 页数:15 大小:1.12MB
收藏 版权申诉 举报 下载
搭建属于自己的机器翻译系统.docx_第1页
第1页 / 共15页
搭建属于自己的机器翻译系统.docx_第2页
第2页 / 共15页
搭建属于自己的机器翻译系统.docx_第3页
第3页 / 共15页
资源描述:

《搭建属于自己的机器翻译系统.docx》由会员分享,可在线阅读,更多相关《搭建属于自己的机器翻译系统.docx(15页珍藏版)》请在装配图网上搜索。

1、搭建属于自己的机器翻译系统 MTI专业“技术小白”走进小牛翻译开源社区的心得搭建属于自己的机器翻译系统MTI专业“技术小白”走进小牛翻译开源社区的心得首先,自我介绍一下。我是一个MTI(翻译硕士)专业、没有计算机编程背景、没有机器翻译理论基础的菜鸟,任职于一家网络科技公司的市场部门,之前的工作中需要做些翻译工作,有时候求助百度翻译、有道翻译等免费的机器翻译系统来解决问题,但是对于一些涉及我们商业机密的数据,由于担心泄密,只能借助于有道词典查查词,然后再自己形成翻译结果。很早之前我就想,要是能有自己的机器翻译系统就好了。我心目中的翻译技术大牛、对外经贸大学的崔启亮老师曾在微博中给MTI的学生提建

2、议,“学好翻译技术,有前途。对于仍在迷茫MTI的同学,我建议学机器翻译设计与开发,走出迷茫。”非常非常幸运的是,我一个东大毕业的同学告诉我,东北大学自然语言处理实验室(国内搞机器翻译最好的团队之一)联合沈阳雅译网络技术有限公司推出了“小牛翻译开源社区”,社区中有一项内容,就是教不懂机器翻译的人学习“快速搭建自己的机器翻译系统”。于是,我走进社区,按照社区里的相关说明,亲身体验了搭建过程。下面,我想谈谈这个被誉为“目前国内首个以机器翻译为核心的交流平台”的菜鸟级用户体验。小牛翻译开源社区里提供了统计机器翻译开源系统的全部代码。我了解了一下,NiuTrans开源系统在国际上比较有名,据说是目前国际

3、上能够支持统计机器翻译模型最全的两套统计机器翻译系统之一(另一套是爱丁堡大学的Moses)。这些内容对MT(机器翻译)的专业学者应该很有用吧,但是对于我这个非科班出身的人来说,其实会完全忽略这部分内容。我还是讲讲我在社区里的真正收获快速搭建实用的机器翻译系统。一、搭建过程详细说明需要说明的是,我是在在网页指导与人工指导下才在自己的电脑(Windows7 64位系统,硬盘500G,内存8G)上成功搭建机器翻译系统的。解释一下为什么我不仅看了网页上操作指导,还需要人工指导。身为“技术小白”的我,虽然网页上的操作指导写的很规范,但是第一次接触这么“高大上”的东西,还是有点小紧张的。于是,我加入了小牛

4、翻译开源社区的QQ群(群号451967838),联系了群主,群主很热心的帮我讲解,在服务方面我的用户体验很好。下面我就与大家分享我如何一步步完成在自己电脑上搭建机器翻译系统的。第一步,进入“小牛翻译开源社区”网站(第二步,根据自己电脑的操作系统(Windows系统还是Linux系统),选择合适的“NiuTrans Server工具包”(之所以叫NiuTrans Server,据说是因为这个工具包是针对单服务器的,或者说,这个工具包还不能用于搭建机器翻译云平台)。小牛翻译开源社区的群主告诉我,目前正式运行的机器翻译系统,都是在Linux操作系统下安装的,但Linux系统下没有图形界面,需要用户稍

5、微懂一些代码。为了方便像我这样的用户,他们很贴心地研发出Windows系统下如何搭建机器翻译系统的方法(此处值得为他们点赞哦)。第三步,点击“Windows版搭建教程,下载“NiuTrans Server工具包”。根据语言方向和电脑内存的大小,社区里提供了四个工具包。由于我的电脑内存总共只有8G,所以选择的是“中译英Windows4G版”。点击下载即可。第四步,安装perl。我是在人工指导下完成的,一共需要四步操作才能完成。首先,点击上面网页中“运行环境准备”项中的“Perl下载地址”。如下图:Step 1、进入“Perl-download”页面,点击“Windows”图标。Step 2、点击

6、页面中“DOWNLOAD ACTIVEPERL”,即页面上Windows下右面第一个图标。大家可以看一下左侧的英文说明,除了64位操作系统,32位操作系统也可以支持的。Step 3、在新的页面中,点击“Download ActivePerl 5.22.1 forWindows (64-bit,x64)”(我的电脑是64位系统)。Step 4、在新的页面中,会自动弹出一个下载框。经过以上操作就可以成功下载Perl。第五步,做了以上准备工作后,接下来进入搭建步骤。搭建共分两步,Step 1、解压工具包。找到刚刚下载的工具压缩包,windows 7系统可直接右键解压到“当前文件夹”,解压后的文件夹名

7、称为“NiuTransServer_v1.1.0_zh2en_x64_window”。打开文件夹如下图:Step 2、启动机器翻译系统。点击上图文件夹中“service”文件夹,进入文件夹内,找到“start.service.bat(BAT脚本文件)”,双击该文件即实现启动机器翻译系统。如图:第六步,搭建操作全部完成后,页面会出现下列提示即代表启动成功。下图是社区指导步骤中给的样图。其实操作者只要看最后一句“Server startup in XXX ms”即可,代表专属于你的机器翻译系统已经搭建成功,此处特别提醒,该页面不可以关闭,要想运行机器翻译系统,要保持着该页面一直打开状态。第七步,将

8、该“http:/127.0.0.1:1517/niutrans/”网址粘贴到浏览器中,即可弹出如下图页面:然后嘛,就可以开始使用机器翻译系统了!以上就完成在自己电脑中搭建机器翻译系统的全过程。在“指导搭建机器翻译系统”页面中还介绍了很多小牛翻译系统的其他功能。如翻译API功能、利用自有数据训练翻译模型等,经过好一顿的研究,被社区群主告知这些功能都是为机器翻译专业人士准备的,不懂程序的人无法直接使用。特此提醒其他使用者,完成我上述七步操作,专属于你的机器翻译系统就搭建成功了,其他的小牛翻译系统各种功能就只能根据使用者自身的能力来选择使用了。二、对小牛开源社区的建议社区内搭建机器翻译系统的方法实现

9、起来真的很便捷,但是对搭建过程中的某些技术指导表述不够清晰,建议以下部分应该有改进。1)安装perl环节应该添加详细介绍。在上一部分我的搭建过程中,我详细了介绍了安装perl的步骤。安装perl的网页是全英文版,由于我是翻译硕士所以我读起来较轻松,但是对于英语水平不太高的使用者,阅读起来会比较困难,这会导致此部分的操作有一定难度。希望社区开发者会进一步详细介绍一下如何选择各个步骤的下载选项。2)“代表启动成功”的展示图片需修改。应提示,操作者只要看最后一句“Serverstartup in XXX ms”即可,这就代表专属于你的机器翻译系统已经搭建成功,亦在图片中明显标画出来,让操作者可以非常

10、清晰操作思路。如下图:3)截下图,只想表达,下图的解释说明虽然可以看得懂,但是却不清晰,典型的程序猿表达方式。如果想要提升用户体验,某些表达也可以优化一下。我相信,随着大家对机器翻译的需求逐渐兴起以及对数据翻译安全的考虑,这种可以在自己电脑上搭建机器翻译系统会有越来越多的需求。因此,“详细、直白、清晰、简洁”的搭建过程说明是很有必要的。三、搭建体会作为一名不懂计算机编程、机器翻译技术基础的我,竟然可以实现自己动手搭建机器翻译系统,我都被自己吓到了,应该说小牛翻译开源社区给了我很大惊喜。通过自己亲手搭建机器翻译系统,虽然我还是不懂机器翻译技术,但是在使用上,感受到了机器翻译的更多优势。比如,在自己的电脑上搭建机器翻译系统,使用的稳定性、数据的安全性均可得到保障。随着“互联网+”时代的到来,机器翻译在变革着翻译行业,语言服务行业的变革也离不开机器翻译。各行各业(如旅游、跨境电商、社交或游戏等平台)出现的多语种翻译需求在不断增加。因此,即使不是机器翻译技术的专业学者,同样有必要加深对机器翻译技术的了解,而小牛翻译开源社区恰好给非科班的人准备了这样的平台,感谢小牛翻译开源社区!

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!