采访了三位深度用户,探寻机器翻译进入专业领域的最佳路径

栏目: 编程工具 · 发布时间: 6年前

如果说人工智能已经能在哪些领域中超越人类,相信一定要提到的就是机器翻译。从技术理论层面上来看,机器翻译已经在逐步超越人类的能力——在今年3月,微软就宣称他们研发的机器翻译系统在通用新闻汉译英能力上已经达到了人类专业水平。

理论上,机器翻译在不断接近专业翻译能力。但仔细想想,我们今天应用最多的还是简单的对话翻译、拍照翻译等等。例如出门旅游用搜狗旅行翻译宝一类的产品帮助对话交流,或者在输入法搞不定非英语单词时拍下照片进行翻译。

采访了三位深度用户,探寻机器翻译进入专业领域的最佳路径

实际上机器翻译不断追求的是接近人类的翻译能力——能处理更长的文档、文字通顺流畅符合上下文。但不断专业化的机器翻译,究竟应该如何进入专业领域?针对这个问题,我们对几位在生活中常常与专业翻译打交道的粉丝进行了采访。

采访了三位深度用户,探寻机器翻译进入专业领域的最佳路径

受访者小A-“用得上的AI,才是真AI”

职业:研究僧

翻译需求:专业期刊论文的学术翻译

一提到提到机器翻译,小A表示这是AI技术里最“迷”的领域。小A的原话是:“技术明明达到了一定高度,应用时最大的作用,还是帮老年旅游团出国时能拍张照片看懂菜谱。”小A认为机器翻译目前最大的问题还是不同机器翻译软件翻译水平层次不齐,有些机器翻译软件的水平连四、六级都过不了,自然难以进入专业领域。

小A告诉我们,作为研究生常常需要翻译期刊论文,面对学术文章里的复杂的长句子和专业单词,很多机器翻译软件都表现不好。尤其是很多期刊论文都是PDF格式,很不方便通过复制粘贴进行翻译。大部分时候最高效的方式还是一边查单词一边“人肉翻译”。

采访了三位深度用户,探寻机器翻译进入专业领域的最佳路径

受访者B君-“我一眼就看穿了你结构混乱的产品原型图”

职业:正在向机器学习方向发展的码农

翻译需求:开发者社区的文档翻译

正在朝机器学习方向努力进修的B君,是脑极体粉丝里的典型一员。B君告诉我们,他对机器翻译的能力是认可的,但日常使用中还是会遇到不少问题。尤其是当他在翻译一些开发者社区文档时,一些专业词汇常常会出现歧义,常常需要用中英文对照才能完全理解。

码农 的严谨眼光来看,目前很多机器翻译产品的主要问题不是在翻译技术,而是在产品交互设计上。B君说“可能很多机器翻译产品都是技术人员主导产品设计,能明显看出不成熟的感觉,用户体验也很糟糕。”就拿中英文对照这个简单的需求来说,很多产品都不能满足。

加上还有很多有分段错误、格式混乱等等问题,B君需要翻译整篇文章时,大多数时候还是会按段落甚至句子翻译。

采访了三位深度用户,探寻机器翻译进入专业领域的最佳路径

受访者C君-“如果有钱付给你,我干嘛还要工作啊?”

职业:兼职法务

翻译需求:长文档的免费翻译

作为兼职法务,受访者C君的职业看起来是和人工智能距离最远的了,但他同样也会应用到机器翻译软件。在兼职法务的工作中遇到涉及到外贸方面的工作,常常要对外文合同进行互译。这时利用机器翻译对文件进行大致翻译,然后再人工优化通常是效率最高的方式。

但C君所遇到的问题除了翻译技术以外,还有费用。他发现很多平台会把机器翻译作为一种噱头,翻译较长的文档时则会很“心机”的向用户推荐人工收费翻译服务。C君告诉我们,对于一些Freelancer法务和小公司的法务来说,这是一个很大的问题,通常小公司并没有能力配备专业的翻译人员,如果选择和第三方合作,除了有商业机密泄露风险,还要签一大堆免责合同。本来机器翻译应该是解决这个问题的最好方法,结果现在却成了人工翻译的引流入口。

采访了三位深度用户,探寻机器翻译进入专业领域的最佳路径

总的来说,机器翻译水平、产品易用性和收费是阻碍机器翻译进入专业应用领域的主要原因。这样看来,机器翻译能否进入专业应用领域,考验的其实产品,或者说产品背后企业的综合实力。不光要有技术,还要有足够产品设计能力,如果能让用户免费使用,那就更好了。

结合这些原因,从技术、产品、费用三个角度评估,我们判断最有希望帮助机器翻译进入专业领域的产品是搜狗文档翻译。

一直技术党,怎么会让你失望?

从机器翻译水平来看,搜狗是一家较早进入NLP和机器翻译行业的企业。

我们知道搜索引擎企业是最容易在AI技术上获得成就的,因为搜索引擎入口本身就是一个巨大的语料累积库。而搜狗不光拥有搜索引擎,还有输入法产品,两款产品为搜狗累积了海量语料,让搜狗搭建了基于深度学习的神经网络框架。搜狗翻译App、搜狗旅行翻译宝、搜狗录音翻译笔等产品都应用了这一框架。在去年的第二届机器翻译大会(WMT2017)上,搜狗机器翻译团队还获得了中英机器翻译冠军。

深度学习中长短期记忆网络技术的应用,带来的不仅仅是日常应用短句的精准翻译,还可以实现结合上下文语义理解推理翻译结果。在期刊文章、合同这类长文档中表现更为突出。对于小A这种经常要翻译学术文章的用户来说,这一点格外实用。

采访了三位深度用户,探寻机器翻译进入专业领域的最佳路径

例如上图中是对生物学家Robert A. Weinberg论文《The Hallmarks of Cancer》的翻译节选。可以看到即使在医学这种充满大量专业名词的领域,搜狗长文档翻译依然没有让人失望。

十四年C端经验,产品届老司机了解一下?

在我们看来,相比技术,其实产品体验才是搜狗文档翻译的最大优势。在AI技术领域,不管是机器翻译水平还是图像水平,所有玩家都在穷追猛赶,追求着百分之零点几的体验提升。但其实从技术到产品的过程,对于很多技术出身的AI企业才是最难的,所以才会出现B君所反映的产品逻辑混乱问题。

搜狗的优势在于,搜索引擎、输入法加上翻译硬件,都是面向C端用户的产品,而C端用户往往又是对产品体验要求最高、最苛刻的。所以我们在搜狗文档翻译上,也能看到搜狗的产品设计体系的成熟和游刃有余。

在产品设计上,我们可以看到搜狗文档翻译完美还原了原来合同中的段落,以双屏对照显示。同时每一个段落都可以随着鼠标移动在两屏对照点亮,让用户清楚地看到每一句中文和对应的英文,方便进行修改和核查。对于行文严谨、需要反复修正的科研期刊、合同文件来说,可以节省很多反复查看文档的时间。

更重要的是,搜狗文档翻译可以实现Doc、Docx、PDF三种格式文档的中英互译,像PDF这种不能编辑的文档,在过去是一大难题,很多学术资料都以PDF的形式出现,却又不方便通过复制粘贴将文字挪腾到翻译软件中,现在可以直接翻译PDF格式,省去了手动转换成可编辑文档的过程。

免费不难,但就此一家

最后最重要的一点是,目前虽然做文档翻译的企业很多,但只有搜狗文档翻译当前独家支持免费预览、下载翻译结果。

或许对于很多企业而言,除了向使用者收费,他们找不到其他变现途径。这时就能体现出搜狗这样产品和技术布局完善的企业的优势了:免费使用能够吸引更多用户,语料库累积的增加可以进一步提升搜狗机器翻译的能力,让每个人都能成为机器翻译走向专业领域的见证者。同时更多用户了解到搜狗机器翻译的实力,也能间接促进翻译硬件这类收费产品的销售。

尽管现在人工智能只是在替代一些简单的体力和脑力劳动,但人工智能逐渐走向复杂、专业的领域已经是必然的趋势,搜狗的文档翻译就是很好的例子。作为普通人,不妨对这类 工具 多加尝试,毕竟能够驾驭专业领域的人工智能,是和未来共同协作的第一步。

文 | 脑极体


以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

C和指针

C和指针

Kenneth A.Reek / 徐波 / 人民邮电出版社 / 2008 年4月 / 65.00元

本书提供与C语言编程相关的全面资源和深入讨论。本书通过对指针的基础知识和高级特性的探讨,帮助程序员把指针的强大功能融入到自己的程序中去。 全书共18章,覆盖了数据、语句、操作符和表达式、指针、函数、数组、字符串、结构和联合等几乎所有重要的C编程话题。书中给出了很多编程技巧和提示,每章后面有针对性很强的练习,附录部分则给出了部分练习的解答。 本书适合C语言初学者和初级C程序员阅读,也可作......一起来看看 《C和指针》 这本书的介绍吧!

URL 编码/解码
URL 编码/解码

URL 编码/解码

XML、JSON 在线转换
XML、JSON 在线转换

在线XML、JSON转换工具

UNIX 时间戳转换
UNIX 时间戳转换

UNIX 时间戳转换