文/东方亦落
今天是韩国平昌冬奥会的第二个比赛日,就在冬奥会举行前夕,谷歌翻译闹出了一桩和冬奥会有关的笑话。据BBC网站消息称,挪威代表队的主厨希望购买1500个鸡蛋,他将相关语句输入谷歌翻译服务,结果韩国本地的超市给送来了15000个鸡蛋。
显然,是谷歌翻译服务在中间环节出了问题。不过现在尚不知准确原因,而且BBC认为,韩文中独有的计数体系以及挪威代表队厨师的拼写也可能是造成问题的原因。此事目前尚无法判定,但从侧面反映出翻译软件服务可能存在一些问题。
近年来随着互联网与智能手机的发展,在线翻译的普及度也越来越高。随着市场和技术的进一步发展,入局在线翻译的企业增加,尤其是对于先进技术的吸纳,使得技术也渐趋成熟。但在发展的同时,也难免会存在缺陷和疏漏。
一、巨头争相布局翻译市场,AI翻译技术日趋成熟
去年,AI技术为各界津津乐道,不论是大众、厂商还是各行各业,都对其产生了空前的兴趣。作为现代科技中足以引领潮流的技术,也引得众多行业中的大佬纷纷入局。谷歌、苹果、微软、百度、阿里、腾讯都在加紧发布自家的AI翻译软件产品。
尽管机器翻译的出现已有数十年的时间,但在过去几年间涌现出的AI软硬件翻译产品数量成倍增长,远超出了之前那些年出现的翻译产品。
国外,微软于2016年发布了翻译工具Microsoft Translator,这是全球首款真正意义上的“万能翻译器”。该产品最大的亮点在于,可以通过对底层深度神经网络技术的应用,实现精确的语音识别和翻译。Microsoft Translator的识别与翻译部分采用了ResNet深度神经网络与长期短期记忆技术,而ResNet神经网络深度则高达150层。
谷歌的翻译软件似乎更受青睐一些,多年的搜索引擎历程使其积累的大量的数据与经验。大概在2014年左右,有关在机器翻译中应用深度学习的论文开始大量出现。谷歌根据这些理论成果,对自家的翻译软件进行多次改进以提升其准确度。
谷歌本身拥有大量的机器集群,在这些集群上部署神经网络训练任务相对而言就非常容易了。只需指定所需资源,就能将训练任务加以部署,从而最大限度地缩减研究成本。这可以使研究者从这类事情中解放出来,更加专心致力于网络结构方面的研究,并且能够让他们去进行大量的实验,用以验证其想法,这使得谷歌的翻译产品进步加速。
国外市场如火如荼,国内的情形也与之相差无几。
去年9月,百度在日本发布了智能翻译机。可在中英、中日等多种语言互译模式中流畅识别一键翻译,还能为手机、电脑等设备提供WIFI,且自带80余个国家的移动数据流量,自动连接4G网络。
同年,腾讯也推出了一款名为“翻译君”的翻译软件。该软件驱动内核为AI,采用NMT(神经网络机器翻译)+语音识别等先进技术,能够实现同声传译功能,且支持在手机等移动终端的应用及实时会话翻译等内容。
去年,一直在语音交互方面有深入研究的科大讯飞推出了智能翻译产品“晓译翻译机”。内置语音识别技术,配合运算芯片可实现中英离线互译,也能做到不受网络环境限制。
甚至连电商也开始涉足AI翻译领域。去年8月,京东推出了一款可进行多国语言实时翻译的“准儿翻译机”。
互联网企业纷纷入局,可看到AI翻译领域的火爆程度。在技术上,各家企业也有所提升。
例如近年来,NMT(神经网络机器翻译)技术火热,它能够模仿人脑神经思考的模式,产出高质量的译文,并将误差降低55%~85%。谷歌将其应用于网页翻译与手机,百度、阿里、腾讯等互联网企业也将深度学习的理念加入机器翻译中。
此外,语言的处理、语音交互等技术的发展使得翻译产品的场景升级加速,也让翻译产品从CAT(辅助翻译)的阶段过渡到了AI Interactive Translation(人工智能交互翻译)的阶段。当今各类技术层出不穷,实质上AI处理人类语言大致可分为基于规则的机器翻译、基于实例的机器翻译和统计的翻译三种类型,目前谷歌等公司采用的基本上是最后一种。
从全球AI翻译市场来看,技术达到一个较为成熟的状态。随着全球各方面交流的加大,未来翻译市场的需求将持续呈现指数级增长速率,预计全球机器翻译市场将在2019年增长至69亿美元。
然而任何行业和技术在发展过程中,都不可避免地会出现一些缺陷与疏漏,AI翻译市场也同样不例外。
二、达到专业翻译水准,AI翻译仍然缺乏足够数据支撑
在翻译水平方面,AI翻译还难以达到令人十分满意的程度,甚至在翻译过程中闹出过许多笑话。
去年,一名巴勒斯坦人遭到色列警方逮捕。原因可谓十分“乌龙”:他在Facebook上用阿拉伯文发了一条内容为“早上好”的帖子。结果由于翻译软件的错误,内容变为“攻击他们”。
在翻译软件出现的问题方面,最典型的例子是“苹果式中文”,因其经常破坏性地创造中文语序读法而饱受吐槽。如“开发者的大事,大快所有人心的大好事”、“真的笑,笑出声”等蹩脚的翻译方式经常出现在苹果的产品中。
由此看来,尽管AI翻译技术大幅提升,但与高水平翻译所要求的“信、达、雅”之间还存在相当大的距离。对人类而言,需要的绝不仅仅是逐字逐句的字面翻译,还要体现出语调、情感,甚至是韵味。
想要传达出这些,需要翻译者有一定的敏感度、水准以及境界。目前AI技术虽已发展到一定程度,但对于这些要求尚不可达到。如果真的想要达到“信、达、雅”的高度,AI要克服人类口语化的难题,如语音断句、语法差异等。
那么机器究竟通过怎样的方法才能解决这些问题?其实AI翻译的难点也是整个行业面临的难点,那就是如何使AI像真正的人类一样拥有智能行为。AI翻译的准确程度实际上取决于数据。目前的翻译体系中多是来自官方的文档,但缺少娱乐、体育方面的数据。加之各地口语中随意性较大并存在网络用语,所以AI翻译仍需庞大的词汇库加以支撑。
理论上来看,所有的问题都能通过庞大的数据来解决,但短期之内,AI翻译的数据支撑仍然处于严重缺乏状态。
此外,传统翻译行业对AI翻译也颇有微词。有观点认为,不论是翻译机还是翻译软件,由中文翻译成其他语言之时效果尚可,但由其他语言翻译过来准确率则不高,在实际交流中更是难以应用。
去年2月,谷歌全新的NMT系统在韩国世宗大学与人类译员进行的翻译对战。在50分钟内双方同时翻译两段文本。结果NMT不占丝毫优势,并且评委指出NMT系统翻译出的文本九成都存在语法方面的问题。
随着技术的完善与进步,未来的AI将能够完成大部分的简单翻译要求。但对于多元化、细微化的专业翻译需求,AI又能否实现呢?其实,世界上的语言多达上千种,而绝大多数的语言还缺乏足够的资料,所以需要不断地去积累。
此外,AI翻涉及到多种知识,如语言学、计算机科学、数学及神经认知科学。所以AI翻译是一个相当复杂的领域。因此想要真正实现AI翻译服务的应用,还需要相当长时间的发展与完善
举报/反馈

最极客

8.3万获赞 4万粉丝
关注前沿科技与极客文化的新媒体
关注
0
0
收藏
分享