专业的事情,还是得留给专业的工具。

一个观察,不一定对。


作为“搞机”行业的资深人士,小雷还记得无论是iOS还是安卓系统,他们刚推出的时候基本没有内置什么功能,一些我们日常经常要用到的功能,都只能通过安装软件去解决。小雷想到,这或许是当时的一种产品理念:系统本身只是一个聚合平台,功能的实现自然有软件去完成。


但后来,操作系统越来越喜欢“多管闲事”,开始整合和强化各种功能。比如说,安卓手机已经把快递信息整合到系统之中,从而让一众快递公司的App“失宠”;美颜功能的整合,让一众美颜App的市场份额直线下降。


今年6月发布的iOS 15系统,则和安卓手机系统一样提升了翻译能力,从发布会的演示来看,iOS 15的翻译能力的确得到了全面提升,不仅支持连续对话自动翻译,还能够自动识别图片中的文字进行翻译,至少从功能的丰富程度来看,已经足够引起专业翻译软件的关注。



在iOS 15的翻译功能已经进步到非常不错的情况下,有人会觉得,是不是已经可以取代日用翻译软件,甚至是专业翻译软件了?实际上,这样的讨论不光是出现在普通用户之中,就连这些专业应用内部,也会出现类似的疑问。


比如网易有道词典,我们都知道网易有道词典是国内最专业的翻译App之一,在iOS 15推出后他们内部进行了一个对比测试,而目的也十分明确,那就是希望通过对比测试确认iOS 15翻译能力到底是什么水平,会不会对有道词典的专业地位构成“威胁”?


对比测试才知iOS 15还是差点意思


这项测试主要分两个项目,分别是OCR(也就是图片识别提取)表现和翻译表现,通过大量的实测来展示对比结果。在OCR评测项目中,识别100张图片的时候有道词典的英文字准率达到了97.32%,而iOS 15只有95.49%;到中文字项目,有道词典的字准率达到了89.46%,苹果跌到了76.79%。



如果特意选取高质量图片进行测试,55张图片中有道词典的英文字准率为100%,iOS 15为98%,43张高质量图片中有道词典的中文字准率为99.99%,iOS 15为93.53%。简单来说,在OCR方面iOS 15做得尚可,但仍和专业软件有不小的差距。至于在翻译领域的测试中,根据翻译质量进行主观评分的话,在中译英项目中有道翻译获得了4.1的主观评分,准确率95.78%;iOS 15就只有3.2分,准确率为82.52%。


会出现这样的成绩并不奇怪,我们看具体的译文就知道,iOS 15的译文偶尔会出现错译、漏译的情况,而有些情况下翻译用语就比较“生硬”,不够地道,机翻的痕迹明显。比如,苹果将“妇女社会地位提高”翻译成“women's social status improved”,不仅用错措辞,更有语法错误。



在英译中场景中,有道翻译得到了4.7的高分,准确率达到了98.71%;iOS 15的翻译也能达到4.4分,准确率为98.03%。文本翻译方面苹果在短句英译中项目中表现更好,iOS 15得分为4.57分,要高于有道词典的4.42分。只不过除了这一项,在短句中译英、中句互译、长句互译场景中,均是有道词典质量更好,准确率也更高。


从测试例句我们可以见到,iOS 15的翻译存在较多错误,例如将“Square”错译成“广场”,和原意的“平方”有误;句子“A lot of things are out of our control”翻译中,iOS 15的中译是“我们无法控制很多事情”,虽然咋一看没有大错误,但和有道词典的“很多事情都是我们无法控制的”相比,可见还是不够地道。



就结果而言,iOS 15的翻译功能的确有显著的提升,无论是可用场景还是翻译质量都已经能够一定程度上追上专业的翻译软件。但是,在翻译领域始终是专业软件有着更好的表现,无论是中译英还是英译中,专业翻译软件较少犯低级错误,在表达上也更加符合我们的阅读习惯,不得不说深耕市场的专业翻译软件们,还是更懂得中国用户。


当然,在对比测试中有道词典团队也提到,iOS 15的翻译功能最大优点在“体验”上:毕竟是集成到系统中的功能,调用起来更加容易,而且在iOS的整合优化下几乎任何场景都可以打开、使用,便利性还是要比传统的单独App更好。


表现更胜一筹,却没有捷径可走


在果粉间有一句玩笑话:苹果不会推出不成熟的技术和功能,言下之意就是苹果的产品面世,必定是经过了重重挑选和检验。但需要注意,这并不代表苹果推出的新功能、新产品就一定冠绝市场,充其量只能说“可以稳定运行”。同理,iOS 15的翻译功能表现不如专业软件也绝不奇怪,毕竟专业软件的投入、积累,都不是系统内置功能所能相比的。


从此前的测试结果我们知道,有道词典相比iOS 15翻译功能优势主要在这两方面:OCR能力更加强大,翻译也更加准确。但这又是怎么做到的呢?


首先是OCR方面,有道词典技术人员介绍,虽然不知道苹果iOS 15这边用的是什么样的技术原理,但有道词典用的是深度学习的AI技术来实现OCR,主要分“检测”和“识别”大环节。


简单来说,借助深度学习的AI技术,有道词典可以快速地检测图片上的目标文字,然后对检测的结果进行识别,将图象转化为文字数据。借助AI深度学习进行检测识别会比端到端识别更为可靠,成功率大幅度提升,同时该技术还会应用到段落分析、图表检测、图像偏移角度检测和语种检测等多个辅助环节中,可以说AI深度学习技术贯穿了有道词典OCR场景的方方面面。



对整个行业来说,深度学习技术犹如“机械降神”,是引导翻译行业变革的转折点。有道词典表示,深度学习技术是他们短短几年时间里将识别率做到行业领先的“绝招”,难道苹果就不知道利用深度学习技术吗?


不可能。最直观的证据是,苹果的A系列芯片中包含有神经网络引擎,并在拍照等场景中引入了深度学习功能以实现图像识别。显然苹果在iOS 15的翻译功能中或多或少地引入了深度学习技术,但最终效果稍逊一筹,或许还和“积累”有关。



有道词典表示,他们早在5年前就开始做图片翻译功能,是国内的第一家。我们知道,深度学习技术的一大特征就是越花时间自我学习那么效果就越明显,起步更早的有道词典自然能够凭借着时间优势,在深度学习技术的帮助下让图像识别能力更加出色。


除此之外,基于有道智云平台,有道词典的技术方案输出到了各大主流手机厂商,为他们提供系统级图像翻译能力,而反过来销量庞大的国产手机也能不断地有道词典团队提供调试样本,完成技术积累。


另一方面,我们不能忘记网易有道旗下还有诸多教育产品,而这些产品正是应用OCR技术的主力军。在教育类场景下,比如试卷分析识别、手写识别、公式识别、口算批改、点读等场景就大量地应用了OCR技术,随着有道教育产品的不断热卖,技术团队自然获得了更多的调试经验,去完善技术提升体验。



与之相反的是,苹果在图片识别、深度学习翻译领域并没有太多积累,不说国内有道词典等行业头部App,和同行相比也不如谷歌、微软等科技企业。因此iOS 15的落败,其实并不奇怪。


有道词典的翻译表现基本令人满意,主要是这些原因。


第一,时间成了最大助力。识别用到深度学习模型,翻译也不例外。时间上,有道从2007年起就开始做机器翻译,2017年升级为深度学习翻译模型,这十年的时间为有道累积了海量数据,也给有道打磨技术留足了时间。


第二,针对性的技术优化。有道词典表示,翻译质量取决于海量高质量双语语料的挖掘、高效的分布式训练平台及相关算法、机器翻译算法本身的建模和持续改进、高性能推理引擎的实现和部署、面向应用场景的针对性优化等关键技术,而有道词典在这些方面做了大量的优化工作,还对个别文字识别错误的情况进行了鲁棒性增强,尽可能地让翻译结果更为稳定。



最后有道词典介绍,他们为了同时兼顾翻译工作的“好”与“快”,在算法上不断改进模型结构和计算机制,进而系统性地减少模型计算量,为翻译部署提供算法基础;在工程侧自研了一套完整的机器翻译的在线&离线推理引擎,更抽离出矩阵计算模块,发布了高性能端侧机器学习计算库EMLL。


小雷认为,在智能手机浪潮冲击下仍能存活下来的专业软件全都是有真材实料、真本事的。一般来说,利用智能手机终端数量优势,系统上的集成功能可以快速地完成优化和迭代,从而在短时间内追上一般的工具型软件,甚至将他们淘汰。


但从结果来看专业软件始终有两把刷子,“吃饭的本事”使其面对系统集成功能仍有十足的底气,我们也可以肯定地说,哪怕系统集成功能再强大,专业软件在市场上仍有一席之地。


“便利”大行其道,但“专业”不会消失


从对比测试结果来看,iOS 15的翻译功能还是以“实用”为主,能够解决大多数人的普通翻译需求,但如果你需要最准确的翻译结果,那还是得借助专业翻译软件的力量。从消费者的需求出发,软件的工具类软件在未来很长的一段时间里仍会有一席之地。


为什么呢?个人觉得最主要的原因,是专业软件的技术优势。系统集成软件在设计时需要兼顾诸多方面,比如说系统调用体验等,在绝对的问题解决能力上仍有欠缺。就以iOS 15为例,在有道词典进行对比之前我们也进行过测试,从我们自己的测试结果来看系统级的翻译功能只能应对日常生活中一些轻度场景的翻译工作,而且对场景比较挑剔(比如说识图方面效果就差一些),也会经常出现翻译不准、卡壳的现象,无法给人很强的信赖感。



现阶段站稳阵脚的专业软件均有着深厚的技术积累,产品优势比较明显。无论是翻译软件也好、生活类软件也好,专业软件无论是产品逻辑、技术储备还是技术实现都要更胜一筹,解决问题效率更高更可靠。


因此,这是一个很现实的问题,在专业领域做专业的事情,还是要专业的工具。假如我们需要翻译大量文本,里面有使用专业语法的长短句子,那肯定是有道词典这类专业工具更加适合,这时候iOS 15自带的翻译功能就显得“只能图一乐”了。


换个角度来看,系统集成功能在更多的场合中会成为专业软件的“补充”,在那些非专业场合中发挥作用。正如我们常说的智能手机摄影和专业相机之间的关系,他们之间从竞争变成互补,现在已经有了明确的分工,而基本的原则肯定是专业的工作交给专业的工具来完成。


但是,专业软件们也需要注意,或者说要有危机感。以智能手机为载体的各类系统级功能正在快速发展,深度学习技术的红利不光是专业软件可以享受,系统集成功能也可以。如果专业软件无法保持技术优势,未来很可能会出现份额被系统集成软件不断蚕食的情况,从而让自身的存在感下跌。毕竟系统级集成功能在使用方面还是要无感和便利一些,而且不需要下载就能使用。


如果从需求的角度出发,日常生活中大多数的消费者在功能需求层面还是以轻度为主,比如说翻译功能,他们很可能只是需要翻译一下菜单、翻译一下路牌而已。当性能提升后,系统级集成功能在我们生活中的应用面肯定会变得越来越广。


对专业软件来说也是一个启示,当下的竞争局势可谓是挑战和机遇并存,专业软件们应该去思考自身的差异化能力是什么,到底要如何给用户带去差异化的体验。在我们看来,不断强化专业水准、提升技术实力、增强在特定场景如学习工作中的应用价值才是专业软件要考虑的事情,只有不断强化专业素养强化技术壁垒,构建自己优势最大化的专属应用场景,才能让专业软件在系统集成软件的冲击下立于不败之地。