鱼来自奥菲庙。
量子比特|微信官方账号QbitAI
这位道友,不知你是否也有边吃盐边看英文论文效率低的烦恼?
作为arXiv天天见的英语***,本颜无论如何也无法在挖掘纸质阅读神器的道路上自拔。
最近一款桌面翻译软件被网友种了。
简单试一下,翻译PDF的效果就是大妈酱的效果:
还有逐句比较功能:
如果只是想看一下摘要,截图就可以了。还有中文版和英文版:
妈妈再也不用担心我删除回车时手抽筋了(手动狗头)。
△PDF中直接***的文字有多余的换行符,影响翻译效果。
这个功能来自于最近更新的网易有道词典9。有说有聊,一看效果真的有点顶~
如果你通过官方网站,一个知名的字典,你会发现这种演变。这个工具强调的是“学术生产力”的提高。
至于是真是假,还是一起仔细试试吧。
从论文检索到论文写作的全过程都有。
看英文文档,翻译PDF都是刚需。
之前学术好帮手Google Translate就有PDF文档翻译的功能。
但是,谷歌的文档翻译总是会出现一些小问题。
比如容易出现版面混乱,让你好像每个字都懂,凑在一起不知道是什么意思。
例如,原始表格如下所示:
用谷歌翻译,你会得到这样一个结果,单词放错了位置,多少会影响你的理解:
相比之下,有道给出的结果看起来是这样的:
可以说,在版面维护方面,有道词典明显优于其他。
比谷歌翻译更方便的是有道词典有直观的双语对比功能。
毕竟机器翻译可以提高阅读效率,但完全脱离英文原文阅读一篇论文并不现实。
相比来回两个文档的忙乱操作,直接同屏对比就方便多了。
更重要的是,有道词典的这次“学术进化”,对计算机、医学、金融经济等专业领域做了针对性的优化,可以提高术语翻译的准确率。
还支持自定义词汇表。
比如你发现文章中的“自我关注”这个词没有被翻译,可以直接选中这个词,选择术语修正,添加到术语库中。应用术语库后,词典在再次遇到相同术语时可以保持一致的翻译。
除了让翻译工作更加方便准确,有道词典9这次甚至计划安排研究方写论文的全过程,这一点与其他翻译工具不同。
他们直接使用ReadPaper和Aminer,并有内置的论文检索服务。官方说法是:
涵盖40多个专业领域,包括3亿个文档。
△亮点自寻
在查找的过程中,还可以打开双语对比按钮快速阅读摘要。
这还不是全部。甚至当你在写论文的时候,有道词典9也能派上用场:它的“AI英文写作纠错”功能可以智能识别语法错误,提供范例参考,润色“母语”句子,并自动标记引文来源,生成参考文献信息...
“学术”词典背后的技术骗局
字典9,一站式的学术服务,可以说是直击研究党的内心。
在这些与学术需求息息相关的功能背后,技术挑战也值得一谈。
PDF翻译:基于视觉技术的PDF分析算法
先说最抢眼的PDF文档翻译功能。
PDF文档翻译本身就是一个复杂的问题,涉及到很多处理环节,包括PDF文档解析、Word文档渲染、翻译策略、翻译结果回填等等。
特别是对于非解析PDF(扫描PDF),页面中的文本、矢量、图片等元素实际上包含在同一个图片中,无法直接解析。
这时候就需要先通过OCR技术识别出各种基本元素,然后转换成可编辑的文档。
这里的难点在于,纸张和文档的OCR识别将比简单的字符识别更重要。因为不仅仅是文字,如果论文中的表格、图像、公式不能准确识别,就容易导致内容丢失、排版混乱的问题。
另外,为了保持版面与原文一致,单列、多栏、页眉、页脚等信息。需要AI准确判断,才能在可编辑文档中恢复原来的布局和内容。
针对无法解析的PDF,有道从两个方面进行了改进。
在字符识别方面,自研的OCR算法集成了业界领先的字符检测识别模型,可以达到更高的召回率,覆盖几十种主要语言。
在版面识别方面,采用“分而治之”的策略。
具体来说,通过版面分析模型得到版面的基本信息后,AI会根据不同的构图结果采取不同的提取策略。
比如遇到常见的以文字为主、表格丰富的版面,有道词典会主要采用分词算法和表格分析算法来处理文档。
但对于以图像为主、背景复杂的特殊版面,会原样保留原版面的所有元素,并集中注意力处理字符,最后进行多层叠加渲染。
除此之外,在很多细节上,有道也进行了优化,让最终呈现给用户的版面更加精准和规整。
比如文本框的透明度,换行符的插入规则等。
领域翻译模型
如前所述,除了一般的翻译,在有道词典9中,用户还可以选择医学、计算机等专业领域,进一步提高翻译的准确率。
每一个专业领域的背后,其实都有一个独立的翻译模式。
具体来说,技术团队收集了不同专业领域的大量数据,对神经网络翻译模型进行了定制化的训练和增强。
通过这种方式,即使是诸如气超显微矽肺等术语也能准确翻译。
另外,一般的在线机器翻译算法都是基于句子的,针对文档翻译的需求,有道词典9这次引入了章节算法。也就是说,AI在翻译的时候,会结合上下文相关的句子来提高翻译质量。
看来被称为“最强桌面翻译软件”的网易有道词典9不是吹牛,而是有备而来。
事实上,除了技术细节上的新尝试,一本词典化身为“科研神器”的背后还有更长远的技术积累。
比如在神经网络翻译技术方面,网易有道在2016年就开始研发自己的神经网络翻译模型YNMT,是国内最早研发自己机器翻译技术的团队之一。
在OCR技术方面,2017年,网易推出了卷积神经网络+递归神经网络的OCR引擎。到目前为止,已经能够支持100多种语言的识别,还具备自动语言辨别和混合识别的能力。
当然,对我们来说,最重要的是免费好用,分一杯羹也没什么损失。
9月13日起,面向所有用户推出文档翻译免费版。
最后,如果你还有其他宝贝和科研神器,努力在评论区种草吧~
—结束—
量子qbitai头条号签约
关注我们,第一时间获悉前沿科技动态。
本文来自抚琴绘长歌投稿,不代表舒华文档立场,如若转载,请注明出处:https://www.chinashuhua.cn/24/642144.html