当前位置:首页 > 新闻资讯 > 科技生活 > 新闻
提高办公效率,快速识别文字内容
  • 2018/5/17 10:27:34
  • 类型:原创
  • 来源:电脑报
  • 报纸编辑:电脑报
  • 作者:
【电脑报在线】现在网络里的很多信息都是通过图片以及PDF文件的格式来传播,由于这些文件已经将文章内容进行了固定,所以用户在收藏的时候往往感觉很不方便,如果想要更加舒服地进行收藏的话,只能将图片或者PDF文件中的文字信息进行识别才可以。但是进行图片文字的识别往往会使用到 OCR 技术,但这项技术往往只有一些专业的软件才拥有。那么还有没有一些简单快捷的解决方案呢?

      现在网络里的很多信息都是通过图片以及PDF文件的格式来传播,由于这些文件已经将文章内容进行了固定,所以用户在收藏的时候往往感觉很不方便,如果想要更加舒服地进行收藏的话,只能将图片或者PDF文件中的文字信息进行识别才可以。但是进行图片文字的识别往往会使用到 OCR 技术,但这项技术往往只有一些专业的软件才拥有。那么还有没有一些简单快捷的解决方案呢?

 

截图软件就能代替专业软件

      如果用户要经常进行图片或者PDF文件的文字识别操作,但又不想安装一些体积较大的软件程序的话,那么可以试一试ShareX这款截图工具(https://getsharex.com/)。成功安装运行这款软件以后,会在系统托盘里显示出一个图标。以后当用户要进行文字识别操作的时候,首先在这个托盘图标上点击鼠标右键,接着在弹出的菜单中,选择“截图”菜单中的“文字捕捉”命令(图1)。接下来软件就会像我们平时使用截图软件那样,出现一个信息抓取的捕捉框。

 

      利用鼠标框选需要识别的文字信息区域后,就会弹出一个识别的文本对话框,同时开始对之前抓取的内容进行识别操作。通常情况下,ShareX软件是无法识别出抓取的内容的,这主要是因为软件默认的语言是英文。现在只需要通过手工在“Language”列表中选择“Chinese Simplified ”这个选项后,再点击“Start OCR”按钮就可以完整地识别出抓取的文字信息了(图2)。最后将这些信息内容复制粘贴到文本编辑器里,再经过编辑加工以后就可以更好地保存了。

      如果用户觉得通过右键来进行这个操作比较烦琐的话,那么也可以为这个功能创建一个快捷键。先在系统托盘的软件图标上点击鼠标右键,在弹出的菜单中选择“快捷键设置”命令。在弹出的窗口中点击“添加”按钮,这时在弹出对话框的“任务”列表中选择“屏幕捕捉”中的“文字捕捉(OCR)”选项,然后在“描述”中任意设置一个名称,关闭这个窗口后在“快捷键设置”列表中选择刚刚添加的动作,然后在动作后面设置一个快捷键就可以了,以后点击这个快捷键就可以快速地进行文字识别操作了。

 

      要注意的是,用户在“Language”列表选择哪一种语言,主要根据是用户抓取的信息属于哪一种语言,比如如果用户抓取的信息是繁体中文的话,那么自然就在列表中选择“Chinese Traditional ”这一选项才可以。

      小提示:其实微软的 OneNote 云笔记软件,也可以非常方便地解决这个问题。首先在 OneNote 软件窗口里面新建一个笔记,接着点击工具栏中“植入”标签中的“图片”按钮,在弹出的窗口里面选择需要进行文字识别的图片,接下来在图片上点击鼠标右键,在弹出的菜单里面选择“复制图片中的文本”命令,这时软件将自动开始对文字内容进行识别。识别完成以后同样粘贴到文本编辑器里,用户就可以对这些文字信息进行编辑操作了。

 

摆脱软件进行内容云端识别

      如果用户只是临时想进行文字识别操作的话,那么大可不必安装专门的软件程序,因为利用很多在线云服务就可以完成图片或者PDF文件里的文字识别操作了。现在通过浏览器打开OCRMaker这个云服务网站(http://www.ocrmaker.com/),这项云服务的操作非常简单,用户只需要根据页面中的向导一步步进行操作就可以了。首先点击“文件上传”后的“浏览”按钮,在弹出的对话框中选择要进行文字识别的图片文件。当然如果这个图片文件直接被其他网友发布在网络中的话,那么可以在“输入图片地址”后的输入框中粘贴图片文件的地址。

      选定的图片可以在“图片预览”窗口里面进行预览操作,如果没有问题的话,接下来在“识别语言”列表中选择“中文简体”这一选项,然后点击“开始”按钮就可以进行文字识别操作。当云服务提示“识别成功!所有文件均识别成功。”后,就可以在“识别结果”里面看到识别出的文字信息(图3)。接下来点击右下角的复制按钮,就可以将所有识别出的文字信息复制到剪贴板,然后我们就可以再粘贴到文本编辑器里进行加工编辑了。

 

      小提示:其实这一类云服务很多,比如 OnlineOCR(https://www.onlineocr.net/)、NewOCR(http://www.newocr.com/)等,用户可以根据自己的需要进行选择操作。需要特别说明的是,NewOCR这项云服务有一个特点,那就是它可以同时添加多个语言类型。这样在识别的文字中包含有中文、英文等多种语言的时候,识别效果就可以更加准确。

 

本文出自2018-05-14出版的《电脑报》2018年第19期 A.新闻周刊
(网站编辑:pcw2013)


我来说两句(0人参与讨论)
发表给力评论!看新闻,说两句。
匿名 ctrl+enter快捷提交
读者活动
48小时点击排行
论坛热帖