【尚书七号官方下载】尚书七号OCR文字识别软件 v1.0.0.1 免费激活版
软件介绍
尚书七号OCR文字识别软件是一款广受欢迎的办公软件,这款软件可以对各种格式的文档、图片、扫描件上的文字进行提取,并且可以识别简繁体汉字、多国语言文字,让用户可以快速提取文字资料,完成各种工作。
软件特色
1、海量字符识别:简体字符集包含了国标GB2312-80的全部一、二级汉字6800多个。
2、简繁双向支持:除了简体汉字外,还可以混识台湾繁体字5400多个以及香港繁体字和GBK汉字。
3、自动识别字体:能识别宋体、仿宋、楷、黑、魏碑、隶书、圆体、行楷等一百多种字体,并支持多种字体混排。
4、自动字号识别:从初号到小六号字体都能正确识别并反映在电子文档上面。
5、自动表格识别:尚书七号ocr文字识别软件可以自动判断、拆分、识别和还原各种通用型印刷体表格。
6、支持多种系统:除了支持大陆地区的简体Windows系统之外,还可支持港澳台地区的繁体WINDOWS系统。
软件功能
1、短边际设计:小角度开启装订成册的扫描对象,对扫描对象没有损坏。全幅无盲区、无变形、无黑边,获得完整的图像结果。适合于不拆装批量连续扫描,得到的图像不会歪斜。
2、扫描速度:尚书七号OCR文字识别软件在200dpi的常用分辨率下,XT3588 只需要不到1.4秒的时间,就可以完成一张A4影像的彩色扫描。
3、自动文稿侦测,即放即扫:自动感应探测器的设计,不定时侦测扫描区域,即放即扫。用户还可根据个人操作习惯,设置感应灵敏度,以调整扫描间隔时间。对于日扫描量比较大的用户,如图书馆或数据加工,此功能很实用,成倍节省工作时间,提高工作效率。
4、快捷操作:XT3588 分享三个功能按键,用户可以根据使用习惯的不同,自行设定每个按键的功能。无需繁琐的操作,只要轻触按键,即可完成扫描、复制或OCR识别等操作。这种设计不仅能大幅提高工作效率,更能降低使用门槛,即使对初学者也可以轻松操作。
5、支持双层PDF格式:扫描影像经过去污、纠偏、OCR识别,直接生成可检索的PDF文件。此PDF文件分两双层,上层是原始图像,下层是识别结果,用户可选择、复制、检索等,便于建立索引数据库,进行科学管理。
6、文件底色淡化功能:淡化红、绿、蓝、黄等文件底色,使文字更清晰,便于阅读及识别。
7、多数据流输出功能:只需一次扫描,就能同时得到彩色+黑白+灰阶三种影像。彩色图像清晰用于辨识、查看等,黑白图像文件较小利于存档,灰阶图像文件有亮度层次同样也利于存档。此功能也支援多种自定义组合影像选择,同时输出不同格式影像。
使用方法
用扫描仪扫描的文字图像,尚书七号OCR文字识别软件不能对个别文字进行编辑修改,在教学中,需要利用文字识别软件,将文字图像进行识别,将图像格式转化成文本格式,常见的文字识别软件有很多,主要功能基本相同,尚书七号就是其中很优秀的一款。用尚书七号对文字图像识别转化的过程,利用其主菜单:“文件”、“编辑”、“识别”、“输出”可以很方便地完成。具体步骤为:
1、获取文字图像文件
选择“文件”菜单下的“扫描”或“打开图像”(将已经扫描好的图像文件打开)命令,打开图像文件。如果连接了多台扫描仪,可以选择“文件”菜单下的“选择扫描仪”命令,调用扫描仪。
2、对扫描的图像页进行调整
选择“编辑”菜单下“图像页面的处理”子菜单下的“图像页的倾斜校正”(分享自动和手动实现方法)及“旋转”等命令,将扫描的图像页进行调整。
3、版面分析与文字识别转化
版面分析,选择识别范围,在进行文字识别前要选择识别范围,识别过程的核心是“版面分析”。
尚书七号的自动版面分析功能很强,对报纸杂志等复杂的版面,也能保持很高的分析正确率。
设置好后,直接点击“开始识别”的按钮就可以进行文字识别了。
4、校对修改
自动识别完毕,识别结果的“文本窗口”会弹出,这个窗口能够分享识别结果的校对,为了校对方便,尚书七号增加了光标跟随显示原图像行的校对方法(如图3出现的黄色提示行的出现)。
分享的校对方法,一眼就能够看到图像原文和识别出文本的差别,如果发现识别有误,可以进行修改。
5、输出
如果检查修改后确认无误,选择识别结果的“输出”菜单,输出的文件格式有:RTF、HTML、XLS、22238,可以根据自己的需要选择对应的格式。如果用户想得到类似原文的识别结果,请选择RTF格式。把RTF格式输出的文件用WORD打开后,会发现几乎保留了原文的所有痕迹,包括原来页面中的彩色图像,都已经保留在WORD中了。
常见问题
识别效果不佳的主要原因:
1、扫描设置不当,扫描图像时的扫描分辨率(Resolution)一般应设为300dpi,如果文档字体较小则需要将扫描分辨率设定为更高值如400dpi或600dpi。缩放比例(Scaling)设为100%,亮度阀值(Threshold,Brightness)需根据纸张和印刷的质量调节,避免扫描图像过黑或过淡 。
2、如自动版面分析有错误,这时请用户用鼠标自己划分出正确的版面块;版面块的版式设置错误,如将横版的设置为竖版,竖版的设置为横版等,这时请用户自行将块的版式修改正确。
3、原稿印刷质量太差,笔画断裂严重、油墨太浓、字与字之间粘连严重等也可能使识别率显著降低。
4、识别语言选项选择不当,应根据原稿正确选择“简体”、“简繁”或“英文”。
安装方法
1、等待尚书七号官方下载完成,然后解压点击“ShangShuQiHao.exe”开始安装
2、选择安装的地址(建议不要放在系统盘),然后点击下一步
3、等待安装完成
4、完成后勾选项目可以自由选择。
下载仅供下载体验和测试学习,不得商用和正当使用。
发表评论