高分200 不清晰版扫描pdf文档转word ocr达人请

[复制链接]
查看11 | 回复5 | 2011-5-23 11:52:02 | 显示全部楼层 |阅读模式
达人好 我收集了部分学习参考资料 有扫描版的pdf学习资料 有word版学习资料 需要将全部资料全部转换成word文档 清晰的pdf扫描版文档转换 校对需要的时间很少 不清晰的扫描版文档转换后校对需要很长时间 在这里急求不清晰扫描版文档转word文档的软件 需要转换率高的 清晰版资料识别率在99%-99.9%之间所以转换校对起来很少时间就完成了 不清晰的文档大约识别率在90%以上 校对起来非常非常花时间了
急求不清晰扫描版文档转word软件 感谢感谢了

回复

使用道具 举报

千问 | 2011-5-23 11:52:02 | 显示全部楼层
对于是图片做成的PDF(特别是扫描件做成的PDF)文件
推荐用下面软件转换
2.1页数比较少的用 CAJviewer 7.0 (带OCR组件完整版) ,支持直接打开PDF文件,识别文字。
2.2页数比较多的可以用 Readiris Corporate 12软件来进行识别 (需要安装亚洲语言包,不然不识别中文)
2.3页数比较多的还可以用 ABBYY finereader 9或者9以上版本(有简体中文版)进行识别转换。
这个软件的识别率很高,转换出来的版面基本保持原样。
上面几个软件的识别率都还可以,不建议用什么OFFICE组件识别,太麻烦识别率也不高
回复

使用道具 举报

千问 | 2011-5-23 11:52:02 | 显示全部楼层
回答您的问题:我一直在用汉王的OCR,识别效果真的一般,其他的ABBYY Finereader 还有CAJ Viewer 集成的OCR,识别效果还不如这个。我只能说,你要想识别不清晰的pdf,还是先处理一下文本本身的亮度、对比度、gamma值比较好,毕竟电脑不是人脑。如果这文档真的有价值,可以直接送去打印店,让他们人工打字,也不贵的。
回复

使用道具 举报

千问 | 2011-5-23 11:52:02 | 显示全部楼层
我用的尚书七号,感觉不错,扫描时要把扫描员紧贴扫描区域,一般书籍类100%不错,你可以试试,如找不到好的版本或安装文件,留QQ我发给你
回复

使用道具 举报

千问 | 2011-5-23 11:52:02 | 显示全部楼层
其实你换个思路就可以了,把PDF打印成文件,然后粘贴图片到word里,同样可以,如果你需要再编辑的话,这个想法就不行了。
回复

使用道具 举报

千问 | 2011-5-23 11:52:02 | 显示全部楼层
试试赛酷OCR 能将pdf转换成可编辑的word打开 识别 插入就可以导入到word中
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

主题

0

回帖

4882万

积分

论坛元老

Rank: 8Rank: 8

积分
48824836
热门排行