页面中分栏的pdf文章能不能转换成顺畅的文本格式,请注意,不是转换后依旧分栏那种

[复制链接]
查看11 | 回复4 | 2011-11-11 09:18:51 | 显示全部楼层 |阅读模式
这个事情必须分两步走。第一步,把PDF转成TXT。第二步,用专业的文本编辑软件,根据出来的TXT的规律,达到你的最终要求。这中间因为没有统一的规律,必须具体情况具体分析,所以我只能答到这里。如果你已经有TXT了,可以发给我看看。...
回复

使用道具 举报

千问 | 2011-11-11 09:18:51 | 显示全部楼层
假如PDF分2栏,每栏10行,你的意思是转换后,第1行后面接的是第11行,而不是按分栏,第10行接第11行?用汉王PDF OCR识别,它会自动识别文字块,相信可以按分栏识别的。...
回复

使用道具 举报

千问 | 2011-11-11 09:18:51 | 显示全部楼层
使用pdf转换成word软件,能实现,试试。...
回复

使用道具 举报

千问 | 2011-11-11 09:18:51 | 显示全部楼层
能...
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

主题

0

回帖

4882万

积分

论坛元老

Rank: 8Rank: 8

积分
48824836
热门排行