方法360问答一:利用Office2003中烈先呼南好数属将型的Microso口赵光ftOfficeDoc希物肥二斗设率体umentImaging组件来实现PDF转WORD文档,也就是说利用WORD来完成该任务。方法如下:
1.用AdobeR确其冲该女的站轮eader打开想转换的PDF文件,接下来选择“文件→打印”菜单,在打开的“打印”窗口中将“打印机”栏中的名称设置为“MicrosoftOfficeDocum粉件武维牛宗倍业挥entImageWr节握基色阿场间iter”,确认后将该PD袁奏美问鸡样入破走两件F文件输出为MDI格式的虚拟打印文件。
注:如果没有找到“MicrosoftOfficeDocumentImageWriter”项,使用Office2003安装光盘中的“添加/删除组件”更新安装该组件,选中“Office工具MicrosoftDRAW转换器”。
2.运行“MicrosoftOfficeDocumentImaging”,并利用它来打开刚才保存的MDI文件,选择“工具→将文本发送到Word”菜单,在弹出的窗口中选中“在输出时保持图片版式不变”,确认后系统会提示“必须在执行此操作前重新运行OCR。这可能需要一些时间”,不管它,确认即可。
注:对PDF转DOC的识别率不是特别完美,转剧证酒飞胜回换后会丢失原来的煤损季装鸡唱概新依滑六排版格式,所以转换后还需要手工对其进行排版和校对工作。
以上仅在word2003中可用,其他版本没有MicrosoftOffice发棉略善卷穿滑苏岁DocumentImageWriter。
方法二:利用第3方软件来实现
下面的六款软件中,前三个适用于普通的PDF文件(里面内容可以用仅吗不坚哥县而军啊井鼠标选中的),后三个适用于图片类或者是扫描件做成的PDF文件(通常网络上政原肥诉往法模下载的书本都是这个形式呀棉简的)。你要有针对性的选择合适的软件转换出来才有最好的效果。
如何判断PDF文件是否加密:用adobereader或者adobeacrobat软件打开你的PDF文抓吃屋风异附仅正血听件,如果提示要输入密码,那么这种文件肯定是加密文件,是无法转换的。还有一种是能够打开的,打开以后在软件的标题栏文件名的后面有“(已加密)”字样的(如下图所示),独三看书顶负神也是加密的PDF马吸密批轻文件,加的不是打开密码,是组拿种司发晚文件修改的权限密码,这种也是无法转换的,只有去除掉了权限以后才可以转换。
重要:转换前请务必确认你的PDF文件没有加密加权限限制,否则转换会失败的,具体看本文最下面注意事项。
1.AnyBizSoftPDFConverterV2.5 推荐使用等级★★★★
AnyBizSoftPDFConverter是一款PDF转多种格式的软件,select部分是你要转换输出的格式,你要什么格式就选择什么格式,前提是你一定要安装微软的OFFICE办公软件。
addfiles按键就是添加你要转换的文件用的,可以批量的。
outputsetting部分就是输出设置部分,是设置文件输出保存位置的,可以是源pdf文件位置或你也可以自定义。最后那个大大的convert按键就是转换开始键了。这个软件对于中文字体的支持还是不错的,就是有时候版面会有点错乱。不过胜在支持多格式转换。而且转换速度比较快。
2.SolidConverterPDFV6/V7 推荐使用等级★★★★☆
solidconverterPDFv6是一个PDF转word的神器,支持PDF转换成word、excel、图片、html等等,当然这个软件还带有PDF的加水印、修改等功能。
转换速度虽然比较慢,但是转换出来的效果是非常好的,版面维持的几乎不变,还有一项最好的功能就是能够转换部分直接复制是乱码的PDF。
3.e-Pdfpdf2wordconverter2.5 推荐使用等级★★★
e-Pdfpdf2wordconverter是一款功能比较单一的软件,只能是PDF转word。但那是这个软件的转换速度和版面的还原能力都是比较好的,而且有中文汉化版的便于操作。只需转换word格式的朋友推荐使用。
4.CAJviewer7.0 推荐使用等级★★★☆
CAJviewer7是中国知网的专用浏览器,也支持PDF格式的阅读,完整版本是带有OCR组件的(约37M左右)。打开PDF文件以后在工具栏上有一个放大镜下面打一个勾的上面还有一个字和A的那个图标工具就是OCR工具。选择这个工具然后拉框选择识别区域,稍等一会儿就会有文字识别结果对话框出来,那里面的文字就是识别提取出来的人,如果你要整个PDF转换,你可以在菜单栏文件---另存为文本就可以了。
5.ABBYYfinereaderv9 推荐使用等级★★★★★
ABBYYfinereaderv9是我见过的最强大的PDF(图片格式或者是扫描件)转word的软件。它是一款OCR软件,界面比较简洁明,9.0和以上版本有简体中文版的,支持100语言的识别,特别是混合多种语言识别效果也非常好。
国内的OCR软件仅仅是对中文的识别比较好而已。而且,这款软件只要你设置好识别文件所用的语言然后打开PDF文件(支持直接打开的)然后其他的工作就交给软件了,识别完后文件------另存为word格式就可以了。而且版面的保持能力是我见过的OCR软件里面最好的一个,识别率也是最高的一个,就是转换识别的速度比较慢。只要PDF文件比较清晰,准确率基本可以达到95%以上(除了数学公式、计算式、化学式、分子式、三角函数等专业的内容之外),强力推荐大家使用。如果你要识别韩语PDF文件的话请使用10.0版本,9.0不支持韩语的识别的。
6.ReadirisCorporate12 推荐使用等级★★★★
ReadirisCorporate12也是一款OCR软件,同样支持100多种语言的识别,但是要识别亚洲语言还要额外安装亚洲语言词典才行。识别能力也是非常高的,就是版面的保持能力比ABBYY的略差一筹,而且转换速度比较慢,对PDF文件的兼容性略差一点。识别等等都要比国内的OCR软件高出不少,也是一款不可多得的软件。
总结:当然PDF转word的软件还有很多种,上面介绍的几个软件只是本人转换了上千个PDF文件在无数个转换软件中挑选出来的比较好的软件,特地总结一些经验大家共勉,免得大家走太多弯路。
注意事项:
因为PDF是可以加密加权限的,所以如果遇到已加密的PDF文件要先解密以后才可以转换的。
对于可以打开阅读,但是限制了复制打印等功能的PDF文件,一般可以用PDFpasswordremover3或者PDFunlocker去掉加密权限,然后再转换。(如果PDFpasswordremover3没有注册只支持解密3页内容)。