PDF转文本文件笔记和PDF Split and Merge

PDF在线资源

PDF转换的工具很多,以免费为前题,以下是我找到的一些资源。

  • 线上PDF文件保护解除工具
    上传有打印、复制保护的PDF档案后可立即下载解锁后的版本(不过需上传文件到Internet,有文件内容外泄的疑虑)
    http://www.ensode.net/pdf-crack.jsf
  • 免费的PDF档合并/分割工具
    电脑玩物有很棒的说明,这里就不罗嗦了。 我测试了手上几个pdf档,pdfsam新版Beta会发生错误,最后改用电脑玩物用的0.7sr1旧版才正常。
  • PDF转HTML的免费工具
    SourceForge的开放源码项目,我测试处理中文会有问题
    http://pdftohtml.sourceforge.net/
  • 在线PDF转TEXT
    上传PDF後,可检视转换后的TEXT,格式很接近原始档、中文也没问题,结果可另存为ZIP起来的文字档。(一样有文件外泄的风险)
    http://pdftextonline.com/
  • 偷用GMail的PDF转HTML功能
    GMail的附件上传后,可以View as HTML,可以借来用用。
    http://labnol.blogspot.com/2005/12/convert-doc-xls-ppt-rtf-pdf-to-html.html
  • Acrobat Reader内建另存文字档功能
    绕了一大圈,没想到Acrobat Reader本身就内建有另存文字档功能...
    不过测试表格式文字时,转好的文字都挤在一起,格式不如pdftextonline.com漂亮
  • Adobe官方提供的线上转换服务
    支援Text及HTML 3.2两种转换格式,可以给URL直接转换,也可以把PDF当成附件寄给pdf2txt@adobe.com, pdf2html@adobe.com。(网友的使用经验)
    http://www.adobe.com/products/acrobat/access_onlinetools.html (一样也有外泄风险)
  • 微软Office OCR大法(For Office 2003+ Users)
    从Office 2003起,微软加入了一个Office Document Imaging的工具,可以将图档OCR成Word档。所以可以用PDF->列成TIF->OCR->转成Word的做法,不过挺绕路的,且效果普普。参考文章
    不过这一招可以用直接用在屏幕截取图档转文字上,效果还过得去,聊胜於无。

PDF Split and Merge 免费的PDF分割合并工具

本节内容来自:http://playpcesor.blogspot.com/2007/11/pdf-split-and-merge-pdf.html

书到用时方恨少,电脑上的工具当然也是一样。有时候我们不一定常常进行某一项作业,但是当偶尔碰到要执行某个操作而缺乏工具时,常常会因为要搜索新软体而花费不少时间,如果这个工具又不好上手,甚至有诸多使用限制的话,那真的会耽搁了工作的进度。因此有时候收集一下这些对你来说不一定常使用,但它是个免费、简单好上手的工具,以备不时之需也是好的。前几天我便碰到了这样的问题,忽然需要进行一个PDF分割与合并的工作,可是总不可能真的去装 Adobe Acrobat吧?於是上网搜索了一下,在最近我也常逛到的“落脚斋”里,发现“PDF 档分割与合并 - PDF Split and Merge”这个完全符合上述免费、简单、好上手原则的PDF工具,它不仅有中文介面,而且几乎不用任何学习就可以很快的完成PDF页面分割与合并,所以用完之後,我当然立刻就将其收近我的必备软体清单当中了。

PDF Split and Merge:http://sourceforge.net/projects/pdfsam/

这是一个开源软体,来到首页,点击绿色的﹝Download PDF Split and Merge﹞,进入下一个页面后拉动网页到下方的“File Releases”,在“pdfsam”栏位就可以看到免安装(pdfsam-0.7sr1-out.zip)与安装版(pdfsam-win32inst-v0_7_sr1.exe)。假设你和我一样下载了免安装版,直接解压缩,然后执行里面的“pdfsam-starter.exe”即可,开启后先切换到﹝Settings﹞标签页面,然后在“Language”中切换到繁体(Traditional)或简体(Simplified)中文,按下右下方的﹝Save﹞,先退出PDFSAM再进入,便可以看到中文的界面了。

PDF Split and Merge的操作真的非常简单,落脚斋中也有详尽的介绍了,在﹝merge﹞活页标签中可以进行PDF档案的合并,只要将你想要合并的档案用﹝新增﹞来加入,并调整合并后的排列顺序,在﹝浏览﹞中选择要输出的资料夹档名或要合并到哪一个档案上,最后按下﹝执行﹞即可。

在﹝Split﹞活页标签中,先指定一个“原始档案”,然後选择一种分割的方式,设定输出的文件夹和档名前缀,最后也是按下﹝执行﹞即可完成作业。

PDF Split and Merge在执行的效能与结果上都很令人满意,操作也真的非常简单,或许你不一定常常用到它,但是将这个实用工具备份到你的软件清单中,等到你需要时就不怕遍寻不着好用工具罗!

作者: Jeffrey

文章来源:

标签:

关键词: PDF, 文本文件, 转换, 免费, 解锁, 解除保护, 合并, 分割, HTML, Gmail, Adobe, Office, OCR, PDF Split and Merge

创建日期: 2008-04-30

文库 微博 博客 作品 首页