我们在工作中经常要涉及到格式转换,特别涉及到文档格式之间的转换,为难了很多工作中的职场人士。俗话说“书到用时方恨少”。我们平常多积累一些职场中的小技巧,自然在工作中就不会发难。
在常见的文档格式的转换中,遇到的最多的,相对比较麻烦的就是PDF到word格式的转换,pdf格式和word的格式,使我们在工作中最常用的两个格式,我们一般在分享和传播的时候用PDF格式比较多,在文档制作和编辑的时候使用word格式比较多。
word 到pdf的转换相对比较容易,只要使用的不是太古老的word或者是wps版本,都可以在另存为的时候把内容保存为pdf格式,而不用刻意借助其他的软件或者工具。但是对于pdf转换为word有时候就比较麻烦一点,转换的过程中经常会出现格式问题或者转换之后用word打开都是无法进行编辑的图片内容。
这里大家需要熟悉一个PDF的知识点。分为两种PDF格式,一种是可编辑的PDF,一种是不可编辑的PDF。
可编辑的PDF
这种PDF格式可以直接选择文字内容,转换之后除了些许格式问题,通常是比较接近word文档的。这种的pdf格式通常是由word直接生成的pdf文件,或者adobe acrobat ,福昕PDF编辑器等专业的PDF编辑器制作的。
不可编辑PDF
这类的PDF我们无法直接选择内容,一般是通过扫描仪扫描的文档或者通过图片生成的文档,这类的内容一般无法直接编辑,如果想要转换成word,需要借助一些文字识别软件或者工具。
直接复制
有些可编辑的PDF文件,我们通常可以文字选择工具直接选择内容进行复制,对于复制的内容我们可以直接使用在需要使用的地方,不过很多的可编辑PDF文件通常即使可以复制,但是在粘贴的时候会出现格式的凌乱,很多情况下这种方法并不是太好用。
word转换法:最简单的PDF转word
如果你使用的是office 2013或者更高的版本,你可以不借助其他的任何软件,仅仅借助word就可以转换pdf格式到word格式,这个方法也比较的简单,对于要打开的文件(注意:这里是可编辑的PDF文件)右击,找到打开方式,在打开方式中找的word,这个时候就可以使用word打开了,打开之后会弹出一个窗口,这里点击确认就可以了,word软件就会自动帮你把pdf文件转换为word 文件,使用起来非常的方便,不需要借助其他的第三方的软件就可以完成转换。
从博主日常的使用来看,这种转换的效果往往还不错,基本上保留的pdf相同的格式,并且能过夜保持与pdf相同的目录和大纲等级。
如果用的是比较低版本的office :在线转换法
如果恰巧使用的是比较低版本的office,比如office 2010以下的版本,即使我们使用word去打开pdf文件,也是无法完成格式的转换的。这个时候可以借助在线的格式转换网站,帮助我们完成格式的转换,好处是我们不需要安装其他的转换工具软件,只需要我们有浏览器,直接使用电脑的浏览器就可以完成转换,只需要把自己要转换格式的文档上传,网站会自动帮我们转换文件,然后将转换后的文件提供给我们下载。
这里比较知名的pdf转换网站有smallpdf、ilovepdf等,这类的软件除了除了支持pdf转换为word格式,还支持pdf和各类文档格式之间的相互转换,平时只需要作为自己浏览器的书签保存起来,当自己需要的时候,可以随时拿出来进行使用。
编辑器“另存为”大法好
如果你使用的是功能比较全面的pdf文件编辑器,比如adobe的文件编辑器,福昕pdf编辑器,万兴pdf编辑器,pdf-xchange,我们往往可以在文件另存为的时候选择word格式的文件,就可以帮我们把pdf文件转换为word格式的文件,根据博主的测试发现,不同的pdf编辑器转换后的质量不尽相同,个人觉得使用起来体验比较好的是福昕风腾企业版,转换之后比较接近原本的格式,格式保持的比较好。
扫描pdf最难搞,OCR软件跑不了
对于扫描的pdf,每一页的内容基本上就相当于一个图片,这类的pdf文件需要支持ocr识别的软件,把pdf中的文字内容识别出来才能够进行转换,市面上不少的pdf编辑器都支持pdf文字识别,比如福昕风腾,Adobe Acrobat Reader DC,万兴pdf编辑。识别效果都还不错,但是也难免有不少的错别字,或者后期转出之后格式比较凌乱。不过要说在ocr文字识别+后期比对比较好用和完善的还要说ABBYY FineReader,可以很好的把文字识别和后期比对很好的融合,并且和原版在格式上基本保持统一。
对于pdf到word的转换,掌握以上的方法基本上可以完成各种pdf到word格式的转换,但是需要注意的是,不管什么样的pdf到word格式的转换软件,基本上都很难转换后的效果和原版的效果完全的相同,之后还需要我们不断的进行比对,才能达到比较完美的效果,市面上的一些pdf转换器基本上都可以对可编辑的pdf有不错的转换效果,对于扫描的pdf基本上都不是特别好,很多软件无法进行文字识别,转换出来的结果就是在word中显示的一页一页的图片。