永发信息网

各种电子图书馆文章转为Word文档的方法

答案:1  悬赏:60  手机版
解决时间 2021-10-16 15:19
各种电子图书馆文章转为Word文档的方法
最佳答案
各种识别软件对电子图书馆文章的识别各有缺陷,有的只能识别字,对表格和图形无能为力;有的识别后生成的版面乱七八糟,无法使用。还在为不同格式的文件怎么变成Word文件发愁吗?现在好了,本文给出了所有情况下全文件表格、图形、文字识别的完美解决方案,帮助大家掌握正确方法,节省时间:   1、PDF文件的识别   1)文件可以直接识别的(以文本形式保存的PDF文件):安装acrobat 7专业版,注意不是acrobat reader,直接另存为rtf文件(识别整个文件),或者选择工具栏上的文字选择按钮,然后选择文字区域,然后复制到Word等中。   2)文件不能直接识别的(以图片形式保存的PDF文件):安装office2003,并装上office工具Microsoft Office Document Imaging(完全安装此工具),然后在打印机里面会增加Microsoft Office Document Image Writer打印机,然后将PDF文件打印到此打印机,选择打印形成的文件的保存位置,然后会自动形成一个MDI文件,并且自动用Microsoft Office Document Image打开此文件,然后选择“工具”菜单下的“使用ocr识别文本”,识别完成后,在选择“工具”下的,“将文本发送到Word”,最后将把整个PDF文件识别输出到Word文件中。   注意:Microsoft Office Document Image可以非常准确的全文件识别转化中文、英文、表格,但是无法将图形输出到Word,而是把文件中的所有图形单独形成一个个独立的图片文件,放在相同位置的一个相同名称的文件夹中,因此可用snagit软件将图形打开,然后复制到Word中。(所有的识别软件都不能很好的处理图形的识别问题,Microsoft Office Document Image的这种处理方法已经是非常好的解决这个问题了。)   3)加密的Pdf文件:先解密软件,解密后在参看1),2)   4)繁体pdf文件:用2)的方法识别到Word后,用Word中的“工具”--“语言”---“中文繁简转换”   2、caj文件的识别:   1)局部文字识别:直接使用caj浏览器的ocr   2)全文件识别:打印到Microsoft Office Document Image Writer打印机,后面和上面的2)操作一样   3)博硕论文全文:在线阅读博硕论文,待可以看到最后一页后,不要关闭caj浏览器,到caj安装目录下cache中找到一个较大的文件,拷贝到其他位置即可。然后使用2)全部转化为Word。   3、超星文件的识别:   1)局部文字识别:直接使用超星浏览器的ocr   2)全文件识别:打印到Microsoft Office Document Image Writer打印机,后面和上面的2)操作一样,要注意的是,超星打印功能有点区别,因为超星是目录和全文分开的,所以打印时,需要分别把目录和正文识别到Word中,在合并到一起。打印时要填入打印页码从1到最后一页,不要选择打印全部。此外在打印选项中,还要将页面比例设成真实大小,而不是整宽。注意:识别速度比其他格式要慢很多,请保持耐心,但是最后当你看到轻松的生成全本书的Word版本时,你会欣喜若狂的,呵呵。我的试验结果是一本280页的书,识别需要几分钟的时间。   3)超星相对比较麻烦一些,如果还有问题,可以先把超星打印成完整的pdf文件,然后在用1、的方法转成Word   4、其他情况下的识别:   使用snagit软件将任何形式的文字可以变成图片,例如使用snagit将屏幕拷贝成图片,然后右键点击图片文件,用microsoft Office Document Image打开图形,其他和2)一样。   注意:其他的各种识别软件请不要在用,因为要么只能识别中文,要么只能识别英文,要么不能识别整个文件,要么不能识别屏幕拷贝图像,要么识别误差很大,要么不能识别表格,要么需要注册,要么识别速度很慢,要么使用不便(和Word结合不紧),这些软件包括:紫光ocr,万方pdfocr,尚书,汉王,ScanSoft PDF Converter,pdf2Word,以及各种被推荐的软件等等,我都装过,现在都像LJ一样删除了。只要安装了acrobat 专业版,snagit,office2003,现在你可以完美的做任何事,最重要的是这几个软件很好得到。   针对一些问题的补充:   经过一些试验,发现microsoft Office Document Image 存在一些不稳定的问题,例如在用caj打印到Microsoft Office Document Image Writer打印机时,发现用caj5.5版本比较快,(caj5.5不能加升级补丁),而caj5.0有时出现假死机。   另外页面显示大时,转化的识别率较高。   如果页数多的文件,包括超星,如果有问题,可以分多次转化。   再次补充:   1、由于虚拟打印到Microsoft Office Document Image Writer 比较慢,并且形成的虚拟文件很大,1本200多页的书大约是60M,因此会严重影响机器的运行速度和C盘空间以及内存空间,建议配置好的机器一次转化不要超过200页,配置差的不要超过100页,同时打印时在右下角系统栏中会出现打印机图,你可以双击,看到打印任务的进度,以免以为死机了。另外转化完成后请删除c:\windows\temp目录下的虚拟打印文件,否则你的c盘很快会被用光。   2、建议如果发生打印到Microsoft Office Document Image Writer很慢或者假死的情况,可以先打印到snagit虚拟打印机,会自动生成tiff文件,速度比Microsoft Office Document Image Writer快,然后在snagit中,选择打印机为Microsoft Office Document Image Writer打印机,(相当于再打印到Microsoft Office Document Image Writer打印机),然后选择snagit---outputs下的printer,然后选择snagit----file----finish output,即可生成msi文件,其他一样。转化完成后请删除c:\windows\systems32\snagit临时文件。
我要举报
如以上问答信息为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
大家都在看
关于菜市场装修有哪些合理化建议
家常饭店装修什么风格的好?怎么装修才能吸引
桑塔纳!
电脑如何设置可以保护眼睛
试管婴儿移植成功后可以补高丽参吗
狗狗细小怎么口服治好
你好 请问洗完牙要注意什么?有什么禁忌?
高档玻璃楼梯扶手的价格要多少?麻烦报报价
油条的做法是什么,哪里有加盟油条店?
怎么设置电脑不关屏幕?
石家庄联飞汽车贸易有限公司地址在哪,我要去
求云南省建筑工程施工质量验收统一规程DBJ 53
普通护肤品真的没有高档护肤品有用吗?
哪位能告诉我水泥自流平怎么施工?这个谁了解
有哪些搞笑小品
推荐资讯
长葛这几天穿什么衣服合适
起亚k3全景天窗多少钱那位朋友给介绍点经验啊
南通哪家瑜伽店比较好
厦门坤城汤岸温泉度假村 订房间有送温泉卷和
脸部发痒是怎么回事有小疙瘩
鉴定玉石的强光手电筒用哪种最好
别墅欧式铁艺大门价格一般是多少
烧饼里的油酥怎么熬城的
三十岁的女人如何培养气质
南京艾森特货架公司怎么样?
链条式开窗机有哪些特点?
城市热点有手机客户端吗?
正方形一边上任一点到这个正方形两条对角线的
阴历怎么看 ?