为什么在复制PDF文件文稿到word中去时所有文字就都变成了乱码呢?
答案:4 悬赏:30 手机版
解决时间 2021-03-30 20:14
- 提问者网友:战魂
- 2021-03-29 23:57
为什么在复制PDF文件文稿到word中去时所有文字就都变成了乱码呢?
最佳答案
- 五星知识达人网友:骨子里都是戏
- 2021-03-30 00:37
复制PDF文件文稿到word中去时变成乱码的原因:
1.文字编码不兼容。
2.文字保存时使用了内嵌的字体。
3.PDF文档制作时没有严格按照PDF标准,反向转换时,也无法顺利反编译。
4.PDF文件一般内嵌的字体在你的电脑上没有,因为word是调用系统字体的,而PDF文件是优先调用内嵌字体的。
解决办法:
1. 可以尝试用第三方的转换工具把PDF转成WORD格式,有些能够解决乱码问题,但是有时候不一定能够解决。
2. 使用OCR识别软件进行文件识别处理。比如ABBYY finereader 10/11 ,可以直接把 PDF文件识别出来成WORD文件,不过OCR识别不会100%正确,需要人工校对。
3. 但是如果文档比较重要的话,那可以将文档发送给人工客服,让人工客服帮您看文档是否有方案可以做识别转换,那就真的没有其他的可能性了。建议先咨询一下,免得白白浪费大量的时间。
拓展资料:
首先要从PDF格式文件本身说起,其它格式文档在制作成PDF文档时,都会将电子文字信息和图片信息,固定化的排布在页面上,同时为了保证文字样式的正确性,不同的编辑的文字和文字字体也会一同嵌入在PDF格式文件中。
但是当反向过来需要将pdf转换成word文档时,因为其中的文字编码、格式、字体已经使用自己的存储方式固化,所以反向转换的时候,会有各种各样的问题出现,其中最常见的就是文字乱码。
1.文字编码不兼容。
2.文字保存时使用了内嵌的字体。
3.PDF文档制作时没有严格按照PDF标准,反向转换时,也无法顺利反编译。
4.PDF文件一般内嵌的字体在你的电脑上没有,因为word是调用系统字体的,而PDF文件是优先调用内嵌字体的。
解决办法:
1. 可以尝试用第三方的转换工具把PDF转成WORD格式,有些能够解决乱码问题,但是有时候不一定能够解决。
2. 使用OCR识别软件进行文件识别处理。比如ABBYY finereader 10/11 ,可以直接把 PDF文件识别出来成WORD文件,不过OCR识别不会100%正确,需要人工校对。
3. 但是如果文档比较重要的话,那可以将文档发送给人工客服,让人工客服帮您看文档是否有方案可以做识别转换,那就真的没有其他的可能性了。建议先咨询一下,免得白白浪费大量的时间。
拓展资料:
首先要从PDF格式文件本身说起,其它格式文档在制作成PDF文档时,都会将电子文字信息和图片信息,固定化的排布在页面上,同时为了保证文字样式的正确性,不同的编辑的文字和文字字体也会一同嵌入在PDF格式文件中。
但是当反向过来需要将pdf转换成word文档时,因为其中的文字编码、格式、字体已经使用自己的存储方式固化,所以反向转换的时候,会有各种各样的问题出现,其中最常见的就是文字乱码。
全部回答
- 1楼网友:人類模型
- 2021-03-30 02:01
不会吧,我用你的办法复制都没有出现过这种情况。那用先复制到记事本的办法看看行不行呢?
- 2楼网友:蓝房子
- 2021-03-30 01:38
可以试一下下面步骤:
在PDF中文件-〉打印
选择打印页面,确定。中间会跳出来一个对话框,不用管,确定,生成MDI文件
将该文件打开后,工具-〉将文件发送到Word
这样也会生成一部分乱码,尤其是图片不会支持,需要自己重新抓图
目前这种技术还不是很成熟,仍然会有很多乱码,尤其是图片基本不显示,还有原来的格式也没法恢复,只好自己动手啦!
可能转换的原理不是通过内码,而是通过字的外形来识别的,比如U这个字母很多时候转换后变成了ll,不过目前没有更好的办法
在PDF中文件-〉打印
选择打印页面,确定。中间会跳出来一个对话框,不用管,确定,生成MDI文件
将该文件打开后,工具-〉将文件发送到Word
这样也会生成一部分乱码,尤其是图片不会支持,需要自己重新抓图
目前这种技术还不是很成熟,仍然会有很多乱码,尤其是图片基本不显示,还有原来的格式也没法恢复,只好自己动手啦!
可能转换的原理不是通过内码,而是通过字的外形来识别的,比如U这个字母很多时候转换后变成了ll,不过目前没有更好的办法
- 3楼网友:春色三分
- 2021-03-30 01:29
复制PDF文件文稿到word中去时变成乱码的原因:
PDF文件一般内嵌的字体在你的电脑上没有,因为word是调用系统字体的,而PDF文件是优先调用内嵌字体的。
解决办法:1. 可以尝试用第三方的转换工具把PDF转成WORD格式,有些能够解决乱码问题,但是有时候不一定能够解决。
2. 使用OCR识别软件进行文件识别处理。比如ABBYY finereader 10/11 ,可以直接把 PDF文件识别出来成WORD文件,不过OCR识别不会100%正确,需要人工校对。
PDF文件一般内嵌的字体在你的电脑上没有,因为word是调用系统字体的,而PDF文件是优先调用内嵌字体的。
解决办法:1. 可以尝试用第三方的转换工具把PDF转成WORD格式,有些能够解决乱码问题,但是有时候不一定能够解决。
2. 使用OCR识别软件进行文件识别处理。比如ABBYY finereader 10/11 ,可以直接把 PDF文件识别出来成WORD文件,不过OCR识别不会100%正确,需要人工校对。
我要举报
如以上问答信息为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
大家都在看
推荐资讯