PDF转Word之后出现乱码?

文字型PDF乱码原因

文字PDF有乱码是因为使用了非标准的内嵌字体。比如标准字体Unicode:4E00代表汉字“一”,非标准的字体,4E00给用做了“a”,PDF里记录的数据是4E00,并不是实际汉字,这就会产生乱码。
直白一点,如果复制此类PDF里的内容,粘贴出来会都是乱码。
此类PDF可联系客服,手动处理。

图片型PDF乱码

图片型PDF的转换,需要OCR技术,OCR技术是从图片中分析文字信息,颇有难度,此类技术无法做到完美还原文档,业内通病,短期内没有办法解决

联系我们寻求帮助

可以把文件发到我们客服邮箱,工作人员会手动为您处理

support@xpdf.cn