为何部分 PDF 识别异常及解决措施
很多 PDF 可能看起来是很正常的,但复制出来就不行,全部是乱码;
或者我们的 PDF 在软件内直接显示乱码,这种是字体导致的;
或者其他乱七八糟错误的问题
这个时候我们只要对这个 PDF 进行转路一下,具体步骤:
用 WPS 或者任何软件打开它,然后 Print to PDF。这一步得到的结果是一个 图片的 PDF, 不能选中
用下面的链接对 PDF 进行 OCR 扫描,扫描完成后会直接下载到[下载目录]。
https://www.pdftool.org/zh/ocr-pdf
(上面的软件免费,并且是在你本地运行的, Perfect!!!)