原因是你的PDF文件是扫描的,扫描的时候页面不可能百分之百的端正,而且如果是图片的话,要转成可编辑的字符。
那就要用到ORC技术,现在最好的ORC软件也不可能做到对扫描的文字百分之百正确的分辨。
所以对于某些PDF文件来说,要求还是别太高了。