原文地址:https://www.douyacun.com/article/c5536d523cb19a38d2a588f6fdf5d1cd
网址:https://www.douyacun.com/pdf/delete-text
微信小程序:搜索 「大宁宝箱」
步骤概览
优势
问题:
支持拖拽文件上传
文件上传完成后需要选择第几页来分析文字,如下图:
选择第几页是为了快速分析文字,如果分析整本PDF会可能占用多的资源和时间
点击立即分析之后会提取第N页的文字内容,这里可以会提取文字字体编码、大小,后续会分析文字颜色,如下图:
这里有2种情况:
点击文字选中需要删除的文字,会有中划线标记需要删除的文字,如上图。
问题:点击选择文字时会选中多处?(如上图红线标记的地方)
PDF删除文字是通过匹配字体编码的方式进行删除的,如果是相同字体相同长度的文字,那选中的都会被删除掉
后续优化!
问题:只想删除某页的文字,整本内容都删除了!
这种情况多见于文字水印,PDF为了减小体积,对于相同的内容是可以以引用的方式加载
这里多半情形无需优化!
下方是原图和删除文字后的对比图,第二张是第四步成果预览的截图。