程序介绍
批量复制指定文件夹A下每个pdf中的文本到txt文档中,复制时每个pdf页面间使用 ≦ 1 ≧ ≦ 2 ≧ 这样的序列分割标注页面,使得每个pdf文件复制文本内容后在txt文档中能够清晰明了。
支持子文件夹穿透,程序会自动创建以pdf文件名命名的txt文档,将pdf文本复制后写入txt文档中,txt文档最后会保存在pdf所在文件夹下,与pdf文档放在一起。
注意事项
使用过程中可能会出现如下情况
1、pdf页面为纯图片页面,这种情况是无法复制文本的,需要先将页面中的图片进行OCR识别处理
2、pdf页面为文本页面,但是复制后的文本出现一个字一个字的情况(这种情况比较少见),这种情况也需要先使用OCR进行预处理添加搜索层,再次复制就不会出现一个字一个字的情况了,还要一种办法就是将pdf另存为pdfA可归档的格式
操作方法
1、如果需要复制pdf文档中的文本(pdf文档中的文本为文本类型时,非图片类型)适用程序2进行复制
2、如果无法正确复制文本,可使用程序1对pdf文件进行OCR处理
适用系统环境
win7及以上64位操作系统
下载地址
- 随机文章
- 热门文章
- 解决Markdown嵌入哔哩哔哩视频在微信页面中自适应宽度问题
- 766-移动带有关键字文件到指定文件夹
- 773-批量为文件名添加前缀或后缀
- 784-批量搜索移动或复制指定文件夹下指定名称的指定格式的文件到指定文件夹
- 789-批量检测指定文件夹下空文件夹并输出到txt
- 790-批量统计各文件夹下文件类型数量及文件夹路径输出到excell
- 10080-1-监测指定文件夹-支持子孙文件夹-对所有压缩包创建同名文件夹移入并解压-只支持zip-rar-7z压缩包的解压
- 10081-1-批量解压自解压文件-【支持密码-子文件穿透】【不支持嵌套自解压或压缩包解压】-除自解压文件外不能有其他exe文件
- 453-批量删除pdf中包含二维码的注释-(只处理注释)
- pdf导出excell提取表格无框线处理逻辑
- 1开通VIP会员享全站内容免费查看
- 2🔥🔥🔥常见问题 | 售后问题 | 程序购买 | 会员开通等问题
- 3752-批量复制文件及文件夹到多个文件夹
- 410081-1-批量解压自解压文件-【支持密码-子文件穿透】【不支持嵌套自解压或压缩包解压】-除自解压文件外不能有其他exe文件
- 5790-批量统计各文件夹下文件类型数量及文件夹路径输出到excell
- 6网页插入bilibili哔哩哔哩视频
- 7401-批量识别pdf中二维码并替换为指定图片或覆盖白色
- 8使用本站程序过程如果遇到问题请查看该文章说明
- 9431-批量合并指定文件夹下各文件夹内pdf为一个pdf文件
- 10【起步式】从python环境配置到使用AI写出第一个python程序(python版本3.86)
还没有评论,来说两句吧...