由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Programming版 - 请问从pdf文件里提取images
相关主题
so weird (转载)如何提取一个executable的所有dependency?
Dijkstra算法如何从html文件里提出中文
Python矩阵一问询问一个提取mailist关键词并保存邮件的方法
请教,网页抓取、内容整理提取用什么做比较简单从文件中提取文字和框图联系的方法
5千至1万个左右的小网页采用什么结构存储呢?问个log处理的问题
请教提取HTML语言的DIV属性问个正则表达式的问题
如何提取大批html文件中规则的信息?cnn大牛们,这种特征如何提取呢?
网上查库存的程序怎么写的? (转载)技术问题探讨:数据处理
相关话题的讨论汇总
话题: images话题: 提取话题: pdf
进入Programming版参与讨论
1 (共1页)
d*****u
发帖数: 17243
1
我用的是 adobe acrobat
图倒是都能弄出来,但是图里的文字标注都没了
比如1,2,3; 1a 1b这些都还是想保留
有什么办法保留这些文字吗?
thx
l********a
发帖数: 1154
2
qq抓图
d*****u
发帖数: 17243
3
there are more than 2000 images....

【在 l********a 的大作中提到】
: qq抓图
1 (共1页)
进入Programming版参与讨论
相关主题
技术问题探讨:数据处理5千至1万个左右的小网页采用什么结构存储呢?
有啥通过语义理解提取信息的轮子?请教提取HTML语言的DIV属性
多线程编程前景如何?如何提取大批html文件中规则的信息?
大家填表遇到过这种怪事么? (转载)网上查库存的程序怎么写的? (转载)
so weird (转载)如何提取一个executable的所有dependency?
Dijkstra算法如何从html文件里提出中文
Python矩阵一问询问一个提取mailist关键词并保存邮件的方法
请教,网页抓取、内容整理提取用什么做比较简单从文件中提取文字和框图联系的方法
相关话题的讨论汇总
话题: images话题: 提取话题: pdf