boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Linux版 - 一行命令找出html中所有img src?
相关主题
script question
请问一个awk的问题
在emacs中怎么按照某种格式进行替换?
sed里面正则表达式匹配字符越少越好怎么写?
How to find the first decimal number in a string ?
请问有没有自动发送IP地址的程序
有没有比wget好一点的全站下载工具?
菜鸟 wget 问题求教
怎样把snoop的结果抽出来(假设已变成hexadecimal and ASCII format)?
想用wget从Google Finance下载数据 (转载)
相关话题的讨论汇总
话题: img话题: src话题: html话题: 一行话题: 找出
进入Linux版参与讨论
1 (共1页)
h**********y
发帖数: 1293
1
求教
c**t
发帖数: 2744
2
wget | grep

【在 h**********y 的大作中提到】
: 求教
h**********y
发帖数: 1293
3
关键是regex怎么写。。。

【在 c**t 的大作中提到】
: wget | grep
C********s
发帖数: 120
4
除非你的数据格式有严格控制否则这类问题不适合用正则表达式。找个 html parser
更合适吧。
如果你能确定 tag 全部在一行内,没有换行,tag 内没有比较古怪的字符,没
有 escape 字符,对结果要求不是特别严格,可以试用正则表达式。下面用 perl one
liner:
perl -e "m/
【在 h**********y 的大作中提到】
: 求教
1 (共1页)
进入Linux版参与讨论
相关主题
想用wget从Google Finance下载数据 (转载)
脚本程序找不到已安装的包是怎么回事?
wget保存页面
各位网友注意,不要点击那个了
遇到黑客了!
Ubuntu 自动安装微软雅黑字体 (zt)
我的wget好快啊!!!
问个grep正则匹配的问题
挺不可思议的
为啥机器能ping但是不能wget?
相关话题的讨论汇总
话题: img话题: src话题: html话题: 一行话题: 找出