r*******n 发帖数: 3020 | 1 我用过Python抓过google排名前50的连接,每一个小时抓一次,
比较结果有什么变化。
用到urllib, 正则表达式 |
|
n********s 发帖数: 144 | 2
提取两标点符号之间的两个汉语词,如“你 好”,或者如。有 什么,
结果老错,应该是汉字正则表达式有问题,麻烦帮忙看一下:
%{
#include
#include
#include
#include
#include
%}
%%
[\u3001-\u303F]+[\u3000]*[\u2E80-\u2EFF\u2F00-\u2FDF\u31C0-\u31EF\u3200-\
u32FF\u3300-\u33FF\u3400-\u4DBF\u4DC0-\u4DFF\u4E00-\u9FBF\uF900-\uFAFF\uFE30
-\uFE4F\uFF00-\uFFEF]+[\u3000]+[\u2E80-\u2EFF\u2F00-\u2FDF\u31C0-\u31EF\
u3200-\u32FF\u3300-\u33FF\u3400-\u4DBF\u4DC0-\u4DFF\u4E00-\u9FBF\uF900-\
uFAFF\uFE30-\uFE4F\uFF00-\u... 阅读全帖 |
|
n********s 发帖数: 144 | 3 这是写的正则表达式,用lex做编译,可以生成c语言的源码,再进一步用c编译器编译
,可以生成机器代码。 |
|
r*****3 发帖数: 143 | 4 中文名: Perl高效编程 (第2版) 中文版
原名: Effective Perl Programming Ways to Write Better, More Idiomatic Perl,
2nd Edition
作者: (美) 霍尔
(美) 麦克亚当斯
(美) 福瓦
译者: 盛春 等
图书分类: 软件
资源格式: PDF
版本: 扫描版
出版社: 人民邮电出版社
书号: 9787115250469
发行时间: 2011年
地区: 大陆
语言: 简体中文
简介:
内容简介
本书是Perl 编程领域的“圣经级”著作。它提供了一百多个详实的应用案例,足
以涵盖编程过程中经常遇到的方方面面,由此详细阐释出各种高效且简洁的写法。本书
第1 版曾畅销十年之久,而在第2 版中不仅修正了前版存在的一些问题,更与时俱进地
引入了许多Perl 领域的新主题,使内容更加完善丰富,也更具实用性。
本书为初级Perl 程序员铺就了一条通往高阶之路,而对高级Perl 程序员来说,本
书也是必备的技术参考。
目录:
第1章 Perl基础
第2章 Perl的地道用法
第3章 正则表达式
第4章 子程序
第5章... 阅读全帖 |
|
o*******m 发帖数: 154 | 5 申请CS Master当然是must,但是自己的学习也不能放松,老马讲的挺好的。
原创 - 尚学堂科技 - 马士兵老师]
JAVA自学之路 一:学会选择
[转载请注明出处:http://www.bjsxt.com/zixue/zixuezhilu_1.html]
为了就业,不少同学参加各种各样的培训。
决心做软件的,大多数人选的是java,或是.net,也有一些选择了手机、嵌入式、游戏
、3G、测试等。
那么究竟应该选择什么方向呢?
我的意见是,不要太过相信各种培训机构或是抢手文章的说法(包括我),当你要走向
社会的时候,就不要再把自己当成学生,不要把自己的将来交给别人,学会运用自己的
眼睛去观察,去了解这个世界吧。
每个培训机构都会宣传自己的好处,并不能说明大的趋势。
一些新闻文章很有可能是枪手写的,不必太过相信。
国外背景的教师和课程,未必适合你。
那么怎么才能确定自己将来的方向?如何才能从纷繁复杂、或真或假的数据世界中挖出
一条路?
我讲一个通过招聘网站的观察方法。
可以到各种招聘的网站上查询信息(可以到google上查询招聘的网站),例如:
http://www.51job.c... 阅读全帖 |
|
|
a9 发帖数: 21638 | 7 用browser控件?
直接用httpwebrequest多好啊?
然后用正则表达式分析。 |
|
w***s 发帖数: 321 | 8 来自主题: EmergingNetworking版 - 一个傻问题 awk:
$ more awkcmd
/interface.*$/ { print
print "new command"
}
{ print }
$ awk -f awkcmd interface.cfg
如果你打算用完整的配置,记得修改正则表达式,否则会匹配到passive-interface或
者其他什么上;-D |
|
e***y 发帖数: 4472 | 9 编个小程序... 或者如果你用total commander, 它支持正则表达式选取文件 |
|
y****w 发帖数: 3747 | 10 还是像楼上说的,regex。
你允许的用户输入越复杂,你就需要越复杂的regular expression。搞明白你的规则先才是最重要的。正则表达式自己写不好的话,google一下,应该还是有不少的。 |
|
t***a 发帖数: 416 | 11 replaceAll("\\n", "")
因为replaceAll是正则表达式,所以两次转义
"" |
|
s****y 发帖数: 503 | 12 正则表达式判断
String a = "123";
boolean isNum = a.matches("[0-9]+"); |
|
j****y 发帖数: 178 | 13 做网站需要很多字符处理么?能不能举个例子。
php也有正则表达式的东西可以用,非要用python或perl是什么情况? |
|
c**y 发帖数: 2282 | 14 不够智能啊,例如我想通过正则表达式过滤url什么的 |
|
v********0 发帖数: 22 | 15 多谢多谢!!
看来我还是要加强正则表达式的学习阿!!! |
|
E*V 发帖数: 17544 | 16 你现学习一下
echo
cat
ls
ps
man
什么是|
more | less | most (这里|是或者的意思)
tail | head
wc
bc
for
if else
test
&&
$() ${}
...
等有空了
研究一下正则表达式
sed| awk
wget
... |
|
|
l******n 发帖数: 1683 | 18 正则表达式呀. 比如在vi里面用这样的替换命令:
s/[0-9]\+/001/g
001
位置 |
|
R******d 发帖数: 1436 | 19 awk的正则表达式是不是不怎么好用?相比sed的话 |
|
|
N**********d 发帖数: 9292 | 21 好像不行啊
sed -n -e 's:.*pattern1="\(/pattern2/[^"]*\)":\1:p' "$file" > "link"
还是不对劲啊,因为括号里面有/,所以我用:分割,我想抓"$file"里面的所有这种在双
引号里面的/pattern2/[^"]*的样子
求教怎么写呢? |
|
e********r 发帖数: 2352 | 22 文件包含很多类似的文件名,但是最有都以'*'结尾,想要把'*'去掉
例如:
model10*
model100*
...
需要重命名为:
model10
model100
...
for i in `ls`; do mv -f $i `echo $i | sed 's/.$/_/'`; done
只能把文件名改为:
model1_*
model10_*
对'*'无能为力
请教如何重命名,'*'总是默认为正则表达式的一部分. |
|
a9 发帖数: 21638 | 23 你直接从网上找个正则表达式吧。
美国区号和电话都没有1开头的,你举的这个例子就不符合。 |
|
l*****s 发帖数: 2109 | 24 一般都是正则表达式了。
但是,原来看过一个说法,理论上,不可能有正确的解法。
我非CS,不懂。 |
|
|
i****n 发帖数: 627 | 26 都对,问题四可以 cat file | sed -n '10p'
用正则表达式更省事儿 |
|
b***y 发帖数: 2799 | 27 ☆─────────────────────────────────────☆
wmbyhh (wmbyhh) 于 (Thu Jul 24 01:46:58 2008) 提到:
1. google maps有个通过鼠标drag/drop来改变路线的功能,怎么实现的?server side
?client side?
A:client side先获取具体用户定义的路线,在server side中路线数据库查找各路线的
信息
2. GPS 怎么工作的?GPS的精度有限,怎么识别两个相距很近的路?
A:卫星信号?角度识别相近路?
3. GPS地图里一条路是怎么表示的?包含哪些信息?
A:用向量表示?包含路起点、终点、长度?
4. trillion个整数,10台电脑,怎么排序?
A:分10分,每分单独heap排序,之后归并??
7. 设计一个数据校验模块,用来校验数据库中的数据是否符合客观逻辑。比如没有人
的名字叫123之类。
A:用函数校验?
8. 正则表达式的应用。
A:查找??
12. 给一个序列{11,21,1211,111221},找出规律,给出第5、6项是什么。
A:不知 |
|
r*******n 发帖数: 3020 | 28 because .* is greedy,
so try .*?
The following from Document of Python.
*?, +?, ??
The '*', '+', and '?' qualifiers are all greedy; they match as much text
as possible. Sometimes this behaviour isn’t desired; if the RE <.*> is
matched against 'title', it will match the entire string, and not
just ''. Adding '?' after the qualifier makes it perform the match in
non-greedy or minimal fashion; as few characters as possible will be matched
. Using .*? in the previous expression will |
|
|
X****r 发帖数: 3557 | 30 What do you want? 替换时支持正则表达式? This doesn't make sense.
You want to use captured parts, e.g.
M-x replace-regexp a\([0-9]+\) b\1
replaces all a1, a2, ...., a101, a102, ... to
b1, b2, ..., b101, b102, ...
.. |
|
N**********d 发帖数: 9292 | 31 例如:其中引号内长度不定
"abc", "def"
".*"
引号里面内容越少越好,我不想是 abc", "def
想要分别是
abc和def
这个该怎么写呢? |
|
|
|
|
a***y 发帖数: 2803 | 35 unix,linux里面的正则表达式,perl和它们很象. |
|
|
t**********s 发帖数: 930 | 37 000-00402-59837-006的正则表达式写成这样对不对?
[0-9]+-[0-9]+-[0-9]+-[0-9]+-
谢谢 |
|
|
|
p*********t 发帖数: 2690 | 40 用value也可以得到某个field的值的。javascript是比较乱,而且不好debug.不過挺喜
欢它的正则表达式,非常的高深。 |
|
l*******s 发帖数: 1258 | 41 这个东西可大可小
往小了说 写一堆正则表达式 自己弄一些rule 应该可以解决大部分问题
往大了说 就是NLP里面典型的Named Entity Recognition问题,主流方法用machine
learning加一些context features。不妨试试一些现成的包,比如opennlp等 |
|
t******t 发帖数: 15246 | 42 数据的可维护性很高,想想看去PARSE一个文本文件,比如CSV的话,尼玛得写多少正则
表达式才能找到数据?这玩意不是给人看的。 |
|
|
x**n 发帖数: 1055 | 44 最近正在看Jeffery的Mastering Regular Expressions一书p69,其中提到将多个连续
的空行替换成一个的例子:
$text =~s/^s*$/ /mg;
目的是把一个纯文本中的多个空行(可含space和tab)替换为一个html的段落
不过这个命令工作原理似乎不太明白,在增强多行模式/m下,总是出现两个
比如我的文件txt(行号不算):
1 a
2
3
4
5 b
6
7
8
9
10 c
用如下的perl脚本t2h.pl:
#!/usr/bin/perl
undef $/;
$text=<>;
$text=~ s/^s*$/
/mg;
print "$text";
运行结果如下:
>./t2h.pl txt
a
b
c
似乎是什么都没有的空行就不行出现了两个连续的
,如果加了个空格就可以,具体
为什么有点奇怪了
xssn@thinkm57:~/regex$ cat txt -An
1 $
2 a$
3 $
... 阅读全帖 |
|