由买买提看人间百态

topics

全部话题 - 话题: 正则表达式
首页 上页 1 2 3 4 5 6 下页 末页 (共6页)
r*******n
发帖数: 3020
1
我用过Python抓过google排名前50的连接,每一个小时抓一次,
比较结果有什么变化。
用到urllib, 正则表达式
n********s
发帖数: 144
2

提取两标点符号之间的两个汉语词,如“你 好”,或者如。有 什么,

结果老错,应该是汉字正则表达式有问题,麻烦帮忙看一下:


%{
#include
#include
#include
#include
#include
%}

%%
[\u3001-\u303F]+[\u3000]*[\u2E80-\u2EFF\u2F00-\u2FDF\u31C0-\u31EF\u3200-\
u32FF\u3300-\u33FF\u3400-\u4DBF\u4DC0-\u4DFF\u4E00-\u9FBF\uF900-\uFAFF\uFE30
-\uFE4F\uFF00-\uFFEF]+[\u3000]+[\u2E80-\u2EFF\u2F00-\u2FDF\u31C0-\u31EF\
u3200-\u32FF\u3300-\u33FF\u3400-\u4DBF\u4DC0-\u4DFF\u4E00-\u9FBF\uF900-\
uFAFF\uFE30-\uFE4F\uFF00-\u... 阅读全帖
n********s
发帖数: 144
3
这是写的正则表达式,用lex做编译,可以生成c语言的源码,再进一步用c编译器编译
,可以生成机器代码。
r*****3
发帖数: 143
4
中文名: Perl高效编程 (第2版) 中文版
原名: Effective Perl Programming Ways to Write Better, More Idiomatic Perl,
2nd Edition
作者: (美) 霍尔
(美) 麦克亚当斯
(美) 福瓦
译者: 盛春 等
图书分类: 软件
资源格式: PDF
版本: 扫描版
出版社: 人民邮电出版社
书号: 9787115250469
发行时间: 2011年
地区: 大陆
语言: 简体中文
简介:
内容简介
本书是Perl 编程领域的“圣经级”著作。它提供了一百多个详实的应用案例,足
以涵盖编程过程中经常遇到的方方面面,由此详细阐释出各种高效且简洁的写法。本书
第1 版曾畅销十年之久,而在第2 版中不仅修正了前版存在的一些问题,更与时俱进地
引入了许多Perl 领域的新主题,使内容更加完善丰富,也更具实用性。
本书为初级Perl 程序员铺就了一条通往高阶之路,而对高级Perl 程序员来说,本
书也是必备的技术参考。
目录:
第1章 Perl基础
第2章 Perl的地道用法
第3章 正则表达式
第4章 子程序
第5章... 阅读全帖
o*******m
发帖数: 154
5
申请CS Master当然是must,但是自己的学习也不能放松,老马讲的挺好的。
原创 - 尚学堂科技 - 马士兵老师]
JAVA自学之路 一:学会选择
[转载请注明出处:http://www.bjsxt.com/zixue/zixuezhilu_1.html]
为了就业,不少同学参加各种各样的培训。
决心做软件的,大多数人选的是java,或是.net,也有一些选择了手机、嵌入式、游戏
、3G、测试等。
那么究竟应该选择什么方向呢?
我的意见是,不要太过相信各种培训机构或是抢手文章的说法(包括我),当你要走向
社会的时候,就不要再把自己当成学生,不要把自己的将来交给别人,学会运用自己的
眼睛去观察,去了解这个世界吧。
每个培训机构都会宣传自己的好处,并不能说明大的趋势。
一些新闻文章很有可能是枪手写的,不必太过相信。
国外背景的教师和课程,未必适合你。
那么怎么才能确定自己将来的方向?如何才能从纷繁复杂、或真或假的数据世界中挖出
一条路?
我讲一个通过招聘网站的观察方法。
可以到各种招聘的网站上查询信息(可以到google上查询招聘的网站),例如:
http://www.51job.c... 阅读全帖
a9
发帖数: 21638
6
正则表达式?

意。
a9
发帖数: 21638
7
来自主题: DotNet版 - 请教一个HTMLelement问题
用browser控件?
直接用httpwebrequest多好啊?
然后用正则表达式分析。
w***s
发帖数: 321
8
来自主题: EmergingNetworking版 - 一个傻问题
awk:
$ more awkcmd
/interface.*$/ { print
print "new command"
}
{ print }
$ awk -f awkcmd interface.cfg
如果你打算用完整的配置,记得修改正则表达式,否则会匹配到passive-interface或
者其他什么上;-D
e***y
发帖数: 4472
9
编个小程序... 或者如果你用total commander, 它支持正则表达式选取文件
y****w
发帖数: 3747
10
来自主题: Java版 - 有没有检查IP范围的算法?
还是像楼上说的,regex。
你允许的用户输入越复杂,你就需要越复杂的regular expression。搞明白你的规则先才是最重要的。正则表达式自己写不好的话,google一下,应该还是有不少的。
t***a
发帖数: 416
11
replaceAll("\\n", "")
因为replaceAll是正则表达式,所以两次转义

""
s****y
发帖数: 503
12
来自主题: Java版 - 问个简单的Java技术问题
正则表达式判断
String a = "123";
boolean isNum = a.matches("[0-9]+");
j****y
发帖数: 178
13
来自主题: Linux版 - 问题:关于python和web
做网站需要很多字符处理么?能不能举个例子。
php也有正则表达式的东西可以用,非要用python或perl是什么情况?
c**y
发帖数: 2282
14
不够智能啊,例如我想通过正则表达式过滤url什么的
v********0
发帖数: 22
15
来自主题: Linux版 - 求助: 批量转换图片格式
多谢多谢!!
看来我还是要加强正则表达式的学习阿!!!
E*V
发帖数: 17544
16
来自主题: Linux版 - 请推荐一本入门书吧
你现学习一下
echo
cat
ls
ps
man
什么是|
more | less | most (这里|是或者的意思)
tail | head
wc
bc
for
if else
test
&&
$() ${}
...
等有空了
研究一下正则表达式
sed| awk
wget
...
cl
发帖数: 165
17
来自主题: Linux版 - script question
google 正则表达式
l******n
发帖数: 1683
18
正则表达式呀. 比如在vi里面用这样的替换命令:
s/[0-9]\+/001/g

001
位置
R******d
发帖数: 1436
19
来自主题: Linux版 - 请问一个awk的问题
awk的正则表达式是不是不怎么好用?相比sed的话
x****s
发帖数: 921
N**********d
发帖数: 9292
21
好像不行啊
sed -n -e 's:.*pattern1="\(/pattern2/[^"]*\)":\1:p' "$file" > "link"
还是不对劲啊,因为括号里面有/,所以我用:分割,我想抓"$file"里面的所有这种在双
引号里面的/pattern2/[^"]*的样子
求教怎么写呢?
e********r
发帖数: 2352
22
文件包含很多类似的文件名,但是最有都以'*'结尾,想要把'*'去掉
例如:
model10*
model100*
...
需要重命名为:
model10
model100
...
for i in `ls`; do mv -f $i `echo $i | sed 's/.$/_/'`; done
只能把文件名改为:
model1_*
model10_*
对'*'无能为力
请教如何重命名,'*'总是默认为正则表达式的一部分.
a9
发帖数: 21638
23
你直接从网上找个正则表达式吧。
美国区号和电话都没有1开头的,你举的这个例子就不符合。
l*****s
发帖数: 2109
24
一般都是正则表达式了。
但是,原来看过一个说法,理论上,不可能有正确的解法。
我非CS,不懂。
I*****y
发帖数: 602
25
正则表达式?
\d+
i****n
发帖数: 627
26
都对,问题四可以 cat file | sed -n '10p'
用正则表达式更省事儿
b***y
发帖数: 2799
27
来自主题: Programming版 - [合集] 请问一下题目的解决答案
☆─────────────────────────────────────☆
wmbyhh (wmbyhh) 于 (Thu Jul 24 01:46:58 2008) 提到:
1. google maps有个通过鼠标drag/drop来改变路线的功能,怎么实现的?server side
?client side?
A:client side先获取具体用户定义的路线,在server side中路线数据库查找各路线的
信息
2. GPS 怎么工作的?GPS的精度有限,怎么识别两个相距很近的路?
A:卫星信号?角度识别相近路?
3. GPS地图里一条路是怎么表示的?包含哪些信息?
A:用向量表示?包含路起点、终点、长度?
4. trillion个整数,10台电脑,怎么排序?
A:分10分,每分单独heap排序,之后归并??
7. 设计一个数据校验模块,用来校验数据库中的数据是否符合客观逻辑。比如没有人
的名字叫123之类。
A:用函数校验?
8. 正则表达式的应用。
A:查找??
12. 给一个序列{11,21,1211,111221},找出规律,给出第5、6项是什么。
A:不知
r*******n
发帖数: 3020
28
来自主题: Programming版 - python 正则表达式请教
because .* is greedy,
so try .*?
The following from Document of Python.
*?, +?, ??
The '*', '+', and '?' qualifiers are all greedy; they match as much text
as possible. Sometimes this behaviour isn’t desired; if the RE <.*> is
matched against '

title

', it will match the entire string, and not
just '

'. Adding '?' after the qualifier makes it perform the match in
non-greedy or minimal fashion; as few characters as possible will be matched
. Using .*? in the previous expression will

C*********m
发帖数: 213
29
来自主题: Programming版 - python 正则表达式请教
多谢. 可以了.

text
matched
X****r
发帖数: 3557
30
What do you want? 替换时支持正则表达式? This doesn't make sense.
You want to use captured parts, e.g.
M-x replace-regexp a\([0-9]+\) b\1
replaces all a1, a2, ...., a101, a102, ... to
b1, b2, ..., b101, b102, ...

..
N**********d
发帖数: 9292
31
例如:其中引号内长度不定
"abc", "def"
".*"
引号里面内容越少越好,我不想是 abc", "def
想要分别是
abc和def
这个该怎么写呢?
t****t
发帖数: 6806
32
sed can not.
N**********d
发帖数: 9292
33
那有什么别的解决方法呢?
s*******a
发帖数: 921
34
try:
"[^"]*"
a***y
发帖数: 2803
35
来自主题: Programming版 - perl 的问题
unix,linux里面的正则表达式,perl和它们很象.
w********o
发帖数: 10088
36
来自主题: Programming版 - 请问一个正则表达式的问题
\d+(\.\d+)?
搞定,呵呵
t**********s
发帖数: 930
37
来自主题: Programming版 - Java Regular expression 请教
000-00402-59837-006的正则表达式写成这样对不对?
[0-9]+-[0-9]+-[0-9]+-[0-9]+-
谢谢
x****u
发帖数: 44466
38
来自主题: Programming版 - 如何自学python
正则表达式现在基本哪个脚本都支持。
x****u
发帖数: 44466
39
来自主题: Programming版 - 如何自学python
正则表达式现在基本哪个脚本都支持。
p*********t
发帖数: 2690
40
来自主题: Programming版 - 新手请教一个javascript JQuery问题
用value也可以得到某个field的值的。javascript是比较乱,而且不好debug.不過挺喜
欢它的正则表达式,非常的高深。
l*******s
发帖数: 1258
41
来自主题: Programming版 - parsing bibliography and sorting (转载)
这个东西可大可小
往小了说 写一堆正则表达式 自己弄一些rule 应该可以解决大部分问题
往大了说 就是NLP里面典型的Named Entity Recognition问题,主流方法用machine
learning加一些context features。不妨试试一些现成的包,比如opennlp等
t******t
发帖数: 15246
42
来自主题: Programming版 - json是一种革命性的创造
数据的可维护性很高,想想看去PARSE一个文本文件,比如CSV的话,尼玛得写多少正则
表达式才能找到数据?这玩意不是给人看的。
a9
发帖数: 21638
43
这太简单了吧。用正则表达式啊。
x**n
发帖数: 1055
44
最近正在看Jeffery的Mastering Regular Expressions一书p69,其中提到将多个连续
的空行替换成一个

的例子:
$text =~s/^s*$/

/mg;
目的是把一个纯文本中的多个空行(可含space和tab)替换为一个html的段落


不过这个命令工作原理似乎不太明白,在增强多行模式/m下,总是出现两个


比如我的文件txt(行号不算):
1 a
2
3
4
5 b
6
7
8
9
10 c
用如下的perl脚本t2h.pl:
#!/usr/bin/perl
undef $/;
$text=<>;
$text=~ s/^s*$/

/mg;
print "$text";
运行结果如下:
>./t2h.pl txt
a


b


c
似乎是什么都没有的空行就不行出现了两个连续的

,如果加了个空格就可以,具体
为什么有点奇怪了
xssn@thinkm57:~/regex$ cat txt -An
1 $
2 a$
3 $
... 阅读全帖

首页 上页 1 2 3 4 5 6 下页 末页 (共6页)