由买买提看人间百态

topics

全部话题 - 话题: parsers
首页 上页 1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)
b*s
发帖数: 82482
1
你看看
http://www.nyconsulate.prchina.org/chn/lsyw/lszjxx/sbqz/applyxu
我用Safari和Firefox都是这个结果,坑爹啊,中文网站不如英文版的,还是官方的

没看到什么特别的啊,难道侬今天把自己的内置html parser module关掉了?
f*a
发帖数: 3132
2
来自主题: Music版 - 【翻唱】fra -- 心在跳(跟风)
原型出来了~~ 只要被翻唱三次或者以上的自动出合集。。 (目前系统收录的)
界面比较难看, 等三哥做正式界面了。
http://vatano.no-ip.org/mitmusic/collection.py
有bugs.. 得想办法处理标题不规范的。。 需要一个text parser..
k*****e
发帖数: 1235
3
我copy paste的,你要把https里面的s删掉就都能看见了。
只能怪买买提的url parser写得实在是太土,居然多个s都不认。
k*****e
发帖数: 1235
4
来自主题: PhotoForum版 - 新手拍大雾山
要把https里面那个s去掉。
mitbbs的url parser非常土,只认http,不认https。
也许是故意的,大概因为国内的防火墙没法监控https。
n*****0
发帖数: 434
5
俺比较土,而且和经理门对门坐着,不好意思太放肆。
虽然email,FB,weibo,youtube都被截了,但是也没觉得太不方便。另外我发现这里的短
信可以照发,parser bug?哈哈。感谢版主们,感谢MITBBS。
M****s
发帖数: 429
6
半年是可以增加很多debug的经验的。但关键问题是cs并不仅仅是编程。很多东西,比
方说怎么设计算法和数据结构,怎么分析,问题如果是np complete怎么办,怎么写
parser,数据库又是怎么回事,index是怎么实现的,这些都要花很多工夫去学。完全
靠自学有点难度。
不过如果你努力,两年是可以完成计算机本科的,只要学校同意你只用上计算机课程和
你没有学过的数学课程,其他课程可以转学分的话。
如果在比较好的学校有个Honors cs degree,找工作面试机会会多很多。
t*******r
发帖数: 22634
7
我说了上面写的是伪装 “伪 yacc”,也就是伪码,只是表达想法,不是真正
能执行的。
当然,正因为是表达一个想法,所以没有固定的标准,也可能误解。
我现在有点忙,晚上我有时间可以给写个 Yacc + C++ STL 的真代码。(当然
我没时间去编译 test)。这样就不会有误解。
但是 yacc 不能用你所说的方式解释。因为 yacc 是 LALR parser,parse 的
是 LR 文法描述,其过程是 shift / reduce。没有变量赋值的概念。你必须
能理解 LR 文法描述。
k******a
发帖数: 2436
8
I thought YACC can only build LR parsers but I could be wrong
t*******r
发帖数: 22634
9
yacc 只能搞 LR parser,你没错。我这个问题用 yacc 搞成,不等于
其他的问题都用 yacc 搞。。。就好比会写中文不等于只会写中文。。。
当然,我灌水时通常天马行空乱用术语,我主要是说个意思。当然,这个
也不好,我刚才飞速去 wiki 了一下,其实我说的意思应该是 formal
system(当年的课是不是叫《形式逻辑和自动机》?)。
http://en.wikipedia.org/wiki/Formal_system
l*****8
发帖数: 16949
10
真能扯啊。这些和LR Grammar有什么关系?LR Grammar能表达的languages本身只是CFL
的一个子集。在整个计算机语言编译的几个阶段中,LR parser只是语法分析的阶段。
这些东东虽然属于逻辑的范畴(formal language),但和首贴的逻辑推理差太远了。
c******n
发帖数: 16666
11
老邢这套破parser啥时候才能更新下
l*******s
发帖数: 1258
12
首先 别当包子了 老板这样对你 基本就是歧视了 你约忍耐 他越来劲;收集证据,上
报学校。
另一方面,积极找工作,你这个方向,machine learning,工业界很好找,只要你不是
要求太高,非得去顶级公司的顶级研发lab不可。
还有,不明白为啥老来宠物版晃,猫猫狗狗对你找工作有用吗?有钱有闲才养宠物,你
觉得你老来这里合适不?
ps:如果你对码工感兴趣,俺组招NLP developer,entry level和senior都要。
语言不限。
纽约midtown office,finance data领域。
要求:大体上跟其他developer要求差不多,比如算法数据结构啊,cs相关专业硕士以
上啊之类的,在此不赘述。
特殊要求:了解并且能手工实现NLP和machine learning常用算法和模型,比如
tokenizer,parser,named entity recognizer,Naive Bayes,KNN,Decision
Tree,SVM,HMM等。有意者请站内我。谢谢!
m******0
发帖数: 1306
13
来自主题: Fujian版 - Need C#.NET developer
今天跟老板谈了一下.我需要招一个初级的程序员和我一起写CODE.
地点是VA的Sterling 20164.
Meanwhile, here's a list of the skills you'll need
- XML, associated technologies, including XSLT, XPath, and DOM programming
using both MSXML and .NET System.Xml parsers.
- AJAX / DHTML programming
- Deep HTML and CSS skills
- Microsoft .NET using C#. (VS2008)
- Basic web server configuration (IIS)
- Adobe PDF Creation
- Excel XML formats (for excel reporting, if required)
- SQL 2005
如果不是很懂,但至少要懂一些,学的要快,上手要快.
有MAIL系统开发背景的更好.没有也可.
有兴趣的朋友(或者有
d****p
发帖数: 685
14
前面看到aaaty贴出的苹果3D interface的专利。事实上微软也有类似的专利。
http://appft1.uspto.gov/netacgi/nph-Parser?
Sect1=PTO1&Sect2=HITOFF&d=PG01&p=1&u=%2Fnetahtml%2FPTO%2Fsrchnum.html&r=1&f=
G&l=50&
s1=%2220080013860%22.PGNR.&OS=DN/20080013860&RS=DN/20080013860
目前3D图形显示标准/工具/类库主要两种:OpenGL和Direct3D。前者最早由SGI提出
,现由非营利技术委员为
Khronos Group, Inc.管理;后者是微软的私有图形显示标准/工具。
微软的Direct3D目前主要用在XBox和Windows gaming PC上。基本上微软提出标准,由
硬件商支持(Nividia, ATI
etc)。在windows平台上,Direct3D和操作系统整合比较好,运行效率也高。据说
Direct3D(DirectX)将正式成为
windows 7的一部分。微软试图采取策略
k*********a
发帖数: 766
15
来自主题: Apple版 - MITBBS iphone app 更新
同意,显然不是网速的问题,因为同一个网页在Safari下打开很快。应该是parser的瓶
颈,希望作者能够看到啊。
z***e
发帖数: 5393
16
html5 硬加速????
这什么东西,还有基于硬件的html parser?
充其量就是某个特定的视频支持而已。

Live
i*****o
发帖数: 1714
17
来自主题: Apple版 - chineseweb parser code 来了。
用svn可以一步拿下所有的文件:
svn co http://173.255.254.163/repos/repos/chineseweb/
从网络上看看:
http://173.255.254.163/repos/repos/chineseweb/
我写了个简单的readme文件,大家照着做看看能不能成功, 不行的花再找我。这个需
要一个64 bit linux。如果没有linux最简单的办法就是下载个vmware player,找找看
有没有pre-built centos 64 bit,这个是我用的。还有这个项目刚开始是在MacOS 上
做的,试了一下,现在不行了,因为linux的thread和MacOS不太一样。不过在家用不需
要多thread,所以把thread去掉后应该还可以运行。
还有谁知道怎么用github或者sourceforge请把它搬过去,我试了一会儿,太烦琐,还
不如我自己搞个服务器简单。
Happy coding!
a***y
发帖数: 19743
18
☆─────────────────────────────────────☆
BJD (巴吉度) 于 (Sat May 22 14:48:28 2010, 美东) 提到:
发信人: BJD (巴吉度), 信区: Hardware
标 题: 关于HTML5, 这段话说的有道理么?
发信站: BBS 未名空间站 (Sat May 22 13:29:36 2010, 美东)
zz来的
你对互联网技术发展毫无了解,就不要大放厥词了吧
我来告诉你为什么微软和apple和google现在一起要推html5
首先你要注意到一个现象,这三家公司都在买光纤,用上billion的美刀
买铺在地下的光纤。其次你要注意到,这三个公司,google稍弱,
都是云计算的超级拥护者。再其次,这三个公司都是互联网前5的流量
制造者,而前十加起来制造了30%的互联网流量。
当你起码注意到以上这些科普级别的事实的时候,就能理解为什么
html5热起来了。用哪个标准不重要,最关键的是三个东西
平台,技术和应用。当这三样被控制住,流量就被固化了,而流量
是$$的来源。
所谓"云计算",目的就是让客户被关在几家大... 阅读全帖
i*****o
发帖数: 1714
19
来自主题: Apple版 - ChineseWeb
先使用proxy吧, local的parser翻页快了有bug。
c********t
发帖数: 5706
20
来自主题: Apple版 - chineseweb 又回来了
首页十大好像上不了了啊。parser error
c**t
发帖数: 2744
21
http://patft.uspto.gov/netacgi/nph-Parser?Sect1=PTO1&Sect2=HITOFF&d=PALL&p=1&u=/netahtml/srchnum.htm&r=1&f=G&l=50&s1=6,714,926.WKU.&OS=PN/6,714,926&RS=PN/6,714,926
Use of browser cookies to store structured data
Abstract
A web site system implements a process for storing selected data structures within browser cookies. The data structures may contain a variety of different types of data elements, including N-bit integers and other non-character elements. A version
tracking scheme provides forwar
l****g
发帖数: 1922
22
python 的urllib可以用来抓网页
然后用html parser,以及正则表达式提取信息
如果不怕麻烦的话,就去python的官方网站,看sgmlparser的说明
要是图方便的话,可以试试 Beautiful Soup, 这是用python弄好的一个html/xml语义
分析器
m******y
发帖数: 25
23
If it is IEEE Tran style,
% biography section
%
% If you had an eps/pdf photo file (graphicx package needed)
% the extra braces prevent the LaTeX parser from getting confused
% when it sees the complicated \includegraphics command within an
% optional argument. You can create your own macro to make things
% simpler here.
%\begin{biography}[{\includegraphics[width=1in,height=1.25in,clip,
keepaspectratio]{mshell.eps}}]{Michael Shell}
% or if you just want to reserve a space for a photo:
p*******d
发帖数: 359
24
没那么严重把,都publish了还怕人看。写一个parser读前一叶的link,大不了让
thread等2分钟在下下一篇。
s****t
发帖数: 698
25
来自主题: CS版 - 有没有做编译的大牛

之前看过一个叫altr?的似乎是比较新的parser,
你可以找找看。
//btw:我不是大牛,只是似乎原来看过,顺便想起来了,希望能帮上你。
h******u
发帖数: 155
26
来自主题: CS版 - 有没有做编译的大牛
parse formated text文本为啥要用这些复杂的 parser generator呀?你说的功能
perl 下面几行就可以搞定了
@lines = `cat filename`;
$numLines = scalar(@lines);
for($p =0; $p < $numLines; $p++){
$line = $fileLines[$i];
if($line =~ /\(w+\)\:\(w+\)/){
$key = $1;
$value = $2;
}
}
$1, $2就是你要的东西 “姓名“ 和 “xxx“
h******u
发帖数: 155
27
来自主题: CS版 - 有没有做编译的大牛
现有的parse generator通常用来检查 context-free-language的recognition 问题。
这些language一般都有matched open parentheses的属性,例如你有左括号,需要右括
号。检查 CFL-recognition不是trivial的问题,所以需要这样的parser生成器。 或者
可以做些 attribute grammar的属性检查 (某个production被evaluate的时候有些什
么action需要产生)。 一般的formated text parsing 不要往这个上面去想。perl就
是用来干这种事情的。
s*****y
发帖数: 3
28
我用libxml2 parser.h 中的 xmlReadFile 打开一个xml file
xmlReadFile 的 parameter -> const char *URL 不支持 wchar,所以当xml file的
path 是 Unicode时, 需要用WideCharToMultiByte转化。 但是如果Unicode的path有
非英文字符时,这也方法就行不通了。
有没有什么方法可用libxml2 的api,open unicode path的 xml file呢?
谢谢!
T*****9
发帖数: 2484
29
你用opennlp,uima,gate还是stanford那个parser?
T*****9
发帖数: 2484
30
你用opennlp,uima,gate还是stanford那个parser?
b***i
发帖数: 3043
31
来自主题: CS版 - 解释程序怎么写?
大体思路如何?比如,就是C语言的解释程序,需要可以定义变量,表达式求值,循环
,函数调用等。
有对antlr熟的吗?parser, grammer tree, antlr可以把解释程序进行到哪一步?
我估计最后就是antlr自动写出解释程序,我来稍微改动一下?
n*****m
发帖数: 73
32
The reviewer is right.

tags
s*x
发帖数: 3328
33
你说得不明白吧,你说assign a tag容易让人以为是词法分析,实际上语法分析消除歧
义之后就是一个树的结构了,之后的动作都是对树的机构作的。当然如果你用不到这个
结构只是assign a tag,我猜你只是要做些统计的话,那只是一个特殊情况而已。

tags
s*****g
发帖数: 5159
34
jabref, a java based bib file parser and editor.

致的
D*****r
发帖数: 6791
35
你得先把分类弄清楚,编译原理是理论课,操作系统其实是系统课,软件工程是编程/
开发课。每门的学法不一样。
编译的正则语言、上下文无关语言等等就是数学(别让数学系的人听见),跟离散数学
、计算理论里的东西一脉相承,你就当数学来学,看书、做题,没问题。
编译器设计上前端的scanner,parser利用这些理论知识,已经有现成的lex,yacc工具
了,都是成型的东西,主要是后端代码生成还需要优化啥的。我也不懂就随便一说……
编译原理和操作系统、软件工程都是核心好课,不亚于数据结构和算法,甚至更重要。
好好看书(权威、经典的),多看UCB,mit open courseware,stanford等学校的课程
录像\大纲作业,最好能自己搞点pet project玩起来。
你现在思路得转一下,理论课靠看书做题,系统和编程开发课都得靠实践(所谓做题没
用)你在linux下面练习一下系统编程,去linux kernel的开发现场(在git上)参观一
下,到软件公司实习一下,就更能体会这些课程的性质了。
g****v
发帖数: 971
36
最近需要分析优化c或是c++写的文件,准备用lex&yacc来做这个事,但是发现没有现成
的bnf文
件。请问大家谁知道哪里可以找到bnf for c or c++?
或是说有没有轻量级的parser for c or c++?
谢谢了,
5个包子
j**a
发帖数: 24
37
【 以下文字转载自 JobHunting 讨论区 】
发信人: jada (I+can), 信区: JobHunting
标 题: [Job Opening] Mainframe Operating System Developer (IBM CSTL Beijing)
发信站: BBS 未名空间站 (Fri Jul 1 09:38:58 2011, 美东)
我们希望您有扎实的计算机基础,踏实肯干,有上进心,有较强的学习能力,良好的沟
通能力,有意愿长期从事主机操作系统或者主机应用程序的研发工作。
有意者请将您的简历发到c***[email protected],并注明应聘主机操作系统开发职位。如有
疑问,欢迎来信询问。多谢。
Job Description:
System z Software Development organization (in CSTL) is seeking software
engineers taking the responsibilities for design, development and test of
zOS and other System ... 阅读全帖
b******p
发帖数: 49
38
如题所示,C++ Grandmaster
网址在这里: cppgm.org
我不是CS专业出身,没写过编译器,对编译器的了解仅限于完成了coursera上面的
CS143。
只是大概知晓了概念,对于更深的内容比如静态/动态分析/优化就不了解了。
这个C++ Grandmaster看起来并不是研究型的,而是比较工程化的一个项目,要从头写
lexer/parser/codegen,而不需优化。
网上有各种议论,有说能做出来的,有说这是个big joke的。但无论别人怎么说,楼主
已经开始蚂蚁撼大树,做了PA1。按官方网上的说法,PA1只占总共的5%左右。
我也不知道能不能做出来,应该是很可能没时间所以做不出来。但是直到做不下去那一
天我都会抽空弄这个。
我想问问有没有人对这个东西感兴趣或是也在弄的,因为我自己写code写得比较烂,碰
到一些难以谷歌搜索的问题如果能讨论将感到不胜幸运。
x*****n
发帖数: 98
39
来自主题: Database版 - a question for JDBC
problem: When I update some rows, how can I get the rows that have just been
updated, genericly?
Solution: 1.I've meant to use the JDBC 2.0's new feasures: updatable Resultset.
Unfortunatly the underlying JDBC DB2 driver didn't support it. Then I have to
write a parser to analyze the value expression. That's use select to get the
rows that will be updated. Then compute the new values according the expression
and update the corresponding columns.
The original purpose of it is: build a layer above
w***y
发帖数: 6251
40
我在psql 下试一些SQL命令,为什么 DROP TABLE test CASCADE RESTRICT; 会有错呢?
ERROR: parser: parse error at or near "CASCADE"
我是看了manual说用CASCADE RESTRICT这种关键字的,为啥会有parse error?
多谢!
w*********e
发帖数: 5286
41
the kernal Oracle RDBMS are all in C, from parser to execution layer.
i****a
发帖数: 36252
42
来自主题: Database版 - I HATE Micro$oft
confirmed it's an issue of M$, I am not smoking funny pipes...
https://connect.microsoft.com/SQLServer/feedback/details/312164/flat-file-
parser-cannot-import-files-with-embedded-text-qualifiers#details
e*i
发帖数: 1819
43
我有几千个email 要从notes 倒出来,本想写个parser 但有些懒,IBM 的东西大操蛋
了,每天要在lotus notes 和outlook 之间折腾
s*i
发帖数: 5025
44
来自主题: DotNet版 - C# HTTP request header parser?
An HTTP request header is pretty much like this, (but encoded):
========================================================
POST / HTTP/1.1
Accept: image/gif, image/x-xbitmap, image/jpeg, image/pjpeg,
application/vnd.ms-
excel, application/vnd.ms-powerpoint, application/msword,
application/x-shockwav
e-flash, */*
Referer: http://localhost
Accept-Language: en-us
Content-Type: application/x-www-form-urlencoded
Accept-Encoding: gzip, deflate
User-Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.
D*******r
发帖数: 37
45
来自主题: DotNet版 - C++ file I/O question (转载)
【 以下文字转载自 Programming 讨论区 】
发信人: DVDplayer (专放DVD VCD), 信区: Programming
标 题: C++ file I/O question
发信站: BBS 未名空间站 (Wed Sep 21 22:24:14 2005)
在c++,存文件的时候,怎样能规定是用什么encoding type?
我输出的文件是xml,我需要是utf-8,但是输出的结果是Ansi。
我再把此文件输入给xml parser (expat)就会有异常,因为规定的是utf-8。
等大虾们指点,谢谢!
z***e
发帖数: 5393
46
固化一部分(比如tcp/ip offload已经有很多网卡支持了,高级的把ssl类似的也有固
化的),实在固化不了的就软件。如果硬件能把html parser固化,就已经提高很多了-
p**o
发帖数: 3409
47
来自主题: Hardware版 - 求助,关于播放mkv
Haali只是用来把mkv这个container里的音频、视频和字幕分离开来的container
parser
你还需要ffdshow/libavcodec这些decoder来给视频解码
T****o
发帖数: 285
48
刷ddwrt,,带tcpdump的,然后用tcpdump的parser, 看下user agent.

★ 发自iPhone App: ChineseWeb 7.7
首页 上页 1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)