由买买提看人间百态

topics

全部话题 - 话题: parsing
首页 上页 1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)
g*****g
发帖数: 34805
1
来自主题: Programming版 - 如何快速处理大量网上xml文件?
真要追求效率。经典的处理就是下载异步,parsing同步,各起一个线程池就对了。在
parsing上Java支持多线程要比Python, Node方便多了。还是那句话,轮子是第一生产
力,我老花一分钟C&P的代码,支持NIO, connection pool, keep alive,比你们拿啥
语言
100行写的都强多了。
N********n
发帖数: 8363
2
来自主题: Programming版 - 如何快速处理大量网上xml文件?

下载和PARSE都在一个THREAD里面。可以一次开20个THREAD并行,把所有XML URL放
在一个POOL里面。每次每个THREAD去POOL里抓200个URL来处理,处理完再去抓200
直到全做完。这样一个THREAD在ASYNC等待时其他拿到XML的THREAD可以PARSE。基
本上就是模拟SERVER端用ASYNC提高MULTI-REQUEST执行效率。
z****e
发帖数: 54598
3
来自主题: Programming版 - 如何快速处理大量网上xml文件?

lol
你那边两个垃圾循环,还simplicity,你丫的多加几个parse进去
别人看了恨不得操你妈五十六次,你还真觉得自己牛逼了?
就这么简单的逻辑,你丫塞进去两个循环,简单在哪?
不用parse了是吧?
d****n
发帖数: 1637
4
来自主题: Programming版 - 如何快速处理大量网上xml文件?
不,我觉得你是煞笔
parse你麻痹啊,下载下来再搞第2步,想怎么搞就怎么搞,老几吧parse你个几吧,都
不知到人家要咋用就开始吹,真是大煞笔
c*********e
发帖数: 16335
5
关键是,restful产生的是json,非常容易在javascript 里parse. soap产生的是xml,
parse起来非常耗时。
如果你是个手機用户,和爱人聊天,你是喜欢爱人快点回复你,还是慢点回复你?
z****e
发帖数: 54598
6
来自主题: Programming版 - 各路大神推荐个linux上的组合吧
另外说点协议,扯点app
app所用的协议,不应该用http
http是给website用的
传输面说,你每次握手三次,脱裤子放屁
封装面说,非要搞成json,很烦诶,直接byte stream
很搞笑的是,有些人用了半死async和ap系统
就是为了节省反应时间,那既然如此
你为啥非要弄http呢?
我搞个pvp的游戏,33ms需要完成发送,传输,parse后展示这么一系列动作
主要消耗都在io上了,剩下根本没有时间来握手+parse
所以我就是udp+byte stream裸写
gc相比之下不是问题,一次gc不过11-15ms,小意思了
只要没事别狂造objects就行,就是因为需要复用objects
所以不用fp,因为fp的immutable贼浪费
异步,ap系统,udp,byte stream,最后控制gc次数
基本上就用这些方式把速度逼到极致,勉强控制在20ms以内完成
网速慢的话,就只能跳帧了
y*******d
发帖数: 1674
7
来自主题: Programming版 - 问java api的问题
面试让写一个API,后面有附加问题:
Consider how the API could support 3rd party applications which need to
perform some logic based on the structure and content of a filter in a type-
safe manner.
不知道应该从什么方面考虑这个问题。以前没有这方面的经验。谢谢啦
还有一个也是这个APi一部分:
Input is a combination of arbitrary complex filters. 比如:
name = "smith" AND age > 9 OR Not(city = "New York")
It asks for a string representation, including the ability to generate and
parse filters from the string representation. (you are not required to
implement the s... 阅读全帖
T********i
发帖数: 2416
8
相信不相信强AI,其实是信仰问题。
但是,现在,迄今技术发展到何种程度,根本无关信仰,而是对基本客观事实的认识问
题。
上面的那个例子,是我一个做NLP一辈子的老友,成天在群里parse各种抬杠句子。这位
老友是业界大牛。但是很多时候还是parse错需要手工调。
英文相对一些。中文现在的处理水平也就这样了。这已经代表了当今的技术水平。那些
号称80年代技术的,根本就是穿越糊涂了。
搞NLP的,思维都和别人不一样。比如你说主要看气质,他会说“主够忙的”。诸如此
类,每天都能抬杠。

AI
y********l
发帖数: 3970
9
来自主题: Programming版 - 如果让VBA里的IE automation更Robust?
下面的链接里说除了regex,也可以考虑用HtmlDocument来parse网页上的数据。这个
HtmlDocument好用不?
http://www.codeproject.com/Articles/1040510/Grab-and-Parse-HTML
i****t
发帖数: 61
10
来自主题: Programming版 - 问几个javascript面试题
function PatientSorter () {
var stringComparer = function (a, b) {
return a.toLowerCase() < b.toLowerCase() ? -1 : 1;
};
var dateComparer = function (a, b) {
return Date.parse(a) < Date.parse(b) ? -1 : 1;
};
var numberComparer = function (a, b) {
return a - b;
};
var comparers = {
firstName: stringComparer,
lastName: stringComparer,
emailAddress: stringComparer,
birthDate: dateComparer,
latestBloodPressur... 阅读全帖
l****n
发帖数: 156
11
没打算用软件去读税法(这个远超出我能编程的范畴)。解读自然语言这一步,目前还
是人来做比较靠谱。
我来读税法,根据我对税法的理解,去更新这个symbolic table。
symbolic table里不含任何程序逻辑,只是一套纯粹的自定义标记方法;这些标记经过
semantics parsing后,产生运算逻辑(税表里的加减乘除)。
我的问题是,用什么语言做semantics parsing?
我的初步想法是lisp或者perl/c,想在这个论坛听到有价值的想法。
不是说c#/java不可以,但肯定不是一个好选择。
d*******r
发帖数: 3299
12
来自主题: Programming版 - front end developer怎么就这么难招
你现在维护parse啊, parse现在用户还多么
r********e
发帖数: 39
13
从github主页上看到的,4月五号开始。
“As of April 5, 2017, Parse, LLC has transferred this code to the parse-
community organization, and will no longer be contributing to or
distributing this code.”
看了一下主要的contributor,就一个加拿大哥们比较活跃。Facebook maintain一年,
正式放手了。现在正在用ParseServer, 心里还是有点惶惶,不知道open source
community 能不能 take over, 前途如何。
r****t
发帖数: 10904
14
来自主题: TeX版 - 再表扬一下 Emacs + AucTex
喔,我是照着网上抄了三行在 .emacs 里面
# Why doesn't the completion, style file, or multi-file stuff work?
It must be enabled first, insert this in your init file:

(setq-default TeX-master nil)
(setq TeX-parse-self t)
(setq TeX-auto-save t)
Read also the chapters about parsing and multifile documents in the manual.
然后 RefTex 又额外抄了两行才让 RefTeX work, 这些人应该默认把配置搞好才对,而
不是要求用户去抄。
o*******e
发帖数: 31
15
来自主题: Unix版 - awk question
I want to use awk to realize following goal:
when the line matches some Regular Expression, parsing
the line and output.
if the line doesn't match, don't make parsing and output
the original line.
I try to use if block like this:
if ( $0 ~ /expression/ )
{ printf "total energy =" ,$NF}
else
{printf $0}
But it doesn't work.
/expression/ {print "total energy =", $NF}
can find the desired line and output as I wish, but
I lose the control of other lines.
I don't know what's wrong with my cod
j***n
发帖数: 9
16
来自主题: Unix版 - Shell Question
Hi, Every High Hand,
One question
In my shell script, I need to pass a absolute file name to
it:
e.g.
>main.sh /home/username/config.cfg
I need to run this script with different cfg files, and make
some temp directories, according to the filename.
How can I parse the absolute file location to the filename
without extenstion?
e.g.
How to parse '/home/username/config.cfg' -> 'config'?
Thanks in advance.
f*g
发帖数: 47
17
【 以下文字转载自 Linux 讨论区 】
【 原文由 fpg 所发表 】
want to parse some text files for my data structure, but never touch it before
besides using c language(sscanf...) , i heard yak is good at parsing files.
any better way to learn it? I only got the manual from gnu which lead me to
nowhere since I never used it b4.
thanks for any comments.
w*****s
发帖数: 122
18
来自主题: XML版 - Perl XML FAQ--4
Q16: Is it possible to read in several documents from a stream?
You can read multiple documents from a stream by using the parse_start
method in place of of parse or parse_file, which creates a new instance of
XML::Parser::ExpatNB. Multiple documents are parsed by making successive
calls to the parse_more method. Calling the parse_done method signifies
that you
have are done processing the document.
Q17: How can I filter out extraneous whitespace whilst processing text?
You c
n****u
发帖数: 12
19
来自主题: XML版 - question on CGI and XML
Hi, guys,
I am using Perl/cgi to display some webpages. I used xml::dom to parse the
files first to get variables from an xml file. Then output html by using
print. Why couldn't I display the page from a browser? Error: 500 Internal
Server Error. It can output result from Unix commandline(html script). Then,I
did the following,
1. Deleted the xml parsing part from the code, with html part left, it can
display from browser fine (of cause I cahnged those variables in html into
normal text)
2. Add
f*******h
发帖数: 1269
20
来自主题: XML版 - About XML parser
You are right. The parsing is usually fast for small XML documents.
But for XML document as large as 100MB (extreme case), the parsing might take
GB memory, and couple of hours, hoho...
S**********l
发帖数: 3835
21
来自主题: Biology版 - 开始找博后,求建议 (转载)
新生能两三个月上手就不错啦。。。
是啊,都是现成的。学生开始就是call call function,parse parse文件。
s*****c
发帖数: 753
22
来自主题: Computation版 - Matlab 读取文件的问题
fprintf? 读?
Have you tried fscanf with %f? How about csvread or dlmread?
If you really was reading it in as a string (assume it is stored in A) and
then parsing the string to get the value, can't you parse A(1:end-1)?
s*****c
发帖数: 753
23
来自主题: Computation版 - Matlab 读取文件的问题
fprintf? 读?
Have you tried fscanf with %f? How about csvread or dlmread?
If you really was reading it in as a string (assume it is stored in A) and
then parsing the string to get the value, can't you parse A(1:end-1)?
t*****r
发帖数: 1765
24
我在cuny的hunter的RN-BSN,suny和cuny学费一样,
留学生是415一个学分,绿卡减半,下学期好像又要涨一点,
suny是州立系统,cuny是市立系统,
我一个同学BMCC毕业的在我们program,
他BMCC用的paper都可以拿过来接着交,
每次只要挖挖以前的paper拿来交就行了,
说明ASN和BSN很多课其实都差不多的,
就是听说suny downstate学校那边很多黑人,
你实地跑一次去看看,但是他们有自己的medical center,
我选hunter因为地铁方便,在曼哈顿,大部分都是白人和亚裔,部分黑人,
SUNY他们那个program prefer有绿卡的学生,要申请要尽量早点。
RN-BSN Nursing的课都是每学期几个paper APA format,
老师都会提前告诉你要写什么,
最多就是有个期中考,有些没有期中考,
期末一般没有考试,平时就是听老师讲课,
看看老师给的文章,做几个online的certificate考试,
最多一个paper,然后期末就是group presentation。
这种都是给边上班边工作的护士设立的,
很简... 阅读全帖
c*****a
发帖数: 1638
25
mapreduce,或者说hadoop这个东西,就是给你一个编程接口,允许你把特定的问题在
非常大的硬件平台上扩展(比如1000个CPU)。
但是调度和通讯是有成本的,所以如果你有一个问题,在一个CPU上面跑50个小时,
mapreduce在10个CPU上面可能要8个小时。另外这个有个基本的性能调度成本,所以基
本上不管你怎么增加扩展,不能低于这个最低成本(这个可能是几秒到几分钟)。所以
这个不能做high frequency
至于backtest或者optimization,只要你能把这个需求转化为mapduce问题,就可以(
不是所有的东西都能用mapduce算的)。这个取决于输入与输出的数据之间的关系。
基本上,mapreduce是很简单的,但是涉及到真正的大数据的时候,需要有些考虑,必
须有很好的程序背景,对于常见API背后的潜在性能有概念。
举个例子,我现在的一个项目,运算的程序并不长,但每次计算,每个语句最后都要运
行几百亿次,那么可能一点点很小的性能差距,最后有巨大的影响。所以所有关于
parse的语句,我都自己写(比如我不会调用Integer.parse,这个API倒不... 阅读全帖
l*******s
发帖数: 1258
26
In my opition, this is a ambiguity problem in parsing.
There are more than one parsing for each sentence you mentioned, then the
dog could be either active or passive.
If you have more context, you might be able to figure out active or passive.
However, just according to the independent sentences, it is almost
impossible.
about parser, you can try Stanford parser:
http://nlp.stanford.edu:8080/parser/
an online demo.
ps: I don't think RE can help, because this is not a string match problem
m******h
发帖数: 297
27
三种可能,1.数据库设计太烂没有相关的文件和专栏,2.数据库已存在相关文件和专栏
,3.数据库没有专栏但是可以parsing出数据。
针对以上,三种结果,
1. 加入文件和专栏要改变整个EHR的设计,不在你能控制的范围内,安了吧。
2. 睁大眼睛继续寻找。一般来说,数据库内不可能只有一个文件,商业数据库会有上
千的文件,且每一个数据文件都可能有几十甚至上百或好几百的栏。
3. 就看你怎么设parsing的条件了。
现在商业EHR系统功能都非常强悍,你说的这些数据都有,都可以做。如果你的数据库
是内部开发或那种小公司给做的,很烂的可能性太大。
如果你手上的数据库只包括一部分文件,你需要去找全有关EHR的全部文件。如果你的
EHR数据是一个data dump形成的flat file,那么你还是得去找源数据文件。
如果我这个回帖里的术语你都没看懂,请先找书学习一下数据结构,数据库设计。
如果你觉得我的回答有用,请把包子转给版主garland,算是带我对他这一年来的工作
表示感谢。

morality
s****h
发帖数: 3979
28
来自主题: DataSciences版 - spark 问题
data frame API 1.3 才有。
弄进一个dense vector很直接:
import org.apache.spark.mllib.linalg.{Vector, Vectors}
val path = "~/test60m.txt"
val minPartitions = 4

val parsed = sc.textFile(path, minPartitions)
.map(_.trim)
.filter(line => !(line.isEmpty || line.startsWith("#")))
val a = parsed.map({ line =>
val fields = line.split(" ")
(fields(0).toInt, fields(1))})
val dataLoad = a.map(x => (x._1, Vectors.dense(x._2.split(',').map(_.
toDouble))))
可是sparse vector就不会了。
不知道怎么结合下面的例子
// Create a dense vector (... 阅读全帖
k*l
发帖数: 2574
w*******y
发帖数: 60932
30
Kobo 6" eBook Reader with 100 Preloaded Classic Books @ just $59.98
LIMITED PERIOD OFFER
Link to buy:
http://www.borders.com/online/store/TitleDetail?type=0&catalogI 4,parse: 9]&searchData={productId:null,sku:null,type:0,sort:null,currPage:1,resultsPerPage:25,simpleSearch:true,navigation:0,moreValue:null,coverView:false,url:rpp=25&view=2&all_search=3175385&type=0&nav=0&simple=true,terms:{all_search=3175385}}&storeId=13551&sku=817866000101&ddkey=http:SearchResults
#91;search%3A+4%2Cparse%3A+9]&se... 阅读全帖
l*****7
发帖数: 1125
31
root@debian:~# asterisk -rvvvvvvvvvv
Asterisk 1.6.2.6, Copyright (C) 1999 - 2010 Digium, Inc. and others.
Created by Mark Spencer
Asterisk comes with ABSOLUTELY NO WARRANTY; type 'core show warranty' for
details.
This is free software, with components licensed under the GNU General Public
License version 2 and other licenses; you are welcome to redistribute it
under
certain conditions. Type 'core show license' for details.
===================================================... 阅读全帖
m******m
发帖数: 445
32
按照教程一步步走到最后,发现不能打出,下面是错误信息(假设GV账号是abc@gmail.
com, 要打的号
码是1234567890)
== Parsing '/opt/etc/asterisk/asterisk.conf': == Found
== Parsing '/opt/etc/asterisk/extconfig.conf': == Found
Connected to Asterisk 1.8.4 currently running on unknown (pid = 20585)
Verbosity is at least 4
-- Remote UNIX connection
== Using SIP RTP CoS mark 5
-- Executing [11234567890@outbound:1] Dial("SIP/101-00000000",
"Gtalk/abc/1*********[email protected]") in new stack
[May 28 15:13:23] ERROR[20669]: c_g... 阅读全帖
m******m
发帖数: 445
33
按照教程一步步走到最后,发现不能打出,下面是错误信息(假设GV账号是abc@gmail.
com, 要打的号
码是1234567890)
== Parsing '/opt/etc/asterisk/asterisk.conf': == Found
== Parsing '/opt/etc/asterisk/extconfig.conf': == Found
Connected to Asterisk 1.8.4 currently running on unknown (pid = 20585)
Verbosity is at least 4
-- Remote UNIX connection
== Using SIP RTP CoS mark 5
-- Executing [11234567890@outbound:1] Dial("SIP/101-00000000",
"Gtalk/abc/1*********[email protected]") in new stack
[May 28 15:13:23] ERROR[20669]: c_g... 阅读全帖
e**********i
发帖数: 108
34
按照fiu的dummy guide装的,打进打出都能响铃,我这边也很清楚,可是对方根本听不
见,声音微弱,还延迟很长,根本没法用,不知道是什么原因,请板上各位给诊断一下
。下面是ssh的信息:打入打出的都在
Tomato v1.28.7500 MIPSR2Toastman-RT K26 USB VPN
root@RT-N16USB:/tmp/home/root# asterisk -rvvv
Asterisk 1.8.17.0, Copyright (C) 1999 - 2012 Digium, Inc. and others.
Created by Mark Spencer
Asterisk comes with ABSOLUTELY NO WARRANTY; type 'core show warranty' for
details.
This is free software, with components licensed under the GNU General Public
License version 2 and othe... 阅读全帖
e**********i
发帖数: 108
35
按照fiu的dummy guide装的,打进打出都能响铃,我这边也很清楚,可是对方根本听不
见,声音微弱,还延迟很长,根本没法用,不知道是什么原因,请板上各位给诊断一下
。下面是ssh的信息:打入打出的都在
Tomato v1.28.7500 MIPSR2Toastman-RT K26 USB VPN
root@RT-N16USB:/tmp/home/root# asterisk -rvvv
Asterisk 1.8.17.0, Copyright (C) 1999 - 2012 Digium, Inc. and others.
Created by Mark Spencer
Asterisk comes with ABSOLUTELY NO WARRANTY; type 'core show warranty' for
details.
This is free software, with components licensed under the GNU General Public
License version 2 and othe... 阅读全帖
f*********e
发帖数: 8453
36
参考前面帖子在pogo上跑了asterisk服务。用IPTel和IPKall的免费服务和号码。前几
天还好,昨天突然dumb平板上的软电话频繁收到google voice转的电话(206xxxxxx)。
按接听也听不见声音。看GV历史记录发现全是一些陌生号码,基本间隔一两分钟一个。
有的还是收费电话,GV扣了钱。奇怪的是除了软电话GV连的其他电话都不响。停了
asterisk server之后软电话就不提示有电话进来了。打开
asterisk console看见一堆转接信息,也不知道啥意思。下面贴几个例子:
== Parsing '/etc/asterisk/asterisk.conf': == Found
Privilege escalation protection disabled!
See https://wiki.asterisk.org/wiki/x/1gKfAQ for more details.
== Parsing '/etc/asterisk/extconfig.conf': == Found
Connected to Asterisk 1.6.2.... 阅读全帖
z***e
发帖数: 5393
37
我不认为你需要使用超过30个PHP API来做论坛。
我列举一下:
和mysql连接的,5~6个(connect/close/query/fetch...)
字符处理如htmlencode(),substring之类的,最多10个.
论坛的东西说白了就是客户端发请求,服务器parse一下然后修改数据库返回结果而已。
php并不是什么“新”东西,新东西是RoR/nodejs之类的.web服务从最初C到perl到php/
asp/jsp的过程, php恰好是作为perl的代替品出现。
当然只要能输入在网页显示的都能输出,那么你要想想为毛别人都不用php做论坛?你
觉得网上那些phpbb/simplemachine/discussz/phpwind/etc.这些开发者都是群傻瓜完
全不知道perl的存在?php和所有xxp的web工具一样,成为Perl的代替品就是因为可以
直接切入html和server code混合起来,而不是非要print xxxx (jsp就是servlet的马
甲,但是为什么别人不去直接用servlet?asp后面也是C#,为毛不直接用
HttpResponseHan... 阅读全帖
j****e
发帖数: 12067
38
来自主题: Detective版 - 【参加活动】小捷的感谢 (转载)
【 以下文字转载自 Food 讨论区 】
发信人: littlej (sunshine), 信区: Food
标 题: 【参加活动】小捷的感谢
发信站: BBS 未名空间站 (Tue Nov 30 01:13:34 2010, 美东)
今年的感恩节,是我经历的第五个感恩节,也是最开心和踏实幸福的一个。回想过
去的一年,是来美国后最开心的一年。经过如噩梦般的两年多,终于走出了最低谷;值
得感谢的太多太多。
谢谢bf一直一直陪在我身边。无论是我在北卡CPT出了问题,遭遇了车祸,膝盖肿
的老高不能上下楼,和房东经济上的纠纷,回学校funding出了问题,或是在加州大清
早被警察pull over,抑或是小到生活中手多处受伤帮我笨手笨脚的包扎,帮我洗菜切
菜不要我的手沾水,你都一直陪在我身边。有过争执和误会,有过赌气和大哭,磕磕绊
绊的一路走来,却发现不知不觉中,你已经给了我家的温暖和依靠。这对于从小无比恋
家,却又独自在外漂了6、7年的我是何等的弥足珍贵!有时候我会跟你念叨,回想起来
,最最温馨和踏实幸福无忧无虑的竟然是中学时代。其实,后来的那些年,也有过很多
的快乐,有了... 阅读全帖
c***s
发帖数: 70028
39
当技术作为基础设施,为用户有关金融、时尚、内容、娱乐、交通、医学和公共设施服务,科技公司就会减少对“创新圣地”硅谷的依赖,将运营重心迁到洛杉矶、纽约、波士顿、奥斯汀甚至以色列、伦敦和深圳。硅谷在“去中心化”,但“硅谷精神”也在全球生根。
今年5月,著名的“阅后即焚”社交应用SnapChat创始人Even Spiegel来了一趟中国,拜访了一些中国做社交应用的同行。其中,在和一个同行吃饭聊天的时候,对方随便地问了一句“你们公司在旧金山什么地方?”,于是Even Spiegel很严肃地回答:“我们不在旧金山,不在硅谷,我们在洛杉矶”。
“为什么不在硅谷?”自然少不了这样的追问。在中国的大部分互联网从业者和创业者来看,硅谷是创新的天堂,有着最疯狂的一群人,风险投资、孵化、创新者社区、大学和巨型互联网公司构成的生态系统相当完备。世界上那些最酷的创新,理应出自硅谷而不是其它地方。据说,Even Spiegel当时没有太多地解释这个问题,只是淡淡地回复:“我不喜欢那个地方”。
如果连Even Spiegel都不喜欢硅谷了,那硅谷一定发生了些什么变化。这位SnapChat联合创始人是个90后,出生在... 阅读全帖
s*****t
发帖数: 637
40
【 以下文字转载自 ChinaNews 讨论区 】
【 原文由 parsely 所发表 】
深陷的眼窝、薄薄的嘴唇、挺直的鼻梁、上翘的下巴……老山汉墓女
主人头像复原图一经面世就引发了轰动。汉墓中为何出土西域美女?
这也许会成为考古界的一大谜团。
近日,中国老山汉墓女主人的头像复原工作在北京顺利结束。记者在
第一时间见到了这个头像复原品。也正是此刻,这位在京西沉睡了20
00多年的神秘西汉女子终于露出了她的庐山真面目。这个复原品是一
个以石膏为材料的雕塑,雕塑的外层涂了特制的颜料,呈现出动人的
光泽和透著远古气息的古铜色。女主人有著深邃的大眼睛和薄薄的嘴
唇。她桃形的下巴微微翘起,似乎始终在对人微笑,而她那高而挺直
的鼻梁在本身就轮廓清晰的脸上更显出了几分西域人脸部特有的立体
感。摄影记者不禁连连赞叹:“真是绝色美人,但她怎么长得像西域
人呢?”
虽然此时离女主人头骨发现的时间已整整8月有余,而且随著时间的
流逝,老山汉墓的热度在人们的记忆中渐趋冷却,但是这个消息一经
传出,无论是在关心老山汉墓的普通群众眼里还是在相关的专家心中
都引起了不小的震动。但是他们关注的焦点却并非头像被成功复
p******u
发帖数: 14642
41
股沟parse出错吧,算成是英亩乘于平方英尺等于多少平方米乘与平方米,搜acre to
square feet的时候别忘了“to”啊
D***r
发帖数: 7511
42
人识别汉字不是一笔一画去认的好不好,是看整体框架结构
简体字里面仍然存在笔画多、结构复杂的
而且由于形近字多、同音字多,反而造成parsing的困难
xt
发帖数: 17532
43
来自主题: Military版 - 为啥放飞员是两个
现在连iphone都能很快parse XML啦。飞机上装个山寨手机就可以...
D***r
发帖数: 7511
44
这不是啥新鲜的,最基本的心理学原理
人类parse文字信息本来就不是单纯的bottom up
v***e
发帖数: 2108
45
来自主题: Military版 - 壮观:航拍10万香港人占中呐喊
http://www.appledaily.com.tw/realtimenews/article/international

https://www.facebook.com/video.php?v=
10205037669248521" data-width="466">
阅读全帖
b********n
发帖数: 38600
46
来自主题: Military版 - Tech Bubble Is Coming
The TechCrunch Bubble Index: Parsing Headlines to Quantify Startup Hype
http://toddwschneider.com/posts/techcrunch-bubble-index/
z****e
发帖数: 54598
47
来自主题: Military版 - 本班索南烂泥扶不上墙
这个你自己动手吧,那些css/html/js都可以通过看源代码找到链接
你自己去down下来parse就是了
z****e
发帖数: 54598
48
中文parse起来很难
复杂度高不少
百度当年不是靠人工去做嘛
说英语的人压根没有太大兴趣搞这个研究
一来不懂中文,二来也没啥经济利益,天朝当局又强势
其他的声音和图像还好
d*b
发帖数: 4184
49
【 以下文字转载自 Parenting 讨论区 】
发信人: dcb (奉钻风之命删除), 信区: Parenting
标 题: 关于AA是否违宪的案例分析
发信站: BBS 未名空间站 (Mon Jun 29 22:17:05 2015, 美东)
The Medical School of the University of California at Davis was typical. It
reserved sixteen of the one hundred slots in its entering classes for
minorities. In 1973 and again in 1974, Allan Bakke, a white applicant, was
denied admission although his test scores and grades were better than most
or all of those admitted through the special program. He sued. In 1977, his
ca... 阅读全帖
W*****d
发帖数: 4196
50
【 以下文字转载自 JobHunting 讨论区 】
发信人: fightclub (搏击俱乐部), 信区: JobHunting
标 题: A, A, G, G, L, C, Z, U 面经 + offer
发信站: BBS 未名空间站 (Fri Dec 18 11:43:09 2015, 美东)
之前也onsite了dropbox, pintreset, 和whatsapp都挂了,后来才慢慢找到点感觉。我
把面的题基本都写下了,但我不在这里和大家讨论这些题了。
A (Airbnb)
1. 2D array, 访问顺序必须是‘回’字的方式,就是从外圈转到里圈,写出class,
Iterator, hasNext(), next().
2. 电话号码和计费的一个log, 去parse 看规定时间内哪个号码产生费用最高。
3. leetcode anagram 的一题变种
4. 有很多个sorted queue存在不同服务器上,如何有效的读取到一个 sorted 大queue
里 (google也面到了这题)
5. 设计db, 如何存取房东和房客的reviews, 如何maintain... 阅读全帖
首页 上页 1 2 3 4 5 6 7 8 9 10 下页 末页 (共10页)