G**Y 发帖数: 33224 | 1 靠,Bush说不定有希望上场了。
上周的操作实在太弱了,选的DEF不入流,RB错过了LSH,今天他TD了。 |
|
G**Y 发帖数: 33224 | 2 悲催的我连续两周找Michael Bush救火。
本来以为,如果他们领先了,或许Bush有机会。
结果,今天他们51分,他都没分到半杯羹,我算彻底绝望了。
之前LSH,P Thomas等人还在的。基本上是个人就比Bush强。 |
|
G**Y 发帖数: 33224 | 3 之前有些动静也有对的。
比如把Greg Jennings扔掉了,换了James Jones。不过魄力不足,没上Cobb。
把Finley扔了,换了Miller。
但总的来说,是错的时候居多:
观察一周就把LSH扔了,结果他爆发了。
关键是当时没想到,D Brown和Murray的伤会这么长时间。
之前把A Brown因伤扔了,结果没过两周他就好了。
郁闷+郁闷呀。
上周把Woodhead扔了,换Bush。
这周屯了两个Kickers,后来上了个最烂的。
屯了三个DEF,都没有能上10分的。
业务确实不行。
WW里爆发的大把大把的。 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
s****t 发帖数: 17096 | 21 还是不说了,本帖标题说了没有书透
有兴趣去google GoT LSH吧 |
|
z*i 发帖数: 58873 | 22 The brotherhood is useless now from plot point of view, since they are
unlikely to bring back LSH. So send the Hound to kill them off and then
build up for a Clegane Bowl is a reasonable solution. |
|
|
|
|
|
m******i 发帖数: 834 | 27 你和我师兄一届的啊,你们那届挺牛的,tw,lsh都是你们那届的吧
读来好亲切呀,真的很怀念交大。
我也是化学系的,96级,应该是师兄毕业的那年进得交大吧。当时好像刚刚换了领导班
子,据说就是前两年出的事情太多了。不过,我们进来以后就基本太平了。师兄现在哪
里高就呀? |
|
m******i 发帖数: 834 | 28 你和我师兄一届的啊,你们那届挺牛的,tw,lsh都是你们那届的吧
读来好亲切呀,真的很怀念交大。
我也是化学系的,96级,应该是师兄毕业的那年进得交大吧。当时好像刚刚换了领导班
子,据说就是前两年出的事情太多了。不过,我们进来以后就基本太平了。师兄现在哪
里高就呀? |
|
|
g*****n 发帖数: 56 | 30 from effective C++ (2nd ed) item 28
struct widgets{
class widget {....};
static const Widget operator+(const Widget& lsh, const Widget& rhs);
....
};
I am wondering why declare a overloaded operator static? |
|
e*******8 发帖数: 94 | 31 这种问题太高级了吧。。。我记得mining massive datesets里面讲LSH里很简略的讲了
个fingerprint matching的例子 |
|
w***g 发帖数: 5958 | 32 那个不是倒排表,而是高维向量的相似性索引。传统方法中用的比较多的是LSH和kd-
tree。目前最牛的方法是基于k-nearest neighbor graph的索引,可以秒杀传统方法。
这是我吃饭的老本行了。 |
|
w***g 发帖数: 5958 | 33 NLP在应用这一块主要是information retrieval, 最典型的应用就是web搜索引擎。用
到的技术是倒排表,TF.IDF以及比较花哨点的pLSA, LDA等。再推广一些的话可以扯上
ranking, clustering等等。这类应用对语言模型的假设大致是vector model,最多就
是n-gram,主要是靠大数据和用户反馈等使得搜索结果比较靠谱。应用最多的系统应该
是lucene,还有sphinx。学术界用来搞研究用lemur(C++)的也比较多。如果用pLSA,LDA
等从文本抽取特征,那么就无法用倒排表了,只能用K-NN搜索。这个我觉得lucene可能
就做不了了(请专家指正)。Lemur可以做。还
有一个叫gensim的python库是用来做这个的,不知道是不是靠谱。还有一个应用是在超
大规模上找相似文本,甚至连倒排表都不够了,需要用到simhash和LSH等技术。
文本向量和topic model产生的特征向量可以用一般的机器学习方法做各种分类预测等
等,然后就是机器学习了。
理论一点的研究领域叫computational linguistics,研究怎么... 阅读全帖 |
|
w***g 发帖数: 5958 | 34 话说我那个kgraph你还用吗?我有两年没改算法,发现已经被CMU和老毛子团队比下去
了, MIT也有一波人没放弃LSH最近又搞了个轮子出来。我这两天业余时间都在改进
kgraph。这种规模得轮子属于业于时间搞搞还可以一拼的。这种事情做不到世界第一
就等于没做。我东家最近情况不是很好,如果他们完蛋了我就全力去做CNN。
老毛子战斗力太强了。 |
|
w***g 发帖数: 5958 | 35 话说我那个kgraph你还用吗?我有两年没改算法,发现已经被CMU和老毛子团队比下去
了, MIT也有一波人没放弃LSH最近又搞了个轮子出来。我这两天业余时间都在改进
kgraph。这种规模得轮子属于业于时间搞搞还可以一拼的。这种事情做不到世界第一
就等于没做。我东家最近情况不是很好,如果他们完蛋了我就全力去做CNN。
老毛子战斗力太强了。 |
|
m*p 发帖数: 1331 | 36 我觉得这个中医跟LSH也有异曲同工,一种病,好几种药方都可以被hash到病灶。你再
琢磨琢磨估计可以发个pami,jmlr什么的。lol.
10 |
|
l*******m 发帖数: 1096 | 37 statisticians cares more about math analysis, CS people focus on
implementations. Nearest neighbors, for example, CS courses would mention 3
algorithms for searching: brute force, KD tree, and LSH. GBM, for another
example, CS people are interested in writing a parallel version, which is
challenging since GBM is sequential one in theory. But google and yahoo do
have paralleled implementations done recently.
At most software companies, software engineers write ML algorithms, and
statisticians are... 阅读全帖 |
|
|
l****g 发帖数: 761 | 39 我也负责我们组ML面试, 我对你的出题很难苟同
你出的这些题背得怎么熟,如果我要solve一个 PB level data problem, 怎么用?
所以我就不拍了,以前有个贴总结的挺好我就直接贴过来吧:
发信人: Algorithmic (Zeal), 信区: JobHunting
标 题: Re: 为什么你么都说现在招聘走做题路线
发信站: BBS 未名空间站 (Mon Dec 23 17:31:14 2013, 美东)
本来我是带着娱乐的态度来回帖的,但是既然碰到了大牛,请educate我。
请告诉我任意一个数据结构,比inverted list 更重要,并且广泛地应用到了实际的
text retrieval system中.
请告诉我任意一个document retrieval model,比vector space model 或者 Okapi
BM25, Statistically significantly better for general purpose document
retrieval. Either implemented in Lucene or Le... 阅读全帖 |
|
l****g 发帖数: 761 | 40 我也负责我们组ML面试, 我对你的出题很难苟同
你出的这些题背得怎么熟,如果我要solve一个 PB level data problem, 怎么用?
所以我就不拍了,以前有个贴总结的挺好我就直接贴过来吧:
发信人: Algorithmic (Zeal), 信区: JobHunting
标 题: Re: 为什么你么都说现在招聘走做题路线
发信站: BBS 未名空间站 (Mon Dec 23 17:31:14 2013, 美东)
本来我是带着娱乐的态度来回帖的,但是既然碰到了大牛,请educate我。
请告诉我任意一个数据结构,比inverted list 更重要,并且广泛地应用到了实际的
text retrieval system中.
请告诉我任意一个document retrieval model,比vector space model 或者 Okapi
BM25, Statistically significantly better for general purpose document
retrieval. Either implemented in Lucene or Le... 阅读全帖 |
|
s*********h 发帖数: 6288 | 41 有点不是很明白它的理念。
比如用来寻找相似项。原本需要过O(N^2)遍,但是每一次比较需要的运算量比较大?。
使用LSH也是需要过至少O(N^2)遍,但是先通过简单的比较来把可能相似的项hashing
to the same bucket,然后再从筛选过的结果中寻找?
所以减少的其实是复杂运算的次数? |
|
s*********h 发帖数: 6288 | 42 有点不是很明白它的理念。
比如用来寻找相似项。原本需要过O(N^2)遍,但是每一次比较需要的运算量比较大?。
使用LSH也是需要过至少O(N^2)遍,但是先通过简单的比较来把可能相似的项hashing
to the same bucket,然后再从筛选过的结果中寻找?
所以减少的其实是复杂运算的次数? |
|
|
w*******y 发帖数: 60932 | 44 Amazon
Olympus LSH-1220 Lens Case for Olympus 50-200mm & 150mm f/2.0 Lenses
$14.57
Shipping is free with Amazon Prime or if you spend $25 or more
|
|
v*******e 发帖数: 3714 | 45 这是平常夏天里的一个平常日子。我已经在路上走过了好久,
看太阳从阴云后面探出头来。这是一个连日阴雨后放晴的好日子。
“杀人的好日子”会不会也是实现期待的好日子?我怀了几个
小小的心愿在今天早上,又满觉得一个都不能实现了。
在网页上看过那么多熟悉的ID底下熟悉的诗作。
http://wenxue.newyouth.beida-online.com/data/data.php3?db=wenxue&id=sm-they-lsh
如果我们能够跳过一些时刻
钟表就喑哑,布谷鸟倒着歌唱,而生活会一如从前
也就是,更美好
看着它们被张贴,甚至,看着作者“发表文章”时将其发表。这些
不再是冰冷的文字,不管随之而来有没有一场泛滥的灌水。这些在
记忆里已成经典的文字,不管是否被记得它们将在我脑海里被翻唱
不休。为这浅薄的理由我说我由衷地深爱你们,可以么?
为何没有署上日期?也许是我记性不好吧..我不能记得那些匆忙流
出的文字是何年何日哪个特定时刻下的心情,为了记住我总是小心
地写上日期,并把它作为这游戏文字的一部分,就象那心情黯寂时
抛出的烟头的最后一明一灭。 |
|