由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
StartUp版 - mitEbiz是本版哪位高人做的?
相关主题
Nutch vs Lucene诚恳、严肃寻报价-购物网站
做了个job search网站看来下一个泡沫真的是social network
想搭一个搜索引擎,哪种open source的crawler最好? (转载)需要做一个大型SNS网站,请报价
http://blekko.com/诚问: 本地机器上的java based文件搜索如何卖钱?
有没有产品 review 的 rss feed问个特种搜索引擎的问题
大家对我的网站提建议吧, 有效建议有伪币试着做了一个image sharing的网站
ruby on rails 和 php问个问题
So how to install Lucene?请问如何能快速收集到制造商的email信息
相关话题的讨论汇总
话题: lucene话题: mitebiz话题: rss话题: feed话题: crawler
进入StartUp版参与讨论
1 (共1页)
I*****y
发帖数: 6402
1
做的不错,是不是后台就是一个机器人去爬几个deal网站?是用的Lucene?
mitebiz.com
b******y
发帖数: 9224
2
not crawler based, rss feed based I guess.
g********g
发帖数: 2172
3
Lucene is not a crawler. It is an index engine.

【在 I*****y 的大作中提到】
: 做的不错,是不是后台就是一个机器人去爬几个deal网站?是用的Lucene?
: mitebiz.com

t*****y
发帖数: 445
4
I also think so

【在 b******y 的大作中提到】
: not crawler based, rss feed based I guess.
b****u
发帖数: 1027
5
hotdeals 是 slickdeals.net 上的 hotdeals rss feed 来的:
http://feeds.feedburner.com/SlickdealsnetForums-9
不过看不出来这个网站打算怎么挣钱,纯粹为 slickdeals 做广告了。
m**t
发帖数: 1292
6
如果是onestop for 各种 deal 网站还是挺方便
b******y
发帖数: 9224
7
well, that's way bigger scope and hard to do. not something easy on the
surface I guess...
b****u
发帖数: 1027
8
问题在于 rss feed 直接受制于 deal 的提供网站。
slickdeals.net 提供hot deal 的 rss feed, fatwallet.com 也提供, 但它们都不提
供 deal 的搜索 rss feed. 这挺局限的。除非写 data mining 机器人去他们那儿拿。

【在 m**t 的大作中提到】
: 如果是onestop for 各种 deal 网站还是挺方便
b******y
发帖数: 9224
9
that's where high tech comes into play. 酷讯, google生活搜索等等,都是做data
mining的典范。 talking about a Ph.D or several to make it working ;-)
e*****p
发帖数: 255
10
parse 一下网页就可以了, 暂时还不需要data ming 这个技术吧。

【在 b****u 的大作中提到】
: 问题在于 rss feed 直接受制于 deal 的提供网站。
: slickdeals.net 提供hot deal 的 rss feed, fatwallet.com 也提供, 但它们都不提
: 供 deal 的搜索 rss feed. 这挺局限的。除非写 data mining 机器人去他们那儿拿。

1 (共1页)
进入StartUp版参与讨论
相关主题
请问如何能快速收集到制造商的email信息有没有产品 review 的 rss feed
cuil.com大家对我的网站提建议吧, 有效建议有伪币
牛人指教ruby on rails 和 php
大家给参谋一下,怎样推广网站So how to install Lucene?
Nutch vs Lucene诚恳、严肃寻报价-购物网站
做了个job search网站看来下一个泡沫真的是social network
想搭一个搜索引擎,哪种open source的crawler最好? (转载)需要做一个大型SNS网站,请报价
http://blekko.com/诚问: 本地机器上的java based文件搜索如何卖钱?
相关话题的讨论汇总
话题: lucene话题: mitebiz话题: rss话题: feed话题: crawler