a**********0 发帖数: 422 | 1 zookeeper在我使用过程中没有用过 因为cluster已经设置好了
现在要设置一个小cluster 不知道自己需要使用zookeeper否 我觉得没有必要 但是不
确定 |
|
w******u 发帖数: 486 | 2 在开玩笑吧。。。会cluster 会linux 。。。。5万。。。。。。
我知道cluster manager在湾区最少10W+。。。。。。 |
|
w*********s 发帖数: 2136 | 3 http://www.recombinomics.com/News/11071001/H3N2_Akita_Vaccine.html
Vaccination Link To H3N2 Death Cluster In Japan Hospital?
Recombinomics Commentary 13:22
November 7, 2010
25 patients and 8 staffs are suffering from influenza now
29 Oct., vaccinated against the flu
31 Oct., a man died(eighties)
2 Nov., 2 men died(sixties, nineties) a woman died(seventies)
4 Nov., a woman died(eighties)
5 Nov., a man died(eighties)
The above comments provide more detail on the H3N2 outbreak in a hospital in
Ak... 阅读全帖 |
|
n**m 发帖数: 7872 | 4 【 以下文字转载自 Xiyu 俱乐部 】
发信人: nkmm (nk), 信区: Xiyu
标 题: 庆祝我家的cluster fly都没了
发信站: BBS 未名空间站 (Thu Aug 5 17:12:35 2010, 美东)
总结一下:
1.fly trap对于小家小院的,弊大于利。清除苍蝇要repel,不要attract。而且fly
trap trap
的是家蝇和horse fly,对cluster fly没有诱惑力
2.苍蝇很多的时候用fly coil效果不错
3.zapper对苍蝇不是很管用,但是蛾子蚊子还是消除了不少的
4.虽然苍蝇是打不完的,但是不能不打。见一个打一个,见两个打一双!
5.这几天苍蝇的population已经少了很多,昨天除虫菊到了,放在院子里,今天就一只
都没有了。不
知道是不是除虫菊的效果 |
|
c****r 发帖数: 185 | 5 intra-cluster distances minus inter-cluster distances |
|
N**D 发帖数: 10322 | 6 there is one such measure, don't remember the name though.
It is based on measure the size of set that belongs to the same cluster in
two clusterings. |
|
a***n 发帖数: 404 | 7 最近要对一捆新闻文档进行clustering, 没有搞过,不知道有啥开源的软件可以快速处
理阿?
谢谢。
对了,clustering 中对于新闻文档比较适合的方法是什么啊? 想对文档根据语义归类
,不知道啥方法好啊,有没有什么paper比较系统地讲这一类的?
谢谢 ag~ |
|
a***n 发帖数: 404 | 8 就是一个point 被 cluster到不同的 cluster中去?
好像已知的算法都是把一块饼分开,没有重复的。。。。
谢谢!! |
|
|
b********p 发帖数: 875 | 10 你们的线性关系是什么知道吗,还是说线性关系也是未知的?
如果是后者,可以看成是hmm的inference, Baum-Welch algorithm.
你有几个clusters就有几个hidden states
假设你的data是y_1,y_2 ... y_n
有两个clusters, 就是有两个hidden states,
z1, z2, 他们transition probability p00,p11是要来猜的
对以每个hidden state,
emission probability
P(Y_j | z_i) 是 a_i + b_i * Uniform(0,1),
a_i, b_i 也是用来猜的,
然后就用MLE算p00,p11, a_i, b_i |
|
a***n 发帖数: 404 | 11 我感觉这个问题有点像给你一个彩色的图,然后根据色彩对图分块。
有点类似 spectral partition?
对于图像分割clustering不了解,不过感觉如果可以这样类比的话,我这里提到的
问题肯定比这个图像问题简单,因为就是一维的。就像一段光谱,要分段,而不是
一个彩色图,要分块。
你说的这个HMM俺还是不怎么理解,怎么去用这个。汗~~ 俺这边的数据的关系就是
前后数据的位置已知,谁挨着谁都定好了,然后每个数据间的色彩距离也是已知。
就是有一个matrix表明各个数据的色彩差异。所以每个数据既知道它的物理位置,也就是
在线段上挨着谁,前面是谁,后面是谁,又知道了这个数据的另外一个性质,也就是它
与其他数据的色彩距离,所以结果要根据色彩来做clustering,但是要尽量preserve这
些数据的原始的物理的相对位置。我觉得做图像的人应该早就解决这个问题了。不知道
有没有
现成的算法,程序可以用。 :( |
|
f*****8 发帖数: 5996 | 12 【 以下文字转载自 Hardware 讨论区 】
发信人: fendou8 (奋斗大叔), 信区: Hardware
标 题: 想买一堆赛扬3300做cluster,牛人帮俺算一算
发信站: BBS 未名空间站 (Thu Jul 1 16:36:07 2010, 美东)
frys赛扬3300加主板28块。想买8个或者16个做cluster。谁能棒我算算还需要什么材料
。每个节点配2G内存,500G硬盘大概要多少钱?便宜的话就搞16个,贵的话8个也行。
这样搞起来,性能大约相当于多大的电脑?能干过AMD六核吧 |
|
K****n 发帖数: 5970 | 13 duno.. I tried "balanced clustering", but no luck.
You can penalize the distance function with the number of data points
assigned to a cluster. |
|
s****i 发帖数: 197 | 14 假设我用python写的code需要用到scipy numpy sklearn等这些package但是处理的数据
非常巨大 在一个single machine上run需要超过50h 请问一下大家有没有方法可以
parallelize work使得我的code可以在一个hadoop cluster上运行以减少运行时间??
谢谢~~~
================================
在datascience板上问到据说用pig/hive写最简单暴力有效 但是由于程序要调用
sklearn/scipy/numpy这些package的函数 这个...在下pig/hive学艺不精 不知该如何
才能在pig/hive中调用那些package 再或者就是用到hadoop streamhttp://hadoop.apache.org/docs/stable1/streaming.html 在下非cs科班出身对此不太了解 可以麻烦推荐一本关于mapreduce设计的书或者教程吗??或
者cluster stream my code的方法详细说一下吗??非常感谢~~~ |
|
E**********e 发帖数: 1736 | 15 要是有的话, 可以指点一下吗? 是不是就简单的把几个电脑通过网络连起来,然后分
装hadoop,设置成single cluster,然后设置成multiple cluster?
自己对服务器不是很了解。服务器是不是去掉显卡,声卡等一下辅助设备后的简化电脑
啊 |
|
c**t 发帖数: 2744 | 16 We can drop a table, view, but how to drop a created
cluster?
And how to show all created created cluster or index? |
|
k***n 发帖数: 93 | 17 【 以下文字转载自 Programming 讨论区,原文如下 】
发信人: keyin (寂寞公路), 信区: Programming
标 题: BIRCH Implementation (Data Clustering)
发信站: The unknown SPACE (Sun Mar 16 16:32:20 2003) WWW-POST
I have to submit paper talking about a data clustering algorithm "BIRCH". Just
wondering if anyone have the source code for Birch and can send it to me. I
seached google and seems the author removed her source code from website.
Many thanks! |
|
a*******s 发帖数: 324 | 18 MySQL 5.0 doesn't support cluster. It should be 5.1
of
cluster
still |
|
M***7 发帖数: 2420 | 19 Hi guys, I have a question of cluster method in SQL.
A table contain 3 columns: rownumber, name, value.
I want to cluster the rows according to their values.
Step 1: First I create another table (tracking table), randomly put some
rows from the data table into this tracking table as the seeds.
Step 2: Then I want to calculate the (ith_value_from_datatable - jth_value_
from_trackingtable)**2, and assign ith row of data table into the jth group
according the the smallest distance calculated above. |
|
a9 发帖数: 21638 | 20 我觉得cluster最大的问题是如果存储服务器坏了,整个cluster就完蛋了。 |
|
c*****d 发帖数: 6045 | 21 不要被名字迷惑了
oracle cluster-index table和ms sql server中的cluster index不是一个概念 |
|
y****9 发帖数: 144 | 22 If I have a one-million row table without any index, let's say it has a col
called SSN and its values are unique. now i create a clustered index on SSN,
what will happen to the existing table rows?
For example, let's say each page can only hold two rows, at the begining,
rows with ssn=1 and ssn=4 are in page no 1; rows with ssn=2 and ssn=3 are in
page no 2. now i create a clustered index on ssn col, at the end will
page no1 contains ssn=1,2 and page no 2 contains ssn= 3 and 4 ? |
|
v*****r 发帖数: 1119 | 23 PK column is not necessarily the most frequently used query criteria when
querying a table, so I guess it is common to use non-pk index as the
clustered index in sqlserver.
Not sure why clustered index is heavily used in SQLServer, it might be bad
application/table design, less power features in SQLServer, or maybe both.
In Oracle, you have more flexible way to group row data logically together (
Partition) instead of having to use physical method like IOT, which is un-
relational in nature and... 阅读全帖 |
|
i****a 发帖数: 36252 | 24 yes you can. as far as SQL version goes, it's no different than installing
multiple versions on a single standalone server. Each version has it's own
folders and binaries.
On a cluster, each server has it's own cluster resource group, independent
from one another. |
|
Z**0 发帖数: 1119 | 25 看你自己要求了。如果钱少,肯定买什么hp,ibm,等的cluster是不现实的。
还是有点钱,可以考虑supermicro的cluster。网上有很多的这样代理。
如果还是缺钱,就是自己搭了。
搞清楚自己的需求。 |
|
d***a 发帖数: 13752 | 26 这个是baby size的cluster。:)
开开玩笑。对一个研究小组来说,有自己专用的机器很不错。
我单位上有一个cluster,256个节点,每节点双处理器,16个核32线程,一共4096个核
。但用的人也不少,并不能保证随时能用上。 |
|
k***n 发帖数: 93 | 27 【 以下文字转载自 Programming 讨论区,原文如下 】
发信人: keyin (寂寞公路), 信区: Programming
标 题: BIRCH Implementation (Data Clustering)
发信站: The unknown SPACE (Sun Mar 16 16:32:20 2003) WWW-POST
I have to submit paper talking about a data clustering algorithm "BIRCH". Just
wondering if anyone have the source code for Birch and can send it to me. I
seached google and seems the author removed her source code from website.
Many thanks! |
|
h*********o 发帖数: 62 | 28 quite hard to sync the singleton intances in a cluster if you have to. One
solution is to code a mediator on top of the cluster.
Actually singleton can also be a problem when you deploy your app as ear to
an application server in java. |
|
l********0 发帖数: 283 | 29 刚安装了Rocks Clusters
我没有用过cluster,用户说需要pbs,但是当前默认是sge
请问如何切换?
谢谢 |
|
c*******g 发帖数: 1996 | 30 在cluster 上是通过qlogin登陆到某个node的
同样sort一个80G的文件,单个server用了2小时不到, 在cluster上用了11个小时
系统负荷应该不会差太多
如何查是什么原因导致时间差那么多? 谢谢 |
|
|
w***g 发帖数: 5958 | 32 openmpi很霸道的, 等待消息的时候用的是轮询, 不管算不算东西一启动CPU占用率都是
100%. 我也见过学校实验室买了cluster雇了sysadmin然后成天让学生在上面跑python
/perl代码. 其实那东西用C++/fortran加openmp实现, 又快又干净, 估计单机性能就可
以跟一个50+node的cluster比了. |
|
j****x 发帖数: 943 | 33 lab 里有几台老旧电脑, 老板想dump了。 但是我想组个小cluster 玩, 主要是做计
算。 不知道组cluster 用那个distro 比较好。 请版上有经验的说说。谢了先。 |
|
l*****t 发帖数: 2019 | 34 问做Hadoop的同学们。你们公司都有几个Hadoop cluster。(testing hadoop code的
cluster 不算)。 |
|
d*******r 发帖数: 3299 | 35 请问你说的快的时候不到1ms,是在在你们 Mongo cluster上读写吗?
你们 cluster 规模大概有多少?还是一个 powerful 的单机 server?
吧。 |
|
v***e 发帖数: 2108 | 36
到目前为止没差,一样的。当然enterprise license有support
不过将来就不知道了
是的,Couchbase Server的caching layer就是memcached + persistence,
是一个C/C++ process,当然加了很多改进,但还是兼容memcached binary protocol
很多enterprise user 用couchbase构建很大的cluster,但是developer里面,
couchbase用的就比mongdo少。
Erlang不太可能写memcached,不是用来干这个的。
Couchbase Server架构里面除了memcached,是还有一大块Erlang process
不过是用来做cluster management和couchdb的
好像用的,具体不太清楚。 |
|
v***e 发帖数: 2108 | 37 正以为楼主需要的是redis+mongo之类的,所以couchdb
根本不是楼主需要的,而couchbase才是
couchdb是distributed datastore,全Erlang,不能提供楼主要求
的high performance caching 和 in-memory operation,
Couchbase 是memcached (caching) + Couchdb (只用在persisted db layer)
+ cluster + XDCR
Couchdb在商业上并不成功,只有Cloudant之类的还在围绕it开发,而Couchbase
是和Mongo,Cassandra一起的NoSQL DB market 三驾马车
楼主原帖 “最近在研究 memory database,做 queuing, cache 和 简单查询。
Redis 看着真心不错,还支持 transaction, 丫的就是 cluster 模式还没搞出来。” |
|
h********w 发帖数: 221 | 38 如题,
我知道单机用TPL就可以了,但是想写的程序在Cluster上并行该怎么办呢?MPI不是对C
#用的。
另外和我写的程序相关么?比如我写的是WPF的程序,也可以在cluster上run么?
谢谢啦,我没有包子,请见谅。 |
|
f******2 发帖数: 2455 | 39 我的需求就是在照片里找到小孩的脸。
请问这个用cloud service(google和aws都有类似的service)和自己搭建cluster训练
model最后能差多远啊?很多人说自己调参数更准确,我个人觉得三脚猫搭的cluster其
实其实并不能反映出所谓可调性带来的优势 |
|
s*********n 发帖数: 35 | 40 实验室装了一套cluster. 老板要找一套有图形效果的
演示程序以向参观者展示CLUSTER的高运算能力.请教
MPI高手哪里能找到? |
|
s*****t 发帖数: 1994 | 41 Globular Cluster M3
Credit & Copyright: S. Kafka & K. Honeycutt (Indiana University), WIYN, NOAO, NSF
Explanation: This huge ball of stars predates our Sun. Long before humankind evolved, before dinosaurs roamed,
and even before our Earth existed, ancient globs of stars condensed and orbited a young Milky Way Galaxy. Of the
200 or so globular clusters that survive today, M3 is one of the largest and brightest, easily visible in the Northern
hemisphere with binoculars. M3 contains about h |
|
h*******o 发帖数: 4884 | 42 standard normalized, 是指都normalized 到 control gene,i.e. b-actin 或
者18s RNA之类的吗?
谢谢
我pearson correlation和Euclidean都试过了
sample之间的cluster确实基本一样,个别的位置换了一下
但是不同gene之间的cluster就很多不一样 |
|
w****l 发帖数: 229 | 43 做了几组microRNA profiling,现在我想看一下,哪几个cluster的microRNA在我的
sample里detect到了。如果不是一个一个去查,有没有可能,我输入一组microRNA, 可
以有软件或者网站告诉我,他们属于哪些 microRNA cluster.谢谢 |
|
v*****a 发帖数: 1332 | 44 赎我直言
您老这么招肯定招不到,听口气连6W都开不到,还差不少。。
你说搞CS的谁去?
建议您换个方式
1,先说清楚多少钱
2,说说福利有那些,比如配偶免费上课,孩子有低价的学校DAYCARE
重点来了,
其实你这个买卖能做成互利的解决方案的。
3,你能给什么TITLE?比如AP?(这个不太可能)比如VAP?比如RAP?后面这两种总可
以吧。有些CS的如果有其他想法的还能去你那里落一下。
4,数据能给么?有些CS的苦B博士还指望弄个牛B的PAPER。你老组里能开CLUSTER,应
该买卖不小,如果答应能均点数据给CS的博士,配合一个VAP的TITLE,那还是有点诱惑
力的。
5,最后说一下,最好要求定低一点,“ 管理过linux cluster server ”可不是那么
简单的条件,一般硕士,博士都不一定有这种经验。有工作经验的,谁能看上那4W的工
作阿。。。 |
|
r*****d 发帖数: 727 | 45 I want to cut an Al cluster from an optimized Al(111) slab and put it into
solution to check the solvation effect. The Al(111) cluster I want consist
of 3 unit cells (3x3). But now I have a question. My boss asked me to
passivate all the boundary Al atoms using hydrogen except for the first
layer. But due to the close packing of Al, one Al will have 12 nearest
neighbors in the periodic model. Does this mean I need to put enough H to Al
until this Al has 12 neighbors? |
|
h***o 发帖数: 539 | 46 I've turned the public workstations in our department as
a cluster...total 28 nodes, CPUs vary from 133MHz(super old)
to 450MHz...hoho
When my school's cluster is crowded..I use this one..
it works well....hiahia |
|
O*****O 发帖数: 24 | 47 【 以下文字转载自 Mathematics 讨论区 】
发信人: OoOoOoO (石头阵), 信区: Mathematics
标 题: multidimensional scaling clustering methods
发信站: BBS 未名空间站 (Thu Mar 30 22:08:26 2006)
I am learning the multidimensional scaling clustering methods
in a hurry. I am able to understand how the stress is minimized
and how the final configuration is computed. The configuration
is supposed to contain the information to project patterns from
a high-dimensional space to a low-dimensional space.
Can someone please tell me how I can u |
|
O*****O 发帖数: 24 | 48 I am learning the multidimensional scaling clustering methods
in a hurry. I am able to understand how the stress is minimized
and how the final configuration is computed. The configuration
is supposed to contain the information to project patterns from
a high-dimensional space to a low-dimensional space.
Can someone please tell me how I can use the configuration
to project a specific pattern to the low-dimensional space?
Is it just a matrix multiplication?
then how clusters are computed thereaft |
|
l**********n 发帖数: 72 | 49 It's quite unusual to have endohedral structure like this. Generally according
to the LDA calculation, the covalent bonding of the IV elements could easily
form a cage. While for metals, when the cluster size is small, the electrons
are quite energetic and very active. I know some metal clusters with 10-15 Fe
atoms but with hydrogen binding outside.
Tell me if you have any results. It's very nice to know. |
|
y****2 发帖数: 34 | 50 我不太明白你说的cluster的背景是什么,以前有人用 reversible jump MCMC 来
detect clustering的,效果很好,不过算法有点BT。Good luck! |
|