d********i 发帖数: 582 | 1 以5年为界,使用Cassandra的公司是增多?还是减少,被会被淘汰? |
|
w**z 发帖数: 8232 | 2 目测今年Cassandra summit 比去年人多一倍也不止
Datastax 拿了106M series E funding, 总funding 189.7M |
|
|
T******7 发帖数: 1419 | 4 大数据newbie 学大数据从什么开始?hadoop? spark? cassandra?
有比较丰富的c++/java/python 经验。一直做的跟大叔无关。
想丰富一下大数据只是。从哪里入手?
hadoop是不是有点老了?直接学spark会不会不接地气?求指教 |
|
l*******n 发帖数: 53 | 5 我们公司从事期权交易,要做一个全新的期权交易系统,需要有Strong Cassandra 经
验的, HBased 后者类似的也可以。Java/SQL are preferred.
可以办身份,工资13万到15万。
Excellent working environment and benefits.
If interested, can email [email protected]
/* */
Thanks. |
|
T******7 发帖数: 1419 | 6 cassandra不難學吧?
會mongo的上手c*是不是没什么困难? |
|
w**z 发帖数: 8232 | 7 哪个hot? Cassandra works great with ssd. |
|
|
i*****h 发帖数: 1534 | 9 【 以下文字转载自 Programming 讨论区 】
发信人: icefish (哆拉A梦), 信区: Programming
标 题: 求推荐:学习cassandra和 kafka的资料
发信站: BBS 未名空间站 (Tue Oct 20 02:56:28 2015, 美东)
RT, 谁能推荐些学习资料,由浅入深的那种,有空想自学一下。非常感谢啊! |
|
|
b**********5 发帖数: 7881 | 11 这个傻逼datastax, 我觉得cassandra流行, 就是这傻逼公司搞的。 我看见这个
createtable primarykey, 就想吐。。。 |
|
h*******0 发帖数: 270 | 12 牛肉姐, 为什么你看到creatable primary key就像吐? 为什么你这么不喜欢
cassandra? 你觉得什么db比较好? |
|
x********0 发帖数: 3 | 13 我们小组急招多年经验Cassandra Expert. 或则有数据库背景的CS MS/PHD.
If you are interested, please send your resume to [email protected]
/* */
Thanks very much! |
|
z*********n 发帖数: 1451 | 14 感觉这是个伪命题,两种数据库数据存法都不一样,有的数据适合RDBMS,有的适合
Cassandra,完全取决于你用法。你起码得说明你数据是什么结构的,测哪种操作吧。 |
|
发帖数: 1 | 15 基本上key value store的数据都可以存在RDBMS, 但是当数据量达到一定程度,RDBMS
的scalability和performance就很难扩展了,所以很多公司把数据从oracle移到了
Cassandra。应该有matrices for the turning point. 例如shopping carts |
|
j**********r 发帖数: 3798 | 16 我老给你指条明路吧。这板上就没几个真折腾过Scalability的。如果你的写操作会超
过每秒5000次,或者读超过每秒1万次。Oracle很大可能会扛不住,或者能扛得住你撑
不起,Oracle是按CPU算钱的。我老干过几次Oracle -> MySQL的迁徙。每次光license
fee每年就省几个米。
对于可以linear scaleout的use case. Cassandra读写都超过Oracle或者任何RDBMS没
有压力。但是没有transaction support,工具跟方便性远远不如RDMBS。维护也麻烦很
多。如果你不需要那么快的读写,老老实实用RDBMS可以省很多事。 |
|
m*p 发帖数: 1331 | 17 试了一下午,还是没法把2个nodes的cassandra cluster给setup起来,但是单机的功能
都可以了。
站内m一下,交流一下下,谢谢! |
|
|
f*******h 发帖数: 1269 | 19 两样东西啊。。。 Cassandra is column store, MongoDB is document store.
你首先得看你的应用属于哪个类型啊。还有你要怎么shard/replicate data, how many
nodes, etc.
All these affect your choice and maintenance. |
|
B***n 发帖数: 84 | 20 每次插入都得排序不是会降低数据写入的性能吗?
还是这些是相对可以忽略的?
反而听说cassandra更适合偏写的应用? |
|
c******n 发帖数: 4965 | 21 cassandra's schema replication is flawed by design
you can have schema out of sync,
it could be that when you try to insert into the cf, it went to a
certain node, and that node does not have the latest schema def , and
that cf is not present
I once repeatedly reproduced the schema out of sync issue, but no time
to dig into that further now
but the
can
any |
|
w**z 发帖数: 8232 | 22 hbase, they still use Cassandra for some of the features such as inbox
search. |
|
g*****g 发帖数: 34805 | 23 去面试的话,Hibernate,Cassandra不会就说不会。Spring也不会就比较糟糕,搞不好
会挂。
我很久以前读的是Spring in Action,你至少要把IoC弄明白。 |
|
k********e 发帖数: 368 | 24 spring hibernate 我是属于非常熟练的水平。
Cassandra 也是他们一个新的R&D项目。我就是希望能够两天迅速的看看基本架构,和
简单操作,以及如何和spring, spring data整合
你平时是如何做呢? 有没有比较入门的资料? |
|
g*****g 发帖数: 34805 | 25 好像就是看了一点的tutorial,你可以看看astyanax,Cassandra单机就可以跑。
跟Spring的整合很简单,直接上个Dao读写即可,而且没有transaction。
我去面试的时候,算法题并不算难,boggle一定要看看,我被问到了两次。
白板还是要的。对large scale的系统设计要求比较高。SOA,Concurrency那些类等等。 |
|
w**z 发帖数: 8232 | 26 bad. need to have whole data set in memory for it to perform. And it is
not written in Java :)
Cassandra and HBase are the better choices . |
|
z*******3 发帖数: 13709 | 27 mongodb的话据说要把整个index都读入内存?
还是cassandra吧 |
|
k********e 发帖数: 368 | 28 Cassandra 爱好者前来围观。 无限可扩容。 |
|
p***c 发帖数: 5202 | 29 Thanks
看来都不喜欢mango啊,呵呵。我主要是看了点教程,发现mongodb仿佛很简单,几下就
配置好,可以写程序了。
Cassandra我到datastax下载了他们的enterprise server,安好,跑了个demo,发现和
mongo很多不一样 |
|
w**z 发帖数: 8232 | 30 别的不知道,Cassandra has intergration with Hadoop |
|
w**z 发帖数: 8232 | 31 Mongo comes with Morphia, 可以做类似sql 的操作,不知性能如何? Cassandra 是
存成sstable, 有些操作不可能实现。
table+ |
|
g*****g 发帖数: 34805 | 32 Cassandra is fast, but you need to plan your query. |
|
w**z 发帖数: 8232 | 33 depends on what you want to do. think of Cassandra as a big hash table,
value is a list of columns (name value pair again ) ordered by column name. |
|
t*******e 发帖数: 684 | 34 Think about a scenario at amazon.com, when a pricing error occurs, the
amount of txns jacks up with anomaly against a single item. Obviously,
overnight data analysis/mining doesn't help. There must be a real-time, big
data analytic process to quickly remove the item from listing.
Does Cassandra or HBase fit this use case?
. |
|
P*****x 发帖数: 72 | 35 we have a cluster on EC2. replication factor 3, simple strategy, quorum read
, quorum write. GC grace using default and node tool repair once a week
Cassandra V1.2.1 hector api 1.0.5
we have a column family used for indexing and all columns are dynamic
composite columns. Here is strange thing, when we do lots of writes and
deletes. Somehow lots of deletes are simply like never happened. Even later
we issued the same comments again, we still see some of columns not being
deleted. If we do range s... 阅读全帖 |
|
w**z 发帖数: 8232 | 36 did you check after the repair is run? if you can repro it consistently,
make sure your delete method is implemented correctly. I suggest you to
post your question to Cassandra mailing list to get better response.
read
later |
|
m******t 发帖数: 635 | 37 老大和goodbug都这么推崇Cassandra,看来有必要研究一下 |
|
|
|
l******0 发帖数: 244 | 40 多两个说法难道不好? 哪天你的老美同事说,cassandra is dope shit. 别感到
puzzled. |
|
P********l 发帖数: 452 | 41 不理解为什么这么说:
cassandra vs hbase 就好比
couchdb vs mongodb
单纯讲scaling好像不太有意义. |
|
|
g*********9 发帖数: 1285 | 43 性能上有问题么?(6台server)Cassandra这个compaction 能慢到什么程度?多谢 |
|
c****e 发帖数: 1453 | 44 mapreduce has nothing to do with hashtable. I guess you want to say
Cassandra is a big hash table with column families. |
|
T********i 发帖数: 2416 | 45 关键是cassandra缺省状态不是100% durable的。
这一点我可以100%肯定goodbug完全不清楚。从上面他发的帖子里就看出来了。
goodbug的话是不是要打折扣?他做的东西各位敢用么? |
|
g*****g 发帖数: 34805 | 46 Cassandra durability的东西是可调的。架构本身支持了写多Datacenter,丢数据的概
率是很小的。
普通数据库hot standby照样会丢数据,只不过丢得不多而已。我没有不允许你hot
standby。
我抓住不放的是内存数据库,当网络写流量大于硬盘流量的时候,你只能在内存buffer
,丢了就全丢了。内存是否够大也是问题。
同样的问题在MongoDB上大家都知道了。用得着你吹吗? |
|
c*e 发帖数: 17 | 47 I am new to cassandra and want to know how to design a security db.
In RDBMS, it's modeled like belows:
1. membership table uid, username, password,email,etc.
2. user table uid,firstname,lastname, phone,address,etc.
3. password history table pid,uid,passwordhashed,etc
4. roles rid, rolename, description
5. Permission peid,permissionname,description
6. role-permission-mapping rid,peid
7. user-role uid,rid4
some basic operations:
1. query if user has role
2. query if user has permission
3. CRUD pe... 阅读全帖 |
|
c*e 发帖数: 17 | 48 I haven't touched mongodb at all. What makes mongo different from Cassandra
in
my scenario? Can you explain how mongo can help to achieve my goal? Thanks. |
|
g*****g 发帖数: 34805 | 49 No, I always recommend SQL until SQL is insufficient. I said if OP has 10M
users, it may not be a bad idea to use Cassandra, that's a big if. |
|
d*******r 发帖数: 3299 | 50 我是 PyMongo+MongoDB 在用,项目规模还比较小。随便存点东西,或者做个
persistent 的 msg queue,让不同的servers/processes去poll, 还有把各种乱七八糟
存在不同server的logs扔到mongo里面。估计别人会用 kafka做 persistent msg queue
, 用 Cassandra 做 logs, 我项目小,存储, queuing, log 就都用mongo了,这样别人
用的时候,看看 Mongo 里面的 JSONs 就啥都明白了。
推荐一个 GUI: http://robomongo.org/
其他部门和测试的人用着也方便。
PyMongo里面可以直接把 Python dictionary (可嵌入原生list) 当成 JSON 扔进去存
,还是比较方便。就是 Mongo 官方例子都是 JavaScript, 看过后,在Python里实现可
能还要简单看看 PyMongo里面的代码或者注释。
还有,create_index(keys_for_index) or ensure_index(keys_for_inde... 阅读全帖 |
|