Redshift 的使用 - JobHunting版 - 未名存档

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

JobHunting版 - Redshift 的使用

相关主题
● 2015年硅谷最火的高科技创业公司都有哪些？	● 请问有人知道amazon家palo alto的redshift组吗？属于aws的
● IBM中国研究院招招聘（代朋友发贴）	● 湾区startup和Google求比较（附一道G家onsite题）
● 求教一道昂赛特设计题	● 【工作机会&内部推荐】Lyft Data及其他组
● 谁可以建立一个外F查询网站数据库？ (转载)	● AMAZON Recruiter contacted me for this position, anyone interested in it?
● 该选哪个方向	● Job Opening - Boston网络大数据数据库工程师Data Engineer
● A家选组求建议	● 亚麻选组请老司机指点
● 【更新，已经选好组】Amazon4个组，已经选好~hoho	● [Amazon]亚麻选组求建议
● 有人了解A家dynamoDB 和 Redshift 组吗	● 诚心求offer比较，amazon VS apple？

相关话题的讨论汇总
话题: redshift话题: 使用话题: spark话题: 数据话题: 查询

进入JobHunting版参与讨论

1

(共1页)

b****u 发帖数: 1130	1 这个版人多，所以发在这。最近给公司搭了一个数据仓库，用Redshift。查询和插入效率都很好。但本质还是一个数据库。现在的问题是，如果要做一些深入的统计和计算，那么仍然要把大量的数据导出来，放到内存中做并行计算。这样我就可能会用spark，这样还不如直接用spark做数据库算了。不知道有没有人这方面的经验和建议。
f*********i 发帖数: 197	2 你的数据量有多大。我们之前用redshift，join4个table，每个table在500GB到1TB之间，50分钟内结果也出来了，用的是12个redshift node。我个人的体验，不知道对不对，和vertica相比，redshift在单个数据的增删改查上比较慢，但是在大数据的情况下效率会高点。
b****u 发帖数: 1130	3 要对很多时间序列数据做各种统计分析，特别是相关性分析，所以必须把数据导入内存以后做计算。
j*******n 发帖数: 48	4 Redshift 马上要支持Python 用户定义方程了,到时就不一定要把数据提出来分析了。【在 b****u 的大作中提到】 : 要对很多时间序列数据做各种统计分析，特别是相关性分析，所以必须把数据导入内存 : 以后做计算。
k******a 发帖数: 44	5 redshift 支持大规模数据。但是要使用传统的rdbms的关系型查询，效率不会好。如果两个或者多个tables都很大，然后做Join, 总数据量访问量太大。 redshift不是为这种复杂join查询设计的。如果需要复杂计算，建议先把复杂计算分解为适合redshift的若干简单查询，对于简单查询的结果，使用程序进行汇总分析。
l*n 发帖数: 529	6 http://cacm.acm.org/magazines/2010/1/55743-mapreduce-and-parall 太复杂的分析dbms做不了，只能上spark。【在 b****u 的大作中提到】 : 这个版人多，所以发在这。 : 最近给公司搭了一个数据仓库，用Redshift。查询和插入效率都很好。但本质还是一 : 个数据库。 : 现在的问题是，如果要做一些深入的统计和计算，那么仍然要把大量的数据导出来，放 : 到内存中做并行计算。这样我就可能会用spark，这样还不如直接用spark做数据库算了 : 。不知道有没有人这方面的经验和建议。

1

(共1页)

进入JobHunting版参与讨论

相关主题
● 诚心求offer比较，amazon VS apple？	● 该选哪个方向
● hiring: Senior Big Data and Machine Learning Engineer	● A家选组求建议
● opening: front end, full stack, big data	● 【更新，已经选好组】Amazon4个组，已经选好~hoho
● hiring in bay area: front end, full stack, data engineer	● 有人了解A家dynamoDB 和 Redshift 组吗
● 2015年硅谷最火的高科技创业公司都有哪些？	● 请问有人知道amazon家palo alto的redshift组吗？属于aws的
● IBM中国研究院招招聘（代朋友发贴）	● 湾区startup和Google求比较（附一道G家onsite题）
● 求教一道昂赛特设计题	● 【工作机会&内部推荐】Lyft Data及其他组
● 谁可以建立一个外F查询网站数据库？ (转载)	● AMAZON Recruiter contacted me for this position, anyone interested in it?

相关话题的讨论汇总
话题: redshift话题: 使用话题: spark话题: 数据话题: 查询

未名新帖统计// 7月16日

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

* 这里只显示发帖超过25的版面，努力灌水吧:-)