w***g 发帖数: 5958 | 1 按G的1PB数据算吧,一个block 64MB,那么就有16M个entry,就是每个entry用
128字节,加起来也就2G数据。GFS的paper是10年前发的,那时候主流了的机器
也有好几十G内存了。存这点数据就是小儿科。
一般这种情况不是小文件合并放大文件,而是大文件分成64MB的块。master存的是
文件名到块列表的映射,以及块到节点的映射。如果系统设计得复杂点,一般不会
所有的块信息都载入内存,而是只载入active文件的块信息。open文件,甚至在
第一次读的时候才一次载入该文件所有块的信息。按上面的算,1PB
active数据的meta data也就是几个G。一点问题都没有。
为啥Hadoop当年那么容易就做出来了,就是因为meta data太小了,几乎用不着
任何分治和优化。(顺便提一下,hadoop有个巧妙的stateless设计。就是
master只存文件到块的映射,而不存块到节点的映射。机群重启的时候由每台
slave汇报自己存了哪些块。这个设计能干活,也依赖于metadata数量很小这
一点。)
我写了这么多,再给留个作业题吧,哪位同学感兴趣可以回下。
假设有... 阅读全帖 |
|
i*****9 发帖数: 3157 | 2 话说现在直接面向用户的网站,一天产生1T的 log 数据一点都不多吧。随便看个指标
要看过去3年的周线也不过分吧。这样就是超过1PB的数据了。谁会为了这种1,2个月一
次的偶发查询准备一台能处理1PB数据的超级计算机?
:比较同意这个, 互联网公司堆廉价Linux机器,
:因为公司启动的时候便宜, 然后能 incrementally scale out 扩展. |
|
i*****9 发帖数: 3157 | 3 话说现在直接面向用户的网站,一天产生1T的 log 数据一点都不多吧。随便看个指标
要看过去3年的周线也不过分吧。这样就是超过1PB的数据了。谁会为了这种1,2个月一
次的偶发查询准备一台能处理1PB数据的超级计算机?
:比较同意这个, 互联网公司堆廉价Linux机器,
:因为公司启动的时候便宜, 然后能 incrementally scale out 扩展. |
|
c*****r 发帖数: 8227 | 4 多阵列可配置协同并行体系结构
6144颗英特尔CPU
5120颗AMD GPU,
内存98TB,
点点通信带宽40Gbps,
共享磁盘1PB。
系统峰值性能1.206PFlops
Linpack性能560.3TFlops |
|
|
s*****V 发帖数: 21731 | 6 中国跻身海量存储三巨头 ”“863计划”系统验收
http://www.stdaily.com/stdaily/content/2012-05/03/content_46306
2012年05月03日 来源: 人民日报海外版 作者:
作为“十一五”“863计划”海量存储系统关键技术重大项目的研究成果,浪潮自
主研发的PB(1PB=1000TB,1TB=1000GB)级高性能海量存储系统于3月通过国家验收。这
是国内第一个研制成功的多控制器和全交换体系结构的存储系统,使我国在高端存储领
域实现了从无到有的零突破,打破了国外厂商长期以来的市场垄断和技术垄断,使中国
成为继美、日之后世界第三个掌握高端存储核心关键技术的国家。
【 事关国家安全 】
“海量数据存储系统是国家信息安全的重要基石,事关国家的信息安全、经济安全
和社会安定,必须实现自主可控。”浪潮高级副总裁王恩东说,在关系到国计民生和国
家战略安全的领域,运行关键业务的存储系统能否可靠、安全、可控运转至关重要。尤
其在金融、电信、能源、政府、国防等领域,这个问题尤为突出。
近年来,随着云计算和物... 阅读全帖 |
|
a*****c 发帖数: 2086 | 7 有些人啊,没有真正的去做过一个project,没有深入去参与其中的开发,就在那里想
当然的发表评论。真正做下去了才知道会碰到多少问题需要去考虑去解决的。一个短时
间内承受巨大交易量,要做到不能当机,让用户不感到速度变慢,购物历史和更新记录
不能冲突,背后采用怎样技术才能支撑,我还是贴个淘宝技术的科普吧。
【编者按】对于淘宝网而言,2012年的“双十一”是一个交易里程碑,是一个购物狂欢
日,在这个“神棍节”里,淘宝创下191亿元的交易额,在交易的背后隐藏着哪些复杂
技术?
你发现快要过年了,于是想给你的女朋友买一件毛衣,你打开了www.taobao.com。这时
你的浏览器首先查询DNS服务器,将www.taobao.com转换成ip地址。不过首先你会发现
,你在不同的地区或者不同的网络(电信、联通、移动)的情况下,转换后的IP地址很
可能是 不一样的,这首先涉及到负载均衡的第一步,通过DNS解析域名时将你的访问分
配到不同的入口,同时尽可能保证你所访问的入口是所有入口中可能较快的一个 (这和
后文的CDN不一样)。
你通过这个入口成功的访问了www.taobao.com的实际的入口IP... 阅读全帖 |
|
n**s 发帖数: 2230 | 8 最近,日本和德国的研究员通过有史以来最大的人脑神经模拟试验,得出了令人震惊的
结论:采用K超级计算机上的82,944个处理器及1PB内存(每个神经元24字节),1秒钟
之内可以有17.3亿神经细胞(连接了10.4兆神经节)的活动。使用目前世界上最强大的
电脑系统,要耗费了40分钟去模拟1秒的生物时,如果时间与被模拟神经规模成线性比
例的话,那么模拟整个大脑1秒的运作则需耗时2.5天。
连大脑怎么运作现在还没完全搞清楚,就想用机器人代替人,天方夜谭 |
|
|
g***j 发帖数: 40861 | 10 【 以下文字转载自 Sex 讨论区 】
发信人: officegirl (云水谣), 信区: Sex
标 题: 世界最大色情网站每月访问量44亿(转载)
发信站: BBS 未名空间站 (Mon May 4 02:37:41 2015, 美东)
生活在互联网世界的人,都曾或多或少地浏览过在许多国家仍受管制的色情网站。
我们很难洞察这类网站的发展状况,因为相关的确切数据实在是少之又少。可以肯定的
是,色情网站的访问量肯定少不了。事实证明上述猜测是正确的,因为根据谷歌旗下广
告服务商Doubleclick的数据显示,独立访问量前500名的网站中,竟有数十个是成人网
站!
世界上最大的色情网站Xvideos每月有44亿的访问量 ,这个数字是CNN官网或24小时
专门播放体育节目ESPN电视网的访问量的3倍,是社交新闻站点Reddit的2倍。YouPorn
、Tube8和Pornhub这些大型的色情网站,其访问量也可以让除了Google和Facebook等超
大型网站之外的小网站们相形见绌。
从访问量中,我们只能得出色情网站要比非色情网站更受欢迎这个结论。44亿访问量听
起来确实是个天文数... 阅读全帖 |
|
d********w 发帖数: 363 | 11 1. 1PB 数据排序,数值范围2^64, 每台机器16G内存,10T数据,普通硬盘,写算法,估
算时间
2. ip表定位,有个1G个record的ip文件,里面记录(start_ip, end_ip, longitude,
latitude, country), 给出一个ip,要求迅速查询到地理位置,给的内存有限
3. 有几个卫星,可以通信到地面的任意基站,每个基站上都有大量数据,基站之间不
能通信,求所有的数据的average, 中位数,要求最少的communication,卫星的容量跟
基站一样
4. 有杯橙汁和咖啡,体积都是10,把1/10的橙汁倒入到咖啡,在把搅匀的咖啡倒1/10
到橙汁,问橙汁中的咖啡跟咖啡中的橙汁数量关系
5. 判断有向图中是否有环
6. 如何抽取feature,如何判断2个用户的相似度,维度大(几千)而稀疏(很多缺失
),比如a用户
[{age:30}, {salary: 100}, {score: 0.21}, {xxx:aas}, ....]
b用户
[{age:30}, {gender: 1}, {score: 0.21}, {xyz:aas}]
... 阅读全帖 |
|
d********w 发帖数: 363 | 12 1. 1PB 数据排序,数值范围2^64, 每台机器16G内存,10T数据,普通硬盘,写算法,估
算时间
2. ip表定位,有个1G个record的ip文件,里面记录(start_ip, end_ip, longitude,
latitude, country), 给出一个ip,要求迅速查询到地理位置,给的内存有限
3. 有几个卫星,可以通信到地面的任意基站,每个基站上都有大量数据,基站之间不
能通信,求所有的数据的average, 中位数,要求最少的communication,卫星的容量跟
基站一样
4. 有杯橙汁和咖啡,体积都是10,把1/10的橙汁倒入到咖啡,在把搅匀的咖啡倒到橙汁,最后它们体积仍然是10,问橙汁
中的咖啡跟咖啡中的橙汁数量关系
5. 判断有向图中是否有环
6. 如何抽取feature,如何判断2个用户的相似度,维度大(几千)而稀疏(很多缺失
),比如a用户
[{age:30}, {salary: 100}, {score: 0.21}, {xxx:aas}, ....]
b用户
[{age:30}, {gender: 1}, {score: 0.21}, {xy... 阅读全帖 |
|
g*****e 发帖数: 282 | 13 1. 1PB 数据排序,数值范围2^64, 每台机器16G内存,10T数据,普通硬盘,写算法,估
算时间
--典型的大数据内存放不下排序,merge sort/external sort。可以探讨下cache的
优化,减少read fault
2. ip表定位,有个1G个record的ip文件,里面记录(start_ip, end_ip, longitude,
latitude, country), 给出一个ip,要求迅速查询到地理位置,给的内存有限
--对纪录先排序,用stack合并有重叠的,然后hash。因为ip addr其实就是个32bit
int,所以一般的机器内存也够了。
3. 有几个卫星,可以通信到地面的任意基站,每个基站上都有大量数据,基站之间不
能通信,求所有的数据的average, 中位数,要求最少的communication,卫星的容量跟
基站一样
--卫星理解成mem,基站为harddrive,分块load data。归结到多个sort array找
median,经典写起来麻烦题~
4. 有杯橙汁和咖啡,体积都是10,把1/10的橙汁倒入到咖啡,在把搅匀的咖啡倒... 阅读全帖 |
|
|
g*****e 发帖数: 282 | 15 1. 1PB 数据排序,数值范围2^64, 每台机器16G内存,10T数据,普通硬盘,写算法,估
算时间
--典型的大数据内存放不下排序,merge sort/external sort。可以探讨下cache的
优化,减少read fault
2. ip表定位,有个1G个record的ip文件,里面记录(start_ip, end_ip, longitude,
latitude, country), 给出一个ip,要求迅速查询到地理位置,给的内存有限
--对纪录先排序,用stack合并有重叠的,然后hash。因为ip addr其实就是个32bit
int,所以一般的机器内存也够了。
3. 有几个卫星,可以通信到地面的任意基站,每个基站上都有大量数据,基站之间不
能通信,求所有的数据的average, 中位数,要求最少的communication,卫星的容量跟
基站一样
--卫星理解成mem,基站为harddrive,分块load data。归结到多个sort array找
median,经典写起来麻烦题~
4. 有杯橙汁和咖啡,体积都是10,把1/10的橙汁倒入到咖啡,在把搅匀的咖啡倒... 阅读全帖 |
|
|
p*****2 发帖数: 21240 | 17 假设有1 billion user
每个user平均每天new一个event
平均每天读10次
那么大概每秒10k的写和100k的读
如果每个user可以使用1M的存储空间,那么total就是1PB,属于大数据了
当然实际使用的情况感觉应该没有这个大,但是potentilly还是可能的, 我感觉实际情
况100T应该是够了 (90%的user不怎么使用calendar)
从这个分析来说, Cassandra handle起来应该没什么问题,是一个不错的选择, 一般
的SQL就不适合处理这么大量了。 |
|
|
w********s 发帖数: 1570 | 19 数据量达不到1PB/day的公司想不出搞大数据有啥意义. |
|
h********3 发帖数: 2075 | 20 如果要1PB/day的公司才能搞的大数据,那多半也是屠龙技,不搞也罢。 |
|
w********s 发帖数: 1570 | 21 差不多,除非你的数据大到每天1pb,否则用用传统的rdbms/array就行了。 |
|
l*****n 发帖数: 246 | 22 1PB 数据排序,数值范围2^64, 每台机器16G内存,10T数据,普通硬盘,写算法,估算
时间 |
|
w*****t 发帖数: 485 | 23 分块, 然后归并排序吧.
nlogn.
"1PB数据排序", 后面还有个"10T数据",这个啥意思? |
|
l*****n 发帖数: 246 | 24 分块,然后归并排序会不会太慢?
10T数据是指硬盘空间是10T
总共1PB也就是需要100台机器 |
|
l*********8 发帖数: 4642 | 25 【 以下文字转载自 Military 讨论区 】
发信人: gshjj (H3-> ?4), 信区: Military
标 题: 世界最大色情网站每月访问量44亿(转载) (转载)
发信站: BBS 未名空间站 (Thu May 7 01:37:54 2015, 美东)
发信人: officegirl (云水谣), 信区: Sex
标 题: 世界最大色情网站每月访问量44亿(转载)
发信站: BBS 未名空间站 (Mon May 4 02:37:41 2015, 美东)
生活在互联网世界的人,都曾或多或少地浏览过在许多国家仍受管制的色情网站。
我们很难洞察这类网站的发展状况,因为相关的确切数据实在是少之又少。可以肯定的
是,色情网站的访问量肯定少不了。事实证明上述猜测是正确的,因为根据谷歌旗下广
告服务商Doubleclick的数据显示,独立访问量前500名的网站中,竟有数十个是成人网
站!
世界上最大的色情网站Xvideos每月有44亿的访问量 ,这个数字是CNN官网或24小时
专门播放体育节目ESPN电视网的访问量的3倍,是社交新闻站点Reddit的2倍。YouPorn
... 阅读全帖 |
|
N*D 发帖数: 3641 | 26 放内存还是放硬盘,交给storage layer决定,不是你app layer考虑的问题。
最后还是一句话:需求不明,没发设计。
数据量多大?1GB?1TB?1PB?
访问量多大?读多少?写多少?1 qps,还是100qps,还是100k qps,还是10m qps
Latency要求?1ms?10ms?100ms?1s?
然后use case:需要给短的读长的?需要给长的读短的?
然后各种细节:一个长的缩成固定的短的?同一个用户short一个长的consistently产
生一个短的?不同用户short一个长的产生几个短的?
等把问题弄清楚,面试就差不多结束了。 |
|
c********t 发帖数: 5706 | 27 上次onsite, 被问能同时做多少个DB update status (没说是什么DB), 卡了。
想问一下怎么估算资源?哪里有学习讲解的?
比如说merge sort吧, 1GB的整数,如果用多线程,如何在一个server上估算需要多少
线程,1秒能sort多少?1PB数据,用多少servers? |
|
d********g 发帖数: 10550 | 28 照SSD目前这个发展速度,SDXC也快死了。以后相机直接内置小型高速SSD,1PB给你用 |
|
a***a 发帖数: 40617 | 29 最近才开始用这个,迅雷我看是不准备上市了,准备死磕屌丝用户市场了
几个迅雷的新概念
1.离线下载
等于就是p2p替你挂机。从此告别无种求种。等于是你发送一个bt/e2dk连接给迅雷
服务器,服务器替你在其他用户那里找源。但是99%的情况下服务器自己本身就已经
有这个文件了。然后等于你用http方式直接从服务器上取下来。你可以要求服务器
暂时hold住这个文件7~9天,并且可以续时间。普通用户是10G空间(清空这个文件
以后空间会补回来),年费用户是1000TB(1PB),你没有看错,一辈子估计用不完。
而且视频文件甚至不用取回本地,可以直接从服务器上云播放,我测试速度大概是
300KBps,看个连续剧啥的无压力
2.高速通道
其实跟上面一回事,还是类似迅雷最早的盗链(磁力链),从源地址帮你普通http
下载的同时,从服务器上也给你开一个进程下同一个文件。
年费用户5个同时进行的任务(普通用户3个),配合加速,全局下载速度可以达到
1.5~2MBps。而且因为不是p2p,对同一个网的其他用户没有干扰
高速流量,普通用户30G/月,年费用户70G/月
普通月费用户 10rmb一个月
年费用... 阅读全帖 |
|
a***a 发帖数: 40617 | 30 1.p2p现在严打
2.你所谓快又多块?我迅雷离线,可以到6~10MBps(不是mbps),1G的电影几分钟下完
3.很多稀缺资源,p2p根本没100%的,迅雷的东西都在server上放着,大部分都直接
100%好了。有些没有的,迅雷帮你挂机,你自己不用天天开着电脑等
4.迅雷年费会员1PB离线空间(你没有看错)。而且很多可以云播放 |
|
s******s 发帖数: 13035 | 31 对免费云计算资源感兴趣的
有一个Petabyte-scale的云计算资源,可以用来储存数据以及进行科学计算,
有点类似AWS,现在有许多NIH以及NASA等也在使用。这个资源现在对非营利科
研用途是免费的, 上面还有一些pipeline,比如基因组分析一类的。不管是有
大的project或者自己用来玩玩都可以,3/12号有一个demo的seminar教如何注
册和使用。有兴趣的可以快去报名注册。
注册的时候“how did you hear about this OSDC demo", 你填mitbbs就行,
不要填我的名字shakuras. 我没啥好处可以捞,这个信息完全是内部统计用。
Hello,
We'd like to encourage you and interested members of your team, lab, and
department to attend our next webconference demo of the Open Science Data
Cloud (OSDC) on Wed 3/12 @ 11am CT.
The OSDC pro... 阅读全帖 |
|
i*****o 发帖数: 1714 | 32 这个1pb的storage是真的吗?
是不是我一个developer account一年交99刀,然后可以分一千份卖出去,每份每年0.
99刀,我还赚900刀一年?
不make sense啊。
★ 发自iPhone App: ChineseWeb 8.7 |
|
N**D 发帖数: 10322 | 33 传统数据库根本对付不了大量的数据
哪个数据库可以存储1PB 的数据? |
|
s******s 发帖数: 13035 | 34 【 以下文字转载自 PDA 讨论区 】
发信人: shakuras (doskey), 信区: PDA
标 题: 对免费云计算资源感兴趣的
发信站: BBS 未名空间站 (Mon Mar 3 15:20:25 2014, 美东)
发信人: shakuras (doskey), 信区: Apple
标 题: 对免费云计算资源感兴趣的
发信站: BBS 未名空间站 (Mon Mar 3 15:18:17 2014, 美东)
对免费云计算资源感兴趣的
有一个Petabyte-scale的云计算资源,可以用来储存数据以及进行科学计算,
有点类似AWS,现在有许多NIH以及NASA等也在使用。这个资源现在对非营利科
研用途是免费的, 上面还有一些pipeline,比如基因组分析一类的。不管是有
大的project或者自己用来玩玩都可以,3/12号有一个demo的seminar教如何注
册和使用。有兴趣的可以快去报名注册。
注册的时候“how did you hear about this OSDC demo", 你填mitbbs就行,
不要填我的名字shakuras. 我没啥好处可以捞,... 阅读全帖 |
|
t**t 发帖数: 27760 | 35 硬件系统
·计算阵列:2560个计算结点,每个计算结点集成2个Intel CPU,配32GB内存。
·加速阵列:2560个加速结点,每个加速结点含2个AMD GPU、 2GB显存。
·服务阵列:512个服务结点,每个服务结点含2个Intel EP CPU、32GB内存。
·互连通信子系统:采用两级Infiniband QDR互,单个通信链路的通信带宽为40Gb
ps、延迟1.2μs。
·I/O存储子系统:采用全局分布共享并行I/O系统结构,磁盘总容量1PB。
·监控:采用分布式集中管理结构,实现全系统的实时安全监测、系统控制和调试
诊断等功能。
“天河一号”的峰值性能可以达到1.206PFlops,LINPACK测试性能563.1TFlops@575MHz
,超过2009年6月TOP500第四位;系统能效为431.7MFlops/W,超过2009年6月Green500第
五位。 |
|
f*******2 发帖数: 211 | 36
1000TB/10min 1,000,000,000MB/600 Seconds =1,666,666.67 MB/S
驱动器Tape Drive 300MB/S, 1,666,666.67/300=5,555.56
共需要5556个驱动器同时读。
1PB/10分钟, 10PB 100分钟就恢复备份完毕了。
真是大手笔。 |
|
x***4 发帖数: 1815 | 37 参赛的有840(Tlc)和840 pro。
840在900tb的时候挂了,840 pro还没有挂(现在已经超过1pb了)
intel的335是 700tb的时候挂的。 |
|
s******s 发帖数: 13035 | 38 【 以下文字转载自 DataSciences 讨论区 】
发信人: shakuras (doskey), 信区: DataSciences
标 题: 这里有免费的云计算存储资源
发信站: BBS 未名空间站 (Mon Mar 3 15:25:10 2014, 美东)
这里有免费的云计算存储资源
有一个Petabyte-scale的云计算资源,可以用来储存数据以及进行科学计算,
有点类似AWS,现在有许多NIH以及NASA等也在使用。这个资源现在对非营利
科研用途是免费的, 上面还有一些pipeline,比如基因组分析一类的。不管
是有大的project或者自己用来玩玩都可以,3/12号有一个demo的seminar
教如何注册和使用。有兴趣的可以快去报名注册。
注册的时候“how did you hear about this OSDC demo", 你填mitbbs
就行, 不要填我的名字shakuras. 我没啥好处可以捞,这个信息完全是内部统
计用。
Hello,
We'd like to encourage you and interested members of you... 阅读全帖 |
|
s******s 发帖数: 13035 | 39 【 以下文字转载自 DataSciences 讨论区 】
发信人: shakuras (doskey), 信区: DataSciences
标 题: 这里有免费的云计算存储资源
发信站: BBS 未名空间站 (Mon Mar 3 15:25:10 2014, 美东)
这里有免费的云计算存储资源
有一个Petabyte-scale的云计算资源,可以用来储存数据以及进行科学计算,
有点类似AWS,现在有许多NIH以及NASA等也在使用。这个资源现在对非营利
科研用途是免费的, 上面还有一些pipeline,比如基因组分析一类的。不管
是有大的project或者自己用来玩玩都可以,3/12号有一个demo的seminar
教如何注册和使用。有兴趣的可以快去报名注册。
注册的时候“how did you hear about this OSDC demo", 你填mitbbs
就行, 不要填我的名字shakuras. 我没啥好处可以捞,这个信息完全是内部统
计用。
Hello,
We'd like to encourage you and interested members of you... 阅读全帖 |
|
s******s 发帖数: 13035 | 40 【 以下文字转载自 Physics 讨论区 】
发信人: shakuras (doskey), 信区: Physics
标 题: 免费的云计算存储资源 Open Science Data Cloud (转载)
发信站: BBS 未名空间站 (Mon Mar 3 15:29:52 2014, 美东)
发信人: shakuras (doskey), 信区: Mathematics
标 题: 免费的云计算存储资源 Open Science Data Cloud
发信站: BBS 未名空间站 (Mon Mar 3 15:29:28 2014, 美东)
发信人: shakuras (doskey), 信区: Statistics
标 题: 免费的云计算存储资源 Open Science Data Cloud
发信站: BBS 未名空间站 (Mon Mar 3 15:29:10 2014, 美东)
免费的云计算存储资源 Open Science Data Cloud
多转几个版。这个是非商业的科研机构,我也没好处可捞,不算违规吧?
有一个Petabyte-scale的云计算资源,可以用... 阅读全帖 |
|
s******s 发帖数: 13035 | 41 【 以下文字转载自 Statistics 讨论区 】
发信人: shakuras (doskey), 信区: Statistics
标 题: 免费的云计算存储资源 Open Science Data Cloud
发信站: BBS 未名空间站 (Mon Mar 3 15:29:10 2014, 美东)
免费的云计算存储资源 Open Science Data Cloud
多转几个版。这个是非商业的科研机构,我也没好处可捞,不算违规吧?
有一个Petabyte-scale的云计算资源,可以用来储存数据以及进行科学计算,
有点类似AWS,现在有许多NIH以及NASA等也在使用。这个资源现在对非营利
科研用途是免费的, 上面还有一些pipeline,比如基因组分析一类的。不管
是有大的project或者自己用来玩玩都可以,3/12号有一个demo的seminar
教如何注册和使用。有兴趣的可以快去报名注册。
注册的时候“how did you hear about this OSDC demo", 你填mitbbs
就行, 不要填我的名字shakuras. 我没啥好处可以捞,这个信息完全是... 阅读全帖 |
|
s******s 发帖数: 13035 | 42 【 以下文字转载自 Mathematics 讨论区 】
发信人: shakuras (doskey), 信区: Mathematics
标 题: 免费的云计算存储资源 Open Science Data Cloud
发信站: BBS 未名空间站 (Mon Mar 3 15:29:28 2014, 美东)
发信人: shakuras (doskey), 信区: Statistics
标 题: 免费的云计算存储资源 Open Science Data Cloud
发信站: BBS 未名空间站 (Mon Mar 3 15:29:10 2014, 美东)
免费的云计算存储资源 Open Science Data Cloud
多转几个版。这个是非商业的科研机构,我也没好处可捞,不算违规吧?
有一个Petabyte-scale的云计算资源,可以用来储存数据以及进行科学计算,
有点类似AWS,现在有许多NIH以及NASA等也在使用。这个资源现在对非营利
科研用途是免费的, 上面还有一些pipeline,比如基因组分析一类的。不管
是有大的project或者自己用来玩玩都可以,3/12号有一个... 阅读全帖 |
|
w********s 发帖数: 1570 | 43 【 以下文字转载自 JobHunting 讨论区 】
发信人: winetricks (winetricks), 信区: JobHunting
标 题: 金融压根不需要大数据, 因为数据量本来就很小
发信站: BBS 未名空间站 (Sun Mar 22 11:22:57 2015, 美东)
数据量达不到1PB/day的公司想不出搞大数据有啥意义. |
|
s******s 发帖数: 13035 | 44 【 以下文字转载自 Apple 讨论区 】
发信人: shakuras (doskey), 信区: Apple
标 题: 对免费云计算资源感兴趣的
发信站: BBS 未名空间站 (Mon Mar 3 15:18:17 2014, 美东)
对免费云计算资源感兴趣的
有一个Petabyte-scale的云计算资源,可以用来储存数据以及进行科学计算,
有点类似AWS,现在有许多NIH以及NASA等也在使用。这个资源现在对非营利科
研用途是免费的, 上面还有一些pipeline,比如基因组分析一类的。不管是有
大的project或者自己用来玩玩都可以,3/12号有一个demo的seminar教如何注
册和使用。有兴趣的可以快去报名注册。
注册的时候“how did you hear about this OSDC demo", 你填mitbbs就行,
不要填我的名字shakuras. 我没啥好处可以捞,这个信息完全是内部统计用。
Hello,
We'd like to encourage you and interested members of your team, lab, and
d... 阅读全帖 |
|
s******s 发帖数: 13035 | 45 【 以下文字转载自 Apple 讨论区 】
发信人: shakuras (doskey), 信区: Apple
标 题: 对免费云计算资源感兴趣的
发信站: BBS 未名空间站 (Mon Mar 3 15:18:17 2014, 美东)
对免费云计算资源感兴趣的
有一个Petabyte-scale的云计算资源,可以用来储存数据以及进行科学计算,
有点类似AWS,现在有许多NIH以及NASA等也在使用。这个资源现在对非营利科
研用途是免费的, 上面还有一些pipeline,比如基因组分析一类的。不管是有
大的project或者自己用来玩玩都可以,3/12号有一个demo的seminar教如何注
册和使用。有兴趣的可以快去报名注册。
注册的时候“how did you hear about this OSDC demo", 你填mitbbs就行,
不要填我的名字shakuras. 我没啥好处可以捞,这个信息完全是内部统计用。
Hello,
We'd like to encourage you and interested members of your team, lab, and
d... 阅读全帖 |
|
s******s 发帖数: 13035 | 46 【 以下文字转载自 Biology 讨论区 】
发信人: shakuras (doskey), 信区: Biology
标 题: 这里有免费的云计算存储资源
发信站: BBS 未名空间站 (Mon Mar 3 15:25:38 2014, 美东)
发信人: shakuras (doskey), 信区: DataSciences
标 题: 这里有免费的云计算存储资源
发信站: BBS 未名空间站 (Mon Mar 3 15:25:10 2014, 美东)
这里有免费的云计算存储资源
有一个Petabyte-scale的云计算资源,可以用来储存数据以及进行科学计算,
有点类似AWS,现在有许多NIH以及NASA等也在使用。这个资源现在对非营利
科研用途是免费的, 上面还有一些pipeline,比如基因组分析一类的。不管
是有大的project或者自己用来玩玩都可以,3/12号有一个demo的seminar
教如何注册和使用。有兴趣的可以快去报名注册。
注册的时候“how did you hear about this OSDC demo", 你填mitbbs
就行, 不要填我的名字... 阅读全帖 |
|