A***g 发帖数: 158 | 1 关系数据库(Relational Database):一个关系数据库是由若干表
组成。在Delphi中,数据库概念对应到物理文件上是有一些不同的
。对于dBASE、FoxPro、Paradox这三种数据库系统,数据库对应于某
一个子目录,而其它类型如MSAccess、Btrieve则是指某个文件。这
是因为前者的表为单独的文件,而后者的表是聚集在一个数据库文
件中的。
表(Table):一个表就是一组相关的数据按行排列,象一张表格
一样。比如一个班所有学生的期末考试成绩,存在一个表中,每一
行对应一名学生,在这一行中,包括学生的学号、姓名以及各门
课程的成绩。
字段(Field):在表中,每一列称为一个字段。每一个字段都
有相应的描述信息,如数据类型、数据宽度等。
记录(Record):在表中,每一行称为一条记录。
索引(Index):为了加快访问数据库的速度,许多数
据库都使用索引。 |
|
s******a 发帖数: 184 | 2 面试的工作要求在关系数据库上有处理大规模数据的经验,这都包括哪些SQL技能呀? |
|
l**e 发帖数: 42 | 3 据库技术经过多年的发展,在数据类型、存储容量、存取速度、
触发机制、数据完整性及一致性等诸多方面都有了很大提高,成为
了各行各业存放信息最主要的方式。随着计算机技术、尤其是
Internet技术的飞速发展,对数据库技术又提出了新的挑战和要
求。
数据库作为支撑Internet应用的Internet平台的核心,担当信息
流通的枢纽,它的好坏,直接关系Internet应用的成功与否。今天
的信息种类繁多,格式多样,而且内容的激增,使得传统的管理方
法难以驾驭,对信息难以查找、定位,对信息难以维护。尤其在管
理多媒体内容方面,在技术上,管理方法上与传统关系型数据库很
不一样。在这一方面,数据库厂商把对象管理技术同关系数据库技
术结合在一起,使数据库不仅能够管理传统字符 |
|
A***g 发帖数: 158 | 4 发信人: chrs (胖胖), 信区: database
标 题: 数据库知识入门之2.(数据库管理系统简介)
发信站: 西北网络中心兵马俑 BBS 站 (Thu Dec 24 13:59:46 1998)
数据库管理系统(DBMS)是用于描述、管理和维护数据库的程序系统,
是数据库系统的核心组成部分。它建立在操作系统的基础上,对数据
库进行统一的管理和控制。其主要功能有:
1.描述数据库:描述数据库的逻辑结构、存储结构、语义信息和
保密要求等。
2.管理数据库:控制整个数据库系统的运行,控制用户的并发
性访问,检验数据的安 全、保密与完整性,执行数据检索、插入、删除、修改等操作。
3.维护数据库:控制数据库初始数据的装入,记录工作日志,
监视数据库性能,修改更新数据库,重新组织数据库,恢复出现故障的数据库。
4.数据通信 :组织数据的传输。
DBMS主要有四种类型:文件管理系统、层次数据库系统、
网状数据库系统和关系数据库系统。 |
|
发帖数: 1 | 5 第一数据不要直接写到数据库, 放在缓冲区攒齐了一起写
关系数据库的IO性能本来就奇差无比,你这完全是没实战经验
第二其实最好不要用数据库存储, 直接写在磁盘上, 后期计算几百万量级的数据直接
上大内存全部load到内存操作
第三, 大规模的数据排序更不要用关系数据库,直接写在磁盘上用external merge
sort, 这是通用做法
综上所述,你根本的错误就在于不应该在这里用数据库 |
|
发帖数: 1 | 6
看需要什么的环境吧
如果是要上关系数据库,只考虑读的速度memcached 和上面提到的 redis 都可以
关系数据库要读写都快,那就是redis
如果数据关联性不强, 那就用 nosql。或者土方法直接 hashtable + 大文件块
真要搞海量文件系统 google那篇 bigtable 要好好读
另外现在好像有新的海量关系数据库,没仔细看 |
|
f***y 发帖数: 4447 | 7 这就是为什么美国要搞阿里了
https://www.cnbeta.com/articles/tech/895899.htm
据权威机构国际事务处理性能委员会(TPC,Transaction Processing Performance
Council)官网披露,中国蚂蚁金服自主研发的金融级分布式关系数据库OceanBase,在
被誉为“数据库领域世界杯”的TPC-C基准测试中,打破了由美国公司Oracle(甲骨文
)保持了9年之久的世界记录,成为首个登顶该榜单的中国数据库产品。
中国工程院院士、计算机专家李国杰对此评价,这是中国基础软件取得的重大突破。
图/TPC官网截图
TPC-C是全球主流计算机硬件厂商、数据库厂商公认的权威标准。过去数十年,TPC-C一
直是海外传统数据库厂商竞技的舞台,Oracle更是制霸该榜单长达9年。OceanBase是登
上TPC-C排行榜前列、由中国公司完全自主研发的第一款大型数据库产品,其创造的新
的联机交易处理系统(OLTP)世界纪录,是Oracle最好成绩的两倍多。
作为基于云计算分布式的新一代数据库,OceanBase在性能指标上大幅超越Orac... 阅读全帖 |
|
w********h 发帖数: 12367 | 8 http://www.sdb.ac.cn/thesis/thesis5/paper/p36.doc
摘 要 共混聚合物的相态行为是研究高分子材料的共混改性,发展高性能高分子材料
的重要数据资源。本文对共混聚合物相态行为的复杂性进行讨论,并由此得出描述共混聚
合物相容性的必要信息及其相互之间的关系。在此基础上,采用关系数据库模型构造了共
混聚合物相容性数据库。该数据库可提供共混聚合物相容性数据,以及聚合物属性、共混
聚合物的组成与制备方法、数据测定方法、数据来源等描述共混聚合物相容性的完备信息
。此外,由描述共混聚合物相容性的必要信息的分析,在数据库中提出了评价相容性数据
质量的表征方法。 |
|
aw 发帖数: 127 | 9 VB.NET是用来写应用程序的(可能访问数据库也可能不用),和用什么数据库没有必然关系
,数据库是用来存储数据的,这点不要搅浆糊。VB.NET里用ADO和数据库进行连接,数据
库可以是任何一家生产的,并不是说一定要用微软的SQL SERVER。
你看来是初学,建议你先不要考虑SQL SERVER,用ACCESS就可以了,基本的功能够你用的
了,也不用多花钱,等把数据库基本的设计,SQL搞熟了,再去找个FREE的EVALUATION版(
6个月)的SQL SERVER来用。
visual studio .net一般学校里都和微软有协议,可以几十块就买到学生版的,先拿来把
编程的内容学会了。 |
|
s*******f 发帖数: 1114 | 10 大虾指点下,谢谢。
是什么重要特性让关系数据库能经济地处理超大数据?
大数据的什么特性会使的关系数据库不是选择? |
|
s*******f 发帖数: 1114 | 11 大虾指点下,谢谢。
是什么重要特性让关系数据库能经济地处理超大数据?
大数据的什么特性会使的关系数据库不是选择? |
|
|
b*******s 发帖数: 16 | 13 第一、不要信我的误导,我胡说的成分比较多
第二、这个东西说起来是很直观的概念,事实上没有很成功地成为方向
前5、6年还满热门的一个研究方向,很快就让位给别的了,好象很多东西也没有定论
第三、最终的存储方式,应该有很多种,大家不必关心。你难道知道关系数据库
的内部存储管理
第四、数据库终极的形式就是一个虚拟的世界,按照你定义的模型生长发展
其中的类又你来定义,其中的对象就受外部的控制了
其中一些对象甚至是自生自灭的
数据库本身并不关心具体编程的语言,但是可以和对象语言有更好的借口 |
|
w**z 发帖数: 8232 | 14 用啥语言和数据库没啥关系。数据库对各种语言都有client
lib. |
|
r**m 发帖数: 446 | 15 阿里的oceanbase,自己开发的关系数据库。
开源的mysql, postgres很好用,互联网公司标配
大数据一来,一堆nosql数据库,hadoop, hbase, cassandra, redis
云计算,狗家的spanner, 等
oracle, sql server本来活的不容易 |
|
p***m 发帖数: 387 | 16 首先你用 FOREIGN KEY 会影响速度,从这个应用来看没有必要。
前面那位同学说的都全写进一个表里,每种爱好一个列,这非常不好,浪费大量空间,
也违背了关系数据库的原则。
用户可以(按任何一种有道理的方式比如地区、名字)partition,可以加快查询的速
度。
爱好可以考虑两种办法提高效率,其本质是一样的。一是你现有的设计,按爱好的不同
partition。还有一种办法,每个爱好或着一类爱好一个表(比如运动类表,艺术类表
)。
补充一句,我不是DBA,只是工作中要用到数据库,所以还是让真正的专业人士来回答
更有价值。 |
|
d******c 发帖数: 2407 | 17 关系数据库建在那几条原则之上。你用不上的话就不需要用数据库。
仅仅是duplicate,那就是hash table足够。找个快的二进制格式存文件,尽量用内存。 |
|
g****t 发帖数: 31659 | 18 Excel同时写照样也有锁
我觉得问题就在于他不用自带的存储过程
用别的踩了坑
我猜
所有逻辑数据库端存储过程实现
Vs excel vba
前者不应该差很多
: 他一开始本机excel vba 是没啥问题啊
: 问题在于他后来在上mysql
: mysql 没有优化的话,同时写150个记录就可能出问题
: 关系数据库同时写从来都是大问题,因为有lock
|
|
l******0 发帖数: 244 | 19 如果想存储所有学生以及学生与学生之间的朋友关系,一个表存学生, 另一个表存朋友
关系。
Student(id, name)
Friend (id_from, id_to)
由于关系是双向的,对每个关系,Friend 里面需要存两次,这样才方便查询。
a->b
b->a
但查询语句需要用到两个 Join.
这种多对多关系的存储和检索,关系数据库里面这是常见的方法吗?
Test here:
http://sqlfiddle.com/#!9/5ec63/1 |
|
t****n 发帖数: 10724 | 20 希望中国公司能做出像SQL Server和Oracle 一样的通用型关系数据库软件。总有一天
美国会禁止中国用美国的软件 |
|
发帖数: 1 | 21 厚积薄发,是中国的一句古语。用在现在的中国身上一点都不为过。中国通过30多年的
改革开放,技术积累,以及不断的追赶。
在军事和民用科技方面,已经积淀了大量的技术。未来将会是中国科技技术的爆炸时期
,这一段时期,主要以中国对欧美国家技术的赶超为具体的方式。
最近,由中国蚂蚁金服集团研发的分布式关系数据库OceanBase,直接干掉了在这一领
域保持了9年记录的甲骨文公司的产品。
性能超过甲骨文产品的100%,可以用完爆来形容。
甲骨文老板之前接受采访的时候表达过对中国的担忧,他说绝对不能够让中国的工程师
超过美国。 |
|
y****w 发帖数: 3747 | 22 现在data scientist招人基本还是统计背景的多。sas/r之类必备。可能跟很多这方面
的manager大部分统计背景有关系。
数据库这边好处是工作机会多些。 |
|
n*w 发帖数: 3393 | 23 尤其是关系数据库,列可以随便换而不改变内容,听说不容易转换为类似图像的矩阵,
而不适合CNN? |
|
发帖数: 1 | 24
他一开始本机excel + vba 是没啥问题啊
问题在于他后来在上mysql
mysql 没有优化的话,同时写150个记录就可能出问题
关系数据库同时写从来都是大问题,因为有lock |
|
l******0 发帖数: 244 | 25 NO-SQL 更简单吗?
关系数据库里面典型的多对多关系,这里用 SQL 也很好吧? |
|
D*********a 发帖数: 398 | 26 数据项的名称都是一样的,把结构变成了关系对象,有很多nested tables. |
|
d********0 发帖数: 5142 | 27 ☆─────────────────────────────────────☆
xmfdrspeech (Jackie) 于 (Thu Apr 21 11:28:56 2011, 美东) 提到:
交大内网泄露出的惊人内幕
由于中国上海交通大学网络故障,不能连外面。面对信息闭塞的无聊苦闷,学生们在内
部网乱逛。大概是
教导处那位昏了头,下面这份东西共享却没设密码!呵呵,学生将它贴到交大饮水思源
站上后,20分钟后
就被斑竹删了,不过已经成为了当天十大之二,不过后来者看不到内容罢了:)
虽然这很普遍,虽然大家心知肚明,呵呵,但这份材料是如此清晰的将情况摆在我们面
前:
机动指标使用讨论材料
] 1 校领导接收
] 招生特殊情况汇总
] 考生姓名 生源 分数 学校加分因素 专业情况 委托人拟解决意见
] 曹炎焱 江苏 620 生物医学工程、金融、电气、应用物理
] 胡光 安徽 609 环境工程、英语 发展研究中心徐诤处长推荐
] 韩超阳 上海 507 电子信息工程、计算机、自动化 闵行区委办公室韩朝阳之弟
保证专业
] 袁毅婷 上海 482 5 测控 保证... 阅读全帖 |
|
G****a 发帖数: 10208 | 28 拉里·埃利森
年龄:56岁
身高:6英尺
出生地:芝加哥
子女:两名
个人爱好:驾驶一架意大利喷气式战斗机和一艘78英尺长的赛艇
拉里·埃利森 - 简介
拉里·埃利森是世界上最大数据库软件公司的老板,他的产品遍布全世界。他是陌
生的人,但谁都似乎无法离开他。埃里森在32岁以前还一事无成。读了三个大学,没得
到一个学位文凭,换了十几家公司,老婆也离他而去。开始创业时只有1200美元,却使得
Oracle公司连续12年销售额每年翻一番,成为世界上第二大软件公司,他自己也成为硅谷
首富。但世人知道,这期间他经历了多么漫长的人生奋斗历程。埃里森是美国犹太人,
俄罗斯移民,出生在1944年的曼哈顿,他的未婚妈妈只有19岁。埃里森由舅舅一家抚养,
在芝加哥犹太区中下阶层长大,那时贫富的差别没有现在巨大。学生时代的埃里森并没
有显示出超人的素质和成绩,在学校他非常孤僻,独来独往,不过却十分注意打扮和享受,
在别的孩子还是由父母来理发时,他却请专业理发师打理。
拉里·埃利森 - 性格
极具魅力和侵略性的酷脸,咄咄逼人的口才,近乎疯狂的休闲方式,使得甲骨文公
司首席执行官拉里·埃利森成为美国硅谷人人皆知... 阅读全帖 |
|
x**n 发帖数: 12542 | 29 ☆─────────────────────────────────────☆
Westridge (西岭) 于 (Wed Apr 18 00:03:19 2012, 美东) 提到:
Java开发人员知识点
1.听说过James Gosling,SUN和Oracle公司。知道网上下载Java的地址,在哪讨论Java
。练习过Java在Windows下的安装和配置。知道Java应用系统中常见的几种license和JCP。了
解bytecode和Java在不同系统下可以轻松移植的原理。
2.懂得基本的Java编程和行命令格式。了解面向对象的编程思路。
几个基本点:Java基本语法和控制结构,命名和代码风格,结构化,对象封装,继承,
抽象,多态,接口,异常处理,堆空间,栈空间,垃圾回收器,static,this,
synchronized,annotations,JUnit,JDBC,JSP/servlet
Java Core APIs: java.lang,java.util,java.io,java.awt,javax.swing,JFrame
,String,java.sql... 阅读全帖 |
|
a***y 发帖数: 19743 | 30 ☆─────────────────────────────────────☆
Corinthian (Diogenes门下一走狗) 于 (Wed May 5 17:04:59 2010, 美东) 提到:
1998年度 64mb的mp3直接用目录管理就好了,没人回说啥
2008年mp3 player已经存储几千首歌甚至上万,还总希望用目录方式管理,这已经不是
行为艺术了,这是iq低于75的直接表现
这跟几十万人的大公司死活要纸笔记账是一个德行
你可以说这是个人选择,没错,你非要吃屎的确是你的个人选择,但你不能劝别人一起
吃,更不能为了自己方便让坐便器厂商更改设计使你更容易的趴着吃屎
☆─────────────────────────────────────☆
meeweek (Meeweek 米粥) 于 (Wed May 5 17:14:40 2010, 美东) 提到:
强力插入。
☆─────────────────────────────────────☆
shadandan (我比小强惨) 于 (Wed May 5 17:15:26 2010,... 阅读全帖 |
|
|
r*****d 发帖数: 1924 | 32 【 以下文字转载自 WashingtonDC 讨论区 】
发信人: Westridge (西岭), 信区: WashingtonDC
标 题: Java开发人员知识点(更新)
发信站: BBS 未名空间站 (Wed Apr 18 00:03:19 2012, 美东)
Java开发人员知识点
1.听说过James Gosling,SUN和Oracle公司。知道网上下载Java的地址,在哪讨论Java
。练习过Java在Windows下的安装和配置。知道Java应用系统中常见的几种license和JCP。了
解bytecode和Java在不同系统下可以轻松移植的原理。
2.懂得基本的Java编程和行命令格式。了解面向对象的编程思路。
几个基本点:Java基本语法和控制结构,命名和代码风格,结构化,对象封装,继承,
抽象,多态,接口,异常处理,堆空间,栈空间,垃圾回收器,static,this,
synchronized,annotations,JUnit,JDBC,JSP/servlet
Java Core APIs: java.lang,java.util,java.io,java.a... 阅读全帖 |
|
W*******e 发帖数: 1268 | 33 先抛砖引玉总结一下个人使用Java经历,从用HotJava开始,第一个IDE用的是Symatec
Cafe,到现在的Eclipse和JDeveloper,看看知识有没有跟上现在的潮流,需要哪些改
进的地方请砸砖。对新的Java开发员如果有用的地方请给包子鼓励。
Java开发人员知识点
1.听说过James Gosling,SUN和Oracle公司。知道网上下载Java的地址,在哪讨论Java
。练习过Java在Windows下的安装和配置。知道Java应用系统中常见的几种license。了
解bytecode和Java在不同系统下可以轻松移植的原理。
2.懂得基本的Java编程和行命令格式。了解面向对象的编程思路。
几个基本点:Java基本语法和控制结构,命名和代码风格,结构化,对象封装,继承,
抽象,多态,接口,异常处理,堆空间,栈空间,垃圾回收器,static,this,
synchronized,annotations,JUnit,JDBC,JSP/servlet
Java Core APIs: java.lang,java.util,java.io,java.awt,javax... 阅读全帖 |
|
W*******e 发帖数: 1268 | 34 【 以下文字转载自 WashingtonDC 讨论区 】
发信人: Westridge (西岭), 信区: WashingtonDC
标 题: Java开发人员知识点
发信站: BBS 未名空间站 (Wed Apr 18 00:03:19 2012, 美东)
先抛砖引玉总结一下个人使用Java经历,从用HotJava开始,第一个IDE用的是Symatec
Cafe,到现在的Eclipse和JDeveloper,看看知识有没有跟上现在的潮流,需要哪些改
进的地方请砸砖。对新的Java开发员如果有用的地方请给包子鼓励。
Java开发人员知识点
1.听说过James Gosling,SUN和Oracle公司。知道网上下载Java的地址,在哪讨论Java
。练习过Java在Windows下的安装和配置。知道Java应用系统中常见的几种license。了
解bytecode和Java在不同系统下可以轻松移植的原理。
2.懂得基本的Java编程和行命令格式。了解面向对象的编程思路。
几个基本点:Java基本语法和控制结构,命名和代码风格,结构化,对象封装,继承,
抽象,多态,接口,异常处理,堆空... 阅读全帖 |
|
f*******3 发帖数: 351 | 35 【 以下文字转载自 WashingtonDC 讨论区 】
发信人: Westridge (西岭), 信区: WashingtonDC
标 题: Java开发人员知识点(更新)
发信站: BBS 未名空间站 (Wed Apr 18 00:03:19 2012, 美东)
Java开发人员知识点
1.听说过James Gosling,SUN和Oracle公司。知道网上下载Java的地址,在哪讨论Java
。练习过Java在Windows下的安装和配置。知道Java应用系统中常见的几种license和JCP。了
解bytecode和Java在不同系统下可以轻松移植的原理。
2.懂得基本的Java编程和行命令格式。了解面向对象的编程思路。
几个基本点:Java基本语法和控制结构,命名和代码风格,结构化,对象封装,继承,
抽象,多态,接口,异常处理,堆空间,栈空间,垃圾回收器,static,this,
synchronized,annotations,JUnit,JDBC,JSP/servlet
Java Core APIs: java.lang,java.util,java.io,java.a... 阅读全帖 |
|
|
a*******s 发帖数: 1698 | 37 第一个例子,热门专业和艺术生体育生没有任何关系,清华经管就有好多体育特招的。
如果他走艺术生体育生的路子,高考随便考点儿就进去了。
第二个例子,你也是道听途说吧,你真的见到人家改分了?从技术上说,银行存款的数
据库也是人弄的,工作人员能建立数据库,就能更改里面的信息,把自己的存款加几个
零。
真要是直接改数据库,而且改了数据库还能让你知道,他就不怕有人举报?到时候一核
对,卷面分和数据库对不上,改分的得担多大责任,换成是你,就算是自己亲儿子高考
,你负责数据库录入,你敢改分吗?你真是改数据库了,你会往外说吗?
改分的情况有,那是需要调出卷面来查卷的。你没有背景,不可能调出卷面给你查,也
就是核对一下各项有没有加错而已。有背景的,可以看到卷子,然后你觉得你做对了的
题发现批错了,可以改回来。直接改数据库那是有毛病的,改了还能让你这种不相干的
人知道,那是阴谋。
第三个例子,她只要达线了,那是可以操作的,但是你要看到这个前提“达线”。你报
一本的学校,就考了个大专线,亲爹亲妈是大学校长都没用。高考目前的公平,就体现
在这儿。
黑幕有没有,肯定有,但是对大多数人来说,高考是相对公平的,90%... 阅读全帖 |
|
f***y 发帖数: 4447 | 38 https://www.enmotech.com/web/detail/1/724/2.html
导读:日前,华为公司在京面向全球发布了人工智能原生(AI-Native)数据库GaussDB和
业界性能的分布式存储FusionStorage 8.0,将多年的AI技术和能力以及数据库经验融
入到新品,实现很多创新性突破,比如人工智能技术融入分布式数据库的全生命周期、
一套存储可同时支持块、文件、对象、HDFS协议等。
其中,最为标杆性的场景应用实属招商银行,在实践中:
华为GaussDB管理数据容量提升10倍,AZ内故障恢复速度提升30倍。以故障恢复为例,
GaussDB的RTO时间小于1秒,而其他厂商则需要30秒;
FusionStorage 8.0在招行,部署渠道接入、开发测试、VDI以及大数据系统,一套存储
替代原有4种存储设备,节省40%的TCO,业务上线速度提升9倍。其次,将人工智能技术
融入存储全生命周期管理,从资源规划、业务发放、系统调优、风险预测和故障定位等
方面实现智能运维管理,实现云上云下协同。再者,分布式存储性能业界第一,单节点
性能高达16.8万每秒读写速度(IO... 阅读全帖 |
|
s*********b 发帖数: 815 | 39 您老这个说法不够准确。Google当然用传统的关系数据库。他们的
Adwords就是用MySQL。Google Pay好像也用的MySQL,不过这个
我记不确切了。另外慢从来不是NoSQL运动攻击关系数据库的
重点。关系数据库的问题是扩展不容易。MapReduce也不是和数据库
竞争的产品。人是负责batch processing的大杀器。和关系数据库
对干的是Google的Big Table。 |
|
d********w 发帖数: 363 | 40 http://dongfei.baijia.baidu.com/article/54768
提到大数据分析平台,不得不说Hadoop系统,Hadoop到现在也超过10年的历史了,很多
东西发生了变化,版本也从0.x进化到目前的2.6版本。我把2012年后定义成后Hadoop平
台时代,这不是说不用Hadoop,而是像NoSQL (Not Only SQL)那样,有其他的选型补
充。我在知乎上也写过Hadoop的一些入门文章 如何学习Hadoop - 董飞的回答,为了给
大家有个铺垫,简单讲一些相关开源组件。
背景篇
Hadoop: 开源的数据分析平台,解决了大数据(大到一台计算机无法进行存储,一台计
算机无法在要求的时间内进行处理)的可靠存储和处理。适合处理非结构化数据,包括
HDFS,MapReduce基本组件。
HDFS:提供了一种跨服务器的弹性数据存储系统。
MapReduce:技术提供了感知数据位置的标准化处理流程:读取数据,对数据进行映射
(Map),使用某个键值对数据进行重排,然后对数据进行化简(Reduce)得到最终的
输出。
Amazon Elastic Map Red... 阅读全帖 |
|
d********w 发帖数: 363 | 41 http://dongfei.baijia.baidu.com/article/54768
提到大数据分析平台,不得不说Hadoop系统,Hadoop到现在也超过10年的历史了,很多
东西发生了变化,版本也从0.x进化到目前的2.6版本。我把2012年后定义成后Hadoop平
台时代,这不是说不用Hadoop,而是像NoSQL (Not Only SQL)那样,有其他的选型补
充。我在知乎上也写过Hadoop的一些入门文章 如何学习Hadoop - 董飞的回答,为了给
大家有个铺垫,简单讲一些相关开源组件。
背景篇
Hadoop: 开源的数据分析平台,解决了大数据(大到一台计算机无法进行存储,一台计
算机无法在要求的时间内进行处理)的可靠存储和处理。适合处理非结构化数据,包括
HDFS,MapReduce基本组件。
HDFS:提供了一种跨服务器的弹性数据存储系统。
MapReduce:技术提供了感知数据位置的标准化处理流程:读取数据,对数据进行映射
(Map),使用某个键值对数据进行重排,然后对数据进行化简(Reduce)得到最终的
输出。
Amazon Elastic Map Red... 阅读全帖 |
|
f***y 发帖数: 4447 | 42 11月6日,以“创造互信共治的数字世界——携手共建网络空间命运共同体”为主题的
第五届世界互联网大会在乌镇召开。本次大会上,中信银行自主研发的金融级分布式数
据库首次亮相。中信银行突破关键技术,明年有望率先实现“核心系统”完全自主可控。
该数据库从银行的需求出发、完全按照银行标准和要求而设计,即将应用于中信银行核
心业务系统。业内认为,该数据库的成功研发和运行将推动整个银行业摆脱对国外商业
数据库的依赖,进入使用国产数据库的时代。
中信银行的分布式数据库是具有银行基因的数据库。从功能开发到架构设计,该数据库
充分考虑了银行业务特点,涵盖银行特有的切日、结息、批量、多法人等业务场景,确
保银行二十多年来积累下来的应用资产和稳定运行的业务逻辑得到保留。
在性能方面,分布式数据库也经受了中信银行核心业务场景的检验,在3亿客户、15亿
账户的数据规模下,30台普通X86服务器,每秒交易量超过40000笔,平均响应时间104毫
秒左右,并可通过增加服务器设备横向扩展,进一步提高性能。
银行的“核心银行业务系统”(以下简称“核心系统”)承载着存、贷、汇、银行卡、
结算、客户开户、客户统一视图主要业... 阅读全帖 |
|
w*r 发帖数: 2421 | 43 很久以前我就说过在商业数据库应用上有两个极端,一个normalize, 一个denormalize
.
normalize是关系数据库的应用,3rd normal form解决了大部分OLTP的应用,其理念就
是处理insert/update/delete的时候如何尽量减少IO cost.
denormlize解决的是reporting的问题,在关系数据库出现之前,大家把数据做成
spreadsheet, mainframe cobol基本上处理的就是这样的文本文件,一个copybook 定
义每个field是什么,然后读写操作,
从dennormalize到normalize之间使用关系数据库解决report问题就是这个怪胎:
dimension model.
你仔细想想这两个极端,很容易发现dimension model就是一个compromise.
至于FACt-Dimesnsion这样的定义没有必要纠结去严格区分,
简单来说FACT就是dimension key + measurement.
Dimesion就是你要group by的东西,
举例说明:
3rd normal f... 阅读全帖 |
|
g*****g 发帖数: 34805 | 44 没有啥长时间一说,就是几分钟。
后台我当然是做并发得,只不过是单关系数据库,用transaction来保证acid。把单子
按车次排序分队列,这个前端写单子存入得时候就做好了。后端得处理服务器是一个集
群,每次可以从cassandra批量读。另外每隔一秒从数据库里拿出个所有余票的
snapshot,cache到
各个处理服务器上。处理先跟这个cache比较,确认各段都有票,再发到数据库交易。
所以处理是并发得,如果没票的话,不用写入关系数据库,写回cassandra确认订单失
败。
尽管订单很多,峰值达到百万/秒,可用的票很少,根据新闻每天千万人次,一半
12306出,每天不过500万张。这500万张,在一台大机器上,oracle数据库,5k-10k/
秒的速度是一个常规的估计。按5k算的话,也不过1000秒,17分钟。12306其实每天是
分多个时段分票的,结果就是延迟更少,如果每天放票8次,那就是2分钟。这是数据库
的延迟。无效订单有延迟,每次处理无非是查内存里一个数组是否有0,有0就可以放弃
,单操作毫秒级的处理。。而且是多核集群并行处理,完全scale out, 订单很多可以
... 阅读全帖 |
|
l*****9 发帖数: 9501 | 45 【 以下文字转载自 ChinaNews 讨论区 】
发信人: fwoods (fwoods), 信区: ChinaNews
标 题: 最新版“贪官百淫数据库“
发信站: BBS 未名空间站 (Thu Jan 19 13:29:33 2012, 美东)
当今中国官场的腐败,虽无不难以脱离“色”的怪圈,但和以往封建社会不同的是,大
凡贪官,嫖娼狎妓、包养二奶、重婚纳妾无奇不有。这和国外也迥然有异,国外也有腐
败也有贪官,然而中国的贪官除了贪得无厌,还荒淫无度!从一乡之长,到官至副国,
大有愈演愈烈之势。这些丑恶现象,已经成了社会机体的“癌肿”!.
下面是贪腐官员们用斑斑劣迹绘就的一幅幅“贪官淫乱”的丑恶图画,今汇集整理,召
示于人,以警示有诸如此类嗜好者,记住一句老话:要想人不知,除非己莫为!.
1、江苏省建设厅原厅长徐其耀。徐某人以包养140多个情妇的骄人业绩,完全有资格当
选色贪吉尼斯纪录之最。一次,徐其耀胸口不太舒服到医院“高干病房”后,40多岁的
女护士王秀丽为其打点滴,徐其耀的左手上还输着液,竟三下两下就解开了王秀丽白大
褂的纽扣……成了徐其耀的情人后,王秀丽求徐为其毕业后在家... 阅读全帖 |
|
R***r 发帖数: 3519 | 46 【 以下文字转载自 ChinaNews 讨论区 】
发信人: fwoods (fwoods), 信区: ChinaNews
标 题: 最新版“贪官百淫数据库“
发信站: BBS 未名空间站 (Thu Jan 19 13:29:33 2012, 美东)
当今中国官场的腐败,虽无不难以脱离“色”的怪圈,但和以往封建社会不同的是,大
凡贪官,嫖娼狎妓、包养二奶、重婚纳妾无奇不有。这和国外也迥然有异,国外也有腐
败也有贪官,然而中国的贪官除了贪得无厌,还荒淫无度!从一乡之长,到官至副国,
大有愈演愈烈之势。这些丑恶现象,已经成了社会机体的“癌肿”!.
下面是贪腐官员们用斑斑劣迹绘就的一幅幅“贪官淫乱”的丑恶图画,今汇集整理,召
示于人,以警示有诸如此类嗜好者,记住一句老话:要想人不知,除非己莫为!.
1、江苏省建设厅原厅长徐其耀。徐某人以包养140多个情妇的骄人业绩,完全有资格当
选色贪吉尼斯纪录之最。一次,徐其耀胸口不太舒服到医院“高干病房”后,40多岁的
女护士王秀丽为其打点滴,徐其耀的左手上还输着液,竟三下两下就解开了王秀丽白大
褂的纽扣……成了徐其耀的情人后,王秀丽求徐为其毕业后在家... 阅读全帖 |
|
b********2 发帖数: 13 | 47 所有如下工作岗位都是基于上海。公司网站:WWW.Datageek.com.cn
All positions are located in Shanghai, China, and open to all levels of
experiences & skills. That's why salary for each position is open.
If you are suitable and interested in any of the following positions, please
write email to: [email protected]/* */ / [email protected]/* */
When writing to us, you must indicate which position you are interested in
or applying for.
--------------------------------------------------
公司简介
--------------------... 阅读全帖 |
|
h**********5 发帖数: 5355 | 48 Google有自己的数据存储查询平台,没有用Oracle这类传统的关系数据库,因为不需要
integrity。另外断言传统基于SQL的关系数据库被Nosql,hadoop之类的取代还为时太
早,只要看一下top500或者各个行业的头几名老大还在用什么数据库就知道了,基本上
还是高端客户还是Oracle和IBM二分天下。当然,基于hadoop(MapReduce)/nosql的
BigData的应用越来越多,这个市场也是今后诸侯争夺的地方,不过短时间还不能对传
统数据库,尤其是transaction-based的应用市场造成太大冲击。 |
|
G****a 发帖数: 10208 | 49 12月10日,财新网确认上海首富、复星集团董事长郭广昌失联。郭广昌被曝与多名
江派落马官员关系密切。12日,法广披露,郭广昌已经被调查部门带往北京,复星和上
海方面的“捞人”以失败告终。13日,网络上一篇文章披露 郭广昌被抓捕的内幕,并
称郭广昌已把黑数据库供出来了,“年底了,大戏要高潮并落幕。”目前相关内容尚无
官方及媒体报导证实。
下面是网络上流传的文章全文:
《进去一个 失眠一片》
今天(12月13日)上午,郭广昌已经被调查部门带往北京,复星和相关人员“捞人
”计划以失败告终。
罗昌平:郭广昌目前的状态似乎接近于监视居住,他原来是人大代表,现在是政协
委员,监视居住属于司法强制措施,如果是全国人大代表就得走人大程序。监视居住原
来只能在家里,三年前修法突破了这一条。参与公司决策并不奇怪,黄光裕几乎全程都
实现了,很多公司文件都是其本人监内签署的。这些只是猜测,仍需权威通报。
曹山石:今晚复星集团的电话会匆忙结束,其实主题就是切割和郭广昌的关系。
好多人很傻很天真地认为他不会有多大事。年底了,大戏要高潮并落幕。
他肯定是出不来了,郭广昌是跑了,被抓捕回来的!如果场外资金不能托住复星... 阅读全帖 |
|
a*******s 发帖数: 1698 | 50 如果真有这种能改高考数据库的关系,人家上哈佛都没问题,跟参加高考的人都不是一
路的,谈不到高考黑幕。我相信有人会有这种实力去改数据库,但是一来这种人用不着
改数据库,早就在高考前走好其他合法路子进学校了。二来以这种人的经验阅历,就算
真改了数据库,也不会跟外人说。 |
|