由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Programming版 - 请问如何scale hive meta store mysql
相关主题
sql 数据是存在哪里 (转载)MySQL replication question
Cassandra 为啥干不过芒果?请大牛来谈谈对Solr的看法
为啥python的人都用postgreSQL古德八你也别废话了
mongodb和mysql的查询速度goodbug你现在懂message queue了么?
我对新技术的态度是:不到万不得已绝对不主动学习mongo dB vs Cassandra
那些做 big data 的公司到底需要什么样的人?大家可以给我说说redis吗
感觉flink出来之后,hadoop就显得不怎么再需要了fb为啥没有坚持用Cassandra ?
这种情况该用那种big data tool?Python里边file writer的问题
相关话题的讨论汇总
话题: mysql话题: hive话题: meta话题: master话题: table
进入Programming版参与讨论
1 (共1页)
p*****u
发帖数: 310
1
用的是 remote的 mysql。但是读操作太多,又要生成很多temp table,导致mysql特别
慢。网上查了许久,好像没有人有这个问题。大概是我们的job都是整点开始。请问有
什么好的solution吗?我们现在是master-slave,slave只是做back up的,并不take
traffic。如果改成master-master的话,没法保证一个client写之后立刻读,能读到
刚写的data。
w***g
发帖数: 5958
2
这个应该不至于产生瓶颈吧。修改/etc/my.cnf加入
[mysqld]
innodb_buffer_pool_size = 10000M
看看。

take

【在 p*****u 的大作中提到】
: 用的是 remote的 mysql。但是读操作太多,又要生成很多temp table,导致mysql特别
: 慢。网上查了许久,好像没有人有这个问题。大概是我们的job都是整点开始。请问有
: 什么好的solution吗?我们现在是master-slave,slave只是做back up的,并不take
: traffic。如果改成master-master的话,没法保证一个client写之后立刻读,能读到
: 刚写的data。

g*****g
发帖数: 34805
3
要在MySQL生成很多temp table,那基本就是架构错了。常见的处理,把需要的数据都
读出来,中间的临时数据可以内存/本地硬盘/Cache/Cassandra等等。

take

【在 p*****u 的大作中提到】
: 用的是 remote的 mysql。但是读操作太多,又要生成很多temp table,导致mysql特别
: 慢。网上查了许久,好像没有人有这个问题。大概是我们的job都是整点开始。请问有
: 什么好的solution吗?我们现在是master-slave,slave只是做back up的,并不take
: traffic。如果改成master-master的话,没法保证一个client写之后立刻读,能读到
: 刚写的data。

p*****u
发帖数: 310
4
同学,这是hive meta 的 database, 不是一般的mysql。

【在 g*****g 的大作中提到】
: 要在MySQL生成很多temp table,那基本就是架构错了。常见的处理,把需要的数据都
: 读出来,中间的临时数据可以内存/本地硬盘/Cache/Cassandra等等。
:
: take

l*****t
发帖数: 2019
5
没碰到这个问题呀。我们都是file number的问题。你们多少 file,多少node?

take

【在 p*****u 的大作中提到】
: 用的是 remote的 mysql。但是读操作太多,又要生成很多temp table,导致mysql特别
: 慢。网上查了许久,好像没有人有这个问题。大概是我们的job都是整点开始。请问有
: 什么好的solution吗?我们现在是master-slave,slave只是做back up的,并不take
: traffic。如果改成master-master的话,没法保证一个client写之后立刻读,能读到
: 刚写的data。

p*****u
发帖数: 310
6
我们改成8G, 好很多,但是有时还是会slow,特别是rerun failed的job时。
innodb_buffer_pool_size = 8589934592
tmp_table_size = 4294967296
max_heap_table_size = 4294967296

【在 w***g 的大作中提到】
: 这个应该不至于产生瓶颈吧。修改/etc/my.cnf加入
: [mysqld]
: innodb_buffer_pool_size = 10000M
: 看看。
:
: take

1 (共1页)
进入Programming版参与讨论
相关主题
Python里边file writer的问题我对新技术的态度是:不到万不得已绝对不主动学习
data consistency那些做 big data 的公司到底需要什么样的人?
问个master-slave的简单问题感觉flink出来之后,hadoop就显得不怎么再需要了
does the system guarantee this? (转载)这种情况该用那种big data tool?
sql 数据是存在哪里 (转载)MySQL replication question
Cassandra 为啥干不过芒果?请大牛来谈谈对Solr的看法
为啥python的人都用postgreSQL古德八你也别废话了
mongodb和mysql的查询速度goodbug你现在懂message queue了么?
相关话题的讨论汇总
话题: mysql话题: hive话题: meta话题: master话题: table