由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
DataSciences版 - 问个 hive的问题
相关主题
question about using Hive parameterImpala v Hive
请问如何用JDBC连接R和Hive (转载)请问大家有没有直接用java全程写mapreduce的程序的?
谁知道怎么通过JDBC让java连上hive?big set intersection in pig
求助: windows 下java 用 jdbc连接hive 老是抱错你们用的都是pig吗?
可以通过jdbc给hive table 进行 load data么?初入data science的困惑
征集版标如何学习Hadoop?
现在的大数据技术的价值和功用有些被夸大了求助: 一个用Hive提取feature的问题
三星samsung创新部门招大数据工程师 (转载)hive table 转换成csv文件丢数据是什么情况?
相关话题的讨论汇总
话题: hive话题: a1话题: a2话题: hiveconf话题: eligible
进入DataSciences版参与讨论
1 (共1页)
t*********u
发帖数: 26311
1
有很多记录 大概12M个
a1 b1
a1 b2
a1 b3
a2 b1
a2 b4
这样的
想法是
如果给a1, a2 就把b1, b2,b3 ,b4找出来
但是a1,a2是动态的
有什么好方法么?
p*******i
发帖数: 1181
2
Select Distinct B from table where A in (a1, a2)?
t*********u
发帖数: 26311
3
如果重复这样的过程,但是(a1 a2)不一样,或者变成(a3 a4 a5)
有没有方法变成参数形式?

【在 p*******i 的大作中提到】
: Select Distinct B from table where A in (a1, a2)?
s*****n
发帖数: 134
4
用 -hiveconf 在命令行传递参数? 比如 hive -f hive_job.hql -hiveconf eligible
_key1=a1 -hiveconf eligible_key2=a2?
如果参数本身也是动态的 a_list = [k1 ... kn], 命令行会很长,可以用python
nKey = len(a_list)
paramlist = ["-hiveconf eligible_key%s=%s" % t for t in zip(range(nKey), a_
list)]
cmdStr = "hive -f hive_job.hql " + " ".join(paramlist)
最后用os.system(cmdStr)来kickoff。
不过这样的话hive脚本本身也需要改。
t*********u
发帖数: 26311
5
Hive出来的结果怎么回传?
我想用jdbc链接,但是老是没法初始化链接

eligible

【在 s*****n 的大作中提到】
: 用 -hiveconf 在命令行传递参数? 比如 hive -f hive_job.hql -hiveconf eligible
: _key1=a1 -hiveconf eligible_key2=a2?
: 如果参数本身也是动态的 a_list = [k1 ... kn], 命令行会很长,可以用python
: nKey = len(a_list)
: paramlist = ["-hiveconf eligible_key%s=%s" % t for t in zip(range(nKey), a_
: list)]
: cmdStr = "hive -f hive_job.hql " + " ".join(paramlist)
: 最后用os.system(cmdStr)来kickoff。
: 不过这样的话hive脚本本身也需要改。

s*****n
发帖数: 134
6
我一般都是HIVE完了直接写成csv喂给下游的程序.如果是要做成数据库供查询的话,就
用mysql的工具上传。
没用过JAVA的Hive client,是不是你的SQL的库不全?根据你的报错信息应该可以
google到吧。

【在 t*********u 的大作中提到】
: Hive出来的结果怎么回传?
: 我想用jdbc链接,但是老是没法初始化链接
:
: eligible

t*********u
发帖数: 26311
7
在网上查了,有人问了类似问题
,但是给出的解决方案不一致
按照网上信息还是不能搞定
我需要的回传信息其实就是一个数字,但是需要做很多次这样的查询
现在在想实在不行,搬一个瘦身版的数据库到mysql上

【在 s*****n 的大作中提到】
: 我一般都是HIVE完了直接写成csv喂给下游的程序.如果是要做成数据库供查询的话,就
: 用mysql的工具上传。
: 没用过JAVA的Hive client,是不是你的SQL的库不全?根据你的报错信息应该可以
: google到吧。

1 (共1页)
进入DataSciences版参与讨论
相关主题
hive table 转换成csv文件丢数据是什么情况?可以通过jdbc给hive table 进行 load data么?
Re: MapR Technologies continue hiring a lot of positions (转载)征集版标
data scientist的五个方面现在的大数据技术的价值和功用有些被夸大了
求职求内推三星samsung创新部门招大数据工程师 (转载)
question about using Hive parameterImpala v Hive
请问如何用JDBC连接R和Hive (转载)请问大家有没有直接用java全程写mapreduce的程序的?
谁知道怎么通过JDBC让java连上hive?big set intersection in pig
求助: windows 下java 用 jdbc连接hive 老是抱错你们用的都是pig吗?
相关话题的讨论汇总
话题: hive话题: a1话题: a2话题: hiveconf话题: eligible