由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Statistics版 - [求助] 问一个Kettle从DB2抽取到SQL2012的问题 (转载)
相关主题
SAS sampling Distribution的实现一个面试题, 关于相似度。
Mainframe SAS vs Unix SASSample size for a Preliminary Test
问个问题。Looking to hire SAS programmer/risk analyst in Dallas, TX
R: generate random number的问题谁用过Kettle(Pentaho suite)? ETL?
敬请指教, 有人用过DB2吗?概率题 (转载)
SAS SQL 和 SQL的不同与相同之处。问个SAS 题
请教一个Sample Size的问题在Categorical Data Analysis有大侠知道怎么format下面这个query的时间么 (转载)
统计职位(STATISTICIAN)最近一些面试的经历
相关话题的讨论汇总
话题: maxdate话题: sql2012话题: db2话题: kettle话题: 更新
进入Statistics版参与讨论
1 (共1页)
k*z
发帖数: 4704
1
【 以下文字转载自 Database 讨论区 】
发信人: kiz (泥偶), 信区: Database
标 题: [求助] 问一个Kettle从DB2抽取到SQL2012的问题
发信站: BBS 未名空间站 (Sat Nov 2 20:27:59 2013, 美东)
我的DB2源表是一个逻辑表,就是已经算好了很多东西给前台用的一个逻辑表。例如时
间已经被拆分成了 Year, Month, Day,
这个源表是只增加,不更新,不删除的,我只要担心怎么插入就可以了,不用考虑更新
和删除。
现在我要把这个表每天进行一次同步,拷贝到SQL2012里面去做Report.
我目前的思路是:
先把目标表的最大日期取出来, maxdate。
Table Input:
select max(year*10000+month*100+day) as maxdate
from target_table
如果maxdate是空值,那么进行全表拷贝。(基本就是第一次更新有用,其他时候表都
有最大值的)
如果maxdate不是空值,那么把这个最大日期的天数的数据在目标表删除 (因为有可能
上次更新的时候这个最大的日期的数据还不完全)
从源表把需要更新的数据读取出来,这里有两个思路
1. 取所有大于maxdate的数据,然后更新 (有可能导入明天和后天的值)
1. 只取 maxdate 和 today()的值。 (当天的数据有可能是全的,有可能是不全的)
把这个取出来的数据插入到目标表。
最后考虑在目标表增加一列,YearMonthDate=Year*1000+month*100+day, 这样就不用
每次都计算了。
因为我的权限有限,而且也不是DBA, 不能对源表进行任何设置和更改,不能用触发器
或者日志的方式更新,目前只想到了这个方法。
求大牛指点一下,怎么实现,怎么优化。
1 (共1页)
进入Statistics版参与讨论
相关主题
最近一些面试的经历敬请指教, 有人用过DB2吗?
请教: 如何用Stata和SAS从weighted data里面随机抽取几个样本?SAS SQL 和 SQL的不同与相同之处。
有2年工作经验,求弯曲data职位内推请教一个Sample Size的问题在Categorical Data Analysis
【工作机会】Data Analyst Production Analytics Sr. Developer in Bank of统计职位(STATISTICIAN)
SAS sampling Distribution的实现一个面试题, 关于相似度。
Mainframe SAS vs Unix SASSample size for a Preliminary Test
问个问题。Looking to hire SAS programmer/risk analyst in Dallas, TX
R: generate random number的问题谁用过Kettle(Pentaho suite)? ETL?
相关话题的讨论汇总
话题: maxdate话题: sql2012话题: db2话题: kettle话题: 更新