由买买提看人间百态

topics

全部话题 - 话题: pentaho
1 (共1页)
d*********k
发帖数: 1239
1
来自主题: Statistics版 - 谁用过Kettle(Pentaho suite)? ETL?
谁用过Kettle(Pentaho suite)? ETL?
想请教一个问题啊,谢谢啦啊
k*z
发帖数: 4704
2
如果有5000-6000买一个MSSQL 2012 Enterprise, 甚至2008也可以。所有问题迎刃而解。
如果老板不信服,可以先用180天的trial做出来展示,然后180天的时候问他们同意买
么,如果不同意,备份好了,删除整个环境,重新做系统,重新装mssql2012,然后恢
复,再用180天。。。。。有点tricky。期间尽快换工作,5000都不愿意花的公司,呆
着没意思。这个是最好上手的,比下面的方案简单的多得多。因为三位一体。
如果一分钱没有pentaho community family, 这个是必须的,其他的都是扯谈,因为
最终都会遇到一个性能和容积的问题,
我开始做的时候ods层数据只有1g,后来50g,这个月190g了。cube现在都有6g了。这些
免费的商业软件都有限制,所以规划要长远,以免到时候白做工。
我可以给你整套solution的建议,如果想知道怎么实施,共享些excel vba,大家交换一
下 :D
source: txt, mssql, mysql, oracle, sasdata, word, pdf.....
here is your set... 阅读全帖

发帖数: 1
3
来自主题: Classified版 - 招Senior data engineer
Company: Okta
Location: SF or San Jose
如果感兴趣,请发简历到 [email protected]
https://www.okta.com/company/careers/ga/senior-data-engineer--983309/
Senior Data Engineer
Position Description:
We are looking for an exceptional Senior Data Engineer who is responsible
for designing and developing robust, scalable solutions for large-scale data
infrastructure in a fast-paced agile environment. You will be encouraged to
initiate new projects to collect, store, and analyze data and to partner
with analysts... 阅读全帖
F**********r
发帖数: 23
4
http://www.qiyi.com/common/employ.html
有意向者,请发邮件至z*****[email protected]
客户端技术经理招聘人数:1人 工作地点:北京
职责描述:
负责客户端开发及团队管理。
职位要求:
1.本科以上学历;
2.精通C/C++, 熟练使用Visual C++开发环境,编程风格清晰;
3.熟悉WTL或MFC界面编程,精通Windows平台用户界面开发技术, 熟悉各种控件定制编程
,熟悉D3D或opengl技术者优先;
4.有丰富的Windows平台下网络编程经验;
5.有媒体播放器开发经验, 熟悉DirectShow编程者优先;
6.具有P2P开发经验者, 熟悉BT等P2P协议;
7.五年以上开发经验,有开发大型客户端项目开发经验;
8.工作责任心强, 良好的沟通和团队合作能力, 可在项目压力下坚持工作;
9.优秀的团队组织能力、良好的沟通协调能力。
返回顶部↑
产品经理招聘人数:1人 工作地点:北京
职责描述:
1.负责网站的全面优化,监控网站关键字,监控和研究竞争对手及其他网站相关做法,
并围绕优化提出合理的网站调整建议;
2.负责公司网站的... 阅读全帖
w**d
发帖数: 27
5
Leetcode 简单 和中等难度的题目 已经刷过两遍 勉强能做到bug free
大概背景如下:
小弟波士顿东北大学毕业
有2年半的工作经验,主要是做大数据, skills 如下:
• AWS cloud products (EC2/S3/RDS).
• Big Data (Hadoop/Hive/Zookeeper/Cloudera), Real-time computation
(Apache Storm), Messaging system (Apache Kafka), Real-time graphing (
Graphite), NoSQL (HBase,Aerospike),
• Web application framework (Spring MVC), REST API service,
Hibernate, JPA, Apache Tomcat
• Schema design (star schema/snowflake schema/closure tables), data
wareho... 阅读全帖
w**a
发帖数: 487
6
前段时间有个recruiter在indeed上看到了我的简历,说在我的这个鸟不拉屎的地方有
个他们公司的office,有个职位可能合适,让我联系一下他。 我回信后,这个
recruiter说把我的简历转给当地office的头,但是随后跟我联系,要电话面试的, 是
总部(在SF)的一个senior architect,这是怎么回事?
另外,linkedin上搜了一下,这个要面试的人,是个烙印(坏消息),但是,如果没差
错的话,这个烙印是从我现在这个学校毕业的(20年前毕业的),不知道算不算好消息?
面试的职位是Entry Level Back end engineer for Analytic Product using Hadoop
, Vertica and Pentaho. 俺现在就懂点hadoop皮毛,应该怎么准备面试啊?
谢谢了!
s*****a
发帖数: 438
7
来自主题: JobHunting版 - 我们公司招Hadoop Engineer
公司在280和92交界的地方, 我们组招Hadoop Engineer. 貌似不会考算法. 至今为止
递简历的全是烙印,如果有人感兴趣,请站内联系.
下面是job description
Hadoop Engineer
Location: San Mateo, CA, USA (headquarters) San Mateo, CA
Job Description
We are looking for a solid Hadoop engineer to join our team. Your role will
be to help us develop Big Data applications that have an impact on our
customers. The role of the Hadoop Engineer will be to develop ETL data
pipelines and to work with Internal teams to deploy using internal DevOps
tools. The ideal candi... 阅读全帖
l**********0
发帖数: 7
8
长期提供Deloitte职位内部推荐机会,地域不限,职位不限,请大家自行在https://
jobs2.deloitte.com/us/en/?icid=top_job-search上搜索详细职位要求,并将Resume以
及职位Requisition code发至[email protected]
/* */ 很抱歉因为工作比较忙很难
每封邮件及站内信都回复。但承诺只要你背景符合并且达到职位最低要求,我一定会尽
力帮大家内推。
General requirements for experienced hire:
1.Prefer at least 2+ years client service experience.
2.Hot skill sets we are looking for are in the following areas: Informatica
suite, Qlikview/Tableau, Big Data/Hadoop, Hyperion HFM/Planning, Pentaho,
Cognos TM1, MS BI stack (SSIS/S... 阅读全帖
l**********0
发帖数: 7
9
长期提供Deloitte职位内部推荐机会,地域不限,职位不限,请大家自行在https://
jobs2.deloitte.com/us/en/?icid=top_job-search上搜索详细职位要求,并将Resume以
及职位Requisition code发至[email protected]/* */ 很抱歉因为工作比较忙很难
每封邮件及站内信都回复。但承诺只要你背景符合并且达到职位最低要求,我一定会尽
力帮大家内推。
General requirements for experienced hire:
1.Prefer at least 2+ years client service experience.
2.Hot skill sets we are looking for are in the following areas: Informatica
suite, Qlikview/Tableau, Big Data/Hadoop, Hyperion HFM/Planning, Pentaho,
Cognos TM1, MS BI stack (SSIS/SS... 阅读全帖
d********w
发帖数: 363
10
来自主题: JobHunting版 - 大数据创业公司篇
这里面创业公司太多了,包含BI工具,数据存储和挖掘,应用等,我就简单说一些我感
兴趣的,其他的可以参考。
Palantir:超过百亿美金估值,已经是超级独角兽,就单独列出来。Peter Thiel创办
大数据公司。数据集成、 信息管理和定量的分析。连接到商业、 专有和公共数据集,
并发现趋势、 关系和异常,包括预测分析。
##############
Database
MemSQL: 号称最快的内存数据库。
GraphSQL:高效、大容量的图形数据库和分析平台,创始人是国人。
MongoDB: 分布式文件存储的数据库
DataStax:主力开发Cassandra。
Hadoop
Altiscale: 提供的Hadoop作为一种服务(HAAS)
Qubole:Hadoop服务提供商,Pinterest也是它的客户
Splice Machine: 基于Hadoop的实时大数据技术公司,支持SQL 事务处理,并针对OLAP
和OLAP 应用进行实时优化处理
机器学习
Paxata:应用机器学习技术处理大数据难题
0xdata:H2O 的算法是面向业务流程——欺诈或趋势预测
Everstrin... 阅读全帖
l**********0
发帖数: 7
11
长期提供Deloitte职位内部推荐机会,地域不限,职位不限,请大家自行在https://
jobs2.deloitte.com/us/en/?icid=top_job-search上搜索详细职位要求,并将Resume以
及职位Requisition code发至[email protected]
/* */ 很抱歉因为工作比较忙很难
每封邮件及站内信都回复。但承诺只要你背景符合并且达到职位最低要求,我一定会尽
力帮大家内推。
General requirements for experienced hire:
1.Prefer at least 2+ years client service experience.
2.Hot skill sets we are looking for are in the following areas: Informatica
suite, Qlikview/Tableau, Big Data/Hadoop, Hyperion HFM/Planning, Pentaho,
Cognos TM1, MS BI stack (SSIS/S... 阅读全帖

发帖数: 1
12
来自主题: JobHunting版 - 如果感兴趣,请发简历到
Company: Okta
Location: SF or San Jose
如果感兴趣,请发简历到 [email protected]
https://www.okta.com/company/careers/ga/senior-data-engineer--983309/
Senior Data Engineer
Position Description:
We are looking for an exceptional Senior Data Engineer who is responsible
for designing and developing robust, scalable solutions for large-scale data
infrastructure in a fast-paced agile environment. You will be encouraged to
initiate new projects to collect, store, and analyze data and to partner
with analysts... 阅读全帖
b********2
发帖数: 13
13
所有如下工作岗位都是基于上海。公司网站:WWW.Datageek.com.cn
All positions are located in Shanghai, China, and open to all levels of
experiences & skills. That's why salary for each position is open.
If you are suitable and interested in any of the following positions, please
write email to: [email protected]/* */ / [email protected]/* */
When writing to us, you must indicate which position you are interested in
or applying for.
--------------------------------------------------
公司简介
--------------------... 阅读全帖

发帖数: 1
14
来自主题: JobMarket版 - 招Senior data engineer
Company: Okta
Location: SF or San Jose
如果感兴趣,请发简历到 [email protected]
https://www.okta.com/company/careers/ga/senior-data-engineer--983309/
Senior Data Engineer
Position Description:
We are looking for an exceptional Senior Data Engineer who is responsible
for designing and developing robust, scalable solutions for large-scale data
infrastructure in a fast-paced agile environment. You will be encouraged to
initiate new projects to collect, store, and analyze data and to partner
with analysts... 阅读全帖
q**j
发帖数: 10612
15
Position: Big Data Developer/DBA
Location: San Francisco, CA
Position: DBA
About Demandforce
Demandforce, Inc., a leading online marketing and communication software
service from Intuit Inc. helps local businesses thrive in the Internet
economy using email communications, text messaging and online services.
Demandforce combines an award winning communications platform with best-in-
class reputation and networking tools into one powerful web-based
application that seamlessly integrates with exi... 阅读全帖
i***0
发帖数: 8469
16
I wanted to connect on a 2 opportunities I'm working on. One is a role in
Menlo Park with Adsymptotic. I'm working with the founders from Google/
Admob/Yahoo and backed by Sequoia/KP; well funded, and growing. I've helped
them staff a number of roles and looking for a hadoop expert to join the
team. Take a look, they're doing quite well.
I'm also working with the VPE of Mashlogic in Palo Alto and they're looking
for an Java/BigData engineer. They're growing, backed by NEA and Bessemer
Vent... 阅读全帖
e****7
发帖数: 4387
17
OLAP,online analytical processing
1. 谁在用
2. 用那家的
3. 有什么好处
我主要用MS的SSAS,挺容易上手,功能还算全,works well with MS SQL SERVER AND
OTHER MS APP. 性能也不错。
接触过pentaho 的OLAP, 比MS差不少
知道呢Oracle 买了Hyperion , 不知道怎么样了
e****7
发帖数: 4387
18
来自主题: Database版 - 问 log 分析 的 问题

我也想听听有没有OLAP以外的办法。
另外想提的就是OMNITURE,和google analytics .
微软的OLAP应该不贵,性价比还不错。open source 的也有,如pentaho cube, 不过一
分钱一分货吧。
weblog 这玩意本身就是一个多维数据,用OLAP可以解决很多aggregation 的计算,
data mart 有十几个表就差不多了。什么dimension hierarchy, aggregation 让OLAP
来完成就容易多了。按照时间或其它的attribute 也狠容易建立partition, 所以
scaling 应该不是大问题。
如果公司请人做OLAP的话,帮我递个简历吧,短期的也行啊,哈哈
l******t
发帖数: 660
19
来自主题: Database版 - 请教一个问题,big data入库
pentaho啊, 最用名也最有用的
n****e
发帖数: 1403
20
Pentaho(Kettle) Data Integration
k*z
发帖数: 4704
21
这么多BI Visualization Tools,有兄弟在business analysis中实际比较过的么?
u******u
发帖数: 595
22
Yes, we will have Qlickview class in Feb, 2014. A very powerful tool.
Totally different with others/
j*********1
发帖数: 122
23
只用过Tableau,挺容易上手的,performance也不错。
w*****r
发帖数: 146
24
大家有好的方法解决row level security的问题吗?就是同一个report/dashboard每个
人login后之能在report上看到他有权限看到的数据,exec可以看到enterprise的,
division manager只能看到自己division的。我们以前试用过Tableau, Qlikview,好
像不太好解决这个问题。
s**********o
发帖数: 14359
25
BI不是用来做一般的REPORT的,SECURITY都不会好
你这种好像只有通过参数PASS给STORED PROC了
w*****r
发帖数: 146
26
用Hyperion Interactive Reporting,我们可以join to security setup table来过滤
数据用同一个dashboard显示各种graph象trend,margin, ratio之类的,这样不同级别
的管理人员可以用一样的工具来看自己管辖的范围内的业绩。还有可以通过email
burst out的report/dashboard。我觉得这个还是蛮不错的
,因为这些人的需求是一致的。不知道你们在应用中相似的需求,怎么来处理。
s**********o
发帖数: 14359
27
我也给老板推荐Hyperion了,我自己也不知道是个什么,
刚开始学OBIEE,水平还差得远啊
w*****r
发帖数: 146
28
Hyperion interactive reporting是query tool+report/dashboard builder,可以在
后端data model没有完全建好的情况下比较快得满足用户的需求.我觉得比较好用,尤
其是在初期需要尽快建立credibility的时候,可惜Oracle不再继续发展了,另外对
mobility的支持不好。OBIEE是BI Analysis tool,对data model要求比较高,而且不太
好用。因为高层需要支持mobility,我们正在转向OBIEE.
s**********o
发帖数: 14359
29
公司也是想MOBILE,不过OBIEE的DATA MODEL搞得要比微软的
MULTI DIMENSIONAL MODEL复杂的多,其实现在需要的就是
个基本REPORT工具,搞复杂了好像大而全,MODEL没弄好,什么
都没有,反正是领导带头别人在做,我一边看着。
c*******r
发帖数: 3289
30

Microstrategy有security filter,直接把filter加在user 或者user group上。但我
觉得performance会有问题,用过的请comment一下
z******4
发帖数: 4716
31
bo 也可以 row level security
z******4
发帖数: 4716
32
花哨 后台很麻烦,复杂应用会有问题,结构不支持大数据
y***t
发帖数: 644
33
来自主题: Database版 - ETL tool or Shellscript&Sql
试试Pentaho, 开源ETL软件, 挺好用的。将来数据大了, 上hadoop, impala。
d***e
发帖数: 793
34
来自主题: Database版 - ETL tool or Shellscript&Sql
pentaho和talend两个哪个好学,哪个好用?learning curve大概多久?能立刻上手吗
?以前用过SSIS。现在sql和shell script
s******a
发帖数: 184
35
谢谢, 请问Pentaho也是实现类似的功能的吗?
w****r
发帖数: 945
36
Fixed Income Java Developer
We require a strong Java Developer with 5-8 years of experience, with a high
level of financial expertise and the ability to work on various
technologies and projects.
Java Developer
Required:
Computer Science Major.
Expert level Java/OOP.
SQL/Database Design.
Experience in the financial services industry.
Highly Technical with the ability to pick up any project and run with it.
College level math proficiency. This role requires understanding of
financial models and i... 阅读全帖
l******t
发帖数: 660
37
来自主题: Programming版 - big data怎么搞定商业报表?
你说的big data是hadoop/hdfs吗? 一般的处理都是需要倒到一个rmdb里边然后用传统
的bi reporting,现在也有一些bi工具能直接连hadoop, 比如pentaho, 不过易用性非常
的差.
不过big data只是数据多, 但是是structure data, 就直接上data warehouse.
h******b
发帖数: 6055
38
来自主题: Programming版 - Amazon AWS还是微软Azure?
打算装胖大海(Pentaho)ETL服务,数据库和网站。一个服务器要解决很多中小型客户。
个人用windows服务器的gui界面舒服很多,但Linux好像便宜很多? 玩过lamp但对打
大把指令还是有点怂。
h******b
发帖数: 6055
39
来自主题: Programming版 - 现在开发新网站是php还是nodejs?
做的是数据转换网站。 类似singlefeed。 打算用Pentaho来做etl。 status报告
给客户界面。
效率真心不是问题,如果性能是问题我估计已经能拉vc了,也能请的起赵策,魏老师,
霸哥这个水平的人了。
糙快猛出prototype抓前几个客户非常重要。是不是应该搭个framework? 貌似
Laravel很火?
z****e
发帖数: 54598
40
来自主题: Programming版 - 现在开发新网站是php还是nodejs?
作事情,想清楚,再动手
不要盲目
搂主要的是粗快猛上网站
资料多很重要
而且连etl引擎都选好了Pentaho
这个时候就应该选择php,因为网站本身被弱化成了一个前端
html generating server
这个时候上node.js就是纯粹没事找事
h******b
发帖数: 6055
41
来自主题: Programming版 - 现在开发新网站是php还是nodejs?
如果有其他ETL选择我们也可以使用。 Pentaho其实稍微heavy了一点。有没有更适合
web服务器的。
基本需要是客户传各种数据,xls,csv,xml,json,我们存入自己数据库然后转换格
式,传送给
各种destination。 附加价值服务是reporting和analytics。
h******b
发帖数: 6055
42
来自主题: Programming版 - 现在开发新网站是php还是nodejs?
本来打算用Pentaho的bi server的。 他们有相关产品。
h******b
发帖数: 6055
43
来自主题: Programming版 - ETL是应该用现有工具还是自己写PHP
最近开发网站,接的活主要是CSV/XLS转TXT,XML,JSON等等, 偶尔搞个PDF报表,web
service之类的。
速度基本上可以无视,都是batch job 。有real time的也不会特别heavy volume。
开始用的是Pentaho, 不过很快觉得这玩意非常bloated,很多问题几行代码搞定的,在
他们的UI里要学好多新东西。很多限制非常讨厌。
也许搞个PHP库就够了? 用cron job或file poller。
w****r
发帖数: 945
44
【 以下文字转载自 Java 讨论区 】
发信人: wumier (乌咪), 信区: Java
标 题: Position: Fixed Income Java Developer
发信站: BBS 未名空间站 (Thu Nov 10 00:45:52 2011, 美东)
Fixed Income Java Developer
We require a strong Java Developer with 5-8 years of experience, with a high
level of financial expertise and the ability to work on various
technologies and projects.
Java Developer
Required:
Computer Science Major.
Expert level Java/OOP.
SQL/Database Design.
Experience in the financial services industry.
Highly Technical with the ... 阅读全帖
l*********s
发帖数: 5409
45
来自主题: Statistics版 - 我也说说 SAS 软件的替代问题
For reporting, there are many tools such as Jasperreport, Pentaho and
openReports.
imho, this job shall really fall onto IT/data specialists, not statisticians
.
k*z
发帖数: 4704
46
来自主题: Statistics版 - 关于MySQL和MS SQL
query上没有任何区别,就是语法上有点不同例如mysql里有tinytext这种mssql里没有
的format.还有mysql的语法相对简洁一些。
还有MSSQL是一个包裹支持SSIS,SSRS,SSAS,可能涉及到收据抽取,分析,报表一个流程
。 Mysql必须和开源的BI软件结合才可以(Pentaho/JReport)。
我最近建分别用Mysql和MSSQL建立了两个微型的数据集市,总体来说MSSQL更简单一些
,Mysql因为是开源的,有点麻烦。
k*z
发帖数: 4704
47
【 以下文字转载自 Database 讨论区 】
发信人: kiz (泥偶), 信区: Database
标 题: 大家有实地接触Tableau, Qlikview, SAS Visual Analytics or Pentaho的么
发信站: BBS 未名空间站 (Fri Jan 10 20:20:38 2014, 美东)
这么多BI Visualization Tools,有兄弟在business analysis中实际比较过的么?
k*z
发帖数: 4704
48
来自主题: Statistics版 - 该让公司买什么软件
楼上的貌似都没在公司做过reporting......搞统计搞多了....瞎给意见。
你的最优化策略就是 r+Python play data, ,然后Ssis或者Pentathol pdi清理和
aggredate数据,然后sass+ssrs来做report. 如果公司都是MySQL,直接上pentaho bi
community, 这些都不要钱,training大概rmb 3000 到美
金几千。
Report成型后,有了credit, 有了钱想怎么搞就怎么搞。
k*z
发帖数: 4704
49
来自主题: Statistics版 - 该让公司买什么软件
如果他们公司已经在用MSSQL了,他拿来用不要钱,如果没在用,用的是Mysql, PSQL,
那么他可以上Pentaho,还是不要钱。
k*z
发帖数: 4704
50
【 以下文字转载自 Database 讨论区 】
发信人: kiz (泥偶), 信区: Database
标 题: 大家有实地接触Tableau, Qlikview, SAS Visual Analytics or Pentaho的么
发信站: BBS 未名空间站 (Fri Jan 10 20:20:38 2014, 美东)
这么多BI Visualization Tools,有兄弟在business analysis中实际比较过的么?
1 (共1页)