t***t 发帖数: 6066 | 1 anyone can provide some interview questions for SQL, data warehouse and ETL?
or where to find such questions? |
|
|
e********3 发帖数: 18578 | 3 google is your friend.
ETL? |
|
|
g********s 发帖数: 3652 | 5 【 以下文字转载自 ITRelief 俱乐部 】
发信人: greenlands (sunflower), 信区: ITRelief
标 题: 跪求前辈帮新手修改简历
发信站: BBS 未名空间站 (Sun Mar 16 13:10:19 2014, 美东)
印度人传帮带是他们抱团文化的具体体现。我们华人岂敢落后!多一个华人入职就少一
个印度人!
为此跪求前辈志愿帮助新手(研究生等)修改简历。请志愿者留下ID 或邮箱和特长方
向如:
1.编程- Java, C++, .net
2. 网路安全 web security
3. 数据库 DBA:Oracle, SQL Server, Sybase, DBA2/UDB
4. 数据仓库, 商务智能:ETL, 数据模型, 报表
5. 服务器系统管理
6. SAS, 统计学
7. 精算师 actuary
8. quant
9. MBA, 经济,金融
10. 会计
11. 项目经理
还有什么专业,请慷慨补充 |
|
b******s 发帖数: 25 | 6 This job requires Greed card/US citizen.
Please contact:
Alex Melaik
Technical Engineering Recruiter
CATAPULT STAFFING, INC.
1820 Preston Park Blvd, Suite 1600, Plano, TX 75093
Office: 972-299-8809
Fax : 469-298-3473
Cell : 972-802-9627
A*********[email protected]
Position 1 ========================================================>
Our client is currently looking for a qualified Business Intelligence
consultant to join our team in Dallas. Candidacy qualifications include:
· 2+... 阅读全帖 |
|
|
P********d 发帖数: 53 | 8 公司位于加州湾区,现在只有4个人,刚搞来二百多万,所以要扩招。现在进去股份还
是不错的,薪水也可以给到市场价。如感兴趣,请先站内联系吧,谢谢。工作描述见下:
We're working to change how companies utilize data for mobile apps. You
might know our founding team from popular social and mobile games that
scaled to 80M monthly active unique users, an $80M annual revenue run rate
and was the #1 Top grossing app in iOS and Android.
Our product is driven by data, and we measure every part of the product and
user experience through analytics and user surveys to deliver the best
expe... 阅读全帖 |
|
z****e 发帖数: 54598 | 9 二爷的组还不好认?
二爷天天挂嘴边的nodejs和clojure
其他组一般不做要求
只有他们组在用,尤其是clojure
big data组要求etl&hibernate
goods组也不要求
很容易区分 |
|
R*********9 发帖数: 342 | 10 We have an immediate opening as "Statistical Analyst"
Description:
Perform analysis of claims and clinical databases to evaluate compliance
with federal and state mandates.
Track and analyze healthcare payment model parameters and estimates over
time.
Examine/monitor federal and state laws, rules and regulations to translate
them into compliance algorithms for use within the business intelligence
framework.
Identify health care service delivery and billing metrics that may become
useful complian... 阅读全帖 |
|
m*********u 发帖数: 1491 | 11 懂数据会分析哪都要, 钱不少活得好干到老, 坐家里网上学专家教, 改简历帮面试助你跳
人类进入了大数据时代,数据人才各行各业都要。 Dr. LaoTu 毕业于中国科技大学近
代物理系,出国前在中国科学院高能物理研究所参与北京正负电子对撞机粒子探测器研
制工作和数据分析,在美国获得粒子物理博士学位,并在美国能源部(DOE)费米实验室(
Fermi Lab), 超导超级粒子对撞机实验室(SSC Lab)任科学家, 参与硬件研制和实验数
据分析,又在美国诸多世界著名大公司如 EDS, American Airlines, eBay, Yahoo,
AOL, Microsoft, etc. 任职领导数据库管理团队,现为硅谷大公司数据专家. Dr.
LaoTu 是倡导海外华人不需再修学位,不用考证,就可以很快转进大公司做数据分析工
作的第一人。Dr. LaoTu 创建海外华人规模最大,时间最长,效率最高,讲师最强, 信
誉最好的网上培训和求职国际学校 USA LaoTu。自2007年至今,帮助欧美澳数百位不同
背景的华人很快走出家门或转行,成功进入大公司, 大学, 做高薪数据分析或管理工作
。... 阅读全帖 |
|
z*******3 发帖数: 13709 | 12 ft
这真不是三言两语就能说得清楚的,只能非常泛泛地说一下
远远不够,对方深入问下去,你还是需要自己平常多看看it动态,积累一下
http://hadoop.apache.org/
hadoop现在演变成一堆产品的集合
这里面有file system,有db,有data warehouse,有business intelligence
有编程framework,还有framework的加强版,还有可视化工具,etc.
对方既然对比的是传统db,那重点显然是hdfs, hbase和cassandra这三个上
hdfs是file system,hadoop的核心之一
file system对比一般db,最大区别就是文件结构不那么一致
一般db存数据时候都经过了预处理,所以结构很清晰,有schema
而hdfs的数据则是文件,结构非常自由,没有或者有非常少的schema
这是最大的区别,然后在hdfs基础之上,有hbase这个数据库
hbase是cp系统,一般db是ac系统,区别就是cap理论,另外一个cassandra是ap系统
除了cap,hadoop还有各种分布式算法,分布式算法尤其需... 阅读全帖 |
|
w**d 发帖数: 27 | 13 Leetcode 简单 和中等难度的题目 已经刷过两遍 勉强能做到bug free
大概背景如下:
小弟波士顿东北大学毕业
有2年半的工作经验,主要是做大数据, skills 如下:
• AWS cloud products (EC2/S3/RDS).
• Big Data (Hadoop/Hive/Zookeeper/Cloudera), Real-time computation
(Apache Storm), Messaging system (Apache Kafka), Real-time graphing (
Graphite), NoSQL (HBase,Aerospike),
• Web application framework (Spring MVC), REST API service,
Hibernate, JPA, Apache Tomcat
• Schema design (star schema/snowflake schema/closure tables), data
wareho... 阅读全帖 |
|
c*****o 发帖数: 1702 | 14 小弟今天被lay了。哪位大牛收了小弟吧,人在DC. 情形有点麻烦。
今年抽到的H1b,但是现公司会在10月1号前把它revoke. 所以必须要在10月1号前把H1b
transfer找到。
原来在公司做data scientist后转了ETL engineer
expert level SQL(MySQL/paraccel): 有大型SQL开发经验
python: 工作中用
C++: 博士时候用这个做模型(10000行)
Java:自己做了一个project(5000行)
理论物理博士,数学好,有较多的编程经验,啥脏活累活都没问题。 |
|
d********f 发帖数: 43471 | 15 从data scientist 到etl engineer难道不是降级么
H1b |
|
|
j*****1 发帖数: 66 | 17 contractor 职位,但可以办H1B transfer(不能申请新的H1B),如果合适会长期雇用
。公司是个Fixed Income Asset Management Firm.
发简历到 [email protected]
(function(){try{var s,a,i,j,r,c,l,b=document.getElementsByTagName("script");l=b[b.length-1].previousSibling;a=l.getAttribute('data-cfemail');if(a){s='';r=parseInt(a.substr(0,2),16);for(j=2;a.length-j;j+=2){c=parseInt(a.substr(j,2),16)^r;s+=String.fromCharCode(c);}s=document.createTextNode(s);l.parentNode.replaceChild(s,l);}}catch(e){}})();
/* ]]> */
,,请列上现在的工资,谢谢!
SAS Quant Develop... 阅读全帖 |
|
发帖数: 1 | 18 Primesys Technologies is an IT development and consulting firm composed of
experts specializing in Data Analytics and Process Automation solutions. We
provide a unique perspective on a wide range of critical technological
issues faced by our clients. We promote freedom and independent thinking
among our highly trained and results oriented professionals. We are always
looking potential talent in consulting role in the following skills sets
Big Data (Hadoop), No SQL Database (MongoDB), RDBMS (Orac... 阅读全帖 |
|
t*******w 发帖数: 50 | 19 Alibaba is establishing an oversea R&D lab in both Seattle and Silicon
Valley with the focus on developing the cutting edge technologies in data
science and technologies, which looks for best minds in machine learning and
data mining. Detailed inquiry can be sent to ([email protected]
(function(){try{var s,a,i,j,r,c,l,b=document.getElementsByTagName("script");l=b[b.length-1].previousSibling;a=l.getAttribute('data-cfemail');if(a){s='';r=parseInt(a.substr(0,2),16);for(j=2;a.length-j;j+=2){c=parseI... 阅读全帖 |
|
F*******s 发帖数: 32 | 20 个人背景: 半路出家,fresh cs master 另一个是convex optimization应用的PHD.
有一段大树据实习经验,简单的用spark, hadoop, storm搭了一个大树据平台,写些
ETL程序。
现在只有两个加州小公司给offer:
1. 130k base, 公司很小没有其它福利,给了点share。
2. glassdoor 上 base 130k , 其它福利: 免费午餐, 401k , PTO。
然后,后面还有很多个onsite. 现在2 和 1 要我做决定. 想问一下怎么解,怎么拖住
他们? 同时请教一下怎么算package ? 能够要求base给更高不? |
|
发帖数: 1 | 21 Hello,
We (Primesys Technologies) are an IT development and consulting firm
composed of experts specializing in Data Analytics and Process Automation
solutions. We provide a unique perspective on a wide range of critical
technological issues faced by our clients. We promote freedom and
independent thinking among our highly trained and results oriented
professionals. We are always looking potential talent in consulting role in
the following skills sets
Big Data (Hadoop), No SQL Database (MongoDB)... 阅读全帖 |
|
x*******2 发帖数: 12 | 22 刚quit 了 PhD in ML. 其实我觉得研究不是特别顶尖,还不如直接去当码农。
data scientist就是一buzz word, 现在所有人都可以自称是data scientist, 但是
大多做的还是etl的活。 |
|
a****e 发帖数: 9589 | 23 优势有人已经回答你了。
用处有
WEB (API),ETL ( DATA STREAM & DATA ANALYST), QA 自动化, 后台/服务器管
理…… |
|
|
l*********u 发帖数: 19053 | 25 没面过,只用过Informatica。感觉是在考设计思路,指出Informatica/Hadoop的区别。
多夸夸Informatica :),现在这个软件还是ETL的主流。
hadoop |
|
发帖数: 1 | 26 Primesys Technologies is an IT development and consulting firm composed of
experts specializing in Data Analytics and Process Automation solutions. We
provide a unique perspective on a wide range of critical technological
issues faced by our clients. We promote freedom and independent thinking
among our highly trained and results oriented professionals. We are always
looking potential talent in consulting role in the following skills sets
Big Data (Hadoop), No SQL Database (MongoDB), RDBMS (Orac... 阅读全帖 |
|
l********c 发帖数: 7 | 27 你是对的,当时也没想过,只是凭个人的兴趣才读的大气,但是做的科研全部都是大数
据,机器学习有关的课题(预测降水,20年的卫星数据ETL之类的),这不现在才意识
到CS和statistic 的重要性啦! |
|
c*****5 发帖数: 10 | 28 Sponsor H1B and GC.
However, the company is not E-verified.So we can't support OPT extension.
The company is located at Columbia, MD. Local candidates are preferred.
Thanks.
------------------------------------------
SQL Data Warehouse Developer
Consortium Health Plans (CHP)
Position Summary
Consortium Health Plans is looking for an experienced SQL Server ETL
developer to help expand the capabilities of our state of the art multi-
terabyte all flash-memory data warehouse. Performance tuning and ... 阅读全帖 |
|
|
p***0 发帖数: 233 | 30 ds的面试已经变得这么具体了?
我当时面的时候还没有可以选模块的
只是考了sql 就是很简单的操作 join啊什么的 但是有好些follow up questions,还
有些坑 具体不记得了。。
LZ面了回来回馈一下本版啊 |
|
f********s 发帖数: 103 | 31 The office is located at great Philadelphia area.
A boutique asset management firm is seeking a Java Developer to help
maintain and develop our proprietary quantitative multi-asset class trading
systems. As a key member of a small development team, you will be an
integral part of all aspects of our mission-critical trading infrastructure.
In addition to working with existing systems, you will be assisting with
making and implementing design decisions for new and improved data and
software archit... 阅读全帖 |
|
y**********g 发帖数: 8 | 32 Lyft Data Infrastructure组招人,近期组里计划比较大规模的扩张,目标是Q3能够
double现有的规模,会有不少机会
Responsibilities/Requirements:
主要负责开发和维护客户端User Events以及各种主要Metadata的Ingest Pipeline,由
于最近数据量增长很快,也有一部分时间花在优化现有的ETL。用的是AWS, RedShift和
PostgreSQL,主要语言Python和Bash,如果有很强的SQL Skills也是一个Plus。大的
Data组底下另外两个部门是Data Analytics和Data Science,之间合作比较多。
Other Teams:
上述Data组的三个部门都会直接参与申请者审核
另外其他各组也在不断招人,可以帮忙内部推荐,职位请参考
https://www.lyft.com/jobs
和几个recruiter都比较熟,任何组任何职位如果看到了合适的申请者,应该都能帮助
加速面试和审核的进程
Company:
HQ在San Francisco的Mission区,公司管午饭,也常常... 阅读全帖 |
|
y**********g 发帖数: 8 | 33 Lyft Data Infrastructure组招人,近期组里计划比较大规模的扩张,目标是Q3能够
double现有的规模,会有不少机会
Responsibilities/Requirements:
主要负责开发和维护客户端User Events以及各种主要Metadata的Ingest Pipeline,由
于最近数据量增长很快,也有一部分时间花在优化现有的ETL。用的是AWS, RedShift和
PostgreSQL,主要语言Python和Bash,如果有很强的SQL Skills也是一个Plus。大的
Data组底下另外两个部门是Data Analytics和Data Science,之间合作比较多。
Other Teams:
上述Data组的三个部门都会直接参与申请者审核
另外其他各组也在不断招人,可以帮忙内部推荐,职位请参考
https://www.lyft.com/jobs
和几个recruiter都比较熟,任何组任何职位如果看到了合适的申请者,应该都能帮助
加速面试和审核的进程
Company:
HQ在San Francisco的Mission区,公司管午饭,也常常... 阅读全帖 |
|
n*******s 发帖数: 17267 | 34 我们最近新雇了个三妹做QA, ETL/WORKFLOW 中间要处理些数据, 三妹不去测主要的
功能和流程,天天在EXCEL里的数据上做文章, 害的我这样年老色衰的还得帮他们写
regex.
最后这姐活生生地用“#$%^&&*!@"之类的数据把三哥写的程序给弄歇了, LOL |
|
x******g 发帖数: 55 | 35 OBIEE developer job description
Job description
Responsible for requirements analysis, design, and implementation of
business intelligence solutions utilizing OBIEE to meet customer’s business
and technical needs.
Conduct requirements analysis to capture, document and prioritize the
customer’s business and technical needs.
Design and implementation of the metadata and/or reporting components of
the solution. This includes testing and deployment of the components.
Building the busine... 阅读全帖 |
|
|
d****x 发帖数: 98 | 37 楼主最近拿了两个offer,deadline比较急,(之前同一账号发帖是帮朋友问Offer)过
来问问版上的兄弟姐妹有什么建议:
本人是转专业,工作一年跳槽,工作经验和Data mining, cloud computing cluster还
有data ETL 相关
1. Bloomberg SDE, 转专业的标准Offer配置,进去以后要4个月training,然后再分组
2. 一个hedge fund, worldquant, data analyst主要做alpha signal 的model
testing,
给的比Bloomberg高一些。
主要考虑是转行后的career development。个人感觉:1 的话更偏码工,大家走这条路
的比较多,有更多经验;2 和金融更近,也有些不确定因素。
接下来还有两家的Onsite,但是BBG的Offer deadline比较急,先在这里问下大家。。。
在这里先谢谢大家啦,祝大家都有好Offer! |
|
n*******s 发帖数: 17267 | 38 我有一次去面个ETL的lead, 结果他们派了个人跟我扯了一个小时的multithread, 后
来进来个部门的头, 问我如何计算他们town加油站的个数, 我当时脑袋一团浆糊,
除了记得有人说过我软考过这题以外什么逻辑推理都没有, 不过走出来, 开上车以后
答案立马就出来了, 都是命, LOL |
|
d********w 发帖数: 363 | 39 http://dongfei.baijia.baidu.com/article/54768
提到大数据分析平台,不得不说Hadoop系统,Hadoop到现在也超过10年的历史了,很多
东西发生了变化,版本也从0.x进化到目前的2.6版本。我把2012年后定义成后Hadoop平
台时代,这不是说不用Hadoop,而是像NoSQL (Not Only SQL)那样,有其他的选型补
充。我在知乎上也写过Hadoop的一些入门文章 如何学习Hadoop - 董飞的回答,为了给
大家有个铺垫,简单讲一些相关开源组件。
背景篇
Hadoop: 开源的数据分析平台,解决了大数据(大到一台计算机无法进行存储,一台计
算机无法在要求的时间内进行处理)的可靠存储和处理。适合处理非结构化数据,包括
HDFS,MapReduce基本组件。
HDFS:提供了一种跨服务器的弹性数据存储系统。
MapReduce:技术提供了感知数据位置的标准化处理流程:读取数据,对数据进行映射
(Map),使用某个键值对数据进行重排,然后对数据进行化简(Reduce)得到最终的
输出。
Amazon Elastic Map Red... 阅读全帖 |
|
d********w 发帖数: 363 | 40 http://dongfei.baijia.baidu.com/article/54768
提到大数据分析平台,不得不说Hadoop系统,Hadoop到现在也超过10年的历史了,很多
东西发生了变化,版本也从0.x进化到目前的2.6版本。我把2012年后定义成后Hadoop平
台时代,这不是说不用Hadoop,而是像NoSQL (Not Only SQL)那样,有其他的选型补
充。我在知乎上也写过Hadoop的一些入门文章 如何学习Hadoop - 董飞的回答,为了给
大家有个铺垫,简单讲一些相关开源组件。
背景篇
Hadoop: 开源的数据分析平台,解决了大数据(大到一台计算机无法进行存储,一台计
算机无法在要求的时间内进行处理)的可靠存储和处理。适合处理非结构化数据,包括
HDFS,MapReduce基本组件。
HDFS:提供了一种跨服务器的弹性数据存储系统。
MapReduce:技术提供了感知数据位置的标准化处理流程:读取数据,对数据进行映射
(Map),使用某个键值对数据进行重排,然后对数据进行化简(Reduce)得到最终的
输出。
Amazon Elastic Map Red... 阅读全帖 |
|
s*****r 发帖数: 43070 | 41 在boundary上面,DE不编程的,做做DW和ETL
要改 |
|
l****n 发帖数: 156 | 42 Database & BI specialist with strong programming background
Different roles (Production DBA, Development DBA, data modeler, data
architect, developer)
Different products (MS SQL SERVER, Oracle, DB2, MySQL, Postgresql, Informix,
IMS, Sybase)
Different platforms (UNIX/Linux, Windows,IBM Mainframe)
Different applications (MIS, MRP, ERP, Billing & Accounting, Data Warehouse
& BI)
Different languages(C, C#, COBOL, Perl, Python, Powershell, VBScript, Ksh,
Bash, SQL, T-SQL,PL/SQL, SQL/PL, JCL, REXX, CL... 阅读全帖 |
|
m**********1 发帖数: 92 | 43 请问具体薪资范畴?可以CPT工作吗?已有两年BI经验。 |
|
k***p 发帖数: 3 | 44 职位是business intelligence engineer, 看要求主要是ETL,query和report design
。 面试官从linkedin看是个从印度跳槽来的三哥engineer。我会一些SQL,但完全没有
BI方面经验,有些意外面这个职位。求问主要应该做哪些准备。谢谢。 |
|
y*d 发帖数: 2226 | 45 Hadoop MR缺5个东西
1。好的programming API。这个Hive和cascading多少弥补了一些
2。Workflow,这个google早就有了,但是没开源,也没发paper。Cascading和Apache
Crunch试了下水。Spark在这两个的基础上稍加改进,终于做得像一点样子了
3。in-memory cache / long live service,这个其实是最早的parallel computing就
有的东西。map-reduce为了扩展性、灵活性、容错性砍掉了,反正map-reduce的主要应
用ETL也不要这些。现在presto,spark又试着把这个加回去
4。interactive execution。也是早就有的东西,Google Dremel,Presto, impala,
等等等等
5。Peer to peer通信。这个对于某些应用很重要。目前只有MPI支持。但是MPI比较难
用了
6。实时数据处理。这个方面,Storm其实做得很好,但是相对比较难programming比较
难debug。Spark的折中方案对于Serious的用户不... 阅读全帖 |
|
m*******e 发帖数: 361 | 46 写了feedback HR会看到的
前几天还碰到个印度大妈,简历吹牛,各种fancy的关键词,结果连遍历两个数组的
while loop都写不出来.
把我面的痛苦的啊,HR也没说可以提前结束面试
问她编程经历如何,python刚开始学....一直做的data engineering,其实就是ETL,希
望到我们这学习更多编程经验... |
|
c******n 发帖数: 4965 | 47 etl informatica 这个东西简直是给烙印量身定做的, 好多烙印吃这个饭碗 |
|
f********s 发帖数: 103 | 48 Let me know if you or your friends are interested.
--------------------------------------------------
A boutique asset management firm in PA. We are seeking a well-rounded
software developer to join our development team. This developer will help
maintain and expand our proprietary automated data-driven trading systems.
As a key member of a small development team, you will be an integral part of
all aspects of our mission-critical trading infrastructure. In addition to
working with existing syste... 阅读全帖 |
|
R*********9 发帖数: 342 | 49 Egencia, an Expedia, Inc. Company is the only integrated solution offering
world-class full-service travel management powered by its own market-leading
technology -- enabling small to Fortune 1000 companies to dramatically
lower costs while enjoying a better travel experience. Egencia is a full
service travel management that combines the ease and efficiency of online
travel services with the personal attention of traditional travel agencies.
Egencia is changing the way business travelers plan, b... 阅读全帖 |
|
R*********9 发帖数: 342 | 50 Egencia, an Expedia, Inc. Company is the only integrated solution offering
world-class full-service travel management powered by its own market-leading
technology -- enabling small to Fortune 1000 companies to dramatically
lower costs while enjoying a better travel experience. Egencia is a full
service travel management that combines the ease and efficiency of online
travel services with the personal attention of traditional travel agencies.
Egencia is changing the way business travelers plan, b... 阅读全帖 |
|