o******3 发帖数: 1 | 1 I took StatsGuy’s Python class on Feb.8 and I have something to say about
the class. I’m a recent graduate master student majoring in statistics and
currently working as a data analyst intern in a startup company. And my
reason for taking the Python class is to better fill the requirements as a
Data Analyst/Scientist in IT industry. About one month ago I read a topic
from StatsGuy on Mitbbs named
再谈湾区工作,Python R及SAS. Here is the link below -
http://www.mitbbs.com/article_t/Statistics/31362237.ht... 阅读全帖 |
d********n 发帖数: 3477 | 3 I am a math PhD student and took both R and Python classes with statsGuy
recently. My expectation before registering the classes was quite simple: I
had some experience with R, and was relatively new to Python. And let's be
realistic: it's impossible to become an experienced data scientist in just
four hour's of training. Hence I am just trying to get some exposure to real
life project with real data for R, refresh my memory for Python and
hopefully learn some useful tricks, as well as tips on h... 阅读全帖 |
S******y 发帖数: 1123 | 4 暑假又到了! 我们每年的暑期培训也开始招生了!
我们的实用Data Science课程与工业界密切相关, 由业界资深的Data Scientists亲授.
我们历届毕业的同学们中 很多成功的进入湾区的大小公司。我们很强的connection遍
This summer, we are offering an Eight-Session online Bootcamp (including
eight weekend classes):
1) Hadoop / Hive for Data Scientist
2) Python 1 (Basic & Intermediate)
3) Python 2 (Advanced)
4) Intensive R for Data Scientists
5) Tableau in Practice
6) Practical SQL for Data Scientist
7) Text Mining for Data Scientist
8) Latest tech trends and popular machine lear... 阅读全帖 |
S******y 发帖数: 1123 | 6 Thank you for your kind words on my training program!
I am glad that you find my online interactive training useful.
Feel free to email me if you have any questions.
Best with your future endeavors!
m*********[email protected]
---------------------------------------------- |
S******y 发帖数: 1123 | 7 Surely I will let you know if new classes become available!
m*********[email protected] |
A****1 发帖数: 9 | 9 刚才在网上看到statsguy 6月份有收费的python课。挺感兴趣的。不过不知道这个靠谱
statsguy您也别介意,怀疑不是否定。如果大家都说好我就报名! |
i********t 发帖数: 809 | 10 靠谱!
[在 A54321 (A54321) 的大作中提到:]
:刚才在网上看到statsguy 6月份有收费的python课。挺感兴趣的。不过不知道这个靠
:........... |
S******y 发帖数: 1123 | 11 ==>欢迎浏览我的Python/R/Hadoop实战速成课网页<==
"Python入门及实战" 成为近期最受同学们欢迎的课程,本月课程中hands-on练习的数
据包括 financial underwriting 工业界实战数据。
"R入门及实战" 课程亦有不同行业的同学来选修.Text-Mining实战也引发了不少兴趣:-)
打算在个人电脑上运行Hadoop/Hive 实例的同学,请准备64-bit PC 至少 4 GB RAM.
同学们利用周末时间来上课,十足的学习拼劲, 亦让人印象深刻!
应同学要求,我计划再开一门新课 - "如何通过参与Kaggle竞赛 来迅速提升Data
Science技巧" http://www.ka... 阅读全帖 |
S******y 发帖数: 1123 | 12 Thank you for your kind words!
Hope to meet you in person at the March 2014 - SF Bay Area R User Meeting in
San Francisco next month!
Happy Python!
- statsGuy
begin |
o****o 发帖数: 8077 | 13 congratulations, StatsGuy |
d********n 发帖数: 3477 | 14 额。。。。见过这么敬业的托么?
而且说句实话,他弯曲sr. data scientist真不缺这点钱。。。。。。 |
b********u 发帖数: 3 | 16 statsguy的hadoop 及python 课
内容非常贴近工作 讲解的也很耐心
推荐一下! |
D**0 发帖数: 2048 | 17 ☆─────────────────────────────────────☆
StatsGuy (StatsGuy) 于 (Mon May 10 00:32:22 2010, 美东) 提到:
帮一个朋友问。 朋友想从中国转钱到美国帮亲戚买房。
国内美元在中国银行。 怎么转十万美元到美国来?
N007 (N007) 于 (Mon May 10 00:33:49 2010, 美东) 提到:
1w收24+12的手续费 好像
StatsGuy (StatsGuy) 于 (Mon May 10 00:49:44 2010, 美东) 提到:
一万美元收三十六块美金, 国内收的真贵啊!
N00 |
S******y 发帖数: 1123 | 18 发信人: StatsGuy (StatsGuy), 信区: Statistics
标 题: 也谈为什麽要学习Python (对 Python没有兴趣的请跳过 :-)
发信站: BBS 未名空间站 (Sat Apr 12 20:03:06 2014, 美东)
最近坛子上 百家齐放,百花争鸣
我也忍不住说一说 - 为什麽要学习Python?
首先, 这里只谈Python 不针对其他任何一种语言(对Python没有兴趣的请跳过 :-)
1) Python是 一个所有人都可以学的语言
在亚洲任何一个国家 上过初三/高一 数学的人, 都够资格学Python
与C++, Java相比, Python 大大简化了编程 (只在 performance做了一点牺牲)
2) 如果你想转行Data Science,Python 是你入行的 敲门砖
Python可以prepare data for analysis
Python可以perform statistical analysis (numpy, scipy, pandas, ipython,
Python 可以用来写p... 阅读全帖 |
S******y 发帖数: 1123 | 19 Saturday 4/19
Python Class - Saturday 8:30 AM (Pacific Daylight Time )
- Data Types and Expressions
- Variables
- Statements
- Functions, Methods and Modules
- Strings
- Lists and Tuples
- Dictionary
- Handling Exceptions
- File I/O
- Conditionals, Loops and other statements
- Hands on coding (inc. Examples: financial underwriting data)
- a quick demo on Hadoop File System, Hive and Python streaming.
R Class - Saturday 11:00 AM (Pacific Daylight Time)
1) R concepts r... 阅读全帖 |
S******y 发帖数: 1123 | 20 -----------------------------------------------------------------------------
发信人: StatsGuy (StatsGuy), 信区: Statistics
标 题: 也谈为什麽要学习Python (对 Python没有兴趣的请跳过 :-)
发信站: BBS 未名空间站 (Sat Apr 12 20:03:06 2014, 美东)
最近坛子上 百家齐放,百花争鸣
我也忍不住说一说 - 为什麽要学习Python?
首先, 这里只谈Python 不针对其他任何一种语言(对Python没有兴趣的请跳过 :-)
1) Python是 一个所有人都可以学的语言
与C++, Java相比, Python 大大简化了编程
2) 如果你想转行Data Science,Python 是你入行的 敲门砖
Python可以prepare data for analysis
Python可以perform statistical analysis
Python 可以用来写production code
Python 可以wo... 阅读全帖 |
S******y 发帖数: 1123 | 21 经常有同学会问 - 同样叫作Data Scientist,为什么在不同industry 不同公司收入可
Data Scientist means different things in different companies
有的传统公司一夜之间把data analyst 改称data scientist 然而工作内容 薪水及公
司的status and visibility 都没改变 是换汤不换药的作法
Data Science =
Stats + CS + Communication
在SF湾区高科技公司 需要大量的能够为核心产品提供guidance and actionable
insights 的数据科学家
一方面招人经理求贤若渴 招人不易
一方面求职者众 找工不易 (今年以来招聘 收到简历之多 发现几乎所有science 及
engineering 专业的都在转data scientist)
这里实际上有信息不对称的情形 常常是对具体data scientist opening的理解不足
===============... 阅读全帖 |
S******y 发帖数: 1123 | 22 做统计/Data Science 的一个好处是: 不少统计的方法可以用在不同的industry
这使得在早期职场生涯 换领域 相对容易一些,但实践中往往也并非易事
08年以前 是金融业吃香的时候 各种金融产品满天飞,做quants工资奖金丰厚 让别的
但如今,奥巴马政府的繁重法规各种要求 让银行业不堪重负 利润大幅减少 华尔街裁
真是所谓 三十年河东 三十年河西!
(当然 牛人在哪里都是牛人,但毕竟是少数,不在本文讨论范围)
从06年开始 WEB 2.0 的兴起,带动的 mobile, social, cloud, sharing economy 的
大潮方兴未艾, 集中在San Francisco 湾区的高科技公司对数据分析的需求暴增。 每
个公司都需要从数据中挖掘INSIGHTS 对产品决策提供支持。需求量大, 但要求也高,
往往身兼 product management 的function。 好的Data Scientist 非常难招,要懂技
术, 懂产品, 能和公司内部各个部门交流。 喜欢高科技行业,有精力能打拼的同学
(... 阅读全帖 |
S******y 发帖数: 1123 | 23 Data Science 在不同公司有不同的要求 本文只专门讨论 高科技公司里
centralized Data Science
部门里的DS role 也是现今需求增长最快的
很多同学有误解 认为DS是极其高大上的工种 非名校PhD不能胜任
除了在狗家和FB家专门做深度学习(专业小圈子 不在本文讨论范围之内) 大部分DS并
不需要顶尖的理论人才 而是需要大批的理论与实际相结合 能够解决实际工业界问题的人
技术方面 基础要扎实 概念要求清楚 知识面要宽 对DS发展最新趋势要了解 不需要造
轮子 而是很快就能用合适的方法从数据中挖掘出actionable insights
除了不错的quant skills 还需要以下几方面:
1 处理数据能力 尤其是很大的unstructured data 这个需要你熟悉Hadoop, Map/
Reduce, NoSQL
2 对产品方方面面 极其熟悉 否则你的对产品的建议只是隔靴搔痒
3 有极强的沟通能力 和各部门要熟络 而 闷头苦干的更适合做纯码工多一些
4 有较强的presentation 能力。Be a good ... 阅读全帖 |
S******y 发帖数: 1123 | 24 There are many hedge funds in CT
But not sure if they are hiring many quants/data scientists this year
Many hedge funds have been doing poorly this year
On the other hand, you might want to look into data scientist positions in
insurance industry in Hartford
注:笔者为多年工业界经验的资深 Principal Data Scientist 现任职于SF湾区一家高
科技公司 【mr.statsguy AT gmail】
[2016秋季班开始] DataScience Bootcamp
http://www.mitbbs.com/article_t/Statistics/3139582... 阅读全帖 |
S******y 发帖数: 1123 | 25 欢迎来湾区!
There are not many companies in SF Bay Area using SAS.
If you would like to widen the range of opportunities, it might be a good
idea to emphasize Python, Hadoop and R skills on your resume. These three
skills are rudimentary requirements in order to pass resume screen as first
step in recruiting process (这三个基本要求里面Python重要性排第一)
SQL, Tableau, and TextMining could be plus too (depending individual
湾区其实圈子很小 找工作主要靠公司内部referral 建议楼主多参加本地 meetups and
[E-... 阅读全帖 |
S******y 发帖数: 1123 | 26 很多人都不满意自己的工作,于是过完年就准备辞职,但却被上司苦苦挽留,从而动摇
复折... 阅读全帖 |
D**0 发帖数: 2048 | 27 ☆─────────────────────────────────────☆
lanxuan (lanxuan) 于 (Wed Mar 10 21:10:43 2010, 美东) 提到:
StatsGuy (StatsGuy) 于 (Wed Mar 10 23:09:17 2010, 美东) 提到:
Jeffy Lube -- $5 off on their website ; sometimes better coupon on newspaper |
b***k 发帖数: 2673 | 29 ☆─────────────────────────────────────☆
StatsGuy (StatsGuy) 于 (Tue May 5 12:19:23 2009) 提到:
Can somebody give a shot to these
interview questions?
I have no clue ..
Cheers! |
o******6 发帖数: 538 | 30 ☆─────────────────────────────────────☆
StatsGuy (StatsGuy) 于 (Sat May 23 20:29:54 2009) 提到:
I have the following data frame -
Name, date, Revenue
Sam, 2007-07-01, 210
Sam, 2007-07-02, 1900
Sam, 2007-07-05, 2900.
Rachel, 2007-07-01, 790
Rachel, 2007-07-02, 580
Rachel, 2007-07-04, 3000
I would like to plot two lines in the same graph in R -
X-axis will be date
Y-axis will be revenue
Two lines , one for Sam, and one for Rachel.. |
p********a 发帖数: 5352 | 31 ☆─────────────────────────────────────☆
StatsGuy (StatsGuy) 于 (Thu Mar 25 19:41:40 2010, 美东) 提到:
what is the difference between "&" vs "&&" in R?
Dannemora (Dannemora) 于 (Thu Mar 25 19:53:28 2010, 美东) 提到:
&是piece wise, 向量化的; && 只给是一个结果。下面的code一跑就知道了。
a & b
a && b
alexmitbbs (alexmitbbs) 于 (Thu Mar 25 23:30:10 2010, 美东) 提到:
"& and && indicate logical AND and | and |
n****q 发帖数: 464 | 32 Hi XXX,
Thank you for your interest!
抱歉我的Notes 还在整理中,需要花一些时间 ,可能会以e-book的形式出现 ,届时会
您 如需要马上 上手Python 和 R,我可以提供online tutoring
Currently, there are four topics that I provide -
I. Introduction to R
II. Introduction to Python
III. Introduction to Text Mining using Python and R (需有一点Python R 基础)
IV. Using Hive and Python to run map-reduce jobs on Hadoop (需有一点Python
及Hadoop 基础)
Each class takes two hours. it will be $70 per class. ... 阅读全帖 |
S******y 发帖数: 1123 | 33 ------------------------------------------------------------------------
欢迎联络我 m*********[email protected]
最近看到不少帖子,讨论到学习Python 与 R 的需求。
我想在这里分享一下自己的经历。希望对大家有帮助 :-)
我以前在传统行业做统计和SAS programming. 过着平稳的技术生活,在平常工作中不
断提高SAS水平,也曾去SAS Conference 做过 presentation. 也算是老板手下的SAS技
术骨干吧 (心里也挺踏实:-)。可是我N年前一个偶然的机会来到湾区,从此开始了"二
次创业"的奋斗史 (教训啊 来湾区的决定要慎重:-)
落脚未稳,首先就发现SAS在湾区不... 阅读全帖 |
n****q 发帖数: 464 | 34 Hi XXX,
Thank you for your interest!
抱歉我的Notes 还在整理中,需要花一些时间 ,可能会以e-book的形式出现 ,届时会
您 如需要马上 上手Python 和 R,我可以提供online tutoring
Currently, there are four topics that I provide -
I. Introduction to R
II. Introduction to Python
III. Introduction to Text Mining using Python and R (需有一点Python R 基础)
IV. Using Hive and Python to run map-reduce jobs on Hadoop (需有一点Python
及Hadoop 基础)
Each class takes two hours. it will be $70 per class. ... 阅读全帖 |
S******y 发帖数: 1123 | 35 谢谢大家回应。
同学们都爱听故事 :-),我就再讲两个小故事,都是真实的湾区故事。
第一个是我的一位朋友,social sciences背景 精通SAS. 多年工业经验。非常优秀。
startup 做Analytics 和模型的负责人,director 级別以上。上任没几天,问题
来了。公司只用R. 沒有SAS! 她想让公司买SAS license. 公司的founder/CEO 拒绝。
学。每天long commute across Bay. 回家还要照顾家人,哪有时间? 结果,被迫再次
跳槽,还好,找到下一家有SAS 的公司工作,更远的上班commute。。
我N年前刚来湾曲不久的时候,有次听说有个如日中天的科技公司 统计部门招人,经
朋友介绍,与部门主管见一见。刚开始,双方聊得甚欢。In middle of conversation
我偶然... 阅读全帖 |
S******y 发帖数: 1123 | 36 谢谢已经注册和已经上课的同学们.
已经完成培训的同学们,希望大家把课堂上学到的Python R 尽量用到每一天的工作中.
比如 您的工作是 SAS programmer. 您在做完SAS coding 以后, 若时间允许不妨用
Python R 来再做一遍 verify 一下结果。就当做 quality control (如果SAS process
is too complicated to replicate,也可以Python R来verify其中的一部分).这样可
以逐渐上手 很快您就成为Python,R,SAS 的多面能手!
打算上课的同学请尽早电邮我来报名 seats and availability do fill up quickly.
祝大家马年 龙马精神,财源广进!
m*********[email protected] |
S******y 发帖数: 1123 | 37 dynkin 's advice above is legitimate. It is worth paying attention to.
See also my earlier post on this topic -
It might be a good time to start using Python + R
If you have budget to spend, you might want to consider Tableau instead.
You could also spend less than one hundred dollars on my two-hour R crash
course :-)
m*********[email protected] |
S******y 发帖数: 1123 | 38 "supervisor以前是自己做过公司的" : Self-start entrepreneurs are the most
cost-sensitive people. They do not like spend one dime more than necessary.
"VP..貌似也没有很大的反应" : What does he really think?
It might be helpful to put yourself in their shoes to think about this.
New group, new budget. Then the management is being asked for ten
thousands $ up front (on one or two BASE licenses) just to get the ball
Not mentioning that you have to purchase separate ... 阅读全帖 |
S******y 发帖数: 1123 | 39 Kaggle是预测性建模和分析比赛平台. 通过这个平台,Sponsors 提供数据和问题的描
述。 参赛者尝试不同的技术相互竞争,以产生最佳的模型和预测结果。(参赛者使用最
多工具的是 Python, R)
学领域。 Kaggle最有名的是300万美元的HealthCare Data比赛 。最近的另一项比赛着
比赛已经导致了许多成功的项目,包括改进现有技术在HIV研究, 交通预测 等
等。 在Kaggle比赛取得成果的基础上 一些学术论文已经发表。
2011年11月, Kaggle宣布A系列轮融资1100万美元。另一个著名的投资人是Hal
2011年Kaggle搬到了旧金山 经历了快速扩张阶段。
(以上摘自/编译自 维基百科)
鼓励大家利用这一极佳学习平台,迅速提高data science水平更上一层楼!
可以自学也可以上我... 阅读全帖 |
S******y 发帖数: 1123 | 40 现在大趋势是,不论做quant finance 还是统计,最好都会点编程。
大家不信可去mitbbs - Financial Engineering版上去看帖子,矿工们天天讨论 -面试
中 编程题目 越来越多。。。
做统计的 过去 往往有专门的 data programmer帮忙编程pull data. 现在更多的公司
不再配专人pull data. 在硅谷做data scientist 的同学们都知道,要自己动手编程
pull raw data 整理数据 然后才建模 预测。
如今天开始学习编程,选第一门语言不妨直接考虑上Python. 其特点 - 简洁,强大
,易上手,前景广阔 (背后有谷歌等硅谷公司默默支持)
- StatsGuy
m*********[email protected] |
S******y 发帖数: 1123 | 41 我本周四,周五会在Lower Manhattan. 住在Wall St附近.
请问在曼哈顿的同学们,周四下了班一般会有Happy Hour吗?
m*********[email protected] |
S******y 发帖数: 1123 | 42 机会可以寻找,可以network for opportunities, 可以不断去试 (我们当年来美国不
就是taking risk & seeking opportunities 吗?)
Meanwhile, you do your part to grasp Python & R. For example, you can use
Python R to parallel programming as QC process (at your own time). You can
write a desktop application in Python to simplify things for your manager/co
-workers. You can use Python to generate SAS code when appropriate.
不外乎两种情形 -
> "勤学苦练 Python, R, Hadoop"
When Data Scientist opportunity presents itself to you, you are ready :-)
... 阅读全帖 |
S******y 发帖数: 1123 | 43 Thanks for sharing the fun stuff you are working on!
Let me give a try by brainstorming :-)
At first, have a productID column so it allows one productID to have
multiple prod names across sites
1.-3. Pig summarizes data in Hadoop
4. Pig summarizes data in Hadoop ==> R/Python building models (quick and
dirty aggregate-level)
5. Mahout (item-based collaborative filtering)
Just my 2 cents :-)
m*********[email protected]
http://plus.google.com/+statsGuyMITBBS/about |
S******y 发帖数: 1123 | 44 最近坛子上 百家齐放,百花争鸣. 我也忍不住说一说 - 为什麽要学习Python?
首先, 这里只谈Python 不针对其他任何一种语言(对Python没有兴趣的请跳过 :-)
1) Python是 一个所有人都可以学的语言
在亚洲国家 上过初三/高一 数学的人, 都够资格学Python
与C++, Java相比, Python 大大简化了编程 (只在 performance做了一点牺牲)
2) 如果你想转行Data Science,Python 是你入行的 敲门砖
Python可以prepare data for analysis
Python可以perform statistical analysis (numpy, scipy, pandas, ipython,
Python 可以用来写production code
Python 可以work seamlessly with Hadoop (extension to Hive, Pig, and Hadoop
streaming). You can write Python map-reduce j... 阅读全帖 |
S******y 发帖数: 1123 | 45 同学们经常有问 - 两个小时的培训课是否太短了,能学会Python吗?
Here is how my students grasp Python/R in two hours -
1)提前获得培训资料,课前预习 Upon registration, students will receive pre-
class installation instructions, and class materials (including entire deck
for class, real-world data files, hands-on exercise/code) prior to class.
Students can study thoroughly prior to class. You can email me any time with
questions even before class starts.
2)培训专注数据科学领域 Python and R, each is a vast topic. In my class, we
focus on Python & R ... 阅读全帖 |