S******y 发帖数: 1123 | 1 Data Science Training
Classes will be conducted via Skype. You will see my screen throughout the
class.
==>Python for Data Scientist Class <==
http://www.eventbrite.com/e/python-for-data-scientist-tickets-2
You can choose Python I or Python II depending your prior Python level :
Python I
- Installing Python
- Numbers and Expressions
- Variables
- Statements
- Modules
- Strings
- Lists and Tuples
- Dictionary
- Conditionals, Loops and other statements
- Hands on coding (Lab:reading data and parse... 阅读全帖 |
|
S******y 发帖数: 1123 | 2 Data Science Training
由硅谷高科技公司任职的资深数据科学家亲自任教
Real-world example and coding will be included.
课程注重 牢固清晰的概念以及极强的实用性。
Classes will be conducted via Skype. You will see instructor's screen during
the class.
已有多位同学成功转行/转型,通过课程 认真掌握课程资料 实践工业界实例,加上
networking, 在旧金山市及湾区找到心仪的Data Scientist 工作。
==> Hadoop/Hive for Data Scientist Class <==
http://www.eventbrite.com/e/hadoophive-for-data-scientist-class
Hadoop/Hive培训课包括
- Installation
- Hadoop 架构及原理
- Hive 语法及实例
- Map/Reduce 原理及实例
==>Python for Data Scienti... 阅读全帖 |
|
|
|
l*******o 发帖数: 71 | 5 楼主,你们培训班都教什么?
[在 StatsGuy (StatsGuy) 的大作中提到:]
:如条件许可 不妨试试搬到SF湾区 作为local candidate找工作
:可以比较容易拿到面试
:........... |
|
|
|
|
|
S******y 发帖数: 1123 | 10 找人内推有几个优点:
1)可以面试前了解公司该组 的内部情况, 从而有的放矢的准备
2)里面帮你内推的人可能成了你的朋友 甚至“盟友”
3)帮你内推的人会提醒你要注意的问题,甚至面试陷阱
找人内推 不是简单把简历丢给人家 说声谢谢就结束了,而是要争取跟他(她)聊一聊
, 对简历有什么建议,面试要注意什么。人家给你简历建议 要用心听。我管这个叫做
“深度内推”。
你不问,人家可能也不会花时间跟你讲.
Data Science 与 business 靠的很近,每个公司都不太一样。 这一点与码工有很大
区别。
盲目海投 搞不好把以后内推的路给堵了。 你网上投的简历进入candidate system, 后
面想帮你内推的就不一定能被系统接受了(至少一半以上的公司的系统是这样)。
祝猴年事事顺利 每个人都找到心仪的工作!
StatsGuy
mr.statsguy AT gmail
http://plus.google.com/+statsGuyMITBBS/about |
|
|
|
|
|
|
|
|
|
|
S******y 发帖数: 1123 | 20 Looking forward to working closely with you in the classes!
Cheers,
StatsGuy
: Thanks StatsGuy!
: I have registered for the Bootcamp :--)
: Looking forward to the classes!
|
|
|
|
|
|
S******y 发帖数: 1123 | 25 http://www.ftchinese.com/story/001068554#adchannelID=2100
数据科学家成抢手人才
美国学者格斯特林表示,5年内所有软件应用都将内置智能,使数据科学家成为“认知
”技术经济的关键工作者。
2016年7月25日 06:06 英国《金融时报》 理查德•沃特斯 报道
对于一个理应奇缺人才的领域,数据科学似乎在快速造就大批新专家。不久前,1600人
出席了华盛顿大学(University of Washington)机器学习教授卡洛斯•格斯特林(
Carlos Guestrin)执掌的公司Turi在旧金山主办的一次数据科学峰会,表明数据科学引
起的兴趣是多么的浓厚。
格斯特林提出,所有软件应用在5年内都将需要内置的智能,使数据科学家——经过培
训,能够对海量数据进行分析的人员——成为这一新兴“认知”技术经济中的关键工作
者。
无论这种关于数据科学即将无处不在的预测正确与否,目前已有一些核心的关键应用依
赖机器学习,最主要的是推荐程序、欺诈探测系统、预报工具和旨在预测顾客行为的应
用。
把直到不久以前还专属于研究科学家... 阅读全帖 |
|
y********o 发帖数: 104 | 26 谢谢您的回复。
Data Scientist都要博士毕业的吧,我就一小硕,也不敢奢望很多呢。
: There are many hedge funds in CT
: But not sure if they are hiring many quants/data scientists this year
: Many hedge funds have been doing poorly this year
: On the other hand, you might want to look into data scientist
positions in
: insurance industry in Hartford
: Best,
: StatsGuy
: http://www.statsguy.net/
: ====================================
: 注:笔者为多年工业界经验的资深 Principal Data Scientist 现任职于SF湾区
一家高
阅读全帖 |
|
|
S******3 发帖数: 66 | 28 不要这样武断,各人情况不同。牛人都去做DS了,编程不行的MM正好有机会靠SAS做点
低薪的金融data analyst / programmer之类的
: sas 考试 might be of little use here in 旧金山湾区
: -StatsGuy
: 欢迎浏览Python/R/Hadoop实战速成课网页-
: http://www.statsguy.net
: http://plus.google.com/ statsGuyMITBBS/about
|
|
S******y 发帖数: 1123 | 29 Don't be too excited
A lot of people on this forum 收到了Facebook recruiter的信; it does not mean
much...
Recruiters are working hard to find candidates so they usually cast a big
net; they will be fired if they cannot produce enough candidates
The interview process will be long and difficult requiring a lot of patience
; full of turns and surprises...
most of candidates will be eliminated at certain point over the long
interview process...
After you are hired, you will be required to go through a "f... 阅读全帖 |
|
S******y 发帖数: 1123 | 30 有兴趣的同学请与我联系
谢谢
[email protected]/* */
-------------------------------------------
我们的实用Data Science课程与工业界密切相关, 由业界资深的Data Scientists亲授.
我们历届毕业的同学们中 很多成功的进入湾区的多家公司 最近又有同学成功入职一线
大数据公司. Congratulations!
Registration for Spring'17 Data Science Bootcamp is now open!
Seats are limited.
If you are interested, please contact me via inbox or
email [email protected]/* */
Regards,
StatsGuy
http://www.statsguy.net/services.html
http://plus.google.com/+statsGuyMITBBS/about |
|
|
S******y 发帖数: 1123 | 32 We are offering a one-time class "Python for Data Scientist" this Saturday
4/22. It covers both Python concepts and coding exercises to solve real-
world problems in industry.
If you are interested, please email [email protected]/* */ ASAP.
Thanks!
StatsGuy
http://www.statsguy.net/ |
|
|
|
|
发帖数: 1 | 36 谢谢指教
请问一般ds职位招聘会考一般的软件算法题吗?我是指码工的算法题而不是ml或dl
一直很奇怪那些原来生物专业的怎么混进大公司ds行当的
[在 StatsGuy (StatsGuy) 的大作中提到:]
:probability
:statstics/ML
:Python/R/SQL
:Hadoop/Hive/Pig
:projects you have done
:soft skills
:business problem solving |
|
|
S******y 发帖数: 1123 | 38 【 以下文字转载自 Statistics 讨论区 】
发信人: StatsGuy (StatsGuy), 信区: Statistics
标 题: [2016] 工作市场总结
发信站: BBS 未名空间站 (Sun Sep 4 11:20:42 2016, 美东)
Data Science 做为北美工作市场上一个为数不多的亮点之一 今年以来仍然处于快速増长
2016转眼过去大半
今年工作市场发生了几个变化:
科技公司招聘需求仍然强劲。FLAG等大型科技公司仍在扩大招收DS和统计师 hiring
bar is now significantly higher。越来越强调动手coding之重要性 (两年前 我曾
在本坛上发帖强调过coding 对于统计专业同学之重要)
初创公司大半资金开始吃紧 招人开始减缓(优步等几家除外)
传统企业开始普遍意识DS重要性 从manufacturing 到consumer healthcare都在开data
science openings 但数量是细水长流型 比如-
Property and Casualty 类保险公司 从单纯强调精算 到接纳采用大数... 阅读全帖 |
|
S******y 发帖数: 1123 | 39 【 以下文字转载自 Statistics 讨论区 】
发信人: StatsGuy (StatsGuy), 信区: Statistics
标 题: [2016] 工作市场总结 <更新>
发信站: BBS 未名空间站 (Sun Sep 4 11:20:42 2016, 美东)
Job trend: Data Scientists vs. SAS Programmers
(source: www.indeed.com)
Data Science 做为北美工作市场上一个为数不多的亮点之一 今年以来仍然处于快速増长
2016转眼过去大半
今年工作市场发生了几个变化:
科技公司招聘需求仍然强劲。FLAG等大型科技公司仍在扩大招收DS和统计师 hiring
bar is now significantly higher。越来越强调动手coding之重要性 (两年前 我曾
在本坛上发帖强调过coding 对于统计专业同学之重要)
初创公司大半资金开始吃紧 招人开始减缓(优步等几家除外)
传统企业开始普遍意识DS重要性 从manufacturing 到consumer healthcare都在开da... 阅读全帖 |
|
S******y 发帖数: 1123 | 40 【 以下文字转载自 Statistics 讨论区 】
发信人: StatsGuy (StatsGuy), 信区: Statistics
标 题: [秋季班开始] DataScience Bootcamp <已更新>
发信站: BBS 未名空间站 (Fri Jun 17 11:21:16 2016, 美东)
Job trend: Data Scientists vs. SAS Programmers
(source: www.indeed.com)
今年夏天我们又有同学成功拿到data scientist offer 顺利入职FLAG一线公司
Congratulations!!
-------------
有兴趣的同学请与我联系
谢谢
[email protected]/* */
-------------------------------------------
我们的实用Data Science课程与工业界密切相关, 由业界资深的Data Scientists亲授.
我们历届毕业的同学们中 很多成功的进入湾区的多家公司 最近又有同学成功入职FLAG
一线公司 cong... 阅读全帖 |
|
|
c****t 发帖数: 19049 | 42 趴了。赵老师您认识StatsGuy? 没理由两个不同的人扯的差不多啊 |
|
l**********1 发帖数: 5204 | 43 pls refer
> posted on FRIDAY, JULY 6, 2012
Fix Overplotting with Colored Contour Lines
I saw this plot in the supplement of a recent paper comparing microarray
results to RNA-seq results. Nothing earth-shattering in the paper - you've
probably seen a similar comparison many times before - but I liked how they
solved the overplotting problem using heat-colored contour lines to indicate
density. I asked how to reproduce this figure using R on Stack Exchange,
and my question was quickly answered b... 阅读全帖 |
|
|
|
S******y 发帖数: 1123 | 46 #Python 2.6 StatsGuy 2010-10-04
import re
locations = '''
New York
New York, NY
Irvine
Dallas'''
txt_lst = locations.split('\n')
txt_lst.remove('')
for item in txt_lst:
# pattern is - comma followed by two-letter state abbreviations
p = re.compile('[\s,.](NY|GA|AL|MS|FL|SC)')
m= p.search(item)
if m:
city, state = item.rstrip('\n').split(',')
else:
city = item.rstrip('\n')
state = 'N/A'
print 'City is: ' + city + '; State is: ' + state
#N... 阅读全帖 |
|
w******a 发帖数: 25 | 47 如果用classification tree或是Support Vector Machine或是KNN分析的话,training set and test set的data size太小,怎么分都是不够的.
请问statsguy,该怎么分呢?要bootstrap吗? |
|
l******1 发帖数: 86 | 48 谢谢
StatsGuy, Actuaries,budmiller,还有被我confused的同学们!!!!! |
|
w******a 发帖数: 25 | 49 StatsGuy方便把code也在这里贴一下吗?谢谢 |
|
S******y 发帖数: 1123 | 50 #StatsGuy 2010-09-17 Python2.6
#Fill in missing data with complementary data
missing = '''
a 1 . 1 3 1
a . 2 1 4 2
a . 4 5 2 8
a 1 5 2 3 .
b . 9 2 3 2
b 5 9 2 4 4
b . 3 . 5 3
c 2 . . . .'''
complete='''
a 1 2 1
a 2 2 2
a 3 4 8
a 1 5 6
b 1 2
b 5 2
b 3 4
c 2 3 4 7'''
NUMBER_OF_VARS = 5
dx={} #map to see which column is missing
d1={} #original missing data set
d2={} #complementary data set
lst = [0 for x in range(NUMBER_OF_VARS)] #0 - good column; 1- bad column for an id
missing_lst = missin |
|