由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Military版 - 中国最擅长吹 不懂装懂 张嘴就来 关于CS DS
进入Military版参与讨论
1 (共1页)
h*****h
发帖数: 264
1
不懂装懂的真多。学校学的DS,就是CS的课,集中在机器学习而已
DS和CS 的本科也好硕士也好,80%的课程相同
不同的课,自己学学就行
学校又不是学习的终结 毕业后还要学三四十年呢
张益唐的数论 也不是普度读博士的领域 是他北大期间的领域
外面的bootcamp那是啥狗屁玩意啊,程序都是别人写的,去aws上调参数
学校里学DS,要自己写程序的!
还扯上统计了,那只是数学基础,距离实际programming远着呢
统计系毕业的硕士,几个学过写过机器学习的程序?除非自己自学
DS毕业 写machine learning程序 现在叫machine learning engineer不叫software
engineer
CS毕业,如果机器学习没咋学(有的学校这个方面不强大)做不来这个
bootcamp出来的根本做不了
h*****h
发帖数: 264
2
你还号称做码工呢,真是无知愚蠢到了极点
https://cs.illinois.edu/academics/courses/cs498dsg-120201
你看看上面链接,是啥教授开的!
非CSEE PHD,基本不会machine learning的原理 ,基本全部靠自学
你以为bootcamp的调参数,是DS啊?后面machine learning程序谁写的?
某些学校把DS开设在统计系,是因为CS EE做ML和图像识别的教授没几个
水平不行,开不出完整的DS项目,DS程序不会写 并行计算的平台学校又不愿意花钱
只好拿统计学点数学充数 统计距离ML程序 差远了
a*****s
发帖数: 1
3
software engineer的就业面还是最广的。
DS一会自称data scientist,一会自称machine learning engineer,已经很说明问题
咯。
s*****r
发帖数: 43070
4
工作也就是调参,把模型结果整的好看些
这玩意跟生物差不多了,没有逻辑方面的支持,全靠调参
谁需要你去程序,都是现成的包,如果notebook那玩意也能算程序

【在 h*****h 的大作中提到】
: 你还号称做码工呢,真是无知愚蠢到了极点
: https://cs.illinois.edu/academics/courses/cs498dsg-120201
: 你看看上面链接,是啥教授开的!
: 非CSEE PHD,基本不会machine learning的原理 ,基本全部靠自学
: 你以为bootcamp的调参数,是DS啊?后面machine learning程序谁写的?
: 某些学校把DS开设在统计系,是因为CS EE做ML和图像识别的教授没几个
: 水平不行,开不出完整的DS项目,DS程序不会写 并行计算的平台学校又不愿意花钱
: 只好拿统计学点数学充数 统计距离ML程序 差远了

h*****h
发帖数: 264
5
DS是CS的一个分支 当然也可以说是EE的分支 统计的分支 =统计+编程
本来学科就是交叉的
这儿的IT大妈太烂了 10年前,很多学校开不出ML的课程 没教授做
大妈们ML的课程都没学过几门 张嘴就来

【在 a*****s 的大作中提到】
: software engineer的就业面还是最广的。
: DS一会自称data scientist,一会自称machine learning engineer,已经很说明问题
: 咯。

h*****h
发帖数: 264
6
滚,先去学几门ML的课,你才有资格谈论

【在 s*****r 的大作中提到】
: 工作也就是调参,把模型结果整的好看些
: 这玩意跟生物差不多了,没有逻辑方面的支持,全靠调参
: 谁需要你去程序,都是现成的包,如果notebook那玩意也能算程序

F**********7
发帖数: 1
7

都这么牛逼了
把泥阿三爹放哪里?

【在 h*****h 的大作中提到】
: 不懂装懂的真多。学校学的DS,就是CS的课,集中在机器学习而已
: DS和CS 的本科也好硕士也好,80%的课程相同
: 不同的课,自己学学就行
: 学校又不是学习的终结 毕业后还要学三四十年呢
: 张益唐的数论 也不是普度读博士的领域 是他北大期间的领域
: 外面的bootcamp那是啥狗屁玩意啊,程序都是别人写的,去aws上调参数
: 学校里学DS,要自己写程序的!
: 还扯上统计了,那只是数学基础,距离实际programming远着呢
: 统计系毕业的硕士,几个学过写过机器学习的程序?除非自己自学
: DS毕业 写machine learning程序 现在叫machine learning engineer不叫software

e****i
发帖数: 393
8
你丫纯扯淡,屁都不懂。
DS说白了就是写点SQL和其他pipeline什么的,调用现成的包做点数据分析。早就烂大
街的行业,无数转行的跑过来混,其实就是数据分析员。这帮人的特点是code写得烂,
也没有能力研究真正的ML问题,就像万金油到处扯扯淡分析一下数据。
DS写个几把code,就是点sql,python,本质就是data anlyst,能写点spark都算高
级的了。
不要跟哥辩论,丫就是你自己说的“屁都不懂,喜欢瞎逼逼”的那种sb。

【在 h*****h 的大作中提到】
: 不懂装懂的真多。学校学的DS,就是CS的课,集中在机器学习而已
: DS和CS 的本科也好硕士也好,80%的课程相同
: 不同的课,自己学学就行
: 学校又不是学习的终结 毕业后还要学三四十年呢
: 张益唐的数论 也不是普度读博士的领域 是他北大期间的领域
: 外面的bootcamp那是啥狗屁玩意啊,程序都是别人写的,去aws上调参数
: 学校里学DS,要自己写程序的!
: 还扯上统计了,那只是数学基础,距离实际programming远着呢
: 统计系毕业的硕士,几个学过写过机器学习的程序?除非自己自学
: DS毕业 写machine learning程序 现在叫machine learning engineer不叫software

e****i
发帖数: 393
9
土鳖不知道做ML有三派吧?统计那帮人做ML的非常多,ML的学名就叫statistical
learning。数学系一帮人做ML,剩下就是EECS的人。三派都有很多做ML水平很高的人。
真正影响力大的还是CS的,因为能做production赚钱。
你丫转行的,还是垫着脚对ML这行探头探脑的门外汉?笑死哥了

【在 h*****h 的大作中提到】
: 你还号称做码工呢,真是无知愚蠢到了极点
: https://cs.illinois.edu/academics/courses/cs498dsg-120201
: 你看看上面链接,是啥教授开的!
: 非CSEE PHD,基本不会machine learning的原理 ,基本全部靠自学
: 你以为bootcamp的调参数,是DS啊?后面machine learning程序谁写的?
: 某些学校把DS开设在统计系,是因为CS EE做ML和图像识别的教授没几个
: 水平不行,开不出完整的DS项目,DS程序不会写 并行计算的平台学校又不愿意花钱
: 只好拿统计学点数学充数 统计距离ML程序 差远了

h*****h
发帖数: 264
10
我当然知道。我是批评洗脚大妈那类人,DS=调参数,或者说统计=DS,认为编程无用的人
你别装逼了,CS的很多code也是很多抄人家统计R来的
抄来的!
你难道郁斌是统计教授,也是CSEE叫兽

【在 e****i 的大作中提到】
: 土鳖不知道做ML有三派吧?统计那帮人做ML的非常多,ML的学名就叫statistical
: learning。数学系一帮人做ML,剩下就是EECS的人。三派都有很多做ML水平很高的人。
: 真正影响力大的还是CS的,因为能做production赚钱。
: 你丫转行的,还是垫着脚对ML这行探头探脑的门外汉?笑死哥了

i***q
发帖数: 1095
11
这东西还是要真懂数学才好说自己真的懂。拿tensorflow堆个神经网络的调调参数,程
序员几天就能学会。

【在 h*****h 的大作中提到】
: 不懂装懂的真多。学校学的DS,就是CS的课,集中在机器学习而已
: DS和CS 的本科也好硕士也好,80%的课程相同
: 不同的课,自己学学就行
: 学校又不是学习的终结 毕业后还要学三四十年呢
: 张益唐的数论 也不是普度读博士的领域 是他北大期间的领域
: 外面的bootcamp那是啥狗屁玩意啊,程序都是别人写的,去aws上调参数
: 学校里学DS,要自己写程序的!
: 还扯上统计了,那只是数学基础,距离实际programming远着呢
: 统计系毕业的硕士,几个学过写过机器学习的程序?除非自己自学
: DS毕业 写machine learning程序 现在叫machine learning engineer不叫software

i***q
发帖数: 1095
12
这种倒数据的,一般不叫data scientist吧?也许小公司不分。倒数据程序员随手就给
干了。

【在 e****i 的大作中提到】
: 你丫纯扯淡,屁都不懂。
: DS说白了就是写点SQL和其他pipeline什么的,调用现成的包做点数据分析。早就烂大
: 街的行业,无数转行的跑过来混,其实就是数据分析员。这帮人的特点是code写得烂,
: 也没有能力研究真正的ML问题,就像万金油到处扯扯淡分析一下数据。
: DS写个几把code,就是点sql,python,本质就是data anlyst,能写点spark都算高
: 级的了。
: 不要跟哥辩论,丫就是你自己说的“屁都不懂,喜欢瞎逼逼”的那种sb。

i***q
发帖数: 1095
13
我当年高级机器学习课的讲义,第一页就用到了测度论,我就觉得自己不适合干这个。
虽然里面的算法我都会用,但是毕竟用的不如真懂得人好。不过现在啥人都觉得自己懂
了,敢吹最重要。不过也是懒,肯几本数学书或者去念个统计得master也没啥难的。
s*****r
发帖数: 43070
14
那是DE干的活,但DE一般不会懂模型,模型确实是大学里学的,工作以后谁没事还自学
数学,没老师教也很难学明白了
DS这活最适合本科数学和统计专业的,PHD时候做这个很容易了

【在 i***q 的大作中提到】
: 这种倒数据的,一般不叫data scientist吧?也许小公司不分。倒数据程序员随手就给
: 干了。

d*****u
发帖数: 17243
15
现在machine learning变化很大,以前的logistic regression, SVM啥的没人研究了。
都转成deep learning。
当然本质上说不管什么分类器,还是logistic regression,只是实现不一样,这就不
详细说了。
deep learning的特征之一是不可解释性。说不清具体怎么work,只有个大致的解释。
现实中的很多问题本来也没有数学解析形式,所以用这个方法倒是不错,只要有足够数
据。
突破性的工具就那么几个,CNN, RNN(现在用得少), Transformer之类的
其他的研究都是小打小闹,或者怎么让数据去fit
m**e
发帖数: 12
16
machine learning的算法就那么几种,难不成你读了一个ds的本科学位,竟然能发明一
种算法?能写ml的程序有个屁用,谁敢把你的code用在production 上,还不是调包。
类似于cs要学database, 课上要求学生写一个简单的database management system, 你
不会天真地认为有哪个公司会用这个吧。

【在 h*****h 的大作中提到】
: 不懂装懂的真多。学校学的DS,就是CS的课,集中在机器学习而已
: DS和CS 的本科也好硕士也好,80%的课程相同
: 不同的课,自己学学就行
: 学校又不是学习的终结 毕业后还要学三四十年呢
: 张益唐的数论 也不是普度读博士的领域 是他北大期间的领域
: 外面的bootcamp那是啥狗屁玩意啊,程序都是别人写的,去aws上调参数
: 学校里学DS,要自己写程序的!
: 还扯上统计了,那只是数学基础,距离实际programming远着呢
: 统计系毕业的硕士,几个学过写过机器学习的程序?除非自己自学
: DS毕业 写machine learning程序 现在叫machine learning engineer不叫software

s*****r
发帖数: 43070
17
码农就是要搞清楚都是怎么work的,因为要写test case,要定量
换个input就全变了,码农不要死了
DS和ML都是炼丹术,反正自己也不知道咋回事,就靠高深的模型公式来解释,反正别人
看不懂,就不知道结果该是啥样

【在 d*****u 的大作中提到】
: 现在machine learning变化很大,以前的logistic regression, SVM啥的没人研究了。
: 都转成deep learning。
: 当然本质上说不管什么分类器,还是logistic regression,只是实现不一样,这就不
: 详细说了。
: deep learning的特征之一是不可解释性。说不清具体怎么work,只有个大致的解释。
: 现实中的很多问题本来也没有数学解析形式,所以用这个方法倒是不错,只要有足够数
: 据。
: 突破性的工具就那么几个,CNN, RNN(现在用得少), Transformer之类的
: 其他的研究都是小打小闹,或者怎么让数据去fit

d*****u
发帖数: 17243
18
Evaluation还是很严谨的,要跟baseline去比performance
有各种metrics
只是没有很精细的论证为啥现在结果会比原来的好,只有个intuition

【在 s*****r 的大作中提到】
: 码农就是要搞清楚都是怎么work的,因为要写test case,要定量
: 换个input就全变了,码农不要死了
: DS和ML都是炼丹术,反正自己也不知道咋回事,就靠高深的模型公式来解释,反正别人
: 看不懂,就不知道结果该是啥样

s*****r
发帖数: 43070
19
万物皆可调,evaluation也能调出了
换另外的数据继续调

【在 d*****u 的大作中提到】
: Evaluation还是很严谨的,要跟baseline去比performance
: 有各种metrics
: 只是没有很精细的论证为啥现在结果会比原来的好,只有个intuition

i***q
发帖数: 1095
20
数学物理的人有机会就是因为传统的计算机系的数学课程标准比较低。
d*****u
发帖数: 17243
21
标准做法是,调参只能用development set(也叫validation set),可以根据它的
performance来调整模型
但最后测试是test set

【在 s*****r 的大作中提到】
: 万物皆可调,evaluation也能调出了
: 换另外的数据继续调

1 (共1页)
进入Military版参与讨论