g******t 发帖数: 11249 | 1 天天都在搞算法 搞计算问题
说起很多统计方法,他们都不熟悉,教学上似乎也很不重视统计方法分析数据 |
d***a 发帖数: 13752 | 2 软硬件设计,对就是对,错就是错,99.9%是不行的。
不过,概率论和统计是必修课程,搞性能分析和评价,或者搞可靠性分析,还是要知道
基本统计方法的。 |
g******t 发帖数: 11249 | 3 计算机程序 = 算法 + 数据
数据也很重要啊,特别对于大尺度数据的distribution建模
完全就是统计的研究内容
不理解数据的统计分布,算法如何才能在PB级别数据上可计算并高效?
【在 d***a 的大作中提到】 : 软硬件设计,对就是对,错就是错,99.9%是不行的。 : 不过,概率论和统计是必修课程,搞性能分析和评价,或者搞可靠性分析,还是要知道 : 基本统计方法的。
|
d******e 发帖数: 7844 | 4 TCS里面会用到一些概率工具和统计模型,但他们和统计community关心的根本不是
一类问题。自然也不会熟悉那些统计方法。
做ML的人很多都有统计的training,尤其是做理论的,教学上和统计有很多共同点,但
和统计community关心的问题有时候差别也很大。
【在 g******t 的大作中提到】 : 天天都在搞算法 搞计算问题 : 说起很多统计方法,他们都不熟悉,教学上似乎也很不重视统计方法分析数据
|
d******e 发帖数: 7844 | 5 你应该是没get他的point。
【在 d***a 的大作中提到】 : 软硬件设计,对就是对,错就是错,99.9%是不行的。 : 不过,概率论和统计是必修课程,搞性能分析和评价,或者搞可靠性分析,还是要知道 : 基本统计方法的。
|
d***a 发帖数: 13752 | 6 当然重要。概率论和统计是计算机专业必修课程。
【在 g******t 的大作中提到】 : 计算机程序 = 算法 + 数据 : 数据也很重要啊,特别对于大尺度数据的distribution建模 : 完全就是统计的研究内容 : 不理解数据的统计分布,算法如何才能在PB级别数据上可计算并高效?
|
d******e 发帖数: 7844 | 7 你不是计算机科班的吧。
CS可比“算法+数据”大太多了。
【在 g******t 的大作中提到】 : 计算机程序 = 算法 + 数据 : 数据也很重要啊,特别对于大尺度数据的distribution建模 : 完全就是统计的研究内容 : 不理解数据的统计分布,算法如何才能在PB级别数据上可计算并高效?
|
d***a 发帖数: 13752 | 8 专长不同罢了。搞统计的人也要学编程。:)
【在 d******e 的大作中提到】 : 你不是计算机科班的吧。 : CS可比“算法+数据”大太多了。
|
d***a 发帖数: 13752 | 9 老兄,程序 = 算法 + 数据结构。数据结构和数据,差得可远了。:)
前面说了,专长不同而已。计算机科班出身,精通统计的人不是没有,但大多数人只要
知道最基本的统计知识就够了。搞统计的人多数也会编程,但能写操作系统内核代码的
,也是少数吧,呵呵。
【在 g******t 的大作中提到】 : 计算机程序 = 算法 + 数据 : 数据也很重要啊,特别对于大尺度数据的distribution建模 : 完全就是统计的研究内容 : 不理解数据的统计分布,算法如何才能在PB级别数据上可计算并高效?
|
d******e 发帖数: 7844 | 10 统计没几个人玩得明白coding,绝大部分用用Python和R。
但CS出身得数学基础足够学统计得了。
【在 d***a 的大作中提到】 : 专长不同罢了。搞统计的人也要学编程。:)
|
|
|
L*********4 发帖数: 883 | 11 因为统计方法的假设太不现实,方法太老土,有效维数太低,大部分都被我们摒弃了。
少部分我们都用
的比如PCA什么的,名字叫的不一样。
machine learning自己也有理论,假设比传统统计弱多了。
统计这个领域大部分人闭门造车,守着自己那点p-value。只有少部分人能跟上形势。
LASSO在当年也算是跟上形势的少数人提出的方法,到了deep learning的时代,统计的
人能跟上形势的更加少了。
【在 g******t 的大作中提到】 : 天天都在搞算法 搞计算问题 : 说起很多统计方法,他们都不熟悉,教学上似乎也很不重视统计方法分析数据
|
d******e 发帖数: 7844 | 12 很好奇,你在的领域管PCA叫啥?
【在 L*********4 的大作中提到】 : 因为统计方法的假设太不现实,方法太老土,有效维数太低,大部分都被我们摒弃了。 : 少部分我们都用 : 的比如PCA什么的,名字叫的不一样。 : machine learning自己也有理论,假设比传统统计弱多了。 : 统计这个领域大部分人闭门造车,守着自己那点p-value。只有少部分人能跟上形势。 : LASSO在当年也算是跟上形势的少数人提出的方法,到了deep learning的时代,统计的 : 人能跟上形势的更加少了。
|
L*********4 发帖数: 883 | 13 我们叫PCA或各种变体的非线性PCA啊。是他们统计的人非要管这个叫什么factor
analysis。
: 很好奇,你在的领域管PCA叫啥?
【在 d******e 的大作中提到】 : 很好奇,你在的领域管PCA叫啥?
|
g*****h 发帖数: 3335 | 14 TCS方向的表示我们用很多概率, 但是不怎么关心统计...
事实上我们这个小方向的很多论文发在PTRF, Ann Prob, Ann Appl Prob这些纯概率期
刊上
【在 d******e 的大作中提到】 : TCS里面会用到一些概率工具和统计模型,但他们和统计community关心的根本不是 : 一类问题。自然也不会熟悉那些统计方法。 : 做ML的人很多都有统计的training,尤其是做理论的,教学上和统计有很多共同点,但 : 和统计community关心的问题有时候差别也很大。
|
r***e 发帖数: 10135 | 15 感觉传统cs要解决的是计算问题
但是现在数据量很大以后 很多东西不是优化算法就可以解决的
首先要用统计的思想把问题简化为可计算的范畴
【在 g*****h 的大作中提到】 : TCS方向的表示我们用很多概率, 但是不怎么关心统计... : 事实上我们这个小方向的很多论文发在PTRF, Ann Prob, Ann Appl Prob这些纯概率期 : 刊上
|
s**********e 发帖数: 33562 | 16 PCA是CS的人提出来的?
【在 L*********4 的大作中提到】 : 我们叫PCA或各种变体的非线性PCA啊。是他们统计的人非要管这个叫什么factor : analysis。 : : : 很好奇,你在的领域管PCA叫啥? :
|