z*******3 发帖数: 13709 | 1 我看这个貌似用了不少统计学上的知识
给说说平常都做了什么主要工作? |
c****e 发帖数: 1453 | 2 简单的从recommendation engine到常用的classifier.非常粗暴简单化的说,历史数据
建模,做点预测。你用Java的下个Weka用用大概就有点感觉了。 |
r******r 发帖数: 700 | 3 你每天上网,很多网站都用到了啊
比如你看到 google 给你的一些广告,都认为是对你相关的;垃圾邮件过滤,spam
detection, 各种各样的分类系统,还包括大家最熟悉的 automatic spell correction
【在 z*******3 的大作中提到】 : 我看这个貌似用了不少统计学上的知识 : 给说说平常都做了什么主要工作?
|
r******r 发帖数: 700 | 4 弄懂这个公式,就可以做很多事
P(A/B) = P(B/A)P(A)/P(B) |
z*******3 发帖数: 13709 | 5 这不是最简单的概率?
stat101
【在 r******r 的大作中提到】 : 弄懂这个公式,就可以做很多事 : P(A/B) = P(B/A)P(A)/P(B)
|
r******r 发帖数: 700 | 6 简单的东西,可以做很多事的,而且比较 advanced 的
【在 z*******3 的大作中提到】 : 这不是最简单的概率? : stat101
|
z*******3 发帖数: 13709 | 7 P(AB) = P(A|B)P(B) = P(B|A)P(A)
这个应该不会有人不懂吧?理工科的多少都学过点概率和统计
【在 r******r 的大作中提到】 : 弄懂这个公式,就可以做很多事 : P(A/B) = P(B/A)P(A)/P(B)
|
r******r 发帖数: 700 | 8 Suppose someone told you they had a nice conversation with someone on the
train. Not knowing anything else about this conversation, the probability
that they were speaking to a woman is 50%. Now suppose they also told you
that this person had long hair. It is now more likely they were speaking to
a woman, since most long-haired people are women.
Bonus question: what's the probability of that person is a woman?
【在 z*******3 的大作中提到】 : 我看这个貌似用了不少统计学上的知识 : 给说说平常都做了什么主要工作?
|
z*******3 发帖数: 13709 | 9 所有学科都是最简单的应用最广
看来的确没有太过于深入
最ADVANCED到什么程度?
【在 r******r 的大作中提到】 : 简单的东西,可以做很多事的,而且比较 advanced 的
|
r******r 发帖数: 700 | 10 所以,大家都可以去做机器学了了
【在 z*******3 的大作中提到】 : P(AB) = P(A|B)P(B) = P(B|A)P(A) : 这个应该不会有人不懂吧?理工科的多少都学过点概率和统计
|
|
|
r******r 发帖数: 700 | 11 那从最基本的开始吧。比如,上面那段关于概率计算的问题,你写个程序给它的每个单
词做个词性标注!周末试试看,看你的程序运行的怎么样。
注意, 不是说你脑子里知道每个单词什么词性,然后让你程序给它 mark 上,而是要
让你的程序 figure out 每个词性是什么。
这两天,先想想算法!
【在 z*******3 的大作中提到】 : 所有学科都是最简单的应用最广 : 看来的确没有太过于深入 : 最ADVANCED到什么程度?
|
z*******3 发帖数: 13709 | 12 不告诉我女人里面长发的比例?
那要做抽样去预测population mean
然后计算confidence interval
不是很难的样子
to
【在 r******r 的大作中提到】 : Suppose someone told you they had a nice conversation with someone on the : train. Not knowing anything else about this conversation, the probability : that they were speaking to a woman is 50%. Now suppose they also told you : that this person had long hair. It is now more likely they were speaking to : a woman, since most long-haired people are women. : Bonus question: what's the probability of that person is a woman?
|
r******r 发帖数: 700 | 13 都告诉你了,还要你预测啥
tip: make sensible assumptions!
【在 z*******3 的大作中提到】 : 不告诉我女人里面长发的比例? : 那要做抽样去预测population mean : 然后计算confidence interval : 不是很难的样子 : : to
|
z*******3 发帖数: 13709 | 14 这么一大段你要parse词性?
我开始怀念法语了
【在 r******r 的大作中提到】 : 那从最基本的开始吧。比如,上面那段关于概率计算的问题,你写个程序给它的每个单 : 词做个词性标注!周末试试看,看你的程序运行的怎么样。 : 注意, 不是说你脑子里知道每个单词什么词性,然后让你程序给它 mark 上,而是要 : 让你的程序 figure out 每个词性是什么。 : 这两天,先想想算法!
|
z*******3 发帖数: 13709 | 15 数据源是什么?
别人搜索的关键字还是我自己跑大街上去找样本统计?
【在 r******r 的大作中提到】 : 都告诉你了,还要你预测啥 : tip: make sensible assumptions!
|
z*******3 发帖数: 13709 | 16 还是你要我现在这样把所有都给猜出来?
凭借一些常识来猜?
【在 r******r 的大作中提到】 : 都告诉你了,还要你预测啥 : tip: make sensible assumptions!
|
r******r 发帖数: 700 | 17 那就试一段短的好了。就这个你说的:
“这么一大段你要parse词性?”
【在 z*******3 的大作中提到】 : 这么一大段你要parse词性? : 我开始怀念法语了
|
r******r 发帖数: 700 | 18 你学的 stat101 都是用来应付期末考试的!
// run
【在 z*******3 的大作中提到】 : 还是你要我现在这样把所有都给猜出来? : 凭借一些常识来猜?
|
z*******3 发帖数: 13709 | 19 因为其中有不少异常要处理
也没有数据源,至少要给个字典的源才能做
要不然要自己从头开始建
还有对于语言本身的规则也不时很熟悉
汉语和英语的语法是不同的
汉语更难
【在 r******r 的大作中提到】 : 那就试一段短的好了。就这个你说的: : “这么一大段你要parse词性?”
|
z*******3 发帖数: 13709 | 20 你没有意识到我已经说了两个方法了么?
在想第三个时候你又不肯配合我继续下去
【在 r******r 的大作中提到】 : 你学的 stat101 都是用来应付期末考试的! : // run
|
t*******e 发帖数: 684 | 21 Mahout怎么样? hadoop里派生出来的项目。 |
n*****3 发帖数: 1584 | 22 far from complete,but promising way
【在 t*******e 的大作中提到】 : Mahout怎么样? hadoop里派生出来的项目。
|