由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
CS版 - 有没有懂LDA(Blei)model得大侠给解释一下
相关主题
Two interview questions? (转载)A Question About Kernel Function
如何量化文档中topic的个数多少呢?Big O的表示问题
rw LDA 的学习曲线~~请教一个算法问题
Machine Learning里的一些算法是否有经典库啊?[转载] Re: BT实战
问个mult-core的clock synchronization问题CS 面试题求教
machine learning工业界用的多不多?++ a faster or a++ faster in C?
[合集] 请问sigir和kdd怎么比?问个问题
比bag-of-words或N-gram 更好的方法Re: Re: Re: 申请成立MacDev(可口苹果)版 (转载)
相关话题的讨论汇总
话题: theta话题: topic话题: word话题: choose话题: blei
进入CS版参与讨论
1 (共1页)
S*******t
发帖数: 97
1
最近在看Blei的Latent Dilechilet Allocation,看得一头
雾水。
1. Choose \theta = Dir(\alpha)
这个明白,\theta就是一个distribution,假设有K个topic,
\sum theta= 1;
2. for each of the N words w_n:
(a)choose a topic z_n = mult(\theta)
这个具体意思是什么? 每个word对应一个topic
的概率?multinomial的话应该需要count啊,
从哪里来呢?比如P(topic1)=\theta_1, topic1
还需要一个count.
(b) choose a word w_n from p(w_n|z_n,\beta)
这个就更不清楚了,不是已经有word了吗?怎么又
choose一个word.
实在是搞不清楚。
w********e
发帖数: 944
2
A topic is defined as a multinomial distribution over all words in the
vocabulary. In order to generate a word for the nth location in a document,
first select a topic (latent variable),then generate word according to the
multinomial distribution associated with the topic.
1 (共1页)
进入CS版参与讨论
相关主题
Re: Re: Re: 申请成立MacDev(可口苹果)版 (转载)问个mult-core的clock synchronization问题
问个Fortran的问题,急求解答machine learning工业界用的多不多?
Google 电面 algorithm 问题[合集] 请问sigir和kdd怎么比?
How to resolve "terminate called after throwing an instance of 'std::bad_alloc'???比bag-of-words或N-gram 更好的方法
Two interview questions? (转载)A Question About Kernel Function
如何量化文档中topic的个数多少呢?Big O的表示问题
rw LDA 的学习曲线~~请教一个算法问题
Machine Learning里的一些算法是否有经典库啊?[转载] Re: BT实战
相关话题的讨论汇总
话题: theta话题: topic话题: word话题: choose话题: blei