由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Mathematics版 - MDP如果不知道reward function怎么办?
相关主题
a question about optimizationprobability problem
请教,Markov chain里,如果transition matrixAn expectation problem
关于markov decision process求解的复杂度Questions on E(1/x) if x~N(mu, sigma)?
问个代数的初级问题[合集] An expectation problem
问数学大侠们一个有趣的数学问题做题啦!
求教数学问题[help]a probability problem
Differentiable one 2 one function from R to [0,1]概率题一问
How to define a coproduct ofsampling problem
相关话题的讨论汇总
话题: mdp话题: reward话题: function
进入Mathematics版参与讨论
1 (共1页)
X*****r
发帖数: 2521
1
好像MDP都是要求知道每一步骤的reward function的
如果这个function写不出来怎么办,比如是一个expected objective,每次只能观察出
一个sample reward
这样还能用MDP吗?
1 (共1页)
进入Mathematics版参与讨论
相关主题
sampling problem问数学大侠们一个有趣的数学问题
请教一道题求教数学问题
Variance and covariance questionDifferentiable one 2 one function from R to [0,1]
what's the difference between expected value and meanHow to define a coproduct of
a question about optimizationprobability problem
请教,Markov chain里,如果transition matrixAn expectation problem
关于markov decision process求解的复杂度Questions on E(1/x) if x~N(mu, sigma)?
问个代数的初级问题[合集] An expectation problem
相关话题的讨论汇总
话题: mdp话题: reward话题: function