MDP如果不知道reward function怎么办？ - Mathematics版 - 未名存档

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

Mathematics版 - MDP如果不知道reward function怎么办？

相关主题
● a question about optimization	● probability problem
● 请教，Markov chain里，如果transition matrix	● An expectation problem
● 关于markov decision process求解的复杂度	● Questions on E(1/x) if x~N(mu, sigma)?
● 问个代数的初级问题	● [合集] An expectation problem
● 问数学大侠们一个有趣的数学问题	● 做题啦！
● 求教数学问题	● [help]a probability problem
● Differentiable one 2 one function from R to [0,1]	● 概率题一问
● How to define a coproduct of	● sampling problem

相关话题的讨论汇总
话题: mdp话题: reward话题: function

进入Mathematics版参与讨论

1

(共1页)

X*****r
发帖数: 2521

1

好像MDP都是要求知道每一步骤的reward function的
如果这个function写不出来怎么办，比如是一个expected objective，每次只能观察出
一个sample reward
这样还能用MDP吗？

1

(共1页)

进入Mathematics版参与讨论

相关主题
● sampling problem	● 问数学大侠们一个有趣的数学问题
● 请教一道题	● 求教数学问题
● Variance and covariance question	● Differentiable one 2 one function from R to [0,1]
● what's the difference between expected value and mean	● How to define a coproduct of
● a question about optimization	● probability problem
● 请教，Markov chain里，如果transition matrix	● An expectation problem
● 关于markov decision process求解的复杂度	● Questions on E(1/x) if x~N(mu, sigma)?
● 问个代数的初级问题	● [合集] An expectation problem

相关话题的讨论汇总
话题: mdp话题: reward话题: function

未名新帖统计// 7月16日

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

* 这里只显示发帖超过25的版面，努力灌水吧:-)