引用本文:殷保群,李衍杰,唐昊,代桂平,奚宏生.半Markov决策过程折扣模型与平均模型之间的关系[J].控制理论与应用,2006,23(1):65~68.[点击复制]
YIN Bao-qun,LI Yan-jie,TANG Hao,DAI Gui-ping,XI Hong-sheng.Relations between discounted models and average models for semi-Markov decision processes[J].Control Theory and Technology,2006,23(1):65~68.[点击复制]
半Markov决策过程折扣模型与平均模型之间的关系
Relations between discounted models and average models for semi-Markov decision processes
摘要点击 2068  全文点击 1906  投稿时间:2004-04-29  修订日期:2005-04-30
查看全文  查看/发表评论  下载PDF阅读器
DOI编号  10.7641/j.issn.1000-8152.2006.1.012
  2006,23(1):65-68
中文关键词  半Markov决策过程  折扣模型  平均模型  最优性方程  最优平稳策略
英文关键词  semi-Markov decision processes  discounted model  average model  optimality equation  optimal stationary policy
基金项目  国家自然科学基金资助项目(60274012,60574065); 安徽省自然科学基金资助项目(050420301)
作者单位
殷保群,李衍杰,唐昊,代桂平,奚宏生 中国科学技术大学自动化系,安徽合肥230026
合肥工业大学计算机系,安徽合肥230009 
中文摘要
      首先分别在折扣代价与平均代价性能准则下,讨论了一类半M arkov决策问题.基于性能势方法,导出了由最优平稳策略所满足的最优性方程.然后讨论了两种模型之间的关系,表明了平均模型的有关结论,可以通过对折扣模型相应结论取折扣因子趋于零时的极限来得到.
英文摘要