研究领域
- 暂无内容
论文成果
查看更多>-
程玉虎.基于参数探索的期望最大化策略搜索,2012,38;1;
-
程玉虎.Selective bayesian classifier based on semi-supervised clustering,2012,21;1;
-
程玉虎.基于Help-Training的半监督支持向量回归,2012,27;2;
-
程玉虎.Efficient data use in incremental Actor-Critic algorithms,2012,93;1;
-
程玉虎,冯涣婷,王雪松.Actor-critic algorithm based on incremental least-squares temporal difference with eligibility trace,2011,6839;;183-188
-
程玉虎.基于状态-动作图测地高斯基的策略迭代强化学习,2011,37;1;44-51
-
程玉虎.类相关性影响可变选择性贝叶斯分类器,2011,37;7;1628-1633
-
程玉虎.基于概率型支持向量机的Q学习,2010
专利
- 暂无内容
著作成果
- 暂无内容
科研项目
查看更多>-
2008-262-3431,基于强化学习的移动机器人行为协调研究,教育部,2008-12-28
-
2022-12947,基于属性学习的零样本图像分类研究-Y,国家自然科学基金委,2022-01-01
-
2021-11962,安全深度强化学习方法研究,国家自然科学基金委员会,2021-08-18
-
2005-209-2725,连续空间下再励学习方法的研究,中国矿业大学,2005-12-20
-
2017-08875,基于属性学习的零样本图像分类研究,国家自然科学基金委,2017-08-18
-
2017-08377,Markov决策过程值函数逼近的基函数自动构造-Y,国家自然科学基金,2017-05-26
-
2013-158-5590,基于知识迁移的机器学习方法研究,中国矿业大学,2013-03-28
-
2012-612-5411,基于知识迁移的机器学习方法研究,教育部,2012-12-18