教育论文网

深度强化学习推荐算法研究与实现

论文目录
摘要第1-6页
ABSTRACT第6-10页
第一章 绪论第10-16页
 1.1 研究背景和研究意义第10-12页
 1.2 国内外研究现状和发展趋势第12-15页
 1.3 研究内容与章节安排第15-16页
第二章 基础算法概述第16-32页
 2.1 协同过滤推荐算法第16-22页
  2.1.1 基于用户的协同过滤推荐算法第17页
  2.1.2 基于项目的协同过滤推荐算法第17-18页
  2.1.3 常见相似度与预测数据计算第18-19页
  2.1.4 系统评价标准第19-22页
 2.2 深度强化学习算法第22-31页
  2.2.1 深度学习之卷积神经网络第22-25页
  2.2.2 强化学习算法第25-29页
   2.2.2.1 Q-learning算法第26-28页
   2.2.2.2 策略梯度(Policy Gradient)第28-29页
  2.2.3 深度Q学习算法第29-31页
 2.3 本章小结第31-32页
第三章 基于深度特征提取的强化学习推荐算法第32-52页
 3.1 现状分析第32-33页
 3.2 算法模型构建第33-44页
  3.2.1 模型数据特征提取第35-40页
   3.2.1.1 用户特征提取第35-37页
   3.2.1.2 用户兴趣的动态捕捉第37-38页
   3.2.1.3 电影特征提取第38-40页
  3.2.2 Q网络设计第40页
  3.2.3 动作与奖励值设计第40-41页
  3.2.4 历史记录回放机制第41-42页
  3.2.5 基于深度特征提取的深度强化学习推荐系统流程第42-44页
 3.3 实验数据与结果第44-50页
  3.3.1 实验数据介绍第44-47页
  3.3.2 实验设计与结果对比第47-50页
   3.3.2.1 奖励值设定合理性验证第47-48页
   3.3.2.2 系统推荐精度第48-50页
   3.3.2.3 历史回放机制策略的有效性第50页
 3.4 本章小结第50-52页
第四章 基于策略梯度算法改进的强化学习推荐模型(DPGQN)第52-58页
 4.1 现状分析与解决思路第52-53页
 4.2 基于策略梯度算法改进的强化学习推荐模型第53-55页
  4.2.1 模型实现框架第53-54页
  4.2.2 策略梯度网络连续动作决策第54-55页
 4.3 实验设计与结果第55-56页
 4.4 本章小结第56-58页
第五章 总结与展望第58-60页
 5.1 研究工作总结第58页
 5.2 研究展望第58-60页
参考文献第60-64页
致谢第64-66页
攻读学位期间取得的研究成果第66页

本篇论文共66页,点击 这进入下载页面

 
 
Copyright(C) All Rights Reserved
客服QQ:304386486
目录由用户 szr1234567** 提供,作者删除入口请点击这里