ContextualBandits算法

前言

  Bandits -> Contextual Bandits -> RL, 3个方向不断进阶。contextual bandits 相比于bandits多了特征优势,相比于RL是一步reward反馈。正好有个大佬整理了这几种算法的对比,顺便学习下。

 

 

资料链接

github地址:https://github.com/sauxpa/neural_exploration

算法解读:https://zhuanlan.zhihu.com/p/262608477

 

相关文章

developer-roadmap —— 提供最全的开发者技术路线指南。前端...
一个极简的文件分享工具,无需注册且没有广告即可生成共享下...
收集 Github、Gitee优秀的开源项目,并进行归类整理。项目地...
大家好,我是 Java陈序员,我们有时会搭建一个属于自己的网站...
一个提供交互式的Web UI用于生成兼容MyBatisPlus框架的相关功...
大家好,我是 Java 陈序员。权限认证是我们日常开发绕不过的...