
会员
深度强化学习:算法原理与金融实践入门
计算机网络计算机理论、基础知识16.9万字
更新时间:2024-12-31 18:45:49 最新章节:第10章习题
书籍简介
深度强化学习是人工智能和机器学习的重要分支领域,有着广泛应用,如AlphaGo和ChatGPT。本书作为该领域的入门教材,在内容上尽可能覆盖深度强化学习的基础知识和经典算法。全书共10章,大致分为4部分:第1部分(第1~2章)介绍深度强化学习背景(智能决策、人工智能和机器学习);第2部分(第3~4章)介绍深度强化学习基础知识(深度学习和强化学习);第3部分(第5~9章)介绍深度强化学习经典算法(DQN、AC、DDPG等);第4部分(第10章)为总结和展望。每章都附有习题并介绍了相关阅读材料,以便有兴趣的读者进一步深入探索。本书可作为高等院校计算机、智能金融及相关专业的本科生或研究生教材,也可供对深度强化学习感兴趣的研究人员和工程技术人员阅读参考。
品牌:清华大学
上架时间:2023-09-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
谢文杰 周炜星编著
最新上架
- 会员本书以理论为基础,以应用为导向,用大量的实例对Access数据库的应用进行全面讲解。全书共8章,主要内容包括数据库的基础知识、Access的基本操作、表的构建、查询的创建、窗体的设计、报表的设计、宏的自动化操作,以及数据库文件的管理。知识点覆盖《全国计算机等级考试二级Access数据库程序设计》考试大纲规定的内容。在介绍Access操作方法的同时,安排大量的动手练案例,并且穿插知识延伸小体例,理论计算机8.5万字
- 会员深度强化学习是人工智能和机器学习的重要分支领域,有着广泛应用,如AlphaGo和ChatGPT。本书作为该领域的入门教材,在内容上尽可能覆盖深度强化学习的基础知识和经典算法。全书共10章,大致分为4部分:第1部分(第1~2章)介绍深度强化学习背景(智能决策、人工智能和机器学习);第2部分(第3~4章)介绍深度强化学习基础知识(深度学习和强化学习);第3部分(第5~9章)介绍深度强化学习经典算法(D计算机16.9万字
- 会员《深度序列模型与自然语言处理:基于TensorFlow2实践》以自然语言和语音信号处理两大应用领域为载体,详细介绍深度学习中的各种常用序列模型。在讲述理论知识的同时辅以代码实现和讲解,帮助读者深入掌握相关知识技能。《深度序列模型与自然语言处理:基于TensorFlow2实践》共12章,不仅涵盖了词向量、循环神经网络、卷积神经网络、Transformer等基础知识,还囊括了注意力机制、序列到序列问题计算机21.9万字
- 会员Bootstrap是一个基于HTML5和CSS3的前端开发框架,它现成可用的HTML标记、CSS样式、JavaScript插件,极大地提高了Web前端界面的开发效率。目前,它已成为了前端设计领域流行的辅助技术。本书共分8章,围绕Bootstrap4框架的使用,讲述了Bootstrap4框架中各类排版元素,表单、表格、列表、图片、导航等各类CSS组件和轮播、对话框、下拉菜单、滚动监听等JavaSc计算机6.4万字
- 会员在物联网及大数据被广泛应用的时代背景下,计算机网络在人们的日常生产生活中的应用比重越来越大,并潜移默化地改变着人们的生产生活方式。在计算机网络中,应用最广泛的是局域网。本书对局域网的组建、管理与维护进行全面剖析,向读者揭开局域网的神秘面纱,在熟悉局域网知识要点的同时,重点培养读者的动手能力和专业思维能力。全书共9章,内容包括局域网概述、局域网基础技术、局域网网络设备、无线局域网的组建、局域网规划与计算机10.8万字
- 会员《Web3.0》针对当下火热的Web3.0话题,介绍Web3.0的相关专业知识、技术实现方法及应用前景。全书共9章,第1章介绍了Web3.0的基本知识;第2、3章介绍了Web3.0的基础技术栈和拓展技术栈;第4章介绍了Web3.0的生态构建,包括去中心化自治组织、开放式金融、加密货币、代币经济与数字市场、数字身份、创造者经济、注意力经济等;第5章阐述了Web3.0的行业应用;第6章介计算机13万字
- 会员本书内容是在充分利用偏最小二乘原理优势的基础上,重点研究改进与优化偏最小二乘的不足方面,使其更好地适应中医药数据分析。主要内容包括分别引入非径向数据包络分析和降噪稀疏自编码器优化偏最小二乘的噪声处理,使其处理缺失值和噪声更有效;分别引入特征相关、L1正则项和灰色关联优化偏最小二乘的特征提取,实现有效降维和提取特征子集;分别融合受限玻尔兹曼机、稀疏自编码器、深度置信网络提取非线性成分,优化偏最小二乘计算机10.5万字
- 会员本书比较全面、系统地介绍了深度强化学习的理论和算法,并配有大量的案例和编程实现。全书核心内容可以分为3部分,第一部分为经典强化学习,包括第2、3、4章,主要内容有动态规划法,蒙特卡洛法、时序差分法;第二部分为深度强化学习,包括第6、7、8章,主要内容有值函数近似法、策略梯度法、策略梯度法进阶;第三部分重点介绍了深度强化学习的经典应用——AlphaGo系列算法。另外,作为理论和算法的辅助,第1章介绍计算机12.5万字
同类书籍最近更新
- 会员本书是计算机应用基础windows7+Office2010的配套实训教材。全书共6个单元,主要内容包括计算机的基础知识、windows7操作系统、Word2010综合应用、Excel2010综合运用、PowerPoint2010综合应用及计算机网络与Internet运用的内容。基础知识4.4万字
- 会员本书按实战项目研发的先后顺序,介绍了目标检测神经网络从研发到运营的全生命周期。首先介绍了目标检测场景下的图片标注方法和数据格式,以及与之密切相关的特征融合网络和预测网络;介绍了数据“后处理”所涉及的NMS算法及其变种,在此基础上,读者只需结合各式各样的骨干网络就可以搭建完整的一阶段目标检测神经网络模型。接下来介绍了神经网络的动态模式和静态模式两种训练方法,以及训练过程中的数据监控和异常处理。最后以基础知识19.6万字
- 会员全书分为3个部分:第一部分主要介绍了NL2SQL技术的相关背景知识,包括对NL2SQL任务的描述和价值探讨、国内外相关数据集的对比分析以及相关前置技术的介绍与实现;第二部分深入解构当前NL2SQL技术领域的若干主流技术路线,并着重分析了各个技术方案的优势与不足,为开发者提供模型选择的参考依据;第三部分包含NL2SQL实践指导相关篇章,结合相关代码,以单表无嵌套和多表有嵌套为例,从数据预处理、模型的基础知识7.3万字
- 会员本书聚焦于当今高性能多核处理器的并行编程系统的理论和实践方面,探讨实现并行编程模型所需的关键算法的有效实现。此类实现需要考虑底层计算机体系结构的特定体系结构方面以及执行环境提供的功能。本书简要回顾了现代计算机体系结构的关键概念,特别关注并行代码的性能以及并行编程模型中的相关概念。然后,本书转向用于实现并行编程模型的基本算法,并讨论它们如何与现代处理器交互。虽然本书将重点介绍一般机制,但我们将主要使基础知识15.9万字