
会员
强化学习:原理与Python实战
更新时间:2023-10-19 17:44:38 最新章节:封底
书籍简介
本书从原理和实战两个方面介绍了强化学习。原理方面,深入介绍了主流强化学习理论和算法,覆盖资格迹等经典算法和MuZero等深度强化学习算法;实战方面,每章都配套了编程案例,以方便读者学习。全书从逻辑上分为三部分。第1章:从零开始介绍强化学习的背景知识,介绍环境库Gym的使用。第2~15章:基于折扣奖励离散时间Markov决策过程模型,介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理论,进而在理论的基础上讲解算法,并为算法提供配套代码实现。基础理论的讲解突出主干部分,算法讲解全面覆盖主流的强化学习算法,包括经典的非深度强化学习算法和近年流行的强化学习算法。Python实现和算法讲解一一对应,还给出了深度强化学习算法的TensorFlow和PyTorch对照实现。第16章:介绍其他强化学习模型,包括平均奖励模型、连续时间模型、非齐次模型、半Markov模型、部分可观测模型等,以便更好了解强化学习研究的全貌。
品牌:机械工业出版社
上架时间:2023-08-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
肖智清
- 会员全书分为三个部分。第一部分了解强化学习应用,了解强化学习基本知识,搭建强化学习测试环境。该部分包括:强化学习的概况、强化学习简单示例、强化学习算法的常见思想、强化学习的应用、强化学习测试环境的搭建。第二部分介绍强化学习理论与深度强化学习算法。强化学习理论部分:Markov决策过程的数学描述、MonteCarlo方法和时序差分方法的数学理论;深度强化学习算法部分:详细剖析全部具有重要影响力的深度强程序设计12.2万字
最新上架
- 会员本书由科大讯飞与中国科大的大模型的资深专家联合撰写,一本书打通大模型的技术原理与应用实践壁垒,深入大模型3步工作流程,详解模型微调、对齐优化、提示工程等核心技术及不同场景的微调方案,全流程讲解6个典型场景的应用开发实践。本书共10章,从逻辑上分为“基础知识”“原理与技术”“应用开发实践”三部分。基础知识(第1章)介绍大模型定义、应用现状、存在的问题,以及发展趋势。原理与技术(第2和3章)详细讲解大计算机12.3万字
- 会员本书旨在帮助读者全面理解知识图谱的基本原理和概念。通过清晰的解释和实例,读者将深入了解知识图谱的构建、表示、推理等关键知识点。此外,本书通过提供代码实战,引导读者亲自动手构建知识图谱,并应用各种技术和工具进行实践。这种实践性的讲解方法可帮助读者更深入地理解知识图谱的实际应用。本书的目标是帮助读者全面理解知识图谱的基本原理和概念,并通过代码实战构建知识图谱。同时,本书也提供了关于大语言模型与知识图谱计算机9.6万字
- 会员本书基于国产自主可控龙芯处理器,系统地介绍计算机视觉领域的基本理论与实践,并结合当前主流的深度学习框架和龙芯平台以项目式教学的形式讲述任务的实施。本书主要包括OpenCV基础功能实战、深度学习框架的部署、计算机视觉技术基础知识、图像分类网络的部署、目标检测网络的部署、图像分割网络的部署、龙芯智能计算平台模型的训练和龙芯智能计算平台的推理部署等内容。通过阅读本书,读者能够了解和掌握深度学习在计算机视计算机10万字
- 会员ChatGPT作为人工智能领域的一大进步,引起了热议,其强大功能的背后离不开大模型的支持。大模型指的是参数规模超过千万的机器学习模型,主要应用于语音识别、计算机视觉等领域。本书聚焦大模型,对大模型的技术场景和商业应用展开详细叙述。本书主要从典型应用ChatGPT入手,探寻其背后支撑大模型的魅力。首先,本书对大模型的基础概念、产业格局、带来的新型商业模式进行讲解,展现了大模型的发展现状和商业化潜力。计算机13.2万字
- 会员《机器学习实战:视频教学版》基于Python语言详细讲解机器学习算法及其应用,用于读者快速入门机器学习。《机器学习实战:视频教学版》共分12章,内容包括机器学习概述、Python数据处理基础、Python常用机器学习库、线性回归及应用、分类算法及应用、数据降维及应用、聚类算法及应用、关联规则挖掘算法及应用、协同过滤算法及应用,最后通过3个综合实战项目(包括新闻内容分类实战、泰坦尼克号获救预测实战、计算机10.1万字