强化学习:原理与Python实战在线阅读
会员

强化学习:原理与Python实战

肖智清
开会员,本书免费读 >

计算机网络人工智能17.2万字

更新时间:2023-10-19 17:44:38 最新章节:封底

立即阅读
加书架
下载
听书

书籍简介

本书从原理和实战两个方面介绍了强化学习。原理方面,深入介绍了主流强化学习理论和算法,覆盖资格迹等经典算法和MuZero等深度强化学习算法;实战方面,每章都配套了编程案例,以方便读者学习。全书从逻辑上分为三部分。第1章:从零开始介绍强化学习的背景知识,介绍环境库Gym的使用。第2~15章:基于折扣奖励离散时间Markov决策过程模型,介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理论,进而在理论的基础上讲解算法,并为算法提供配套代码实现。基础理论的讲解突出主干部分,算法讲解全面覆盖主流的强化学习算法,包括经典的非深度强化学习算法和近年流行的强化学习算法。Python实现和算法讲解一一对应,还给出了深度强化学习算法的TensorFlow和PyTorch对照实现。第16章:介绍其他强化学习模型,包括平均奖励模型、连续时间模型、非齐次模型、半Markov模型、部分可观测模型等,以便更好了解强化学习研究的全貌。
品牌:机械工业出版社
上架时间:2023-08-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

肖智清
主页
  • 会员
    全书分为三个部分。第一部分了解强化学习应用,了解强化学习基本知识,搭建强化学习测试环境。该部分包括:强化学习的概况、强化学习简单示例、强化学习算法的常见思想、强化学习的应用、强化学习测试环境的搭建。第二部分介绍强化学习理论与深度强化学习算法。强化学习理论部分:Markov决策过程的数学描述、MonteCarlo方法和时序差分方法的数学理论;深度强化学习算法部分:详细剖析全部具有重要影响力的深度强
    肖智清程序设计12.2万字

最新上架

  • 会员
    优化提示词是用好GPT的关键。本书基于GPT,讨论提示词的使用技巧和优化方法。本书不仅讨论如何让GPT不再“胡说八道”,如何用GPT解决各种问题,如何让GPT了解用户的需求,如何让GPT记忆力超群,还讲述如何应用GPT,如何让GPT自动运行,如何打造商业级别的GPT,如何辨别GPT生成的内容。无论你是职场人士,还是在校大学生,通过阅读本书,都可以掌握用好GPT的关键,提升自己的工作或学习效率。
    梁成睿计算机8.5万字
  • 会员
    《秒懂AI写作:让你轻松成为写作高手》针对职场、学习、生活、艺术创作领域常见的40余种写作应用场景,遵循“场景+方法+总结”的框架,详细介绍了如何正确利用AI完成多种写作任务,并归纳出使用AI写作的方法和技巧。《秒懂AI写作:让你轻松成为写作高手》分为6章。第1章通过5个步骤、6大场景介绍了如何驾驭AI完成多种类型的写作任务;第2章至第6章分别详细介绍了在职场应用文写作、商业营销文案写作、新媒体写
    秋叶 刘进新 贾凝墨 万静计算机8.1万字
  • 会员
    《DeepSeeK实操指南:引爆AI时代个人效率核聚变》是一本专为职场人士量身打造的AI工具使用指南,旨在帮助读者通过DeepSeek这一强大的AI工具,全面提升工作效率,解锁职场新技能。本书不仅详细介绍了DeepSeek的基础知识和核心优势,还提供了40个实用的职场AI技能,涵盖从文案创作、数据处理到社交媒体运营等多个领域,助力读者在职场中脱颖而出。通过丰富的实操案例和技巧,本书深入讲解了如何运
    苏江 温洁计算机7.4万字
  • 会员
    本书聚焦如何高效运用DeepSeek这一前沿AI工具,帮助读者在技术浪潮中把握机遇。全书从DeepSeek发展历程切入,系统解析DeepSeek在信息处理、创意生成与决策辅助中的核心能力,并结合生活管理、职场协作、学习优化、社交互动等场景,通过真实案例讲解其应用方法。同时,针对内容创作、自媒体运营、副业变现等需求,书中提供了可落地的策略与案例,助力读者实现效率提升与价值创造。书中不仅提供技术使用技
    何华平编著计算机5.5万字
  • 如今,以DeepSeek为代表的AI工具迅速崛起,深刻地改变了人类获取与处理信息的方式。但在应用DeepSeek的过程中,很多人发现,向DeepSeek提出问题后,得到的回复往往不尽如人意,或是过于宽泛、缺乏针对性,或是未能切中要点、不能解决实际问题。导致这一问题的根本原因是,提问者缺乏有效的提问技巧,无法精准引导AI发挥强大的运算与分析能力。《DeepSeek高效提问指南》正是针对这一痛点,构建
    马超编著计算机11.4万字
  • 会员
    本书全面系统地介绍了字节跳动旗下AI智能助手——豆包的使用方法,涵盖注册登录流程及基本操作要点,并通过丰富多样的学习、工作、生活等场景的应用实例,如化身学习小能手、担当高效职场助手、呈现精彩模拟人物互动等,充分展现了豆包的强大效用。此外,还深入介绍了豆包智能体及其应用实例,以及豆包App的注册/登录方式和便捷功能。随书赠送学习资源,包含50个高效提问公式,40个深度提问模板、100个豆包智能体模板
    何华平编著计算机7.1万字
  • 会员
    本书是系统解读DeepSeek的实用指南,从AI基础知识开始,书中讲解了DeepSeek的底层创新,详细剖析其优缺点,探讨如何通过有效提问激发DeepSeek潜能,如何规避AI幻觉,如何实现本地部署;展示了DeepSeek在创意写作、图片视频创作、职场效率提升、学习辅导、知识库构建等领域的实战应用,并探讨了其在政企智能化转型中的价值。无论你是想提升工作效率的职场人、追求创作突破的内容生产者,还是渴
    程希冀计算机9.4万字
  • 会员
    本书通过从零开始构建生成式人工智能模型来探讨生成式人工智能的底层机制,并使用PyTorch对生成式人工智能模型进行编程的实践指导,以期让读者在了解生成对抗网络(GAN)、变分自编码器(VAE)、循环神经网络(RNN)、Transformer、扩散模型、大语言模型(LLM)和LangChain等技术原理之后,能构建可生成形状、数字、图像、文本和音乐的生成式人工智能模型。本书适合各种商业领域中的人工智
    (美)刘焕良计算机22万字
  • 会员
    本书是一本面向产品经理的实用新书,分12章探讨如何用ChatGPT提升产品管理工作的效率和质量。第1章介绍了人工智能对产品管理的影响;第2章介绍用ChatGPT提高文档写作效率;第3章介绍用ChatGPT进行竞品和市场分析;第4章介绍用ChatGPT优化需求管理;第5章介绍用ChatGPT分析产品数据;第6章介绍用ChatGPT改进用户体验;第7章介绍用ChatGPT设计产品原型;第8章介绍用Ch
    关东升计算机11.5万字