
会员
强化学习:原理与Python实战
更新时间:2023-10-19 17:44:38 最新章节:封底
书籍简介
本书从原理和实战两个方面介绍了强化学习。原理方面,深入介绍了主流强化学习理论和算法,覆盖资格迹等经典算法和MuZero等深度强化学习算法;实战方面,每章都配套了编程案例,以方便读者学习。全书从逻辑上分为三部分。第1章:从零开始介绍强化学习的背景知识,介绍环境库Gym的使用。第2~15章:基于折扣奖励离散时间Markov决策过程模型,介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理论,进而在理论的基础上讲解算法,并为算法提供配套代码实现。基础理论的讲解突出主干部分,算法讲解全面覆盖主流的强化学习算法,包括经典的非深度强化学习算法和近年流行的强化学习算法。Python实现和算法讲解一一对应,还给出了深度强化学习算法的TensorFlow和PyTorch对照实现。第16章:介绍其他强化学习模型,包括平均奖励模型、连续时间模型、非齐次模型、半Markov模型、部分可观测模型等,以便更好了解强化学习研究的全貌。
品牌:机械工业出版社
上架时间:2023-08-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
肖智清
- 会员全书分为三个部分。第一部分了解强化学习应用,了解强化学习基本知识,搭建强化学习测试环境。该部分包括:强化学习的概况、强化学习简单示例、强化学习算法的常见思想、强化学习的应用、强化学习测试环境的搭建。第二部分介绍强化学习理论与深度强化学习算法。强化学习理论部分:Markov决策过程的数学描述、MonteCarlo方法和时序差分方法的数学理论;深度强化学习算法部分:详细剖析全部具有重要影响力的深度强程序设计12.2万字
同类热门书
最新上架
- 会员《PyTorch深度学习与企业级项目实战》立足于具体的企业级项目开发实践,以通俗易懂的方式详细介绍PyTorch深度学习的基础理论以及相关的必要知识,同时以实际动手操作的方式来引导读者入门人工智能深度学习。《PyTorch深度学习与企业级项目实战》共分18章,内容主要包括人工智能、机器学习和深度学习之间的关系,深度学习框架PyTorch2.0的环境搭建,Python数据科学库,深度学习基本原理,计算机10.8万字
- 会员本书深入剖析了图神经网络领域所面临的两大核心挑战:深度加深模型退化和监督信息过度依赖。针对这两大挑战,本书提出了一系列解决思路,涵盖模型结构设计、训练策略优化等方面的内容。全书共7章,第1章主要介绍了图神经网络研究的背景与意义,阐述了近年来国内外网络表示学习与图神经网络的研究现状,分析了图神经网络当前面临的挑战及其主要问题等;第2章主要对图神经网络进行概要论述,包括基础的理论、典型的模型方法及应用计算机8.1万字
- 会员本书基于国产自主可控龙芯处理器,系统地介绍计算机视觉领域的基本理论与实践,并结合当前主流的深度学习框架和龙芯平台以项目式教学的形式讲述任务的实施。本书主要包括OpenCV基础功能实战、深度学习框架的部署、计算机视觉技术基础知识、图像分类网络的部署、目标检测网络的部署、图像分割网络的部署、龙芯智能计算平台模型的训练和龙芯智能计算平台的推理部署等内容。通过阅读本书,读者能够了解和掌握深度学习在计算机视计算机10万字
- 会员青少年人工智能编程水平测试涵盖从数学逻辑到计算思维、从拖曳程序模块到程序编写、从数学建模到算法设计等多学科知识,能够对学生的多学科知识综合运用能力做出评价;能够通过设计的具体解决方案,对学生的计算思维、创造性思维等能力做出评价;在具体的解决方案中,能够通过设计算法模型和实现算法,对学生掌握和运用编程的能力做出评价。本书结合生活中的实例,系统地介绍了不同进制之间的转换、函数参数的作用域、枚举算法、二计算机2万字
同类书籍最近更新
- 会员本书主要讲解最新的EDA设计软件NIMultisim11在PLD可编程逻辑器件、PIC系列单片机、PLC可编程控制器设计中的应用,包括PLD可编程逻辑器件、PIC系列单片机、PLC可编程控制器分别介绍、如何使用仿真平台、具体仿真步骤及过程、汇编及C语言的要点、基本的编程方法、图形化设计的使用、VHDL代码的自动生成方法、梯形图的设计过程、各种接口电路的使用等内容,并给出了大量的仿真实例。人工智能11.9万字
- 会员OpenCV是一个跨平台计算机视觉和机器学习软件库,也是计算机视觉领域的开发人员必须掌握的技术。本书基于Python3.8全面、系统地介绍OpenCV4.5的使用,并配套示例源代码、开发环境与答疑服务。本书共分15章,主要内容包括计算机视觉概述、OpenCV的Python开发环境搭建、OpenCV基本操作、数组矩阵、图像处理模块、灰度变换和直方图修正、图像平滑、几何变换、图像边缘检测、图像分割、图人工智能16.8万字
- 会员通用智力是人类区别万物并高于万物的独有神器和最后一道保护屏障,之前的AI工具诸如深蓝、阿尔法狗等虽然非常强大,但其功能单一,不能迁移通用。ChatGPT、AutoGPT和GPT-4、GPT-5等或许正在敲开“通用智能”的大门,潘多拉魔盒或将由此打开,所以ChatGPT、AutoGPT和GPT-4等的横空出世,具有划时代的重大意义。本书围绕、联动AI领域诸如大模型、预训练、微调、人类反馈强化学习、A人工智能5.5万字
- 会员这是一部为企业应用RPA智能机器人提供实施方法论和解决方案的著作。作者团队RPA技术、产品和实践方面有深厚的积累,不仅有作者研发出了行业领先的国产RPA产品,同时也有作者在万人规模的大企业中成功推广和应用国际最有名的RPA产品。本书首先讲清楚了RPA平台的技术架构和原理、RPA应用场景的发现和规划等必备的理论知识,然后重点讲解了人力资源、财务、税务、ERP等领域的RPA实施方法和解决方案,具有非常人工智能5.2万字