强化学习:原理与Python实战在线阅读
会员

强化学习:原理与Python实战

肖智清
开会员,本书免费读 >

计算机网络人工智能17.2万字

更新时间:2023-10-19 17:44:38 最新章节:封底

立即阅读
加书架
下载
听书

书籍简介

本书从原理和实战两个方面介绍了强化学习。原理方面,深入介绍了主流强化学习理论和算法,覆盖资格迹等经典算法和MuZero等深度强化学习算法;实战方面,每章都配套了编程案例,以方便读者学习。全书从逻辑上分为三部分。第1章:从零开始介绍强化学习的背景知识,介绍环境库Gym的使用。第2~15章:基于折扣奖励离散时间Markov决策过程模型,介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理论,进而在理论的基础上讲解算法,并为算法提供配套代码实现。基础理论的讲解突出主干部分,算法讲解全面覆盖主流的强化学习算法,包括经典的非深度强化学习算法和近年流行的强化学习算法。Python实现和算法讲解一一对应,还给出了深度强化学习算法的TensorFlow和PyTorch对照实现。第16章:介绍其他强化学习模型,包括平均奖励模型、连续时间模型、非齐次模型、半Markov模型、部分可观测模型等,以便更好了解强化学习研究的全貌。
品牌:机械工业出版社
上架时间:2023-08-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

肖智清
主页
  • 会员
    全书分为三个部分。第一部分了解强化学习应用,了解强化学习基本知识,搭建强化学习测试环境。该部分包括:强化学习的概况、强化学习简单示例、强化学习算法的常见思想、强化学习的应用、强化学习测试环境的搭建。第二部分介绍强化学习理论与深度强化学习算法。强化学习理论部分:Markov决策过程的数学描述、MonteCarlo方法和时序差分方法的数学理论;深度强化学习算法部分:详细剖析全部具有重要影响力的深度强
    肖智清程序设计12.2万字

同类热门书

最新上架

  • 会员
    《PyTorch深度学习与企业级项目实战》立足于具体的企业级项目开发实践,以通俗易懂的方式详细介绍PyTorch深度学习的基础理论以及相关的必要知识,同时以实际动手操作的方式来引导读者入门人工智能深度学习。《PyTorch深度学习与企业级项目实战》共分18章,内容主要包括人工智能、机器学习和深度学习之间的关系,深度学习框架PyTorch2.0的环境搭建,Python数据科学库,深度学习基本原理,
    宋立桓 宋立林计算机10.8万字
  • 会员
    本书由浅入深地介绍了生成式AI的理论与实践,内容涉及从基础原理到前沿应用,为读者提供了一个系统的认知框架。本书从生成式AI技术的基础工具入手,逐步深入到Transformer模型与GPT的原理和应用,详细介绍了图像生成模型StableDiffusion,以及LangChain与AIAgent的相关知识。书中结合开源代码分析,展示了生成式AI在各行各业的实际应用,并探讨了其在高速发展过程中所面临
    欧阳植昊 梁菁菁 吕云翔主编计算机11.7万字
  • 会员
    ChatGPT的诞生与迭代,昭示着AIGC领域向前迈出了重要一步,以更为拟人的人工智能提高了人机对话效率和自然程度,可能彻底改变人类与计算机的交互方式。因此,大众对于ChatGPT类产品的认识和学习将对自身成长与社会进步大有裨益。为帮助读者快速了解ChatGPT,本书避免使用过多的专业术语和复杂的数学推导过程,而是采用生动的示例和精致的图表,重点围绕ChatGPT的技术变迁、应用变革与挑战变局,图
    何静 向安玲编著计算机14.4万字
  • 本书是一本深度探讨大模型在低算力环境下实现迁移与微调的实践指南,并深入讲解了大模型的部署与优化策略。书中结合多个垂直领域的应用场景,从理论到技术实现,全程详尽讲解了如何应对大模型在行业落地中的技术挑战,帮助读者逐步掌握大模型的迁移与微调核心技术。无论你是大模型开发者、人工智能研究人员,还是对垂直领域AI应用感兴趣的行业专家,本书都将带你深入大模型的核心领域,提供从构建、优化到部署的全流程指导,助你
    程戈计算机13.7万字
  • 会员
    量子计算与人工智能的交叉融合,促使量子人工智能的不断发展。本书旨在采用对深度学习爱好者友好的方式,构建量子人工智能应用。全书共13章,第1章和第2章系统介绍量子计算机发展脉络和量子计算编程的基础知识。第3~7章分别介绍不同的深度学习方法和在这些算法逻辑上构建量子启发算法的方式,用量子线路中的相位作为神经网络的可学习参数,重构为量子神经网络算子。这些算子可以在PyTorch环境中直接调用。第8章和第
    金贤敏 胡俊杰编著计算机7.6万字
  • 会员
    本书深入剖析了图神经网络领域所面临的两大核心挑战:深度加深模型退化和监督信息过度依赖。针对这两大挑战,本书提出了一系列解决思路,涵盖模型结构设计、训练策略优化等方面的内容。全书共7章,第1章主要介绍了图神经网络研究的背景与意义,阐述了近年来国内外网络表示学习与图神经网络的研究现状,分析了图神经网络当前面临的挑战及其主要问题等;第2章主要对图神经网络进行概要论述,包括基础的理论、典型的模型方法及应用
    王杰计算机8.1万字
  • 会员
    本书基于国产自主可控龙芯处理器,系统地介绍计算机视觉领域的基本理论与实践,并结合当前主流的深度学习框架和龙芯平台以项目式教学的形式讲述任务的实施。本书主要包括OpenCV基础功能实战、深度学习框架的部署、计算机视觉技术基础知识、图像分类网络的部署、目标检测网络的部署、图像分割网络的部署、龙芯智能计算平台模型的训练和龙芯智能计算平台的推理部署等内容。通过阅读本书,读者能够了解和掌握深度学习在计算机视
    彭飞 张强编著计算机10万字
  • 会员
    本书深度探讨了构建和训练ChatGPT模型涉及的核心技术,以及ChatGPT在各种实际应用中的作用。全书精心划分为三部分,其中第1章为第1部分,第2章为第2部分,第3章和第4章为第3部分。首先,详细阐述了机器学习的历史演变与各种学习范式,同时也揭示了在人工智能生成内容(AIGC)领域下,图像处理和自然语言处理技术的历史发展趋势;接下来,对ChatGPT的运行机制和关键算法进行深度解析,包括大规模模
    邱才明 凌泽南 冯湛搏 杨昊编著计算机10.8万字
  • 会员
    青少年人工智能编程水平测试涵盖从数学逻辑到计算思维、从拖曳程序模块到程序编写、从数学建模到算法设计等多学科知识,能够对学生的多学科知识综合运用能力做出评价;能够通过设计的具体解决方案,对学生的计算思维、创造性思维等能力做出评价;在具体的解决方案中,能够通过设计算法模型和实现算法,对学生掌握和运用编程的能力做出评价。本书结合生活中的实例,系统地介绍了不同进制之间的转换、函数参数的作用域、枚举算法、二
    陈杰编著计算机2万字

同类书籍最近更新

  • 会员
    本书根据人工智能技术服务专业人才培养的需求,以智能机器人为载体,以揭开人工智能的神秘面纱为主线进行编写,设置了5个学习情境。学习情境1主要介绍人工智能的发展和应用,引起学习者的兴趣;学习情境2主要从智能机器如何进行知识存储的角度来理解人工智能;学习情境3主要从智能机器如何使用知识进行探索世界和求解问题的角度来进一步理解人工智能;学习情境4主要从智能机器如何进行自主学习知识、增长智慧的角度来理解人工
    关景新 姜源主编人工智能13.7万字
  • 会员
    本书主要讲解最新的EDA设计软件NIMultisim11在PLD可编程逻辑器件、PIC系列单片机、PLC可编程控制器设计中的应用,包括PLD可编程逻辑器件、PIC系列单片机、PLC可编程控制器分别介绍、如何使用仿真平台、具体仿真步骤及过程、汇编及C语言的要点、基本的编程方法、图形化设计的使用、VHDL代码的自动生成方法、梯形图的设计过程、各种接口电路的使用等内容,并给出了大量的仿真实例。
    聂典 李北雁等编著人工智能11.9万字
  • 会员
    本书是大数据处理的基础教材。从介绍基础的大数据采集开始,关注数据的采集、数据预处理、数据的可视化、数据的标注,以及大数据的相关应用等大数据的处理知识。其中,既包括文本或数值相关数据的处理,也包括对图片这样的非结构化数据的梳理。知识内容涵盖面较为广泛。本书以项目制的方式编写,浅显易懂,可以让没有相关经验的读者,比如高职高专的人工智能相关专业的学生,在短时间内了解人工智能数据处理相关知识,并在各自的领
    余平等编著人工智能5.8万字
  • 会员
    OpenCV是一个跨平台计算机视觉和机器学习软件库,也是计算机视觉领域的开发人员必须掌握的技术。本书基于Python3.8全面、系统地介绍OpenCV4.5的使用,并配套示例源代码、开发环境与答疑服务。本书共分15章,主要内容包括计算机视觉概述、OpenCV的Python开发环境搭建、OpenCV基本操作、数组矩阵、图像处理模块、灰度变换和直方图修正、图像平滑、几何变换、图像边缘检测、图像分割、图
    朱文伟 李建英人工智能16.8万字
  • 会员
    通用智力是人类区别万物并高于万物的独有神器和最后一道保护屏障,之前的AI工具诸如深蓝、阿尔法狗等虽然非常强大,但其功能单一,不能迁移通用。ChatGPT、AutoGPT和GPT-4、GPT-5等或许正在敲开“通用智能”的大门,潘多拉魔盒或将由此打开,所以ChatGPT、AutoGPT和GPT-4等的横空出世,具有划时代的重大意义。本书围绕、联动AI领域诸如大模型、预训练、微调、人类反馈强化学习、A
    王骥人工智能5.5万字
  • 会员
    这是一部为企业应用RPA智能机器人提供实施方法论和解决方案的著作。作者团队RPA技术、产品和实践方面有深厚的积累,不仅有作者研发出了行业领先的国产RPA产品,同时也有作者在万人规模的大企业中成功推广和应用国际最有名的RPA产品。本书首先讲清楚了RPA平台的技术架构和原理、RPA应用场景的发现和规划等必备的理论知识,然后重点讲解了人力资源、财务、税务、ERP等领域的RPA实施方法和解决方案,具有非常
    朱龙春人工智能5.2万字