强化学习:原理与Python实现在线阅读
会员

强化学习:原理与Python实现

肖智清
开会员,本书免费读 >

计算机网络编程语言与程序设计12.2万字

更新时间:2019-10-11 15:10:40 最新章节:12.3 本章小结

立即阅读
加书架
下载
听书

书籍简介

全书分为三个部分。第一部分了解强化学习应用,了解强化学习基本知识,搭建强化学习测试环境。该部分包括:强化学习的概况、强化学习简单示例、强化学习算法的常见思想、强化学习的应用、强化学习测试环境的搭建。第二部分介绍强化学习理论与深度强化学习算法。强化学习理论部分:Markov决策过程的数学描述、MonteCarlo方法和时序差分方法的数学理论;深度强化学习算法部分:详细剖析全部具有重要影响力的深度强化学习算法,结合TensorFlow实现源码。第三部分介绍强化学习综合应用案例。
品牌:机械工业出版社
上架时间:2019-08-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

肖智清
主页
  • 会员
    本书从原理和实战两个方面介绍了强化学习。原理方面,深入介绍了主流强化学习理论和算法,覆盖资格迹等经典算法和MuZero等深度强化学习算法;实战方面,每章都配套了编程案例,以方便读者学习。全书从逻辑上分为三部分。第1章:从零开始介绍强化学习的背景知识,介绍环境库Gym的使用。第2~15章:基于折扣奖励离散时间Markov决策过程模型,介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理
    肖智清人工智能17.2万字

同类热门书

最新上架

  • 会员
    《SpringBoot从入门到精通》从初学者角度出发,通过通俗易懂的语言、丰富多彩的实例,详细讲解了使用SpringBoot进行程序开发需要掌握的知识。全书分为18章,内容包括SpringBoot概述及其环境搭建,第一个SpringBoot程序,SpringBoot基础,配置SpringBoot项目,处理HTTP请求,过滤器、拦截器与监听器,Service层,日志的操作,JUnit单元
    明日科技编著计算机14.2万字
  • 会员
    《PHP从入门到精通(第7版)》从初学者角度出发,通过通俗易懂的语言、丰富多彩的实例,详细介绍了使用PHP进行网络开发需要掌握的各种技术。全书分为4篇共26章:基础知识篇包括初识PHP、PHP环境搭建和开发工具、PHP语言基础、流程控制语句、字符串操作、正则表达式、PHP数组、PHP与Web页面交互、PHP与JavaScript交互以及日期和时间;核心技术篇包括Cookie与Session、图形
    明日科技编著计算机16.4万字
  • 会员
    全书共6章,第1章:介绍本书所使用到的主要工具和一些需要心里有数的预备知识;第2章:解析最简单、常用的基础语法,帮助读者适应本书的节奏;第3章:为进阶知识,会从CPU、操作系统的角度,深入分析函数的工作原理和实现细节;第4章:解析经典的C++语法,背后的实现逻辑,并介绍面向对象的编程思想及优缺点;第5章:讨论跟操作系统强相关的软件技术,会将所有章节的内容贯穿起来,初步形成一个现代操作系统的运作模型
    阿布编程计算机9万字
  • 会员
    本书在不涉及大量数学与编程知识的前提下,从零开始,逐步带领读者熟悉并掌握当下最新的基于Python3的人工智能编程工具,包括但不限于数据分析(Pandas),以及支持单机(Scikitlearn)、深度(PyTorch、TensorFlow、PaddlePaddle)和分布式(PySparkML)机器学习的开源程序库,等等。全书共分为4部分,分别如下。入门篇:包括对全书核心概念的指南性介绍,
    范淼 徐晟桐计算机9.4万字
  • 会员
    本书是一本入门级的Web前端开发教材,以通俗易懂的语言、丰富实用的案例,帮助初学者快速掌握JavaScript技术和jQuery技术,并能够运用JavaScript技术和jQuery技术开发交互式Web前端项目。全书共12章。第1~5章讲解JavaScript的基础知识;第6~8章讲解DOM和BOM的相关知识;第9章和第10章讲解jQuery的相关知识和使用方法;第11章讲解JavaScript面
    黑马程序员编著计算机14.9万字
  • 会员
    本书详细阐述如何在设计、规划和实现软件时做出更好的决策,通过真实的案例,以抽丝剥茧的方式分析那些失误的决策,探讨还有哪些可能的解决方案,并对比各种方案的优缺点,摸索软件设计的常青模式。本书通过实例来说明某些决策的后果,例如代码重复如何影响系统的耦合与演进速度,以及如何在日期和时间信息方面隐藏细微差别。本书还介绍如何根据帕累托法则有效地缩小优化范围,确保分布式系统的一致性。通过阅读本书,读者很快就可
    (美)托马斯·莱莱克 (英)乔恩·斯基特计算机23.9万字
  • 会员
    本书综合性讲解HuggingFace社区提供的工具集datasets和transformers,书中包括最基础的工具集的用例演示,也包括具体的项目实战,以及预训练模型的底层设计思路和实现原理的介绍。通过本书的学习,读者可以快速掌握HuggingFace工具集的使用方法,掌握自然语言处理项目的一般研发流程,并能研发自己的自然语言处理项目。本书共14章,分为工具集基础用例演示篇(第1~6章),详细讲解
    李福林计算机7.7万字
  • 会员
    全书共14章。第1章主要讲解MySQL数据库以及客户端工具的安装;第2~4章主要介绍数据库与表的创建、数据类型与表达式,以及函数、运算符与变量;第5章主要讲解select查询语句、子查询以及连接查询;第6章主要讲解索引和索引类型;第7、8章主要介绍MySQL事务的ACID特性、事务的四种隔离级别、如何使用事务、存储过程和视图概述,以及如何使用存储过程和视图;第9章介绍MySQL用户权限管理以及数据
    黄文毅计算机8万字
  • 会员
    本书将JavaWeb开发的基础知识与实例有机地结合在一起,系统地介绍JavaWeb应用开发过程中的一些实用技术、系统设计与编程思想。本书主要内容包括JavaWeb开发基础、Servlet入门、Servlet应用、JSP应用开发、JDBC数据库应用开发、EL表达式与JSTL标签、基于WebMVC框架的项目实践。全书不仅介绍理论基础,更强调实际应用。本书可作为普通高等院校计算机相关专业的教材,
    曹慧 艾迪主编计算机9.5万字

同类书籍最近更新

  • 会员
    PHP是一种运行于服务器端并完全跨平台的嵌入式脚本编程语言,是目前开发各类Web应用的主流语言之一。本书就是面向具备PHP编程基础的学习者推出的一本进阶教材,以精心设计的应用案例、阶段案例和项目实战,全面讲解了PHP中级项目的开发技术。本书共10章,分类介绍了PHP各方面高级应用。本书附有配套视频、源代码、习题、教学课件等资源,而且为了帮助初学者更好地学习本书讲解的内容,还提供了在线答疑,希望得到
    传智播客高教产品研发部编著程序设计10.5万字
  • 会员
    Scrum是一个解决复杂问题的框架,也是各个遵循2001年敏捷宣言的流派中,目前流传和应用最广的一个,全球大约70%的企业转型认可并采用Scrum框架。《Scrum指南》作为Scrum的权威定义,对多个团队协作方式提到的不多。然而,以诺西的产品为例,人们打一通电话要经过一个通信网络中的数十个网元设备。而一个网元的研发工作,也需要数百人共同协作来完成。既然没有规模化转型的银弹,那就摸索着前进吧,无论
    (加)克雷格·拉尔曼 (荷)巴斯·沃代程序设计15.7万字
  • 会员
    本书系统地讲解了中文版3dsMax2018的各种工具和命令的使用,具体包括初识3dsMax2018、基本操作、基础建模、高级建模、灯光、摄影机、材质和贴图、灯光、材质和渲染,以及基础动画和高级动画等相关工作中所使用到的关键知识点。在具体介绍过程中均辅以实战案例,并穿插技巧提示和答疑解惑等,帮助读者更好地理解知识点,使这些案例成为读者以后实际学习和工作的提前“练兵”。本书汇集了笔者多年的设计经验和教
    唐茜 耿晓武程序设计9.6万字
  • 会员
    本书以零基础入门为宗旨,用范例引导读者学习,深入浅出地介绍了C语言的相关知识和实战技能。本书第Ⅰ篇【基础知识】主要讲解步入C语言的世界—HelloC、C程序的结构、C语言的基本构成元素、变量、数制、数据类型、运算符和表达式、算法、顺序结构与选择结构、循环结构与转向语句、数组以及字符数组和字符串等;第Ⅱ篇【核心技术—函数】主要讲解函数、变量的作用范围和存储类型、库函数、结构体和联合体、枚举等;第Ⅲ篇
    李岚编著程序设计18.3万字
  • 会员
    《JavaWeb开发实例大全(基础卷)》筛选、汇集了JavaWeb开发从基础知识到高级应用各个层面约600个实例及源代码,每个实例按实例说明、关键技术、设计过程、详尽注释、秘笈心法的顺序进行了分析解读。全书分为6篇23章,主要内容有开发环境搭建、Java语言基础、HTML/CSS技术、JSP基础与内置对象、JavaBean技术、Servlet技术、过滤器与监听器技术、JSTL标签库、JavaS
    软件开发技术联盟程序设计38.8万字
  • 会员
    ThebookwouldappealtowebdevelopersandPythonprogrammerswhowanttostartusingversion3.5andwritecodeefficiently.BasicknowledgeofPythonprogrammingisexpected.
    Micha? Jaworski Tarek Ziadé程序设计12.9万字