大数据搜索引擎原理分析在线阅读
会员

大数据搜索引擎原理分析

刘凡平编著
开会员,本书免费读 >

计算机网络数据库16.1万字

更新时间:2019-07-25 11:56:30 最新章节:致谢

立即阅读
加书架
下载
听书

书籍简介

本书是畅销书升级版,向读者提供了一套完整的大数据时代背景下的搜索引擎解决方案,详尽地介绍了搜索引擎的技术架构、算法体系及取得的成果,并以模块化的方式进行组织。本书着重介绍了机器学习在搜索引擎中的应用,包括中文分词、聚类、分类等核心的机器学习算法,并结合示例加以介绍和分析,使读者可以更好地理解机器学习在搜索引擎中的价值;同时,阐述了大数据给搜索引擎带来的新特性,结合目前大数据分析的主流工具,在搜索引擎中构建知识图谱,以及进行日志反馈学习,可以使得搜索引擎更加智能。本书不仅适合作为互联网行业从业者的技术参考书,也适合作为搜索引擎爱好者的参考读物。
上架时间:2018-11-01 00:00:00
出版社:电子工业出版社
上海阅文信息技术有限公司已经获得合法授权,并进行制作发行

最新章节

刘凡平编著
主页

同类热门书

最新上架

  • 会员
    本书以Python数据分析与挖掘的常用技术与真实案例相结合的方式,深入浅出地介绍Python数据分析与挖掘的重要内容。本书共11章,分为基础篇(第1~5章)和实战篇(第6~11章),基础篇包括数据挖掘基础、Python数据挖掘编程基础、数据探索、数据预处理、数据挖掘算法基础等基础知识;实战篇包括6个案例,分别为信用卡高风险客户识别、餐饮企业菜品关联分析、金融服务机构资金流量预测、O2O优惠券使用预
    翟世臣 张良均主编计算机13.6万字
  • 会员
    本书是一本介绍分布式数据库基础内容与应用的大数据专业类图书,力求培养读者对分布式数据库的应用技能。本书共11章,采用原理+代码实例+综合案例的编写形式,清晰明了地介绍分布式数据库的原理、基础应用、进阶应用及主流工具的使用方法、应用场景,以理实结合为编写要求,让读者能够轻松学习和掌握分布式数据库的内容。本书可以作为高等院校计算机、网络技术等相关专业的教材,也可以作为数据库相关工作的从业人员的参考用书
    闭应洲 许桂秋 刘军主编计算机14万字
  • 会员
    本书以Python作为开发语言,系统介绍PySpark开发环境搭建流程及基于PySpark进行大数据分析的相关知识。本书条理清晰、重点突出,理论叙述循序渐进、由浅入深。本书共7章,第1?5章包括PySpark大数据分析概述、PySpark安装配置、基于PySpark的DataFrame操作、基于PySpark的流式数据处理、基于PySpark的机器学习库,内容介绍注重理论与实践相结合,通过典型示例
    戴刚 张良均主编计算机10.4万字
  • 会员
    《数据分析实践:专业知识和职场技巧》从初学者的角度出发,讲解了进阶为高级数据分析师所需的知识和技能,其中既包括数据分析岗位的介绍、发展现状及未来趋势,也包括实际工作中各环节的方法策略、实战案例,还包括职场中的困惑解答及面试指导。阅读本书,并基于本书进一步拓展所需要的知识能,可以帮助读者形成一套成系统、可实战的数据分析方法论。
    姜文哲计算机19.6万字
  • 会员
    数据科学的关键技术包括数据存储计算、数据治理、结构化数据分析、语音分析、视觉分析、文本分析和知识图谱等方面。本书的重点是详细介绍文本分析和知识图谱方面的技术。文本分析技术主要包括文本预训练模型、多语种文本分析、文本情感分析、文本机器翻译、文本智能纠错、NL2SQL问答以及ChatGPT大语言模型等。知识图谱技术主要包括知识图谱构建和知识图谱问答等。本书将理论介绍和实践相结合,详细阐述各个技术主题的
    苏海波 刘译璟 易显维 苏萌计算机21.6万字
  • 会员
    本书共3篇:第1篇主要介绍分布式数据库基础理论,包括经典的CAP理论、一致性算法相关的理论、并发控制相关的理论等;第2篇具体介绍Greenplum数据库,从分布式事务、分布式计算和分布式存储3个方面,深入代码层级,讲述分布式理论在工业上的实现;第3篇是总结和展望,介绍云原生数据库和新技术带给Greenplum和数据库管理系统的机遇和挑战。本书打破以理论介绍和架构介绍为主的思路,深入分析工业化的实现
    王凤刚计算机7.1万字
  • 会员
    时序数据库是一种新型技术,主要用于工业互联网软件建设中。近年来,伴随着物联网技术在智能制造、交通、能源、智慧城市等领域的发展,时序数据库也发展迅速,成为搭建应用的必备数据库之一。《深入理解InfluxDB》从InfluxDB的安装开始,一步步详细介绍InfluxDB的功能及原理,带领读者深入理解以InfluxDB为代表的时序数据库。
    郑强 张伟 刘爽计算机7.6万字
  • 会员
    本书是《数据库原理——GaussDB技术及应用》一书配套的辅助教材。全书共分3部分:第一部分为实验指导,共有13个综合实验,每一个实验都是根据教学目标而设计,详细讲述了每一个实验的实验目的、实验任务及实验步骤,从而培养学生掌握关系数据库管理软件技术与应用的技能;第二部分为习题集,是根据主教材各章节内容编写的习题及习题答案,内容广泛,有填空、选择、简答、设计及实验题等多种形式,利求通过对这些习题的训
    李雁翎编著计算机6.9万字
  • 会员
    达梦数据库是一款非常优秀的国产数据库。本书从实用角度,通过对达梦数据库的体系结构、运行机制的讲解,以及与其他数据库相似功能的对比,帮助读者掌握达梦数据库的基本操作。本书第1章讲解达梦数据库的安装部署;第2章讲述达梦数据库的体系结构,并与Oracle的体系结构进行对比;第3章讲解数据库中最重要的两部分redo和undo;第4章介绍用户管理,重点讲述用户创建和权限;第5章讲解表和索引,并对普通表和堆表
    付强编著计算机10.7万字

同类书籍最近更新

  • 会员
    本书以数据流上的频繁模式和高效用模式挖掘计算为背景,介绍该领域相关的概念、理论及近年来相关的最新研究成果,内容包括传统数据集中的频繁模式挖掘及其大数据集下的频繁模式挖掘算法、不确定数据流中的频繁模式挖掘算法、具有效用值的数据流中的高效用模式挖掘算法。
    王乐数据库5.7万字
  • 会员
    本书分为25章,包括SQLServer2008的最基本、最常用、最重要的知识,同时通过贯穿全文的实例使读者更易、更快地掌握各章的知识点,最后通过实际应用中的完整实例让读者顺利地将所学理论知识运用到实际工作中去。全书内容由浅入深,并辅以大量的实例说明,使读者能更快、更好地掌握SQLServer2008。本书可供初学者作为入门书籍,也可为有一定的SQLServer编程基础的程序员作为参考用书
    希赛IT发展研究中心组编数据库28.4万字
  • 会员
    DataAnalysiswithPythonoffersamodernapproachtodataanalysissothatyoucanworkwiththelatestandmostpowerfulPythontools,AItechniques,andopensourcelibraries.IndustryexpertDavid
    David Taieb数据库8.9万字
  • 会员
    本书以在数字化背景下,数据产品从业者的数据技术、数据技能、数据思维、数据方法、数据模型、产品用户/客户增长实战经验为基调,体系化撰写了数字化和数据产品的数据经验知识和案例。随书附赠丰富的原始数据和源代码,方便读者对数据分析案例进行实操练习。本书内容全面,结构完整。首先,讲解了数据指标体系搭建和数据埋点案例;然后按照细节讲解数据分析流程、数据采集方法、数据挖掘整体方法;紧接着通过实操案例讲解了的数据
    连诗路编著数据库25.9万字
  • 会员
    本书从理论与实际应用相结合的角度出发,介绍数据库系统的原理知识与技术应用方法,包括数据库系统概述、关系数据模型、SQL数据库操作语言、数据库设计、数据库管理、数据库应用编程,以及分布式NoSQL数据库技术等内容。
    陆鑫 张凤荔 陈安龙数据库21.1万字
  • 会员
    本书由多位数据库技术专家和爱好者合著而成,集合了各行业dba的工作经验与思考,包含了精心挑选的数据库诊断案例与数据库恢复实践。内容涉及oracle典型错误的分析和诊断,oracle600内部错误的外理和解决,优化器与sql的行为与分析,以及很多内部深入技术的实践。本书的主要内容以原理分析、内容实践、故障解决为依据,将oracle数据库的深层技术层剖缕析抽丝剥茧地展示给读者。希望能够帮助读者加深
    盖国强 杨廷琨主编数据库15.3万字