
会员
网络数据采集技术:Java网络爬虫实战
更新时间:2020-09-29 15:50:25 最新章节:9.4 本章小结
书籍简介
本书以Java为开发语言,系统地介绍了网络爬虫的理论知识和基础工具,包括网络爬虫涉及的Java基础知识、HTTP协议基础与网络抓包、网页内容获取、网页内容解析和网络爬虫数据存储等。本书选取典型网站,采用案例讲解的方式介绍网络爬虫中涉及的问题,以增强读者的动手实践能力。同时,本书还介绍了3种Java网络爬虫开源框架,即Crawler4j、WebCollector和WebMagic。本书适用于Java网络爬虫开发的初学者和进阶者;也可作为网络爬虫课程教学的参考书,供高等院校文本挖掘、自然语言处理、大数据商务分析等相关学科的本科生和研究生参考使用;也可供企业网络爬虫开发人员参考使用。
上架时间:2020-01-01 00:00:00
出版社:电子工业出版社
上海阅文信息技术有限公司已经获得合法授权,并进行制作发行
最新章节
钱洋等
最新上架
- 会员本书从初学者的角度出发,由浅入深地讲解了Java语言的相关内容。全书共11章,主要介绍了Java开发环境的搭建及其运行机制、基本语法、面向对象编程思想、多线程、常用API、集合、I/O、网络编程等内容,采用通俗易懂的语言阐述抽象的概念,选用生活中密切相关的例子演示知识的运用,通过剖析案例、分析代码含义、解决常见问题等方式进行讲解。书中还添加了许多阶段性任务来模拟程序开发过程,帮助初学者培养良好的编计算机10.6万字
- 会员Node.js是一个基于ChromeV8引擎的JavaScript运行环境,用来编写服务器端程序。Node.js是新兴的开发工具,也是目前发展较快的开发工具之一。近几年来,随着Node.js的发展,越来越多的开发人员选择用它构建Web应用。本书较为系统地介绍了目前Node.js应用开发中涉及的基础知识和核心技术,并通过案例介绍了基于Express和Koa框架的项目开发。本书着重实际应用,案例及实计算机10.9万字
- 会员本书分为三篇,共12章。第一篇:基础篇,包括第1-4章,介绍了uni-app的特点和优势、环境搭建、HBuilderX开发工具的安装和使用,以及uni-app的一些基础知识。第二篇:进阶篇,包括第5-9章,介绍了uni-app的基础配置、相关组件、导航栏、高效开发技巧,以及uniCloud云开发平台。第三篇:实战篇,包括第10-12章,通过第一个实战,介绍了如何使用uni-app开发小程序;通过第计算机10万字
- 会员虽然技术在进步,硬件也越来越物美价廉,但如今软件工程师仍需要关注程序的性能优化。本书将介绍软件效率问题、Go语言快速入门知识、如何实现高效编程,告诉大家如何高效进行性能优化,以及何时进行,并给出需要的工具和相关知识,让你使用较少的资源实现高效编程。计算机27.3万字
- 会员本书采用常用技术与真实案例相结合的讲解方式,深入浅出地介绍了Python机器学习应用的主要内容。全书共8章,内容包括Python概述、NumPy数值计算、pandas基础、pandas进阶、Matplotlib绘图、scikit-learn、餐饮企业综合分析与预测、通信运营商客户流失分析与预测。前6章设置了选择题、填空题和操作题,后两章设置了操作题,希望通过练习和操作实践,读者可以巩固所学的内容。计算机7.4万字
- 会员本书全面深入地介绍Elasticsearch的核心功能及其工作机制。本书由浅入深,从Elasticsearch的基本用法和架构原理,以及倒排索引、分片、节点角色和相关性等核心概念讲起;然后深入探讨数据处理和索引管理,涵盖映射模式、数据类型、文本分析、索引模板;接着详细介绍词项级搜索、全文搜索、复合查询和高级搜索等Elasticsearch的搜索功能,并深入讲解聚合;最后聚焦生产环境中的Elasti计算机27.5万字
- 会员本书系统地介绍了如何利用AI助手Copilot和ChatGPT来提升Python编程的效率和质量。本书从AI助手的基础概念讲起,逐步深入到代码组织、阅读、测试、提示工程等关键技能,并引导读者通过实践掌握如何拆解复杂问题、查找和修复bug、自动化任务处理及开发计算机游戏。本书不仅提供了丰富的实例和练习,还探讨了AI助手的潜力和局限,以及未来的发展趋势,是希望在编程领域融入AI技术的读者的理想选择。本计算机17.2万字
- 会员本书从零开始,介绍了Python编程语言的基础知识。全书共17章,第1-9章介绍了Python的语言基础;第10-13章介绍了与Python编程相关的拓展知识;第14-16章介绍了3个实战项目;第17章介绍了初学者如何利用当下最热门的AI工具ChatGPT学习Python编程。计算机8.8万字
同类书籍最近更新
- 会员本书为广受读者喜爱的畅销书升级版,旨在让读者快速、简单地上手大模型应用开发。本书为初学者提供了一份清晰、全面的“最小可用知识”,带领你快速了解GPT-4和ChatGPT的工作原理及优势,并在此基础上使用流行的Python编程语言构建大模型应用。升级版在旧版的基础上进行了全面更新,融入了大模型应用开发的最新进展,比如RAG、GPT-4新特性的应用解析等。本书提供了大量简单易学的示例,帮你理解相关概念程序设计13.1万字
- 会员虽然技术在进步,硬件也越来越物美价廉,但如今软件工程师仍需要关注程序的性能优化。本书将介绍软件效率问题、Go语言快速入门知识、如何实现高效编程,告诉大家如何高效进行性能优化,以及何时进行,并给出需要的工具和相关知识,让你使用较少的资源实现高效编程。程序设计27.3万字
- 会员Three.js在过去几年中已经成为创建令人惊叹的3DWebGL内容的标准方式。本书探讨Three.js的所有特性,并提供额外的内容,包括如何将Three.js与Blender、React、TypeScript以及最新的物理引擎进行集成。本书共分为四个部分:第一部分介绍搭建开发环境和运行Three.js;第二部分介绍Three.js的核心组件;第三部分介绍如何创建复杂的几何体、动画和纹理;第四部程序设计13.3万字