ISBN/价格: | 978-7-111-71694-5:CNY79.00 |
---|---|
作品语种: | chi |
出版国别: | CN 110000 |
题名责任者项: | 网络爬虫原理与实践/.李健, 种惠芳著 |
出版发行项: | 北京:,机械工业出版社:,2023.01 |
载体形态项: | 265页:;+图:;+26cm |
丛编项: | 数据科学与工程技术丛书 |
一般附注: | 战略支援部队信息工程大学出版基金 |
提要文摘: | 本书以C#为平台, 介绍网络爬虫开发的基本知识、原理和方法。全书共分11章: 第1章介绍网络爬虫的基础知识, 包括网络、网页和爬虫概述 ; 第2章简要介绍C#编程, 并侧重与网络爬虫相关的内容 ; 第3章介绍网络资源下载的方法, 并实现通用资源下载器 ; 第4章介绍网页数据抽取的方法, 重点实现HTM解析器: 第5章介绍xI和JSON数据抽取的方法, 从而获得更丰富的目标数据 ; 第6章介绍爬虫数据的存储, 可将采集结果保存到文件或数据库 ; 第7章介绍网络爬虫的搜索方式, 包括深度优先搜索和广度优先搜索, 并实现爬虫控制器 ; 第8章介绍多线程爬虫, 并实现自定义线程池以提高爬虫效率 ; 第9章介绍如何使用代理服务器, 并实现自定义代理池 ; 第10章介绍常见的浏览器内核, 以及如何使用GeckoFx模拟浏览器获取深层数据 ; 第11章介绍抽取模板的表示、管理以及可视化配置方法。 |
并列题名: | Principle and practice of eng |
题名主题: | 软件工具 程序设计 |
中图分类: | TP311.561 |
个人名称等同: | 李健 著 |
个人名称等同: | 种惠芳 著 |
记录来源: | CN 人天书店 20221230 |