Python爬虫大数据采集与挖掘(第2版·微课视频版)

作者: 曾剑平

ISBN号: 9787302678250

出版日期: 2025-02-01

印次:2-1

定价: ¥59.8

咨询QQ:2301891038(仅限教师)
内容简介

本书围绕大数据采集与挖掘,对采集技术的相关基础、技术原理、Python实现技术、大数据挖掘与应用方法进行了系统介绍。书中全面、完整地覆盖了各种类型的网络爬虫及相关的信息处理挖掘技术,并提供了45个与爬虫技术和应用相关的Python程序。全书共分为四部分,即概述、基础篇、技术与实现篇、大数据挖掘与应用篇。第一部分 (第1章)是概述,指出利用Python采集互联网大数据的重要性,介绍了相关技术研究、技术体系、 采集技术的合规性及应用现状等 ,分析了大模型对互联网大数据技术的影响; 第二部分 (第2、3章)是基础篇,包括Web服务器的应用架构以及HTTP、Robots、HTML、页面编码等相关协议和规范; 第三部分 (第4~10章)是技术与实现篇,全面介绍普通网络爬虫技术、动态页面采集方法、主题爬虫技术、Deep Web爬虫、微博信息采集、Web信息提取以及反爬虫技术等,内容涵盖各种爬虫技术实现方法及Python实例; 第四部分 (第11、12章)是大数据挖掘与应用篇,介绍 文本、情感、社交网络和时间序列等典型大数据处理与挖掘技术 及应用模式,并以新闻舆情监测、 Web自动化测试、酒店评论文本挖掘 为例介绍Python爬虫应用构建方法,将本书介绍的一些关键技术、模型和工具贯穿在一起。

更多图书信息
  • 策划编辑:王冰飞
  • 出版日期:2025-02-01
  • 作者:曾剑平
  • 书号:9787302678250
  • 印刷日期:2025-02-19
  • 印次:2-1