[图书] - 主编:韩莹,副主编:袁静 - 清华大学出版社 - 2022
本书主要以纯案例驱动的形式,分别使用和结合使用requests库、selenium库,从互联网上收集数据。主要内容包括收集静态网页数据,网页解析,JSON数据,JSON解析,多级翻页,cookie和session,验证登录,多线程,数据的存储,收集到的数据包括静态网页数据、json、图片、音频、视频等数据,并对获取的数据进行清洗。适合Python初学者,也适合研究Python的广大科研人员、学者、工程技术人员。本教材采用纯的案例,和简单的注释,其他一些先修的知识是在其他课程有开设。