本书以某招聘网站中的大数据职位招聘信息为数据源,系统地介绍了使用 Hadoop 生态系统进行大数据离线分析的方法和步骤。全书共6章,分别讲解项目需求、项目架构、项目实现流程、Hadoop集群环境搭建、使用Flume实现数据采集、使用MapReduce实现数据预处理、使用Hive实现数据分析和使用FineBI实现数据可视化。 本书附有配套视频、教学PPT、教学设计等资源。同时,为了帮助初学者更好地学习本书中的内容,还提供了在线答疑,欢迎读者关注。 本书适合作为高等学校的数据科学与大数据技术及相关专业的教材,也适合数据分析、数据可视化、数据仓库等领域的从业者阅读。