X
0


购买方式

联系编辑

编辑:卢老师S

QQ: 731258266

电话:0411-84706104

邮箱:

相关教材

Hive数据仓库应用

孙玉林,高晓燕

978-7-5685-5310-0

TP311.13

大连理工大学出版社

2025-11-01

55.80元

编辑推荐

  本书按照国家职业教育教学标准与行业标准,采用项目式的教学模式,科学规范地编排内容。本书深入浅出讲解 Hive 工作原理,剖析 Hive 驱动程序,将 HiveQL 语句转化为 MapReduce 任务,利用 Hadoop 集群执行的过程深入探讨 Hive查询引擎优化查询计划的方法。结合企业的真实案例、数据精准反映大数据工程技术人员的真实工作过程、工艺流程和技术规范要求,助力读者系统掌握 Hive 性能特点与优化策略,提升职业技能。

  • 内容简介
  • 教材目录
  • 样章试读
  • 教学资源

  本书紧扣落实立德树人根本任务,始终坚持正确方向和价值引领,注重在教学中铸魂育人。采用“项目导向、任务驱动”的方式编写,以 Hive 数据仓库安装、开发、设计优化为主线,循序渐进地组织教学内容。在 Hive 数据仓库安装与使用基础环节,不仅让读者初步认识 Hive 数据仓库,还引导读者树立严谨的科学态度与数据安全意识 ;进入 Hive 数据仓库开发入门阶段,在掌握基本开发技能的同时,培养读者的创新精神和团队协作能力 ;在 Hive 数据仓库设计与优化过程中,深入探索数据仓库的架构设计与性能提升,注重培养读者的工匠精神和社会责任感 ;在 Hive 数据仓库综合应用实践中,帮助读者运用所学知识解决实际业务问题,强化读者的职业道德与担当意识 ;最后通过 Hive 数据仓库应用案例分析,学习不同行业的应用经验,拓宽知识视野,引导读者关注行业发展动态,思考如何利用大数据技术为社会发展贡献力量。各个任务层层递进,在逐步引导读者提升专业能力的同时,实现全方位的育人目标,使其快速适应大数据领域的实际工作需求,逐渐成长为德才兼备的高技能人才。

  本书紧密契合国家战略布局与产业发展需求,深度融入职业教育改革的时代进程,积极顺应行业发展趋势,精心甄选丰富的企业一线真实案例,将其巧妙嵌入知识体系,精准对接企业岗位要求,让读者沉浸式体验真实的工作场景,实现理论知识与实践技能的深度融合。始终坚持“学做结合、以学促教”的教育理念,巧妙融入课程思政元素,在传授 Hive 技术知识与技能的过程中,通过案例深度剖析,引导读者树立正确职业观与价值观,培育坚韧劳动精神与精益工匠精神,全方位提升职业素养与综合能力,助力其成长为适应新时代需求的高素质技能人才,为未来职业发展筑牢根基。


 
项目 1 Hive 数据仓库安装与使用基础 ........................................1
 1.1 项目背景 ................................................................................................................. 1
 1.2 项目知识准备 ........................................................................................................ 2
  1.2.1 什么是 Hive ? .................................................................................................. 2
  1.2.2 Hive 的起源和背景 ........................................................................................... 2
  1.2.3 Hive 的特性和优势 ........................................................................................... 3
  1.2.4 Hive 系统架构 ................................................................................................... 4
  1.2.5 Hive 数据模型 ................................................................................................... 6
  1.2.6 Hive 工作原理 ................................................................................................... 7
  1.2.7 Hive 执行流程 ................................................................................................... 7
  1.2.8 Hive 学习社区 ................................................................................................... 8
 1.3 项目设计与准备.................................................................................................... 8
 1.4 项目实施............................................................................................................... 12
  1.4.1 任务 1-1 部署虚拟机环境 .......................................................................... 12
  1.4.2 任务 1-2 部署 CentOS 操作系统 ................................................................ 18
  1.4.3 任务 1-3 配置 CentOS 阿里 YUM 源.......................................................... 24
  1.4.4 任务 1-4 安装系统依赖环境 ...................................................................... 26
  1.4.5 任务 1-5 部署 Hadoop 集群环境................................................................ 46
  1.4.6 任务 1-6 部署 Hive 数据仓库..................................................................... 56
 1.5 项目实训  搭建高可用 Hive 数据仓库集群................................................ 66
 1.6 练习题................................................................................................................... 68
项目 2 Hive 数据仓库开发入门............................................... 71
 2.1 项目背景............................................................................................................... 71
 2.2 项目知识准备...................................................................................................... 72
  2.2.1 什么是大数据?.............................................................................................. 72
  2.2.2 什么是数据仓库?.......................................................................................... 73
  2.2.3 Hive 与传统数据库的对比............................................................................. 74
  2.2.4 数据库操作相关概念...................................................................................... 74
 2.3 项目设计与准备 ................................................................................................. 75
 2.4 项目实施.............................................................................................................. 76
  2.4.1 任务 2-1 掌握 HiveQL 基础概念................................................................ 76
  2.4.2 任务 2-2 熟悉 HiveQL 基本语法................................................................ 79
  2.4.3 任务 2-3 实现 Hive 表数据操作................................................................. 91
  2.4.4 任务 2-4 运用 HiveQL 进阶查询.............................................................. 102
  2.4.5 任务 2-5 使用 Hive 内置函数................................................................... 115
 2.5 项目实训  HiveQL 操作实践 ..................................................................... 126
 2.6 练习题 ................................................................................................................ 129
项目 3 Hive 数据仓库设计与优化.......................................... 131
 3.1 项目背景............................................................................................................. 131
 3.2 项目知识准备.................................................................................................... 132
  3.2.1 Hive 的索引 ................................................................................................... 132
  3.2.2 SQL 解析器、编译器、优化器、执行器 ................................................... 133
  3.2.3 行式存储及列式存储.................................................................................... 133
  3.2.4 什么是数据倾斜?........................................................................................ 134
 3.3 项目设计与准备 ............................................................................................... 134
 3.4 项目实施............................................................................................................ 136
  3.4.1 任务 3-1 设计数据模型 ............................................................................ 136
  3.4.2 任务 3-2 调优 Hive 系统........................................................................... 144
  3.4.3 任务 3-3 优化 HiveQL 查询...................................................................... 150
 3.5 项目实训一  Hive 数据仓库模型设计实践.............................................. 158
 3.6 项目实训二  Hive 数据仓库优化实践....................................................... 160
 3.7 练习题 ................................................................................................................ 161
项目 4 Hive 数据仓库综合应用实践....................................... 163
 4.1 项目背景............................................................................................................. 163
 4.2 项目知识准备.................................................................................................... 164
  4.2.1 Hive 现有的挑战和趋势............................................................................... 164
  4.2.2 Hadoop 生态系统........................................................................................... 165
  4.2.3 数据可视化工具............................................................................................ 171
 4.3 项目设计与准备 ............................................................................................... 172
 4.4 项目实施............................................................................................................ 174
  4.4.1 任务 4-1 开发与运用 Hive 自定义函数 .................................................. 174
  4.4.2 任务 4-2 集成与运用 Hive 与数据可视化工具 ...................................... 187
 4.5 项目实训  Hive 综合应用实践 - 收益分析 ............................................. 197
 4.6 练习题 ................................................................................................................ 197
项目 5 Hive 数据仓库应用案例分析....................................... 199
 5.1 项目背景............................................................................................................. 199
 5.2 项目知识准备.................................................................................................... 201
  5.2.1 Hive 新兴应用场景 ....................................................................................... 201
  5.2.2 Hive 与人工智能、机器学习、深度学习的结合展望 .............................. 201
  5.2.3 Hive 在数据处理与分析领域的未来发展趋势........................................... 202
 5.3 项目设计与准备 ............................................................................................... 204
 5.4 项目实施............................................................................................................ 206
  5.4.1 任务 5-1 Hive 综合实践一 :实施影视视频网站统计分析 .................. 206
  5.4.2 任务 5-2 Hive 综合实践二 :执行网站流量日志数据分析 .................. 210
 5.5 项目实训  Hive 综合应用实践:社交媒体数据分析............................. 251
 5.6 练习题 ................................................................................................................ 253
参考文献 .......................................................................... 255


很抱歉!您正在使用的浏览器版本过低,无法正常使用我们的网站,请升级后再试!

为获得最佳浏览体验,建议您升级或使用其他浏览器,我们列出了一些最受欢迎的浏览器供您尝试: