0


智能语音技术与应用 : 基于Python实现
作者:陈伟元, 贾克辉丛书名: ISBN:978-7-5685-4337-8页数:0 开本:装帧:平装 出版时间:2024-02-01中图分类:①TP18②TP391.1
¥41.80

编辑推荐

省级专业教学资源库“智能语音应用技术”课程配套教材

  本教材为高职电子信息类专业人工智能领域的专业核心课程配套教材。

  人工智能是新世纪引领未来发展的主导学科之一。相关技术和研究成果已经广泛应用到国防建设、工业生产、国民生活中的各个领域。在信息网络和知识经济时代,人工智能相关技术正在引起越来越广泛的重视,必将推动科学技术的进步和产业的发展。

  智能语音技术是人工智能产业链上的关键一环。智能语音技术之所以越来越被重视,是因为它是人工智能的重要入口。随着互联网、智能硬件的普及,语音将成为简单且直接的交互方式。相比图像、双手操控,语音入口有多种优势。智能语音系统具有交互属性,可以与产业深度融合,例如将智能语音技术植入产品或应用于相关业务场景,可以提高企业服务质量,释放产业红利。因此,智能语音技术已成为企业数字化转型的核心助力。目前,智能语音行业正经历着高速的发展,随着技术的逐步突破和愈加成熟,智能语音技术的应用广度和深度都在不断增加,产业规模越来越大,人才需求将会急剧增加。智能语音是智能产品开发生产过程中极为重要的工作环节,智能语音技术是从事人工智能产品开发生产所必须掌握的核心知识与岗位技能。国务院在《新一代人工智能发展规划》中明确提出当前我国人工智能人才远不能满足需求,并在总体部署中将加强人才队伍建设作为构建开放协同的人工智能科技创新体系四大主要支撑之一。工业和信息化部人才交流中心牵头编写的《人工智能产业人才发展报告(2019—2020 年)》从人才角度出发,全面分析梳理了人工智能产业人力资源发展情况。该报告采用岗位人才供需比值来反映人工智能产业各技术方向岗位和不同职能岗位的人才供需情况。岗位人才供需比越高,表明该岗位的人才供应越充足。数据显示智能语音技术方向岗位的人才供需比为 8%,说明智能语音技术方向的人才供应严重不足。针对当前社会智能语音专业技术人才需求量比较大的现状,同时满足高职院校培养模式应顺应职业发展多方面需求,编写组编写了本教材,通过设计合适的综合性教学项目帮助学生获得智能语音技术必需的知识和技能,帮助学生构建相应的知识体系。

  智能语音技术是一门涉及语音信号处理、人工智能、声学、语言学、数理统计学、心理学等多学科交叉的科学。根据智能语音企业对核心岗位人才的能力遴选要求,同时依据智能语音产品开发岗位的工作内容,本教材以语音数据采集和处理、语音数据标注和分析、智能语音产品运维和设计等能力为基本目标,将知识、技能和素质培养有机结合在一起,注重学生实践能力的培养,同时关注学生后续发展创新能力的培养。本教材遵循智能语音产品开发所需技术环节,以Python语言为主要开发语言,讲授内容主要包括语音信号预处理、语音信号的时域分析和频域分析、语音识别、自然语言处理、语言合成、语音标注、移动终端的智能语音技术等。教材体例安排以项目为主线、专业知识为前导、任务为单元,在每个项目内设置若干个任务,在任务中融入了所需的相关知识、相关技能与相关素质,最后通过“创意园地”作为能力拓展部分,为学生创新创业实践提供思路引导。具体如下:

  1. 专业知识是智能语音技术人才为达成工作任务应掌握的专业背景知识与理论基础。

  2. 项目注重培养智能语音技术人才在实际工程与项目开发中应当具备的能力。其核心能力包含分析并推动问题解决的能力,需求分析与识别能力,数据分析与处理能力,准确理解业务场景、从具体问题中抽象出通用解决方案的能力等。

  3. 任务作为项目的子单元,注重培养学生应当掌握的智能语音技术常用工具和技术能力。

  4.“创意园地”注重培养学生后续的能力发展与知识创新,促使学生成为智能语音技术能手与专家。在基本的技能和知识的基础上增强学生对智能语音的系统化认知,针对真实的、专业化的、综合性的工作任务,学生制订合适的解决方案、操作计划并实施,并对实施情况、完成过程、工作结果进行评估和反思。

  5.项目中穿插“思考”板块,寓价值引导于知识传授,寓中国传统文化为主体的教育于项目实践,希望读者在项目学习过程中思考并树立正确的价值取向、理想信念、政治信仰和社会责任。 

  本教材主要介绍智能语音技术的基础知识、原理、方法和应用。全书共9个项目,包括23个任务单元。绪论部分介绍了智能语音基础、产业技术、产业应用、产业人才现状;项目1介绍了语音信号的采集与转换,包括语音信号的采集、音频文件读取与波形绘制、音频参数的转换任务;项目2介绍了语音信号的时域特征提取,包括语音信号的分帧、语音信号的时域特征提取、语音信号的端点检测、语音信号的基音周期估计任务;项目3介绍了语音信号的频域特征提取,包括语音信号频谱图的绘制、语音信号语谱图的绘制、语音信号MFCC 特征的提取任务;项目4介绍了语音识别,包括个性化定义语音操控命令和离线简单语音识别任务;项目5介绍了自然语言处理,包括中文自然语言处理、英文自然语言处理、中文文本可视化分析任务;项目6介绍了语音合成,包括中文文字转语音处理、离线语音合成任务;项目7介绍了语音标注,包括用Praat工具标注对话语音、平台语音标注任务;项目8介绍了云平台智能语音处理,包括百度云平台在线实时语音识别、讯飞云平台在线语音合成任务;项目9介绍了移动终端的智能语音技术,包括Android系统的语音合成、华为鸿蒙系统的语音播报与语音识别任务。项目案例以主流开源库为基础,采用Python语言编程实现。

  本教材以立德树人为根本任务,注重学生素质及能力培养,重点突出,要点明确,淡化理论分析,突出知识教学与实践训练相结合。本教材为省级专业教学资源库“智能语音应用技术”课程配套教材。部分课程内容以动画、微视频、微实验等方式形象直观表达,可通过专业教学资源库快速、便捷获得,便于自主学习。

  本教材在编写过程中对接智能语音职业技能等级标准和专业教学标准,注重理论与实践相结合,充分考虑岗位适应性问题,使用现成的算法技术,强调学以致用和学而能用,努力体现教学与实践零距离。本教材可作为科大讯飞“人工智能语音应用开发职业技能等级证书”的考证和参考用书。学生可快速地提升相应智能语音产品开发技能,提升就业起点。同时关注岗位专业知识的相对系统性,注重学生动手能力和实际问题解决能力的培养,注重培养学生的职业道德素养及可持续发展能力,以求达到高等职业教育要求。教材经产、教、社三方联合,优势互补,保障了教材的质量。


 

绪论   智能语音概述……………………………………………………………………………… 1


项目1   语音信号的采集与转换 ………………………………………………………………… 9

1.1   人声的特性…………………………………………………………………………… 10

1.2   声音的拾取装置……………………………………………………………………… 11

1.3   声音的数字化过程…………………………………………………………………… 12

1.4   任务1 语音信号的采集 …………………………………………………………… 17

1.5   任务2 音频文件读取与波形绘制 ………………………………………………… 21

1.6   任务3 音频参数的转换 …………………………………………………………… 25

1.7   项目小结……………………………………………………………………………… 27

1.8   习 题………………………………………………………………………………… 28

1.9   创意园地……………………………………………………………………………… 28


项目2   语音信号的时域特征 ………………………………………………………………… 30

2.1   时域特征的介绍……………………………………………………………………… 31

2.2   分帧与加窗…………………………………………………………………………… 32

2.3   常用的时域特征表示………………………………………………………………… 34

2.4   语音的端点检测……………………………………………………………………… 39

2.5   语音的基音周期估计………………………………………………………………… 41

2.6   任务1 语音信号的分帧 …………………………………………………………… 45

2.7   任务2 语音信号的时域特征提取 ………………………………………………… 49

2.8   任务3 语音信号的端点检测 ……………………………………………………… 52

2.9   任务4 语音信号的基音周期估计 ………………………………………………… 54

2.10   项目小结 …………………………………………………………………………… 57

2.11   习 题 ……………………………………………………………………………… 57

2.12   创意园地 …………………………………………………………………………… 58


项目3   语音信号的频域特征 ………………………………………………………………… 60

3.1   频域特征的介绍……………………………………………………………………… 61

3.2   频谱图与语谱图……………………………………………………………………… 61

3.3   Mel频率倒谱系数(MFCC)………………………………………………………… 63

3.4   任务1 语音信号频谱图的绘制 …………………………………………………… 65

3.5   任务2 语音信号语谱图的绘制 …………………………………………………… 68

3.6   任务3 语音信号 MFCC特征的提取 ……………………………………………… 70

3.7   项目小结……………………………………………………………………………… 74

3.8   习 题………………………………………………………………………………… 74

3.9   创意园地……………………………………………………………………………… 75


项目4   语音识别 ……………………………………………………………………………… 77

4.1   语音识别简介………………………………………………………………………… 78

4.2   语音识别的应用与场景……………………………………………………………… 79

4.3   语音识别的基本流程………………………………………………………………… 80

4.4   语音识别的效果评价………………………………………………………………… 85

4.5   任务1 个性化定义语音操控命令 ………………………………………………… 85

4.6   任务2 离线简单语音识别 ………………………………………………………… 88

4.7   项目小结……………………………………………………………………………… 91

4.8   习 题………………………………………………………………………………… 92

4.9   创意园地……………………………………………………………………………… 93


项目5   自然语言处理 ………………………………………………………………………… 95

5.1   自然语言处理简介…………………………………………………………………… 96

5.2   自然语言处理的应用与场景………………………………………………………… 97

5.3   自然语言处理技术…………………………………………………………………… 98

5.4   中英文自然语言处理技术的差异 ………………………………………………… 100

5.5   任务1 中文自然语言处理 ………………………………………………………… 101

5.6   任务2 英文自然语言处理 ………………………………………………………… 104

5.7   任务3 中文文本可视化分析 ……………………………………………………… 108

5.8   项目小结 …………………………………………………………………………… 112

5.9   习 题 ……………………………………………………………………………… 112

5.10   创意园地…………………………………………………………………………… 113


项目6   语音合成 ……………………………………………………………………………… 115

6.1   语音合成简介 ……………………………………………………………………… 116

6.2   语音合成的应用与场景 …………………………………………………………… 116

6.3   语音合成技术 ……………………………………………………………………… 118

6.4   语音合成技术的效果评价 ………………………………………………………… 120

6.5   任务1 中文文字转语音处理 ……………………………………………………… 121

6.6   任务2 离线语音合成 ……………………………………………………………… 124

6.7   项目小结 …………………………………………………………………………… 128

6.8   习 题 ……………………………………………………………………………… 129

6.9   创意园地 …………………………………………………………………………… 129


项目7   语音标注 ……………………………………………………………………………… 131

7.1   为什么需要语音标注 ……………………………………………………………… 132

7.2   语音标注的种类 …………………………………………………………………… 132

7.3   语音标注的规则 …………………………………………………………………… 135

7.4   语音数据标注工具与平台 ………………………………………………………… 137

7.5   任务1 用Praat工具标注对话语音 ……………………………………………… 139

7.6   任务2 平台语音标注 ……………………………………………………………… 145

7.7   项目小结 …………………………………………………………………………… 147

7.8   习 题 ……………………………………………………………………………… 148

7.9   创意园地 …………………………………………………………………………… 149


项目8   云平台智能语音处理 ………………………………………………………………… 150

8.1   智能语音的端侧和云端处理 ……………………………………………………… 151

8.2   智能语音云平台的应用与场景 …………………………………………………… 151

8.3   百度云平台的注册使用 …………………………………………………………… 154

8.4   讯飞云平台的注册使用 …………………………………………………………… 155

8.5   任务1 百度云平台在线实时语音识别 …………………………………………… 156

8.6   任务2 讯飞云平台在线语音合成 ………………………………………………… 158

8.7   项目小结 …………………………………………………………………………… 164

8.8   习 题 ……………………………………………………………………………… 164

8.9   创意园地 …………………………………………………………………………… 165


项目9   移动终端的智能语音技术 …………………………………………………………… 167

9.1   移动终端的智能语音技术简介 …………………………………………………… 168

9.2   任务1 Android系统的语音合成 ………………………………………………… 169

9.3   任务2 华为鸿蒙系统的语音播报与语音识别 …………………………………… 171

9.4   项目小结 …………………………………………………………………………… 181

9.5   习 题 ……………………………………………………………………………… 181

9.6   创意园地 …………………………………………………………………………… 182


参考文献………………………………………………………………………………………… 184


  • 课件-智能语音技术与应用 : 基于Python实现

    课程: 语音识别 类型: zip 大小:235.73MB上传时间: 2024-02-07 12:59:08

  • 习题答案-智能语音技术与应用 : 基于Python实现

    课程: 语音识别 类型: docx 大小:28.87KB上传时间: 2024-02-07 12:59:51

  • 项目例程-智能语音技术与应用 : 基于Python实现

    课程: 语音识别 类型: zip 大小:963.75KB上传时间: 2024-02-07 13:00:31

  • 在线课程-智能语音技术与应用 : 基于Python实现

    课程: 语音识别 类型: txt 大小:64B上传时间: 2024-02-07 13:01:01

全部下载
0.741831s