first commit

This commit is contained in:
2024-09-05 12:45:40 +08:00
commit e148adef80
98 changed files with 2808 additions and 0 deletions

View File

@@ -0,0 +1,71 @@
# 课程作业
- 课程名称:计算机语音技术
- 作业编号作业1
- 学号21281280
- 姓名:柯劲帆
- 班级物联网2101班
---
## 1. 什么是语音,语音交际过程分为哪五个阶段,各阶段的内容是什么?
语音是语言的声学实现,即传递语言信息的声学信号。
语音交际过程分为以下5个阶段
1. **语义规划**:出现发音的意图,大脑对信息处理和转化,将意图进行编码;
2. **语音产生**:大脑控制发音相关器官的运动和调节进行发音,横膈肌挤压肺部产生气流,声门、声道和唇齿震动发声;
3. **声音传递**:声音主要由四个维度携带语音信号,包括音强、音长、音高和音质;
4. **语音感知**:耳朵的复杂结构将声波的各个频率分解,并转换成电信号通过神经传递进大脑;
5. **语义理解**:大脑将接收到的语音信号转化为可以理解的思想或信息,即对语音信息进行反编码,并结合认知和记忆系统对信息进行处理和理解。
## 2. 语音的基本声学特征有哪些?请加以简要说明。
- **音质**:音质是指声音的特色和纯净度,即声音在传播过程中表现出来的泛音和震动的复杂性。语音的音质与声带、口腔、鼻腔、喉咙等发音器官的形状、大小、紧张程度等因素有关,此外还受到发音方式、发音时气流的特点、声音的共振等因素的影响。
- **音强**:音量是指声音的强度或响度,即声音在空气中的振幅。语音的音量与声带的紧张程度、呼出气体的多少以及声音在空气中传播的距离有关。一般来说,声音的响度越大,声音传播得越远。
- **音高**:音高是指声音的频率,即每秒振动声带的次数。语音的音高与声带的长短、厚薄以及松紧程度有关,一般来说,男人的音高较低,女人的音高较高。
- **音长**:音长是指声音的持续时间,即声音从开始到结束的时间长度。语音的音长与发音速度、发音时所需时间等因素有关,它可以用来表达说话人的情感和态度。
## 3. 汉语的音节结构,试举例说明各部分,以及各部分单元的个数。
在汉语中音节声母韵母声调柯KE = 声母K + 韵母E + 第1声。
汉语音节结构各部分单元的个数:
- 声母21个
- 韵母39个
- 单元音10个
- 舌面元音7个
- 舌尖元音2个
- 卷舌元音1个
- 二合元音9个
- 前响5个
- 后响4个
- 三合元音4个
- 鼻韵尾7个
- 复合鼻韵尾9个
- 声调5个
- 孤立音节声调4个
- 轻声1个
## 4. 从语音产生的过程说明辅音和元音的区别。
辅音和元音的主要区别:
1. 气流方面:
1. 辅音口腔内有阻塞或挤压,气流强烈。辅音是由于声带振动或者气流受到阻碍而产生的。在发音过程中,声带部分或全部振动,但并不像元音那样没有阻碍。气流通过口腔或鼻腔时,会被口腔或鼻腔内部的形状或紧张状态所阻碍,这种阻碍就形成了辅音。因此,辅音通常带有某种程度的摩擦、挤迫或阻碍的感觉。
2. 元音气流平稳,口腔内无明显阻碍。元音是在发音过程中,声带振动且气流不受阻碍产生的。气流通过口腔时,不遇到任何显著的阻碍。口腔的形状、大小和紧张程度都适中,使得气流能够顺畅地通过,这样的发音过程就形成了元音。因此,元音通常被认为是一种“无阻碍”的发音方式。
2. 辅音视其发音部位(如摩擦、送气、阻塞)和方式(如唇、齿、硬腭、软腭、舌面、舌根、鼻)分类;元音视声道长度、舌位和唇形分类。
## 5. 绘制语音产生模型框图,并加以简要说明。
![语音产生模型框图.drawio](语音产生模型框图.drawio.svg)

View File

@@ -0,0 +1,49 @@
<mxfile host="Electron" modified="2023-09-23T16:59:42.025Z" agent="Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) draw.io/21.7.5 Chrome/114.0.5735.289 Electron/25.8.1 Safari/537.36" etag="JUpnaB9MXtwt9jDfJp81" version="21.7.5" type="device">
<diagram name="第 1 页" id="srzzxO-FdIVnfBNWfj8P">
<mxGraphModel dx="810" dy="469" grid="1" gridSize="10" guides="1" tooltips="1" connect="1" arrows="1" fold="1" page="0" pageScale="1" pageWidth="827" pageHeight="1169" math="0" shadow="0">
<root>
<mxCell id="0" />
<mxCell id="1" parent="0" />
<mxCell id="HXZTd7DcZxRO3KjASpro-16" style="edgeStyle=orthogonalEdgeStyle;rounded=0;orthogonalLoop=1;jettySize=auto;html=1;exitX=0.5;exitY=1;exitDx=0;exitDy=0;" edge="1" parent="1" source="HXZTd7DcZxRO3KjASpro-2" target="HXZTd7DcZxRO3KjASpro-6">
<mxGeometry relative="1" as="geometry" />
</mxCell>
<mxCell id="HXZTd7DcZxRO3KjASpro-2" value="激励源" style="swimlane;fontStyle=0;childLayout=stackLayout;horizontal=1;startSize=30;horizontalStack=0;resizeParent=1;resizeParentMax=0;resizeLast=0;collapsible=1;marginBottom=0;whiteSpace=wrap;html=1;" vertex="1" parent="1">
<mxGeometry x="320" y="120" width="160" height="80" as="geometry" />
</mxCell>
<mxCell id="HXZTd7DcZxRO3KjASpro-3" value="声带振动,产生不同音高和音质的谐振源" style="text;strokeColor=none;fillColor=none;align=left;verticalAlign=middle;spacingLeft=4;spacingRight=4;overflow=hidden;points=[[0,0.5],[1,0.5]];portConstraint=eastwest;rotatable=0;whiteSpace=wrap;html=1;" vertex="1" parent="HXZTd7DcZxRO3KjASpro-2">
<mxGeometry y="30" width="160" height="50" as="geometry" />
</mxCell>
<mxCell id="HXZTd7DcZxRO3KjASpro-18" style="edgeStyle=orthogonalEdgeStyle;rounded=0;orthogonalLoop=1;jettySize=auto;html=1;exitX=0.5;exitY=1;exitDx=0;exitDy=0;entryX=0.5;entryY=0;entryDx=0;entryDy=0;" edge="1" parent="1" source="HXZTd7DcZxRO3KjASpro-6" target="HXZTd7DcZxRO3KjASpro-8">
<mxGeometry relative="1" as="geometry" />
</mxCell>
<mxCell id="HXZTd7DcZxRO3KjASpro-6" value=" 声道调节" style="swimlane;fontStyle=0;childLayout=stackLayout;horizontal=1;startSize=30;horizontalStack=0;resizeParent=1;resizeParentMax=0;resizeLast=0;collapsible=1;marginBottom=0;whiteSpace=wrap;html=1;" vertex="1" parent="1">
<mxGeometry x="200" y="280" width="160" height="80" as="geometry" />
</mxCell>
<mxCell id="HXZTd7DcZxRO3KjASpro-7" value="辅音和元音在口腔共振腔内调节,产生共振峰" style="text;strokeColor=none;fillColor=none;align=left;verticalAlign=middle;spacingLeft=4;spacingRight=4;overflow=hidden;points=[[0,0.5],[1,0.5]];portConstraint=eastwest;rotatable=0;whiteSpace=wrap;html=1;" vertex="1" parent="HXZTd7DcZxRO3KjASpro-6">
<mxGeometry y="30" width="160" height="50" as="geometry" />
</mxCell>
<mxCell id="HXZTd7DcZxRO3KjASpro-8" value="辐射" style="swimlane;fontStyle=0;childLayout=stackLayout;horizontal=1;startSize=30;horizontalStack=0;resizeParent=1;resizeParentMax=0;resizeLast=0;collapsible=1;marginBottom=0;whiteSpace=wrap;html=1;" vertex="1" parent="1">
<mxGeometry x="200" y="400" width="160" height="80" as="geometry" />
</mxCell>
<mxCell id="HXZTd7DcZxRO3KjASpro-9" value="声音从口腔传到嘴唇形成语音信号" style="text;strokeColor=none;fillColor=none;align=left;verticalAlign=middle;spacingLeft=4;spacingRight=4;overflow=hidden;points=[[0,0.5],[1,0.5]];portConstraint=eastwest;rotatable=0;whiteSpace=wrap;html=1;" vertex="1" parent="HXZTd7DcZxRO3KjASpro-8">
<mxGeometry y="30" width="160" height="50" as="geometry" />
</mxCell>
<mxCell id="HXZTd7DcZxRO3KjASpro-14" style="edgeStyle=orthogonalEdgeStyle;rounded=0;orthogonalLoop=1;jettySize=auto;html=1;exitX=0.5;exitY=1;exitDx=0;exitDy=0;" edge="1" parent="1" source="HXZTd7DcZxRO3KjASpro-12" target="HXZTd7DcZxRO3KjASpro-2">
<mxGeometry relative="1" as="geometry" />
</mxCell>
<mxCell id="HXZTd7DcZxRO3KjASpro-12" value="冲激序列发生器" style="swimlane;fontStyle=0;childLayout=stackLayout;horizontal=1;startSize=30;horizontalStack=0;resizeParent=1;resizeParentMax=0;resizeLast=0;collapsible=1;marginBottom=0;whiteSpace=wrap;html=1;" vertex="1" parent="1">
<mxGeometry x="320" width="160" height="80" as="geometry" />
</mxCell>
<mxCell id="HXZTd7DcZxRO3KjASpro-13" value="横膈膜有规律地挤压肺,产生序列气流" style="text;strokeColor=none;fillColor=none;align=left;verticalAlign=middle;spacingLeft=4;spacingRight=4;overflow=hidden;points=[[0,0.5],[1,0.5]];portConstraint=eastwest;rotatable=0;whiteSpace=wrap;html=1;" vertex="1" parent="HXZTd7DcZxRO3KjASpro-12">
<mxGeometry y="30" width="160" height="50" as="geometry" />
</mxCell>
<mxCell id="HXZTd7DcZxRO3KjASpro-17" style="edgeStyle=orthogonalEdgeStyle;rounded=0;orthogonalLoop=1;jettySize=auto;html=1;exitX=0.5;exitY=1;exitDx=0;exitDy=0;entryX=0.5;entryY=0;entryDx=0;entryDy=0;" edge="1" parent="1" source="HXZTd7DcZxRO3KjASpro-15" target="HXZTd7DcZxRO3KjASpro-6">
<mxGeometry relative="1" as="geometry" />
</mxCell>
<mxCell id="HXZTd7DcZxRO3KjASpro-15" value="&lt;p style=&quot;margin-top: 10.8pt; margin-bottom: 0pt; direction: ltr; unicode-bidi: embed; vertical-align: baseline;&quot;&gt;随机噪声发生器&lt;/p&gt;" style="rounded=0;whiteSpace=wrap;html=1;" vertex="1" parent="1">
<mxGeometry x="80" y="120" width="160" height="80" as="geometry" />
</mxCell>
</root>
</mxGraphModel>
</diagram>
</mxfile>

File diff suppressed because one or more lines are too long

After

Width:  |  Height:  |  Size: 14 KiB