*本系统功能模块、字段参数,均可结合用户实际业务需求调整,可增可减,以达到最佳业务管理流程的体验!
编号 | 模块名称 | 字段参数 |
1 | 声音录制与采集 | 音频文件路径、采样率、通道数、时长、采样位数、声音格式等 |
2 | 音频预处理 | 消噪处理、去除杂音、音量调节、压缩、降噪效果、混响效果、音频标准化等 |
3 | 声音分割与定位 | 起始时间点、结束时间点、语音段数、能量阈值、分段精度、音频标签等 |
4 | 音频转文本 | 转写文本、文本编码、转写精度、说话人识别、语种识别、转写结果格式等 |
5 | 语音合成 | 文本输入、语音合成音色、合成时长、语速控制、音量控制、合成采样率等 |
6 | 声音特征提取 | 频谱图、峰值频率、频段能量、时域信息、频域信息、音高、音调、语速等 |
7 | 语音识别模型训练 | 语音样本标签、特征向量、训练数据集、学习率、迭代次数、识别准确率等 |
8 | 音频信号处理 | 卷积、傅里叶变换、FIR滤波、IIR滤波、频率增强、平滑滤波、音频谱分析等 |
9 | 音频效果调节 | 均衡器、失真器、噪音门、频率转移、相位旋转、空间定位、拾音器等 |
10 | 情感识别 | 情感类别、情感分数、中性情感、积极情感、消极情感、恐惧识别、高兴识别、悲伤识别等 |