传统音频检测

介绍
采用线性支持向量机分类模型,基于深度伪造语音数据集对模型进行训练,
构造得到合成语音鉴伪模型。该模型采用九分类法,前八种分类(类别0~7)
分别代表8种不同的合成算法,类别8表示真实音频。本模型要求输入格式
为wav或mp3的待检测音频,先将音频统一转换为模型适用的16k采样率,
再利用opensmile工具包提取相关特征,随后将待测音频文件的特征输入
训练好的模型进行检测。检测结果以文字形式输出,结果内容包括测试音频
判断为真实/伪造,若判断为伪造音频,则还会输出判断的伪造算法