深圳市奥斯恩净化技术有限公司

环保在线中级9

收藏

声源分析算法识别系统 训练样本超过一万个 准确率高达85%

时间:2024-08-20      阅读:31

  一、声纹识别算法盒子背景
 
  声纹识别是一种生物识别技术,通过分析个体的声音特征来进行身份验证或确认身份的一种方法。声纹识别利用个体的声音包括语音、发音习惯、音调、语速等信息来进行识别。
 
  声纹识别技术有着广泛的应用,包括但不限于安全领域、个人身份验证、电话银行服务、司法领域的证据分析等。它的优势在于不受外貌变化的影响,相比其他生物识别技术如指纹或虹膜识别,声纹识别也更容易在远程或者隐秘的情况下进行。然而,声纹识别也面临一些挑战,例如环境噪音、说话者的情绪或健康状态变化等因素可能会影响识别的准确性。
 
  随着技术的进步和应用场景的增多,声纹识别技术正逐渐成为生物识别领域的重要分支之一,为各种领域提供了更加安全和便捷的身份验证解决方案。
 
  技术参数
 
  Ø基于Pytorch实现的声纹识别模型:模型是一种基于深度学习的说话人识别系统,其结构中融入了通道注意力机制、信息传播和聚合操作。这个模型的关键组成部分包括多层帧级别的TDNN 层、一个统计池化层以及两层句子级别的全连接层,此外还配备了一层 softmax,损失函数为交叉熵。
 
  Ø特征提取:预加重->分加窗->离散傅里叶变换->梅尔滤波器组->逆离散傅里叶变换 -->image
 
  Ø模型训练集:>10000个训练样本
 
  Ø声音类型:声音类型主要划分为五大类别,分别为生活噪声、施工噪声、工业噪声、交通噪声、自然噪声,其中包含打雷,刮风,敲击、虫鸣鸟叫等不少于50个声音子类别
 
  Ø声纹识别准确率:≥85%
 
  Ø识别响应速率:>3s
 
  Ø调用方式:支持云端调用或者本地终端调用
 
  Ø技术协议:支持HTTP协议
image.png
  声纹库分类
 
  一级分类:五大类,自然噪声、生活噪声、施工噪声、工业噪声、交通噪声,分类依据:HJ640标准、噪声污染防治报告、噪声环评、噪声法等;
 
  二级分类:按照应用场景或声音共同特点区分;
 
  三级分类:作为子站识别结果显示,对原始声音类型进行同类合并、优化。
 
上一篇: 道路积尘扬尘负荷评估监测 免安装支架 可适用于各种车型 下一篇: 便携油烟检测仪 实现与烟道内油烟等流速抽取方式
提示

请选择您要拨打的电话: