• 全部
主办单位:煤炭科学研究总院有限公司、中国煤炭学会学术期刊工作委员会
基于MFCC,MODGDF和支持向量机的环境音识别研究
  • 作者

    任立勇何永彬贺茜于永斌刘思怡

  • 单位

    电子科技大学信息与软件工程学院四川长江职业学院

  • 摘要
    环境音识别是机器学习领域中的一个研究重点和难点,它可以帮助智能系统识别音频数据中的环境音。本文提出一种新的环境音识别方法,它是将梅尔频率倒谱系数(mel frequency cepstral coefficents,MFCC)和修正群延迟函数(modified group delay function,MODGDF)联合作为特征参数,然后利用多分类支持向量机(support vector machine,SVM)进行参数分类,达到识别音频数据中环境音的目的。结果表明,在DCASE 2018数据集上,该方法的实验效果优于DCASE 2018数据集基线系统识别效果,整体识别准确率提高了25.8%。
  • 关键词

    环境音识别梅尔频率倒谱系数修正群延迟函数支持向量机

  • 基金项目(Foundation)
    国家自然科学基金资助项目(61550110248);
相关问题
立即提问

主办单位:煤炭科学研究总院有限公司 中国煤炭学会学术期刊工作委员会

©版权所有2015 煤炭科学研究总院有限公司 地址:北京市朝阳区和平里青年沟东路煤炭大厦 邮编:100013
京ICP备05086979号-16  技术支持:云智互联
Baidu
map