广西师范大学学报(自然科学版) ›› 2018, Vol. 36 ›› Issue (4): 34-41.doi: 10.16088/j.issn.1001-6600.2018.04.005

• • 上一篇    下一篇

基于随机森林的不同程度病态嗓音识别

许远静, 胡维平   

  1. 广西师范大学电子工程学院,广西桂林541004
  • 收稿日期:2018-03-29 发布日期:2018-10-20
  • 通讯作者: 胡维平(1963—),男,广西桂林人,广西师范大学教授,博士。E-mail: huwp@gxnu.edu.cn
  • 基金资助:
    国家自然科学基金(61362003);广西多源信息挖掘与安全重点实验室基金(13-A-03-02);广西壮族自治区高等学校科学研究项目(KY2015YB034)

Identification of Pathological Voice of Different Levels Based on Random Forest

XU Yuanjing, HU Weiping*   

  1. College of Electronic Engineering, Guangxi Normal University, Guilin Guangxi 541004,China
  • Received:2018-03-29 Published:2018-10-20

摘要: 为了更好地对不同程度病态嗓音进行识别,本文采用了一种基于随机森林的识别方法。分别对正常、中度、重度病态嗓音进行识别,并与高斯混合模型的识别结果进行了对比。实验结果表明:相比高斯混合模型,随机森林具有更高的分类精度、鲁棒性及更好的识别效果,其中正常、中度、重度嗓音的最高识别率分别达到了98.04%、86.84%、83.33%。本文内容为进一步研究病态嗓音细分类提供了一定的参考。

关键词: 病态嗓音, 随机森林, 高斯混合模型, 鲁棒性

Abstract: In order to identify the different degrees of pathological voice recognition, a method based on random forest recognition is proposed in this paper. The normal, moderate, and severe pathological voices are identified separately and compared with the recognition results of GMM. The experimental results show that compared with GMM, random forest method has higher classification accuracy, robustness, and better recognition results. The highest recognition rates of normal, moderate, and severe voices are 98.04%, 86.84%, and 83.33%, respectively. It provides a reference for further research on the classification of pathological voice.

Key words: pathological voice, random forest, Gaussian mixed model, robustness

中图分类号: 

  • TP391.4
[1] 卢永辉. 语音识别技术的关键问题研究[D]. 西安:陕西师范大学, 2014.
[2] 于萍, 孙彩. 嗓音疾病的分类[J]. 听力学及言语疾病杂志, 2018,26(1):110-114.
[3] 杨式麟. 嗓音的声学检测[J]. 听力学及言语疾病杂志, 2002, 10(2):127-128.
[4] FANG S H, TSAO Y, HSIAO M J, et al. Detection of pathological voice using cepstrum vectors: a deep learning approach[J]. Journal of Voice, 2018. DOI:10.1016/j.jvoice.2018.02.003.
[5] 刘珊珊. 基于SVM的病理嗓音障碍严重等级的评估和分类[J]. 仪表技术, 2015(6):41-43,47.
[6] 袁悦, 顾玲玲, 常静雅,等. 经验模态分解法识别声带息肉和声带囊肿的研究[J]. 信息化研究, 2015,41(2):27-32.
[7] 陶智, 曾晓亮, 顾玲玲,等. 病理嗓音发声系统的非对称建模研究[J]. 数据采集与处理, 2016, 31(2):260-267.
[8] MUHAMMAD G, ALSULAIMAN M, ALI Z, et al. Voice pathology detection using interlaced derivative pattern on glottal source excitation[J]. Biomedical Signal Processing and Control, 2017, 31:156-164.
[9] MURSALIN M, ZHANG Y, CHEN Y, et al. Automated epileptic seizure detection using improved correlation-based feature selection with random forest classifier[J]. Neurocomputing, 2017, 241(C):204-214.
[10] 高俊芬, 胡维平. 基于非线性动力学和GMM的病态嗓音识别与研究[J]. 广西师范大学学报(自然科学版), 2011, 29(3):5-8.
[11] 张志明, 杨式鳞. 病态嗓音基频和音域的变化[J]. 临床耳鼻咽喉科杂志, 2000, 14(6): 260-261.
[12] ZHAO G H, MIN H. Incremental learning algorithm of least squares support vector machines based on renyi entropy[C]// International Conference on Management Science and Engineering. Piscataway NJ: IEEE Press, 2009:95-100.
[13] XIE H B, CHEN W T, HE W X, et al. Complexity analysis of the biomedical signal using fuzzy entropy measurement[J]. Applied Soft Computing, 2011, 11(2):2871-2879.
[14] YE X, XIA X, ZHANG J, et al. Effects of trends and seasonalities on robustness of the Hurst parameter estimators[J]. IET Signal Processing, 2013, 6(9):849-856.
[15] HURST H E, BLACK R P, SIMAIKA Y M. Long-term storage: an experimental study[J]. Journal of the Royal Statistical Society, 1966, 129(4):591.
[16] JOHNSON R W. An introduction to the bootstrap[J]. Teaching Statistics, 2010,23(2):49-54.
[17] HENRIQUEZ P, ALONSO J B, FERRER M A, et al. Characterization of healthy and pathological voice through measures based on nonlinear dynamics[J]. IEEE Transactions on Audio Speech and Language Processing, 2009, 17(6):1186-1195.
[1] 邹艳丽, 汪洋, 刘树生, 姚飞. 带有邻居度信息的容量负载模型下电网级联故障研究[J]. 广西师范大学学报(自然科学版), 2019, 37(4): 27-36.
[2] 唐堂, 魏承赟, 罗晓曙, 丘森辉. 基于附加惯性项人群搜索算法的四旋翼无人机姿态控制研究[J]. 广西师范大学学报(自然科学版), 2018, 36(4): 12-19.
[3] 韦振汉, 宋树祥, 夏海英. 基于随机森林的锂离子电池荷电状态估算[J]. 广西师范大学学报(自然科学版), 2018, 36(4): 27-33.
[4] 钟海鑫, 丘森辉, 罗晓曙, 唐堂, 杨力, 赵帅. 基于附加惯性项BP神经网络的四旋翼无人机姿态控制研究[J]. 广西师范大学学报(自然科学版), 2017, 35(2): 24-31.
[5] 钟海鑫,罗晓曙,赵帅,杨力,唐堂. 基于改进精英蚁群系统算法的四旋翼无人机 姿态控制研究[J]. 广西师范大学学报(自然科学版), 2016, 34(4): 85-92.
[6] 陈锦, 罗晓曙. 一种新的基于小波变换的QPSK信号解调方法[J]. 广西师范大学学报(自然科学版), 2016, 34(2): 35-45.
[7] 周克良, 王亚光, 叶岑. 心音信号特征分析与识别方法研究[J]. 广西师范大学学报(自然科学版), 2015, 33(3): 34-44.
[8] 高俊芬, 胡维平. 基于非线性动力学和GMM的病态嗓音识别与研究[J]. 广西师范大学学报(自然科学版), 2011, 29(3): 5-8.
[9] 熊顺清, 周卫红. 一种基于非采样Contourlet变换的图像水印算法[J]. 广西师范大学学报(自然科学版), 2011, 29(2): 195-199.
[10] 李勇, 贾贞. 离散混沌系统在保密通信中的应用[J]. 广西师范大学学报(自然科学版), 2011, 29(1): 15-19.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!
版权所有 © 广西师范大学学报(自然科学版)编辑部
地址:广西桂林市三里店育才路15号 邮编:541004
电话:0773-5857325 E-mail: gxsdzkb@mailbox.gxnu.edu.cn
本系统由北京玛格泰克科技发展有限公司设计开发