|
广西师范大学学报(自然科学版) ›› 2018, Vol. 36 ›› Issue (4): 34-41.doi: 10.16088/j.issn.1001-6600.2018.04.005
许远静, 胡维平
XU Yuanjing, HU Weiping*
摘要: 为了更好地对不同程度病态嗓音进行识别,本文采用了一种基于随机森林的识别方法。分别对正常、中度、重度病态嗓音进行识别,并与高斯混合模型的识别结果进行了对比。实验结果表明:相比高斯混合模型,随机森林具有更高的分类精度、鲁棒性及更好的识别效果,其中正常、中度、重度嗓音的最高识别率分别达到了98.04%、86.84%、83.33%。本文内容为进一步研究病态嗓音细分类提供了一定的参考。
中图分类号:
[1] 卢永辉. 语音识别技术的关键问题研究[D]. 西安:陕西师范大学, 2014. [2] 于萍, 孙彩. 嗓音疾病的分类[J]. 听力学及言语疾病杂志, 2018,26(1):110-114. [3] 杨式麟. 嗓音的声学检测[J]. 听力学及言语疾病杂志, 2002, 10(2):127-128. [4] FANG S H, TSAO Y, HSIAO M J, et al. Detection of pathological voice using cepstrum vectors: a deep learning approach[J]. Journal of Voice, 2018. DOI:10.1016/j.jvoice.2018.02.003. [5] 刘珊珊. 基于SVM的病理嗓音障碍严重等级的评估和分类[J]. 仪表技术, 2015(6):41-43,47. [6] 袁悦, 顾玲玲, 常静雅,等. 经验模态分解法识别声带息肉和声带囊肿的研究[J]. 信息化研究, 2015,41(2):27-32. [7] 陶智, 曾晓亮, 顾玲玲,等. 病理嗓音发声系统的非对称建模研究[J]. 数据采集与处理, 2016, 31(2):260-267. [8] MUHAMMAD G, ALSULAIMAN M, ALI Z, et al. Voice pathology detection using interlaced derivative pattern on glottal source excitation[J]. Biomedical Signal Processing and Control, 2017, 31:156-164. [9] MURSALIN M, ZHANG Y, CHEN Y, et al. Automated epileptic seizure detection using improved correlation-based feature selection with random forest classifier[J]. Neurocomputing, 2017, 241(C):204-214. [10] 高俊芬, 胡维平. 基于非线性动力学和GMM的病态嗓音识别与研究[J]. 广西师范大学学报(自然科学版), 2011, 29(3):5-8. [11] 张志明, 杨式鳞. 病态嗓音基频和音域的变化[J]. 临床耳鼻咽喉科杂志, 2000, 14(6): 260-261. [12] ZHAO G H, MIN H. Incremental learning algorithm of least squares support vector machines based on renyi entropy[C]// International Conference on Management Science and Engineering. Piscataway NJ: IEEE Press, 2009:95-100. [13] XIE H B, CHEN W T, HE W X, et al. Complexity analysis of the biomedical signal using fuzzy entropy measurement[J]. Applied Soft Computing, 2011, 11(2):2871-2879. [14] YE X, XIA X, ZHANG J, et al. Effects of trends and seasonalities on robustness of the Hurst parameter estimators[J]. IET Signal Processing, 2013, 6(9):849-856. [15] HURST H E, BLACK R P, SIMAIKA Y M. Long-term storage: an experimental study[J]. Journal of the Royal Statistical Society, 1966, 129(4):591. [16] JOHNSON R W. An introduction to the bootstrap[J]. Teaching Statistics, 2010,23(2):49-54. [17] HENRIQUEZ P, ALONSO J B, FERRER M A, et al. Characterization of healthy and pathological voice through measures based on nonlinear dynamics[J]. IEEE Transactions on Audio Speech and Language Processing, 2009, 17(6):1186-1195. |
[1] | 邹艳丽, 汪洋, 刘树生, 姚飞. 带有邻居度信息的容量负载模型下电网级联故障研究[J]. 广西师范大学学报(自然科学版), 2019, 37(4): 27-36. |
[2] | 唐堂, 魏承赟, 罗晓曙, 丘森辉. 基于附加惯性项人群搜索算法的四旋翼无人机姿态控制研究[J]. 广西师范大学学报(自然科学版), 2018, 36(4): 12-19. |
[3] | 韦振汉, 宋树祥, 夏海英. 基于随机森林的锂离子电池荷电状态估算[J]. 广西师范大学学报(自然科学版), 2018, 36(4): 27-33. |
[4] | 钟海鑫, 丘森辉, 罗晓曙, 唐堂, 杨力, 赵帅. 基于附加惯性项BP神经网络的四旋翼无人机姿态控制研究[J]. 广西师范大学学报(自然科学版), 2017, 35(2): 24-31. |
[5] | 钟海鑫,罗晓曙,赵帅,杨力,唐堂. 基于改进精英蚁群系统算法的四旋翼无人机 姿态控制研究[J]. 广西师范大学学报(自然科学版), 2016, 34(4): 85-92. |
[6] | 陈锦, 罗晓曙. 一种新的基于小波变换的QPSK信号解调方法[J]. 广西师范大学学报(自然科学版), 2016, 34(2): 35-45. |
[7] | 周克良, 王亚光, 叶岑. 心音信号特征分析与识别方法研究[J]. 广西师范大学学报(自然科学版), 2015, 33(3): 34-44. |
[8] | 高俊芬, 胡维平. 基于非线性动力学和GMM的病态嗓音识别与研究[J]. 广西师范大学学报(自然科学版), 2011, 29(3): 5-8. |
[9] | 熊顺清, 周卫红. 一种基于非采样Contourlet变换的图像水印算法[J]. 广西师范大学学报(自然科学版), 2011, 29(2): 195-199. |
[10] | 李勇, 贾贞. 离散混沌系统在保密通信中的应用[J]. 广西师范大学学报(自然科学版), 2011, 29(1): 15-19. |
|
版权所有 © 广西师范大学学报(自然科学版)编辑部 地址:广西桂林市三里店育才路15号 邮编:541004 电话:0773-5857325 E-mail: gxsdzkb@mailbox.gxnu.edu.cn 本系统由北京玛格泰克科技发展有限公司设计开发 |