广西师范大学学报(自然科学版) ›› 2026, Vol. 44 ›› Issue (2): 190-198.doi: 10.16088/j.issn.1001-6600.2025060402

• 数学与统计学 • 上一篇    下一篇

匹配分位数回归的改进方法及应用

贾起超, 黄磊*   

  1. 西南交通大学 数学学院,四川 成都 611756
  • 收稿日期:2025-06-04 修回日期:2025-08-11 发布日期:2026-02-03
  • 通讯作者: 黄磊(1987—),男,四川成都人,西南交通大学副教授,博士。E-mail: stahl@swjtu.edu.cn
  • 基金资助:
    国家自然科学基金面上项目(12571312);四川省科技厅中央引导地方科技发展资金(2024ZYD0019);中央高校基本科研业务费专项资金(2682024ZTPY024)

Improved Methods of Matching Quantile Regression and Their Applications

JIA Qichao, HUANG Lei*   

  1. School of Mathematics, Southwest Jiaotong University, Chengdu Sichuan 611756, China
  • Received:2025-06-04 Revised:2025-08-11 Published:2026-02-03

摘要: 针对传统匹配分位数估计(MQE)在多维数据应用中存在的初始值敏感性与异常值干扰问题,本文提出融合全局优化策略与稳健损失函数的改进框架。通过集成主成分分析、普通最小二乘估计、最小绝对离差估计及随机初始化构建多样化初始值集合,结合多起点搜索机制与遗传算法进行全局寻优,有效降低参数估计陷入局部最优的风险;同时将平方损失函数重构为绝对损失函数以增强模型稳健性。蒙特卡洛模拟结果表明:改进后的全局优化方法将参数估计成功收敛率从传统方法的5%显著提升至82%;在含20%异常值的污染数据中,绝对损失函数的参数估计平均绝对误差较平方损失降低14%。传感器信号实证研究表明,改进方法GLOBAL-MQE(L1)和GLOBAL-MQE(L2)在Wasserstein距离指标上,较基准方法MQE分别降低55%和45%。所提出的全局优化策略与稳健损失机制显著提升模型参数估计的全局收敛性和抗干扰能力,改进后的分位数预测序列能有效保持与真实信号一致的统计特性,为工程数据分布匹配提供更可靠的建模工具。

关键词: 匹配分位数估计, 信号匹配, 全局收敛算法, 稳健估计

Abstract: To address the initial value sensitivity and outlier interference issues in the application of traditional quantile matching estimation to multi-dimensional data, an improved framework integrating global optimization strategies and robust loss functions is proposed. By integrating principal component analysis, ordinary least squares estimation, least absolute deviation estimation, and random initialization to construct a diverse set of initial values, combined with a multi-start search mechanism and genetic algorithm for global optimization, the risk of parameter estimation getting trapped in local optima is effectively reduced. Meanwhile, the square loss function is reconstructed into an absolute loss function to enhance model robustness. Monte Carlo simulation results show that the success rate of parameter estimation of the improved global optimization method is significantly increased from 5% of the traditional method to 82%; in contaminated data with 20% outliers, the average absolute error of parameter estimation using the absolute loss function is reduced by 14% compared with the square loss function. Empirical studies on sensor signals show that the improved methods GLOBAL-MQE(L1) and GLOBAL-MQE(L2) reduce the Wasserstein distance index by 55% and 45% respectively compared with the benchmark method MQE. The proposed global optimization strategy and robust loss mechanism significantly enhance the global convergence and anti-interference ability of model parameter estimation. The improved quantile prediction sequence can effectively maintain the statistical characteristics consistent with the real signal, providing a more reliable modeling tool for engineering data distribution matching.

Key words: matching quantile estimation, signal matching, global convergence algorithm, robust estimation

中图分类号:  O21

[1] 邢砾文, 姚文凯, 黄莹.基于深度学习的含未知复合故障多传感器信号故障诊断[J].重庆大学学报(自然科学版), 2020, 43(9):93-100.DOI:10.11835/j.issn.1000-582X.2020.09.010.
[2] 王骁贤, 陆思良, 何清波, 等.变转速工况下基于多传感器信号深度特征融合的电机故障诊断研究[J].仪器仪表学报, 2022, 43(3):59-67.DOI:10.19650/j.cnki.cjsi.J2108410.
[3] 郝大鹏, 巴寅亮, 李春兰.基于层次分析法模拟传感器信号的故障诊断[J].自动化技术与应用, 2019, 38(3):84-87, 108.DOI:10.3969/j.issn.1003-7241.2019.03.018.
[4] 王双, 韩冰冰, 李峰.面向多源传感器信号融合的滚动轴承多层自助最大熵法故障诊断[J].中国工程机械学报, 2023, 21(1):90-94.DOI:10.15999/j.cnki.311926.2023.01.011.
[5] 刘一飞, 张宁, 赵鹤达, 等.基于相似性度量的磁异信号匹配检测算法[J].电子测量与仪器学报, 2022, 36(9):103-110.DOI:10.13382/j.jemi.B2205238.
[6] 吕志良, 冯丽.基于频谱相似度的信号匹配方法研究[J].中国无线电, 2024(1):52-53.
[7] 徐阳, 罗明璋, 杜国锋.管道缺陷超声导波监测信号匹配追踪去噪[J].科学技术与工程, 2022, 22(13):5182-5189.DOI:10.3969/j.issn.1671-1815.2022.13.011.
[8] 刘水清.基于图像匹配与WiFi信号匹配的室内PDR定位方法[J].电子测量技术, 2023, 46(1):154-159.DOI:10.19651/j.cnki.emt.2210142.
[9] SGOUROPOULOS N, YAO Q W, YASTREMIZ C.Matching a distribution by matching quantiles estimation[J].Journal of the American Statistical Association, 2015, 110(510):742-759.DOI:10.1080/01621459.2014.929522.
[10] QIN S S, WU Y H.General matching quantiles M-estimation[J].Computational Statistics & Data Analysis, 2020, 147:106941.DOI:10.1016/j.csda.2020.106941.
[11] LIM H, KIM A K H.Matching a discrete distribution by Poisson matching quantiles estimation[J].Journal of Applied Statistics, 2024, 51(15):3102-3124.DOI:10.1080/02664763.2024.2337082.
[12] WU P, LIANG B S, XIA Y F, et al.Predicting disease risks by matching quantiles estimation for censored data[J].Mathematical Biosciences and Engineering, 2020, 17(5):4544-4562.DOI:10.3934/mbe.2020251.
[13] 吉洋莹, 潘雨辰, 黄磊.含顺序类别自变量的中位数惩罚回归及应用研究[J].重庆理工大学学报(自然科学), 2022, 36(11):257-265.DOI:10.3969/j.issn.1674-8425(z).2022.11.031.
[14] 蔡学峰, 李天俊, 黄磊.基于非参检验及多元回归分析的不同医保医疗费用自付比例研究:以成都市某医院Ⅱ型糖尿病患者为例[J].广西师范大学学报(自然科学版), 2024, 42(4):115-123.DOI:10.16088/j.issn.1001-6600.2023092003.
[15] 王景炜, 胡超竹, 李翰芳, 等.复合分位回归的贝叶斯经验似然推断[J].广西师范大学学报(自然科学版), 2024, 42(5):130-140.DOI:10.16088/j.issn.1001-6600.2023110304.
[16] 李灿, 杨建波, 李荣.部分线性变系数模型的贝叶斯复合分位数回归[J].广西师范大学学报(自然科学版), 2024, 42(5):117-129.DOI:10.16088/j.issn.1001-6600.2023102501.
[17] 李学文, 冯可馨, 王小刚.删失分位数回归模型中的多变点估计[J].山东大学学报(理学版), 2025, 60(2):96-104.DOI:10.6040/j.issn.1671-9352.0.2024.021.
[18] 周小英, 吉晨, 涂晓艺.基于线性化技术的变点分位数回归模型的估计与应用[J].山东大学学报(理学版), 2025, 60(3):69-76.DOI:10.6040/j.issn.1671-9352.0.2024.084.
[19] SRIVASTAV R K, SCHARDONG A, SIMONOVIC S P.Equidistance quantile matching method for updating IDF Curves under climate change[J].Water Resources Management, 2014, 28(9):2539-2562.DOI:10.1007/s11269-014-0626-y.
[20] LI H B, SHEFFIELD J, WOOD E F.Bias correction of monthly precipitation and temperature fields from Intergovernmental Panel on Climate Change AR4 models using equidistant quantile matching[J].Journal of Geophysical Research:Atmospheres, 2010, 115(D10):2009JD012882.DOI:10.1029/2009JD012882.
[21] DOMINICY Y, VEREDAS D.The method of simulated quantiles[J].Journal of Econometrics, 2013, 172(2):235-247.DOI:10.1016/j.jeconom.2012.08.010.
[22] JIANG L, LIU X B, PHILLIPS P C B, et al.Bootstrap inference for quantile treatment effects in randomized experiments with matched pairs[J].Review of Economics and Statistics, 2024, 106(2):542-556.DOI:10.1162/rest_a_01089.
[23] YANG S, ZHANG Y S.Multiply robust matching estimators of average and quantile treatment effects[J].Scandinavian Journal of Statistics, 2023, 50(1):235-265.DOI:10.1111/sjos.12585.
[1] 荣晶晶, 冶继民. 一种基于错误发现率的模型选择规则[J]. 广西师范大学学报(自然科学版), 2026, 44(1): 110-118.
[2] 汪韫頔, 戴家佳, 毛围. 偏态纵向数据和生存数据的贝叶斯联合建模[J]. 广西师范大学学报(自然科学版), 2025, 43(5): 175-184.
[3] 赵雨洁, 冶继民. 相依竞争风险下部分加速寿命试验的统计分析[J]. 广西师范大学学报(自然科学版), 2025, 43(4): 129-139.
[4] 田亮, 戴家佳, 李先琪. 广义病例队列设计下多类型复发事件的加性转移模型[J]. 广西师范大学学报(自然科学版), 2025, 43(3): 113-127.
[5] 杨晓兰, 张辉国, 胡锡健. 空间自相关性异质特征的局部极大似然估计及在手足口病防护中的应用[J]. 广西师范大学学报(自然科学版), 2025, 43(2): 179-192.
[6] 于雪松, 徐宝. 加权p、q对称损失函数下Burr分布参数的Bayes估计[J]. 广西师范大学学报(自然科学版), 2024, 42(6): 186-193.
[7] 李灿, 杨建波, 李荣. 部分线性变系数模型的贝叶斯复合分位数回归[J]. 广西师范大学学报(自然科学版), 2024, 42(5): 117-129.
[8] 王景炜, 胡超竹, 李翰芳, 罗幼喜. 复合分位回归的贝叶斯经验似然推断[J]. 广西师范大学学报(自然科学版), 2024, 42(5): 130-140.
[9] 唐洁, 秦永松. 含空间自相关误差的空间自回归模型的调整经验似然推断[J]. 广西师范大学学报(自然科学版), 2024, 42(4): 100-114.
[10] 蔡学峰, 李天俊, 黄磊. 基于非参检验及多元回归分析的不同医保医疗费用自付比例研究——以成都市某医院Ⅱ型糖尿病患者为例[J]. 广西师范大学学报(自然科学版), 2024, 42(4): 115-123.
[11] 朱艳, 蔡静, 龙芳. 逐步Ⅰ型混合截尾下复合Rayleigh分布竞争失效产品部分步加寿命试验的统计分析[J]. 广西师范大学学报(自然科学版), 2024, 42(3): 159-169.
[12] 蒙海珍, 张正家, 秦永松. 含MA误差的线性模型的经验似然推断[J]. 广西师范大学学报(自然科学版), 2023, 41(3): 144-154.
[13] 杜洁瑞, 崔霞, 李元. 基于Rubin因果模型的处理变量与协变量的交互效应估计[J]. 广西师范大学学报(自然科学版), 2023, 41(1): 122-130.
[14] 田世坤, 唐胜达. 衰减信道下具有严格时延的P2P实时通信传输策略[J]. 广西师范大学学报(自然科学版), 2022, 40(6): 122-130.
[15] 秦永松, 雷庆祝. 空间计量经济模型的经验似然研究进展[J]. 广西师范大学学报(自然科学版), 2022, 40(5): 138-149.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
[1] 田晟, 赵凯龙, 苗佳霖. 基于改进YOLO11n模型的自动驾驶道路交通检测算法研究[J]. 广西师范大学学报(自然科学版), 2026, 44(1): 1 -9 .
[2] 徐秀虹, 张进燕, 卢羽玲, 梁小平, 廖广凤, 卢汝梅. 萝藦科药用植物中新C21甾体的研究进展(Ⅱ)[J]. 广西师范大学学报(自然科学版), 2026, 44(2): 1 -16 .
[3] 王星宇, 郑浩楠, 刘肖, 崔世龙, 蔡进军. 壳聚糖基吸附材料的制备及其吸附去除水中污染物的研究进展[J]. 广西师范大学学报(自然科学版), 2026, 44(2): 17 -30 .
[4] 田晟, 冯帅涛, 李嘉. 一种基于复合框架的城市道路场景车辆轨迹提取方法[J]. 广西师范大学学报(自然科学版), 2026, 44(2): 31 -51 .
[5] 吕辉, 司可. 基于改进RT-DETR的光伏板缺陷检测[J]. 广西师范大学学报(自然科学版), 2026, 44(2): 52 -64 .
[6] 宋冠武, 李建军. 基于自蒸馏边缘细化的遥感图像语义分割[J]. 广西师范大学学报(自然科学版), 2026, 44(2): 65 -76 .
[7] 王旭阳, 梁宇航. 多尺度非对称注意力遥感去雾Transformer[J]. 广西师范大学学报(自然科学版), 2026, 44(2): 77 -89 .
[8] 张胜伟, 曹洁. 融合傅里叶卷积与差异感知的钢材表面微小缺陷检测算法[J]. 广西师范大学学报(自然科学版), 2026, 44(2): 90 -102 .
[9] 王巍, 李智威, 张赵阳, 张洪, 周蠡, 王振, 黄放, 王灿. 基于IFA-BP神经网络模型的变电站碳排放预测[J]. 广西师范大学学报(自然科学版), 2026, 44(2): 103 -114 .
[10] 罗缘, 朱文忠, 王文, 吴宇浩. 基于改进PatchTST的多步水质预测模型[J]. 广西师范大学学报(自然科学版), 2026, 44(2): 115 -131 .
版权所有 © 广西师范大学学报(自然科学版)编辑部
地址:广西桂林市三里店育才路15号 邮编:541004
电话:0773-5857325 E-mail: gxsdzkb@mailbox.gxnu.edu.cn
本系统由北京玛格泰克科技发展有限公司设计开发