电子信息科技风2021年5月DOI:10.19392//cnki.1671-7341.202114040
浅谈数据挖掘在QAR数据处理的应用研究
刘莉雯
中国民用航空飞行学院四川广汉618307
摘要:QAR数据记载着飞机运行中的上千种飞行参数数据,涵盖了飞机运行的各个方面。但QAR数据的数量大、种类多,目前对QAR数据的认识和应用还很有限。随着数据处理技术的不断发展,数据挖掘方法被应用到QAR数据处理中,取得了比较好的成果,为航空安全提供了有力支撑和保障。本文阐述了数据挖掘的基本原理,介绍了数据挖掘在飞机系统故障诊断、飞行品质评估、飞机健康评估等方面的应用,最后总结了数据挖掘所面临的问题和挑战。
关键词:QAR数据;数据挖掘;航空安全
中图分类号:V247文献标识码:A
1绪论
安全,是航空永恒的话题。近年来,随着航空安全保障技术的发展,民航安全运行平稳可控,飞行事故的发生率较低,但飞行事故征候却时有发生。
为了保障飞行安全,局方要求商业飞机安装快速存取记录器)Quick Acces s Recordee,简称QAR)。QAR可连续记录飞机长达数百小时的原始飞行数据,并且采集飞机的高度、速度、姿态、加速度等上千种飞行参数,涵盖了飞机运行的各个方面。如何将QAR数据充分利用起来用起来,深入发掘其中有价值的信息,为飞行安全评估、飞行事故调查提供数据支持,为飞机维护工作提供决策依据,是目前航空安全领域研究的热点。数据挖掘是从海量数据中出有价值信息的过程,并将这些有用信息归纳整理成结构模式,为使用者进行评价和决策的参考。随着信息科技的飞速发展,数据挖 掘技术已经广泛应用于工程设计和科学探索的各种领域,航空领域中QAR数据的数据处理就是它的一个典型应用。
2数据挖掘的原理
数据挖掘是从海量数据中出有价值信息的过程,并将这些有用信息归纳整理成结构模式,为使用者进行评价和决策的参考。
2.1数据挖掘的方法
(1)分类。通过在已经分好类的训练集上运用数据挖掘技术建立分类模型,将该模型用于数据分类。
(2)估值。与分类类似,但估值最终输出的是连续型的数值。
(3)预测。通过分类或估值的训练得到的模型,如果经检验准确率较高,则可将该模型用于对未知变量的预测。
(4)关联规则。其目的是发现哪些事情总是一起发生。
(5)聚类。自动寻分组规则,判断样本间的相似性,把相似的样本划分在一起。⑴
2.2数据挖掘流程
数据挖掘系统流程如图1所示。首先,必须要对目标有一个清晰明确的定义。然后,建立数据挖掘库。QAR所记录的飞行参数涉及多个部件和系统,数据的感知、传输、存储、译码的过程中,任一环节出现问题,都可能会造成数据失真。在建立数据库时,需要对数据进行预处理:尽量补全缺失数据,通过滤波平滑噪声数据,删除孤立点等,将原始数据转化为挖掘算法所接受的操作数据类型。同时,由于QAR数据 属于多传感器参数流数据,有特征维度高、数据量大等特性,从几千个飞行参数中到对输出结果影响最大的参数,排除冗余,对数据进行降维就很有必要。接下来就可以采用合理的挖掘算法,先用一部分数据建立模型,再对这个模型进行测试验证⑵。模型建立好之后,评价得到的结果,解释模型的价值,最后将挖掘算法结果转化为知识。
鱷定义
图1数据挖掘系统流程图
3数据挖掘在QAR数据处理的应用现状
3.1特征提取
由于QAR数据来自于不同系统的多个传感器,具有维度多、时间长、数量大等特性,从海量数据中寻到有效数据是应用QAR数据的首要问题。
主成分分析法(Principal Component Analysis,PCA)基于 最大方差理论,用少数几个综合指标提取了原多个指标主要成分的方差信息,去除原始飞参数据的冗余,降低数据维度,有效地出数据中主成分,能够有效实现飞行数据的特征提取⑶。但PCA忽略了方差较小方向的数据信息,也就是信息提取不完整;其次,它不能获取不同样本之间差异特征,而且对非线性数据特征提取的效果不是很理想。
为解决以上问题,奇异值分解、深度置信网络⑷、卷积神经网络与长短时记忆网络⑸等有监督的学习方法也被用于QAR数据的特征提取,提高了特征提取的效率。
科技风2021年5月电子信息
3.2在飞行品质监控中的应用
QAR数据最初的应用就是飞行品质监控,保障飞行的安全。其在飞行品质监控中的应用于超限分析和安全风险预测。
(1)超限分析:指对在飞行中QAR所记录的参数超出监控标准的不安全事件进行分析⑹。目前航空公司普遍采用的基于QAR的超限分析方法为:筛选出超限事件所对应的航班信息,随后由专业人员对照航班信息判读筛选。国内一些航空公司,建立了以QAR数据解译码系统为基础的云平台,根据飞行超限事件中部分指标的重要性不同赋予不同的权重,对飞行员驾驶等级进行量化评定。或者结合飞行管理系统的航后管理功能,对超限事件涉及的机组人员进行复训,以保证飞行员的操作符合标准,保障飞行安全。这样做固然可以得到超限事件的统计结果,但人力成本巨大。为此,学术界尝试基于数据挖掘用更智能的
方式,如:黄金分割法等,对超限事件进行判定,并基于离差最大化原理或聚类理论对飞行参数赋予不同的指标权重,来构建飞行安全评估模型⑺一⑻。
超限分析大多是飞行超限事件出现后以风险事故调查的形式展开。这就忽略了没有超限但有风险倾向的飞行操作行为。
(2)风险行为识别:在现代运输航空中,大部分时间飞机都是在按照预先设定好的程序自动飞行,飞行员主要起监督作用。区别在于,当外界环境变化时,优秀的飞行员总是能及时根据外界环境变量的变化,通过飞行操作,实现对飞行器的平稳控制。为此,航空公司作开展了较多有风险倾向的操作行为识别与飞行品质评估工作。基于海量QAR数据建立飞行风险分析平台,用飞行风险系数来评价飞行员的驾驶行为级别。除了各大航空公司以外,学术界对于风险行为识别的讨论主要集中在起飞和着陆飞行操作较密集的阶段,通过随机森林⑼、贝叶斯网络、专家经验数据库等方法对特定动作所表征的风险进行讨论数据。
3.3在故障诊断中的应用
故障诊断是查设备或系统的故障的过程。对于飞机而言,故障诊断的难点在于从参数中提取反映系统运行状态的特征向量,对系统运行状态和异常情况作出判断,建立系统故障模型,通过特征向量与标准值比较,诊断故障类型,推
QAR数据的故障诊断流程如图2所示,首先需要建立数据库信息,数据库信息包括飞机QAR数据和时间、机场条件等其他相关因素。然后根据具体需要分析的对象,运用知识库中间的四类知识来进行故障模式识别,最终对事件进行评估%叫
飞机是一个复杂系统,飞机上某元件、子系统发生故障会影响其他部件或子系统也出现异常,呈现出极其复杂的故障乱象。在故障诊断过程中,面对海量故障信息,最关键的是构建故障诊断知识库。常采用数据挖掘中关联规则或聚类的方法,通过主成分分析、模糊理论、深度置信网络等方法提取故障特征,再利用极限学习机、支持向量机、卷积神经网络算法等构建故障诊断模型。
3.4在飞机故障预测与健康管理中的应用
故障预测与健康管理PHM(PAgnostics Health Manage­ment)要求通过数据监控与分析预测故障的发生。为了达到这个目标,首先必须对海量数据进行分析。QAR完整记录了飞机飞行过程中上千个参数,对这些参数进行深入分析,通过关联规则挖掘出数据属性的潜在联系,建立故障预测模型,判断飞机相应部件的故障发生时间,为预防性维护提供决策支撑。故障预测与健康管理的难点在于健康模型怎么评价,预测的模型如何创建。现在主流的方法是依据以往数据进行分析,这类办法实现简单但精确度不高。另外,还有很多新方法应用到了PHM当中,也取得了比较好的效果,例如贝叶斯理论、时间序列分析法等%11]#
4结语
自飞机加装QAR了几十年以来,国内的航空公司累积了海量的QAR数据,提高QAR数据利用率对于保障飞行安全有非常重要的意义。近年来数据挖掘技术飞速发展为深入分析、发掘QAR数据信息提供了新的思路。本文汇总了目前数据挖掘技术在QAR数据处理中的应用。通过将数据分类、估值、聚类、发掘数据隐藏的关联,为进行飞机系统故障诊断、飞行品质评估、飞机健康评估等提供支持。然而现有的研究多侧重于理论、方法层面,对飞行参数数据的挖掘利用还不够,同时缺乏面向工程实际的体系化研究与应用。
参考文献:
%1]张曾莲•基于非营利性、数据挖掘和科学管理的高校财务分析、评价与管理研究:首都经济贸易大学出版社,2014. 05:70.
:2:杨良斌•信息分析方法与实践%M].东北师范大学出版社,2017.01:213.
%3]冯兴杰,冯小荣,王艳华.基于核函数的PCA在QAR数据分析中的应用%J].计算机工程与应用,2009,45(14):207-209.
%4]戴婧睿,吴奇,仁和,等•基于深度置信网络的QAR飞行数据特征提取分析%J]•电光与控制,2017,2
4(11):78-82.
%5&张鹏,杨涛,等•基于CNN-LSTM的QAR数据特征提取与预测%J].计算机应用研究,2019,36(10):2958-2961.
(下转第125页)
科技风2021年5月
定相应的管理办法。
a.应具有2年以上承担技术项目研究的经历,并且是主 要的研究者之一;
b.具有一定的现场实践经验,并仍保持着与现场的不断交往和联系;/具有一定的企业管理经验和组织能力、业务沟通能力;d.具有良好的语言表达能力、电脑操作能力和文字组织能力。
2.6.3研发人员工时投入管理
2019年度集团公司和海油发展级技术专家绩效考核表
项目名称项目等级
A
项目角
B
计分方式备注
项目1国家级省部级(10分)项目经理(1.0)
(Ai*Bi 上限不超过30分(针对2019年在研项目,须提供相关证明材料,如立项论证报告等。)
项目2集团公司级(8分)项目副经理(0.7)
项目3海油发展级(6分)专业骨干(0.5)
所属单位级(3分)参与人员(0.3)
2.6.4项目人员的考核
一旦项目实施结束,应对项目经理进行包括技术、经费、采办、外委/外协、管理等全方位的考核,考核结果应有备案,考核不及格,将在一定年限内实行禁用制。
(1)项目管理不得力,导致项目预算严重超支,且无法完成研究任务,2年内禁止担任同级别及以上级别的项目经理职务;
(2)对外合作(含外协、外委)岀现严重失误,导致研究工作受影响而停止,预期成果难于实现,2年内禁止担任同级 别及以上级别的项目经理职务;
(3)项目运行过程管理不力,未按科技管理的有关规定召集会议、提交各类报表等,1年内禁止担任项目经理职务;
(4)无客观原因,项目虽完成研究,但未能通过验收,1年内禁止担任项目经理职务;
广汉飞行学院招生(5)科技项目管理考核不合格,1年内禁止担任项目经理职务。
3总结
石油企业加强科技研发投入,提高自身研发能力是解决制约公司发展卡脖子技术的重要途径。如何实现科技项目管理的科学化和规范化,确保项目顺利实施,达到经费投入的预期目标,是目前科研管理面临的问题,本文就1.1项目要有完备的技术调研、市场调研;1.2项目策划要周全;1.3项目审查要严格三个方向阐述了项目立题要准备充分,又基于项目实施管理精细化的论点,通过2.1编制科研项目实施方案;2.2制订周密的工作计划;2.3及时归纳和整理阶段成果;2.4加强项目监控管理;2.5项目变更要慎重等方面进行了论述,最后提出了关于科研项目技术人员管理的思考。本文就石油企业的科项目精细化管理一些思考,从项目调研、结构策划、预算编制、审核和实施过程等方面的精细化管理描述,达到提高科研项目管理水平的目的。
参考文献:
[1]林华.专业技术人员能力建设读本.北京:中国人事出版社,2012.
[2]彼得•德鲁克.创新与企业家精神.机械工业出版社,2007.01.
作者简介:邹若华(1978—(,女,汉族,天津人,本科,2002年毕业于辽宁石油化工大学化学工程与工艺专业,工程技术公司,科创与数字化部,科研项目主管。
(上接第93页)
[6]杨绎煊.基于QAR数据的航班运行安全风险研究
[D],天津:中国民航大学,2016.
[7]孙瑞山,杨绎煊,汪磊.QAR数据在飞行安全评价中的应用[J].中国安全科学学报,2015,25(07):87-92.
[8]宋志勇.航空公司基于飞行参数数据库的飞行品质管理[J].民航管理,2016,2016(11):89-92.
[9]李俊辰.基于机器学习的起飞、进近阶段飞行成绩评估%D].天津:中国民航大学,2020.
[10]卿立勇,黄圣国,林钰森.基于QAR数据的飞机系统故障预测与故障诊断支持系统研究[J].江苏航空,2
006.2
(10):11-12.
[11]房冠成,贾大鹏,刘毅飞,等.基于飞行参数数据挖掘的军机健康评估技术[J].航空学报,2020,41(6):523458.
中国民用航空飞行学院青年基金项目:多参数融合的飞行品质评估方法研究(编号:Q2018-87)资助
作者简介:刘莉雯,女,四川绵阳人,硕士,讲师,研究方向为导航技术、航空安全。