您当前的位置:鸿祥娱乐 > 航空防务 >
文本大数据分析在航空安全管理中的应用
来源:     日期:2018-11-22 08:05    字体:【】【】【

  原标题:文本大数据分析在航空安全管理中的应用[ 一、研究背景 近几年,许多重要行业行业,如金

  近几年,许多重要行业行业,如金融投资、工业生产等领域大数据研究分析均被越来越广泛地应用,人们利用各式各样的统计分析方法使海量的数据变“活”,从这些数据身上,人们客观、精确、超前地挖掘出行业内不被人注意的信息和规律,产生不可限量的价值。

  而文本分析正是近些年悄然崛起的一种数据研究的方式,其特殊性首先在于研究对象本身--文本,没有一定的机构化模式,也没有像数字式或因子式数据呈现一定的客观规律。而这种非模式化的数据中,往往不可避免地会反映人和事物的立场、观点、价值和利益。

  笔者在本文中,分析从网页上获取的从2000年1月到2017年12月FAA不安全事件报告系统中的文字记录,从而窥探这些没有“常形”、没有规律的文字中蕴含着怎样的影响航空安全的信息。

  笔者搜集了FAA航空安全报告系统中公布的B737-800(为了研究方便,笔者选取统一机型研究)从2000年1月至2017年12月的850条不安全事件报告信息,信息中包含着大量参数,笔者为了方便研究,根据行业经验筛取其中不安全事件发生的时刻、月份、气象条件、导致事件的主要因素,以及叙述性文字报告。所有的报告中笔者选取了下降、进近和着陆阶段的样本进行分析。

  由图可知,在19年中,不同月份里不安全事件分布较为均匀,从数据样本分布看来,似乎航空安全不分季节月份,保证生产安全的警惕性始终不可松懈。

  图2中笔者整理出不安全事件发生时的飞行气象条件,统计显示绝大多数的飞行条件是目视气象条件,其次为仪表飞行条件,同时统计中还有相当一部分是未知的,也就是在飞行报告中并没有记录。

  很多飞行员会下意识认为,夜晚的飞行比白天的飞行更难更危险,但是基于样本分析来看,恐怕白天的飞行同样值得飞行员小心再小心。

  上图中,笔者统计并总结了不安全事件报告中的主要构成因素,其中人为因素(Human Factors)、飞机系统(Aircraft)以及机组迷惑(Ambiguous)是占比最多的因素,分别占比:47.4%,19.6%,13%。笔者将从探究这些对应的不安全事件报告文本中,将那些杂乱的、毫无规律的文字,转化为有价值的信息,窥探那些因素在飞机处于下降剖面时对飞行安全产生影响,我们应该做出哪些预防行为。

  2. 数据清洗:将英文文本大写转小写,去除不必要的数字、去除虚词(英文中的虚词主要包括:be动词、人称代词、a、the等等),去除不必要的标点符号,填充空白部分等。

  4.由于不安全事件主因——人为因素、飞机系统以及机组迷惑占样本中的绝大多数,笔者将这些因素对应的文本数据逐一分画出词云。

  “What”的内涵可以是人或物,比如“aircraft”或者“CAPT(机长)”,或者“PAX”(旅客),“attendant”(乘务员)。这些词汇表示一个事件描述的主体,那么这次词汇的就进动词或者其他形容状态的词,就很可能刻画当前的状态和决策。

  “When”的内涵是飞行阶段,文本中相关的词汇可以有“APPROACH”(进近),“LANDING”(着陆),而“ILS”(盲降)“LOC”(航向道)则可以刻画出飞机处于最后进近阶段或是中间进近航段、四转弯阶段等等。

  而“Where”则可以包括“FLAP”(襟翼)、“gear”(起落架)“cabin”(客舱)等词汇,这可以表明某些不安全事件主要发生在什么地方,飞机的哪个部位。

  7.找出与关键词中,相关性较强的词汇,成为“相关关键词”笔者在实验中设计的方法如下:

  -在步骤6中找出一个关键词,在全文档中搜寻包含该关键词的句子并整理成新的矩阵。在每一个文本矩阵中使用TF-IDF加权(去权值0.5),搜索出真正意义上的高频词。

  -同样利用步骤6之后建立的矩阵,通过矩阵中的词汇间计算相关系数,取系数值0.5的词汇。

  通过以上方法,笔者整理人为因素、飞机系统以及机组迷惑刻画高频词词云分别如下:

  其中满足 “What”-“When”-“Where”模型的高频词筛选如下:

  从以上内容我们可以看出进近和着陆阶段出现系统故障的概率较大,在进近阶段,操纵系统、导航信号,以及飞机操纵系统对于安全影响较大,尤其是对处于截获盲降信号时的飞机更加重要。

  从词频分析中不难看出,飞行员在截获航向道、下滑道的过程中,既要监控自动驾驶,又要保持前后飞机的间隔,这段时间飞行员往往工作负荷骤增,而如果一旦出现飞机系统故障,很容易造成手忙脚乱,处理故障滞后,进而导致飞行状态难以把控。

  而着陆期间,往往速度控制、刹车系统工作状况,是影响安全的关键点。对于带有系统故障的飞机,飞机员一旦决定执行落地,那么飞机的刹车性能、着陆构型、所需跑道长度、接地速度以及外界气象条件(尤其是侧风影响)都是在短时间内需要飞行员考虑的。

  针对总体样本中的系统故障,从近20年的时间跨度中,B737-800飞机的起落架(gear)襟翼(flap)和配平(trim)故障记录最多。在飞行员报告的文本分析中,笔者可以看出,大部分飞行员都是本着Aviation-Navigation-Communication的顺序对故障进行处理。

  其中,襟翼故障最多,但是问题相对比较集中,多数不安全事件由于后缘襟翼引起,并且B737-800飞机大多数此类故障都是根据驾驶舱内的指示器所发现,这也从侧面证明,驾驶舱襟翼指示器的可靠性还是很高的。

  在起落架故障中,收起落架产生的故障在记录中要多于放起落架时发生的故障数量。而遭遇起落架故障,飞机的性能通过“drag”一次可以侧面体现出来。据笔者经验,一旦发现此类故障,首先飞行员应该保持飞行状态,而往往起飞、复飞(甚至发动机失效复飞)等,起落架在伸出状态时对于飞机的性能产生的影响会很大,尤其是阻力的大幅增加,导致增速困难以及越障爬升性能降低。因此,飞行员在进近期间,考虑复飞或者起飞时,不仅要完成正常动作,更应在条件允许的情况下查阅相关的性能手册,搞清楚在极端条件下,飞机的飞行性能,这样才能更加从容地面对突发情况。

  通过对配平(trim)故障的文本分析,笔者看出B737-800飞机水平安定面部位的故障明显较多,其中电动(electric)马达失效,动作器(actuator)卡阻的故障发生频次多,影响大,在这种情况下,飞行员往往使用人工配平,操作时将分离器(clutch)断开。

  从文本词频可以看出,人为因素导致不安全事件发生最多的是进近阶段,其中处于最后进近阶段的飞机发生的次数最多(final、ils、loc),其次分别是下降和着陆阶段。

  在关键词中,对非自然环境描述增多,尤其是其他飞机(traffic、aircraft)的描述增多,笔者回顾文本,在重新审视文本描述的过程中,

  发现处于下降剖面的飞机,外界交通状况引发的不安全状况很多。其中终端管制指挥(twr)也是一个很重要的因素,笔者在大量的报告中看到,

  有些样本中管制机组迷惑,导致相对飞机产生TCAS避让(turn、clb、visual),甚至有时一架正在着陆的航空器下方不足一千英尺就有一个对头爬升的飞机。

  从文本中词频分析来看,不安全事件导致飞行员不得不短时间做出落地-复飞决策,而相当多的飞行员最终不得不复飞(goaround)。

  综合以上分析看出,人为因素导致的不安全事件数量占总体样本比例最多,而该类不安全事件集中出现在截获最后进近航段之后,因此笔者认为在这个阶段,刨除机组操纵原因以外,机组资源管理和落实标准程序以及加强内外兼顾的情景意识是保证安全的重点。

  通过词云,笔者提取出以机组迷惑为主要原因的不安全事件文本报告中,词频超过80的词汇:

  从文本数据来看,机组迷惑为主因的不安全事件中机组所面对的外界干扰因素比较复杂,其中与CAPT相关系数大于0.5的高频词中,不乏对飞机上各个系统(electrical、doors、vhf)以及各个部位传来的声、光、电(cracks、debris、decompression、smoke、sound),在笔者复盘文本描述中,其中甚至有机组报告在落地减速期间,某乘客的ipad掉落并从驾驶舱门的缝隙中滑入驾驶舱,机组起初以为机械故障,险些造成机组复飞的案例。

  从文本中也不难看出,进近中造成机组迷惑的不安全事件分布最多,其中管制员指令不专业(terminology、terms),指令不清晰(vague)造成高度、航向产生偏差,重者造成交通避让事件,轻者则需要机组不断重复。在文本案例中就有管制员指挥机组下降某高度后多次更改指令,最后造成与爬升飞机冲突,进而迫使进近飞机复飞的案例。

  从案例和文本数据分析中,笔者看到大多数的不安全事件中因为技术原因导致的样本数很少,多数在于进近和着陆期间外界因素干扰导致机组注意力分配不到位、机组分工不科学。在飞机下降过程中个,进近和着陆期间的程序相对紧凑,发生不安全事件的可能性相对而言更高,这里不仅有飞机内部的干扰,更有外部因素的影响。通过文本分析,笔者看到管制-飞行员通讯不明确不标准、运行环境中其他飞机的距离方位监视缺乏情景意识、导航信号与设备的监控缺位是导致不安全事件的主要因素。

  笔者认为,美国的空中交通现状就是中国民航未来的写照,随着航班量量增多,航线运行越来越密集,飞行机组对于保证安全发挥着不可撼动的重要作用。而尽管飞行技术是重中之重,但是合理的机组资源管理是影响生产正常的直接因素。

  实际飞行中,飞行员的经验和能力有长有短,而随着民航飞行不如现代化、程序化,也早已不是“逞能”或者“单打一”的时代,飞行机组应该能做到相互取长补短才能发挥机组最佳实力,这才是保证安全的最有效最直接手段。

  笔者在实际飞行中不止一次亲眼见到或者听说过,某个机组成员的一句“复飞”挽救了一次不稳定进近;某飞行员的一个建议是某机组避免了钻进雷暴的风险……当然也有某国飞行机组全部都把注意力集中在维修某显示组件上而没有监控飞机状态,鸿祥娱乐注册最终导致飞机撞山。

  因此,在飞行中机组应当合理调配机组各个成员,让大家各司其职相互适当提醒,机组中职责最高者也应该充分判别和听取合理建议,当机组每一个成员的能力都被调动起来的时候,机组更有可能将不安全因子扼杀在萌芽之中。

  通过文本数据分析,笔者看出很少有不安全事件是因为飞行员操纵技术不过关产生的,而在国内运行中,笔者经常听到的是飞行员之间讨论落地正常不正常,因此很多飞行员也在飞行中把一定的精力放在防止重着陆上。但是通过国外同行的文本分析,可以明确的是,导致不安全事件的诸多因素中,操纵能力只是很小的一部分,而发生在着陆阶段意外,包括下降、进近以及落地后滑行的不安全事件数量远远超过着陆阶段的数量。

  显著的不安全因子还有很多:外部飞机、设备和通讯干扰、气象条件(尤其是侧风、颠簸甚至风切变)、导航设备调谐(尤其是截获五边时飞机状态把控)、地形及安全高度(终端区MSA)的影响、飞行程序设计和落实、机组决策能力(“起飞想终端,落地想复飞”)等等。

  要想避免不必要的麻烦,就要保持高度的情景意识。不论发生什么,飞行员首先要把控飞机状态(Aviation),判断自己和其他飞机的相对方位(Navigation),在搞清状况的前提下建立与外界的沟通(Communication)。

  在实际飞行中,落实标准程序,认真执行简令以及优秀的机组资源管理均有助于提高情景意识。同时也希望国内借助国外同行的教训,提醒更多的飞行员在飞行中,除了关注QAR探测和重着陆的严防外,应该把更多精力放在对上述不安全因子的监管上。

分享到:
联系我们
电话:
传真:
地址:
邮编:
信访邮箱:
监事会邮箱: