《1 引言》

1 引言

中国是森林火灾多发的国家,森林火灾每年都对资源和环境造成严重的损失。为了防治森林火灾,除了研究如何扑救外,预测火灾的发生、发展也是一个重要课题。由于森林火灾的发生和发展要受到气象条件、植被条件、地形条件和人类活动等的影响,通过对这些影响因素的分析就可以得到火灾信息,从而预测火灾的发生、发展情况,指导森林火灾的防治。

美国、加拿大、澳大利亚等国家已经发展了森林火险分级方法,通过对多种气象参数的分析确定火灾风险[1~3]。我国也制定了行业标准《全国森林火险天气等级》(LY/T 1172-1995)。森林火险分级方法是利用每天的温度、风速、降水量、湿度等参数预测火灾发生概率和蔓延速度,有时还要考虑地形、可燃物条件等。如何找到这些参数与森林火灾之间的相关性是其中的关键,对此已经展开了很多研究工作。

植物含水量是决定森林火险的重要参数。Cruz 等人研究了树冠高度、风速、可燃物含水量等与森林树冠火的发生情况之间的关系[4]。他们假定这些参数都是独立变量,利用逻辑斯蒂回归(logistic regression)进行了分析。结果表明,对树冠火发生情况的预测准确度达到 66 % ~ 90 % 。Castro 等测量了水犀科植物含水量与气象参数之间的关系,结果表明含水量与气象参数之间存在稳定的关联。利用多个地点的样本进行验证表明,相关系数达到 80 %,这为森林火险的预测提供了一个可靠的方法[5]。Viegas 等对植物的含水量进行了测量,得到了活可燃物含水量的季节变化和年度变化,并根据变化情况将可燃物进行了分类;将植物含水量与邻近气象站记录的气象参数进行比较,得到了植物含水量与干旱系数的关系[6] 。Flannigan 等利用加拿大的森林火险分级系统对未来的森林火灾变化情况进行了模拟,结果与古生态数据相符合,表明该系统可以预测未来的火灾情况[7] 。williams 等利用澳大利亚的森林火险指数研究了温室效应、厄尔尼诺-南方涛动现象对森林火灾的影响,表明日最小湿度是受影响最大的气象参数,从而影响了森林火险的变化[8,9]。人类对森林的采伐会改变局部的气候条件。Hoffmann 等对亚马逊和印度尼西亚森林的分析表明,森林面积的减小,提高了气温、风速,减少了降水和相对湿度,从而增大森林火灾风险[10]。他们还研究了森林火灾、气候和植被之间的相互作用,结果表明,高温天气增加了火灾频率,增大了树木损失;同样,对森林的破坏使温度、风速增大,降水量和相对湿度降低,进而增大了火灾频率[11]。Nepstad 等开展了类似工作[12]

影响森林火灾的因素很多,如:温度、湿度、风速、降雨量、树种和地形条件等,林火的发生往往是这些因素综合作用的结果。目前的研究表明,常规的林火预测方法大多对这些影响因素考虑不甚全面,加之这些影响因素之间存在复杂相互作用,使得林火概率成为一个复杂问题[13-18] 。人工神经网络长于处理非线性问题[19],近年来已在森林火灾的卫星图像处理方面得到应用,用来探测森林火灾,降低了误探测率[20,21];在建筑火灾探测[22,23]、气象预测[24]、室内热舒适度评价方面也取得了阶段性进展[25]。笔者分析了日本近年来的森林火灾和气象数据,利用 BP 神经网络处理多种气象参数与火灾发生概率之间的多元相关性,发展了用神经网络预测森林火灾概率的新方法。与实际数据的比较表明,该方法获得了满意的结果。与以往相比,分析的气象参数种类更多、更详细,并采用 BP 神经网络分析一元相关性和多元相关性。考虑到日本和中国地理位置接近,该项研究对中国的森林火灾发生概率预测有一定参考价值。

《2 方法与数据》

2 方法与数据

人工神经网络(简称为神经网络)的研究始于 20 世纪 40 年代。80 年代中期以后,神经网络的应用研究取得了很大成就。神经网络作为一种非线性动力学系统,具有并行处理、非线性映射、自适应学习等特点。经过发展的神经网络可以实现函数逼近、模式分类和数据聚类等功能。

BP(back propagation)网络是人工神经网络中使用最广泛的一种网络模型,其网络结构见图 1a 。它采用误差反向传播算法,有较强的自组织、自学习、联想和泛化能力[19]。Robert Hecht-Nielson 证明了理论上对于闭区间内任意一个连续函数,均可以用具有一个隐层的BP网络来逼近,因而可以完成任意的 N 维到 M 维的映射。这表明BP网络可以学习输入输出之间的关系而不需要知道其精确的数学表达式[19]

《图 1》

图 1 BP 网络模型结构和隐层输入输出特性

Fig.1 Structure and input-output characteristics of BP network

BP 网络通常具有一个或多个隐层。其中,隐层神经元常采用 Sigmoid 传递函数(如图 1b 所示),输出层采用线性传递函数。笔者采用了 2 种网络结构,分别具有一个隐层和两个隐层。

笔者收集到日本全国范围内 1999 年到 2000 年每天的气象站记录,考虑了对森林火灾影响较大的 5 种气象参数:日平均相对湿度(ahum),日平均降雨量(arain),日平均风速(awind),日平均温度(atem)和每天的日照时间(sun)。经过对气象参数和火灾数据的处理,可以得到火灾概率随着某种气象参数的变化关系,也可以得到每种气象参数组合所对应的火灾概率。后者如表 1 所示,表中将每种气象参数从小到大分为 5 个等级。

为了方便 BP 神经网络的设计和训练,先对数据进行预处理,即数据的标准化。其方法为

其中, 是标准化处理后的数据, 为原始数据,uSd 分别为数据均值和标准差。经过前面的量化和标准化,得到了无量纲的、取值在 ± 1 附近的数据序列。数据的反标准化可以通过上式的逆函数处理。

《表 1》

表 1 多种气象参数及其对应的火灾发生概率

Table 1 Weather parameters and corresponding fire probability

《3 结果与分析》

3 结果与分析

先考虑相对简单的情况即林火概率在一种气象参数作用下的变化规律。由于对少量的样本数据进行训练相对比较简单,可以通过简单的BP网络来实现林火概率预测问题。该神经网络有一个输入即一个气象参数和一个输出即对应的林火概率,其中气象参数值按大小分为 10 个等级,使用如表2所示的神经网络参数,网络的结构为 1 × 3 × 1。BP 网络中各层的权值和阈值采用随机初始化的方式赋值;采用的学习规则为传统的误差反向传播算法(BP算法)。给定对网络训练过程中的最小误差梯度为 1 × 10-6,如果训练过程中出现下列情况之一则停止训练:达到最大训练步数;训练误差小于目标误差;误差梯度小于给定的最小值。

《表 2》

表 2 网络训练参数设计

Table 2 Training parameters of BP network

在平均相对湿度(ahum)与林火概率关系的网络学习中,误差曲线如图 2 所示。可以看到,在训练到第 35 步时目标输出与训练结果间的均方差(MSE)已经达到了 6.41637 × 10-25 。其他气象参数作为神经网络的输入时,网络的表现与此相似。利用训练完毕的神经网络进行模拟,可得到气象参数和林火概率关系的拟合曲线(图 3)。

《图 2》

图 2 BP 网络训练的误差变化曲线

Fig.2 Change of MSE in the training of BP network

由图 3 可知,神经网络给出的输出结果较好地反映了气象参数对林火概率的影响。

《图 3》

图 3 采用神经网络计算的各气象参数与林火概率间的关系曲线

Fig.3 Relation between fire probability and each single weather parameter and the corresponding BP network calculation result

下面考虑多种气象因素综合作用对林火概率的影响。如果上述 5 种气象参数之间是相互独立的,则可以简单地利用概率加和公式(式 2)计算出 5 种气象参数综合作用下的火灾概率,即:

然而,这 5 种气象参数之间存在复杂的相互作用,并不是独立的。因此,需要利用多元相关方法进行分析,神经网络方法是其中之一。基于表 1 中的 5 种气象参数及对应的火灾发生概率,笔者设计的BP网络有 5 个输入、1 个输出。又考虑到问题的复杂性,虽然理论上含有一个隐层的神经网络可以实现这两组数据的映射关系,但为了更进一步降低误差,提高精度,又在不易出现过拟合的情况下,BP 网络设计了 2 个隐层。虽然网络的复杂性增加了,训练的时间也因此变长,但是,相对于精度的提高,这些花费是值得的。网络的参数设计见表 3。可以看到网络的结构为:5 ×20 × 12 × 1。

《表 3》

表 3 网络训练参数设计

Table 3 Training parameters of BP network

统计结果表明,1999 -2000 年,日本全国范围内有 466 种不同的气象参数组合,对应有 466 组林火概率。笔者随机抽取 440 组数据作为神经网络的训练集,把另外 26 组数据作为测试集以考察网络的泛化能力。训练过程的误差变化如图 4 所示。

《图 4》

图 4 BP网络训练 5000 步时的误差下降曲线

Fig.4 Change of MSE within 5 000 training epochs

训练进行到 5000 步时,均方误差已经达到了 4 × 10-7,可以认为网络的输出与目标输出近似相等。为了考察其泛化能力,将 26 组数据的测试集输入训练好的 BP 神经网络,得到的网络输出结果见表 4,从表 4 可看出使用 BP 网络拟合得到的概率与统计结果相差不大,最大相对误差为 9.9 %,其余都在 5.0 % 以下。这对于实际数据来说已经非常理想了,说明采用的 BP 网络对多种气象参数综合作用下林火概率的预测具有良好的泛化能力,可以用来对多种气象因素综合作用下的森林火灾发生概率进行预测。

《表 4》

表 4 测试集与对应的BP网络计算结果

Table 4 Test set and calculation results of BP network

《4 结论》

4 结论

BP 网络可以较好地量化气象参数对火灾发生概率的影响规律,并且具有较好的范化能力。无论是单个气象参数与火灾发生概率之间的关系,还是多种气象参数的综合作用与火灾发生概率之间的关系,都通过 BP 网络得到了满意的分析结果。利用 BP 网络进行森林火险预测具有可行性和可靠性。气象参数与森林火灾概率之间的关系虽然是非线性的,但存在明显的规律性;进一步考虑更多因素如地理条件、树种、人口密度等对森林火灾的作用,可望发展出系统的森林火险预测方法。