![地球科学中的大数据分析与挖掘算法手册](https://wfqqreader-1252317822.image.myqcloud.com/cover/574/33783574/b_33783574.jpg)
上QQ阅读APP看书,第一时间看更新
1.1.7 地球科学应用案例
以一个简单的林火风险预测为例,从一幅遥感影像中可以提取到植被的覆盖度类型,从空间数据库中查取过去一年中该地区的降水量,由数字高程模型(Digital Elevation Model,DEM)提取该地区的坡度图,应用关联规则算法得出发生山火的概率[10]。
首先,对已经得到的属性数据进行离散化处理,各属性的取值范围为植被覆盖度V[0,100]、坡度S[0,90]、降水量R[0,100]、山火发生概率F[1,10]。四维属性值的分割见表1-3~表1-6。
表1-3 植被覆盖度属性分割
![](https://epubservercos.yuewen.com/344980/18061422308241106/epubprivate/OEBPS/Images/3.jpg?sign=1739672436-wse7PETw9SweJA5ZadHTF6o2itZC7mbC-0-1ad269499067056c8e41319866227ca0)
表1-4 坡度属性分割
![](https://epubservercos.yuewen.com/344980/18061422308241106/epubprivate/OEBPS/Images/4.jpg?sign=1739672436-mxaETK4nNC1n4tPyBRDtTmE69YEwWAv1-0-8b2b8d9e022d5a7bbc2a49e618c01d1f)
表1-5 降水量属性分割
![](https://epubservercos.yuewen.com/344980/18061422308241106/epubprivate/OEBPS/Images/5.jpg?sign=1739672436-lh2upA5MZj7IsHClyUI9UeoHPDWd4ULr-0-2a69d511d0280e452fd3f2ecb5993e24)
表1-6 山火发生概率属性分割
![](https://epubservercos.yuewen.com/344980/18061422308241106/epubprivate/OEBPS/Images/6.jpg?sign=1739672436-zuSiGxkhKet4mPZdysxHP63r3HGCTaOU-0-7993c45b1df04725439cad6a1dad406d)
为了将关联规则用于遥感图像数据这类量化数据,首先应该将量化数据离散化,即需将图像数据转化为事务数据库的形式,事务数据库一般由事务的标识符和事务项集组成,在遥感图像中,每一个像素都代表一个事务,表1-7为图像数据转化为事务数据库形式的示例。
表1-7 事务数据库形式
![47855-00-041-1.jpg](https://epubservercos.yuewen.com/344980/18061422308241106/epubprivate/OEBPS/Images/47855-00-041-1.jpg?sign=1739672436-h64khp5pnYvkXDTMOz3bhpgxptAKNWW4-0-9f20f866878132fad2eebda2ea4a537d)
假设最小支持度为50%,最小置信度为60%。经过属性分割的所有块将成为候选项集,分别计算它们在60 000次交易中出现的次数。表1-8为计算后的四维关联规则。
表1-8 四维关联规则
![47855-00-042-1.jpg](https://epubservercos.yuewen.com/344980/18061422308241106/epubprivate/OEBPS/Images/47855-00-042-1.jpg?sign=1739672436-F3aWCk1fFgqZMATaBd5v0pYhzQGiewXQ-0-ffa045b7ea62d01512b0efde01f3cd45)
从上述的例子来看,坡度高、降水量多容易发生山火;坡度低、降雨量低、植被覆盖率低的地区,发生山火的概率不是很大;对于植被覆盖率比较大、坡度大于35°、上一年平均降水量小于64 cm的地区,在空气干燥季节尤其要引起注意。