1. 问题背景
现代信息技术及对地观测技术的快速发展,使得大数据在地球科学领域具备了坚实的数据基础;而大数据具有5V特征,即Volume(数据规模大)、Variety(数据类型多)、Velocity(数据增长速度和处理速度快)、Value(数据价值密度相对较低但潜在价值高)和Veracity(数据准确性和可信赖度高),这五大鲜明特征进一步使得大数据在地球科学领域作用愈加突出.除了传统的野外调查采样和岩土工程监测,地学大数据还包括其他新型数据来源,如卫星影像、无人机影像或视频、无线传感器网络(记录温度、压力、位移速度等信息)、激光雷达、数值模拟、全球卫星导航系统、众包和社交媒体信息等.地学大数据对于研究地球科学的前沿问题之一——地质灾害预警预报,具有重要价值.海量高价值的地学大数据和基于人工智能的数据挖掘可以增进人类对地质灾害分布规律,启动机制和演化过程的理解;地学大数据已经在地质灾害预警中发挥显著作用(如Dai et al.,2020;Guzzetti et al.,2020),但其在地质灾害预报中的作用仍有待发掘和验证.
2. 核心思想
地质灾害常表现为突发性和随机性,对灾害预报造成了极大的困难,但灾害发生前并非无征兆.地质灾害的发展演化是一个累积渐变过程,这一过程中可能出现宏观或微弱形变.对这种形变的连续、实时和动态的监测对于实现地质灾害预报至关重要.传统手段对人力要求高,且容易受天气等外界条件影响,而以卫星遥感为代表的地学大数据能够提供全天候的连续观测,融合物联网和云计算等技术,还能够实现全自动和(近)实时的地质灾害隐患体监测,及时识别形变的异常加速可作为短时预报或临近预报的前兆信号依据.
除了基于形变异常的预报方法,还可以从统计学模型和非线性系统理论方面预测地质灾害的发生.统计学模型预报法通过统计分析区域历史地质灾害事件和地质背景/环境特征,建立地质灾害发生概率和环境触发因素之间的统计模型,在这些因素满足地质灾害触发条件时发出预报.例如,对于降雨型滑坡,通过统计降雨量和滑坡发生率,可以根据预测降雨量来预报滑坡灾害.这种统计学方法需要收集大量地质灾害和环境数据,并对地质灾害的可能触发因子进行事前识别,而地学大数据为此方法的应用提供了有力数据与技术支撑.
非线性系统理论方法,主要思想是基于地质灾害体在多种内外因素耦合作用下的非线性演化特征进行地质灾害预报.将地质灾害体看作一个非线性系统,采用从过去的人工神经元网络到如今的机器学习/深度学习方法(Korup and Stolle,2014;Karpatne et al.,2019),通过对发生的地质灾害和其潜在影响因素(如地形地貌、降雨、土壤湿度、岩性、植被覆盖、构造运动和工程活动等)作为样本进行训练,可以自适应地对不同环境下的地质灾害发生情况进行预测预报.非线性系统理论方法需要使用大量精准的地质灾害和环境因子数据作为训练数据集,而这正是地学大数据的优势所在.
3. 科学价值
“我们能否更准确地预测灾害性事件”是《科学》杂志2021年发布的全世界125个前沿科学问题之一.在对灾害发生的时空分布和危害大小进行预测的过程中,体现了人类对自然规律的探索和掌握,因此地质灾害预报具有重大科学价值.同时,地质灾害比其他自然灾害(如海啸、飓风和地震)分布更为广泛,发生频率更高,与百姓生活更为息息相关,直接危及人居安全,破坏生态环境,制约着社会高质量发展,因此地质灾害预报具有重大社会和经济效益.地学大数据从获取、分发、分析到挖掘依赖现代信息技术和航空航天技术的进步,将其应用于地质灾害预报中是提升预报准确性的关键,也是从局限于单灾害体预报发展到大范围多尺度地质灾害预报的必要条件.带动了多学科深度合作,交叉融合发展.
4. 发展前景
地学大数据发展迅速,未来将有更多星载、机载和地基传感器数据用于地质灾害研究中,这要求对不同空间时间尺度、不同观测精度和不同来源的数据进行高效融合,也对数据挖掘算法和高性能计算提出了更高要求.基于地学大数据的发展和多学科(如数学、物理、地质学、地质资源与地质工程、测绘科学与技术、信息与通信工程和人工智能学)交叉技术的应用,地质灾害预报向系统化、定量化和精准化迈进.系统化的地质灾害预报需要构建广域地质灾害识别-地质灾害分布规律与诱因分析-地质灾害过程模拟(或地质灾害样本训练)-单体地质灾害实时监测-地质灾害预警预报的完整技术体系.这一体系的每一环节都需要地学大数据参与数据层构建,结合地形地貌和灾害体环境参数,可以保障定量化实现地质灾害的长期预报、短时预报和临近预报.海量数据的参与,也有利于数据之间的交叉验证,能够更全面地了解地质灾害发生规律,从而提升最终地质灾害预报的精准性.显然,地学大数据可以助力地质灾害预报,具有很好的发展应用前景,但其中的理论与技术瓶颈问题的攻关仍任重道远.