本文是一篇计算机论文,本文主要完成了以下工作: 一是,在参考众多国内外相关研究后,对比分析了卷积神经网络(CNN)、长短期记忆(LSTM)模型和极限梯度提升(XGBoost)模型在台风强度预测中的应用,发现传统的CNN 台风强度预测模型存在预测精度不高,识别率低,特征提取复杂等问题。因此在极限梯度提升(XGBoost)台风预测模型的基础上对模型进行了优化,即把 LSTM 模型获得的训练结果作为预测因子之一重新添加到新的数据集,并将该数据集用于训练 XGBoost模型。
第一章 绪论
1.1. 研究背景及意义
1.1.1. 研究背景
台风,是一种强大且复杂的天气系统,会在一定程度上危害人们的生命、财产安全和地区的经济发展。但如果能为决策部门提供更为精准、高效的台风预报信息,则能够在很大程度上减少台风及其引发的此生灾害对人们生产生活的影响。早期对台风的预测主要是通过结合热力学和动力学知识以及分析沿海地区复杂的地形和海岸线特征,建立数据分析模型,进行预测[1]。但这一预测方式主观性较大,且对预报员的专业技术能力要求较高,这并不利于防灾减灾决策工作的现代化发展。
随着数据信息化的发展,为了满足日益庞大的数据信息处理需求,机器学习逐渐发展出了深度学习这一分支。但与机器学习不同的是,深度学习更类似人类大脑的运作方式,能够实现更强的学习能力和更广泛的特征提取。
随着近年来互联网时代数据的爆发式的增长以及计算机硬件能力的不断提高,在文本生成、图像识别、自动驾驶等领域深度学习得到了比较成功的应用,并逐渐融入了人们的日常生活。尤其在图像识别领域,过去图像识别应用最为广泛的方法是模式匹配和支持向量机等,而近来备受关注的深度学习则是凭借出色的自动特征提取方式在其中崭露头角。深度学习方法非常接近人类思维方式,它可以通过使用多层网络挖掘图像数据中的信息,通过大数据提取最具针对性的特征进行学习,这一方式较此前的机器学习方法具有更广泛的应用领域,越复杂的问题,预测精准度也更高。
随着科技的发展,数据也发生了爆发式的增长,1997 年、2004 年、2013 年我国陆续发射了多颗“风云”系列气象卫星,为气象研究提供了大量的观测数据集,为台风研究提供了可靠的数据支撑。随着深度学习在其他领域应用的成熟与深入,气象研究人员开始思考深度学习应用于气象领域,尤其台风预测的可能,借助人工智能将预测过程自动化不仅可以提升预测精度,使预测结果更客观,更可以减少人力成本,缩短应急反应时间,有利于决策部门及时采取应急措施,减少人们的生命财产损失。
............................
1.2. 国内外研究现状
1.2.1. 台风强度预测研究现状
尽管图象识别、计算机视觉和人工智能方法引入气象学的时间不长,但是目前其研究是十分活跃的。此前,应用时间最长、范围最广的台风强度分析方法是美国气象学家Vernon Dvorak 在 1984 年提出的 Dvorak 技术[3]。但 Dvorak 技术是一种依赖于人类识别能力的方法,是通过人工读取台风云型中隐藏的信息,然后将判断结果集中到中心气压这个数值上。在这样的步骤中,难免会出现个性化的偏差,而为了减少因个人主观产生的预测偏差,逐渐发展为通过模式识别算法替代人工分析,这样一来,无论谁跑程序都能得到同样的结果。但预测结果依旧受限于算法的能力,所以本质上还是免不了误差。而后出现的新一代红外成像器[3][4][5]和 CubeSat 传感器[6][7]用于台风即时播报和预测时则需要同时提取所有光谱多样化的图像。近年来,随着人工神经网络(Artificial Neural Network, ANN)特别是前馈神经网络(Feedforward Neural Network,FNN)的兴起,一些研究人员提出了基于 FNN 的台风预测方法。这类方法基于统计理论和大数据,预测人员不再需要详细了解台风形成的具体物理过程即可开展相关预测,这对台风预测具有积极意义。
通常,台风强度是通过台风中心附近的大气压强最小值和风速极大值来测量的,因此,台风强度预测实际上是压强和风速的判断。对于风速预测,2019 年鲁迪、王星华等人[8]试图通过使用人口粒子算法和多分位数鲁棒极限学习机预测短期风速;张烨[9]等人通过Cuckoo搜索算法优化的小波分解和小波神经网络的混合来减少预测误差;Khelil.K等[10]结合离散小波变换方法的 ANN 用于高效风速预测。在结果方面,所有混合方法都以很少的预测步骤(不超过五个步骤)和较短的时间改进了风速预测的预测结果。而且,这些研究的预测因素仅仅是风速。因此,对于台风强度的预测,仍需寻找一种预测步骤多、提前时间长的实用方法。
随着神经网络特别是深度神经网络(DNN)的发展,一些研究者尝试基于 DNN 来研究台风问题,如卷积神经网络(CNN)和长短期记忆(LSTM)。魏昱洲、许西宁[11]应用 LSTM 对未来 10 min 的风速进行预测,预测准确率达到 98%以上。殷豪等[12]设计了一个基于模糊信息粒化和长短期记忆网络 LSTM 优化算法的风速预测模型, 模型中融入了支持向量机(SVM)和使用反向传播算法,用于对 1 小时后的风速进行预测。Gholamreza Memarzadeh和 Farshid Keynia[13]提出了一种基于 LSTM 的小波变换、属性选择和乌鸦搜索算法相结合的风速预测模型,与其他未使用这些算法的 LSTM 模型相比,该模型对未来 1 小时的风速表现出最好的性能。廖学超等人[14]利用注意机制、小波分解等方法提出了一种基于LSTM 的风速预测模型,与此前的支持向量回归模型相比更稳定,并且每隔 1 小时便会在接下来的 5 小时内出现累积误差。这些研究旨在预测短期风速,并表明基于 LSTM 的预测模型更适合于风速预测问题,但它们都仅将风速数据用于实验,而不是在台风强度预测领域。此外,基于 LSTM 的台风强度预测研究仅适用于未来 24h 的台风强度预测,这表明台风强度预测还存在较大的提升空间。
.............................
第二章 相关理论
2.1. 台风相关背景知识
2.1.1. 台风简介
台风是一种复杂且具有较强危害性的热带天气系统,多产生于夏秋季节的热带或副热带洋面上。成熟的台风会随着风速的不断增强,中心气压逐渐降低,在中心形成清晰的台风眼和云墙。
台风登陆,通常会引发一系列极具危害性的暴雨、洪涝、风暴潮等次生灾害,使人们的生命和财产遭受损失。其中受到台风影响最为普遍,亚洲沿海地区受台风影响造成的民众受伤甚至死亡、经济财产遭受损失的情况尤为严重。中国是受台风影响最严重的国家之一,根据中国气象局(CMA)记录的数据,每年大约有近 30 个热带气旋在我国近海形成,其中至少会有 20%在人口最多的沿海地区登陆,台风登陆地区会遭遇台风引发的暴雨、洪涝、大风等次生灾害,极大地影响了人们的正常生产生活。因此,准确、及时地预测台风具有重要的现实意义。
2.1.2. 台风等级的划分
据中国气象局发布的《关于实施<热带气旋等级>国家标准(GB/T 19201-2006)的通知》(气发〔2006〕154 号),热带气旋等级划分如表 2-1 所示:
计算机论文怎么写
计算机论文怎么写.
.....................
2.2. 相关理论介绍
2.2.1. 卷积神经网络(CNN)
深度学习卷积神经网络(CNN)是一种可以实现对数据快速响应的深度学习算法。它由卷积层和采样层组成,交替形成网络拓扑。CNN 使用反向传播神经元的方法来实现每个神经元信息的更新网络。
由于 CNN 的卷积层和采样层的交替设置,网络学习能力会在较大程度上受到输入特征的影响。CNN 采用的是直接将输入的台风图片与原始台风图片进行对比的方式,如果所传输 CNN 图像数据的分辨率较低,那么 CNN 对台风强度的预测精度也会随之下降。在构建的卫星云图数据集里,由于台风形成初期云层螺旋半径并不明显,且观测云图易受到气流、水汽等因素影响,因此 CNN 在台风云图像的特征提取上并不理想。
2.2.2. 长短期记忆(LSTM)模型
LSTM 是一种递归神经网络(RNN)网络。LSTM 的提出解决了反向传播神经网络训练时出现的过拟合问题。在 LSTM 中,隐藏层的每个神经元都是一个存储单元,其中包含一个自连接的循环边。该边缘的权重为 1,这使得渐变可以跨步传递而不会爆炸或消失。
LSTM 由五个基本单元组成:存储模块,存储单元,输入门,输出门和遗忘门。这些门与块中的所有单元共享。存储单元具有经常性的自连接线性单元,称为恒定误差圆盘传送带(Constant Error Carousel ,CEC)。错误和激活信号由 CEC 再循环,使其充当短期存储单元。对输入、输出和遗忘门进行训练,以决定哪些信息应存储在存储器中,在什么时间段以及何时读取信息。新输入到单元格中的流由输入单元格控制。输出单元决定了用于 LSTM 单元和遗忘门输出激活单元中值的时间扩展、记忆单元值的记忆期和遗忘时间。LSTM 按时间步长更新所有单位 T=0,1,2,... n,并计算所有权重的误差信号。单元的操作称为前向通过,而误差信号计算称为后向通过。
..........................
第三章 数据处理及特征选择 ................................. 20
3.1. 数据预处理 ............................................ 20
3.1.1 数据来源 .................................. 20
3.1.2 数据预处理 ............................. 20
第四章 台风强度预测模型优化 ............................. 24
4.1.平台配置 .................................. 24
4.2.模型说明及优化 ........................ 24
第五章 模型对比 ............................. 33
5.1.评估方式 ................................... 33
5.2.优化前后对比 ..................... 33
5.3.不同模型预测对比 ............................ 34
第五章 模型对比
5.1. 评估方式
为了评估在训练和验证期间与给定提前期相对应的每个 XGBoost 模型的性能,我们使用了平均绝对误差(MAE)和均方根误差(RMSE)。
将 2009 年至 2015 年的台风强度信息用作原模型(M1)和优化模型(M2)的训练数据,并对 2016 年至 2019 年的台风强度进行了预测和验证。结果数据对比详见表 5-1,可以看到,与原模型相比,优化后的模型的预测准确度更高,误差值更小。
计算机论文参考
计算机论文参考
.........................
第六章 总结与展望
6.1 本文主要工作
本文尝试将深度学习和机器学习理论应用于气象领域中的台风强度预测。将深度学习应用于台风强度预测的优势在于对台风眼、螺旋雨带、风切变等先验知识的要求不高,仅需提供足够数量的云图样本及相关特征标签,即可进行自主学习。
本文主要完成了以下工作:
一是,在参考众多国内外相关研究后,对比分析了卷积神经网络(CNN)、长短期记忆(LSTM)模型和极限梯度提升(XGBoost)模型在台风强度预测中的应用,发现传统的CNN 台风强度预测模型存在预测精度不高,识别率低,特征提取复杂等问题。因此在极限梯度提升(XGBoost)台风预测模型的基础上对模型进行了优化,即把 LSTM 模型获得的训练结果作为预测因子之一重新添加到新的数据集,并将该数据集用于训练 XGBoost模型。
二是,利用风云 2 号(FY-2)卫星数据对优化后的模型进行了验证调试,设计了原极限梯度提升模型(XGBoost)和优化后模型的对比实验,实验证明,优化后的模型的平均绝对误差(MAE)在 6、12、18 和 24 小时预测中较原模型分别降低了 0.47%,1.79%,1.91%和 5.04%。
三是,将优化后的模型与卷积神经网络(CNN)、长短期记忆(LSTM)模型进行了比较。得出每个模型的性能似乎都取决于预测提前时间,但优化后的 XGBoost 模型预测的平均绝对误差(MAE)更低,LSTM 模型在长期预测和高强度台风预测方面,有时可以提供比XGBoost 模型误差更小的预测。 四是,将优化后的模型与卷积神经网络(CNN)、长短期记忆(LSTM)模型对 2020 年4 个典型台风案例进行了预测验证,证明了优化后的模型较 CNN 模型和 LSTM 模型的预测更为精准和稳定,具有可行性和实用性。