摘 要
随着云计算和物联网的发展,大数据已经成为当今社会必不可少的技术。气象服务的发展,以及气象数据量的快速增长,促使大数据技术在气象服务中发挥着举足轻重的作用,大数据的应用将为气象科学的不断发展提供新的思路和方法。
本文对基础的天气数据信息,进行采集和分析显得尤为必要。我们的气象数据分析系统是以Hadoop的Mapreduce为基础的,前端采用swing编写,后台使用Hadoop集群,数据库使用MySQL,天气数据信息采集与分析,以天气网(www.tianqi.com)为数据源,通过网页爬虫技术,分析网页结构,获取天气数据信息,并存储。然后,通过天气等级划分标准,将文本描述的天气信息量化成天气等级信息。最后,在地图上可视化显示,通过对比分析很容易发现异常点和天气数据信息呈现的规律性信息。
关键词:天气数据;气象数据;大数据分析;Hadoop;可视化
Abstract
With the development of cloud computing and the Internet of Things, big data has become an essential technology in today's society.The development of meteorological services, as well as the rapid growth of meteorological data volume, promotes big data technology to play an important role in meteorological services. The application of big data will provide new ideas and methods for the continuous development of meteorological science.
It is particularly necessary to collect and analyze the basic weather data information.Our meteorological data analysis system is based on Hadoop Mapreduce, written in swing on the front end, Hadoop cluster in the background, database using MySQL, weather data information collection and analysis, weather network (www.tianqi.com) as the data source, through web crawler technology, analysis of web data structure, weather data information, and storage.Then, the weather information described in the text is converted into weather grade information through the weather classification criteria.Finally, visualized on the map, it is easy to find anomalies and weather data information through comparative analysis.
Key words: weather data; meteorological data; big data analysis; Hadoop; visualization
目 录
摘 要 I
Abstract II
1 绪论 1
1.1选题背景及意义 1
1.2研究现状及趋势 1
1.3天气数据信息采集与分析项目简介 2
1.4论文的组织结构 2
2项目架构与主要技术介绍 3
2.1项目架构 3
2.2主要技术介绍 4
2.2.1 数据采集 5
2.2.2 数据存储 6
2.2.3 数据处理 7
2.2.4 数据可视化分析 7
2.3 小结 9
3 需求分析 10
3.1 项目需求分析 10
3.2 功能需求分析 11
3.2.1 天气数据采集 11
3.2.2 天气数据可视化分析 11
3.3 非功能需求分析 13
3.3.1 界面设计原则 13
3.3.2 性能需求 13
3.3.3 配置需求 13
3.4 小结 15
4 概要设计 16
4.1 总体设计 16
4.2 数据采集与存储 16
4.3 可视化分析 17
4.4 小结 18
5 详细设计及实现 19
5.1 数据库设计 19
5.2 域划分表 20
5.2.1 区域划分的依据 20
5.2.2 区域划分表的组织形式 20
5.2.3 地理位置经纬度 20
5.3 天气数据爬虫 24
5.3.1 流程图 24
5.3.2 具体实现 25
5.4 数据量化处理 28
5.4.1 流程图 29
5.4.1具体实现 29
5.5 天气数据信息可视化与分析 30
5.5.1 登录与注册 30
5.5.2 数据列表查询 38
5.5.3 百度地图显示 47
5.6小结 60
6 测试与分析 61
6.1 测试设计 61
6.1.1 测试范围 61
6.1.2测试策略 61
6.2 测试结果与分析 62
6.2.1 数据爬虫测试 62
6.2.2 可视化功能测试 63
6.3 小结 74
7 总结与展望 75
7.1 总结 75
7.2 展望 75
参考文献 76
致 谢 78