毕业设计开题报告
四川省部分地区经济发展水平的统计分析
一、题目来源
本题目来源于指导老师科研。
二、研究目的和意义
在社会、经济、人口的研究中,存在着大量分类研究、构造分类模式的问题。如在经济研究中,为了研究不同地区城镇居民生活中的收入与消费状况,往往需划分为不同的类型去研究。中国改革开放后到现在,经济发展取得了巨大的进步,但全国的经济发展水平不平衡,存在明显的地区差异,因此为了解决发展差异导致的种种问题,对不同地区的经济水平进行划分分类就显得十分重要。同理,在省或者市不同的地区的经济发展水平也存在明显差异。聚类分析在此问题上可以很好的解决划分问题,我们可以根据聚类的结果结合相应的经济学理论,对不同地区给予不同的经济政策,从而减小地区差异,实现经济全面发展。
本文采用聚类分析法,聚类分析将个体或者对象分类,使得同一类中的对象之间的相似性比其他类的对象的相识性更强。其目的在于使类内对象的同质性最大化和类与类间对象的相似性更强。聚类分析不仅可以用来对样品进行分类,也可以用来对变量进行分类。对样品的分类常称为Q型聚类分析,对变量的分类常称为R型聚类分析。
四、国内外现状和发展趋势与研究的主攻方向
在过去的几年中聚类分析发展方向有两个:加强现有的聚类算法和发明新的聚类算法。现在已经有一些加强的算法用来处理大型数据库和高维度数据,例如小波变换使用多分辨率算法,网格从粗糙到密集从而提高聚类簇的质量。然而,对于数据量大、维度高并且包含许多噪声的集合,要找到一个“全能”的聚类算法是非常困难的。某些算法只能解决其中的两个问题,同时能很好解决三个问题的算法还没有,现在最大的困难是高维度(同时包含大量噪声)数据的处理。算法的可伸缩性是一个重要的指标,通过采用各种技术,一些算法具有很好的伸缩性。这些技术包括:数据采样、信息浓缩、网格和索引。CLARANS是最早使用数据采样的算法,CURE使用优选的采样点,信息浓缩技术在BIRCH方法和DECLIJE方法中得到应用。许多算法都使用了索引技术,典型的有:BIRCH方法、DBSCAN方法、小波变换方法、DENCLUE方法、DENCLUE方法、小波变换方法、STING方法和CLIQUE方法使用了网格技术。还有一些新的技术如:STING+方法引入动态数据挖掘触发器:mAFIA方法引入间距尺寸自适应网格分割算法;OptiGrid算法使用迭代和网格等技术处理高维度数据。新技术的引进大大加强了聚类算法的效能,尤其提升了处理高维度数据的能力。目前国内外聚类分析方法主要应用在经济与金融方面,而且与现阶段热门的数据挖掘结合在一起用。
聚类分析作为多元统计中的一个重要的基本概念,在各个领域都受到学者的亲睐。在文献[6]中,江平通过研究高职大学生的心理健康水平,研究了K-均值聚类法在聚类分析中的可行性与有效性;在文献[7]中,李漫漫探讨了利用最短聚类法对广西各地区的经济水平进行了分类,较为系统地反映广西各地市的经济发展程度,指出各地市在广西经济发展中的地位,并提出相应的建议;在文献[1]中,何晓群等讨论了聚类分析的数学理论和计算步骤与上机实现,并列举在经济,人口,社会等方面的应用;在文献[8]中,周东斌,沈良忠探讨了将数据挖掘与聚类分析方法的结合,探讨聚类分析方法在房地产发展中的应用;在文献[13]中,于国庆探讨了聚类分析在证卷投资中的应用,重点解析了K-均值聚类法在的应用;在文献[14]中,李晓萌,韩慧婧探讨了聚类分析在物流发展水平的应用,讨论了系统聚类法在Q型聚类分析中的应用;在文献[15]中,丁 柳,刘艳华利用聚类分析及判别分析法探究我国各地区经济发展水平,重点在于聚类分析与判别分析的联合运用决解实际问题。在以上工作的基础上,本文主要针对聚类分析的原理以及在地区经济发展水平评价上的应用,并重点考察利用K-均值聚类法在地区经济发展水平评价上的应用。
五、主要研究内容、需重点研究的关键问题及解决思路
四川省部分地区经济发展水平的统计分析主要包括:
(1)研究背景与意义
(2)聚类分析的数学原理
(3)聚类分析的一般方法
① 系统聚类法
② 模糊聚类分析
③ 有序样品聚类
(4)K-均值聚类法及应用
① K-均值聚类法的原理;
② K-均值聚类法的适用范围
③ K-均值聚类法的计算机实现
(5)K-均值聚类法在地区经济发展评价中的应用
(6)小结
关键问题:K-均值聚类法如何应用在地区经济发展评价中,如何有效正确的解读K-均值聚类法得出的类别?
解决思路:首先了解如何正确的选择合适的变量或者样品,再根据SPSS软件正确的生成聚类图,根据分类标准,进行合适的分类,然后在根据相应的经济学原理解释分类的结果,以及做相适应的预测或者分析。
六、完成毕业设计所必须具备的工作条件
1、参考工具 在长江大学图书馆工具书阅览室查阅
2、参考期刊 在长江大学图书馆期刊阅览室查阅
3、电子期刊 在长江大学网上图书馆中国知网提供
4、论文编辑 排版所需的计算机及其软件由长江大学图书馆和机房提供
七、工作的主要阶段、进度与时间安排
第一阶段 (前期工作):与指导教师见面,确定论文题目,接收任务书:2018.11.13~
2018.11.29
查阅收集文献资料并撰写开题报告:2018.11.30~2018.12.25
完成开题报告:2018.12.26~2018.12.29
第二阶段(中期工作):开题答辩:2018.12.30
完成论文提纲(三级提纲)并撰写论文:2019.01.1~2019.04.24
完成论文初稿:2019.04.25~2019.05.14
根据指导教师意见修改初稿:2019.05.15~2019.05.19
第三阶段(后期工作):论文定稿:2019.05.20~2019.05.22
论文答辩:2019.05.26
完成论文(设计)装订、资料归档:2019.05.27~2019.06.08
三、阅读的主要参考文献及资料名称
[1] 何晓群编.应用多元统计分析[M].北京:中国统计出版社,2010
[2] 李卫东编著.应用多元统计分析[M].北京市:北京大学出版社,2008
[3] 梁飞豹编.应用统计分析方法[M].北京:北京大学出版社,2010
[4] 王周伟,朱敏编著.SPSS统计分析与综合应用[M].上海市:上海交通大学出版社,2012
[5] 汪冬华编著.多元统计分析与SPSS应用[M].上海市:华东理工大学出版社, 2010
[6] 江平.高职大学生心理健康水平的聚类分析[J].现代职业教育 ,2018 (7) :118-119
[7] 李漫漫.广西各地市经济发展程度的聚类分析[J].现代经济信息 , 2018 (8):478-479
[8] 周东斌,沈良忠.基于聚类分析的杭州房价研究[J].电脑知识与技术:学术交流 , 2018 , 13 (22) :10-11
[9] 陈奕娟,张昊.基于因子分析和聚类分析的海南省各市县经济发展水平综合评价[N].德州学院学报,2018 (8), 33(4)
[10] 方帅.基于因子分析和聚类分析研究城镇家庭消费支出[J].现代经济信息,2018(3) :13-14
[11] 缪炯.基于主成分分析和聚类分析的江苏省各城市经济发展水平评价[J].经济研究导刊,2018(3),17-20
[12] 韩圆圆,王肖肖,王丽楠.聚类分析在房地产价格分析中的应用[J].广东经济,2018, (10)
[13] 于国庆.聚类分析在证券投资中的应用[J].合作经济与科技,2018,48-49
[14] 李晓萌,韩慧婧.山西省物流发展水平的聚类分析[J].时代金融(中旬),2018, (1)
[15] 丁 柳,刘艳华.我国各地区经济发展水平的实证分析——基于聚类分析及判别分析法的应用[N].赤峰学院学报,2018(8), 33 (8) :143-145