摘 要
随着信息时代的发展,信息量呈几何级数增长,人们发现从这些海量信息中获取有用的信息越来越困难,要找出信息背后隐藏的规律更是不可想象。数据挖掘就是从大量数据中获取有用信息的一门新技术,关联规则挖掘是数据挖掘方法中的一种。本文详细论述了基于Apriori算法的关联规则挖掘系统的设计开发过程。系统基于经典的Apriori算法,对事务数据库进行了位图矩阵转换,大大提高了搜索效率,并能分别挖掘频繁项集和关联规则。http://www.16sheji8.cn/
论文组织如下:首先介绍了数据挖掘的产生、定义和应用;接着阐述了关联规则挖掘的基本概念;然后对系统的需求进行了分析,并提出设计方案;紧接着是系统的具体实现;最后对系统进行了测试,将系统用于挖掘中药方剂库中的药对药组,验证了系统的正确性和实用性。
关键词:数据挖掘;关联规则;Apriori算法
The Design and Implementation of Association Rules Mining System based on Apriori Arithmetic
Abstract
With the development of the information era, the quantity of information increases in the way of geometric series, and people find that it is more and more difficult to obtain valuable informatin and it is incogitable to find out the rules hiding in the information. Data mining is a new technology to mine valuable informatin from abundant data, and association rules mining is a method of data mining. This paper elaborates on the process of the design and development of association rules mining system based on Apriori . The system is based upon classical Apriori arithmetic, and converts chinese medicine prescriptions database to a bitmap matrix, which greatly enhances the efficiency of search, and can mine frequent items and association rules respectively.http://www.16sheji8.cn/
The paper is organized as following: Firstly, introduces the generation, definition and application of data mining; Secondly, sets forth the conception of association rules mining; Thirdly, analyzes the demand of the system, and propses the design project and implements the system; Finally, gives a test to mine chinese medicine groups from a chinese medicine prescriptions data, which proves the system valid and applicable.
Key words: Data mining; Apriori; Chinese traditional medicine
目录
论文总页数:27页
1引言 1http://www.16sheji8.cn/
2数据挖掘概述 1
2.1数据挖掘的产生 1
2.2数据挖掘的定义 1
2.3 数据挖掘的应用 4
3关联规则挖掘 4
3.1基本概念 4
3.2购物篮分析 5
3.3Apriori经典算法 6
4需求分析和设计方案 8
4.1需求分析 8
4.2设计方案 8
5基于Apriori算法的关联规则挖掘系统 10
5.1数据挖掘在中药方剂研究中的应用 10
5.2基于Apriori算法的关联规则挖掘系统的实现 11
5.2.1连接数据库 11
5.2.2位图矩阵的建立 11
5.2.3频繁项集 13http://www.16sheji8.cn/
5.2.4关联规则 14
6系统测试 19
6.1系统的使用 19
6.2对显示数据的解释 22
6.3分析 23
结 论 24
参考文献 24http://www.16sheji8.cn/
致 谢 26
声 明 27
1引言
随着数据库技术的迅速发展以及数据库管理系统的广泛应用,人们积累的数据越来越多。激增的数据背后隐藏着许多重要的信息,人们希望能够对其进行更高层次的分析,以便更好地利用这些数据。目前的数据库系统可以高效地实现数据的录入、查询、统计等功能,但无法发现数据中存在的关系和规则,无法根据现有的数据预测未来的发展趋势。缺乏找出数据背后隐藏的知识的手段,导致了“数据爆炸但知识贫乏”的现象。于是数据挖掘技术应运而生,并显示出强大的生命力。数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。它使人类分析问题和发现知识能力得到了延伸。
2数据挖掘概述
2.1数据挖掘的产生
随着信息时代的发展,信息量呈几何级数增长,然而用于对这些数据进行分析处理的工具却很少,人们拥有了海量的数据的同时却苦于信息的缺乏。而激增的数据背后隐藏着许多重要的信息,人们希望能够对其进行更高层次的分析,以便更好地利用这些数据。目前的数据库系统可以高效地实现数据的录入、查询、统计等功能,但无法发现数据中存在的关系和规则,无法根据现有的数据预测未来的发展趋势。缺乏挖掘数据背后隐藏的知识的手段,导致了“数据爆炸但知识贫乏”的现象。信息爆炸是一把双刃剑:巨量的信息既是最重要的财富,又是最危险的杀手。巨量信息也导致决策与理解危机。面对“人人被数据淹没,人们却饥饿于知识”的挑战,数据挖掘和知识发现技术应运而生,并得以蓬勃发展,越来越显示出其强大的生命力。http://www.16sheji8.cn/
数据挖掘是信息技术自然演化的结果。演化过程的见证是数据库业界开发以下功能:数据收集和数据库创建,数据管理(包括数据存储和检索,数据库事务处理),以及数据分析与理解(涉及数据仓库和数据挖掘)。例如,数据收集和数据库创建机制的早期开发已成为稍后数据存储和检索、查询和事务处理有效机制开发的必备基础。随着提供查询和事务处理的大量数据库系统广泛付诸实践,数据分析和理解自然成为下一个目标.http://www.16sheji8.cn/