设计 任务书 文档 开题 答辩 说明书 格式 模板 外文 翻译 范文 资料 作品 文献 课程 实习 指导 调研 下载 网络教育 计算机 网站 网页 小程序 商城 购物 订餐 电影 安卓 Android Html Html5 SSM SSH Python 爬虫 大数据 管理系统 图书 校园网 考试 选题 网络安全 推荐系统 机械 模具 夹具 自动化 数控 车床 汽车 故障 诊断 电机 建模 机械手 去壳机 千斤顶 变速器 减速器 图纸 电气 变电站 电子 Stm32 单片机 物联网 监控 密码锁 Plc 组态 控制 智能 Matlab 土木 建筑 结构 框架 教学楼 住宅楼 造价 施工 办公楼 给水 排水 桥梁 刚构桥 水利 重力坝 水库 采矿 环境 化工 固废 工厂 视觉传达 室内设计 产品设计 电子商务 物流 盈利 案例 分析 评估 报告 营销 报销 会计
 首 页 机械毕业设计 电子电气毕业设计 计算机毕业设计 土木工程毕业设计 视觉传达毕业设计 理工论文 文科论文 毕设资料 帮助中心 设计流程 
垫片
您现在所在的位置:首页 >>毕设资料 >> 文章内容
                 
垫片
   我们提供全套毕业设计和毕业论文服务,联系微信号:biyezuopin QQ:2922748026   
中药方剂数据挖掘信息系统设计与实现 开题报告
文章来源:www.biyezuopin.vip   发布者:毕业作品网站  

一、 选题背景与意义(说明所选课题的历史背景、国内外研究现状和发展趋势)

1.1选题研究的背景:

中药方剂的数据挖掘是在中国传统中药方剂中,应用数据挖掘方法,在中医理论指导下,用知识发现技术对传统中药新药、中医组方理论及规律、中药作用机制、有效成分构效关系等多个方面进行全面、系统的研究[1]。中国传统中医药文化源远流长, 是我国文化宝库中的重要组成部分。中药方剂是祖国医学的重要组成部份 ,仅历史文献就记录有十余万首方剂[2]。然而 , 由于中药方剂多为医务人员的手工汇总 ,虽然有广博精深的中医理论作为支持, 但是整体性、辩证性 、动态性等本质特征过于抽象和定性化 ,难于定量和具体的把握 .而将数据挖掘技术应用于中药方剂的研究中, 是把我国丰富的中药信息资源和信息技术相结合的重要途径[3]。

1.2国内外研究的现状和趋势

目前我国尚未建立中药方剂数据挖掘系统 ,现有数据库只能提供检索、统计等一般性服务, 其中的大量隐含知识并未得到充分的发掘和利用[4]。建立中药方剂数据挖掘系统可以充分利用现有中药数据库中的大量数据, 通过计算机智能信息处理 ,形成新的知识 ,为我国中药新药开发提供新的思路[5]。我国中医药界已经有一批科研院所及大专院校建成了一定数量的中医药文献型和事实型数据库,初步满足了中医药界文献检索的需要。 如国家中医药管理局建立的“中医药期刊文献数据库”、“中医药报刊文献数据库”,北京中医药大学建立的“中药方剂数据库”, 北京中医研究院建立的“中国中药数据库”,浙江大建立的中医药科技数据库群等[6]。利用数据挖掘技术开发研制中药(方剂)新药的工作已受到中医药界广泛重视 ,已经获得一些初步的结果.但是目前建立的大多数中药方剂数据库,只能提供检索和统计的服务,而没有对隐含在数据中的大量隐藏信息进行有效的利用[7]。 如何进一步深入将数据挖掘技术应用在中药方剂的研制和中药配伍的过程中,将为我国的中医药理论研究提供新的思路和方法,为新药的研制带来更大的发展契机[8]。

1.3 选题研究意义

中药方剂数据挖掘研究不仅可以提高我国现有中药数据库的利用价值, 缩短我国中药新药开发的周期, 而且也可以避免中药信息资源的流失.经过多年的努力[9]。 我国中医药界已经有一批科研院所及大专院校建成了一定数量的中医药文献型和事实型数据库, 初步满足了中医药界文献检索的需要。利用数据挖掘技术开发研制中药(方剂)新药的工作已受到中医药界广泛重视 ,已经获得一些初步的结果.目前建立的大多数中药方剂数据库 ,只能提供检索和统计的服务 , 而没有对隐含在数据中的大量隐藏信息进行有效的利用.将数据挖掘技术应用在中药方剂的研制和中药配伍的过程中 ,为中医药的理论研究提供了新的思路和方法 .将数据挖掘技术应用在中药方剂的应用研究上 ,这标志着我国中医药领域利用现代信息处理技术己经跨上一个新台阶, 必将促使中医药信息化工作在原有基础上获得进一步发展[10]。

二、 研究的基本内容和拟解决的主要问题

2.1研究的基本内容

2.1.1系统特点

中药方剂数据挖掘信息系统能够收集现存的中药方剂信息,在对其预处理后,由相关人员进行数据挖掘,最后系统专家对整个系统进行分析与评价。因此该系统分工明确,流程一目了然。若系统中出现问题,可迅速找出源头,“对症下药”,能有效节约时间与资源。其次,本系统旨在通过数据挖掘,对传统中药新药、中医组方理论及规律、中药作用机制、有效成分构效关系等多个方面进行全面、系统的研究 ,从而为我国中药新药的开发提供思路。而除此之外,系统中还包括对信息的收集、预处理,以及对整个流程的评价与分析,因此更加全面、丰富。

2.1.2需求分析

相关的信息收集人员收集中药方剂的有关信息并交给信息预处理人员,信息预处理人员对数据进行清理、集成、规约、变换等预处理操作后,整理为信息表并交给数据挖掘人员进行数据挖掘并得出结果。系统专家考察整个系统流程,并进行合理性和可行性评价。

2.1.3问题的数学模型和算法

分类分析、关联规则分析和聚类分析是目前数据挖掘的三种常用方式。

分类分析是根据所调查事务的属性或特征的共同点和差异点,按照一定的标志将调查总体内所有的个体划为一些性质相同或相近的类别,分别归入某一层或组内,使之条理化、系统化,以利于对总体进行分门别类地研究[15]。

关联规则分析反映的是一个事件和其他事件之间依赖或关联的知识。设I={i1,i2…,im}为所有项目的集合,设A是一个由项目构成的集合,称为项集。事务T是一个项目子集,每一个事务具有唯一的事务标识Tid。事务T包含项集A,当且仅当AT。如果项集A中包含k个项目,则称其为k项集。D为事务数据库,项集A在事务数据库D中出现的次数占D中总事务的百分比叫做项集的支持度(support)。如果项集的支持度超过用户给定的最小支持度阈值,就称该项集是频繁项集(或大项集)[16]。

聚类分析指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程。

聚类分析的目标就是在相似的基础上收集数据来分类。聚类源于很多领域,包括数学,计算机科学,统计学,生物学和经济学。在不同的应用领域,很多聚类技术都得到了发展,这些技术方法被用作描述数据,衡量不同数据源间的相似性,以及把数据源分类到不同的簇中[19]。

聚类与分类的不同在于,聚类所要求划分的类是未知的。聚类类似于分类,但与分类的目的不同,是针对数据的相似性和差异性将一组数据分为几个类别。属于同一类别的数据间的相似性很大,但不同类别之间数据的相似性很小,跨类的数据关联性很低[21]。

2.1.4系统分析

对中药方剂数据挖掘信息系统分别建立相应模块的系统用例图、活动图、类图、分析业务规则、用例实现和确定系统架构和框架,从而将现实世界中的需求转换到计算机中,进行可视化的描述。

2.1.5系统设计

实现中药方剂数据挖掘信息系统设计,接口设计、包设计、数据库设计、界面的设计与各个系统模块的设计与实现等。

2.1.6系统实现

该系统基于Struts2+Hibernate4+Spring4框架整合编程,实现和测试系统的功能。系统功能实现包含实现数据库的添加,删除,修改,查询功能;实现对不同角色的控制跳转;信息的保存、浏览、传输和添加,删除,修改功能等。

2.2拟解决的主要问题

(1)规范标准化收录內容。分离药物名和用量,在每条方剂的药物组成中,药物名和用量是在一起的。为了后面的数据挖掘,必须将其分离,从中提取出药物名和用量[22]。

(2)此外,现有方剂数据库关于现代临床及文献报道中方剂数据的整理亦存在不足。自动提取的方剂数据还存在数据缺失、数据冗余、数据标准不统一等问题,需人工运用 Apriori这种经典关联规则算法对某类方剂的组成药物进行分析,找出核心药物的主要药对、药组,进而分析该类方剂的配伍规律[23]。

(3)对传统中药新药、中医组方理论及规律、中药作用机制、有效成分构效关系等多个方面进行研究时,针对期望的挖掘结果选用何种挖掘方法是值得思考的问题[24]。

三、 研究方法及措施(拟采取的研究手段及技术路线、实验方案等)

图1  技术路线

3.1 数据挖掘之典型算法

(1)分类分析——朴素贝叶斯分类法

贝叶斯分类算法是统计学的一种分类方法,它是一类利用概率统计知识进行分

类的算法:

设每个数据样本用一个n维特征向量来描述n个属性的值,即:X={x1,x2,…,xn},假定有m个类,分别用C1, C2,…,Cm表示。给定一个未知的数据样本X(即没有类标号),若朴素贝叶斯分类法将未知的样本X分配给类Ci,则一定是

P(Ci|X)>P(Cj|X) 1≤j≤m,j≠i

根据贝叶斯定理

由于P(X)对于所有类为常数,最大化后验概率P(Ci|X)可转化为最大化先验概率P(X|Ci)P(Ci)。如果训练数据集有许多属性和元组,计算P(X|Ci)的开销可能非常大,为此,通常假设各属性的取值互相独立,这样

先验概率P(x1|Ci),P(x2|Ci),…,P(xn|Ci)可以从训练数据集求得。

根据此方法,对一个未知类别的样本X,可以先分别计算出X属于每一个类别Ci的概率P(X|Ci)P(Ci),然后选择其中概率最大的类别作为其类别。

朴素贝叶斯算法成立的前提是各属性之间互相独立。当数据集满足这种独立性假设时,分类的准确度较高,否则可能较低。另外,该算法没有分类规则输出[25]。

(2)关联规则分析——Apriori算法

1、项集和K-项集
令I={i1,i2,i3……id}是购物篮数据中所有项的集合,而T={t1,t2,t3….tN}是所有事务的集合,每个事务ti包含的项集都是I的子集。在关联分析中,包含0个或多个项的集合称为项集。如果一个项集包含K个项,则称它为K-项集。空集是指不包含任何项的项集。例如,在购物篮事务的例子中,{啤酒,尿布,牛奶}是一个3-项集。
2、支持度计数
项集的一个重要性质是它的支持度计数,即包含特定项集的事务个数,数学上,项集X的支持度计数σ(X)可以表示为
σ(X)=|{ti|X⊆ti,ti∈T}|
其中,符号|*|表示集合中元素的个数。
在购物篮事务的例子中,项集{啤酒,尿布,牛奶}的支持度计数为2,因为只有3和4两个事务中同时包含这3个项[26]。
3、关联规则
关联规则是形如X→Y的蕴含表达式,其中X和Y是不相交的项集,即X∩Y=∅。
关联规则的强度可以用它的支持度(support)和置信度(confidence)来度量。支持度确定规则可以用于给定数据集的频繁程度,而置信度确定Y在包含X的事务中出现的频繁程度。
支持度(s)和置信度(c)这两种度量的形式定义如下:
s(X→Y)=σ(X∪Y)/N
c(X→Y)=σ(X∪Y)/σ(X)
其中, σ(X∪Y)是(X∪Y)的支持度计数,N为事务总数,σ(X)是X的支持度计数。
关联规则发现
给定事务的集合T,关联规则发现是指找出支持度大于等于minsup (最小支持度)并且置信度大于等于minconf(最小置信度)的所有规则,minsup和minconf是对应的支持度和置信度阈值[27]。
关联规则的挖掘是一个两步的过程:
(1)频繁项集产生:其目标是发现满足最小支持度阈值的所有项集(至少和预定义的最小支持计数一样),这些项集称作频繁项集。
(2)规则的产生:其目标是从上一步发现的频繁项集中提取所有高置信度的规则,这些规则称作强规则。(必须满足最小支持度和最小置信度)
Apriori算法介绍
Apriori算法的实质使用候选项集找频繁项集。
Apriori 算法是一种最有影响的挖掘布尔关联规则频繁项集的算法。算法的名字基于这样的事实:算法使用频繁项集性质的先验知识, 正如我们将看到的。Apriori 使用一种称作逐层搜索的迭代方法,k-项集用于探索(k+1)-项集。首先,找出频繁1-项集的集合。该集合记作L1。L1 用于找频繁2-项集的集合L2,而L2 用于找L3,如此下去,直到不能找到频繁k-项集。找每个Lk 需要一次数据库扫描[28]。

(3)关联规则分析——BIRCH算法(层次方法)

BIRCH算法即平衡迭代削减聚类法,其核心是用一个聚类特征3元组表示一个簇的有关信息,从而使一簇点的表示可用对应的聚类特征,而不必用具体的一 组点来表示。它通过构造满足分支因子和簇直径限制的聚类特征树来求聚类。BIRCH算法通过聚类特征可以方便地进行中心、半径、直径及类内、类间距离的运 算。算法的聚类特征树是一个具有两个参数分枝因子B和类直径T的高度平衡树。分枝因子规定了树的每个节点子女的最多个数,而类直径体现了对一类点的直径大 小的限制即这些点在多大范围内可以聚为一类,非叶子结点为它的子女的最大关键字,可以根据这些关键字进行插人索引,它总结了其子女的信息。
聚类特征树可以动态构造,因此不要求所有数据读人内存,而可以在外存上逐个读人。新的数据项总是插人到树中与该数据距离最近的叶子中。如果插人后使得 该叶子的直径大于类直径T,则把该叶子节点分裂。其它叶子结点也需要检查是否超过分枝因子来判断其分裂与否,直至该数据插入到叶子中,并且满足不超过类直 径,而每个非叶子节点的子女个数不大于分枝因子。算法还可以通过改变类直径修改特征树大小,控制其占内存容量。
BIRCH算法通过一次扫描就可以进行较好的聚类,由此可见,该算法适合于大数据量。对于给定的M兆内存空间,其空间复杂度为O(M),时间间复杂度 为O(dNBlnB(M/P)).其中d为维数,N为节点数,P为内存页的大小,B为由P决定的分枝因子。I/O花费与数据量成线性关系。BIRCH算法 只适用于类的分布呈凸形及球形的情况,并且由于BIRCH算法需提供正确的聚类个数和簇直径限制,对不可视的高维数据不可[32].

3.2 系统实现技术]

中药方剂数据挖掘信息系统以B/S结构设计,利用Struts2+Hibernate4+Spring4三大框架来整合实现。其中集成开发环境(IDE)采用Eclipse-jee-luna(Eclipse 4.4),服务器使用Apache Tomcat v8.0,数据库采用MySQL5.5。

四、 研究工作的步骤与进度(课题研究在时间和顺序上的安排)

1、2017年12月—2018年2月,确认和完善系统用例、用例实现、用例场景以及

相应的活动图、泳道图、类图、用例图、用例规约、鲁棒图和序列图。完成系统设计,包括模型设计、包设计和接口设计等。

3、2018年2月—3月,进行系统编码,初步完成系统项目。

4、2018年4月系统调试和修改完善,并着手撰写论文。

5、2018年5月准备论文答辩。

五、主要参考文献(其中外文文献应不少于2篇)

[1]王萍. 基于数据挖掘方法对中药治疗中晚期大肠癌的方剂组方规律初步探析[D].北京中医药大学,2015.

[2]蒋志滨. 基于数据挖掘的方剂配伍规律研究方法探讨[D].南京中医药大学,2015.

[3]贾铁东. 基于数据挖掘分析近10年治疗糖尿病足中药方剂组方规律[D].辽宁中医药大学,2015.

[4]宋宇,李文林,张云,曾莉. 中药方剂文献的数据挖掘[J]. 中华医学图书情报杂志,2014,23(08):59-62. [2017-09-14].

[5]李强. 基于方剂数据挖掘的痹证证治规律研究[D].中国中医科学院,2014.

[6]高原. 用于方剂配伍分析的中药数据挖掘研究[D].南京大学,2014.

[7]宋兆林. 数据挖掘技术在中药方剂配伍中的应用研究[D].福州大学,2014.

[8]张博. 基于关联规则的数据挖掘技术在中药方剂配伍中的应用研究[J]. 甘肃联合大学学报(自然科学版),2011,25(01):82-86. [2017-09-14]. DOI:10.13804/j.cnki.2095-6991.2011.01.027

[9]李振岳. 中药方剂数据挖掘研究[D].广东药学院,2010.

[10]胡建军. 中药方剂数据挖掘系统中数据存储的设计[J]. 福建电

脑,2008,(06):3-4.

[11]周婕. 数据挖掘若干方法研究及其在中医药数据库中的应用[D].西南交通大学,2003.

[ 12] 姚美村, 袁月梅, 艾路, 等.数据挖掘及其在中医药现代化研究中的应用[ J] .北京中医药大学学报, 2002 ,25(5):20-24.

[ 13] 李凌艳, 李认书, 孙鹤, 等.数据挖掘技术在中药研究中的应用[ J] .中草药, 2010, 40(5):17.

[ 14] 谢含.数据挖掘在中医药文献研究中的应用[ J] .中医药信息, 2005 , 22(6):125-127 .

[ 15] 孔芳, 钱雪忠.关联规则挖掘中对 Aprio ri 算法的一种改进研究[ J] .计 算机工程与 设计, 2008, 29(16):4220-4223.

[ 16] 陈则芝, 李冬梅.数据挖掘关联规则 Aprio ri 算法的优化[ J] .山西大同大学学报:自然科学版, 2008, 24(4):35-37.

[ 17] (加)韩家炜, 堪博著, 范明.数 据挖掘概念与技术[ M] .第 2 版 .孟 小峰译.北京:机械工业出版 社,2007.

[18] 王欣.基于数据挖掘技术的医药信息整合进程研究[J].齐齐哈尔医学院学报,2010,31(6):911-912.

[19] 胡建军.中药特性信息数据挖掘系统中的预处理设计[J].计算机工程,2008,34(21):284-285.

[20] 李力.数据挖掘算法研究及其在中药复方配伍分析中的应用[D].西南交通大学,2000:111-117.

[21] 李凌艳,李认书,孙鹤.数据挖掘技术在中药研究中的应用[J].中草药,2010,41(5).

[22] 朱恒民.领域知识制导的数据挖掘技术及其在中药提取中的应用[D].南京航空航天大学,2006:41-43.

[23] 朱金伟,鞠时光.基于数据挖掘的中医药数据预处理方法[J].计算机工程,2006,32(15):280-282.

[24]滕秀香,李宏田,佟庆,姚海洋. 柴松岩辨证治疗卵巢早衰中药方剂数据挖掘研究[J]. 中华中医药杂志,2015,30(10):3709-3712. [2017-09-14].

[25]申丹. 《中药成方制剂》数据库构建及用药规律研究[D].中国中医科学院,2014.

[26]赵培杰. NT-proBNP对ST段抬高急性心肌梗死患者急诊PCI术后临床结果的预测价值[D].昆明理工大学,2014.

[27]李文涛,刘昶,王增绘,杨默,黄林芳,陈士林. 基于中医治疗血液病方剂的中药组合规律数据挖掘[J]. 中华中医药杂志,2012,27(12):3096-3099. [2017-09-14].

[28]董辉. 基于改进FP_Growth算法的中药方剂配伍规律挖掘研究[J]. 赤峰学院学报(自然科学版),2011,27(09):198-200. [2017-09-14]. DOI:10.13398/j.cnki.issn1673-260x.2011.09.056

[29]黄晶. 急性ST段抬高型心肌梗死心电图Tp-e间期的临床研究[D].吉林大学,2011.

[30]王靖. 急性心肌梗塞合并恶性室性心律失常相关研究[D].中国协和医科大学,2010.

[31]付先军. 中药归经(肺经)理论和肺系方剂配伍规律的解析及在海洋中药研发中的应用[D].中国海洋大学,2009.

[32]胡建军. 中药药理知识发现系统中关键技术的研究[D].四川大学,2006.

六、指导教师意见:

指导教师签名:

年       月       日

七、开题报告会审核意见:

开题报告会审核小组组长:

年       月       日

  全套毕业设计论文现成成品资料请咨询微信号:biyezuopin QQ:2922748026     返回首页 如转载请注明来源于www.biyezuopin.vip  

                 

打印本页 | 关闭窗口
本类最新文章
小型垂直升降机机械结构设计 任务 台式数控等离子切割机机械结构设计 台式数控等离子切割机机械结构设计
台式数控等离子切割机机械结构设计 基于PLC的罐装加工过程为全自动 基于Python电影推荐系统设计
| 关于我们 | 友情链接 | 毕业设计招聘 |

Email:biyeshejiba@163.com 微信号:biyezuopin QQ:2922748026  
本站毕业设计毕业论文资料均属原创者所有,仅供学习交流之用,请勿转载并做其他非法用途.如有侵犯您的版权有损您的利益,请联系我们会立即改正或删除有关内容!