目录
1 选题的背景和意义
1.1 选题的背景
1.2 国内外研究现状及发展趋势
1.2.1python发展现状
2 研究的基本内容
1.2.2 Wiki百科网页分析方法
2.1 基本框架
2.2 研究的重点和难点
2.3 拟解决的关键问题
3 研究的方法及措施
4 预期成果
2、资料收集准备阶段
3、论文写作及答辩阶段
2015年12月中旬-2016年5月下旬
参考文献
1 选题的背景和意义
1.1 选题的背景
维基百科是一个基于维基技术的全球性多语言百科全书协作计划,同时也是一部用不同语言写成的网络百科全书,其目标及宗旨是为全人类提供自由的百科全书──用他们所选择的语言来书写而成的,是一个动态的、可自由访问(绝大多数国家,但使用安全连接则也行)和编辑的全球知识体。并且在许多国家相当普及。其口号为“维基百科,自由的百科全书。”中文则附加“海纳百川,有容乃大。”
Wiki一词来源于夏威夷语的“wee kee wee kee”,原本是“快点快点”的意思。在这里“WikiWiki”指一种超文本系统。这种超文本系统支持面向社群的协作式写作,同时也包括一组支持这种写作的辅助工具。wikipedia就是wiki+cyclopedia合并而来的。有人认为中文里,“维”指网络,“基”指基础,合起来就是网络基础之意。在数学世界中,维数和基数是描述线性空间(可与时间空间相较)的基础,更加贴切的形容了维基百科包罗万象,所以说“维基”既是音译,也是意译。
维基百科自2001年1月15日正式成立,由维基媒体基金会负责维持,其大部分页面都可以由任何人使用浏览器进行阅览和修改。因为维基用户的广泛参与共建、共享,维基百科也被称为创新2.0时代的百科全书、人民的百科全书。这本全球各国人民参与编写,自由、开放的在线百科全书也是知识社会条件下用户参与、大众创新、开放创新、协同创新的生动诠释。英语维基百科的普及也促成了其它计划,例如维基新闻、维基教科书等计划的产生,虽然也造成对这些所有人都可以编辑的内容准确性的争议,但如果所列出的来源可以被审察及确认,则其内容也会受到一定的肯定。维基百科中的所有文本像和其他内容都是在GNU自由文档许可证下发布的,以确保内容的自由度及开放度。所有人在这里所写的文章都将遵循copyleft协议,所有内容都可以自由的分发和复制,真正实现了全民共享信息资源。
截至2014年7月2日,维基百科条目数第一的英文维基百科已有454万个条目。全球所有282种语言的独立运作版本共突破2100万个条目,总登记用户也超越3200万人,而总编辑次数更是超过12亿次。中文的大部分页面都可以由任何人使用浏览器进行阅览和修改,英文维基百科的普及也促成了其它计划成形。
1.2 国内外研究现状及发展趋势
1.2.1python发展现状
Python是一种解释型、面向对象、动态语义、语法优美的脚本语言,自从1989年由Guido Van Rossum设计出来后,经过十余年的发展,已经同Tcl、Perl一起,成为目前应用最广的三种跨平台脚本语言。Python支持现有的各种主流操作系统,如Microsoft、Windows、Solaris、Mac OS、Linux等,甚至包括Palm OS这样的嵌入式环境。它的源程序和二进制代码可以免费获得。由于其强大灵活的功能,简洁优美的语法和源代码免费开放,Python被著名国际自由软件项目KDE计划选定为标准系统脚本语言,微软公司也宣布将在.NET环境中提供对Python语言的支持。
与同为脚本语言的Tcl、Perl相比,Python的特点有:
(1)面向对象:Python提供类,类的继承,类的私有和公有属性,例外处理等完善的对面向对象方法的支持。
(2)简单易学:Python是一种代表简单主义思想的语言。阅读一个良好的Python程序就感觉像是在读英语一样。它使你能够专注于解决问题而不是去搞明白语言本身。Python极其容易上手,因为Python有极其简单的说明文档。
(3)速度快:Python的底层是用C语言写的,很多标准库和第三方库也都是用C写的,运行速度非常快。
(4)免费、开源:Python是FLOSS(自由/开放源码软件)之一。使用者可以自由地发布这个软件的拷贝、阅读它的源代码、对它做改动、把它的一部分用于新的自由软件中。FLOSS是基于一个团体分享知识的概念。
(5)解释性:一个用编译性语言比如C或C++写的程序可以从源文件(即C或C++语言)转换到一个你的计算机使用的语言(二进制代码,即0和1)。这个过程通过编译器和不同的标记、选项完成。
运行程序的时候,