数据挖掘最新的文献

数据挖掘最新的文献类型

数据挖掘概念综述数据挖掘又称从数据库中发现知识（KDD）、数据分析、数据融合（Data Fusion）以及决策支持。KDD一词首次出现在1989年8月举行的第11届国际联合人工智能学术会议上。随后在1991年、1993年和1994年都举行KDD 专题讨论会，汇集来自各个领域的研究人员和应用开发者，集中讨论数据统计、海量数据分析算法、知识表示、知识运用等问题。随着参与人员的不断增多，KDD国际会议发展成为年会。1998 年在美国纽约举行的第四届知识发现与数据挖掘国际学术会议不仅进行了学术讨论，并且有30多家软件公司展示了他们的数据挖掘软件产品，不少软件已在北美、欧洲等国得到应用。一、什么是数据挖掘 1、数据挖掘的历史近十几年来，人们利用信息技术生产和搜集数据的能力大幅度提高，千万万个数据库被用于商业管理、政府办公、科学研究和工程开发等等，这一势头仍将持续发展下去。于是，一个新的挑战被提了出来：在这被称之为信息爆炸的时代，信息过量几乎成为人人需要面对的问题。如何才能不被信息的汪洋大海所淹没，从中及时发现有用的知识，提高信息利用率呢？要想使数据真正成为一个公司的资源，只有充分利用它为公司自身的业务决策和战略发展服务才行，否则大量的数据可能成为包袱，甚至成为垃圾。因此，面对”人们被数据淹没，人们却饥饿于知识”的挑战。另一方面计算机技术的另一领域——人工智能自1956年诞生之后取得了重大进展。经历了博弈时期、自然语言理解、知识工程等阶段，目前的研究热点是机器学习。机器学习是用计算机模拟人类学习的一门科学，比较成熟的算法有神经网络、遗传算法等。用数据库管理系统来存储数据，用机器学习的方法来分析数据，挖掘大量数据背后的知识，这两者的结合促成了数据库中的知识发现（KDD：Knowledge Discovery in Databases）的产生，因此，数据挖掘和知识发现（DMKD）技术应运而生，并得以蓬勃发展，越来越显示出其强大的生命力。数据挖掘又称从数据库中发现知识（KDD）、数据分析、数据融合（Data Fusion）以及决策支持。KDD一词首次出现在1989年8月举行的第11届国际联合人工智能学术会议上。随后在1991年、1993年和1994年都举行KDD 专题讨论会，汇集来自各个领域的研究人员和应用开发者，集中讨论数据统计、海量数据分析算法、知识表示、知识运用等问题。随着参与人员的不断增多，KDD国际会议发展成为年会。1998 年在美国纽约举行的第四届知识发现与数据挖掘国际学术会议不仅进行了学术讨论，并且有30多家软件公司展示了他们的数据挖掘软件产品，不少软件已在北美、欧洲等国得到应用。 2数据挖掘的概念从1989年到现在，KDD的定义随着人们研究的不断深入也在不断完善，目前比较公认的定义是Fayyad 等给出的：KDD是从数据集中识别出有效的、新颖的、潜在有用的以及最终可理解模式的高级处理过程。从定义可以看出，数据挖掘（DataMining）就是从大量的、不完全的、有噪声的、模糊的、随机的数据中，提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。人们把原始数据看作是形成知识的源泉，就像从矿石中采矿一样。原始数据可以是结构化的，如关系数据库中的数据，也可以是半结构化的，如文本、图形、图像数据，甚至是分布在网络上的异构型数据。发现知识的方法可以是数学的，也可以是非数学的；可以是演绎的，也可以是归纳的。发现了的知识可以被用于信息管理、查询优化、决策支持、过程控制等，还可以用于数据自身的维护。因此，数据挖掘是一门很广义的交叉学科，它汇聚了不同领域的研究者，尤其是数据库、人工智能、数理统计、可视化、并行计算等方面的学者和工程技术人员。特别要指出的是，数据挖掘技术从一开始就是面向应用的。它不仅是面向特定数据库的简单检索查询调用，而且要对这些数据进行微观、中观乃至宏观的统计、分析、综合和推理，以指导实际问题的求解，企图发现事件间的相互关联，甚至利用已有的数据对未来的活动进行预测。一般来说在科研领域中称为KDD，而在工程领域则称为数据挖掘。二、数据挖掘的步骤 KDD包括以下步骤： 1、数据准备 KDD的处理对象是大量的数据，这些数据一般存储在数据库系统中，是长期积累的结果。但往往不适合直接在这些数据上面进行知识挖掘，需要做数据准备工作，一般包括数据的选择（选择相关的数据）、净化（消除噪音、冗余数据）、推测（推算缺失数据）、转换（离散值数据与连续值数据之间的相互转换，数据值的分组分类，数据项之间的计算组合等）、数据缩减（减少数据量）。如果KDD的对象是数据仓库，那么这些工作往往在生成数据仓库时已经准备妥当。数据准备是KDD 的第一个步骤，也是比较重要的一个步骤。数据准备是否做好将影响到数据挖掘的效率和准确度以及最终模式的有效性。 2、数据挖掘数据挖掘是KDD最关键的步骤，也是技术难点所在。研究KDD的人员中大部分都在研究数据挖掘技术，采用较多的技术有决策树、分类、聚类、粗糙集、关联规则、神经网络、遗传算法等。数据挖掘根据KDD的目标，选取相应算法的参数，分析数据，得到可能形成知识的模式模型。 3、评估、解释模式模型上面得到的模式模型，有可能是没有实际意义或没有实用价值的，也有可能是其不能准确反映数据的真实意义，甚至在某些情况下是与事实相反的，因此需要评估，确定哪些是有效的、有用的模式。评估可以根据用户多年的经验，有些模式也可以直接用数据来检验其准确性。这个步骤还包括把模式以易于理解的方式呈现给用户。 4、巩固知识用户理解的、并被认为是符合实际和有价值的模式模型形成了知识。同时还要注意对知识做一致性检查，解决与以前得到的知识互相冲突、矛盾的地方，使知识得到巩固。 5、运用知识发现知识是为了运用，如何使知识能被运用也是KDD的步骤之一。运用知识有两种方法：一种是只需看知识本身所描述的关系或结果，就可以对决策提供支持；另一种是要求对新的数据运用知识，由此可能产生新的问题，而需要对知识做进一步的优化三、数据挖掘的特点及功能 1、数据挖掘的特点数据挖掘具有如下几个特点，当然，这些特点与数据挖掘要处理的数据和目的是密切相关的。 1、处理的数据规模十分巨大。 2、查询一般是决策制定者（用户）提出的即时随机查询，往往不能形成精确的查询要求。 3、由于数据变化迅速并可能很快过时，因此需要对动态数据作出快速反应，以提供决策支持。 4、主要基于大样本的统计规律，其发现的规则不一定适用于所有数据 2、数据挖掘的功能数据挖掘所能发现的知识有如下几种：广义型知识，反映同类事物共同性质的知识；特征型知识，反映事物各方面的特征知识；差异型知识，反映不同事物之间属性差别的知识 ;关联型知识，反映事物之间依赖或关联的知识；预测型知识，根据历史的和当前的数据推测未来数据；偏离型知识，揭示事物偏离常规的异常现象。所有这些知识都可以在不同的概念层次上被发现，随着概念树的提升，从微观到中观再到宏观，以满足不同用户、不同层次决策的需要。例如，从一家超市的数据仓库中，可以发现的一条典型关联规则可能是”买面包和黄油的顾客十有八九也买牛奶”，也可能是”买食品的顾客几乎都用信用卡”，这种规则对于商家开发和实施客户化的销售计划和策略是非常有用的。至于发现工具和方法，常用的有分类、聚类、减维、模式识别、可视化、决策树、遗传算法、不确定性处理等。归纳起来，数据挖掘有如下几个功能：预测/验证功能：预测/验证功能指用数据库的若干已知字段预测或验证其他未知字段值。预测方法有统计分析方法、关联规则和决策树预测方法、回归树预测方法等。描述功能：描述功能指找到描述数据的可理解模式。描述方法包括以下几种：数据分类、回归分析、簇聚、概括、构造依赖模式、变化和偏差分析、模式发现、路径发现等。四、数据挖掘的模式数据挖掘的任务是从数据中发现模式。模式是一个用语言L来表示的一个表达式E，它可用来描述数据集F中数据的特性，E 所描述的数据是集合F的一个子集FE。E作为一个模式要求它比列举数据子集FE中所有元素的描述方法简单。例如，“如果成绩在81 ～90之间，则成绩优良”可称为一个模式，而“如果成绩为81、82、83、84、85、86、87、88、89 或90，则成绩优良”就不能称之为一个模式。模式有很多种，按功能可分有两大类：预测型（Predictive）模式和描述型（Descriptive）模式。预测型模式是可以根据数据项的值精确确定某种结果的模式。挖掘预测型模式所使用的数据也都是可以明确知道结果的。例如，根据各种动物的资料，可以建立这样的模式：凡是胎生的动物都是哺乳类动物。当有新的动物资料时，就可以根据这个模式判别此动物是否是哺乳动物。描述型模式是对数据中存在的规则做一种描述，或者根据数据的相似性把数据分组。描述型模式不能直接用于预测。例如，在地球上，70 ％的表面被水覆盖，30 ％是土地。在实际应用中，往往根据模式的实际作用细分为以下6 种： 1、分类模式分类模式是一个分类函数（分类器），能够把数据集中的数据项映射到某个给定的类上。分类模式往往表现为一棵分类树，根据数据的值从树根开始搜索，沿着数据满足的分支往上走，走到树叶就能确定类别。 2、回归模式回归模式的函数定义与分类模式相似，它们的差别在于分类模式的预测值是离散的，回归模式的预测值是连续的。如给出某种动物的特征，可以用分类模式判定这种动物是哺乳动物还是鸟类；给出某个人的教育情况、工作经验，可以用回归模式判定这个人的年工资在哪个范围内，是在6000元以下，还是在6000元到1万元之间，还是在1万元以上。 3、时间序列模式时间序列模式根据数据随时间变化的趋势预测将来的值。这里要考虑到时间的特殊性质，像一些周期性的时间定义如星期、月、季节、年等，不同的日子如节假日可能造成的影响，日期本身的计算方法，还有一些需要特殊考虑的地方如时间前后的相关性（过去的事情对将来有多大的影响力）等。只有充分考虑时间因素，利用现有数据随时间变化的一系列的值，才能更好地预测将来的值。 4、聚类模式聚类模式把数据划分到不同的组中，组之间的差别尽可能大，组内的差别尽可能小。与分类模式不同，进行聚类前并不知道将要划分成几个组和什么样的组，也不知道根据哪一（几）个数据项来定义组。一般来说，业务知识丰富的人应该可以理解这些组的含义，如果产生的模式无法理解或不可用，则该模式可能是无意义的，需要回到上阶段重新组织数据。 5、关联模式关联模式是数据项之间的关联规则。关联规则是如下形式的一种规则：“在无力偿还贷款的人当中，60％的人的月收入在3000元以下。” 6、序列模式序列模式与关联模式相仿，而把数据之间的关联性与时间联系起来。为了发现序列模式，不仅需要知道事件是否发生，而且需要确定事件发生的时间。例如，在购买彩电的人们当中，60％的人会在3个月内购买影碟机五、数据挖掘的发现任务数据挖掘涉及的学科领域和方法很多，有多种分类法。根据挖掘任务分，可分为分类或预测模型发现、数据总结、聚类、关联规则发现、序列模式发现、依赖关系或依赖模型发现、异常和趋势发现等等；根据挖掘对象分，有关系数据库、面向对象数据库、空间数据库、时态数据库、文本数据源、多媒体数据库、异质数据库、遗产数据库以及环球网Web;根据挖掘方法分，可粗分为：机器学习方法、统计方法、神经网络方法和数据库方法。机器学习中，可细分为：归纳学习方法（决策树、规则归纳等）、基于范例学习、遗传算法等。统计方法中，可细分为：回归分析（多元回归、自回归等）、判别分析（贝叶斯判别、费歇尔判别、非参数判别等）、聚类分析（系统聚类、动态聚类等）、探索性分析（主元分析法、相关分析法等）等。神经网络方法中，可细分为：前向神经网络（BP算法等）、自组织神经网络（自组织特征映射、竞争学习等）等。数据库方法主要是多维数据分析或OLAP 方法，另外还有面向属性的归纳方法。从挖掘任务和挖掘方法的角度而言有数据总结、分类发现、聚类和关联规则发现四种非常重要的发现任务。 1、数据总结数据总结目的是对数据进行浓缩，给出它的紧凑描述。传统的也是最简单的数据总结方法是计算出数据库的各个字段上的求和值、平均值、方差值等统计值，或者用直方图、饼状图等图形方式表示。数据挖掘主要关心从数据泛化的角度来讨论数据总结。数据泛化是一种把数据库中的有关数据从低层次抽象到高层次上的过程。由于数据库上的数据或对象所包含的信息总是最原始、基本的信息（这是为了不遗漏任何可能有用的数据信息）。人们有时希望能从较高层次的视图上处理或浏览数据，因此需要对数据进行不同层次上的泛化以适应各种查询要求。数据泛化目前主要有两种技术：多维数据分析方法和面向属性的归纳方法。 1、多维数据分析方法是一种数据仓库技术，也称作联机分析处理（OLAP）。数据仓库是面向决策支持的、集成的、稳定的、不同时间的历史数据集合。决策的前提是数据分析。在数据分析中经常要用到诸如求和、总计、平均、最大、最小等汇集操作，这类操作的计算量特别大。因此一种很自然的想法是，把汇集操作结果预先计算并存储起来，以便于决策支持系统使用。存储汇集操作结果的地方称作多维数据库。多维数据分析技术已经在决策支持系统中获得了成功的应用，如着名的SAS数据分析软件包、Business Object公司的决策支持系统Business Object,以及IBM公司的决策分析工具都使用了多维数据分析技术。采用多维数据分析方法进行数据总结，它针对的是数据仓库，数据仓库存储的是脱机的历史数据。 2、为了处理联机数据，研究人员提出了一种面向属性的归纳方法。它的思路是直接对用户感兴趣的数据视图（用一般的SQL查询语言即可获得）进行泛化，而不是像多维数据分析方法那样预先就存储好了泛化数据。方法的提出者对这种数据泛化技术称之为面向属性的归纳方法。原始关系经过泛化操作后得到的是一个泛化关系，它从较高的层次上总结了在低层次上的原始关系。有了泛化关系后，就可以对它进行各种深入的操作而生成满足用户需要的知识，如在泛化关系基础上生成特性规则、判别规则、分类规则，以及关联规则等。 2、分类发现分类在数据挖掘中是一项非常重要的任务，目前在商业上应用最多。分类的目的是学会一个分类函数或分类模型（也常常称作分类器），该模型能把数据库中的数据项映射到给定类别中的某一个。分类和回归都可用于预测。预测的目的是从利用历史数据纪录中自动推导出对给定数据的推广描述，从而能对未来数据进行预测。和回归方法不同的是，分类的输出是离散的类别值，而回归的输出则是连续数值。要构造分类器，需要有一个训练样本数据集作为输入。训练集由一组数据库记录或元组构成，每个元组是一个由有关字段（又称属性或特征）值组成的特征向量，此外，训练样本还有一个类别标记。一个具体样本的形式可为：（ v1, v2, …， vn; c ）；其中vi表示字段值，c表示类别。分类器的构造方法有统计方法、机器学习方法、神经网络方法等等。统计方法包括贝叶斯法和非参数法（近邻学习或基于事例的学习），对应的知识表示则为判别函数和原型事例。机器学习方法包括决策树法和规则归纳法，前者对应的表示为决策树或判别树，后者则一般为产生式规则。神经网络方法主要是BP算法，它的模型表示是前向反馈神经网络模型（由代表神经元的节点和代表联接权值的边组成的一种体系结构），BP算法本质上是一种非线性判别函数。另外，最近又兴起了一种新的方法：粗糙集（rough set），其知识表示是产生式规则。不同的分类器有不同的特点。有三种分类器评价或比较尺度：1 预测准确度；2 计算复杂度；3 模型描述的简洁度。预测准确度是用得最多的一种比较尺度，特别是对于预测型分类任务，目前公认的方法是10番分层交叉验证法。计算复杂度依赖于具体的实现细节和硬件环境，在数据挖掘中，由于操作对象是巨量的数据库，因此空间和时间的复杂度问题将是非常重要的一个环节。对于描述型的分类任务，模型描述越简洁越受欢迎；例如，采用规则表示的分类器构造法就更有用，而神经网络方法产生的结果就难以理解。另外要注意的是，分类的效果一般和数据的特点有关，有的数据噪声大，有的有缺值，有的分布稀疏，有的字段或属性间相关性强，有的属性是离散的而有的是连续值或混合式的。目前普遍认为不存在某种方法能适合于各种特点的数据。 3、聚类聚类是把一组个体按照相似性归成若干类别，即”物以类聚”。它的目的是使得属于同一类别的个体之间的距离尽可能的小，而不同类别上的个体间的距离尽可能的大。聚类方法包括统计方法、机器学习方法、神经网络方法和面向数据库的方法。在统计方法中，聚类称聚类分析，它是多元数据分析的三大方法之一（其它两种是回归分析和判别分析）。它主要研究基于几何距离的聚类，如欧式距离、明考斯基距离等。传统的统计聚类分析方法包括系统聚类法、分解法、加入法、动态聚类法、有序样品聚类、有重叠聚类和模糊聚类等。这种聚类方法是一种基于全局比较的聚类，它需要考察所有的个体才能决定类的划分；因此它要求所有的数据必须预先给定，而不能动态增加新的数据对象。聚类分析方法不具有线性的计算复杂度，难以适用于数据库非常大的情况。在机器学习中聚类称作无监督或无教师归纳；因为和分类学习相比，分类学习的例子或数据对象有类别标记，而要聚类的例子则没有标记，需要由聚类学习算法来自动确定。很多人工智能文献中，聚类也称概念聚类；因为这里的距离不再是统计方法中的几何距离 ,而是根据概念的描述来确定的。当聚类对象可以动态增加时，概念聚类则称是概念形成。在神经网络中，有一类无监督学习方法：自组织神经网络方法；如Kohonen自组织特征映射网络、竞争学习网络等等。在数据挖掘领域里，见报道的神经网络聚类方法主要是自组织特征映射方法，IBM在其发布的数据挖掘白皮书中就特别提到了使用此方法进行数据库聚类分割。 4、关联规则发现关联规则是形式如下的一种规则，”在购买面包和黄油的顾客中，有90%的人同时也买了牛奶”（面包+黄油（牛奶）。用于关联规则发现的主要对象是事务型数据库，其中针对的应用则是售货数据，也称货篮数据。一个事务一般由如下几个部分组成：事务处理时间 ,一组顾客购买的物品，有时也有顾客标识号（如信用卡号）。由于条形码技术的发展，零售部门可以利用前端收款机收集存储大量的售货数据。因此，如果对这些历史事务数据进行分析，则可对顾客的购买行为提供极有价值的信息。例如，可以帮助如何摆放货架上的商品（如把顾客经常同时买的商品放在一起），帮助如何规划市场（怎样相互搭配进货）。由此可见，从事务数据中发现关联规则，对于改进零售业等商业活动的决策非常重要。如果不考虑关联规则的支持度和可信度，那么在事务数据库中存在无穷多的关联规则。事实上，人们一般只对满足一定的支持度和可信度的关联规则感兴趣。在文献中，一般称满足一定要求的（如较大的支持度和可信度）的规则为强规则。因此，为了发现出有意义的关联规则，需要给定两个阈值：最小支持度和最小可信度。前者即用户规定的关联规则必须满足的最小支持度，它表示了一组物品集在统计意义上的需满足的最低程度；后者即用户规定的关联规则必须满足的最小可信度，它反应了关联规则的最低可靠度。在实际情况下，一种更有用的关联规则是泛化关联规则。因为物品概念间存在一种层次关系，如夹克衫、滑雪衫属于外套类，外套、衬衣又属于衣服类。有了层次关系后，可以帮助发现一些更多的有意义的规则。例如，”买外套，买鞋子”（此处，外套和鞋子是较高层次上的物品或概念，因而该规则是一种泛化的关联规则）。由于商店或超市中有成千上万种物品，平均来讲，每种物品（如滑雪衫）的支持度很低，因此有时难以发现有用规则；但如果考虑到较高层次的物品（如外套），则其支持度就较高，从而可能发现有用的规则。另外，关联规则发现的思路还可以用于序列模式发现。用户在购买物品时，除了具有上述关联规律，还有时间上或序列上的规律，因为，很多时候顾客会这次买这些东西，下次买同上次有关的一些东西，接着又买有关的某些东西。

NoteExpress软件能解决你的问题。它是北京爱琴海软件公司开发的一款专业级别的文献检索与管理系统，其核心功能涵盖“知识采集，管理，应用，挖掘”的知识管理的所有环节你可以上网找找，有破解版的。

懒惰阿。。。开题还是论文？这个没有，你问多少人也不会为这点分给你现写的。告诉你个好方法：从中国知网（没账号密码？不好意思，再悬赏200分自己问去吧）上搜索往年的论文，然后把NK格式的大论文的前言部分找自己需要的粘贴下来，再自己添几句话使之看起来不象别人的文章，多搜几篇1000字很好搞定，就看你想不想做了。话已至此，得分~~

数据挖掘最新的文献综述

[摘要 ]随着 In te rne t在中国的迅速发展 ,人们日常生活中越来越多地使用这项新的技术来为自己的工作和学习服务。由于 W EB 页面能把文本、图像、声音、动画、视像等多种媒体信息集于一体 ,不但使信息的显示更加生动 ,而且使信息的浏览更为方便 ,同时 W EB 页能实现网上交易平台、客户信息反馈方便了企业与客户之间信息交流 ,因此许多企业纷纷建设网站以增强企业知名度。[关键词 ]网站规划 PH P +M YSQL 数据库1 引言互联网的快速发展使企业可以实现快捷的信息传送以及直接的客户介入 ,但企业中各个系统的相对独立性使信息渠道比较混乱。企业系统中各类人员的信息渠道多种多样 ,互不兼容 ,没有一个统一的应用界面让系统使用者可以根据自己的需要获得想要的信息 , 这不利于电子商务应用模式的建立和开展。如何通过建立一个单独的界面给企业遍布全球的现实客户、潜在客户、供应商、雇员和合作伙伴提供全面的企业信息和应用呢 ? 于是企业门户 ( En te rp rise Po rta l) 诞生了 ,并成为一个新的热点。2 如何定义企业门户目前 ,尚不能准确地对企业门户下一个完整的定义 , 企业门户与 IT业有些名词一样 , 不同的专业人士和机构对之有不同的理解 ,并有很多术语用于描述企业为其客户、合作伙伴和员工的方便而采用的“门户 ”,如企业门户、社团门户、员工门户等。同时根据应用的具体功能不同又把企业门户细分为信息门户、知识门户和应用门户等 ,并且这种划分方法已逐渐得到认可。下面介绍一下这 3类门户。( 1 ) 企业信息门户企业信息门户 ( En te rp rise Info rm a tion Po rta l, E IP) 的基本作用是为人们提供企业信息。企业信息门户提供了一个了解企业的访问入口 ,所有访问者都可以通过这个入口获得个性化的信息和服务。对企业来说 , 信息门户既是一个展示企业的窗口 ,又可以无缝地集成企业的内容、商务活动及社区等 ,动态地发布存储在企业内部和外部的各种信息 ,同时还可以支持网上的虚拟社区。企业信息门户强调对结构化与非结构化数据的收集、访问、管理和无缝集成 ,这类门户必须提供数据查询、分析和报告等基本功能 ,企业员工、合作伙伴、客户及供应商都可以通过企业信息门户方便地获取自己所需的信息。( 2 ) 企业知识门户企业知识门户 ( En te rp rise Know ledge Po rta l, EKP)是一个平台 ,该平台是知识加工平台、决策平台、知识发布与获取平台的集成 ,它使企业各部门职员之间的信息共享和交流更加流畅。这里的“知识 ”不仅包括数据库、文档、企业政策方针和过程手续等 ,甚至包括存在于员工头脑中的工作经验与专业技能等非具体化的信息资源。企业知识门户是企业信息门户的延伸与发展。信息门户的重点是信息的收集、整理及传输 , 有效利用企业已有的信息、知识和公共关系 ,并能收集、分析、增值、共享信息和知识。企业知识门户的重点是企业信息的加工与处理。企业知识门户的目的是使恰当的人在恰当的时间使用恰当的知识 ,企业信息门户主要通过数据挖掘、数据加工技术使零散的信息成为知识 ,供决策支持服务。( 3 ) 企业应用门户企业应用门户 ( En te rp rise App lica tion Po rta l, EA P)实际上是对企业业务流程的集成。它以商业流程和企业应用为核心 ,把商业流程中功能不同的应用模块通过门户技术集成在一起。从某种意义上说 ,我们可以把企业应用门户看成是企业信息系统的集成界面 ,企业员工和合作伙伴可以通过企业应用门户访问相应的应用系统 ,实现移动办公 ,进行网上交易等。以上 3类门户虽然在侧重点有所不同 ,但随着企业信息系统复杂程度的增加 ,越来越多的企业需要能够将以上 3 类门户有机地整合在一起的通用型企业门户 ,这已是一种趋势 ,我们在这里把它们统一称为企业门户。最后 ,让我们试图通过企业门户的作用来帮助读者理解企业门户的定义。维持客户的最基本战略因素是企业整体强大、互利关系网 , 包括客户、供应商、合作伙伴和员工本身。这些关系的培养主要通过各方之间的相互沟通和信任感 ———即各方及时收到相关信息、信息准确并且服务最优。企业门户被认为能够满足这种需要 ,通过使用户利用方便、可靠的工具接入实现有效的信息交换。或者说 , 企业门户能为用户提供建设信息型企业网站的应用 ,包括网站生成、信息发布、信息管理、信息反馈、网站管理等系统 ,实现企业网上形象展示及对外沟通的需求。3 有无必要建立企业门户在国外 ,特别是在美国 ,实施企业门户战略已经被列入了许多大企业的日程表中。与国外相比 ,国内了解企业门户概念的企业十分少 ,而计划建立企业门户的企业就更加微乎其微。但是 ,互联网在国内的发展速度相当迅速 ,中国企业建立自己的门户网站 ,为自己的客户、员工和代理商提供综合性服务的重要性不言而喻。从网络经济的特点来看 ,速度和知识是网络经济的两大支柱。首先 ,企业只有借助于网络才能获得发展的先机 , 这就要看谁能够以最迅捷的动作联系客户、供应商和代理商 ,组织生产和销售。毫无疑问 , 企业门户是实现上述目标最有力的手段。从资源利用的角度来看 , 企业门户是以最小可能成本 , 实现最大程度开发利用现有资源目标的可行途径。首先 ,企业门户将本需要占用多台不同硬件系统的应用集成到较少的系统设备上 ,从而节约硬件的投入。其次 , 减少了多种未经集成的应用软件的总体维护成本。除了新设立的企业 ,其他实施企业门户的企业都已有多种应用系统和以数据库、文档等形式存储的信息资源。这些资源往往条块分割 ,分散维护成本高昂。新的企业门户将现有的资源加以整合 ,并经过一定的处理 ,最后集成到企业门户这样一个统一的平台上 ,提供给更多的用户。由于它的继承和集成 ,企业可以实现集中维护 ,从而降低维护成本。第三 ,企业门户采用高效的互联网作为信息传输的工具 ,相比建设或租用线路价格低廉 ,同时减少了人力投入。第四 ,企业门户的实施可以改进企业的供应链管理 ,企业门户能够帮助企业实现真正意义上的零库存。由此看来 ,企业尤其是大中型企业 , 不论是从节约成本角度还是从提高竞争力角度考虑 , 建立企业门户都是有效的方法。4 如何建立企业门户既然企业门户功效如此之大 ,那么企业要想建立企业门户应该如何去操作 ? 一般来说 ,企业要成功地部署企业门户可按照如下几方面进行。( 1) 前期准备工作企业在建立企业门户之前 ,要进行大量的信息调查工作 ,弄清楚企业的商业信息是如何使用的。对于大多数企业而言 ,这意味着要进行商业信息应用的调查和研究。调查的目的是了解谁使用信息 ,信息如何使用 ,以及信息如何流入和流出。( 2) 产品与技术的选择在进行完信息的使用调查之后 ,企业就要选择门户产品和技术。门户软件不仅要满足商业信息和应用访问的需要 ,还要满足事先定义的技术层面 (如协议 )的要求。目前 ,由于有相当数量的公司推出了企业门户解决方案 ,这为企业提供了较大的选择余地。

据学术堂了解，毕业论文的文献综述一般包括：摘要、引言、主体和参考文献。　　一、摘要　　摘要一般在200字以内，是一段扼要地说明研究工作的目的、研究方法和最终结论等的简短的陈述，其中结论是摘要的重点。　　注意：摘要不能含有图表、冗长的公式以及非公知的符号、缩略语。　　二、引言　　引言，也叫前言、绪论，就是论文正文前面的一段话，是论文的开场白，向读者说明本研究的来龙去脉，吸引读者对此篇论文产生阅读的兴趣。引言内容大致包括：此项研究的历史背景和理论依据是什么？为什么要做这项研究？选择该题的理论或者实践依据是什么？有哪些创新点？本项研究在学术理论、实际应用中有哪些意义？　　引言的语言要求简洁，开门见山，避免篇幅过长，论述过于笼统，题不扣文。　　三、主体　　主体部分是综述的主体部分，写法多样，没有特定的格式综述，但是无论你选择哪种综述，都要将收集到的文献资料进行归纳、整理以及分析比较。　　1、主题的层次标题　　标题要简洁明了，不带标点符号，控制在15字以内。标题阶级划分及编号一概使用阿拉伯数字分级编号，一般用两级，第三级用圆括号（）中间加数字的形式标识。　　2、插图　　插图具有自明性，图片要清晰明了，切记不要与论文中文字和表格重复，插图下方要注明图序和图名。　　3、表格　　表格结构简洁，线条清晰，内容不应与论文内容和插图重复，最好使用三线表，可以适当加注辅助线，但是注意不要使用斜线和竖线，表格应该注明表序和表名。　　4、正文　　是综述的重点，没有固定的写法，只要能较好的表达综合的内容即可。正文主要包括论据和论证两个部分，通过提出问题、分析问题和解决问题，比较不同学者对同一问题的看法及其理论依据，进一步阐明问题的来龙去脉和作者自己的见解。　　正文需要运用好连接性语言，结构和层次要围绕观点自然展开，要有严谨的逻辑性。　　四、参考文献　　参考文献的多与少，可以体现作者阅读文献的广度和深度，虽然毕业论文并没有对参考文献的数量有硬性要求，一般以30条为宜。　　在选择文献时，要注意有些观点是否存在差异，所存在，则要特别说明；尽量多引用一次文献（即原始文献），避免二次文献可能存在较为片面的观点；尽量引用近几年的内容较新的文献，避免观点陈旧；建议引用与本研究有直接相关的经典文献。

文献综述是在确定选题后，在对选题所涉及的研究领域的文献进行广泛阅读和理解的基础上，对该领域的研究现状进行的综合分析、归纳整理和评论，通过了解选题的研究现状，发现前人研究中存在的问题，从而为自己的研究找到突破口和创新点。

数据挖掘最新的文献格式

参考文献[1] 李嶶，李宛州基于数据仓库技术的进销存系统的设计与实现2001(10)：93-94[2]Jiawei H数据挖掘概念与技术机械工业出版社2001，8 [3]WHI数据仓库机械工业出版社2000，5[4]林字等编著数据仓库原理与实践北京：人民邮电出版社，2003[5]张春阳，周继恩，刘贵全，蔡庆生基于数据仓库的决策支持系统的构建，计算机工程2002(4)：249-252[6]陈德军，盛翊智，陈绵云基于数据仓库的OLAP在DSS中的应用研究2003(1)：30-31[7]朱明，数据挖掘合肥：中国科技大学出版社2002，5[8] 陈京民等数据仓库与数据挖掘技术[M]北京:电子工业出版社,[9] 毛国君等数据挖掘原理与算法[M]北京:清华大学出版社,[10] 陈文伟等数据挖掘技术[M]北京:北京工业大学出版社,

数据表格式不对。weka没有处理事务表的格式吧？(有大侠知道有的话麻烦指正啊)，事务表格式用spss可以做。SQL转置处理一下或者写个脚本转置一下吧

严格来说，中药数据挖掘大部分包括了频率分析、聚类分析、因子分析、关联规则和复杂网络。这些分析，建议你最好整理成0和1的格式。就是一列为一个药物，一行为一个药方，用了这个药标记为1，没用标记为假如你实在不会整理，可以每个药方整理到一个单元格里，然后每个药物用逗号隔开，我们也可以处理成0和1格式的！

手动进行修改。参考文献是在学术研究过程中，对某一著作或论文整体参考的借鉴，如果参考文献格式不正确，知网查重就无法识别出来，那么论文参考文献也会被参与对比查重。只要对论文重复率影响不大，即使不改也可以的。知网查重时，参考文献四个字一定要独占一行，这样容易被系统识别，参考文献不建议用谷歌学术等工具来生成，很容易在查重时被标红的。按照论文中的参考文献顺序书写，标点符号在英文状态下。通远网络自成立之初就专注于数据挖掘技术的深度研究与创新应用，经过四年的锐意进取、稳步发展，已成功研发出一系列数据挖掘产品，在国内率先推出面向论文写作辅导和监督的Gocheck论文引用检测系统、面向科研管理部门科研文献新颖性评价的文献查新系统，以及功能强大的数据预测分析系统等产品，并为政府、金融、教育、能源、烟草等行业客户提供了优质完善的解决方案，在业界取得了良好的口碑。

数据挖掘的参考文献

相关范文：数据挖掘技术及其应用摘要：随着网络、数据库技术的迅速发畏以及数据库管理系统的广泛应用，人们积累的数据越来越多。数据挖掘(Data Mining)就是从大量的实际应用数据中提取隐含信息和知识，它利用了数据库、人工智能和数理统计等多方面的技术，是一类深层次的数据分析方法。关键词：数据挖掘；知识；分析；市场营销；金融投资随着网络、数据库技术的迅速发展以及数据库管理系统的广泛应用，人们积累的数据越来越多。由此，数据挖掘技术应运而生。下面，本文对数据技术及其应用作一简单介绍。一、数据挖掘定义数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中，提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。它是一种新的商业信息处理技术，其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理，从中提取辅助商业决策的关键性数据。简而言之，数据挖掘其实是一类深层次的数据分析方法。从这个角度数据挖掘也可以描述为：按企业制定的业务目标，对大量的企业数据进行探索和分析，揭示隐藏的、未知的或验证已知的规律性，并进一步将其模型化的先进有效的方法。二、数据挖掘技术数据挖掘技术是人们长期对数据库技术进行研究和开发的结果，代写论文其中数据仓库技术的发展与数据挖掘有着密切的关系。大部分情况下，数据挖掘都要先把数据从数据仓库中拿到数据挖掘库或数据集市中，因为数据仓库会对数据进行清理，并会解决数据的不一致问题，这会给数据挖掘带来很多好处。此外数据挖掘还利用了人工智能(AI)和统计分析的进步所带来的好处，这两门学科都致力于模式发现和预测。数据库、人工智能和数理统计是数据挖掘技术的三大支柱。由于数据挖掘所发现的知识的不同，其所利用的技术也有所不同。1．广义知识。指类别特征的概括性描述知识。根据数据的微观特性发现其表征的、带有普遍性的、较高层次概念的、中观和宏观的知识，反映同类事物的共同性质，是对数据的概括、精炼和抽象。广义知识的发现方法和实现技术有很多，如数据立方体、面向屙性的归约等。数据立方体的基本思想是实现某些常用的代价较高的聚集函数的计算，诸如计数、求和、平均、最大值等，并将这些实现视图储存在多维数据库中。而面向属性的归约是以类SQL语言来表示数据挖掘查询，收集数据库中的相关数据集，然后在相关数据集上应用一系列数据推广技术进行数据推广，包括属性删除、概念树提升、属性阈值控制、计数及其他聚集函数传播等。2．关联知识。它反映一个事件和其他事件之间依赖或关联的知识。如果两项或多项属性之间存在关联，那么其中一项的属性值就可以依据其他属性值进行预测。最为著名的关联规则发现方法是Apriori算法和FP—Growth算法。关联规则的发现可分为两步：第一步是迭代识别所有的频繁项目集，要求频繁项目集的支持率不低于用户设定的最低值；第二步是从频繁项目集中构造可信度不低于用户设定的最低值的规则。识别或发现所有频繁项目集是关联规则发现算法的核心，也是计算量最大的部分。3．分类知识。它反映同类事物共同性质的特征型知识和不同事物之间的差异型特征知识。分类方法有决策树、朴素贝叶斯、神经网络、遗传算法、粗糙集方法、模糊集方法、线性回归和K—Means划分等。其中最为典型的分类方法是决策树。它是从实例集中构造决策树，是一种有指导的学习方法。该方法先根据训练子集形成决策树，如果该树不能对所有对象给出正确的分类，那么选择一些例外加入到训练子集中，重复该过程一直到形成正确的决策集。最终结果是一棵树，其叶结点是类名，中间结点是带有分枝的屙性，该分枝对应该屙性的某一可能值。4．预测型知识。它根据时间序列型数据，由历史的和当前的数据去推测未来的数据，也可以认为是以时间为关键属性的关联知识。目前，时间序列预测方法有经典的统计方法、神经网络和机器学习等。1968年BoX和Jenkins提出了一套比较完善的时间序列建模理论和分析方法，这些经典的数学方法通过建立随机模型，进行时间序列的预测。由于大量的时间序列是非平稳的，其特征参数和数据分布随着时间的推移而发生变化。因此，仅仅通过对某段历史数据的训练，建立单一的神经网络预测模型，还无法完成准确的预测任务。为此，人们提出了基于统计学和基于精确性的再训练方法，当发现现存预测模型不再适用于当前数据时，对模型重新训练，获得新的权重参数，建立新的模型。5．偏差型知识。它是对差异和极端特例的描述，揭示事物偏离常规的异常现象，如标准类外的特例、数据聚类外的离群值等。所有这些知识都可以在不同的概念层次上被发现，并随着概念层次的提升，从微观到中观、到宏观，以满足不同用户不同层次决策的需要。三、数据挖掘流程数据挖掘是指一个完整的过程，该过程从大型数据库中挖掘先前未知的、有效的、可实用的信息，代写毕业论文并使用这些信息做出决策或丰富知识。数据挖掘的基本过程和主要步骤如下：过程中各步骤的大体内容如下：1．确定业务对象，清晰地定义出业务问题。认清数据挖掘的目的是数据挖掘的重要一步，挖掘的最后结构不可预测，但要探索的问题应该是有预见的，为了数据挖掘而挖掘则带有盲目性，是不会成功的。2．数据准备。(1)数据选择。搜索所有与业务对象有关的内部和外部数据信息，并从中选择出适用于数据挖掘应用的数据。(2)数据预处理。研究数据的质量，进行数据的集成、变换、归约、压缩等．为进一步的分析作准备，并确定将要进行的挖掘操作的类型。(3)数据转换。将数据转换成一个分析模型，这个分析模型是针对挖掘算法建立的，这是数据挖掘成功的关键。3．数据挖掘。对所得到的经过转换的数据进行挖掘。除了完善和选择合适的挖掘算法外，其余一切工作都能自动地完成。4．结果分析。解释并评估结果。其使用的分析方法一般应视挖掘操作而定，通常会用到可视化技术。5．知识同化。将分析所得到的知识集成到业务信息系统的组织结构中去。四、数据挖掘的应用数据挖掘技术从一开始就是面向应用的。目前在很多领域，数据挖掘都是一个很时髦的词，尤其是在如银行、电信、保险、交通、零售(如超级市场)等商业领域。1．市场营销。由于管理信息系统和P0S系统在商业尤其是零售业内的普遍使用，特别是条形码技术的使用，从而可以收集到大量关于用户购买情况的数据，并且数据量在不断激增。对市场营销来说，通过数据分析了解客户购物行为的一些特征，对提高竞争力及促进销售是大有帮助的。利用数据挖掘技术通过对用户数据的分析，可以得到关于顾客购买取向和兴趣的信息，从而为商业决策提供了可靠的依据。数据挖掘在营销业上的应用可分为两类：数据库营销(database markerting)和货篮分析(basket analysis)。数据库营销的任务是通过交互式查询、数据分割和模型预测等方法来选择潜在的顾客，以便向它们推销产品。通过对已有的顾客数据的辱淅，可以将用户分为不同级别，级别越高，其购买的可能性就越大。货篮分析是分析市场销售数据以识别顾客的购买行为模式，例如：如果A商品被选购，那么B商品被购买的可能性为95％，从而帮助确定商店货架的布局排放以促销某些商品，并且对进货的选择和搭配上也更有目的性。这方面的系统有：Opportunity Ex-plorer，它可用于超市商品销售异常情况的因果分析等，另外IBM公司也开发了识别顾客购买行为模式的一些工具(IntdligentMiner和QUEST中的一部分)。2．金融投资。典型的金融分析领域有投资评估和股票交易市场预测，分析方法一般采用模型预测法(如神经网络或统计回归技术)。代写硕士论文由于金融投资的风险很大，在进行投资决策时，更需要通过对各种投资方向的有关数据进行分析，以选择最佳的投资方向。无论是投资评估还是股票市场预测，都是对事物发展的一种预测，而且是建立在对数据的分析基础之上的。数据挖掘可以通过对已有数据的处理，找到数据对象之间的关系，然后利用学习得到的模式进行合理的预测。这方面的系统有Fidelity Stock Selector和LBS Capital Management。前者的任务是使用神经网络模型选择投资，后者则使用了专家系统、神经网络和基因算法技术来辅助管理多达6亿美元的有价证券。3．欺诈甄别。银行或商业上经常发生行为，如恶性透支等，这些给银行和商业单位带来了巨大的损失。对这类行为进行预测可以减少损失。进行甄别主要是通过总结正常行为和行为之间的关系，得到行为的一些特性，这样当某项业务符合这些特征时，可以向决策人员提出警告。这方面应用非常成功的系统有：FALCON系统和FAIS系统。FALCON是HNC公司开发的信用卡欺诈估测系统，它已被相当数量的零售银行用于探测可疑的信用卡交易；FAIS则是一个用于识别与洗钱有关的金融交易的系统，它使用的是一般的政府数据表单。此外数据挖掘还可用于天文学上的遥远星体探测、基因工程的研究、web信息检索等。结束语随着数据库、人工智能、数理统计及计算机软硬件技术的发展，数据挖掘技术必能在更多的领域内取得更广泛的应用。参考文献：[1]闫建红《数据库系统概论》的教学改革与探索[J]．山西广播电视大学学报，2006，(15)：16—17．其他相关：数据挖掘研究现状及最新进展（CAJ格式）仅供参考，请自借鉴希望对您有帮助补充：如何撰写毕业论文本科专业（含本科段、独立本科段）自考生在各专业课程考试成绩合格后，都要进行毕业论文的撰写（工科类专业一般为毕业设计、医科类一般为临床实习）及其答辩考核。毕业论文的撰写及答辩考核是取得高等教育自学考试本科毕业文凭的重要环节之一，也是衡量自考毕业生是否达到全日制普通高校相同层次相同专业的学力水平的重要依据之一。但是，由于许多应考者缺少系统的课堂授课和平时训练，往往对毕业论文的独立写作感到压力很大，心中无数，难以下笔。因此，对本科专业自考生这一特定群体，就毕业论文的撰写进行必要指导，具有重要的意义。本文试就如何撰写毕业论文作简要论述，供参考。毕业论文是高等教育自学考试本科专业应考者完成本科阶段学业的最后一个环节，它是应考者的总结性独立作业，目的在于总结学习专业的成果，培养综合运用所学知识解决实际问题的能力。从文体而言，它也是对某一专业领域的现实问题或理论问题进行科学研究探索的具有一定意义的论说文。完成毕业论文的撰写可以分两个步骤，即选择课题和研究课题。首先是选择课题。选题是论文撰写成败的关键。因为，选题是毕业论文撰写的第一步，它实际上就是确定“写什么”的问题，亦即确定科学研究的方向。如果“写什么”不明确，“怎么写”就无从谈起。教育部自学考试办公室有关对毕业论文选题的途径和要求是“为鼓励理论与工作实践结合，应考者可结合本单位或本人从事的工作提出论文题目，报主考学校审查同意后确立。也可由主考学校公布论文题目，由应考者选择。毕业论文的总体要求应与普通全日制高等学校相一致，做到通过论文写作和答辩考核，检验应考者综合运用专业知识的能力”。但不管考生是自己任意选择课题，还是在主考院校公布的指定课题中选择课题，都要坚持选择有科学价值和现实意义的、切实可行的课题。选好课题是毕业论文成功的一半。第一、要坚持选择有科学价值和现实意义的课题。科学研究的目的是为了更好地认识世界、改造世界，以推动社会的不断进步和发展。因此，毕业论文的选题，必须紧密结合社会主义物质文明和精神文明建设的需要，以促进科学事业发展和解决现实存在问题作为出发点和落脚点。选题要符合科学研究的正确方向，要具有新颖性，有创新、有理论价值和现实的指导意义或推动作用，一项毫无意义的研究，即使花很大的精力，表达再完善，也将没有丝毫价值。具体地说，考生可从以下三个方面来选题。首先，要从现实的弊端中选题，学习了专业知识，不能仅停留在书本上和理论上，还要下一番功夫，理论联系实际，用已掌握的专业知识，去寻找和解决工作实践中急待解决的问题。其次，要从寻找科学研究的空白处和边缘领域中选题，科学研究还有许多没有被开垦的处女地，还有许多缺陷和空白，这些都需要填补。应考者应有独特的眼光和超前的意识去思索，去发现，去研究。最后，要从寻找前人研究的不足处和错误处选题，在前人已提出来的研究课题中，许多虽已有初步的研究成果，但随着社会的不断发展，还有待于丰富、完整和发展，这种补充性或纠正性的研究课题，也是有科学价值和现实指导意义的。第二、要根据自己的能力选择切实可行的课题。毕业论文的写作是一种创造性劳动，不但要有考生个人的见解和主张，同时还需要具备一定的客观条件。由于考生个人的主观、客观条件都是各不相同的，因此在选题时，还应结合自己的特长、兴趣及所具备的客观条件来选题。具体地说，考生可从以下三个方面来综合考虑。首先，要有充足的资料来源。“巧妇难为无米之炊”，在缺少资料的情况下，是很难写出高质量的论文的。选择一个具有丰富资料来源的课题，对课题深入研究与开展很有帮助。其次，要有浓厚的研究兴趣，选择自己感兴趣的课题，可以激发自己研究的热情，调动自己的主动性和积极性，能够以专心、细心、恒心和耐心的积极心态去完成。最后，要能结合发挥自己的业务专长，每个考生无论能力水平高低，工作岗位如何，都有自己的业务专长，选择那些能结合自己工作、发挥自己业务专长的课题，对顺利完成课题的研究大有益处。选好课题后，接下来的工作就是研究课题，研究课题一般程序是：搜集资料、研究资料，明确论点和选定材料，最后是执笔撰写、修改定稿。第一、研究课题的基础工作———搜集资料。考生可以从查阅图书馆、资料室的资料，做实地调查研究、实验与观察等三个方面来搜集资料。搜集资料越具体、细致越好，最好把想要搜集资料的文献目录、详细计划都列出来。首先，查阅资料时要熟悉、掌握图书分类法，要善于利用书目、索引，要熟练地使用其他工具书，如年鉴、文摘、表册、数字等。其次，做实地调查研究，调查研究能获得最真实可靠、最丰富的第一手资料，调查研究时要做到目的明确、对象明确、内容明确。调查的方法有：普遍调查、重点调查、典型调查、抽样调查。调查的方式有：开会、访问、问卷。最后，关于实验与观察。实验与观察是搜集科学资料数据、获得感性知识的基本途径，是形成、产生、发展和检验科学理论的实践基础，本方法在理工科、医类等专业研究中较为常用，运用本方法时要认真全面记录。第二、研究课题的重点工作———研究资料。考生要对所搜集到手的资料进行全面浏览，并对不同资料采用不同的阅读方法，如阅读、选读、研读。通读即对全文进行阅读，选读即对有用部分、有用内容进行阅读，研读即对与研究课题有关的内容进行全面、认真、细致、深入、反复的阅读。在研读过程中要积极思考。要以书或论文中的论点、论据、论证方法与研究方法来触发自己的思考，要眼、手、脑并用，发挥想象力，进行新的创造。在研究资料时，还要做好资料的记录。第三、研究课题的核心工作―――明确论点和选定材料。在研究资料的基础上，考生提出自己的观点和见解，根据选题，确立基本论点和分论点。提出自己的观点要突出新创见，创新是灵魂，不能只是重复前人或人云亦云。同时，还要防止贪大求全的倾向，生怕不完整，大段地复述已有的知识，那就体现不出自己研究的特色和成果了。根据已确立的基本论点和分论点选定材料，这些材料是自己在对所搜集的资料加以研究的基础上形成的。组织材料要注意掌握科学的思维方法，注意前后材料的逻辑关系和主次关系。第四、研究课题的关键工作―――执笔撰写。考生下笔时要对以下两个方面加以注意：拟定提纲和基本格式。拟定提纲包括题目、基本论点、内容纲要。内容纲要包括大项目即大段段旨、中项目即段旨、小项目即段中材料或小段段旨。拟定提纲有助于安排好全文的逻辑结构，构建论文的基本框架。基本格式：一般毕业论文由标题、摘要、正文、参考文献等4方面内容构成。标题要求直接、具体、醒目、简明扼要。摘要即摘出论文中的要点放在论文的正文之前，以方便读者阅读，所以要简洁、概括。正文是毕业论文的核心内容，包括绪论、本论、结论三大部分。绪论部分主要说明研究这一课题的理由、意义，要写得简洁。要明确、具体地提出所论述课题，有时要写些历史回顾和现状分析，本人将有哪些补充、纠正或发展，还要简单介绍论证方法。本论部分是论文的主体，即表达作者的研究成果，主要阐述自己的观点及其论据。这部分要以充分有力的材料阐述观点，要准确把握文章内容的层次、大小段落间的内在联系。篇幅较长的论文常用推论式（即由此论点到彼论点逐层展开、步步深入的写法）和分论式（即把从属于基本论点的几个分论点并列起来，一个个分别加以论述）两者结合的方法。结论部分是论文的归结收束部分，要写论证的结果，做到首尾一贯，同时要写对课题研究的展望，提及进一步探讨的问题或可能解决的途径等。参考文献即撰写论文过程中研读的一些文章或资料，要选择主要的列在文后。第五、研究课题的保障工作―――修改定稿。通过这一环节，可以看出写作意图是否表达清楚，基本论点和分论点是否准确、明确，材料用得是否恰当、有说服力，材料的安排与论证是否有逻辑效果，大小段落的结构是否完整、衔接自然，句子词语是否正确妥当，文章是否合乎规范。总之，撰写毕业论文是一种复杂的思维活动，对于缺乏写作经验的自考生来说，确有一定的难度。因此，考生要“学习学习再学习，实践实践再实践”，虚心向指导教师求教。

首页

> 论文期刊知识库

数据挖掘最新的文献

数据挖掘最新的文献

数据挖掘最新的文献类型

数据挖掘最新的文献综述

数据挖掘最新的文献格式

数据挖掘的参考文献

相关百科

数据挖掘最新的文献

数据挖掘最新的文献综述

数据挖掘类论文

数据挖掘论文参考文献

有关数据挖掘的论文

数据挖掘方面的论文

数据挖掘参考文献

数据挖掘,杂志

数据挖掘论文

数据挖掘的参考文献

热门百科

西方建筑论文相关文献有哪些

山东大学社科期刊等级分类

韩国建筑文化论文题目大全

环境专业毕业论文题目推荐

青海社会科学投稿经验介绍信格式