主页 > 新闻资讯 > 数据挖掘主要技术:数据挖掘技术简介

数据挖掘主要技术:数据挖掘技术简介

作者:张老师 浏览次数: 2020-09-09 17:21
高度发达的互联网,带来了足够丰富的数据,也成为支持大数据快速发展的重要资源,要从海量的数据当中去获取价值,离不开数据挖掘技术和数据挖掘人才的支持。今天我们主要来讲讲数据挖掘主要技术,对数据挖掘技术做个简单的介绍。

数据挖掘需要从大量的、不完全的、有噪声的、模糊的、随机的数据中,去获取到隐藏其中的价值信息,这个过程,就是从数据集中发现模式的过程。

数据挖掘主要技术

数据挖掘,按照功能可以划分为两大类:预测性(Predictive)模式和描述性(Descriptive)。在预测性和描述性之下,继续细分,还可以分为分类,估值,预测,相关性分析,序列,时间序列,描述和可视化等。

数据挖掘需要依据不同的场景不同的需求去选择合适的技术方法,下面例举的是比较主要的几类:

1、统计技术

统计技术对数据集进行挖掘的主要思想是,统计的方法对给定的数据集合假设了一个分布或者概率模型(例如一个正态分布),然后根据模型采用相应的方法来进行挖掘。

2、关联规则

数据关联是数据库中存在的一类重要的可被发现的知识。若两个或多个变量的取值之I司存在某种规律性,就称为关联。关联可分为简单关联、时序关联、因果关联。关联分析的目的是找出数据库中隐藏的关联网。

3、遗传算法GA(Genetic Algorithms)

基于进化理论,并采用遗传结合、遗传变异、以及自然选择等设计方法的优化技术。主要思想是:根据适者生存的原则,形成由当前群体中最适合的规则组成新的群体,以及这些规则的后代。

4、聚集检测

将物理或抽象对象的集合分组成为由类似的对象组成的多个类的过程被称为聚类。由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其它簇中的对象相异。

5、连接分析

连接分析,Link analysis,它的基本理论是图论。利用连接分析,可以从一些用户的行为中分析出一些模式;同时将产生的概念应用于更广的用户群体中。

6、决策树

决策树提供了一种展示类似在什么条件下会得到什么值这类规则的方法。

7、回归分析

回归分析分为线性回归、多元回归和非线性同归。在线性回归中,数据用直线建模,多元回归是线性回归的扩展,涉及多个预测变量。非线性回归是在基本线性模型上添加多项式项形成非线性同门模型。

8、差别分析

差别分析的目的是试图发现数据中的异常情况,如噪音数据,欺诈数据等异常数据,从而获得有用信息。

关于数据挖掘主要技术,数据挖掘技术简介,以上就是今天的分享内容了。所谓数据挖掘技术,其实更多就是对于数学算法的应用,如果数学基础好的话,学起来也是能够更快的。成都加米谷大数据,专业大数据培训机构,大数据开发、数据分析与挖掘,零基础学习班,本月正在招生中,课程大纲及试听课程,可联系客服获取!
热点排行
推荐文章
立即申请>>