当前位置:萝卜系统 > 硬件软件教程 > 详细页面

学习笔记(1)数据挖掘的概念与技术

学习笔记(1)数据挖掘的概念与技术

更新时间:2023-06-24 文章作者:未知 信息来源:网络 阅读次数:

根据运行的环境,操作系统可以分为桌面操作系统,手机操作系统,服务器操作系统,嵌入式操作系统等。

数据挖掘概念与技术_挖掘技术哪家强_规则挖掘技术

1数据仓库和:

数据仓库是用于长期存储数据的仓库. 这些数据来自多个数据源,并进行组织以支持管理决策. 这些数据存储在统一模型中,通常会进行汇总. 数据仓库提供了一些数据分析功能,称为分析处理.

: 传统关系的主要应用.

数据挖掘概念与技术_挖掘技术哪家强_规则挖掘技术

2数据挖掘功能

特征: 研究类别(目标类别)的一般摘要数据挖掘概念与技术,通常通过查询来收集与用户指定类别相对应的数据. 例如: 对执行SQL查询以收集产品数据.

区分: 将目标数据对象的一般特征与一个或多个对比对象的一般特征进行比较.

规则挖掘技术_数据挖掘概念与技术_挖掘技术哪家强

频繁模块: 频繁项目集(频繁项目集挖掘是频繁模式挖掘的基础),频繁子序列和频繁子结构. ->在数据中发现的兴趣和相关性分析: buys(X数据挖掘概念与技术,“ computer”)=> buys(X,“ software”)[support = 1%,confidence = 50%] 50%的信心和1%的支持. 涉及单个重复的属性或谓词(“购买”)称为一维关联规则. 多维关联规则的示例: age(X,“ 20 ... 29”)

\wedge

收入(X,“ 40K..49K”)= >>购买(X,“笔记本电脑”)[support = 2%,confidence = 60%](解释: 年龄收入对购买的影响)

挖掘技术哪家强_数据挖掘概念与技术_规则挖掘技术

如果关联规则不能同时满足最小支持阈值和最小置信度阈值,则将其视为无趣的. ,

相关性分析: 在分类和回归之前,请尝试识别与分类和回归过程显着相关的属性.

分类: 找到描述和区分数据类或概念的模型. 一次,您可以使用模型来预测带有类标签的未知对象的类标签. 例如决策树,神经网络

数据挖掘概念与技术_规则挖掘技术_挖掘技术哪家强

回归: 建立一个连续值函数模型,用于预测实际或难以获得的数值数据,而不是类标签.

聚类: 分析对象不考虑标签,而是根据最大化类内相似度并最小化类间相似度的原理进行聚类或分组.

异常值分析: 都异常挖掘. 可以通过统计检查来检测它,并将其应用于欺诈检测.

3一个有趣的模型: (1)易于理解(2)在一定的置信度内,对新数据或测试数据有效(3)可能有用的(4)新颖

4种数据挖掘技术


本文来自本站,转载请注明本文网址:
http://www.pc-fly.com/a/jisuanjixue/article-249494-1.html



温馨提示:喜欢本站的话,请收藏一下本站!

本类教程下载

系统下载排行

网站地图xml | 网站地图html