免费论文查重: 大雅 万方 维普 turnitin paperpass

浅议计算机故障检测中数据挖掘运用

最后更新时间:2024-01-15 作者:用户投稿原创标记本站原创 点赞:4888 浏览:14179
论文导读:
摘 要 伴随计算机技术的迅速发展和广泛应用,计算机故障检测难题逐渐被人们所关注。为了提高计算机故障检测效率,本文将数据挖掘技术引入到了计算机实验室管理当中,通过创建挖掘模型,提取相关数据能够有效查询计算机故障信息,准确实现了故障预测查询,对提升计算机故障检测效率大有裨益。
关键词 计算机故障;数据挖掘;模型建立;故障预测
1671-7597(2014)17-0076-02
当今全球经济发展速度迅猛,人们对数据资源的要求也越来越高,但是在实际运用过程中,计算机故障频发与实际检测技术不成熟之间的矛盾也越来越大。数据挖掘是目前数据库和人工智能研究领域最为关注的话题之一,通过数据挖掘来发掘其中潜在的信息,提取有用的信息数据,具有广泛而强大的应用潜力。尤其是在高校计算机信息机房当中,应用数据挖掘技术,一旦出现理由,管理人员不必采用传统的策略对每一台计算机进行检测,而通过数据挖掘技术为能为管理人员提供具有价值的参考信息,及时找出故障理由,极大提高了工作效率。
1 数据挖掘技术概述
数据挖掘,顾名思义就是从数据库当中发现知识,根据人们的需要,在模糊的、大量的、随机的数据库当中寻找有用的信息。通常情况下,数据挖掘处理的对象范围非常大,除了完好的文件之外,其他处于半结构或者结构化的信息也能在搜寻出来。在数据挖掘处理的过程中,需要经过非常繁杂的程序步骤,主要的过程可以分为四大部分,如图1所示。
图1 数据挖掘过程简图

1.1 数据准备

在数据准备环节,需要经历三个阶段,即:数据的选取、预处理以及变换。在准备环节,将原始数据变成标准化数据,并对其中的错误数据和丢失的数据进行处理,其中的预处理就是针对存在的错误数据进行清除,对于数据会根据属性进行合并,以便在进行数据处理变换的过程更加便捷,而经过最后的数据变换后,复杂的数据将会根据一定的程序被转换成标准
形式。

1.2 数据挖掘

数据挖掘是非常关键的步骤,在进行数据处理之前,根据理由来进行分析,明确具体的数据挖掘任务或者目的。在确定挖掘任务后,选取正确的算数参数,合成得到知识模式。通常情况下,挖掘参数的选择需要从两个方面来进行综合考虑,一是要根据所挖掘数据的特点来进行分析考虑:二是根据数据挖掘的实际需要和系统要求来获取预测准确度较高的预测性知识。常见的数据挖掘算法有计算机故障检测中数据挖掘的运用相关论文由www.7ctime.com收集,如需论文.Apriori算法、决策树、K-means算法等。

1.3 模式评估

模式的评估关键取决于用户感兴趣程度,数据挖掘系统在宽泛的条件设定下能够产生成千上万种模式和规则,在这些已产生的模式当中,可能仅有部分是用户感兴趣的,这些模式就是可用的知识。通过将感兴趣的模式提取出来,并进行兴趣度测评,得出最终能够代表知识,真正有用的模式。

1.4 知识表示

知识表示即通过上述流程,筛选出有价值的知识信息,知识的发现是一个非常复杂循环的过程。将挖掘的有用的知识提供给用户,在此基础上进行进一步的评估,所含的信息数据必定会夹杂需要无用的信息,进行清理后得到最终有用的模式。通常情况下,数据挖掘发现的知识有五种,即:关联知识、预测型知识、广义知识、偏差知识以及关联知识。据此分门别类之后以最简单的形式进行保存供用户参考。
2 数据挖掘在计算机故障检测中的应用分析

2.1 挖掘模型定义

以学校计算机实验室为例,进行数据挖掘模型定义首先要进行数据收集。从实验室管理系统中获取最近使用时间以及故障维修记录,根据系统当中记录的数据统计出一定周期内计算机的故障状态,使用频率和时间,将所得的统计信息存储在数据库中的新建表格中,便于创建模型、训练模型和预测评价模型等。需要注意的是,根据挖掘模型的准确性来确定最终的统计周期,并不可以随意而定,是一个迭代的过程。
挖掘模型的属性与实际计算机的使用情况密切相关,其中包含了机器号、上机次数、使用时间,故障类型以及机器状态等。进行预测的属性属于机器状态,采用Microsoft决策树算法。

2.2 训练模型

根据设定的挖掘模型,会发现从根节点到叶节点的每一条路径都会形成一条关于数据的规则,而不同的规则也代表着不同类型的机器故障类型,总的可以分为三种,第一种类型故障,机器使用时间总长小于1032分钟,发生故障的概率是40.38%,可见此类型故障发生的几率是最大的,并且大致可判断出严重计算机故障,如内存、显卡等严重故障类型,会直接影响到计算机的正常使用。
第二类型故障:机器使用时间总长大于1032分钟,且换机使用频率较为频繁,导致出现的第二层故障发生概率为5.67%,第三层故障发生概率是3.6%,一般情况下此类故障出现的几率最小,而且可以大致推断出此类情况是由于数据源“噪声”和无效数据造成的,使用过程基本上可以忽略。在实际使用过程中,不难发现,导致计算机出现故障最大的因素是使用的时长,其次是频繁换机次数。据此反复选择有关属性来创建和训练模型就能够确定最准确的模型。当然,除此之外,也可以先建立一个贝叶斯算法模型,先找到影响计算机状态最明显的属性,然后再据此建立决策树算法模型。

2.3 使用挖掘模型进行预测

在最后的预测过程,采用挖掘模型对输入数据进行分析预测。基于BIDev Studio平台中“挖掘模型预测”窗口能够构建和编辑预测查询,最终所得的结果会保存在一个表格当中,如图2所示的内容就是在基于BIDev Studio平台中通过查询生成器所得出的预测结果。
图2 挖掘模型预测图
在图2中所显示的查询结果,可以非常清楚地看到机器号、正常状态的概率以及实际机器所处的状态。正常概率数据的计算是根据机器状态来进行预测的,并根据概率大小进行了升降排序,通过实际机器状态与所发生概率进行对比能够列出大致的计算机故障种类。据此策略对比可以看出,实际故障机器预测为正常状态的机器号为A02-01、A04-06、A01-14、A02-07、A01-17,所对应的概率都非常低,而且都是属于第一论文导读:掘技术,能够对复杂、庞大的信息数据进行挖掘和处理,根据故障信息来寻找其中存在的规律,获取有用的知识,并与原有正常的数据进行对比,择取检测来排除分析出计算机存在的故障和理由。本文论述的数据挖掘技术能够在实际的应用过程中提出较为完善的解决方案,创建挖掘模型,对数据信息进行分类,有效训练挖掘模型后,能够实现较为准确
种类型故障,可见采取此策略得出的预测结果十分准确。
3 结束语
伴随着信息技术的不断发展,计算机广泛应用的同时也带来了故障检测和处理等难点理由。通过应用数据挖掘技术,能够对复杂、庞大的信息数据进行挖掘和处理,根据故障信息来寻找其中存在的规律,获取有用的知识,并与原有正常的数据进行对比,择取检测来排除分析出计算机存在的故障和理由。本文论述的数据挖掘技术能够在实际的应用过程中提出较为完善的解决方案,创建挖掘模型,对数据信息进行分类,有效训练挖掘模型后,能够实现较为准确的预测查询,能够迅速找出故障计算机和理由,极大提高了工作效率。
参考文献
[1]柴文光,周宁.网络信息安全防范与Web数据挖掘技术的整合研究[J].情报理论与实践,2009(03).
[2]刘春茂.基于GA-CLARANS数据挖掘技术的移动通信网络故障检测专家系统[J].信息与电脑(理论版),2014(01).
[3]樊静,林初善,廖晓闽,李彬.基于数据挖掘的光传送网故障管理系统构建[J].中国科技信息,2011(08).
[4]关德君.基于数据挖掘的网络教学平台决策支持系统研究[J].轻工科技,2013(11).
作者简介
黄应红(1976-),男,汉族,重庆人,讲师,学士,研究方向:计算机应用与教学等。