<form id="hvrjf"></form>

          <noframes id="hvrjf">

              <address id="hvrjf"></address>

                <address id="hvrjf"></address>
                <address id="hvrjf"><listing id="hvrjf"><meter id="hvrjf"></meter></listing></address>
                  <address id="hvrjf"><address id="hvrjf"><listing id="hvrjf"></listing></address></address>

                  <noframes id="hvrjf"><address id="hvrjf"></address>
                  <address id="hvrjf"></address>

                    <form id="hvrjf"><th id="hvrjf"><progress id="hvrjf"></progress></th></form>

                      <address id="hvrjf"></address>

                      浅析数据挖掘中的分类算法

                      作者:何峡峰时间:2015-12-16 13:47:03  来源:www.cjjfamily.com  阅读次数:1400次 ]
                      【文章摘要】
                      分类算法在数据挖掘中的应用,可以避免出现传统数据挖掘弊端,同时提高挖掘数据的应用有效性。本文结合具体实例,分析数据挖掘中的分裂算法。
                      【关键词】
                      数据挖掘;分类算法;应用
                      针对数据挖掘中,应用分类算法,可以解决数据量大、计算复杂性高问题,提升数据挖掘的速率?梢栽谑萃诰蛑,引入分类算法内容,并可以结合实际的数据挖掘情况,再去选择合适的分类算法,有效分析数据信息,使数据挖掘工作更加实用性,以下本篇对此做具体分析。
                      1 数据挖掘中的不同分类算法
                      1.1 分类训练算法
                      针对分类算法中,分类训练算法就是针对训练样本多的样本,其中大多为非支持数据信息, 占用了计算和内存上的大量资源, 在每次的优化过程中, 通过迭代方式排除非支持数据信息,只保留当前支持数据信息, 节省计算时间与内存空间。数据挖掘中,采用分类算法,可以随机选择较少样本作初始样本集,在问题求解后从结果内去掉非支持数据信息, 再根据训练结果对剩余样本数据进行检验, 然后再将不符合优化条件的一部分样本与数据合并,使其成为新的训练样本集, 重新训练, 直到获得最优训练结果。
                      1.2 分类决策算法
                      分类决策算法中,应用决策树作为预测模型,决策树代表的是对象属性同对象值间映射关系。决策树中每个节点表示某个对象,而决策树每个分叉路径,则代表决策树中的某个可能属性值,而决策树中的每个叶结点,则对应从决策树根节点到该叶节点中,所有经历的路径对象值。在决策树中不仅有单一输出,还包含有复数输出,可以建立独立决策树,这样就可以处理不同输出。
                      1.3 SLIQ 分类算法
                      SLIQ 分类算法对分类决策树算法进行改进,采用“预排序”、“广度优先”两种技术?梢栽诰霾呤鞯拿扛鼋岬闵,都对数据集进行排序,并且为需要进行训练集的数据,在每个的属性上创建出一个属性列表,给每个元组类别上创建类别列表, 利用数据库保存类别列表,有效提升算法计算速度。
                      2 分类算法在数据挖掘中的应用实例分析
                      2.1 应用分类算法实例一
                      应用分类算法可以挖掘出有用的煤矿瓦斯控制信息,对改善企业的发展进度产生积极影响。首先可以先建立决策树, 然后再根据在瓦斯监测中的数据特点, 将状态维作为本次的分类类别。取正常状态维是P 类( 正例) , 报警状态维是Q 类( 反例) ,然后建立相应的决策树进行数据挖掘。如下图1 中所示:
                      在本次所建立的决策树中,包括甲烷传感器、传感器以及风速传感器,对每个维成员的数据信息进行增益率计算, 将传感器最大信息增益率维当做一个决策属性的节点, 在通过为属性的取值来建立本节点的分支。要求分类面能将两类样本点分开,并且保证两分类空隙最大。对于其d 维空间中的线性判别函数,若是一般形式为,则分类面方程就是,然后在将判别函数进行归一化,确保两类样本满足,分类面样本都正确分类
                      。
                      两类样本的分类空隙间隔大小为:
                      最优分类面表示成约束优化问题,求函数最小值
                      可以定义函数Lagrange :
                      基于决策树的数据挖掘里面瓦斯浓度维,计算出信息的增益率, 以此来作为决策树中的根结点,提高数据挖掘的效益。
                      2.2 应用分类算法实例二
                      针对校园教学系统,对其数据进行数据挖掘,应用分类算法进行数据挖掘,首先,就是应该确定出需要解决的一些目标问题,并设置数据挖掘模型。对于其数据挖掘步骤如下图2 所示:
                      分类是已知一共有多少类, 并明确知道该类的特点, 然后把未知的按一定规则分到某一个类中;分类可以多可以少, 当然数据量大才能很好地说明分类算法的优异. 但实际上分类算法在确定某些规则后, 你可以只有一个未知的数据也可以把它分到某一个类别当中。
                      class CAdodc : public CWnd
                      {protected: DECLARE_DYNCREATE ( CAdodc)
                      public: CLSID const& GetClsid()
                      {
                      s t a t i c C L S I D c o n s t c l s i d = { 0x67397aa3, 0x7fb1, 0x11d0, { 0xb1, 0x48, 0x0, 0xa0, 0xc9, 0x22, 0xe8, 0x20 }
                      };
                      return clsid;
                      }
                      virtual BOOL Create( LPCTSTR lpsz ClassName,
                      L P C T S T R l p s z WindowName, DWORD dwStyle,
                      const RECT& rect,
                      CWnd* pParentWnd, UINT nID,
                      C C r e a t e C o n t e x t * pContext = NULL)
                      { return Create Control ( GetClsid(), lpszWindowName,
                      dwStyle, rect, pParentWnd, nID); }
                      BOOL Create (
                      LPCTSTR lpsz WindowName, DWORD dwStyle,
                      const RECT& rect,
                      CWnd* pParentWnd, UINT nID,
                      CFile* pPersist = NULL,
                      BOOL bStorage = FALSE,
                      B S T R b s t r L i c K e y = NULL)
                      { return CreateControl( GetClsid(), lpsz Window Name, dwStyle, rect, p Parent Wnd, nID,
                      p P e r s i s t , b S t o r a g e , bstrLicKey); }
                      在分类算法中,还可以可以应用模糊分类的方法,对U 之中国的单因素Ui(i=1,2,…,m),可以对其进行单因素的评价,然后可以根据因素ui 来确定处事物的评价等级,计算出vj(j=1,2,…,n) 隶属度, 可以得到ri=(ril,ri2,…,rin) 向量,从而得到评价矩阵:
                      R 作为因素集U 以及评价集V 的模糊关系,可以用(ui,vj)=rij 来表示因素u;箍梢越心:浠皇迪肿酆掀兰郏
                      = A × = ( a 1 , a 2 , a 3 , … ,an)× = (bi1,bi2,bi3,bi4)
                      其中,bik= (aij ∧ rijk) (i=1,2,3 ; k=1,2,3,4)
                      3 结语
                      综上所述,针对数据挖掘中,应用分类算法,不仅可以提升数据挖掘中算法运行效率,还可以在数据挖掘中动态调用不同分类算法,使数据挖掘工作可以在稳定、高效环境中进行,对数据进行分类,大大提高数据挖掘中算法的性能与效率,发挥实际应用价值。
                      【参考文献】
                      [1] 甘杨兰, 赵梅, 牛森等. 基于云仿真环境数据挖掘的服务分类方法[J]. 计算机仿真,2014,31(10):460- 465.
                      [2] 李学明, 杨阳, 秦东霞等. 基于频繁闭项集的新关联分类算法ACCF[J]. 电子科技大学学报,2012,41(1):104-109.
                      [3] 覃梅. 数据挖掘分类算法在信用卡风险管理中的应用[J]. 现代计算机(专业版),2013,(13):13-16.

                      本站论文资源均为来自网络转载,免费提供给广大作者参考,不进行任何赢利,如有版权问题,请联系管理员删除! 快速论文发表网(www.cjjfamily.com)本中心和国内数百家期刊杂志社有良好的合作关系,可以帮客户代发论文投稿.

                      投稿邮箱:[email protected]
                      客服Q  Q: 论文发表在线咨询82702382
                      联系电话:15295038833

                      本站论文资源均为来自网络转载,免费提供给广大作者参考,不进行任何赢利,如有版权问题,请联系管理员删除!

                      广告推荐

                      文章评论

                      共有 0 位网友发表了评论

                      阅读排行

                      推荐文章

                      最新文章

                      明发彩票提现提不出来|官网_首页