首页解决方案公部门资料探勘分析应用
公部门资料探勘分析应用

随着电脑技术的发展,资料的存储量成倍增长,而海量资料分析方法的发展却难以望其项背,资料探勘(Data Mining)技术就是在这样的“资料海洋、知识荒漠”的情况下应运而生。公部门将可透过资料探勘技术的应用,为民众带来更多的便利性,并且可获得施政最直接的回馈(Feedback)。

资料探勘应用的最基本要件为在各类资料库的建置、连结与资料的流通、整合,当被用以探勘的资料为可辨识个人的资料;当政府资料库或资料交换平台的使用者可透过探勘技术,将分散的个人片段生活纪录加以整合、辨识属性与分类进行资料剖绘(Profiling)时,资料探勘应用便成为一项改善公部门行政效率的一大利器。国际间目前最受瞩目的资料探勘应用计划,当推美国国土安全部自911恐怖攻击事件后推展的一系列边境防御措施:相关措施更扩及至对欧洲籍航空业者提交旅客资料之要求。国内劳保局亦运用资料探勘技术进行资料的比对,劳退新制实施后,退休准备金将由劳保局统一管理,劳保长期存在的低报投保薪资情况,将因退休金与劳保费一并汇入劳保局管理而“现形”,藉由雇主投保薪资和提拨退休准备金的工资标准作比较,让短缴的黑数全部曝光。所以资料探勘分析是从海量的资料中发现潜在规律,提取有用知识的方法和技术,它不仅能分析现有的问题,也能预测未来的趋势,且分析的结果易于理解与应用,因此一出现就得到各个领域的重视。

资料探勘是由电脑技术、人工智慧技术、统计技术等构成的一门新学科。它采用数学、统计、人工智慧、神经网路等领域的科学方法,运用如聚类分析、关联分析、决策树等技术,从大量资料中挖掘出隐含的、先前未知的、对决策有潜在价值的关系、模式和趋势,并用这些知识和规则建立用于决策支援的模型,提供预测性决策支援的方法、工具和过程。

根据“跨行业资料探勘标准过程”,资料探勘的过程可以分成以下6个步骤:


  • 商业理解—从商业的角度了解专案的要求和最终目的,并把这些目的转化成运用资料探勘方面的计划及目标。
  • 资料理解—根据要求从资料库中提取相关的资料,并对可用资料进行评估。
  • 数据预处理—主要对提取的资料加工,检查资料的完整性和一致性,填补缺失的资料,处理噪音资料等,以达到建模要求。
  • 建立模型—运用资料探勘工具建立模型。
  • 评估—评估建立的模型,并具体考察得到的结果是否符合商业目的。
  • 部署—把发现的结果及认识过程组织成可读文本形式,即撰写资料探勘报告


  • 案例分享:FIS导入资料探勘分析

  • 台湾析数资讯股份有限公司

    AsiaAnalytics Taiwan Ltd.


    114台北市内湖路一段356号5楼[Google Map]

    5F, No. 356, Sec. 1, Neihu Rd., Neihu Dist., Taipei City 11493, Taiwan (R.O.C.)

    TEL:+886 2 7728 7958 FAX: +886 2 2627 0667

    e-mail:service@asia-analytics.com.tw

    关于析数 | 连络析数 | 资料分析同乐会社团 | 订阅析数电子报