数据挖掘介绍
数据挖掘 - 必需品,而不是奢侈品
数据挖掘是一项功能强大的新技术帮助企业将数据和信息转化为知识。现代企业处理和处理大量的数据,这些数据可以从内部或外部来源收集。
随着互联网、网络和移动设备的出现,这十年的主要挑战是管理这一巨大的非结构化或原始数据资源,这些数据每时每刻都在以非常快的速度生成。非结构化数据从不同的来源快速而持续地流,在格式上是异构的和可变的。非结构化数据包括来自网站上的客户互动、网站上运行的营销应用、社交网络、电子商务网站、博客以及调查和反馈的所有数据。这些数据可以被挖掘并用于揭示客户的消费模式、产品和品牌偏好,以及其他查询和报告无法有效揭示的信息。因此,即使投入了时间和金钱,也有必要有效地处理和利用这一庞大的数据量,而这正是数据挖掘的重要性所在。
这个数据量有多大?
存储在企业数据库中的原始数据量在多年来爆炸和上升。当我们参考大量数据或大数据,你能想象我们在谈论什么数据?数据库现在以千兆字节和tberabytes衡量,其中一个terabyte = 1万亿字节。数据也可以是petabytes,其中1个petabyte = 1,024吨。
什么是数据挖掘?
数据挖掘或知识发现是使用适当的工具和程序来分析大规模数据集和从中提取含义和模式的计算机辅助过程。数据挖掘工具预测行为和未来趋势,使企业能够积极主动,知识驱动的决策。数据挖掘工具可以回答否则耗时的业务问题,并且它们非常迅速地查找专家可能会发现难以找到和预见的隐藏模式和预测信息。
数据挖掘从在大型数据库中搜索有价值信息之间的相似性以及为有价值的矿石进行山区来源的。这两个过程都需要通过巨大的材料进行筛分,有效,智能地发现真实值谎言的位置。
如何使用数据挖掘?
尽管数据挖掘仍处于起步阶段,但包括零售、金融、医疗保健、制造、运输和航空航天等广泛行业的公司已经在使用数据挖掘工具和技术来利用历史数据。通过使用模式识别技术、统计和数学技术来筛选仓库中的信息,数据挖掘可以提供帮助分析人员承认重要的事实关系、趋势、模式、异常和异常,否则可能会被忽视。这些数据中发现的模式和关系有助于企业做出更好的业务决策、识别销售和消费者趋势、设计营销活动、预测客户忠诚度等等。数据挖掘可以被公司用来挖掘以下趋势和信息:
- 消费者消费模式:识别从特定公司购买特定产品的消费者的共同特征和模式。
- 客户潮流:鉴别忠实的客户和可能转移品牌和购买偏好的客户。
- 欺诈检测:识别更有可能是欺诈的交易。
- 直接营销:基于更有可能有更好回复率的潜在客户生成邮件列表。
- 互动营销:破译如何改进公司网站的应用和特征,使其更加互动,更容易获得更多关注访客。
- 市场篮子分析:了解常用的产品或服务。
- 营销活动后趋势分析:揭示特定营销活动的影响,如果销售数据和趋势发生了任何变化。
如何挖掘数据 - 工具和方法
数据挖掘告诉您您不知道的重要事项或帮助您可视化未来的模式和趋势。用于自动提取模式的技术称为建模。建模是基于从答案所知的情况的数据构建模型或一组数学关系和算法的过程,然后将模型应用于答案不知道的其他情况。
以下是一些常用的数据挖掘工具和方法:
- 传统数据挖掘工具:这些是数据挖掘程序和软件,通过使用一些复杂的算法和技术,帮助公司建立数据模式和趋势。其中一些工具分析内部数据,而另一些则处理外部数据。
- 仪表板:安装在计算机中的程序,用来监控数据库中的信息。它们反映数据变化,并以图表或表格的形式显示它们,使公司能够看到业务的执行情况。也可以使用历史数据,这样公司就可以识别趋势变化,识别原因和影响因素。
- 文本挖掘工具:该工具用于从不同类型的文本中挖掘数据,从Microsoft Word和Acrobat PDF文档、电子邮件到简单的文本文件。这些工具扫描内容,并将选定的文本转换为与工具的数据库兼容的格式。从文本格式捕获的数据可以是丰富的信息,可以挖掘这些信息来发现趋势、概念和态度。
除了这些工具,其他应用程序和程序也可以用于数据挖掘目的。
总结
对于现在的一天组织,数据与库存,劳动力和资本交谈。公司需要有效地捕获,可视化,分析和应用推论分析的数据从各种来源收集的。这将帮助他们保持领先于竞争对手,制定业务战略,预见未来的市场趋势,从而提高他们的运营效率,利润,销量。因此,数据挖掘现在是一个流行词,并且将继续成为一个越来越重要的话题。