艾伦·西蒙

可以将数据建模看作是制造公司在着手构建实际对象之前构建汽车、家用电器或飞机模型的数据和系统等效物。模型帮助我们描绘出不同对象和子系统之间如何相互关联的概念图。我们可以在花费大量的时间和资源投入到实际的对象之前就解决这些细节问题。

在数据模型的情况下,我们可以制定出如何将数据的主要部分将涉及到另一个,有什么各自的特点和属性,以及业务规则适用于模型作为一个整体,以及更小的组件是什么。数据科学家,数据分析人员,软件开发人员,而其他人可以使用一个数据模型的描述性内容是水晶上清楚每件实际数据的装置的建立分析模型,数据定义为软件之前,和组织数据的其他用途。

掌握数据建模基础

最近更新2020年3月

畅销书
  • 37个讲座
  • 初学者级
4.3 (426)

实体 - 关系技术和最佳实践|阿兰•西蒙

探索课程

在这篇文章中,我们将深入挖掘数据建模的基本原理和回答,为什么它的数据科学的一个重要部分常见问题。

数据如何建模工作?

数据建模帮助我们开始以高度概念化的方式处理数据。它的目的是比许多数据库更接近真实世界。此外,建模沿着概念-逻辑-物理生命周期转换和映射数据,一直到为支持最佳在线性能和响应时间而设计的高度调优的数据结构。

换句话说,数据建模是一门学科,反映其他类型的技术与概念图和最终开始技术实施 - 如软件开发和业务流程建模,例如。betwayapp下载安装

数据科学家什么时候使用建模?

数据科学团队负责构建复杂的分析模型,以支持广泛的预测和探索/发现分析。对于这些分析模型来说,关键的构建模块是正确地获取数据。这意味着准确地理解每个数据元素的含义、其内容的可能范围或值列表、是否必须提供数据实例或是否允许缺失数据(例如,是否允许空值)、数据如何与其他数据相关联,等等。

数据模型有助于数据科学团队充分了解的数据,并确定可能会影响他们的模型的有效性和准确性任何可能的问题。

掌握数据建模基础
艾伦·西蒙
4.3 (426)
畅销书
数据仓库基础为初学者
艾伦·西蒙
4.5 (1105)
畅销书

由阿伦·西蒙课程

数据建模的三种类型是什么?

现在我们知道的数据模型是如何工作的,让我们的基础知识进入三种类型的数据模型,每一个都在数据库系统中自己的角色。

概念数据模型

概念数据模型理想地尽可能接近真实世界。换句话说,我们试图避免特定数据库管理系统的约束,这些约束通常要求我们的数据以非常特定的方式进行结构化,有时包括“人工的”数据库表或克服这些约束所需的其他结构。相反,我们希望概念模型用实际的对象、特征、关系和业务规则来表示特定的业务问题,或者构建它的目的是什么。

逻辑数据模型

逻辑数据模型我们的概念模型映射到特定的机构的数据库集。例如,在关系数据库中,我们有一定的结构,如由行和列的表。我们采取的模式,我们在概念上建立并应用任何转换,我们需要为了使模型现在符合关系型数据库的规则,或者我们使用任何类型的数据管理系统,使。

物理数据模型

在物理层面上,我们做出调整以两种方式的逻辑模型。第一种方式是通过产品的特定功能和限制驱动。第二种方法试图提高性能和响应时间,一旦数据库实际上是充满了数据和实施。

所有这三个级别都非常重要,理想情况下,数据建模生命周期在每一个级别上都包含实质性的参与。

什么是常见的数据建模工具?

数据建模工具是一个专门的软件,不仅允许我们得出的主要数据建模构造 - 实体,属性和关系 - 同时也重视语义的对象。这些含义可能是简单的数据类型和属性的大小,或作为复杂的支配上的数据模型两个实体之间的特定关系的业务规则。

语义然后帮助我们翻译和转换的是反映现实世界到特定数据库的结构是成为一个或多个应用程序和系统中的数据管理平台高度的概念模型。

数据建模工具的范围可以从通用的软件包,如Microsoft Visio中,它已经演变成一个全功能的产品来构建和管理数据模型,以专门的软件,如CA欧文,ER / Studio数据架构师,等等。下面就一起来看看最流行的工具五位。

  1. Microsoft Visio中

如果您不需要非常专业的软件,那么Microsoft Visio可能是一个很好的起点。它的图表是专业和直观的。此外,流程图模板是现代的,您可以在工具中与您的团队协作以获得真实世界的见解。

  1. CA Erwin

如果你使用Windows作为操作系统,并正在寻找一个数据建模与结构化和非结构化数据的工作,欧文数据建模是一个屡获殊荣的,高品质的建模工具。

  1. ER /工作室

Idera的ER/Studio是另一个最适合Windows的软件。使用enterprise team edition,您可以对来自BI、大数据、ETL、NoSQL和关系源的数据建模,还可以实现命名标准、定义术语表术语,并将模型保存在存储库中以供其他团队成员查看。

  1. PowerDesigner的

在SAP的PowerDesigner工具最适合用于数据建模,则Lync和同步,以及元数据管理。该界面易于浏览和拥有存储库,因此您可以轻松地与您的团队协作。这个工具最适合运行Windows。

  1. Navicat

Navicat的使用在任何的操作系统。这是一个更具成本效益的方式来建立高质量的数据模型比其他一些工具,你仍然可以执行许多相同的任务。Navicat的是最好的前进和/或逆向工程,从其他数据源导入模型,或生成复杂的SQL / DDL。

流行的数据建模技术

有不止一种方法,以数据建模。正确的技术将取决于你的使用情况和业务需求。一些数据建模方法可以被认为是数据库为中心的,这意味着它们专用于数据的图形描述和数据对象之间的关系,与设计的最终目标和创建数据库。其他技术在本质上更全面,在演唱会和旁边流程建模和系统开发等方面的寻址数据模型。betwayapp下载安装

大多数方法的根源都可以追溯到实体关系(E-R)建模,它始于1976年Peter Chen的学术论文,并经过多年的发展。另一种与经典E-R建模密切相关的技术是所谓的“乌鸦脚符号”,它遵循许多与“经典”E-R建模相同的规则,但使用不同的符号来表示数据和业务规则。

E-R模型,不管符号是什么,都表示真实世界的对象。实体是现实世界中的一件事物。它有一组属性,这些属性可以有值。因为可以有许多实体,这些实体之间可以有关系。因此,E-R建模对这些实体以及它们之间的属性和关系进行建模。

现在,我们已经讨论了很多关于数据建模的内容,所以您可能想知道它如何适合您的职业发展。betwayapp下载安装IT和数据专业人员可以将数据建模作为他们所做的以数据为中心的工作的一部分(数据仓库或大数据等)或数据模型的工作作为工作,如定制软件开发,打包的软件开发或数据科学和机器学习的一个更大的身体的一部分。betwayapp下载安装在一般情况下,数据建模是任何人谁在任何容量数据工作的非常重要的技能。有人可以使数据建模自己的职业生涯的中心点,也可以是技能较大的工具包的一部分。

使您的团队。引领行业。

获取订阅的在线课程和数字学习工具库与您Udemy组织业务。

请求一个演示

页面最后更新:2020年6月