艾伦西蒙

可以将数据建模看作是数据和系统的等效物,就像制造公司在开始构建实际对象之前构建汽车、家用电器或飞机的模型一样。模型帮助我们描绘出一幅不同对象和子系统如何相互关联的概念图。我们可以在投入大量时间和资源到实际对象之前就解决这些细节问题。

在数据模型的情况下,我们可以列出主要数据片段如何相互关联,它们各自的特征和属性是什么,以及将哪些业务规则应用于整个模型以及较小的组件。数据科学家、数据分析师、软件开发人员和其他人可以在构建分析模型、软件数据定义和组织数据的其他用途之前,使用数据模型的描述性内容来明确每个数据块的实际含义。

掌握数据建模基础

最后更新于2020年3月

畅销书
  • 37个讲座
  • 初级水平
4.4 (3,085)

实体关系技术和最佳实践|阿兰•西蒙

探索课程

在本文中,我们将深入挖掘数据建模的基本原理,并回答为什么这是一个重要数据科学的常见问题。

数据建模是如何工作的?

数据建模帮助我们以一种高度概念化的方式开始处理数据。它的目的是比许多数据库更接近真实世界。此外,建模沿着概念-逻辑-物理生命周期转换和映射数据,一直到高度调优的数据结构,旨在支持最佳在线性能和响应时间。

换句话说,数据建模是一门反映其他类型技术的学科,这些技术以概念视图开始,以技术实现结束——例如,软件开发和业务流程建模。betwayapp下载安装

数据科学家什么时候使用建模?

数据科学团队负责构建复杂的分析模型,为广泛的预测和探索/发现分析奠定基础。这些分析模型的一个关键组成部分是获取正确的数据。这意味着准确地理解每个数据元素的含义、其内容值的可能范围或列表、数据实例是否必须存在或是否允许丢失数据(例如,如果允许NULL值)、数据如何与其他数据关联,等等。

数据模型可帮助数据科学团队完全了解数据并确定可能影响其模型的有效性和准确性的可能问题。

掌握数据建模基础
艾伦西蒙
4.4 (3,085)
畅销书
数据仓库入门基础
艾伦西蒙
4.5 (7,063)
畅销书

艾伦西蒙课程

数据建模的三种类型是什么?

现在我们已经了解了数据建模工作原理的基础知识,接下来让我们了解三种类型的数据模型,每种数据模型在数据库系统中都有自己的角色。

概念数据模型

概念数据模型理想地尽可能地反映真实世界。换句话说,我们试图避免特定数据库管理系统的约束,这通常要求我们的数据以非常特定的方式结构化,有时包括“人工”数据库表或其他克服这些约束所必需的结构。相反,我们希望概念模型用实际的对象、特征、关系和业务规则表示特定的业务问题,或者我们构建它的目的。

逻辑数据模型

逻辑数据模型将我们的概念模型映射到特定于数据库的结构集中。例如,在关系数据库中,我们具有某些构造,如表格和列组成的表。我们采取了我们在概念层面构建的模型,并应用我们需要进行的任何变换,以便使模型符合关系数据库规则,或我们使用的任何类型的数据管理系统。

物理数据模型

在物理级别,我们以两种方式对逻辑模型进行调整。第一种方式是由特定于产品特征和限制的驱动。一旦数据库实际上填充数据并实现,第二种方式尝试提高性能和响应时间。

所有三个层次都是非常重要的,理想情况下,数据建模生命周期包括在每个层次上的实质性参与。

什么是常见的数据建模工具?

数据建模工具是一种专业的软件,不仅允许我们绘制主要数据建模构造 - 实体,属性和关系 - 但也将语义附加到这些对象。这些含义可能与属性的数据类型和大小一样简单,或者作为复杂的复杂作为数据模型上的两个实体之间的特定关系。

然后,语义可以帮助我们转换并转换高度概念模型,以将现实世界镜像为具有一个或多个应用程序和系统的数据管理平台的数据库特定的构造。

数据建模工具的范围可以从通用的包,如Microsoft Visio,它已经发展成为一个完整的功能产品,以构建和管理数据模型,到专门的软件,如CA Erwin、ER/Studio Data Architect和许多其他软件。以下是五种最流行的工具。

  1. 微软Visio

如果您不需要令人难以置信的专业软件,那么Microsoft Visio可能是一个很好的开始。它的图表是专业和直观的。此外,流程图模板是现代的,您可以与您的团队合作,以获得现实世界的洞察力。

  1. CA Erwin

如果您使用Windows作为操作系统,并且正在寻找一个数据建模器来处理结构化和非结构化数据,Erwin data modeler是一个屡获殊荣的高质量建模工具。

  1. ER /工作室

Idera的ER/Studio是另一款最适合Windows操作系统的软件。使用企业团队版本,您可以对来自BI、Big data、ETL、NoSQL和关系源的数据进行建模,以及实现命名标准、定义术语表术语,并将模型保存在存储库中供其他团队成员查看。

  1. PowerDesigner.

SAP PowerDesigner工具最适合用于数据建模、lync-and-sync和元数据管理。该界面易于导航,并且有一个存储库,因此您可以轻松地与您的团队协作。这个工具在Windows下工作得最好。

  1. navicat

在任何操作系统中使用Navicat。它是一种更具成本效益的方式来构建高质量的数据模型而不是一些其他工具,您仍然可以执行许多相同的任务。Navicat最适合向前和/或逆向工程,从其他数据源导入模型,或生成复杂的SQL / DDL。

流行的数据建模技术

数据建模有多种方法。正确的技术将取决于您的用例和业务需求。一些数据建模方法可以被认为是以数据库为中心的,这意味着它们专用于数据对象之间的数据和关系的图形描绘,具有设计和创建数据库的最终目标。其他技术在于性质上是更全面的,在音乐会中寻址数据模型以及系统开发的其他方面。betwayapp下载安装

大多数方法都将其根部追溯到实体关系(E-R)建模,该建模始于1976年,彼得陈的学术纸并在多年来发展。另一种与经典E-R模型密切相关的技术是所谓的“乌鸦的脚分表示”,它遵循与“经典”E-R模型相同的规则,但使用不同的符号来表示数据和业务规则。

e-R模型,无论符号如何代表真实的对象。一个实体是现实世界的一件事。它具有一组属性或属性,并且这些属性可以具有值。因为可以有很多实体,那些实体可以彼此关系。因此,E-R模型模拟这些实体和属性和关系。

现在,我们已经讨论了很多关于数据建模的内容,所以你可能想知道它如何适合你的职业发展。betwayapp下载安装IT和数据专业人员可以将数据建模作为他们所做的以数据为中心的工作的一部分(数据仓库例如,大数据)或将数据模型作为更大工作的一部分,如定制软件开发、打包软件开发或数据科学和机器学习。betwayapp下载安装一般来说,数据建模对于任何处理数据的人来说都是一项非常重要的技能。有些人可以把数据建模作为他们职业生涯的中心,或者它可以成为一个更大的技能工具包的一部分。

让你的团队。领导行业。

通过Udemy为Business获取组织的在线课程和数字学习工具库的订阅。

请求一个演示

页面上次更新:2020年6月