内容简介:在最近的他表示,NoSQL运动帮助了数据库社区明白了两件事。首先,并非每个应用程序都需要ACID,并且,放宽ACID以能扩展到互联网规模。其次,表格数据组织很适合大量的数据,但未必适合所有的数据集。但是,随着时间的流逝,SQL/NoSQL的显著区别将会消失,DBMS用户则会因为有了更多选择而获得收益。实体关系(entity-relationship,简称ER)建模技术已经在SQL数据库上应用很长时间了,但是,对于NoSQL数据库来说,它们的工作方式是不一样的。在研讨会上,Hills讨论了
在最近的 2018 数据架构峰会 上,Ted Hills 主持了一个研讨会 ,该研讨会的主题是关系数据库和NoSQL数据库的数据建模。
他表示,NoSQL运动帮助了数据库社区明白了两件事。首先,并非每个应用程序都需要ACID,并且,放宽ACID以能扩展到互联网规模。其次,表格数据组织很适合大量的数据,但未必适合所有的数据集。但是,随着时间的流逝,SQL/NoSQL的显著区别将会消失,DBMS用户则会因为有了更多选择而获得收益。
实体关系(entity-relationship,简称ER)建模技术已经在 SQL 数据库上应用很长时间了,但是,对于NoSQL数据库来说,它们的工作方式是不一样的。在研讨会上,Hills讨论了 概念和对象建模符号(the Concept and Object Modeling Notation,简称COMN ,发“common”的音)。COMN用于表示新的数据库结构,不同的NoSQL数据库均支持该数据库结构。
他谈到了对以COMN符号表示新的 多模型NoSQL数据库 的承诺。无论是数据建模人员,还是程序开发人员都可以使用它,开发人员能够在COMN中用数据对软件建模。Hills也讨论了建模无模式(schema-less)数据库的方法。
InfoQ与Hills进行了对话,讨论了与NoSQL中的数据建模和COMN符号有关的话题。
InfoQ:您能否对概念和对象建模符号(COMN)下个定义?
Ted Hills:概念和对象建模符号(COMN)是一种数据建模符号,其能用一种熟悉的图形符号(框和线)来表示需求、图形和本体性谓词、逻辑数据、软件类结构和NoSQL及SQL的物理实现,该图形符号能对这些非传统实现中层之间的重要映射进行建模。
InfoQ:您能否谈谈NoSQL数据库背景中的概念和对象建模符号(COMN)?以及数据建模和关系数据库建模之间的不同之处在哪里?
Hills:实体关系(Entity-relationship,简称E-R)和其他符号假设数据将最终存储于表格中。随着NoSQL数据库的出现,现在我们可以把数据存于图形和文档中,也可以存储于其他表格结构中,如宽列表(wide-column table)、面向列的表格和键/值对。我们不再假设从逻辑数据设计到物理实现的映射接近1:1。此外,物理实现建模,包括非表结构(non-tabular structure)建模,甚至查询建模,都变得比以往更为重要。COMN使各种各样的物理结构和所代表的数据的重要映射得以表达。
InfoQ:对于每种NoSQL数据库,数据建模方法是不同的吗?比如,像Cassandra这样的宽列数据库(wide-column database)?以及像Neo4j这样的图形数据库?
Hills:是的, 对大多数NoSQL数据库类型来说,数据建模的重点是不同的。属性图形数据模型关注于关系,而后用数据属性来注释节点和关系。知识图形数据模型也关注关系,但添加子/超类型关系。文档(XML和JSON)数据模型把层次关系放在首位。因此,尽管物理数据模型的焦点随每个NoSQL数据库的类型而改变,但COMN可以用于每种数据库。此外,它可以代表所有这些非传统数据结构和表(还没消失),并把物理模型和逻辑数据模型相关联,理想情况下,逻辑数据模型不会受物理表示选择的影响。
InfoQ:您能谈谈多模型NoSQL数据库吗?还有,它们如何能有助于不同数据结构的数据管理?
Hills:在NoSQL的世界里,必须为你的数据选择一个物理表示,而且这些数据必须是最适合你的应用程序的。是否需要随机写入或只在日志的末尾写入?是否需要围绕分层文档结构来组织数据?或是围绕关系来组织数据?很多NoSQL DBMS只提供一种方法来组织数据。如果需要改变数据组织,或需要更多的方式来组织数据,那么就不得不改变整个DBMS。这涉及到处理不同的供应商、不同的支持需求、不同的编程语言和API等等。它可不是个平凡的数据库。如果相反,使用支持多个数据组织的混合DBMS,那么使用多种方法来组织你的数据就变得更容易了,并且如果要改变主意也不是件难事。
InofQ:一般而言,微服务如何有助于数据建模?
Hills:我不会说微服务本身有助于数据建模任务,但是,对数据架构,它们的确有显著的积极影响。微服务必须设计成自给自足的:它始终必须持有本地所需的所有数据。这涉及两种类型的数据:微服务创建和维护的数据,以及微服务必须从外部源获取的数据。对微服务来讲,数据如何存储在微服务外部的物理模型不重要,但是,数据如何到达微服务的模型却很重要。那可以是XML或JSON文档。数据模型需要表示文档结构及微服务将如何存储数据,并需要表达它们之间的映射关系,这种关系可能具有重要意义。COMN能够同时表达模型和它们的映射关系。
InofQ:您在会议演示中谈到了状态和陈述。您能否讨论一下如何在数据库中建模这些概念?
Hills:每个DBMS,无论是NoSQL还是SQL,最终,都是把无意义的物理状态(高电压和低电压,或者开和关)和有意义的事物建立映射关系,从而表示数据。我们把这个映射称为物理表示。在更高的层次上,我们使用表、图形和文档等结构来表示关系。理解的关键是逻辑数据模型应该完全忽略这些物理映射问题。逻辑数据模型应该把重点完全放在数据的含义上以及数据如何按照逻辑表示问题域内的数据。但是,在从逻辑模型转移到物理模型时,保留从物理模型到逻辑模型的映射关系以及物理表示设计都变得至关重要了。
InfoQ:NoSQL数据库领域的新兴趋势是什么?
Hills:主流趋势是,NoSQL和SQL之间的差别变得越来越少。对于初学者来说,术语“NoSQL”开始意味着“no SQL(没有SQL)”,也即不支持表数格据库的标准结构化查询语言。然而现在,它意味着“not only SQL(不只是SQL)”,这意味着越来越多的“NoSQL”DBMS开始支持SQL。在早期,NoSQL不提供ACID强度交易,而这对金融应用程序是至关重要的。现在,很多NoSQL DBMS实现了ACID。同时,一些SQL DBMS正允许放宽ACID,使它们能够扩展到和一些NoSQL DBMS几乎相同的水平。有些混合DBMS支持表格和非表格数据组织。最终可能会出现,每个DBMS都支持各种物理数据组织,以及ACID和非ACID(“BASE”),所有这些都由用户选择。SQL诞生于表格时代,目前还没有替代者,而这个事实将会阻碍这一完整的转型。但是,COMN可以适用于所有这些数据组织。
Ted还表示,传统建模 工具 供应商对基于每次三层和一个应用的数据模型的观点很有局限,NoSQL建模工具专注于物理建模以排除逻辑数据模型和真实世界模型。像COMN这样的工具能有助于数据建模,COMN的承诺是代表数据管理的新多模型世界。
关于COMN的更多信息,包括完整规范、白皮书和Visio模板,可以从 DATAVERITY网站 免费获取。
查看英文原文: 数据建模NoSQL数据库的概念和对象建模符号
感谢冬雨对本文的审校。
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网
猜你喜欢:本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。