什么是半结构化数据?

栏目: 数据库 · 发布时间: 5年前

内容简介:要考虑半结构化数据是什么,让我们从类比开始 – 采访。假设您正在进行半结构化访谈。顾名思义,这在介于结构化和非结构化的访谈之间。对于上下文,结构化访谈是指您的人力资源团队预先确定所询问的问题以及询问问题的顺序,并对每个候选人保持一致。另一方面,非结构化访谈是指问题及问题的顺序取决于访问者的自由裁量权 – 对于每个候选人而言可能完全不同。

要考虑半结构化数据是什么,让我们从类比开始 – 采访。

假设您正在进行半结构化访谈。顾名思义,这在介于结构化和非结构化的访谈之间。

对于上下文,结构化访谈是指您的人力资源团队预先确定所询问的问题以及询问问题的顺序,并对每个候选人保持一致。另一方面,非结构化访谈是指问题及问题的顺序取决于访问者的自由裁量权 – 对于每个候选人而言可能完全不同。

当你考虑这两个极端时,你可以开始看到半结构化访谈的好处,这些访谈是相当一致和定量的(如结构化访谈),但仍然为访调员提供了建立融洽关系的窗口,并要求跟进的问题。

半结构化数据在本质上类似于半结构化访谈 – 它不像非结构化数据那样混乱和不受控制,但不像结构化数据那样严格且易于量化。

为营销人员下载9个免费的Excel模板

什么是半结构化数据

半结构化数据是不存在于关系数据库或任何其他数据表中的信息,但是具有一些组织属性以便于分析,例如语义标记。半结构化数据的一个很好的例子是HTML代码,它不限制你想要在文档中收集的信息量,但仍然通过语义元素强制执行层次结构。

在这里,我们将探索结构化,半结构化和非结构化数据之间的区别,以确保您对术语有一个很好的理解。

结构化,半结构化和非结构化数据

结构化数据称为定量数据,是分析软件可以收集的客观事实和数字 – 这种类型的数据易于在Excel或 SQL 等数据库中导出,存储和组织。结构化数据很有价值,因为您可以通过数据分析方法(如回归分析和数据透视表)运行数据来深入了解总体趋势。

以下是Excel工作表中结构化数据的示例:

或者,半结构化数据不符合关系数据库(如Excel或SQL),但仍然通过语义元素(如标记)包含某种级别的组织。例如,考虑HTML,它不限制您可以在文档中收集的信息量,但强制执行某种层次结构:

这是半结构化数据的一个很好的例子。正如您所看到的,HTML是通过代码组织的,但它不容易提取到数据库中,您无法使用传统的数据分析方法来获取洞察力。

最后,非结构化数据 – 也称为定性数据。在营销方面,非结构化数据是您可能收集的有关您的品牌的任何意见或评论。虽然您的消费者所说的话无疑是重要的,但您无法从这些消息中轻松提取有意义的分析数据。

非结构化数据的示例包括电子邮件响应,如下所示:

看看非结构化数据VS.结构化数据:3分钟的概述,以便更详细地说明结构化数据与非结构化数据。

半结构化数据示例

电子邮件

CSV,XML和JSON文档

NoSQL数据库

HTML

电子数据交换(EDI)

RDF

本文来自投稿,不代表穷思笔记立场,如若转载,请注明出处:http://www.chons.cn/10655.html


以上所述就是小编给大家介绍的《什么是半结构化数据?》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

软利器

软利器

保罗·莱文森 / 何道宽 / 复旦大学出版社 / 2011-5 / 35.00元

《软利器:信息革命的自然历史与未来》内容简介:何谓“软利器”?一种轻盈、透明、无质无形、难以把握的力量,由信息和物理载体构成,这就是媒介。了解媒介的属性和演化规律的人,常占尽优势:反之则身处险境。是不是有些危言耸听? 如果你看过保罗•莱文森的这本《软利器:信息革命的自然历史与未来》,或许就会深信不疑。在书中,莱文森如同一位经验丰富的航海家,带领你穿越媒介时空——你将邂逅古埃及的法老、古希腊的......一起来看看 《软利器》 这本书的介绍吧!

随机密码生成器
随机密码生成器

多种字符组合密码

正则表达式在线测试
正则表达式在线测试

正则表达式在线测试