什么是半结构化数据?

栏目: 数据库 · 发布时间: 5年前

内容简介:要考虑半结构化数据是什么,让我们从类比开始 – 采访。假设您正在进行半结构化访谈。顾名思义,这在介于结构化和非结构化的访谈之间。对于上下文,结构化访谈是指您的人力资源团队预先确定所询问的问题以及询问问题的顺序,并对每个候选人保持一致。另一方面,非结构化访谈是指问题及问题的顺序取决于访问者的自由裁量权 – 对于每个候选人而言可能完全不同。

要考虑半结构化数据是什么,让我们从类比开始 – 采访。

假设您正在进行半结构化访谈。顾名思义,这在介于结构化和非结构化的访谈之间。

对于上下文,结构化访谈是指您的人力资源团队预先确定所询问的问题以及询问问题的顺序,并对每个候选人保持一致。另一方面,非结构化访谈是指问题及问题的顺序取决于访问者的自由裁量权 – 对于每个候选人而言可能完全不同。

当你考虑这两个极端时,你可以开始看到半结构化访谈的好处,这些访谈是相当一致和定量的(如结构化访谈),但仍然为访调员提供了建立融洽关系的窗口,并要求跟进的问题。

半结构化数据在本质上类似于半结构化访谈 – 它不像非结构化数据那样混乱和不受控制,但不像结构化数据那样严格且易于量化。

为营销人员下载9个免费的Excel模板

什么是半结构化数据

半结构化数据是不存在于关系数据库或任何其他数据表中的信息,但是具有一些组织属性以便于分析,例如语义标记。半结构化数据的一个很好的例子是HTML代码,它不限制你想要在文档中收集的信息量,但仍然通过语义元素强制执行层次结构。

在这里,我们将探索结构化,半结构化和非结构化数据之间的区别,以确保您对术语有一个很好的理解。

结构化,半结构化和非结构化数据

结构化数据称为定量数据,是分析软件可以收集的客观事实和数字 – 这种类型的数据易于在Excel或 SQL 等数据库中导出,存储和组织。结构化数据很有价值,因为您可以通过数据分析方法(如回归分析和数据透视表)运行数据来深入了解总体趋势。

以下是Excel工作表中结构化数据的示例:

或者,半结构化数据不符合关系数据库(如Excel或SQL),但仍然通过语义元素(如标记)包含某种级别的组织。例如,考虑HTML,它不限制您可以在文档中收集的信息量,但强制执行某种层次结构:

这是半结构化数据的一个很好的例子。正如您所看到的,HTML是通过代码组织的,但它不容易提取到数据库中,您无法使用传统的数据分析方法来获取洞察力。

最后,非结构化数据 – 也称为定性数据。在营销方面,非结构化数据是您可能收集的有关您的品牌的任何意见或评论。虽然您的消费者所说的话无疑是重要的,但您无法从这些消息中轻松提取有意义的分析数据。

非结构化数据的示例包括电子邮件响应,如下所示:

看看非结构化数据VS.结构化数据:3分钟的概述,以便更详细地说明结构化数据与非结构化数据。

半结构化数据示例

电子邮件

CSV,XML和JSON文档

NoSQL数据库

HTML

电子数据交换(EDI)

RDF

本文来自投稿,不代表穷思笔记立场,如若转载,请注明出处:http://www.chons.cn/10655.html


以上所述就是小编给大家介绍的《什么是半结构化数据?》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

数字麦克卢汉

数字麦克卢汉

(美)保罗﹒莱文森(Paul Levinson) / 何道宽 / 社会科学文献出版社 / 2001年 / 20.0

本书是一本三合一的书。既是麦克卢汉评传,又是一部专著,而且是让网民“扫盲”和提高的指南。 《数字麦克卢汉》实际上有两个平行的主题和任务。一个是批评和张扬麦克卢汉。另一个是写作者自己的思想。它“不仅谋求提供进入数字时代的向导……而且谋求证明麦克卢汉思想隐而不显的准确性。为了完成这个双重任务,本书的每一章都试图阐明麦克卢汉的一种重要的洞见、原则或概念。与此同时,它试图揭示麦克卢汉告诉我们一些什么......一起来看看 《数字麦克卢汉》 这本书的介绍吧!

HTML 压缩/解压工具
HTML 压缩/解压工具

在线压缩/解压 HTML 代码

CSS 压缩/解压工具
CSS 压缩/解压工具

在线压缩/解压 CSS 代码

在线进制转换器
在线进制转换器

各进制数互转换器