什么是半结构化数据?

栏目: 数据库 · 发布时间: 5年前

内容简介:要考虑半结构化数据是什么,让我们从类比开始 – 采访。假设您正在进行半结构化访谈。顾名思义,这在介于结构化和非结构化的访谈之间。对于上下文,结构化访谈是指您的人力资源团队预先确定所询问的问题以及询问问题的顺序,并对每个候选人保持一致。另一方面,非结构化访谈是指问题及问题的顺序取决于访问者的自由裁量权 – 对于每个候选人而言可能完全不同。

要考虑半结构化数据是什么,让我们从类比开始 – 采访。

假设您正在进行半结构化访谈。顾名思义,这在介于结构化和非结构化的访谈之间。

对于上下文,结构化访谈是指您的人力资源团队预先确定所询问的问题以及询问问题的顺序,并对每个候选人保持一致。另一方面,非结构化访谈是指问题及问题的顺序取决于访问者的自由裁量权 – 对于每个候选人而言可能完全不同。

当你考虑这两个极端时,你可以开始看到半结构化访谈的好处,这些访谈是相当一致和定量的(如结构化访谈),但仍然为访调员提供了建立融洽关系的窗口,并要求跟进的问题。

半结构化数据在本质上类似于半结构化访谈 – 它不像非结构化数据那样混乱和不受控制,但不像结构化数据那样严格且易于量化。

为营销人员下载9个免费的Excel模板

什么是半结构化数据

半结构化数据是不存在于关系数据库或任何其他数据表中的信息,但是具有一些组织属性以便于分析,例如语义标记。半结构化数据的一个很好的例子是HTML代码,它不限制你想要在文档中收集的信息量,但仍然通过语义元素强制执行层次结构。

在这里,我们将探索结构化,半结构化和非结构化数据之间的区别,以确保您对术语有一个很好的理解。

结构化,半结构化和非结构化数据

结构化数据称为定量数据,是分析软件可以收集的客观事实和数字 – 这种类型的数据易于在Excel或 SQL 等数据库中导出,存储和组织。结构化数据很有价值,因为您可以通过数据分析方法(如回归分析和数据透视表)运行数据来深入了解总体趋势。

以下是Excel工作表中结构化数据的示例:

或者,半结构化数据不符合关系数据库(如Excel或SQL),但仍然通过语义元素(如标记)包含某种级别的组织。例如,考虑HTML,它不限制您可以在文档中收集的信息量,但强制执行某种层次结构:

这是半结构化数据的一个很好的例子。正如您所看到的,HTML是通过代码组织的,但它不容易提取到数据库中,您无法使用传统的数据分析方法来获取洞察力。

最后,非结构化数据 – 也称为定性数据。在营销方面,非结构化数据是您可能收集的有关您的品牌的任何意见或评论。虽然您的消费者所说的话无疑是重要的,但您无法从这些消息中轻松提取有意义的分析数据。

非结构化数据的示例包括电子邮件响应,如下所示:

看看非结构化数据VS.结构化数据:3分钟的概述,以便更详细地说明结构化数据与非结构化数据。

半结构化数据示例

电子邮件

CSV,XML和JSON文档

NoSQL数据库

HTML

电子数据交换(EDI)

RDF

本文来自投稿,不代表穷思笔记立场,如若转载,请注明出处:http://www.chons.cn/10655.html


以上所述就是小编给大家介绍的《什么是半结构化数据?》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

Linux内核完全剖析

Linux内核完全剖析

赵炯 / 机械工业出版社 / 2006-1 / 79.00元

本书对早期Linux操作系统内核全部代友文件进行了详细的剖析,旨在让读者在尽量短的时间内对Linux的工作机理获得全面而深刻的理解,为进一步学习和研究Linux系统打下坚实的基础。虽然选择的版本较低,但该内核已能够正常编译运行,并且其中已包括了Linux工作原理的精髓。书中首先以Linux源代码版本的变迁为主线,简要介绍了Lin-ux系统的发展历史,同时着重说明了各个内核版本之间的主要区别和改进方......一起来看看 《Linux内核完全剖析》 这本书的介绍吧!

JS 压缩/解压工具
JS 压缩/解压工具

在线压缩/解压 JS 代码

在线进制转换器
在线进制转换器

各进制数互转换器

HEX CMYK 转换工具
HEX CMYK 转换工具

HEX CMYK 互转工具