什么是半结构化数据?

栏目: 数据库 · 发布时间: 6年前

内容简介:要考虑半结构化数据是什么,让我们从类比开始 – 采访。假设您正在进行半结构化访谈。顾名思义,这在介于结构化和非结构化的访谈之间。对于上下文,结构化访谈是指您的人力资源团队预先确定所询问的问题以及询问问题的顺序,并对每个候选人保持一致。另一方面,非结构化访谈是指问题及问题的顺序取决于访问者的自由裁量权 – 对于每个候选人而言可能完全不同。

要考虑半结构化数据是什么,让我们从类比开始 – 采访。

假设您正在进行半结构化访谈。顾名思义,这在介于结构化和非结构化的访谈之间。

对于上下文,结构化访谈是指您的人力资源团队预先确定所询问的问题以及询问问题的顺序,并对每个候选人保持一致。另一方面,非结构化访谈是指问题及问题的顺序取决于访问者的自由裁量权 – 对于每个候选人而言可能完全不同。

当你考虑这两个极端时,你可以开始看到半结构化访谈的好处,这些访谈是相当一致和定量的(如结构化访谈),但仍然为访调员提供了建立融洽关系的窗口,并要求跟进的问题。

半结构化数据在本质上类似于半结构化访谈 – 它不像非结构化数据那样混乱和不受控制,但不像结构化数据那样严格且易于量化。

为营销人员下载9个免费的Excel模板

什么是半结构化数据

半结构化数据是不存在于关系数据库或任何其他数据表中的信息,但是具有一些组织属性以便于分析,例如语义标记。半结构化数据的一个很好的例子是HTML代码,它不限制你想要在文档中收集的信息量,但仍然通过语义元素强制执行层次结构。

在这里,我们将探索结构化,半结构化和非结构化数据之间的区别,以确保您对术语有一个很好的理解。

结构化,半结构化和非结构化数据

结构化数据称为定量数据,是分析软件可以收集的客观事实和数字 – 这种类型的数据易于在Excel或 SQL 等数据库中导出,存储和组织。结构化数据很有价值,因为您可以通过数据分析方法(如回归分析和数据透视表)运行数据来深入了解总体趋势。

以下是Excel工作表中结构化数据的示例:

或者,半结构化数据不符合关系数据库(如Excel或SQL),但仍然通过语义元素(如标记)包含某种级别的组织。例如,考虑HTML,它不限制您可以在文档中收集的信息量,但强制执行某种层次结构:

这是半结构化数据的一个很好的例子。正如您所看到的,HTML是通过代码组织的,但它不容易提取到数据库中,您无法使用传统的数据分析方法来获取洞察力。

最后,非结构化数据 – 也称为定性数据。在营销方面,非结构化数据是您可能收集的有关您的品牌的任何意见或评论。虽然您的消费者所说的话无疑是重要的,但您无法从这些消息中轻松提取有意义的分析数据。

非结构化数据的示例包括电子邮件响应,如下所示:

看看非结构化数据VS.结构化数据:3分钟的概述,以便更详细地说明结构化数据与非结构化数据。

半结构化数据示例

电子邮件

CSV,XML和JSON文档

NoSQL数据库

HTML

电子数据交换(EDI)

RDF

本文来自投稿,不代表穷思笔记立场,如若转载,请注明出处:http://www.chons.cn/10655.html


以上所述就是小编给大家介绍的《什么是半结构化数据?》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

渐进增强的Web设计

渐进增强的Web设计

[美] Todd Parker、[英] Patty Toland、[英] Scott Jehl、[法] Maggie Costello Wachs / 牛化成 / 人民邮电出版社 / 2014-1 / 69.00

本书由全球著名Web设计公司Filament集团两位创始人和两位开发主力联手打造,其中Scott Jehl还是jQuery团队成员。四位作者具有多年的网站设计和开发经验,曾为网站、无线设备、Web应用设计过众多高度实用的用户界面,受到了高度赞扬。本书展示了如何利用渐进增强方法开发网站,从而获得最佳用户体验。本书既是理解渐进增强原则和益处的实用指南,也用详细的案例分析,目的是向设计师以及开发人员传授......一起来看看 《渐进增强的Web设计》 这本书的介绍吧!

Base64 编码/解码
Base64 编码/解码

Base64 编码/解码

RGB HSV 转换
RGB HSV 转换

RGB HSV 互转工具

HEX CMYK 转换工具
HEX CMYK 转换工具

HEX CMYK 互转工具