微软开源大规模数据处理项目 Data Accelerator

栏目: 软件资讯 · 发布时间: 7年前

内容简介：据微软官方开源博客介绍，Data Accelerator 的一些方法可以更容易地在 Apache Spark 上构建流式传输管道：

微软开源了一个原为内部使用的大规模数据处理项目 Data Accelerator 。自 2017 年开发以来，该项目已经大规模应用在各种微软产品工作管道上。

据微软官方开源博客介绍，Data Accelerator 的一些方法可以更容易地在 Apache Spark 上构建流式传输管道：

即插即用 ：轻松设置输入源和输出接收器，以便在几分钟内建立管道。Data Accelerator 支持从 Eventhub 和 IoThub 取数据，并支持将数据下载到 Azure blob、CosmosDB、Eventhub 等。
无代码体验 ：无需编写任何代码即可设置警报和数据处理。通过规则设计器体验，您可以指定简单和聚合的数据处理，标记和警报。
SQL 查询 ：在 SQL 中编写复杂的处理——无需在 Scala 中工作。内置的可扩展性模型还支持用户定义的函数并利用 Azure 功能，例如，用于 ML 中流。
实时查询 ：通过针对传入数据样本运行，在几秒钟内验证您的查询，从而节省设置和测试管道处理的工作时间。

微软开源大规模数据处理项目 Data Accelerator

Data Accelerator 不仅仅是 EventHub 和数据库之间的管道。它允许用户在继续流式传输的同时重塑传入的事件，然后将同一事件的不同部分路由到不同的数据存储，同时提供健康监控和整个管道状态的警报。

Data Accelerator 还提供配置 UI 和规则/查询设计器体验，使用户无需编写任何代码即可启动和运行。

此外，任何进行流数据处理的人通常都需要使用滑动窗口处理数据，或处理延迟到达数据，或者随时间累积数据。Data Accelerator 支持并简化了这些高级功能的使用。

最后，微软提到，Data Accelerator 支援 dev-test 循环的快速验证周期，其中查询针对本地采样的事件运行在部署之前就能迭代修正到可用，这可以节省大量测试工作管道处理的时间。

以上所述就是小编给大家介绍的《微软开源大规模数据处理项目 Data Accelerator》，希望对大家有所帮助，如果大家有任何疑问请给我留言，小编会及时回复大家的。在此也非常感谢大家对码农网的支持！

查看所有标签

本站部分资源来源于网络，本站转载出于传递更多信息之目的，版权归原作者或者来源机构所有，如转载稿涉及版权问题，请联系我们。

码农书籍

图解CIO工作指南（第4版）

［日］野村综合研究所系统咨询事业本部 / 周自恒 / 人民邮电出版社 / 2014-3 / 39.00

《图解CIO工作指南（第4版）》是一本实务手册，系统介绍了企业运用IT手段提高竞争力所必需的管理方法和实践经验，主要面向CEO或CIO等企业管理人士。《图解CIO工作指南（第4版）》分为三个部分。第1部分的主题为IT管理，着重阐述运用IT技术提高企业竞争力所必需的所有管理业务，具体包括制定作为企业方针的IT战略，以及统筹执行该战略时与IT相关的人力、物力、财力、风险等要素在内的一系列管理业......一起来看看《图解CIO工作指南（第4版）》这本书的介绍吧!

码农工具

微软开源大规模数据处理项目 Data Accelerator

图解CIO工作指南（第4版）

HTML 压缩/解压工具

JSON 在线解析

图片转BASE64编码