Azure 数据质量分析真实世界示例

问题描述

在这个关于 DQS 的 article 中,我无法理解什么是“profiling”和“知识库”。我所能找到的只是理论解释和行话。有人可以提供一个简单的现实世界示例吗?令人困惑的是,即使在分析内部,也提到了数据清理和匹配!

问题不是针对任何特定工具,而是针对衡量数据质量的任何工具或平台。

我的目标是在我们的项目中实现它。提到的其他要点(例如数据清理和匹配)很简单,我们已经实施了。

enter image description here

解决方法

  • 分析涉及描述形状、大小的汇总统计信息 您的数据内容。
  • 帮助您了解数据中的内容
  • 作为数据工程师,您有责任提供正确的数据 用于分析和模型

是的,这些只是更多的理论,但这里有real world example如何在 ADF 数据流中使用和保留数据配置文件