问题描述
在这个关于 DQS 的 article 中,我无法理解什么是“profiling”和“知识库”。我所能找到的只是理论解释和行话。有人可以提供一个简单的现实世界示例吗?令人困惑的是,即使在分析内部,也提到了数据清理和匹配!
问题不是针对任何特定工具,而是针对衡量数据质量的任何工具或平台。
我的目标是在我们的项目中实现它。提到的其他要点(例如数据清理和匹配)很简单,我们已经实施了。
解决方法
- 分析涉及描述形状、大小的汇总统计信息 您的数据内容。
- 帮助您了解数据中的内容
- 作为数据工程师,您有责任提供正确的数据 用于分析和模型
是的,这些只是更多的理论,但这里有real world example如何在 ADF 数据流中使用和保留数据配置文件