问题描述
||
您好,我是Datawarehousing的新手,对于作业,请问我实现逻辑设计,物理和实现。您如何在Data Warehouse中对此建模:
我希望设计一个数据仓库,以给出与棒球联赛有关的统计信息
对于玩家
在进攻中:
•连击有多少次。
•得分多少。
•击中几下,双击和三击。
•做了多少本垒打。
•许多打点。
•许多基于球
在防守端:
▪双打多少次
▪有多少助攻
▪导致错误或投手有多少错误:
▪输了多少场比赛
▪赢得了很多场比赛
▪保存了多少个游戏
▪完整的游戏线索有多少
▪多少场比赛开始了很多场比赛
漂白的时候
▪击中次数,两次击中次数,三次击中次数,本垒打次数
至于玩家的数据,重要的是可以将其视为
一个赛季,有人知道DW设计的精确部分吗?有任何想法吗?
非常感谢。
解决方法
设计任何数据仓库的第一步是选择业务流程。您已经通过基于棒球统计信息确定报告要求而做到了这一点,这已经是一个非常明确的过程(基于游戏规则)。
第二步是识别谷物。粒度是您需要在报表查询中表示的最低详细级别。对于您的棒球比赛情况,这很可能是一个基调。
接下来,您将确定描述谷物所需的尺寸。这些都很容易识别-游戏,投手,击球手和上场日期都是显而易见的。
最后,您将确定包含与这些维度相关的度量的事实。这涵盖了您问题中的许多衡量标准,包括是否对比赛进行了评分-这可以在任意维度的组合(即局,局,队,球员或赛季级别)中相加。
, IBM红皮书上有一些标题。
数据的数据建模技术
入库
维度建模:业务中
情报环境