问题描述
我有课程作业,我不明白,我尝试给我的导师发电子邮件,但他没有回复,我已经等了大约 2 个月了......我应该创建一个专注于 2 的星形/雪花模式事实表。
该项目必须专注于 NHS,我们可以自由定义范围,因此我决定专注于 COVID-19。我为 1 个事实表创建了一个星型模式,称为“死亡”,我的想法是数据仓库显示哪些地区的死亡率最高,以便 NHS 知道哪些地区需要,以便相应地管理情况.
我在想,第二个事实表是感染/感染,它应该查看哪些区域的感染率最高。我认为这是行不通的,因为“感染”的维度应该与死亡的维度不同(我不确定它们是否必须相同)?
你能和我分享你的想法和建议吗? 这是作业简介,简介下方是我的星型架构设计(我认为这是错误的)。
解决方法
我认为没有必要提供两个事实,一个用于康复,另一个用于死亡案例。
您只能举行一次 FactDiagnosticAnalysis
聚会:
- TreatmenCenterSK
- 患者SK
- 治疗者SK
- 员工SK
- 诊断SK
- DateSK
- 结果
- InsertedDate :记录插入时间的技术专栏
结果列将包含以下值:已感染、未感染、已恢复、在特定日期死亡,因为:
- 患者在康复前会进行多次分析
- 患者在完成上述操作后到达时不会被感染 分析
- 经过多次分析,患者会康复
- 经过多次分析,患者可能会死亡
您的模型可能如下所示:
实际上,在这种情况下,您的事实是 factless fact。 无事实事实表捕获维度之间的多对多关系,但不包含数字或文本事实。
您将报告/仪表板中的度量设置为 views(如果您使用的是 SQL):
- 死亡率最高的地区
- 达到最大容量的医疗中心数量