NHS 数据仓库

问题描述

我有课程作业,我不明白,我尝试给我的导师发电子邮件,但他没有回复,我已经等了大约 2 个月了......我应该创建一个专注于 2 的星形/雪花模式事实表。

该项目必须专注于 NHS,我们可以自由定义范围,因此我决定专注于 COVID-19。我为 1 个事实表创建了一个星型模式,称为“死亡”,我的想法是数据仓库显示哪些地区的死亡率最高,以便 NHS 知道哪些地区需要,以便相应地管理情况.

我在想,第二个事实表是感染/感染,它应该查看哪些区域的感染率最高。我认为这是行不通的,因为“感染”的维度应该与死亡的维度不同(我不确定它们是否必须相同)?

你能和我分享你的想法和建议吗? 这是作业简介,简介下方是我的星型架构设计(我认为这是错误的)。

Assignment Brief

Star Schema 1 Fact Table

解决方法

我认为没有必要提供两个事实,一个用于康复,另一个用于死亡案例。 您只能举行一次 FactDiagnosticAnalysis 聚会:

  • TreatmenCenterSK
  • 患者SK
  • 治疗者SK
  • 员工SK
  • 诊断SK
  • DateSK
  • 结果
  • InsertedDate :记录插入时间的技术专栏

结果列将包含以下值:已感染、未感染、已恢复、在特定日期死亡,因为:

  • 患者在康复前会进行多次分析
  • 患者在完成上述操作后到达时不会被感染 分析
  • 经过多次分析,患者会康复
  • 经过多次分析,患者可能会死亡

您的模型可能如下所示:

enter image description here

实际上,在这种情况下,您的事实是 factless fact。 无事实事实表捕获维度之间的多对多关系,但不包含数字或文本事实。

您将报告/仪表板中的度量设置为 views(如果您使用的是 SQL):

  • 死亡率最高的地区
  • 达到最大容量的医疗中心数量