对一个分类变量使用distinct,对其他分类列使用unique

问题描述

我有一个数据集,其中每个患者id都有多个“ Specialty”变量和出院变量(两个值:住院和出院后)。我想针对每个专科计算不同的患者编号,而不考虑“唯一出院变量”。

PatientID   Specialty   admission_date  discharge
1           Geriatrics  2017-11-08      In_Hospital
1           Nephrology  2017-10-21      Post_discharge
1           Cancer      2017-10-21      Post_discharge
1           Geriatrics  2017-10-21      Post_discharge

我希望输出看起来像

Geriatrics  1
Nephrology  1
Cancer      1

并且要消除老年病学的最后一行,因为它是重复值并且属于较早的日期。

我已经尝试过了,但是在“住院”和“出院后”这两个组中都计入了老年病

Select disTINCT [Speciality],[Thirty_day_Mortality_detail],count(distinct[PatientID]) as number_of_patients_died
 FROM #data
group by [Speciality],[Thirty_day_Mortality_detail]
 ORDER BY [Speciality]

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)