问题描述
我致力于犯罪预测的预测模型,这意味着我尝试对犯罪风险进行建模。 在我的建模结束时,我有以下值:
- 每个州的预测犯罪数量(由我的模型计算)
- 每个州的真实犯罪数量(来自警方的真实数据)
根据这些值,我创建了一个差异图,通过减去预测值和实际值来获得差异。现在它会有所不同,当差异为 200 时,如果有 250 例或 5000 例,因为 200 要么非常高,要么不太高。
我想对数据进行规范化,并考虑通过人口或犯罪事件对其进行规范化。 我不确定如何规范化数据以及我可以从中做出哪些陈述。
按人口归一化:如果我按人口对数据进行归一化,我会将预测犯罪和实际犯罪除以每个州的人口数,然后乘以 100.000。这意味着我可以说模型与实际情况存在差异,例如每 10 万人中有 100 个案例,对吗?
按案件归一化:如何按犯罪案件归一化数据?从结果值得出什么陈述?我不知道如何处理,我只是觉得,解释这些值可能会有所帮助。
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)