问题描述
||
我正在尝试根据#following #followers找到一个公式来计算Twitter用户的“重要性”
我要考虑的事情:
1.跟随者/跟随者越多,他的重要性就越大。
2.在20/20和10k / 10k之间有所不同(10k更重要,尽管比率相同)。
考虑到这两个,我希望得到与这两个输入相似的输出重要性值:
#followers = 1000#following = 100
#followers = 30k#following = 30k
我在考虑第二点时遇到了问题。我相信它必须非常简单。救命?
谢谢
解决方法
一种可能是“ 0”,其中CONST是一些预定义的值,并经过适当测试。这将确保比率具有适当的重要性,但规模也很重要。
对于最后一个示例,您将需要设置CONST〜= 9.4以获得相似的结果。
, 这个问题的答案太多了,您需要权衡关注者数量与比率之间的重要程度,以便获得共同的数量来关联这两个对象。例如,我想到的第一个想法是将比率乘以#跟随器的对数。这样的事情。
Importance = (#Followers / #Following)*Log(#Followers)
, 根据您在此处所说的内容,您可以进行3个关注者^ 2 /关注。
但是您已经描述了一个系统,在该系统中,用户可以通过关注较少的其他用户来提高其重要性。看起来不太好。
, 您可以通过用户总数对其进行归一化。
我建议对所有值使用对数,以使较高的值不太明显地增加或改变。
(log(#followers)/log(#TotalNumberOfPeopleInTwitter))*(log(#followers)/log(#following))