问题描述
||
解决方法
如果您专门在估计事物的概率,那么您需要使用一种生成概率的机器学习方法。大多数只生成一个类标签:是/否。
估计概率的最著名算法是Logistic回归。 Weka中提供了一个实现。
, Leo Breiman撰写的Random Forests(RF)是目前最流行的预测和分类算法之一。它的实现在weka中也可用。
, 这个问题有点含糊,我只能给出一个含糊的答案:使用全能的SVM!向SVM分类器提供数百万个输入向量,随后它应该能够为您提供最新的预测。
如果您正在寻找SVM的实现,请查看libsvm,它在几乎每种体面的编程语言中都有包装器。
, 使用大量机器学习库开始实验的最流行工具是Weka。您可以在此处上传数据并尝试多种算法。它的弱点是可伸缩性,但是对数据进行简单处理不是问题。