互联网流量分类模型

问题描述

我对开发识别加密互联网流量的方法很感兴趣。

我将捕获的流量分成多个流并确定每个流的统计指标(第一个数据包大小、第二个数据包大小、平均数据包大小等)。接下来,我使用了一个实现随机森林分类器的库,并在少量数据上对其进行了训练。如果我对相同的数据进行测试,最多可以检测到 56% 的协议。例如,如果我为 Skype、viber 训练了一个分类器,并且我试图识别 whatsapp,那么分类器仍然会尝试始终确定类别,尽管它没有在 whatsapp 流量中进行过训练。

请告诉我可能适合我的情况的方法和模型。如果我想识别模型未知的流量,那么模型应该给我一个错误,而不是一个非常相似的类。还是来自幻境?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)