我正在评估使用Storm构建一个webcrawler(实时框架,而不是IDE).我的spout将提供一个URI流,必须在第一个Bolt中调用和检索,这是用
PHP编写的.
来自node.js背景,我知道可以使用回调以非阻塞方式构建这样的功能.我天真的想法是,只为该Bolt配置很多任务,以便在一些Taks等待答案时可以充分利用资源.问题是,PHP为每个进程分配了大量资源是臭名昭着的,我不知道Storm是如何在内部管理的,如果这是一个好主意.
在这种环境中,类似node.js的行为是否可行?或者我必须切换到另一种语言来实现它(如果是这样,我该怎么做)?