amazon-web-services – 在生产中使用PredictionIO

我已经在本地安装了predictionio,使用我根据需要修改的通用推荐模板训练了引擎,一切看起来都很好.

现在我知道这可以满足我的需求,我希望将它部署到生产中,遗憾的是,没有太多关于它的文档.

理想情况下,我希望在AWS上部署所有内容,有一部分文档描述它,但由于CloudFormation模板被禁用,因此无用.

我正在考虑使用Docker来实现它,但我对整个堆栈缺乏了解,并希望了解以下内容

>数据应存储在何处? hbase似乎是“数据库”,将它与其余服务器(事件服务器,预测服务器)放在同一台服务器上并不危险吗?
>它是如何扩展的?我是否需要在负载均衡器后面运行多个predictionio实例?如果是的话,如何实现呢?
>什么是优秀的分布式架构?为了扩展,我很确定我们需要将EventServer与PredictionServer分开,这样做的好方法是什么?

希望有人能提供帮助.谢谢.西里尔

最佳答案
>数据应存储在何处?

根据PredictionIO网站:

If you decide to install HBase to another location,you must edit
predictionio-0.10.0-incubating/conf/pio-env.sh and change the PIO_STORAGE_SOURCES_HBASE_HOME variable to point to your own HBase installation.

也在该网页中提到

For production deployment,run a fully distributed HBase configuration.

>它如何扩展?

predition-io google group一个很好的答案,他们分解成单独的部分

>什么是优秀的分布式架构?

in order to scale,I’m pretty sure we will need to separate the EventServer from the PredictionServer,what is the good way to do this?

分离摄取图层,处理图层和服务图层通常被认为是一种很好的做法,但您确实需要注意不要过度工程.这在很大程度上取决于您的具体使用情况,不要忘记您所做的每个分离都会给系统带来更多复杂性(部署,监控等).

相关文章

本篇文章和大家了解一下docker容器无法执行vim如何解决。有一...
这篇文章主要介绍了windowsDockerDeskTop最新款4.18.0怎么安...
这篇文章主要介绍“docker的常用命令怎么使用”,在日常操作...
这篇文章主要介绍“docker中怎么配置hosts”的相关知识,小编...
这篇“docker怎么部署zookeeper集群”文章的知识点大部分人都...
这篇文章主要介绍了怎么使用Maven打包构建Docker镜像并推送到...