内容简介:PredictionIO 是一个用Scala编写的开源机器学习服务器应用,可以帮助你方便地使用RESTFul API搭建推荐引擎。 PredictionIO的核心使用的是一个可伸缩的机器学习库,基于Spark一个完整的端到端Pipeline,让使用者可以非常简单的从零开始搭建一个推荐系统。 "PredictionIO 是由三个元件所组成:官方有提供快速的一键安装方法,当然也可以手动安装。
本文转载自:https://juejin.im/post/5bc560045188255c2f424733,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有。
PredictionIO 是一个用Scala编写的开源机器学习 服务器 应用,可以帮助你方便地使用RESTFul API搭建推荐引擎。 PredictionIO的核心使用的是一个可伸缩的机器学习库,基于Spark一个完整的端到端Pipeline,让使用者可以非常简单的从零开始搭建一个推荐系统。 "
PredictionIO 是由三个元件所组成:
- PredictionIO platform
- Event Server: 收集来自应用程式的资料,可以是即时也可以定时。
- Engine: 训练模型,并且将结果以 Restful API 提供查询。
Install
官方有提供快速的一键安装方法,当然也可以手动安装。
$ bash -c "$(curl -s https://install.prediction.io/install.sh)" $ PATH=$PATH:/home/yourname/PredictionIO/bin; export PATH 复制代码
透过以下指定可以检查是否安装成功,会回传每一种套件所连接的状况
$ pio status ### Return: [INFO] [Console$] Inspecting PredictionIO... [INFO] [Console$] PredictionIO 0.9.6 is installed at ... [INFO] [Console$] Inspecting Apache Spark... [INFO] [Console$] Apache Spark is installed at ... [INFO] [Console$] Apache Spark 1.6.0 detected ... [INFO] [Console$] Inspecting storage backend connections... [INFO] [Storage$] Verifying Meta Data Backend (Source: MYSQL)... [INFO] [Storage$] Verifying Model Data Backend (Source: MYSQL)... [INFO] [Storage$] Verifying Event Data Backend (Source: MYSQL)... [INFO] [Storage$] Test writing to Event Store (App Id 0)... [INFO] [Console$] (sleeping 5 seconds for all messages to show up...) [INFO] [Console$] Your system is all ready to go. 复制代码
Quick Start
Step 1. Run PredictionIO
先执行 PredictionIO 主程式,针对不同的储存器,有不同的执行方法。
$ pio eventserver & # If you are using PostgreSQL or MySQL, run the following to start PredictionIO Event Server or $ pio-start-all # If instead you are running HBase and Elasticsearch, run the following to start all PredictionIO Event Server, HBase, and Elasticsearch 复制代码
Step 2. Create a new Engine from an Engine Template
选择Engine Templates 一个适合的 Engine。
$ pio template get <template-repo-path> <your-app-directory> $ cd MyRecommendation 复制代码
可以从Engine Templates 选择,也可以自定义,在这边我们使用 Universal Recommender
作为范例。
Step 3. Generate an App ID and Access Key
执行指定从 Engine 产生一个 APP 并取得对应的 Key。
$ pio app new MyRecommendation ### Return: [INFO] [App$] Initialized Event Store for this app ID: 1. [INFO] [App$] Created new app: [INFO] [App$] Name: MyRecommendation [INFO] [App$] ID: 1 [INFO] [App$] Access Key: ... $ pio app list ### Return: [INFO] [App$] Name | ID | Access Key | Allowed Event(s) [INFO] [App$] MyRecommendation | 1 | ... | (all) [INFO] [App$] Finished listing 1 app(s). 复制代码
Step 4. Collecting Data
接着要汇入资料,最基本的推荐演算法(Cooperative Filtering, CF)格式支元: user
- action
- item
三种元素。使用 data/import_eventserver.py
可以将符合格式的资料汇入资料库。
$ curl <sample_data> --create-dirs -o data/<sample_data> $ python data/import_eventserver.py --access_key <access-key> 复制代码
... 0::2::3 0::3::1 3::9::4 6::9::1 ... 复制代码
Step 5. Deploy the Engine as a Service
在部署应用程式之前,先在 Engine.json 中设定基础资料,像是 appName 或是演算法要运行几次之类的。
... "datasource": { "params" : { "appName": MyRecommendation # make sure the appName parameter match your App Name } }, ... 复制代码
部署系统到 Web Service 时,过程中分成三个步骤: pio build -> pio train -> pio deploy Building 负责准备 Spark 的基础环境及资料准备。 Training 负责执行演算法建模。 Deployment 则是将结果运行在 Web Service 上,并以 Restful API 开放。
- Bulid and Training the Predictive Model
$ pio build ### Return: [INFO] [Console$] Your engine is ready for training. $ pio train ### Return: [INFO] [CoreWorkflow$] Training completed successfully. $ pio deploy ### Return: [INFO] [HttpListener] Bound to /0.0.0.0:8000 [INFO] [MasterActor] Bind successful. Ready to serve. 复制代码
Step 6. Use the Engine
然后就是执行了,预设会开在 port 8000,参数输入 使用者
即要推荐的 商品数量
。
$ curl -H "Content-Type: application/json" \ -d '{ "user": "1", "num": 4 }' https://localhost:8000/queries.json ### Retnrn: { "itemScores":[ {"item":"22","score":4.072304374729956}, {"item":"62","score":4.058482414005789}, {"item":"75","score":4.046063009943821}, {"item":"68","score":3.8153661512945325} ] } 复制代码
以上所述就是小编给大家介绍的《PredictionIO:开源的推荐系统》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!

关注我们,获取更多IT资讯^_^
为你推荐:
- 推荐系统评价:什么是好的推荐系统
- 码云推荐 | 基于 Laravel 的开源淘宝客系统 SmallGo
- 打造工业级推荐系统(七):怎么评估推荐系统的效果?
- 打造工业级推荐系统(六):构建优质的推荐系统服务
相关软件推荐:
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
推荐系统
[奥地利] Dietmar Jannach、Markus Zanker、Alexander Felfernig、Gerhard Friedrich / 蒋 凡 / 人民邮电出版社 / 2013-6-25 / 59.00元
编辑推荐: 通过对本书的学习,读者不仅可以全面系统地了解该领域的基础原理,还能试验如何搭建一套真正的推荐系统。 —— 百度主任架构师、百度技术委员会主席 廖若雪 本书比较全面地介绍了推荐系统涉及的相关知识点,很适合对于推荐系统感兴趣的相关人员作为入门教程,目前能够系统全面介绍相关技术的中文书籍还显得匮乏,相信这本译著对于缓解这种情况大有裨益。 ——新浪微博数据挖掘技术专家 ......一起来看看 《推荐系统》 这本书的介绍吧!