内容简介:业务方说需要我做个注:作者去简单尝试了
背景
业务方说需要我做个 web
界面,在上面输入一条网站访问线索的信息,后台通过机器学习计算这条线索的评级,例如这条线索对应的用户购买意愿有多强之类的。而机器学习对应的模型,也是业务方自己用 KNIME
这个软件训练的,然后将训练完的模型导出为一个 PMML
格式的文件,我所需要做的主要工作就是导入这个文件,转换成对应的机器学习模型。
注:作者去简单尝试了 KNIME
这个软件,感觉是个数据分析的利器。 [链接]
PMML
介绍
PMML(Predictive Model Markup Language)
全称是 预测模型标记语言
,既然叫做标记语言,那其实与 html/XML
等也是非常类似的,只是它存储的是机器学习模型的信息,比如特征名称、类型、个数,模型种类等等。它常用于部署,例如模型在 dev
环节训练好了,将其导出为一个 PMML
文件,然后在 prod
环境中导入即可,也很方便在不同的环境间传递模型,例如使用 python
训练出来的模型,用 R
来调用和预测。
Python
导入 PMML
的问题
现在大部分语言都支持将训练好的模型 导出
为 PMML
文件, python
同样也可以使用 sklearn2pmml
这个库来导出模型,
但我发现没有一个很好的 工具 能反向操作,将已有的 PMML
文件还原成 sklearn
中的机器学习模型。
于是在 GitHub
尝试了一些方案,如下:
-
找到一个项目叫做 jpmml-evaluator
,是用
java写的,它支持将PMML导入到java中,进入作者的仓库中,又发现一个叫做jpmml-evaluator-python,根据ReadMe介绍,这是一个将jpmml-evaluator做了简单封装的python版本,使python可以导入PMML文件,但用户较少,start也只有1,试用时发现了问题,也向作者反馈了,并且作者还因此更新了代码,但仍然没有解决。issue链接: https://github.com/jpmml/jpmm... - 又找了一个叫做 sklearn-pmml-model ,目前也是用户少,功能不完整(支持的模型有限)的情况,但在安装过程中就出错,联系了作者,未获得反馈。
-
openscoring
项目,同样也是一个用
java写的项目,其作用就是支持开启一个服务端用于调用机器学习模型,客户端向服务端传递机器学习的PMML文件和预测数据,服务端可以使用jar包一键部署,而客户端则可以使用java/python/R等不同的SDK,甚至直接使用curl,最终该方案用上了。在和作者沟通中,作者还指出了KNIME导出的PMML存在的BUG,并建议向KNIME反馈这个BUG。
以上所述就是小编给大家介绍的《记一次PMML文件的处理过程》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!
猜你喜欢:- MDK编译过程及文件类型全解
- 宜家PDF下载过程本地文件包含漏洞披露
- 在 Swift Framework 中使用 C 文件的过程探索
- 阿里云短信提示网站发现后门(webshell)文件的解决过程分享
- PHPCMSv9.6.1任意文件读取漏洞的挖掘和分析过程
- 一文了解文件上传全过程(1.8w 字深度解析,进阶必备)
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
ACM图灵奖演讲集
阿申豪斯特 / 苏运霖 / 电子工业出版社 / 2005-4 / 55.0
本书完整地收录了这些演讲,并配之以部分获奖者撰写的后记,旨在反映过去数年来这一领域中发生的变化。对任何一位计算机科学的历史与发展有兴趣的人来说,本书都极具收藏价值。 本文收录了自图灵奖开始颁发的1966年起到1985年这20年间图灵奖获得者在授奖大会上所做演讲的全文。由于在此期间有三次是把奖项同时授予两个人的,而其中有两次两位获奖者分别做了演讲,因此一共收录了22篇演讲稿。本书把这些演讲分为两大......一起来看看 《ACM图灵奖演讲集》 这本书的介绍吧!