南京航空航天大学开源ALiPy:用于主动学习的Python工具包

百家 作者:机器之心 2019-01-18 06:58:15

机器之心报道

机器之心编辑部

参与:路


近日,来自南京航空航天大学的研究者提出并开源了一个用于主动学习的 Python工具包 ALiPy。它不仅提供 20 余种当前最优算法的实现,还支持用户在不同主动学习环境下轻松配置和实现自己的算法。


  • 论文链接:https://arxiv.org/pdf/1901.03802.pdf

  • ALiPy 官网地址:http://parnec.nuaa.edu.cn/huangsj/alipy/index.html


简介


ALiPy 可为主动学习框架提供基于模块的实现,允许用户便捷地评估、对比和分析主动学习方法的性能。它可实现超过 20 种算法,还支持用户在不同的设置下轻松实现自己的方法。


特征


模型独立


不限制分类模型的类型。用户可以按需求在 sklearn 中使用 SVM,或者在 TensorFlow 中使用深度模型。


模块独立


用户可随意修改工具包中的一或多个模块,对其他模块不会产生影响。


无需继承即可实现自己的算法


对用户自定义函数限制极少。


支持不同设置


支持 Noisy oracles、Multi-label、Cost effective、Feature querying 等设置。


强大的工具


保存和加载中间结果、多线程、分析实验结果等。


快速启动


用户可以通过以下命令启动 ALiPy:


pip install alipy

 

详细安装指南,参见 http://parnec.nuaa.edu.cn/huangsj/alipy/installation.html。


  • 对于不太熟悉主动学习、只是想对数据集应用该方法的用户,请查看 http://parnec.nuaa.edu.cn/huangsj/alipy/page_adv/encapsulation_alexperiment.html,即可使用几行代码运行主动学习流程,无需了解任何背景知识。

  • 对于想要对现有主动学习方法进行实验评估的用户,请查看 http://parnec.nuaa.edu.cn/huangsj/alipy/alipy_overview.html,了解 7 种不同设置下的 20 余种当前最优算法。

  • 对于想要实现自己的算法、执行主动学习实验的用户,请查看 http://parnec.nuaa.edu.cn/huangsj/alipy/10_mins_to_alipy.html,学习如何使用 ALiPy 轻松实施主动学习实验。


实现策略


ALiPy 目前提供不同主动学习设置下的多种常见策略,新算法将会在后续更新中逐步添加。



如上图所示,ALiPy 提供的 20 多种算法涉及实例选择、多标签数据、特征查询等不同设置。ALiPy 官网上还展示了 ALiPy 在实例查询等设置下的运行机制。如下所示:


实例查询



Noisy Oracles



不同成本数据集



特征查询




本文为机器之心报道,转载请联系本公众号获得授权

✄------------------------------------------------

加入机器之心(全职记者 / 实习生):hr@jiqizhixin.com

投稿或寻求报道:content@jiqizhixin.com

广告 & 商务合作:bd@jiqizhixin.com

关注公众号:拾黑(shiheibook)了解更多

[广告]赞助链接:

四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接