开源的基于Python的科学计算工具包SciPy,基于SciPy,目前开发者们针对不同的应用领域已经发展出了为数众多的分支版本,它们被统一称为Scikits,即SciPy工具包的意思。在这些分支版本中,最有名,也是专门面向机器学习的一个就是Scikit-learn。
Scikit-learn项目最早由数据科学家 David Cournapeau 在 2007 年发起。
Scikit-Learn是基于 Python 语言的机器学习工具。
建立在 NumPy、SciPy和Matplotlib上,可供大家在各种环境中重复使用,简单高效的数据挖掘和数据分析工具。
开发源码,可商业使用-BSD License。
Scikit-learn的基本功能主要被分为六大部分:分类,回归,聚类,数据降维,模型选择和数据预处理。