版本发布¶
版本 0.15.0¶
新增 #1317, #1455, #1485, #1501, #1518, #1523:初步支持多目标 Auto-sklearn。
新增 #1300, #1410, #1414, #1415, #1420, #1468, #1500:初步支持文本特征 Auto-sklearn。现在可以传入标识为 “string” 的列,这些列将使用纯粹的 sklearn 方法进行分词。
新增 #1475:支持将 X 数据传递给评估指标,这被 [fairlearn](https://github.com/fairlearn/fairlearn) 评估指标所要求
新增 #1341, #1250:公开接口,用于与 auto-sklearn 在需要时如何执行数据集压缩进行交互
文档 #1304:新增了可被 Auto-sklearn 使用的 SMAC 回调函数的文档。
文档 #1476:如何使用回调函数中断 autosklearn 并实现非常朴素的早停的示例
维护 #1364, #1473:通过将选择器模型的构建从导入时移至构建时,缩短了 Auto-sklearn 2 的导入时间。
维护 #1425:更新 StopWatch 为上下文管理器。
维护 #1454:将内部布尔参数 categorical 重命名为 feat_type,以反映不同特征类型的使用
维护 #1474:从代码中移除了“公共测试集”的遗留部分。这不会影响任何面向用户的代码。
维护 #1487:替换已弃用的 DataFrame.append
维护 #1504:将 rval 重命名为 return_value 或 run_value,以消除歧义
维护 #1506:增加元学习相关单元测试的时间,以减少 github 上的超时次数。
维护 #1527:放宽 MLPRegressor 单元测试精度要求。
维护 #1545:在训练评估器中添加明确的下界子样本检查
维护 #1551:修复更新 scipy skew 相关的问题,参见[此处](https://github.com/scipy/scipy/issues/16765)。
维护 #1434:重构集成构建过程
维护 #1464:改进测试,包括缓存 (#1464) 和模块化 (#1417)
维护 #1358:添加工具 Mypy, Flake8, isort, black
修复 #741:如果特殊数据模态不存在,则禁用其超参数,例如在没有类别特征时禁用独热编码。
修复 #1365, #1369:修复了 ensemble_size == 0 的问题。
修复 #1374:将随机状态传递给流水线的所有组件。
修复 #1432:修复了 AutoSklearnClassifier.leaderboard() 或 AutoSklearnRegressor.leaderboard() 可能无法显示结果的问题。
修复 #1480:在发生异常或键盘中断时正确终止 Auto-sklearn。
修复 #1532:在最新 dask 版本关闭时移除异常打印。打印的异常完全不影响性能,只是具有误导性,因为它们暗示了 Auto-sklearn 的故障。
修复 #1547:修复了 Auto-sklearn 2 中的一个错误,该错误在传入 pandas DataFrames 时可能悄无声息地导致其崩溃。
修复 #1550:修复了最近在使用 pandas Y 进行评估时出现的错误。
贡献者 v0.15.0¶
Matthias Feurer
Eddie Bergman
Katharina Eggensperger
Sagar Kaushik
partev
Lukas Strack
Basavasagar K Patil
Eric Pedley
Aseem Kannal
SkBlaz
版本 0.14.7¶
热修复 #1445:将 ConfigSpace 锁定到 <0.5.0,smac 锁定到 <1.3。添加了 automl 包的上限,以帮助防止进一步的问题。
贡献者 v0.14.7¶
Eddie Bergman
版本 0.14.4¶
修复 #1356:SVR 度超参数现在仅在“poly”核函数激活时有效。
新增 #1311:Black 格式检查(非严格)。
维护 #1306:运行历史现在每迭代一次保存
文档 #1309:更新了文档常见问题解答,包括许多用例和早期介绍的手册
文档 #1322:修复贡献指南中的拼写错误
维护 #1326:添加 isort 检查器(非严格)
维护 #1238, #1346, #1368, #1370:更新测试中的警告
维护 #1325:测试工作流程现在可以手动触发
维护 #1332:更新
include
和exclude
参数的文档字符串和类型注解新增 #1260:支持 Python 3.10
新增 #1318:首次更新使用新的子模块 automl_common 中的共享后端
修复 #1339:解决
sphinx_toolbox
的依赖问题修复 #1335:修复了某些回归算法给出不正确输出维度的问题,如 #1297 中提出
文档 #1340:更新预定义分割示例
修复 #1329:修复随机状态未传递给 ConfigurationSpace 的问题
维护 #1348:停止双重触发 github 工作流程
文档 #1349:在文档中将 OSX 重命名为 macOS
新增 #1321:将
show_models()
更改为生成实际的流水线对象,而非str
维护 #1361:移除
flaky
依赖维护 #1366:使
SimpleClassificationPipeline
测试更具确定性维护 #1367:使用较新的 numpy 更新
MLPRegressor
的测试值
贡献者 v0.14.4¶
Eddie Bergman
Matthias Feurer
Katharina Eggensperger
UserFindingSelf
partev
版本 0.14.1¶
修复 #1248:允许稀疏的
y_test
。修复 #1259:修复了由于选择了相对路径可能导致
setup.py
无法工作的问题。维护 #1261:包含 CITATION.cff 文件
维护 #1263:使单元测试确定性。
文档 #1269:修复扩展数据预处理的示例。
文档 #1270:从文档的代码示例中移除
>>>
。文档 #1271:修复文档示例中的拼写错误。
文档 #1282:添加贡献指南。
贡献者 v0.14.1¶
Eddie Bergman
Michael Becker
Katharina Eggensperger
版本 0.14.0¶
新增 #900:使数据预处理更具可配置性,例如允许完全禁用它。
新增 #1128:添加新功能,无需额外代码即可从 Auto-sklearn 检索随时间变化的准确率图的数据。
修复 #1149:阻止 Auto-sklearn 在关闭时打印奇怪的警告(忽略的异常在 […])。
修复 #1169:修复了导致交叉验证和多输出回归不兼容的错误。
修复 #1170:使所有预处理技术确定性。
修复 #1190:修复了可能导致预测概率包含过少类别的问题,如果某个类别只出现一次。
修复 #1209:将随机状态传递给流水线对象。
修复 #1204:在 Auto-sklearn 2.0 中添加对稀疏数据的支持。
修复 #1210:添加对稀疏 y 标签的支持。
修复 #1245:修复了如果某个类别只出现一次可能导致 Auto-sklearn 崩溃的错误。
文档 #532,#1242:简化安装说明。
文档 #1144:记录通过 conda 安装
文档 #1195,#1201,#1214:修复一些拼写错误和链接。将一些 http 链接改为 https 链接。
文档 #1200:修复示例中的变量名。
文档 #1229:改进文档中的代码格式。
文档 #1235:改进 docker 启动命令,使其也能在 Windows 上工作。
维护 #1198:在 github actions 中使用最新的 Ubuntu LTS (20:04)。
维护 #1231:make linkcheck 命令不再构建文档,加快了链接检查速度。
维护 #1233:在 github actions 上使用 3 个分类数据集和 3 个回归数据集启用回归测试。
维护 #1239:将 github actions 的超时时间增加到 60 分钟。
贡献者 v0.14.0¶
Pieter Gijsbers
Taneli Mielikäinen
Rohit Agarwal
hnishi
Francisco Rivera Valverde
Eddie Bergman
Satyam Jha
Joel Jose
Oli
Matthias Feurer
版本 0.13.0¶
新增 #1100:提供对 SMAC 回调函数的访问。
新增 #1185:新的排行榜功能用于可视化模型
修复 #1133:在错误消息中引用正确的属性。
修复 #1154:允许在 32 位系统上运行 Auto-sklearn。
维护 #924:现在必须传递对象,而非传递类来指定重采样策略。
维护 #1108:通过 threadpoolctl 限制 numpy 和/或 scikit-learn 使用的线程数。
维护 #1135:简化 pandas 处理的内部工作流程。这导致 pandas 直接传递给 scikit-learn 模型,而非在内部转换为 numpy 数组。但是,这应该不会影响 Auto-sklearn 的行为或性能。
维护 #1157:停止支持 Python 3.6,启用对 Python 3.9 的支持。
维护 #1159:移除分类器和回归器的输出目录参数。尽管名称如此,输出目录并未使用,是参与 AutoML 挑战的遗留物。
维护 #1187:提升 SMAC 版本要求到至少 0.14。
文档 #1109:添加常见问题解答。
文档 #1126:添加关于如何使用 scikit-learn 的 inspect 模块的新示例。
文档 #1136:添加关于如何执行多输出回归的新示例。
文档 #1152:构建文档时启用链接检查。
文档 #1158:添加关于如何配置 Auto-sklearn 日志记录器的新示例。
文档 #1165:改进 README 页面。
贡献者 v0.13.0¶
Matthias Feurer
Eddie Bergman
bitsbuffer
Francisco Rivera Valverde
版本 0.12.7¶
新增 #1178:如果数据集对于给定的内存限制过大,则降低精度。
新增 #1179:通过为评估指标 roc_auc 和 logloss 提供新的元数据,改进 Auto-sklearn 2.0 的元数据。
文档:修复对 arXiv 论文的引用
维护 #1134,#1142,#1143:对 stale bot 的改进 - stale bot 现在将标记为“需要反馈”的问题标记为 stale,如果 30 天内没有任何活动。再过 7 天后,它将关闭问题。
维护:添加了新的问题模板用于提问。
维护 #1168:SciPy 上限为 1.6.3,因为 1.7.0 与 SMAC 不兼容。
维护 #1173:更新许可证文件以便被 github 识别。
贡献者 v0.12.7¶
Francisco Rivera Valverde
Matthias Feurer
JJ Ben-Joseph
Isaac Chung
Katharina Eggensperger
bitsbuffer
Eddie Bergman
olehb007
版本 0.12.6¶
新增 #886:提供新的函数,允许只拟合单个配置。
文档 #1070:澄清逐步减半和贝叶斯优化如何协同工作的示例。
文档 #1112:修复类型。
文档 #1122:在 Ubuntu 的安装命令中添加 Python 3。
修复 #1114:修复了导致打印 dummy 模型失败的错误。
修复 #1117:修复了之前导致 memory_limit=None 失败的错误。
修复 #1121:修复了在使用交叉验证和迭代拟合时,在 Auto-sklearn 2.0 中可能降低性能的边界情况。
修复 #1123:修复了 autosklearn.metrics.calculate_score 中需要最小化的指标/分数的问题,该函数之前返回的是损失而非分数。
修复 #1115/#1124:修复了在多进程情况下阻止 Auto-sklearn 计算元特征的错误。
贡献者 v0.12.6¶
Francisco Rivera Valverde
stock90975
Lucas Nildaimon dos Santos Silva
Matthias Feurer
Rohit Agarwal
版本 0.12.4¶
新增 #660:为输入特征启用 scikit-learn 的幂变换。
维护:提升
pyrfr
最低依赖版本到 0.8.1,以便尽可能自动从 pypi 下载 wheels。修复 #732:在用于 NeurIPS 2015 论文的 GMEANS 聚类中添加缺失的大小检查。
修复 #1050:为
AutoSklearn2Classifier
签名添加缺失的参数。修复 #1072:修复了
AutoSklearn2Classifier
无法创建的问题,原因在于尝试缓存到错误的目录。
贡献者 v0.12.4¶
Matthias Feurer
Francisco Rivera
Maximilian Greil
Pepe Berba
版本 0.12.3¶
修复 #1061:修复了在 jupyter notebook 中无法打印模型的问题。
修复 #1075:修复了集成构建器对于损失函数(即需要最小化的函数,例如
logloss
或mean_squared_error
)会错误地剪除好模型的问题。修复 #1079:修复了
AutoMLClassifier.cv_results
和AutoMLRegressor.cv_results
对于损失函数(即需要最小化的函数,例如logloss
或mean_squared_error
)可能以相反顺序对结果排序的错误。修复:修复了离线元数据生成中的一个可能导致死锁的错误。
维护 #1076:使用正确的进程上下文计算元特征
维护:清理 readme 和主目录
贡献者 v0.12.3¶
Matthias Feurer
ROHIT AGARWAL
Francisco Rivera
版本 0.12.2¶
新增 #1045:新的示例,演示如何在 Auto-sklearn 运行期间记录多个指标。
文档 #1052:添加 mybinder 链接
文档 #1059:改进了手动启动 Auto-sklearn 工作者的示例。
修复 #1046:将集成构建器的最终结果添加到集成构建器轨迹。
维护:两个警告级别的日志输出被降级到 info 日志级别,因为它们对用户不可操作。
维护 #1062:为本地 dask worker 使用线程,并使用 forkserver 启动子进程以减少开销。
维护 #1053:再次移除对
__main__ == "__name__"
保护单核 Auto-sklearn 的限制。
贡献者 v0.12.2¶
Matthias Feurer
ROHIT AGARWAL
Francisco Rivera
Katharina Eggensperger
版本 0.12.1¶
新增:一个新的启发式方法,如果数据量对于给定的
memory_limit
过大,则会给出警告并对数据进行子抽样。新增 #1024:调整 scikit-learn 的
MLPClassifier
和MLPRegressor
。维护 #1017:改进版本 0.12.0 中引入的日志服务器。
维护 #1024:迁移到 scikit-learn 0.24.X。
维护 #1038:为回归和分类使用新数据集,并更新用于 Auto-sklearn 1.0 的元数据。
维护 #1040:集成选择算法中的轻微速度改进。
贡献者 v0.12.1¶
Matthias Feurer
Katharina Eggensperger
Francisco Rivera
版本 0.12.0¶
重大变更:由于使用了
spawn
多进程上下文,Auto-sklearn 现在必须由__name__ == "__main__"
保护。新增 #1026:添加改进的 Auto-sklearn 2.0 元数据,从而显著提高了性能。
维护 #984 和 #1008:迁移到 scikit-learn 0.23.X
维护 #1004:从 travis-ci 迁移到 github actions。
维护 8b67af6:移除对 lockfile 包的依赖。
修复 #990:修复了如果 pandas DataFrame 中存在缺失值,导致 Auto-sklearn 失败的错误。
修复 #1007, #1012 和 #1014:通过新的日志服务器记录多进程输出。移除几个与多进程、多线程和日志记录的联合使用相关的潜在死锁。
贡献者 v0.12.0¶
Matthias Feurer
ROHIT AGARWAL
Francisco Rivera
版本 0.11.1¶
修复 #989:修复了 y 未传递给所有数据预处理器的问题,这导致第三方类别编码器失败。
修复 #1001:修复了可能导致 Auto-sklearn 随机失败的错误。
维护 #1000:引入
dask.distributed
的最低版本要求。
贡献者 v0.11.1¶
Matthias Feurer
版本 0.11.0¶
新增 #992:将集成构建从独立进程迁移到提交给 dask 集群的任务。这允许在多进程设置中更好地控制使用的内存。
修复 #905:使
AutoSklearn2Classifier
可序列化。修复 #970:修复了如果类别特征作为 Pandas Dataframe 传入,Auto-sklearn 会失败的错误。
维护 #772:改进 dummy 预测失败情况下的错误消息。
维护 #948:最终使用 Pandas >= 1.0。
维护 #973:通过运行更长时间的元数据生成并对重要指标单独进行,改进元数据。
维护 #997:改进集成构建过程中的内存处理。这允许为更大的数据集构建集成。
贡献者 v0.11.0¶
Matthias Feurer
Francisco Rivera
Karl Leswing
ROHIT AGARWAL
版本 0.10.0¶
新增 #325:允许单独优化元数据生成指标。
新增 #946:新的 dask 后端用于并行 Auto-sklearn。
重大变更 #947:停止支持 Python 3.5。
重大变更 #946:移除并行 Auto-sklearn 的共享模型模式。
修复 #351:不再将不可序列化的日志记录器实例传递给目标函数。
修复 #840:修复了阻止计算回归数据集元数据的错误。同时添加了回归元数据计算的单元测试。
修复 #897:允许自定义分割器用于多输出回归。
修复 #951:修复了回归流水线中的许多错误,这些错误导致回归数据集的性能不佳。
修复 #953:重新添加 liac-arff 作为依赖。
修复 #956:修复了可能导致 Auto-sklearn 在磁盘上找不到集成一部分模型的问题。
修复 #961:修复了导致 Auto-sklearn 为无法在多类别数据集上计算的指标(特别是 ROC_AUC)加载不良元数据的错误。
文档 #498:通过展示如何将 scikit-learn 的分割器对象传递给 Auto-sklearn,改进重采样策略示例。
文档 #670:演示如何访问训练准确率。
文档 #872:改进关于如何获取最佳模型的示例。
文档 #940:改进 docker 镜像的文档。
维护:改进 docker 文件,设置环境变量限制 BLAS 和 OMP 只使用单个核心。
维护 #949:在安装指南中将 pip 替换为 pip3。
维护 #280, #535, #956:更新元数据,再次包含回归元数据。
贡献者 v0.10.0¶
Francisco Rivera
Matthias Feurer
felixleungsc
Chu-Cheng Fu
Francois Berenger
版本 0.9.0¶
新增 #157,#889:改进 pandas dataframes 的处理,包括使用 pandas 类别列类型的可能性。
新增 #375:新的 SelectRates 特征预处理组件用于回归。
新增 #891:通过使用单个最佳模型(如果未找到集成),提高 Auto-sklearn 的健壮性。
新增 #902:跟踪集成随时间变化的性能。
新增 #914:添加使用 pandas dataframes 作为输入 Auto-sklearn 的示例。
新增 #919:添加多标签分类示例。
维护 #909:修复文档中的损坏链接。
维护 #907,#911:添加对 mypy 的初步支持。
维护 #881,#927:在推送到 master 和 development 分支时自动构建 docker 镜像,并将其推送到 dockerhub 和 github docker 注册表。
维护 #918:从 requirements.txt 中移除旧依赖。
维护 #931:在日志文件中添加关于主机系统和已安装软件包的信息。
维护 #933:减少构建文档时 sphinx 触发的警告数量。
维护 #936:完全重构示例部分。
修复 #558:提供更好的错误消息,当集成过程由于内存问题失败时。
修复 #901:再次允许自定义重采样策略(由于 SMAC 升级导致损坏)。
修复 #916:修复了数据预处理配置被忽略的错误。
修复 #925:使内部数据预处理对象可克隆。
贡献者 v0.9.0¶
Francisco Rivera
Matthias Feurer
felixleungsc
Vladislav Skripniuk
版本 0.8¶
新增 #803:多输出回归
新增 #893:新的 Auto-sklearn 模式 Auto-sklearn 2.0
贡献者 v0.8.0¶
Chu-Cheng Fu
Matthias Feurer
版本 0.7.1¶
新增 #764:支持自动选择 per_run_time_limit
新增 #864:添加使用交叉验证进行预测的可能性
新增 #874:支持限制磁盘空间消耗
维护 #862:改进文档并在网页中渲染示例
维护 #869:移除竞赛数据管理器支持
维护 #870:构建集成时的内存改进
维护 #882:执行集成选择时的内存改进
修复 #701:元特征的缩放因子不应使用测试数据学习
修复 #715:允许无限的 ML 内存
修复 #771:改进最差可能结果计算
修复 #843:SelectPercentileRegression 的默认值
修复 #852:将概率限制在 [0-1] 范围内
修复 #854:改进临时文件命名
修复 #863:SMAC 异常也在日志文件中注册
修复 #876:允许克隆 Auto-sklearn 模型
修复 #879:允许一维二分类预测
贡献者 v0.7.1¶
Matthias Feurer
Xiaodong DENG
Francisco Rivera
版本 0.7.0¶
新增 #785:用户控制减少存储集成所需的硬盘内存
新增 #794:梯度提升的迭代拟合
新增 #795:添加逐步减半评估策略
新增 #814:使用新的 sklearn.metrics.balanced_accuracy_score 而非自定义指标
新增 #815:新的实验评估模式 iterative_cv
维护 #774:从 scikit-learn 0.21.X 迁移到 0.22.X
维护 #791:从 smac 0.8 迁移到 0.12
维护 #822:使 autosklearn 模块符合 PEP8 规范
修复 #733:修复 n_jobs=-1 的问题
修复 #739:移除不必要的警告
修复 ##769:修复元特征计算错误
修复 #778:支持 python 3.8
修复 #781:支持 pandas 1.x
贡献者 v0.7.0¶
Andrew Nader
Gui Miotto
Julian Berman
Katharina Eggensperger
Matthias Feurer
Maximilian Peters
Rong-Inspur
Valentin Geffrier
Francisco Rivera
版本 0.6.0¶
维护:从 scikit-learn 0.19.X 迁移到 0.21.X
维护 #688:允许 pyrfr 版本 0.8.X
修复 #680:移除不必要的打印语句
修复 #600:移除不必要的警告
贡献者 v0.6.0¶
Guilherme Miotto
Matthias Feurer
Jin Woo Ahn
版本 0.5.2¶
修复 #669:正确处理传递给
AutoMLRegressor
的参数修复 #667:Auto-sklearn 再次支持 numpy 1.16.3。
新增 #676:允许临时和输出目录路径中使用方括号 [ ]。
新增 #424:(实验性)脚本以重现原始 Auto-sklearn 论文的结果。
贡献者 v0.5.2¶
Jin Woo Ahn
Herilalaina Rakotoarison
Matthias Feurer
yazanobeidi
版本 0.5.1¶
新增 #650:如果使用 scikit-learn 的 dummy 预测器进行预测失败,Auto-sklearn 将立即停止。
新增 #537:对于时间限制小于 30 秒的情况,Auto-sklearn 将不再启动。
修复 #655:修复了使用并行 Auto-sklearn 运行的模型进行预测可能错误的问题。
修复 #648:修复了自定义元数据目录的问题。
修复 #626:修复了损失未被最小化而是最大化的问题。
维护 #646:不再限制 numpy 版本小于 1.14.5。
贡献者 v0.5.1¶
Jin Woo Ahn
Taneli Mielikäinen
Matthias Feurer
jianswang
版本 0.5.0¶
新增 #593:Auto-sklearn 支持
n_jobs
参数用于单机并行计算。文档 #618:添加了多个系统要求的链接。
修复 #611:改进了通过 pip 安装。
测试 #614:在干净的 Ubuntu 上测试安装。
维护:修复了文档中的损坏链接和拼写错误。
贡献者 v0.5.0¶
Mohd Shahril
Adrian
Matthias Feurer
Jirka Borovec
Pradeep Reddy Raamana
版本 0.4.2¶
修复 #538:移除为 holdout 提供训练集比例时的舍入误差。
修复 #558:集成脚本现在使用更少内存,并且可以将内存限制传递给 Auto-sklearn。
修复 #585:Auto-sklearn 的集成脚本在直接调用时(而非通过 Auto-sklearn 的估计器类之一调用)产生了错误结果。
修复了集成脚本中的一个使其非确定性的错误。
维护 #569:重命名超参数,使其与含义不同的 scikit-learn 超参数名称不同。
维护 #592:向后兼容的 requirements.txt
维护 #588:固定 SMAC 版本到 0.8.0
维护:移除对 six 包的依赖
维护:升级到 XGBoost 0.80
贡献者 v0.4.2¶
Taneli Mielikäinen
Matthias Feurer
Diogo Bastos
Zeyi Wen
Teresa Conceição
Jin Woo Ahn
版本 0.4.1¶
添加了关于 如何使用自定义分类器、回归器和预处理器扩展 Auto-sklearn 的文档。
Auto-sklearn 现在需要 numpy 版本在 1.9.0 和 1.14.5 之间,因为更高版本会导致 travis 失败。
示例现在使用
sklearn.datasets.load_breast_cancer()
而非sklearn.datasets.load_digits()
以减少 travis 构建的内存使用。修复非元组序列索引的未来警告。
修复 #482 和 #491:用户现在可以通过传递 yaml 文件创建的字典到
logging_config
来设置自定义日志配置。修复 #566:集成现在已正确排序。
修复 #293:在调用
fit()
之前,Auto-sklearn 检查是否为分类和回归给出了适当的目标类型。Travis-ci 现在运行 flake8 以强制执行 pep8 风格指南,并使用 travis-ci 而非 circle-ci 进行部署。
贡献者 v0.4.1¶
Matthias Feurer
Manuel Streuhofer
Taneli Mielikäinen
Katharina Eggensperger
Jin Woo Ahn
版本 0.4.0¶
修复 #409:修复
predict_proba
不再引发 AttributeError。改进并行示例的文档。
分类器现在被测试为幂等的,如 scikit-learn 所要求的。
修复 LDA 中收缩参数的使用。
修复 #410 并更改 SGD 超参数
修复 #425,该错误导致非线性支持向量机总是在 OSX 上崩溃。
实现 #149:现在可以传递自定义的交叉验证分割,遵循 scikit-learn 的
model_selection
模块。现在可以通过在
resampling_strategy_arguments
的字典中传递布尔值 shuffle 来决定是否打乱 Auto-sklearn 中的数据。添加了跟踪测试性能随时间变化的功能。
重构集成构建使其更快,从硬盘读取更少数据,并在性能相同的模型情况下执行随机平局打破。
实现 #438:为了与 SMAC 的输出保持一致(它最小化目标函数的损失),集成构建器的输出现在也是最小化问题的输出。
实现 #271:XGBoost 再次可用,甚至可以配置新的 dropout 功能。
新的文档部分 检查结果。
修复 #444:Auto-sklearn 现在只加载实际与集成相关的模型进行 refit。
在导入和安装时添加操作系统检查,确保不会意外在 Windows 机器上运行。
使用 sphinx gallery 的新示例库:示例
保护 Auto-sklearn 不删除它未创建的目录(问题 #317)。
贡献者 v0.4.0¶
Matthias Feurer
kaa
Josh Mabry
Katharina Eggensperger
Vladimir Glazachev
Jesper van Engelen
Jin Woo Ahn
Enrico Testa
Marius Lindauer
Yassine Morakakam
版本 0.3.0¶
升级到 scikit-learn 0.19.1。
不将
DummyClassifier
或DummyRegressor
用作集成的一部分。修复 #140。通过在子进程而非主进程中加载数据来修复 #295。
修复 #326:refitting 可能导致类型错误。通过改进分类组件中的类型检查现已修复。
更新了
RandomForestClassifier
,ExtraTreesClassifier
和GradientBoostingClassifier
的搜索空间(修复 #358)。移除常量特征现在是流水线的一部分。
允许将 SMBO 对象传递到
AutoSklearnClassifier
和AutoSklearnRegressor
中。
贡献者 v0.3.0¶
Matthias Feurer
Jesper van Engelen
版本 0.2.1¶
允许使用 scikit-learn 0.18.2。
升级到最新的 SMAC 版本(
0.6.0
)和最新的随机森林版本(0.6.1
)。添加了 Dockerfile。
添加了使用 holdout 重采样策略时更改 holdout 集大小的可能性。
修复了 QDA 超参数中的一个错误。
打印语句中的拼写错误修复。
新方法检索最终集成中使用的模型。
贡献者 v0.2.1¶
Matthias Feurer
Katharina Eggensperger
Felix Leung
caoyi0905
Young Ryul Bae
Vicente Alencar
Lukas Großberger
版本 0.2.0¶
auto-sklearn 支持自定义指标和 scikit-learn 中包含的所有指标。现在可以将不同的指标传递给估计器对象的
fit()
方法,例如AutoSklearnClassifier.fit(metric='roc_auc')
。升级到 scikit-learn 0.18.1。
移除 XGBoost,因为最新版本(0.6a2)在由 pyninsher 启动时无法工作。
auto-sklearn 可以在调用
predict()
和predict_proba
时使用多进程。作者:Laurent Sorber。
贡献者 v0.2.0¶
Matthias Feurer
Katharina Eggensperger
Laurent Sorber
Rafael Calsaverini
版本 0.1.x¶
在版本 0.2.0 之前没有 auto-sklearn 的版本说明。
贡献者 v0.1.x¶
Matthias Feurer
Katharina Eggensperger
Aaron Klein
Jost Tobias Springenberg
Anatolii Domashnev
Stefan Falkner
Alexander Sapronov
Manuel Blum
Diego Kobylkin
Jaidev Deshpande
Jongheon Jeong
Hector Mendoza
Timothy J Laurent
Marius Lindauer
_329_
Iver Jordal