版本发布

版本 0.15.0

  • 新增 #1317, #1455, #1485, #1501, #1518, #1523:初步支持多目标 Auto-sklearn。

  • 新增 #1300, #1410, #1414, #1415, #1420, #1468, #1500:初步支持文本特征 Auto-sklearn。现在可以传入标识为 “string” 的列,这些列将使用纯粹的 sklearn 方法进行分词。

  • 新增 #1475:支持将 X 数据传递给评估指标,这被 [fairlearn](https://github.com/fairlearn/fairlearn) 评估指标所要求

  • 新增 #1341, #1250:公开接口,用于与 auto-sklearn 在需要时如何执行数据集压缩进行交互

  • 文档 #1304:新增了可被 Auto-sklearn 使用的 SMAC 回调函数的文档。

  • 文档 #1476:如何使用回调函数中断 autosklearn 并实现非常朴素的早停的示例

  • 维护 #1364, #1473:通过将选择器模型的构建从导入时移至构建时,缩短了 Auto-sklearn 2 的导入时间。

  • 维护 #1425:更新 StopWatch 为上下文管理器。

  • 维护 #1454:将内部布尔参数 categorical 重命名为 feat_type,以反映不同特征类型的使用

  • 维护 #1474:从代码中移除了“公共测试集”的遗留部分。这不会影响任何面向用户的代码。

  • 维护 #1487:替换已弃用的 DataFrame.append

  • 维护 #1504:将 rval 重命名为 return_valuerun_value,以消除歧义

  • 维护 #1506:增加元学习相关单元测试的时间,以减少 github 上的超时次数。

  • 维护 #1527:放宽 MLPRegressor 单元测试精度要求。

  • 维护 #1545:在训练评估器中添加明确的下界子样本检查

  • 维护 #1551:修复更新 scipy skew 相关的问题,参见[此处](https://github.com/scipy/scipy/issues/16765)。

  • 维护 #1434:重构集成构建过程

  • 维护 #1464:改进测试,包括缓存 (#1464) 和模块化 (#1417)

  • 维护 #1358:添加工具 Mypy, Flake8, isort, black

  • 修复 #741:如果特殊数据模态不存在,则禁用其超参数,例如在没有类别特征时禁用独热编码。

  • 修复 #1365, #1369:修复了 ensemble_size == 0 的问题。

  • 修复 #1374:将随机状态传递给流水线的所有组件。

  • 修复 #1432:修复了 AutoSklearnClassifier.leaderboard()AutoSklearnRegressor.leaderboard() 可能无法显示结果的问题。

  • 修复 #1480:在发生异常或键盘中断时正确终止 Auto-sklearn。

  • 修复 #1532:在最新 dask 版本关闭时移除异常打印。打印的异常完全不影响性能,只是具有误导性,因为它们暗示了 Auto-sklearn 的故障。

  • 修复 #1547:修复了 Auto-sklearn 2 中的一个错误,该错误在传入 pandas DataFrames 时可能悄无声息地导致其崩溃。

  • 修复 #1550:修复了最近在使用 pandas Y 进行评估时出现的错误。

贡献者 v0.15.0

  • Matthias Feurer

  • Eddie Bergman

  • Katharina Eggensperger

  • Sagar Kaushik

  • partev

  • Lukas Strack

  • Basavasagar K Patil

  • Eric Pedley

  • Aseem Kannal

  • SkBlaz

版本 0.14.7

  • 热修复 #1445:将 ConfigSpace 锁定到 <0.5.0smac 锁定到 <1.3。添加了 automl 包的上限,以帮助防止进一步的问题。

贡献者 v0.14.7

  • Eddie Bergman

版本 0.14.6

  • 热修复 #1407:在 SingleThreadedClient 中捕获关键字参数,使其不传递给其执行的 func

贡献者 v0.14.6

  • Eddie Bergman

版本 0.14.5

  • 热修复:发布包含 automl_common 的 PyPi 包

贡献者 v0.14.5

  • Eddie Bergman

版本 0.14.4

  • 修复 #1356:SVR 度超参数现在仅在“poly”核函数激活时有效。

  • 新增 #1311:Black 格式检查(非严格)。

  • 维护 #1306:运行历史现在每迭代一次保存

  • 文档 #1309:更新了文档常见问题解答,包括许多用例和早期介绍的手册

  • 文档 #1322:修复贡献指南中的拼写错误

  • 维护 #1326:添加 isort 检查器(非严格)

  • 维护 #1238, #1346, #1368, #1370:更新测试中的警告

  • 维护 #1325:测试工作流程现在可以手动触发

  • 维护 #1332:更新 includeexclude 参数的文档字符串和类型注解

  • 新增 #1260:支持 Python 3.10

  • 新增 #1318:首次更新使用新的子模块 automl_common 中的共享后端

  • 修复 #1339:解决 sphinx_toolbox 的依赖问题

  • 修复 #1335:修复了某些回归算法给出不正确输出维度的问题,如 #1297 中提出

  • 文档 #1340:更新预定义分割示例

  • 修复 #1329:修复随机状态未传递给 ConfigurationSpace 的问题

  • 维护 #1348:停止双重触发 github 工作流程

  • 文档 #1349:在文档中将 OSX 重命名为 macOS

  • 新增 #1321:将 show_models() 更改为生成实际的流水线对象,而非 str

  • 维护 #1361:移除 flaky 依赖

  • 维护 #1366:使 SimpleClassificationPipeline 测试更具确定性

  • 维护 #1367:使用较新的 numpy 更新 MLPRegressor 的测试值

贡献者 v0.14.4

  • Eddie Bergman

  • Matthias Feurer

  • Katharina Eggensperger

  • UserFindingSelf

  • partev

版本 0.14.3

  • 热修复 #1356:更新 dask 到 dask.distributed >=2012.12

贡献者 v0.14.3

  • Eddie Bergman

版本 0.14.2

  • 修复 #1290:修复了无法扩展 Auto-sklearn 并并行运行的错误。

贡献者 v0.14.2

  • Matthias Feurer

版本 0.14.1

  • 修复 #1248:允许稀疏的 y_test

  • 修复 #1259:修复了由于选择了相对路径可能导致 setup.py 无法工作的问题。

  • 维护 #1261:包含 CITATION.cff 文件

  • 维护 #1263:使单元测试确定性。

  • 文档 #1269:修复扩展数据预处理的示例。

  • 文档 #1270:从文档的代码示例中移除 >>>

  • 文档 #1271:修复文档示例中的拼写错误。

  • 文档 #1282:添加贡献指南。

贡献者 v0.14.1

  • Eddie Bergman

  • Michael Becker

  • Katharina Eggensperger

版本 0.14.0

  • 新增 #900:使数据预处理更具可配置性,例如允许完全禁用它。

  • 新增 #1128:添加新功能,无需额外代码即可从 Auto-sklearn 检索随时间变化的准确率图的数据。

  • 修复 #1149:阻止 Auto-sklearn 在关闭时打印奇怪的警告(忽略的异常在 […])。

  • 修复 #1169:修复了导致交叉验证和多输出回归不兼容的错误。

  • 修复 #1170:使所有预处理技术确定性。

  • 修复 #1190:修复了可能导致预测概率包含过少类别的问题,如果某个类别只出现一次。

  • 修复 #1209:将随机状态传递给流水线对象。

  • 修复 #1204:在 Auto-sklearn 2.0 中添加对稀疏数据的支持。

  • 修复 #1210:添加对稀疏 y 标签的支持。

  • 修复 #1245:修复了如果某个类别只出现一次可能导致 Auto-sklearn 崩溃的错误。

  • 文档 #532,#1242:简化安装说明。

  • 文档 #1144:记录通过 conda 安装

  • 文档 #1195,#1201,#1214:修复一些拼写错误和链接。将一些 http 链接改为 https 链接。

  • 文档 #1200:修复示例中的变量名。

  • 文档 #1229:改进文档中的代码格式。

  • 文档 #1235:改进 docker 启动命令,使其也能在 Windows 上工作。

  • 维护 #1198:在 github actions 中使用最新的 Ubuntu LTS (20:04)。

  • 维护 #1231:make linkcheck 命令不再构建文档,加快了链接检查速度。

  • 维护 #1233:在 github actions 上使用 3 个分类数据集和 3 个回归数据集启用回归测试。

  • 维护 #1239:将 github actions 的超时时间增加到 60 分钟。

贡献者 v0.14.0

  • Pieter Gijsbers

  • Taneli Mielikäinen

  • Rohit Agarwal

  • hnishi

  • Francisco Rivera Valverde

  • Eddie Bergman

  • Satyam Jha

  • Joel Jose

  • Oli

  • Matthias Feurer

版本 0.13.0

  • 新增 #1100:提供对 SMAC 回调函数的访问。

  • 新增 #1185:新的排行榜功能用于可视化模型

  • 修复 #1133:在错误消息中引用正确的属性。

  • 修复 #1154:允许在 32 位系统上运行 Auto-sklearn。

  • 维护 #924:现在必须传递对象,而非传递类来指定重采样策略。

  • 维护 #1108:通过 threadpoolctl 限制 numpy 和/或 scikit-learn 使用的线程数。

  • 维护 #1135:简化 pandas 处理的内部工作流程。这导致 pandas 直接传递给 scikit-learn 模型,而非在内部转换为 numpy 数组。但是,这应该不会影响 Auto-sklearn 的行为或性能。

  • 维护 #1157:停止支持 Python 3.6,启用对 Python 3.9 的支持。

  • 维护 #1159:移除分类器和回归器的输出目录参数。尽管名称如此,输出目录并未使用,是参与 AutoML 挑战的遗留物。

  • 维护 #1187:提升 SMAC 版本要求到至少 0.14。

  • 文档 #1109:添加常见问题解答。

  • 文档 #1126:添加关于如何使用 scikit-learn 的 inspect 模块的新示例。

  • 文档 #1136:添加关于如何执行多输出回归的新示例。

  • 文档 #1152:构建文档时启用链接检查。

  • 文档 #1158:添加关于如何配置 Auto-sklearn 日志记录器的新示例。

  • 文档 #1165:改进 README 页面。

贡献者 v0.13.0

  • Matthias Feurer

  • Eddie Bergman

  • bitsbuffer

  • Francisco Rivera Valverde

版本 0.12.8

  • 维护 #1183:引入 dask 版本的上限,以保持与 SMAC3 的兼容性。

贡献者 v0.12.8

  • Eddie Bergman

版本 0.12.7

  • 新增 #1178:如果数据集对于给定的内存限制过大,则降低精度。

  • 新增 #1179:通过为评估指标 roc_auclogloss 提供新的元数据,改进 Auto-sklearn 2.0 的元数据。

  • 文档:修复对 arXiv 论文的引用

  • 维护 #1134,#1142,#1143:对 stale bot 的改进 - stale bot 现在将标记为“需要反馈”的问题标记为 stale,如果 30 天内没有任何活动。再过 7 天后,它将关闭问题。

  • 维护:添加了新的问题模板用于提问。

  • 维护 #1168:SciPy 上限为 1.6.3,因为 1.7.0SMAC 不兼容。

  • 维护 #1173:更新许可证文件以便被 github 识别。

贡献者 v0.12.7

  • Francisco Rivera Valverde

  • Matthias Feurer

  • JJ Ben-Joseph

  • Isaac Chung

  • Katharina Eggensperger

  • bitsbuffer

  • Eddie Bergman

  • olehb007

版本 0.12.6

  • 新增 #886:提供新的函数,允许只拟合单个配置。

  • 文档 #1070:澄清逐步减半和贝叶斯优化如何协同工作的示例。

  • 文档 #1112:修复类型。

  • 文档 #1122:在 Ubuntu 的安装命令中添加 Python 3。

  • 修复 #1114:修复了导致打印 dummy 模型失败的错误。

  • 修复 #1117:修复了之前导致 memory_limit=None 失败的错误。

  • 修复 #1121:修复了在使用交叉验证和迭代拟合时,在 Auto-sklearn 2.0 中可能降低性能的边界情况。

  • 修复 #1123:修复了 autosklearn.metrics.calculate_score 中需要最小化的指标/分数的问题,该函数之前返回的是损失而非分数。

  • 修复 #1115/#1124:修复了在多进程情况下阻止 Auto-sklearn 计算元特征的错误。

贡献者 v0.12.6

  • Francisco Rivera Valverde

  • stock90975

  • Lucas Nildaimon dos Santos Silva

  • Matthias Feurer

  • Rohit Agarwal

版本 0.12.5

  • 维护:移除 Cythonnumpy 作为安装要求。

贡献者 v0.12.5

  • Matthias Feurer

版本 0.12.4

  • 新增 #660:为输入特征启用 scikit-learn 的幂变换。

  • 维护:提升 pyrfr 最低依赖版本到 0.8.1,以便尽可能自动从 pypi 下载 wheels。

  • 修复 #732:在用于 NeurIPS 2015 论文的 GMEANS 聚类中添加缺失的大小检查。

  • 修复 #1050:为 AutoSklearn2Classifier 签名添加缺失的参数。

  • 修复 #1072:修复了 AutoSklearn2Classifier 无法创建的问题,原因在于尝试缓存到错误的目录。

贡献者 v0.12.4

  • Matthias Feurer

  • Francisco Rivera

  • Maximilian Greil

  • Pepe Berba

版本 0.12.3

  • 修复 #1061:修复了在 jupyter notebook 中无法打印模型的问题。

  • 修复 #1075:修复了集成构建器对于损失函数(即需要最小化的函数,例如 loglossmean_squared_error)会错误地剪除好模型的问题。

  • 修复 #1079:修复了 AutoMLClassifier.cv_resultsAutoMLRegressor.cv_results 对于损失函数(即需要最小化的函数,例如 loglossmean_squared_error)可能以相反顺序对结果排序的错误。

  • 修复:修复了离线元数据生成中的一个可能导致死锁的错误。

  • 维护 #1076:使用正确的进程上下文计算元特征

  • 维护:清理 readme 和主目录

贡献者 v0.12.3

  • Matthias Feurer

  • ROHIT AGARWAL

  • Francisco Rivera

版本 0.12.2

  • 新增 #1045:新的示例,演示如何在 Auto-sklearn 运行期间记录多个指标。

  • 文档 #1052:添加 mybinder 链接

  • 文档 #1059:改进了手动启动 Auto-sklearn 工作者的示例。

  • 修复 #1046:将集成构建器的最终结果添加到集成构建器轨迹。

  • 维护:两个警告级别的日志输出被降级到 info 日志级别,因为它们对用户不可操作。

  • 维护 #1062:为本地 dask worker 使用线程,并使用 forkserver 启动子进程以减少开销。

  • 维护 #1053:再次移除对 __main__ == "__name__" 保护单核 Auto-sklearn 的限制。

贡献者 v0.12.2

  • Matthias Feurer

  • ROHIT AGARWAL

  • Francisco Rivera

  • Katharina Eggensperger

版本 0.12.1

  • 新增:一个新的启发式方法,如果数据量对于给定的 memory_limit 过大,则会给出警告并对数据进行子抽样。

  • 新增 #1024:调整 scikit-learn 的 MLPClassifierMLPRegressor

  • 维护 #1017:改进版本 0.12.0 中引入的日志服务器。

  • 维护 #1024:迁移到 scikit-learn 0.24.X。

  • 维护 #1038:为回归和分类使用新数据集,并更新用于 Auto-sklearn 1.0 的元数据。

  • 维护 #1040:集成选择算法中的轻微速度改进。

贡献者 v0.12.1

  • Matthias Feurer

  • Katharina Eggensperger

  • Francisco Rivera

版本 0.12.0

  • 重大变更:由于使用了 spawn 多进程上下文,Auto-sklearn 现在必须由 __name__ == "__main__" 保护。

  • 新增 #1026:添加改进的 Auto-sklearn 2.0 元数据,从而显著提高了性能。

  • 维护 #984 和 #1008:迁移到 scikit-learn 0.23.X

  • 维护 #1004:从 travis-ci 迁移到 github actions。

  • 维护 8b67af6:移除对 lockfile 包的依赖。

  • 修复 #990:修复了如果 pandas DataFrame 中存在缺失值,导致 Auto-sklearn 失败的错误。

  • 修复 #1007, #1012 和 #1014:通过新的日志服务器记录多进程输出。移除几个与多进程、多线程和日志记录的联合使用相关的潜在死锁。

贡献者 v0.12.0

  • Matthias Feurer

  • ROHIT AGARWAL

  • Francisco Rivera

版本 0.11.1

  • 修复 #989:修复了 y 未传递给所有数据预处理器的问题,这导致第三方类别编码器失败。

  • 修复 #1001:修复了可能导致 Auto-sklearn 随机失败的错误。

  • 维护 #1000:引入 dask.distributed 的最低版本要求。

贡献者 v0.11.1

  • Matthias Feurer

版本 0.11.0

  • 新增 #992:将集成构建从独立进程迁移到提交给 dask 集群的任务。这允许在多进程设置中更好地控制使用的内存。

  • 修复 #905:使 AutoSklearn2Classifier 可序列化。

  • 修复 #970:修复了如果类别特征作为 Pandas Dataframe 传入,Auto-sklearn 会失败的错误。

  • 维护 #772:改进 dummy 预测失败情况下的错误消息。

  • 维护 #948:最终使用 Pandas >= 1.0。

  • 维护 #973:通过运行更长时间的元数据生成并对重要指标单独进行,改进元数据。

  • 维护 #997:改进集成构建过程中的内存处理。这允许为更大的数据集构建集成。

贡献者 v0.11.0

  • Matthias Feurer

  • Francisco Rivera

  • Karl Leswing

  • ROHIT AGARWAL

版本 0.10.0

  • 新增 #325:允许单独优化元数据生成指标。

  • 新增 #946:新的 dask 后端用于并行 Auto-sklearn。

  • 重大变更 #947:停止支持 Python 3.5。

  • 重大变更 #946:移除并行 Auto-sklearn 的共享模型模式。

  • 修复 #351:不再将不可序列化的日志记录器实例传递给目标函数。

  • 修复 #840:修复了阻止计算回归数据集元数据的错误。同时添加了回归元数据计算的单元测试。

  • 修复 #897:允许自定义分割器用于多输出回归。

  • 修复 #951:修复了回归流水线中的许多错误,这些错误导致回归数据集的性能不佳。

  • 修复 #953:重新添加 liac-arff 作为依赖。

  • 修复 #956:修复了可能导致 Auto-sklearn 在磁盘上找不到集成一部分模型的问题。

  • 修复 #961:修复了导致 Auto-sklearn 为无法在多类别数据集上计算的指标(特别是 ROC_AUC)加载不良元数据的错误。

  • 文档 #498:通过展示如何将 scikit-learn 的分割器对象传递给 Auto-sklearn,改进重采样策略示例。

  • 文档 #670:演示如何访问训练准确率。

  • 文档 #872:改进关于如何获取最佳模型的示例。

  • 文档 #940:改进 docker 镜像的文档。

  • 维护:改进 docker 文件,设置环境变量限制 BLAS 和 OMP 只使用单个核心。

  • 维护 #949:在安装指南中将 pip 替换为 pip3

  • 维护 #280, #535, #956:更新元数据,再次包含回归元数据。

贡献者 v0.10.0

  • Francisco Rivera

  • Matthias Feurer

  • felixleungsc

  • Chu-Cheng Fu

  • Francois Berenger

版本 0.9.0

  • 新增 #157,#889:改进 pandas dataframes 的处理,包括使用 pandas 类别列类型的可能性。

  • 新增 #375:新的 SelectRates 特征预处理组件用于回归。

  • 新增 #891:通过使用单个最佳模型(如果未找到集成),提高 Auto-sklearn 的健壮性。

  • 新增 #902:跟踪集成随时间变化的性能。

  • 新增 #914:添加使用 pandas dataframes 作为输入 Auto-sklearn 的示例。

  • 新增 #919:添加多标签分类示例。

  • 维护 #909:修复文档中的损坏链接。

  • 维护 #907,#911:添加对 mypy 的初步支持。

  • 维护 #881,#927:在推送到 master 和 development 分支时自动构建 docker 镜像,并将其推送到 dockerhub 和 github docker 注册表。

  • 维护 #918:从 requirements.txt 中移除旧依赖。

  • 维护 #931:在日志文件中添加关于主机系统和已安装软件包的信息。

  • 维护 #933:减少构建文档时 sphinx 触发的警告数量。

  • 维护 #936:完全重构示例部分。

  • 修复 #558:提供更好的错误消息,当集成过程由于内存问题失败时。

  • 修复 #901:再次允许自定义重采样策略(由于 SMAC 升级导致损坏)。

  • 修复 #916:修复了数据预处理配置被忽略的错误。

  • 修复 #925:使内部数据预处理对象可克隆。

贡献者 v0.9.0

  • Francisco Rivera

  • Matthias Feurer

  • felixleungsc

  • Vladislav Skripniuk

版本 0.8

  • 新增 #803:多输出回归

  • 新增 #893:新的 Auto-sklearn 模式 Auto-sklearn 2.0

贡献者 v0.8.0

  • Chu-Cheng Fu

  • Matthias Feurer

版本 0.7.1

  • 新增 #764:支持自动选择 per_run_time_limit

  • 新增 #864:添加使用交叉验证进行预测的可能性

  • 新增 #874:支持限制磁盘空间消耗

  • 维护 #862:改进文档并在网页中渲染示例

  • 维护 #869:移除竞赛数据管理器支持

  • 维护 #870:构建集成时的内存改进

  • 维护 #882:执行集成选择时的内存改进

  • 修复 #701:元特征的缩放因子不应使用测试数据学习

  • 修复 #715:允许无限的 ML 内存

  • 修复 #771:改进最差可能结果计算

  • 修复 #843:SelectPercentileRegression 的默认值

  • 修复 #852:将概率限制在 [0-1] 范围内

  • 修复 #854:改进临时文件命名

  • 修复 #863:SMAC 异常也在日志文件中注册

  • 修复 #876:允许克隆 Auto-sklearn 模型

  • 修复 #879:允许一维二分类预测

贡献者 v0.7.1

  • Matthias Feurer

  • Xiaodong DENG

  • Francisco Rivera

版本 0.7.0

  • 新增 #785:用户控制减少存储集成所需的硬盘内存

  • 新增 #794:梯度提升的迭代拟合

  • 新增 #795:添加逐步减半评估策略

  • 新增 #814:使用新的 sklearn.metrics.balanced_accuracy_score 而非自定义指标

  • 新增 #815:新的实验评估模式 iterative_cv

  • 维护 #774:从 scikit-learn 0.21.X 迁移到 0.22.X

  • 维护 #791:从 smac 0.8 迁移到 0.12

  • 维护 #822:使 autosklearn 模块符合 PEP8 规范

  • 修复 #733:修复 n_jobs=-1 的问题

  • 修复 #739:移除不必要的警告

  • 修复 ##769:修复元特征计算错误

  • 修复 #778:支持 python 3.8

  • 修复 #781:支持 pandas 1.x

贡献者 v0.7.0

  • Andrew Nader

  • Gui Miotto

  • Julian Berman

  • Katharina Eggensperger

  • Matthias Feurer

  • Maximilian Peters

  • Rong-Inspur

  • Valentin Geffrier

  • Francisco Rivera

版本 0.6.0

  • 维护:从 scikit-learn 0.19.X 迁移到 0.21.X

  • 维护 #688:允许 pyrfr 版本 0.8.X

  • 修复 #680:移除不必要的打印语句

  • 修复 #600:移除不必要的警告

贡献者 v0.6.0

  • Guilherme Miotto

  • Matthias Feurer

  • Jin Woo Ahn

版本 0.5.2

  • 修复 #669:正确处理传递给 AutoMLRegressor 的参数

  • 修复 #667:Auto-sklearn 再次支持 numpy 1.16.3。

  • 新增 #676:允许临时和输出目录路径中使用方括号 [ ]。

  • 新增 #424:(实验性)脚本以重现原始 Auto-sklearn 论文的结果。

贡献者 v0.5.2

  • Jin Woo Ahn

  • Herilalaina Rakotoarison

  • Matthias Feurer

  • yazanobeidi

版本 0.5.1

  • 新增 #650:如果使用 scikit-learn 的 dummy 预测器进行预测失败,Auto-sklearn 将立即停止。

  • 新增 #537:对于时间限制小于 30 秒的情况,Auto-sklearn 将不再启动。

  • 修复 #655:修复了使用并行 Auto-sklearn 运行的模型进行预测可能错误的问题。

  • 修复 #648:修复了自定义元数据目录的问题。

  • 修复 #626:修复了损失未被最小化而是最大化的问题。

  • 维护 #646:不再限制 numpy 版本小于 1.14.5。

贡献者 v0.5.1

  • Jin Woo Ahn

  • Taneli Mielikäinen

  • Matthias Feurer

  • jianswang

版本 0.5.0

  • 新增 #593:Auto-sklearn 支持 n_jobs 参数用于单机并行计算。

  • 文档 #618:添加了多个系统要求的链接。

  • 修复 #611:改进了通过 pip 安装。

  • 测试 #614:在干净的 Ubuntu 上测试安装。

  • 维护:修复了文档中的损坏链接和拼写错误。

贡献者 v0.5.0

  • Mohd Shahril

  • Adrian

  • Matthias Feurer

  • Jirka Borovec

  • Pradeep Reddy Raamana

版本 0.4.2

  • 修复 #538:移除为 holdout 提供训练集比例时的舍入误差。

  • 修复 #558:集成脚本现在使用更少内存,并且可以将内存限制传递给 Auto-sklearn。

  • 修复 #585:Auto-sklearn 的集成脚本在直接调用时(而非通过 Auto-sklearn 的估计器类之一调用)产生了错误结果。

  • 修复了集成脚本中的一个使其非确定性的错误。

  • 维护 #569:重命名超参数,使其与含义不同的 scikit-learn 超参数名称不同。

  • 维护 #592:向后兼容的 requirements.txt

  • 维护 #588:固定 SMAC 版本到 0.8.0

  • 维护:移除对 six 包的依赖

  • 维护:升级到 XGBoost 0.80

贡献者 v0.4.2

  • Taneli Mielikäinen

  • Matthias Feurer

  • Diogo Bastos

  • Zeyi Wen

  • Teresa Conceição

  • Jin Woo Ahn

版本 0.4.1

  • 添加了关于 如何使用自定义分类器、回归器和预处理器扩展 Auto-sklearn 的文档。

  • Auto-sklearn 现在需要 numpy 版本在 1.9.0 和 1.14.5 之间,因为更高版本会导致 travis 失败。

  • 示例现在使用 sklearn.datasets.load_breast_cancer() 而非 sklearn.datasets.load_digits() 以减少 travis 构建的内存使用。

  • 修复非元组序列索引的未来警告。

  • 修复 #500:修复集成构建器以正确评估任意指标的模型分数。参见此 PR

  • 修复 #482#491:用户现在可以通过传递 yaml 文件创建的字典到 logging_config 来设置自定义日志配置。

  • 修复 #566:集成现在已正确排序。

  • 修复 #293:在调用 fit() 之前,Auto-sklearn 检查是否为分类和回归给出了适当的目标类型。

  • Travis-ci 现在运行 flake8 以强制执行 pep8 风格指南,并使用 travis-ci 而非 circle-ci 进行部署。

贡献者 v0.4.1

  • Matthias Feurer

  • Manuel Streuhofer

  • Taneli Mielikäinen

  • Katharina Eggensperger

  • Jin Woo Ahn

版本 0.4.0

  • 修复 #409:修复 predict_proba 不再引发 AttributeError

  • 改进并行示例的文档。

  • 分类器现在被测试为幂等的,如 scikit-learn 所要求的

  • 修复 LDA 中收缩参数的使用。

  • 修复 #410 并更改 SGD 超参数

  • 修复 #425,该错误导致非线性支持向量机总是在 OSX 上崩溃。

  • 实现 #149:现在可以传递自定义的交叉验证分割,遵循 scikit-learn 的 model_selection 模块。

  • 现在可以通过在 resampling_strategy_arguments 的字典中传递布尔值 shuffle 来决定是否打乱 Auto-sklearn 中的数据。

  • 添加了跟踪测试性能随时间变化的功能。

  • 重构集成构建使其更快,从硬盘读取更少数据,并在性能相同的模型情况下执行随机平局打破。

  • 实现 #438:为了与 SMAC 的输出保持一致(它最小化目标函数的损失),集成构建器的输出现在也是最小化问题的输出。

  • 实现 #271:XGBoost 再次可用,甚至可以配置新的 dropout 功能。

  • 新的文档部分 检查结果

  • 修复 #444:Auto-sklearn 现在只加载实际与集成相关的模型进行 refit。

  • 在导入和安装时添加操作系统检查,确保不会意外在 Windows 机器上运行。

  • 使用 sphinx gallery 的新示例库:示例

  • 保护 Auto-sklearn 不删除它未创建的目录(问题 #317)。

贡献者 v0.4.0

  • Matthias Feurer

  • kaa

  • Josh Mabry

  • Katharina Eggensperger

  • Vladimir Glazachev

  • Jesper van Engelen

  • Jin Woo Ahn

  • Enrico Testa

  • Marius Lindauer

  • Yassine Morakakam

版本 0.3.0

  • 升级到 scikit-learn 0.19.1。

  • 不将 DummyClassifierDummyRegressor 用作集成的一部分。修复 #140

  • 通过在子进程而非主进程中加载数据来修复 #295。

  • 修复 #326:refitting 可能导致类型错误。通过改进分类组件中的类型检查现已修复。

  • 更新了 RandomForestClassifier, ExtraTreesClassifierGradientBoostingClassifier 的搜索空间(修复 #358)。

  • 移除常量特征现在是流水线的一部分。

  • 允许将 SMBO 对象传递到 AutoSklearnClassifierAutoSklearnRegressor 中。

贡献者 v0.3.0

  • Matthias Feurer

  • Jesper van Engelen

版本 0.2.1

  • 允许使用 scikit-learn 0.18.2。

  • 升级到最新的 SMAC 版本(0.6.0)和最新的随机森林版本(0.6.1)。

  • 添加了 Dockerfile。

  • 添加了使用 holdout 重采样策略时更改 holdout 集大小的可能性。

  • 修复了 QDA 超参数中的一个错误。

  • 打印语句中的拼写错误修复。

  • 新方法检索最终集成中使用的模型。

贡献者 v0.2.1

  • Matthias Feurer

  • Katharina Eggensperger

  • Felix Leung

  • caoyi0905

  • Young Ryul Bae

  • Vicente Alencar

  • Lukas Großberger

版本 0.2.0

  • auto-sklearn 支持自定义指标和 scikit-learn 中包含的所有指标。现在可以将不同的指标传递给估计器对象的 fit() 方法,例如 AutoSklearnClassifier.fit(metric='roc_auc')

  • 升级到 scikit-learn 0.18.1。

  • 移除 XGBoost,因为最新版本(0.6a2)在由 pyninsher 启动时无法工作。

  • auto-sklearn 可以在调用 predict()predict_proba 时使用多进程。作者:Laurent Sorber

贡献者 v0.2.0

  • Matthias Feurer

  • Katharina Eggensperger

  • Laurent Sorber

  • Rafael Calsaverini

版本 0.1.x

在版本 0.2.0 之前没有 auto-sklearn 的版本说明。

贡献者 v0.1.x

  • Matthias Feurer

  • Katharina Eggensperger

  • Aaron Klein

  • Jost Tobias Springenberg

  • Anatolii Domashnev

  • Stefan Falkner

  • Alexander Sapronov

  • Manuel Blum

  • Diego Kobylkin

  • Jaidev Deshpande

  • Jongheon Jeong

  • Hector Mendoza

  • Timothy J Laurent

  • Marius Lindauer

  • _329_

  • Iver Jordal