hyperas
Hyperas 是一款专为 Keras 深度学习框架设计的超参数优化辅助工具。它巧妙地将强大的 Hyperopt 优化算法与用户熟悉的 Keras 建模流程结合在一起,旨在解决传统超参数调优过程中代码复杂、学习成本高的问题。
在使用 Hyperas 之前,开发者通常需要专门学习 Hyperopt 的特定语法来定义搜索空间,这往往打断了原本流畅的建模思路。Hyperas 通过独特的“模板标记”技术解决了这一痛点:用户只需在标准的 Keras 模型代码中,用双花括号 {{ }} 包裹需要优化的参数(如 Dropout 概率、层节点数或激活函数),并指定分布类型,即可直接启动自动化搜索。这种设计让用户无需跳出舒适的编码环境,就能轻松实现从均匀分布采样到条件化网络结构构建等多种高级优化策略。
Hyperas 特别适合正在使用 Keras 进行模型开发的深度学习工程师、数据科学家及研究人员。无论是希望快速验证想法的初学者,还是需要精细调整模型性能的专业人士,都能利用它以极低的改造成本显著提升实验效率,将更多精力集中在模型架构创新而非繁琐的调参代码上。
使用场景
某电商数据团队正在构建用户流失预测模型,急需通过调整神经网络结构来提升准确率。
没有 hyperas 时
- 手动试错效率低:工程师需反复修改代码中的 Dropout 比率或层数,每次调整都要重新运行脚本,耗时费力。
- 搜索策略盲目:缺乏系统性的参数搜索算法,只能凭经验猜测参数范围,极易错过全局最优解。
- 代码耦合度高:超参数搜索逻辑与 Keras 模型定义混杂在一起,导致代码冗长且难以维护。
- 学习门槛较高:若要使用强大的 Hyperopt 库,必须专门学习其复杂的语法和回调机制,增加了开发成本。
使用 hyperas 后
- 模板化定义参数:只需在 Keras 代码中用双花括号
{{uniform(0, 1)}}标记待优化参数,即可自动启动搜索,无需重写模型逻辑。 - 智能算法加持:直接调用 TPE 等先进算法自动探索参数空间,用更少的实验次数找到比人工调优更佳的模型配置。
- 关注点分离:将数据加载、模型构建与优化执行清晰分离,代码结构简洁,便于团队协作和后续迭代。
- 零语法负担:完全复用熟悉的 Keras 编写习惯,无需学习 Hyperopt 底层语法,让数据科学家专注于业务逻辑。
hyperas 通过将复杂的超参数优化过程简化为几行模板代码,让开发者能以最低成本获得显著的模型性能提升。
运行环境要求
- 未说明
未说明
未说明

快速开始
Hyperas

Hyperas 将 Keras 的快速实验与 Hyperopt 的超参数优化结合在一起。 它使你无需学习 Hyperopt 的语法,就能充分利用 Hyperopt 的强大功能。 相反,你可以像往常一样定义你的 Keras 模型,只需使用简单的模板语法来指定要调优的超参数范围。
安装
pip install hyperas
快速入门
假设你已经生成了如下数据:
def data():
x_train = np.zeros(100)
x_test = np.zeros(100)
y_train = np.zeros(100)
y_test = np.zeros(100)
return x_train, y_train, x_test, y_test
并且有一个现有的 Keras 模型,如下所示:
def create_model(x_train, y_train, x_test, y_test):
model = Sequential()
model.add(Dense(512, input_shape=(784,)))
model.add(Activation('relu'))
model.add(Dropout(0.2))
model.add(Dense(512))
model.add(Activation('relu'))
model.add(Dropout(0.2))
model.add(Dense(10))
model.add(Activation('softmax'))
# ... 模型训练
return model
为了对这个模型进行超参数优化, 只需将你想优化的参数用双大括号括起来, 并选择一个用于运行算法的分布。
在上面的例子中,假设我们想优化两个 Dropout 层的最佳 Dropout 概率。
如果我们选择在区间 [0,1] 上的均匀分布,
那么对应的定义如下。请注意,在返回模型之前,为了进行优化,
我们还需要定义对我们来说重要的模型评估指标。
例如,在下面的例子中,我们以准确率作为优化目标。
注意:在下面的代码中,我们使用 'loss': -accuracy,即准确率的负值。这是因为 Hyperopt 在底层总是会最小化你提供的任何指标。如果你希望真正最小化某个指标,比如均方误差或其他损失函数,则应保持正号(例如 'loss': mse)。
from hyperas.distributions import uniform
def create_model(x_train, y_train, x_test, y_test):
model = Sequential()
model.add(Dense(512, input_shape=(784,)))
model.add(Activation('relu'))
model.add(Dropout({{uniform(0, 1)}}))
model.add(Dense(512))
model.add(Activation('relu'))
model.add(Dropout({{uniform(0, 1)}}))
model.add(Dense(10))
model.add(Activation('softmax'))
# ... 模型训练
score = model.evaluate(x_test, y_test, verbose=0)
accuracy = score[1]
return {'loss': -accuracy, 'status': STATUS_OK, 'model': model}
最后一步是实际运行优化,具体操作如下:
best_run = optim.minimize(model=create_model,
data=data,
algo=tpe.suggest,
max_evals=10,
trials=Trials())
在这个例子中,我们最多进行 10 次评估,并使用 Hyperopt 中的 TPE 算法来进行优化。
更多详细信息,请参阅下方的“完整示例”。
完整示例
注意: 重要的是将你的数据和模型封装到函数中,如下面所示,然后将它们作为参数传递给优化器。data() 返回 create_model() 所需的数据。上述示例的扩展版本在一个脚本中如下所示。这个示例展示了 hyperas 的许多潜在用法,包括:
- 在均匀分布中采样以调整 dropout 概率
- 不同的层输出大小
- 不同的优化算法
- 不同的激活函数选择
- 根据选择有条件地添加层
- 替换整组层
from __future__ import print_function
import numpy as np
from hyperopt import Trials, STATUS_OK, tpe
from keras.datasets import mnist
from keras.layers.core import Dense, Dropout, Activation
from keras.models import Sequential
from keras.utils import np_utils
from hyperas import optim
from hyperas.distributions import choice, uniform
def data():
"""
数据提供函数:
将此函数与 create_model() 分离,以便 hyperopt 不会在每次评估时重新加载数据。
"""
(x_train, y_train), (x_test, y_test) = mnist.load_data()
x_train = x_train.reshape(60000, 784)
x_test = x_test.reshape(10000, 784)
x_train = x_train.astype('float32')
x_test = x_test.astype('float32')
x_train /= 255
x_test /= 255
nb_classes = 10
y_train = np_utils.to_categorical(y_train, nb_classes)
y_test = np_utils.to_categorical(y_test, nb_classes)
return x_train, y_train, x_test, y_test
def create_model(x_train, y_train, x_test, y_test):
"""
模型提供函数:
创建 Keras 模型,其中双大括号根据需要被替换。返回值必须是一个有效的 Python 字典,包含两个常用键:
- loss: 指定要最小化的数值评估指标
- status: 如果可行,只需使用 STATUS_OK;否则请参阅 hyperopt 文档
最后一个键是可选的,但建议包含:
- model: 指定刚刚创建的模型,以便我们稍后可以再次使用它。
"""
model = Sequential()
model.add(Dense(512, input_shape=(784,)))
model.add(Activation('relu'))
model.add(Dropout({{uniform(0, 1)}}))
model.add(Dense({{choice([256, 512, 1024])}}))
model.add(Activation({{choice(['relu', 'sigmoid'])}}))
model.add(Dropout({{uniform(0, 1)}}))
# 如果我们选择 'four',则添加额外的第四层
if {{choice(['three', 'four'])}} == 'four':
model.add(Dense(100))
# 我们也可以在整组层之间进行选择
model.add({{choice([Dropout(0.5), Activation('linear')])}})
model.add(Activation('relu'))
model.add(Dense(10))
model.add(Activation('softmax'))
model.compile(loss='categorical_crossentropy', metrics=['accuracy'],
optimizer={{choice(['rmsprop', 'adam', 'sgd'])}})
result = model.fit(x_train, y_train,
batch_size={{choice([64, 128])}},
epochs=2,
verbose=2,
validation_split=0.1)
# 获取训练期间最高的验证准确率
validation_acc = np.amax(result.history['val_acc'])
print('最佳验证准确率:', validation_acc)
return {'loss': -validation_acc, 'status': STATUS_OK, 'model': model}
if __name__ == '__main__':
best_run, best_model = optim.minimize(model=create_model,
data=data,
algo=tpe.suggest,
max_evals=5,
trials=Trials())
X_train, Y_train, X_test, Y_test = data()
print("最佳模型评估结果:")
print(best_model.evaluate(X_test, Y_test))
print("最佳模型所选超参数:")
print(best_run)
常见问题解答
以下是一些常见错误的列表
TypeError: 需要字符串标签
你可能正在尝试直接在 Python 中执行带有模板的模型创建代码。这会失败,因为 Python 无法运行大括号中的模板语法,例如 {{uniform..}}。实际上,def create_model(...) 函数已经不再是有效的 Python 函数了。
你需要将代码包裹在 def create_model(...): ... 函数中,然后像示例中那样从 optim.minimize(model=create_model,... 调用它。
原因是 hyperas 通过将 {{...}} 中的所有内容替换为一个单独的临时文件来工作,然后运行替换后的模型(类似于 jinja 模板)。这就是 hyperas 作为“非常简单的封装”简化 hyperopt 使用方式的基础。
TypeError: 'generator' 对象不可下标访问
这是一个已知问题。
只需运行 pip install networkx==1.11 即可解决。
NameError: 全局名称 'X_train' 未定义
也许你在 def create_model(x_train...) 调用中忘记从 def data(): ... 函数返回 x_train 参数了。
你并不局限于示例中的相同参数列表。任何从 data() 返回的参数都会传递给 create_model()。
笔记本调整
如果你遇到类似 "没有这样的文件或目录" 或 OSError, Err22 的错误,你可能需要在 optim.minimize 函数中添加 notebook_name='simple_notebook'(假设你当前的笔记本名称是 simple_notebook),如下所示:
best_run, best_model = optim.minimize(model=model,
data=data,
algo=tpe.suggest,
max_evals=5,
trials=Trials(),
notebook_name='simple_notebook')
hyperas 是如何工作的?
我们所做的就是解析 data 和 model 模板,并将它们转换为符合 hyperopt 格式的代码,通过重建 space 对象将其传递给 fmin。相关代码主要位于 optim.py 和 utils.py 中。
如何解读 hyperas 模型的输出?
hyperas 会将你的脚本转换为符合 hyperopt 标准的代码,有关如何解释结果的指导,请参阅 这里。
如何向数据函数传递参数?
假设你希望你的数据函数接受一个参数,可以仅使用位置参数(而非关键字参数)来定义它:
import pickle
def data(fname):
with open(fname, 'rb') as fh:
return pickle.load(fh)
请注意,你的参数必须能够被 repr 完整地表示出来(例如字符串和数字)。如果需要更复杂的对象,可以在 data 函数内部利用传入的参数来构建它们。
在运行试验时,将要替换的参数以元组形式传入 data_args:
best_run, best_model = optim.minimize(
model=model,
data=data,
algo=tpe.suggest,
max_evals=64,
trials=Trials(),
data_args=('my_file.pkl',)
)
如果我需要更灵活地加载数据并调整模型怎么办?
Hyperas 是 Hyperopt 的一个便捷封装,但它也有一些局限性。如果你觉得它在当前场景下并不“便捷”,那就不要使用它,直接选择 Hyperopt 即可。使用 Hyperas 能做到的一切,用 Hyperopt 也能实现,只是定义模型的方式有所不同。如果你想从 Hyperas 中榨取更多灵活性,可以查看 这里。
如何并行运行 Hyperas?
你可以借助 MongoDB(需要先安装并配置用户)来使用 Hyperas 并行运行多个模型。以下是一个基于 MNIST 数据集的简短示例:
复制并修改
examples/mnist_distributed.py文件(如果需要,可以适当增加max_evals值):运行
python mnist_distributed.py。该脚本会生成一个temp_model.py文件,并将其复制到所有参与模型评估的机器上。随后,主程序会开始等待评估结果。在其他机器上(确保已安装 Python 及所有依赖包,最好版本一致),执行以下命令:
export PYTHONPATH=/path/to/temp_model.py hyperopt-mongo-worker --exp-key='mnist_test' --mongo='mongo://username:pass@mongodb.host:27017/jobs'当达到
max_evals次评估后,你应该会得到最佳模型的输出。此外,你也可以通过 MongoDB 查看所有结果,从中找出最佳模型并运行它,具体步骤如下:from pymongo import MongoClient from keras.models import load_model import tempfile c = MongoClient('mongodb://username:pass@mongodb.host:27017/jobs') best_model = c['jobs']['jobs'].find_one({'exp_key': 'mnist_test'}, sort=[('result.loss', -1)]) temp_name = tempfile.gettempdir() + '/' + next(tempfile._get_candidate_names()) + '.h5' with open(temp_name, 'wb') as outfile: outfile.write(best_model['result']['model_serial']) model = load_model(temp_name)
常见问题
相似工具推荐
openclaw
OpenClaw 是一款专为个人打造的本地化 AI 助手,旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚,能够直接接入你日常使用的各类通讯渠道,包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息,OpenClaw 都能即时响应,甚至支持在 macOS、iOS 和 Android 设备上进行语音交互,并提供实时的画布渲染功能供你操控。 这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地,用户无需依赖云端服务即可享受快速、私密的智能辅助,真正实现了“你的数据,你做主”。其独特的技术亮点在于强大的网关架构,将控制平面与核心助手分离,确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者,以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力(支持 macOS、Linux 及 Windows WSL2),即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你
stable-diffusion-webui
stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。
everything-claude-code
everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上
ComfyUI
ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。
gemini-cli
gemini-cli 是一款由谷歌推出的开源 AI 命令行工具,它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言,它提供了一条从输入提示词到获取模型响应的最短路径,无需切换窗口即可享受智能辅助。 这款工具主要解决了开发过程中频繁上下文切换的痛点,让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用,还是执行复杂的 Git 操作,gemini-cli 都能通过自然语言指令高效处理。 它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口,具备出色的逻辑推理能力;内置 Google 搜索、文件操作及 Shell 命令执行等实用工具;更独特的是,它支持 MCP(模型上下文协议),允许用户灵活扩展自定义集成,连接如图像生成等外部能力。此外,个人谷歌账号即可享受免费的额度支持,且项目基于 Apache 2.0 协议完全开源,是提升终端工作效率的理想助手。
markitdown
MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具,专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片(含 OCR)、音频(含语音转录)、HTML 乃至 YouTube 链接等多种格式的解析,能够精准提取文档中的标题、列表、表格和链接等关键结构信息。 在人工智能应用日益普及的今天,大语言模型(LLM)虽擅长处理文本,却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点,它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式,成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外,它还提供了 MCP(模型上下文协议)服务器,可无缝集成到 Claude Desktop 等 LLM 应用中。 这款工具特别适合开发者、数据科学家及 AI 研究人员使用,尤其是那些需要构建文档检索增强生成(RAG)系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性,但其核心优势在于为机器