MaiBot 模型预算分配器

一个 MaiBot LLM Provider 插件，用来把不同任务的模型请求分配到不同中转站和模型。

适合有很多免费、试用、低价中转站的用户：可以按任务分类模型池，并根据余额、每日预算、延迟、价格、失败情况自动选择更合适的站点。

功能

按任务配置不同模型池。
每个模型池条目都可以单独开启或关闭。
自动从 MaiBot model_config.toml 同步中转站。
按延迟、价格、余额、每日预算、站点权重打分。
候选模型失败时自动切换下一个。
支持 429、403、402、余额不足、额度耗尽时自动切换同站点备用 API Key。
支持同一中转站配置多个备用 API Key，某个 Key 没额度时自动切换下一个。
支持按 API Key 序号单独设置余额、每日预算和 Token 额度。
支持普通模型错误累计到阈值后自动关闭池内模型，默认 3 次。
支持三种计费方式：按模型价格、按次扣费、Token 额度。
支持同一中转站内按模型单独覆盖计费方式。
支持站点按人民币或美元计价，并按汇率换算成内部人民币预算。

安装

在 MaiBot WebUI 的插件管理里安装：

https://github.com/tackyeel/maibot-model-budget-router

安装后，在“模型管理”里添加一个模型分配器 API 提供商：

[[api_providers]]
name = "模型分配器"
base_url = "http://budget-router.local/v1"
api_key = "budget-router"
client_type = "budget_router"
max_retry = 0
timeout = 80
retry_interval = 1

然后添加逻辑模型，例如：

[[models]]
model_identifier = "router:replyer"
name = "分配器-正式回复"
api_provider = "模型分配器"
price_in = 0
price_out = 0
cache = false
cache_price_in = 0
visual = true
force_stream_mode = false

[models.extra_params]

把 分配器-正式回复 放到 [model_task_config.replyer].model_list 里即可。

支持的任务标识

router:replyer
router:planner
router:timing_gate
router:memory
router:mid_memory
router:utils
router:learner
router:emoji
router:vlm

embedding 和 voice 不建议走这个插件，因为它目前只处理 OpenAI 兼容的聊天补全请求。

模型池

[pools] 里填写模型管理页面里的真实模型名称。新版配置支持每个模型单独开关：

[pools]
replyer = [
  { name = "deepseek-v3", enabled = true },
  { name = "gemini-2.5-flash", enabled = true },
]
planner = [
  { name = "gemini-2.5-flash", enabled = true },
]

旧版字符串列表仍然兼容，插件启动后会自动迁移成带开关的格式。

中转站预算

插件会自动把模型管理里的中转站同步到 providers.overrides。默认开启 auto_prune_removed_providers，模型管理里删掉的中转站也会从插件配置页移除。

如果中转站很多，可以先在 providers 里设置默认余额、默认币种、默认计费方式、默认权重。新同步出来的站点会直接继承这些默认项，只需要给少数特殊站点单独覆盖。

每个站点可以配置：

enabled：是否启用这个中转站。
api_keys：备用 API Key；WebUI 里按“每行一个 Key”填写，主 Key 仍来自模型管理。
api_key_budget_overrides：按 Key 序号单独覆盖余额和预算；WebUI 里每行一条，格式为 Key序号 | 余额 | 每日预算 | Token余额 | 每日Token预算 | 备注。0 是主 Key，1 是第 1 个备用 Key。
balance_yuan：估算余额。
daily_budget_yuan：每日预算。
weight：站点权重，越大越优先。
currency：站点后台使用的币种，支持 CNY 和 USD。
usd_to_cny_rate：计价币种为 USD 时使用的美元兑人民币汇率。
billing_mode：计费方式。
price_per_call_yuan：按次扣费时每次调用多少钱。
token_balance：Token 额度模式下的剩余 token。
daily_token_budget：每日 token 预算。
model_billing_overrides：同一站点内按模型名称覆盖计费方式。

计费方式支持：

model_price   使用模型管理里的输入/输出价格
per_call      每次成功调用固定扣费
token_quota   直接按 token 额度扣

插件不会登录中转站后台查询真实余额，余额和额度是根据你的配置与调用量估算的。

美元中转站

如果中转站后台余额和模型价格都是美元，在站点配置里这样设置：

currency = "USD"
usd_to_cny_rate = 7.2

之后这些字段都可以直接按中转站后台看到的美元填写：

站点余额
每日预算
每次调用价格
API Key 预算覆盖里的余额
模型管理里的输入/输出/缓存价格
模型计费覆盖里的每次调用价格

插件内部会统一换算成人民币来计算预算和路由。例如余额 $6.11、汇率 7.2，内部会按约 43.99 元人民币计算。

单模型计费覆盖

如果同一个中转站里有些模型按次扣费，有些模型按量扣费，可以在对应站点的“模型计费覆盖”里单独配置。

例如这个站点默认使用模型管理里的价格，但 gpt-5.5 每次调用固定 0.2 元，gemini-2.5-flash 使用 100 万 token 额度：

[providers.overrides]
"示例站点" = {
  enabled = true,
  api_keys = [],
  balance_yuan = 50.0,
  daily_budget_yuan = 10.0,
  weight = 1.0,
  currency = "USD",
  usd_to_cny_rate = 7.2,
  billing_mode = "按模型价格",
  price_per_call_yuan = 0.0,
  token_balance = 0,
  daily_token_budget = 0,
  model_billing_overrides = [
    { model_name = "gpt-5.5", billing_mode = "按次扣费", price_per_call_yuan = 0.2, token_balance = 0, daily_token_budget = 0 },
    { model_name = "gemini-2.5-flash", billing_mode = "Token 额度", price_per_call_yuan = 0.0, token_balance = 1000000, daily_token_budget = 0 },
  ],
}

没有写进 model_billing_overrides 的模型，会继续继承这个中转站上面的默认计费方式。

单 Key 预算覆盖

如果同一个中转站配置了多个 Key，而且每个 Key 属于不同账号，可以按 Key 序号单独设置余额。

序号规则：

0 = 模型管理里的主 API Key
1 = 备用 API Keys 里的第 1 个 Key
2 = 备用 API Keys 里的第 2 个 Key

示例：

[providers.overrides]
"示例站点" = {
  enabled = true,
  api_keys = ["sk-backup-1", "sk-backup-2"],
  balance_yuan = 9999.0,
  daily_budget_yuan = 9999.0,
  weight = 1.0,
  currency = "CNY",
  usd_to_cny_rate = 7.2,
  billing_mode = "按模型价格",
  price_per_call_yuan = 0.0,
  token_balance = 0,
  daily_token_budget = 0,
  api_key_budget_overrides = [
    { key_index = 0, label = "主账号", balance_yuan = 10.0, daily_budget_yuan = 5.0, token_balance = 0, daily_token_budget = 0 },
    { key_index = 1, label = "备用账号1", balance_yuan = 3.0, daily_budget_yuan = 1.0, token_balance = 0, daily_token_budget = 0 },
    { key_index = 2, label = "备用账号2", balance_yuan = 20.0, daily_budget_yuan = 5.0, token_balance = 0, daily_token_budget = 0 },
  ],
}

如果当前请求是 Token 额度计费，插件会优先使用这个 Key 的 token_balance 和 daily_token_budget；如果是人民币计费，则使用 balance_yuan 和 daily_budget_yuan。

自动切换 API Key

主 API Key 仍然在 MaiBot 模型管理里的中转站配置中填写。备用 Key 可以在插件配置页对应站点的“备用 API Keys”里填写，也可以直接写 TOML：

[providers.overrides]
"沐阳" = { enabled = true, api_keys = ["sk-backup-1", "sk-backup-2"], balance_yuan = 9999.0, daily_budget_yuan = 9999.0, weight = 1.0, billing_mode = "按模型价格", price_per_call_yuan = 0.0, token_balance = 0, daily_token_budget = 0 }

如果某个 Key 返回 429、403、402、余额不足、额度不足、欠费等错误，插件会先禁用这个 Key，并继续尝试同一站点的下一个 Key。默认不会因为额度错误直接关闭模型池里的模型。

自动关闭

开启 auto_switch_api_key_on_quota 后，如果上游返回 429、403、402、限流、额度不足、余额不足、额度耗尽等错误，插件会关闭当前 API Key，并自动切换同站点下一个 Key。

如果你打开 auto_disable_model_when_all_keys_failed，当一个站点的所有 Key 都因为额度类错误失效时，插件才会自动关闭模型池里的对应模型。这个选项默认关闭，避免余额问题误伤模型池。

开启 auto_disable_on_errors 后，排除 429、403、402、额度不足和超时以外的普通模型错误会计数；达到 auto_disable_error_threshold 后，插件会自动关闭模型池里的对应模型。默认阈值是 3 次。

如果给站点充值或模型恢复了，可以在插件配置页把模型池里的开关重新打开。

状态文件

默认状态文件：

data/router_state.json

里面记录今日消耗、近期延迟、失败次数和自动关闭记录。

许可证

MIT

Name		Name	Last commit message	Last commit date
Latest commit History 16 Commits
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
_manifest.json		_manifest.json
config.toml		config.toml
config_models.py		config_models.py
plugin.py		plugin.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

MaiBot 模型预算分配器

功能

安装

支持的任务标识

模型池

中转站预算

美元中转站

单模型计费覆盖

单 Key 预算覆盖

自动切换 API Key

自动关闭

状态文件

许可证

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

MaiBot 模型预算分配器

功能

安装

支持的任务标识

模型池

中转站预算

美元中转站

单模型计费覆盖

单 Key 预算覆盖

自动切换 API Key

自动关闭

状态文件

许可证

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages