本站所有内容均由自动化程序抓取自第三方网站,部分内容未及时审核,如有侵权,违规,请联系我们第一时间删除!QQ:3963907323
Clash 小火箭 v2ray节点购买
好用的梯子,海外网络,快速稳定
GoogleGemini Balance 以 Python + FastAPI 为核心,整合多 Key 轮询、负载均衡、权限过滤与健康监控,并向下兼容 OpenAI 接口格式。最新版在性能、文档与安全性上全面升级,引入 countTokens 端点、自动思考配置优化、本地与云端双向代理指南,以及 ARM/AMD Docker 镜像,帮助开发者快速构建高可用的 Gemini 服务栈。
Gemini Balance介绍
Gemini Balance 是一个开源 Gemini API 代理与负载均衡器,支持在同一实例中管理多组 Gemini API Key,并通过轮询算法分摊流量,显著降低单 Key 触发速率限制的风险。相比上游版本,当前 Fork 进一步修复配置缺陷、强化安全策略,并补全繁体中文与英文文档,方便跨地区团队协作。

Gemini Balance关键功能
多 Key 轮询与负载均衡
- 
自动按顺序轮询多个 Gemini API Key,均衡请求负载并提升并发能力
 
- 
可过滤不常用模型,自动从 API 获取最新模型列表
 
新增与优化功能
- 
countTokens API 支持:在发送前预估 token 数量
 - 
智能 thinkingConfig 处理:当 thinkingBudget 为 0 时自动省略该配置
 - 
反向代理与本地开发指南:包含 nginx、SSL 证书、hosts 配置等
 - 
管理脚本:支持一键切换代理、更新端口与完整移除
 
技术实现与兼容性
栈与架构
- Python + FastAPI:利用异步特性高效处理并发请求,性能优于传统同步框架。
 - Nginx + SSL/mkcert:官方示例脚本一键生成本地证书,快速配置 HTTPS 反向代理。
 
容器化部署
- 官方镜像适配 AMD 与 ARM 架构,
docker pull ghcr.io/snailyp/gemini-balance:latest即可落地生产环境;也可自行构建镜像定制插件。 
网络与代理支持
- 可为每个请求单独指定 HTTP/SOCKS5 代理;亦支持将 Gemini 官方或自建 Cloudflare Worker 代理作为上游端点,灵活适配不同网络场景。
 
快速上手
- 配置环境变量:在 
.env中写入API_KEYS="key1,key2",按需填写PROXIES与FILTERED_MODELS。 - 启动服务:本地执行 
python main.py或使用docker compose up -d。 - 调用接口:
# OpenAI 格式 curl http://localhost:8000/v1/chat/completions -H "Authorization: Bearer sk-..." # Gemini 格式 curl http://localhost:8000/gemini/v1beta/models/gemini-pro:generateContent两种协议均支持图文对话、联网搜索与自定义模型过滤。
 
Gemini Balance适用场景
- 个人或团队需要统一管理多把 Gemini Key,提升调用上限。
 - AI 应用希望无缝迁移自 OpenAI,兼顾 Gemini 最新多模态能力。
 - 对安全合规、可观测性与高可用性有硬性要求的生产部署。
 
借助 Gemini Balance,你可以在最短时间内获得稳定、易扩展且对开发者友好的 Gemini 代理服务,为应用接入最新多模态模型扫清障碍。
Gemini Balance 项目地址
官网地址:https://gb-docs.snaily.top/
GitHub:https://github.com/yulin0629/gemini-balance
