AI-Switch
企業級 AI 資源治理平臺
統一接入本地模型 GLM / Minimax / Qwen / DeepSeek 或聯網模型 OpenAI / Claude / Gemini / Grok, 兼容 Claude Code、Codex、OpenCode、Cursor 等編程工具。
核心能力
一個平臺,統管企業 AI 資源的接入、權限、用量與安全
多提供商統一接入
本地模型 GLM / Minimax / Qwen / DeepSeek 或聯網模型 OpenAI / Claude / Gemini / Grok,請求/響應格式自動轉換,直接對接編程工具。
組織分級權限
4 層部門樹 + 4 級角色體系(root / 公司管理員 / 部門管理員 / 成員),所有查詢自動按權限過濾可見范圍。
三層額度體系
個人額度 → 項目額度 → 補充額度,消費順序可自定義。預扣-結算機制保證冪等性,4 類 Token 獨立計量。
流式響應 & 智能緩存
SSE 實時流式輸出,三層響應緩存(內存 LRU + SQLite + 語義向量),緩存命中跳過額度預扣,大幅降低成本。
安全防護
API Key SHA256 加密、AES-256-GCM 密鑰存儲、命令攔截(5 種匹配模式)、暴力破解防護、CIDR 白名單。
可觀測性
Prometheus 指標端點、Grafana Dashboard、Alertmanager 告警規則。請求延遲、活躍連接、配額預扣等關鍵指標全覆蓋。
技術架構
模塊化設計,從請求入口到模型轉發全鏈路可控
請求入口
Gin 路由 + 中間件鏈:請求 ID → 延遲記錄 → 鑒權(含暴力破解防護)→ 權限隔離 → 限流(Enterprise)
治理層
命令攔截 → 響應緩存查詢 → 額度預扣(冪等性保證)→ 請求排隊/背壓控制
模型轉發
負載均衡選擇資源 → 適配器自動轉換格式 → 非流式自動重試 → 流式 SSE 轉發
結算 & 審計
額度結算(多退少補)→ 訪問日志異步批寫 → 審計事件可靠投遞(Kafka)→ 響應緩存寫入
選擇適合的版本
同一代碼庫,兩種部署模式。從小團隊到千人企業,按需選擇
小型團隊
開箱即用,零配置啟動,適合 10-100 人團隊
- ? 組織權限 & 三層額度
- ? 多提供商模型接入
- ? 流式響應 & 三層緩存
- ? Web 管理界面
- ? SQLite 默認,支持 PostgreSQL
- ? Prometheus 可觀測
中大型企業
分布式架構,高可用部署,適合 100-1000+ 人企業
- ? SMB 版全部功能
- ★ 分布式限流(Redis)
- ★ 異步審計事件(Kafka)
- ★ 審計可靠投遞(DurablePublisher)
- ★ 模型會話查詢 & 企業審計 API
- ★ K8s HPA 自動擴縮容