欧美巨大黑人精品videos人妖_婷婷丁香五月天播播_在线视频欧美一二_十八禁午夜私人在线观看影院_中文在线资源天堂www_国产一级 片内射老妇内射_秋霞影视午夜福利_十八禁禁久久精品

AI-Switch

企業級 AI 資源治理平臺

統一接入本地模型 GLM / Minimax / Qwen / DeepSeek 或聯網模型 OpenAI / Claude / Gemini / Grok, 兼容 Claude Code、Codex、OpenCode、Cursor 等編程工具。

4 層
組織權限
3 層
額度體系
3 層
響應緩存
1000+
并發用戶

核心能力

一個平臺,統管企業 AI 資源的接入、權限、用量與安全

?

多提供商統一接入

本地模型 GLM / Minimax / Qwen / DeepSeek 或聯網模型 OpenAI / Claude / Gemini / Grok,請求/響應格式自動轉換,直接對接編程工具。

??

組織分級權限

4 層部門樹 + 4 級角色體系(root / 公司管理員 / 部門管理員 / 成員),所有查詢自動按權限過濾可見范圍。

??

三層額度體系

個人額度 → 項目額度 → 補充額度,消費順序可自定義。預扣-結算機制保證冪等性,4 類 Token 獨立計量。

??

流式響應 & 智能緩存

SSE 實時流式輸出,三層響應緩存(內存 LRU + SQLite + 語義向量),緩存命中跳過額度預扣,大幅降低成本。

???

安全防護

API Key SHA256 加密、AES-256-GCM 密鑰存儲、命令攔截(5 種匹配模式)、暴力破解防護、CIDR 白名單。

??

可觀測性

Prometheus 指標端點、Grafana Dashboard、Alertmanager 告警規則。請求延遲、活躍連接、配額預扣等關鍵指標全覆蓋。

技術架構

模塊化設計,從請求入口到模型轉發全鏈路可控

1

請求入口

Gin 路由 + 中間件鏈:請求 ID → 延遲記錄 → 鑒權(含暴力破解防護)→ 權限隔離 → 限流(Enterprise)

2

治理層

命令攔截 → 響應緩存查詢 → 額度預扣(冪等性保證)→ 請求排隊/背壓控制

3

模型轉發

負載均衡選擇資源 → 適配器自動轉換格式 → 非流式自動重試 → 流式 SSE 轉發

4

結算 & 審計

額度結算(多退少補)→ 訪問日志異步批寫 → 審計事件可靠投遞(Kafka)→ 響應緩存寫入

Go 1.24 Gin GORM SQLite / PostgreSQL Redis Kafka Prometheus Docker / K8s
Client Claude Code / Codex / Cursor / SDK /v1/chat/completions Auth Intercept Cache? Quota Reserve Queue Load Balance Select Resource 本地模型 聯網模型 Quota Finalize Log Audit Response SSE Stream / JSON

選擇適合的版本

同一代碼庫,兩種部署模式。從小團隊到千人企業,按需選擇

SMB 版

小型團隊

開箱即用,零配置啟動,適合 10-100 人團隊

  • ? 組織權限 & 三層額度
  • ? 多提供商模型接入
  • ? 流式響應 & 三層緩存
  • ? Web 管理界面
  • ? SQLite 默認,支持 PostgreSQL
  • ? Prometheus 可觀測