Aiii 申請 Beta
普羅米修斯 Beta · 內測開放中

算力
帶給人類

Prometheus · 普羅米修斯算力平台

整合 AWS Bedrock、Google Vertex AI、OpenAI 與台灣自建算力——一個入口,取最優模型,AI 算力雲端 92 折起,按用量計費,無需綁約。

92 折起相較官方定價
4+供應商整合
自建台灣算力・不出境
統一OpenAI 相容 API
🔥
選擇模型,即刻推論
Beta 期間限定折扣
AWS Bedrock · Claude Opus 4.8
旗艦推理,長文優化
92 折
Google Vertex AI · Gemini 2.5 Pro
多模態,長脈絡理解
95 折
OpenAI · GPT-5 / o4-mini
廣泛相容,工具呼叫
95 折
醫療專用 · Med-Gemini / Meditron 70B
醫療問答・臨床推理微調
95 折
Aiii Gemma 4 醫療版(台灣自建)
台灣機房 · 醫療微調
最優惠
統一 OpenAI 相容 API — 改一行 base_url 就換供應商
💰

最低 92 折,直接省

整合多供應商採購量能,把折扣直接傳遞給你。Beta 期間享最優惠定價,無最低消費門檻。

🔌

一個 API,四家模型

OpenAI 相容格式統一接口。切換供應商只需改一行 base_url,你的程式碼不用改,帳單自動合一。

🇹🇼

台灣本地算力

Mac Studio M3 Ultra 與 MacBook Pro M5 Max 叢集架設於台灣機房。本地推論低延遲,資料不出境,符合醫療合規要求。

⚖️

醫療級資安合規

ISO 27001 認證架構。自建 Gemma 可設定資料不落地 log,適合藥廠、醫院等有嚴格資安要求的場景。

📊

即時用量儀表板

每個 API key 的 token 用量、費用、模型分佈一目了然。團隊多 key 管理,帳單按部門分攤。

🏗️

企業 fine-tune 支援

需要醫療專業微調?Aiii 提供 Gemma 客製化 fine-tune 服務,訓練數據留在你的環境,模型權重可私有化。

模型 & 定價
選最合適的模型,按用量付費

Beta 期間雲端模型享 92–95 折優惠,台灣自建模型更低。正式上線後將公告完整定價。

Beta 定價 · 正式上線前鎖定優惠
雲端 LLM 供應商(92–95 折)
AWS Bedrock
Claude Opus 4.8 · Sonnet 4.6 · Llama 4
92 折
相較官方
−8%
官方定價
強項
長文·推理
Claude 系列
適合場景
企業知識庫
合規文件處理
claude-opus-4-8 claude-sonnet-4-6 claude-haiku-4-5 llama-4-maverick
Google Vertex AI
Gemini 2.5 Pro · 2.5 Flash · Med-Gemini
95 折
相較官方
−5%
官方定價
強項
多模態
長脈絡 2M token
適合場景
圖文理解
搜尋增強 RAG
gemini-2.5-pro gemini-2.5-flash med-gemini
OpenAI
GPT-5 · o4-mini · Whisper · gpt-oss
95 折
相較官方
−5%
官方定價
強項
工具呼叫
廣泛生態相容
適合場景
Agent 開發
語音轉錄
gpt-5 o4-mini gpt-oss-120b whisper
醫療專用 LLM(臨床・合規場景)
醫療大型語言模型
Med-Gemini · Meditron 70B · Med-PaLM 2
醫療微調
強項
臨床推理
仿單・衛教問答
資料主權
可地端
敏感病歷不出境
適合場景
藥廠 / 醫院
合規稽核留軌
med-gemini meditron-70b medpalm-2 aiii-med-gemma4
開源 & 台灣在地 LLM
國際開源旗艦
Llama 4 · Gemma 4 · Phi-4 · Mistral
可地端
授權
開源權重
可自託管微調
強項
成本最佳化
自建算力推論
適合場景
高量推論
私有部署
llama-4-maverick llama-4-scout gemma-4-31b phi-4-reasoning magistral-small gpt-oss-120b qwen
台灣在地模型(資料主權)
TAIDE · FFM · FoxBrain · Taiwan-LLM
在地
語言
繁中優化
台灣語境訓練
主權
台灣機房
資料不出境
適合場景
政府 / 醫療
在地合規需求
llama-3.1-taide-8b llama3.1-ffm-70b foxbrain-70b llama-3-taiwan-70b
Aiii 自建算力(台灣)
計費方式

儲值制,按實際 token 使用量計費。無月費、無最低消費,Beta 期間最低儲值 NT$30,000

申請 Beta 資格 →
台灣自建算力

Mac Studio M3 Ultra 叢集
建在台灣,資料不出境

Aiii 自行建置的 GPU 叢集,以 Apple M3 Ultra 與 M5 Max 為推論節點,架設於台灣機房。適合有資料主權要求的醫療、藥廠、政府場景。

算力核心
M3 Ultra · M5 Max
部署規模
持續擴充中
資料主權
台灣機房,不出境
適用模型
Gemma 4, Llama 4
合規認證
ISO 27001
地端部署
On-prem 方案可談
📍 台灣機房 · 低延遲推論
💻
M3 Ultra #01
💻
M3 Ultra #02
💻
M3 Ultra #03
💻
M3 Ultra #04
💻
M3 Ultra #05
💻
M3 Ultra #06
📓
M5 Max #07
📓
M5 Max #08
📓
M5 Max #09
📓
M5 Max #10
💻
#11 擴充中
💻
#12 擴充中
💻
#13 規劃中
💻
#14 規劃中
💻
#15 規劃中
50 節點線上 · 平均延遲 <120ms · 台灣機房
適用對象
不管是開發者還是企業,都有最合適的方案
👨‍💻

開發者 / 新創

快速接 API、測試多家模型、節省雲端帳單。Beta 期間最低 NT$30,000 起即可上手,OpenAI 相容格式零學習成本。

API Key 即用多模型比較低起步門檻
🏢

企業 IT / AI 導入

統一帳單管理、多部門 API key 分流、用量報表匯出。不需要各自申請 AWS / GCP / OpenAI 帳號,一站管理。

多 Key 管理統一帳單用量控管
💊

藥廠 / 醫療機構

台灣自建算力,資料不出境,可配合 ISO 27001 / HIPAA 合規要求。搭配 Aiii MCP Engine 可直接部署醫療合規 AI。

資料不出境ISO 27001醫療合規On-prem 可談
Beta 內測開放申請

搶先體驗
AI 算力 92 折起

Beta 期間限定,完成申請後 1-2 個工作天內由顧問聯繫,確認需求後開通 API access 並提供專屬優惠儲值方案。

Beta 名額有限,審核後 1-2 個工作天聯繫。不會分享個人資訊給第三方。

🎉

申請已送出!

我們會在 1-2 個工作天內以信箱聯繫您,確認需求後開通 API access。
如有急用請聯繫 [email protected]

常見問題
折扣是怎麼計算的?跟官方定價比較?
以各供應商官網公告定價為基準,Prometheus 的折扣直接反映在每 1M token 的計費單價上。Beta 期間整合測試中,正式上線後會公告各模型完整定價表。
API 格式跟 OpenAI 相容嗎?要改多少程式碼?
完全相容 OpenAI Chat Completions API。只需要改 base_urlapi_key 兩個參數,其他程式碼不用動。所有語言的 OpenAI SDK 都可直接使用。
台灣自建 Gemma 跟雲端模型差在哪裡?
Aiii 自建 Gemma 的主要優勢是:(1)資料完全不出台灣;(2)可做醫療中文微調;(3)價格比雲端模型更低;(4)適合有資料主權要求的藥廠、醫院場景。但能力上較大的雲端旗艦模型(如 GPT-5、Claude Opus 4.8)在複雜任務上仍有優勢。
儲值後沒用完會退款嗎?
Beta 期間政策尚未確定,預計提供餘額有效期延展選項。正式上線後退款政策會在條款中明確說明。如有疑慮,請在申請時備注或直接聯繫 [email protected] 詢問。
可以地端部署(On-prem)嗎?
可以,針對藥廠、醫院、政府機構等有嚴格資安需求的場景,Aiii 提供自建 Gemma 的地端部署方案。需要評估算力規模、維運需求等,請直接聯繫我們的企業業務規劃。
跟直接申請 AWS / GCP / OpenAI 帳號有什麼差別?
三個差異:(1)折扣:Prometheus 的採購量能帶來更低單價;(2)統一管理:一個帳號、一張帳單、多模型多 key 統一控管;(3)台灣自建選項:雲端供應商沒有資料不出境的推論選擇,Aiii Gemma 填補這個空白。