普羅米修斯 Beta · 內測開放中

把算力
帶給人類

Prometheus · 普羅米修斯算力平台

整合 AWS Bedrock、Google Vertex AI、OpenAI 與台灣自建算力——一個入口，取最優模型，AI 算力雲端 92 折起，按用量計費，無需綁約。

申請 Beta 資格 → 查看定價方案

92 折起相較官方定價

4+供應商整合

自建台灣算力・不出境

統一OpenAI 相容 API

🔥

選擇模型，即刻推論

Beta 期間限定折扣

aws

AWS Bedrock · Claude Opus 4.8

旗艦推理，長文優化

92 折

GCP

Google Vertex AI · Gemini 2.5 Pro

多模態，長脈絡理解

95 折

GPT

OpenAI · GPT-5 / o4-mini

廣泛相容，工具呼叫

95 折

⚕️

醫療專用 · Med-Gemini / Meditron 70B

醫療問答・臨床推理微調

95 折

Aiii Gemma 4 醫療版（台灣自建）

台灣機房 · 醫療微調

最優惠

統一 OpenAI 相容 API — 改一行 base_url 就換供應商

💰

最低 92 折，直接省

整合多供應商採購量能，把折扣直接傳遞給你。Beta 期間享最優惠定價，無最低消費門檻。

🔌

一個 API，四家模型

OpenAI 相容格式統一接口。切換供應商只需改一行 base_url，你的程式碼不用改，帳單自動合一。

🇹🇼

台灣本地算力

Mac Studio M3 Ultra 與 MacBook Pro M5 Max 叢集架設於台灣機房。本地推論低延遲，資料不出境，符合醫療合規要求。

⚖️

醫療級資安合規

ISO 27001 認證架構。自建 Gemma 可設定資料不落地 log，適合藥廠、醫院等有嚴格資安要求的場景。

📊

即時用量儀表板

每個 API key 的 token 用量、費用、模型分佈一目了然。團隊多 key 管理，帳單按部門分攤。

🏗️

企業 fine-tune 支援

需要醫療專業微調？Aiii 提供 Gemma 客製化 fine-tune 服務，訓練數據留在你的環境，模型權重可私有化。

模型 & 定價

選最合適的模型，按用量付費

Beta 期間雲端模型享 92–95 折優惠，台灣自建模型更低。正式上線後將公告完整定價。

Beta 定價 · 正式上線前鎖定優惠

雲端 LLM 供應商（92–95 折）

aws

AWS Bedrock

Claude Opus 4.8 · Sonnet 4.6 · Llama 4

92 折

相較官方

−8%

官方定價

強項

長文·推理

Claude 系列

適合場景

企業知識庫

合規文件處理

claude-opus-4-8 claude-sonnet-4-6 claude-haiku-4-5 llama-4-maverick

GCP

Google Vertex AI

Gemini 2.5 Pro · 2.5 Flash · Med-Gemini

95 折

相較官方

−5%

官方定價

強項

多模態

長脈絡 2M token

適合場景

圖文理解

搜尋增強 RAG

gemini-2.5-pro gemini-2.5-flash med-gemini

GPT

OpenAI

GPT-5 · o4-mini · Whisper · gpt-oss

95 折

相較官方

−5%

官方定價

強項

工具呼叫

廣泛生態相容

適合場景

Agent 開發

語音轉錄

gpt-5 o4-mini gpt-oss-120b whisper

醫療專用 LLM（臨床・合規場景）

⚕️

醫療大型語言模型

Med-Gemini · Meditron 70B · Med-PaLM 2

醫療微調

強項

臨床推理

仿單・衛教問答

資料主權

可地端

敏感病歷不出境

適合場景

藥廠 / 醫院

合規稽核留軌

med-gemini meditron-70b medpalm-2 aiii-med-gemma4

開源 & 台灣在地 LLM

OSS

國際開源旗艦

Llama 4 · Gemma 4 · Phi-4 · Mistral

可地端

授權

開源權重

可自託管微調

強項

成本最佳化

自建算力推論

適合場景

高量推論

私有部署

llama-4-maverick llama-4-scout gemma-4-31b phi-4-reasoning magistral-small gpt-oss-120b qwen

🇹🇼

台灣在地模型（資料主權）

TAIDE · FFM · FoxBrain · Taiwan-LLM

在地

語言

繁中優化

台灣語境訓練

主權

台灣機房

資料不出境

適合場景

政府 / 醫療

在地合規需求

llama-3.1-taide-8b llama3.1-ffm-70b foxbrain-70b llama-3-taiwan-70b

Aiii 自建算力（台灣）

🔥

Aiii Gemma（台灣自建）

台灣機房 · 資料不出境 · 醫療微調版本

最優惠

相較雲端

更低成本

自建算力優勢

強項

資料主權

不出境 · 合規

適合場景

醫療 / 藥廠

敏感資料推論

gemma-4-31b-medical gemma-4-e4b-fast aiii-embed-zh

計費方式

儲值制，按實際 token 使用量計費。無月費、無最低消費，Beta 期間最低儲值 NT$30,000。

申請 Beta 資格 →

台灣自建算力

Mac Studio M3 Ultra 叢集
建在台灣，資料不出境

Aiii 自行建置的 GPU 叢集，以 Apple M3 Ultra 與 M5 Max 為推論節點，架設於台灣機房。適合有資料主權要求的醫療、藥廠、政府場景。

算力核心

M3 Ultra · M5 Max

部署規模

持續擴充中

資料主權

台灣機房，不出境

適用模型

Gemma 4, Llama 4

合規認證

ISO 27001

地端部署

On-prem 方案可談

📍 台灣機房 · 低延遲推論

💻

M3 Ultra #01

💻

M3 Ultra #02

💻

M3 Ultra #03

💻

M3 Ultra #04

💻

M3 Ultra #05

💻

M3 Ultra #06

📓

M5 Max #07

📓

M5 Max #08

📓

M5 Max #09

📓

M5 Max #10

💻

#11 擴充中

💻

#12 擴充中

💻

#13 規劃中

💻

#14 規劃中

💻

#15 規劃中

50 節點線上 · 平均延遲 <120ms · 台灣機房

適用對象

不管是開發者還是企業，都有最合適的方案

👨‍💻

開發者 / 新創

快速接 API、測試多家模型、節省雲端帳單。Beta 期間最低 NT$30,000 起即可上手，OpenAI 相容格式零學習成本。

API Key 即用多模型比較低起步門檻

🏢

企業 IT / AI 導入

統一帳單管理、多部門 API key 分流、用量報表匯出。不需要各自申請 AWS / GCP / OpenAI 帳號，一站管理。

多 Key 管理統一帳單用量控管

💊

藥廠 / 醫療機構

台灣自建算力，資料不出境，可配合 ISO 27001 / HIPAA 合規要求。搭配 Aiii MCP Engine 可直接部署醫療合規 AI。

資料不出境ISO 27001醫療合規On-prem 可談

Beta 內測開放申請

搶先體驗
AI 算力 92 折起

Beta 期間限定，完成申請後 1-2 個工作天內由顧問聯繫，確認需求後開通 API access 並提供專屬優惠儲值方案。

姓名 *

公司 *

公司信箱 *

聯絡電話 *

預計使用場景 *

補充說明（選填）

Beta 名額有限，審核後 1-2 個工作天聯繫。不會分享個人資訊給第三方。

🎉

申請已送出！

我們會在 1-2 個工作天內以信箱聯繫您，確認需求後開通 API access。
如有急用請聯繫 [email protected]

常見問題

折扣是怎麼計算的？跟官方定價比較？

以各供應商官網公告定價為基準，Prometheus 的折扣直接反映在每 1M token 的計費單價上。Beta 期間整合測試中，正式上線後會公告各模型完整定價表。

API 格式跟 OpenAI 相容嗎？要改多少程式碼？

完全相容 OpenAI Chat Completions API。只需要改 base_url 和 api_key 兩個參數，其他程式碼不用動。所有語言的 OpenAI SDK 都可直接使用。

台灣自建 Gemma 跟雲端模型差在哪裡？

Aiii 自建 Gemma 的主要優勢是：（1）資料完全不出台灣；（2）可做醫療中文微調；（3）價格比雲端模型更低；（4）適合有資料主權要求的藥廠、醫院場景。但能力上較大的雲端旗艦模型（如 GPT-5、Claude Opus 4.8）在複雜任務上仍有優勢。

儲值後沒用完會退款嗎？

Beta 期間政策尚未確定，預計提供餘額有效期延展選項。正式上線後退款政策會在條款中明確說明。如有疑慮，請在申請時備注或直接聯繫 [email protected] 詢問。

可以地端部署（On-prem）嗎？

可以，針對藥廠、醫院、政府機構等有嚴格資安需求的場景，Aiii 提供自建 Gemma 的地端部署方案。需要評估算力規模、維運需求等，請直接聯繫我們的企業業務規劃。

跟直接申請 AWS / GCP / OpenAI 帳號有什麼差別？

三個差異：（1）折扣：Prometheus 的採購量能帶來更低單價；（2）統一管理：一個帳號、一張帳單、多模型多 key 統一控管；（3）台灣自建選項：雲端供應商沒有資料不出境的推論選擇，Aiii Gemma 填補這個空白。

把算力帶給人類

最低 92 折，直接省

一個 API，四家模型

台灣本地算力

醫療級資安合規

即時用量儀表板

企業 fine-tune 支援

Mac Studio M3 Ultra 叢集建在台灣，資料不出境

開發者 / 新創

企業 IT / AI 導入

藥廠 / 醫療機構

搶先體驗AI 算力 92 折起

申請已送出！

把算力
帶給人類

Mac Studio M3 Ultra 叢集
建在台灣，資料不出境

搶先體驗
AI 算力 92 折起