Select Page

OpenCode 如何使用本地端模型

打開 opencode 設定檔 :

  • macOS / Linux: ~/.config/opencode/opencode.json
  • Windows: %USERPROFILE%\.config\opencode\opencode.json

加入下面的設定(是標準的 json)

json{
  "$schema": "https://opencode.ai/config.json",
  "provider": {
    "ollama": {
      "npm": "@ai-sdk/openai-compatible",
      "name": "Ollama (local)",
      "options": {
        "baseURL": "http://localhost:11434/v1"
      },
      "models": {
        "qwen2.5-coder-16k": {
          "name": "Qwen Coder Local (16k)",
          "tools": true
        }
      }
    }
  }
}

Opencode config 說明

https://opencode.ai/docs/config

2026 AI 專案上線該選誰?Vercel、Cloudflare、RepackAI 與 Esbuild 深度分析

本文將分析目前相當熱門的四套工具與平台:

  • Vercel
  • Cloudflare
  • RepackAI
  • Esbuild

雖然這四者常被一起提及,但實際上定位完全不同。

有些是部署平台,有些是 AI 開發工具,有些則是前端打包工具。

了解它們之間的差異,才能打造更具競爭力的 AI 產品。


四大平台定位比較

平台類型主要用途
Vercel雲端部署平台Next.js、React 專案部署
Cloudflare全球邊緣運算平台CDN、Workers、AI Gateway
RepackAIAI 內容轉換平台AI 自動產生跨平台內容
EsbuildJavaScript 打包工具前端建置與編譯

因此這四套工具其實並非完全競爭關係,而是可互補搭配使用。


一、Vercel:AI 時代最熱門的前端部署平台

Vercel 官方網站

Vercel 是由 Next.js 團隊打造的雲端平台,主打:

  • Git 自動部署
  • Preview Environment
  • Serverless Functions
  • AI SDK
  • 全球 CDN
  • AI Cloud

目前許多 AI SaaS 產品都直接部署在 Vercel 上。Vercel 提供 Git Push 即部署能力,能自動建立測試環境與正式環境,大幅降低 DevOps 門檻。

Vercel 優點

開發速度快

連接 GitHub 後即可自動部署。

Next.js 最佳化

與 Next.js 深度整合。

AI 生態完整

提供:

  • AI SDK
  • AI Gateway
  • V0
  • AI Agent Framework

逐步朝 AI Cloud 發展。

缺點

  • 流量大時成本上升較快
  • Vendor Lock-in 較高
  • 後端功能不如 Cloudflare 彈性

二、Cloudflare:AI Agent 時代的新霸主?

Cloudflare 官方網站

Cloudflare 原本是 CDN 廠商,但近年快速轉型成:

  • Serverless Platform
  • Edge Computing Platform
  • AI Inference Platform

目前已提供:

  • Workers
  • Pages
  • Durable Objects
  • R2 Storage
  • Vectorize
  • AI Gateway
  • MCP 支援

Cloudflare 的最大優勢是將 AI、儲存、運算、安全性整合在同一平台。

Cloudflare 優點

全球邊緣節點

超過 300 個以上節點。

成本極低

許多開發者由 Vercel 轉向 Cloudflare 的原因之一就是成本。

AI Agent 友善

Cloudflare 正積極投入:

  • MCP
  • AI Gateway
  • Agent Hosting

未來 AI Agent 部署極具潛力。

缺點

  • 學習曲線較高
  • Next.js 支援仍不如 Vercel 完整
  • 除錯較複雜

三、RepackAI:AI 行銷內容生成神器

RepackAI 官方網站

RepackAI 並不是部署平台。

它的定位比較像:

AI 內容工廠

使用者只需提供:

  • 網址
  • YouTube 影片

即可快速產生:

  • Facebook 貼文
  • Instagram 貼文
  • X(Twitter)內容
  • LinkedIn 內容
  • 部落格文章
  • 圖片素材
  • 短影音素材

大幅降低內容行銷成本。

適合誰?

  • AI SaaS 團隊
  • 自媒體
  • 行銷公司
  • 電商團隊

最大價值

當你使用 Vercel 或 Cloudflare 建立 AI 產品後,

RepackAI 可以協助你:

  • 宣傳產品
  • 建立 SEO 文章
  • 經營社群媒體

形成完整的流量成長循環。


四、Esbuild:極速打包工具

Esbuild 官方網站

Esbuild 是目前最受歡迎的新世代 JavaScript Bundler 之一。

其核心特色:

非常快。

Esbuild 採用 Go 語言開發,因此在編譯速度上遠超:

  • Webpack
  • Babel
  • Rollup

官方甚至表示許多情境下能快上數十倍。

功能

  • TypeScript 編譯
  • Tree Shaking
  • Minify
  • Code Splitting
  • ESM 轉換
  • CommonJS 轉換

適合

  • React
  • Vue
  • Svelte
  • Next.js
  • Node.js

為什麼重要?

AI 專案通常依賴大量套件:

LangChainOpenAI SDKSupabaseShadcn/UIReact

若建置速度太慢,

開發效率會大幅下降。

Esbuild 正是解決此問題的重要工具。


四大平台比較總表

項目VercelCloudflareRepackAIEsbuild
類型部署平台邊緣運算平台AI內容平台打包工具
AI功能★★★★★★★★★★★★★★☆★☆☆☆☆
部署速度★★★★★★★★★☆不適用不適用
全球CDN★★★★★★★★★★
成本控制★★★☆☆★★★★★★★★★☆免費
學習曲線中高
適合新創★★★★★★★★★☆★★★★☆★★★★★
適合大型產品★★★★☆★★★★★★★★☆☆★★★★★

RepackAI 則負責自動產生 SEO 與社群內容,建立持續流量來源。


能行銷才是王者

2026 年的 AI 開發已經不只是模型競賽,而是整個開發與部署生態系的競爭。

  • Vercel 適合快速開發與 AI SaaS
  • Cloudflare 適合大型流量與 AI Agent
  • RepackAI 適合內容行銷自動化
  • Esbuild 適合提升前端建置效率

透過開發、部署、行銷三者整合,才能在 AI 時代建立可持續成長的產品與流量體系。

Nidia DGX Spark GB10 Ollama 最佳設定

話說最近把 GB10 中的 ollama 給多人使用後就常常掛點,先把我的解方記錄下來,最後還是得用 vllm + QUENE 才能達到產品級

GPU OOM
500 Error
timeout

編輯設定檔

sudo nano /etc/systemd/system/ollama.service

建議的設定檔

[Service]

Environment="OLLAMA_HOST=0.0.0.0:11434"

Environment="OLLAMA_GPU_LAYERS=999"

Environment="OLLAMA_MODELS=/mnt/ai-models/ollama/models"

Environment="OLLAMA_FLASH_ATTENTION=1"

Environment="OLLAMA_KV_CACHE_TYPE=q8_0"

Environment="OLLAMA_NUM_PARALLEL=1"

Environment="OLLAMA_MAX_LOADED_MODELS=1"

Environment="OLLAMA_MAX_QUEUE=256"

Environment="OLLAMA_KEEP_ALIVE=10m"

為什麼這樣設

OLLAMA_NUM_PARALLEL=1

很多教學會設:

OLLAMA_NUM_PARALLEL=4

但實際上:

Parallel 越大,

Context Cache 會倍數成長。

例如:

NUM_PARALLEL=1VRAM 使用 30GBNUM_PARALLEL=4VRAM 使用 50GB+

很容易直接炸掉。


OLLAMA_MAX_LOADED_MODELS=1

避免:多個模型同時留在 VRAM。

多人使用時最容易發生。


OLLAMA_KEEP_ALIVE=10m

目前很多人設:

-1

永久保留模型。

結果:

VRAM 永遠不釋放。

改:

10m

10分鐘沒人用就卸載。

Ideogram 4 實作教學:在 ComfyUI 本機部署最強開源 AI 繪圖模型

Ideogram 4 實作教學:在 ComfyUI 本機部署最強開源 AI 繪圖模型

2026 年最受矚目的 AI 繪圖模型之一,莫過於 Ideogram 團隊正式釋出的:

Ideogram 4

這是 Ideogram 首次公開模型權重(Open Weight),也是目前開源陣營中,在:

  • 文字生成(Text Rendering)
  • 海報設計
  • 品牌廣告
  • 排版控制
  • JSON 結構化提示詞

官方資料顯示,Ideogram 4 採用 9.3B 參數的單流 Diffusion Transformer(DiT)架構,並支援原生 2K 圖像生成。

本篇將帶你使用 ComfyUI,在本機部署 Ideogram 4。


系統需求

官方模型共有兩個版本:

版本量化
Ideogram 4 FP8品質最佳
Ideogram 4 NF4VRAM需求較低

目前 ComfyUI 官方整合版本主要使用:

  • FP8
  • NVFP4

其中 FP8 畫質最佳。


第一步:下載模型

ComfyUI 專用模型

官方:

Comfy-Org Ideogram-4

原始模型:

Ideogram 4 FP8 官方模型


第二步:放置模型檔案

依照官方說明建立目錄。

ComfyUI
│
├─ models
│  ├─ diffusion_models
│  │  ├─ ideogram4_fp8_scaled.safetensors
│  │  └─ ideogram4_unconditional_fp8_scaled.safetensors
│  │
│  ├─ text_encoders
│  │  └─ qwen3vl_8b_fp8_scaled.safetensors
│  │
│  └─ vae
│      └─ flux2-vae.safetensors

第三步:了解每個模型用途

ideogram4_fp8_scaled

主模型

負責:

  • 圖片生成
  • 構圖
  • 風格
  • 排版

ideogram4_unconditional_fp8_scaled

CFG 引導模型

負責:

  • 提升細節
  • 強化 Prompt Follow
  • 改善品質

官方建議兩個模型一起使用。若只載入主模型雖可運作,但畫質會下降。


qwen3vl_8b_fp8_scaled

文字編碼器

負責:

  • Prompt 理解
  • JSON 理解
  • 空間推理
  • 海報版面配置

flux2-vae

VAE 解碼器

負責將 Latent 轉換成圖片。


第四步:更新 ComfyUI

Ideogram 4 需要最新版本的 ComfyUI。

更新方式:

cd ComfyUI

git pull

或:

update_comfyui.bat

官方於 Day-0 即已原生支援 Ideogram 4。


第五步:載入官方 Workflow

ComfyUI 官方已提供範例工作流。

建議直接從:

Comfy Blog

下載 Workflow


基礎工作流架構

Prompt
    ↓

Qwen3-VL Encoder
    ↓

Ideogram 4
    ↓

Sampler
    ↓

Flux VAE Decode
    ↓

Save Image

第六步:第一張圖片

測試 Prompt:

A futuristic cyberpunk city at night,
neon signs in Chinese,
cinematic lighting,
ultra detailed,
high contrast,
8k photography

生成尺寸:

1024 x 1024

推理模式:

DEFAULT

第七步:體驗 JSON Prompt

Ideogram 4 最大特色就是:

Structured JSON Prompt

官方模型訓練時即使用 JSON Caption。


範例:海報設計

{
  "scene_summary": "Professional technology conference poster",

  "background": {
    "description": "Modern convention center stage with blue ambient lighting, large LED screen, clean professional environment"
  },

  "style": {
    "description": "Corporate marketing design, professional conference poster, clean typography, premium branding, modern layout"
  },

  "objects": [
    {
      "description": "Conference stage",
      "bbox": [100, 150, 900, 850],
      "colors": ["#0A2540", "#1E88E5", "#FFFFFF"]
    }
  ],

  "text_elements": [
    {
      "text": "AI SUMMIT 2026",
      "bbox": [150, 120, 850, 260],
      "style": "Large bold white sans-serif title"
    },
    {
      "text": "Future of Artificial Intelligence",
      "bbox": [180, 280, 820, 350],
      "style": "Medium white subtitle"
    },
    {
      "text": "Taipei International Conference Center",
      "bbox": [180, 1050, 820, 1120],
      "style": "Small white footer text"
    }
  ]
}

Bounding Box 控制

可直接指定位置。

{
  "text_elements":[
    {
      "text":"SALE 50%",
      "bbox":[100,100,500,300]
    }
  ]
}

座標範圍:

0 ~ 1000

原點:

左上角

這是目前 FLUX 與 Stable Diffusion 所不具備的能力。


色彩盤控制

品牌設計超級好用。

{
  "color_palette":[
    "#FF6600",
    "#FFFFFF",
    "#000000"
  ]
}

官方支援:

  • 最多16色
  • 單元素最多5色

與 FLUX 比較

FLUX 強項

  • 寫實攝影
  • 光影細節
  • 人像品質

Ideogram 4 強項

  • Logo
  • 海報
  • Banner
  • 電商素材
  • 排版設計
  • 中文文字生成

若你是:

  • 電商設計師
  • 行銷公司
  • 品牌設計
  • 廣告公司

Ideogram 4 很可能比 FLUX 更適合。


結論

Ideogram 4 不只是另一個 AI 繪圖模型。

它最大的創新在於:

把 Prompt 從自然語言升級為結構化設計規格。

透過:

  • Qwen3-VL
  • Diffusion Transformer
  • JSON Prompt
  • Bounding Box
  • Color Palette

使用者終於可以像操作 Figma 一樣控制 AI 生成內容。

對於需要:

  • 海報設計
  • 品牌素材
  • Banner 製作
  • AI Agent 自動產圖

的開發者來說,Ideogram 4 是目前最值得研究與部署的開源模型之一。

Ideogram 4.0 技術解析:9.3B 參數 DiT 架構、結構化 JSON 提示詞與 2K 原生輸出,Diffusion Transformer 革命登場

Ideogram 4.0 技術解析:9.3B 參數 DiT 架構、結構化 JSON 提示詞與 2K 原生輸出,Diffusion Transformer 革命登場

AI 圖像生成正式進入「設計級控制」時代

近兩年 AI 繪圖領域競爭激烈,從 Midjourney、Stable Diffusion、FLUX,到 Google Imagen,各家模型都在追求更好的畫質與更精準的提示詞理解能力。

真正困擾設計師與企業用戶的問題其實不是畫質,而是以下的問題:

  • 文字總是生成錯誤
  • 排版無法控制
  • Logo 與標題位置不準確
  • 無法符合品牌色彩規範
  • 每次生成結果都像在「抽卡」

2026 年 6 月,Ideogram 正式推出最新開源模型:

Ideogram 4.0

這不僅是 Ideogram 首次公開權重(Open Weight)模型,更被許多開發者視為目前最接近商業設計工作流程的 AI 圖像生成系統。


什麼是 Ideogram 4.0?

Ideogram 4.0 是一款從零開始訓練的 AI 圖像生成模型,採用最新的:

Diffusion Transformer(DiT)架構

與傳統 Stable Diffusion 不同,Ideogram 4.0 使用:

  • 34 層 Transformer
  • 93 億參數(9.3B)
  • 單流(Single Stream)設計
  • 文字 Token 與影像 Token 共用同一套注意力機制

官方稱其為:

Single-Stream Diffusion Transformer(DiT)

這種架構讓模型能更深入理解文字與影像之間的關聯,提高提示詞遵循能力(Prompt Adherence)與版面控制能力。


核心架構解析

1. 文字編碼器(Text Encoder)

Ideogram 4.0 並未使用傳統的 CLIP 或 T5 「文字編碼器(Text Encoder)」。

而是採用了:

Qwen3-VL-8B-Instruct

作為文字理解引擎。

其特色包括:

  • 視覺語言模型(Vision Language Model)
  • 僅使用文字模式
  • 提取 13 個中間層隱藏狀態
  • 將多層特徵串接後輸入 DiT

這種設計能同時保留:

  • Token 級語意
  • 物件關係
  • 空間推理
  • 構圖理解

讓模型對複雜提示詞有更深層的理解能力。


2. DiT 主幹網路

Ideogram 4.0 採用:

  • 34 Layers
  • Embedding Dimension:4608
  • 18 Attention Heads
  • SwiGLU Feed Forward

總參數量達:

9.3 Billion Parameters

目前已是開源 AI 繪圖模型中最頂尖的規模之一。


3. VAE 解碼器

使用凍結(Frozen)的:

KL VAE

特性:

  • 8× 空間壓縮
  • 128 Latent Channels

負責將潛在空間(Latent Space)轉換為最終圖像。


4. Flow Matching 取樣器

不同於傳統 DDPM。

Ideogram 4.0 採用:

Euler Flow Matching

搭配:

Asymmetric CFG

特色:

  • 提升生成效率
  • 改善細節品質
  • 更穩定的提示詞遵循能力

官方提供三種推理模式:

模式Steps
V4_TURBO12
V4_DEFAULT20
V4_QUALITY48

品質模式會在最後階段降低引導強度,進一步提升真實感。


最大突破:JSON 結構化提示詞

這是 Ideogram 4.0 最具革命性的地方。

過去 AI 繪圖都依賴自然語言:

A beautiful girl standing beside a lake...

Ideogram 4.0 則改為:

{  "background": "...",  "objects": [...],  "texts": [...],  "style": {...}}

模型訓練時完全使用 JSON 描述,因此天生理解結構化資訊。


Bounding Box 精準版面控制

支援 Bounding Box:

{  "bbox": [100,100,400,400]}

採用:

  • 0~1000 正規化座標
  • 左上角為原點

可直接指定:

  • Logo 位置
  • 標題位置
  • 商品位置
  • 人物位置

這是過去 Midjourney、Stable Diffusion 很難做到的功能。


色彩盤控制(Color Palette)

可直接指定品牌色:

{  "colour_palette": [    "#FF6600",    "#FFFFFF",    "#000000"  ]}

限制:

  • 每張圖最多 16 色
  • 每個元素最多 5 色

非常適合:

  • 品牌設計
  • 電商素材
  • 廣告 Banner
  • 包裝設計

多語言文字生成能力大幅提升

Ideogram 一直以來最強的能力就是:

Text Rendering

也就是圖片內文字生成。

例如:

  • 海報
  • Logo
  • 廣告標語
  • 包裝文字
  • 社群貼文

以往 AI 經常出現亂碼。

但 Ideogram 4.0 已能大幅提升:

  • 中文
  • 英文
  • 日文
  • 韓文

等多語系文字品質。


原生支援 2K 輸出

解析度支援:

  • 最小:256 × 256
  • 最大:2048 × 2048

且:

  • 必須為 16 的倍數
  • 最長比例可達 6:1

例如:

  • YouTube Banner
  • 網站橫幅
  • 電商主圖
  • 手機桌布

皆可直接生成。


設計工作流功能全面升級

除了模型本身之外,Ideogram 平台也同步推出多項設計工具:

Prompt Edit

直接修改既有圖片中的特定區域。

Magic Fill

局部重繪。

Remix

基於現有圖片重新生成。

Extend / Reframe

擴展畫布與調整比例。

Upscale

提高解析度。

Transparent Background

直接輸出透明背景 PNG。

MCP 整合

可接入 AI Agent 工作流程。

Editable Text Layers

未來將支援真正可編輯的文字圖層功能。


Ideogram 4.0 與 Google Imagen 誰更強?

若比較:

  • Google Imagen
  • FLUX
  • Stable Diffusion
  • Ideogram 4.0

目前 Ideogram 最大優勢在於:

✅ 文字生成能力

✅ 排版控制能力

✅ JSON 結構化設計流程

✅ 開源權重

✅ 可自行部署

而 Google Imagen 仍在:

  • 寫實度
  • 影像理解
  • Google 生態整合

方面維持優勢。

若是企業設計工作流,Ideogram 4.0 已經是極具競爭力的選擇。


官方資源

官方網站

Ideogram 官方網站

模型介紹

Ideogram 4.0 Model Page

技術部落格

Ideogram 4.0 Technical Details

API 文件

Ideogram Developer API

GitHub

Ideogram 4 GitHub Repository

Hugging Face

Ideogram 4 Hugging Face Collection


Ideogram 4.0 不只是另一個 AI 繪圖模型。

它最大的突破在於:

把 AI 繪圖從「描述圖片」提升到「設計圖片」。

透過:

  • Diffusion Transformer(DiT)
  • Qwen3-VL 編碼器
  • JSON Prompt
  • Bounding Box 控制
  • 色彩盤控制
  • 可編輯文字圖層

Ideogram 4.0 正逐步接近 Photoshop、Illustrator 與 Figma 所代表的專業設計工作流程。

對於品牌設計、電商素材、廣告製作與 AI Agent 自動化內容生成來說,Ideogram 4.0 很可能會成為 2026 年最值得關注的開源 AI 圖像生成模型之一

Ollama 遠端連線教學:Windows PowerShell 連接 AI Server 完整指南

想把 Ollama Client 安裝在 Windows 筆電上,但模型實際運行在另一台 AI 伺服器(例如 NVIDIA Spark、Linux GPU 主機)嗎?

本文教你如何透過 PowerShell 指定遠端 Ollama Server,讓本機直接使用遠端模型資源。


Ollama 遠端架構說明

一般情況下,Ollama 預設會連接本機:

localhost:11434

但如果你的 AI 模型部署在另一台主機,例如:

192.168.0.1

則可以透過環境變數指定遠端伺服器。

Step 1:設定遠端 Ollama Host

開啟 PowerShell:

$Env:OLLAMA_HOST = "192.168.0.1:11434"

若使用 HTTP 格式也可以:

$Env:OLLAMA_HOST = "http://192.168.0.1:11434"

建議使用第二種寫法較完整。


Step 2:確認連線是否成功

執行:

ollama list

若成功,將會看到遠端伺服器上的模型清單:

NAME                 ID              SIZEclaude               xxxxxx          45 GBkimi-k2.5:cloud      xxxxxx          22 GBqwen3:32b            xxxxxx          20 GBdeepseek-r1:70b      xxxxxx          42 GB

若出現:

Error: connection refused

請確認:

  • 遠端 Ollama 是否啟動
  • 防火牆是否開放 11434 Port
  • Ollama 是否監聽 0.0.0.0

Linux 可檢查:

sudo ss -tlnp | grep 11434

正常應看到:

0.0.0.0:11434

Step 3:啟動 Claude

確認模型存在後:

ollama launch claude

系統將直接透過遠端 Ollama 執行 Claude。


Step 4:指定模型版本

例如使用 Kimi K2.5 Cloud 版本:

ollama launch claude --model kimi-k2.5:cloud

也可以切換成其他模型:

ollama launch claude --model qwen3:32b
ollama launch claude --model deepseek-r1:70b
ollama launch claude --model gemma3:27b

每次開機自動設定 OLLAMA_HOST

如果不想每次都輸入:

$Env:OLLAMA_HOST = "192.168.0.240:11434"

可永久寫入 Windows 使用者環境變數:

[System.Environment]::SetEnvironmentVariable(    "OLLAMA_HOST",    "http://192.168.0.240:11434",    "User")

重新開啟 PowerShell 後生效。

驗證:

echo $Env:OLLAMA_HOST

輸出:

http://192.168.0.240:11434

常見問題排除

無法連線

測試:

curl http://192.168.0.240:11434/api/tags

若有回傳 JSON 表示正常。


Linux Server 未開放外部連線

編輯 Ollama Service:

sudo systemctl edit ollama

加入:

[Service]Environment="OLLAMA_HOST=0.0.0.0:11434"

重新載入:

sudo systemctl daemon-reloadsudo systemctl restart ollama

查看目前設定

Windows:

echo $Env:OLLAMA_HOST

Linux:

echo $OLLAMA_HOST

透過設定 OLLAMA_HOST,即可讓 Windows 電腦上的 Ollama Client 直接連接遠端 AI 伺服器,將模型運算交由高效能 GPU 主機處理,而本機僅作為操作介面。

這種架構特別適合:

  • NVIDIA Spark AI 工作站
  • 家用 GPU 伺服器
  • 多人共用 Ollama Server
  • 企業內部 AI 平台
  • AI 開發與測試環境

只需一行指令:

$Env:OLLAMA_HOST = "192.168.0.240:11434"

即可讓你的 Windows PC 立即接管遠端 Ollama 的所有模型能力。