by Rain Chu | 4 月 18, 2026 | AI, Hermes
🧠 Hermes Agent 是什麼?
Hermes Agent 是由 Nous Research 推出的開源 AI Agent 框架,具備:
- 🔁 跨對話記憶(Memory)
- 🧠 技能(Skill)可持續累積
- 🌐 內建網頁瀏覽與工具調用
- ⏱️ 任務排程(Cron-like)
- 🔌 OpenAI 相容 API(可接各種 LLM)
👉 本質上,它不是單純聊天機器人,而是「可執行任務的 AI 系統」
🖥️ Hermes WebUI(Dashboard)帶來什麼改變?
1️⃣ 從 CLI → GUI 的巨大轉變
過去:
- OpenClaw / Agent 系統 → CLI + config + prompt
現在:
- Hermes WebUI → 點擊操作 + 視覺化管理
👉 這是 AI Agent 商業化的關鍵一步
2️⃣ 多 Agent 管理(未來 SaaS 核心)
透過 WebUI,可以:
- 管理多個 Agent
- 設定不同任務流程
- 控制記憶與技能
👉 這意味著:
👉 你可以做「多人 AI 平台」
3️⃣ 技能(Skill)可視化
Hermes 最大亮點:
任務會被記錄成「技能」,並可重複使用
例如:
👉 這其實就是:
👉 AI workflow engine(未來企業標準)
Hermes 實作
先更新到最新版本
然後就可以直接啟用 hermes webui
之後就可以用瀏覽器使用,預設是 http://localhost:9119/
🔍 Hermes WebUI 深度觀察(關鍵洞察)
💡 與 Open WebUI 深度整合
在社群中有人指出:
Hermes 可以當成「有狀態的 LLM endpoint」
意思是:
- WebUI(前端)
- Hermes(Agent)
- LLM(模型)
👉 三層架構:
User → WebUI → Hermes Agent → LL
「Hermes 開箱就像調教一週的 OpenClaw」
官方資訊
https://docs.openwebui.com/getting-started/quick-start/connect-an-agent/hermes-agent
第三方套件
https://github.com/nesquena/hermes-webui
by Rain Chu | 4 月 10, 2026 | AI, google
近年 AI 發展幾乎都依賴雲端,但現在 Google 正在顛覆這一切,透過最新的 Google AI Edge Gallery App,你已經可以在手機上「離線」直接運行 Gemma 4 大模型,不只文字對話,還能做到圖片理解、語音應用,甚至 AI Agent。
👉 換句話說:
你的手機,正在變成一台隨身 AI 伺服器。
📱 什麼是 Google AI Edge Gallery?
Google AI Edge Gallery 是 Google 推出的開源應用,讓使用者可以:
- 在手機上下載 AI 模型
- 完全「離線」執行
- 不需要連網、不上傳資料
👉 也就是「On-device AI(裝置端 AI)」
📌 重點特色:
- 🔒 完全隱私(資料不離開手機)
- 📡 完全離線(無網路也能用)
- ⚡ 低延遲(不用等雲端回應)
這款 App 主打「直接在硬體上運行生成式 AI」,讓手機具備高效 AI 推理能力
🧠 Gemma 4 是什麼?為什麼這麼強?
Gemma 4 是 Google 最新開源大模型,基於 Gemini 技術打造。
👉 核心重點:
- 支援多種尺寸(可跑在手機)
- 強化推理能力與邏輯能力
- 可本地執行(Edge AI)
目前部分版本(如 E2B / E4B)已經可以在手機透過 AI Edge Gallery 直接跑
👉 簡單講:
| 類型 | 傳統 AI | Gemma 4 |
|---|
| 運算位置 | 雲端 | 本地(手機) |
| 隱私 | 低 | 高 |
| 延遲 | 高 | 低 |
| 成本 | 訂閱制 | 免費 |
🖼️ 不只是聊天:圖片+語音也能搞定
這次最關鍵的不是「能聊天」,而是👇
🔍 多模態能力(Multimodal)
Gemma 4 + Edge AI 已經可以支援:
- 📷 圖片理解(Image Recognition)
- 🎤 語音相關應用(Speech)
- 🧾 OCR / 文件理解
- 🤖 Agent 自動任務
👉 代表未來:
手機 AI 可以直接「看圖、聽聲音、做決策」
⚙️ 實際運作方式
👉 關鍵技術:
- 模型量化(Quantization)
- 邊緣推論(Edge Inference)
- NPU 加速
這也是為什麼現在手機能跑 AI 的核心原因。
🧪 實測重點
✔ 優點
- 不用網路也能用 AI
- 資料完全私密
- 速度比雲端更即時
- 免費使用
❌ 缺點
- 模型體積大(2GB~5GB)
- 手機會發熱
- 功能還在成長中
🤖 AI Agent 能力(未來最可怕的地方)
AI Edge Gallery 還支援「Agent Skills」:
- 可接工具(如地圖、知識庫)
- 可自動完成任務
- 可擴展插件
👉 官方甚至強調:
AI 可以從單純聊天變成「主動助理」
🌍 這代表什麼?(重點分析)
這不只是 App,而是產業轉折點👇
1️⃣ AI 從「雲端」走向「個人設備」
- ChatGPT → 雲端 AI
- Gemma 4 → 個人 AI
2️⃣ AI 成為手機標配(像相機一樣)
未來:
- 每支手機都有 AI
- AI 常駐本地運行
- 即時處理所有需求
3️⃣ 新創機會爆炸(你可以做)
結合你現在在做的 AI Agent / LangChain:
👉 你可以做:
- 本地 AI 房仲助理
- 離線 AI CRM
- 私有 AI 商業分析工具
- Edge AI SaaS(超有機會)
🧭 實際使用流程(超簡單)
- 安裝 App(Play Store / iOS)
- 下載模型(Gemma 4)
- 開始使用(Chat / Image / Voice)
👉 約 5 分鐘內完成
🏁 結論:AI 正在「回到你手上」
Google 這一步很關鍵:
👉 AI 不再只是雲端服務
👉 而是變成「你手機的一部分」
未來 3 年:
每個人都會有一個「離線 AI 助理」
而你現在就可以先卡位。
官方網頁
https://play.google.com/store/apps/details?id=com.google.ai.edge.gallery&pli=1
https://github.com/google-ai-edge/gallery?tab=readme-ov-file
by Rain Chu | 2 月 23, 2025 | AI, 程式開發
OpenRouter 是一個統一的大型語言模型(LLM)API 服務平台,可以讓使用者透過單一介面訪問多種大型語言模型。
主要特點:
- 多模型支援: OpenRouter 集成了多種預訓練模型,如 GPT-4、Gemini、Claude、DALL-E 等,按需求選擇適合的模型。
- 易於集成: 提供統一的 API 介面,方便與現有系統整合,無需自行部署和維護模型。
- 成本效益: 透過 API 調用,使用者無需購買昂貴的 GPU 伺服器,降低了硬體成本。
使用方法:
- 註冊帳號: 使用 Google 帳號即可快速註冊 OpenRouter。
- 選擇模型: 在平台上瀏覽並選擇適合的模型,部分模型提供免費使用。
- 調用 API: 使用統一的 API 介面,將選定的模型整合到您的應用中。
Cline 整合
OpenRouter 與 Cline 的整合為開發者提供了強大的 AI 編程體驗,Cline 是一款集成於 VSCode 的 AI 編程助手,支援多種大型語言模型(LLM),如 OpenAI、Anthropic、Mistral 等,透過 OpenRouter,Cline 能夠統一調用這些模型,簡化了不同模型之間的切換和管理,使用者只需在 Cline 的設定中選擇 OpenRouter 作為 API 提供者,並輸入相應的 API 金鑰,即可開始使用多種模型進行開發。這種整合不僅提升了開發效率,還降低了使用多模型的技術門檻。
DeepSeek R1
OpenRouter 現在也支援 DeepSeek R1 模型,DeepSeek R1 是一款高性能的開源 AI 推理模型,具有強大的數學、編程和自然語言推理能力。透過 OpenRouter,開發者可以在 Cline 中輕鬆調用 DeepSeek R1 模型,享受其強大的推理能力。這進一步豐富了開發者的工具選擇,讓他們能夠根據項目需求選擇最適合的模型。
by rainchu | 11 月 28, 2024 | Agent, AI
Flowise 是一款開源的低代碼工具,一般人也可以輕易地使用,用於構建自定義的大語言模型(LLM)編排流程和 AI 代理。透過直觀的拖放介面,使用者可以輕鬆設計複雜的 AI 工作流程,無需深入的程式設計知識。
Flowise 的主要特點:
- 開源且免費:Flowise 完全開源,使用者可自由使用並進行二次開發,無需擔心授權問題。 GitHub
- 低代碼開發:透過簡單的拖放介面,使用者可以快速構建 LLM 應用,縮短開發週期。 Flowise AI Docs
- 多代理支援:Flowise 提供多代理系統,允許使用者設計可與外部工具和資料來源互動的代理,實現更高效的任務處理。 Flowise AI Docs
- 靈活的工作流程設計:使用者可以根據需求,自定義工作流程的邏輯和順序,滿足不同場景的應用需求。
Flowise 與其他 AI 代理工具的差異:
- 與 Langflow 的比較:Langflow 專注於自然語言處理,提供可視化介面來構建和調試語言處理流程。相比之下,Flowise 更強調 LLM 的編排和代理的靈活性,適用範圍更廣。
- 與 Dify 的比較:Dify 致力於簡化 AI 應用的部署,提供一站式解決方案。而 Flowise 更專注於工作流程的設計和代理的構建,提供更大的自定義空間。
- 與其他工具的比較:Flowise 的開源性和低代碼特性,使其在靈活性和可擴展性方面具有優勢,適合需要快速迭代和自定義需求的開發者。
參考資料
by rainchu | 11 月 22, 2024 | AI, 程式, 程式開發
LLMs Server 還是需要放在 Linux 環境中比較好,但開發階段常常用 Windows 在開發,多數人使用的 Shell export 就沒法使用
export OPENAI_API_KEY="sk-...".
Windows中設置LLM環境變數的幾種方法解決方法
使用命令列 CMD
set OPENAI_API_KEY=sk-...
使用 PowerShell
[Environment]::SetEnvironmentVariable("OPENAI_API_KEY", "sk-...", "User")
放在 Python 程式中
import os
# 設置環境變數
os.environ['OPENAI_API_KEY'] = 'sk-你的API密鑰'
# 之後就可以使用這個環境變數了
# 例如,當使用OpenAI的API時,就可以從環境變數中獲取API密鑰
api_key = os.environ['OPENAI_API_KEY']
print("API Key:", api_key)
檢查是否有正確設置
相關資料
近期留言