Select Page
AI Agent 實戰:用 Chrome 自動操作 + OpenCLI 控制瀏覽器與 Cursor 開發環境

AI Agent 實戰:用 Chrome 自動操作 + OpenCLI 控制瀏覽器與 Cursor 開發環境

🧠 什麼是 OpenCLI?

OpenCLI 是一個結合 CLI(命令列)+AI Agent+瀏覽器控制能力 的工具。

它讓你可以:

  • 用 AI 操作你的瀏覽器(真的操作你的 Chrome)
  • 控制本地開發工具(例如 Cursor)
  • 串接自訂 Plugin(抓資料、爬網站、整合 API)

👉 簡單來說,它是「本地版 AI Agent 作業系統」

🧠 核心組件說明

1️⃣ Runtime(最重要)

OpenCLI 本體負責:

  • 任務調度
  • 指令解析
  • Plugin 呼叫
  • 狀態管理

👉 類似:

  • LangChain Agent Executor
  • 或 AutoGPT 的 runtime

2️⃣ Plugin Adapter(YAML)

👉 這是 OpenCLI 最強的地方之一

你可以:

  • 把網站轉成 CLI
  • 定義資料抓取規則
  • 建立 AI 工具鏈

📌 重點:

👉 不是寫程式,而是寫 YAML


3️⃣ Browser Bridge(關鍵黑科技)

OpenCLI 不是用 Selenium

👉 而是:

  • Playwright MCP bridge
  • Chrome DevTools Protocol(CDP)

👉 直接控制「你正在用的瀏覽器」


4️⃣ Channel / Gateway

負責:

  • AI ↔ 工具 溝通
  • 多工具整合
  • 跨平台控制

⚡ 核心特色

1️⃣ 直接使用你的 Chrome(含登入狀態)

OpenCLI 最大的優勢之一:

👉 直接控制你正在使用的 Chrome

這代表:

  • ✅ 可以使用已登入的帳號(Google、FB、銀行等)
  • ✅ 可以存取 cookies / session
  • ✅ 不需要重新登入

背後技術是:

👉 Chrome DevTools Protocol(CDP) ( opencli chrome外掛)

這比 Selenium 強的地方在於:

  • 更快
  • 更貼近真實使用者
  • 可操作現有視窗

2️⃣ 控制 Cursor 寫程式(AI 自動開發)

Cursor 是目前非常強的 AI 編輯器,而 OpenCLI 可以直接操控它 👇

🛠️ 設定方式

Step 1:啟動 Cursor Debug 模式

cursor --remote-debugging-port=9226

⚠️ 注意:

  • 視窗 不能關閉
  • 這會開啟 CDP 讓 OpenCLI 控制

Step 2:設定環境變數

mac or linux
export OPENCLI_CDP_ENDPOINT="http://127.0.0.1:9226"

windows 版本
set OPENCLI_CDP_ENDPOINT=http://127.0.0.1:9226

Step 3:測試是否成功

opencli cursor model

Step 4:讓 AI 寫程式

opencli cursor send "新增一個 readme.txt"

👉 OpenCLI 會直接:

  • 操控 Cursor
  • 建立檔案
  • 寫入內容

🔥 實際應用場景

  • 自動生成專案 README
  • 批次修改程式碼
  • 自動補齊文件
  • AI Refactor 專案

👉 等於你有一個「真的會操作 IDE 的 AI 工程師」


3️⃣ 自訂 Plugin Adapter(YAML 抓網站)

OpenCLI 支援自訂 Plugin,透過 YAML 定義資料來源 👇

🧩 範例概念

name: fetch_news
description: 抓取新聞網站資料request:
url: https://example.com/news
method: GETparse:
type: html
selectors:
title: h1.title
content: div.article

👉 你可以做到:

  • 抓網站資料
  • 做 ETL pipeline
  • 整合 API
  • 建立 AI 工具鏈

📦 安裝 OpenCLI

官方資源:

  • GitHub:GitHub 上的 opencli repo
  • npm 套件:@jackwener/opencli
npm install -g @jackwener/opencli

安裝 OpenCLI Chorm extension

https://github.com/jackwener/opencli/releases

下載 opencli-extension.zip

解壓縮後放到 chrome 的擴充套件中

檢查安裝狀態

opencli doctor

看到上面的資訊就代表成功

可以測試用自己的帳號去查 B 站的最熱門影片了

opencli bilibili hot –limit 5


⚡ 三大核心能力


🔥 1. 把任何網站變 CLI

👉 這是 OpenCLI 最核心功能

例如:

opencli hackernews top
opencli twitter mentions
opencli gmail read

背後:

  • YAML 定義
  • AI 自動操作頁面

🔥 2. 直接用你 Chrome(含登入)

👉 這點非常關鍵(你前面有用到)

OpenCLI:

  • 不模擬登入
  • 不存 cookie
  • 不重建 session

👉 直接用你 Chrome 裡的登入狀態


🔥 這代表什麼?

你可以:

  • 操作 Gmail
  • 操作 FB / IG
  • 操作內部系統(SSO)

👉 完全不像傳統爬蟲


🔥 3. 控制本地工具(Cursor / VSCode)

👉 這才是 AI Agent 真正關鍵

OpenCLI 可以:

  • 控制 Cursor
  • 控制 CLI
  • 操作本機檔案

👉 等於:

AI 可以「真的幫你寫程式」

🧪 真實應用場景


📌 1. 自動收集資訊

👉 每天做:

  • 抓新聞
  • 抓 Reddit
  • 抓競品資料

📌 2. 自動寫程式

👉 例如:

opencli cursor send "建立 flask API"

📌 3. 自動操作後台

👉 例如:

  • WordPress 發文
  • Cloud Console 操作
  • CRM 系統

📌 4. 自動化工作流

👉 一句話:

👉「抓資料 → 分析 → 寫報告 → 存檔」

📱 延伸:手機 + Termux + OpenCLI

Termux + Android 手機也可以跑:

👉 搭配:

  • OpenClaw
  • OpenCLI

可以做到:

  • 行動 AI Agent
  • 手機自動操作
  • 遠端開發

⚠️ 注意事項

🔒 安全性

因為它可以:

  • 操控你的 Chrome
  • 使用你的登入狀態

👉 建議:

  • 不要開放外網
  • 使用本機環境
  • 控制權限

⚙️ 穩定性

  • CDP port 被占用會失敗
  • Cursor 視窗關閉會斷線
  • Plugin YAML 要寫正確

🎯 總結

OpenCLI 的本質不是工具,而是:👉 AI 的「手」

👉 AI 操作你電腦的入口

它讓你可以:

  • 🧠 用 AI 控制瀏覽器
  • 💻 用 AI 操作 IDE(Cursor)
  • 🔗 串接任何資料來源(Plugin)

🧠 AI 能力分層

層級能力
LLM思考
LangChain決策
OpenCLI行動

👉 沒有 OpenCLI:

👉 AI 只能「講」

👉 有 OpenCLI:

👉 AI 才能「做」

參考資訊

https://opencli.info/docs

不用電腦!用舊手機安裝 OpenClaw 打造遠端操控系統

不用電腦!用舊手機安裝 OpenClaw 打造遠端操控系統

如果你想使用 OpenClaw 這類 AI Agent 工具,大多需要一台電腦或伺服器來執行。

但現在,你甚至可以用「一支舊 Android 手機」來打造一個 隨身遠端 AI 控制節點

👉 沒錯,舊手機不再只是備用機,而是可以變成:

  • AI 控制終端
  • 遠端操作工具
  • 自動化任務節點

這篇文章會帶你一步步完成:

📌 在 Android 手機上透過 Termux 安裝 OpenClaw,並實現遠端操控能力


🎯 為什麼要用「舊 Android 手機 + OpenClaw」?

📸 使用場景示意

https://miro.medium.com/1%2AKAL2RMpqpGh-AmqsMPf2hA.jpeg

4

✅ 核心優勢

1️⃣ 硬體要求低(舊手機就能跑)

  • 不需要高效能 CPU / GPU
  • 2GB~4GB RAM 就能運作
  • 廢棄手機再利用

2️⃣ 可直接使用手機硬體能力

👉 不同於傳統 server,你可以用:

  • 📷 相機(影像輸入)
  • 🎤 麥克風(語音控制)
  • 📶 行動網路(隨時在線)

3️⃣ 隨身攜帶的 AI 控制中心

  • SSH 控制 GCP / VM
  • 呼叫 AI Agent workflow
  • 當 DevOps 控制台

4️⃣ 比舊電腦更省電、更穩定

  • 手機天生低功耗
  • 可長時間掛機

🧠 系統架構

Android 手機 -> Termux (Linux 環境) -> OpenClaw Agent -> Local AI / Server / GCP

👉 手機只是「控制層」,重運算仍在雲端


以下安裝方法 2 選 1 ,薪水推薦用 APK

🛠️ 安裝流程(APK)

🔗 官方下載

👉 來源:
https://github.com/mithun50/openclaw-termux/releases/


📱 Step 1:下載 APK

在 Releases 頁面找:

👉 通常名稱會像:

openclaw-android.apk

app-release.apk

下載到手機


🔐 Step 2:允許安裝未知來源

Android 需要開:

👉 設定 → 安全性
👉 允許「未知來源」


📲 Step 3:安裝 APK

直接點 APK:

👉 完成後會出現 App(OpenClaw)


⚙️ Step 4:準備 Backend(重點)

👉 APK 本身不會跑 AI

你需要一個 Gateway:

方法 A(最推薦)

👉 手機本機跑:

  • Termux
  • Ubuntu
  • OpenClaw

👉 流程:

APK → localhost:port

方法 B(更穩定)

👉 連 GCP:

APK → GCP VM(OpenClaw)

🔗 Step 5:連線 OpenClaw Gateway

打開 APK → 設定連線:

方式 1:自動配對

  • Setup Code

方式 2:手動輸入

Host: 你的IP
Port: 3000 / 8080(依你設定)
Token: Gateway Token

👉 官方說明支援:

  • manual host/port
  • token / TLS

🧪 Step 6:測試

成功後你可以:

  • 發送指令
  • 控制 AI agent
  • 看執行結果

🛠️ 安裝流程(完整實戰)

📱 Step 1:安裝 Termux

👉 使用:
Termux

⚠️ 注意:

  • 請從 F-Droid 安裝(不要用 Play 商店版本)

🔄 Step 2:更新環境

pkg update && pkg upgrade -y
pkg install git wget curl -y

📦 Step 3:安裝 OpenClaw

👉 官方 repo:
openclaw-termux

git clone https://github.com/mithun50/openclaw-termux.git
cd openclaw-termux
bash install.sh

⚙️ Step 4:啟動服務

bash start.sh

啟動後你會看到:

  • API endpoint
  • 控制介面 port

🌐 遠端操控方式

方法一:瀏覽器控制

👉 手機或電腦打開:

http://手機IP:PORT

方法二:API / AI Agent 控制

👉 你可以串:

  • LangChain
  • Local AI Agent
  • webhook

方法三:SSH 進手機

pkg install openssh
sshd

⚡ 進階玩法

🔥 架構升級

👉 也可以這樣玩:

手機(OpenClaw)-> 控制指令 -> GCP VM(AI模型)-> 回傳結果


🤖 實際應用

  • 📊 自動抓資料 → 分析 → 回報
  • 🧠 控制 Ollama AI 模型
  • 🏠 智慧家居控制中心
  • 📡 遠端監控節點

⚠️ 注意事項(實戰會踩雷)

❌ Android 限制

  • 背景程序可能被殺掉
    👉 建議:
    • 關閉省電模式
    • 設定常駐

❌ Port 問題

👉 常見:

  • 8080 被占用
lsof -i :8080

❌ 效能限制

👉 不適合:

  • 重 AI 推論
  • Docker

❌ 手機連不到內網

👉 用:

  • Tailscale
  • ZeroTier

❌ 以為 APK = 完整系統

👉 錯

👉 APK 只是 UI


❌ Port 連不到

👉 要開:

ufw allow 3000

❌ Gateway 沒啟動

openclaw gateway

🧠 舊手機 vs 舊電腦

項目舊手機舊電腦
功耗⭐⭐⭐⭐
攜帶性⭐⭐⭐⭐
穩定性⭐⭐⭐⭐⭐
擴充性⭐⭐⭐⭐

👉 結論:

📌 手機適合「控制節點」,電腦適合「運算節點」

參考資訊

官方網站

https://github.com/mithun50/openclaw-termux

下載最新版本

https://github.com/mithun50/openclaw-termux/releases