在opneclew出現之後,向來只要AI有新東西就去追的我,放棄了即時跟上。
過了一段時間,看到Hermes Agent出現,這也是openclew的同類產品,並且也能串接到codex上,這讓我很少用完的codex使用量,能將訂閱花費發揮得淋漓盡致。實際串起之後,不用多久,就能把每週額度用光光。
要能派上用場才是工具,要「持續」派上用場才是好工具。
我發現Hermes Agent的強大之處,透過對話一來一往,就能精煉技能(Skill),比起寫更好的提示詞,能夠記住並改善而變成技能,然後之後有需要之時再調用已經精煉好的技能,技能這能讓執行更穩定,而不會太多變數。
權限派與與能增刪查改檔案,對於產生或是整理內容有很大的幫助。適當限縮在特定區域去調整,就不會發生整個硬碟都刪除掉的悲劇。
不過Hermes Agent中有安控機制,又或者是codex有安控機制,讓這種影響嚴重的操作可以讓人介入,像是crul內網,就會被攔下。
出發點
訂閱了ChatGPT Plus,但是我有時用量多,有時少,感覺沒有很划算。
用了Codex寫程式,我一下就用完了,不過我維運的其實也不多,就也沒啥值得或是有機會寫出來問世的專案。
既然Hermes Agnet能串ChatGPT Plus,又不需要再額外付費,也有額度上限,就用用看吧。
環境
Docker部署的Hermes Agent,部署在NAS上方。
N8N作為通訊軟體聊天機器人的Webhook,再去串接Hermes agent的Gateway。(Hermes Agent Gateway就類似於一般對話式LLM的窗口,可供其他裝置連線使用,進行對話)
通訊軟體使用Telegram。
完成項目
- 臺鐵車次查詢
- 整理今天的對話紀錄,輸出到日記
- 縮網址(reurl)
- 文字分享(privatebin)
- 天氣查詢
- 寄信給我
- (Webhook)傳送訊息給我
- (Webhook)傳送檔案給我
- 在Notion新增文章
探索Agent
比起漫天飛的使用AI Agent就能充當人力、寫一大堆文章、收集一堆資訊等,總之就是非常高效率的產出。我認為那是非常充分瞭解與探索過後的成果,也有可能是$$$使用後的收穫。
想到我問我同事,有的說自己按一按APP查詢還比較快,沒有那麼懶。或者是說,回應速度很慢。其實最重要的並不是快速,而是能不能做到?結果是正不正確?關於效率速度我相信未來會改善,現階段AI Agent是不知倦怠且能同時多工的,只要能在幾分鐘以內回報,就已經夠用了。
以生活為出發點,我覺得查臺鐵車次很好用。這作為我經常使用的交通工具,也曾享用API去撈資料,申請被拒絕,算了,也不是特別必要,此外,使用過N8N的我,要讓N8N自主模擬瀏覽器操作,可能要有一波複雜操作。
想說AI Agent有瀏覽器工具,所以就試試看,發現Hermes Agent在第一次詢問時,就能夠答對臺鐵車次的回答!(後續我額外用gemini免費版詢問就答錯。
然後開始陸續去探索天氣查詢等。
Agent有時候會進行「檔案輸出」的操作,我用Docker掛載一個資料夾,專門放Agent輸出的檔案,並且在雲端同步,確保我在各裝置可以看到檔案輸出成果。
此時能讓Agent將對話紀錄整理出來,變成一個個.md檔案。網路上已經有一些技能能夠去整理分析這些內容並且找出關聯,這點我先擱置,我的Token與資料都還沒那麼多。
再調整寄信技能,然後讓Agent學習使用Webhook上傳檔案,N8N Webhook會把檔案再用Telegram傳送給我。
Agent要有排程任務的功能,也要有自主使用排程任務的功能,這樣才能自動自發輸出,不需要總是透過人才會驅動。
為了測試這功能,我讓Agent自主安排三次任務,每次任務都是傳送訊息給我並且內容不一。測試成功。
工作上,我會使用到縮網址與文字分享功能。
接下來使用縮網址,我沒有指定要使用哪家的縮網址服務,Agent自動決定,發現效果不好,再改,成功是成功但是要等十秒才會轉導,於是最後就指定reurl讓Agent使用。
技能優化
通常Agent背後的模型是經濟實惠的,也就是推論能力不是最強的。
技能優化是需要大量思考,於是我都會請Agent輸出Skill,可以是檔案或是訊息。
(※當然我知道Skill其實是位於Agent的某個資料夾中,目的是希望除了必要,不然我不要連入去查看。)
拿到Skill說明之後,再透過WebUI介面的ChatGPT 5.4 Think去思考、分析並優化,如果我看過覺得要補充什麼條件與限制,也會在此時添加上。
最常做的是效率改善,就是把步驟改執行方法(curl改成browser、由口述操作步驟變成明確的python code)。對於Token的消耗並不會明顯減少,但是可以穩定很多。
技能優化是將Agent變成自己樣子的過程,而且也很耗費時間,由Agent建立的Skill在一開始也有不小成功率,讓Agent可以更快速達到生產力的階段。
技能進階優化
有些技能可能沒有那麼順利就能執行,反覆試錯,消耗大量token。
如果使用Hermes Agent Response,就能看到過程,以下以臺鐵查詢為例。

雖然Agent幫忙完成了,到底怎麼完成?就能從這裡看,這邊是我的N8N工作流紀錄。
眼尖發現,其實Agent不是去臺鐵官網查詢,而是去其他網站查詢。
透過這個輸出的JSON裡面有完整步驟,從中看出反覆試錯的步驟,就能詢問ChatGPT 5.4 Think時一併附上,並只保留「有效」步驟。
於是我Skill就不查臺鐵官方網站。
這個反覆試錯的token總消耗1.5m,但精煉後的skill約在0.15m以下。
臺鐵車次查詢


縮網址
---
name: url-shortener
description: 使用瀏覽器工具前往 reurl 官網前台進行縮網址,成功時直接輸出短網址純文字。
version: 1.4.0
author: hermes
license: MIT
metadata:
hermes:
tags: [URL, Shortener, Link, Browser, reurl, Frontend]
prerequisites:
commands: []
environment_variables: []
---
# url-shortener
## 使用時機
- 使用者要求「縮網址」、「把這個連結變短」、「shorten URL」時。
- 需要可直接點擊、可分享的短連結。
- 不使用 Web API,也不依賴 `REURL_API_KEY`。
- 固定使用瀏覽器工具操作 reurl 官網前台完成縮網址。
## 輸入
- 一個完整網址(建議含 `http://` 或 `https://`)。
## 前提條件
- reurl 官網前台可正常連線與載入。
- 瀏覽器工具可操作網頁輸入框、按鈕與結果讀取。
- 本流程不保證 reurl 官網前台 UI 永久不變;若網站改版,需同步調整操作選擇器或步驟。
## 標準流程(Browser-first)
1. 先做基本驗證:網址需有 `scheme` 與 `netloc`。
2. 使用瀏覽器工具開啟 `https://reurl.cc/`。
3. 在首頁輸入框貼上使用者提供的長網址。
4. 觸發前台縮網址操作(例如點擊 shorten/送出按鈕)。
5. 等待頁面完成處理並顯示結果區塊。
6. 讀取頁面上產生的短網址文字。
7. 成功時直接輸出短網址純文字,不加前後綴、標籤、引號或 Markdown。
8. 若頁面出現錯誤訊息、未產生結果或網站無法連線,回傳 `縮網址失敗:<reason>`。
## 建議操作語意(供 Browser 工具使用)
1. 開啟首頁:
- `https://reurl.cc/`
2. 找到首頁縮網址輸入框。
3. 將長網址填入輸入框。
4. 點擊縮網址按鈕。
5. 讀取結果區塊中的短網址,例如 `Your short URL is` 下方欄位。
6. 僅輸出短網址字串。
## 回覆格式
- 成功:直接輸出 `<short_url>`
- 失敗:`縮網址失敗:<reason>`
## 輸出規則
- 不做任何強調與修飾。
- 不加前綴文字。
- 不加引號。
- 不加 Markdown。
- 僅輸出 reurl 前台產生的短網址原文。
## 注意事項
- reurl 官網首頁支援直接貼上網址進行縮網址。
- 若短網址超過 5 個月無人點擊,會被歸類為非活躍連結,之後可能被刪除。
- 若有登入 reurl,前台建立的短網址可在個人介面查看點擊統計;未登入時不應假設可追蹤個人統計。
- 本流程依賴前台頁面結構;若欄位名稱、按鈕位置或結果顯示方式改版,需更新 skill。
測試成功

Docker Compose截圖
由於目前不算穩定,為了避免被抄功課,然後抄到不能用的,所以我這邊不提供。
也許日後穩定了會再更新。


V0.10.0版本後從Container使用Hermes
從v0.9.0開始,需要先啟用虛擬環境,啟用後前方會出現(hermes)>
source /opt/hermes/.venv/bin/activate
過程
root@0a9ed0830cc5:/opt/hermes#
root@0a9ed0830cc5:/opt/hermes# source /opt/hermes/.venv/bin/activate
(hermes) root@0a9ed0830cc5:/opt/hermes#
(hermes) root@0a9ed0830cc5:/opt/hermes# hermes