(Photo by Jonny Gios on Unsplash)

✳️ tl;dr

新玩具 Claude for Chrome ¹ ²
很久之前填表排隊
昨天收到信
今天抽空玩
繼續寫作業
誒不對，應該找它陪我一起寫作業？！

看起來我是第二批 Max plan 排隊取得 Claude for Chrome research preview
連假嘗試了幾個任務給 Claude for Chrome 執行看看。
會先取得 URL 裡頭某個 domain 底下的授權，也可以一步一步按同意。

如果是自己閱讀文件步驟，自己操作，不熟悉（或是第一次）自己操作的情況下，大約 2~3 分鐘（邊看、邊操作、雙螢幕）可以完成任務。但需要動腦消化、以及在螢幕上找（或需要用 cmf+f 找到 action link 或 action button 前進）。
相比之下 Claude for Chrome 約莫需要 10~15 分鐘，都有完成任務（例如幫我設定 GTM、幫我翻找 Quickbooks 某個 Account 的歷史紀錄），因為需要一步一步操作、每一步都需要螢幕截圖、判讀畫面並決定下一步滑鼠該 click 在哪個位置、有些畫面需要輸入文字到文字框裡頭、連 click 文字方塊後都會在螢幕截圖做一次確認焦點有在文字方塊上（我好幾次都差點衝動想要幫它按，都先忍住，怕打擾流程）。

我目前搭配 Edge 使用（因為需要垂直分頁和 multiple isolated profiles），好像有遇到 Claude for Chrome 將我原本 group 的名稱改掉、原本 tab group 中其他 tab 擅自關閉沒問過我的情況、也有 Claude for Chrome 自己在 tab group 中開啟了新的 tab (e.g. GA4) 自己開始進行操作，但是畫面上我還停留在 GTM 的 tab 之類情事。
以體驗來說，當然現階段是沒有效率的。
但以結果來說，Claude for Chrome 有完成任務，這代表拆解步驟的思路和知識夠用，就等新世代的模型或是未來可能的地端 infra 出來，減少往返的時間，效率就會直接拉上來。

你也在思考如何導入 AI Agent 或 Agentic Workflow 到團隊或工作流程中嗎？歡迎聊聊。

除錯 Kiro 與 zsh 的 CLI Session 互動問題：無法取得後續指令回傳值

Published: 2025-09-19

by Ernest Chiang

問題解決

問題描述

最近在使用 Kiro (Agentic IDE) 玩 multiple-role agents 和 hooks 的時候，遇到了一個相當困擾的問題：在同一個 CLI session 中，Kiro 拿不到第二個指令的回傳值。

問題場景是這樣的：

當我請 Kiro 執行第一個指令時，一切正常，指令可以執行且能正確取得輸出結果。
但是接下來在同一個 shell session 中執行第二個指令時，Kiro 就無法取得該指令的回傳值了。
所以 Kiro 就停在那邊等回傳，vibe 不起來。

這個問題對我的工作流程造成了很大的影響：

頻繁的 session 重啟：
- 每次執行完第一個指令後，我都必須手動關閉 CLI session，需要我（人類）這麼頻繁地介入，那這不是我想要的 AI agent。
手動複製輸出：
- 或者我需要手動複製第二個指令的回傳值給 Kiro Chat。
工作效率降低：
- 原本流暢的 agentic coding 工作流程變得斷斷續續，放鬆的時候是可以放鬆，但我對於工作任務，會想要提升效率。

問題場景影片紀錄（影片中的某些關鍵資訊已經被重新產生，請勿驚慌）：

解決 LM Studio gpt-oss 模型輸出參雜「推理內容」之問題

Published: 2025-08-12

by Ernest Chiang

隨手記 | AI

(Photo by Felix Eka Putra Kuntjoro on Unsplash)

起因

剛才想到將 MacWhisper Dictation 的後處理，從原本的 LM Studio google/gemma-3-12b 改成使用 openai/gpt-oss-20b，但一直遇到 gpt-oss 模型會將思考過程也回傳成為 dictation 輸出結果。有問題的輸出結果：

We need to correct punctuation: use full-width. 
Input: "嗨,我們明天去兒童樂園玩好嗎?" 
We replace comma with ，, question mark with ？. 
Also add period at end? 
The sentence ends with question mark already. 
So output: "嗨，我們明天去兒童樂園玩好嗎？"
嗨，我們明天去兒童樂園玩好嗎？

AWS 重塑 AI 基礎設施：S3 Vectors 如何改變向量搜尋遊戲規則

Published: 2025-07-29

by Ernest Chiang

隨手記 | AI

(圖說：將世界重新使用向量拆解與整合，我們也許得以重新認識新的世界。圖片來源：Photo by James Wainscoat on Unsplash)

✳️ tl;dr 給技術管理者

Amazon S3 Vectors 將原生向量搜尋功能直接整合進 S3 物件儲存，目標是簡化架構並降低成本。¹
對於 RAG、語意搜尋等 AI 應用，官方宣稱最高可節省 90% 的向量儲存與查詢成本。
這意味著我們不再需要為某些 AI 場景維護一個獨立、昂貴的向量資料庫，大幅降低了維護營運複雜度 (TCO)。²
S3 Vectors 提供 subsecond 級查詢效能，適用於對延遲要求非即時 (non-real-time) 的大規模應用。³

核心優勢：實現了向量資料的「存算分離 (Storage and Compute Separation)」，將長期儲存的成本效益發揮到極致。⁴
透過與 Amazon OpenSearch 的整合，可建立「冷熱」資料分層策略，兼顧成本與高效能查詢需求。⁵
可與 Amazon Bedrock Knowledge Bases 的無縫整合，讓建立和擴展 RAG 應用的過程變得前所未有的簡單。⁶
S3 Vectors 的出現，可能迫使現有向量資料庫廠商 (如 Pinecone) 重新思考其市場定位與定價策略。

對於技術團隊，現在需要重新評估現有的 AI 技術堆疊，判斷哪些工作負載可以遷移到 S3 Vectors 以實現成本優化。
該功能引入了新的 Vector Bucket，讓向量管理像管理一般 S3 物件一樣簡單。
推測：未來 S3 Vectors 可能會進一步增強其查詢能力，例如支援混合搜尋，以適應更複雜的場景。

✳️ tl;dr 給工程師與開發者

Amazon S3 現在原生支援向量儲存與搜尋，新功能 S3 Vectors。¹
可以直接在 S3 建立 Vector Bucket 和 Vector Index，然後用 API 存入和查詢 embeddings。
對於許多 RAG 應用，可以省去部署和管理一個獨立 Vector DB 的步驟。⁷
API 支援 k-NN 相似性搜尋，並提供 subsecond 級的回應時間，同時支援 Cosine、Euclidean 等距離度量。

開發亮點：查詢時可以使用 metadata filter，例如 (category = 'ernest-pkm' AND year > 2023)，非常實用。³
與 Amazon Bedrock Knowledge Bases 無縫整合，設定好 S3 data source 後，Bedrock 會自動幫你處理 embedding 和同步。⁶
如果你的應用需要更低的延遲或更複雜的搜尋 (如 hybrid search) ，可以將熱向量匯出到 Amazon OpenSearch Service。⁵

對於已經在使用 AWS 的開發者，學習曲線很低，基本上就是多學幾個 S3 API call。
整個服務是 Serverless 的，意味著你不用煩惱 scaling、provisioning 和 aRPU 這些東西，專心處理客戶應用場景。
可以更經濟地為你的 AI Agent 建立一個巨大的長期記憶庫，所有互動紀錄或知識，都能被向量化並儲存在 S3。
對於儲存在 S3 Data Lake ⁴ 中的海量文件或圖片，現在可以直接就地建立索引並進行語意搜尋，無需 ETL 到另一個系統。（Well… 如果你的海量檔案現在還沒放在 S3… 那就呼叫幾個 API calls 吧 XD）

✳️ tl;dr 給行銷人與產品人

想像一下，你公司所有的文件、客服對話、產品圖片、甚至影片，都能用自然語言進行語意搜尋。Amazon S3 Vectors 正在讓這件事變得更便宜、更簡單。¹
過去，只有資源雄厚的公司才能負擔得起建立大規模向量搜尋系統。現在，AWS 將這項能力直接內建到 S3，大幅降低了技術門檻和成本。
應用場景：媒體公司可以快速在 PB 級的影片庫中找到相關片段；醫療機構可以在數百萬張醫學影像中識別相似病例。
對於電商，可以用它來建立更精準的語意搜尋引擎，理解用戶「想要」什麼，而不僅僅是他們「輸入」了什麼。

商業價值：這不僅僅是技術升級，更是释放企業內部「非結構化資料」價值的一把鑰匙。⁴
S3 Vectors 讓 RAG (檢索增強生成) 技術變得更加普及，這意味著你的聊天機器人或 AI 客服可以提供相對準確、相對有根據的回答。⁶
市場趨勢：向量搜尋正在從一個利基技術，轉變為雲端儲存的基礎設施的一部分。

這項創新將加速 AI 在各行各業的落地，因為它解決了最基礎的「資料準備」和「知識儲存」的成本問題。
對產品經理來說，這意味著在規劃 AI 功能時，可以更大膽地構思需要海量知識庫的應用。（將 S3 當作萬能鑰匙，電影 Matrix 裡面的 keymaker。）
S3 Vectors 與 Amazon Bedrock Knowledge Bases 的整合，提供了一個一站式的知識庫解決方案。⁶
推測：未來將會出現更多基於 S3 Vectors 的第三方 SaaS 應用，專注於特定行業的知識管理和語意搜尋。此推測基於 AWS 生態系中 ISV 的發展模式。²
企業現在應該思考：我有哪些沉睡的資料可以被「向量化」，從而創造新的商業價值？先不要顧慮資料格式，你覺得是「資料」就試著先用用看，先從小資料起手。

Anthropic 內部如何使用 Claude Code：從基礎設施到產品到資安到法務的全面代理式程式開發

Published: 2025-07-28

by Ernest Chiang

隨手記 | AI | Software Development

(圖說：Claude Code 正在進行代理式程式開發 (agentic coding)。圖片來源：Anthropic。)

✳️ tl;dr

Anthropic 最近分享了他們內部團隊使用 Claude Code ¹ 的真實案例 ²，讓我看到了從單純的程式碼自動完成，進化到「代理式軟體開發生命週期 (agentic SDLC)」的大致畫面。
Data Infrastructure 團隊讓 Claude Code 用 OCR 看錯誤截圖，診斷出 Kubernetes IP 耗盡，並提供修復指令
非技術背景的財務人員只要用自然語言描述需求，Claude Code 就能自動產生查詢並輸出 Excel 報表
Product Development 團隊在 auto-accept mode 下讓 Claude Code 自主寫出 70% 的 Vim 模式程式碼
Security Engineering 透過 Claude Code 快速解析 Terraform plan，完成安全審核並減少開發瓶頸
Inference 團隊依賴 Claude Code 生成涵蓋 edge case 的單元測試，研究開發時間降低 80%
DS/ML 團隊用 Claude Code 建立 5,000 行 TypeScript 儀表板 (dashboard)，從一次性分析轉向長期可重用工具

MCP（Model Context Protocol） ³ 讓 Claude 在安全環境中存取精準的組態與資料
Claude Code 借助「自我驗證迴圈」：撰寫程式 → 執行測試/CI → 自動修正錯誤，推進代理式 SDLC (agentic SDLC)
第三代 AI coding 工具正整合到端到端開發流程，從需求到部署全面自動化
Anthropic 透過 RLAIF 與 Constitutional AI 訓練模式，讓 Claude 在程式碼生成中展現業界領先的自我修正能力

你有想過 AI coding 工具在你的組織內部或對你自己的工作流程到底能做到什麼程度嗎？
今年五月我在 AWS Summit Hong Kong 2025 分享「重塑程式設計: AI 如何轉變企業的程式開發方式」，從 SDLC 開始拆解，大家有興趣也可以搭配投影片一起閱讀。

⁴⁵⁶⁷⁸

美國 AI 行動計劃 (2025-07)：以三大支柱策略重塑美國 AI 全球主導地位

Published: 2025-07-26

by Ernest Chiang

隨手記 | AI Policy

(圖說：水文調查儲存區。每個管子都包含一份登錄的水文調查資料。圖片來源：Photo by NOAA on Unsplash。)

✳️ tl;dr

美國政府 2025-07 發布 America's AI Action Plan，目標重塑美國 AI 全球主導地位
三大戰略支柱：加速 AI 創新、建設 AI 基礎設施、領導國際 AI 外交與安全
撤銷前任政府 AI 執行命令 14110，移除「繁文縟節和過度監管」

強調保護言論自由和美國價值觀，確保 AI 系統客觀追求真理
鼓勵開源和開放權重 AI 模型發展，促進創新與商業採用
建立簡化的資料中心、半導體製造和能源基礎設施許可程序，實現「Build, Baby, Build」願景

透過 CHIPS 計劃辦公室重振美國半導體製造業
建設軍用高安全性資料中心，抵禦國家級攻擊威脅
向夥伴出口美國 AI 技術的完整技術堆疊

建立監管沙盒和 AI 卓越中心，讓研究機構、新創和企業能快速部署測試 AI 工具
建立 AI 勞動力研究中心，持續評估 AI 對勞動市場的影響並提供政策建議
投資自動化雲端實驗室，涵蓋工程、材料科學、化學、生物學等多個科學領域

附上全文美國人工智慧行動計畫（中文翻譯好讀版）¹

²³¹⁴⁵⁶⁷

Kiro: AWS 代理式 IDE 告別盲盒式 Vibe Coding

Published: 2025-07-16

by Ernest Chiang

隨手記 | Software Development

(圖說：正在安裝 Kiro。圖片來源：Ernest’s MBP。)

✳️ tl;dr

覺得 AI | Vibe coding 寫程式像開盲盒嗎？
Kiro ¹ 用 Specs 幫你拆盒前就看說明書
一句提示 → 自動展開使用者故事，還附 EARS 需求標準

Ernest 嘗試拆解 Kiro 的四層架構（意圖層、知識層、執行層、監督層）²
Kiro AI = Kiro Agentic IDE

Tasks 列表直接串單元/整合測試，減少忘記寫測試的窘境
Hooks 讓大家發揮想像力，事件驅動的自動化，自己的自動化自己接
Steering 專案指導原則，確保一致性，讓 Kiro 遵循組織文化，串接知識管理
支援 RWD 與 A11y，前端也有被照顧

預覽期間免費，支援 Mac/Win/Linux （快蹭！
Kiro 基於 Code OSS，與 VS Code 相容
VS Code 使用者 (應) 可無痛搬家，有些外掛在 Kiro 還沒見到
Kiro + WSL2 解法 ²

延伸玩法: Kiro + dev container 做隔離
延伸玩法: Kiro + Remote SSH + EC2 (CloudShell?) within VPC

³⁴⁵

Cloudflare 推出基於 Firecracker 的容器服務

Published: 2025-06-25

by Ernest Chiang

隨手記

(圖說：巴西第一大港，Port of Santos，提供裝卸貨櫃服務。圖片來源: Photo by sergio souza on Unsplash。)

✳️ tl;dr

Cloudflare Containers ¹ 公開 Beta 上線，付費用戶立即可用，與 Workers 完整整合。
Region: Earth 全地球之全域佈署，數秒啟動容器，開發者無須自行選區 (5)。
透過 Worker→Container 綁定，可依 ID 動態生成隔離實例，適合多租戶平台。
dev/basic/standard 三種 Instance Type 覆蓋 256 MiB, 1 GiB, 4 GiB 記憶體需求。
10 ms 計費粒度，CPU、記憶體、磁碟分別度量，並附免費額度。
內建 Metrics/Logs 保留七天，可外送 LogSink，降低 Observability 整合成本。
Upcoming: autoscale = true 啟用全球自動擴容與延遲感知路由。

Cloudflare Containers 底層是 AWS 開發且開源的 Firecracker microVM ² 以 KVM 提供隔離，降低多租戶側通道風險，並保持啟動速度與資源運用效率。
Firecracker microVM < 125 ms 冷啟、< 5 MiB 記憶體，兼顧安全與密度。
Ernest Chiang 於 COSCUP 2020 Firecracker 工作坊，示範 ³ 90 秒跑起 4,000 microVM on i3.metal。

⁴⁵⁶⁷⁸⁹¹⁰

互通、整合、迭代：傳統產業產品與技術整合之十年生存指南

Published: 2025-06-15

by Ernest Chiang

脈絡拆解 | 土炮轉型

(圖說：Ernest at Taiwan Product Conference 2025。圖片來源：Bob Chao。)

一路看著台灣從技術社群發展出技術年會，也隨著產業轉型及跨領域整合的複雜度增加，陸續在地產生了越來越多的產品相關機會，涵蓋產品營運 (product operation)、產品行銷 (product marketing)、產品設計 (product design)、產品管理 (product management)、產品開發 (product development) 等各方各面，相當有機蓬勃。

但看似綠意盎然的背後，到底是有機溫室？還是雜草叢生？在混沌中前行的我們，沒人知道答案。不知道答案，代表我們還能做些什麼，代表我們還能出門探索，代表我們還能回家實驗，代表我們還能嘗試迭代。這天炎熱的週末，我們一群圍繞產品生態的人們，一起在第一次舉辦的台灣軟體產品年會 2025 裡頭，嘗試著做點什麼。

年會心得，另篇整理。

本篇會分兩個階段，一會先釋出投影片，然後二會釋出 Q&A 補充說明。歡迎大家使用投影片最後一頁的表格，給予我各種角度的回饋、或問問題交流。期待彼此下次的嘗試。