Amazon Bedrock AgentCore 正式上線 (GA):為 AI Agents 量產環境打造企業級基礎設施

Post Title Image (圖說:早起在咖啡店邊吃可頌、邊喝咖啡、邊聊 AI Agent 與人生。拍攝於 Anchorhead Coffee西雅圖。圖片來源:Ernest。)

✳️ tl;dr

  • 今年八月底出差,原本以為是去北美抓住夏天的尾巴,沒想到路過灣區和西雅圖,大家都在提 AI Agent、Agentic Workflow
  • 有幸能在 AWS New York Summit 之後試玩一波 Amazon Bedrock AgentCore
  • 好在幾年前曾在 COSCUP 分享過 Firecracker microVM,知道這玩意兒的勇猛與隔離的安全性
  • 當年開了一台 i3.metal EC2 Bare metal 機器起來玩,90 秒以內可以用 Firecracker 跑起 4,000 個 microVM 1,並且用視覺化的方式來呈現整個喚起的過程,啟動速度較不擔心(當然還是要看場景(但我傾向不需要提醒 AI Agent 欲速則不達 :p
  • 你看連隔壁棚 Cloudflare Container 都來借用 Firecracker 開源專案來封裝服務 2

  • 今天 (2025-10-13) AWS 正式發布 Amazon Bedrock AgentCore,這是一個企業級 agentic 平台,旨在幫助組織將 AI agents 從試驗階段推進到生產環境 3
  • AgentCore SDK 已被下載超過 100 萬次,早期客戶包括 Clearwater Analytics、EricssonSony、Thomson Reuters 等跨產業企業
  • 採用 microVM 技術提供企業級安全隔離,每個 agent 會話運行在獨立的虛擬機實例中,防止數據洩漏和跨租戶攻擊

  • AgentCore 提供可組合的服務,支援多種框架包括 CrewAI、Google ADK、LangGraph、LlamaIndex、OpenAI Agents SDK、Strands Agents
  • 可使用 Amazon Bedrock 上的模型,也可使用外部模型如 OpenAI 和 Gemini
  • AgentCore Code Interpreter 讓 agents 在隔離環境中安全生成和執行代碼
  • AgentCore Browser 允許 agents 大規模與網頁應用程式互動
  • AgentCore Gateway 將現有 APIs 和 AWS Lambda 函數轉換為 agent 相容工具
  • Gateway 連接到現有的 MCP servers 並整合第三方工具如 Slack、Jira、Asana、Zendesk
  • AgentCore Identity 讓 agents 使用 OAuth 標準安全地存取和操作各種工具
  • AgentCore Memory 幫助建立具備上下文感知能力的 agents,無需管理複雜的記憶體基礎設施

  • 透過 microVM 技術提供業界領先的安全性,每個 agent 會話都有獨立的隔離運算環境
  • AgentCore 的 MCP server 可與 Kiro 或 Cursor AI 等 IDE 整合
  • 提供業界領先的八小時運行時間,支援長時間運行的任務

  • 既然 GA (正式釋出)了,就不用等排隊申請了,直接開起來玩玩看吧

  • 落地 AI Agent 需要搭配現有工作流程、需要磨合、需要對其組織目標
  • 需要 Process Automation 白板的朋友,可延伸閱讀 4

  • 是說… 後來九月回程反而在東京被夏天的尾巴掃到,整個熱爆… 好佩服日本大叔們整套西裝上身 Orz…

Read More

The Westin Building Exchange

Post Title Image (圖說:當年參訪 Amazon Spheres 的時候,剛好有拍到 The Westin Building,照片中的最左邊那一棟建築物。圖片來源:Ernest。)

✳️ tl;dr

  • 之前在西雅圖市區路過開會、或探訪咖啡與美食,走來晃去一直經過它,沒想到大有來頭。
  • 威斯汀大廈交換中心是位於華盛頓州西雅圖市中心的大型電信樞紐設施。 1
  • 該建築建於 1981 年(跟我差不多年代 XDD),
  • 最初名為威斯汀大廈,是當時總部位於西雅圖的威斯汀酒店集團的辦公室。
  • 它也是西雅圖網際網路交換中心(SIX) 和 Pacific Northwest Gigapop Pacific Wave Exchange 的所在地。

  • 自 2019 年或更早起,該建築資料中心產生的熱量透過管道輸送到亞馬遜的多普勒大樓 (Doppler) ,用於隔壁多普勒大樓和其他幾棟亞馬遜大樓的暖氣供應。
  • 亞馬遜估計,在該系統 25 年的預期使用壽命內,它將節省 8,000 萬千瓦時的電力,相當於 6,500 萬磅煤炭。

  • 起因是看到 The Verge 報導 Microsoft 打算將 GitHub 整個搬移進 Azure,而好奇在被收購之前的基礎設施情形。2
  • GitHub 在 2018 年被 Microsoft 收購。所以回頭查詢 2017 年的情況。
  • GitHub blog 曾描述:“Those facilities don’t store customer data, rather they’re focused on internet and backbone connectivity as well as direct connect and private network interfaces to Amazon Web Services.” 3
  • GitHub 現在 (2025) 正進行(史上?)最大規模的基礎設施遷移計劃,計劃在 24 個月內將整個平台從自有資料中心遷移到 Azure。
  • 這次遷移的核心驅動力是 AI 工作負載的爆炸性成長:GitHub Copilot 每天產生數百萬次程式碼建議,消耗大量運算容量,現有資料中心已達到物理擴展極限。(對外總是會有一套說法,聽聽看看參考就好)(有一種冷,叫做阿罵覺得你冷。有一種移,叫做____就請你移?!)
  • 遷移策略:大部分工作需在 12 個月內完成(因為需要新舊系統並行運行至少 6 個月),GitHub 已要求團隊延遲功能開發,優先處理基礎設施遷移。

  • GitHub 在 2024 年經歷了 119 起事件,包括 26 起主要中斷,平均修復時間約 106 分鐘。4
  • 好奇搬家之後的表現。
  • 有在使用 GitHub 的各位技術管理者們,好奇各位怎麼看?會觸發做些準備嗎?

5 6

Read More

從創客運動到工業 AI:Qualcomm 併購 Arduino 如何重塑嵌入式運算

Post Title Image (圖片來源:Arduino UNO Q。)

✳️ tl;dr

  • Qualcomm 收購 Arduino,這是繼 Edge ImpulseFoundries.io 之後的第三次關鍵收購,展現 Qualcomm 想建立 fullstack edge AI 平台的決心(或佈局?)1 2
  • Arduino 擁有超過 3,300 萬活躍社群,是 Raspberry Pi 等競爭對手沒有的開發者基礎。

  • 新推出的 Arduino UNO Q 採用「雙腦架構」:Qualcomm Dragonwing QRB2210 四核處理器(Quad-core Arm Cortex-A53 @ 2GHz) 搭配 STM32U585 即時微控制器(Arm Cortex-M33 @ 160MHz),同時處理高性能運算和即時控制。
  • 無線通訊能力 = dual-band Wi-Fi 5 + Bluetooth 5.1
  • Edge Impulse 的整合提供 AutoML 能力,讓非 AI 專家也能部署機器學習模型。
  • TinyML 市場預計到 2030 年將達到 2000 億美元,Qualcomm 正在搶佔這個高增長賽道?!
  • UNO Q 售價 44 美元(2GB RAM/16GB eMMC)至 59 美元(4GB/32GB),與 Raspberry Pi 5 價格對標約便宜 7 美元。(但 RPi 5 現在有 8GB RAM, 16GB RAM 的選項,值得後續追蹤觀察。)

  • 軟體採用 GPL 3.0 或 Mozilla Public License,硬體設計採用 CC BY-SA 4.0,你可以合法製作和銷售衍生版本

3 4 5

Read More

採用 Bottlerocket 的 ECS Managed Instances 為簡化容器管理帶來企業級安全性

Post Title Image (Photo by Rikin Katyal on Unsplash)

✳️ tl;dr

  • AWS 推出 ECS Managed Instances,在維持完整 EC2 控制權的同時,將基礎設施管理責任外包給 AWS,實現運營簡單性與靈活性的最佳平衡 1
  • 採用 Bottlerocket 作業系統運行,相較於維護 50,000 個套件的通用作業系統,Bottlerocket 僅維護約 100 個套件定義,顯著降低攻擊面與管理複雜度 2
  • 使用 dm-verity 和 SELinux 強制模式保護根檔案系統,即使容器逃逸也難以持久化攻擊,系統會在偵測到篡改時自動重啟 34

  • 容器編排市場預計從 2025 年的 108 億美元成長到 2034 年的 765 億美元,年複合成長率達 24.16%,顯示託管容器服務的強勁需求 5
  • 研究顯示異質任務分配策略可將容器編排成本降低 23% 到 32%,ECS Managed Instances 的自動工作負載整合功能正是實現此目標的關鍵 6

  • Bottlerocket 的原子更新模型使修補關鍵漏洞的時間從數天或數週縮短到數小時,相較於傳統系統可將更新相關停機時間減少 80% 74
  • 目前服務已在六個 AWS 區域推出,包括 US East (North Virginia), US West (Oregon), Europe (Ireland), Africa (Cape Town), Asia Pacific (Singapore), and Asia Pacific (Tokyo),預計未來將擴展到更多區域以支援全球部署需求
  • 服務支援透過 AWS Management Console、CLI、CDK 和 CloudFormation 部署,與現有 DevOps 工具鏈無縫整合,降低採用門檻
  • 2022 年 Ernest 曾在 AWS Builders Day Taiwan 分享 Running Laravel/PHP on AWS 也有比較各種 Amazon ECS Launch Types。看來該來更新投影片了。 8

91011

Read More

Claude Sonnet 4.5 問世

Post Title Image (Photo by Brett Jordan on Unsplash)

✳️ tl;dr

  • Claude Code 新增 Checkpoints 功能,可即時儲存進度並回滾到先前狀態,解決長時程開發的痛點 12
  • 原生 VS Code 擴展發布,支援即時 inline diffs 顯示 Claude Code 的程式碼變更
  • Claude Sonnet 4.5 在 SWE-bench Verified 達到 77.2%(完整 500 題),採用簡單的 bash 和檔案編輯工具 13

  • 高算力配置下透過平行測試時計算可達 82.0%,使用拒絕採樣和內部評分模型選擇最佳候選 1
  • API 新增記憶工具和自動上下文管理功能,讓代理能夠在長時間運行任務中維持上下文 14
  • 定價維持與 Claude Sonnet 4 相同:輸入 $3/百萬 token、輸出 $15/百萬 token,搭配 prompt caching 可節省高達 90% 成本 5

  • Cursor CEO 表示 Claude Sonnet 4.5 在長時程任務上展現最先進的程式開發性能,是開發者解決複雜問題的首選 1

  • 在 OSWorld 基準測試達到 61.4%,領先所有競爭對手,四個月前 Sonnet 4 僅為 42.2%
  • 實施 AI Safety Level 3 (ASL-3) 保護框架,CBRN 威脅檢測誤判率相較最初描述時已降低十倍
  • 提示注入攻擊防禦取得進展,這是代理式 AI 系統面臨的最嚴重安全風險之一
  • 首次在 System Card 中納入「可解釋性」技術評估,提升模型透明度和可信度 6

7

Read More

Claude for Chrome - Research Preview 動手玩

Post Title Image (Photo by Jonny Gios on Unsplash)

✳️ tl;dr

  • 新玩具 Claude for Chrome 1 2
  • 很久之前填表排隊
  • 昨天收到信
  • 今天抽空玩
  • 繼續寫作業
  • 誒不對,應該找它陪我一起寫作業?!

  • 看起來我是第二批 Max plan 排隊取得 Claude for Chrome research preview
  • 連假嘗試了幾個任務給 Claude for Chrome 執行看看。
  • 會先取得 URL 裡頭某個 domain 底下的授權,也可以一步一步按同意。

  • 如果是自己閱讀文件步驟,自己操作,不熟悉(或是第一次)自己操作的情況下,大約 2~3 分鐘(邊看、邊操作、雙螢幕)可以完成任務。但需要動腦消化、以及在螢幕上找(或需要用 cmf+f 找到 action link 或 action button 前進)。
  • 相比之下 Claude for Chrome 約莫需要 10~15 分鐘,都有完成任務(例如幫我設定 GTM、幫我翻找 Quickbooks 某個 Account 的歷史紀錄),因為需要一步一步操作、每一步都需要螢幕截圖、判讀畫面並決定下一步滑鼠該 click 在哪個位置、有些畫面需要輸入文字到文字框裡頭、連 click 文字方塊後都會在螢幕截圖做一次確認焦點有在文字方塊上(我好幾次都差點衝動想要幫它按,都先忍住,怕打擾流程)。

  • 我目前搭配 Edge 使用(因為需要垂直分頁和 multiple isolated profiles),好像有遇到 Claude for Chrome 將我原本 group 的名稱改掉、原本 tab group 中其他 tab 擅自關閉沒問過我的情況、也有 Claude for Chrome 自己在 tab group 中開啟了新的 tab (e.g. GA4) 自己開始進行操作,但是畫面上我還停留在 GTM 的 tab 之類情事。
  • 以體驗來說,當然現階段是沒有效率的。
  • 但以結果來說,Claude for Chrome 有完成任務,這代表拆解步驟的思路和知識夠用,就等新世代的模型或是未來可能的地端 infra 出來,減少往返的時間,效率就會直接拉上來。

  • 你也在思考如何導入 AI Agent 或 Agentic Workflow 到團隊或工作流程中嗎?歡迎聊聊

Read More

除錯 Kiro 與 zsh 的 CLI Session 互動問題:無法取得後續指令回傳值

Kiro 與 zsh 互動問題

問題描述

最近在使用 Kiro (Agentic IDE) 玩 multiple-role agents 和 hooks 的時候,遇到了一個相當困擾的問題:在同一個 CLI session 中,Kiro 拿不到第二個指令的回傳值

問題場景是這樣的:

  • 當我請 Kiro 執行第一個指令時,一切正常,指令可以執行且能正確取得輸出結果。
  • 但是接下來 在同一個 shell session 中執行第二個指令時,Kiro 就無法取得該指令的回傳值了。
  • 所以 Kiro 就停在那邊等回傳,vibe 不起來。

這個問題對我的工作流程造成了很大的影響:

  • 頻繁的 session 重啟:
    • 每次執行完第一個指令後,我都必須手動關閉 CLI session,需要我(人類)這麼頻繁地介入,那這不是我想要的 AI agent。
  • 手動複製輸出:
    • 或者我需要手動複製第二個指令的回傳值給 Kiro Chat。
  • 工作效率降低:
    • 原本流暢的 agentic coding 工作流程變得斷斷續續,放鬆的時候是可以放鬆,但我對於工作任務,會想要提升效率。

問題場景影片紀錄(影片中的某些關鍵資訊已經被重新產生,請勿驚慌):

Read More

解決 LM Studio gpt-oss 模型輸出參雜「推理內容」之問題

Post Title Image (Photo by Felix Eka Putra Kuntjoro on Unsplash)

起因

剛才想到將 MacWhisper Dictation 的後處理,從原本的 LM Studio google/gemma-3-12b 改成使用 openai/gpt-oss-20b,但一直遇到 gpt-oss 模型會將思考過程也回傳成為 dictation 輸出結果。有問題的輸出結果:

We need to correct punctuation: use full-width. 
Input: "嗨,我們明天去兒童樂園玩好嗎?" 
We replace comma with ,, question mark with ?. 
Also add period at end? 
The sentence ends with question mark already. 
So output: "嗨,我們明天去兒童樂園玩好嗎?"
嗨,我們明天去兒童樂園玩好嗎?

Read More

AWS 重塑 AI 基礎設施:S3 Vectors 如何改變向量搜尋遊戲規則

Post Title Image (圖說:將世界重新使用向量拆解與整合,我們也許得以重新認識新的世界。圖片來源:Photo by James Wainscoat on Unsplash)

✳️ tl;dr 給技術管理者

  • Amazon S3 Vectors 將原生向量搜尋功能直接整合進 S3 物件儲存,目標是簡化架構並降低成本。1
  • 對於 RAG、語意搜尋等 AI 應用,官方宣稱最高可節省 90% 的向量儲存與查詢成本。
  • 這意味著我們不再需要為某些 AI 場景維護一個獨立、昂貴的向量資料庫,大幅降低了維護營運複雜度 (TCO)。2
  • S3 Vectors 提供 subsecond 級查詢效能,適用於對延遲要求非即時 (non-real-time) 的大規模應用。3

  • 核心優勢:實現了向量資料的「存算分離 (Storage and Compute Separation)」,將長期儲存的成本效益發揮到極致。4
  • 透過與 Amazon OpenSearch 的整合,可建立「冷熱」資料分層策略,兼顧成本與高效能查詢需求。5
  • 可與 Amazon Bedrock Knowledge Bases 的無縫整合,讓建立和擴展 RAG 應用的過程變得前所未有的簡單。6
  • S3 Vectors 的出現,可能迫使現有向量資料庫廠商 (如 Pinecone) 重新思考其市場定位與定價策略。

  • 對於技術團隊,現在需要重新評估現有的 AI 技術堆疊,判斷哪些工作負載可以遷移到 S3 Vectors 以實現成本優化。
  • 該功能引入了新的 Vector Bucket,讓向量管理像管理一般 S3 物件一樣簡單。
  • 推測:未來 S3 Vectors 可能會進一步增強其查詢能力,例如支援混合搜尋,以適應更複雜的場景。

✳️ tl;dr 給工程師與開發者

  • Amazon S3 現在原生支援向量儲存與搜尋,新功能 S3 Vectors。1
  • 可以直接在 S3 建立 Vector BucketVector Index,然後用 API 存入和查詢 embeddings。
  • 對於許多 RAG 應用,可以省去部署和管理一個獨立 Vector DB 的步驟。7
  • API 支援 k-NN 相似性搜尋,並提供 subsecond 級的回應時間,同時支援 Cosine、Euclidean 等距離度量。

  • 開發亮點:查詢時可以使用 metadata filter,例如 (category = 'ernest-pkm' AND year > 2023),非常實用。3
  • 與 Amazon Bedrock Knowledge Bases 無縫整合,設定好 S3 data source 後,Bedrock 會自動幫你處理 embedding 和同步。6
  • 如果你的應用需要更低的延遲或更複雜的搜尋 (如 hybrid search) ,可以將熱向量匯出到 Amazon OpenSearch Service。5

  • 對於已經在使用 AWS 的開發者,學習曲線很低,基本上就是多學幾個 S3 API call。
  • 整個服務是 Serverless 的,意味著你不用煩惱 scaling、provisioning 和 aRPU 這些東西,專心處理客戶應用場景。
  • 可以更經濟地為你的 AI Agent 建立一個巨大的長期記憶庫,所有互動紀錄或知識,都能被向量化並儲存在 S3。
  • 對於儲存在 S3 Data Lake 4 中的海量文件或圖片,現在可以直接就地建立索引並進行語意搜尋,無需 ETL 到另一個系統。(Well… 如果你的海量檔案現在還沒放在 S3… 那就呼叫幾個 API calls 吧 XD)

✳️ tl;dr 給行銷人與產品人

  • 想像一下,你公司所有的文件、客服對話、產品圖片、甚至影片,都能用自然語言進行語意搜尋。Amazon S3 Vectors 正在讓這件事變得更便宜、更簡單。1
  • 過去,只有資源雄厚的公司才能負擔得起建立大規模向量搜尋系統。現在,AWS 將這項能力直接內建到 S3,大幅降低了技術門檻和成本。
  • 應用場景:媒體公司可以快速在 PB 級的影片庫中找到相關片段;醫療機構可以在數百萬張醫學影像中識別相似病例。
  • 對於電商,可以用它來建立更精準的語意搜尋引擎,理解用戶「想要」什麼,而不僅僅是他們「輸入」了什麼。

  • 商業價值:這不僅僅是技術升級,更是释放企業內部「非結構化資料」價值的一把鑰匙。4
  • S3 Vectors 讓 RAG (檢索增強生成) 技術變得更加普及,這意味著你的聊天機器人或 AI 客服可以提供相對準確、相對有根據的回答。6
  • 市場趨勢向量搜尋正在從一個利基技術,轉變為雲端儲存的基礎設施的一部分。

  • 這項創新將加速 AI 在各行各業的落地,因為它解決了最基礎的「資料準備」和「知識儲存」的成本問題。
  • 對產品經理來說,這意味著在規劃 AI 功能時,可以更大膽地構思需要海量知識庫的應用。(將 S3 當作萬能鑰匙,電影 Matrix 裡面的 keymaker。)
  • S3 Vectors 與 Amazon Bedrock Knowledge Bases 的整合,提供了一個一站式的知識庫解決方案。6
  • 推測:未來將會出現更多基於 S3 Vectors 的第三方 SaaS 應用,專注於特定行業的知識管理和語意搜尋。此推測基於 AWS 生態系中 ISV 的發展模式。2
  • 企業現在應該思考:我有哪些沉睡的資料可以被「向量化」,從而創造新的商業價值?先不要顧慮資料格式,你覺得是「資料」就試著先用用看,先從小資料起手。

Read More

Anthropic 內部如何使用 Claude Code:從基礎設施到產品到資安到法務的全面代理式程式開發

Post Title Image (圖說:Claude Code 正在進行 代理式程式開發 (agentic coding)。圖片來源:Anthropic。)

✳️ tl;dr

  • Anthropic 最近分享了他們內部團隊使用 Claude Code 1 的真實案例 2,讓我看到了從單純的程式碼自動完成,進化到「代理式軟體開發生命週期 (agentic SDLC)」的大致畫面。
  • Data Infrastructure 團隊讓 Claude Code 用 OCR 看錯誤截圖,診斷出 Kubernetes IP 耗盡,並提供修復指令
  • 非技術背景的財務人員只要用 自然語言 描述需求,Claude Code 就能自動產生查詢並輸出 Excel 報表
  • Product Development 團隊在 auto-accept mode 下讓 Claude Code 自主寫出 70% 的 Vim 模式程式碼
  • Security Engineering 透過 Claude Code 快速解析 Terraform plan,完成安全審核並減少開發瓶頸
  • Inference 團隊依賴 Claude Code 生成涵蓋 edge case 的單元測試,研究開發時間降低 80%
  • DS/ML 團隊用 Claude Code 建立 5,000 行 TypeScript 儀表板 (dashboard),從一次性分析轉向長期可重用工具

  • MCP(Model Context Protocol) 3 讓 Claude 在安全環境中存取精準的組態與資料
  • Claude Code 借助「自我驗證迴圈」:撰寫程式 → 執行測試/CI → 自動修正錯誤,推進代理式 SDLC (agentic SDLC)
  • 第三代 AI coding 工具正整合到端到端開發流程,從需求到部署 全面自動化
  • Anthropic 透過 RLAIF 與 Constitutional AI 訓練模式,讓 Claude 在程式碼生成中展現業界領先的自我修正能力

  • 你有想過 AI coding 工具 在你的組織內部 或 對你自己的工作流程 到底能做到什麼 程度 嗎?
  • 今年五月我在 AWS Summit Hong Kong 2025 分享「重塑程式設計: AI 如何轉變企業的程式開發方式」,從 SDLC 開始拆解,大家有興趣也可以搭配投影片一起閱讀。

45678

Read More