脈絡拆解: AWS re:Invent 2025 Keynote with Dr. Swami Sivasubramanian

Post Title Image (圖說:AWS re:Invent 2025 Keynote with Dr. Swami Sivasubramanian。圖片來源:AWS。)

AWS Agentic AI(自主式 AI)副總裁 Dr. Swami Sivasubramanian 在 re:Invent 2025 發表以開發者為核心的主題演講,展示 AI agents 如何改變我們建構軟體的方式。從 Blue Origin 運用自主式 AI 將月球基礎設施設計速度提升 75%,到 Vercel 以自駕式基礎設施服務 1,100 萬名客戶,這場主題演講證明了 Agentic AI(自主式 AI)agents 的時代已經到來。Nova Act 以 90% 的可靠度支援企業工作流程的發布,標誌著生產環境自動化的重要轉捩點。

✳️ tl;dr 重點摘要

一個主題「Agentic AI(自主式 AI)」貫穿全場,分為五大段落:

  • 理解 Agents:Agents 能感知環境、將目標轉化為可執行步驟,並持續學習;不同於提供建議的聊天機器人,agents 會主動調查並啟動解決方案。
  • 建構 AgentsStrands Agent SDK(超過 500 萬次下載)與 Amazon Bedrock AgentCore 提供模型驅動開發,具備 Identity、Policy、Evals 及 Episodic Memory 等能力。
  • 客製化模型Amazon Bedrock 中的 Reinforcement Fine-Tuning 可帶來 66% 的準確度提升;Nova Forge 透過在中期訓練階段混入專有資料來建立客製化前沿模型。
  • 確保信任Amazon Nova Act 透過結合自動推理與 LLMs 的神經符號式 AI,達到 90% 的可靠度;Cedar 策略語言提供確定性控制。
  • 重新想像工作方式Kiro autonomous agentAWS Security AgentAWS DevOps Agent,加上 Amazon Connect 的 8 項新自主式功能與 Nova Sonic 整合。

✳️ 現場回顧

(圖說:Dr. Swami Keynote 前幾天晚上在拉斯維加斯的威尼斯人二樓,很幸運捕獲野生的 Dr. Swami,我們介紹是來自台灣的 AWS Heroes,獲得親民大佬熱切的握手,超開心。。)

Read More

脈絡拆解: AWS re:Invent 2025 Keynote with CEO Matt Garman

Post Title Image (圖說:AWS re:Invent 2025 Keynote with CEO Matt Garman。圖片來源:AWS。)

AWS 執行長 Matt Garman 在第 14 屆年度 re:Invent 向超過 60,000 名現場與會者及近 200 萬名線上觀眾發表演講,闡述 AWS 已成長為 1,320 億美元的事業,年增率達 20%。在「Freedom to Invent」的主題下,Garman 闡述五個相互關聯的領域:AI 基礎設施(Trainium3 GA、Trainium4 預覽版、P6e-GB300、AI Factories)、模型與智慧(Nova 2 系列含 Lite/Pro/Sonic/Omni、Nova Forge 開放訓練模型)、大規模 Agents(AgentCore Policy 與 Evaluations)、開發者轉型(AWS Transform Custom、Kiro IDE、三個前沿 agents),以及 25 項核心服務的快速發表,涵蓋運算、Lambda、儲存、EMR、安全性與資料庫。

✳️ tl;dr 重點摘要

一個主題「Freedom to Invent」貫穿全場,分為五大段落:

  • AI 基礎設施:AWS 領先 GPU 可靠性,推出 P6e-GB300 與 Nvidia 合作,宣布 Trainium3 GA(AWS Cloud 中首款 3 奈米 AI 晶片),預覽 Trainium4(6 倍 FP4 運算效能),並推出 AWS AI Factories 提供專屬的地端 AI 基礎設施。
  • 模型與智慧Amazon Bedrock 突破 100K 客戶,超過 50 個客戶各自處理超過 1 兆 tokens(對比我整理 2025 年度回顧 時將整年 Heptabase 日記筆記全部丟進去也才 200k tokens);新增來自 Mistral、Google、MiniMax、Nvidia 的開放權重模型;Nova 2 系列(Lite、Pro、Sonic、Omni)以最佳化成本提供前沿等級的智慧;Nova Forge 推出開放訓練模型,可建立客製化的 Novellas。
  • 大規模 AgentsAmazon Bedrock AgentCore 新增 Policy(基於 Cedar 的確定性控制)和 Evaluations(持續品質檢測,含 13 個預建評估器);來自 Sony、Adobe 和 Writer 的講者展示企業採用案例。
  • 開發者轉型AWS Transform Custom 支援任何程式碼現代化;Kiro 成為 Amazon 官方 AI IDE;推出三個前沿 agents(frontier agents):Kiro autonomous agentAWS Security AgentAWS DevOps Agent
  • 25 項核心服務發表:快速發表包括新 EC2 執行個體系列(X、C8a、C8ine、M8azn、Mac)、Lambda durable functions、S3 最大物件大小 50TB、S3 Vectors GA、EMR serverless storage、GuardDuty for ECS、Security Hub GA、RDS 256TB 容量,以及資料庫儲蓄方案。

✳️ 現場回顧

(圖說:CEO Keynote 的當天,人在拉斯維加斯早早起床,排隊進場,第一次挑戰在現場聽講,只使用 reMarkable Paper Pro 手寫筆記,快速抄寫關鍵字、快速分類抓架構、同時模擬如果其他夥伴臨時也出其他任務可以如何幫忙 briefing 打底,感謝自己小時候帶營隊的經驗和規律 morning routine 的燒腦訓練。)

(圖說:CEO Keynote 結束後,我們只有一個半小時集合、移動、補充食物、briefing,然後就直接進 re:Invent Podcast 錄音室,每年都挑戰更上一層樓的不同任務。)

Read More

專注中不可承受之輕又一篇 - Ricoh GR IV 開箱 (61P)

Ricoh GR IV (圖說:Ricoh GR IV,街拍神機的最新篇章。)

喔喔喔!等了兩個半月的「銀杏觀賞套組」終於從從容容地離開倉庫!這兩個半月實在太漫長,長到我都覺得需要銀杏來補補腦力了。

  • Ricoh 於 2025-08-20 釋出 GR IV,
  • 我盡快在 2025-08-21 衝到 B&H 預定一台(以及相關零配件),
  • 盼啊盼的,等啊等的,中間收到兩次 Backorder Status 更新。
  • 十月中忍不住進線問客服有沒有預估的交期,因為真的很想帶著 GR IV 跑接下來的出差行程以及掃街。
  • 幸運的是 2025-10-31 收到出貨通知 (Order Shipped),
  • 但遇上雙十一和非洲豬瘟,整個海關被塞爆,
  • 一直到 2025-11-09 才收到進口關稅和稅費通知,幸好付款後立刻就收到箱子,可以來開心開箱。

自己的上一台 Ricoh 已經是 2005 年的 R3(還少了個 G!),這一晃眼就是二十年。這次連買相機都是跟 B&H 買,該說是真愛還是緣分?跟這兩個字母真是有緣?雖然銀杏相機(加電池、閃光燈等配件)在海關卡了頗多天,第一次完全沒收到 ezway 通知(可能是有先手動填了紙本委任書?),但總算趕在感恩節前拿到手,讓我有時間再出差之前學一下怎麼設定(把玩?!

今天,GR IV 終於到着。用了別種一些磚塊換成眼前這些磚塊,明天跟小朋友說這也是麥塊的一種?

好好好,不亂聊天了,趕快來開箱今年的「專注中不可承受之輕」。(至少跟去年的「專注中不可承受之輕」相比,真的輕!

Read More

2025-10 Amazon DynamoDB 於 北維吉尼亞區域 (US-EAST-1) 服務中斷事件摘要

Post Title Image (圖說:AWS Health Dashboard 螢幕截圖 at 2025-10-20 12:51 PDT。圖片來源:Ernest。)

✳️ tl;dr

  • 以下內容來自 AWS 官方報告 1,由 AWS Community Hero Ernest 2 以開發者、技術管理者視角,切分段落、畫上重點,以求貼近事實,並基於事實進行推理與延伸學習。
  • 期待透過研讀報告,讓雙方(AWS 原廠、以及同樣身為 AWS 客戶的我們)不論是在雲端或是地端,一起累積經驗、一起持續進步。
  • 以下時間如果沒有特別描述,都是 AWS 西雅圖總部的美西太平洋夏令時間。
  • 這份筆記,會先以知識圖譜開場,然後接續拆解原始官方報告內容,總共分成四個段落:Amazon DynamoDB, Amazon EC2, Network Load Balancer (NLB), Other AWS Services
  • 如果時間不夠,建議可以先看第一個段落,了解本次服務中斷的 root cause 與解決方案。
  • 如果有預算想要調整自身架構成為跨區域高可用,但又沒有足夠時間大幅調整架構,推薦可以看一眼 AWS 各個服務中帶有 global 字樣的服務,例如這次同為 DynamoDB 家族的「Amazon DynamoDB Global Tables」幾乎沒有受到影響。

  • 我們想要提供您關於服務中斷的一些額外資訊,該事件發生於
    • 北維吉尼亞 (us-east-1) 區域 3
    • 2025 年 10 月 19 日和 20 日
    • 事件開始於美西太平洋夏令時間 10 月 19 日 晚上 11:48 (台北時間 UTC+8, 2025-10-20 14:48)
    • 並且結束於美西太平洋夏令時間 10 月 20 日 下午 2:20 (台北時間 UTC+8, 2025-10-21 05:20),
    • 對客戶應用有三個不同的影響時期:
      • 首先,在 10 月 19 日晚上 11:48 到 10 月 20 日凌晨 2:40 之間,Amazon DynamoDB 在北維吉尼亞 (us-east-1) 區域經歷了API 錯誤率增加的情況。
      • 其次,在 10 月 20 日上午 5:30 到下午 2:09 之間,網路負載平衡器 (NLB) 在北維吉尼亞 (us-east-1) 區域的部分負載平衡器經歷了連線錯誤增加的情況。
        • 這是由於 NLB 機群中的健康檢查失敗所造成,導致部分 NLB 的連線錯誤增加。
      • 第三,在 10 月 20 日凌晨 2:25 到上午 10:36 之間,新的 EC2 執行個體啟動失敗,而雖然執行個體啟動從上午 10:37 開始成功,但部分新啟動的執行個體遇到連線問題,這些問題在下午 1:50 得到解決。

Read More

Sönke Ahrens 的 How to Take Smart Notes:將 Zettelkasten 系統化的現代詮釋

Post Title Image (Ernest Chiang 手繪,你可能也會想延伸閱讀他整理的 Ernest PKM。)


1️⃣ 前言:讓 Zettelkasten 可學習、可複製

2017 年,德國學者 Sönke Ahrens 出版了一本改變知識管理領域的書:How to Take Smart Notes(中譯:《卡片盒筆記法》)。1

這本書做了一件重要的事:將 Niklas Luhmann 的 Zettelkasten 方法 系統化、步驟化、可操作化

在 Ahrens 之前,Zettelkasten 更像是一個「傳說」——我們知道 Luhmann 用這個方法寫了 70 本書,但不太清楚普通人該如何複製這個系統。Luhmann 自己的 1981 年論文《與卡片盒溝通》更像是哲學反思,而非操作手冊。(我自己是比較喜歡反思,但滿多朋友在詢問方法,所以還是整理了本篇筆記。)

「寫作不是在思考之後發生的事。
寫作就是思考的媒介。」

— Sönke Ahrens, How to Take Smart Notes (2017)

Read More

Niklas Luhmann 的原始 Zettelkasten:兩個卡片盒、固定編號、溝通夥伴

Zettelkasten 卡片盒筆記系統 (Ernest Chiang 手繪,你可能也會想延伸閱讀他整理的 Ernest PKM。)

1️⃣ 前言:一個社會學家與他的思考機器

Niklas Luhmann(1927–1998)是德國社會學家,以系統理論(Systems Theory)聞名。在他的學術生涯中,完成了令人驚嘆的產出:70 本書和超過 400 篇學術文章。

但更驚人的是,他將這一切歸功於一個看似簡單的工具:Zettelkasten(卡片盒,Slip-Box)。

  • 這不是一個普通的筆記系統。
    • Luhmann 從 1950 年代開始建立這個系統,最終累積了超過 90,000 張索引卡片。
  • 他稱這個系統為「溝通夥伴」(communication partner)
    • 一個能與自己展開對話、促進思考、甚至「驚訝」自己的外部大腦。1
    • 這有沒有像是個一百年前的手動版本 AI Agent 或知識庫助理?!

在 1981 年發表的著名論文《與卡片盒溝通》(Kommunikation mit Zettelkästen)中,Luhmann 詳細描述了這個系統的運作方式。但有趣的是,許多現代對 Zettelkasten 方法的理解,其實混入了後世學者的詮釋和改編

這篇筆記要探討的,是 Luhmann 自己實際使用的原始方法。


「若不書寫,人便無法思考;
至少無法以精確的、可接續的方式思考。」

— Niklas Luhmann, Kommunikation mit Zettelkästen (1981)1

Read More

KKR 與 ECP 的 500 億美元 AI 基礎設施佈局

Post Title Image (圖說:KKR 總部位於紐約 30 hudson yards。圖片來源:Photo by Illya Goloborodko。)

✳️ tl;dr

  • 新聞追蹤 2024-10-30 1 → 2025-07-30 2
  • KKR 對於科技產業並不陌生,曾於 2006 年就聯合入手 80% 飛利浦半導體事業群,並改名為 NXP Semiconductors。曾經是 Ernest 經手服務的客戶,印象特別深刻。

  • 【2024-10-30】KKREnergy Capital Partners 宣布 500 億美元戰略合作夥伴關係,專注加速資料中心、發電和輸電基礎設施開發,支援全球 AI 和雲端運算擴張 1
  • 合作雙方擁有超過 8GW 現有資料中心管線和 100GW 運營中及可開發的發電能力,KKR 在全球擁有超過 100 個資料中心設施 1
  • ECP 投資於清潔能源資產基礎,在美國市場擁有和營運超過 83GW 的發電能力,涵蓋發電、再生能源、儲能等五個資產類別 1
  • 合作目標是與公用事業、電力生產商和資料中心開發商合作,為超大規模業者快速且負責任地開發大型資料中心園區 1
  • 背景脈絡:BlackRock 於同月推出 300 億美元的 AI 基礎設施基金,由 Microsoft 和 Nvidia 支持,顯示資本競相湧入 AI 基礎設施 1

  • 【2025-07-30】首筆投資落地:德州 Bosque County 建造 190MW 超大規模資料中心園區,從戰略宣布到首個專案公告歷時 9 個月 2
  • 創新共址模式:資料中心與 Calpine 的 Thad Hill Energy Center 天然氣電廠相鄰,代表與超大規模業者的首個此類專屬電力協議 2
  • 透過 CyrusOne 和 ECP 的合資企業建造,預計 2026 年 Q4 啟用,總投資近 40 億美元,初始 IT 容量 144MW,佔地超過 70 萬平方英尺 2
  • Behind-the-Meter 模式:Calpine 提供 190MW 專屬電力,在 ERCOT 電網緊急情況下,電力可轉向支援系統可靠性和地方需求 2

  • AI 驅動的電力需求:Goldman Sachs 預測 2030 年全球資料中心電力需求將較 2023 年增長 165%,AI 資料中心功率密度從傳統 5-10kW/機櫃暴增至 50-200kW/機櫃 34
  • 電網瓶頸嚴重:新資料中心電網連接延遲已達 5 年,Behind-the-Meter 天然氣發電可在 18-24 個月內部署完成,成為務實選擇 5
  • 德州監管環境:SB6 新法規(2025 年 6 月簽署)要求 75MW 以上大型負載承擔電網成本、接受緊急削減,並安裝 ERCOT 控制的「緊急切斷開關」67
  • 私募股權持續加碼:2024 年資料中心投資達 1080 億美元(是 2023 年的三倍),KKR 在 2021 年以 150 億美元收購 CyrusOne,為此次合作奠定基礎 89

Read More

BlackRock 領導聯盟以 400 億美元收購 Aligned Data Centers,創 AI 基礎設施交易紀錄

Post Title Image (圖說:Aligned Data Centers。圖片來源:Aligned Data Centers。)

✳️ tl;dr

  • AIP、MGX 和 GIP 組成聯盟,以 400 億美元 ($40B) 收購 Aligned Data Centers 12
  • 這是 AIP = AI Infrastructure Partnership 成立以來的首筆投資

  • AIP 由 BlackRock、Microsoft、NVIDIA、MGX 於 2024 年 9 月創立 3
  • AIP 目標動員 300 億美元股權資本,包含債務融資後有潛力達到 1000 億美元規模
  • Aligned 擁有 50 個園區、超過 5 GW 運營及規劃容量,橫跨美國與拉丁美洲關鍵數位樞紐

  • 超大規模資料中心市場預計 2025 年達 1673 億美元,
  • 以 23.58% CAGR 增長至 2030 年的 6024 億美元 4
  • 全球資料中心用電量預計從 2024 年的 415 TWh 翻倍至 2030 年的 945 TWh,占全球用電量 3% 5
  • Aligned 持有超過 50 項專利冷卻技術,包括空氣、液體和混合冷卻系統,專為高密度 AI 工作負載設計 16

  • NVIDIA 最新 GB200 晶片每機架功率密度可達 120 千瓦,液冷成為 20 千瓦以上機架的必要技術 78
  • 科威特投資局和新加坡淡馬錫作為 AIP 錨定投資者,顯示主權財富基金對 AI 基礎設施的長期承諾 23
  • 值得注意的是 Macquarie (麥格理資產管理公司) 在 2018 年首次投資 Aligned,7 年內將其從 2 個設施擴展至 50 個園區,實現約 400 億美元估值退出 910

  • 主要科技公司預計 2025 年在 AI 基礎設施上投入 4000 億美元,OpenAI 的 Stargate 計劃單獨就達 5000 億美元 211
  • 美國資料中心功率需求預計從 2024 年的 35 GW 翻倍至 2035 年的 78 GW,平均每小時用電量將增長三倍 12

  • 身為管理者的你:麥格理 在 2018 年入手投資(不只一家資料中心公司), 7 年後退出。即將面對 2026 年的各位,有開啟雷達定位 3~5 年標的了嗎?

Read More

表外融資的 AI 時代: SPV 如何為資料中心熱潮 融資 卻隱藏槓桿風險

Post Title Image (Photo by Ray Hennessy on Unsplash)

✳️ tl;dr

  • Meta 透過 SPV 結構完成近 $300 億美元融資
  • 建設路易斯安那州 Hyperion 資料中心 (數據中心),創下史上最大私募股權交易記錄 1
  • Hyperion 資料中心佔地 400 萬平方英尺,
  • 全面運作時耗電 5 gigawatts,相當於 400 萬戶美國家庭用電量

  • Meta 僅保留 20% 股權,卻維持完全營運控制權,
  • 這種「控制但不合併」的會計技巧讓 $270 億美元債務不出現在資產負債表上 2
  • 股權僅佔總融資的 8.5% ($25 億/$295 億)
  • 保險公司透過私募信貸大量投資此類專案,
  • 但面臨資產負債不匹配風險,在經濟下滑時可能被迫清算投資 3
  • 歷史教訓: 1990 年代電信公司鋪設 8000 萬英里光纖,
  • 泡沫破裂四年後仍有 85%-95% 未使用,被稱為「暗光纖4
  • Meta、Amazon、Google、Microsoft 承諾今年資本支出達創紀錄的 $3200 億美元,大部分用於 AI 基礎設施,但 Meta 10-K 坦承:「無法保證 AI 的使用將增強我們的產品或服務」5

  • 電力基礎設施成為瓶頸之一
  • Grid Strategies 估計到 2030 年資料中心需新增 60 gigawatts 電力,相當於義大利全國峰值需求 6
  • 冷卻技術也是關鍵之一: 從氣冷到直接液冷再到浸入式冷卻,影響長期營運成本 7

  • Morgan Stanley 作為獨家承銷商,同時為多個類似專案提供融資諮詢 1
  • 債券以 144A 格式私募發行,利差高出國債 2.25% 1

  • 技術管理者可以做什麼? (1) 量化 AI 投資的實際 ROI 時間表 (2) 評估電力供應鏈風險 (3) 保持適當的財務槓桿比例

8 9

Read More

AI 的地理學:Claude 經濟指數追蹤 AI 在 150 個國家的真實世界影響

Post Title Image (Photo by The New York Public Library on Unsplash)

✳️ tl;dr

  • 2025-09-15 Anthropic 發布第三份 Economic Index(從不同維度切入),首次追蹤 Claude 在 150+ 國家和美國所有州的使用模式。 1
  • (可能是模型業界第一份完整的地理分布 AI 採用數據?!)
  • 企業 API 客戶的自動化率達 77%,遠高於消費者用戶的 50%,顯示企業正在積極將 AI 從協作工具轉向生產力替代方案。
  • 指令式自動化在 8 個月內從 27% 躍升至 39%,這是首次自動化(49.1%)超越擴增(47%),反映模型能力提升帶來的用戶信心增長。

  • API 使用的價格敏感度僅 3%(成本指數每增 1% 僅減少 0.29% 使用),企業優先考慮 能力價值 而非 成本,
  • 推測原因是 隱藏的基礎設施成本 遠超 模型費用(每 1 美元模型費需額外 5-10 美元才能落地、達到 production ready)。
  • Ernest 的現場觀察也相同,會嫌 token 貴的需求提出者,通常自身沒有健全的組織營運系統或工作流程。反之則會看出整體創造的價值,而勇於導入 AI。
  • 約 5% 的 API 流量專門用於開發和評估 AI 系統,形成「AI 開發 AI」的遞迴改進循環,推測這可能加速能力提升但也需要更強的安全監督。
  • 美國州際 GDP 彈性(1.8)顯著高於跨國(0.7),但收入的解釋力反而較低,說明產業組成和經濟結構是更強的採用驅動因素。

  • AUI = Anthropic AI Usage Index
  • 華盛頓特區 AUI 最高(3.82),主要用於文件編輯和資訊搜尋;加州(第三)側重程式設計;紐約(第四)偏好金融任務,地方經濟結構直接映射到 AI 使用模式。
  • 教育指導任務增長 40%(9% → 13%),科學研究增長 33%(6% → 8%),顯示知識密集型領域的快速採用,推測高技能工作者正在利用 AI 提升專業能力。
  • 商業管理任務下降 40%(5% → 3%),金融營運任務減半(6% → 3%),推測這些領域可能正在被自動化或用戶轉向更專業化的工具。
  • 富裕國家傾向使用 AI 進行擴增協作(augmentation),貧窮國家更偏好自動化(automation),控制任務組合後每增加 1% 人口調整使用量對應約 3% 的自動化減少。

  • 研究使用隱私保護分類方法結合 O*NET 資料庫(19,498 個任務描述)和 Claude 自有分類系統雙重驗證,確保數據匿名化。
  • 但其靜態性質和粗粒度分類可能無法捕捉 AI 創造的新興任務和不同複雜度的程式設計工作。 23
  • 企業 AI 真實成本包括數據工程、安全合規、持續監控和整合架構,遠超表面的 API 費用,推測這解釋了為何企業對價格不敏感。 45
  • 模型能力提升(Sonnet 3.6 → 4.x 系列)直接驅動行為變化,更好的輸出品質減少迭代需求,推測未來更強大的模型可能進一步提高自動化佔比並改變人機協作模式。

1 4 5 2 6 7 3 8 9

Read More