2025-10 Amazon DynamoDB 於 北維吉尼亞區域 (US-EAST-1) 服務中斷事件摘要

Post Title Image (圖說:AWS Health Dashboard 螢幕截圖 at 2025-10-20 12:51 PDT。圖片來源:Ernest。)

✳️ tl;dr

  • 以下內容來自 AWS 官方報告 1,由 AWS Community Hero Ernest 2 以開發者、技術管理者視角,切分段落、畫上重點,以求貼近事實,並基於事實進行推理與延伸學習。
  • 期待透過研讀報告,讓雙方(AWS 原廠、以及同樣身為 AWS 客戶的我們)不論是在雲端或是地端,一起累積經驗、一起持續進步。
  • 以下時間如果沒有特別描述,都是 AWS 西雅圖總部的美西太平洋夏令時間。
  • 這份筆記,會先以知識圖譜開場,然後接續拆解原始官方報告內容,總共分成四個段落:Amazon DynamoDB, Amazon EC2, Network Load Balancer (NLB), Other AWS Services
  • 如果時間不夠,建議可以先看第一個段落,了解本次服務中斷的 root cause 與解決方案。
  • 如果有預算想要調整自身架構成為跨區域高可用,但又沒有足夠時間大幅調整架構,推薦可以看一眼 AWS 各個服務中帶有 global 字樣的服務,例如這次同為 DynamoDB 家族的「Amazon DynamoDB Global Tables」幾乎沒有受到影響。

  • 我們想要提供您關於服務中斷的一些額外資訊,該事件發生於
    • 北維吉尼亞 (us-east-1) 區域 3
    • 2025 年 10 月 19 日和 20 日
    • 事件開始於美西太平洋夏令時間 10 月 19 日 晚上 11:48 (台北時間 UTC+8, 2025-10-20 14:48)
    • 並且結束於美西太平洋夏令時間 10 月 20 日 下午 2:20 (台北時間 UTC+8, 2025-10-21 05:20),
    • 對客戶應用有三個不同的影響時期:
      • 首先,在 10 月 19 日晚上 11:48 到 10 月 20 日凌晨 2:40 之間,Amazon DynamoDB 在北維吉尼亞 (us-east-1) 區域經歷了API 錯誤率增加的情況。
      • 其次,在 10 月 20 日上午 5:30 到下午 2:09 之間,網路負載平衡器 (NLB) 在北維吉尼亞 (us-east-1) 區域的部分負載平衡器經歷了連線錯誤增加的情況。
        • 這是由於 NLB 機群中的健康檢查失敗所造成,導致部分 NLB 的連線錯誤增加。
      • 第三,在 10 月 20 日凌晨 2:25 到上午 10:36 之間,新的 EC2 執行個體啟動失敗,而雖然執行個體啟動從上午 10:37 開始成功,但部分新啟動的執行個體遇到連線問題,這些問題在下午 1:50 得到解決。

Read More

Sönke Ahrens 的 How to Take Smart Notes:將 Zettelkasten 系統化的現代詮釋

Post Title Image (Ernest Chiang 手繪,你可能也會想延伸閱讀他整理的 Ernest PKM。)


1️⃣ 前言:讓 Zettelkasten 可學習、可複製

2017 年,德國學者 Sönke Ahrens 出版了一本改變知識管理領域的書:How to Take Smart Notes(中譯:《卡片盒筆記法》)。1

這本書做了一件重要的事:將 Niklas Luhmann 的 Zettelkasten 方法 系統化、步驟化、可操作化

在 Ahrens 之前,Zettelkasten 更像是一個「傳說」——我們知道 Luhmann 用這個方法寫了 70 本書,但不太清楚普通人該如何複製這個系統。Luhmann 自己的 1981 年論文《與卡片盒溝通》更像是哲學反思,而非操作手冊。(我自己是比較喜歡反思,但滿多朋友在詢問方法,所以還是整理了本篇筆記。)

「寫作不是在思考之後發生的事。
寫作就是思考的媒介。」

— Sönke Ahrens, How to Take Smart Notes (2017)

Read More

Niklas Luhmann 的原始 Zettelkasten:兩個卡片盒、固定編號、溝通夥伴

Zettelkasten 卡片盒筆記系統 (Ernest Chiang 手繪,你可能也會想延伸閱讀他整理的 Ernest PKM。)

1️⃣ 前言:一個社會學家與他的思考機器

Niklas Luhmann(1927–1998)是德國社會學家,以系統理論(Systems Theory)聞名。在他的學術生涯中,完成了令人驚嘆的產出:70 本書和超過 400 篇學術文章。

但更驚人的是,他將這一切歸功於一個看似簡單的工具:Zettelkasten(卡片盒,Slip-Box)。

  • 這不是一個普通的筆記系統。
    • Luhmann 從 1950 年代開始建立這個系統,最終累積了超過 90,000 張索引卡片。
  • 他稱這個系統為「溝通夥伴」(communication partner)
    • 一個能與自己展開對話、促進思考、甚至「驚訝」自己的外部大腦。1
    • 這有沒有像是個一百年前的手動版本 AI Agent 或知識庫助理?!

在 1981 年發表的著名論文《與卡片盒溝通》(Kommunikation mit Zettelkästen)中,Luhmann 詳細描述了這個系統的運作方式。但有趣的是,許多現代對 Zettelkasten 方法的理解,其實混入了後世學者的詮釋和改編

這篇筆記要探討的,是 Luhmann 自己實際使用的原始方法。


「若不書寫,人便無法思考;
至少無法以精確的、可接續的方式思考。」

— Niklas Luhmann, Kommunikation mit Zettelkästen (1981)1

Read More

KKR 與 ECP 的 500 億美元 AI 基礎設施佈局

Post Title Image (圖說:KKR 總部位於紐約 30 hudson yards。圖片來源:Photo by Illya Goloborodko。)

✳️ tl;dr

  • 新聞追蹤 2024-10-30 1 → 2025-07-30 2
  • KKR 對於科技產業並不陌生,曾於 2006 年就聯合入手 80% 飛利浦半導體事業群,並改名為 NXP Semiconductors。曾經是 Ernest 經手服務的客戶,印象特別深刻。

  • 【2024-10-30】KKREnergy Capital Partners 宣布 500 億美元戰略合作夥伴關係,專注加速資料中心、發電和輸電基礎設施開發,支援全球 AI 和雲端運算擴張 1
  • 合作雙方擁有超過 8GW 現有資料中心管線和 100GW 運營中及可開發的發電能力,KKR 在全球擁有超過 100 個資料中心設施 1
  • ECP 投資於清潔能源資產基礎,在美國市場擁有和營運超過 83GW 的發電能力,涵蓋發電、再生能源、儲能等五個資產類別 1
  • 合作目標是與公用事業、電力生產商和資料中心開發商合作,為超大規模業者快速且負責任地開發大型資料中心園區 1
  • 背景脈絡:BlackRock 於同月推出 300 億美元的 AI 基礎設施基金,由 Microsoft 和 Nvidia 支持,顯示資本競相湧入 AI 基礎設施 1

  • 【2025-07-30】首筆投資落地:德州 Bosque County 建造 190MW 超大規模資料中心園區,從戰略宣布到首個專案公告歷時 9 個月 2
  • 創新共址模式:資料中心與 Calpine 的 Thad Hill Energy Center 天然氣電廠相鄰,代表與超大規模業者的首個此類專屬電力協議 2
  • 透過 CyrusOne 和 ECP 的合資企業建造,預計 2026 年 Q4 啟用,總投資近 40 億美元,初始 IT 容量 144MW,佔地超過 70 萬平方英尺 2
  • Behind-the-Meter 模式:Calpine 提供 190MW 專屬電力,在 ERCOT 電網緊急情況下,電力可轉向支援系統可靠性和地方需求 2

  • AI 驅動的電力需求:Goldman Sachs 預測 2030 年全球資料中心電力需求將較 2023 年增長 165%,AI 資料中心功率密度從傳統 5-10kW/機櫃暴增至 50-200kW/機櫃 34
  • 電網瓶頸嚴重:新資料中心電網連接延遲已達 5 年,Behind-the-Meter 天然氣發電可在 18-24 個月內部署完成,成為務實選擇 5
  • 德州監管環境:SB6 新法規(2025 年 6 月簽署)要求 75MW 以上大型負載承擔電網成本、接受緊急削減,並安裝 ERCOT 控制的「緊急切斷開關」67
  • 私募股權持續加碼:2024 年資料中心投資達 1080 億美元(是 2023 年的三倍),KKR 在 2021 年以 150 億美元收購 CyrusOne,為此次合作奠定基礎 89

Read More

BlackRock 領導聯盟以 400 億美元收購 Aligned Data Centers,創 AI 基礎設施交易紀錄

Post Title Image (圖說:Aligned Data Centers。圖片來源:Aligned Data Centers。)

✳️ tl;dr

  • AIP、MGX 和 GIP 組成聯盟,以 400 億美元 ($40B) 收購 Aligned Data Centers 12
  • 這是 AIP = AI Infrastructure Partnership 成立以來的首筆投資

  • AIP 由 BlackRock、Microsoft、NVIDIA、MGX 於 2024 年 9 月創立 3
  • AIP 目標動員 300 億美元股權資本,包含債務融資後有潛力達到 1000 億美元規模
  • Aligned 擁有 50 個園區、超過 5 GW 運營及規劃容量,橫跨美國與拉丁美洲關鍵數位樞紐

  • 超大規模資料中心市場預計 2025 年達 1673 億美元,
  • 以 23.58% CAGR 增長至 2030 年的 6024 億美元 4
  • 全球資料中心用電量預計從 2024 年的 415 TWh 翻倍至 2030 年的 945 TWh,占全球用電量 3% 5
  • Aligned 持有超過 50 項專利冷卻技術,包括空氣、液體和混合冷卻系統,專為高密度 AI 工作負載設計 16

  • NVIDIA 最新 GB200 晶片每機架功率密度可達 120 千瓦,液冷成為 20 千瓦以上機架的必要技術 78
  • 科威特投資局和新加坡淡馬錫作為 AIP 錨定投資者,顯示主權財富基金對 AI 基礎設施的長期承諾 23
  • 值得注意的是 Macquarie (麥格理資產管理公司) 在 2018 年首次投資 Aligned,7 年內將其從 2 個設施擴展至 50 個園區,實現約 400 億美元估值退出 910

  • 主要科技公司預計 2025 年在 AI 基礎設施上投入 4000 億美元,OpenAI 的 Stargate 計劃單獨就達 5000 億美元 211
  • 美國資料中心功率需求預計從 2024 年的 35 GW 翻倍至 2035 年的 78 GW,平均每小時用電量將增長三倍 12

  • 身為管理者的你:麥格理 在 2018 年入手投資(不只一家資料中心公司), 7 年後退出。即將面對 2026 年的各位,有開啟雷達定位 3~5 年標的了嗎?

Read More

表外融資的 AI 時代: SPV 如何為資料中心熱潮 融資 卻隱藏槓桿風險

Post Title Image (Photo by Ray Hennessy on Unsplash)

✳️ tl;dr

  • Meta 透過 SPV 結構完成近 $300 億美元融資
  • 建設路易斯安那州 Hyperion 資料中心 (數據中心),創下史上最大私募股權交易記錄 1
  • Hyperion 資料中心佔地 400 萬平方英尺,
  • 全面運作時耗電 5 gigawatts,相當於 400 萬戶美國家庭用電量

  • Meta 僅保留 20% 股權,卻維持完全營運控制權,
  • 這種「控制但不合併」的會計技巧讓 $270 億美元債務不出現在資產負債表上 2
  • 股權僅佔總融資的 8.5% ($25 億/$295 億)
  • 保險公司透過私募信貸大量投資此類專案,
  • 但面臨資產負債不匹配風險,在經濟下滑時可能被迫清算投資 3
  • 歷史教訓: 1990 年代電信公司鋪設 8000 萬英里光纖,
  • 泡沫破裂四年後仍有 85%-95% 未使用,被稱為「暗光纖4
  • Meta、Amazon、Google、Microsoft 承諾今年資本支出達創紀錄的 $3200 億美元,大部分用於 AI 基礎設施,但 Meta 10-K 坦承:「無法保證 AI 的使用將增強我們的產品或服務」5

  • 電力基礎設施成為瓶頸之一
  • Grid Strategies 估計到 2030 年資料中心需新增 60 gigawatts 電力,相當於義大利全國峰值需求 6
  • 冷卻技術也是關鍵之一: 從氣冷到直接液冷再到浸入式冷卻,影響長期營運成本 7

  • Morgan Stanley 作為獨家承銷商,同時為多個類似專案提供融資諮詢 1
  • 債券以 144A 格式私募發行,利差高出國債 2.25% 1

  • 技術管理者可以做什麼? (1) 量化 AI 投資的實際 ROI 時間表 (2) 評估電力供應鏈風險 (3) 保持適當的財務槓桿比例

8 9

Read More

AI 的地理學:Claude 經濟指數追蹤 AI 在 150 個國家的真實世界影響

Post Title Image (Photo by The New York Public Library on Unsplash)

✳️ tl;dr

  • 2025-09-15 Anthropic 發布第三份 Economic Index(從不同維度切入),首次追蹤 Claude 在 150+ 國家和美國所有州的使用模式。 1
  • (可能是模型業界第一份完整的地理分布 AI 採用數據?!)
  • 企業 API 客戶的自動化率達 77%,遠高於消費者用戶的 50%,顯示企業正在積極將 AI 從協作工具轉向生產力替代方案。
  • 指令式自動化在 8 個月內從 27% 躍升至 39%,這是首次自動化(49.1%)超越擴增(47%),反映模型能力提升帶來的用戶信心增長。

  • API 使用的價格敏感度僅 3%(成本指數每增 1% 僅減少 0.29% 使用),企業優先考慮 能力價值 而非 成本,
  • 推測原因是 隱藏的基礎設施成本 遠超 模型費用(每 1 美元模型費需額外 5-10 美元才能落地、達到 production ready)。
  • Ernest 的現場觀察也相同,會嫌 token 貴的需求提出者,通常自身沒有健全的組織營運系統或工作流程。反之則會看出整體創造的價值,而勇於導入 AI。
  • 約 5% 的 API 流量專門用於開發和評估 AI 系統,形成「AI 開發 AI」的遞迴改進循環,推測這可能加速能力提升但也需要更強的安全監督。
  • 美國州際 GDP 彈性(1.8)顯著高於跨國(0.7),但收入的解釋力反而較低,說明產業組成和經濟結構是更強的採用驅動因素。

  • AUI = Anthropic AI Usage Index
  • 華盛頓特區 AUI 最高(3.82),主要用於文件編輯和資訊搜尋;加州(第三)側重程式設計;紐約(第四)偏好金融任務,地方經濟結構直接映射到 AI 使用模式。
  • 教育指導任務增長 40%(9% → 13%),科學研究增長 33%(6% → 8%),顯示知識密集型領域的快速採用,推測高技能工作者正在利用 AI 提升專業能力。
  • 商業管理任務下降 40%(5% → 3%),金融營運任務減半(6% → 3%),推測這些領域可能正在被自動化或用戶轉向更專業化的工具。
  • 富裕國家傾向使用 AI 進行擴增協作(augmentation),貧窮國家更偏好自動化(automation),控制任務組合後每增加 1% 人口調整使用量對應約 3% 的自動化減少。

  • 研究使用隱私保護分類方法結合 O*NET 資料庫(19,498 個任務描述)和 Claude 自有分類系統雙重驗證,確保數據匿名化。
  • 但其靜態性質和粗粒度分類可能無法捕捉 AI 創造的新興任務和不同複雜度的程式設計工作。 23
  • 企業 AI 真實成本包括數據工程、安全合規、持續監控和整合架構,遠超表面的 API 費用,推測這解釋了為何企業對價格不敏感。 45
  • 模型能力提升(Sonnet 3.6 → 4.x 系列)直接驅動行為變化,更好的輸出品質減少迭代需求,推測未來更強大的模型可能進一步提高自動化佔比並改變人機協作模式。

1 4 5 2 6 7 3 8 9

Read More

Amazon Bedrock AgentCore 正式上線 (GA):為 AI Agents 量產環境打造企業級基礎設施

Post Title Image (圖說:早起在咖啡店邊吃可頌、邊喝咖啡、邊聊 AI Agent 與人生。拍攝於 Anchorhead Coffee西雅圖。圖片來源:Ernest。)

✳️ tl;dr

  • 今年八月底出差,原本以為是去北美抓住夏天的尾巴,沒想到路過灣區和西雅圖,大家都在提 AI Agent、Agentic Workflow
  • 有幸能在 AWS New York Summit 之後試玩一波 Amazon Bedrock AgentCore
  • 好在幾年前曾在 COSCUP 分享過 Firecracker microVM,知道這玩意兒的勇猛與隔離的安全性
  • 當年開了一台 i3.metal EC2 Bare metal 機器起來玩,90 秒以內可以用 Firecracker 跑起 4,000 個 microVM 1,並且用視覺化的方式來呈現整個喚起的過程,啟動速度較不擔心(當然還是要看場景(但我傾向不需要提醒 AI Agent 欲速則不達 :p
  • 你看連隔壁棚 Cloudflare Container 都來借用 Firecracker 開源專案來封裝服務 2

  • 今天 (2025-10-13) AWS 正式發布 Amazon Bedrock AgentCore,這是一個企業級 agentic 平台,旨在幫助組織將 AI agents 從試驗階段推進到生產環境 3
  • AgentCore SDK 已被下載超過 100 萬次,早期客戶包括 Clearwater Analytics、EricssonSony、Thomson Reuters 等跨產業企業
  • 採用 microVM 技術提供企業級安全隔離,每個 agent 會話運行在獨立的虛擬機實例中,防止數據洩漏和跨租戶攻擊

  • AgentCore 提供可組合的服務,支援多種框架包括 CrewAI、Google ADK、LangGraph、LlamaIndex、OpenAI Agents SDK、Strands Agents
  • 可使用 Amazon Bedrock 上的模型,也可使用外部模型如 OpenAI 和 Gemini
  • AgentCore Code Interpreter 讓 agents 在隔離環境中安全生成和執行代碼
  • AgentCore Browser 允許 agents 大規模與網頁應用程式互動
  • AgentCore Gateway 將現有 APIs 和 AWS Lambda 函數轉換為 agent 相容工具
  • Gateway 連接到現有的 MCP servers 並整合第三方工具如 Slack、Jira、Asana、Zendesk
  • AgentCore Identity 讓 agents 使用 OAuth 標準安全地存取和操作各種工具
  • AgentCore Memory 幫助建立具備上下文感知能力的 agents,無需管理複雜的記憶體基礎設施

  • 透過 microVM 技術提供業界領先的安全性,每個 agent 會話都有獨立的隔離運算環境
  • AgentCore 的 MCP server 可與 Kiro 或 Cursor AI 等 IDE 整合
  • 提供業界領先的八小時運行時間,支援長時間運行的任務

  • 既然 GA (正式釋出)了,就不用等排隊申請了,直接開起來玩玩看吧

  • 落地 AI Agent 需要搭配現有工作流程、需要磨合、需要對其組織目標
  • 需要 Process Automation 白板的朋友,可延伸閱讀 4

  • 是說… 後來九月回程反而在東京被夏天的尾巴掃到,整個熱爆… 好佩服日本大叔們整套西裝上身 Orz…

Read More

超越效率的思考:AI 時代保留「手寫」筆記的神經科學證據

Post Title Image (圖說:準備開箱 Remarkable Paper Pro。圖片來源:Ernest。)

✳️ tl;dr

  • Ernest PKM 1 有提到我仍保有紙本筆記,以及搭配使用數位手寫筆記。
  • 去年添置了一疊紙 reMarkable Paper Pro 也是以手寫為基礎。
  • 總有個感覺是,在成堆混雜的資訊中,一但某個時刻我想要靜一靜釐清當下的複雜認知,
  • 通常會抱著某個手寫工具,戴上降噪耳機,靜坐幾分鐘,然後開始動筆嘔吐輸出、分類、比較,
  • 總能理出個頭緒。就算沒長出脈絡,也長出了個枝枒。
  • 但感覺總歸是感覺,總想要找個歸因(哎,算一種壞習慣嗎,總之是種習慣動作,在台積的 root cause 習慣養成太扎實了

  • 找著找著,找到了 Dr. Audrey van der Meer 2 長期關注這個領域,
  • 以下是她 2024-01 發表的一篇研究結果。 34
  • 研究記錄了 36 名大學生使用數位筆手寫和鍵盤打字時的腦電活動。
  • 手寫時大腦連接模式比打字時更為複雜精細
  • 手寫產生廣泛的 theta/alpha 頻率連接性模式,這些模式對記憶形成和學習至關重要。

Read More

The Westin Building Exchange

Post Title Image (圖說:當年參訪 Amazon Spheres 的時候,剛好有拍到 The Westin Building,照片中的最左邊那一棟建築物。圖片來源:Ernest。)

✳️ tl;dr

  • 之前在西雅圖市區路過開會、或探訪咖啡與美食,走來晃去一直經過它,沒想到大有來頭。
  • 威斯汀大廈交換中心是位於華盛頓州西雅圖市中心的大型電信樞紐設施。 1
  • 該建築建於 1981 年(跟我差不多年代 XDD),
  • 最初名為威斯汀大廈,是當時總部位於西雅圖的威斯汀酒店集團的辦公室。
  • 它也是西雅圖網際網路交換中心(SIX) 和 Pacific Northwest Gigapop Pacific Wave Exchange 的所在地。

  • 自 2019 年或更早起,該建築資料中心產生的熱量透過管道輸送到亞馬遜的多普勒大樓 (Doppler) ,用於隔壁多普勒大樓和其他幾棟亞馬遜大樓的暖氣供應。
  • 亞馬遜估計,在該系統 25 年的預期使用壽命內,它將節省 8,000 萬千瓦時的電力,相當於 6,500 萬磅煤炭。

  • 起因是看到 The Verge 報導 Microsoft 打算將 GitHub 整個搬移進 Azure,而好奇在被收購之前的基礎設施情形。2
  • GitHub 在 2018 年被 Microsoft 收購。所以回頭查詢 2017 年的情況。
  • GitHub blog 曾描述:“Those facilities don’t store customer data, rather they’re focused on internet and backbone connectivity as well as direct connect and private network interfaces to Amazon Web Services.” 3
  • GitHub 現在 (2025) 正進行(史上?)最大規模的基礎設施遷移計劃,計劃在 24 個月內將整個平台從自有資料中心遷移到 Azure。
  • 這次遷移的核心驅動力是 AI 工作負載的爆炸性成長:GitHub Copilot 每天產生數百萬次程式碼建議,消耗大量運算容量,現有資料中心已達到物理擴展極限。(對外總是會有一套說法,聽聽看看參考就好)(有一種冷,叫做阿罵覺得你冷。有一種移,叫做____就請你移?!)
  • 遷移策略:大部分工作需在 12 個月內完成(因為需要新舊系統並行運行至少 6 個月),GitHub 已要求團隊延遲功能開發,優先處理基礎設施遷移。

  • GitHub 在 2024 年經歷了 119 起事件,包括 26 起主要中斷,平均修復時間約 106 分鐘。4
  • 好奇搬家之後的表現。
  • 有在使用 GitHub 的各位技術管理者們,好奇各位怎麼看?會觸發做些準備嗎?

5 6

Read More