(圖說:AWS re:Invent 2025 Keynote with Peter DeSantis and Dave Brown。圖片來源:AWS。)
AWS Utility Computing 資深副總裁 Peter DeSantis 與 Dave Brown 在 re:Invent 2025 登台發表主題演講,深入探討驅動 AI 時代的基礎設施根基。他們並未追逐最新的 AI 炒作,而是提出了一個有力的論點:我們過去二十年所仰賴的核心雲端屬性 – 安全性、可用性、彈性、敏捷性與成本 – 在今天比以往任何時候都更加重要。發布內容涵蓋 Graviton5(單一封裝 192 核心,L3 快取提升 5 倍)、Lambda Managed Instances(橋接 EC2 與 Lambda 的鴻溝)、S3 Vectors 正式可用(在 20 億向量上實現次 100 毫秒查詢)。在 AI 加速方面,Trainium3 UltraServer 每百萬瓦輸出 5 倍 tokens,而 PyTorch 原生支援意味著將 GPU 程式碼移植到 Trainium 僅需修改一行程式碼。
✳️ tl;dr 重點摘要
一個主題「Infrastructure Fundamentals for the AI Era」貫穿全場,分為六大段落:
- 核心雲端屬性:安全性、可用性、彈性、敏捷性與成本仍然是根基。這些屬性引導了 AWS 過去 20 年的每一個決策,在 AI 時代更加關鍵。
- Nitro 與 Graviton 演進:從消除虛擬化抖動 (時基誤差) 的客製化 Nitro 晶片 到 提供 192 核心與 5 倍 L3 快取的 Graviton5。M9g 執行個體效能比 M8g 提升最高 25%。客座講者:Payam Mirrashidi(Apple)分享 Swift + Graviton 達成 40% 效能提升。
- 無伺服器擴展:Lambda Managed Instances 橋接 EC2 效能與 Lambda 簡便性之間的鴻溝。你的 Lambda functions 執行在你選擇的 EC2 執行個體上,而 Lambda 負責管理佈建、修補、擴展。
- 推論與 Bedrock 架構:Project Mantle 推論引擎為 Bedrock 提供動力,支援服務層級(priority、standard、flexible)、逐客戶佇列公平性、Journal 容錯機制,以及機密運算。
- 向量搜尋與 S3 Vectors:Nova Multimodal Embeddings 將文字、圖像、影片、音訊統一到共享的向量空間。S3 Vectors GA 在 20 億向量上實現次 100 毫秒查詢。4 個月內建立超過 25 萬個向量索引。客座講者:Jae Lee(TwelveLabs)談影片智慧。
- Trainium3 與 AI 加速:Trainium3 UltraServer 搭載 144 顆晶片、360 PetaFLOPS、20TB HBM。每百萬瓦輸出 5 倍 tokens。NKI GA 與 Neuron Explorer 用於效能分析。PyTorch 原生支援。客座講者:Dean Leitersdorf(Decart)談即時視覺智慧。
✳️ 現場回顧
(圖說:原本這一場都是安排在週一晚上,原名為 Monday Night Live,經常因為週一晚上安排了晚餐或會議而錯過只能事後補課。今年則是與其他任務衝堂,只好拿 CEO Keynote 講台上現場展示的 Amazon EC2 UltraServer 和可愛又調皮愛躲藏的 Kiro 照片來充數,為各位呈現在雲端抽象的背後真實存在物理與通訊協定的世界。)