網際網路正在為機器重建
重點摘要
雲端基礎設施歷來假設可預測的、人類驅動的行為模式——搜尋、點擊與串流。 AI 代理改變了這種動態,會產生突發且強烈的活動高峰,然後同樣迅速地消失。 作為回應,像 AWS 這樣的公司正在重構核心服務,使計算與儲存分離,讓資源在閒置時能擴展到零,在需要時能立即暴增。此舉旨在降低浪費的成本,並在代理從試驗走向生產時支援機器對機器的流量。
情緒分析
- 整體情緒:正面偏中立。本文在讚賞技術創新與承認重大的營運與經濟變動之間取得平衡。它強調實際優勢——即時可擴展性、閒置時的成本節省以及更好地處理代理工作負載——同時也指出改造傳統系統的規模與複雜性。語氣偏向前瞻:基礎設施供應商正積極回應機器產生流量的成長趨勢,但過渡涉及重大的架構改變與產業範圍內的持續調適。
文章內文
雲端平台是圍繞人類行為而建立:使用者以相對可預測的模式搜尋、點擊、捲動與串流。然而,人工智慧代理的運作方式不同。它們可以衍生出許多平行程序,查詢數十或數百個資料來源,並在終止前快速連續呼叫 API。這些由代理驅動的工作流程會產生突發的活動高峰,然後是長時間的閒置期——這類模式是傳統雲端架構未被設計來有效處理的。
Amazon Web Services 最近宣布改良版的 OpenSearch Serverless,旨在回應這些新需求。該服務是一項為代理工作負載量身打造的受管搜尋與向量資料庫,能在代理啟動任務時立即擴展計算,並在閒置期間縮減到零。這種行為反映出產業的更廣泛認知:為人類使用者優化的基礎設施在面對機器產生的流量時可能效率低下且成本高昂。
機器流量已經是網際網路活動中的重要部分,且預期還會成長。近期測量顯示,機器人佔了相當比例的 HTTP 流量,AI 爬蟲、助理與自動搜尋器佔有顯著份額。產業觀察者預測,非人類流量在不久的將來可能超越人類流量。隨著組織允許 AI 系統執行如產品研究、訂旅行或與應用互動等任務,消費者與企業環境都將產生越來越多的自主請求。
AWS 新一代 OpenSearch Serverless 的根本技術變化是將計算與儲存分離。透過解耦這些層級,計算資源能夠按需配置——在數秒內擴展以應對突發代理流量,並在閒置時擴展到零以避免閒置費用。先前即便是 serverless 模型也至少需要一個執行中實例,因為計算與儲存是相連的,這意味著客戶在未使用時實際上仍為保留的容量付費。新的做法類似計量式資源使用:當計算運行時付費,未運行時不付費。
這一轉變對成本模型與架構設計有立即的影響。內部部署代理或向客戶提供代理服務的企業需要能回應不可預測工作負載且不產生持續基線成本的基礎設施。通過啟用與獨立儲存綁定的短暫計算,供應商可以為代理應用提供更具經濟效率且更具回應性的後端。
在推出時,OpenSearch Serverless 與 AI 開發平台整合,允許開發者為代理部署搜尋與向量後端而無需管理底層基礎設施。這種整合降低了運維摩擦,並幫助團隊更快地將代理部署從試驗推向生產。 實際結果是代理在大規模運行時變得更便宜且更容易,這很可能加速其在各行各業的採用。
產業的回應不限於 AWS。其他雲端與資料公司也在重新定位其產品,作為 AI 的檢索與記憶系統。資料平台正在將自身定位為模型的企業記憶,而主要雲端廠商也在更新服務以支援代理工作負載的快速擴展並促進代理之間的共享記憶。網路與邊緣供應商也在推出功能,為機器客戶提供持久環境與瞬時擴展能力。
將基礎設施調適為以機器為先的網際網路是一項複雜的多年工程。這需要重新思考成本結構、營運實務以及搜尋、儲存與訊息等核心服務的設計。然而誘因很明顯:隨著代理處理更多面向使用者與後端的任務,能支援高度可變之機器對機器流量的系統需求將會增加。能成功提供彈性、高效且整合解決方案的雲端供應商,將促成代理更廣泛且更具成本效益的部署,進而重塑應用的建構方式與資源的消耗模式。
總之,像 OpenSearch Serverless 這類服務的演進顯示出由 AI 代理驅動的雲端架構關鍵轉變。透過將計算與儲存分離並強調即時可擴展性與成本效率,供應商正為一個機器產生流量將成為網路主力的未來做準備。
關鍵見解表
| 面向 | 描述 |
|---|---|
| 流量模式變化 | AI 代理會產生突發高峰及長時間閒置期,與穩定的人類驅動使用不同。 |
| 技術轉變 | 將計算與儲存解耦可讓計算瞬間擴展並在閒置時降為零。 |
| 經濟影響 | 按使用付費的模型降低了因保留閒置計算而產生的浪費,使運行代理的成本更低。 |
| 產業動向 | 多家雲端與資料供應商正在調整服務以支援檢索、記憶與代理工作負載。 |