文章上線

親身體驗 Google 即將推出的 AI 眼鏡:接近未來但尚未完美的預覽

親身體驗 Google 即將推出的 AI 眼鏡:接近未來但尚未完美的預覽

目錄

你可能想知道的事

Google 新款具備 AR 能力的眼鏡除了音訊功能外,是否能提供實用的日常視覺體驗?

這款原型眼鏡在翻譯、導航和拍照等真實世界任務上的表現如何?

主要主題

在 Google 的 I/O 開發者大會上,我們短暫體驗了 Google 即將推出的 AI 眼鏡。這並非 Google 計畫於今年秋季出貨的僅有音訊功能的鏡框;我們測試的原型包含內嵌鏡片顯示器,可將資訊疊加在真實世界上。這款在去年的活動中首次亮相的 Android XR 眼鏡,會在你的視野中直接呈現小工具,用於天氣更新、步行路線、叫車詳情、即時翻譯,甚至 AI 生成的自訂小工具。Google 表示這些裝置最終會與 iOS 與 Android 手機配對,且顯示器型代表比先前較快到貨的僅音訊產品更進一步。

硬體是與 Warby Parker、Gentle Monster 以及 Samsung 等消費品牌合作研發,以將 Google 的軟體與熟悉的眼鏡美學結合。我們試用的機種明顯是原型:主要用來測試內部顯示技術、電池行為與軟體互動,而非最終款的造型或配戴舒適度。因此,這些示範鏡框與 Google 計畫出貨的精緻消費款有顯著差異;原型優先在核心功能上做實驗,而非外觀細節。

我們的示範中缺少零售產品預期會有的一些功能。例如,出貨版本的眼鏡會偵測是否佩戴或摘下,但原型並未包含此感應器。啟動 Google 的助理 Gemini 很簡單:長按右側鏡框兩秒會發出啟動提示音並讓裝置進入聆聽模式。在示範機上,啟動 Gemini 時預設也會開啟相機,但 Google 表示最終產品會讓使用者選擇是否要在助理啟動時同時啟用相機。

我們嘗試了幾項日常任務。請求 Gemini 播放特定藝人的音樂時,音樂會透過眼鏡的喇叭播放。現場環境吵雜,即使在高音量下,音質仍不及高階耳機的清晰度與細節。整體印象是,這類眼鏡方便在戶外隨性聆聽或做家務時使用,但在音訊保真度很重要的情況下,並不能取代專用耳機。然而,不戴入耳式耳機相比某些入耳透明模式,能更容易聽見周遭的人,這在社交或公共場合可能是一項優勢。

控制播放很直觀:輕觸鏡框側邊一次即可切換音樂關閉。拍照方面,我們使用專用拍攝按鈕拍攝靜態影像;原型會將影像傳到配對的手機和手錶。原型不支援(長按觸發的)影片錄製,但 Google 解釋影片片段將產生縮圖預覽,而非獨立照片。你也可以請 Gemini 拍照並套用 AI 編輯——例如把一個人轉換成動漫風格。照片會上傳到手機與雲端進行處理,然後回傳已編輯的結果。由於會場網路擁擠,來回處理大約花了 45 秒左右。

啟用顯示器後,一個簡單的主畫面會出現在你的視野中。示範裝置顯示了預載小工具,例如天氣與 I/O 倒數計時。可加入 Google Maps 或 Translate 等應用程式的快速啟動捷徑以便更快速存取。我們使用的原型在右眼上方有單一顯示器,儘管平台支援單/雙顯示或僅音訊的配置。測試時影像看起來略為柔和;這可能受到我戴的度數隱形眼鏡影響,因為我們的隱形眼鏡每眼使用不同的屈光度。閉上一隻眼後影像變得較為銳利,但在示範過程中我仍感到右眼上方有些眼睛疲勞,目前尚不清楚這是否與原型光學或我的處方鏡片有關。

其中一個最吸引人的示範是即時語言翻譯。在配對手機上的 Google 翻譯支援下,眼鏡偵測到快速的西班牙語語音,在使用者視野中顯示英文文字,並同時透過 Gemini 播放英文語音翻譯。這種視覺與聽覺結合的翻譯對旅客特別有用。Google 指出翻譯功能也會在僅音訊的眼鏡上運作;在那種情況下,使用者會透過鏡框喇叭聽到翻譯,如果需要文字可以在手機上查看逐字稿。

導航是另一個實用的使用情境。我們請 Gemini 指引到附近的咖啡廳,眼鏡便在手機上啟動 Google Maps,同時在佩戴者視線中顯示逐步轉向指示。直視前方會顯示下一個轉彎資訊,而往下看則會顯示熟悉的藍點地圖以供定位。地圖互動與手機上的 Google Maps 綁定,因此像“家”和“公司”這類已儲存地點已可使用。由於地圖在你抬頭時會從視野消失,它允許在不阻礙步行的情況下仍提供即時的導航提示。

眼鏡也能辨識物體並回答相關問題。在一項測試中,裝置一開始無法辨認一幅莫內複製畫,因為原型需要在應用程式中明確啟用相機;在啟用相機並靠近畫作簽名處後,系統才識別出是莫內。其他物品,例如植物或食譜書中的細節,則能較順暢地被識別與描述。雖然這些功能在某些方面與現有的 Google Lens 及手機 AI 工具重疊,但眼鏡的免持、隨時可用特性,能讓此類互動在許多情境中更自然與便利。

Google 計畫在今年晚些時候擴大針對 Android XR 顯示眼鏡的受信任測試者計畫,並承諾屆時會公布更多細節。在近期內,公司會先出貨僅音訊的眼鏡,這讓他們有時間在市場上保有產品的同時,優化顯示硬體與軟體。音訊版與顯示版皆整合了用於語音互動的 Gemini,並透過鏡框喇叭播出。使用者將能做像是聽音樂、拍照、撥打電話,以及透過語音指令與手機應用互動等操作。Google 也示範了 Gemini 如何整合第三方工作流程,例如從食譜中擷取食材並加入購物清單,或在你烹飪時評估一道菜並提供熟度回饋。

總體而言,原型展現出明顯的潛力——特別是在情境翻譯、免持導航與快速相機互動方面——但體驗尚未能完全取代高階音訊或長時間顯示使用。 示範突顯出核心功能已準備就緒的程度,同時也強調了在消費者發售前仍需改進的領域——影像清晰度、人體工學、電池行為,以及 AI 編輯時受網路影響的延遲。

關鍵洞見表

面向 描述
設計與合作夥伴 與 Warby Parker、Gentle Monster 及 Samsung 共同開發,將 Google 的技術與既有的眼鏡設計結合。
原型重點 目前機種優先測試顯示技術與電池效應,而非最終的配戴與外觀設計。
音訊品質 適合休閒聆聽;根據嘈雜示範的印象,無法取代高保真耳塞。
顯示體驗 單眼原型顯示可用,但看起來略微模糊且測試中導致輕微眼睛疲勞。
翻譯與導航 即時翻譯(語音 + 文字)與免持導航是突出的實用功能。
相機與 AI 編輯 照片拍攝與雲端 AI 編輯可行,但處理時間會隨網路條件而異。

後續……

展望未來,開發者與硬體團隊應持續改進光學清晰度、舒適度與電池效率,同時透過本機模型與優化的雲端流程來降低 AI 延遲,以提升回應速度。探索混合處理——將某些對延遲敏感的任務在本機執行,而將較重的編輯卸載到雲端——可能有助於改善即時性。此外,隨著配備顯示器的可穿戴裝置變得更普遍,提升隱私控制與為相機啟用提供明確的使用者選擇也將非常重要。

對於緊湊顯示光學、低功耗 AI 加速器,以及用於翻譯和視覺任務的強韌離線模型的進一步研究應列為優先事項。這些進展將使下一代具 AR 能力的眼鏡在日常使用上更實用、更舒適且更具回應性。

最後編輯時間:2026/5/23

數字匠人

閒散過客