為了開發這個龐大的模型,Gemini 特別依賴 Alphabet 透過 YouTube、Google 圖書、Google 搜尋和 Google Scholar 等平台收集的資料的廣度和深度。它還使用名為 TPUv5 的最先進的訓練晶片,據稱這是世界上唯一能夠協調 16,384 個
晶片協同工作的晶片。谷歌團隊
也使用類似於開發 AlphaGo 的方法來訓練模型,AlphaGo 是一種比國際象棋更複雜的遊戲。此外,與 LaMDA
(Google 透過監督學習 波蘭電報數據 訓練的大型會話語言模型)不同,Gemini 是透過 GPT-3 和 GPT-4 等強化學習進行訓練的。這種機器學習技術涉及人工智慧代理在動態環境中透過反覆試驗來學習執行任務。
根據 The Information 報道,Google Brain和 DeepMind 團隊的幾位前成員目前正在致力於該項目,其中包括Google聯合創始人謝爾蓋·布林 (Sergey Brin)。此外,根據同一消息來源,Google可能會引入 Gemini 作為 Google Bard 的更新,或在使
用 Gemini 為 Google Docs 等各種產品提供支援之前創建一個新的聊天機器人。 Gemini 可能很快就會發布,可能是為了回應 OpenAI 即將於 2024 年初發布的 GPT-5 之前的 GPT-4.5 版本。谷歌表
示:「經過改進和嚴格的安全測試後,Gemini 將提供多種尺寸和容量,類似於 PaLM 2。」但沒有提供更多細節。
可能縮短使用者旅程
目前,GoogleSGE(Google人工智慧增強搜尋體驗)正在約一百個國家進行測試。這個版本的Google提供人工智慧生成的文字、提要和
對話模組。對於某些查詢,此搜。根據 Exposure Ninja 的一個例子,搜尋搬家程序的「房地產律師」資訊的使用者可能只會造訪該網站四次,而傳統搜尋則為八次。
透過 Exposure Ninja 進行使用者搜尋
來源:來源曝光ninja
如果 Gemini 最終與 SGE 整合會發生什麼? Exposure Ninja 創辦人 Tim Cameron-Kitchen 警告:「將Gemini 回覆分發給SGE 的相 IT、技術與數字——這三個術語是同義詞還是有區別? 關成本最初意味著Google 不太熱衷於提供基於Gemini 的SGE 結果,除非有必要。
如果在 SGE 中實作 Gemini,系統預測使用者假定需求的多模式能力可以進一步縮短搜尋階段。使用Gemini可以在搜尋結果中為使用者後續的問題提供直接的答案。據 Exposure Ninja 稱,在前面的範例中,這可能會創建一個僅需要 美國數據 訪問 三個網站的搜尋旅程。
用戶搜尋意圖
來源:來源曝光ninja
Tim Cameron-Kitchen 表示,在 SGE 中使用 Gemini 還可以實現“更少的重複、更好的結構化響應(邏輯上遵循搜尋路徑)以及更好的多模式功能整合。”值得注意的是,對於這位數位行銷專家來說,網站訪問量的潛在減少可能會被以下事實所抵消:連結仍然存在於產生的回應中,人們仍然透過 Google 購買網站。
Gemini 的潛在用途
Gemini 有潛力用於各種應用,包括:
聊天機器人:Gemini 可用於創建更複雜、更自然的聊天機器人。以 Gemini 為基礎的聊天機器人可用於客戶服務、回答問題,甚至進行對話。
文字摘要:Gemini 可用於產生更準確、簡潔的文字摘要。 Gemini 支援的文本摘要可用於幫助人們理解長文章或文件。
創意內容產生器:Gemini 可用於產生創意內容,例如詩歌、腳本或音樂。由 Gemini 提供支援的創意內容產生器可用於創造新的藝術或娛樂形式。
機器學習應用:Gemini 可用於提升機器學習應用的效能。 Gemini 可用於訓練更準確、更有效率的機器學習模型。
我們如何使用 Google Gemini AI
Google Alphabet 執行長 Sundar Pichai 在 2023 年 Google I/O 大會上強調了在使生成式 AI 變得更加用戶友好方面取得的進展。這些進步包括 PaLM 2 和 Gemini。 DeepMind 的 Gemini 專門設計為多模式,使其能夠理解不同類型的數據,例如文字、圖像和程式碼。這種多功能性使其能夠在多項任務中表現出色: