OpenAI 發布新模型 GPT-4o

AI SPOTLIGHTS:

  • 📣 OpenAI 發布新模型 GPT-4o

  • 📣 Google I/O 開發者大會重磅更新

  • 📣 Android 手機進入 AI 時代

  • 📣 蘋果宣布 iOS 18 引進眼動追蹤功能

  • 📣 ElevenLabs 推出 AI 語音螢幕閱讀 APP

  • 📣 Arup 墮深偽 (Deepfake) 技術騙案

  • 📣 Sony Music 警告生成式 AI 公司

  • 📣 Z 世代和千禧世代對 AI 持樂觀態度

AI 資訊

圖片來源: OpenAI

  • OpenAI 宣布推出 GPT-4o 新模型,所有 ChatGPT 用戶 (包括免費用戶) 即將可以使用 GPT-4o 模型,付費用戶將繼續「擁有免費用戶五倍的容量限制」。

  • GPT-4o(“o”代表“o​​”),這個 o 就是 "Omni"。它接受文字、音訊和圖像的任意組合作為輸入,並產生文字、音訊和圖像的任意組合輸出。

  • GPT-4o 可以在短至 232 毫秒的時間內響應音訊輸入,平均為 320 毫秒。

圖片來源: Google

  • Google I/O 大會發布一系列 AI 更新,亮點包括: 

  • Gemini 升級

  • 增強 Gemini 1.5 Pro 的翻譯、推理和編碼能力,上下文視窗增加了一倍,達到 200 萬個 token。

  • Project Astra

  • Project Astra 是一個多模態 AI 助手,可以觀看並理解透過裝置相機看到的內容,並執行用戶要求的任務,從找到遺失的眼鏡到審查程式碼。 

  • Veo

  • Veo 與 OpenAI Sora 類似,是 AI 生成視頻模型,可根據用戶提示,生成超過 1 分鐘的 1080p 視頻。

  • Google 表示,生成的影片「更加一致和連貫」,在整個鏡頭中描繪了人、動物和物體的更真實運動。

  • Google 正邀請電影製作人和創作者試驗該模型。

  • AI Search

  • 在 Google I/O 大會上,宣布全新的 AI 搜尋功能「AI Overviews」在美國全面上線。

  • 未來 Google 搜尋結果的第一順位將是由 AI 整理、總結的內容,用戶可以直接獲得答案,不需要再點進網站連結。

圖片來源: Google

  • Google 在其 I/O 開發者大會上宣布,Android 用戶可以在手機上體驗 Google AI。

  • Google 的 Gemini Nano 模型將於今年稍後整合到 Pixel 中。

  • Android 用戶很快將能夠在應用程式頂部調出 Gemini 的覆蓋層,以便以更多方式使用 Gemini,該覆蓋層改進並理解上下文以提供動態建議。

  • Circle to Search 功能允許用戶查詢螢幕上的任何內容,並透過 LearnLM 模型幫助學生做作業。Circle to Search 將能夠幫助解決涉及符號公式、圖表、圖形等的更複雜問題。

  • Google 將很快推出一項新的 AI 安全功能,對疑似詐騙的電話提供即時警報。

圖片來源: Apple

  • 蘋果宣布 iOS 18 推出推出一系列新的輔助功能,包括 AI 驅動的眼動追蹤、音樂觸覺、聲音快捷鍵等。

  • 眼動追蹤這項功能可讓用戶僅用眼睛控制 iPad 或 iPhone。

  • Music Haptics 是聾啞或聽力障礙用戶在 iPhone 上體驗音樂的新方式。iPhone 中的 Taptic Engine 會根據音樂音訊播放敲擊聲、紋理和精緻的振動。使用戶能夠透過 iPhone 的 Taptic Engine 體驗音樂。

  • 聲音快捷方式將允許用戶指派 Siri 可以理解的自訂短語來啟動捷徑並執行任務。

  • 這些新功能將於今年稍後透過 iOS 18 和 iPadOS 18 等軟體更新上線。

  • OpenAI 春季發布會後,OpenAI 聯合創始人兼首席科學家 Ilya Sutskever 宣布離職。

  • Sutskever 表示,他相信 OpenAI 將在目前的領導下「打造既安全又有益的 AGI」。同時離職的還有 Superalignment 聯合領導 Jan Leike。

  • OpenAI 執行長 Sam Altman 任命 Jakub Pachocki 為新任首席科學家,他是創建 GPT-4 的關鍵研究員。

圖片來源: ElevenLabs

  • ElevenLabs 推出了一款免費的 iPhone 應用程序,名為 ElevenLabs Reader: AI Audio,不過暫時只可在 US、UK 和加拿大使用。應用程式功能包括:

  • 文本閱讀器:以高品質、類似人類的聲音朗讀任意長度的文本。 

  • 控制閱讀速度:加快或減慢敘述者的速度,讓用戶以喜歡的速度聆聽。 

  • 適用於多種類型的內容:撰寫文字、貼上網頁連結或上傳 PDF。 

圖片來源: ARUP

  • 英國設計及工程公司 Arup 證實,該公司一名香港員工被詐騙集團以「深偽技術(Deepfake)」騙走 2,500 萬美元。

  • 在這騙局中,一名財務人員被騙與他認為是首席財務官和其他員工的人進行視訊通話,但結果證明所有這些人都是 Deepfake 生成的。

圖片來源: Sony

  • Sony Music 向 700 多家生成式 AI 公司和串流媒體平台發送正式信函,禁止他們挖掘文字或資料、網頁抓取或以其他方式使用任何內容。

  • 其中涵蓋了各種各樣的內容,包括錄音、音樂作品(包括歌詞)、封面藝術作品和元數據。

AI 調查報告

圖片來源: Deloitte

  • 德勤發布 2024 年 Z 世代和千禧世代調查,對 44 個國家的 23,000 名 Z 世代和千禧世代員工進行調查。

  • 經常使用 AI 的 Z 世代和千禧世代認為 GenAI 的使用可以改善工作/生活平衡、增強工作效率並騰出時間。

  • 60% 的員工表示,AI 驅動的自動化將在未來消除工作崗位。

  • 經常使用 GenAI 的用戶比非用戶更擔心,他們需要尋找不易受自動化影響的工作機會,而年輕一代會因為 GenAI 而更難進入勞動力市場。

AI 工具

  • StickerBaker 是一款 AI Sticker 貼紙創作工具,用戶只需輸入文字提示詞,就可以生成貼紙。

  • StickerBaker 由 replicate 和 flydotio 提供支持,100% 開源

❤️ 應謝支持 Pulse AI 電子報!! 您的點讚及訂閱,是我持續更新的動力 ❤️

▶︎ 訂閱 YouTube 頻道,獲取最新 AI 教學

▶︎ 更多 AI 工具: https://bit.ly/ai-tools-pro

▶︎ 熱門文章: https://bit.ly/ai-hot-topic

▶︎ 新手教學: https://bit.ly/for-newbies