Meta 在 Meta Connect 2024 一系列更新

AI SPOTLIGHTS:

  • 📣 Meta 在 Meta Connect 2024 一系列更新

  • 📣 ChatGPT 高級語音模式正式推出

  • 📣 OpenAI 領導層又再經歷重大變化

  • 📣 AI 以 100% 準確率擊敗 Google 的 reCAPTCHA

  • 📣 Runway 推出基金,支持使用 AI 製作電影

  • 📣 Google 在 Gmail 推出 Gemini 智慧回覆

  • 📣 X世代:AI 最不了解的一代?

AI 資訊

  • Meta 宣布推出語音模式,類似於 ChatGPT 的高級語音模式,允許用戶在 Messenger、Facebook、WhatsApp 和 Instagram DM 上使用語音與 Meta AI 交談,該功能已在部分國家/地區推出。

  • Llama 模型:Meta 最新的 Llama 3.2 模型是 Llama 模型第一個能夠理解圖像和文字的主要視覺模型,具有 11B 和 90B 參數版本。

  • 智慧眼鏡升級:Ray-Ban Meta 智慧眼鏡獲新功能,包括翻譯和即時城市遊覽,很快就能「看到」和「聽到」您所經歷的一切,幫助您做一些事情。

  • Orion AR 眼鏡重量低於 100 克,具備寬視野顯示器以及語音控制和手部追蹤等功能。

  • Meta Quest 3S:MR 部分在解析度與延遲上有所提升,更提供 128GB 和 256GB 兩種規格。

  • Instagram 即將推出新的 AI 功能,自動翻譯 Reels 的音頻。透過自動配音和口型同步,Meta AI 將以另一種語言模擬說話者的聲音,並同步他們​​的口型以進行匹配。

  • OpenAI 正式向 Plus 和 Team 用戶推出「高級語音」功能。

  • 這種新的高級語音模式,讓用戶可以更自然地與 AI 交談。「高級語音」功能可以從用戶的語氣中感知和解釋情緒,並相應地調整其回應,令對話也更加流暢和快捷。

  • 高級語音模型 (AVM) 經過 alpha 測試的改進,現在它可以更好地理解口音,不過,高級語音暫時仍然缺少演示中展示的一些功能,例如螢幕共享。

  • OpenAI 正在經歷重大轉型,領導層也發生了顯著變化,技術長 Mira Murati、研究主管 Bob McGrew 和研究副總裁 Barret Zoph 已宣布離職,而 OpenAI 總裁 Greg Brockman 也已休假。

  • 據內部人士透露,OpenAI 正在向營利性模式轉型,而其非營利部門將持有少數股權。這一變化可能使公司估值達到 1,500 億美元。

  • 領導層變動和結構變化標誌著 OpenAI 向獲利模式的策略轉變,OpenAI 將吸引更多投資者並改變公司的管理方式。

圖片來源: Arxiv Org

  • 隨著 AI 的不斷發展,AI 正在挑戰現有系統。

  • 研究團隊使用先進的影像辨識演算法,YOLO 模型進行影像分割和分類,在大量標記影像上訓練模型,實現了 100% 的成功率,AI 成功繞過 Google 的 reCAPTCHAv2 。

  • 這項研究強調 Google reCAPTCHAv2 中的一個主要漏洞,要求更新安全措施。

圖片來源: Runway

  • Runway 宣布推出「百部電影基金」的新計劃,支持將 AI 技術融入電影的電影製作人,撥款範圍從 5,000 美元到 100 萬美元以上不等,另外還將授予 200 萬美元的 Runway Credits。

  • 除了 Runway 團隊之外,百部電影基金還提供專家諮詢小組,業內知名人士,作為顧問,幫助擴大專案規模、提供建議,並共同製作精選專案。

  • Runway 執行長 Cris Valenzuela 強調,Runway 不會擁有這些項目的所有權,也不會發行成品電影。

圖片來源: Google

  • Google 引入 Gemini 增強 Gmail 的智慧回覆,提供更個人化的回覆,此更新適用於 Android 和 iOS。

  • 用戶可以預覽建議的回覆,選擇適合自己風格的回覆,並可以選擇立即發送或在發送前編輯。

  • 新的上下文智慧回覆功能正在向 Gemini 商業、企業、教育、教育進階版 和 Google One AI Premium 訂戶推出。

圖片來源: Alport

  • AIport 和圖靈郵報使用四種不同的生成式 AI 模型創建一系列圖片,探索嬰兒潮世代、X 世代、千禧世代和 Z 世代的五個領域:身分、關係、工作/教育、生活方式和消費習慣。

  • 研究分析了 1,200 張 AI 生成的嬰兒潮世代、X 世代、Y 世代和 Z 代不同的人物圖片,發現他們的共同點是對啤酒的熱愛。

圖片來源: Github

  • 阿里巴巴最新開源模特型 MIMO,只需提供參考圖片和視頻/骨骼動畫,MIMO 就能把圖片中的人物直接替換成影片裡面的人物。

  • MIMO 能夠處理不同的角色,例如真人、卡通人物,還可以處理複雜的 3D 動作與真實場景的物體互動。

AI 教學

  • 製作 AI 跳舞影片,上傳死侍、安尼亞、蜘蛛俠、蝙蝠俠圖片,簡單幾步,即可輕鬆製作跳舞影片。

AI 工具

圖片來源: Google

  • Google 的 NotebookLM 剛剛進行了重大升級,允許用戶將 YouTube 連結和音訊檔案添加到筆記中。

  • NotebookLM 分析文字記錄,提供簡短的摘要和可點擊的主題,以獲取更多詳細資訊。

  • EaseUS Vocal Remover 是一款線上 AI 音樂編輯工具,可以將人聲和樂器聲分離、去除噪音等,助音樂製作人或任何人對音軌進行混音和編輯。

  • EaseUS Vocal Remover 分為免費版及付費版,免費版每天可上傳 3 個檔案及下載 1 個檔案。

❤️ 應謝支持 Pulse AI 電子報!! 您的點讚及訂閱,是我持續更新的動力 ❤️

▶︎ 訂閱 YouTube 頻道,獲取最新 AI 教學

▶︎ 更多 AI 工具: https://bit.ly/ai-tools-pro

▶︎ AI 熱門主題: https://bit.ly/ai-hot-topic

▶︎ AI 應用: https://bit.ly/ai-in-use

▶︎ 新手教學: https://bit.ly/for-newbies