- Pulse AI 電子報
- Posts
- Meta 在 Meta Connect 2024 一系列更新
Meta 在 Meta Connect 2024 一系列更新
AI SPOTLIGHTS:
📣 Meta 在 Meta Connect 2024 一系列更新
📣 ChatGPT 高級語音模式正式推出
📣 OpenAI 領導層又再經歷重大變化
📣 AI 以 100% 準確率擊敗 Google 的 reCAPTCHA
📣 Runway 推出基金,支持使用 AI 製作電影
📣 Google 在 Gmail 推出 Gemini 智慧回覆
📣 X世代:AI 最不了解的一代?
AI 資訊
Meta 宣布推出語音模式,類似於 ChatGPT 的高級語音模式,允許用戶在 Messenger、Facebook、WhatsApp 和 Instagram DM 上使用語音與 Meta AI 交談,該功能已在部分國家/地區推出。
Llama 模型:Meta 最新的 Llama 3.2 模型是 Llama 模型第一個能夠理解圖像和文字的主要視覺模型,具有 11B 和 90B 參數版本。
智慧眼鏡升級:Ray-Ban Meta 智慧眼鏡獲新功能,包括翻譯和即時城市遊覽,很快就能「看到」和「聽到」您所經歷的一切,幫助您做一些事情。
Orion AR 眼鏡重量低於 100 克,具備寬視野顯示器以及語音控制和手部追蹤等功能。
Meta Quest 3S:MR 部分在解析度與延遲上有所提升,更提供 128GB 和 256GB 兩種規格。
Instagram 即將推出新的 AI 功能,自動翻譯 Reels 的音頻。透過自動配音和口型同步,Meta AI 將以另一種語言模擬說話者的聲音,並同步他們的口型以進行匹配。
Advanced Voice is rolling out to all Plus and Team users in the ChatGPT app over the course of the week.
While you’ve been patiently waiting, we’ve added Custom Instructions, Memory, five new voices, and improved accents.
It can also say “Sorry I’m late” in over 50 languages.
— OpenAI (@OpenAI)
6:11 PM • Sep 24, 2024
OpenAI 正式向 Plus 和 Team 用戶推出「高級語音」功能。
這種新的高級語音模式,讓用戶可以更自然地與 AI 交談。「高級語音」功能可以從用戶的語氣中感知和解釋情緒,並相應地調整其回應,令對話也更加流暢和快捷。
高級語音模型 (AVM) 經過 alpha 測試的改進,現在它可以更好地理解口音,不過,高級語音暫時仍然缺少演示中展示的一些功能,例如螢幕共享。
OpenAI 正在經歷重大轉型,領導層也發生了顯著變化,技術長 Mira Murati、研究主管 Bob McGrew 和研究副總裁 Barret Zoph 已宣布離職,而 OpenAI 總裁 Greg Brockman 也已休假。
據內部人士透露,OpenAI 正在向營利性模式轉型,而其非營利部門將持有少數股權。這一變化可能使公司估值達到 1,500 億美元。
領導層變動和結構變化標誌著 OpenAI 向獲利模式的策略轉變,OpenAI 將吸引更多投資者並改變公司的管理方式。
隨著 AI 的不斷發展,AI 正在挑戰現有系統。
研究團隊使用先進的影像辨識演算法,YOLO 模型進行影像分割和分類,在大量標記影像上訓練模型,實現了 100% 的成功率,AI 成功繞過 Google 的 reCAPTCHAv2 。
這項研究強調 Google reCAPTCHAv2 中的一個主要漏洞,要求更新安全措施。
Runway 宣布推出「百部電影基金」的新計劃,支持將 AI 技術融入電影的電影製作人,撥款範圍從 5,000 美元到 100 萬美元以上不等,另外還將授予 200 萬美元的 Runway Credits。
除了 Runway 團隊之外,百部電影基金還提供專家諮詢小組,業內知名人士,作為顧問,幫助擴大專案規模、提供建議,並共同製作精選專案。
Runway 執行長 Cris Valenzuela 強調,Runway 不會擁有這些項目的所有權,也不會發行成品電影。
Google 引入 Gemini 增強 Gmail 的智慧回覆,提供更個人化的回覆,此更新適用於 Android 和 iOS。
用戶可以預覽建議的回覆,選擇適合自己風格的回覆,並可以選擇立即發送或在發送前編輯。
新的上下文智慧回覆功能正在向 Gemini 商業、企業、教育、教育進階版 和 Google One AI Premium 訂戶推出。
AIport 和圖靈郵報使用四種不同的生成式 AI 模型創建一系列圖片,探索嬰兒潮世代、X 世代、千禧世代和 Z 世代的五個領域:身分、關係、工作/教育、生活方式和消費習慣。
研究分析了 1,200 張 AI 生成的嬰兒潮世代、X 世代、Y 世代和 Z 代不同的人物圖片,發現他們的共同點是對啤酒的熱愛。
阿里巴巴最新開源模特型 MIMO,只需提供參考圖片和視頻/骨骼動畫,MIMO 就能把圖片中的人物直接替換成影片裡面的人物。
MIMO 能夠處理不同的角色,例如真人、卡通人物,還可以處理複雜的 3D 動作與真實場景的物體互動。
AI 教學
AI 工具
Google 的 NotebookLM 剛剛進行了重大升級,允許用戶將 YouTube 連結和音訊檔案添加到筆記中。
NotebookLM 分析文字記錄,提供簡短的摘要和可點擊的主題,以獲取更多詳細資訊。
EaseUS Vocal Remover 是一款線上 AI 音樂編輯工具,可以將人聲和樂器聲分離、去除噪音等,助音樂製作人或任何人對音軌進行混音和編輯。
EaseUS Vocal Remover 分為免費版及付費版,免費版每天可上傳 3 個檔案及下載 1 個檔案。
❤️ 應謝支持 Pulse AI 電子報!! 您的點讚及訂閱,是我持續更新的動力 ❤️
▶︎ 訂閱 YouTube 頻道,獲取最新 AI 教學
▶︎ 更多 AI 工具: https://bit.ly/ai-tools-pro
▶︎ AI 熱門主題: https://bit.ly/ai-hot-topic
▶︎ AI 應用: https://bit.ly/ai-in-use
▶︎ 新手教學: https://bit.ly/for-newbies