- Pulse AI 電子報
- Posts
- OpenAI 宣布推出具有 AGI 目標的 o3 模型
OpenAI 宣布推出具有 AGI 目標的 o3 模型
AI SPOTLIGHTS:
📣 OpenAI 宣布推出具有 AGI 目標的 o3 模型
📣 Meta 推出 Instagram AI 影片編輯功能
📣 Google 發布自己的「推理」AI 模型「Gemini 2.0 Flash Thinking」
📣 Genesis 支援生成 4D 動態世界
📣 免費課程:如何有效提示和使用 OpenAI 的 o1 模型
📣 Google 推出 Whisk AI 圖生成工具
📣 Kling AI 最新推出 1.6 版本
🥳 感謝支持 AI 電子報,下周將暫停一期,祝大家聖誕快樂,新年進步!
AI 資訊
OpenAI 發布 o3 模型系列,包括 o3 和 o3-mini,聲稱 o3 正在向 AGI 邁進。
o3 模型增強了推理能力,並經過訓練在回應之前進行「思考」。
憑藉自我檢查推理能力,o3 可以減少數學、科學和編碼等領域的錯誤,儘管它比非推理模型稍慢。
o3 在 2024 年美國邀請賽數學考試中取得了 96.7% 的成績,並在編程任務的 SWE-Bench 和 EpochAI’s Frontier Math 測試等其他基準測試中創下了記錄。
Instagram 將於 2025 年推出生成式 AI 編輯功能,用戶可以使用簡單的文字提示詞修改影片。
該工具由 Meta 的 Movie Gen AI 模型提供支持,可無縫調整背景、更換服裝和添加物體,無需高級編輯技能即可增強內容創作。
Instagram 負責人 Adam Mosseri 展示了早期的演示,其中 AI 順利地改變了各種元素,即使在快速移動過程中也能保持自然的過渡。
Just when you thought it was over... we’re introducing Gemini 2.0 Flash Thinking, a new experimental model that unlocks stronger reasoning capabilities and shows its thoughts.
The model plans (with thoughts visible), can solve complex problems with Flash speeds, and more 🧵
— Logan Kilpatrick (@OfficialLoganK)
5:00 PM • Dec 19, 2024
Google 發布實驗性的「Gemini 2.0 Flash Thinking」模型,旨在解決程式設計、數學和物理等領域的複雜任務。
此模型可以將複雜的指令或問題分解為較小的任務。透過一次專注於一小步,可以避免錯誤並確保更可靠的最終答案。
該模型不僅限於文字,它可以透過結合文字和圖像的問題來推理。
Google 已在其 AI Studio 平台上推出 Gemini 2.0 Flash Thinking 模型。
Google 前 CEO Eric Schmidt 與《華盛頓郵報》的 Bina Venkataraman 一起討論 AI 如何塑造未來。
這次訪談涉及了廣泛的議題,包括 AI 的前景和危險、美國和中國的 AI 競賽以及政府在 AI 發展中的作用。
Eric Schmidt 相信 AI 有可能徹底改變科學並解決世界上一些最緊迫的問題,例如氣候變遷和疾病。
他還警告 AI 的潛在危險,例如網路攻擊和危險的生物武器的開發。
Genesis 項目正式發布,支援產生 4D 動態世界,Github 上已飆升到 8.2k+ star!
■ 完全開源
■ 可產生複雜的角色動畫
■ 透過文字提示,快速創建 4D 動態世界
■ 模擬速度比實時速度快約 430,000 倍
■ 只需 26 秒即可在單個 RTX4090 上訓練Genesis Github: genesis-embodied-ai.github.io
#genesis… x.com/i/web/status/1…
— lazy_kar (@lazy_kar)
3:10 PM • Dec 19, 2024
AniDoc 可以自動為角色線稿上色。效果上能很好地保持角色一致性,即使草圖在姿勢和比例上有顯著變化,也能穩定上色。
AniDoc 項目已經開源,程式碼已發佈在 GitHub 上。
AI 教學
DeepLearning AI 推出一堂 o1 推理的免費 70 分鐘線上課程,講師為 OpenAI 解決方案主管 Colin Jarvis。
內容包括:
o1 工作原理、效能以及使用它的最佳場景。
識別 o1 模型適合哪些任務,以及何時您可能想要使用更小或更快的模型或將兩者結合。
了解如何有效地提示 o1 以及何時將任務委派給更具成本效益、更低延遲的模型。
了解 o1 如何在編碼和視覺推理任務上表現出色,以及如何應用元提示來優化您的應用程式。
AI 工具
Google 推出 Whisk,是 Google Labs 最新的圖片生成工具,專注於快速視覺構思,無需複雜提示詞!
Whisk 操作簡單,用圖片作為提示,就可以輕鬆把三類圖片混合在一起。
上傳主題、場景和風格圖片,即可生成一張新圖片。
可靈 AI (Kling) 是由快手出品的影片生成工具。最新發佈 1.6 版本,提高一致性、及時的依從性、動態性和美觀性。
支援標準和專業模式,相比 KLING 1.5 型號整體提升 195 %。
❤️ 應謝訂閱 Pulse AI 電子報!! 您的支持,是我持續更新的動力 ❤️
🔆 如果您喜歡 Pulse AI 電子報,歡迎分享給您的好友!
▶︎ 歡迎訂閱我的 YouTube 頻道,獲取最新 AI 教學
▶︎ 更多 AI 工具: https://bit.ly/ai-tools-pro
▶︎ AI 熱門主題: https://bit.ly/ai-hot-topic
▶︎ AI 應用: https://bit.ly/ai-in-use
▶︎ 新手教學: https://bit.ly/for-newbies