AI 代理軍事競賽正在升級

本周 AI 焦點

  • 📣 OpenAI 推出 Operator 全新 AI 代理

  • 📣 Perplexity 推出 Android AI 行動助理

  • 📣 DeepSeek 令全球 AI 競賽更激烈

  • 📣 蘋果重組 AI 團隊,聚焦 Siri 和 AI 發展

  • 📣 11 款 Google AI 工具,讓教學與學習更高效

  • 📣 HuggingFace 開源 Open-R1,重現 DeepSeek-R1 模型

  • 📣 HeyGen 推出數字人分身運動控制,AI 化身更生動

AI 資訊

AI 代理軍事競賽正在升級

OpenAI 推出 Operator 全新 AI 代理,具備 GPT-4 的先進推理與視覺能力,能夠透過網頁瀏覽器執行任務,例如預訂行程、購物、或管理工作流程。

功能亮點:

  • 自主互動:像人類一樣瀏覽、點擊、填寫表單,無需整合額外工具。

  • 高效操作:處理繁瑣數位任務。

  • 合作夥伴關係與安全:與 DoorDash、Instacart 和 Uber 等平台合作,提供用戶批准、自動威脅偵測和敏感操作的手動「接管模式」等內建功能。

目前,Operator 作為研究預覽,率先向美國的 ChatGPT Pro 用戶推出。

儘管功能仍有部分限制,例如處理複雜任務的能力尚待提升,Operator 的推出標誌著 AI 個人助理時代的到來,重新定義我們與 AI 的互動方式。

Perplexity 推出全新 Perplexity Assistant,一款適用於 Android 的免費 AI 行動助理,不僅能回答問題,還能執行如撰寫電子郵件、設定提醒和預訂車輛等實用任務,讓生活更高效。

功能亮點:

  • 多模式互動:支援語音輸入和相機功能,可識別物體或解讀螢幕內容。

  • 無縫應用整合:與 Spotify、YouTube、Uber 等流行應用直接搭配使用。

  • 情境感知:能根據互動情境從搜尋到行動提供流暢體驗,例如搜尋餐廳並完成預訂。

圖片來源: Deepseek

開源 AI 模型 DeepSeek R1 以顯著更低的成本實現與 OpenAI 頂級模型媲美的性能,成為中國首個在全球 AI 領域具影響力的競爭者,引起了矽谷的關注。

亮點:

  • 高效與開源:DeepSeek 擺脫傳統依賴大量 GPU 投資的模式,專注於效率與開源開發。

重新定義 AI 策略:DeepSeek 的崛起挑戰美國以高成本擴張為核心的 AI 發展策略,推動更具成本效益與協作性的未來方向。

圖片來源: Apple

蘋果正積極調整 AI 與 Siri 相關業務,將參與 iPhone 和 Vision Pro 開發的資深主管 Kim Vorrath 調任至 AI 和機械學習部門,以打造 AI 和 Siri。

  • 領導層變動:根據彭博社報道,Kim Vorrath 將擔任 AI 負責人 John Giannandrea 的「高級副手」,專注改進 Siri 基礎設施與內部 AI 模型。

  • 提升 Siri 表現:針對當前 Siri 版本對用戶請求處理不佳的批評,蘋果計畫徹底升級底層技術。

  • AI 優先戰略:這一調整顯示 AI 對蘋果的重要性正在超越 Vision Pro,進一步表明公司對 A 領域的投入與重視。

  • 競爭壓力:雖然蘋果已在 WWDC 上啟動 Apple Intelligence 計劃,但仍面臨 OpenAI 和 Google 等對手的激烈競爭。

圖片來源: Google

Google AI 發佈 11 款 Google AI 工具 2025 指南,讓教學與學習更高效、更個性化。

免費 AI 工具,提升教學與學習

  • NotebookLM:上傳課堂資料,生成教案、學習指南、測驗並提供資料來源。

  • LMS 整合:Gemini 工具無縫整合到 Canvas 等學習管理系統。

  • Gemini 「雙重檢查」: 驗證 Gemini 回應的真實性。

  • 安全學習:Gemini 專為青少年設計,提供安全的學習環境。

提升效率與創造力的 Gemini 工具

  • 教學影片製作:在 Google Vids 中快速生成腳本與素材。

  • 多任務助手:利用 Gemini 在 Gmail、Docs 側邊欄完成摘要與內容生成。

  • 自訂詞彙清單: 快速生成符合年級與主題的詞彙清單,幫助學生學習關鍵詞。

  • 個性化 AI 助手:Gems 記住指令,為學生提供專屬學習資源。

  • NotebookLM Plus:高級功能具備更大儲存與分享功能。

Chromebook 與 AI 的完美結合

  • Chromebook Plus:用 AI 翻譯字幕、生成文本或錄音轉錄,輕鬆應對教學需求。

  • Google Lens:即時搜索視頻、PPT 或圖片內容,快速找到答案並分享。

圖片來源: HuggingFace

HuggingFace 最新推出開源項目 Open-R1,目標是重現 DeepSeek-R1 模型。該專案基於 DeepSeek-R1 的技術報告,分為以下三個主要步驟:

  • 步驟 1:從 DeepSeek-R1 中提取高品質語料庫,複製 R1-Distill 模型。

  • 步驟 2:複製 DeepSeek 用於建立 R1-Zero 的純 RL 管道,包括整理針對數學、推理和程式碼的大規模資料集。

  • 步驟 3:通過多階段訓練,從基礎模型過渡到 RL 調整。

AI 教學

教學包括:

  • 卡通人物教學視頻

  • AI 老照片轉視頻 / 親人擁抱影片

  • 角色一致性教學視頻

  • AI 影片特效教學

  • 模特兒換衣教學

  • AI 唱歌及跳舞影片

AI 工具

  • HeyGen 推出全新運動控制功能,讓數字人分身能夠執行更複雜的動作與互動。不再是靜態的 AI 頭像影片。

  • 通過簡單提示,即可彈吉他和跳舞等

推薦三款 AI 圖表生成工具,助您輕鬆告別枯燥的數據呈現方式,打造專業級的視覺內容,包括

  • Napkin AI

  • Infography AI

  • Infografix

❤️ 應謝訂閱 Pulse AI 電子報!! 您的支持,是我持續更新的動力 ❤️

🔆 如果您喜歡 Pulse AI 電子報,歡迎分享給您的好友!

▶︎ 歡迎訂閱我的 YouTube 頻道,獲取最新 AI 教學

▶︎ AI 工具推薦:精選 30+ 款最佳 AI 工具

▶︎ 更多 AI 工具https://bit.ly/ai-tools-pro

▶︎ AI 熱門主題https://bit.ly/ai-hot-topic

▶︎ AI 應用https://bit.ly/ai-in-use

▶︎ 新手教學https://bit.ly/for-newbies