OpenAI 推出全新 o3-mini 系列模型

本周 AI 焦點

  • 📣 OpenAI 推出全新 o3-mini 系列模型

  • 📣 Google 低調發布新 AI 模型 Gemini 2.0 Pro Experimental

  • 📣 Google「Ask for Me」功能:讓 AI 代表用戶致電企業

  • 📣 超級盃:今年充滿 AI 廣告

  • 📣 阿里巴巴發布 Qwen 2.5 系列 AI 模型

  • 📣 OpenAI Reddit AMA 重點整理

  • 📣 如何使用 DeepSeek R1 推理模型

AI 資訊

圖片來源: OpenAI

OpenAI 正式推出最新推理模型 o3-mini 系列的兩個版本:o3-mini 和 o3-mini-high。

  • 性能提升:o3-mini 模型相較於先前的 o1-mini 快 24%,能夠提供更精確的回答,特別在 STEM(科學、數學與程式設計)相關任務上表現優異。

  • 三種「推理力度」:提供低、中、高三種推理力度,讓允許開發人員平衡速度和準確性,當任務較複雜時可以選擇較高的推理力度以多思考,當延遲敏感時可以選擇較低力度。

  • 新功能: OpenAI o3-mini 加入搜尋功能,可以上網答案並附上相關連結,以及展示較為詳細的思考過程。

  • 使用方式:ChatGPT Plus 用戶每日可使用 150 條 o3-mini 訊息,及每周 50 條 o3-mini-high;Pro 用戶則享有無限次使用 o3-mini-high 的權益。免費用戶可在訊息欄中選擇「Reason」體驗推理模型,這是免費用戶首次獲得推理模型的體驗機會。

圖片來源: Techcrunch

  • Google 發布 Gemini 2.0 Pro Experimental,這款新模型是 Gemini 1.5 Pro 的進階版本,主要著重於提升事實準確性,並強化編碼與數學運算能力。

  • 早期預覽階段:Google 將此模型標示為「早期預覽」,並提醒用戶可能會出現意外行為,且部分 Gemini 應用程式的某些功能不相容。

  • 新模型已向 Google AI Premium 計劃的 Gemini Advanced 訂閱用戶開放使用。

  • 配合 Gemini 2.0 Pro Experimental 的發布,Google 將其 12 月公佈的 Gemini 2.0 Flash 模型引入到 Gemini 應用中,供所有用戶使用。

圖片來源: Google

  • Google 正在測試「Ask for Me」的新 AI 功能,該功能能夠代表用戶致電當地企業,詢問服務資訊、價格或預約情況。

  • 這項實驗性功能處於實驗階段,目前並非所有服務類型均可享有此體驗,並僅向加入 Google 搜尋實驗室的桌面及行動裝置用戶提供體驗。

  • 當用戶搜尋本地服務,例如「附近的美甲沙龍」或「汽車維修」,便會看到「Ask for Me」的選項。點選後,用戶只需輸入所需服務的詳情,Google 的 AI 就會代表用戶撥打電話,並將所收集到的資訊,例如價格,整理可用性摘要回傳給用戶。

  • 「Ask for Me」功能不是所有地區都支援,並要加入候補名單等待試用。

圖片來源: Pixabay

  • 今年超級盃定於 2 月 9 日舉行,屆時 AI 相關的公司與產品將成為廣告主流

  • 不僅有超過 10 家廣告商投資破紀錄的超級盃 LIX 廣告時段,Mark Evans 表示,投資 AI 的大型公司和一些專注於 AI 的公司都會在超級盃亮相。

  • 雖然以 AI 為中心的廣告金額持續攀升,但來自電影製片廠和串流平台的廣告預算卻呈現下滑趨勢。

  • 這些廣告現象充分展現 AI 在現今文化與經濟中的深度滲透。

  • 不過,今年看到很多 AI 廣告不代表會永遠處於這種狀態,反映 AI 看起來比以往任何時候都更像是一個被過度炒作的泡沫。

圖片來源: Quen

阿里巴巴 推出全新 AI 模型系列 Qwen2.5,其中包括 Qwen2.5-VL 與 Qwen2.5-Max,旨在迎戰 DeepSeek、OpenAI 等市場競爭對手。

Qwen2.5-VL

  • 視覺解析能力躍進,不僅能分析各類影像,更能精準辨識結構與佈局,有效捕捉各種元素細節,對圖表及文件的理解表現更強。

Qwen2.5-Max

  • 採用經濟高效的 MoE(專家混合)架構。

  • 在各項關鍵基準測試中,其性能據稱超越了 DeepSeek-V3,並向 GPT-4o 及 Llama-3.1-405B 等。

  • 已整合至 Qwen Chat 平台,讓用戶能夠輕鬆生成圖片與影片。

圖片來源: Apple

  • 蘋果將於 4 月擴大 Apple Intelligence 的語言支援,新增法語、德語、義大利語、葡萄牙語、西班牙語、日語、韓語及簡體中文,並推出針對印度與新加坡的本地化英語版本。

  • 這一更新在蘋果 2024 年第四季財報電話會議上由執行長 Tim Cook 證實,標誌著自最初僅限美國英語版本推出以來的一大進展。

  • 新版 Siri 將於「未來幾個月內」推出,升級後的 Siri 將具備理解螢幕內容的能力。

模型更新與發布

  • o3-mini

    • 現已支援推理能力及工具使用(包含網路搜尋功能)。

    • 知識截止日期依然是 2023 年 10 月,但由於具備網路搜尋,這一限制變得次要。

即將推出

  • o3 完整版:預計「幾週到幾個月內」上線。

  • 4o 系列改進中:基於 GPT-4o 的圖像生成與編輯功能預計在「幾個月內」推出。

功能與能力

  • Plus 方案將在「未來數月內」新增 Operator 功能。

  • 更多代理(Agents)功能將上線。

  • 進階語音模式更新中,計劃與文字及 Canva 互動整合。

  • 計劃為推理模型增加 PDF 支援和檔案附件功能。

  • o3-mini 即將增加視覺能力(目前已在 o1 模型中提供)。

AGI 發展觀點

  • 未來願景是持續運作、具代理性的 AI 在背景中提供服務。

  • AGI 突破重點或將放在治療疾病和發展廉價能源上。

開源策略

  • 內部對開源策略展開辯論,Sam Altman 認為當前做法處於「歷史錯誤的一邊」。

  • 參考過去如 GPT-2 和 Jukebox 的開源,未來可能釋出更多成果。

AI 教學

如何使用 Deepseek R1

  • DeepSeek 介面簡單易用。在文字輸入框輸入問題、需求或任務指令,DeepSeek 就會根據您的輸入產生對應的答案。

  • 使用 DeepSeek-R1 時,可打開聯網搜索功能,以確保獲取最新的信息

DeepSeek R1 使用小技巧

  • 提示詞模板

    公式:【目標/目的】+【要求】+【背景】+【警告 (Warnings)】

  • 延長思考時間

    如果希望 DeepSeek-R1 進行更深入的思考,可以使用「請你在思考過程中,進行3 輪思考再回答我。」提示詞。

  • 提供更多背景資訊

    背景資訊越詳細,DeepSeek R1 就越能提供更全面的答案。

  • 進行多輪對話

    如果對 DeepSeek-R1 的回答不滿意,可以繼續與它對話, 以釐清問題或提出新的要求。

  • 微軟 Copilot 免費使用 OpenAI o1 推理模型,手把手教你如何高效使用推理模型。

工具推薦

  • 推薦四款工具 LottieLab、Spline AI、Rive 和 Jitter,讓設計作品更加豐富多彩。

  • Infography 是一款資訊圖表(Infographics)創作平台,透過 AI 技術,自動創建視覺化資訊圖表設計。

  • Infography 提供豐富模板,用戶可以自由調整顏色、字體、文字等細節。

  • 支持多種格式的輸出,如 PNG、JPG。免費版提供 3 Credits 免費生成資訊圖表。

❤️ 應謝訂閱 Pulse AI 電子報!! 您的支持,是我持續更新的動力 ❤️

🔆 如果您喜歡 Pulse AI 電子報,歡迎分享給您的好友!

▶︎ 歡迎訂閱我的 YouTube 頻道,獲取最新 AI 教學

▶︎ AI 工具推薦:精選 30+ 款最佳 AI 工具

▶︎ 更多 AI 工具: https://bit.ly/ai-tools-pro

▶︎ AI 熱門主題: https://bit.ly/ai-hot-topic

▶︎ AI 應用: https://bit.ly/ai-in-use

▶︎ 新手教學: https://bit.ly/for-newbies