中國新創公司「深度求索」(DeepSeek)推出的 AI 模型,以高效能和低成本備受外界注目。中國科技巨頭阿里巴巴也加入 AI 競爭賽,旗下阿里雲近日發布「通義千問」旗艦版模型(Qwen2.5-Max)全新升級版,還聲稱該模型超越 DeepSeek V3 模型。
根據《德國之聲》今(30)日的報導,Qwen2.5-Max 能力十分優秀,在多方面的測試中都取得良好成績。阿里雲官方微信帳號表示,在編程、知識、人類偏好對齊和全面評估綜合能力等基準測試中,Qwen2.5-Max 都取得足以與 Claude-3.5-Sonnet 媲美的成績,幾乎全面超越 DeepSeek V3 及GPT-4o。
Qwen2.5-Max 開發團隊指出,Qwen2.5-Max 在訓練過程中使用超過 20 兆 token 的預訓練數據,並採用精心設計的後訓練方案。
為了證明 Qwen2.5-Max 模型的優越性,開發團隊還展示該模型與 Claude-3.5-Sonnet、GPT-4o、DeepSeek V3 表現對比圖。圖片顯示 Qwen2.5-Max 在各種能力的競爭中都取得優秀名次,幾乎都位列第一。
Qwen2.5-Max 開發團隊相信,之後還能推出更加優秀的版本。開發團隊聲稱,隨著訓練和微調技術的進步,下一個版本的 Qwen2.5-Max 必然會更加強大。
值得注意的是,阿里雲發布 Qwen2.5-Max 的時間不太尋常。阿底雲於 29 日發布 Qwen 2.5-Max,時間正值中國農歷新年,絕大多數中國人都在此期間與家人相聚。阿里雲不惜選在春節期間推出 Qwen2.5-Max,顯示 DeepSeek 模型的崛起讓中國同行備受壓力,不得不做出行動以免在競爭中被淘汰。
阿里巴巴秀各個 AI 模型對比圖。 圖:翻攝自微博