DeepSeek的成就與對美國股市的重大衝擊,可以說是這幾天的重要消息。但探查這方面的消息,報導DeepSeek的發展、投資者與主持者的成長和發展背景,又讓我對報導DeepSeek的內容與成就,深感困惑。
根據經濟日報這則新聞「DeepSeek 成 AI 黑馬 創辦人梁文鋒經歷曝光」(https://money.udn.com/money/story/5603/8518211)我們很難相信DeepSeek所宣稱的成就。該新聞:「梁文鋒是廣東湛江吳川市一中「高考狀元」。DeepSeek創始人梁文鋒的背景備受關注,梁文鋒1985年出生於廣東省湛江市。2002年以湛江的吳川市第一中學「高考狀元」的成績考入浙江大學電子信息工程系,並在隨後的幾年裡繼續深造,最終於2010年獲得信息與通信工程碩士。在校期間,他對金融市場產生了濃厚的興趣。梁文鋒與浙大同學徐進於2013年共同創立了杭州雅克比投資管理有限公司,2015年成立了幻方量化,致力於透過人工智慧進行量化投資。
2016年公司推出了首個基於深度學習的交易模型,並實現了所有量化策略的AI化轉型。2018年幻方正式確立了以AI為核心的發展戰略。2021年幻方的資產管理規模突破千億大關,躋身大陸量化私募領域的「四大天王」之列。最後梁文鋒於2023年創辦深度求索DeepSeek,專注於做真正人類級別的人工智慧。」
他的問題在:
1. 梁文鋒的成就在於金融理財,不是專業性很高的AI領域。金融強調他的成績,在這個議題中,只能顯是他理財能力對AI這領域能投資的金額。
2. 這個專長與時間點值得注意:
甲、 「梁文鋒與浙大同學徐進於2013年共同創立了杭州雅克比投資管理有限公司,2015年成立了幻方量化,致力於透過人工智慧進行量化投資。」
乙、 「2016年公司推出了首個基於深度學習的交易模型,並實現了所有量化策略的AI化轉型。2018年幻方正式確立了以AI為核心的發展戰略。」
丙、 「2021年幻方的資產管理規模突破千億大關,躋身大陸量化私募領域的「四大天王」之列。」
丁、 「梁文鋒於2023年創辦深度求索DeepSeek,專注於做真正人類級別的人工智慧。」
3. 根據第2點。在2023年之前,幻方所從事的,即令是AI,都是以金融為主。AI的領域很廣。金融方面的AI和AGI、大型語言模型,有相當差別。因此他這方面的轉換,真正的時間是一年多。以往在金融方面的成就都不能列入此次成就的努力之中。
4. 梁文鋒說「至於聘用原則,是只看能力,不問經驗,核心職位都由應屆和畢業一兩年的年輕人擔任。衡量新人的能力,除了看院校背景(主要是清華、北大生),還看競賽成績,金獎以下都不用,「只招1%的天才,去做99%中國公司做不到的事情。」所以這家只有139人的公司,可謂臥虎藏龍,人人身負絕技。」這是很有爭議。
甲、 競賽年年有,競賽成績如此優越的人也年年有。為何這一批139人,能做出中國期待又做不到的工作,甚至超過美國諸多頂級大學一流學生做不到的成就?
乙、 這種聘用「至於聘用原則,是只看能力,不問經驗,核心職位都由應屆和畢業一兩年的年輕人擔任。」在實務上有爭議。
i. 這意味經驗在這個研發工作中沒有價值?而整個研發工作的領導團隊,是否要有博士學位、主持過中大型研發團隊的人才能讓研究工作運作?
ii. 這其中應該有很多如羅福莉那樣沒有博士學位的工作者。AGI工作交由一些沒有博士學位的研究人員工作,能否有大成就?
丙、 羅福莉的國際會議論文,照影片「DeepSeek正面對決 輝達股價暴跌創新低|「95後」AI天才少女引領革命 小米雷軍捧千萬年薪挖角」(https://www.youtube.com/watch?v=jTowfuo7X7E&ab_channel=寰宇新聞頻道)
i. 這個論文像是壁報論文。也就是他接受你的發表,但沒有機會在會議上宣讀,僅在會議場外貼論文摘要。換言之,這種論文的價值遠低於能在會議上演講發表的論文。更且,發表這種論文一般也需要費用。因此除非需要有這種發表成績來證明自己能力或職業需要外,一般人不會強調他發表多少篇這樣的論文。
ii. 影片中呈現出來他那樣的研究環境,應該不是研究團隊中的頂級領導者的環境,像是一般研究者,甚至僅是研究助理的研究環境。
作者 : 林修正/退休副教授