中國人工智慧公司「深度求索」(DeepSeek)因其標榜「成本低」、性能又與美國OpenAI最領先的AI模型相媲美,近日引起轟動,不過也有台灣財經人士懷疑其中有蹊蹺。中國國內有專業人士則質疑DeepSeek靠抄襲難走遠。
DeepSeek標榜「低成本」 被疑有蹊蹺
DeepSeek是中國科技公司幻方量化旗下的子公司「深度求索」打造的一系列人工智慧大型語言模型。深度求索2023年7月才成立,2024年12月就發布開源模型DeepSeek-V3。今年1月20日,深度求索又發布了專門適用於數學、編碼和邏輯等任務的DeepSeek-R1。
根據「深度求索」發布的數據,DeepSeek的訓練使用的是輝達的H800型GPU,開發耗資僅不到558萬美元,遠低於其西方競爭對手的投入。由於美國的出口管制,H800是輝達專門針對中國市場發售的性能較低的晶片。
DeepSeek發布驚人的低成本AI模型後,美國科技公司股價大幅下挫。1月27日收盤時,輝達在美國的股價大幅度下跌近17%,市值蒸發5,890億美元,創下美股單日市值損失的歷史記錄。
截至1月27日,DeepSeek的應用程式分別在美國和中國的蘋果商店登上了免費應用榜榜首。
台灣非政府組織工作者黃曼婷(Manting Huang,音譯)對《大紀元》表示,DeepSeek背後的幻方這家私募基金公司爭議非常多,它主要是透過自動化判斷去決定投資標的,過去在中國用這個理由去規避官方的審查,它說我這個人工智慧的部分是不面向消費者的,所以不用去遵守中國的人工智慧相關法規,但DeepSeek作為面向消費者的產品,就會受到中國生產AI的規定。
「它等於在開發時的前端規避了審查,但是它的最終端要符合審查,所以目前中國國內,它的對手在罵這件事情,因為他們前端不用審查,所以成本近乎於零,直接去用ChatGPT的模型去做,幻方推出的DeepSeek的價格等於在中國市場直接砍半,所以所有做AI服務的廠商都跳腳。」
美國創業公司Scale AI執行長Alexandr Wang在電視訪談中表示,DeepSeek有5萬顆NVIDIA的H100處理器。「但是很明顯他們不能說出來,因為這違反了美國所實施的出口管制,我相信他們擁有比外界想像的更多,他們未來會被晶片管制,和出口管制所限制」。
台灣知名財經網美胡采蘋則在臉書發文直言:「事實上DeepSeek的開發成本必然是謊報的,因為他們沒有報上背後語言模型的成本」。
胡采蘋還表示,DeepSeek的母公司幻方量化是最重視晶片軍火裝備的一家公司,中國媒體過去報導過幻方是如何大量添購GPU、是中國準備最足的一家公司,這種發展邏輯的企業只會裝備更強大的軍火而已,不會丟盔棄甲空手上陣。
對於幻方聲稱他們是用A800、降速晶片開發,胡采蘋並表示:「這根本是無從驗證的說法,美國社會相信誠實,說謊或詐欺會使公司面臨嚴重的司法後果,因此他們也會假設中國公司說的都是可信的,但是他們跟中國公司打交道的經驗太少了。」
胡采蘋提到,「其實上次華為說它突破美國封鎖、做出七納米晶片的時候,台積電也是從560跌到535,跌了快10%,只是當時是跌了一個多禮拜。」
她說,一堆人都在說看美股反應就知道中國AI爆擊了美國,一定是真的,但其實股市投資人往往才是最跟風的。後來經過解釋,根本沒人再懷疑台積電,然而這種金融攻擊就是會有效果的,而且很多人在其中獲利。
台灣數位發展部政務次長林宜敬也在貼文後留言稱,「目前資訊不完全,但可以確定的是,他們(DeepSeek)的成本絕對不是他們所說的600萬美金。單單是他們拿來訓練模型的2,048片nVidia H800就遠遠不止這個價錢。」
林宜敬表示,此外,有許多跡象顯示,他們應該是拿ChatGPT的輸出來訓練DeepSeek。
中國業界點評DeepSeek抄襲
原本默默無名的中國科技公司DeepSeek,號稱通過低成本硬體開發出的人工智慧大語言模型DeepSeek在性能上和美國最領先的AI模型旗鼓相當,連日來引發轟動。不過,中國國內也有人對DeepSeek的產品提出質疑。
世纪骗局 #DeepSeek 这些视频被秒删,更是佐证了这是个骗局。 pic.twitter.com/vO6FhcKVgX
— 正視歷史▪️傳播真相 (@543dom_) January 28, 2025
中國科技博主「水小木」表示:DeepSeek震驚美國科技界,網上消息都說美國人工智慧受到威脅,好像DeepSeek已經具備用低成本晶片可以算出突破性模型的能力,因為DeepSeek,2,048張GPU訓練了兩個月,耗資只有558萬美元,而反觀GPT4用了25,000塊,A100GPU訓練一百天,花費一億美元。這麼一對比,可以說DeepSeek已在各方面遙遙領先,但有人可能會覺得不對勁。為什麼呢?
該博主解釋說,「如果你把這幾十年遙遙領先的新聞放在一起對比會發現一個驚人的規律,每當國外出現什麼重大的科技變革,我們這邊都會立馬有公司宣布遙遙領先。然而過了一段時間以後,你又會發現好像一瞬間再也聽不到這些消息了。」
「每日經濟新聞剛剛做了一個調研,他們發現如果你問DeepSeek你是誰?它會回答我是GPT4。如果你問他自己的編程接口是什麼?它甚至會把OpenAI的編程接口使用說明給到你。如果你深入了解的話,就會發現就連笑話的笑點DeepSeek和GPT4都是一模一樣。有國外專家是這麼說的,大概率是DeepSeek使用了GPT4蒸餾。簡單說,如果你是一個學生,老師已經給了你這道題的答案,你只需要讓自己的推理過程,等於這個答案就可以,就省了大量的思考和運算,等於省去了大量的時間和成本,這種學習方法不是不行,但是會出現一個問題,導致學生永遠不可能超越老師。因為當沒有老師給你提供答案時,你就沒有辦法工作了。」該博主說。
該博主表示,就像平時考試一樣,人家努力學習大量思考,做出一道題,你只需要提高抄襲水平,偷瞄一眼,也能做出這道題。問題是高考不讓你抄了,你怎麼辦?「現在你知道為什麼這幾十年來我們有那麼多的公司遙遙領先,但到最後都只是曇花一現了吧。因為這麼多年來,他們努力的方向都是做蒸餾技術,蒸餾技術是條捷徑,但是這條路走得越深,離核心科技其實也就越遠。」
另一位本身是中國AI領域創業者的博主表示:「我作為一個非常普通的用戶,用DeepSeek和ChatGPT回答了一道邏輯推理題。結果DeepSeek的回答是錯誤的,ChatGPT是正確的。很多人私訊給我說,我在黑DeepSeek。我想我作為一個中國的中國的AI領域的創業者,我黑它對我有什麼好處?」
她認為,對DeepSeek的評價,不要去捧殺,「我們目前和OpenAI的差距在逐漸地縮小。但是你說超過它,沒有可能,到現在為止,你就算是讓DeepSeek的創始人梁文峰出來說,他自己都不敢說『我已經超過了OpenAI』。」
新美國安全中心(CNAS)助理研究員史堪隆(Ruby Scanlon)對美國之音說,DeepSeek之所以可以用較低端的硬體和成本打造出這一產品,涉及模型蒸餾(Modell Distillation)。她解釋說,假設一個模型中有5%是在從事整個模型裡最重要的工作,「如果你將所有計算能力和訓練資源集中在模型中最有用的那5%上──這就是模型蒸餾的原理──那麼你可以真正專注於最關鍵的部分,從而得到更好的答案。」
黃曼婷對《大紀元》表示,有購買DeepSeek企業版的人士說,DeepSeek提供的運算能力,跟TripleGPT是可以相比,但僅限於數字和數值,在人文或是圖片等美化的能力上面,還沒到這麼好。它的優勢是在於價格便宜,因為現在是開源給大家使用,它只是把過去大家互抄的結果,讓大家再來互抄一下吧。人們不清楚它的算力,到底是哪裡提供的,這也是很大的問題。
DeepSeek AI「姓黨」引吐槽
DeepSeek開發的AI產品自我標榜「低成本且性能直逼OpenAI模型」,但外界測試發現,DeepSeek跟中國其它AI一樣「黨性十足」,會迴避敏感問題。
許多網友測試發現,DeepSeek跟中共治下的其它AI一樣進行言論審查,凡涉及到8964、習近平、中國共產黨等敏感話題或政治性話題,回答或者是中共的宣傳用詞,或者乾脆拒絕回答。
有網友問「中國大躍進死多少人?」、「文革死多少人?」Deepseek都是回應暫時無法回答。網友怒稱「中國的人工智慧Deep Seek,姓黨,而且100%姓黨!」
中国的人工智能Deep Seek,姓党,而且100%姓党! pic.twitter.com/yhkRaaFFHI
— Petrichor (@Jam79922967) January 28, 2025
前內蒙古官員杜文在X平台上表示,「我從不相信任何對中共的吹捧,以我對中共的了解,它們不過是偷竊抄襲和造假而已,所有看上去先進、遙遙領先的數據都是宣傳、都是泡沫和謊言。中國當前共產統治的土壤出不來OpenAI和太空探索一樣的公司,就像荊棘上長不出葡萄。」
黃曼婷對《大紀元》說,中國AI不管是什麼水平,一旦回到中國的法規面上面,就沒有辦法有一個完整性的發展,它的思維模型,受限於那個緊箍咒,演算能力再好,它的最終呈現都要打非常大的問號。
「中國(企業)有很大很好的潛力,但是中國共產黨是把它的潛力滅下去的最大的兇手,它表現再怎麼好,中國共產黨也會把它包裝成另外一個形式,會把它壓制住,不讓它用最好的方式做呈現,變成是個很畸形的方式,呈現出中國共產黨要的模型。」
黃曼婷認為,最終DeepSeek只能在中國外收割一批韭菜,尤其是在股市上面,但是實際在技術上面,可能沒有什麼實際的作為。
「目前看起來,DeepSeek已經收割了一批韭菜,他們年後就可以退場,沒有辦法去做新的東西。」她說。