亚洲国产天堂久久综合-亚洲国产天堂久久综合2261144-亚洲国产天堂久久综合9999-亚洲国产天堂久久综合图区-黄色aa大片-黄色aa毛片

中國的“ChatGPT時刻”來臨?

放大字體  縮小字體 發布日期:2025-02-05     來源:解放日報     瀏覽次數:12
核心提示:2024年12月,DeepSeek發布新一代大語言模型V3,已引起行業不少討論。1月20日發布的R1,將DeepSeek的熱度推向了高潮。一年多時間內,DeepSeek成為大模型行業的“黑馬”,是否意味著國內大模型迎來彎道超車的機會?

本報記者 查睿 裘雯涵

 

126日—27日,短短兩天內,國內AI創業公司DeepSeek(深度求索)遭遇兩次短暫宕機,DeepSeek將其歸因為新模型發布后導致訪問量激增。

 

新模型指的是剛發布的推理大模型DeepSeek-R1,由此帶來的訪問量有多大?27日,DeepSeek在蘋果美區應用商店下載量力壓ChatGPT,登頂免費App下載排行榜。

 

202412月,DeepSeek發布新一代大語言模型V3,已引起行業不少討論。120日發布的R1,將DeepSeek的熱度推向了高潮。

 

一年多時間內,DeepSeek成為大模型行業的“黑馬”,是否意味著國內大模型迎來彎道超車的機會?

 

硅谷都在談論DeepSeek

 

在硅谷,幾乎每個人都在談論DeepSeek。有報道稱,硅谷“被嚇壞了”,工程師正在瘋狂分析DeepSeek。還有說法稱,這是中國的“ChatGPT時刻”。

 

DeepSeek究竟厲害在哪?高性能、低成本、開源是外界提到的高頻詞。

 

輿論注意到,DeepSeek的推理計算效率極高,可以與業內一些頂尖的AI模型相媲美,與美國硅谷前沿發展保持同步。國外大模型排名榜單Arena最新測評顯示,R1基準測試在全類別大模型中排名第三,其中在風格控制分類中與OpenAI o1并列第一,得分達到1357分,甚至略超OpenAI o1。這也幾乎意味著,DeepSeek-R1躋身全球最強大模型之列。

 

DeepSeek的官方測試也顯示,R1在數學、代碼、自然語言推理等任務上,性能比肩OpenAI o1正式版。在各自小參數版本的模型比拼中,R1-32B的數學推理明顯優于o1-mini。

 

加利福尼亞大學伯克利分校教授亞歷克斯·迪馬基評價,DeepSeek的技術路線揭示了達到頂尖性能未必需要天文數字投入,“這對硅谷的燒錢競賽無異于釜底抽薪”。

 

DeepSeek有多便宜?有數據顯示,Deepseek V3的訓練成本僅為558萬美元,不足GPT-4o的二十分之一。推理模型R1API(應用程序編程接口)服務定價為每百萬tokens(詞元)僅需1元(緩存命中)/4元(緩存未命中),每百萬輸出tokens16元。大語言模型V3就更便宜了,每百萬tokens僅需0.1元(緩存命中)/1元(緩存未命中),每百萬輸出tokens2元。DeepSeek的定價約等于Llama 3-70B的七分之一,GPT-4 Turbo的七十分之一。

 

開源是DeepSeek備受關注的另一個重要原因。這意味著它已經與其他企業和研究人員共享基礎代碼,其他人能用相同的技術構建和發布自己的產品。

 

英偉達資深科學家吉姆·范稱贊DeepSeek是“非美國公司踐行OpenAI初心”的典范,通過開放技術細節和訓練方法,為全球研究者賦能。

 

出身國內算力最充足企業

 

天眼查信息顯示,DeepSeek背后的實控人是梁文鋒,他所創立的幻方量化是國內知名的量化私募基金,這也給DeepSeek打下了良好的算力基礎。

 

不同于常規基金依賴基金經理,量化基金通過數量模型的計算尋找投資機會,因此對數據尤為敏感,高頻交易更是離不開機器學習。為了從海量數據中挖掘投資機會,幻方量化早早開始囤積算力,先后斥資10億元,在美國對芯片出口管制前購買了1萬張英偉達A100型號GPU。機緣巧合下,幻方量化成為國內GPU算力最充足的企業之一。

 

AI行業有條規;▌t,簡單來說,就是算力越大、參數越多,訓練出的大模型性能就越好。如果遵照這條規則,幻方量化的算力基礎,成了DeepSeek最大的王牌之一。

 

當然,光靠算力優勢,DeepSeek顯然無法與全球AI巨頭抗衡。“DeepSeek爆火主要是創新的技術路線。”上海人工智能行業協會秘書長鐘俊浩認為,架構機制、訓練方法和管道并行算法等創新,展現了中國本土AI技術的潛力,顛覆了中國只是AI技術跟隨者、應用方的傳統認知。

 

英國科技網站“生命科學”撰稿人本·特納指出,美國限制向中企出口先進AI計算芯片,迫使DeepSeek-R1研發者采用更智能、更有效的算法,彌補計算能力的不足。ChatGPT據報道需要1萬臺英偉達的圖像處理器處理訓練數據,DeepSeek稱僅用2000臺圖像處理器就取得了類似結果。

 

DeepSeek公布的技術論文顯示,R1在訓練過程中實驗了三種技術路徑:直接強化學習、多階段漸進訓練和模型蒸餾,其中R1首次證明了直接強化學習的有效性?萍济襟w在技術解讀中打了個比方,面對同一道題目,大模型同時多次進行回答,系統將給每個答案打分,依照“高分獎勵低分懲罰”的邏輯進行循環,最終得出更具優勢的推理路徑。

 

中國“正在全力沖刺”

 

“元”公司首席執行官扎克伯格日前在一檔播客節目中坦言,DeepSeek技術非常先進。他表示,中國“正在全力沖刺”,擔心這個開源模型會被全世界廣泛使用,影響到美國科技行業的領先地位。

 

一些美國專家也評論稱,如果最好的開源技術來自中國,美國開發人員將在這些技術之上構建他們的系統,“從長遠來看,這可能會讓中國成為研發AI的中心”。

 

在華盛頓州工作的技術專家阿爾文·王·格雷林認為,DeepSeek的進展顯示,美國的領先優勢正在縮小,各國應該采取合作方式建設先進AI,而不是在AI領域進行“軍備競賽”。

 

在長文本交互和多模態的全球競爭中,國內大模型已經嶄露頭角,隨著大模型推理能力的迭代,中國還有機會彎道超車。鐘俊浩認為,高效利用計算資源、相對較低的成本,以及更高的市場活躍度,是國內訓練推理大模型的優勢所在。他表示,國內面臨高端算力芯片緊缺的難題,但推理大模型能更集約利用有限的算力資源,同時國內算力基礎設施較為完備,訓練硬件成本較低。

 

更重要的是,中國的人工智能市場處于開放競爭的狀態,不僅有阿里、字節、商湯等大型AI廠商,還有階躍星辰、MiniMax等高水平的AI創業企業。更多市場參與者,就有更多創新想法,意味著市場更活躍。

 

此外,中國具有極強的政策引導能力。例如上海發布“模塑申城”實施方案,就進一步明確“5+6”應用場景,為人工智能企業在推理方面的應用拓寬了發展空間,加速其商業化進程。


關鍵詞:DeepSeek
工博士工業品商城聲明:凡資訊來源注明為其他媒體來源的信息,均為轉載自其他媒體,并不代表本網站贊同其觀點,也不代表本網站對其真實性負責。您若對該文章內容有任何疑問或質疑,請立即與商城(www.mlzytj.cn)聯系,本網站將迅速給您回應并做處理。
聯系電話:021-31666777
新聞、技術文章投稿QQ:3267146135  投稿郵箱:syy@gongboshi.com
主站蜘蛛池模板: 99热在线获取最新地址 | 一级做a爰片久久毛片免费看 | h在线观看视频免费网站 | 78m-78模成视频在线 | 狠狠色噜噜狠狠狠97影音先锋 | 亚洲日本高清 | 多男一女一级淫片免费播放口 | 国产精品成人四虎免费视频 | 天天干夜夜爱 | 亚洲最大成人 | 午夜免费片在线观看不卡 | 国产精品爱啪在线线免费观看 | 全黄色一级片 | 波多野结衣久久国产精品 | 7m凹凸精品分类大全免费 | 伦理片日本韩国电影三级在线观看 | 日本www色视频成人免费网站 | 色综合久久中文字幕网 | 欧美一级免费观看 | 久久久噜噜噜久久久午夜 | 欧洲国产精品精华液 | 国产综合精品久久亚洲 | 日韩在线三级 | 夜夜狠狠操 | 综合欧美亚洲 | 日日夜夜狠狠干 | 亚洲综合成人在线 | 色天网站| 午夜亚洲国产精品福利 | 夜夜骑天天操 | 一道精品视频一区二区三区男同 | 欧美满足你的丝袜高跟ol | 高清性欧美xxx | 六月天丁香婷婷 | 456影院第一| 日本黄色免费在线 | 男男h全肉耽污 | 奇米米奇777 | 夜夜夜夜夜夜夜工噜噜噜 | 免费一级特黄特色黄大任片 | 久久久免费的精品 |