過去一週,中國AI公司DeepSeek推出的新模型,攪動美國矽谷AI圈。(彭博資料照)
過去一週,中國AI公司DeepSeek推出的新模型,攪動美國矽谷AI圈。(彭博資料照)
高佳菁/核稿編輯
〔財經頻道/空煙彈〕過去一週,來自中國的DeepSeek(深度求索) R1模型洗版了整個美國AI 圈,美國各大主流網站和社平網站大量探討這間中國神秘的AI公司。據報導,美國強力限制先進科技輸入中國背景下,DeepSeek能以低晶片數開發出與OpenAI O1並肩的新模型,但查詢成本卻便宜了98%,令人驚嘆。
據報導,2025年1月20日DeepSeek發布一款可媲美OpenAI O1的新模型R1後,是以極低的600萬美元(約新台幣1.96億元)製作成本,及僅用2000塊少量晶片就實現了與OpenAI等巨頭相媲美的性能。
請繼續往下閱讀...
業內人士指出,R1與OpenAI o1相比,主要吸引力在於其成本效益。其中,R1模型的查詢成本僅為每百萬token0.14美元,而OpenAI的費用則為7.5美元,便宜了98%。
這並不是DeepSeek令美國AI圈驚豔的首次。就在2個月前,DeepSeek發布的V3模型免費模型,也僅用558萬美元(約新台幣1.83億元)、遠低於如訓練成本高達7800萬美元(約新台幣25.6億元)的GPT-4。
據報導,1月24日在專業模型排名Arena上, 基準測試已升至全類別大模型第三。其中,在風格控制類模型(StyleCtrl)與OpenAI o1 並列第一,競技場得分則略超OpenAI O1的1352分、達1357分。
《CNBC》報導,微軟執行長納德拉(Satya Nadella)在22日在達沃斯世界經濟論壇上表示,DeepSeek的新模型令人印象深刻,不僅因為他們有效地建構一個開源模型,還因為它的推理計算效率極高。納德拉表示,「我們應該非常嚴肅地看待中國的人工智慧(AI)發展」。
AI投資者「modest proposal」一臉問號詢問,「DeepSeek為什麼突然成為主流焦點,導火線是甚麼」?而CNBC也做了一個40分鐘的深度視頻,討論美國AI是不是受到了中國威脅。
《世界報》高級商業編輯Holger Zschäpitz指出,DeepSeek可能對美國股市產生威脅,因為該公司以極低的成本構建了一個突破性的人工智慧模型,並且無需使用尖端晶片,這讓人質疑,投入該行業的數千億美元資本支出的實際效用。