DeepSeek官網(wǎng)顯示,2月9日,DeepSeek-V3 API服務(wù)的45天優(yōu)惠價格體驗期已結(jié)束,從2月9日開始將調(diào)整為新的價格:每百萬輸入tokens 0.5元(緩存命中)/2元(緩存未命中),每百萬輸出tokens 8元。
 
在優(yōu)惠期,DeepSeek-V3的輸入token費用在緩存命中的情況下是每百萬0.1元,緩存未命中時為每百萬1元;輸出token的費用則是每百萬2元。
而在2月9日價格調(diào)整后,輸入token費用統(tǒng)一變?yōu)槊堪偃f2元,不管緩存是否命中;緩存未命中時的價格翻倍,漲幅為100%;輸出token費用漲至每百萬8元,漲幅為300%。
據(jù)《中國基金報》報道,有分析稱,優(yōu)惠體驗期是一種常見的市場推廣策略,在優(yōu)惠期內(nèi)吸引了大量用戶嘗試和使用DeepSeek-V3的API服務(wù),積累了用戶基礎(chǔ)和市場口碑,F(xiàn)在優(yōu)惠期滿,API價格如期恢復(fù)上調(diào)。
專家分析,DeepSeek提價之后,公有云價格競爭壓力減小,同時API性價比下降后利好企業(yè)本地化部署。由于DeepSeek-V3優(yōu)惠期價格相較云廠商具有極高的性價比,價格恢復(fù)后云廠商價格競爭壓力顯著下降。此外,由于API價格相較優(yōu)惠期上調(diào)2~4倍不等,部分企業(yè)或更傾向于選擇本地化部署,利好企業(yè)側(cè)算力需求與容災(zāi)備份需求。
成本降低打開的市場空間
據(jù)《21世紀(jì)經(jīng)濟報道》報道,伴隨DeepSeek爆火而來的,是業(yè)內(nèi)對其技術(shù)路線的研究和探討,以及由于成本降低打開的巨大市場空間。
Meta首席執(zhí)行官馬克·扎克伯格(Mark Zuckerberg)指出,開源在一開始并不占據(jù)很高優(yōu)勢,向外界開放可以更大程度推動產(chǎn)業(yè)鏈標(biāo)準(zhǔn)化,由此拉動產(chǎn)業(yè)鏈共同參與推動降低成本、優(yōu)化能力!皝碜灾袊男赂偁帉κ諨eepSeek,我認為他們顯示出,即將有一個全球化的開源標(biāo)準(zhǔn)——這是我們正在談?wù)摰氖虑橹?/B>!
亞馬遜首席執(zhí)行官Andy Jassy指出,“我們秉持一種信念,即幾乎所有大型生成式人工智能應(yīng)用都會使用多種模型類型,而且不同客戶會針對不同類型的工作負載使用不同模型,那么你就要盡可能多地提供前沿模型讓客戶選擇。我們正通過Amazon Bedrock這類服務(wù)來實現(xiàn)。這就是為什么我們迅速行動,確保DeepSeek模型能在Bedrock和SageMaker平臺上使用。”
Arm首席執(zhí)行官Rene Haas指出,DeepSeek無論是V3還是R1模型,都是基于行業(yè)前沿模型的基礎(chǔ)上,進行了大量創(chuàng)意性工作來搭建,由此讓推理更為高效!皩嵲捳f我認為很棒!彼m(xù)稱,因為這將推動行業(yè)發(fā)展走向更為高效,降低成本從而可以更好擴大整體計算需求。
谷歌首席執(zhí)行官Sundar Pichai也認為,DeepSeek是一個了不起的團隊,“回顧過去三年來的發(fā)展,會發(fā)現(xiàn)用于AI推理的支出比例相比AI訓(xùn)練一直在增加。這是件好事,因為推理顯然可以支持企業(yè)獲得良好的投資回報率(即加速推動應(yīng)用落地)。”
他指出,推理使用成本將不斷下降,使更多用例變得可行,“機會空間要多大就有多大(as big as it comes),這就是為什么我們在持續(xù)投資以期迎接這一時刻。”
AI投資的走向
AI在推理側(cè)的需求在快速發(fā)展早已是事實,只是DeepSeek用更低成本實現(xiàn)。乍一看來,與財報季前后美股科技巨頭動輒提出數(shù)百億美元的AI投入顯得差異巨大。
在業(yè)績會期間,關(guān)于AI投資的走向就備受關(guān)注。綜合來看,巨頭們?nèi)匀粓猿謱I基礎(chǔ)設(shè)施的投資,也強調(diào)了對推理側(cè)投資力度的價值——即面向應(yīng)用領(lǐng)域探索的投資重要性不容忽視。
亞馬遜首席執(zhí)行官Andy Jassy仔細分析道,過去幾周里,人們會做出一種假設(shè):如果能夠降低AI投資中任何一種技術(shù)組件的成本——主要指推理成本——就可以減少在技術(shù)方面的總體支出。
“但實際情況并非如此,我們在云計算領(lǐng)域經(jīng)歷過類似情形。”他指出,在2006年推出亞馬遜云服務(wù)(AWS)時,提供的S3存儲服務(wù)價格是每千兆字節(jié)15美分、計算服務(wù)每小時10美分,當(dāng)然現(xiàn)在價格已經(jīng)低得多。
“隨著技術(shù)發(fā)展,人們曾認為企業(yè)在基礎(chǔ)設(shè)施技術(shù)上的支出會大幅減少。但實際情況是,企業(yè)在每單位基礎(chǔ)設(shè)施上的花費確實會大幅降低,但隨后,他們會對之前因成本過高而從未嘗試的新項目產(chǎn)生興趣,想著還能搭建些什么,最終往往總體支出會大幅增加!彼仓赋觯w看,推理成本將顯著降低,這對客戶和公司業(yè)務(wù)都將是積極影響。
Meta首席財務(wù)官Susan Li也表示,公司仍然致力于針對AI訓(xùn)練和推理進行基礎(chǔ)設(shè)施相關(guān)投資!因為目前還不十分明晰我們到底需要什么,例如不知道我們的推理用途到底有多廣泛——這是我們競爭優(yōu)勢的真正來源。所以,我們也很興奮,因為仍有空間在推進更有效地運行這些工作負載!
她重申,當(dāng)前正處于AI資本支出的早期階段,還無法完全確定未來整體格局將如何演變。有資格談?wù)摰氖,GenAI將有許多全新、更簡單的方法,來豐富生態(tài)系統(tǒng),這顯然對應(yīng)用程序家族(the Family of Apps)的體驗有很大幫助。
“我仍然認為,隨著時間的推移,從服務(wù)質(zhì)量和服務(wù)規(guī)模角度看,大力投資資本支出和基礎(chǔ)設(shè)施將是一個戰(zhàn)略優(yōu)勢!盨usan Li說道。
根據(jù)Meta拆解,2025年針對AI基礎(chǔ)設(shè)施的投入主要涵蓋三方面:其中大部分將用于GPU部署,此外對構(gòu)建更高容量的網(wǎng)絡(luò)能力、光傳輸能力等也將持續(xù)。
“我認為現(xiàn)在確定長期資本密度還為時過早。因為要考慮的因素很多,包括底層模型的進步速度、效率;Gen AI產(chǎn)品的用例方向;一代硬件創(chuàng)新帶來了哪些性能和效率提升等。”Susan Li表示。
可以從一個案例對此進行解讀。關(guān)于AI/MR眼鏡品類,多家硅谷大廠其實已經(jīng)投入多年。即便根據(jù)Meta最新財報,其Reality Labs(虛擬現(xiàn)實實驗室)仍然巨虧50億美元,但近兩年來在該領(lǐng)域風(fēng)靡全球,甚至帶火AI終端發(fā)展新一輪周期的產(chǎn)品,Quest系列和Ray-Ban Meta也都出自其手。由此不能忽視在AI應(yīng)用探索過程中需要投入的前期成本。
從一個行業(yè)的正常發(fā)展邏輯來說,先行者往往會需要投入更多進行摸索,導(dǎo)致后來者在成本方面會有一些優(yōu)勢。只是DeepSeek的出現(xiàn)讓這種差異對比明顯,但并不能由此就認為巨頭們對AI的投資就完全屬于“浪費”,只是可能會存在一些可及性和有效性的問題。
|