1. 芯片制造流片多少錢?
流片成本的核心影響因素
工藝節(jié)點
先進工藝(如5nm、7nm):流片成本可達數(shù)千萬至數(shù)億美元。例如,5nm工藝的Full Mask費用可能超過4700萬美元,而臺積電3nm工藝的Full Mask費用高達數(shù)億美元。
成熟工藝(如28nm、40nm):成本顯著降低。例如,中芯國際40nm工藝的Full Mask費用約為30萬-50萬美元,MPW模式成本更低,約5.5萬美元。
生產(chǎn)模式
Full Mask:適用于量產(chǎn),費用高昂但單片分攤后較低。例如,臺積電7nm工藝單次流片約3000萬美元,量產(chǎn)1萬片時單片成本可降至約2050美元。
MPW:共享掩膜版,成本僅為單獨流片的5%-10%。例如,中芯國際55nm MPW項目成本約40萬元人民幣。
其他費用
IP授權(quán):如ARM Cortex-A系列授權(quán)費可能達數(shù)千萬美元。
封裝測試:占總成本的20%-30%。
研發(fā)成本:復雜芯片的研發(fā)人力成本可能超過數(shù)億元人民幣。
2. 中國AI再破世界紀錄,DeepSeek發(fā)布6710億參數(shù)數(shù)學推理模型R2大模型開啟算力自主新紀元
4月30日,中國AI企業(yè)深度求索(DeepSeek)在Hugging Face社區(qū)正式開源DeepSeek-Prover-V2-671B,以6710億參數(shù)規(guī)模刷新全球數(shù)學推理模型參數(shù)紀錄。該模型在形式化定理證明任務中創(chuàng)下88.9%的通過率(MiniF2F-test數(shù)據(jù)集),超越此前SOTA模型37個百分點,逼近人類數(shù)學家專業(yè)水平。同日,DeepSeek同步披露其即將發(fā)布的R2大模型技術(shù)細節(jié):基于華為昇騰910B芯片實現(xiàn)全棧自主可控,參數(shù)規(guī)模突破1.2萬億,單位推理成本僅為GPT-4的2.7%,在多模態(tài)處理、工業(yè)級邏輯驗證等領(lǐng)域展現(xiàn)出顛覆性能力,標志著中國AI從“應用落地”向“核心技術(shù)領(lǐng)跑”的關(guān)鍵跨越。
- 芯片設(shè)計中,已完成某國產(chǎn)14nm芯片RTL代碼的邏輯驗證測試,錯誤定位準確率達99.2%(數(shù)據(jù)來源:中芯國際技術(shù)白皮書)。
R2搭載MoE 3.0動態(tài)專家網(wǎng)絡(luò),1.2萬億參數(shù)按需激活(單次任務平均調(diào)用780億參數(shù)),支持多語言復雜指令處理:中文代碼生成準確率達89.3%(HumanEval數(shù)據(jù)集),英語法律文書解析效率較GPT-4提升40%。多模態(tài)能力實現(xiàn)行業(yè)級突破:
視覺處理:COCO圖像分割精度92.4%(超越CLIP模型11.6個百分點),在工業(yè)質(zhì)檢中可識別5微米級缺陷(凌云光技術(shù)實測數(shù)據(jù));
- 醫(yī)療診斷:胸部X光片病灶識別準確率98.1%,經(jīng)北京協(xié)和醫(yī)院10萬例臨床驗證,超越該院放射科專家團隊平均水平(97.3%)。
成本革命:昇騰芯片驅(qū)動的全棧自主化
R2基于華為昇騰910B芯片集群訓練,在FP16精度下實現(xiàn)512 PetaFLOPS算力,芯片利用率達82%(英偉達A100集群平均利用率65%),單位算力成本較A100降低45%。推理成本實現(xiàn)斷崖式下降:輸入0.07美元/百萬token,輸出0.27美元/百萬token,僅為GPT-4的2.7%(數(shù)據(jù)來源:華為昇騰實驗室《2025算力白皮書》)
R2是首個完全基于國產(chǎn)算力基礎(chǔ)設(shè)施(昇騰芯片+歐拉系統(tǒng))訓練的萬億級模型,實現(xiàn)從芯片設(shè)計、框架開發(fā)到模型訓練的全鏈條自主可控,打破美國在AI算力領(lǐng)域的長期壟斷。華為昇騰生態(tài)目前已吸引超3000家合作伙伴,R2的發(fā)布標志著中國AI“技術(shù)主權(quán)”的實質(zhì)性落地。
3. 全球AI芯片廠商匯總
一、美國企業(yè)
NVIDIA(英偉達)
A100/H100 GPU:基于Ampere和Hopper架構(gòu),支持大規(guī)模AI訓練與推理,適用于數(shù)據(jù)中心和超算。
Jetson系列(如Jetson AGX Orin):面向邊緣計算和機器人場景的低功耗AI芯片。
技術(shù)特點:CUDA生態(tài)優(yōu)勢,兼容性強,廣泛用于深度學習。
AMD
Instinct MI300系列:首款CPU+GPU異構(gòu)芯片,專為生成式AI和高性能計算優(yōu)化。
A100/H100 GPU:基于Ampere和Hopper架構(gòu),支持大規(guī)模AI訓練與推理,適用于數(shù)據(jù)中心和超算。
Jetson系列(如Jetson AGX Orin):面向邊緣計算和機器人場景的低功耗AI芯片。
Intel(英特爾)
Habana Gaudi/Gaudi2:針對AI訓練的ASIC芯片,對標英偉達A100。
Movidius VPU:面向邊緣端的視覺處理芯片(如無人機、安防攝像頭)。
TPU(Tensor Processing Unit)v4:專用ASIC芯片,支撐Google Cloud AI服務,擅長大規(guī)模矩陣運算。
Cerebras Systems
Wafer Scale Engine(WSE-3):基于整片晶圓的超大芯片,專攻大模型訓練,算力達百億億次級別。
Groq
LPU(Language Processing Unit):低延遲推理芯片,專為生成式AI(如LLM)優(yōu)化。
二、中國企業(yè)
華為(海思)
昇騰(Ascend)910/310:基于達芬奇架構(gòu),支持全場景AI(云邊端),算力達256 TFLOPS。
寒武紀(Cambricon)
思元(MLU)590:7nm制程,支持千卡集群訓練,對標英偉達A100。
地平線(Horizon Robotics)
征程(Journey)系列(如J5):面向自動駕駛的BPU架構(gòu),算力達128 TOPS。
壁仞科技(Biren)
BR100系列:7nm通用GPU,算力超越英偉達A100,主攻數(shù)據(jù)中心市場。
天數(shù)智芯(Iluvatar)
智鎧(Big Island)系列:通用GPU,兼容CUDA生態(tài),支持AI訓練與圖形渲染。
摩爾線程(Moore Threads)
MTT S系列:國產(chǎn)全功能GPU,支持AI加速和圖形渲染。
沐曦
燧原科技
4. 大摩追蹤中國AI硬件本土化進程
AI GPU自主化進度
1、2024年中國云AI市場規(guī)模約為170億美元,預計以28%年復合增長率發(fā)展
到2027年,市場規(guī)模將達480億美元,占全球市場的20%
2、華為是關(guān)鍵本土GPU供應商
3、這些芯片主要由SMIC采用7nm(n+2)工藝制造
SMIC預計將為主要客戶的GPU生產(chǎn)分配(圖1)產(chǎn)能;假設(shè)30-50%良率,到2027年中國本土GPU自主化率將達82%
4、各細分領(lǐng)域進展
存儲器、圖像傳感器、電源半導體自給率超出預期;設(shè)備和EDA領(lǐng)域的進展低于預期。
5. OpenAI架構(gòu)重大調(diào)整,仍由非營利實體控制全員持股,未來還需數(shù)萬億美元
從營利性有限責任公司(LLC)向公益責任公司(PBC),架構(gòu)調(diào)整是為了呼應業(yè)界意見和員工訴求。
擁有獨立董事會,核心治理權(quán)仍由非營利實體掌控,董事由后者任命。
調(diào)整后其股權(quán)結(jié)構(gòu)將發(fā)生變化,使員工、投資者及非營利實體能夠持有該公益責任公司的股權(quán)。
立志為世界打造一個智能“大腦”,讓OpenAI的服務惠及全人類,目前需要數(shù)千億美元,未來需要數(shù)萬億美元。
當?shù)貢r間5月5日,OpenAI發(fā)布聲明宣布對公司架構(gòu)進行調(diào)整,山姆?奧特曼也發(fā)布全員信,談及OpenAI的愿景、使命、資本架構(gòu)等外界關(guān)心的問題。
該公司表示,在完成從營利性有限責任公司(LLC)向公益責任公司(PBC)的架構(gòu)調(diào)整后,其核心治理權(quán)仍由非營利實體掌控。
在做出這一決定前,OpenAI已與加利福尼亞州及特拉華州總檢察長辦公室進行過溝通。OpenAI在發(fā)展之初曾獲微軟超百億美元戰(zhàn)略投資、并在軟銀今年領(lǐng)投的融資輪中估值達到3000億美元,此次架構(gòu)調(diào)整是對部分民間意見領(lǐng)袖及前員工訴求的回應。
OpenAI董事會主席布雷特?泰勒在與記者的視頻通話中表示,“在我們正在籌劃的架構(gòu)下,非營利實體將繼續(xù)掌控OpenAI。我們將把由該非營利組織控股的有限責任公司轉(zhuǎn)型為公益責任公司。通過此舉,該公司的股權(quán)結(jié)構(gòu)將發(fā)生變化,使員工、投資者及非營利組織能夠持有該公益責任公司的股權(quán)。
6. 化解半導體設(shè)備整合難題的思考
半導體設(shè)備是近幾年最火熱的賽道,因而其調(diào)整周期也最晚到來,目前設(shè)備整合成為行業(yè)最受關(guān)注的焦點。但由于各種局限,設(shè)備整合并未順利展開,對此芯謀研究有以下幾點思考。
減值退出攔路
半導體設(shè)備整合難度很大,有些地方政府投資難以退出成為主要障礙,同時有些社會資本也沒有做好減值退出的準備。
地方藩籬設(shè)限
除了減值退出成為“攔路虎”之外,設(shè)備整合的關(guān)鍵是實現(xiàn)龍頭企業(yè)平臺化,但首先要打破地方政府“功成在我”的藩籬。
半導體設(shè)備企業(yè)平臺化是全球產(chǎn)業(yè)規(guī)律。盡管半導體設(shè)備種類繁多,但根據(jù)SEMI的數(shù)據(jù),2024年半導體設(shè)備銷售額為1171億美元,前5家全球龍頭企業(yè)占據(jù)其中約70%的市場份額。這些核心企業(yè)覆蓋眾多細分領(lǐng)域,具備明顯的平臺化特征。目前國內(nèi)半導體設(shè)備行業(yè)也呈現(xiàn)出明顯的平臺化傾向,龍頭企業(yè)在優(yōu)勢產(chǎn)品之外,依靠強勢的市場地位開始拓展產(chǎn)品線。中小企業(yè)內(nèi)卷嚴重,它們大多上市無望,最好的選擇就是被龍頭企業(yè)并購整合。
市場主導并購
由于前述原因,地方政府很自然地試圖主導并購整合。但設(shè)備行業(yè)整合終究是市場說了算,行政手段只能化解地方國資對并購整合的限制,而不能主導行業(yè)整合。
頂層設(shè)計破題
半導體設(shè)備整合進度決定著自立自強的進度,解決目前遇到的難題,似乎只有頂層設(shè)計才能快速推動并購整合。
中國半導體設(shè)備國產(chǎn)化依賴國內(nèi)有限的市場和資源來推動,只能支撐為數(shù)不多的設(shè)備龍頭企業(yè)。隨著去中化等影響,國內(nèi)半導體市場出現(xiàn)一定的萎縮,有限的國內(nèi)市場愈發(fā)不應過度分散。設(shè)備行業(yè)的整合也愈發(fā)緊迫,如果整合速度過慢,就會嚴重影響龍頭企業(yè)的成長,影響設(shè)備國產(chǎn)化的進度。
半導體設(shè)備整合成為現(xiàn)階段中國半導體產(chǎn)業(yè)的核心問題,需要頂層設(shè)計來解決地方投資退出的問題。因為在中國半導體設(shè)備行業(yè)高速發(fā)展的初始階段,地方政府的投資發(fā)揮了決定性作用。在并購整合階段,地方政府投資因為國資減值的問題,也可以起到一票否決的作用。所以為了中國半導體設(shè)備產(chǎn)業(yè)的高質(zhì)量發(fā)展,需要政府發(fā)揮決定性作用來解決地方投資退出的難題。
7. 誰擁有最多的AI芯片?
人工智能的進步依賴于指數(shù)級增長的人工智能超級計算機。自2010年以來,用于訓練最著名人工智能模型的計算量每年增長4.1倍,從而實現(xiàn)了先進聊天機器人、圖像生成和蛋白質(zhì)結(jié)構(gòu)預測等突破。
領(lǐng)先人工智能超級計算機的計算性能每9個月翻一番,這得益于更多和更好的AI芯片的部署(圖1)。兩個關(guān)鍵因素推動了這一增長:芯片數(shù)量每年增加1.6倍,以及每個芯片的性能每年提高1.6倍。雖然在2019年擁有超過1萬個芯片的系統(tǒng)很少見,但到2024年,各公司部署的人工智能超級計算機的規(guī)模是當時的十倍以上,例如xAI擁有20萬個AI芯片的Colossus。
領(lǐng)先人工智能超級計算機的電力需求和硬件成本每年翻一番。人工智能超級計算機的硬件成本每年增長1.9倍,而電力需求每年增長2.0倍。因此,截至2025年3月,性能最強的人工智能超級計算機,即xAI的Colossus,其估計硬件成本為70億美元,電力需求約為300兆瓦——相當于25萬戶家庭的用電量。在電力需求大幅增長的同時,人工智能超級計算機的能源效率也更高了:每瓦計算性能每年提高1.34倍,這幾乎完全歸功于更節(jié)能芯片的采用。
如果觀察到的趨勢持續(xù)下去,到2030年6月,領(lǐng)先的人工智能超級計算機將需要200萬個AI芯片,硬件成本將達到2000億美元,電力需求將達到9GW。歷史AI芯片生產(chǎn)的增長以及像5000億美元的“星際之門計劃”(Project Stargate)這樣的重大資本投入表明,前兩個要求很可能能夠滿足。
美國擁有75%的人工智能超級計算機,其次是中國。美國約占人工智能超級計算機總性能的四分之三,中國以15%位居第二。
文章包含2019年至2025年間500臺AI超級計算機的數(shù)據(jù)集,發(fā)現(xiàn)性能、芯片數(shù)量、電力需求和硬件成本都呈指數(shù)級增長。AI超級計算機性能的快速增長,加上訓練時長的增加,使得前沿AI模型的訓練算力每年增長4-5倍,這推動了AI能力的顯著進步,并進一步刺激了對基礎(chǔ)設(shè)施的投資。如果趨勢持續(xù)下去,到2030年,領(lǐng)先的AI超級計算機的硬件成本可能超過2000億美元,并包含超過200萬個AI芯片。然而,預計9吉瓦的電力需求在單個地點難以滿足,很可能迫使公司采用跨多個站點的分布式訓練方法。
我們的數(shù)據(jù)還揭示了AI超級計算機所有權(quán)的關(guān)鍵趨勢,公司在AI超級計算機總性能中的份額從2019年的40%增加到2025年的80%以上。這一發(fā)現(xiàn)強調(diào)了先前觀察到的工業(yè)界和學術(shù)界之間日益擴大的計算鴻溝。美國擁有全球約75%的AI超級計算機性能,并且很可能通過其對AI芯片供應鏈的控制保持這種主導地位。
總而言之,AI超級計算機一直是AI進步的關(guān)鍵驅(qū)動力,并且是AI供應鏈的核心組成部分。我們的分析提供了關(guān)于AI超級計算機的增長模式、分布和資源需求的寶貴信息。這些信息對于政策制定者以及更廣泛地理解AI的發(fā)展軌跡將變得越來越重要。
8. HBM重構(gòu)DRAM市場格局,2025年首季DRAM市占排名
一季度在AI服務器保持穩(wěn)健推動對服務器DRAM需求,PC和移動需求復蘇力度也較預期更為明顯,此外疊加關(guān)稅觸發(fā)的部分補庫存需求的共同影響下,2025年一季度整體表現(xiàn)優(yōu)于預期,全球DRAM市場規(guī)模同比增長42.5%至267.29億美元,環(huán)比減少8.5%。
然而不可忽視的是,在2025年一季度,SK海力士憑借在HBM領(lǐng)域的絕對優(yōu)勢,終結(jié)三星長達四十多年的市場統(tǒng)治地位,以36.7%的市場份額首度登頂全球DRAM市場第一。
其實從2024年SK海力士與三星在DRAM上的差距就已經(jīng)開始減小,在4Q23和1Q24他們還保持有11%的份額差距,而到4Q24已經(jīng)減小到1%;與之相對應的是,在HBM市場份額上,SK海力士與三星從最初的幾乎五五分,到2025年一季度已經(jīng)擴大到兩倍以上的差距。盡管服務器DRAM bit出貨量依然保持15%的環(huán)比增長,但因AI芯片的出口管制以及HBM3E-12hi產(chǎn)品需求推遲的影響,1Q25三星的HBM銷售額環(huán)比大幅減少也令一季度DRAM銷售額環(huán)比下跌17%(按韓幣計算)。
9. 芯片戰(zhàn)場巨頭博弈四大關(guān)鍵市場!
全球芯片設(shè)計產(chǎn)業(yè)格局高度集中,TrendForce集邦咨詢數(shù)據(jù)顯示,2024年全球前十大芯片設(shè)計業(yè)者營收合計約2498億美元,其中前五家廠商總計貢獻逾90%營收。當前,英偉達、AMD、高通、聯(lián)發(fā)科等IC設(shè)計巨頭正圍繞手機、AI PC、汽車、服務器四大關(guān)鍵市場積極展開布局;與此同時,隨著AI推動高性能芯片需求上漲,加上市場競爭日趨激烈,產(chǎn)業(yè)鏈協(xié)同合作趨勢明顯。
隨著半導體產(chǎn)業(yè)競爭加劇,AI驅(qū)動芯片性能大幅提升,半導體產(chǎn)業(yè)中封裝、代工與設(shè)計等環(huán)節(jié)協(xié)同發(fā)展趨勢明顯,以持續(xù)探索芯片架構(gòu)與性能的極限。
當前芯片設(shè)計公司與晶圓代工廠商的協(xié)同合作是最基礎(chǔ)的模式,英偉達、高通、AMD、聯(lián)發(fā)科等芯片設(shè)計公司需要臺積電、三星、格芯、聯(lián)電等晶圓代工廠商生產(chǎn)芯片產(chǎn)品。隨著技術(shù)發(fā)展,半導體產(chǎn)業(yè)的合作正走向更深層次的協(xié)同優(yōu)化,特別是在先進節(jié)點和封裝技術(shù)上。
傳統(tǒng)的單片系統(tǒng)級芯片(SoC)在微縮方面正逼近物理極限,其設(shè)計和制造成本與難度急劇增加。為了繼續(xù)提升性能和集成度,業(yè)界正轉(zhuǎn)向更先進的解決方案,如3D集成電路(3D-IC)、Chiplet(芯粒)和異構(gòu)集成 。這些技術(shù)需要跨越設(shè)計、工藝、封裝和系統(tǒng)等多個領(lǐng)域的專業(yè)知識進行協(xié)同優(yōu)化。比如,實現(xiàn)高密度互連和管理復雜的多芯片系統(tǒng)熱效應,需要設(shè)計公司、代工廠和封裝廠的緊密配合。
此外,AI和HPC應用的爆發(fā)式增長,對專用、高性能、高能效的芯片(GPU、NPU、AI加速器)提出了極高要求。下游的系統(tǒng)廠商(如云服務提供商、汽車制造商)日益傾向于尋求針對特定應用定制或半定制的芯片解決方案,這直接推動了芯片設(shè)計公司與代工廠、甚至終端客戶之間更緊密的合作關(guān)系,實現(xiàn)系統(tǒng)與技術(shù)的協(xié)同優(yōu)化成為滿足這些需求的關(guān)鍵。
全球芯片市場挑戰(zhàn)與機遇并存,芯片設(shè)計作為半導體產(chǎn)業(yè)鏈核心,正迎來新一輪技術(shù)與生態(tài)模式變革,這場沒有硝煙的戰(zhàn)爭正在手機、AI PC、汽車與服務器等領(lǐng)域打響,技術(shù)創(chuàng)新、產(chǎn)品迭代與產(chǎn)業(yè)鏈協(xié)同合作是廠商的重要“武器”。巨頭博弈之下,芯片設(shè)計與半導體產(chǎn)業(yè)鏈將迎來什么新變化?我們拭目以待。
10. 黃仁勛:未來幾年中國AI芯片市場將達500億美元
5月6日,英偉達創(chuàng)始人兼CEO黃仁勛接受美國消費者新聞與商業(yè)頻道(CNBC)采訪時表示,中國人工智能市場可能在未來兩到三年內(nèi)達到約500億美元規(guī)模(側(cè)重硬件與算力需求),并強調(diào)美國企業(yè)若因政策限制錯失這一市場,將面臨收入損失、稅收減少及就業(yè)機會流失的多重打擊。
今年4月,美國政府正式通知英偉達,要求其向中國出口H20芯片需獲得出口許可證,并明確這些限制將“無限期生效”。由于美國政府對中國出口的限制措施,英偉達不得不計提了55億美元的季度費用。
目前,中國AI芯片市場規(guī)模快速增長,占全球市場的30%-40%,并展現(xiàn)出強勁的增長潛力。同時,黃仁勛也指出,中國在AI研究領(lǐng)域具有顯著優(yōu)勢——全球50%的AI研究人員來自中國,且中美技術(shù)差距極小。
黃仁勛多次強調(diào),中國是全球最大的半導體市場,美國公司無法進入這一市場將造成巨大的經(jīng)濟損失,包括收入、就業(yè)機會和稅收等。他指出,AI芯片出口限制實際上會損害美國的國家安全,并與美國政府的初衷背道而馳。此外,他還提到,世界對AI技術(shù)的需求正在快速增長,美國企業(yè)應抓住機會,爭取并占領(lǐng)全球市場。
2024年,盡管面臨美國出口管制的挑戰(zhàn),但通過推出符合出口規(guī)定的新款H20芯片,英偉達成功在中國市場實現(xiàn)了約120億美元的銷售額。這一數(shù)字占其全球總營收的13%左右。
與此同時,盡管隨著中國本土AI芯片廠商(如華為昇騰、寒武紀等)的崛起,英偉達的市場份額受到一定挑戰(zhàn),但其在中國AI芯片市場中仍然占據(jù)主導地位。IDC報告顯示,2024年,中國計算芯片的市場規(guī)模增長迅速,超過270萬張。其中,英偉達出貨量占比70%超過190W片。