1. 芯片設(shè)備三巨頭最新觀點(diǎn)
在此前美國的一場討論會(huì)上,面對高盛分析師Jim Schneider關(guān)于2025年晶圓廠設(shè)備市場前景的提問,Applied Materials CEO Gary Dickerson給出“低單位數(shù)成長”的保守預(yù)測,KLA Corporation CFO Bren Higgins卻預(yù)期“中單位數(shù)增長”,Lam Research CFO Doug Bettinger則完全回避數(shù)字預(yù)測。這種分歧并非市場判斷能力的差異,而是三家巨頭對半導(dǎo)體技術(shù)發(fā)展方向有著根本性的不同看法。
半導(dǎo)體設(shè)備產(chǎn)業(yè)向來以技術(shù)門檻極高著稱,Applied Materials的材料工程、KLA的檢測系統(tǒng)、Lam Research的蝕刻工藝,每項(xiàng)技術(shù)都需要十年以上的深度積累。然而,AI制程需求的爆發(fā)與地緣政治限制正在壓縮產(chǎn)業(yè)的技術(shù)更新周期,迫使設(shè)備商在不確定性中做出戰(zhàn)略押注。從2022年管制啟動(dòng)到當(dāng)前市場格局重塑,整個(gè)產(chǎn)業(yè)正在經(jīng)歷從技術(shù)分歧到競爭邏輯重構(gòu)的深層變革。三大設(shè)備巨頭將透過技術(shù)路線差異、產(chǎn)業(yè)生態(tài)斷裂、制造方式革命,以及政治風(fēng)險(xiǎn)內(nèi)化四個(gè)維度,展現(xiàn)這場產(chǎn)業(yè)轉(zhuǎn)折點(diǎn)的真實(shí)面貌。
Gary Dickerson的謹(jǐn)慎表態(tài)背后,隱藏著Applied Materials對未來技術(shù)路線的深度思考。這位執(zhí)行長在會(huì)議上強(qiáng)調(diào)iCAPS市場的“消化期”,實(shí)際上反映了該公司對摩爾定律平面縮放到達(dá)極限的判斷。 Applied Materials正在押注先進(jìn)封裝技術(shù),認(rèn)為AI芯片的復(fù)雜性將迫使產(chǎn)業(yè)從2D轉(zhuǎn)向3D整合。該公司位于奧巴尼的EPIC Center已投入15億美元,專門開發(fā)CoWoS(Chip-on-Wafer-on-Substrate)技術(shù),這是一場對異質(zhì)整合未來的豪賭。 Dickerson相信,當(dāng)CPU、GPU、記憶體必須整合在同一封裝內(nèi)時(shí),傳統(tǒng)的晶圓制造將讓位給材料工程和封裝技術(shù)。
Bren Higgins的樂觀預(yù)測則建立在制程復(fù)雜化不可逆轉(zhuǎn)的技術(shù)判斷上。 KLA Corporation這位財(cái)務(wù)長在會(huì)議中詳細(xì)描述了一個(gè)技術(shù)現(xiàn)實(shí):臺(tái)積電3納米制程的檢測步驟比7納米制程增加60%,每當(dāng)制程節(jié)點(diǎn)向前推進(jìn),電晶體尺寸就更接近物理極限。 Higgins押注的是“制程越先進(jìn),檢測越重要”的技術(shù)邏輯,該公司的電子束檢測設(shè)備能夠發(fā)現(xiàn)10納米以下的缺陷,正好契合AI芯片的零容錯(cuò)要求。 KLA相信,即使地緣政治風(fēng)險(xiǎn)持續(xù),先進(jìn)制程的檢測需求也不會(huì)減少,反而會(huì)因?yàn)榱悸蕢毫Χ掷m(xù)增長。
Doug Bettinger的策略回避顯露出Lam Research對技術(shù)路線的復(fù)雜判斷。該公司財(cái)務(wù)長在會(huì)議中反覆提及“etch-and-deposition intensity”概念,暗示公司同時(shí)押注兩個(gè)技術(shù)方向:3D NAND的垂直擴(kuò)展和先進(jìn)邏輯的3D架構(gòu)。 3D NAND從96層向200層演進(jìn)需要深寬比超過100:1的垂直蝕刻技術(shù),而AI芯片的3D電晶體結(jié)構(gòu)同樣需要原子級精度的工藝控制。然而,這兩個(gè)技術(shù)方向都面臨物理極限的挑戰(zhàn),Lam Research選擇保留戰(zhàn)略彈性,等待市場需求進(jìn)一步明朗化。
Applied Materials中國營收從32%暴跌至18%,每季損失10億美元的數(shù)字震撼市場,但真正的危機(jī)遠(yuǎn)超財(cái)務(wù)報(bào)表。這家設(shè)備巨頭失去的不僅是收入來源,更是與全球最大半導(dǎo)體消費(fèi)市場的技術(shù)共同發(fā)展機(jī)會(huì)。中國市場向來是新技術(shù)驗(yàn)證和工藝優(yōu)化的重要場域,當(dāng)Applied Materials被迫退出時(shí),該公司實(shí)際上失去了一個(gè)關(guān)鍵的技術(shù)改進(jìn)回饋機(jī)制。更嚴(yán)峻的是,中國本土設(shè)備商北方華創(chuàng)、中微公司正在成熟制程領(lǐng)域快速追趕,Applied Materials重返中國市場的技術(shù)門檻正在不斷提高。
KLA Corporation面臨的5億美元損失看似溫和,但技術(shù)生態(tài)的影響更加深遠(yuǎn)。該公司的檢測設(shè)備不只是硬體產(chǎn)品,更是整個(gè)制程監(jiān)控體系的技術(shù)核心。中國晶圓廠被迫尋找替代方案時(shí),正在重新建構(gòu)獨(dú)立的檢測標(biāo)準(zhǔn)和供應(yīng)鏈體系。長期而言,這種技術(shù)標(biāo)準(zhǔn)的分化將導(dǎo)致全球半導(dǎo)體產(chǎn)業(yè)出現(xiàn)兩套平行的品質(zhì)管控系統(tǒng),所有參與者的研發(fā)成本和技術(shù)復(fù)雜度都將大幅增加。 KLA面臨的真正挑戰(zhàn)不是短期收入損失,而是全球技術(shù)標(biāo)準(zhǔn)統(tǒng)一性的瓦解。
Lam Research中國營收占比從32%縮減至24%的過程中,客戶支援業(yè)務(wù)群組(CSBG)受到最嚴(yán)重沖擊。半導(dǎo)體設(shè)備的商業(yè)模式特性決定了設(shè)備銷售只是開始,后續(xù)十年的技術(shù)支援、升級改造、備件供應(yīng)才是真正的利潤來源。一臺(tái)蝕刻設(shè)備的使用周期通常超過十年,服務(wù)收入往往是設(shè)備價(jià)值的兩倍以上。中國市場的服務(wù)中斷不僅是當(dāng)期現(xiàn)金流損失,更意味著未來十年收益的永久消失。這種產(chǎn)業(yè)生態(tài)鏈的斷裂正在重塑全球半導(dǎo)體設(shè)備產(chǎn)業(yè)的商業(yè)邏輯。
Applied Materials賭的是封裝技術(shù)將取代傳統(tǒng)制程,KLA賭的是檢測需求將無限放大,Lam Research賭的是保持選擇權(quán)比下注更安全。三家公司看似預(yù)測市場,實(shí)際上是在選擇生存方式:是押注單一技術(shù)路線獲得先發(fā)優(yōu)勢,還是分散風(fēng)險(xiǎn)等待局勢明朗?
時(shí)間會(huì)證明誰的判斷更準(zhǔn)確。 AI芯片的制造需求能否真正彌補(bǔ)中國市場的損失,先進(jìn)封裝技術(shù)能否如Applied Materials所愿成為新的增長引擎,檢測設(shè)備的重要性是否如KLA預(yù)期般持續(xù)提升,市場終將給出答案。
但無論結(jié)果如何,有一點(diǎn)已經(jīng)確定:半導(dǎo)體設(shè)備產(chǎn)業(yè)已經(jīng)從純粹的技術(shù)競爭,轉(zhuǎn)變?yōu)榧夹g(shù)與政治并重的復(fù)合競爭。在這個(gè)新的競爭環(huán)境中,技術(shù)領(lǐng)先不再是唯一的勝負(fù)標(biāo)準(zhǔn),政治風(fēng)險(xiǎn)管控能力同樣決定企業(yè)的生死存亡。游戲規(guī)則已經(jīng)改變,回不去了。
2. openai與英偉達(dá)合作開發(fā)10千兆瓦系統(tǒng)
OpenAI 與英偉達(dá)確實(shí)已宣布達(dá)成戰(zhàn)略合作伙伴關(guān)系,計(jì)劃共同開發(fā)并部署至少 10 千兆瓦(10 gigawatts)的人工智能基礎(chǔ)設(shè)施系統(tǒng),用于訓(xùn)練和運(yùn)行 OpenAI 的下一代模型,推動(dòng)通往“超級智能”的目標(biāo)。
合作要點(diǎn)如下:
部署規(guī)模:雙方將建設(shè)并部署至少 10GW 的 NVIDIA 系統(tǒng),代表數(shù)百萬顆 GPU 的算力,是目前全球最大規(guī)模的 AI 數(shù)據(jù)中心建設(shè)計(jì)劃之一。
投資金額:英偉達(dá)計(jì)劃隨著每千兆瓦系統(tǒng)的部署,逐步向 OpenAI 投資高達(dá) 1000 億美元,用于支持?jǐn)?shù)據(jù)中心和電力基礎(chǔ)設(shè)施建設(shè)。
時(shí)間表:首個(gè) 1GW 的系統(tǒng)預(yù)計(jì)將在 2026 年下半年上線,采用英偉達(dá)下一代 Vera Rubin 平臺(tái)。
合作性質(zhì):OpenAI 將英偉達(dá)列為其“AI 工廠增長計(jì)劃”的首選戰(zhàn)略計(jì)算與網(wǎng)絡(luò)合作伙伴,雙方將協(xié)同優(yōu)化硬件與軟件發(fā)展路線圖。
此次合作標(biāo)志著 AI 基礎(chǔ)設(shè)施建設(shè)進(jìn)入“吉瓦級”時(shí)代,遠(yuǎn)超傳統(tǒng)數(shù)據(jù)中心的規(guī)模。
3. 傳中芯國際在測試首款國產(chǎn)28納米DUV光刻機(jī)
據(jù)多家行業(yè)媒體援引知情人士近日消息,中芯國際(SMIC)已開始對首款國產(chǎn)深紫外(DUV)光刻機(jī)進(jìn)行評估和測試。
據(jù)悉,中芯國際正在測試的深紫外線(DUV)光刻機(jī)由上海初創(chuàng)公司宇量昇生產(chǎn),采用浸沒式技術(shù),類似于ASML所采用的技術(shù)。這臺(tái)國產(chǎn)的28納米(nm)DUV光刻機(jī),可利用“多重曝光技術(shù)”生產(chǎn)7納米芯片,即在沒有EUV光刻機(jī)的情況下,通過多次光刻實(shí)現(xiàn)更精細(xì)線路圖案的折中方案。
目前尚不清楚該光刻機(jī)是否及何時(shí)能夠用于高端芯片的量產(chǎn)。但毫無疑問,成功研發(fā)并量產(chǎn)國產(chǎn)DUV光刻機(jī),對于保障中國龐大的成熟制程芯片供應(yīng)鏈安全、提升產(chǎn)業(yè)鏈韌性具有至關(guān)重要的戰(zhàn)略意義。
4. CPO概念爆火2025年光通信革命哪些企業(yè)已入局?
共封裝光學(xué)(Co-packaged Optics, CPO)作為光通信領(lǐng)域的顛覆性技術(shù),在2025年迎來了爆發(fā)式增長。
2025年3月,英偉達(dá)在GTC大會(huì)上正式發(fā)布了Quantum-X Photonics InfiniBand和Spectrum-x Photonics Ethernet兩款CPO交換機(jī),前者預(yù)計(jì)于2025年下半年上市,后者則將在2026年推出。與傳統(tǒng)插拔式光模塊相比,英偉達(dá)的CPO創(chuàng)新技術(shù)可將現(xiàn)有能效提高3.5倍,網(wǎng)絡(luò)可靠性提高10倍,部署時(shí)間縮短1.3倍。
盡管CPO不是非常新的技術(shù),但其“突然爆火”并非偶然,而是技術(shù)演進(jìn)、市場需求和商業(yè)壓力三者共同作用下的必然結(jié)果。最直接的原因是,它完美地解決了當(dāng)前數(shù)據(jù)中心和AI計(jì)算領(lǐng)域最迫切的痛點(diǎn)——顯著縮短了電信號傳輸距離,減少了信號完整性問題,同時(shí)顯著降低了功耗和延遲。
當(dāng)然,除了英偉達(dá)之外,全球還有數(shù)十家核心科技企業(yè)深度布局CPO領(lǐng)域,包括光通信巨頭、芯片制造商和云計(jì)算公司。市場應(yīng)用方面,預(yù)計(jì)CPO技術(shù)將在2025年開始商用,2026-2027年規(guī)模上量。第一代CPO產(chǎn)品將從800G和1.6T端口開始商用 ,逐步向更高速率發(fā)展。本文將從技術(shù)優(yōu)勢、市場驅(qū)動(dòng)力、核心企業(yè)布局、市場前景與挑戰(zhàn)等層面,全方位解析CPO技術(shù)這一2025開年以來的資本市場熱點(diǎn)。
CPO技術(shù)主要應(yīng)用于數(shù)據(jù)中心的交換機(jī)接口,其核心優(yōu)勢體現(xiàn)在三個(gè)維度:功耗、帶寬密度和延遲。根據(jù)多項(xiàng)研究數(shù)據(jù),CPO在關(guān)鍵性能指標(biāo)上顯著優(yōu)于傳統(tǒng)可插拔光模塊:
功耗方面:Broadcom數(shù)據(jù)顯示,可插拔光模塊功耗范圍為15-20 pJ/bit,而CPO系統(tǒng)可降低50%以上,達(dá)到5-10 pJ/bit。在800G傳輸速率下,CPO功耗為5.5W,而傳統(tǒng)可插拔技術(shù)為14W。
帶寬密度:CPO提升5-10倍帶寬密度,支持高速光通信和高帶寬需求。
尺寸與集成度:CPO實(shí)現(xiàn)更小尺寸、更緊湊設(shè)計(jì)和高集成度。
延遲方面:通過消除長距離電氣連接,CPO可提供亞微秒級的低延遲。
以上關(guān)鍵性能優(yōu)勢,對于高性能計(jì)算和AI訓(xùn)練集群至關(guān)重要。不過,CPO要求極高的對準(zhǔn)精度,通常需要<50nm橫向?qū)?zhǔn)公差以及光纖陣列的3D對準(zhǔn)。
整體來看,CPO技術(shù)爆火主要有以下幾個(gè)原因:
一是最根本的驅(qū)動(dòng)力:AI大模型的算力競賽。這也是CPO熱度飆升的最直接、最強(qiáng)大的催化劑。從2022年以來,ChatGPT等生成式AI的爆發(fā),催生了巨大的算力需求,其背后是無數(shù)英偉達(dá)GPU組成的超大規(guī)模計(jì)算集群。這些GPU之間需要高速、低延遲、高帶寬地交換數(shù)據(jù)(比如模型參數(shù)、梯度信息)。傳統(tǒng)的網(wǎng)絡(luò)連接速度無法滿足需求,導(dǎo)致強(qiáng)大的GPU算力在“等待”數(shù)據(jù),效率低下。這也意味著GPU間通信成為瓶頸。
而CPO技術(shù)能夠?qū)⒐庖嬷苯臃庋b在GPU旁邊,實(shí)現(xiàn)超短距離的高速互連,提供前所未有的帶寬(如1.6Tb/s甚至更高)和極低的功耗,徹底打破了GPU間的通信瓶頸,讓算力集群的性能得以充分發(fā)揮。
二是無法忍受的“功耗墻”。除了高速互聯(lián)之外,功耗是數(shù)據(jù)中心運(yùn)營商的噩夢,而傳統(tǒng)可插拔光模塊的功耗已經(jīng)逼近極限。隨著數(shù)據(jù)傳輸速率從800G向1.6T甚至3.2T演進(jìn),使用傳統(tǒng)的可插拔光學(xué)(Pluggable Optics)方案,光模塊的功耗、發(fā)熱和密度問題變得極其突出。一個(gè)1.6T的可插拔光模塊功耗可能超過20W,一個(gè)高密度交換機(jī)可能就需要數(shù)十個(gè)這樣的模塊,其總功耗和散熱需求是天文數(shù)字。
CPO將光引擎和電芯片(ASIC)緊密集成,通過芯片級的互連替代了傳統(tǒng)PCB板上的高速銅線,大幅降低了信號傳輸?shù)墓暮蛽p耗。數(shù)據(jù)顯示,CPO技術(shù)相比可插拔方案,能效可提升50%以上。這對于降低數(shù)據(jù)中心PUE(能源使用效率)、節(jié)省電費(fèi)至關(guān)重要。
三是帶寬密度需求的爆炸式增長。數(shù)據(jù)流量每年都在指數(shù)級增長,要求交換機(jī)的端口速率和密度越來越高。然而,交換機(jī)的前面板面積是固定的,但需要塞進(jìn)更多、更高速的端口。可插拔光模塊的尺寸和散熱限制了端口密度的進(jìn)一步提升。CPO則將光連接移至交換機(jī)內(nèi)部,與交換芯片共同封裝,解放了前面板的空間,從而極大地提高了交換機(jī)的帶寬密度。這使得單臺(tái)交換機(jī)能夠處理的數(shù)據(jù)流量呈數(shù)量級增長。
四是技術(shù)成熟度的拐點(diǎn)。任何技術(shù)從概念到爆火都需要經(jīng)過漫長的研發(fā)和積累,而CPO正處在產(chǎn)業(yè)化的臨界點(diǎn)。CPO并非全新概念,業(yè)界已對其研究和探索了多年,在材料、硅光技術(shù)、封裝工藝、熱管理等方面都有了長足的進(jìn)步,其在2023-2025年間實(shí)現(xiàn)了從技術(shù)概念到產(chǎn)業(yè)熱點(diǎn)的跨越式發(fā)展。
5. TechInsights 2025報(bào)告DRAM 與 NAND 趨勢與展望
DRAM
DRAM陣營里,Samsung、SK hynix、Micron三巨頭正把1z nm推向1β→1γ→1dnm,并在2027年前后轉(zhuǎn)入4F2單元結(jié)構(gòu),通過縮小特征尺寸、多層金屬互連和高介電常數(shù)電容薄膜把單片容量繼續(xù)往上頂。

3D NAND Layer
另一邊,3D NAND的層數(shù)已把218L/236L拋在身后,Samsung 286L、KIOXIA 286L、Micron 276L、SK hynix 321L、YMTC 267L紛紛進(jìn)入量產(chǎn)。


Hybrid bonding
為了在繼續(xù)加層的同時(shí)不讓晶圓翹曲、縫隙填充和柵極應(yīng)力失控,各家都把“陣列-邏輯分離+Hybrid Bonding”當(dāng)成續(xù)命良藥——先在一枚晶圓上做完三百多層垂直通道與柵極堆疊,再把它倒扣到另一枚已布好外圍電路的CMOS晶圓上,用亞微米級銅-銅直接鍵合省去凸塊、壓縮厚度、提升帶寬,也讓國產(chǎn)YMTC Xtacking和KIOXIA BiCS-CBA在制裁陰影下仍能繼續(xù)迭代。
簡言之,存儲(chǔ)芯片的物理極限正被 “更細(xì)的線條、更薄的Die、更高堆疊+晶圓級混合鍵合” 這套組合一點(diǎn)點(diǎn)推開,DRAM在納米尺度里榨電容,NAND在微米垂直里深挖,Hybrid Bonding是兩者共同且最關(guān)鍵的跳板。
6. 一文讀懂大模型常見的10個(gè)核心概念
1)、大模型型號
每個(gè)大模型都有其獨(dú)特的設(shè)計(jì)和功能,有些大模型可能在語言理解方面表現(xiàn)出色,有些則可能在生成圖像或解決特定領(lǐng)域問題上更有優(yōu)勢,就像不同品牌的汽車。
同一個(gè)大模型也會(huì)有不同的版本型號,例如DeepSeek R1、DeepSeek V3等,不同的版本號代表著全面的進(jìn)化,例如更大的參數(shù)、更快的速度、更長的上下文、或者多模態(tài)之類的新功能。
很多模型還針對不同任務(wù)做了微調(diào),這些在名字上同樣有區(qū)分,比如DeepSeek Coder V2、DeepSeek Math等。
通常情況對話型就加chat,寫代碼就加coder,算數(shù)學(xué)就加math,做視覺就加vision等等。
2)、模型參數(shù)
模型參數(shù)的數(shù)量通常非常龐大,比如7B、14B、32B等(7B=7Billion=7000000000個(gè)參數(shù)),一個(gè)擁有數(shù)十億甚至數(shù)萬億參數(shù)的大模型,就像一個(gè)擁有超級多“腦細(xì)胞”的超級大腦。這些參數(shù)決定了模型如何理解輸入的信息,并生成相應(yīng)的輸出。
模型參數(shù)越大,通常能夠?qū)W習(xí)到更復(fù)雜的模式和規(guī)律。
參數(shù)越大,價(jià)格越貴,所以需要根據(jù)處理任務(wù)的復(fù)雜度,合理選擇不同“尺寸”的模型。
7B 模型
適用場景:適用于一些對實(shí)時(shí)性要求較高,且任務(wù)相對簡單的場景。
14B 模型
適用場景:可以處理稍微復(fù)雜一點(diǎn)的自然語言處理任務(wù)。
32B 模型
適用場景:生成質(zhì)量較高的文本,比如吸引人的廣告文案、社交媒體推文等內(nèi)容,提供一些不錯(cuò)的創(chuàng)意和內(nèi)容生成。在知識(shí)問答系統(tǒng)中,能夠回答一些涉及一定領(lǐng)域知識(shí)的問題,如 “人工智能的發(fā)展歷程是怎樣的”。
70B 模型
適用場景:具備更強(qiáng)的語言理解和生成能力,適用于復(fù)雜的對話系統(tǒng),能夠進(jìn)行多輪對話,理解對話中的上下文信息,并給出合理的回應(yīng);在文本生成方面,能夠生成更連貫、更有邏輯的長篇內(nèi)容,如小說、技術(shù)文檔等。
671B 模型
適用場景:通常具有非常強(qiáng)大的知識(shí)儲(chǔ)備和語言處理能力,能夠處理極其復(fù)雜的任務(wù)。
3)、上下文長度
你可以把上下文長度想象成一個(gè)“記憶窗口”。
當(dāng)大模型處理文本時(shí),它會(huì)考慮一定長度的前文內(nèi)容來理解當(dāng)前的文本信息,這個(gè)長度就是上下文長度。一般簡單且短的問題用低上下文,而嚴(yán)謹(jǐn)且文本量大的用高上下文。
上下文長度通常有:
4)、Token
Token可以理解為文本的“積木塊”。
當(dāng)大模型處理文本時(shí),它會(huì)把文本分成一個(gè)個(gè)小的單元,這些小單元就是Token。比如句子“我喜歡吃蘋果”,可能會(huì)被分成“我”“喜歡”“吃”“蘋果”這幾個(gè)Token。
每個(gè)Token都有其對應(yīng)的編號或向量表示,就像每個(gè)積木塊都有自己的獨(dú)特標(biāo)識(shí)一樣,模型就是通過操作這些“積木塊”來進(jìn)行語言處理。
5)、蒸餾
蒸餾可以想象成從一個(gè)“知識(shí)淵博的老師”(大模型)那里提取精華,傳授給一個(gè)“學(xué)生”(小模型)的過程。大模型通常包含了大量的知識(shí)和信息,但它可能比較復(fù)雜,運(yùn)行起來比較慢。
蒸餾是通過一種特殊的訓(xùn)練方法,讓小模型學(xué)習(xí)大模型的行為和知識(shí),從而變得更加聰明。就像學(xué)生向老師學(xué)習(xí)一樣,小模型通過蒸餾可以在保持一定性能的同時(shí),變得更加簡潔和高效,能夠更快地處理任務(wù)。
6)、量化
模型參數(shù)通常是非常精確的數(shù)字,占用大量的存儲(chǔ)空間和計(jì)算資源。量化就是把這些精確的數(shù)字用更簡單、更緊湊的方式表示,比如把一個(gè)32位的浮點(diǎn)數(shù)變成8位的整數(shù)。
7)、知識(shí)庫與RAG
知識(shí)庫就像是一個(gè)巨大的圖書館,里面存放著各種各樣的知識(shí)和信息,比如歷史事件、科學(xué)知識(shí)、文化傳統(tǒng)等等。
而RAG(檢索增強(qiáng)生成)則是一種從這個(gè)“圖書館”里快速找到有用信息,然后把這些信息提供給大模型,讓大模型能夠根據(jù)這些準(zhǔn)確的知識(shí)來生成更準(zhǔn)確、更有依據(jù)的回答。
8)、MOE(混合專家模型)
DeepSeek采用MoE(Mixture of Experts,混合專家)架構(gòu),訓(xùn)練多個(gè)專家模塊,每個(gè)專家針對特定的數(shù)據(jù)分布或任務(wù)進(jìn)行優(yōu)化。
9)、Prompt
Prompt可以理解為給大模型的“提示語”或“指令”。當(dāng)你想要讓大模型做某件事情或回答某個(gè)問題時(shí),你輸入的那段文字就是Prompt。
Prompt的設(shè)計(jì)非常重要,因?yàn)樗鼤?huì)直接影響大模型的輸出結(jié)果。
10)、Agent
Agent可以根據(jù)大模型的能力和一些預(yù)設(shè)的規(guī)則,自主地完成一些任務(wù),比如與用戶進(jìn)行對話、處理信息、執(zhí)行特定的操作等。
Agent就像是一個(gè)有自己思維和行動(dòng)能力的小機(jī)器人,它能夠理解用戶的需求,然后利用大模型的知識(shí)和自身的功能來幫助用戶解決問題,為用戶提供服務(wù)。
7. 人工智能的基礎(chǔ)設(shè)施投資越來越大,投人工智能95%尚沒有回報(bào),人工智能尚未開啟替代人工,人工智能的智能尚需時(shí)間
你提到的這些現(xiàn)象,確實(shí)是當(dāng)前人工智能發(fā)展階段的真實(shí)寫照。我們可以從幾個(gè)角度來拆解這個(gè)問題:
一、“基礎(chǔ)設(shè)施投資越來越大”
這是事實(shí),也是必然。
算力、數(shù)據(jù)、模型規(guī)模是AI發(fā)展的三大支柱,而這三者都在指數(shù)級增長。
比如,訓(xùn)練一個(gè)GPT-4級別的模型,成本可能高達(dá)數(shù)千萬到上億美元。
芯片(如NVIDIA H100)、電力、冷卻系統(tǒng)、數(shù)據(jù)中心建設(shè),都是重資產(chǎn)投入。
國家層面也在加碼:中美歐都在把AI基礎(chǔ)設(shè)施當(dāng)作“新基建”的核心,類似當(dāng)年的高鐵、5G。
結(jié)論:這不是泡沫,而是新一輪技術(shù)革命的“地基”,就像電力、鐵路、互聯(lián)網(wǎng)早期一樣,投入巨大,回報(bào)周期長。
二、“95%的AI投資尚未回報(bào)”
這句話并不夸張,甚至可能更悲觀。
To B市場:大多數(shù)AI公司還在“POC(試點(diǎn))地獄”,客戶愿意試點(diǎn),不愿意付費(fèi)。
To C市場:除了ChatGPT、Midjourney等少數(shù)爆款,大多數(shù)AI產(chǎn)品DAU低、留存差、變現(xiàn)弱。
估值與收入脫節(jié):很多AI公司估值10億美元,年收入不到1000萬美元。
風(fēng)險(xiǎn):這一輪AI熱潮中,95%的公司可能活不到盈利那天,但剩下的5%可能會(huì)成為下一個(gè)Google、Apple。
三、“尚未開啟替代人工”
這個(gè)說法部分正確,但要看場景。
已經(jīng)替代:客服、翻譯、基礎(chǔ)文案、代碼補(bǔ)全、圖像標(biāo)注、金融分析等崗位,已經(jīng)被AI大幅滲透。
尚未替代:需要物理操作、復(fù)雜判斷、情感交互、責(zé)任承擔(dān)的工作,如護(hù)士、律師、廚師、 plumber,AI還插不上手。
瓶頸不在“智能”,而在“可靠性”:
AI可以寫代碼,但不能保證不出錯(cuò);
AI可以看病,但不能簽字承擔(dān)責(zé)任;
AI可以開車,但不能坐牢。
關(guān)鍵問題:社會(huì)制度、法律、倫理、責(zé)任機(jī)制,還沒跟上AI的能力。
四、“智能尚需時(shí)間”
這句話是最核心也最被低估的。
當(dāng)前AI是“統(tǒng)計(jì)擬合器”,不是“理解器”。
它能模仿語言,但不理解世界;
它能生成圖像,但不知道物理規(guī)律;
它能通過考試,但不知道“為什么”。
真正的“替代人工”,需要:
多模態(tài)理解(視覺+語言+行動(dòng))
長期記憶與推理
自主目標(biāo)設(shè)定與執(zhí)行
社會(huì)協(xié)作與責(zé)任承擔(dān)
時(shí)間估算:
5年內(nèi):AI將成為“超級助手”,人均配一個(gè)“AI實(shí)習(xí)生”;
10年內(nèi):AI將重構(gòu)大多數(shù)知識(shí)工作,但仍有邊界;
20年內(nèi):可能出現(xiàn)**“通用人工智能(AGI)”**,社會(huì)制度將面臨重塑。
總結(jié)一句話:
我們正在為一場尚未到來的智能革命“修路”,而大多數(shù)人還在用“馬車”的標(biāo)準(zhǔn)衡量它。
8. 阿里云與英偉達(dá)官宣合作Physical A,押寶具身智能輔助駕駛
在今日舉辦的2025杭州云棲大會(huì)上,阿里云和英偉達(dá)在Physical AI(物理AI)領(lǐng)域達(dá)成合作。阿里云人工智能平臺(tái)PAI將集成英偉達(dá)Physical AI軟件棧,將為企業(yè)用戶提供數(shù)據(jù)預(yù)處理、仿真數(shù)據(jù)生成、模型訓(xùn)練評估、機(jī)器人強(qiáng)化學(xué)習(xí)、仿真測試等全鏈路平臺(tái)服務(wù),進(jìn)一步縮短具身智能、輔助駕駛等應(yīng)用的開發(fā)周期。
資料顯示,Physical AI(物理人工智能)是人工智能技術(shù)向物理世界延伸的分支領(lǐng)域,旨在通過融合多模態(tài)感知、空間關(guān)系理解和物理規(guī)則認(rèn)知,實(shí)現(xiàn)與現(xiàn)實(shí)世界的交互。
據(jù)介紹,阿里云人工智能平臺(tái)PAI將集成NVIDIA Isaac Sim、NVIDIA Isaac Lab、NVIDIA Cosmos和Physical AI數(shù)據(jù)集在內(nèi)的全套Physical AI軟件棧,結(jié)合阿里云大數(shù)據(jù)AI平臺(tái)能力,形成覆蓋數(shù)據(jù)預(yù)處理、仿真數(shù)據(jù)生成、模型訓(xùn)練評估、機(jī)器人強(qiáng)化學(xué)習(xí)、仿真測試在內(nèi)的全鏈路平臺(tái)支撐。
阿里巴巴集團(tuán)董事兼首席執(zhí)行官,阿里云智能集團(tuán)董事長兼首席執(zhí)行官吳泳銘表示,未來可能會(huì)有超過全球人口數(shù)量的Agent(智能體)和機(jī)器人,和人類一起工作,對真實(shí)世界產(chǎn)生巨大影響。
他認(rèn)為,大模型是下一代操作系統(tǒng),而AI云是下一代計(jì)算機(jī)。也許未來全世界只會(huì)有5、6個(gè)超級云計(jì)算平臺(tái)。目前阿里正積極推進(jìn)3800億的AI基礎(chǔ)設(shè)施建設(shè),并計(jì)劃追加更大的投入。為了迎接ASI(超級人工智能)時(shí)代的到來,從GenAI元年的2022年到2032年,阿里云全球數(shù)據(jù)中心的能耗規(guī)模將提升10倍。
9. 阿里吳泳銘三年3800億投建AI基礎(chǔ)設(shè)施,劍指ASI時(shí)代
9月24日,在杭州云棲大會(huì)上,阿里巴巴集團(tuán)CEO、阿里云智能集團(tuán)董事長兼CEO吳泳銘發(fā)表重磅演講,向外界釋放出阿里在人工智能領(lǐng)域前所未有的雄心。他宣布,阿里巴巴正在積極推進(jìn)三年3800億的AI基礎(chǔ)設(shè)施建設(shè)計(jì)劃,并將會(huì)持續(xù)追加更大的投入。
吳泳銘認(rèn)為,人類正站在一場由AI驅(qū)動(dòng)的“智能化革命”門檻上。過去,工業(yè)革命放大了人類的體能,信息革命提升了信息處理能力,而AI革命將前所未有地解放人類的智力潛能。在短短三年內(nèi),AI的智能水平已從“高中生”躍升至“博士生”,甚至能在國際數(shù)學(xué)奧林匹克競賽中摘金奪銀。
然而,吳泳銘強(qiáng)調(diào),AGI并非終點(diǎn),而是通往ASI的跳板。AGI的目標(biāo)是將人類從80%的重復(fù)性工作中解放出來,讓我們專注于創(chuàng)造與探索;而ASI則將是全面超越人類智能的系統(tǒng),能夠以指數(shù)級速度推動(dòng)科技進(jìn)步,解決醫(yī)學(xué)、能源、氣候、星際旅行等人類長期未能攻克的難題。
他在演講中指出,當(dāng)前正處于人工智能發(fā)展的關(guān)鍵轉(zhuǎn)折點(diǎn)。從2022年生成式AI(GenAI)爆發(fā)元年起,短短三年間,AI技術(shù)已深刻改變各行各業(yè)。而未來十年,AI將從“生成式智能”邁向“人工超級智能”(Artificial Superintelligence, ASI)時(shí)代。
吳泳銘表示,在AGI到ASI的巨大變革中,大模型將是下一代的操作系統(tǒng)。“并不是說大模型替代了windows或者說linux這樣的操作系統(tǒng)。而是大模型以及相關(guān)的系統(tǒng),在整個(gè)物理世界和數(shù)字世界的交互當(dāng)中,將承載現(xiàn)有操作系統(tǒng)的地位。未來幾乎所有鏈接真實(shí)世界的工具接口,都將與大模型進(jìn)行連接,所有用戶需求和行業(yè)應(yīng)用將會(huì)通過大模型相關(guān)的工具執(zhí)行任務(wù)”。
吳泳銘首次系統(tǒng)性地提出了通往ASI的三階段演進(jìn)路線:
第一階段是“智能涌現(xiàn)”,核心是“學(xué)習(xí)人”。大模型通過學(xué)習(xí)互聯(lián)網(wǎng)上近乎全量的人類知識(shí),涌現(xiàn)出泛化智能,具備理解意圖、解答問題和多步推理的能力。這是過去幾年AI發(fā)展的主線。
第二階段是“自主行動(dòng)”,核心是“輔助人”。AI不再局限于對話,而是具備工具使用(Tool Use)和編程(Coding)能力,能在數(shù)字與物理世界中自主執(zhí)行任務(wù)。用戶只需用自然語言下達(dá)指令,AI即可自動(dòng)調(diào)用軟件、編寫代碼、操作設(shè)備,完成復(fù)雜工作。吳泳銘指出,當(dāng)前行業(yè)正處于這一階段,未來每個(gè)人都將擁有數(shù)十甚至上百個(gè)24小時(shí)工作的AI代理(Agent)。
第三階段是“自我迭代”,核心是“超越人”。這需要兩大關(guān)鍵突破:一是AI直接連接真實(shí)世界的全量原始數(shù)據(jù),擺脫對人類歸納知識(shí)的依賴;二是實(shí)現(xiàn)“自主學(xué)習(xí)”(Self-learning),通過與物理世界的持續(xù)交互和反饋,自主優(yōu)化模型架構(gòu)、數(shù)據(jù)流程,實(shí)現(xiàn)自我進(jìn)化。當(dāng)AI完成無數(shù)次“交互-反饋-優(yōu)化”的循環(huán)后,一個(gè)早期的ASI將由此成型。
為支撐這一宏大愿景,吳泳銘明確了阿里云的兩大戰(zhàn)略路徑。其一,通義千問堅(jiān)定走開源開放路線,致力于打造“AI時(shí)代的Android”,賦能全球開發(fā)者生態(tài)。其二,構(gòu)建“下一代計(jì)算機(jī)”——超級AI云,提供全球智能算力網(wǎng)絡(luò)。為此,阿里正在推進(jìn)三年3800億的AI基礎(chǔ)設(shè)施建設(shè)計(jì)劃,并將持續(xù)追加更大投入。遠(yuǎn)期規(guī)劃顯示,到2032年,阿里云全球數(shù)據(jù)中心的能耗規(guī)模將比2022年提升10倍。
值得一提的是,阿里Qwen3-Max,是阿里巴巴迄今為止規(guī)模最大、能力最強(qiáng)的模型。目前,Qwen3-Max-Instruct的預(yù)覽版在LMArena文本排行榜上位列第三,超越了GPT-5-Chat。正式版本在代碼能力和智能體(agent)能力方面進(jìn)一步提升,在涵蓋知識(shí)、推理、編程、指令遵循、人類偏好對齊、智能體任務(wù)和多語言理解的全面基準(zhǔn)測試中均達(dá)到業(yè)界領(lǐng)先水平。
10. AI時(shí)代下全球及中國半導(dǎo)體產(chǎn)業(yè)現(xiàn)狀與展望
全球半導(dǎo)體市場的發(fā)展趨勢 馮莉指出,據(jù)最新WSTS公布數(shù)據(jù)顯示,2024年全球半導(dǎo)體銷售額同比增長19.7%至6,305億美元。預(yù)估2025年全球半導(dǎo)體市場銷售額將繼續(xù)保持強(qiáng)勢增長,突破7,000億美元,同比增長11.2%。從2000年2,000億美元的市場規(guī)模的體量開始,大約花了十三年的時(shí)間達(dá)到了3,000億美元,之后每增長1,000億美元,大概花費(fèi)4年左右的時(shí)間。到2022年左右,增長節(jié)奏變成每兩年增長1,000億美元,到2025年已經(jīng)達(dá)到7千億美元。預(yù)測2030年的增長將達(dá)到1萬億美元,主要推手是人工智能。
關(guān)于人工智能,我們可以看到其支持AI大模型的底層基礎(chǔ)建設(shè)。服務(wù)器、數(shù)據(jù)中心和存儲(chǔ)將遠(yuǎn)超其他細(xì)分市場。2024年的這一部分占到1,490億美元。2030年時(shí),比重將翻倍,達(dá)到3,400億美元,占1萬億美元的34%。
從2020年到2030年,整個(gè)AI基礎(chǔ)建設(shè)對半導(dǎo)體的拉動(dòng)作用非常大,包括ASIC、FPGA、GPU和CPU。2025年即當(dāng)前的整個(gè)AI基礎(chǔ)建設(shè)大約是1,390億美元的體量,其中GPU占1,000億美元,2030年GPU的比重翻了三倍,達(dá)到3,260億美元,成長迅速。 在整個(gè)半導(dǎo)體產(chǎn)業(yè)發(fā)展過程中,各地方政府發(fā)揮了巨大的推動(dòng)作用。美國在2025年宣布了5,000億美元的人工智能基礎(chǔ)設(shè)施,這也被稱為星際之門計(jì)劃。歐洲有芯片法案,有超過500億歐元的投資。
中國大陸有大基金一期、二期、三期的投資在進(jìn)行。韓國的K半導(dǎo)體策略,10年計(jì)劃投資4,500億美元。日本設(shè)立了2,200億日元的后5G基金發(fā)展半導(dǎo)體,同時(shí)也通過一系列招商引資手段吸引臺(tái)積電。各國都將半導(dǎo)體視為戰(zhàn)略資源推動(dòng)。
中國在一系列政策支持下,從2000年到2020年的中國半導(dǎo)體產(chǎn)業(yè)發(fā)展也非常迅速。從全球晶圓廠產(chǎn)能來看,2000年時(shí)美國和日本占據(jù)了全球50%以上的產(chǎn)能,中國大陸產(chǎn)能當(dāng)時(shí)只占約2%。2010年,半導(dǎo)體產(chǎn)業(yè)向韓國和中國臺(tái)灣轉(zhuǎn)移,兩者一共占據(jù)全球35%的產(chǎn)能。此時(shí)中國大陸占據(jù)全球產(chǎn)能的9%。2020年,隨著新產(chǎn)線的建設(shè)及原有產(chǎn)線的擴(kuò)產(chǎn),中國大陸已占據(jù)全球17%的產(chǎn)能。
根據(jù)SEMI最新預(yù)測,2026年300mm Fab廠中國大陸部分將占到26%。 根據(jù)SEMI 2024-2028年設(shè)備投資的預(yù)測數(shù)據(jù),到2028年,中國大陸、中國臺(tái)灣以及韓國仍然是三個(gè)相對穩(wěn)定投資的地區(qū)。2024年,美國在設(shè)備上的投資為240億美元,2028年將增長到330億美元,趕上了中國大陸、韓國以及中國臺(tái)灣的投資節(jié)奏,東南亞也有所增長,中東和歐洲地區(qū)的投資在這4年內(nèi)翻一番,2028年達(dá)到150億美元。
中國大陸地區(qū)的晶圓廠投資在未來4年將恢復(fù)到正常水平,2028年預(yù)估的晶圓廠投資金額仍高達(dá)280億美元。 根據(jù)SEMI全球Fab設(shè)備投資趨勢的數(shù)據(jù)來看,2020年時(shí),投資金額基本上維持在400億到600億美元。2021年發(fā)生了巨大變化,投資規(guī)模達(dá)到1千億美元。從2021年到2025年,都基本維持在這樣的水平。從2026年到2028年,受到AI及全球芯片法案的影響,投資規(guī)模將會(huì)突破1,200億美元。 AI的投資對整個(gè)芯片市場設(shè)備投資產(chǎn)生了一定影響。2025年AI和HPC的投資已經(jīng)占到設(shè)備總投資的40%,這些投資集中在7納米及以下的邏輯芯片,包括相關(guān)存儲(chǔ)設(shè)備。2028年將增長到48%的比重。AI在未來幾年里,對整個(gè)半導(dǎo)體格局將產(chǎn)生巨大影響。
從應(yīng)用劃分來看,2025年設(shè)備投資金額預(yù)計(jì)將達(dá)到1,080億美元,2026年將進(jìn)一步加速增長14%,達(dá)到1,226億美元。在前沿投資的推動(dòng)下,預(yù)計(jì)2025年Foundry和Logic的支出將增長3%,預(yù)計(jì)2026年將進(jìn)一步增長15%。2025年,DRAM支出將增長10%,達(dá)到210億美元。特別值得一提的是,過去十年中國大陸在設(shè)備投資方面持續(xù)增長,到2024年達(dá)到全球設(shè)備投資的40%以上。
中國半導(dǎo)體產(chǎn)業(yè)的發(fā)展及展望 中國在全球應(yīng)用市場中占據(jù)了非常重要的位置。自2001年以來,亞太地區(qū)成為全球最大的半導(dǎo)體市場。其中,亞太地區(qū)最大的半導(dǎo)體市場是中國,占亞太市場的46%和全球市場的24%。
中國IC市場規(guī)模及中國IC制造規(guī)模方面,自主率從2012年的14%增長到2022年的18%,2027年有望超過26%。 過去的十多年,中國半導(dǎo)體的發(fā)展非常迅速,2023年,中國集成電路產(chǎn)業(yè)銷售額達(dá)到了12,276.9億元,同比增長2.3%。2024年,中國集成電路產(chǎn)業(yè)銷售額達(dá)13,000億元,同比增長超5%。 制造業(yè)方面,根據(jù)SEMI數(shù)據(jù),2024年-2028年,中國晶圓廠產(chǎn)能的復(fù)合年均增長率為8.1%,關(guān)于晶圓廠產(chǎn)能的復(fù)合年均增長率為5.3%。細(xì)分來看,成熟節(jié)點(diǎn)(55nm及以上)產(chǎn)能的復(fù)合年均增長率為3.7%。主流芯片節(jié)點(diǎn)(22nm-40nm)產(chǎn)能的復(fù)合年均增長率為26.5%。先進(jìn)節(jié)點(diǎn)(14nm及以下)產(chǎn)能的復(fù)合年均增長率為5.7%。中國將在主流節(jié)點(diǎn)占主導(dǎo)地位,2024年,中國主流節(jié)點(diǎn)產(chǎn)能占全球25%,今年將達(dá)到32%,預(yù)計(jì)到2028年,在不斷投資的帶動(dòng)下,占比將達(dá)到42%。
根據(jù)SEMI預(yù)測,中國半導(dǎo)體設(shè)備投資2025年為380億美元,2026年將為360億美元,依舊繼續(xù)引領(lǐng)全球半導(dǎo)體設(shè)備投資。從長期發(fā)展角度來看,國家的資金投入和支持非常重要。隨著2024年5月24日國家集成電路產(chǎn)業(yè)投資基金三期股份有限公司的成立,大基金目前已投資三期,第三期注冊資本3,440億元,規(guī)模超過了第一期和第二期總和,存續(xù)期限延長至15年,國家對集成電路產(chǎn)業(yè)的持續(xù)投資增強(qiáng),極大地提振了行業(yè)信心和創(chuàng)新活力。投資方向上,大基金三期會(huì)繼續(xù)聚焦于半導(dǎo)體晶圓制造以及設(shè)備、零部件、材料等關(guān)鍵環(huán)節(jié),同時(shí)可能將AI芯片等新興產(chǎn)業(yè)作為重點(diǎn)投資方向。2019年科創(chuàng)板的問世也推動(dòng)了資本市場賦能整個(gè)半導(dǎo)體產(chǎn)業(yè)的發(fā)展。
全球半導(dǎo)體資本支出規(guī)模非常巨大。根據(jù)市場分析機(jī)構(gòu)預(yù)測,2025年半導(dǎo)體總資本支出為1,600億美元,比2024年增長3%。2024年半導(dǎo)體總資本支出為1,550億美元,2024年三星,臺(tái)積電,Intel三家半導(dǎo)體資本支出占比全球半導(dǎo)體資本支出超過57%,全球前五家晶圓廠累計(jì)資本支出占比超70%。
半導(dǎo)體行業(yè)是一個(gè)不斷投入大資金的過程,加大半導(dǎo)體研發(fā)投入是產(chǎn)業(yè)發(fā)展的長期策略。據(jù)SIA報(bào)告,2022年,整個(gè)美國半導(dǎo)體產(chǎn)業(yè)的研發(fā)支出總額達(dá)到了588億美元,占銷售額的比例為18.75%。歐洲的研發(fā)支出和銷售額占15%,中國臺(tái)灣為11%,韓國9.1%,日本為8.3%,中國大陸為7.6%。
我們在研發(fā)上需投入更多精力、時(shí)間、資金以實(shí)現(xiàn)更好的發(fā)展。 高峰論壇上,魏少軍、王志華、唐建石、王源、李明等業(yè)界專家分別圍繞計(jì)算芯片技術(shù)創(chuàng)新、智能時(shí)代集成電路發(fā)展、具身神經(jīng)智能、高算力芯片、光電材料等主題展開探討。白鵬、董博宇、朱煜、張建中、趙超、何寧、王豐等行業(yè)領(lǐng)軍者就產(chǎn)業(yè)創(chuàng)新發(fā)展、GPU、DRAM、RISC-V等議題交流經(jīng)驗(yàn),為產(chǎn)業(yè)發(fā)展提供“芯”思路。
莫大康:浙江大學(xué)校友,求是緣半導(dǎo)體聯(lián)盟顧問。親歷50年中國半導(dǎo)體產(chǎn)業(yè)發(fā)展歷程的著名學(xué)者、行業(yè)評論家。