浭深http://www.yw28777.cn/Good Luck To You!14歲就能開!豐田 推出微型純電“小頭樂”http://www.yw28777.cn/2025/03/629/<p style="text-indent: 2em;">豐田發布了一款全新的純電動微型車FT-Me Concept,專為城市出行設計。</p><p style="text-indent: 2em;">這款概念車車長僅2.5米,適合狹窄街道路況,采用雙門雙座布局,車尾造型立體,尾燈與車頭呼應。</p><p style="text-indent: 0em; text-align: center;"><img class="ue-image" src="http://www.yw28777.cn/zb_users/upload/2025/03/202503131741868080852426.jpg" title="14歲就能開!豐田 推出微型純電“小頭樂”-第1張圖片.jpg" alt="14歲就能開!豐田 推出微型純電“小頭樂”-第1張圖片.jpg"/></p><p style="text-indent: 2em;">內飾簡潔且具科幻感,配備圓角矩形方向盤和全液晶儀表盤,座椅采用織物材質,支持可移動設計。</p><p style="text-indent: 2em;">FT-Me Concept采用純電驅動,續航里程約100公里,最高車速45公里/小時,車頂配備太陽能電池板,每天可補充約30公里續航。</p><p style="text-indent: 2em;">該車量產版“很快”推出,外觀與概念車一致,將衍生更多車型,價格預計與Citro?n Ami相近(約7.2萬元人民幣),主要面向第二輛車用戶及青少年。</p><p style="text-align: center; text-indent: 0em;"><img class="ue-image" src="http://www.yw28777.cn/zb_users/upload/2025/03/202503131741868109751370.jpg" title="14歲就能開!豐田 推出微型純電“小頭樂”-第2張圖片.jpg" alt="14歲就能開!豐田 推出微型純電“小頭樂”-第2張圖片.jpg"/></p><p style="text-indent: 2em;">按照歐洲L6e標準,多數國家允許14歲及以上人群駕駛,但英國除外。</p><p style="text-indent: 2em;">FT-Me取消傳統車鑰匙,采用手機控制,家長可限制子女用車時間,車內副駕座椅可拆卸,騰出1.6米儲物空間。</p><p style="text-indent: 2em;">方向盤類似飛機操縱桿,方便下肢不便者駕駛,外觀設計靈感源自頭盔,強調安全性,90%材料可回收。</p><p style="text-indent: 2em;">豐田稱FT-Me“價格親民,維護成本低”,量產版將在同級車型中擁有最佳保值率。</p><p><br/></p>Thu, 13 Mar 2025 20:13:45 +0800DeepSeek 打破 英偉達 “算力霸權” http://www.yw28777.cn/2025/03/628/<p style="text-indent: 0em; text-align: center;"><img class="ue-image" src="http://www.yw28777.cn/zb_users/upload/2025/03/202503111741699797169462.jpg" title="DeepSeek 打破 英偉達“算力霸權” -第1張圖片.jpg" alt="DeepSeek 打破 英偉達“算力霸權” -第1張圖片.jpg"/></p><p style="text-indent: 2em;">DeepSeek帶動推理需求爆發,英偉達的“算力霸權”被撕開一道口子,一個新世界的大門逐漸打開——由ASIC芯片主導的算力革命,正從靜默走向喧囂。</p><p style="text-indent: 2em;">日前,芯流智庫援引知情人士的消息,稱DeepSeek正在籌備AI芯片自研。相比這個后起之秀,國內大廠如阿里、百度、字節們更早就跨過了“自研”的大門。</p><p style="text-indent: 2em;">大洋彼岸,OpenAI自研芯片的新進展也在年初釋出,外媒披露博通為其定制的首款芯片幾個月內將在臺積電流片。</p><p style="text-indent: 2em;">此前更是一度傳出Sam Altman計劃籌集70000億美元打造“芯片帝國”,設計與制造通吃。此外,谷歌、亞馬遜、微軟、Meta也都先后加入了這場“自研熱潮”。</p><p style="text-indent: 2em;">一個明顯的信號是——無論DeepSeek、OpenAI,還是中國公司和硅谷大廠,誰都不希望在算力時代掉隊。而ASIC芯片,可能會成為他們跨越新世界大門的入場券。</p><p style="text-indent: 2em;">這會不會“殺死”英偉達?或者,會不會“再造”第二個英偉達?現在還沒有答案。</p><p style="text-indent: 2em;">不過可以明確的是,這場轟轟烈烈的“自研浪潮”,其上游的產業鏈企業已經“春江水暖鴨先知”,例如給各家大廠提供設計定制服務的博通,業績已經“起飛”:2024年AI業務收入同比240%,達到37億美元;2025Q1AI業務營收41億美元,同比增77%;其中80%來自ASIC芯片設計。</p><p style="text-indent: 2em;">在博通的眼里,ASIC芯片這塊蛋糕,價值超過900億美元。</p><p style="text-indent: 0em; text-align: center;"><strong><span style="font-size: 20px;">01 從GPU到ASIC,<span style="text-indent: 2em;">算力經濟學走向分水嶺</span></span></strong></p><p style="text-indent: 2em;">低成本是AI推理爆發的必要條件,與之相對的是——通用GPU芯片成了AI爆發的黃金枷鎖。</p><p style="text-indent: 2em;">英偉達的H100和A100是大模型訓練的絕對王者,甚至連B200、H200也讓科技巨頭們趨之若鶩。金融時報此前援引Omdia的數據,2024年,英偉達Hopper架構芯片的主要客戶包括微軟、Meta、Tesla/xAI等,其中微軟的訂單量達到50萬張。</p><p style="text-indent: 2em;">但是,作為通用GPU的絕對統治者,英偉達產品方案其“硬幣的另一面”已逐漸顯現:高昂的成本與冗余的能耗。</p><p style="text-indent: 2em;">成本方面,單個H100售價超3萬美元,訓練千億參數模型需上萬張GPU,再加上網絡硬件、存儲和安全等后續的投入,總計超5億美元。根據匯豐的數據,最新一代的GB200 NVL72方案,單機柜超過300萬美元,NVL36也在180萬美元左右。</p><p style="text-indent: 2em;">可以說,基于通用GPU的模型訓練太貴了,只不過是算力不受限制的硅谷,仍然偏向于“力大磚飛”的敘事,資本支出并未就此減速。就在日前,馬斯克旗下xAI,不久之前公布的Grok-3,訓練的服務器規模,已經達到了20萬張GPU的規模。</p><p style="text-indent: 2em;">騰訊科技聯合硅兔賽跑推出的《兩萬字詳解最全2025 AI關鍵洞察》一文提到,超大規模數據中心運營商預計2024年資本支出(CapEx)超過 2000億美元,到2025年這一數字預計將接近2500億美元,且主要資源都將傾斜給人工智能。</p><p style="text-indent: 2em;">能耗方面,根據SemiAnalysis的測算,10萬卡H100集群,總功耗為150MW,每年耗費1.59TWh的電量,按0.078美元/千瓦時計算,每年電費高達1.239億美元。</p><p style="text-indent: 2em;">對照OpenAI公布的數據,推理階段GPU的算力利用率僅30%-50%,“邊算邊等”現象顯著,如此低效的性能利用率,在推理時代,確實是大材小用,浪費過于嚴重。</p><p style="text-indent: 0em; text-align: center;"><img class="ue-image" src="http://www.yw28777.cn/zb_users/upload/2025/03/202503111741699831237043.jpg" title="DeepSeek 打破 英偉達“算力霸權” -第2張圖片.jpg" alt="DeepSeek 打破 英偉達“算力霸權” -第2張圖片.jpg"/></p><p style="text-indent: 0em; text-align: center;"><span style="font-size: 12px;">谷歌此前公布的TPU V4與A100針對不同架構模型的訓練速度</span></p><p style="text-indent: 2em;">性能領先、價格昂貴,效率不佳,外加生態壁壘,過去一年業內都在喊“天下苦英偉達久矣”——云廠商逐漸喪失硬件自主權,疊加供應鏈風險,再加上AMD暫時還“扶不起來”,諸多因素倒逼巨頭開始自研ASIC專用芯片。</p><p style="text-indent: 2em;">自此,AI芯片戰場,從技術競賽轉向經濟性博弈。</p><p style="text-indent: 2em;">正如西南證券的研究結論,“當模型架構進入收斂期,算力投入的每一美元都必須產出可量化的經濟收益。”</p><p style="text-indent: 2em;">從北美云廠商最近反饋的進展看,ASIC已體現出一定的替代優勢:</p><ul class=" list-paddingleft-2" style="list-style-type: disc;"><li><p style="text-indent: 0em;">谷歌:博通為谷歌定制的TPU v5芯片在Llama-3推理場景中,單位算力成本較H100降低70%。</p></li><li><p style="text-indent: 0em;">亞馬遜:3nm制程的AWS Trainium 3,同等算力下能耗僅為通用GPU的1/3,年節省電費超千萬美元;據了解,亞馬遜Trainium芯片2024年出貨量已超50萬片。</p></li><li><p style="text-indent: 0em;">微軟:根據IDC數據,微軟Azure自研ASIC后,硬件采購成本占比從75%降至58%,擺脫長期被動的議價困境。</p></li></ul><p style="text-indent: 2em;">作為北美ASIC鏈的最大受益者,博通這一趨勢在數據中愈發顯著。</p><p style="text-indent: 2em;">博通2024年AI業務收入37億美元,同比增240%,其中80%來自ASIC設計服務。2025Q1,其AI業務營收41億美元,同比增77%,同時預計第二季度AI營收44億美元,同比增44%。</p><p style="text-indent: 2em;">早在年報期間,博通指引2027年ASIC收入將大爆發,給市場畫了3年之后ASIC芯片將有望達到900億美元的市場規模這個大餅。Q1電話會期間,公司再次重申了這一點。</p><p style="text-indent: 2em;">憑借這個大的產業趨勢,博通也成為全球繼英偉達、臺積電之后,第三家市值破1萬億美元的半導體公司,同時也帶動了海外對于Marvell、AIchip等公司的關注。</p><p style="text-indent: 0em; text-align: center;"><img class="ue-image" src="http://www.yw28777.cn/zb_users/upload/2025/03/202503111741699862145018.jpg" title="DeepSeek 打破 英偉達“算力霸權” -第3張圖片.jpg" alt="DeepSeek 打破 英偉達“算力霸權” -第3張圖片.jpg"/></p><p style="text-indent: 0em; text-align: center;"><span style="font-size: 12px;">市面主流GPU與ASIC算力成本對比 資料來源:西南證券</span></p><p style="text-indent: 2em;">不過,有一點需要強調——“ASIC雖好,但也不會殺死GPU”。</p><p style="text-indent: 2em;">微軟、谷歌、Meta都在下場自研,但同時又都在搶英偉達B200的首發,這其實說明了雙方之間不是直接的競爭關系。</p><p style="text-indent: 2em;">更客觀的結論應該是,GPU仍將主導高性能的訓練市場,推理場景中由于GPU的通用性仍將是最主要的芯片,但在未來接近4000億美元的AI芯片藍海市場中,ASIC的滲透路徑已清晰可見。</p><p style="text-indent: 2em;">IDC預測,2024-2026年推理場景中,ASIC占比從15%提升至40%,即最高1600億美元。</p><p style="text-indent: 2em;">這場變革的終局或許是:ASIC接管80%的推理市場,GPU退守訓練和圖形領域。真正的贏家將是那些既懂硅片、又懂場景的“雙棲玩家”,英偉達顯然是其中一員,看好ASIC斷然不是唱空英偉達。</p><p style="text-indent: 2em;">而新世界的指南,是去尋找除英偉達之外的雙棲玩家,如何掘金ASIC新紀元。</p><p style="text-indent: 0em; text-align: center;"><strong><span style="font-size: 20px;">02 ASIC的“手術刀”,非核心模塊,通通砍掉</span></strong></p><p style="text-indent: 2em;">錦緞此前詳解過SoC,而CPU、GPU用戶早已耳熟能詳,FPGA應用市場小眾,最為陌生的當屬ASIC。</p><p style="text-indent: 0em; text-align: center;"><img class="ue-image" src="http://www.yw28777.cn/zb_users/upload/2025/03/202503111741699885633405.jpg" title="DeepSeek 打破 英偉達“算力霸權” -第4張圖片.jpg" alt="DeepSeek 打破 英偉達“算力霸權” -第4張圖片.jpg"/></p><p style="text-indent: 0em; text-align: center;"><span style="font-size: 12px;">算力芯片對比 資料來源:中泰證券</span></p><p style="text-indent: 2em;">那么,都說ASIC利好AI推理,究竟它是一個什么樣的芯片?</p><p style="text-indent: 2em;">從架構上來說,GPU這樣的通用芯片,其局限在于“以一敵百”的設計——需要兼顧圖形渲染、科學計算、不同的模型架構等多元需求,導致大量晶體管資源浪費在非核心功能模塊。</p><p style="text-indent: 2em;">英偉達GPU最大的特點,就是有眾多“小核”,這些“小核”可以類比成獵鷹火箭多臺發動機,開發者可以憑借CUDA多年積累的算子庫,平穩、高效且靈活地調用這些小核用于并行計算。</p><p style="text-indent: 2em;">但如果下游模型相對確定,計算任務就是相對確定的,不需要那么多小核來保持靈活性,ASIC最底層的原理正是如此,所以也被稱為全定制化高算力芯片。</p><p style="text-indent: 2em;">通過 “手術刀式”精準裁剪,僅保留與目標場景強相關的硬件單元,釋放出驚人的效率,這在谷歌、亞馬遜都已經在產品上得到了驗證。</p><p style="text-indent: 0em; text-align: center;"><img class="ue-image" src="http://www.yw28777.cn/zb_users/upload/2025/03/202503111741699912202807.jpg" title="DeepSeek 打破 英偉達“算力霸權” -第5張圖片.jpg" alt="DeepSeek 打破 英偉達“算力霸權” -第5張圖片.jpg"/></p><p style="text-indent: 0em; text-align: center;"><span style="font-size: 12px;">谷歌TPU v5e AI加速器實拍</span></p><p style="text-indent: 2em;">對于GPU來說,調用它們最好的工具是英偉達的CUDA,而對于ASIC芯片,調用它們的是云廠商自研的算法,這對于軟件起家的大廠來說,并不是什么難事:</p><p style="text-indent: 2em;">谷歌TPU v4中,95%的晶體管資源用于矩陣乘法單元和向量處理單元,專為神經網絡計算優化,而GPU中類似單元的占比不足60%。</p><p style="text-indent: 2em;">不同于傳統馮·諾依曼架構的“計算-存儲”分離模式,ASIC可圍繞算法特征定制數據流。例如在博通為Meta定制的推薦系統芯片中,計算單元直接嵌入存儲控制器周圍,數據移動距離縮短70%,延遲降低至GPU的1/8。</p><p style="text-indent: 2em;">針對AI模型中50%-90%的權重稀疏特性,亞馬遜Trainium2芯片嵌入稀疏計算引擎,可跳過零值計算環節,理論性能提升300%。</p><p style="text-indent: 2em;">當算法趨于固定,對于確定性的垂直場景,ASIC就是具有天然的優勢,ASIC設計的終極目標是讓芯片本身成為算法的“物理化身”。</p><p style="text-indent: 2em;">在過去的歷史和正在發生的現實中,我們都能夠找到ASIC成功的例證,比如礦機芯片。</p><p style="text-indent: 2em;">早期,行業都是用英偉達的GPU挖礦,后期隨著挖礦難度提升,電力消耗超過挖礦收益(非常類似現在的推理需求),挖礦專用ASIC芯片爆發。雖然通用性遠不如GPU,但礦機ASIC將并行度極致化。</p><p style="text-indent: 2em;">例如,比特大陸的比特幣礦機ASIC,同時部署數萬個SHA-256哈希計算單元,實現單一算法下的超線性加速,算力密度達到GPU的1000倍以上。不僅專用能力大幅提升,而且能耗實現了系統級節省。</p><p style="text-indent: 2em;">此外,使用ASIC可精簡外圍電路(如不再需要PCIe接口的復雜協議棧),主板面積減少40%,整機成本下降25%。</p><p style="text-indent: 2em;">低成本、高效率,支持硬件與場景深度咬合,這些ASIC技術內核,天然適配AI產業從“暴力堆算力”到“精細化效率革命”的轉型需求。</p><p style="text-indent: 2em;">隨著推理時代的到來,ASIC成本優勢將重演礦機的歷史,實現規模效應下的“死亡交叉”——盡管初期研發成本高昂(單芯片設計費用約5000萬美元),但其邊際成本下降曲線遠陡于通用GPU。</p><p style="text-indent: 2em;">以谷歌TPU v4為例,當出貨量從10萬片增至100萬片時,單顆成本從3800美元驟降至1200美元,降幅接近70%,而GPU的成本降幅通常不超過30%。根據產業鏈最新信息,谷歌TPU v6預計2025年出貨160萬片,單片算力較前代提升3倍,ASIC的性價比,還在快速提升。</p><p style="text-indent: 2em;">這又引申出一個新的話題,是否所有人都可以涌入自研ASIC大潮中去?這取決于自研成本與需求量。</p><p style="text-indent: 2em;">按照7nm工藝的ASIC推理加速卡來計算,涉及IP授權費用、人力成本、設計工具、掩模板在內的一次流片費用等,量級可能就在億元的級別,還不包括后期的量產成本。在這方面,大廠更具有資金優勢。</p><p style="text-indent: 2em;">目前,像谷歌、亞馬遜這樣的云廠商,因為有成熟的客戶體系,能夠形成研發、銷售閉環,自研上擁有先天的優勢。</p><p style="text-indent: 2em;">Meta這種企業,自研的邏輯則在于內部本身就有天量級的算力需求。今年初,扎克伯格就曾透露,計劃在2025年上線約1GW的計算能力,并在年底前擁有超過130萬張GPU。</p><p style="text-indent: 0em; text-align: center;"><strong><span style="font-size: 20px;">03 “新地圖”價值遠不止1000億美元</span></strong></p><p style="text-indent: 2em;">僅僅是挖礦需求就帶來了近100億美元的市場,所以當博通2024年底喊出AI ASIC市場空間700-900億美元的時候,我們并不意外,甚至認為可能這個數字都保守了。</p><p style="text-indent: 2em;">現在,ASIC芯片的產業趨勢不應當再被質疑,重點應該是如何掌握“新地圖”的博弈法則。</p><p style="text-indent: 2em;">近千億美元的AI ASIC市場中,已經形成清晰的三大梯隊——“制定規則的ASIC芯片設計者和制造者” 、“產業鏈配套”、“垂直場景下的Fabless”。</p><p style="text-indent: 2em;">第一梯隊,是制定規則的ASIC芯片設計者和制造者,他們可以制造單價超過1萬美元的ASIC芯片,并與下游的云廠商合作商用,代表玩家有博通、Marvell、AIchip,以及不管是什么先進芯片都會受益的代工王者——臺積電。</p><p style="text-indent: 2em;">第二梯隊,產業鏈配套,已經被市場關注到的配套邏輯包括先進封裝與更下游的產業鏈。</p><p style="text-indent: 2em;">先進封裝:臺積電CoWoS產能的35%已轉向ASIC客戶,國產對應的中芯國際、長電科技、通富微電等。</p><p style="text-indent: 2em;">云廠商英偉達硬件方案解耦帶來的新硬件機會:如AEC銅纜,亞馬遜自研單顆ASIC需配3根AEC,若2027年ASIC出貨700萬顆,對應市場超50億美元,其他還包括服務器、PCB均是受益于相似邏輯。</p><p style="text-indent: 2em;">第三梯隊,是正在醞釀的垂直場景的Fabless。ASIC的本質是需求驅動型市場,誰能最先捕捉到場景痛點,誰就掌握定價權。ASIC的基因就是定制化,與垂直場景天然適配。以智駕芯片為例,作為典型的ASIC芯片,隨著比亞迪等All in智駕,這類產品開始進入爆發期。</p><p style="text-indent: 2em;">映射全球ASIC產業鏈三大梯隊對應的機會,可以看作是國產的“三把秘鑰”。</p><p style="text-indent: 2em;">受制于禁令的限制,國產GPU與英偉達的差距仍然巨大,生態建設也是一個漫長的路程,但是對于ASIC,我們甚至與海外在同一起跑線上,再結合垂直場景,中國不少Fabless能夠做出更有能效比的產品,前面提及的礦機ASIC、智駕ASIC以及阿里平頭哥的含光、百度的昆侖芯這些AI ASIC。</p><p style="text-indent: 2em;">與之配套的芯片制造,主要依賴中芯國際,中興旗下的中興微等則是新入場的“玩家”,不排除未來他們將與國內廠商合作,上演一場“誰將是中國博通”的戲碼。</p><p style="text-indent: 0em; text-align: center;"><img class="ue-image" src="http://www.yw28777.cn/zb_users/upload/2025/03/202503111741699940156290.jpg" title="DeepSeek 打破 英偉達“算力霸權” -第6張圖片.jpg" alt="DeepSeek 打破 英偉達“算力霸權” -第6張圖片.jpg"/></p><p style="text-indent: 0em; text-align: center;"><span style="font-size: 12px;">左圖為英偉達數據中心產品主要上游供應商,來源Fubon Research ,右圖GB200 NV72L機柜的總長接近2英里的NVLink Spine銅纜</span></p><p style="text-indent: 2em;">產業鏈配套部分難度相對較低,對應的服務器、光模塊、交換機、PCB、銅纜,由于技術難度低,國內企業本來競爭力就比較強。與此同時,這些產業鏈企業與國產算力屬于“共生”關系,ASIC芯片產業鏈也不會缺席。</p><p style="text-indent: 2em;">應用場景上,除了反復提及的智駕芯片和AI推理加速卡,其他國產設計公司的機會,取決于什么場景能爆發,對應哪些公司又能把握住機遇。</p><p style="text-indent: 0em; text-align: center;"><strong><span style="font-size: 20px;">04 結語</span></strong></p><p style="text-indent: 2em;">當AI從大力出奇跡的訓練軍備競賽,躍進推理追求能效的深水區,算力戰爭的下半場注定屬于那些能將技術狂想,轉化為經濟賬本的公司。</p><p style="text-indent: 2em;">ASIC芯片的逆襲,不僅是一場技術革命,更是一本關于效率、成本和話語權的商業啟示錄。</p><p style="text-indent: 2em;">在這場新的牌局中,中國選手的籌碼正在悄然增加——機會永遠留給準備好的人。</p><p><br/></p>Tue, 11 Mar 2025 21:21:41 +0800“機器人護理員”要來了?能幫老人翻身,還會煮雞蛋、折疊衣物……http://www.yw28777.cn/2025/03/627/<p style="text-indent: 0em; text-align: center;"><img class="ue-image" src="http://www.yw28777.cn/zb_users/upload/2025/03/202503111741696513692912.jpg" title="“機器人護理員”要來了?.jpg" alt="“機器人護理員”要來了?.jpg"/></p><p style="text-indent: 2em;">今年的政府工作報告中明確提出,要“完善社會保障和服務政策”,并特別強調“人工智能+”戰略。這一政策導向為養老產業的科技化、智能化升級提供了重要契機。</p><p style="text-indent: 2em;">養老資源短缺是我國養老產業面臨的核心問題之一,尤其是在護理人力資源方面,而隨著人工智能和人形機器人等新科技的出現,為解決這一問題提供了新的思路,同時也引發了對隱私與數據安全的討論,如何在技術創新與風險管控之間找到平衡成為科技賦能養老產業的關鍵。</p><p style="text-indent: 0em; text-align: center;"><strong><span style="font-size: 20px;">01 推動養老科技落地家庭社區</span></strong></p><p style="text-indent: 2em;">全國人大代表羅衛紅在全國兩會期間提到,積極推動人工智能在養老領域的應用;鼓勵人工智能、機器人技術在新老年人消費領域的研發應用;加強陪伴式機器人的應用場景資源釋放,提升情緒價值供給,以科技創新賦能新消費。</p><p style="text-indent: 2em;">全國政協委員、中國科學院計算技術研究所研究員張云泉也在兩會期間建議,將發展養老機器人納入新的國家戰略規劃,重點推動社區和家庭養老機器人發展行動計劃。</p><p style="text-indent: 2em;">張云泉認為,養老問題是重大民生問題。我國是全球人口老齡化程度較高的國家之一,這也對養老服務的質量與效率提出了更高要求。因此,發展養老機器人具有現實要求。</p><p style="text-indent: 2em;">“養老服務須堅持科技支撐,特別是養老機器人的研發應用。我國已具備發展養老機器人的條件和基礎?!睆堅迫f道。</p><p style="text-indent: 2em;">養老機器人產業發展起源于科研實驗室,關鍵技術積累始于上世紀90年代。此后近三十年間,經歷了產品探索、功能完善、AI賦能等多個發展階段,養老機器人逐步走向成熟。</p><p style="text-indent: 2em;">據張云泉觀察,助潔、助行、助餐為老年人當前最迫切需求的服務?!爱斍?,發展養老機器人仍面臨一些問題和挑戰?!睆堅迫硎?,“一是康復類養老機器人發展迅速,但在家庭和社區的落地尚待推進;二是養老機器人涉及的多項核心關鍵技術需進一步突破?!?lt;/p><p style="text-indent: 2em;">他認為,一方面,養老對服務精細化和個性化、產品安全性和便捷性要求高,導致機器人研發投入較高,機器人的銷售價格也相對較高,一些家庭難以購買其服務,反過來導致技術研發難以深入;另一方面,養老機器人是復雜技術綜合體,其自身實現“感知-決策-執行-反饋”的自閉環還需要技術突破,尤其是需要廣覆蓋的數據、充足的算力,以及AI+人工協作的智能算法。</p><p style="text-indent: 2em;">目前養老機器人一般分為護理型、康復型和陪伴型三大類。其中,護理型一般針對失能老人,康復型主要針對半失能老人,陪伴型主要針對有情感交流需求的老人。</p><p style="text-indent: 2em;">在我國,養老呈現“9073”的格局,即約90%老年人在居家養老,7%依托社區支持養老,3%入住機構養老。“發展家庭養老機器人應該是政策重中之重,同時大力發展社區養老?!睆堅迫硎?。</p><p style="text-indent: 2em;">他建議,定期對社區和家庭養老機器人產業重點領域和空間布局進行動態評估和調整;面向社區和家庭養老機器人出臺財政補貼和稅收優惠政策;充分發揮招商引資模式對經濟發展的促進作用。</p><p style="text-indent: 2em;">在養老機器人技術攻關布局方面,張云泉特別提到了針對老年群體的語音識別、自然語言處理技術和基于AI心理學的情感識別技術開發,以及在發展技術的同時確保倫理和隱私安全。</p><p style="text-indent: 0em; text-align: center;"><strong><span style="font-size: 20px;">02“機器人護理員”何時上崗?</span></strong></p><p style="text-indent: 2em;">事實上,不僅僅在中國,在整個亞洲,老齡化的挑戰都非常嚴峻。新加坡官方預測數據顯示,到2030年,新加坡65歲或以上人口占比將達到四分之一,而在2010年,這一占比僅為十分之一。</p><p style="text-indent: 2em;">新加坡也在尋求通過人工智能技術來幫助管理老年人口的健康,例如將檢測跌倒的聲音收集設備接入養老院的看護系統;新加坡住房和發展局甚至還向家庭提供跌倒檢測技術,該系統還能向居民的近親發送警報,或連接到社區呼叫中心尋求幫助。</p><p style="text-indent: 2em;">通過聲音收集來識別老年人病癥是目前AI技術公司正在嘗試開發的技術。據介紹,已經有企業開發出可為護理人員提供100多種不同病癥見解的聲音檢測設備,這些聲音異常的識別可提示包括泌尿道或呼吸道感染的早期跡象,以及跌倒或認知能力下降的跡象。</p><p style="text-indent: 2em;">新加坡國立大學蘇瑞福公共衛生學院研究員Chuan De Foo上個月在科學期刊《前沿》上撰文稱,人工智能將在新加坡的老年人護理中發揮巨大作用。不過他也警告稱,過度依賴人工智能也可能會產生負面影響,必須正確設計人工智能產品,以確保倫理和安全性。</p><p style="text-indent: 2em;">新加坡國立大學李光耀公共衛生政策學院研究員Han Ei Chew認為,老年人護理的方法需要將人與機器相結合,使用高科技,但仍要保持人類的“高接觸”?!叭斯ぶ悄芸赡茏詈帽挥米黝~外的眼睛和耳朵,機器人是額外的手,但不能取代高接觸的人類護理?!盋hew表示。</p><p style="text-indent: 2em;">日本是世界上老齡化程度最高的國家,出生率下降,勞動年齡人口減少。在日本,人工智能驅動的人形機器人也正在開發用于老年人的護理,以解決日本老齡人口面臨護理人員短缺的問題,但“機器護理員”的初期投入成本高昂,并帶來關于老年人安全問題的辯論。</p><p style="text-indent: 2em;">近期,一款名為AIREC的人形機器人為老人翻身的視頻引發關注。這個重達150公斤的機器人俯身靠近一名仰臥的男子,輕輕地將一只手放在他的膝蓋上,另一只手放在他的肩膀上,并將他翻到一邊——這是一種用于更換尿布或預防老年人褥瘡的常規操作。</p><p style="text-indent: 2em;">此外,AIREC機器人還能幫助人起身或穿襪子,并完成煮雞蛋、折疊衣物等家務。</p><p style="text-indent: 2em;">據介紹,這款機器人由東京早稻田大學教授Shigeki Sugano團隊開發,并獲得了政府的資助?!拌b于我們高度發達的老齡化社會和出生率下降,我們將需要機器人在醫療和老年護理以及日常生活中的支持。”Sugano表示。</p><p style="text-indent: 2em;">他認為,盡管特斯拉的擎天柱Optimus等人形機器人更受關注,但它們很少能與人類直接接觸,只能做家務或在工廠車間做搬運等工作;要開發出能夠安全地與人類進行身體互動的機器人,需要更高級別的精度和智能程度。</p><p style="text-indent: 2em;">Sugano預計,AIREC要到2030年左右才能在護理和醫療機構中使用,而且最初的價格不低于1000萬日元(約合67000美元)。</p><p><br/></p>Tue, 11 Mar 2025 20:34:16 +0800Nintendo Switch 2 最新爆料:NFC 回歸,Wi-Fi 6 加持,還有雙 USB-C?http://www.yw28777.cn/2025/03/626/<p style="text-indent: 0em; text-align: center;"><img class="ue-image" src="http://www.yw28777.cn/zb_users/upload/2025/03/202503091741534989122762.jpg" title="Nintendo Switch 2 最新爆料:NFC 回歸,Wi-Fi 6 加持,還有雙 USB-C?.jpg" alt="Nintendo Switch 2 最新爆料:NFC 回歸,Wi-Fi 6 加持,還有雙 USB-C?.jpg"/></p><p style="text-indent: 2em;">任天堂雖然一直對新機閉口不提,但實際上,FCC(美國聯邦通信委員會)的文檔早就悄悄地把一些秘密透露給我們。結合那段早就發布但又“好像過了很久的”首發預告片,咱們倒是可以順藤摸瓜,來看看新一代 Switch 2 究竟還有多少玄機。</p><p style="text-indent: 2em; text-align: center;"><strong><span style="font-size: 20px;">01 代號 BEE-001:新機“身份證”曝光</span></strong></p><p style="text-indent: 2em;">最新線索來自FCC數據庫,顯示 Nintendo Switch 2 的型號編碼為 BEE-001。</p><ul class=" list-paddingleft-2" style="list-style-type: disc;"><li><p style="text-indent: 0em;">“BEE” 指代整臺 Switch 2 及其配件</p></li><li><p style="text-indent: 0em;">“001” 則是主機本體的編號</p></li></ul><p style="text-indent: 2em;">而且按照這個套路,左側 Joy-Con 的型號是 BEE-012,右側是 BEE-014,甚至還有一個什么“繼電器盒”叫 BEE-053。聽上去就像是一支小蜜蜂王國的管理系統!當年初代 Switch 大家用 HAC-001 來區分,想不到這回直接換了個更萌的 “BEE”,也算讓咱們小小驚喜了一把。</p><p style="text-indent: 0em; text-align: center;"><strong><span style="font-size: 20px;">02 Amiibo支持?NFC 看似必不可少</span></strong></p><p style="text-indent: 2em;">很多朋友可能關心,“我珍藏的 Amiibo 能不能繼續用在 Switch 2 上???”好消息是:FCC 文件確認 Switch 2 整機含有 NFC 功能,而且這枚 NFC/ RFID 天線就位于 右側 Joy-Con 里。</p><ul class=" list-paddingleft-2" style="list-style-type: disc;"><li><p style="text-indent: 0em;">原版 Switch 也是右側手柄支持 NFC</p></li><li><p style="text-indent: 0em;">如果 Switch 2 還是這個配置,那 Amiibo 識別應該毫無障礙</p></li></ul><p style="text-indent: 2em;">盡管任天堂官方尚未拍胸脯保證 “Amiibo 一定能用”,但根據以往的經驗,這基本可以算是穩了。畢竟 Amiibo 平臺對任天堂的粉絲和游戲生態都有著不可小覷的價值,它可不想讓忠實用戶白買了那么多手辦擺飾吧?</p><p style="text-indent: 0em; text-align: center;"><strong><span style="font-size: 20px;">03 Wi-Fi 6 升級:網速加倍,聯機更爽</span></strong></p><p style="text-indent: 2em;">說到聯網體驗,第一代 Switch 的 Wi-Fi 5(802.11ac) 要是再勉強用幾年,估計會跟不上新時代的網絡節奏了。為此,Switch 2 將直接跳到 Wi-Fi 6(802.11ax),帶寬最高可達 80MHz。</p><ul class=" list-paddingleft-2" style="list-style-type: disc;"><li><p style="text-indent: 0em;">下載更新包更快?那必須的</p></li><li><p style="text-indent: 0em;">聯機游戲更穩?大概率沒問題</p></li></ul><p style="text-indent: 2em;">畢竟哪怕你宅家里打網戰,也能享受更穩定的網絡速度,再也不必擔心因為延遲過高被隊友罵“掛機狗”。</p><p style="text-indent: 0em; text-align: center;"><strong><span style="font-size: 20px;">04 雙 USB-C 接口:上面一個,下面一個</span></strong></p><p style="text-indent: 2em;">首發預告片里,我們隱約看到 Switch 2 的機身 頂部 和 底部 各有一個 USB-C 端口。文件也證實了這一點。這意味著什么呢?</p><p style="text-indent: 2em;">充電更靈活:你不必再糾結“這臺機器能不能倒著插?”、或者“我想邊玩邊充,但我喜歡倒著放機子啊”這樣的問題。反正上面下面都有口,哪邊方便插哪邊。</p><p style="text-indent: 2em;">雙端口同時使用:是的,你能否同時使用兩根充電線?答案居然是可以。要么你可以邊充電邊外接存儲設備,要么你可以接個網線轉接頭之類的。這給了玩家更多拓展功能的空間。</p><p style="text-indent: 2em;">不過,實際功能還有待官方解鎖,說不定有些冷門玩法,比如一邊充電一邊連個手機熱點 adapter,都是有可能的哦!</p><p style="text-indent: 0em; text-align: center;"><strong><span style="font-size: 20px;">05 充電電壓、速度……會有驚喜嗎?</span></strong></p><p style="text-indent: 2em;">文檔顯示,Switch 2 額定電壓為 15V,適配器最高可達 20V。</p><ul class=" list-paddingleft-2" style="list-style-type: disc;"><li><p style="text-indent: 0em;">有沒有更快的充電速度?文檔并未給出明確結論</p></li><li><p style="text-indent: 0em;">相比初代 Switch 那 15V/2.6A 標準,也許 Switch 2 會有略微的提升,但到底能不能做到手機那種“快充 80W”這種夸張速度,顯然沒有太大可能,畢竟主機發熱和整機穩定性都需要更多考量。</p></li></ul><p style="text-indent: 2em;">換句話說,Switch 2 大概率還是走“穩扎穩打”的路線,給你一個夠用的充電效率,不至于因為快充而導致過熱、對電池壽命不利。</p><p style="text-indent: 0em; text-align: center;"><strong><span style="font-size: 20px;">06 4月2日直面會:會有更多秘密嗎?</span></strong></p><p style="text-indent: 2em;">任天堂已經宣布,將在 4 月 2 日 召開一場直面會,極有可能公布更多關于 Switch 2 的細節。</p><ul class=" list-paddingleft-2" style="list-style-type: disc;"><li><p style="text-indent: 0em;">價格?什么時候開賣?</p></li><li><p style="text-indent: 0em;">首發游戲?馬里奧還是塞爾達?</p></li><li><p style="text-indent: 0em;">是否支持與老一代 Switch 同步或兼容?</p></li></ul><p style="text-indent: 2em;">所有的問題都可能在那場發布會上揭曉。盡管“傳說中的” Switch 2 預告片已經推出一段時間,但任天堂這家的保密措施可一向嚴格,也不排除他們在后期再加幾大驚喜或改動,等到臨門一腳才把一切蓋章釘死。</p><p style="text-indent: 0em; text-align: center;"><strong><span style="font-size: 20px;">07 期待中的下一代掌機,不負眾望?</span></strong></p><p style="text-indent: 2em;">Switch 自 2017 年推出以來,一舉打響了“家用機+掌機二合一”的名號,甚至讓不少玩家喊出“這輩子都不會再換了”的口號。但硬件終究會老化,性能也難扛住如今日益增長的游戲需求。Switch 2 的到來,正是給大家提供了一次“升級”或“換代”契機。</p><p style="text-indent: 2em;">從外部情報看,這款“新玩具”擁有 NFC、Wi-Fi 6、雙 USB-C 接口等升級。雖然還無法證實有沒有性能大幅飆升、4K 輸出或者 DLSS 等逆天技術,但僅憑硬件上的小提升,就足以讓許多玩家欣然升級——更別提任天堂出品的自家大作,再怎么輕描淡寫,都值得期待一下不是嗎?</p><p style="text-indent: 2em;">4 月 2 日,讓我們一起準備好零食和瓜子,看任天堂到底會如何為 Switch 2 正名,或許這臺新機將再次掀起一波“Switch熱潮”,不負任天堂粉絲們的期待!</p><p><br/></p>Sun, 09 Mar 2025 23:42:05 +0800蘋果 Siri 重構計劃夭折,有何內幕?http://www.yw28777.cn/2025/03/625/<p style="text-indent: 0em; text-align: center;"><img class="ue-image" src="http://www.yw28777.cn/zb_users/upload/2025/03/202503081741434329137153.jpg" title="蘋果 Siri 重構計劃夭折,有何內幕?.jpg" alt="蘋果 Siri 重構計劃夭折,有何內幕?.jpg"/></p><p style="text-indent: 2em;">蘋果公司人工智能部門的動蕩在當地時間周五達到新高潮,這家科技巨頭宣布推遲此前承諾的Siri語音助手更新計劃,原定于2025年推出的Siri人工智能升級方案將推遲至2026年。</p><p style="text-indent: 2em;">蘋果表示,去年六月展示的Siri新功能——包括調用用戶個人信息回答問題、更精準控制應用程序等——將延至“未來一年內”發布。盡管公司此前未公開具體時間表,但這些功能原定于今年四月隨iOS 18.4系統更新推出。</p><p style="text-indent: 2em;">2月14日曾有報道,由于開發進度滯后,相關功能將推遲至五月(iOS 18.5發布時)。知情人士透露,過去數月蘋果工程師全力修復項目中的大量漏洞,但進展未達預期,目前團隊認為最早要等到2025年才能發布。</p><p style="text-indent: 2em;">多位內部人士稱,在最近的延期決策前,軟件業務負責人克雷格·費德里吉及其他高管在內部測試中發現,這些功能既不穩定也未達到宣傳效果。蘋果發言人對此不予置評。</p><p style="text-indent: 2em;">部分AI團隊成員認為相關功能可能被徹底放棄,需要從零開始重構。若此方案實施,新功能將被整合到計劃2026年推出的下一代Siri中。這些功能最初于去年六月全球開發者大會(WWDC)亮相,是蘋果智能(Apple Intelligence)平臺的重要組成部分。</p><p style="text-indent: 2em;">今年WWDC大會上,蘋果將不再展示重大AI突破,而是專注于將蘋果智能深度集成至更多應用程序。這種戰略收縮凸顯了蘋果在AI領域的困境——已公布的延期不僅損害公司聲譽,更暴露出其技術競爭力的不足。</p><p style="text-indent: 2em;">原本計劃2025年實現的類ChatGPT對話式Siri升級,目前僅底層架構有望在2026年iOS 19發布時就緒,而用戶可見的交互界面預計要等到2027年的iOS 20才能實現。</p><p style="text-indent: 2em;">本周早些時候有報道稱,蘋果員工正質疑是否需要CEO蒂姆·庫克或董事會出面調整AI部門領導層,認為若不進行重大改革,公司將繼續落后于競爭對手。今年初,蘋果已委派資深軟件高管金·沃拉斯協助AI團隊。</p><p style="text-indent: 2em;">此次延期對蘋果造成嚴重公關危機。過去六個月里,公司一直在電視廣告中宣傳這些尚未完成的功能。去年秋季發布iPhone 16時,蘋果甚至以“專為蘋果智能打造”為核心賣點。如今這些核心功能可能要等到2025年iPhone 17發布后才能實現,導致蘋果不得不向AppleCare客服人員下發話術指引:“若客戶詢問Siri功能發布時間,請重申我們預計在未來一年內推出?!?lt;/p><p style="text-indent: 2em;">內部擔憂還涉及技術層面,要完善Siri可能需要在設備端運行更強力的AI模型,這將增加硬件負擔。蘋果或被迫在功能完整性與運行效率間取舍,也可能需要提升未來產品的硬件性能以支持完整功能。</p><p style="text-indent: 2em;">目前Siri僅在iOS 18中獲得界面級改進,包括集成OpenAI的ChatGPT、新增文字輸入交互模式“Type to Siri”,以及優化的蘋果產品知識庫和發光界面動畫,但這些均未觸及底層技術革新。</p><p style="text-indent: 2em;">隨著亞馬遜本月推出備受期待的Alexa+,三星和谷歌也深度整合AI技術,蘋果在語音助手市場的競爭力正面臨嚴峻挑戰。</p><p><br/></p>Sat, 08 Mar 2025 19:44:59 +0800SpaceX 第二代新星艦發射,“筷子夾火箭” 日趨成熟,飛船爆炸解體http://www.yw28777.cn/2025/03/624/<p style="text-indent: 2em;">北京時間2025年3月7日07時30分左右,SpaceX星艦進行第八次綜合測試飛行試驗,發射地點仍然位于美國德克薩斯州墨西哥灣畔的博卡奇卡星艦基地,本次試飛距上次試飛間隔不到兩個月的時間。</p><p style="text-indent: 2em;">由于上次試飛的時候,二代星艦飛船由于氧氣泄漏和推進劑系統故障發生解體,這次新飛船的再次發射,引起了更廣泛的關注。</p><p style="text-indent: 2em;">本次發射順利升空,一級助推火箭順利返回發射塔架,復現了“筷子夾火箭”的操作,但星艦飛船部分還是出了問題,發生了解體爆炸,沒能完成入軌,官方還沒給出事故原因。</p><p style="text-indent: 0em; text-align: center;"><img class="ue-image" src="http://www.yw28777.cn/zb_users/upload/2025/03/202503071741355034180210.jpg" title="SpaceX 第二代新星艦發射,“筷子夾火箭” 日趨成熟,飛船爆炸解體.jpg" alt="SpaceX 第二代新星艦發射,“筷子夾火箭” 日趨成熟,飛船爆炸解體.jpg"/></p><p style="text-indent: 2em;">本次星艦的編號為S34,超重助推火箭的編號為B15。S34和上次發射的S33一樣,都屬于二代星艦,二代星艦比一代星艦高出了1.83米,但載荷空間卻比一代星艦要小,這主要是為推進劑騰出更多的空間。據悉,二代星艦推進劑的加注量達到了1500噸,比一代星艦多出了近25%。</p><p style="text-indent: 2em;">我們可以看到,“筷子夾火箭”非常成熟了,但鑒于新星艦的兩次發射均沒能完成入軌,可見還要繼續優化。</p><p style="text-indent: 0em; text-align: center;"><strong><span style="font-size: 20px;">01 地面發射系統和“筷子”捕獲機構</span></strong></p><p style="text-indent: 2em;">星艦的地面發射系統主要由發射臺和發射塔架組成。發射臺高約21.5米,主要為星艦提供支撐作用。發射塔架高146米,由數個鋼材料的桁架部段組成,上面安裝有“筷子”捕獲機械臂、快速斷開臂和吊裝設備等。</p><p style="text-indent: 2em;">“筷子”捕獲機構是雙叉臂結構,既可以沿發射塔架上下移動,也可以沿中軸擺動,能夠對助推火箭和星艦進行升降組裝等操作,在助推火箭和星艦返回時又可充當捕獲機構。</p><p style="text-indent: 0em; text-align: center;"><strong><span style="font-size: 20px;">02 人類研制過的最大火箭</span></strong></p><p style="text-indent: 2em;">給還不熟悉星艦結構的朋友插入一個簡單的說明。起飛階段,星艦要靠助推火箭助力升空,這枚助推火箭的英文名是Super Heavy,通常譯為超重。</p><p style="text-indent: 2em;">超重火箭高71米,安裝有33臺猛禽發動機,這些發動機一起工作,能夠產生約76000千牛的推力。星艦本身安裝有6臺猛禽發動機,當助推火箭分離后,會接力飛行,最終讓星艦進入地球軌道。</p><p style="text-indent: 2em;">星艦和超重火箭的組合體近地軌道運載能力為150噸,超越了阿波羅登月計劃中使用的土星五號火箭和執行阿爾忒彌斯一號任務的Block1火箭,是人類研發過的最強火箭發射系統。</p><p style="text-indent: 2em;">今年1月16日,貝索斯的“新格倫”重型運載火箭終于發射了,這枚新火箭的運力也不錯,近地軌道能達到45噸,但與星艦比起來還是小巫見大巫了。</p><p style="text-indent: 0em; text-align: center;"><strong><span style="font-size: 20px;">03 星艦測試的重要節點事件</span></strong></p><p style="text-indent: 2em;">此前星艦的每次測試發射,我們都進行過完整的跟蹤,下面是我們整理的從2019年以來到現在的重要節點。</p><p style="text-indent: 2em;">2019年7月26日,SpaceX對最早的星艦原型機 “星蟲”(starhopper)進行了高度20米的自由懸浮測試。</p><p style="text-indent: 2em;">2019年8月27日,SpaceX再次對“星蟲”進行測試,成功飛行到150米的高度并安全著陸。</p><p style="text-indent: 2em;">2020年8月5日,星艦原型SN5完成了高度150米的自由懸浮測試。由于沒安裝頭椎,SN5外觀看起來就像是一個30多米高的圓柱形不銹鋼大水塔。</p><p style="text-indent: 2em;">2020年8月25日,星艦原型SN6同樣完成了高度150米的自由懸浮測試。</p><p style="text-indent: 2em;">2020年12月10日,星艦原型SN8進行了12.5公里高度的測試飛行,在最后落地的時候發生墜毀爆炸。</p><p style="text-indent: 2em;">2021年2月3日,星艦原型SN9再次進行了10公里高度的測試飛行,仍然是在最后落地的時候發生墜毀爆炸。</p><p style="text-indent: 2em;">2021年3月4日,星艦原型SN10第三次進行了10公里高度的測試飛行,穩穩落地,但在落地數分鐘后,還是發生了爆炸。</p><p style="text-indent: 2em;">2021年3月27日,星艦原型SN11第四次進行了10公里高度的測試飛行,失敗的更慘,箭體炸成碎片。</p><p style="text-indent: 2em;">2021年5月6日,星艦原型SN15在得克薩斯州博卡奇卡(Boca Chica)成功進行了高空飛行測試,這是SpaceX星艦原型第五次挑戰10公里級高度,也是首次沒有發生爆炸事故的完美著陸。</p><p style="text-indent: 2em;">下面進行的歷次測試飛行進入了全新的階段,就是所謂的“綜合測試飛行”,也就是星艦和超重助推火箭的合體飛行。</p><p style="text-indent: 2em;">2023年4月20日,星艦曾首次嘗試軌道級發射飛行試驗,但剛起飛就發現三臺發動機沒點燃,在飛行過程中又有三臺發動機陸續出現故障,導致箭體發生異常旋轉而失控,最終不得不主動引爆銷毀。</p><p style="text-indent: 2em;">2023年11月18日,星艦在進行第二次飛行試驗時,超重助推火箭由于液氧管道發生堵塞,在返航時發生了爆炸,星艦已飛到了太空的高度,但由于在排放多余的液氧時發生了起火墜毀,沒能完成既定任務。</p><p style="text-indent: 2em;">2024年3月14日,星艦進行第三次軌道級飛行試驗,星艦和超重助推火箭成功分離,助推火箭濺落在大海。幾分鐘后,星艦成功進入太空,并在軌道上完成了“在軌燃料輸送試驗”以及“載荷艙門開合試驗”,但遺憾的是,星艦離軌點火沒成功,燒毀在大氣中。</p><p style="text-indent: 2em;">2024年6月6日,星艦進行了第四次軌道飛行試驗,助推火箭按計劃成功降落在海面。星艦飛行約一個小時,在進入大氣層的時候隔熱瓦發生掉落,翼面被燒穿,但最終還是堅持到降落海面,幾乎完成了所有的既定任務和目標。</p><p style="text-indent: 2em;">2024年10月13日,星艦進行第五次測試飛行。在星艦發射約6分50秒后,發射塔架上的捕獲裝置首次成功抓住了從天而降的幾百噸重的助推火箭,這是人類首次用這種方式回收火箭,網友形象地稱之為“筷子夾火箭”。</p><p style="text-indent: 2em;">2025年3月4日,星艦進行第七次綜合測試飛行,成功完成了“筷子夾火箭”試驗,但星艦飛船由于氧氣泄漏和推進劑系統故障發生解體,沒能完成既定任務。</p><p style="text-indent: 2em;">據悉,未來星艦的發射頻率會越來越高。馬斯克曾表示,2025年將發射25次星艦,不過他的話我們往往要打一個折扣來聽,2025年的第一季度,也才發射了2次。2025年具有標志性的看點還有:推進器的在軌轉移試驗,星艦的返場捕獲試驗以及真正開始部署星鏈衛星。</p><p><br/></p>Fri, 07 Mar 2025 21:43:12 +0800Manus 一夜爆火!AI Agent 的“GPT 時刻”http://www.yw28777.cn/2025/03/623/<p style="text-indent: 0em; text-align: center;"><img class="ue-image" src="http://www.yw28777.cn/zb_users/upload/2025/03/202503061741250173118534.jpg" title="Manus 一夜爆火!AI Agent 的“GPT 時刻”-第1張圖片.jpg" alt="Manus 一夜爆火!AI Agent 的“GPT 時刻”-第1張圖片.jpg"/></p><p style="text-indent: 2em;">2025 年是 AI Agent 元年——這句話,在北京時間 3 月 6 日凌晨,得到了應驗。</p><p style="text-indent: 2em;">“DeepSeek 之后,又一個科技圈的不眠之夜?!辈簧儆脩粼谏缃幻襟w上如此點評。</p><p style="text-indent: 2em;">所有人徹夜蹲守,只為該產品的一個使用邀請碼——它就是 Monica.im 研發的全球首款 AI Agent 產品“Manus”。</p><p style="text-indent: 2em;">據團隊介紹,“Manus”是一個真正自主的 AI 代理,能夠解決各類復雜多變的任務。與傳統 AI 助手不同,Manus 不僅能提供建議或答案,還能直接交付完整的任務成果。</p><p style="text-indent: 0em; text-align: center;"><img class="ue-image" src="http://www.yw28777.cn/zb_users/upload/2025/03/202503061741250187572784.jpg" title="Manus 一夜爆火!AI Agent 的“GPT 時刻”-第2張圖片.jpg" alt="Manus 一夜爆火!AI Agent 的“GPT 時刻”-第2張圖片.jpg"/></p><p style="text-indent: 0em; text-align: center;"><span style="font-size: 12px;">Manus 的介紹視頻只有短短的 4 分鐘,卻威力驚人</span></p><p style="text-indent: 2em;">正如“Manus”的名字寓意,它在拉丁文里象征著“手”。也就是說,知識不僅要在腦子里,還要能用手執行。這正是 Agent 和 AI Bot(聊天機器人)產品的本質進階。</p><p style="text-indent: 2em;">Manus 牛在哪里?最直觀的是看官方網站展示、以及用戶自發展示的使用用例,整理如下:</p><ul class=" list-paddingleft-2" style="list-style-type: disc;"><li><p style="text-indent: 0em;">旅行規劃:不僅整合旅行信息,還為用戶創建定制旅行手冊。例如,為用戶規劃日本四月旅行,提供個性化的旅行建議和詳細手冊。</p></li><li><p style="text-indent: 0em;">股票分析:進行深入的股票分析,設計視覺上吸引人的儀表盤展示全面的股票洞察。例如,對特斯拉股票進行深度分析,創建可視化儀表盤。</p></li><li><p style="text-indent: 0em;">教育內容創建:為中學教師創建視頻演示材料,解釋動量定理等復雜概念,幫助教師更有效地教學。</p></li><li><p style="text-indent: 0em;">保險政策比較:創建清晰的保險政策比較表,提供最佳決策建議,幫助用戶選擇最適合的保險產品。</p></li><li><p style="text-indent: 0em;">供應商采購:在整個網絡中進行深入研究,找到最適合用戶需求的供應商,作為真正公平的代理為用戶服務。</p></li><li><p style="text-indent: 0em;">財務報告分析:通過研究和數據分析捕捉市場對特定公司(如亞馬遜)的情緒變化,提供過去四個季度的市場情緒分析。</p></li><li><p style="text-indent: 0em;">創業公司列表整理:訪問相關網站識別符合條件的公司,并將其整理成表格。例如,整理 YC W25 批次的所有 B2B 公司列表。</p></li><li><p style="text-indent: 0em;">在線商店運營分析:分析亞馬遜商店銷售數據,提供可操作的洞察、詳細可視化和定制策略,幫助提升銷售業績。</p></li></ul><p style="text-indent: 2em;">當 Agent 通過一長串思維鏈和工具調用,最終輸出一個無比完整、專業的結果時,用戶們開始感嘆“真的能幫人類做事了”。</p><p style="text-indent: 2em;">根據官方網站信息,在GAIA基準測試(評估通用AI助手解決真實世界問題的能力)中,Manus在所有三個難度級別上都取得了新的最先進 (SOTA) 表現。</p><p style="text-indent: 2em;">總結成一句話——Manus 更想做的,是你在數字世界中,字面意義上的“代理人”。而它做到了。</p><p style="text-indent: 2em;">就像你想的一樣,凌晨推出的 Manus,一下子把所有 AI 圈的人都炸醒了!</p><p style="text-indent: 0em; text-align: center;"><strong><span style="font-size: 20px;">01 Manus,你的“數字代理人”</span></strong></p><p style="text-indent: 2em;">首先,Manus 在體驗上與此前 LLM 最大的不同:</p><p style="text-indent: 2em;">它強調直接交付最終結果的能力,而不只是給出一個單純的“答案”。</p><p style="text-indent: 2em;">Manus 目前采用 Multiple Agent 架構,運行方式與此前 Anthropic 發布的 Computer Use 類似,完全運行在獨立虛擬機中。同時可以在虛擬環境中調用各類工具——編寫和執行代碼、瀏覽網頁、操作應用等,直接交付完整成果。</p><p style="text-indent: 2em;">在官方發布的視頻中,介紹了三個 Manus 在實際使用場景中所完成的工作案例:</p><p style="text-indent: 2em;">第一個任務是篩選簡歷。</p><p style="text-indent: 2em;">從 15 份簡歷中,為強化學習算法工程師職位推薦合適的候選人,并根據其強化學習專業知識對候選人進行排名。</p><p style="text-indent: 2em;">在這個演示中,你甚至不需要給壓縮文件解壓、將其中的簡歷文件一份份手動上傳。Manus 這時候就已經展現出了像人類“實習生”的一面,手動解壓縮文件,并逐頁瀏覽每一份簡歷,同時記錄其中的重要信息。</p><p style="text-indent: 0em; text-align: center;"><img class="ue-image" src="http://www.yw28777.cn/zb_users/upload/2025/03/202503061741250240365690.jpg" title="Manus 一夜爆火!AI Agent 的“GPT 時刻”-第3張圖片.jpg" alt="Manus 一夜爆火!AI Agent 的“GPT 時刻”-第3張圖片.jpg"/></p><p style="text-indent: 0em; text-align: center;"><span style="font-size: 12px;">Manus 像實習生一樣,自動理解“解壓老板扔過來的打包文件”這個隱藏指令&nbsp;</span></p><p style="text-indent: 2em;">在 Manus 給出的結果中,不僅有自動生成的排名建議,它還會根據工作經驗等重要維度,將候選人分為不同等級。在接受到用戶更希望以 Excel 表格的方式呈現后,Manus 還能自動將這些內容通過現場編寫 Python 腳本的方式,來生成對應的表格。</p><p style="text-indent: 2em;">Manus 甚至還能通過記憶能力,在這個實踐過程中記錄下“用戶更喜歡通過表格的方式接受結果”這樣的信息,下一次處理類似的任務結果時,會優先使用表格的形式來呈現。</p><p style="text-indent: 0em; text-align: center;"><img class="ue-image" src="http://www.yw28777.cn/zb_users/upload/2025/03/202503061741250262135580.jpg" title="Manus 一夜爆火!AI Agent 的“GPT 時刻”-第4張圖片.jpg" alt="Manus 一夜爆火!AI Agent 的“GPT 時刻”-第4張圖片.jpg"/></p><p style="text-indent: 0em; text-align: center;"><span style="font-size: 12px;">Manus 能記住用戶在內容生成流程中的偏好</span></p><p style="text-indent: 2em;">第二個案例,更為國人量身打造,就是遴選房產。</p><p style="text-indent: 2em;">案例中用戶希望在紐約購買房產,輸入的要求是希望同時有安全的社區環境、低犯罪率,以及優質的中小學教育資源—— 當然還包括最重要的預算,足夠在每月固定收入的情況下負擔的起。</p><p style="text-indent: 2em;">在這個需求中,Manus AI 將復雜任務分解為待辦事項列表,包括研究安全社區、識別優質學校、計算預算、搜索房產等。并通過網絡搜索,仔細閱讀有關紐約最安全社區的文章,收集相關信息。</p><p style="text-indent: 2em;">其次,Manus 通過編寫一個 Python 程序,根據用戶收入計算可負擔的房產預算。結合房地產網站上相關的房價信息,根據預算范圍篩選房產列表。</p><p style="text-indent: 0em; text-align: center;"><img class="ue-image" src="http://www.yw28777.cn/zb_users/upload/2025/03/202503061741250288203836.jpg" title="Manus 一夜爆火!AI Agent 的“GPT 時刻”-第5張圖片.jpg" alt="Manus 一夜爆火!AI Agent 的“GPT 時刻”-第5張圖片.jpg"/></p><p style="text-indent: 0em; text-align: center;"><span style="font-size: 12px;">Manus 能夠自動搜索、并過濾掉條件不符合用戶要求的房源&nbsp;</span></p><p style="text-indent: 2em;">最后,Manus 會整合所有收集的信息,撰寫詳細報告,包括社區安全分析、學校質量評估、預算分析、推薦房產列表以及相關資源鏈接——就像一個專業的房地產經紀人一樣。而且由于 Manus 自帶“完全基于用戶利益考慮”的屬性,其使用甚至體驗更好。</p><p style="text-indent: 2em;">在最后一個案例中,Manus 展示了對股票價格的分析能力。</p><p style="text-indent: 2em;">案例給出的任務是分析過去三年中英偉達、邁威爾科技和臺積電股票價格之間的相關性:眾所周知這三支股票之間存在緊密的關聯性,但對于新手用戶來講,很難快速將其中的因果關系整理清楚。</p><p style="text-indent: 2em;">而 Manus 的操作,與一個真正的股票經紀人非常相似,它先是通過 API 訪問雅虎金融等信息網站,來獲取股票歷史數據,同時還會交叉驗證數據準確程度,避免被單一信息來源誤導,對最終產生結果帶來重大影響。</p><p style="text-indent: 2em;">在這個案例中,Manus 同樣用到了編寫 Python 代碼、進行數據分析和可視化的能力,同時還引入了金融相關的專業工具進行分析,最終通過數據可視化圖表,搭配詳盡的綜合分析報告的方式,向用戶反饋其中的因果關系——真的就像一個金融領域“實習生”做的日常工作。</p><p style="text-indent: 2em;">不僅如此,在 Manus 官網還展示了十多個 Manus 能夠使用的場景:直接使用 Manus 幫你整理行程、個性化推薦旅游路線,還能讓它學習使用各種復雜工具,來流程化的完成日常工作。</p><p style="text-indent: 2em;">在這個過程中,真正讓 Manus 展現出與往常工具不同的,是它的自主規劃,來確保執行任務的能力。</p><p style="text-indent: 2em;">自主學習的能力也讓 Manus 的工作能力提升邏輯更像是真正的人類——即使現階段,它可能還無法在某一個特定領域做到專家級別的精通,但已經能看到巨大的潛力。</p><p style="text-indent: 2em;">隨著自主學習能力的加入,AI Agent 的泛用性得到了巨大的提升,在用戶對 Manus 的實際測試中,你甚至可以做到直接對它描述一個視頻畫面中的相關內容,Manus 最終能夠直接根據對應的信息,跨越平臺內容對于搜索引擎的限制,精準找到某個抖音短視頻的鏈接。</p><p style="text-indent: 2em;">由于目前版本的 Manus 完全基于云端異步運行,因此實際上 Manus 的能力并不被你所使用的端側平臺形態或算力等因素限制——用戶甚至可以做到在向 Manus 下達指令之后,暫時關閉電腦,當 Manus 執行完成活動結果后,會自動通知你結果。</p><p style="text-indent: 2em;">這個操作邏輯同樣非常眼熟——就像一個人下班以后,在微信上喊實習生“文件整理好發我”。只不過,現在,這個實習生是真的可以 7x24 小時的響應你了,并且不用擔心他會“整頓職場”。</p><p style="text-indent: 0em; text-align: center;"><strong><span style="font-size: 20px;">02 多代理+自查,跑通 AI Agent 流</span></strong></p><p style="text-indent: 2em;">從上面這些案例,其實不難看出 Manus 真正的殺手锏,并非 Computer Use 中已經出現過的“AI Agent”概念,而是它“模擬人類方式工作方式”的能力。</p><p style="text-indent: 2em;">比起“運行計算”,Manus 的工作邏輯更像是“思考并執行命令”。它并沒有做到哪些人類當前真正無法做到的事;這也就是為什么一些已經體驗過當前版本 Manus 的用戶,將它形容為“一個實習生”。</p><p style="text-indent: 2em;">在 Manus 官網,展示著眾多 Manus 能夠完成的任務,其中就有一個案例,展示了在 B2B 業務中,如何使用 Manus??焖倬珳实膶⒛愕挠嗀浶枨螅c全球供應商實現精準匹配。</p><p style="text-indent: 2em;">在類似需求的常規產品中,在平臺內整合全球供應鏈企業信息,來幫助用戶完成供貨商/需求方匹配這件事,是業內通行的邏輯。但這件事在 Manus 的案例中,你能看到完全不同的實現方式。</p><p style="text-indent: 2em;">Manus AI 使用一套名為“Multiple Agent”的架構,運行在獨立的虛擬機中。通過規劃代理、執行代理、驗證代理的分工協作機制,。來大幅提升對復雜任務的處理效率,并通過并行計算縮短響應時間。</p><p style="text-indent: 2em;">在這個架構中,每個代理可能基于獨立的語言模型或強化學習模型,彼此通過 API 或消息隊列通信。同時每個任務也都在沙盒中運行,避免干擾其他任務,同時支持云端擴展。每個獨立模型都能模仿人類處理任務的流程,比如先思考和規劃,理解復雜指令并拆解為可執行的步驟,再調用合適的工具。</p><p style="text-indent: 2em;">換言之,通過 Manus 的這套多代理架構,它更像是由多個助理,通過協助的方式,分別完成檢索資源、對接、驗證信息是否有效等工作,來幫你完成整個工作流程——這實際上不僅像是你招了一個“實習生”,更像是直接當上了一個微縮版的“部門主管”。</p><p style="text-indent: 2em;">在 B2B 業務這個案例中,Manus 通過網頁爬蟲以及代碼編寫、執行能力,Manus 會自動在互聯網這片汪洋大海中檢索,根據你自己的需求,對潛在供應商從產品質量、價格、交貨能力等方面,為你匹配到最合適的貨源。不僅可以將結論以圖表的方式直觀呈現在你眼前。還能對這些數據進一步給出更加詳細的操作建議。</p><p style="text-indent: 0em; text-align: center;"><img class="ue-image" src="http://www.yw28777.cn/zb_users/upload/2025/03/202503061741250324487391.jpg" title="Manus 一夜爆火!AI Agent 的“GPT 時刻”-第6張圖片.jpg" alt="Manus 一夜爆火!AI Agent 的“GPT 時刻”-第6張圖片.jpg"/></p><p style="text-indent: 0em; text-align: center;"><span style="font-size: 12px;">Manus 完成 B2B 場景下的需求,或許比單一平臺的內建工具更好用&nbsp;</span></p><p style="text-indent: 2em;">至于 Monica 團隊到底如何、用何種技術實現的視頻效果,根據消息,團隊或將在北京時間 3 月 6 日為大家揭曉。</p><p style="text-indent: 0em; text-align: center;"><strong><span style="font-size: 20px;">03 “縫合”的極致,就是炸裂</span></strong></p><p style="text-indent: 2em;">Manus 背后的 Monica.im,到底是家什么公司?</p><p style="text-indent: 2em;">Monica 是一款 All-in-One 的 AI 助手,產品形態從瀏覽器插件、慢慢拓展至了 App、網頁端。主流的使用場景是,當用戶在瀏覽器中點開它的小圖標,就能直接使用其接入的各大主流模型。通過對細分場景用戶需求的準確理解,Monica 摘到了大模型“低垂的果實”。</p><p style="text-indent: 2em;">其創始人肖弘(昵稱小紅,英文名 Red)是一位年輕的連續創業者,1992 年生,畢業于華中科技大學。2015 年,他畢業后創業,早期創業不算順利(如校園社交、二手集市)。2016 年,他創業微信公眾號運營者提供編輯與數據分析工具,獲得了百萬用戶、并完成了盈利,最終產品于 2020 年出售給了某獨角獸公司。</p><p style="text-indent: 2em;">等到 2022 年大模型浪潮后,他正式創立 Monica,專注海外市場,通過獨立開發者產品 ChatGPT for Google,產品快速完成了冷啟動。</p><p style="text-indent: 2em;">2024 年,在 GPT-4o、Claude 3.5、OpenAI o1 系列上線的第一時間,Monica 讓用戶可以獲得最新 SOTA 模型。隨著接入模型的新進展,Monica 推出的專業搜索、DIY Bot、Artifacts 寫小程序、記憶等功能也受到用戶喜愛。而 Monica 在 YouTube、Twitter、Gmail、The Information 等不同功能的網頁里呈現出不同的交互形態和功能,以適配特定場景的用戶需求,更新了數百個網頁的個性化 AI 體驗。</p><p style="text-indent: 2em;">2024 年,Monica 用戶數量翻番,達 1000 萬。同時,其保持著可觀的盈利,在海外同類產品中,位居頭部。</p><p style="text-indent: 2em;">Monica 的強勁表現驗證了一件事:</p><p style="text-indent: 2em;">套殼到極致,既是 TPF、也是 PMF,最后都通往用戶價值。</p><p style="text-indent: 0em; text-align: center;"><img class="ue-image" src="http://www.yw28777.cn/zb_users/upload/2025/03/202503061741250362708313.jpg" title="Manus 一夜爆火!AI Agent 的“GPT 時刻”-第7張圖片.jpg" alt="Manus 一夜爆火!AI Agent 的“GPT 時刻”-第7張圖片.jpg"/></p><p style="text-indent: 0em; text-align: center;"><span style="font-size: 12px;">Monica 首頁&nbsp;</span></p><p style="text-indent: 2em;">Manus 或許延續了 Monica 團隊這種思路——肖弘接受媒體人張小珺的訪談時表示,產品不能只有聊天機器人一種形態,Agent 會是新增的形態、需要新的產品去承接。</p><p style="text-indent: 2em;">他從 AI 編程產品 cursor 和 Devin 中獲得了靈感。據了解,前者主要是 copilot 模式、后者則是 autopilot 模式,后者更符合人性需求。Agent 也應該像 Devin 一樣,面向大眾人群、真正由 ai 主導進行執行。但過去的問題是,模型不夠聰明。</p><p style="text-indent: 2em;">但基于模型已有能力去做場景的封裝服務,或許正是 Monica 團隊的優勢。肖弘說,目前 Agent 產品團隊并不多,因為它需要很多復合能力,比如說團隊要搞過 chatbot、AI 編程、瀏覽器相關(因為都在瀏覽器上跑)、而且對模型的邊界要有不錯的感知——今天發展到什么水平,接下來會發展到什么樣的水平等等。</p><p style="text-indent: 2em;">“同時擁有這些能力的公司沒那么多,而有這些能力的公司,可能手頭正在干一個很具體的業務,但我們恰好有同學剛好有時間一起把這件事情做出來?!彼f。</p><p style="text-indent: 2em;">為什么是 Monica 做出來了,他總結道,“第一,我覺得我們是比較幸運的。第二,某種程度上,如果今天大家都去做 reasoning 了,可能是不是又多出了一些時間給創業公司?模型預計能力外溢還能走多遠?”</p><p style="text-indent: 2em;">他認為,目前 Agent 還在早期階段。一是目前 Agent 還在規劃階段,還沒到物理世界的執行;二是大模型的能力還在往上發展,一切還不可預料。</p><p style="text-indent: 2em;">“我肯定不知道 Agent,是可以被用這樣的方式被出來的,它是一個未知的事情?!彼f。</p><p style="text-indent: 2em;">耐人尋味的是,“不知道怎么做 Agent”的 Monica,現在做出了一個讓整個 AI 圈感到炸裂的產品。</p><p style="text-indent: 2em;">Manus 可能未必是最終的 AI Agent,但它無疑在 DeepSeek 爆火之后,再次將人們對 AI 的期望拉升了一個數量級。</p><p><br/></p>Thu, 06 Mar 2025 16:34:47 +0800美國擬全面封殺 AI 芯片,H20B20 將被禁?http://www.yw28777.cn/2025/03/622/<p style="text-indent: 0em; text-align: center;"><img class="ue-image" src="http://www.yw28777.cn/zb_users/upload/2025/03/202503041741096908135633.jpg" title="美國擬全面封殺 AI 芯片,H20B20 將被禁?.jpg" alt="美國擬全面封殺 AI 芯片,H20B20 將被禁?.jpg"/></p><p style="text-indent: 2em;">近日美國特朗普政府正考慮推出新一輪對華芯片管制措施,全面禁止所有 AI 芯片對華出口,包括英偉達專為中國市場設計的 H20/B20。不僅如此,美國還可能擴大封鎖范圍,連 28nm 以上的傳統芯片都在管制名單內,甚至暫停部分出口許可證的發放。</p><p style="text-indent: 2em;">自2022 年10月起,美國就不斷加碼AI芯片出口禁令,先是禁止 A100/H100,隨后提高技術門檻,迫使英偉達推出降級版 AI 芯片,如 H20/B20。但如今,美國似乎準備徹底封堵所有變通方案,直接全面封殺 AI 芯片。</p><p style="text-indent: 2em;">據外媒報道,美國商務部將推動兩項變革:</p><p style="text-indent: 2em;"><strong>1、 徹底堵死“對華特供版”</strong></p><p style="text-indent: 2em;">過去,英偉達等公司通過降頻、降低帶寬等方式,為中國市場推出符合出口管制要求的芯片,如 H20、B20、L20,但未來將不再允許降級版芯片繞過管制。換句話說,無論算力高低,所有 AI 相關芯片都將被禁,甚至包括 28nm 以上的傳統芯片。</p><p style="text-indent: 2em;"><strong>2、出口管制清單動態更新</strong></p><p style="text-indent: 2em;">以往的出口管制名單每年調整一次,而新規將每年 10 月動態更新,自動將新推出的“合規芯片”納入禁令范圍。即使未來企業想繼續推出符合管制規則的“特供版”AI 芯片,也很難再進入中國市場。</p><p style="text-indent: 2em;">H20 是英偉達針對中國市場推出的 AI 加速芯片,雖然是 H100 的“降級版”,但仍具備最高 296 INT8 TOPS/FP8 TFLOPS 的算力,配備 96GB HBM3 內存,帶寬高達 4TB/s。如果 H20 被全面禁止,中國市場短期內將難以獲得高性能 AI 芯片,對科研、企業 AI 計算等領域的影響不可忽視。</p><p style="text-indent: 2em;">外媒預計,這一禁令可能導致英偉達 2026 財年營收減少 60 億~400 億美元,同時英特爾、AMD、博通等公司的 AI 及 GPU 業務也將受到波及。</p><p style="text-indent: 2em;">此外,特朗普政府近期已與日本、荷蘭政府會面,商討限制東京電子和阿斯麥(ASML)等半導體設備制造商對中國提供設備維護服務。</p><p style="text-indent: 2em;">如果美國正式頒布新一輪禁令,不僅會影響 中國的 AI 發展,對美國自身和全球 AI 產業格局也將帶來深遠影響。</p><p style="text-indent: 2em;">從短期來看,中國高性能AI芯片的獲取將受到限制,可能阻礙科研項目及企業AI 創新應用的拓展。從長遠來看,可以倒逼國內AI算力芯片及先進制程的發展,國產 AI 算力芯片企業,如 華為昇騰、寒武紀、壁仞科技等,將迎來更大的市場機會。</p><p style="text-indent: 2em;">對于美國芯片來說,由于在中國的AI芯片及GPU業務受到影響,直接就會影響到整體營收。</p><p style="text-indent: 2em;">美國對中國 AI 產業的封鎖已經越來越嚴,但封鎖只是表面上的“降速”,而在另一端,中國 AI 產業的自主突破也在不斷提速。未來的 AI 競賽,將不再只是比拼芯片性能,更是供應鏈、算力生態、行業落地能力的全方位較量!</p><p><br/></p>Tue, 04 Mar 2025 21:59:54 +0800DeepSeek 開源周:一場技術普惠的嘉年華,極限提升大模型效率http://www.yw28777.cn/2025/03/621/<p style="text-indent: 0em; text-align: center;"><img class="ue-image" src="http://www.yw28777.cn/zb_users/upload/2025/03/202503031740991386208968.jpg" title="DeepSeek 開源周:一場技術普惠的嘉年華,極限提升大模型效率.jpg" alt="DeepSeek 開源周:一場技術普惠的嘉年華,極限提升大模型效率.jpg"/></p><p style="text-indent: 2em;">在2025年開年,DeepSeek的發布,在全社會造成了轟動。這是因為,DeepSeek通過一系列技術革新,大大降低了生成式AI的研發與使用成本,使得生成式AI有望在近期走入千家萬戶,從而幫助全社會提升工作效率。</p><p style="text-indent: 2em;">2022年,OpenAI開發的ChatGPT被認為是具有革新意義的生成式AI工具,可以幫助用戶提升工作效率;在2025年,國產生成式AI——DeepSeek,被認為是比ChatGPT更優的生成式AI工具,在成本、能力和開放性方面均優于ChatGPT,并在一定程度上影響到了金融市場。社會上甚至出現了一種觀點,認為DeepSeek能夠賦予計算機情感等構成人格的要素,甚至得出計算機很快將統治甚至取代人類的結論。</p><p style="text-indent: 2em;">事實上,稍有計算機與數學基礎的讀者,可以很容易地理解:無論是DeepSeek,還是其他生成式AI,對人類語言的“理解”與“生成”,實際上只是將其通過一定的算法,轉化為一串數字(在計算機科學中可稱為“向量”),再經過一系列算法轉化為輸出的內容。在這一過程中,計算機并不會擁有人類獨有的“情感”與“人格”等要素,只是解決了一個略微復雜的數學計算問題。</p><p style="text-indent: 2em;">顯然,將人類語言轉化為“向量”,再生成輸出的內容,需要非常復雜的計算機算法。如果完全由人類來編寫這一算法,是不現實的。因此,工程師們將這些算法簡化為一系列矩陣(所謂的“模型”與“參數”)的乘法,讓計算機使用暴力窮舉法嘗試這些矩陣的值(也就是“調參”或“訓練”,最終得到發布的“模型”。在得到“模型”后,讓計算機基于這一“模型”和用戶的輸入,得到輸出的內容,就是所謂的“推理”。</p><p style="text-indent: 2em;">目前,所有的生成式AI,都是基于Google在2017年發布的論文《Attention is All You Need》實現的“Transformer”模型。Transformer模型孵化出了以ChatGPT為代表的一系列生產式AI,但其訓練與推理所需要的海量計算資源,令個人用戶和一般的企業用戶都難以接受。特別地,即使是經濟實力雄厚的大型政企用戶,也有可能受到復雜的外部環境影響,在采購組建高性能集群的硬件時出現困難。這成為了使用生成式AI幫助全社會提升生產效率的重大障礙。</p><p style="text-indent: 2em;">DeepSeek的出現改變了這一切。在過去的一周里,DeepSeek為開發者公開發布了一系列非常有價值的創新成果。那么,它到底實現了哪些關鍵創新呢?為了系統解讀DeepSeek開源周的貢獻與突破,騰訊科技聯合騰訊云、鵝廠技術派,特別邀約騰訊云技術專家方天戟在開源周進行到第二天的時候進行了解讀。而本文是方天戟基于直播內容,在DeepSeek開源周結束后又補充的開源周后半部分,進行的系統性整理與解讀,希望盡可能以通俗的語言呈現這些創新為業界帶來的價值與影響。</p><p style="text-indent: 0em; text-align: center;"><strong><span style="font-size: 20px;">01 DeepSeek開源周,開源了哪些重要內容?</span></strong></p><p style="text-indent: 2em;">DeepSeek選擇了2025年2月的最后一周作為“開源周”,公布了FlashMLA(優化語句解析算法),DeepEP(優化多機協作機制),DeepGEMM(提升矩陣乘法效率),DualPipe(壓榨計算機資源的手段),EPLB(實現生成不同領域內容)和3FS(高性能存儲)。同時,DeepSeek還公開了一些研發過程中的分析數據。</p><p style="text-indent: 2em;">我們在文章開頭提到過,無論是DeepSeek,ChatGPT,還是其他的生成式AI,本質上都是讓計算機進行一系列矩陣運算。那么,想提高生成式AI算法的執行效率,就應當從三個方面著手:縮小矩陣規模,提高運算效率,減少等待時間。在過去精彩的一周里,DeepSeek公布的這些核心技術,都是聚焦在這三個方面。</p><p style="text-indent: 0em;"><strong>1、FlashMLA:語言解析加速器</strong></p><p style="text-indent: 2em;">我們知道,生成式AI的輸入,一般是人類的自然語言。在Transformer模型中,將自然語言進行編碼與分析的機制,就是所謂“Attention”機制——先將每個詞編碼為512個數字組成的“向量”,再使用Q,K,V三個矩陣對每個詞和全文中其他所有詞,進行關聯分析。顯然,隨著輸入長度的增加,總的計算量會以平方律上升,同時,還需要消耗寶貴的GPU內存,用于保存整句話中每個詞的K和V矩陣。</p><p style="text-indent: 2em;">FlashMLA針對這一問題的解決思路是,設法把K和V兩個矩陣壓縮,例如將矩陣中相對過于小的數,以及一部分為0的數去掉,來節約內存,減少計算工作量。進一步地,FlashMLA還針對Nvidia 的H800 GPU進行了優化,考慮到H800卡間通信帶寬限制,減少了讀寫其他卡上數據的需求,避免了卡間通信帶寬限制計算性能。</p><p style="text-indent: 2em;">在FlashMLA加持下,H800單卡能發揮的FP8計算性能從300T FLOPS提升到了580T FLOPS,并且把內存帶寬壓榨到了理論極限的90%。那么,如何進一步提升計算的性能呢?</p><p style="text-indent: 0em;"><strong>2、DeepGEMM:跨時代的AI基石</strong></p><p style="text-indent: 2em;">幾乎所有的AI計算都離不開矩陣乘法。由于矩陣乘法可以分解為多組沒有相互依賴關系的重復計算,工程師們定義了GEMM(GEneral Matrix Multiply,通用矩陣乘法)算子,而Nvidia也在cuBLAS和NVBLAS這兩種數學庫中,基于自身的GPU實現了這一算子的并行運算??梢哉J為,GEMM是包括Transformer模型在內的所有AI算法的基石,其重要程度堪比動力裝置對機械化與工業化體系的意義。</p><p style="text-indent: 2em;">DeepSeek對GEMM做了革命性的優化。DeepSeek考慮到Nvidia Hopper系列GPU內部的Tensor Core(專用的矩陣運算電路)可以支持8-bit浮點數計算,但精度不如16-bit和32-bit浮點數,DeepGEMM將中間過程暫存為32-bit浮點數以提升精度,同時計算速度與8bit相差無幾。</p><p style="text-indent: 2em;">值得注意的是,實現這一運算,需要繞開一切現有的開發庫,直接寫機器指令實現,其開源行為實際上對Nvidia的“護城河”——CUDA生態,發出了直接的挑戰。我們甚至可以認為,DeepGEMM的意義,就如同蒸汽機-內燃機-電動機的迭代驅動歷次工業革命那樣,會驅使生成式AI技術進入一個普惠大眾的時代,從而成為跨時代的AI基石。</p><p style="text-indent: 0em;"><strong>3、EPLB和DualPipe:驅動工業革命的效率大師</strong></p><p style="text-indent: 2em;">社會科學工作者在分析美國崛起的原因時,往往提到20世紀初在美國出現的泰勒管理制度和福特生產流水線這兩個概念。在工業生產中,泰勒管理制能讓每個工作者充分發揮自己的專長,而福特生產流水線能避免人的工作時間浪費在等待中。EPLB和DualPipe在DeepSeek中起到的作用就類似于泰勒管理制度和福特生產流水線。</p><p style="text-indent: 2em;">生成式AI的核心技術之一,是所謂“專家模型”。它的工作原理是,把計算機對自然語言理解的結果輸入到描述“專家模型“的矩陣,經過一系列矩陣乘法運算,得到生成的答案。為了讓專家模型在通信能力受限的H800 GPU集群上取得更好的效果,DeepSeek使用的是MoE模型,也就是使用多個專注于特定領域的小型專家模型來生成內容——這類似于醫院的不同科室,在初步識別患者的問題后讓最匹配的專家進行診療。</p><p style="text-indent: 2em;">在醫院中,不同科室有可能會有分工合作,各科室的繁忙程度也可能會有較大差異。那么,如果將密切合作的科室安排在同一樓層,同時,對繁忙的科室,多聘請一些專家坐診,就可以有效減少患者就診等待時間。EPLB在設計時,就借鑒了這一思路,將頻繁互動的幾個專家模型放在同一個GPU,從而減少卡間通信,同時,如果發現某些專家模型調用量顯著多于其他專家模型,就多復制幾個這些專家模型來扛住并發的計算。</p><p style="text-indent: 2em;">而DualPipe的作用則是,借鑒福特生產流水線的改進思路,在訓練這些專家模型時,盡量減少流水線各個環節的等待時間(所謂的“流水線氣泡”)。它的思路是,讓兩個任務進行交叉排布。當下一個計算任務在等待通信任務結束的時候,讓計算機先執行其他的任務。具體而言,就是把訓練過程中,求解方程的環節(所謂的“前向計算”),和驗算反饋(所謂的“后向計算”)的環節,共用一條流水線。這樣,在求解方程環節的計算任務,等待通信任務完成后才能繼續執行的期間,讓GPU進行驗算反饋環節的計算,反之亦然。</p><p style="text-indent: 2em;">DeepSeek在AI大模型訓練與推理算法的工程化工作中,引入EPLB和DualPipe,對業界的貢獻,可以類比為泰勒管理制度和福特生產流水線對工業生產的貢獻,實現了進一步地解放生產力和發展生產力。</p><p style="text-indent: 0em;"><strong>4、DeepEP:邃密群科的破壁者</strong></p><p style="text-indent: 2em;">看過電影《橫空出世》的讀者們,一定會對“算盤打出原子彈”的情節記憶猶新。在缺乏大型計算機的制約下,我國的科技工作者們將復雜的核物理仿真計算,拆解為可分布式并行計算的任務,動員了數以千計的工作人員,使用算盤完成了多輪仿真計算,最終支撐了原子彈的成功研發。</p><p style="text-indent: 2em;">在多輪次的仿真計算中,一項重要的任務就是,將大家計算的結果收集匯總,作為下一輪計算的輸入。在AI模型的訓練算法中,這一任務被稱為“AllReduce”。在DeepSeek開源DeepEP之前,這一任務需要依賴Nvidia開發的NCCL(Nvidia Collective Communications Library,英偉達集合通信庫)。</p><p style="text-indent: 2em;">DeepEP實際上是對傳統的AllReduce做了深度的定制和優化。首先,由于DeepSeek手頭的GPU是通信帶寬受限的H800,因此,DeepEP設法限制了對卡間通信資源的消耗量,讓部分GPU作為中繼節點,進行合并處理后,再把合并后的計算結果傳輸到其他GPU,以避免不必要的通信開銷。</p><p style="text-indent: 2em;">考慮到GPU在執行方程求解的任務時,如果切換到AllReduce任務,需要重新將指令和數據加載到緩存(Cache),DeepEP還增加了一項機制,讓GPU內的一些處理核心(SM,Streaming Multiprocessor)來專門處理這項任務,并動態調整承擔AllReduce任務的核心數量。</p><p style="text-indent: 2em;">我們可以看出,DeepEP打破了三大壁壘:首先是GPU通信的NVLink網(服務器內部)和RDMA網(服務器之間)的壁壘;其次是GPU內部SM分工的壁壘;最重要的一點是,DeepEP通過直接對硬件編程的方式,打破了Nvidia壟斷的集合通信庫等技術壁壘。</p><p style="text-indent: 2em;">DeepEP與戈壁灘上算盤打出原子彈的科技工作者們一樣,是邃密群科的破壁者。</p><p style="text-indent: 0em;"><strong>5、FS:懼滿溢,則思江海下百川</strong></p><p style="text-indent: 2em;">計算,網絡和存儲,是構成計算機系統的三大基礎支柱。3FS的開源,也補上了DeepSeek所使用的大型分布式系統的最后一塊拼圖。</p><p style="text-indent: 2em;">以生成式AI為代表的機器學習算法,實質上是海量的矩陣運算。在運算過程中需要經常保存草稿(也就是“Checkpoint”)。數千塊GPU卡并行保存Checkpoint數據的時候,對存儲子系統的性能提出了嚴峻的考驗。因此,業界出現了所謂的“并行高性能文件系統”,利用多臺服務器分擔存儲數據的任務,也就是分布式存儲。</p><p style="text-indent: 2em;">分布式系統需要解決的最重要問題之一,就是讓系統關鍵性能,可以隨服務器數量的增長,而接近正比例增長,特別是需要避免多個并行任務阻塞在單點。特別地,為了保證關鍵數據不丟失,需要保證一份數據能夠寫入多份冗余的存儲介質,且數據內容保持一致。</p><p style="text-indent: 2em;">目前,業界有LustreFS等開源的并行文件系統,但在性能、高可用與一致性等方面依然有較大的改進空間。DeepSeek研發的3FS(Fire-Flyer File System,螢火蟲文件系統)基于軟硬件協同的思想,采用RDMA網絡和SSD存儲盤實現了自己的高性能并行文件系統。由于RDMA網絡和SSD存儲盤本身就可以通過NVMe協議來協同工作,且RDMA網絡可以繞過遠端CPU的中斷處理,直接讀取遠端SSD/內存中的數據,3FS能夠在180個存儲節點構成的集群上,取得6.6TiB/s的吞吐性能,把并行文件系統的吞吐量壓榨到了網絡吞吐量理論值的80%以上,這是非常了不起的成就。這不禁讓我們想起來初唐政治家魏征在《諫太宗十思疏》中的一句話:懼滿溢,則思江海下百川。——如果擔心存儲系統成為瓶頸,就要讓它像江海容納來自眾多河川的水一樣。</p><p style="text-indent: 0em; text-align: center;"><strong><span style="font-size: 20px;">02 為什么只有DeepSeek做到了?</span></strong></p><p style="text-indent: 2em;">對機器學習與數學有一定認知的讀者很容易理解,DeepSeek在這一周里開源的幾項技術,并不是非常難以實現的。那么,為什么只有DeepSeek做到了這些呢?</p><p style="text-indent: 2em;">從公開信息可以得知:DeepSeek用于訓練的GPU是限制了GPU卡間通信帶寬的H800,且數量只有2048張,比業界頭部的大型企業有數量級的差距。而部署DeepSeek推理模型所需要的GPU資源數量,可以精簡到消費級PC單機可運行的地步。DeepSeek所做的工作,就是將Transformer模型進行優化,減少浪費,使其能夠在受限的硬件資源上順利運行。</p><p style="text-indent: 2em;">由于DeepSeek手頭的GPU是通信帶寬受限的版本,DeepSeek針對這一點的改進就是FlashMLA,EPLB和DeepEP。同時,在DeepGEMM和DualPipe的壓榨下,DeepSeek使用了2048張卡實現了萬卡集群的訓練效果。最后,3FS進一步降低了訓練過程中的存儲開銷。</p><p style="text-indent: 2em;">有人可能會問,DeepSeek團隊將付出了大量心血的成果,無保留地對全社會公開,這一利他行為的動機是什么呢?我們不妨將視線轉向人文社科領域的書海尋求可能的答案。</p><p style="text-indent: 2em;">馬克思在《關于費爾巴哈的提綱》中指出:“人的本質,是社會關系的總和?!痹隈R克思做出這一論斷后,又過了100多年,美國社會學家馬斯洛提出,人的需求的最高層次是自我實現的需要,次之的是尊重的需要。幾乎與馬斯洛同一時代,在風云激蕩的東半球,毛澤東主席也在《紀念白求恩》中寫道:“我們大家要學習他毫無自私自利之心的精神。從這點出發,就可以變為大有利于人民的人。一個人能力有大小,但只要有這點精神,就是一個高尚的人,一個純粹的人,一個有道德的人,一個脫離了低級趣味的人,一個有益于人民的人。”我們有理由相信,DeepSeek將自身的工作成果向全社會無償貢獻出來,說明這是一個脫離了短期利益得失和其他低級趣味的團隊,是為自我成就和尊重而努力奮斗的團隊,是積極回饋社會的團隊。</p><p style="text-indent: 2em;">DeepSeek站在Transformer的肩膀上,讓生成式AI技術得以普惠大眾,同時也將自行研發的技術開源回饋社會。如果這樣的正向循環得以持續,全社會能夠得到的,不僅是基于AI技術的生產力提升,還能夠通過這種價值觀的傳播,讓大家更好地為共同的目標團結奮斗,讓世界的將來更加美好。</p><p><br/></p>Mon, 03 Mar 2025 16:42:09 +0800騰訊 推出快思考模型:API 成本只有 deepseek 不到一半http://www.yw28777.cn/2025/03/620/<p style="text-indent: 0em; text-align: center;"><img class="ue-image" src="http://www.yw28777.cn/zb_users/upload/2025/03/202503021740927351575995.jpg" title="騰訊 推出快思考模型:API 成本只有 deepseek 不到一半.jpg" alt="騰訊 推出快思考模型:API 成本只有 deepseek 不到一半.jpg"/></p><p style="text-indent: 2em;">最近,騰訊元寶可以說是“殺瘋了”,先是多款產品接入 deepseek,推出自研混元 T1 模型,又是猛推流,一度超越字節“豆包”登上中國區 App Store 免費榜第二,又是入駐微信生活服務“九宮格”。</p><p style="text-indent: 2em;">在各家大模型紛紛推出深度思考模型的同時,騰訊混元又“反?!钡赝屏艘粋€快思考模型 Turbo S。</p><p style="text-indent: 2em;">2 月 27 日,騰訊混元自研的快思考模型 Turbo S 正式發布,目前已在騰訊云和元寶上線。</p><p style="text-indent: 2em;">區別于 Deepseek R1、混元 T1 等需要“想一下再回復”的慢思考模型,混元 Turbo S 能夠實現“秒回”,吐字速度提升一倍,首字時延降低 44%,同時在知識、數理、創作等方面也有突出表現。通過模型架構創新,Turbo S 部署成本也大幅下降,持續推動大模型應用門檻降低。</p><p style="text-indent: 2em;">有研究表明,人類約 90%—95% 的日常決策依賴直覺,快思考正如人的“直覺”,為大模型提供了通用場景下的快速響應能力,而慢思考更像理性思維,通過分析邏輯提供解決問題思路??焖伎己吐伎嫉慕Y合和補充,可以讓大模型更智能、更高效地解決問題。</p><p style="text-indent: 2em;">據介紹,通過長短思維鏈融合,騰訊混元 Turbo S 在保持文科類問題快思考體驗的同時,基于自研混元 T1 慢思考模型合成的長思維鏈數據,顯著改進了理科推理能力,實現模型整體效果提升。</p><p style="text-indent: 2em;">作為旗艦模型,Turbo S 未來將成為騰訊混元系列衍生模型的核心基座,為推理、長文、代碼等衍生模型提供基礎能力。</p><p style="text-indent: 2em;">基于 Turbo S,通過引入長思維鏈、檢索增強和強化學習等技術,騰訊自研了推理模型 T1,該模型已在騰訊元寶上線,用戶可以選擇 Deepseek R1 或騰訊混元 T1 模型進行回答,具體操作上,在元寶中選擇 Hunyuan 模型,點亮 T1 即為深度思考,不點亮則為 Turbo S。</p><p style="text-indent: 2em;">開發者和企業用戶已經可以在騰訊云上通過 API 調用騰訊混元 Turbo S,即日起一周內免費試用。</p><p style="text-indent: 2em;">定價上,Turbo S 輸入價格為 0.8 元/百萬 tokens,輸出價格為 2 元/百萬 tokens,相比前代混元 Turbo 模型價格下降數倍,是 deepseek API 成本的 1/2-1/4,團隊稱“比大模型界的拼多多還便宜”。另外,混元滿血 T1&nbsp; 將在 3 月初發布。</p><p style="text-indent: 2em;">在 3 月 2 日騰訊混元的直播里,騰訊混元專家團隊對這次推出的快思考模型做出了詳解,極客公園整理重點如下:</p><p style="text-indent: 0em; text-align: center;"><strong><span style="font-size: 20px;">01 為什么要做“快思考”?</span></strong></p><p style="text-indent: 2em;">團隊通過分析和觀察發現,用戶約 90% 的請求都可以依靠大模型的“直覺”(即快思考模型),無需深度思考就能精準簡潔地給出答案,所以針對這些請求需要模型能更快、更準地回應。</p><p style="text-indent: 2em;">對于剩下的約 10% 的請求,需要模型能進行深度思考甚至反思,從而給出更精準的答案。</p><p style="text-indent: 2em;">同時,快思考模型不僅成本更低,還具備強大的數據融合能力,能夠融入 MySQL 模型或 Max 模型中的優質數據。</p><p style="text-indent: 2em;">Turbo S 借鑒了騰訊的慢思考模型 Hunyuan T1 的數據,該模型使用一種稱為長思維鏈合成的技術進行訓練。這有助于 Turbo S 在保持其速度優勢的同時,通過多步驟問題進行推理,使得對于其余 10% 需要反復反思思考的問題也能得到較精準答案。</p><p style="text-indent: 0em; text-align: center;"><strong><span style="font-size: 20px;">02 技術解析:模型架構/工程優化</span></strong></p><p style="text-indent: 2em;">在業界通用的多個公開 Benchmark 上,騰訊混元 Turbo S 在知識、數學、推理等多個領域展現出對標 DeepSeek V3、GPT 4o、Claude3.5 等業界領先模型的效果表現。</p><p style="text-indent: 2em;">架構方面,通過創新性地采用了 Hybrid-Mamba-Transformer 融合模式,混元 Turbo S 有效降低了傳統 Transformer 結構的計算復雜度,減少了 KV-Cache 緩存占用,實現訓練和推理成本的下降。</p><p style="text-indent: 2em;">傳統 Transformer 架構存在以下缺陷 :</p><p style="text-indent: 2em;">計算復雜度高,序列維度呈平方級關系,在訓練和推理時復雜度高;</p><p style="text-indent: 2em;">推理時需要 KV-Cache,且隨著序列長度增加線性增加,部署成本高;預測時時間成本高,每步預測因疊加 KV-Cache 與序列長度呈線性關系,越往后生成越慢,尤其對于 Mamba 線性 Attention 機制,每步預測都是 O1 復雜度,所以需要做更高效的 attention 或甚至 linear 的 attention,目前行業內已有一些相關探索方案如 window attention、mobile、NSA 等,都是通過不同方式壓縮計算復雜度。</p><p style="text-indent: 2em;">Hybrid-Mamba-Transformer 融合架構是混元 Turbo S 中的一項突破性架構創新,通過融合兩種強大的架構,平衡效率和上下文推理能力:</p><p style="text-indent: 2em;">Mamba 是一種狀態空間模型(SSM),專為高效處理長序列而設計,在內存使用上比 Transformer 更為節省。與 Transformer 不同,后者在處理長文本時會遇到 KV-cache 內存的平方級擴展問題,而 Mamba 可以在不產生過多計算開銷的情況下處理更長的文本,更適合閱讀、總結和生成長文檔的回答(例如法律文本、研究論文等)。</p><p style="text-indent: 2em;">盡管 Mamba 高效,但它在捕捉復雜的上下文關系方面不如 Transformer。Transformer 擅長理解復雜的模式和依賴關系,特別適合推理密集型任務,如數學運算、邏輯推理和問題解決,適用于多步驟推理、代碼生成和深度上下文理解。</p><p style="text-indent: 2em;">混元 Turbo S 首次將 Mamba 應用于超大規模 MoE 模型 MoE(專家混合模型)通過每次查詢激活一部分參數,從而提高計算效率,在保持精度的同時充分利用了 Mamba 的高效性,同時也保留了 Transformer 在推理任務中的優勢。這一突破不僅降低了訓練和推理成本,還提升了速度和智能水平。</p><p style="text-indent: 0em; text-align: center;"><strong><span style="font-size: 20px;">03 算法做到了哪些不一樣的工作?</span></strong></p><p style="text-indent: 2em;">長短思維鏈的融合。</p><p style="text-indent: 2em;">通過長短思維鏈融合,對于需反復推理反思的問題也能得到更精準答案,T1 模型可得到相對長鏈數據,將長鏈數據和短鏈數據融合訓練后采樣,采樣依據正確性和長度正確性,采用規則方法和濾波 model case,從而提升模型整體能力,尤其在數學、代碼、邏輯等強推理任務上表現更好,且短鏈模型能很好地融合長鏈能力,體驗更佳。</p><p style="text-indent: 2em;">即短鏈模型其實體驗更佳,通過融合長鏈也能有很好的推理能力。</p><p style="text-indent: 0em; text-align: center;"><strong><span style="font-size: 20px;">04 scaling&nbsp; law 還沒結束</span></strong></p><p style="text-indent: 2em;">GPT-4.5 是短鏈模型天花板的一個存在,但 API 的成本非常高,以百萬 tokens 計算約為 150 美元,約是 Turbo S 成本 500 倍,且據推測,GPT-4.5 的激活參數量達萬億級別。因此,Turbo S 等快思考模型的出現,正是為了在保證響應速度的同時,降低成本并保持較好的性能。</p><p style="text-indent: 2em;">不管是模型 size 的 scaling 還是訓練數據的 scaling,目前 scaling law 遠未結束,現在中文互聯網上可獲取數據量各家差不多,誰能通過獲取或合成方式獲得更多數據量對模型 performance 來說是關鍵。</p><p style="text-indent: 2em;">標注數據方面,更專業標注團隊對模型表現影響大,如小說創作、醫療方向等,擁有更專業標注團隊和數據的模型表現會更好,整體來看,在數據、算法、算力工程優化等方面對 scaling 的探索都遠未結束。</p><p><br/></p>Sun, 02 Mar 2025 22:48:23 +0800