產品分類（lèi）

吃瓜動態

聯係方式

郵箱:admin@aa.com

電話:020-123456789

傳真:020-123456789

黑料在線

李飞飞团队456页陈述：中美AI模型功能近乎相等体系推理本钱降至280分之一

2025-06-17 16:27:56 點擊：687

　　4月8日，由李飛飛聯合領導的（de）斯坦福大學以人為本人工智能研討所（suǒ）（Stanford HAI）發布了《2025年（nián）人工（gōng）智（zhì）能（néng）指數陳述》（Artificial Intelligence Index Report 2025）。這份長達456頁的陳述，深化分析了2024年全球人工智能職業的開（kāi）展態勢，提醒了12大要害趨勢。

CFF20LXzkOyN00ZI2y8fDJNkp68HnqTuJyQIfZqLibhibIicPQ2O4YiaR5P372yfOsNBlxqaCjw1mSMwTaN2j8yvTg.png

圖片來（lái）曆：斯坦福（fú）大學以人為本人工（gōng）智能研討所官網。

　　陳述（shù）以為，AI正變得更高效、更普惠。跟著小模型功能飆升，到達GPT-3.5水平的（de）體係推理本錢在曩昔兩（liǎng）年間下降到了本來的280分之（zhī）一。

　　陳（chén）述（shù）還指出，我國高（gāo）功能AI模型的數量和質量不斷進步，中美AI模（mó）型功能近乎相等。與此同時，我國在AI範疇論文數量和專利數量上堅持（chí）領先地位。

　　。AI功能飆升（shēng），體現逐漸挨近人類。

　　2023年，研討人員（yuán）推出了MMMU、GPQA和SWE-bench等頗具應戰性的新基準測驗，用於（yú）測驗AI體係的極限。

　　測驗發現，僅（jǐn）僅一年後，AI體係的功能便完成大幅躍升——在MMMU測驗中得分進步18.8個百分點；在（zài）GPQA測驗中進步48.9個百分點；SWE-bench測驗裏更是進步了67.3個百分點。

　　從全體趨（qū）勢來看，AI在各大範疇的體現逐漸挨近人類，甚至在某些（xiē）景象下，AI智能體能在限時編程使命（mìng）中逾（yú）越人類。

CFF20LXzkOyN00ZI2y8fDJNkp68HnqTuDnjWlmF4HxkIibrUvNcW5U2NvzSrOqdrn3E3HAjyic5Y24EibkUoGPujQ.png

在部分評測指標上，AI技能功能（néng）體現與人類水平的比照圖片來曆：《2025年人（rén）工智能指數陳述》。

　　但是（shì），雜亂的推理關於AI模型而言，仍然是一個應戰。

　　在處（chù）理相似世界數學奧林匹克比（bǐ）賽標題這類使命時（shí），AI模型體（tǐ）現（xiàn）出色。但麵臨比如PlanBench等雜亂推（tuī）理基準測驗時（shí），卻仍（réng）顯得費勁。即（jí）便麵臨（lín）那些已（yǐ）知（zhī）存在正解的邏輯使命，AI也常常無法可靠地處理邏輯使命，這極大約束了AI在對精度要求極高（gāo）的高風險職業中的運用。

CFF20LXzkOyN00ZI2y8fDJNkp68HnqTu83W711jRLvbuKGh5bYnhgsllIClDALrZMiaxfVx3SSXN1aScqUz1mTA.png

各大模型在（zài）PlanBench基準測驗上的正（zhèng）確率圖片來曆：《2025年人工智能指數陳述》。

　　。全球AI出資飆升。

　　2024年，生成式AI在全球範圍內招引了339億美元的私家出資，與2023年比較，增（zēng）長幅度到達18.7%。

　　與此（cǐ）同時，企業對（duì）AI的采用率顯著（zhe）進步（bù），從2023年的（de）55%上升至（zhì）2024年的（de）78%。越來越（yuè）多的研討成（chéng）果表（biǎo）明，AI不隻可以有用進步生產力，在大都情況下，還能縮小勞動力的技能距離。

　　值得重（chóng）視的是，將生成式AI運用於至少一項事務功（gōng）能的企業數量呈現了激增。2023年，這一份額僅為33%，而到了2024年，該份額躍升至71%，增幅（fú）超越一倍。

CFF20LXzkOyN00ZI2y8fDJNkp68HnqTuRN92iagqoRF88QZGA82iaVv5UOgc6icAtBLbia9RicUYGMkt0GevcITFgjw.png

2017年至2024年，將AI運用於至少一項事務功能企業的份額不（bú）斷上升圖片來曆：《2025年人工智能（néng）指數陳述》。

　　。中（zhōng）美模（mó）型功能近乎相等。

　　數（shù）據顯現，美國在AI模（mó）型的數（shù）量上處於領先地位。2024年，總部坐落美國的組織具有（yǒu）40個聞名AI模型，超（chāo）越我國（15個）和法國（3個）。

CFF20LXzkOyN00ZI2y8fDJNkp68HnqTucVy6U9cqNIZRt46DnQicNbUJbUPC1jxCrB1KiaiaTRGPU496ka2sibvfJg.png

圖片來曆：《2025年人工智能指數陳述》。

　　不過，陳述著重，中美模型（xíng）之間的功能（néng）距離（lí）正在敏捷縮小。以MMLU和Humanevals等幹（gàn）流基準測驗成果來看，2023年，中美頂尖模型（xíng）之間的功能（néng）距離還在兩位數，但是到了2024年，這一距離已大幅縮小，簡（jiǎn）直處於（yú）同一水平。

　　與此同時，我國在AI範疇（chóu）論文數量和（hé）專利數量上仍舊堅持（chí）領先地位。

　　。小模型功（gōng）能飆升，推理本錢（qián）降至280分之一。

　　陳述（shù）指（zhǐ）出，AI正變得愈加高效、經濟實惠和易於獲取。

　　跟（gēn）著小（xiǎo）模型功能進步，到達GPT-3.5水平的體係推理本錢在曩昔兩年間下降至（zhì）280分之一。在硬件層麵，本（běn）錢每年下降30%，而動力功率每年進步40%。

　　2022年，在MMLU基準測驗中，得分超60%的最小模型是PaLM，參數量為5400億。到了2024年（nián），微軟Phi-3-mini僅用（yòng）38億參數，就取得了相同的實力。這代表，兩年多的時間裏模型參數減（jiǎn）少了（le）142倍。

　　此外，開（kāi）源模型正在迎頭趕上，與閉源模型的（de）距（jù）離逐漸縮小。2023年，開（kāi）源模型顯著落後於閉（bì）源模型（xíng）。而到（dào）2024年，這一距離簡直消失。2024年1月初，頂尖閉源模（mó）型在大模型（xíng）競技場排（pái）行榜上以8.0%的成果超越（yuè）了頂尖開源模（mó）型。而（ér）到2025年2月，這一距離已縮小至1.7%。

CFF20LXzkOyN00ZI2y8fDJNkp68HnqTuxjufQpjqtp8Bd1IMiaictIYic2YeyO7qRHjBPHorGOdib937IbK2e9FzHA.png

2022年至2024年，在MMLU上得分高於60%的小模型圖片來（lái）曆：《2025年人工智能指（zhǐ）數陳述》。

　　。我國（guó）對AI的心情最達觀。

　　在對AI的心情（qíng）方麵，我國是全球首要國家和（hé）地區中最達觀的。

　　陳（chén）述顯現，2024年我國有83%的人以為AI產品和服務利大於弊，排（pái）在後邊的是印度尼西亞（80%）和泰國（77%）。比較之下，美（měi）國（39%）、加拿大（40%）等的達觀心（xīn）情遠（yuǎn）低於我（wǒ）國。

CFF20LXzkOyN00ZI2y8fDJNkp68HnqTuYyt6yV7ibKoM2CnMAP8cdncPGqURa5zrbeh1DBgibQL9QrcEsWoL5zdw.png

2022年（nián）至2024年，各國以為（wéi）“運用AI產品和服（fú）務利大（dà）於弊”的份額圖片來曆：《2025年人工（gōng）智能指數陳述》。

　　不（bú）過，從全（quán）體趨勢而言，各國關於AI的達觀心情（qíng）正逐漸升溫，特別是在一些曾對AI最持懷疑心情的國家。數據顯現，自2022年（nián）起，美國以為“運用AI產（chǎn）品和服務利大於弊”的份額進步了4%，加拿大增長了（le）8%，法國（guó）增長了10%。

三分之二受訪者稱AI將在（zài）未來3至5年對日常日子發（fā）生顯著影響。

　　從醫療保健到交通（tōng）運輸，AI正敏捷從試驗室走向（xiàng）日常日子（zǐ）。

　　2023年，美國食品藥品監督管理局（jú）（FDA）同意了223款AI醫療設備，而2015年僅有6款。

CFF20LXzkOyN00ZI2y8fDJNkp68HnqTuW5I80fjWndEcdyE8MqejuZtWicr8IOvuWD7ZIeWKBFezGL0sknNVUIg.png

1995年至2023年FDA同意的AI醫療設備數量圖片來曆：《2025年（nián）人工（gōng）智能（néng）指數陳述》。

　　道路交通相同因AI技能發生著一日千（qiān）裏的改變。自（zì）動駕駛轎車不（bú）再（zài）僅僅試驗，而是逐漸駛入（rù）現實日子。

　　美國（guó）最大的運營商之一Waymo每（měi）周供給超越15萬次自動駕駛服務，而百度旗下的“蘿卜快跑”（Apollo Go）無（wú）人駕（jià）駛租借車隊已在我國多（duō）個城市正式投入運營。

　　此外，人們（men）對AI融入日常日子的等待與認可度正在上升。據統計，全球範圍內，有多達三分之二的受訪者以為，在未來三到五年內，AI產品及服務（wù）將對日常日子發（fā）生顯著影響（xiǎng）。

（文章來曆：每日（rì）經濟新聞）。

《海濱的假日》｜每日一書 — 新（xīn）京報
 美軍證（zhèng）明海軍陸戰隊初次在洛杉磯拘留布衣

李飞飞团队456页陈述：中美AI模型功能近乎相等 体系推理本钱降至280分之一

李飞飞团队456页陈述：中美AI模型功能近乎相等体系推理本钱降至280分之一