產品分類(lèi)
吃瓜動態
  • 國常會:進一步優(yōu)化現有方針 更大力度推進房地產商場止跌回穩
  • 北京市森(sēn)防辦持續發(fā)布森林火險橙色預警(jǐng) — 新(xīn)京報
  • Over 20,000 second
  • 雲鯨智能融資1億美元 騰訊(xùn)和北京機器人基金布局家庭具身智能 — 新京(jīng)報
  • 香港藝(yì)人羅家英自曝第四次患癌:最多剩9年壽數(shù)
聯係方式

郵箱:admin@aa.com

電話:020-123456789

傳真:020-123456789

黑料在線

李飞飞团队456页陈述:中美AI模型功能近乎相等 体系推理本钱降至280分之一

2025-06-17 16:27:56      點擊:687

李飞飞团队456页陈述:中美AI模型功能近乎相等 体系推理本钱降至280分之一

  4月8日,由李飛飛聯合領導的(de)斯坦福大學以人為本人工智能研討所(suǒ)(Stanford HAI)發布了《2025年(nián)人工(gōng)智(zhì)能(néng)指數陳述》(Artificial Intelligence Index Report 2025)。這份長達456頁的陳述,深化分析了2024年全球人工智能職業的開(kāi)展態勢,提醒了12大要害趨勢。

CFF20LXzkOyN00ZI2y8fDJNkp68HnqTuJyQIfZqLibhibIicPQ2O4YiaR5P372yfOsNBlxqaCjw1mSMwTaN2j8yvTg.png

圖片來(lái)曆:斯坦福(fú)大學以人為本人工(gōng)智能研討所官網。

  陳述(shù)以為,AI正變得更高效、更普惠。跟著小模型功能飆升,到達GPT-3.5水平的(de)體係推理本錢在曩昔兩(liǎng)年間下降到了本來的280分之(zhī)一。

  陳(chén)述(shù)還指出,我國高(gāo)功能AI模型的數量和質量不斷進步,中美AI模(mó)型功能近乎相等。與此同時,我國在AI範疇論文數量和專利數量上堅持(chí)領先地位。

  。AI功能飆升(shēng),體現逐漸挨近人類。

  2023年,研討人員(yuán)推出了MMMU、GPQA和SWE-bench等頗具應戰性的新基準測驗,用於(yú)測驗AI體係的極限。

  測驗發現,僅(jǐn)僅一年後,AI體係的功能便完成大幅躍升——在MMMU測驗中得分進步18.8個百分點;在(zài)GPQA測驗中進步48.9個百分點;SWE-bench測驗裏更是進步了67.3個百分點。

  從全體趨(qū)勢來看,AI在各大範疇的體現逐漸挨近人類,甚至在某些(xiē)景象下,AI智能體能在限時編程使命(mìng)中逾(yú)越人類。

CFF20LXzkOyN00ZI2y8fDJNkp68HnqTuDnjWlmF4HxkIibrUvNcW5U2NvzSrOqdrn3E3HAjyic5Y24EibkUoGPujQ.png

在部分評測指標上,AI技能功能(néng)體現與人類水平的比照圖片來曆:《2025年人(rén)工智能指數陳述》。

  但是(shì),雜亂的推理關於AI模型而言,仍然是一個應戰。

  在處(chù)理相似世界數學奧林匹克比(bǐ)賽標題這類使命時(shí),AI模型體(tǐ)現(xiàn)出色。但麵臨比如PlanBench等雜亂推(tuī)理基準測驗時(shí),卻仍(réng)顯得費勁。即(jí)便麵臨(lín)那些已(yǐ)知(zhī)存在正解的邏輯使命,AI也常常無法可靠地處理邏輯使命,這極大約束了AI在對精度要求極高(gāo)的高風險職業中的運用。

CFF20LXzkOyN00ZI2y8fDJNkp68HnqTu83W711jRLvbuKGh5bYnhgsllIClDALrZMiaxfVx3SSXN1aScqUz1mTA.png

各大模型在(zài)PlanBench基準測驗上的正(zhèng)確率圖片來曆:《2025年人工智能指數陳述》。

  。全球AI出資飆升。

  2024年,生成式AI在全球範圍內招引了339億美元的私家出資,與2023年比較,增(zēng)長幅度到達18.7%。

  與此(cǐ)同時,企業對(duì)AI的采用率顯著(zhe)進步(bù),從2023年的(de)55%上升至(zhì)2024年的(de)78%。越來越(yuè)多的研討成(chéng)果表(biǎo)明,AI不隻可以有用進步生產力,在大都情況下,還能縮小勞動力的技能距離。

  值得重(chóng)視的是,將生成式AI運用於至少一項事務功(gōng)能的企業數量呈現了激增。2023年,這一份額僅為33%,而到了2024年,該份額躍升至71%,增幅(fú)超越一倍。

CFF20LXzkOyN00ZI2y8fDJNkp68HnqTuRN92iagqoRF88QZGA82iaVv5UOgc6icAtBLbia9RicUYGMkt0GevcITFgjw.png

2017年至2024年,將AI運用於至少一項事務功能企業的份額不(bú)斷上升圖片來曆:《2025年人工智能(néng)指數陳述》。

  。中(zhōng)美模(mó)型功能近乎相等。

  數(shù)據顯現,美國在AI模(mó)型的數(shù)量上處於領先地位。2024年,總部坐落美國的組織具有(yǒu)40個聞名AI模型,超(chāo)越我國(15個)和法國(3個)。

CFF20LXzkOyN00ZI2y8fDJNkp68HnqTucVy6U9cqNIZRt46DnQicNbUJbUPC1jxCrB1KiaiaTRGPU496ka2sibvfJg.png

圖片來曆:《2025年人工智能指數陳述》。

  不過,陳述著重,中美模型(xíng)之間的功能(néng)距離(lí)正在敏捷縮小。以MMLU和Humanevals等幹(gàn)流基準測驗成果來看,2023年,中美頂尖模型(xíng)之間的功能(néng)距離還在兩位數,但是到了2024年,這一距離已大幅縮小,簡(jiǎn)直處於(yú)同一水平。

  與此同時,我國在AI範疇(chóu)論文數量和(hé)專利數量上仍舊堅持(chí)領先地位。

  。小模型功(gōng)能飆升,推理本錢(qián)降至280分之一。

  陳述(shù)指(zhǐ)出,AI正變得愈加高效、經濟實惠和易於獲取。

  跟(gēn)著小(xiǎo)模型功能進步,到達GPT-3.5水平的體係推理本錢在曩昔兩年間下降至(zhì)280分之一。在硬件層麵,本(běn)錢每年下降30%,而動力功率每年進步40%。

  2022年,在MMLU基準測驗中,得分超60%的最小模型是PaLM,參數量為5400億。到了2024年(nián),微軟Phi-3-mini僅用(yòng)38億參數,就取得了相同的實力。這代表,兩年多的時間裏模型參數減(jiǎn)少了(le)142倍。

  此外,開(kāi)源模型正在迎頭趕上,與閉源模型的(de)距(jù)離逐漸縮小。2023年,開(kāi)源模型顯著落後於閉(bì)源模型(xíng)。而到(dào)2024年,這一距離簡直消失。2024年1月初,頂尖閉源模(mó)型在大模型(xíng)競技場排(pái)行榜上以8.0%的成果超越(yuè)了頂尖開源模(mó)型。而(ér)到2025年2月,這一距離已縮小至1.7%。

CFF20LXzkOyN00ZI2y8fDJNkp68HnqTuxjufQpjqtp8Bd1IMiaictIYic2YeyO7qRHjBPHorGOdib937IbK2e9FzHA.png

2022年至2024年,在MMLU上得分高於60%的小模型圖片來(lái)曆:《2025年人工智能指(zhǐ)數陳述》。

  。我國(guó)對AI的心情最達觀。

  在對AI的心情(qíng)方麵,我國是全球首要國家和(hé)地區中最達觀的。

  陳(chén)述顯現,2024年我國有83%的人以為AI產品和服務利大於弊,排(pái)在後邊的是印度尼西亞(80%)和泰國(77%)。比較之下,美(měi)國(39%)、加拿大(40%)等的達觀心(xīn)情遠(yuǎn)低於我(wǒ)國。

CFF20LXzkOyN00ZI2y8fDJNkp68HnqTuYyt6yV7ibKoM2CnMAP8cdncPGqURa5zrbeh1DBgibQL9QrcEsWoL5zdw.png

2022年(nián)至2024年,各國以為(wéi)“運用AI產品和服(fú)務利大(dà)於弊”的份額圖片來曆:《2025年人工(gōng)智能指數陳述》。

  不(bú)過,從全(quán)體趨勢而言,各國關於AI的達觀心情(qíng)正逐漸升溫,特別是在一些曾對AI最持懷疑心情的國家。數據顯現,自2022年(nián)起,美國以為“運用AI產(chǎn)品和服務利大於弊”的份額進步了4%,加拿大增長了(le)8%,法國(guó)增長了10%。

三分之二受訪者稱AI將在(zài)未來3至5年對日常日子發(fā)生顯著影響。

  從醫療保健到交通(tōng)運輸,AI正敏捷從試驗室走向(xiàng)日常日子(zǐ)。

  2023年,美國食品藥品監督管理局(jú)(FDA)同意了223款AI醫療設備,而2015年僅有6款。

CFF20LXzkOyN00ZI2y8fDJNkp68HnqTuW5I80fjWndEcdyE8MqejuZtWicr8IOvuWD7ZIeWKBFezGL0sknNVUIg.png

1995年至2023年FDA同意的AI醫療設備數量圖片來曆:《2025年(nián)人工(gōng)智能(néng)指數陳述》。

  道路交通相同因AI技能發生著一日千(qiān)裏的改變。自(zì)動駕駛轎車不(bú)再(zài)僅僅試驗,而是逐漸駛入(rù)現實日子。

  美國(guó)最大的運營商之一Waymo每(měi)周供給超越15萬次自動駕駛服務,而百度旗下的“蘿卜快跑”(Apollo Go)無(wú)人駕(jià)駛租借車隊已在我國多(duō)個城市正式投入運營。

  此外,人們(men)對AI融入日常日子的等待與認可度正在上升。據統計,全球範圍內,有多達三分之二的受訪者以為,在未來三到五年內,AI產品及服務(wù)將對日常日子發(fā)生顯著影響(xiǎng)。

(文章來曆:每日(rì)經濟新聞)。

《海濱的假日》|每日一書 — 新(xīn)京報
美軍證(zhèng)明海軍陸戰隊初次在洛杉磯拘留布衣

石榴视频APP下载_石榴视频在线观看_石榴视频色版_石榴视频污下载