開欄語。
當人工智能的浪潮席卷全球,北京正以科技立異之姿,成為AI大模型範(fàn)疇的戰略高地。從智源(yuán)研討院的(de)“悟道”大(dà)模型麵世,到“天使投資人”形式孵化頂尖學者,再到月之暗麵、DeepSeek、智譜等(děng)人工智能獨角(jiǎo)獸興起,這座城市不隻匯聚了前沿技能,更以敞開生態孕育打破性(xìng)效果。
現在,北京正活潑打造“全球開源之都”,一大批研發組織、企業活潑擁抱開源,而開源也已深化到轎車、機器人等許多職業。展開AI將是一場科技長征,新京報AI研討院將深度(dù)訪談此次AI浪潮的親曆者與見證人,敘述AI比賽新格局與背麵的故事。
清程極智聯合開創人師(shī)天麾。受訪者供圖。
人工智能是年青的作業,也是年青人的作業。
清程極智聯合開創人師天麾正成為(wéi)這句(jù)話(huà)的一個生動的(de)注腳,而他的閱曆也是其時我國年青一代AI高端人才的縮影——高中拿下(xià)信息學奧林匹克比賽金獎保送清(qīng)華大學,大學確認了體係和高功能核算的研討方向(xiàng),博士結業後(hòu)成(chéng)為我國科學院(yuàn)核算(suàn)技能研討所課(kè)程講師、我國信通院萬卡智(zhì)算集(jí)群服務(wù)才幹推動方陣技能專家。
多個身份標(biāo)簽加持,互聯網大廠(chǎng)曾向(xiàng)師天麾拋出高薪的橄欖枝(zhī),他終究(jiū)卻挑選自己創(chuàng)業,理由也很簡略,“做一些不同的(de)事”。在他眼中,大廠“老板組織”和KPI均是捆綁,立異將難以展開。
在AI圈,年青的(de)身影已然顯眼。2024年異軍突起的Kimi由90後楊植麟領軍,2025年席卷全球的DeepSeek中心團隊成(chéng)員為清北的應屆結業(yè)生(shēng)組成。依據獵(liè)聘大數據研討院陳述,近一(yī)年AI技能活潑人才中(zhōng),30歲以下(xià)的人才占比59.90%。
現在,創建一年多時刻,清程(chéng)極(jí)智已一起入駐上海“模速空間”和北京“人工智(zhì)能立異街區”,這個清華係AI Infra(人工智能根底設(shè)施)立異企業,職工平均年紀不(bú)到30歲。
作為一名95後,師天麾的身上(shàng)看不到老一輩人心中那座名為“技能距離”的大山。麵臨(lín)新京(jīng)報(bào)AI研討院關於算力、立異等問題時,師天麾坦言,英偉達從建立起CUDA到許(xǔ)多人用,其實也沒有好久。國產芯片隻需處理好更好用(yòng)的(de)問題,以國內的(de)工業製(zhì)作(zuò)才幹,將以超高性價比在比(bǐ)賽中勝出。
他(tā)地點的這支由清華核算機係師兄弟組成的團隊,既是我國AI新生代的典型樣(yàng)本,也是破解國產算(suàn)力缺(quē)少的探路者,開源的大(dà)模型推理引擎“赤兔”經過底層技能革新,完成了大多數老舊英偉達GPU和國產芯片對原生FP8模型的高效布置,然後可以運轉DeepSeek滿血(xuè)版。當全球AI比賽進入算力攻(gōng)堅階段,年青團隊正在為國產芯片與大模型之間(jiān)架起一座“通天塔”,在英偉達主導的算(suàn)力版(bǎn)圖中扯開一道立異裂(liè)縫。
創業·。代碼寫得特別快。的愉悅。
新京報AI研討院(yuàn)。:你(nǐ)最早觸摸AI是什麽時分,為何挑選了這個職業?
師天麾。:我最早(zǎo)觸摸AI要追溯到初高中參(cān)加信息學奧林(lín)匹克比賽小組的時分,其時的學習內容首要為“算(suàn)法和數據結(jié)構”。之(zhī)所以(yǐ)學習奧賽,首(shǒu)要是(shì)對核(hé)算機感愛好,還能悄悄(qiāo)打遊戲。高二的暑假,我獲得了2014全國青少年信(xìn)息學(xué)奧林匹克比賽金牌,保送了清華(huá)大學核算機係。
在我的大學期間,人工智(zhì)能現已迎來了以智能駕馭和CV(核算機(jī)視覺)為主的第一(yī)波浪潮,大(dà)二時,我還沒想好將來是(shì)作業仍是從事科研,所以去(qù)了智能駕馭企(qǐ)業Momenta實習研討(tǎo)算法。經過作業實踐,我發現人工智能算法的“黑箱(xiāng)”特性導致(zhì)可解釋性不強,這無法給我很高的成就感。大三時,我去商(shāng)湯科技的高功能核算部分進行(háng)了測驗,才找到了自己真實的愛好地點。
實踐上,信息(xī)學奧林匹克比賽本身就對程序運轉的時刻有要求,這也讓我對“把一份代碼(mǎ)寫得特別快”很感愛好,終究我成(chéng)為清(qīng)華大學(xué)高功能核算(suàn)研討所翟季(jì)冬教師的博士。在博士研討進程中(zhōng),多年堆集(jí)也為創業供給了條件。2023年,咱(zán)們(men)清程極智建立,首要以清華核算機係高功能核算(suàn)所的師兄弟(dì)為班底,清程首要做AI Infra。
簡略來講,AI Infra是銜接硬件與AI算法之間的“中間層”,經過咱們的軟件,客戶可以在相同的硬件資源上完成更快的推理速度和更高的並發(fā)功能,完成AI運(yùn)用(yòng)落地更高效、更低本錢,讓國產(chǎn)硬件也能“比肩(jiān)”英偉(wěi)達(dá)。
新(xīn)京報AI研討院。:清程極智的職工十分年青,團隊為何是這樣的組合?
師天(tiān)麾。:咱們團隊30歲以上的人很少,隻(zhī)需三名(míng)80後。年紀最大的為1985年出世,最小的(de)則是一名現已保送清華(huá)的高三實習生。比較校園更偏重理論根底學習,企業可以真實讓(ràng)理論學(xué)以致(zhì)用。當(dāng)咱們把一個實踐問題滿足細化,最終就會變(biàn)成一個標題,交給這(zhè)名高三實習生後,他用一兩天時刻就做(zuò)完了一周的作業,而且反應說總算理(lǐ)解了在校園學習的核算機理(lǐ)論根(gēn)底“有(yǒu)什麽用”。
咱們團隊年青的原因一方麵是(shì)地點的職業比較搶(qiǎng)手,團隊技(jì)能布景也很(hěn)好,對同學們挺有吸引力(lì)的,所以(yǐ)一些剛出校門的同學就參加清程了。另(lìng)一方麵(miàn),其實AI Infra研討相關職位並不好招人,比較算法,咱們的作業愈加傾向底層,圈子“就這麽大”。所(suǒ)以,咱們也樂意招一些有主意、有熱心、根底厚實、學習才幹強的年(nián)青人進行培育(yù),有些乃至是在(zài)校生。一起,AI職業本身也比較年青,有些擔起重擔的技能大佬也是95後乃至00後,也便是互聯網原住民一代(dài)。
新京(jīng)報AI研(yán)討院。:從你進入清華到現在,現已過去了十(shí)年,這期間AI技能現已閱曆了至(zhì)少兩輪浪潮,對此有什麽感觸?怎樣看待熱門改變對學生挑選專業的影響?
師天麾。:當我決(jué)議走高功能算力這(zhè)條路時,技能熱門的改變對我就影響不大了。由於不論是CV、大模型,仍(réng)是再往前的雲核算、超算,哪一項技能火爆,隻需用的人多起(qǐ)來,本錢在必定程度上就會變高,都需求經過高功(gōng)能核算來加快、降本。
入校時火爆的熱門,或許結業時不必定再熱。但學生隻需打牢根底,不論未來什麽熱門火爆,高功能核(hé)算(suàn)的才幹都(dōu)可以很好地運用進去。
商機。·。 從練習轉向推(tuī)理。,踩點。DeepSeek。爆火(huǒ)。
新京(jīng)報(bào)AI研討院。:本年1月底開端,DeepSeek爆火,作(zuò)為從事算力研討的AI Infra公(gōng)司,你們受到了怎樣的影(yǐng)響?
師天麾。:新(xīn)年期間翻開手機,朋友圈處處都是DeepSeek的音訊。許多上一年和咱們協作的(de)國產公司開端(duān)密布(bù)和咱們討論怎樣快速適配DeepSeek。新年期間,咱們(men)和這些公司簡直每天都在交流。
DeepSeek選用MoE(混合專家模型)架(jià)構,咱們在前幾年MoE剛呈(chéng)現時就判別它會成為未來的重要趨勢(shì),因而進行了MoE模型練習、推理加快的技能堆集(jí),也宣布了一些國際尖端會議的論文。
清(qīng)程(chéng)極智的客戶生態(tài)首要包含硬件廠商、大模型研發企業(yè)以及有數字化轉型需求的企(qǐ)業。上一年,大模型練習的需求高於推理的需求,但隨著(zhe)DeepSeek呈現,企業(yè)對推理服務的需求正逾越傳統的練(liàn)習需求,而咱們推出的(de)DeepSeek一體機以低(dī)技能門檻,讓企業在無需專(zhuān)業AI團隊支撐的環境下也能布置並運用大模型(xíng),效果類似於AI範(fàn)疇的“傻瓜(guā)相機”。
咱們做推理的(de)優勢很大,由於DeepSeek需求多機器推理(lǐ),觸及上層並行核算的優化,這方麵咱(zán)們有麵向超大規模國產算力集群研發的大(dà)模(mó)型練習體係“八卦爐”,核算才幹已(yǐ)擴展到10萬台服務器超大(dà)規模(mó)集(jí)群,所(suǒ)以(yǐ)在多機並行核算、通訊優(yōu)化(huà)等方麵閱曆豐富,將這一數量級的集群優化閱曆放到幾台機(jī)器上,做起來十分隨手。
現在,咱(zán)們的一體機產品布置較多的模型首要有DeepSeek、智譜GLM 、Qwen和llama等幹流模型。
新京報AI研討院。:展開大模型,算力是一個繞不開的論題。英(yīng)偉達在這一範疇(chóu)運營多年(nián),乃至衡量一家企業的算力往往是看其具有多少張“英偉達卡”。你的展開願(yuàn)景會是成為(wéi)下一個英偉達嗎?
師天麾(huī)。:比較於成為英偉達,咱們的定位更類似於(yú)協助(zhù)國產芯片比肩英(yīng)偉達。讓國產芯片以及老(lǎo)舊英偉(wěi)達芯片的才幹到(dào)達(dá)和英偉達新版芯片相同。本年初,清程(chéng)極智與清華一起開源了大模型推理引擎“赤兔(tù)”(chitu),經過赤兔的布置,讓英(yīng)偉達老卡舊卡及國產芯片可以支撐FP8精度模型,然後(hòu)可(kě)以運轉(zhuǎn)DeepSeek滿血版(bǎn)。下一步,咱們也將測驗讓CPU服務器也能高效運轉大模型。
其時,國產硬(yìng)件正在漸漸(jiàn)變老練,但這需(xū)求必(bì)定的(de)進程(chéng),比方咱們在運用國產硬件時會發現一些底層Bug,此刻咱們會和對方進行反應。
其實,英偉達從建立起CUDA生態到許多人用,時刻上也沒有好久,其興起的首要因素是趕上了GPU適配AI練習推理的(de)技能盈利期。所以歸根到底,這(zhè)仍是國產生態的(de)問題——不必定需求一味在硬件上追(zhuī)逐趕超,經過軟硬協同相(xiàng)同能讓國產顯(xiǎn)卡更好用,以我(wǒ)國在工業製作範疇(chóu)強壯的產業化才(cái)幹,參照手機、轎車等職業的演進(jìn)軌道,徹底具有在合理周(zhōu)期內完成(chéng)顯卡產品的性價比打破。
其時,許多央國企已批(pī)量(liàng)收購國產顯卡設備,但實踐布置時仍依靠海外推理(lǐ)引擎,而部分前瞻性客戶已發動專項收購流程,將國產推理引擎歸入收購流程(chéng),這標誌著商場對純國產(chǎn)技能棧的認可度正(zhèng)在提高。
其時,DeepSeek的呈現證(zhèng)明國產大模型現已不輸國際一流模型了,假如不用上相(xiàng)同好的國產顯(xiǎn)卡和推理引擎,生態就不完好,隻(zhī)需生態好,算(suàn)力國產化的(de)方針才幹更好完成。
咱們的終究方針是:不論底(dǐ)層的硬件是什麽,隻需經(jīng)過咱們的軟(ruǎn)件引擎,都可以感觸到相同功能(néng)的算(suàn)力服務,躲避掉硬件的差異。
挑選·。KPI壓(yā)力帶不來立(lì)異。
新京報AI研討院。:DeepSeek的團隊(duì)也很年青,你怎樣看待DeepSeek在立異方麵的(de)成功?
師(shī)天麾。:DeepSeek做得很好,原因之一當然是他們吸引的人才十分凶猛。咱們組博二和博三的同學悉數收(shōu)到過DeepSeek的郵件。比較大廠,DeepSeek少了一些KPI的壓力,更類似於校園(yuán)裏博(bó)士從(cóng)事的科研作業,即“找一個有意(yì)思的點,盡量去完成。做一件有意義(yì)的工作,但不要(yào)求給我帶(dài)來多少收益”。
一旦有了KPI的壓力,往往就不敢去做收益不(bú)確認的工作,會愈加傾向於仿製已有的、清晰的途徑,這(zhè)不會(huì)冒險,但也做(zuò)不(bú)出“特別不相同”的東西。
新京(jīng)報AI研討院。:以你本身的閱曆來看,AI相關專業結業生在草創企業、大廠與(yǔ)校(xiào)園科研之間怎(zěn)麽(me)挑選?在企業的閱曆和實驗室有何(hé)不同(tóng)?
師天麾。:我博士結業後,就現已有大廠發來(lái)了薪資很高的offer,但我其時更(gèng)傾向於創業,做一些不同的事。在大廠,大多(duō)情況下(xià)是“老板組織什麽就做什(shí)麽”,一起要擔負必(bì)定KPI,假如被這些東(dōng)西捆綁住,或許一些工作將難以展開。最初假如我挑選了大(dà)廠(chǎng),或(huò)許也會先待兩三年了解產業界,有(yǒu)了(le)閱曆再(zài)出來創業。關於大廠(chǎng)來說,“你就值這個錢,你有必要做這件事才幹發揮價值。”。
在清程極智,咱們(men)根本很少加班,氣氛敞開並不“內卷”。咱們對(duì)自己的技能十分有決心,咱們信任,尖端的技能人員不是逼著加班就能釋放出世產力的,最重要的是不受約束的(de)創造力。
關於學界與企業的差異,校園的實驗(yàn)室會更多地從技能視點剖(pōu)析一件事,比方大模型(xíng)練習推理體(tǐ)係的功能(néng)瓶頸在哪(nǎ)裏,怎(zěn)麽處理使其加快。在校園,1萬行代碼(mǎ)就能驗證一(yī)個主意,但要把(bǎ)這個主意變成可用、安穩、簡直沒有Bug的產品(pǐn),或許(xǔ)需求幾十萬代碼。這便是企業要(yào)做的,關於(yú)企業的產品,功能好並不(bú)代表肯(kěn)定好用,需求更多權(quán)衡,更多產(chǎn)品工程化。
一起,實驗(yàn)室關於投(tóu)產比沒有(yǒu)那(nà)麽介意。企業(yè)則(zé)需求向投資(zī)人告知,試錯(cuò)本錢不能太大。最終,二(èr)者的節奏(zòu)也(yě)有所不同,企業需(xū)求看商場上客(kè)戶真實需求什麽,要從用戶視(shì)點來考慮商場的(de)改變(biàn),並進行活潑地適配。
記者聯絡郵箱:luoyidanxjbnews.com。
新京報貝殼財經記者 羅亦丹。
修(xiū)改 王進雨。
校正 楊許麗。
強強聯手、改寫觀測極限!我國天眼再傳好消(xiāo)息
怎(zěn)麽做好工作“蓄水池”和消費“助推器”?滴滴交出新答卷 — 新京報