澎湃新聞記者 張靜
成立3年,融資4輪,金額總計(jì)數(shù)億元,專攻算法攻防、隱私計(jì)算、深偽檢測,為AI“殺毒”。掌管著這家估值數(shù)十億人民幣AI初創(chuàng)企業(yè)的,是個(gè)典型理工科氣質(zhì)的90后清華AI博士。
90后西安人田天從小癡迷計(jì)算機(jī),憑借高中物理競賽全國金獎(jiǎng)保送清華計(jì)算機(jī)系,一路念到博士,2018年7月出了校門就加入浩浩蕩蕩的創(chuàng)業(yè)大軍,做“真正的AI”。
他創(chuàng)辦的北京瑞萊智慧科技有限公司要做第三代人工智能,為AI安全發(fā)展保駕護(hù)航。瑞萊智慧是RealAI的音譯,由清華大學(xué)人工智能研究院官方發(fā)起設(shè)立,清華大學(xué)人工智能研究院院長張鈸院士和清華大學(xué)人工智能研究院基礎(chǔ)理論研究中心主任朱軍共同擔(dān)綱首席科學(xué)家。參與承擔(dān)科技部、工信部、公安部、發(fā)改委等發(fā)起的多個(gè)國家級重大項(xiàng)目建設(shè)任務(wù)。
田天說,AI歸根到底還是一項(xiàng)有用的技術(shù),但算法、數(shù)據(jù)、應(yīng)用層面的安全可控問題有待突破,不能簡單停留在功能層面的復(fù)制或修修補(bǔ)補(bǔ)。AI產(chǎn)業(yè)要真正做到頂天立地,得先立地,也就是加強(qiáng)基礎(chǔ)層領(lǐng)域的技術(shù)研究,這就好比打好地基,是整個(gè)產(chǎn)業(yè)發(fā)展的最堅(jiān)實(shí)基礎(chǔ)。
他擅長理性規(guī)劃,制定目標(biāo)和路徑后逐步推進(jìn)。但在創(chuàng)辦這家企業(yè)前,他并不知道自己究竟是否適合創(chuàng)業(yè)?!暗坏╅_始做起來,很多問題就一定要去解決掉,包括公司的戰(zhàn)略制定、管理、產(chǎn)品研發(fā)、銷售推進(jìn)。”田天說,自己的創(chuàng)業(yè)信心越來越足,對市場和第三代人工智能的判斷越來越清晰。
人工智能的瓶頸
1991年,田天出生于西安一個(gè)教師家庭。上小學(xué)時(shí)接觸到計(jì)算機(jī)便萌生了興趣,那時(shí)父母上課要用到電子課件,他覺得有意思,也開始自學(xué)PPT。從頭建立一個(gè)網(wǎng)站、制作一個(gè)flash動畫,對他來說是非常有成就感的事,甚至把自學(xué)經(jīng)驗(yàn)總結(jié)出來發(fā)表,得到500多元稿費(fèi)。
對計(jì)算機(jī)的興趣越來越濃厚,他開始學(xué)編程,不斷跟進(jìn)計(jì)算機(jī)知識。2009年,18歲的田天憑借高中物理競賽全國金獎(jiǎng)保送進(jìn)入清華大學(xué)計(jì)算機(jī)系,之后免試就讀清華大學(xué)計(jì)算科學(xué)與技術(shù)專業(yè),在這里,他完成了碩士和博士學(xué)業(yè),主要研究方向是貝葉斯機(jī)器的理論、模型和應(yīng)用領(lǐng)域。
田天說,自己真正接觸到人工智能是在大二,從入門到現(xiàn)在已經(jīng)有12年時(shí)間。那時(shí)候的人工智能還沒有如此火熱,直到2016年谷歌旗下圍棋人工智能程序AlphaGo的出現(xiàn)。
它曾在和其他圍棋程序的對抗中獲得99.8%的勝率,在一項(xiàng)競賽中以5:0戰(zhàn)勝歐洲圍棋冠軍。2016年,AlphaGo約戰(zhàn)圍棋世界冠軍韓國棋手李世石,以4:1的總比分取勝。
“整個(gè)行業(yè)得到了很大的促進(jìn),熱度升溫了很多。帶來的直接變化就是更多的人進(jìn)入到這個(gè)領(lǐng)域,很多人開始嘗試它在不同方向的產(chǎn)業(yè)化?!鄙疃葘W(xué)習(xí)在搜索技術(shù)、數(shù)據(jù)挖掘、機(jī)器翻譯、自然語言處理等領(lǐng)域取得成果,“最開始大家覺得人工智能能力非常強(qiáng),能夠解決很多問題?!?/p>
但從2018年開始,人們也發(fā)現(xiàn)了人工智能還有很大瓶頸,人工智能底層理論問題逐漸得到關(guān)注。
“我們發(fā)現(xiàn)人工智能到了一個(gè)產(chǎn)業(yè)化和應(yīng)用的新階段后,有一系列新的問題要去解決,主要是關(guān)于人工智能的算法、數(shù)據(jù)、應(yīng)用等各方面非常棘手的問題,可以說是安全或者可靠性的隱患。”
比如 臉解鎖被破解、刷臉 付出現(xiàn)漏洞、 動駕駛汽 被 客操縱“誤導(dǎo)”從而駛向其他方向,這些屬于算法層面的安全漏洞。
“把AI用在游戲里,算法出錯(cuò)的影響也不會特別大,造成的損失是有限的。對話系統(tǒng)的智能問答出錯(cuò),大家也就是笑一笑,覺得AI有點(diǎn)笨,也不會帶來特別大的問題?!?/p>
但人工智能在越來越多的關(guān)鍵領(lǐng)域落地,特別是金融、能源、醫(yī)療等高價(jià)值領(lǐng)域的應(yīng)用與財(cái)產(chǎn)安全、人身安全甚至社會安全緊密相關(guān),對人工智能的安全、可靠、可控要求越來越高,一旦出現(xiàn)不可控,帶來的損失是巨大的。
而以深度學(xué)習(xí)為代表的第二代人工智能本身具有黑盒性和不可解釋性,人們很難理解算法最終決策的細(xì)節(jié)和邏輯,這就導(dǎo)致了開發(fā)者、使用者都不可預(yù)知的攻擊或誤導(dǎo)。
再者,“一個(gè)隱私保護(hù),一個(gè)知識產(chǎn)權(quán),用戶的人臉數(shù)據(jù)憑什么給一家公司用?”中國科學(xué)院院士張鈸曾說,怎么用也是一個(gè)問題,“數(shù)據(jù)都被公司收走,是否會造成不公平競爭,這些都是需要思考和治理的?!?/p>
主動上門的需求
傳統(tǒng)AI技術(shù)局限凸顯,第三代人工智能的理念出現(xiàn)了。早在2016年,張鈸院士就曾提出發(fā)展“第三代人工智能”的理念,利用知識、數(shù)據(jù)、算法和算力4個(gè)要素, 建立新的可解釋和魯棒的AI理論與方法,發(fā)展安全、可信、可靠和可擴(kuò)展的AI技術(shù)。
2018年,清華大學(xué)設(shè)立人工智能研究院,張鈸擔(dān)任新研究院院長,聘請圖靈獎(jiǎng)得主姚期智院士作為學(xué)術(shù)委員會主任。2019年,清華大學(xué)宣布成立人工智能研究院基礎(chǔ)理論研究中心,以期建立第三代人工智能基礎(chǔ)理論和方法體系,清華大學(xué)計(jì)算機(jī)系長聘教授朱軍被聘為研究中心主任。
博士階段,田天師從朱軍,他所從事的也是與第三代人工智能相關(guān)的研究,包括機(jī)器學(xué)習(xí)算法與眾包知識的整合,提高AI在有噪聲的數(shù)據(jù)和標(biāo)注情況下的訓(xùn)練和預(yù)測表現(xiàn)。2018年拿到博士學(xué)位后,田天沒有去互聯(lián)網(wǎng)大廠,而是把讀研期間一直想做的事做了:辦一家公司,把手里的技術(shù)落地。
“做這件事的想法和決心在讀研期間是一直都有的?!碧锾煺f,當(dāng)年瑞萊智慧最初的創(chuàng)始團(tuán)隊(duì)都是“清華同一個(gè)團(tuán)隊(duì)的”,“大家在一起配合了很長時(shí)間,非常有默契?!眲?chuàng)業(yè)也是一拍即合,走出清華校門,尋找辦公場地。公司成立后,他白天忙于業(yè)務(wù)和管理,晚上鉆研技術(shù)路線和產(chǎn)品方向。
“第三代人工智能能夠應(yīng)用的領(lǐng)域非常廣,所以對于我們來說,反倒要去篩選,到底哪一塊更需要我們的能力和產(chǎn)品,哪一塊能讓我們在市場產(chǎn)生相應(yīng)優(yōu)勢?!甭涞貓鼍暗倪x擇并非完全一帆風(fēng)順。
早期一些慕名而來的客戶對田天團(tuán)隊(duì)提出AI需求,團(tuán)隊(duì)接到需求后研發(fā)再交付客戶。但他們很快發(fā)現(xiàn),這些主動上門的需求中,有時(shí)候客戶搞不清楚現(xiàn)在AI到底能把問題解決到什么程度。有些需求聽上去更像科幻,更多時(shí)候,客戶所積累的數(shù)據(jù)并非是解決問題所需的數(shù)據(jù),甚至沒有數(shù)據(jù)。
最初,田天嘗試過智慧旅游方案,通過AI為游客定制行程。這就要求人工智能有可解釋性,智慧旅游不僅僅是給出一個(gè)旅游方案,更重要的是讓客戶信服,為什么是這個(gè)方案、它好在哪。
“當(dāng)時(shí)期望高就高在我們想做出來的是一個(gè)真正可靠、可解釋的系統(tǒng)?!毙枨蟊旧頉]有問題,但很快被現(xiàn)實(shí)打敗。當(dāng)真正下手時(shí)發(fā)現(xiàn),人工服務(wù)積累下來的旅游數(shù)據(jù)距離AI可用還有很大距離。從游客的角度,“他的需求到底在什么地方、他為什么提出這個(gè)需求等等,并沒有得到很好的記錄。”
在數(shù)據(jù)不足情況下,模型輸出效果并不理想。要么繼續(xù)積累更多數(shù)據(jù),要么通過前期研發(fā)把算法做到能實(shí)現(xiàn)智慧旅游的程度,但后者又需要高額投入,而客戶的預(yù)期是用相對合理的成本實(shí)現(xiàn)能力強(qiáng)大的AI。經(jīng)過一段時(shí)間嘗試后,他們覺得這樣的項(xiàng)目現(xiàn)階段并不合適公司的技術(shù)方向。
為AI“殺毒”
從科研走向創(chuàng)業(yè),這幫青年創(chuàng)業(yè)者越來越關(guān)注技術(shù)如何變成當(dāng)下市場需要的產(chǎn)品,再把產(chǎn)品賣出去。
他們泡在市場里,挖掘身邊認(rèn)識的所有人脈資源,與這些潛在客戶的交流讓他們摸索出一些高價(jià)值的場景,找到最適合現(xiàn)階段落地、快速產(chǎn)生應(yīng)用價(jià)值的領(lǐng)域,這些場景的智能化升級能夠獲得合理的投入產(chǎn)出比。
在電網(wǎng)領(lǐng)域,AI圖像識別系統(tǒng)可用于電網(wǎng)智能監(jiān)控,判斷高壓線周圍有無危險(xiǎn)品。但如果為了惡意破壞基礎(chǔ)設(shè)施,在危險(xiǎn)品上加裝花紋等特殊對抗樣本,“AI圖像識別算法就沒有辦法認(rèn)出危險(xiǎn)品了,那就有可能導(dǎo)致危險(xiǎn)品出現(xiàn)又無法檢測到,甚至一些地方起火了也檢測不到,圖像識別算法完全被消除?!?/p>
如果通過搭載的攻擊算法對系統(tǒng)進(jìn)行模擬攻擊,然后評估系統(tǒng)表現(xiàn),綜合給出安全性評分,并指出安全漏洞在哪,用戶再通過搭載的防御方案就可以針對性地加固提升。田天說,這套人工智能安全平臺類似于殺毒軟件,發(fā)現(xiàn)安全隱患的同時(shí)進(jìn)行安全防御。
所有的AI都有相應(yīng)輸入,輸入數(shù)據(jù)被黑客添加“對抗樣本”,就會導(dǎo)致惡意攻擊?!疤貏e像針對人臉,有可能黑客會在人臉上加一些特定生成的干擾圖案,就能誤導(dǎo)后面的識別模型給出錯(cuò)誤輸出。”
這時(shí)候如果在輸入數(shù)據(jù)后、識別模塊前,先檢測輸入的數(shù)據(jù)是否存在惡意攻擊,“如果有攻擊行為,就拒絕請求,沒有攻擊行為再進(jìn)入識別環(huán)節(jié)?!比鹑R智慧因此開發(fā)了AI安全防火墻。
田天說,這種AI防火墻和傳統(tǒng)網(wǎng)絡(luò)安全防護(hù)墻類似,不同的是防護(hù)對象是算法,它可以提供對抗樣本攻擊、深度偽造攻擊等算法攻擊的檢測,除了應(yīng)用在人臉識別領(lǐng)域,對目標(biāo)檢測、圖像分類、自動駕駛系統(tǒng)也能防御部署。
另外,在金融風(fēng)控場景中,一般情況下信貸分析模型所需的數(shù)據(jù)涉及消費(fèi)、支付、社交、通訊等,高度綁定用戶隱私,一旦在整合和使用過程被竊取泄漏,將造成嚴(yán)重后果。
田天說,結(jié)合人工智能、密碼學(xué)、分布式系統(tǒng)等技術(shù)路線,瑞萊智慧正在搭建隱私保護(hù)計(jì)算平臺,這一綜合底層平臺支持不同算法和場景,支持多方聯(lián)合建模和統(tǒng)計(jì)。
“在金融領(lǐng)域我們做建模、風(fēng)控等,雖然做的是金融模型,但這個(gè)模型底層都是基于隱私計(jì)算平臺來搭建的。”相比傳統(tǒng)不考慮隱私的建模方式,基于隱私計(jì)算平臺的金融模型可以確保所有明文數(shù)據(jù)在原始的存儲方不出庫,保證密文計(jì)算效果。
根據(jù)場景選擇技術(shù),在這個(gè)90后的帶領(lǐng)下,瑞萊智慧在政務(wù)、 融、能源、制造、互聯(lián) 等領(lǐng)域落地,提供 臉識別系統(tǒng)安全、自動駕駛系統(tǒng)安全、深度合成和偽造檢測、隱私保護(hù)計(jì)算、AI攻防靶場等產(chǎn)品和方案。
在業(yè)務(wù)路徑選擇上,田天說,原本最早定位于“AI基礎(chǔ)設(shè)施”,在市場里摸索后目標(biāo)市場更細(xì)化了,他們把目光鎖定在“更安全的AI基礎(chǔ)設(shè)施+更智能的上層應(yīng)用”。“在這些領(lǐng)域,目前相對來說能夠提供類似能力的廠商比較稀缺。作為一家技術(shù)公司,我們在里面可以取得更高的話語權(quán)?!?/p>
用田天的話說,當(dāng)初走了一些不大彎的彎路后,他們又“很快轉(zhuǎn)回來了”。
不能簡單停留在功能的復(fù)制或修補(bǔ)
90后硬科技創(chuàng)業(yè)者越來越多,學(xué)霸正在攻占創(chuàng)投圈。去年10 ,瑞萊智慧A輪融資3億元,去年11 獲中 投近億元戰(zhàn)略投資。成立3年完成四輪融資,金額總計(jì)數(shù)億元。
田天是個(gè)典型理工科特質(zhì)的創(chuàng)業(yè)者,擅長理性規(guī)劃,制定目標(biāo)和路徑后逐步推進(jìn)。他覺得90后創(chuàng)業(yè)者是更敢想、更愿意突破的一群人。他們選擇顛覆性的創(chuàng)業(yè)方向,特別是硬科技創(chuàng)業(yè)需要把握核心技術(shù)不斷迭代,保持技術(shù)前沿性。
但要經(jīng)營好一家企業(yè),基礎(chǔ)的素質(zhì)和能力是相通的,比如領(lǐng)導(dǎo)力、韌性、學(xué)習(xí)力等。田天說,在創(chuàng)辦這家企業(yè)前,他并不知道自己究竟是否適合創(chuàng)業(yè),很多事情也不了解,大到銷售商務(wù)、財(cái)務(wù)法務(wù)工作本就在學(xué)校時(shí)接觸不多,小到辦公室選址、裝修也需要花時(shí)間思考。
“但一旦開始做起來,很多問題就一定要去解決掉,包括公司的戰(zhàn)略制定、管理、產(chǎn)品研發(fā)、銷售推進(jìn)。這些問題都要想辦法解決,所以就得不停學(xué)習(xí)不停提升。”
從當(dāng)初六七個(gè)人的小團(tuán)隊(duì)發(fā)展到如今規(guī)模近200人,核心成員均來自清華大學(xué)、北京大學(xué)、中科院等。他帶領(lǐng)的團(tuán)隊(duì)參與承擔(dān)了科技部、工信部、公安部、發(fā)改委等部委發(fā)起的多個(gè)國家級重大項(xiàng)目建設(shè)任務(wù),包括科技創(chuàng)新2030-新一代人工智能重大項(xiàng)目中“安全大腦新一代人工智能創(chuàng)新開放平臺”的建設(shè)、工信部揭榜項(xiàng)目新一代人工智能產(chǎn)業(yè)創(chuàng)新重點(diǎn)任務(wù)、人工智能關(guān)鍵技術(shù)源頭創(chuàng)新專項(xiàng)等。
今年2月,瑞萊智慧入選第二批北京市專精特新“小巨人”認(rèn)定企業(yè)。田天說,自己的創(chuàng)業(yè)信心越來越足,對市場和第三代人工智能的判斷越來越清晰。第三代人工智能未來的發(fā)展,最核心的還是人才。
他認(rèn)為國內(nèi)AI產(chǎn)業(yè)偏應(yīng)用,基于成熟的算法做微調(diào),提供解決方案。“但第三代人工智能是理論上的突破,需要很多人研究AI底層,國內(nèi)相關(guān)領(lǐng)域人才沒有那么多?!边@是將第三代人工智能推向舞臺中央的一個(gè)大挑戰(zhàn)。
“人才永遠(yuǎn)都是難招的。”光靠創(chuàng)始團(tuán)隊(duì)遠(yuǎn)遠(yuǎn)不夠,他所困擾的也是如何吸引更優(yōu)秀的人加入團(tuán)隊(duì)?!拔覀兿胍龅牡谌斯ぶ悄苁且患芎甏蟮氖?,需要長時(shí)間,需要一幫人持續(xù)投入資源去做?!?/p>
“除了我們自己推進(jìn)它的研究和產(chǎn)業(yè)化之外,也要進(jìn)一步營造生態(tài)和氛圍,讓更多人關(guān)注到人工智能底層的一些研究,追求人工智能底層的突破?!?/p>
在商業(yè)化之前,田天團(tuán)隊(duì)里的研究 員已經(jīng)坐了多年冷板凳。技術(shù)產(chǎn)業(yè)的發(fā)展趨勢,前期會經(jīng)歷高峰期,緊接著會有低谷期,后期會進(jìn)入一個(gè)平穩(wěn)發(fā)展階段。這幾年,他的切身感受是人們對人工智能的態(tài)度越來越冷靜、理性。
AI歸根到底還是一項(xiàng)有用的技術(shù),但人工智能仍有很多新的關(guān)鍵問題待突破,不能簡單停留在功能層面的復(fù)制或修修補(bǔ)補(bǔ), “夠一夠能夠著的東西早就被別人夠走了?!?/p>
“真正做到頂天立地,得先立地?!币簿褪羌訌?qiáng)基礎(chǔ)層領(lǐng)域的技術(shù)研究,這就好比打好地基,這是整個(gè)產(chǎn)業(yè)發(fā)展的最堅(jiān)實(shí)基礎(chǔ),然后再深入產(chǎn)業(yè),理解產(chǎn)業(yè)場景的核心需求。
責(zé)任編輯:李躍群
校對:欒夢