“咱們現(xiàn)在看到的這些應(yīng)該都只是表象,或者說是大賽組委會(huì)有意讓咱們看到的,在這背后,其發(fā)起這項(xiàng)賽事的終極目的,我猜他們很可能是在為一套超級(jí)AI系統(tǒng)積累基礎(chǔ)的樣本數(shù)據(jù)?!?p> “然后,讓AI系統(tǒng)對(duì)這些樣本數(shù)據(jù)進(jìn)行機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘,從中吸收營養(yǎng),不斷自我完善?!?p> 李幻將自己的猜測(cè)向潘正道娓娓道來。
潘正道又吸了一口手上的香煙,然后目光炯炯地看著李幻,若有所思地問道:“你的意思是,大賽組委會(huì)在暗地里用這些比賽數(shù)據(jù)訓(xùn)練一套AI系統(tǒng)?”
“嗯!”李幻輕輕地點(diǎn)了點(diǎn)頭。
“但是這些比賽中發(fā)掘的漏洞數(shù)據(jù),大賽組委會(huì)在賽后都會(huì)與所有贊助商分享的呀,咱們數(shù)字護(hù)盾也是可以得到一份的。按你這樣的說法,不但大賽組委會(huì)可以用這些數(shù)據(jù)來訓(xùn)練AI系統(tǒng),每一個(gè)擁有這份數(shù)據(jù)的廠商應(yīng)該都可以做同樣的事情才對(duì),但實(shí)際情況卻是得到這份數(shù)據(jù)的廠商似乎都沒有這樣做,這其中就包括了咱們的數(shù)字護(hù)盾。每年得到的這些數(shù)據(jù),最終只是進(jìn)入了咱們公司安全類產(chǎn)品的基礎(chǔ)樣本庫,除此之外貌似也別無它用了,難道這些數(shù)據(jù)還可以用來訓(xùn)練AI?”潘正道說出了自己心中的疑惑。
李幻笑著搖了搖頭:“潘總,大賽組委會(huì)與贊助商分享的那些數(shù)據(jù),確實(shí)是只能當(dāng)成基本的樣本庫來使用,無法用來訓(xùn)練AI系統(tǒng)的?!?p> “原因何在?”潘正道問。
“這是因?yàn)檫@些數(shù)據(jù)中少了用來訓(xùn)練AI系統(tǒng)最為關(guān)鍵的‘行為數(shù)據(jù)’?!崩罨没卮鸬煤苁呛唵巍?p> 看著潘正道依然有些疑惑的目光,李幻溫聲說:“我給您打個(gè)比方吧。以咱們公司的殺毒軟件為例,殺毒軟件都有自己的‘病毒特征庫’,我想這個(gè)您應(yīng)該是知道的吧?”
潘正道點(diǎn)了點(diǎn)頭,示意知道。
“好。當(dāng)殺毒軟件查殺病毒的時(shí)候,它會(huì)將從所查殺的那個(gè)文件中提取出來的特征數(shù)據(jù)與‘病毒特征庫’中已經(jīng)存在的樣本數(shù)據(jù)進(jìn)行比對(duì),如果存在,則標(biāo)記那個(gè)文件有病毒,如果不存在,則跳過,繼續(xù)查殺后面的文件,絕大多數(shù)殺毒軟件的工作原理就是這樣的。”
“但這樣其實(shí)有一個(gè)很大的問題,就是病毒永遠(yuǎn)會(huì)先于殺毒軟件出現(xiàn),因?yàn)椴《静怀霈F(xiàn),就沒辦法提取病毒的特征數(shù)據(jù)加入到殺毒軟件的‘病毒特征庫’中,而‘病毒特征庫’中沒有這個(gè)病毒的特征數(shù)據(jù),殺毒軟件就無法識(shí)別出這個(gè)病毒,也就無法對(duì)此病毒進(jìn)行有效地查殺。這樣一來,殺毒軟件其實(shí)始終是在扮演一個(gè)‘事后諸葛亮’的角色?!?p> 李幻徐徐地向潘正道解釋著。
潘正道點(diǎn)了點(diǎn)頭,肯定地說:“是的,目前的現(xiàn)狀就是如此。雖然現(xiàn)在有些殺毒軟件號(hào)稱可以查殺未知病毒,但實(shí)際效果并不怎么好,因此目前的主流殺毒軟件還都是在靠‘病毒特征庫’來查殺病毒的。你舉這個(gè)例子是不是想說,大賽組委會(huì)提供給我們這些贊助商的數(shù)據(jù)其實(shí)就相當(dāng)于是一個(gè)‘病毒特征庫’數(shù)據(jù)?”
“沒錯(cuò),說白了就是一個(gè)‘病毒特征庫’數(shù)據(jù),這些數(shù)據(jù)不能說沒有用,在許多情況下可以說是很有用很有價(jià)值的,但如果用這樣的數(shù)據(jù)來訓(xùn)練AI系統(tǒng)的話,估計(jì)這個(gè)AI系統(tǒng)最后也只能與殺毒軟件一樣,做一個(gè)‘事后諸葛亮’罷了?!?p> “一套AI系統(tǒng)能否做到真正的‘智能’,只讓它學(xué)習(xí)這些已知的樣本數(shù)據(jù)是遠(yuǎn)遠(yuǎn)不夠的,最關(guān)鍵的是要讓它學(xué)習(xí)如何得到這些數(shù)據(jù)的,即發(fā)掘這些系統(tǒng)漏洞的過程與方法,只有這樣,AI系統(tǒng)才會(huì)真正的‘智能’起來。俗話說‘授人以魚不如授人以漁’,此語同樣適用與AI系統(tǒng)的訓(xùn)練。”
李幻的一番話讓潘正道眼睛一亮,他拉著李幻坐回了沙發(fā),然后將手中的煙頭丟到了煙灰缸中。
潘正道說:“你的意思就是說,這項(xiàng)賽事最為關(guān)鍵的數(shù)據(jù),其實(shí)是你們這些選手在破除障礙發(fā)掘漏洞時(shí)所用到的那一套方法?”
李幻點(diǎn)頭稱是:“對(duì)的,這套方法才是訓(xùn)練AI的關(guān)鍵所在,也就是所謂的‘漁’,而被用這套方法發(fā)掘出來的系統(tǒng)漏洞其實(shí)就是所謂的‘魚’了?!?p> “原來如此!”潘正道自言自語了一句,似是已經(jīng)完全明白了李幻的意思。
“像你們發(fā)掘一個(gè)系統(tǒng)漏洞,怎樣嘗試,怎樣試錯(cuò),怎樣設(shè)斷點(diǎn)……等等方法,這些都是在你們每個(gè)人的腦子里的呀,而且并不是發(fā)掘每一個(gè)漏洞都會(huì)用到所有的這些方法,如此一來,這些不完整的方法,對(duì)于訓(xùn)練AI來說意義應(yīng)該也不怎么大吧?”潘正道又提出了自己的問題。
李幻笑了笑:“在這點(diǎn)上,您可能想錯(cuò)了。一個(gè)人發(fā)掘一個(gè)系統(tǒng)漏洞,可能只需要用到一種方法;一個(gè)人發(fā)掘一百個(gè)系統(tǒng)漏洞,就可能需要用到幾十種不同的方法;如果是一百個(gè)人,每個(gè)人都發(fā)掘一百個(gè)系統(tǒng)漏洞呢?所有用到的方法,用大數(shù)據(jù)匯總起來,再放給AI系統(tǒng)去進(jìn)行機(jī)器學(xué)習(xí),就算AI系統(tǒng)每次只能夠有效地掌握其中一半的方法,經(jīng)過這么多屆比賽的數(shù)據(jù)積累,這套AI系統(tǒng)發(fā)掘系統(tǒng)漏洞的能力,估計(jì)要比許多參賽選手都要高出很多了吧?!?p> “???真的可以這樣嗎?”聽了李幻的一番話,潘正道一臉震驚之色。
“雖然這些都只是我個(gè)人的猜測(cè),但我認(rèn)為此法的可行性非常高。”李幻肯定地回答。
“而且,我發(fā)現(xiàn),今年的比賽,在構(gòu)建破障范例的時(shí)候,比賽系統(tǒng)會(huì)記錄選手的所有操作過程,其中甚至包括了選手們敲擊鍵盤的習(xí)慣,這種情況在我前年第一次參加這項(xiàng)賽事時(shí)是沒有發(fā)現(xiàn)的。所以,今年的十場(chǎng)預(yù)選賽,我在第一場(chǎng)比賽發(fā)現(xiàn)了這種情況之后,從第二場(chǎng)比賽開始,我就不再在比賽系統(tǒng)之中,敲擊完整的破障過程了,而是只會(huì)將腦海中演算后得到的破障結(jié)果,以范例的形式提交給系統(tǒng)。這種做法就像是解一道數(shù)學(xué)題,我將所有的解題過程都在腦海中完成,只把答案或很簡略的過程寫在題目的下面類似?!?p> 潘正道一只手摸著自己的下巴,眼睛一眨不眨地看著坐在自己對(duì)面的李幻,思索著他所說的每一句話。
他知道,如果李幻的這些猜測(cè)為真,那系統(tǒng)安全這個(gè)行業(yè),在不久的將來可能就真地要變天了。