人工智能和機(jī)器人的關(guān)系
近年來,人工智能的話題非常熱門。不過,大多數(shù)人對(duì)人工智能存在誤解,很多人認(rèn)為人工智能是用機(jī)器來模擬人類的智能,實(shí)則不然。實(shí)際上,人工智能是用機(jī)器來模擬人類的智能行為。
模擬智能和模擬智能行為是完全不同的。比方說,我們沒法模擬人類的情感,因?yàn)槲覀儾恢涝趺磥矶x快樂、痛苦等,因?yàn)楫?dāng)我們快樂和痛苦的時(shí)候,我們的大腦和心理發(fā)生了什么變化,到今天為止人們并不很清楚。在這種情況下,不能用機(jī)器來模擬人類的感情,而只能模擬感情的表現(xiàn)——即痛苦或高興所表現(xiàn)出來的行為。
眾所周知,情感主要從三個(gè)渠道表現(xiàn)出來:即臉部表情、語言(聲音)和肢體動(dòng)作。從人類的面部表情、發(fā)出的聲音(語言)和做出的動(dòng)作能夠判定某人對(duì)某事的態(tài)度,這是情感分析。反過來,則稱為情感生成。人工智能主要用機(jī)器來模擬人類的以下四個(gè)方面的智能行為:理性行為、感知、動(dòng)作以及情感、靈感等。
有人可能會(huì)說,人工智能要模擬人類的這四個(gè)智能行為,這和機(jī)器人很相似。但人工智能和機(jī)器人是有顯著區(qū)別的。機(jī)器人做的是機(jī)器,人工智能做的是智能體(intelligent agent),為什么用Agent來描述它,而不是用智能機(jī)器。這是因?yàn)槿斯ぶ悄懿还庖鰴C(jī)器,還包括軟件、系統(tǒng)和零部件等。
那么該怎么定義機(jī)器人呢?現(xiàn)代機(jī)器人問世已有幾十年,對(duì)其定義仁者見仁,智者見智,沒有一個(gè)統(tǒng)一的意見。目前,對(duì)機(jī)器人的理解寬度很大,最低的只指可編程的機(jī)器,最高的則是指各種各樣智能化的機(jī)器。在我看來,對(duì)機(jī)器人的定義是一個(gè)逐步發(fā)展的過程,主要包括三大部分:前端指感覺(傳感器)或者感知,可能通常做不到感知,只能做到感覺,后端就是可控的操作器、效應(yīng)器等等,中間的部分目前主要還是集中在控制、編程這些領(lǐng)域,智能成分會(huì)逐步增加。
從機(jī)器人和人工智能發(fā)展的整個(gè)進(jìn)程來看,機(jī)器人和人工智能有很多重疊的地方,但機(jī)器人更加面向任務(wù)、面向應(yīng)用。
現(xiàn)代機(jī)器人的研究始于20世紀(jì)中期。最早在二戰(zhàn)后,美國(guó)阿貢國(guó)家能源實(shí)驗(yàn)室為了解決核污染機(jī)械操作問題,首先研制出遙控操作器用于處理放射性物質(zhì)。緊接著于第二年,又開發(fā)出一種電氣驅(qū)動(dòng)的主從式機(jī)械手臂。
20世紀(jì)50年代中期,“可編程”“示教再現(xiàn)”機(jī)器人面世。1960年,第一臺(tái)真正意義上的工業(yè)機(jī)器人由美國(guó)聯(lián)合控制公司研制成功。隨著傳感技術(shù)和智能技術(shù)的發(fā)展,20世紀(jì)80年代開始進(jìn)入智能機(jī)器人研究階段。
經(jīng)過近40多年的發(fā)展,機(jī)器人已從傳統(tǒng)的工業(yè)制造領(lǐng)域迅速向醫(yī)療服務(wù)、教育服務(wù)、家庭服務(wù)、勘探勘測(cè)、生物工程、救災(zāi)救援、深空深海探測(cè)、智能交通、智能工廠等領(lǐng)域擴(kuò)展。
擴(kuò)大應(yīng)用場(chǎng)景本身就是創(chuàng)新
機(jī)器人的誕生是人類高新技術(shù)革命的結(jié)晶,經(jīng)過短短幾十年的發(fā)展已取得了很大的進(jìn)展,但對(duì)于人類的理想而言,這還僅僅是開始。
在各種類型的機(jī)器人中,應(yīng)用于生產(chǎn)過程與環(huán)境的工業(yè)機(jī)器人較早得到大規(guī)模應(yīng)用。作為各種機(jī)器人分類中較為成熟的板塊,工業(yè)機(jī)器人應(yīng)用已經(jīng)滲透到幾乎所有工業(yè)生產(chǎn)制造的場(chǎng)景中,包括:機(jī)器人碼垛、沖壓、注塑、分揀、焊接、激光切割、噴涂、機(jī)床上下料,另外結(jié)合視覺技術(shù)或機(jī)床,還能創(chuàng)造出更多的可能。
協(xié)作機(jī)器人近兩年也開始在機(jī)器人市場(chǎng)嶄露頭角。其常見的應(yīng)用場(chǎng)景包括拾取和放置、設(shè)備看護(hù)、包裝碼垛、加工作業(yè)、精加工作業(yè)、質(zhì)量檢測(cè)等。此外,它還被應(yīng)用于加工作業(yè)、醫(yī)療外科手術(shù)、倉儲(chǔ)物流、機(jī)器維護(hù)等其它非制造業(yè)和非傳統(tǒng)的領(lǐng)域。
隨著人工智能與物聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,服務(wù)機(jī)器人在不斷豐富自身功能及實(shí)現(xiàn)更強(qiáng)大性能的基礎(chǔ)上成為當(dāng)之無愧的后起之秀。新零售、智慧城市、智慧醫(yī)療、銀行、智能安防、機(jī)器人STEM教育等應(yīng)用場(chǎng)景遍地開花。
為了讓機(jī)器人在更多場(chǎng)景落地應(yīng)用,很多機(jī)器人行業(yè)已經(jīng)開始探索AI、VR、5G等更廣泛的技術(shù)融合。其實(shí),想要為機(jī)器人選擇一個(gè)好的應(yīng)用場(chǎng)景并不容易。特別是對(duì)于制造傳統(tǒng)機(jī)器人而言,不斷擴(kuò)大應(yīng)用場(chǎng)景,本身就是一種創(chuàng)新。
如何突破從結(jié)構(gòu)化到非結(jié)構(gòu)化的環(huán)境
目前,機(jī)器人在某些領(lǐng)域應(yīng)用比較普遍,比如無人機(jī)、水下機(jī)器人等。為什么機(jī)器人在這些領(lǐng)域能得到應(yīng)用,而其它領(lǐng)域卻比較困難?我認(rèn)為,關(guān)鍵在于如何突破從結(jié)構(gòu)化到非結(jié)構(gòu)化的環(huán)境,這就需要人工智能。這里,我想通過幾個(gè)例子來說明。
PUMA型機(jī)械臂是最早的多關(guān)節(jié)機(jī)器人,在20世紀(jì)70年代被推出,在20世紀(jì)80年代變成了工業(yè)機(jī)器人,并進(jìn)入迅猛發(fā)展的階段。如今,要把它推廣到一個(gè)相對(duì)非結(jié)構(gòu)化的環(huán)境。所謂機(jī)械臂的非結(jié)構(gòu)化環(huán)境就是有人參與,能夠與人交互,這樣環(huán)境就變成非結(jié)構(gòu)化了。
要想解決非結(jié)構(gòu)化環(huán)境的問題,必須把感知和動(dòng)作結(jié)合起來,也就是說要做的動(dòng)作是把感知和動(dòng)作連接起來。從事機(jī)器人研究的人對(duì)反饋的概念非常清楚,因?yàn)檫@里必須要用反饋,而人工智能缺少反饋的概念,所有從事計(jì)算機(jī)領(lǐng)域的研究人員都缺少這個(gè)概念,因?yàn)樗麄冄芯康膶?duì)象都是開環(huán)的算法,所以我認(rèn)為這是人工智能和機(jī)器人結(jié)合的非常重要的點(diǎn),而且可以做好。
協(xié)作機(jī)器人可以柔順控制,不會(huì)碰到周圍的事物,一旦碰到會(huì)立刻降速,但協(xié)作機(jī)器人目前還未形成產(chǎn)業(yè)。就我國(guó)而言,在非結(jié)構(gòu)化的環(huán)境下,發(fā)展協(xié)作機(jī)器人產(chǎn)業(yè)是一個(gè)巨大的考驗(yàn),但當(dāng)前有很大的市場(chǎng)需求,只有在有需求的情況下,才能找到應(yīng)用場(chǎng)景。
過去我們也做過不少移動(dòng)機(jī)器人,中國(guó)早期也是集中在研究越野,慢慢地越野的任務(wù)就轉(zhuǎn)向軍方和自動(dòng)駕駛車輛。就目前而言,全世界都非常重視汽車的自動(dòng)駕駛,汽車必然走向自動(dòng)駕駛的道路。
目前自動(dòng)駕駛主要是通過數(shù)據(jù)驅(qū)動(dòng)的學(xué)習(xí)方法,學(xué)習(xí)不同場(chǎng)景下的圖象分割,判別是車輛、行人還是道路等,基于此建立三維模型,在三維模型上規(guī)劃行駛路徑,但是自動(dòng)駕駛的這種方案并不能解決復(fù)雜路況下的行駛問題。
自動(dòng)駕駛最重要的就是感知部分,也就是說汽車必須可以感知周圍的環(huán)境,主要是視覺傳感器,包括多模態(tài),用攝像機(jī)或者其它設(shè)備感知周圍環(huán)境,這在人工智能看來就涉及深度學(xué)習(xí)。眾所周知,采用淺層神經(jīng)網(wǎng)絡(luò)對(duì)標(biāo)準(zhǔn)圖像庫ImageNet進(jìn)行圖像識(shí)別,原來誤識(shí)率是50%,但采用深度學(xué)習(xí)之后誤識(shí)率降到3.57%,盡管誤識(shí)別率降低了很多,但算法的脆弱性令人擔(dān)憂。在很多情況下,基于深度學(xué)習(xí)的人工智能系統(tǒng)非常脆弱、容易受攻擊和受欺騙,這就是計(jì)算機(jī)視覺算法的不安全性。如果這種不安全性不消除,很難想象在實(shí)際應(yīng)用中會(huì)出多大的事故?
人工智能現(xiàn)有的方法只能處理結(jié)構(gòu)化環(huán)境下的問題,而非結(jié)構(gòu)化環(huán)境下的問題,人工智能的方法還有待提高,所以我們提出第三代人工智能就是要解決非結(jié)構(gòu)環(huán)境下的有關(guān)問題。
早期,我們從事人工智能研究主要是靠知識(shí)、算法和算力,進(jìn)入數(shù)據(jù)驅(qū)動(dòng)時(shí)代以后,則主要靠的是數(shù)據(jù)、算法和算力,僅僅依靠數(shù)據(jù)、算法和算力做出來的系統(tǒng)總是存在不安全問題,怎么解決這種不安全問題?我們的辦法就是發(fā)展第三代人工智能,其核心思想是全面利用知識(shí)、數(shù)據(jù)、算法和算力這四個(gè)要素。
自動(dòng)駕駛從L2、L3、L4走到L5,必須要解決計(jì)算機(jī)視覺不安全性的問題,現(xiàn)在世界各國(guó)都在做這件事。有人說未來汽車是四個(gè)輪子上的超級(jí)計(jì)算機(jī),換句話說,將來只要用很少的錢買車本身,而需要用大量的錢買車上的各種計(jì)算機(jī)設(shè)備。
我們現(xiàn)在是用大數(shù)據(jù)的方法對(duì)圖像進(jìn)行分割和識(shí)別,然后建模、規(guī)劃,目前這些任務(wù)完全可以做到實(shí)時(shí),這樣車能不能就可以讓計(jì)算機(jī)來開?我認(rèn)為在復(fù)雜路況下還是不能開,因?yàn)橛?jì)算機(jī)視覺是不可靠的。當(dāng)一個(gè)系統(tǒng)中有人(在交通系統(tǒng)中,包括行人和汽車駕駛員)存在時(shí),這個(gè)系統(tǒng)就會(huì)變成復(fù)雜的系統(tǒng)。由于在現(xiàn)實(shí)情況中,駕駛員和行人都存在有意無意地違反交通規(guī)則的情況,所以必須從實(shí)際情況出發(fā)去考慮這種問題。其實(shí),解決這樣的問題并不難。我們可以讓計(jì)算機(jī)自動(dòng)駕駛車,累計(jì)開幾十萬邁,從中暴露計(jì)算機(jī)中存在的錯(cuò)誤,找到解決各種突發(fā)事件的辦法,如同駕駛員在駕駛中積累經(jīng)驗(yàn)一樣,有了這些“經(jīng)驗(yàn)”,就可以放心地讓計(jì)算機(jī)單獨(dú)駕駛了。
總之,當(dāng)機(jī)器人往前發(fā)展的時(shí)候,與人工智能會(huì)有更多的交集,通過和人工智能的交叉融合,最后達(dá)到二者互利共贏的目的。■
(作者系中國(guó)科學(xué)院院士、清華大學(xué)人工智能研究院名譽(yù)院長(zhǎng),記者倪偉波整理)