中國在人工智能領域的科研實力怎么樣?
中國人工智能水平,同美國,歐洲都屬于第一梯隊的玩家。每個國家,各有所長,同美國相比,中國企業及學術界對人工智能的重視程度及研發與美國不相上下。以目前的短板而言,要比美國晚20年。但在新一輪的深度學習以及中國移動互聯網浪潮中,中國確實扳回一局。(后面詳細說移動互聯網浪潮對中國人工智能的推動)
通俗化解讀什么叫人工智能,本文不含代碼,并且努力將復雜的內容口語化,所以專業大拿不要見怪。另外本文可能會省略不少內容,畢竟人工智能是一門學科不是一篇文章能夠簡單的講完的。但力求讓咱們老百姓理解,這個東西對于未來的我們很重要!僅此一點。
一、什么叫人工智能?人工智能,通俗的講就是機器具有智慧,有智商了。能夠按照人的方式去干活,去辦事,幫助人類解決工作了。
在深究一些,什么是智能?對于智能的研究有3個方面的定義:
1、思維層面:智能來源于思維活動,智能的核心是思維,人的一切知識都是思維的產物。可望通過對思維規律和思維方法的研究,來揭示智能的本質。
2、知識閾值:智能取決于知識的數量及其可運用程度。一個系統所具有的可運用知識越多,其智能就會越高。
3、進化理論:是美國MIT的Brooks在對人造機器蟲研究的基礎上提出來的。智能取決于感知和行為,取決于對外界復雜環境的適應。智能不需要知識、不需要表示、不需要推理,智能可由逐步進化來實現。(emergent)
這三個定義,看著很難理解,其實簡單的說。第一中思維層面的理解,含義就是智能要有思維,這個定義,基本同社會學的歸納類似,說白了就是哪個有名的人說的一句名言就是定義。
這第二種知識閾值,很有意識,這個就具有一定的數據知識了。簡單的可以理解為,我們學到的,看到的知識都放在一個盆里,怎么體現出你智慧很高。你才高八斗,學富五車,就是智慧的體現。簡單說,就是裝的內容多,但是也有學傻的。(這里我們不討論學傻的情況)
第三中,進化理論,那真的就走到了現代機器人智能的入門了,人們在尋找方法,讓一個機器能夠輔助人處理問題的時候,想到的方法是,從生物學上講:人類是進化的,同時人類的學習過程也是一步步積累的過程。
從這三個定義的發展過程,其實我們大致是能夠看出來,人類一直在探索,智慧形成的過程,知道怎么形成的,才能去憑空創造一個智慧。
4、人類對智能進行了不同層次的結構
高層智能:以大腦皮層(抑制中樞)為主,主要完成記憶、思維等活動。
中層智能:以丘腦(感覺中樞)為主,主要完成感知活動。
低層智能:以小腦、脊髓為主,主要完成動作反應活動。
不同觀點在層次結構中的對應關系
5、最終學術界大體將智能歸類為以下這些東西
(1)感知能力:對應機器人的傳感器
通過感知器官感知外界的能力。是人類獲得外界信息的基本途徑,其處理方式有以下兩種:
感知--動作方式:對簡單、緊急信息。
感知--思維--動作方式:對復雜信息。
(2)記憶和思維能力:對應人工智能的搜索以及建模能力
記憶:對感知到的外界信息和由思維產生的內部知識的存儲過程。
思維:對已存儲信息或知識的本質屬性、內部知識的認識過程。
(3)思維方式:對應人工智能:問題建模,模糊認識
抽象思維(邏輯思維):根據邏輯規則對信息和知識進行處理的理性思維方式。例如,邏輯推理等。
形象思維(直感思維):基于形象概念,根據感性形象認識材料對客觀現象進行處理的一種思維方式。例如,圖像、景物識別等。
靈感思維(頓悟思維):是一種顯意識和潛意識相互作用的思維方式。例如,因靈感而頓時開竅。
(4)學習和自適應能力:對應人工智能,神經網絡學習,深度學習
學習:是一個具有特定目的的知識獲取過程,是人的一種本能。不同人的學習方法、能力不同。自適應:是一種通過自我調節適應外界環境的過程,是人的一種本能。不同人的適應能力不同。
(5)行為能力:對應機器人運動控制能力。
含義:是人們對感知到的外界信息作出動作反應的能力信息來源:由感知直接獲得的外界信息 經過思維加工后的信息實現過程:通過脊髓來控制 由語言、表情、體姿等來實現
因此,在人類認識人工智能的思路上面,是從簡單到復雜而來,并且最終分解智能應該具有哪些細節表現特征,這對于整個技術的發展是至關重要的。這才算是指明了方向。
復雜的問題,一定是通過系統解決的,系統解決了復雜問題的同時,也在制造新的復雜問題,因為需要不斷的優化和訓練處理問題的系統——這個系統就是人工智能。(我個人理解)
二、人工智能的發展歷史?熟悉歷史,你才知道,這個基數什么國家發展的早,發展的好。50多年來,人工智能走過了一條起伏和曲折的發展道路。回顧歷史,可以按照不同時期的主要特征,將其產生與發展過程分為5個階段:
(1)孕育期(1956年以前)
普羅米修斯:人類獲取智慧火種的最初努力 (渴望智慧會帶來惡果?)自遠古以來,人類就有用機器代替人們腦力勞動的的幻想:
公元前900多年我國有歌舞機器人流傳的記載;
公元前850年古希臘有制造機器人幫助人們勞動的神話傳說。
亞里斯多德(Aristotle,公元前384 - 322):古希臘偉大的哲學家和思想家,創立了演繹法。他提出的三段論至今仍然是演繹推理的最基本出發點。
萊布尼茨( G.W.Leibnitz,1646 - 1716 ) :德國數學家和哲學家把形式邏輯符號化,奠定了數理邏輯的基礎 (四則運算計算器)。
圖靈( A.M.Turing,1912 - 1954 ) :英國數學家,1936年創立了自動機理論,自動機理論亦稱圖靈機,是一個理論計算機模型。
二戰中,協助英國軍方破譯德國的著名密碼系統Enigma,幫助盟軍取得了二戰勝利 。
莫克利( J.W.Mauchly,1907 - 1980 ) :美國數學家、電子數字計算機的先驅,與他的研究生埃克特(J.P.Eckert)合作,1946年研制成功了世界上第一臺通用電子計算機ENIAC。
1945年底,世界上第一臺電子計算機研制完成,全稱是“電子數字積分計算機”,簡稱為ENIAC。
(2)形成期(1956 - 1970年)
AI誕生于一次歷史性的聚會(Dartmouth人工智能夏季研討會)
時間:1956年夏季
地點:達特莫斯 (Dartmouth)學院
目的:為使計算機變得更“聰明” ,使計算機具有智能
發起人: 麥卡錫(J.McCarthy) ,Dartmouth的年輕數學家、計算機專家,后為MIT教授
明斯基 (M.L.Minsky),哈佛大學數學家、神經學家,后為MIT教授
洛切斯特 (N.Lochester), IBM公司信息中心負責人
香農 (C.E.Shannon),貝爾實驗室信息部數學研究員參加人:
莫爾 (T.more)、塞繆爾 (A.L.Samuel),IBM公司
塞爾夫里奇 (O.Selfridge)、索羅蒙夫(R.Solomonff) ,MIT 紐厄爾 (A.Newell),蘭德(RAND)公司 西蒙 (H.A.Simon),卡內基—梅隆大學
會議結果:麥卡錫提議正式采用了“Artificial Intelligence”這一術語。
心理學小組——一次邏輯訓練的嘗試
1957年,紐厄爾、肖(J.Shaw)和西蒙等人的心理學小組研制了一個稱為邏輯理論機(Logic Theory Machine,簡稱LT)的數學定理證明程序。
1960年研制了通用問題求解(General Problem Solving)程序。該程序當時可以解決11種不同類型的問題,如不定積分、三角函數、代數方程、猴子摘香蕉、河內梵塔、人- 羊過河等。
IBM工程小組——深藍機器人的開發(就是那個同人類下象棋勝利的那個計算機)
1956年,塞繆爾在IBM704計算機上研制成功了具有自學習、自組織和自適應能力的西洋跳棋程序。
這個程序可以從棋譜中學習,也可以在下棋過程中積累經驗、提高棋藝。
通過不斷學習,該程序1959年擊敗了塞繆爾本人,1962年又擊敗了一個州的冠軍。MIT小組 1958年,麥卡西建立了行動規劃咨詢系統。
1960年,麥卡西又研制了人工智能語言LISP。
1961年,明斯基發表了“走向人工智能的步驟”的論文,推動了人工智能的發展。
基本上相當于一幫大拿,在小酒館吃完飯,吹牛逼說:“以后就干AI了”。問題是人家有實力把牛逼實現。
(3)知識應用期(1970 - 20世紀80年代末)
以知識為中心的研究: 專家系統是AI發展史上的一次重要轉折。
1972年,費根鮑姆( Feigenbaum )開始研究MYCIN專家系統,并于1976年研制成功。 從應用角度看,它能協助內科醫生診斷細菌感染疾病,并提供最佳處方。
從技術角度看,他解決了知識表示、不精確推理、搜索策略、人機聯系、知識獲取及專家系統基本結構等一系列重大技術問題。
1972年法國馬賽大學Clomerauer發明Prolog邏輯程序設計語言。
1976年,斯坦福大學的杜達(R.D.Duda)等人開始研制地質勘探專家系統PROSPECTOR。 1970年Artificial Intelligence國際期刊創刊。
1977年費根鮑姆提出知識工程概念,專家系統廣泛應用。
(4)從學派分離走向綜合(20世紀80年代末到本世紀初)
隨著人工神經網絡的再度興起和布魯克(R.A.Brooks)的機器蟲的出現,人工智能研究形成了符號主義、連接主義和行為主義三大學派。
(5)智能科學技術學科的興起(本世紀初以來)
現代人工智能,由對人工智能的單一研究走向以自然智能、人工智能、集成智能為一體的協同研究;
由人工智能學科的獨立研究走向重視與腦科學、認知科學、等學科的交叉研究; 由多個不同學派的獨立研究走向多學派的綜合研究;
由對個體、集中智能的研究走向對群體、分布智能的研究。
總結整個人工智能的發展,可以歸納為:原始的積累基本在歐美,得益于硬件設備,計算機的發明,美國在整個人工智能的起步階段,要比其他國家要早。
同時針對各類社會學模型的研究,美國也要比其他國家要更豐富。
三、當下你能見到的人工智能都是什么樣子的?當下,我們見到的人工智能,主要集中在幾個領域:
1、智能語言,也被我們稱為:語音智能。手機,電腦,小家電可以識別你說話,甚至能夠跟你對話。這個看似很傻瓜的功能,其實就是人工智能。
這些都是語音智能。
2、人臉識別:
3、圖像搜索:識別圖像,人類識別物體的方式
4、OCR識別:圖片轉文字
四、人工智能的核心技術狹義地講,機器學習是給定一些訓練樣本 (xi , yi), 1 ≤ i ≤ N (其中xi 是輸入,yi 是 需要預測的目標),讓計算機自動尋找一個決策函數f(·)來建立x和y 之間的關系。
這里,y?是模型輸出,θ 為決策函數的參數,?(x)表示樣本x對應的特征表示。因為x不 一定都是數值型的輸入,因此需要通過?(x) 將x 轉換為數值型的輸入。如果我們假設x 是已經處理好的標量或向量,公式3.1也可以直接寫為 y? = f(x, θ)
寫到這,基本看不懂,我也是引用的內容。但是問題在于,我還要說明白,人工智能技術的核心是啥?
人工智能的核心的是深度學習。
深度學習,就是用一個模型,教會計算機自己去學習。你只需要做兩件事:
(1)讓無數的碼農去寫優化的代碼,修改BUG。
(2)喂龐大到無法想象的數據。
1、圖像識別: 數千萬訓練樣本,這就是我們說的圖像樣本庫。也許你不知道的情況下,你就成了樣本。
2、OCR: 數千萬訓練樣本;
美國一家公司,將圖書館中的文字書籍,掃描圖片后,切圖,全部以驗證碼的方式,讓各個平臺人錄入數據。這就是最典型的人機訓練。
3、語音識別: 數百億訓練樣本。
語音樣本庫,目前歸國家管理,只有具備條件的企業才有資格使用。國內例如百度,科大訊飛,騰訊,阿里都有資格。
4、無人駕駛
很多朋友,一直不明白,為什么百度,滴滴,騰訊都去爭奪無人駕駛的研發測試。因為先爭門票,有沒票,才有使用龐大道路交通數據的權利。最大的道路實況數據,都在公路交通的監控里。但這個顯然不是對所有人開放的。這才是當前爭搶的關鍵內容。
五、中國人工智能的地位與趨勢從以上我們介紹的四大主要人工智能的場景來看。中國的產品成熟度,以及技術實力,確實達到了全球第一陣營中。
百度無人駕駛,已經開始上路測試。語音智能領域,科大訊飛,百度語言都是世界領先。圖像識別領域:商湯科技,曠視科技,百度智能都具有全球領先水平,基本同google,facebook屬于同一梯隊。
對于未來的人工智能的發展:
1、中國擁有廣闊的使用市場。畢竟有錢才能驅動一切。
2、中國的移動互聯,為人工智能的深度學習,提供了極其強大的訓練資源。是的在5-10年,人類的所有操作其實都是在訓練機器人。
如果從哲學的角度講:人類發展了這么多年,陽光之下無新事,那么人工智能的深度學習,一定能夠創造出一個頂級的智慧體,只是時間的問題。