人類生活的改變源于科技的進(jìn)步,延展人類器官功能極限,改進(jìn)人類器官功能缺陷,提升人類器官功能效率,進(jìn)而創(chuàng)造先進(jìn)工具,改變生活方式。
而科技話題繞不開人工智能,智能家居、自動駕駛、智能安防……它革新了人機(jī)交互方式,升級了人機(jī)交互體驗(yàn),重構(gòu)一個"人、工具、場景"的新世界,敲開了物聯(lián)網(wǎng)時代的大門。
也就是說,人機(jī)交互技術(shù)是鏈接"人與工具"的橋梁,啟動工具動作驅(qū)動場景,它是人工智能至關(guān)重要的第一步,也決定未來生活工具的使用方式!
1、什么是人機(jī)交互技術(shù)?
百度百科詞條解釋為"人機(jī)交互技術(shù)(Human-ComputerInteractionTechniques)是指通過計(jì)算機(jī)輸入、輸出設(shè)備,以有效的方式實(shí)現(xiàn)人與計(jì)算機(jī)對話的技術(shù)。"
2、有哪些AI人機(jī)交互技術(shù)?
說起人機(jī)交互技術(shù),鼠標(biāo)、鍵盤打開了PC時代一維交互大門,觸屏打開了移動互聯(lián)網(wǎng)時代的二維交互大門,而AI時代,語音識別代替耳朵,視覺識別代替眼睛,腦神經(jīng)識別代替大腦,開啟三維交互紀(jì)元!
A、自然語言:語音識別技術(shù)
這是計(jì)算機(jī)科學(xué)領(lǐng)域與人工智能領(lǐng)域中的一個重要方向,研究能實(shí)現(xiàn)人與計(jì)算機(jī)之間用自然語言進(jìn)行有效通信的各種理論和方法,涉及的領(lǐng)域較多,主要包括機(jī)器翻譯、機(jī)器閱讀理解和問答系統(tǒng)等。
也就是轉(zhuǎn)化自然語言數(shù)據(jù)為電腦語言數(shù)據(jù)的技術(shù),可以幫助人類實(shí)現(xiàn)很多操作,如客戶服務(wù)、知識管理和智能搜索。
而人類語言帶來很多便利,也帶來很多誤解,這種不夠完善的語言體系也給機(jī)器識別帶來很多困難!
B、機(jī)器視覺:視覺識別技術(shù)
根據(jù)解決的問題,計(jì)算機(jī)視覺可分為"計(jì)算成像學(xué)、圖像理解、三維視覺、動態(tài)視覺和視頻編解碼"五大類。
而機(jī)器視覺是使用計(jì)算機(jī)模仿人類視覺系統(tǒng)的科學(xué),讓計(jì)算機(jī)擁有類似人類提取、處理、理解和分析圖像以及圖像序列的能力。
同時,深度學(xué)習(xí)的發(fā)展,預(yù)處理、特征提取與算法處理漸漸融合,形成端到端的人工智能算法技術(shù)。
這一技術(shù)應(yīng)用于自動駕駛、機(jī)器人、智能醫(yī)療、智能家居、智慧社區(qū)、智能安防等領(lǐng)域,通過計(jì)算機(jī)視覺技術(shù)從視覺信號中提取并處理信息。
C、人工神經(jīng)網(wǎng)絡(luò):腦神經(jīng)識別技術(shù)
這就不能不提埃隆·馬斯克的"腦機(jī)"項(xiàng)目,也就是"腦機(jī)接口"充當(dāng)神經(jīng)手術(shù)機(jī)器人,將大腦以某種形式與外部設(shè)備連接,實(shí)現(xiàn)腦電波信號與相關(guān)指令信號間的轉(zhuǎn)換,主要分為非侵入式和侵入式兩種形式。
非侵入式是較為穩(wěn)健的、正常人都可以使用的無創(chuàng)技術(shù)。這種技術(shù)類似于醫(yī)院中的腦電圖或者心電圖技術(shù)。貼上電極,從大腦外采集信號,就能夠?qū)崿F(xiàn)對外部設(shè)備的控制。
侵入式指較激進(jìn)的有創(chuàng)技術(shù),需要把電極裝入大腦,或把計(jì)算機(jī)設(shè)備裝在人體里,實(shí)現(xiàn)混合的人類和電子系統(tǒng),而這個設(shè)備或芯片可以讀取大腦神經(jīng)元信號,識別人類大腦意圖,也能夠識別該信號元記憶的某些場景。
該腦機(jī)接口設(shè)備,原則上可以修復(fù)任何大腦問題,包括提升視力和聽覺、恢復(fù)肢體功能、治療老年癡呆癥、檢測并阻止癲癇發(fā)作、治愈中風(fēng)等。同時,他還認(rèn)為人體對該設(shè)備的排異潛在風(fēng)險(xiǎn)非常低。
這技術(shù)還可能存儲人類的記憶,也就意味著人類"永生"的難題將會得到重大的突破,再配合機(jī)器的學(xué)習(xí)能力,人類的"永生"也就再近了一步。
3、AI人機(jī)交互關(guān)鍵技術(shù)有哪些?
未來,基于語音、視覺、腦神經(jīng)的人機(jī)交互囊括了人體核心器官的交互功能,模擬人體的人機(jī)交互過程,包括信息輸入和輸出的交互、語音處理、語義分析、智能邏輯處理以及知識內(nèi)容的整合。
AI人機(jī)交互關(guān)鍵技術(shù)主要,如下:
A、信息采集技術(shù)
包括語音、圖形、腦電波的識別、合成等。
B、輸入信息的處理技術(shù)
包括"語音的發(fā)音、語言、音色、語法等","物體靜態(tài)、動態(tài)的特征、方向、形狀等","腦電波的信號頻率、強(qiáng)度、波形、長短等"分類技術(shù)。
C、意圖分析和理解
包括發(fā)音的特征、動作的含義、電信號的信息的意義體系、機(jī)器推理等。
D、知識構(gòu)建和學(xué)習(xí)體系
包括搜索技術(shù)、網(wǎng)絡(luò)爬蟲、數(shù)據(jù)挖掘、知識獲取、機(jī)器學(xué)習(xí)等技術(shù)。
E、整合通信技術(shù)
包括跨平臺即時通訊整合技術(shù)、超大負(fù)載消息集群處理技術(shù)、移動客戶端開發(fā)技術(shù)。
F、云計(jì)算技術(shù)
包括海量數(shù)據(jù)分布式存儲、統(tǒng)計(jì)和分析技術(shù)。
目前來講,這三大AI交互技術(shù)分別代替耳朵、眼睛、大腦,語音識別、視覺識別、腦神經(jīng)識別是核心交互技術(shù),商業(yè)應(yīng)用也有不同分工,屬于同一賽場的不同賽道。
未來,更有可能是三者歸于統(tǒng)一,形成真正的語音、視覺、腦神經(jīng)融合的人工智能,物聯(lián)網(wǎng)應(yīng)用潛力巨大。