所謂的語(yǔ)音識(shí)別技術(shù),簡(jiǎn)單的說(shuō)就可以用一句話來(lái)概括:將語(yǔ)音轉(zhuǎn)化成文字的技術(shù)。
當(dāng)然如果要展開(kāi)說(shuō)的話,可能說(shuō)三天三夜都說(shuō)不完。先說(shuō)一說(shuō)語(yǔ)音識(shí)別的典型應(yīng)用都有什么。
第一個(gè)最典型也是最常見(jiàn)的應(yīng)用就是輸入法,所謂的語(yǔ)音輸入法?,F(xiàn)在幾乎所有的主流輸入法都支持語(yǔ)音輸入。比如說(shuō)搜狗輸入法,訊飛輸入法,百度輸入法等等。你在使用這些輸入法的時(shí)候按住空格鍵,然后對(duì)著麥克風(fēng)說(shuō)話,輸入法就會(huì)自動(dòng)的把你說(shuō)的每一句話,每一個(gè)詞每一個(gè)字都轉(zhuǎn)化成文字。如果你的普通話說(shuō)的非常標(biāo)準(zhǔn)的話,你會(huì)發(fā)現(xiàn)你在手機(jī)上的打字效率變得非常之高,甚至超越了你在電腦上的打字速度。
第二個(gè)比較典型的應(yīng)用,但是普通人平時(shí)見(jiàn)得比較少的,是在司法機(jī)構(gòu)的速記,當(dāng)然凡是需要速記的地方應(yīng)該都會(huì)需要這種應(yīng)用。過(guò)去有一種工作叫速記員,他們?cè)谟行枰獙⒄勗拑?nèi)容,會(huì)議內(nèi)容記錄下來(lái)的場(chǎng)合,發(fā)揮自己超強(qiáng)的打字天賦,將語(yǔ)音的內(nèi)容通通的記錄成文字。當(dāng)然這對(duì)人的打字速度要求非常之高,于是語(yǔ)音識(shí)別技術(shù)就非常順理成章地應(yīng)用在了這個(gè)領(lǐng)域。有了這個(gè)技術(shù),速記員只需要將已經(jīng)被機(jī)器轉(zhuǎn)化成的文字進(jìn)行校對(duì)即可。
當(dāng)然語(yǔ)音識(shí)別技術(shù)還有很多很多其他的更不太常見(jiàn)的應(yīng)用,只要需要將語(yǔ)音轉(zhuǎn)化成文字的地方都會(huì)用到。
有的人會(huì)問(wèn),為什么需要將語(yǔ)音轉(zhuǎn)化成文字呢?因?yàn)樵谟?jì)算機(jī)領(lǐng)域,語(yǔ)音是一種模擬信號(hào),既不利于保存,也不利于進(jìn)行分析,尤其是不利于進(jìn)行分析。如果能夠?qū)⒄Z(yǔ)音這種模擬信號(hào)轉(zhuǎn)化成文字,那么利用已經(jīng)非常成熟的大數(shù)據(jù)技術(shù),就可以進(jìn)行更深度的挖掘和分析,甚至于進(jìn)行下一步的相關(guān)的人工智能應(yīng)用,比如自然語(yǔ)言理解方面的應(yīng)用。
最后再說(shuō)一下,現(xiàn)在的語(yǔ)音識(shí)別技術(shù)已經(jīng)發(fā)展到什么程度了。建議每一個(gè)人都使用自己手機(jī)上的語(yǔ)音輸入法試一下,看看精度如何。作為人工智能領(lǐng)域最成功的商業(yè)化案例之一,語(yǔ)音識(shí)別技術(shù)正在被卻來(lái)越多的應(yīng)用在日常生活當(dāng)中的方方面面。
如果還有其他的有關(guān)人工智能的問(wèn)題,請(qǐng)關(guān)注我并私信留言。我將為大家一一解答。