百度“軟硬雙施”
作 者:肖婧 來(lái) 源:商學(xué)院發(fā)表日期:2015-02-09
2015年,“百度大腦”正在人工智能軍備競(jìng)賽中的全面沖刺。“過(guò)去20年里人們已經(jīng)看到人工智能的正循環(huán):如果你有一個(gè)好的產(chǎn)品,你就會(huì)得到大量用戶,有了大量用戶你就會(huì)有大量數(shù)據(jù),這些大量數(shù)據(jù)用于人工智能算法,你的產(chǎn)品就會(huì)更好。但是,傳統(tǒng)的人工智能算法的問(wèn)題在于:當(dāng)你給他更多數(shù)據(jù),效果并不一定一直變好,而百度大腦的新算法是適度學(xué)習(xí),當(dāng)你給他更多數(shù)據(jù),效果變得越來(lái)越好。”吳恩達(dá)表示。2014年1月,百度CEO李彥宏宣布將建立公司歷史上首個(gè)前沿科學(xué)研究機(jī)構(gòu)——深度學(xué)習(xí)研究院(Institute of Deep Learning,IDL)。5月,百度在硅谷設(shè)立人工智能中心,并聘請(qǐng)了前Google人工智能部門創(chuàng)始人之一——吳恩達(dá)(Andrew Ng)擔(dān)任負(fù)責(zé)人。吳恩達(dá)是世界三大人工智能專家之一,并且是三人中最年輕的一個(gè)。另兩個(gè)是杰夫·辛頓(Geoffrey Hinton)和伊恩·勒坤(Yann LeCun)目前分別受聘于谷歌和Facebook。吳恩達(dá)近日在接受采訪時(shí)稱,目前百度的IDL團(tuán)隊(duì)主要攻關(guān)的是語(yǔ)音和圖像識(shí)別,并兼顧BaiduEye等智能硬件的進(jìn)一步研究探索。“在移動(dòng)互聯(lián)網(wǎng)的時(shí)代,用戶需要用更自然方式使用互聯(lián)網(wǎng),所以大數(shù)據(jù),語(yǔ)音、圖像、自然語(yǔ)言的處理以及用戶用自然方式找到服務(wù)至關(guān)重要,而擁有海量數(shù)據(jù)和人工智能新算法的百度大腦已經(jīng)有能力使人工智能正循環(huán)越滾越快。”吳恩達(dá)說(shuō)。
搜索回歸“說(shuō)”與“看”的原生世界 隨著移動(dòng)互聯(lián)網(wǎng)的發(fā)展,搜索給了用戶新的可能性。李彥宏在2014年百度世界大會(huì)上透露,未來(lái)五年語(yǔ)音和圖像搜索會(huì)超過(guò)文字。“目前百度10%的搜索請(qǐng)求來(lái)自語(yǔ)音搜索,一天可以最高達(dá)到500次,其中400次以上的語(yǔ)音搜索來(lái)自兒童。” 李彥宏解釋說(shuō),語(yǔ)音是一個(gè)更加自然的表達(dá)需求的方式。“文字的歷史大約只有5千多年,但語(yǔ)音的歷史至少有20萬(wàn)年,它是一個(gè)更加自然且低門檻的表達(dá)方式,一個(gè)兒童在還不會(huì)打字的時(shí)候,就已經(jīng)可以用語(yǔ)音來(lái)表達(dá)他的搜索需求了。”李彥宏舉了一個(gè)語(yǔ)音搜索的案例:“‘7年前姐姐的年齡是妹妹的4倍,7年后姐妹倆的年齡之和是48歲,姐姐今年多少歲?’以上語(yǔ)音搜索內(nèi)容可以推測(cè)是一個(gè)小學(xué)二年級(jí)的學(xué)生輸入的。反觀如果使用文字輸入的話,所需的時(shí)間可能比算出答案還要長(zhǎng),很可能干脆不去搜索了。”“說(shuō)”之外,“看”有著更豐富的形式——圖片。現(xiàn)在的百度同時(shí)也支持拍照搜索,或是用一個(gè)圖片去找相似的圖片。“一個(gè)人在學(xué)會(huì)語(yǔ)言之前,是先用眼睛認(rèn)知世界的。圖片搜索推出后,很多用戶都開始用這種更自然的方式來(lái)向百度表達(dá)需求。”李彥宏談到,其實(shí)表達(dá)需求最多的一個(gè)類型是跟生活方式相關(guān)的,購(gòu)物需求的圖片搜索占到了35.5%,比如把一個(gè)包拍下來(lái)看看網(wǎng)上哪有賣。”可以這樣說(shuō),搜索技術(shù)的門檻一直在上升,從文字到語(yǔ)音再到圖片,而使用者的門檻一直在降低,即使一個(gè)嬰兒也可以用他的眼睛來(lái)表達(dá)需求。“未來(lái)5年,我認(rèn)為使用語(yǔ)音和圖片搜索的請(qǐng)求量會(huì)超過(guò)純文字的需求量。”過(guò)去一年百度語(yǔ)音方面的探索取得巨大進(jìn)展。目前,百度搜索中有10%為語(yǔ)音搜索,此外如地圖定位和百度語(yǔ)音助手都有百度在語(yǔ)音上的成果,圍繞語(yǔ)音界面重新設(shè)計(jì)移動(dòng)產(chǎn)品,推動(dòng)物聯(lián)網(wǎng)的革命,讓汽車界面、家用設(shè)備、可穿戴設(shè)備都離不開語(yǔ)音。
李彥宏的新大陸 “開放云”“數(shù)據(jù)工廠”和“百度大腦”被稱為李彥宏的新大陸。百度高級(jí)副總裁王勁介紹,百度的大數(shù)據(jù)引擎由這三項(xiàng)核心大數(shù)據(jù)能力組成。此前百度在公布“百度大腦”項(xiàng)目時(shí),宣布該項(xiàng)目已能模擬人腦的200億個(gè)神經(jīng)元,達(dá)到兩三歲孩童的智力水平——這意味著百度的進(jìn)度在不聲不響中做到了全球領(lǐng)先。以算法為基礎(chǔ)的“百度大腦”則是人工智能、深度學(xué)習(xí)的代表,目前百度人工智能方面的能力已經(jīng)開始被應(yīng)用在語(yǔ)音、圖像、文本識(shí)別,以及自然語(yǔ)言和語(yǔ)義理解方面,“等于(機(jī)器)有了眼睛、耳朵、嘴巴。”王勁說(shuō)。當(dāng)你被一片不認(rèn)識(shí)的美麗花田傾倒,在過(guò)去只能是拍下照片就沒(méi)有“然后”了,現(xiàn)在通過(guò)照片,百度大腦讓你既知道花名,還能得到服務(wù):百度百科告訴你這個(gè)花名及它的相關(guān)屬性,同時(shí)百度直達(dá)號(hào)幫你找到離你最近的有這種花賣的花店。王勁表示,受益者還有商家,“對(duì)于花店來(lái)說(shuō),過(guò)去只能是有顧客來(lái)到店里,才能把花賣出去,現(xiàn)在整個(gè)大自然都是它的櫥窗,商家能夠非常準(zhǔn)確地捕捉商機(jī)。”大家都有這樣的經(jīng)歷,在某個(gè)地方突然聽到一首非常好聽的歌, 想知道這是什么歌?是誰(shuí)唱的歌?“這時(shí)你只要拿起手機(jī),百度大腦就會(huì)告訴你。如果你是喜歡音樂(lè)的人,可以通過(guò)百度直達(dá)號(hào)到音樂(lè)網(wǎng)站下載這首歌;如果你是歌手的粉絲,直達(dá)號(hào)會(huì)告訴你:比如過(guò)兩天他要到你所在的城市開演唱會(huì),同時(shí)你可以找到對(duì)應(yīng)的票務(wù)公司下單并選定座位。”王勁說(shuō)。除了更好地滿足娛樂(lè)相關(guān)的訴求,百度大腦還能對(duì)我們生活中更重要的事情起到幫助,比如老百姓特別關(guān)心的醫(yī)療。“我們最近跟醫(yī)療行業(yè)有了很多的合作,比如目前百度和祥云醫(yī)院有了一個(gè)初步的合作——在網(wǎng)上提供皮膚病的預(yù)診。”王勁談到,過(guò)去一個(gè)新生的小寶寶皮膚出了問(wèn)題,年輕的父母會(huì)非常焦慮,他們不知道這個(gè)問(wèn)題有多大、多嚴(yán)重、多緊急,也不知道他們應(yīng)該做什么樣的應(yīng)急處理。而今只要把患病部位用手機(jī)拍照并上傳到百度,就可以得到一個(gè)預(yù)診的診斷。“現(xiàn)在預(yù)診的準(zhǔn)確率已經(jīng)達(dá)到93%了,雖不足以成為一個(gè)正式的醫(yī)療的結(jié)果,但可以第一時(shí)間幫助這些父母做初步的處理建議,同時(shí)也能幫助他們解決之后去找什么樣的專家來(lái)治療孩子的問(wèn)題。百度大腦能夠把一個(gè)線下服務(wù)和患者對(duì)接起來(lái)。”“除了看得見的服務(wù)器和云計(jì)算中心,更重要的是背后看不見的被稱為‘深度學(xué)習(xí)‘的人工智能算法。”王勁解釋說(shuō),把普通的CPU服務(wù)器、ARM服務(wù)器和GPU的服務(wù)器整合在一起,構(gòu)成大規(guī)模的集群,把它用在人工智能的算法的時(shí)候,整個(gè)計(jì)算的能力、存儲(chǔ)的能力達(dá)到了一個(gè)新的高度。“我們用這個(gè)集群打造了世界最大規(guī)模的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),它和傳統(tǒng)機(jī)器的區(qū)別在于:傳統(tǒng)機(jī)器的學(xué)習(xí)只是一味擴(kuò)大它的數(shù)據(jù)規(guī)模,且層次只有一層,而深度學(xué)習(xí)的算法更好地模擬人類大腦的思維和學(xué)習(xí)過(guò)程,能夠處理更復(fù)雜的事務(wù)。”王勁表示,把百度大腦的人工智能技術(shù)和百度的大數(shù)據(jù)結(jié)合,能夠找到以前所不知道的規(guī)律,從而嘗試做一些對(duì)于未來(lái)的預(yù)測(cè)。“現(xiàn)在我們已經(jīng)能夠?yàn)橹袊?guó)疾控中心提供流行病的預(yù)測(cè)。另外,我們還能夠預(yù)測(cè)兩星期內(nèi)國(guó)內(nèi)各個(gè)城市的旅游熱度,讓旅游者更好地規(guī)劃出游,也能幫助相關(guān)單位做好宏觀調(diào)控。”2014年6月,百度甚至還和全球另4家高科技公司——谷歌、雅虎、微軟、高盛對(duì)世界杯的結(jié)果進(jìn)行了預(yù)測(cè)競(jìng)賽,結(jié)果它的準(zhǔn)確率是最高的。
另一個(gè)商業(yè)化觸角:智能硬件 基于“百度大腦”的技術(shù)支撐,百度世界大會(huì)上發(fā)表了多款智能硬件,其中以BaiduEye和百度“筷搜”最吸引眼球。“百度筷搜”被李彥宏認(rèn)為是“新的感知世界的方式,是用戶和消費(fèi)者表達(dá)需求的方式”。BaiduEye是百度研究院副院長(zhǎng)余凱帶領(lǐng)的IDL(深度學(xué)習(xí)實(shí)驗(yàn)室)牽頭研發(fā)的智能穿戴設(shè)備,它的噱頭是“無(wú)需屏幕,隔空辨物”——沒(méi)有眼鏡屏幕,佩戴者只需要用手指在空中對(duì)著某個(gè)物品畫個(gè)圈,或者拿起這個(gè)物品,BaiduEye即可通過(guò)這些手勢(shì)獲得指令,鎖定該物品并進(jìn)行識(shí)別和分析處理。比如:你在街上看到別人身上好看的某款衣服時(shí),手指輕輕一圈,BaiduEye會(huì)立即根據(jù)衣服特征,搜索到相關(guān)品牌以及最近的銷售促銷信息等;你在博物館欣賞一個(gè)瓷瓶時(shí),BaiduEye會(huì)在耳邊講述瓷瓶的歷史知識(shí);你看到一棵不知名的植物時(shí),BaiduEye會(huì)告訴你它的名稱、產(chǎn)地、生活習(xí)性等信息;你如果要去某一個(gè)地方,BaiduEye將判斷你所處的位置迅速找到最佳路線,并啟動(dòng)語(yǔ)音導(dǎo)航。“BaiduEye不是眼鏡,而是人眼的自然延伸,讓人具有‘看到即可知道’的能力,因?yàn)闆](méi)有屏幕遮擋,戴著它的人也更加輕松,不會(huì)因?yàn)橛醚圻^(guò)度而感到困乏。” 負(fù)責(zé)研發(fā)BaiduEye產(chǎn)品的IDL工程師解釋說(shuō)。據(jù)余凱介紹, BaiduEye是一款連接線上與線下、針對(duì)O2O場(chǎng)景的產(chǎn)品,目前它的使用場(chǎng)景專注在兩個(gè)方面:商場(chǎng)購(gòu)物和博物館游覽。余凱以合作的銀泰百貨為場(chǎng)景描述:你來(lái)到銀泰,佩戴上BaiduEye就可以隨時(shí)搜索貨架上商品的信息以及網(wǎng)絡(luò)上對(duì)這個(gè)商品的評(píng)價(jià),BaiduEye會(huì)記錄下你的年齡、性別、你放棄和購(gòu)買了哪些商品、在哪一些貨架停留的時(shí)間最長(zhǎng)……在這些信息的基礎(chǔ)上,向你推薦相關(guān)商品和打折信息,甚至根據(jù)你已經(jīng)購(gòu)買的上衣推薦搭配的褲子——它就在這家商場(chǎng)的另外一家門店出售。“我們目前主要考慮的是to B的環(huán)境。BaiduEye的圖像識(shí)別都是通過(guò)百度大腦來(lái)完成的,它可以在后臺(tái)進(jìn)行大量的數(shù)據(jù)分析,再推送到BaiduEye中。商店一般在收銀的地方都有一個(gè)小貨架,讓你在排隊(duì)結(jié)賬的時(shí)候再買點(diǎn)東西,而使用了BaiduEye的商家則可以根據(jù)你在整個(gè)店面里所有的關(guān)注行為,為你提供一個(gè)你私人定制離店貨架。”余凱還透露,百度投資了一家室內(nèi)定位的公司,通過(guò)和手機(jī)結(jié)合,BaiduEye可以為顧客提供語(yǔ)音室內(nèi)導(dǎo)航,同時(shí)讓商家知道消費(fèi)者在這個(gè)商場(chǎng)里面的走動(dòng)軌跡。“銀泰可以通過(guò)數(shù)據(jù)進(jìn)行商業(yè)決策,比如怎么安排消費(fèi)者在商場(chǎng)的路線,把到商場(chǎng)里面的購(gòu)買行為全部打通,未來(lái)購(gòu)物體驗(yàn)會(huì)非常不一樣。”銀泰商業(yè)CEO陳曉東表示,BaiduEye解決了傳統(tǒng)零售體驗(yàn)中消費(fèi)者和商戶都“看不見”的問(wèn)題:用戶不知道眼前的商品是不是新品、是否打折、價(jià)格、做工、原料;商戶不知道用戶的喜好、信息和消費(fèi)記錄。“有了BaiduEye,這些數(shù)據(jù)都可以雙向沉淀下來(lái)。”如果說(shuō)BaiduEye是一款相當(dāng)前衛(wèi)的產(chǎn)品,那百度“筷搜”可以說(shuō)是令千百萬(wàn)關(guān)注食品安全問(wèn)題的中國(guó)消費(fèi)者翹首以待的一款產(chǎn)品:它底端集成了四顆傳感器,分別可以監(jiān)測(cè)油脂、鹽分、PH值和溫度。“如果發(fā)現(xiàn)了地溝油,或者水質(zhì)有問(wèn)題,筷子頂端的紅燈就會(huì)閃亮起來(lái),”“筷搜”產(chǎn)品經(jīng)理解釋說(shuō),“其他更多的信息會(huì)通過(guò)藍(lán)牙和手機(jī)同步”。“筷搜”與普通筷子的重量沒(méi)有明顯區(qū)別,充電通過(guò)一個(gè)“筷籠”:茶杯大小,搭上去就可以充電。“筷籠還有更神奇的作用,可以識(shí)別放在上面的食材成分。”“筷搜”工作原理相當(dāng)于建立了食品健康的大數(shù)據(jù)分析庫(kù),基于云計(jì)算,將采集到的數(shù)據(jù)進(jìn)行實(shí)時(shí)分析,轉(zhuǎn)化為各項(xiàng)食品安全指標(biāo)。但它的實(shí)用性卻遭到不少業(yè)內(nèi)人士的質(zhì)疑,百度方面隨后承認(rèn)了這一點(diǎn),稱目前地溝油檢測(cè)的成功率還比較低。“‘筷搜’主要是想讓大家理解大數(shù)據(jù)未來(lái)能做到什么。”“筷搜”產(chǎn)品經(jīng)理說(shuō)。在“百度筷搜”的背后,是百度圍繞“百度大腦”人工智能逐步打造智能硬件生態(tài)的野心。智能化之后,硬件具備連接的能力,實(shí)現(xiàn)互聯(lián)網(wǎng)服務(wù)的加載,形成“云+端”的典型架構(gòu),具備了大數(shù)據(jù)等附加價(jià)值。“因?yàn)榘俣葘?duì)數(shù)據(jù)和基礎(chǔ)設(shè)施的投資,讓我們有能力利用人工智能進(jìn)行互聯(lián)網(wǎng)的轉(zhuǎn)型,正所謂,贏得人工智能就贏得互聯(lián)網(wǎng)。”吳恩達(dá)說(shuō)。BaiduEye不是眼鏡,而是人眼的自然延伸,讓人具有“看到即可知道”的能力,因?yàn)闆](méi)有屏幕遮擋,戴著它的人也更加輕松,不會(huì)因?yàn)橛醚圻^(guò)度而感到困乏。