Google是如何做移動搜索的(下)

0 評論 5087 瀏覽 4 收藏 15 分鐘

長久以來Google的旗艦產(chǎn)品已成為我們生活的一部分。但Google并不認為搜索理所當然就應該是那樣的。此文編譯自《In The Plex : How Google thinks, Works, and Shapes Our Lives》作者Steven Levy的文章,是有關Google搜索變革研究的第一部分。

Google是如何做移動搜索的(上)

語音搜索

在意識到移動技術(shù)即將變得無所不在后,Google 決定對搜索進行一個微妙但同時又是巨大的變動。它不再把查詢視為提交給計算機系統(tǒng)的指令,而是把所有的輸入當作是對話。而在這里面,交互方式比輸入更自然的語音將起到非常重要的作用。

這種改變并不僅僅是搜索引擎處理查詢方式的改變,也需要用戶在思想上做出改變。就像以前 Google 教育用戶要以查詢的方式組織搜索一樣,現(xiàn)在 Google 需要用戶以對話的方式進行思考。不過顯然后面這種方式并不需要太多的教育,因為這是我們自然的交互方式。

實現(xiàn)這一變動需要兩方面的舉措。首先是搜索引擎必須更仔細地傾聽,甚至要解析含糊不清的語音輸入,這種能力此前只有人類才具備。然后 Google 還需要確保人對著手機說話或在搜索框輸入口語化文字時系統(tǒng)知道人在說什么。

Google 攻關語音識別技術(shù)已有好些年頭。2000 年代中期時,Google 曾推出過一個名為Google 411的 服務,做的事情跟電話公司一樣,就是給客戶提供電話查詢系統(tǒng),不同的是后者是付費的。而 Google 的收獲是通過數(shù)百萬的免費電話學習如何正確解析多語種多口音的語音。但是 Google 無法獲得其所需的 2500 條短語在一部分地區(qū)的樣本,于是 Google 就直接派人去到哪些地方采樣。

付出終于獲得回報—Google 搜索可兼容 159 種語言,而語音搜索現(xiàn)在已能識別其中的 59 種。公司宣稱,其“單詞錯誤率”已經(jīng)降到了 8%。

Amit Singhal 的副手 Ben Gomes 以自己為例演示了 Google 取得的里程碑式進展。這位印度出生的工程師發(fā)音不太標準,在上述行動前,他是沒有機會親自演示 Google 的語音識別能力的,以往 Google 都是派一位發(fā)音純正深受機器青睞的專家來做演示的。不過現(xiàn)在 Gomes 跟那位家伙已經(jīng)失去了聯(lián)系。“他已經(jīng)變得可有可無了。我就可以做演示。哪怕你讓我站在記者前進行查詢我也不怕。”

此外,Google 還需要考慮讓手機給人回話。它應該用哪一種嗓音呢?像Siri那樣擬人化?還是用一種可辨識的機器人語音來讓用戶意識到對自己正在跟系統(tǒng)(而不是人造人)對話?Google選擇了后者。其首席搜索設計師 Wiley 說,為了避免造成與有意識的實體對話的幻覺,你需要自動化一種皮克斯級的敘事能力?!拔艺J為我們與計算機可以喚起人性到人類感到舒服的地步仍有很長一段距離?!?/p>

但是技術(shù)的發(fā)展很快,足以為 Google 提供一種高級的語音交互能力。Gomes 認為,語音識別能力的提高得益于計算機的處理速度變快、硬件變好以及軟件算法的改進,但是最大的變化是 Google 對語言的理解能力提升了。

頭銜為搜索部門“著名研究科學家”的 Fernando Pereira 研究自然語言處理(NLP)已有 30 個年頭。過去幾年,在如何將搜索查詢與網(wǎng)上的文檔及其他信息集匹配上 Google 已經(jīng)解決得相當好,但是像 Knowledge Graph 這樣得數(shù)據(jù)庫的引入給搜索引擎帶來機遇的同時也帶來了挑戰(zhàn)。Pereira 說:“你使用的語言是否與數(shù)據(jù)庫的設計方式匹配變得更加難以判斷?!?/p>

比方說,Google 會收到這樣的查詢:“巨人隊在哪里打比賽?”雖然是短短的一句話,但引擎需要了解大量信息:這涉及到了體育,某支隊伍打的是主場等等。然后它還得做出選 擇,這里指的是棒球隊還是橄欖球隊?用戶是想知道這支隊伍的主場體育場還是像了解它下周去哪里打比賽?Google 通過信號和此前的用戶行為去構(gòu)建答案。這些理解、判斷、推理都是幾年前 Google 沒有做過的。

一旦清除了這些障礙,Google 的 NLP 系統(tǒng)就能從知識圖中獲得更大的推力,開始逐漸理解世界。包括在用戶措辭不佳甚至表達混亂的情況下揣摩用戶想問什么。比方說用戶在手機上輸入“戴維?卡梅 倫”時系統(tǒng)已經(jīng)知道這兩個詞是配對的,知道這是一個人—然后賦予代詞“他”。哪怕麥克風捕捉不到姓氏,知識圖也能斷定這位英國總理是主題。

Google懂得越多,就能更好地理解你

2004 年,我問 Larry Page 和 Sergey Brin 對搜索的長期愿景是什么。Larry說,搜索應該被包含進人的大腦里?!爱斈闼伎寄臣|西時如果不太了解的話,你可以自動獲得信息。” Sergey 指出,關鍵點在于:“你有對話的設備,或者留意周圍發(fā)生的事的計算機,從而可以提供有用的信息。”

2010 年,兩位 Android 工程師 Baris Gultekin 和 Andrew Kirsme 倒騰的一個“20%(注:Google 的 70/20/10 時間分配原則)”項目跟這一愿景的精神非常一致,于是就誕生了后來的 Google Now。

根據(jù) Gultekin 的說法,目前的 Google Now 與他們最初的設想也保持著高度的一致?!捌浜诵挠^點是你現(xiàn)在的手機并不智能,但是是可以做到智能的,”他說:“如果我們能夠把可感知、可連接的強大設備與 Google 的威力結(jié)合到一起的話會怎樣?”

換言之,Google Now 可回答你太懶或沒時間問的查詢。這意味著要通過多領域信息的結(jié)合來處理某件重要的事。Gultekin 說一開始要建立這樣一套系統(tǒng)去做這樣的事是很恐怖的,但他和伙伴先把目標分解成一個領域,通勤。但即便這樣一件有限的事情也需要系統(tǒng)具備大量的知識:家和 辦公室的位置,最佳往返路線,交通模式。當然,Google Maps(以及后來的 Waze)知道如何導航是關鍵。Google 調(diào)用所有的力量去增強這一搜索工具。不久之后,他們有了一款可靠的 app 來幫助通勤者?!安贿^我們不希望這只是一款通勤 app,” Gultekin 說:“我們希望它成為一位主動的助手,能幫助處理很多事情?!?012 年 7 月,Google Now 發(fā)布,當時具備 7 個領域知識:通勤、飛行、體育、附近地方、旅游、公交以及天氣?,F(xiàn)在 Google Now 的領域已經(jīng)增加到 70 個,且還在快速增長?!拔蚁M?Google Now 能夠提供你所需的大部分信息,其他的 app 只有在 Google Now 沒有你所需的東西時才用,” Gultekin 說。

Google Now的效率取決于對世界的深度知識(這個Google搜索和知識圖可以提供)與大量個人信息的整合。這正是為什么有人會提出搜索的這個子集實際上是 Google 本身的借代:每次它都會提供一張即時信息“卡片”。Google Now 吸收了一大批的 Google 服務。一張典型的卡片往往結(jié)合了個人郵件、日程表、通信錄、交通安排、交通信息以及天氣等信息。

大家往往不知道 Google Now 是做什么的,直到它做了。比方說,你停車時,Google Now 會記錄下你停止行駛了,并記住你在什么地方離開了車子—以防你忘了車子停在哪里。如果郵件告訴 Google Now 你在找房子,它可能就會推送一些你希望居住地區(qū)的待售房產(chǎn)。

隨著 Google Now 的不斷演變,現(xiàn)在它已經(jīng)從 20% 項目變成了全職服務。不過給 Google Now 的發(fā)展提供最大動力的也許是蘋果。2011 年,蘋果發(fā)布了 Siri,給 Google 總部造成了一點點的恐慌,從而加大了這一語音助手項目的投入。隨后它變成了搜索部門的官方組成部分,盡管團隊仍同時分屬搜索和 Android。當然這種安排也是合適的,除了推送給用戶的非查詢消息外,所有的個人信息最終都會為登錄用戶的搜索框所利用(目前可做到“送我上班要多 久?”很快將實現(xiàn)“我的車在哪里?”)。搜索和 Google Now 非常具有互補性,Gultekin 說:“我們希望在你開始搜索前就提供信息,但還是會有很多情況是我們不知道的,比方說你的水管爆了,你需要管道工。” (當然,未來通過 Google 收購的智能家庭平臺 Nest,Google 有可能會知道這一點的。)

與舊版搜索相比,Google Now化的搜索只有在使用全系Google產(chǎn)品時才能發(fā)揮最大效用。 “Larry 有個說法—‘搜索應該理解你的意思并提供你想要的東西,’” Yehoshua 說:“這是一個 Google 生態(tài)體系—如果你登錄手機和桌面,我們可以利用這一點。如果你希望獲得飛行信息,跟蹤包裹以及任何我們可從 Gmail 獲得的信息,你都可以得到。如果你不用 Gmail(當然你不會),你仍然可以獲得我們豐富的語音和回答等等?!?/p>

沒有繞行方式—如果你想用 Google,但 Gmail 不是你的首選,那就無法獲得 Google Now 或甚至 Google 搜索的全部價值。“生活在一個我們能夠分享所有這些信息的世界里將是非常美好的,” Yehoshua 說:“我不認為明天就會實現(xiàn)。蘋果做起來會好點,但我們實現(xiàn)會更加困難?!?/p>

Google有意識地不把Google Now當作獨立產(chǎn)品。相反,它把Now包含進搜索app里面。而app本身也不叫“搜索”,很簡單,就叫“Google”。這種取名方式不僅說明了搜索與Google關系之緊密,也說明了Google Now對公司的重要。

盡管如此,Google Now 組件還是可選的。使用前 Google 會提出隱私方面的警告,而該產(chǎn)品的無所不知也可能會成為令人不安的提醒器,告訴我們這家巨頭對我們的了解有多少。Google 掌握我們的個人信息越多,它惹上的麻煩也越多—尤其是在歐洲,加強監(jiān)管、巨額罰款甚至解體威脅一個沒落,其服務我們的抱負也許會被對隱私的擔憂挫敗。哪怕 是那些相信 Google 的人,在斯諾登披露政府如何輕易獲得我們的信息之后也無法淡定了。如果 Google Now 知道你在哪里停的車的話,當?shù)氐那閳髾C構(gòu)是不是也一樣知道?

Amit Singhal 認為,第一代搜索是在人與遠端機器的交互之間隔著一道墻。而我們逐步進入的搜索新時代將會打破這堵墻,這與把移動設備當作電子人化的附體是同步的。我們預 期手機會知道我們的意思。我們預計搜索既精通于提供包含我們個人信息的答案,又能從網(wǎng)頁、文檔及公共數(shù)據(jù)庫中挖掘事實。

我把搜索視為一切計算的接口,”Singhal 說:“設備消失或最小化或融入環(huán)境之后,你又如何跟它們交互呢?因為大多數(shù)時候,你需要采取行動—或者簡單如播放音樂,或者復雜點,寫備忘錄提醒自己來到 小賣部附近時記得買牛奶?;蛘吣銜小依掀诺暮桨嗍欠駵蕰r?’或者“奧巴馬有多高?”之類的問題”

大家也許會把過去當作理所當然—抱怨 Google 搜索已經(jīng)不像以前那樣。但 Singhal 指出,Google 搜索已經(jīng)越過了那道橫亙在他面前幾十年的障礙?!白鳛橐幻芯咳藛T我攻關了 20 年都沒有成功,”Singhal 說。他指的就是他的團隊在 Google 搜索上面所取得的成就。但他也承認,還有比現(xiàn)在多得多的問題有待解決。但在描述某類他不再失敗的查詢背后的科學時,他的聲音充滿了自豪。對了,那個問題就 是:

天為什么是藍的?

原文來自:36KR

本文編譯自:medium.com

更多精彩內(nèi)容,請關注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!