作者:史考特(不在線上)
日期:2013-05-18 10:27
瀏覽:8545
回覆:0
  加入討論   
  

此次在台灣Google協助下,我們在Google I/O 2013期間與Google搜尋工程部門資深副總Amit Singhal做了簡單訪談,針對目前Google Search,以及此次公布更新Knowledge Graph等動態做了詳盡說明,同時提及對於未來搜尋應用的想像。
 
Knowledge Graph技術加入更多語系 更進一步理解世界

目前在Google Search中佔有重要份量的Knowledge Graph技術,主要是以接近人類大腦思考比對模式所進行的搜尋方式,在配合全球使用者每日大量搜尋造就Google Search搜尋「正確性」,加上後端蒐集全球各地所發生大大小小事件事實作為資料比對,藉此輔助系統所推論解答是否能正確對應搜尋者所需。

而目前Google Search已經廣泛地應用在Google旗下每一項產品,包含目前關注極高的Google Glass,以及目前主要推動的「Google Now」使用體驗,因此透過文字、語音或影像等不同方式"告訴"Google所想查找問題,並且在最短時間內找到對應不同使用者需求,並且用最簡單方式"告訴"使用者,目前也成為Google Search最大挑戰。

因此宣布在Knowledge Graph技術中加入包含繁、簡體中文語系、波蘭語系與土耳其語系,對Google Search應用來說也再往前跨進一步,特別是目前全球已有為數不少的中文人口,同時全球經濟體系仍有不少比例放在中國,以及擁有不少OEM廠商、科技技術資源的台灣。加上先前已經支援的英語、法語、德語、義大利語、西班牙語、葡萄牙語、俄語、日語與韓語,也讓使用這些語言的人能以最自然的口說方式透過Google Search查找資訊。


Knowledge Graph新增繁、簡體中文等語系

搜尋最大困難:語言語意差異

根據Amit Singhal表示,在加入Google負責搜尋相關技術設計前,其實自己一直都期待有朝一日能讓《星際爭霸戰 (Star Trek)》劇中充滿高科技的應用在現實中呈現,而讓電腦系統能夠理解人們口語涵意,甚至明白其中用語、口音等差異,並且提供最為正確資料,其實是相當困難的事情。

正如同美國與英國所使用的英語便有些為差異,在不同地區如澳洲所使用的口音、語法可能也跟通用英語有差別,更不用說是語法、語意困難程度更為明顯的中文,以及包含中國地區用語與台灣地區用語的差異。因此Amit Singhal的看法認為,找尋各國家、地區使用語言詞彙差異比對是相當大的挑戰。

而實際完成Knowledge Graph技術系統,其實前後僅花費約一年左右時間,但主要是透過包含源自不同語系國家的龐大技術團隊,以及包含先後累積超過40年左右的語言研究資源,讓搜尋系統可以"理解"不同地區使用者所輸入字詞背後代表涵意,搭配Google Now體驗識別使用者輸入「Kings」時,想知道的會是世界知名國王,還是NBA國王隊目前積分狀況。

如同先前提到Google Search現階段收錄超過5.7億種實質資料來源,以及180億種發生事件,同時在每日搜尋量中,平均約接受5億種從未見過的搜尋內容"新知",同時必須在超過200億組網站找尋對應的"最佳"解答內容,並且以最直覺的方式呈現給使用者。至於部分涉及非法、不好的內容,主要還是以人工方式進行篩選剔除,同時配合前述系統收錄資料與事件記錄比對搜尋內容結果是否適當。

就Amit Singhal本身觀點認為,使用者使用搜尋應該只要當下用自然的方式"提問"即可,後續則是由Google負責將"最佳解答"呈現給使用者知曉,同時無論是透過文字、語音等方式搜尋,最後使用者所獲得解答應該都應該會是一致體驗。

透過演繹法協助問題解答

對於搜尋技術的應用發展,Amit Singhal始終認為Google是站在對的方向,並且提示未來將會以最自然口吻的方式直接提問,而系統將會藉由背後困難的語意辨識、資料比對,並且迅速剔除不適合內容等,最後將適合的解答呈現給使用者。

而目前包含Google Now使用體驗、Google Glass等創新產品都能明顯看見搜尋創新應用,系統非但僅能提供最佳解答,可能還會舉一反三協助使用者挖掘更多的問題解決方案。

如同Google執行長Larry Page堅信能以科學技術解決生活困難,Amit Singhal也同樣認為藉由演繹方式都能順利獲得大多數問題解答。而在此前提中,使用者也必須願意將各類「事實」予以分享,讓Google能在大量資料比對、查找下篩選最佳合適解答,同時剔除不適合呈現內容,如此才能有更為準確的解答反饋給使用者。
 

全文網址udn數位資訊 http://mag.udn.com/mag/digital/storypage.jsp?f_ART_ID=456385#ixzz2TbgoiIq0
 




  加入討論                       
搜尋:
欄位:
類別: