1用戶真正的需求是什麼(me)
視索引第用戶輸入的查詢請求非常問短, 查詢的平均長(cháng)度是 2.7個單調。如何從如此知的查詢請求裡(lǐ)供知隐藏兒的真實用廣需求7這(zhè)是搜索引擎首需要解決的非常原要的問題。如果不能(néng)在取用戶真正的搜索意圖,搜索的準确性無從談起(qǐ),即使續内容匹配算法再精巧也無濟于事(shì),
從另外,個角度看,即使是同個查詢詞,不同用戶的搜索目的是不同的,如何識别這(zhè)種(zhǒng)差異7如果更進(jìn)步, 即使是間個用戶發(fā)出的網 個查詢詞 也可能(néng)因爲用戶所處場景不同,其目的存在差異,義如何識别?
所有這(zhè)些把是搜索引繁需要解決的核心問題,即用戶在此時此地發(fā)出某個查詢,他的真實搜索意圖到是什麼(me)。
哪些信息是和用戶需求真正相關的?
上述第個核心問題是從用戶需求角度出發(fā)的,另外兩(liǎng)個核心問題則是從數據角度考慮的。搜索引擎本質上是個匹配過(guò)程, 即從海量數據裡(lǐ)面(miàn)找到能(néng)夠匹配用戶需求的内容。 所以,在明确用戶真實意圖這(zhè)個前提條件做到,如何找到能(néng)夠滿足用戶需求的信息則成(chéng)爲關鍵因素。
判斷内容和用戶查詢關鍵詞的相關性,直是信息檢索領域的核心研究課題,不斷提出的信息檢索模型即在試圖解決這(zhè)個問題。相關研究曆時近60年,盡管不斷有方法提出,檢效果總體而言也在逐步改進(jìn),但是這(zhè)個領域的基本指導思想還(hái)是基于關鍵詞的匹配,包括現在所有搜索引擎的相關性計算部分,其基本計算思路和幾十年前相比并無本質差異。
如何能(néng)夠在這(zhè)個核心問題上有所突破?這(zhè)個問題將(jiāng)會越來越重要,而從關鍵詞匹配到讓機器真正理解信息所代表的含義是解決這(zhè)個問題必須邁過(guò)的門檻。從目前來看,盡管包括人I工智能(néng)在内的很多相關研究領域對(duì)此有所進(jìn)展,但是短期内還(hái)未能(néng)看到解決這(zhè)問題的清晰技術思路。
哪些信息是用戶可以信賴的?
搜索本質上是找到能(néng)夠滿足用戶需求的信息,盡管相關性是衡量信息是否滿足用戶需求的個重要方面(miàn),但并非全部,信息是否值得信賴是另個重要的衡量标準。