微信里的海量內(nèi)容不會只在小范圍內(nèi)傳播了,它們都可以在搜狗的微信搜索中找到。是什么決定我們在搜索入口看到的內(nèi)容,這背后有著怎樣的產(chǎn)品邏輯與思考?
微博微信Twitter大家可能會經(jīng)歷這樣一個情況,在朋友圈里看到了一篇非常好的文章,當(dāng)時沒有點收藏,幾個月之后突然要找那篇文章,翻了很多朋友圈的文章沒有找到。搜狗的微信搜索就是圍繞用戶的這一痛點而建立的搜索平臺。
用戶需求產(chǎn)生的意義
什么是微信搜索?它既不是搜索微信好友,也不是去搜索朋友圈內(nèi)容的,它主要搜索的是微信公眾帳號以及公眾帳號的文章。包括 PC 端和無線端兩個終端的服務(wù)。
目前搜狗的微信搜索主要提供了公眾號搜索和文章搜索兩個功能。在 PC 端搜索上,搜狗搜索為用戶提供了掃碼一鍵關(guān)注的功能。公眾帳號最近發(fā)表的文章也會展示在搜索結(jié)果頁上。
當(dāng)用戶點擊這個公眾帳號之后,會進入到公眾帳號的詳情頁,其中除了會把公眾帳號認(rèn)證的信息、簡介的信息呈現(xiàn)之外,還會把公眾帳號所有歷史上發(fā)布的文章展示出來。
文章搜索就會更加簡單一些,跟網(wǎng)頁搜索和新聞搜索的展現(xiàn)樣式是比較類似的。
在微信公眾號里,不乏對各個專業(yè)、行業(yè),比較專業(yè)的意見領(lǐng)袖或者自媒體人士,使得這些文章會有很深刻的解讀性和理解。這些對用戶而言,用戶可以從中獲得更廣泛、更深度、更有觀點性的內(nèi)容。
反過來,搜狗微信搜索對微信而言,也有一定的意義。首先,搜狗微信搜索的上線,其實是使微信公眾平臺從一個半封閉的生態(tài)圈轉(zhuǎn)向了開放。這意味著意味著微信公眾帳號以及微信文章的曝光量獲得了極大的提升。
搜狗微信搜索同樣為公眾帳號打擊盜版、保護原創(chuàng)提供了一個工具。由于搜狗平臺的存在,盜版內(nèi)容的生產(chǎn)者,也不會再那么明目張膽的抄襲了。
搜索背后的排序
其實搜索引擎的排序,無非跟相關(guān)性、時效性、權(quán)威性等等因素相關(guān),公眾帳號的排序具有搜索引擎網(wǎng)頁通用的指標(biāo),但它也有自己鮮明的特點。
公眾賬號的排序
首先我們考慮的是文本的相關(guān)性,在公眾號搜索里面,如果公眾帳號的名稱和用戶搜索的內(nèi)容精準(zhǔn)匹配我們會考慮往前排。
同時我們也會考慮權(quán)威性,搜狗的微信搜索中認(rèn)證過的帳號排序肯定會排在非認(rèn)證帳號之前。
除了上面兩點之外,還需要考慮一些熱門性的因素,包括公眾號的粉絲數(shù),公眾帳號發(fā)表文章的閱讀量、轉(zhuǎn)發(fā)率,這些因素從一定程度上能夠反映出來,這個公眾帳號受關(guān)注的程度,以及它的活躍度。上面這些是說,我們目前為止在線上可能用到的一些公眾帳號排序因素。
后續(xù)我們會考慮增加另外一些因素,來優(yōu)化排序效果。包括,我們會計算這個公眾帳號的分類和發(fā)表文章的分類是否對應(yīng)。再往后,也不排除我們會針對不同類別的查詢給出不同排序的策略。
公眾賬號的顯示
對于公眾帳號的搜索結(jié)果在網(wǎng)頁搜索結(jié)果里展示,首先要判斷用戶的查詢是否需要展示公眾號的結(jié)果,這就涉及到用戶查詢意圖的分析。
然后我們會根據(jù)微信公眾號結(jié)果返回的認(rèn)證號數(shù)目以及精準(zhǔn)匹配的數(shù)量,去確定我們以哪種形式展現(xiàn),是展現(xiàn)多條還是展現(xiàn)單條結(jié)果。確定了如何展現(xiàn)之后,接下來就是展現(xiàn)位置。
首先還是要分析用戶的查詢意圖,看用戶的需求是找一個機構(gòu)還是找一個名人,還是說我其實是一個泛類別的需求。
同時,我們也會參考微信返回的搜索結(jié)果效果,看一下返回結(jié)果里認(rèn)證帳號的數(shù)目,精準(zhǔn)匹配的數(shù)目,文本的相關(guān)程度等等。網(wǎng)頁搜索里面其它搜索結(jié)果的排序,也會對我們公眾號的排序起到一定的影響作用。
綜合以上這些因素,我們最終確定了一個公眾帳號在網(wǎng)頁搜索里初始排序的位置,后續(xù)它還會參與網(wǎng)頁搜索點擊調(diào)權(quán)的情況。
文章搜索的排序
文章搜索排序,它更類似于搜索引擎網(wǎng)頁搜索的排序。包括我們之前提到的相關(guān)性、權(quán)威性、時效性、熱門性這些緯度的指標(biāo)。在文章排序里面,會有一個指標(biāo)是比較重要的,或者說反映了我們對微信運營者尊重的,那就是原創(chuàng)性。
我們目前做這種原創(chuàng)性識別還是比較簡單的方式,微信的文章里面會有這么兩類文章:一類是以文本為主的,對于這一類文章我們首先會基于這樣的文章做文章特征的抽取,根據(jù)抽取文章特征做相似度的判斷,然后我們會把相似度高的文章進行聚類,然后去尋找里面發(fā)表時間最早的那篇。
我們知道,在微信里面并不是都是這種文本的文章,還可以看到這種圖片為主的文章,這類文章文本的信息量非常少,有的可能只是純圖片的,還有很多都是 Gif 圖。
這種情況該怎么解決呢?其實開始之前的短片里面也介紹了搜狗識圖技術(shù),那么在這里也會引入搜狗識圖搜索圖片的相似度,判斷兩篇文章是否是相似的或者是否是重復(fù)的。
其實,我們線上對原創(chuàng)的識別做的還不是很理想,但是原創(chuàng)識別這塊工作一定會作為我們未來非常非常重點的工作來開展。其實不僅僅是原創(chuàng)識別,文章和公眾帳號排序的效果,還有待我們持續(xù)的優(yōu)化。
除了這些基礎(chǔ)的搜索品質(zhì)優(yōu)化和改善之外,我們也會思考,搜狗的微信搜索對于用戶而言,對于微信的公眾帳號或公眾平臺而言,它的作用到底是什么呢?是不是就是我之前提到的那幾點呢?
用戶希望搜索到什么
對于公眾帳號而言,用戶最在意的指標(biāo),無非就是粉絲數(shù)、閱讀量、轉(zhuǎn)發(fā)數(shù)這些很 Kpi 的指標(biāo),其實這些指標(biāo)說到底就是一個公眾帳號的影響力。另外,微信公眾帳號的運營,需要很好的推廣平臺。
在真實的微信搜索里,用戶的真實需求是什么呢?我們發(fā)現(xiàn),以下三類查詢會比較突出:首先第一類是和時令相關(guān)的,像中秋啊、開學(xué)啊、教師節(jié)啊、九月啊、秋季養(yǎng)生這些搜索比例比較高。第二類是和用戶興趣比較相關(guān)的,攝影啊、旅游啊、裝修啊,里面還隱藏著一類有商業(yè)價值的查詢,這個量也比較大。
未來,微信搜索的方向,可能會分成對用戶和對微信公眾號和公眾平臺兩個緯度來說。
首先對用戶,我們會從這樣基礎(chǔ)體驗,核心價值和脫離搜索本身的其他服務(wù)展開。
對于公眾帳號也是 3 個方向:除了基礎(chǔ)體驗,不斷提升公眾帳號的影響力,還包括為微信運營者提供服務(wù)平臺,來幫助這些運營者更好的做微信公眾帳號的運營,提升自己品牌的影響力。
本文演講者 韓異凡(搜狗搜索事業(yè)部產(chǎn)品總監(jiān))、整理者 lydiaxin