【7哥導讀】本文是《揭秘淘寶搜索》系列文章的第一篇,主要介紹了搜索的特點,系列文章的規劃,以及淘寶搜索的歷史和變化。可以作為了解淘寶搜索的入門級的文章,不懂搜索的人也能看得懂,懂搜索的人可以有更整體的概念。

寫在前面

終於要開始寫揭秘淘寶搜索的文章了,2013年1月自媒體”鬼腳七”剛開始的時候,我說如果微信”鬼腳七”粉絲數達到10萬,我就開始寫《揭秘淘寶搜索》,在這個賬號中連載,沒想到很快就到了。當時我還在負責淘寶搜索的產品,現在我不再負責淘寶搜索業務,正好可以專心寫淘寶搜索的文章。

  之所以寫想寫這個系列的文章,有幾個原因:

1、淘寶搜索對於一個賣家來說,太重要了。目前又沒有系統性的介紹,我之前答應過要寫,這次剛好有機會。可以供賣家參考。

2、我負責了4年多的淘寶搜索技術和產品,如今不再負責搜索業務了,也希望能寫一些文章,做為總結。也算對自己交代。

3、目前對於購物搜索方面的文章太少,我寫出來,可以讓其他做購物搜索的同仁們有所借鑒。

搜索這十多年,就像一幕電影。我現在只不過把劇本零星的整理出來形成系列的文章。

我假定的讀者對象是搜索相關產品和技術人員、所有淘寶和天貓上的賣家,以及其他對購物搜索感興趣的朋友。因此文章不能太技術,但又不能太沒有技術,這是很有挑戰的地方。所以大家不要期望太高,照顧一下其他讀者。

雖然是計劃寫揭秘淘寶搜索系列,但我希望我的文章包括淘寶搜索、一淘搜索、天貓搜索、以及阿里巴巴B2B的搜索,也不會有真的內部秘密要公開,能公開的就不是秘密。

 那幾個搜索引擎

B2B、B2C、C2C這些名詞想必都很熟悉,還有現在比較新潮的O2O, C2B。所謂的模式,都是做出來以後總結出來的。先知先覺設定某個模式,然後去搞,十有八九不會成功。此文章系列不談這些,着重談搜索技術,不同的搜索引擎,搜索的原理基本一致,只是在產品策略,排序因素上有各自的特性。

如果講這幾搜索引擎技術的完整性,一淘搜索最完整。具體技術以後再講,先說說一淘搜索。

中國最大的全網購物搜索是一淘搜索(淘寶搜索不是全網購物搜索),但明顯一淘搜索還不屬於購物的主要入口,相比淘寶本身還很小,看似一個很好的應用,卻一直沒有得到市場的認可。原因是多方面的,我這裏列幾個:

當市場一家或幾家獨大的時候,站內的購物搜索已經能解決用戶90%的需求,全網購物搜索引擎的需求不大;

購買商品不同於瀏覽網頁,需要輸入賬號,很少有人願意到一個地方搜索,然後到另外一個地方重新輸入賬號、瀏覽、購買,然後再回來進行搜索的;

各個電商網站的數據非常不一樣,如果搜索產品想做到非常好用,技術難度不是一般的高。

淘寶搜索是最有挑戰性的。我從2000年開始做搜索技術,先後做網站的站內搜索、企業知識搜索、網頁搜索,最後做淘寶搜索。這十幾年中,遇到最具挑戰性的就是淘寶搜索。雖然數據量不是最大的,但其技術的複雜性,一點都不低於網頁搜索,更具有挑戰的是,其產品策略太難制定,在考慮用戶體驗的同時,還需要考慮幾百萬賣家的利益。而且道高一尺魔高一丈,無論多好的策略,很快就可能被市場破壞。

天貓搜索和淘寶搜索都是同一套技術體系,因為他們要解決的問題都是一樣的。天貓的數據量小,商家數只有淘寶商家數的百分之幾,商品量也很小,天貓搜索的產品策略和淘寶搜索有明顯的不一樣。天貓搜索不擔心馬太效應(馬太效應是指大者越來越大,小者很難成長),天貓可以通過制度要求讓賣家配合很多規則,例如商標、圖片、正品要求、發票等。當然,天貓搜索還會倡導品質,而不是便宜。

淘寶搜索和天貓搜索都有兩個類型的應用,一個是直接關鍵詞搜索,一個是類目瀏覽(也就是list)。前者好理解,後者是指當用戶通過某個類目名稱進入到商品列表頁的時候,出現的搜索結果。這兩者都是調用的同一個後台,只不過排序因子有些不一樣。

阿里巴巴B2B的搜索,也就是1688的搜索,我自己還不太了解,等過些天我去拜訪一下相關的負責人,再向大家做介紹。

 淘寶搜索VS. 網頁搜索

我們平時用網頁搜索引擎更多,為了讓大家更清楚了解淘寶搜索的特點,我這裏把網頁搜索和淘寶搜索的特點做個對比。

 一、搜索流量的價值

淘寶上每個賣家店鋪流量來源主要分成三部分:推廣流量(付費廣告或免費活動);老客戶(直接登錄、收藏等);搜索流量。由於推廣活動的持續性問題,搜索流量基本上決定了一個店鋪新客戶來源。如果一個店鋪新客戶來源不夠的話,在市場上會日益衰落。

目前的網頁搜索引擎公司,盈利的主要來源還在搜索廣告。但對於網頁搜索引擎來說,不是所有的流量都有價值,例如:在百度上搜索“李湘”,估計就沒有什麼廣告,大多是明星新聞八卦什麼的。一般的網頁搜索流量中,大約20%~30%的搜索詞是有商業價值的(適合出廣告)。淘寶搜索不一樣的是,基本上99%的流量都是有商業價值的。搜索“李湘”,會出來減肥茶,搜索“林志玲”,會出來充氣娃娃;在韓寒和方舟子鬧得很厲害時,搜索“韓寒 VS 方舟子”也有很多個性T-shirt結果。某種程度上可以說,如果淘寶搜索流量有10億,其價值估計相當於網頁搜索流量40億的商業價值。

在淘寶搜索上,如果要賣廣告,是最好融合的。因為淘寶搜索的結果本身就是商品,廣告也是商品,二者沒有區別。

 二、搜索的社會影響

這個和淘寶本身的社會影響相關聯。現在淘寶賣家數達到800萬,活躍賣家數應該在200萬左右。我們假設平均每個活躍賣家背後有5個人,那麼直接在淘寶上就業的人就有1000萬人,如果加上其他兼職賣家、快遞公司、第三方服務公司等,估計能到2000萬人。每天有上億的用戶上淘寶去買東西。淘寶任何一個規則的變化,對整個社會都會有不小的影響。

2012年淘寶、天貓雙十一,整個交易額達到191億,考驗的不只是淘寶、淘寶賣家、淘寶買家,還有物流快遞公司、銀行支付系統等。試想有一天淘寶忽然停業一天,全國有多少人都得在家打麻將了。同理,搜索的任何一個變化,都會影響淘寶賣家,通過賣家會影響到買家、第三方物流……

不知道有多少人還記得2010年7月份搜索規則的變化,已經由一個公司內部的技術變革,演變成一個社會事件。這個在本文後面會有專題介紹。

 三、搜索的實時性

如果有人自己建了個網站,網頁搜索引擎要是一兩個星期沒有收錄這個網站,站長也不會太着急。但在淘寶上不一樣,必須是實時或者接近實時的。賣家發布一個商品,希望幾分鐘后就能搜索到。因為商品是實體,賣一件少一件,價格也會有變化,賣家還會經常搞活動,如果信息更新不及時,就會誤導買家,造成糾紛。這些對搜索的實時性要求非常高。

在淘寶上,每天會有上億的商品信息發生變化,包括上架、下架、銷量、價格、屬性、描述的變化等。這些商品絕大部分都會在幾分鐘之內反應到搜索結果中去,如果要做到實時的呢? 這對技術帶來的挑戰是巨大的。淘寶最開始更新的周期是半個小時到40分鐘,到2012年已經縮短到三四分鍾之內了。當然,晚上系統做更新的時候,數據更新會稍微慢一些。

  四、搜索的查全率

查全率是個專業術語。所謂查全率,就是搜索鞋子,找到的鞋子數量佔總體鞋子數量的百分比。類似的術語還有相關性,相關性就是指搜索結果和搜索詞是否相關。例如:搜索“做自己”,出來《做自己》這本書就算相關,出來《做自己的口才專家》就屬於不相關。搜索手機,出來手機鏈也屬於不相關。

網頁搜索是會做一些消重和過濾的。我們在網頁搜索時,最不希望看見的就是一摸一樣的重複結果。在淘寶搜索中,我們也不希望看見太多的重複結果,但同時又希望有不同的商家可以對比,有不同的地域可以選擇。對於賣家來說,如果自己店鋪的寶貝因為跟其他店鋪重複而不出現的話,一定會詢問為什麼,淘寶的客服電話很快就會打爆了。

淘寶搜索,一方面要考慮買家的體驗,一方面又要考慮賣家的利益,這就需要採用很多不同的技術解決。

 五、搜索的反作弊

有一項很吃香的職業,叫搜索引擎優化(SEO),他們的主要工作就是如何讓制定的結果在搜索引擎中排名靠前。如果用正常手段,叫SEO,如果用一些欺騙的手段,就叫作弊。網頁搜索和淘寶搜索上作弊的人都非常多,因為搜索引擎的重要,導致有太多的利益驅動。雖然都有作弊,但手段很不一樣。

在淘寶搜索上是直接和交易相關,所以作弊更加瘋狂;同時檢測作弊的對象又是淘寶的賣家,如果算法有誤殺,會導致正常的賣家受到損失,這個損失經常是這個賣家不可承受的。如何進行搜索的反作弊,也是一項很有挑戰的技術。

  阿基米德

淘寶搜索這幾年,最大的變化有兩個,一個是阿基米德,一個是個性化搜索。這是我在負責淘寶搜索期間,主導的最重要的兩個項目。阿基米德的上線,奠定了整個淘寶搜索的框架,直到現在,搜索的排序算法還是基於當時建立的框架。如果說阿基米德是過去和現在,那麼個性化項目則是淘寶搜索的未來。從2012年開始在個性化排序和推薦上做了很多工作,2013年也是重點。個性化以後會有專門的文章來介紹,這裏只介紹阿基米德。

2010年7月8日,淘寶搜索新排序算法阿基米德上線。由於排序算法變化大,導致很多賣家的流量波動非常大。特別是靠之前規則獲得很多流量的賣家,這次規則的調整,導致他們流量大幅下降,因此很多賣家開始圍攻淘寶。這就是7.8事件。回憶當時的情景,我仍然歷歷在目。

 

以下內容摘選自我在2010年8月發給所有淘寶內部小二的郵件:

Hi 大家好,

想必這段時間大家從各方渠道都聽到了不少賣家的聲音,有新聞、有論壇、有抗議的、有拉橫幅的,肯定也有賣家直接找到我們小二來詢問,背後到底發生了什麼?搜索規則的修改真的是像外界說的一樣么?相信每個小二都有疑惑。

夜深人靜,我來給大家做個詳細介紹。

 不是前言的背景

以前的搜索,一直是簡單的原則:消保優先、相關性、櫥窗推薦的三大前提下,按照下架時間排序。

存在的一些不好的現象:

1. 一個貌似對賣家很公平的原則,從實際展現數量和點擊數量來看,還是被一些針對規則做了很多優化的大賣家把持着;

2. 對於消費者也沒有任何公平可言,因為最重要的排序因素下架時間,消費者不關心。消費者最關心的賣家服務質量,卻沒考慮在內。

3. 流量浪費非常嚴重,不少賣家每天得到流量很大,但成交比例非常低。有的賣家經常每天上千個搜索點擊流量,只有一到兩單的成交,有的甚至一單都沒有。

4. 很多賣家花很多心思琢磨如何給店鋪增加更多的流量(不排除通過作弊等方式),但通常忽視對於買家的服務質量。

我們希望那些服務質量好的賣家,能自然得到更多的流量。服務越好,流量增長越多!

我們希望那些得到流量的賣家,如果服務質量不好,流量會越來越低!

我們希望賣家可以花更多的時間和精力在如何服務好買家,而不是挖空心思想搞流量!

於是我們有了阿基米德!

 什麼是阿基米德

2010年,淘寶消費者年。

每天是誰在直接接觸消費者?不是淘寶幾千名小二,而是淘寶幾百萬的賣家。如果賣家對消費者的服務越來越好了,那麼消費者的體驗會越來越好!

阿基米德,簡單說,就是把“店鋪服務質量”作為重要因素加入到搜索中來影響排序。7月8日上線阿基米德以後,目前的排序規則是:

消保優先、相關性、櫥窗推薦的三大前提下,在一定時間範圍內,按照店鋪服務質量權重排序。

目前影響店鋪服務質量參考的因素有很多,包括:是否違規、是否作弊、退款率、超時退款率、發貨速度、旺旺響應速度、滯銷商品率…….等。參數有幾十個,只是權重不一樣。

 阿基米德的影響

這次調整,確實對賣家的影響比較大,應該說是幾家歡喜幾家愁。各方面的新聞報道,就不計其數;來淘寶抗議的賣家,也來了幾波了。

這個情況下,來看看整體數據:

1 搜索帶來的UV成交轉化率至少提升7.942%,搜索結果點擊率提升4.14%,退款率下降19%

2 今天剛收到BI同學做的全站對比分析數據:

 全網UV下降明顯

大家都知道6、7、8月是淡季,我不擅長做數據分析,但有一點是可以說明的:阿基米德的上線沒起啥壞作用,也並不是很多抵制搜索排序改版的人說的那樣。

這次調整,對於P4P廣告的收入衝擊很大,上線的第一周,搜索右側的廣告收入,下降了約10%左右。主要的原因就是因為消費者使用搜索時點擊搜索結果更多 了,點擊廣告更少了。超凡、龍飛、三多對這次變化,表現出了高度的姿態:支持搜索的改變!老陸、三豐、東邪也紛紛表示:不要擔心收入下降,只要對消費者有 更好的體驗,支持!

加上數據的支持,給予搜索部門同事更多的信心!

這次事情對搜索部門的影響就更加深遠了,在提升消費者體驗方面,可以在排序上做更多的工作。同時,也可以真正利用排序的變化,來引導賣家的行為!讓搜索排序成為撬動賣家行為的支點吧!

—-鬼腳七

2010.8.7

從現在來看當時的目的,已經完全達到了,只是當時有點鬧騰。

好吧,那就是一段故事,都過去了。

為什麼會有這麼糾結的地方,思考一下淘寶搜索所處的位置。淘寶搜索的任何變化,需要考慮三方面的因素:買家、賣家、平台。買家的體驗是第一位的,需要平衡眾多賣家的利益,還要考慮平台的健康發展。

通過這篇文章的描述,應該對淘寶搜索有了大體的印象。不要着急,下次的文章我會專門介紹淘寶搜索系統的原理,逐漸比較技術。如果有耐心看完這個搜索系列文章,就算他不能成為搜索專家,一定能對搜索的邏輯非常清楚。

文章來源:鬼腳七的微信

本文由“人人都是產品經理”QQ群④群的  Charles-PM-北京 推薦