
關(guān)于亞馬遜搜索量,行業(yè)爭議已有五六年之久。雖然亞馬遜在后臺(tái)多個(gè)模塊陸續(xù)披露了搜索量數(shù)據(jù),但賣家朋友們可能并未注意,其實(shí)它們都不是真正的搜索量。
這篇文章,我們也籌備一年有余。陸續(xù)寫過2篇階段性的解密亞馬遜搜索量的文檔,但一直未對(duì)外發(fā)表,就是因?yàn)閬嗰R遜的數(shù)據(jù)還有諸多矛盾和謎團(tuán)未解。
但隨著亞馬遜近期的一個(gè)調(diào)整,我們認(rèn)為時(shí)機(jī)已經(jīng)成熟。搜索量這個(gè)懸而未決的問題,是時(shí)候給大家一個(gè)結(jié)論,終結(jié)行業(yè)爭議了。
由于篇幅較長,我們先把結(jié)論貼在這里,暫時(shí)沒時(shí)間閱讀的賣家朋友可以直接記下:
-
現(xiàn)在的“搜索詞表現(xiàn)”模塊的“搜索查詢數(shù)量”是真正的搜索量
-
商機(jī)探測器中搜索詞的“360天搜索量”是搜索人數(shù)
-
ABA排名是PC端的搜索人數(shù)排名
有興趣的賣家朋友則可以跟隨我們一年多來的研究歷程,逐漸抽絲剝繭真正的搜索量。
曾經(jīng)我們以為的搜索量
都不是真的搜索量
整個(gè)研究過程十分坎坷,可謂一波三折,在經(jīng)歷第四波的時(shí)候,真正的搜索量才逐漸浮出水面。這三折分別是:
-
第一折:ABA(品牌分析)數(shù)據(jù)
-
第二折:商機(jī)探測器
-
第三折:搜索詞表現(xiàn)1.0
換句話說,ABA、商機(jī)探測器、搜索詞表現(xiàn)1.0這三個(gè)亞馬遜后臺(tái)的模塊給出的數(shù)據(jù),背后對(duì)應(yīng)的都不是搜索量。直到搜索詞表現(xiàn)2.0出現(xiàn)的時(shí)候,亞馬遜給出的數(shù)據(jù)才看起來“像”搜索量。
之所以說“像”搜索量,是因?yàn)檫@里邊依然有很多疑點(diǎn),或者說,在亞馬遜的多個(gè)模塊給出的數(shù)據(jù)之間,矛盾似乎越來越多了。
本篇長文,我們會(huì)從商機(jī)探測器聊到搜索詞表現(xiàn)1.0,再到最新的搜索詞表現(xiàn)2.0,然后再回過頭去重新審視我們已經(jīng)習(xí)以為常的ABA數(shù)據(jù),毫無保留地與大家分享我們?cè)谒阉髁可系难芯俊?/p>
我們也會(huì)為大家逐一解密,為什么ABA、商機(jī)探測器、搜索詞表現(xiàn)1.0不是真正的搜索量,我們又是如何逐漸洞察到真正的搜索量的。最后,我們還會(huì)與大家分享我們的搜索量模型的方法,以及使用亞馬遜數(shù)據(jù)的一些實(shí)用建議,供大家參考。
文章雖長,如果大家能耐心看完,我們敢保證,一定會(huì)有非常巨大的收獲。不僅能知道什么才是真正有參考價(jià)值的數(shù)據(jù),同時(shí)對(duì)亞馬遜后臺(tái)的數(shù)據(jù)邏輯也會(huì)有更加深刻的認(rèn)識(shí)。
文章會(huì)分五個(gè)部分逐漸展開:
-
關(guān)于搜索量的幾個(gè)常識(shí)性認(rèn)知錯(cuò)誤
-
后臺(tái)到底什么數(shù)據(jù)才“像”是真正的搜索量
-
搜索量還有什么疑點(diǎn)
-
Sif是如何做搜索量模型的,準(zhǔn)確率如何
-
如何正確地認(rèn)識(shí)和使用亞馬遜數(shù)據(jù)
關(guān)于搜索量的三個(gè)常識(shí)性認(rèn)知錯(cuò)誤
在解讀真正的搜索量之前,我們必須先指出幾個(gè)常見的關(guān)于搜索量的認(rèn)知錯(cuò)誤。這些認(rèn)知錯(cuò)誤并不是大家的問題,而是因?yàn)閬嗰R遜不嚴(yán)謹(jǐn)或不透明的數(shù)據(jù)統(tǒng)計(jì)所致。如果不仔細(xì)加以研究,非常容易被誤導(dǎo)。
澄清這些錯(cuò)誤,有助于大家真正理解這些看起來是搜索量實(shí)際上并不是搜索量的數(shù)據(jù)到底代表什么含義,避免被誤導(dǎo),做出錯(cuò)誤的決定。
錯(cuò)誤一,認(rèn)為商機(jī)探測器里的細(xì)分市場是真實(shí)搜索量
這個(gè)問題在商機(jī)探測器剛開始出來的時(shí)候,有大量用戶沒經(jīng)過仔細(xì)研究,就誤以為是搜索量。這個(gè)錯(cuò)誤并不嚴(yán)重,很快大家就認(rèn)識(shí)到商機(jī)探測器給出的是同類商品聚合之后代表的細(xì)分市場,也就是某類需求的代名詞,而不是單個(gè)關(guān)鍵詞。

錯(cuò)誤二,認(rèn)為商機(jī)探測里的搜索詞是真實(shí)搜索量
細(xì)分市場的搜索量不是關(guān)鍵詞的搜索量,但是細(xì)分市場的二級(jí)菜單里,有一個(gè)“搜索詞”模塊,這個(gè)里邊是具體的關(guān)鍵詞,所以很快,大家就認(rèn)為這個(gè)是真實(shí)搜索量,并在很長的一段時(shí)間里深信不疑。我們跟很多研究過這個(gè)數(shù)據(jù)的大佬交流,他們都認(rèn)為是。

但做數(shù)據(jù)分析的直覺告訴我們,這個(gè)數(shù)據(jù)應(yīng)該也不是搜索量,因?yàn)榘凑者@個(gè)數(shù)據(jù)做推斷,亞馬遜的GMV體量,要比實(shí)際的小好幾倍。
但這個(gè)問題并不好證明,因?yàn)槲覀兊耐茢嗄P鸵肓似渌兞?,這些變量的值也存在一定的不確定性。但我們堅(jiān)信,這個(gè)數(shù)據(jù)從直覺和邏輯上說不通。
于是我們選擇了默默的頂住壓力,不對(duì)搜索量模型做出調(diào)整。即便一些友商為了討用戶歡心,逐漸將搜索量改成了和商機(jī)探測器保持一致,但我們依然不為所動(dòng),因?yàn)槲覀兿嘈拍遣皇钦嬲乃阉髁俊?/p>
轉(zhuǎn)機(jī)出現(xiàn)在亞馬遜推出了搜索詞表現(xiàn)1.0,逐漸開始證明我們的堅(jiān)持是對(duì)的,這也是錯(cuò)誤三的由來。
錯(cuò)誤三,以為搜索詞表現(xiàn)1.0里的搜索量是真實(shí)搜索量
亞馬遜并沒有將搜索詞表現(xiàn)模塊劃分過1.0和2.0版本,這是我們自己的劃分。之所以這么劃分,是因?yàn)閬嗰R遜對(duì)搜索詞表現(xiàn)做過改版,改版前和改版后的數(shù)據(jù)有比較大的出入。且1.0版本中出現(xiàn)過一個(gè)極其重要的數(shù)據(jù),正是這個(gè)數(shù)據(jù),讓我們開始逐漸挖掘到真正的搜索量,并據(jù)此邏輯嚴(yán)密地證明了商機(jī)探測器里的搜索量不是真的搜索量。
為了給大家真實(shí)還原我們的研究過程,我們把改版前稱為1.0版本,改版后稱為2.0版本。
在1.0版本中,我們挖掘到了一些表征搜索量的隱含數(shù)據(jù)。這個(gè)隱含數(shù)據(jù)來自于搜索詞表現(xiàn)數(shù)據(jù)內(nèi)部多個(gè)字段間的矛盾。
很多賣家應(yīng)該沒注意和留存過這個(gè)中間版本的數(shù)據(jù),所以我們?cè)谶@里貼一些出來,讓大家對(duì)我們的研究過程有更真切的感受。
我們先給大家看一下原始數(shù)據(jù)。在1.0版本的時(shí)候,我們下載了2022年7月份的搜索詞表現(xiàn)數(shù)據(jù),并做了簡單的整理,我們主要關(guān)注搜索查詢數(shù)量、點(diǎn)擊量、點(diǎn)擊率、加購量、加購率、購買量、購買率這7個(gè)數(shù)據(jù)。

我們將點(diǎn)擊量/點(diǎn)擊率、加購量/加購率、購買量/購買率兩兩相除,得到另外三個(gè)指標(biāo),如下圖所列。

這三列數(shù)據(jù)很有意思,同一個(gè)關(guān)鍵詞下,它們的值非常接近。
我們猜測,同一行這三列數(shù)值其實(shí)應(yīng)該是同一個(gè)數(shù)字,之所以不完全相等,是因?yàn)閬嗰R遜在計(jì)算點(diǎn)擊率、加購率、購買率的時(shí)候只保留了2位小數(shù),我們還原回去的時(shí)候會(huì)因?yàn)槭÷缘男?shù)位數(shù),帶來一定誤差。
我們還猜測,點(diǎn)擊量/點(diǎn)擊率、加購量/加購率、購買量/購買率這三組比值,得到的都是同一個(gè)值——搜索量。
為什么是搜索量?我們先做一下邏輯上說明,然后再用數(shù)據(jù)證明。
亞馬遜的電商數(shù)據(jù),在全球范圍內(nèi)有諸多類似的應(yīng)用。其中轉(zhuǎn)化漏斗數(shù)據(jù)的計(jì)算,全世界通常有兩種方法:
一個(gè)是將轉(zhuǎn)化漏斗的第一個(gè)環(huán)節(jié)的變量,作為所有后續(xù)指標(biāo)的固定分母,比如當(dāng)?shù)谝画h(huán)節(jié)是搜索量的時(shí)候,那么后續(xù)的所有點(diǎn)擊率和轉(zhuǎn)化率都以搜索量為分母,得到搜索點(diǎn)擊率和搜索轉(zhuǎn)化率。這是在衡量市場數(shù)據(jù)的時(shí)候更常使用的一種標(biāo)準(zhǔn),也是亞馬遜現(xiàn)在很多市場數(shù)據(jù)在使用的標(biāo)準(zhǔn)。搜索詞表現(xiàn),我們認(rèn)為就是這種計(jì)算方法。
另一個(gè)標(biāo)準(zhǔn)是轉(zhuǎn)化漏斗的下一環(huán)節(jié)除以上一環(huán)節(jié),比如大家習(xí)慣的點(diǎn)擊率是點(diǎn)擊量/曝光量,轉(zhuǎn)化率是購買量/點(diǎn)擊量。這種計(jì)算方式一般是在計(jì)算賣家自己的數(shù)據(jù)時(shí)更常用的標(biāo)準(zhǔn),方便你評(píng)估在你自己的轉(zhuǎn)化流程里,每個(gè)環(huán)節(jié)的轉(zhuǎn)化(和對(duì)應(yīng)的流失)是什么水平。大家自己產(chǎn)品的廣告數(shù)據(jù)就是這種計(jì)算方法。
假設(shè)這三個(gè)值可能代表搜索量,而亞馬遜也直接給了一個(gè)搜索查詢數(shù)量,我們分別用這三組數(shù)據(jù)與搜索查詢數(shù)量做一下對(duì)比。

很容易發(fā)現(xiàn),這三個(gè)數(shù)值與搜索查詢數(shù)量并不相等,而且好像還有好幾倍的差距。于是我們使用這三個(gè)值分別除以搜索查詢數(shù)量,得到分別的倍數(shù),如下圖。

于是,詭異的地方出現(xiàn)了。這三個(gè)比值得到的值都是搜索量,亞馬遜也給出了搜索查詢數(shù)量,這兩組數(shù)據(jù)理論上應(yīng)該相等。
但它們并不相等,且通過比值算出來的搜索量比搜索查詢數(shù)量都要大1.5-4.5倍不等。
所以問題就來了,兩個(gè)理論都應(yīng)該是搜索量,但為什么并不相等,而且中間還有好幾倍的差距?誰才是真正的搜索量?誰又不是搜索量?
雖然亞馬遜的指標(biāo)解釋通常都語焉不詳,但我們把官方給的解釋又通讀了一遍之后(以下截圖大家現(xiàn)在已經(jīng)無法看到,因?yàn)橐呀?jīng)更新了),發(fā)現(xiàn)了搜索查詢數(shù)量真實(shí)含義的一點(diǎn)蛛絲馬跡。

在這個(gè)截圖里,亞馬遜官方解釋的是,搜索查詢數(shù)量是同一個(gè)買家在24小時(shí)內(nèi)發(fā)出的請(qǐng)求去重之后的數(shù)量。也就是說,這個(gè)搜索查詢數(shù)量,如果是一天的數(shù)據(jù),可以理解為某個(gè)詞的搜索人數(shù);如果是周或者月,則可以理解為周或者月的搜索人次。比如一個(gè)客戶在一周的周一和周五都搜索了同一個(gè)詞,那么這個(gè)客戶在這一周會(huì)記2個(gè)搜索查詢數(shù)量。
由于搜索詞表現(xiàn)最細(xì)的顆粒度也是周,所以我們認(rèn)為這個(gè)數(shù)據(jù)代表的就是搜索人次。
于是,在搜索查詢數(shù)量和我們我們算出來的三個(gè)比值,顯然那三個(gè)比值更像是搜索量。
什么才是真正的搜索量
那我們?nèi)绾未_定點(diǎn)擊量/點(diǎn)擊率、加購量/加購率、購買量/購買率得到的比值確實(shí)就是真正的搜索量呢?
證明的機(jī)會(huì)出現(xiàn)在了搜索詞表現(xiàn)2.0版本,亞馬遜在9月份左右升級(jí)到了搜索詞表現(xiàn)2.0版本。
同樣是22年7月份的數(shù)據(jù),可以明確的看到,同一個(gè)詞laptop的搜索查詢數(shù)量比1.0版本的時(shí)候大了好幾倍:1.0版本是1,219,284,2.0版本則是5,504,032。


而5,504,032這個(gè)數(shù)值,剛好和我們通過三組比值算出來的數(shù)值幾乎一模一樣,這顯然絕非巧合。

這個(gè)變化還是蠻大的,為什么會(huì)發(fā)生這個(gè)變化?我們注意到,亞馬遜對(duì)查詢數(shù)量做了新的定義。

這段話包含兩個(gè)含義:
-
多次請(qǐng)求會(huì)重復(fù)計(jì)數(shù),也就是一個(gè)關(guān)鍵詞一個(gè)客戶一天內(nèi)查詢多次,不會(huì)去重
-
翻頁,也會(huì)算作是一次搜索請(qǐng)求
這兩個(gè)特征,就和我們之前所了解的A9算法一模一樣了。多次請(qǐng)求會(huì)重復(fù)計(jì)數(shù)、翻頁會(huì)重復(fù)計(jì)數(shù)、在左側(cè)增加任何篩選條件也會(huì)重復(fù)計(jì)數(shù)。

也就是說,之前1.0版本的確實(shí)不是搜索量,更像是搜索人次,而中間相差的倍數(shù),就是代表一個(gè)詞平均每個(gè)消費(fèi)者會(huì)搜索幾次。
如何證明商機(jī)探測器里的“搜索量”不是真的搜索量
現(xiàn)在,有了這個(gè)數(shù)據(jù),請(qǐng)?jiān)试S我們擲地有聲地向大家證明,商機(jī)探測器的搜索量并不是真正的搜索量。這也算是我們對(duì)自己曾經(jīng)的那份樸素的堅(jiān)持的一份有力聲明。
我們找到在搜索詞表現(xiàn)里出現(xiàn)的第一個(gè)詞laptop,去商機(jī)探測器找到對(duì)應(yīng)的數(shù)據(jù)。

同樣的關(guān)鍵詞,商機(jī)探測器里顯示過去360天的搜索量只有600萬,平均一個(gè)月才50萬。但這個(gè)詞在搜索詞表現(xiàn)里,今年7月份就有550多萬的搜索量,很明顯,商機(jī)探測器里的搜索量絕非真正的搜索量。
那商機(jī)探測器的數(shù)據(jù)到底代表的是什么含義呢?我們用數(shù)據(jù)做一下推理。
我們依然使用laptop這個(gè)詞,我們來統(tǒng)計(jì)一下laptop這個(gè)詞在商機(jī)探測器的7月份的數(shù)據(jù)。
由于商機(jī)探測器的“趨勢”模塊給的是細(xì)分市場的趨勢,所以我們先大致統(tǒng)計(jì)laptop這個(gè)細(xì)分市場在7月份的搜索量,然后再根據(jù)laptop這個(gè)詞在這個(gè)細(xì)分市場的360天的搜索量占比來大致計(jì)算laptop這個(gè)詞在7月份的搜索量(相當(dāng)于假設(shè)laptop這個(gè)詞在laptop這個(gè)細(xì)分市場里的搜索量份額,在7月份的時(shí)候和360天里是大致相等的)。
下圖是laptap這個(gè)細(xì)分市場的搜索量趨勢。

我們將laptop這個(gè)細(xì)分市場在過去一年的搜索量做一下記錄,分別如下:

然后選擇其中的7月份的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)。由于7月的第一周和最后一周只有部分天數(shù)在7月內(nèi),我們?nèi)∷鼈兯诋?dāng)周的數(shù)據(jù)除以7,再乘以在7月內(nèi)的天數(shù),最終得到laptop這個(gè)細(xì)分市場在7月份的搜索量大致是1,648,792。

然后我們把laptop細(xì)分下市場的多個(gè)關(guān)鍵詞360天的搜索量做一下求和,得到15,626,037(具體計(jì)算過程就不在這里貼出來了,我們直接用計(jì)算器加的)。

這個(gè)數(shù)據(jù)和過去一年的數(shù)據(jù)求和15,965,958大致相當(dāng)。我們之所以要研究這兩個(gè)數(shù)據(jù),是害怕亞馬遜在不同模塊給出的數(shù)據(jù)又有差別,為保險(xiǎn)起見,我們用上了可以用的所有數(shù)據(jù)做交叉驗(yàn)證。

而這兩個(gè)數(shù)據(jù)不完全相等的原因,則是因?yàn)榘粗艿内厔輸?shù)據(jù),從21年12月5日開始,到最新的一周2022年12月04號(hào)(最后一天是12月11號(hào))那一周結(jié)束,比360天要多出幾天,所以數(shù)據(jù)稍微大一點(diǎn),屬于正常范圍。
根據(jù)360天的搜索量總和,我們算出laptop這個(gè)詞的搜索量占比大致為6,004,659/15,626,037=38.43%。于是大致推測7月份1,648,792萬的細(xì)分市場搜索量,laptop這個(gè)詞的搜索量大致是1,648,792 * 38.43% = 634,049。
我們?cè)谒阉髟~表現(xiàn)中已經(jīng)明確,7月份的搜索人次是1,219,284,搜索量是5,504,032。
634,049這個(gè)數(shù)據(jù),比7月份實(shí)際上550多萬的搜索量,僅有其1/9。差距如此之大,基本可以證明,商機(jī)探測器的搜索量,與真正的搜索量相距甚遠(yuǎn),絕不可能是真正的搜索量。
但634,049這個(gè)數(shù)據(jù)又留下了一個(gè)新疑點(diǎn):它比7月份laptop這個(gè)詞在搜索詞表現(xiàn)里的搜索人次1,219,284也差不多小了一半,這又是為何?
對(duì)于這個(gè)誤差,我們有兩種猜測:
-
商機(jī)探測器的搜索量,可能指的是搜索人數(shù)。也就是說,商機(jī)探測器里統(tǒng)計(jì)的,是在某一段時(shí)間內(nèi)搜索過某個(gè)詞的消費(fèi)者數(shù)量。比如客戶在某一周的周一和周五都搜索了laptop這個(gè)詞,商機(jī)探測器只會(huì)計(jì)數(shù)1(統(tǒng)計(jì)周期內(nèi)按同一個(gè)消費(fèi)者去重);但搜索詞表現(xiàn)里會(huì)計(jì)數(shù)2個(gè)搜索查詢量,因?yàn)槿ブ刂芷谑?4小時(shí)。
-
商機(jī)探測器指的是搜索人次,數(shù)據(jù)統(tǒng)計(jì)的誤差來源于我們?cè)谶@個(gè)過程中做的假設(shè):我們認(rèn)為laptop這個(gè)細(xì)分市場里的多個(gè)關(guān)鍵詞,在1年的時(shí)間內(nèi)搜索趨勢都和這個(gè)細(xì)分市場是完全吻合的,同時(shí)在prime day那一個(gè)月的搜索量的增幅也是相等的。但實(shí)際上可能會(huì)有一些差異,或者有可能laptop這個(gè)最頭部的詞的搜索人次增加比例要比其他小的詞大不少,所以實(shí)際上laptop這個(gè)詞在7月份的搜索人次要比634,049這個(gè)數(shù)字要大。
這兩種猜測我們傾向于第一種,因?yàn)楹筮呥€有新的疑點(diǎn)也指向這個(gè)猜測。
但不管商機(jī)探測器的數(shù)據(jù)代表的真實(shí)含義是什么,這不影響我們?cè)谇斑叺玫降慕Y(jié)論:雖然我們不完全確定商機(jī)探測器的數(shù)據(jù)是什么,但我們可以完全確定它不是搜索量。真正的搜索量是搜索詞表現(xiàn)2.0里的搜索查詢數(shù)量。
搜索量進(jìn)一步探索過程中的新疑點(diǎn)
對(duì)于我們這些搞技術(shù)的人而言,知道什么是真正的搜索量,只是完成了真實(shí)的數(shù)據(jù)樣本收集這一步。我們的目的,是要通過模型,來實(shí)現(xiàn)對(duì)真實(shí)搜索量的擬合,這樣才能大面積應(yīng)用在我們的產(chǎn)品之中。
接下來的部分,我們建議大家還是保持耐心繼續(xù)閱讀下去,因?yàn)檫@些思考決定著我們是如何通過模型推算搜索量的,而這個(gè)過程中,我們又發(fā)現(xiàn)了諸多疑點(diǎn)。
我們覺得有必要向大家分享我們的發(fā)現(xiàn)與疑惑,大家也可以據(jù)此評(píng)估,我們的模型的可信程度,方便大家在使用Sif時(shí)保持合理的預(yù)期,或者適當(dāng)?shù)卣{(diào)整預(yù)期。
我們的工作要進(jìn)行下去,首先就面臨一個(gè)困境。搜索詞表現(xiàn)的數(shù)據(jù)是每個(gè)賣家自己店鋪里的產(chǎn)品對(duì)應(yīng)的關(guān)鍵詞的數(shù)據(jù),我們要把所有的關(guān)鍵詞搜索量都覆蓋到并保持更新,就需要非常大量的店鋪,顯然這個(gè)是沒有辦法做到的。
于是,很自然的,我們想到了在搜索詞表現(xiàn)里尋找部分樣本,然后通過ABA數(shù)據(jù)里的搜索排名來擬合搜索量曲線。這樣只要使用ABA排名,就可以大致預(yù)估對(duì)應(yīng)的搜索量了。
然而,當(dāng)我們滿懷期待,試著將搜索量與搜索排名關(guān)系對(duì)應(yīng)的時(shí)候,第二個(gè)困境出現(xiàn)了:相同時(shí)期的關(guān)鍵詞的ABA排名與搜索量并不是嚴(yán)格的線性關(guān)系。也就是搜索量排名靠前的,搜索量不一定大;而排名靠后的,搜索量也不一定比排名靠前的更小。
為了讓大家有直觀的感受,我們還是貼一下圖。

這張圖中,紅色那一列是ABA排名,橙色那一列是搜索人次,綠色那一列是搜索量,數(shù)據(jù)是按照ABA排名從小到大排序的。
紅色框標(biāo)出來的,就是理論上隨著ABA排名從上往下變大(靠后),搜索人次或者搜索量應(yīng)該跟著變小但實(shí)際上卻在變大了的異常數(shù)據(jù)。
之所以把搜索人次的數(shù)據(jù)也一并對(duì)比,是因?yàn)樵谖覀儼l(fā)現(xiàn)ABA排名與搜索量關(guān)系并不完全線性之后,我們猜測ABA排名是否可能是搜索人次的排名,但結(jié)果發(fā)現(xiàn)也不是。
一直以來,對(duì)于ABA的搜索頻率排名到底代表什么含義,大家莫衷一是。現(xiàn)在這個(gè)研究結(jié)果,使得這個(gè)問題變得更加撲朔迷離。它既不代表搜索量排名,也不代表搜索人次排名。所以,ABA排名,到底是什么排名?
這個(gè)問題,需要用到我們之前在ABA上做過的一些研究,還要用到我們?cè)趯?duì)比搜索詞報(bào)告2.0與ABA數(shù)據(jù)時(shí)的另一個(gè)發(fā)現(xiàn)。
關(guān)于ABA的研究是,我們發(fā)現(xiàn)一個(gè)有趣的現(xiàn)象,同樣一個(gè)月內(nèi)的ABA數(shù)據(jù),月的ABA條數(shù)比周和天的條數(shù)都要少,顯然ABA是有一定的過濾條件的。
這些現(xiàn)象指向一個(gè)我們推理得出的結(jié)論:ABA排名對(duì)應(yīng)的數(shù)據(jù),天數(shù)據(jù)最末尾的排名對(duì)應(yīng)的值應(yīng)該是1,周數(shù)據(jù)是7,月數(shù)據(jù)則大概是30(視當(dāng)月天數(shù)而定)——具體推理邏輯可參考我們過去的文章《亞馬遜ABA數(shù)據(jù)的一些有趣發(fā)現(xiàn) 》。
而搜索詞報(bào)告2.0與ABA的聯(lián)合研究的發(fā)現(xiàn)則是,相同月份的搜索詞表現(xiàn)里的關(guān)鍵詞,大約在搜索量略大于1000的時(shí)候,在ABA當(dāng)月的數(shù)據(jù)里無法搜索到(這里研究的是美國站)。
比如下邊兩張圖中的durable iPhone 13 case,在9月的搜索詞表現(xiàn)中的搜索量為1232,但在9月的ABA中卻找不到這個(gè)詞。


綜合上邊兩個(gè)研究,我們可以大致推測ABA的排名背后對(duì)應(yīng)的那個(gè)指標(biāo)的值,與實(shí)際的搜索量之間大概相差30多倍(1000/30>30)。
30倍是一個(gè)差距非常巨大的數(shù)字,所以我們對(duì)ABA排名做了本文中最大膽的一個(gè)猜測:ABA排名是某一段時(shí)間內(nèi)的PC端的搜索人數(shù)排名。
要證實(shí)這個(gè)猜測,我們需要做多個(gè)假設(shè),讓30倍這個(gè)數(shù)字看起來合理。
既然是猜測,就很可能會(huì)有問題。但我們猜測的思路,我們覺得也是很有參考價(jià)值的,所以我們也做一下說明:
首先,假設(shè)ABA的排名就是搜索量的排名,那么它們兩者應(yīng)該完全嚴(yán)格線性對(duì)應(yīng),沒有任何誤差,但實(shí)際情況不是。
接著我們很自然的就會(huì)猜測,是否是搜索詞報(bào)告1.0里的搜索人次,結(jié)果也顯示并不是。但沒關(guān)系,我們將其作為一種可能性,再去疊加其他條件。
假設(shè)它如果是,誤差大致會(huì)比3-5倍左右(之所以這個(gè)數(shù)字會(huì)比1.5-4.5大,是因?yàn)槲覀冞x擇的樣本是標(biāo)品類的產(chǎn)品,而且行業(yè)集中度比較高,所以每次搜索時(shí)觸發(fā)的搜索量不會(huì)太多,但非標(biāo)品如服裝行業(yè)的搜索量可能會(huì)比這個(gè)數(shù)字要大,因?yàn)槊看蜗M(fèi)者可能會(huì)翻更多的頁碼或者組合更多的條件。平均之后,倍數(shù)會(huì)比1.5-4.5要大。)
不是搜索人次,那是否可能跟商機(jī)探測器一樣,是搜索人數(shù)呢?假設(shè)是,這會(huì)多帶來2倍左右的誤差(以商機(jī)探測器的經(jīng)驗(yàn))。我們也姑且作為一種可能。
之所以會(huì)做這個(gè)猜測,還有一個(gè)原因,是因?yàn)樵贏BA還未在亞馬遜后臺(tái)開放之前,我們從灰色渠道接觸過大量的A9數(shù)據(jù),A9數(shù)據(jù)里包含搜索人數(shù)和搜索量兩個(gè)字段,但默認(rèn)排序的字段是搜索人數(shù),而不是搜索量。ABA是最早開放的數(shù)據(jù),我們懷疑ABA繼承了這個(gè)傳統(tǒng)。
但以上兩者相乘的倍數(shù)頂多也不到10倍,與30倍相去甚遠(yuǎn),我們還得繼續(xù)尋找。
剛才提到了A9數(shù)據(jù),所以我們做了另外一個(gè)猜測:ABA的數(shù)據(jù),可能并未包含移動(dòng)端的搜索量。
之所以這么懷疑,是因?yàn)橹暗腁9數(shù)據(jù)在通過灰色渠道流入市場之后,大量的賣家覺得給出來的搜索量偏小,排名第一的詞一個(gè)月也才幾十萬搜索量,于是各家服務(wù)商都不約而同地乘以了3-4倍,而這個(gè)3-4倍的差距,正是因?yàn)榇蠹也聹y這個(gè)數(shù)據(jù)并未包含移動(dòng)端的搜索量。
猜測并未包含移動(dòng)端還有另一個(gè)原因,是在2021年亞馬遜在廣告數(shù)據(jù)里突然增加了移動(dòng)端的數(shù)據(jù),導(dǎo)致大家后臺(tái)的轉(zhuǎn)化率數(shù)據(jù)突然暴跌。所以我們也懷疑,ABA數(shù)據(jù)里,可能只包含PC端的數(shù)據(jù)。
如果只包含PC端,那么PC端的流量目前大概只有25%的份額,如果是全平臺(tái),那么就還需要差不多乘以4。
現(xiàn)在我們將三個(gè)假設(shè)相差的倍數(shù)相乘,大致是[3,5]*2*4,差不多就是24-40倍之間,與30多倍的差距基本差不多。
關(guān)于這個(gè)猜測,亞馬遜披露數(shù)據(jù)的節(jié)奏,也給了我們額外的一點(diǎn)信心。
從A9數(shù)據(jù)明確是搜索人數(shù),且只包含PC端;到 ABA繼承A9;再到商機(jī)探測器繼承搜索人數(shù),但增加了移動(dòng)端;再到搜索詞表現(xiàn)的1.0改為搜索人次;最后到2.0改為真實(shí)搜索量。整個(gè)數(shù)據(jù)披露的過程,越早出現(xiàn)的數(shù)據(jù),與真實(shí)搜索量的差距就會(huì)越大,而每一個(gè)新模塊似乎一開始都會(huì)繼承上一個(gè)模塊的一些數(shù)據(jù),然后再進(jìn)行升級(jí)。按照這個(gè)時(shí)間順序,我們認(rèn)為ABA的真實(shí)含義是某一段時(shí)間內(nèi)的PC端的搜索人數(shù)排名,雖然大膽,但并非全無道理。
但假設(shè)就是假設(shè),等我們有更多研究,有更重大的發(fā)現(xiàn)之后,我們?cè)偌皶r(shí)向大家同步。
接著我們講一講,在這些數(shù)據(jù)的基礎(chǔ)之上,我們?nèi)绾巫鏊阉髁磕P汀?/p>
Sif如何做搜索量模型
準(zhǔn)確率如何
ABA排名并不是搜索量排名,是否ABA排名就完全沒辦法為搜索量做出貢獻(xiàn)了呢?并不是。
大家看到,這個(gè)數(shù)據(jù)出現(xiàn)的偏差,并不是很大。在整體上,ABA排名與搜索量的關(guān)系依然是線性的,隨著ABA排名的下降,搜索量整體也在變少,只是在相近的排名上并不呈現(xiàn)嚴(yán)格的大小線性關(guān)系。
所以,從一定程度上來講,ABA數(shù)據(jù)依然具備其商業(yè)價(jià)值。在通過大量的店鋪獲取完全精確的搜索量,與使用ABA擬合出大致的搜索量之間,我們依然認(rèn)為ABA是一個(gè)在工程上更具可行性與實(shí)用性的選擇。
所以,Sif依然繼續(xù)選擇使用ABA排名來擬合搜索量。
但既然使用這種方法有局限,所以我們也把這個(gè)方法可能帶來的問題,一一與大家做個(gè)說明。
第一,使用ABA搜索量,可能會(huì)導(dǎo)致在部分關(guān)鍵詞上的搜索量與實(shí)際差距稍大。我們根據(jù)模型擬合出來的數(shù)據(jù),發(fā)現(xiàn)有部分異常的點(diǎn)與曲線偏離較遠(yuǎn),這種情況就是因?yàn)锳BA排名與搜索量之間出現(xiàn)了較為異常的關(guān)系,猜測可能是某些用戶或者網(wǎng)絡(luò)爬蟲大量搜索了某個(gè)關(guān)鍵詞,導(dǎo)致這些關(guān)鍵詞根據(jù)ABA排名推測的搜索量,與實(shí)際搜索量有幾倍的差距。
比如2022年10月份的這兩個(gè)詞:cam和pc cam。cam在10月份的ABA排名是163,603名,pc cam在10月份的ABA排名是82,421。理論上,由于cam比pc cam這個(gè)詞的排名要靠后8萬多名,搜索量應(yīng)該pc cam更大才對(duì)。


但cam卻比pc cam的搜索量要大,cam的搜索量是15,157,pc cam反而只有10,401。

根據(jù)我們的模型,肯定pc cam的搜索量會(huì)更大,而且會(huì)比cam大不少,這就會(huì)導(dǎo)致誤差變大。
第二,在不同的站點(diǎn)上,ABA排名的擬合準(zhǔn)確率會(huì)有差異,大部分站點(diǎn)的大部分?jǐn)?shù)據(jù)都可以做到80%以上的準(zhǔn)確率,但部分站點(diǎn)卻誤差較大。
最典型的是英國站,ABA排名與搜索量之間的關(guān)系存在大量異常,尤其是下圖中的②,該關(guān)鍵詞的ABA排名是這一批關(guān)鍵詞中是最靠后的,但搜索量卻只比排名225的關(guān)鍵詞略小。

這些異常導(dǎo)致我們很難直接用英國站的樣本擬合模型,所以我們選擇了人口數(shù)量和關(guān)鍵詞數(shù)量十分接近的德國站的模型微調(diào)之后作為英國站的模型。
所以如果您發(fā)現(xiàn)Sif英國站的搜索量與搜索詞表現(xiàn)相差很大,大概率是由這個(gè)原因?qū)е碌模覀冋谙朕k法改善此模型。
第三,不同時(shí)間段的ABA排名對(duì)應(yīng)的搜索量,與實(shí)際的搜索量差異會(huì)有區(qū)別。通常來講,某個(gè)時(shí)間段ABA關(guān)鍵詞條數(shù)越多,該期頭部的關(guān)鍵詞的搜索量就會(huì)越大,比如prime day對(duì)應(yīng)的天/周/月的關(guān)鍵詞條數(shù)就會(huì)顯著多于平時(shí),相同ABA排名的關(guān)鍵詞的搜索量會(huì)比平時(shí)要大不少。
目前我們發(fā)現(xiàn)最為異常的是日本站的數(shù)據(jù)。prime day所在的月份的關(guān)鍵詞條數(shù)只比平時(shí)略多一點(diǎn),但大部分關(guān)鍵詞的實(shí)際搜索量都有很大程度的提升,所以此時(shí)間段的搜索量,我們的準(zhǔn)確率只有大致70%。我們后續(xù)會(huì)對(duì)異常月份的數(shù)據(jù)做特殊處理。
亞馬遜數(shù)據(jù)使用建議
以上,便是我們對(duì)亞馬遜搜索量的主要研究成果。從整個(gè)亞馬遜數(shù)據(jù)模塊的演進(jìn)過程來看,大家也能發(fā)現(xiàn),正確地認(rèn)識(shí)和使用亞馬遜的數(shù)據(jù)是一項(xiàng)非常艱巨的挑戰(zhàn)。
所以,借這個(gè)話題,我們想就其中可能的原因跟大家做一個(gè)探討,這些探討有助于大家從整體上客觀地認(rèn)識(shí)亞馬遜的數(shù)據(jù),以及合理地管理自己的預(yù)期。
從我們上述的內(nèi)容中可以看出,亞馬遜后臺(tái)的數(shù)據(jù)至少有這幾個(gè)特點(diǎn):
-
定義模糊,模棱兩可
在很多指標(biāo)的解釋上僅僅只是點(diǎn)到為止,但關(guān)于統(tǒng)計(jì)口徑的詳細(xì)說明卻非常少,導(dǎo)致大家認(rèn)識(shí)不一,解讀各異。
這個(gè)的主要原因應(yīng)該是長期以來亞馬遜都不是特別重視賣家端的服務(wù),并且長期和賣家之間是互相對(duì)抗的博弈狀態(tài)。但是隨著流量見頂,市場從增量變到存量,亞馬遜的態(tài)度也在逐漸改觀,會(huì)從更多對(duì)抗的狀態(tài)變?yōu)楦嗪献鞯臓顟B(tài),亞馬遜已經(jīng)做出的很多改變便可以發(fā)現(xiàn)其中的變化。
-
各個(gè)模塊的統(tǒng)計(jì)口徑不一致
這個(gè)問題非常嚴(yán)重,很多相同的名詞在不同的模塊,代表的含義差距巨大,導(dǎo)致大量數(shù)據(jù)想通過不同模塊交叉使用時(shí),發(fā)現(xiàn)完全不可用。這個(gè)槽點(diǎn)多到罄竹難書,我們找機(jī)會(huì)再跟大家分享。
出現(xiàn)這個(gè)的原因,市面上有一種說法是,亞馬遜后臺(tái)的各個(gè)模塊是不同的團(tuán)隊(duì)負(fù)責(zé)的,缺乏統(tǒng)一的定義和說明,所以導(dǎo)致各做各的,我們使用的時(shí)候就要飽受不一致之苦。
這個(gè)說法我們覺得有一定道理,像亞馬遜這樣的大公司,后臺(tái)服務(wù)有多個(gè)產(chǎn)品經(jīng)理是很正常的事情。但是亞馬遜也在開啟大裁員,留下來的產(chǎn)品經(jīng)理就要肩負(fù)更多模塊的設(shè)計(jì)工作,也許這個(gè)會(huì)逐漸得到統(tǒng)一,讓我們小小地期待一下。
-
數(shù)據(jù)都有不同程度的脫敏
這個(gè)倒是非常常見,幾乎所有搜索引擎都會(huì)對(duì)數(shù)據(jù)做脫敏,比如Google、百度、淘寶用的都是將搜索量脫敏并做歸一化之后的熱度,亞馬遜也一直保持著這個(gè)傳統(tǒng),比如銷量用BSR代替,搜索熱度用ABA排名代替等等。
這幾乎是行業(yè)慣例,出于商業(yè)機(jī)密保護(hù)和數(shù)據(jù)披露法規(guī)等因素,各家平臺(tái)都不會(huì)對(duì)外暴露真實(shí)的數(shù)據(jù),所以我們不多說。
基于以上這些特性,我們有幾個(gè)關(guān)于數(shù)據(jù)使用的建議,我們一直受益匪淺,希望對(duì)大家也有幫助。
第一,放棄對(duì)數(shù)據(jù)的絕對(duì)準(zhǔn)確的執(zhí)念。數(shù)據(jù),只有對(duì)比才有意義。很多時(shí)候,絕對(duì)值并不重要,相對(duì)的趨勢判斷和對(duì)比更加重要,要用多維度和變化的視角看問題。就跟BSR和ABA排名都有其價(jià)值一樣,甚至他們的價(jià)值比絕對(duì)的銷量和搜索量都更加重要。大一點(diǎn)小一點(diǎn),多一點(diǎn)少一點(diǎn),別去計(jì)較這些雞毛蒜皮的差異,關(guān)注那些更重要的東西。
第二,始終保持懷疑。不管是對(duì)亞馬遜的數(shù)據(jù),還是對(duì)大家在使用的服務(wù)商的數(shù)據(jù),包括Sif的,我們都希望大家始終抱著謹(jǐn)慎的懷疑態(tài)度。拿到一個(gè)結(jié)果數(shù)據(jù)是簡單的,但結(jié)果可能會(huì)騙人,多問是什么以及為什么,理解數(shù)據(jù)背后的邏輯,才不會(huì)被誤導(dǎo),才可以客觀地評(píng)估數(shù)據(jù)的可信度,找到最適合的使用場景。
同時(shí),我們也希望大家多懷疑自己,能夠以開放的心態(tài)重新審視自己腦子里已有的東西,這也是我們想說的第三點(diǎn)。
第三,Stay hungry,stay foolish。說這句話不是為了嘩眾取寵,是在幾年的從業(yè)經(jīng)驗(yàn)中,我們發(fā)現(xiàn)一些賣家朋友的好奇心和研究精神還是少了一些,甚至連一些基礎(chǔ)的亞馬遜知識(shí)都還需要加強(qiáng),但是卻只能接受與自己認(rèn)知一致的數(shù)據(jù),十分讓人惋惜。
數(shù)據(jù)的最大價(jià)值不是證明我們腦子里已知的東西,而是幫我們發(fā)現(xiàn)我們?cè)瓉聿恢篮驼J(rèn)知有問題的東西。大家用數(shù)據(jù)都是為了賺錢,證明自己牛逼除了自嗨之外,無益于幫我們賺更多的錢,只有那些我們還不知道的東西可以幫助我們賺更多的錢。
俗話說,我們只能賺認(rèn)知之內(nèi)的錢,我們的認(rèn)知不拓展邊界,能賺的錢就不會(huì)變得更多。
市面上一些服務(wù)商對(duì)亞馬遜某一方面的理解是比很多賣家要更專業(yè)的,對(duì)他們保持質(zhì)疑的同時(shí),也要保持開放的心態(tài)學(xué)習(xí),他們下過的功夫可以幫我們少走彎路或者避免重復(fù)發(fā)明輪子。
Sif的數(shù)據(jù)“價(jià)值觀”
以上,就是這次我們想給大家分享的所有東西了。
每一個(gè)研究結(jié)果的結(jié)論得來都不容易,在整個(gè)過程中,我們既要一邊保持對(duì)亞馬遜數(shù)據(jù)的謹(jǐn)慎懷疑,一邊又要面對(duì)對(duì)數(shù)據(jù)沒有深入研究的客戶的質(zhì)疑,我們承受了巨大的壓力。
但這些堅(jiān)持最終證明都是值得的,我們可以很自豪的說,沒有人比我們對(duì)亞馬遜搜索量的研究更深入和執(zhí)著。因?yàn)閷?duì)這個(gè)數(shù)據(jù)從未放棄研究,我們也得到了很多其他的洞察,找其他時(shí)間我們?cè)倥c大家做分享。
最后,為了做這些研究,不管我們經(jīng)歷了多少個(gè)孤獨(dú)的夜晚,也不管我們?yōu)榇顺惺芰硕啻蟮膲毫Γ覀円廊粫?huì)一如既往地為大家做亞馬遜數(shù)據(jù)的研究先鋒,堅(jiān)持為大家提供最具洞察力與最有實(shí)用價(jià)值的數(shù)據(jù)。

