甲方:當我手上有1.5億數據

甲方:當我手上有1.5億數據
Read Time:1 Minute, 21 Second

“我們手上有1.5億的數據,但我們廣告卻投不好,到底哪裡出了問題?“

數據,是個坑人的字眼

對於甲方,我有一個建議,當聽到“數據”二字,就要立即警覺起來。數據這個詞,很坑人的。

簡單地說,每個人理解的數據都可能不一樣。而甲方理解的數據,和乙方提供的數據,常常有天淵之別。

要說清楚數據到底是什麼數據,必須注意三個重點:

  • 是什麼樣的結構:ID + 屬性字段;還是只有ID;還是只有屬性。
  • 顆粒度:個體級別,還是受眾包,如果是受眾包,多少人一包。
  • 包含哪些字段。

而數據包含多少數據量,並沒有被列在重點裡。為什麼,後面再講。

現在來看看那個甲方,他們的1.5億數據是什麼?

  • 結構:基本只有ID(Device ID),沒有屬性字段,或者很有限的屬性字段。
  • 顆粒度:個體級別。
  • 包含字段只有一項:點擊它的某個廣告。

現在,當你手握1.5億這樣的數據,會覺得這是一個很多、很了不起的數據嗎?

這其實很令人堪憂。

Device ID是個體級別的,這個有優勢。但是這數據屬性中的可用部分,只有可憐的“點擊某某廣告”可用。

而且,點擊廣告?Are you kidding me?品牌廣告的點擊,先不說可能存在的垃圾或作弊,光誤點擊或者好奇心點擊就很多,卻不是目標族群。因此,廣告點擊是一種表明品牌興趣的“信號機制”,但顯然不夠強,數據質量也不夠高。

但這還不是全部的問題。

數據量,完全不是越大越好!

這1.5億數據存在的第二個很大的問題是,1.5億本身。

美國有多少手機用戶?大約3.3億,假設平均每個人有1支手機。那麼1.5億的device ID,就基本上是接近46%的美國手機用戶了。

給甲方提供數據服務的服務商,可能還會跟甲方說,1.5億數據太少啦,你們要繼續積累數據,最好積累到5億、10億……

Are you kidding me?

在以點擊廣告作為字段的情況,將數據積累到5億,那就基本上每兩個手機用戶,就有一個是這個品牌的“Target Audience”(TA)。這聽起來,相當不符合邏輯呀。

如果人人都是你的TA,跟人人都不是你的TA有什麼區別!

又不是賣可樂,開麥當勞。

所以,這1.5億數據,聽起來龐大,感覺是窮舉了TA。但實際上,或許它太大了一點,大到已經不能從中發現真正的TA了。

很多甲方喜歡很大很大的數據。而且幾億數據喊出來,服務商臉上也有光,否則還有啥能說明數據的強大的?

但是,數據量,完全不是越大越好。

比如,數據量太大,真正有用的數據就會被淹沒。數據量太大,處理起來會更慢,比如做look-alike,無論種子數量的巨大,還是放大的人群池裡面的數據量巨大,都不一定會讓效果更好,反而會讓look-alike的速度變得很慢。數據量太大,為每一個個體構建準確的標籤的難度也會隨之加大,數據的精準度也必然會降低。

換句話說,1000萬個Device ID加上每個ID都有10個較為準確的標籤,和1億個Device ID,只有一個點擊廣告的標籤,哪個更能被應用?答案毫無疑問。

不是追求大,而是要追求有質量的大。

所以,為什麼1.5億的數據,實際上很難投出有效果的廣告,是因為,實際上其實手上沒什麼有用的數據。1.5億數據和沒有數據,一點兒不矛盾。

為1.5億數據填充數據

那麼,怎麼“處理”這1.5億數據?

方法一:找第三方來做data enrichment。

這麼做沒有大坑,但也沒有什麼用。第三方的數據,當然可以一定程度上幫你豐富數據標籤,但價值在哪裡?它們並不能幫你把標籤精確到能夠分辨這個Device ID背後的人是否對你的某個產品感興趣,第三方數據都是很粗略的大致的人口屬性描述,和大致的興趣數據。

本來你就不知道這1.5億數據中,有多少真正是你的目標受眾。第三方數據做data enrichment之後,仍然不會讓你知道誰是你真正的目標受眾。

給一大群可能連你自己都不知道是不是你的TA的人做data enrichment,這不是浪費錢是啥。

邏輯不是這樣的!既然花錢強化數據,就像打遊戲升級裝備,顯然是要升級那些最好的裝備嘛。現在的問題在於,這些數據是不是最值得“升級”的數據,甲方並不知道。

方法二:把數據上傳給媒體的DMP,做data enrichment。

這個方法就更不靠譜了。媒體的DMP不會給你做數據增強,它們會給你兩個出口,要嘛給你查看人群作為一個over-all的圖表報告,要嘛建議你把這些數據直接變成它們的受眾包進行投放。這兩個出口,對解決問題都於事無補。

方法三:分批分包投放這些數據,然後根據效果判斷這些數據的質量和是否包含TA。

這個方法一般人不會去用吧,太麻煩,儘管但它背後包含一定的合理性。

方法四:別再去考慮用這1.5億數據投放之類的問題了。如果就是為了投放廣告,乾脆直接用媒體的數據,比自己積累的這半吊子1.5億不知道好哪裡去了。這不算正能量方法,但絕對不是餿主意,如果只是為了投放廣告的話,媒體現在的數據,以及它們的數據產品,質量都相當不錯。

方法五:用來自於自己的(第一方的)數據,為這1.5億數據中真正重要的部分進行數據增強。1.5億數據不重要,為1.5億的device ID豐富第一方的屬性更重要!

這個方法是真正值得甲方採用的方法。數據,唯有自己的數據,才是質量最有保障的。如我前面所說,點擊不算是真正好的信號機制,但如果這些點擊能夠繼續進入甲方的自有觸點,在這些觸點上產生更多的行為,這些才算是真正能夠衡量是否真正目標消費者的信號機制。

這個過程不是一蹴可幾的,要一定的時間,但每每積累下來的數據,都是真正的數據資產。

否則,當這1.5億數據,真的繼續“積累”到5億10億了,你就會忽然發現,其實自己的手上,跟沒有數據已然沒有差別了。

看看你手上,是不是也有這幾億數據?你又會如何處置它們應用它們?