從 google 趨勢看政治人物聲量 vs 從臉書統計看政治人物聲量

今天在網路看到這篇

覺得蠻有意思的。「聲量看政治」的統計數據資料來源是FB。所以他反應的政治聲量比較算是從「特定人物字詞,在FB上有多少po文、留言、分享、讚」來做統計。留言,評論,分享也都算發文一種,因為本質是「發文」,也就是說他反應的是FB內容產出的統計。

我覺得這統計很棒。因為可以拿來跟google趨勢的搜尋結果參照一件事情:內容創造與帶動主動搜尋量之間是否有關係。所以我這篇就以他這篇的日期區間(1/12~9/27)與政治人物為基礎,到google趨勢撈資料看能觀察到什麼。

柯文哲 vs 韓國瑜

由於google趨勢是相對數據,一次最多比五個字。且如果有數據偏離太多的時候,數據少的會被壓扁。所以先來看「聲量看政治」政治人物聲量最高的兩位

  1. 1/12是剛選完所以有一次高峰
  2. 6/6罷免投票,8月正式卸任高雄市長,韓國瑜有兩次明顯的井噴式高峰

所以韓國瑜這段聲量高,有很大部分應該是因為霸韓。

兩個人相對搜尋熱度數總計如下
柯文哲:254
韓國瑜:768

但是如果留著韓國瑜的線,其他人都不用看了。所以我把韓國瑜拿掉。然後照著「聲量看政治」的排名依次跟後面3個人做比較

柯文哲 vs 朱立倫 vs 江啟臣 vs 鄭文燦

  1. 整體來說柯文哲比其他三個人的搜尋量明顯要來得多
  2. 朱立倫的搜尋量是四個人裡面最低的
  3. 江啟臣的搜尋量高峰是3/7,因為當選國民黨主席,前面1/25有一波量是當時宣布要選國民黨主席。3~4月很鬧的數位諸葛選拔雖然我在同溫層FB看大家轉傳得很high,但顯然沒反應在搜尋量的變化上。反而6/8傳坐鎮高雄反霸韓跟罷韓投票後有一小波搜尋量。7/23的搜尋量則是因為李眉蓁涉論文抄襲時的發言。
  4. 鄭文燦搜尋量相對高點有三個,當天對應的新聞:2/25,鄭文燦取消龍德宮接駕。5/31前一天母親過世。7/4母喪告別式
  5. 朱立倫搜尋量相對高點有三個,當天對應的新聞:1/12總統選舉剛結束。6/6~6/11當時是罷韓前後。6/18發布「朱立倫倡議」網站,倡議打造藍軍大智庫

在「聲量看政治」中朱立倫的排名是第三。但很顯然他在臉書的「量」只存在於臉書,完全沒有反映在搜尋量上。而鄭文燦的搜尋熱點就我個人同溫層觀察,取消龍德宮接駕當時有一波新聞討論,是有一些討論熱度但我個人覺得熱度普通。但這件事卻有反映在搜尋行為上。然後他母親過世的事情我是整理這篇才發現有這個新聞。從這可以隱約感覺出臉書上同溫層會熱議的主題,跟會反映在搜尋行為的新聞間主題上的差異。

四個人相對搜尋熱度數總計如下
柯文哲:3092
朱立倫:458
江啟臣:941
鄭文燦:594

柯文哲 vs 郭台銘 vs 蘇貞昌 vs 林佳龍

郭台銘搜尋量相對高點有三個,當天對應的新聞:1/12總統選舉剛結束。1/22鴻海尾牙。5/26周刊爆郭台銘捐款台大癌醫跳票。然後其他人的新聞點我懶得查了XD

四個人相對搜尋熱度數總計如下
柯文哲:4485
郭台銘:1928
蘇貞昌:1845
林佳龍:872

郭台銘略高於蘇貞昌。蘇貞昌則是林佳龍2倍以上。這部分跟「聲量看政治」中三個人的數據分佈也是有差異的。

柯文哲 vs 賴清德 vs 馬英九 vs 侯友宜

比較有意思的是,馬英九的網路搜尋量是上述國民黨人中最高的。而且也是最會創造搜尋話題的。

四個人相對搜尋熱度數總計如下
柯文哲:4485
賴清德:1504
馬英九:2979
侯友宜:1291

綜合搜尋熱度總計比較

上述所有人的搜尋熱度,以柯文哲的4485做基準以等比例調整後。大家數值與圖表如下。跟「聲量看政治」的排序做個對照,大家可以比較一下「社群媒體聲量」跟「使用者搜尋熱度」的差異。

「聲量看政治」圖表

「使用者搜尋熱度」圖表

柯文哲:4485
韓國瑜:13561
朱立倫:664
江啟臣:1365
鄭文燦:862
郭台銘:1928
蘇貞昌:1845
林佳龍:872
賴清德:1504
馬英九:2979
侯友宜:1291

在臉書上馬英九排名很後面。但在搜尋他排第三。反而是朱立倫在臉書統計上排名第三,搜尋熱度吊車尾。然後綠營的政治人物排名也與臉書有所差異。

另外從前面搜尋凸起點可以發現,一般使用者的搜尋行為還是很受傳統電視新聞媒體的影響。電視報比較多,或是電子媒體有些比較聳動的新聞,通常都會帶動關鍵字搜尋量。

這裡要提一件事。就是不管是從FB看聲量,還是從google趨勢看聲量。都要先有個前提認知:這些數量都無法反應「沒有出聲只是看」的人的感受,而這有時候其實才是關鍵。所以大家看網路大數據分析很精彩的時候,請不要忘記沈默螺旋與倖存者偏誤的效應。

從google趨勢看台灣重大事件搜尋熱度:蔡英文、韓國瑜、陳時中、確診、酒精、衛生紙、口罩

到目前為止最大的事件還是武漢肺炎。在這個時間點正好可以把在台灣當下的熱門事件搜尋,跟選前韓國瑜的數據做個比較,找出台灣政治人物搜尋熱度的某種「正常基準值」。

衛生紙之亂 vs 韓國瑜誰比較熱門?

先用這五個字來看:蔡英文、韓國瑜、確診、酒精、衛生紙

從這張圖可以看出幾件事

  1. 兩次的衛生紙之亂都反映在搜尋熱度上,一次2月初,一次3月中。
  2. 1月的時候確診數相對還比較少的時候,大家更關心買不買的到酒精。
  3. 2月底之後酒精的搜尋熱度有走下的趨勢,但還是維持在一個程度的搜尋量,代表持續有酒精的需求。這部分我想應該是反應還要營業的店家有固定酒精消毒的需求,之前沒有現在有,所以現在酒精的搜尋熱度會比之前的搜尋量維持在一定的量。
  4. 3月中境外疑入確診數連續好幾天飆高,也反映在搜尋確診的熱度上。搜尋熱度也在這個時候超越了酒精。

確診人數 vs 韓國瑜誰比較熱門?

為什麼我要拿韓國瑜來比?因為我之前就一直說韓國瑜的搜尋熱度不正常。正好拿現在的事件來做比較。

把時間再往前拉一點看,會看到在選前9月到11月韓國瑜的搜尋量一直維持在跟現在確診2月初到3月的搜尋熱度。我個人還是認為是個不正常的狀態就對了。因為我覺得持續關心確診很正常,但持續關心韓國瑜很奇怪,即便是選舉還是一樣。而且關心確診的人不可能比關心韓國瑜的人少。

口罩 vs 韓國瑜誰比較熱門?

那發生重大事件時,特定關鍵字的搜尋量跟全國知名政治人物相比,搜尋熱度有多大的差異呢?現在防疫最熱門的話題應該就屬口罩了。所以拿口罩跟蔡英文、韓國瑜來比比看。

口罩大大的超越了所有的字。就算相對搜尋熱度的低點也比確診的高點更高。這表示在重大事件的特殊關鍵字,台灣的搜尋量是可以超越總統當選人當選那天的搜尋量很多很多的,這是有可能的,但需要符合重大的特殊事件。口罩這個詞基本上在這段時間可以說是全民談資,所以能夠達到這樣的搜尋熱度也是很合理的。

另外3/21後隨著確診人數不再那麼猛爆性增加,搜尋量也隨之緩慢下跌,但會發現搜尋口罩的搜尋熱度在3/21後卻是逐日往上成長。特別是清明節其間,大家應該都有被外出人潮嚇到。在那到現在口罩搜尋量一直都上升。我想這反應的是台灣然在確診人數增加後,危機意識還是有一定程度的提升,所以關心要去哪買口罩的量有變多。

政治人物正常的搜尋量級到底是多少?

上述這些字跟這段時間很紅的陳時中搜尋量相比又是如何呢?

從2月以後看,整體都比蔡英文高,這應該算正常,畢竟現在跟防疫有關的記者會都是他在說明。然後如果陳時中3/14後(就是開始很多境外移入案例爆炸的時間)跟蔡英文選前2019年12月比的話,兩者的搜尋熱度是相當的。

從這裡我大概可以下一個判斷:政治人物人名在台灣的「正常」搜尋熱度。排除選舉日當天當月,但在選舉期間或因故熱門(這次來說是疫情)期間,搜尋量的熱度上限大約就是蔡英文在2019年11、12月與陳時中2020年2、3月這段時間的搜尋熱度。那如果換算成實際搜尋量大概是多少呢?

我這裡用 https://keywordtool.io/ 撈,可能會跟 google ads 直接提供的數據有一點落差。但大致可以做個參考。

蔡英文2019年11月搜尋量級
蔡英文2019年11月搜尋量級

 

蔡英文2019年12月搜尋量級
蔡英文2019年12月搜尋量級

陳時中2020年2月搜尋量級

陳時中2020年3月搜尋量級

https://keywordtool.io/ 撈 google 的月總搜尋量級,蔡英文2019年11月是550000,2019年12月是823000。陳時中在2020年2月是823000,2020年3月則是550000。這與前面分析陳時中與蔡英文在這兩個時間的搜尋熱度相當是相符合的。

也就是未來在台灣如果有那個政治人物的月搜尋量級可以莫名且持續數月超越這個數字,我們可以合理的懷疑他背後應該有神秘水軍在操作。

後面補上韓國瑜一樣從 https://keywordtool.io/ 撈 google 月總搜尋量級,從2019年11月~2020年3月數據做參考。

韓國瑜2019年11月搜尋量級

韓國瑜2019年12月搜尋量級

韓國瑜2020年1月搜尋量級

韓國瑜2020年2月搜尋量級

韓國瑜2020年3月搜尋量級

從google趨勢看各國疫情變化

今天朋友丟了一篇臉書文,內容是用google趨勢找台灣這七天搜尋台灣跟譚得賽(兩者都是英文)的比較。問我有什麼看法。

我覺得他的比較蠻有趣的,但是我對他選的標的比較有疑問一點。是他選的字詞是 Taiwan 跟 Tedros。

因為Taiwan這個詞可以包含的範圍很廣,不只是這次肺炎的事,而Tedros只是單一人名,所以文中寫說「全球各大國家對台灣的搜尋量,比對譚先生的搜尋量還大。」,這其實是必然的。這不用看這七天的資料。在之前就是如此。

當然譚得賽先生的發言有帶動 Taiwan 這個字詞的搜尋更上層樓,這點是無庸置疑的。

不過這篇就引發我去想要搜什麼字來看這次武漢肺炎相關的趨勢。

病毒名稱字:coronavirus、冠状病毒

簡體中文還略高於英文,這我有點小意外。不過有沒有可能是因為發源地是中國,所以大家好奇中國的資訊?

武漢字:Wuhan、武漢、武汉

針對地名的話,英文搜尋高於繁體再高於簡體。

各地病情字:國家名 + coronavirus 還是 coronavirus in 國家?

我先打了 taiwan coronavirus ,但朋友說這字是不是會被認為是台灣肺炎?

不過做了測試以後我覺得不會。因為我使用 coronavirus in taiwan 。後面 taiwan 換成其他國家名稱。都明顯是使用 國家名 + coronavirus 的搜尋量比較大。所以在語意上大家應該要查的就是某國家的冠狀病毒資訊。而不是認為這個冠狀病毒源自某國家所以這樣搜尋。

各國疫情的搜尋熱度比較

先比較東方台灣、日本、韓國

韓國的疫情是在2/19的時候攀高,在搜尋上也是那時候開始拉高。這個狀況台灣也有(但要用中文搜尋「確診」)。日本從2/22拉高,大概是接在2/19鑽石公主號乘客開始可以下船之後。

如果把中國加進來呢?

很好,大家都被壓扁了呢。我對中國這段時間到底爆了哪些新聞沒興趣所以就不去找他為什麼搜尋量從3/8之後又步步高昇的原因了。不過很有趣的是中國不是說自己零確診嗎?顯然其他國家的人民可能並不是那麼放心。

既然台日韓已經被中國的搜尋量壓扁了,就不跟台日韓比了,我們直接來做大國之間的比較

中國跟美國搜尋量不相上下。當然中國因為比較早就出事了,所以早期搜尋量就比較高。義大利搜尋量3/8上升,3/18後提高更多,時間點大約是更在開始部分封城到鎖國兩個時間點。

那把英國加進來看看?

不知道是不是因為英國中標的包含皇室成員以及首相,英國的搜尋量超出中國美國的很多,也超越義大利。

那搜尋譚得賽跟搜尋各國確診人數比較呢?

恩,譚得賽跟歐美疫情比,大家比較關心疫情。那譚得賽跟東方各國疫情比呢?

關心譚得賽跟台灣疫情的搜尋在後期才有高有低,早期還是關心台灣疫情的人多於譚得賽。但基本上關心日本韓國疫情的人明顯是更多的。

簡單小結:

  1. 遇到確診數大增、宣布封城時,搜尋量都會有一波大增,各國都是。
  2. 關心疫情的人還是比較多,至於全球對譚得賽的注意其實相對還是比較少的。

從google趨勢看武漢肺炎疫情對生活的影響

武漢肺炎後,改變了很多我們的生活習慣。例如這段時間大家減少外出,顯而易見造成旅遊業的重大衝擊。我也觀察到身邊很多人開始自己煮吃的,就在想,那像這些生活的改變,是否可以從google趨勢中看到一些端倪呢?

所以挑了這些詞組的五年搜尋熱度資料來做比較。分別是:旅遊、機票、旅館、電鍋、烤箱、微波爐、冰箱、電腦、網路、foodpanda、ubereat、泡麵、罐頭、額溫槍、耳溫槍、計程車、腳踏車,以及「確診」

以下只針對個別字的搜尋熱度作自我的搜尋趨勢比較。不同字的搜尋熱度點數不等於搜尋量所以不能直接跨字互相比較喔。

出遊字:旅遊、機票、hotel 搜尋量大大降低,旅館緩步下跌

不意外,這週「旅遊」的搜尋熱度20點,比2018年最低49點的一半還少。這週「機票」的搜尋熱度13點,也比2016年最低點34點的一半還少。這週「hotel」搜尋熱度低點是47點,也比2016年的低點64點少了三成。

讓我比較意外的是旅館這個字,也是呈現下跌趨勢,但沒有「旅遊」「機票」「hotel」崩盤的那麼明顯。可能代表國內旅遊還是大家會考慮的?

廚具字:電鍋、烤箱大漲,冰箱短波小漲,微波爐緩步上升

電鍋烤箱搜尋熱度明顯都是過去五年的最高。冰箱小漲的幅度沒那麼明顯,但如果跟過去同時期比,過去每年2/2~4/4正好都是冰箱搜尋的相對中低點且搜尋趨勢持平,今年搜尋熱度明顯上升,與其他年不同。

微波爐的搜尋趨勢因為正好五年是緩步上升的,一時間看不出有差異。但如果把過去同時期拉出來比較,會觀察到微波爐在過年前會有兩波搜尋高波,隨後往下降。但今年卻是緩步往上,代表搜尋行為還是不同與前幾年,有增加的趨勢。至於過年前為什麼有兩波高波…我猜是買來熱年菜的人變多?

這些字對應的應該是在家裡煮的人變多了,所以有找廚具的需要。

3C字:電腦與網路跟同期比搜尋熱度都微幅上升

似乎是找廚具比想買電腦接網路的人要多一點。但跟同時期比,「電腦」跟「網路」的搜尋熱度都是上升的。「網路」比較有趣是他只要再過年放假期間,就會有一個搜尋熱度凹陷的狀況。大家都放假出去玩啦。

外送字:foodpanda 與 ubereat 正夯

這兩個字不意外,搜尋熱度都大漲走高。代表叫外賣的人變多了。

戰備物資字:泡麵、罐頭、耳溫槍、額溫槍大家買

跟旅遊字相反,泡麵罐頭搜尋量都大增。大家都在囤貨啊。另外耳溫槍、額溫槍搜尋熱度也有井噴式的爆發狀況,從平常搜尋熱度低點爆衝到跟泡麵相當,額溫槍甚至比泡麵還高。

交通字:計程車下滑,機車持平,腳踏車上升。

外出交通,計程車搜尋量整體是下滑,但其中有兩段驟升,前面驟升的時間點正好跟開始有確診消息的時間有重疊。可能是一開始宣布確診後,比較多人有交通需求寧可選擇計程車而不是大眾運輸工具。但後來確診人數又大增,整體出門的意願降低,所以就往下滑了。

想騎腳踏車的變多了。機車反而變化不大。機車變化不大我有點意外,是因為比起機車,腳踏車更便宜嗎?

大趨勢字:確診,搜尋熱度走高走低都跟他有關

確診這個字,對應其他字會發現,不管他們走高還走低,時間點都跟確診有相當的關連性。

然後因為打「確診」注音輸入法在mac電腦上如果有點問題的時候,很容易不小心打出ㄑㄩ,結果也呈現搜尋熱度微幅上升的趨勢,算是一個小有趣的發現。

 

 

資訊戰真的存在嗎?從韓國瑜的搜尋量看資訊戰

選舉又要到了,去年這個時候寫了韓國瑜。今年韓國瑜出來選總統,就再來寫寫韓國瑜。

台灣政治人物搜尋次數量級的上限。我覺得應該可以拿總統作為一個標準因為總統是全國性的,屬於大家都會知道的人。現在的總統是蔡英文。所以拿蔡英文作為一個比較基準。

近七天搜尋熱度趨勢分析

最近因為有短暫熱點「王立強」共諜案,先來看看過去七天的搜尋熱度趨勢分析。這個圖表的搜尋時間是2019年11月26日中午12:00。

(點我看大圖)

  1. 韓國瑜最高,還是在一個很詭異的搜尋熱度
  2. 蔡英文其次
  3. 吳斯懷在剛開始中國國民黨提名不分區立委那陣子搜尋量有上來,快跟蔡英文相當,後來就降下去
  4. 王立強最近新聞開始爆之後搜尋量大增,超越蔡英文但也不算超越的非常多。
  5. 拿新北耶誕城作為比較,是因為這個活動是年輕人跟小家庭都會想去的,猜測會有一定的搜尋量,也確實有很明顯的搜尋週期,週四搜尋從下午兩點開始上高峰。週五下午五點開始,週六跟週日下午三點開始,週一就趨緩沒有在週末那麼熱。很符合想出去玩之前要先找資料的時間。但即便是週一搜尋量還是跟搜蔡英文的熱度相當。

七天搜尋量的城市分布

再來看看搜尋量的城市分布

  1. 人名(蔡英文、韓國瑜、吳斯懷、王立強)的搜尋城市分布遍佈全台灣。
  2. 活動(新北耶誕)明顯集中在雙北,然後少量在桃竹苗。但跟近七天搜尋熱度趨勢放在一起看,表示大型活動的搜尋量,在活動熱度高的時候,即使是區域型活動還是有辦法超越全國性政治人物的搜尋量。

你一直說韓國瑜搜尋熱度詭異的高,你是不是有偏見?

首先,這個看法去年我就提出過了,可以回顧以下舊文,裡面有當時的分析。
選舉觀察part2:看「韓國瑜」網路資訊風向的被操弄

另外關於搜尋量異常,以下舊文後面也要附上當時查的 google ads 實際搜尋量的資料。特別要注意到的是 google ads 實際搜尋量 跟 google 搜尋趨勢顯示的搜尋熱度意義是不同的,google ads 查到的是搜尋次數的量級統計。
選舉觀察part5:「公投」使用者搜尋行為差異分析

既然去年查過。今年我當然也要再來查一下。這兩年因為剛好歷經六都市長選舉,還有兩大黨的總統候選人黨內初選,所以我就拿蔡英文、柯文哲、郭台銘,韓國瑜來比較,以下是從 google ads 撈出的兩年數據(2017/11~2019/10)做出的折線圖,分析如下。

(點我看大圖)

這份是2015/11~2016/10,蔡英文的搜尋量。由於 google ads 最早只能查到2015/11,所以沒有更之前的資料。同時比較當時的對手朱力倫與上一屆總統馬英九的搜尋量。

(點我看大圖)

  1. 2018年市長選舉,可以看得出來柯文哲的搜尋量從2018年4月開始就逐漸攀升。而韓國瑜的搜尋量在7月前都趴在地上,8月9月開始有起色,接著從10月開始噴井式突破天際,月搜尋量到達400萬的等級。這數字有多驚人呢?以總統選舉來看。蔡英文當選得票數是 6,894,744。這人數跟馬英九第二屆的得票人數是相當的。台灣兩千三百萬人口。我假設一個搜尋量代表一個人搜尋一次的話,代表2018年11月,全台灣有17.4%的人都去搜尋過韓國瑜。從2019年1月開始。韓國瑜就一直維持在月搜尋量82萬以上的搜尋量級。
  2. 柯文哲在2018年11月(市長選舉月)當月的搜尋量也有噴井式的狀況。但也不過就是150萬。跟韓國瑜409萬比起來根本完全就是小兒科。韓國瑜的月搜尋量足足是柯文哲的2.7倍。
  3. 蔡英文的月搜尋量一直處在一個平凡而穩定的狀態。最高月搜尋量不過24.6萬。沒有選舉的時甚至只有6萬。唯一可以預期的是2020年1月總統選舉月,不管當選與否都一定會有噴井式的搜尋量,到時候我們可以來看看他的搜尋量有多少(2016年1月蔡英文的搜尋量是55萬,2016年5月就任,搜尋量是30萬),可以作為以後分析的一個標準。
  4. 郭台銘的數據可以視為「有錢人撲天蓋地選舉時,到底可以對網路搜尋量影響多大」的一個標的。搜尋量高點在2019年4月跟9月。4月的時候是國民黨黨內初選。9月的時候是最後宣布不選總統的時間。也就是說有錢人選舉對搜尋量影響的極限,大概可以說就是在月搜尋量67.3萬。

我沒有辦法去判斷柯文哲跟郭台銘的搜尋量有沒有被外來勢力影響,因為看起來還在可能正常的範圍內。但是韓國瑜的搜尋量一枝獨秀的超越他們近兩倍有。肯定是有其他勢力介入操作狂打雞血才有可能。以中國國民黨的現況,我不認為中國國民黨自己有那個本事作這些操作。

小結

最近很多人在那裡說哪有資訊戰。我覺得大家在討論資訊戰的時候,要釐清幾個點。

  1. 選舉影響有效/無效不能拿來證明資訊戰的有/無。有資訊戰不一定代表會對選舉產生明顯的「有效」影響,因為光釐清什麼叫做「有效」就有很多可以討論。但是「有沒有人在操作」資訊戰是有跡可尋的。很多人在討論的時候會把這兩個觀念互相抽換混淆,不可不慎。以數據來說,我會說資訊戰就是確實存在的。但很難說他最後的「影響」有多大。這兩者之間的關連性到什麼程度本來就很難評估。有沒有做,跟做完有沒有影響。完全是兩件事。
  2. 「有資訊戰操作」不等於什麼東西的歸因都是資訊戰。這就很像我們做網路行銷SEO的時候,順風大家都是SEO專家,逆風大家都怪演算法變更一樣。現在資訊戰也常常被拿來作為某件事情成功/失敗的藉口。我個人是覺得這樣的心態也不太健康。
  3. 韓國瑜的網路搜尋量很明顯是有被操作的,但我也沒有進一步證據可以證明是誰操作的。只能說確定有人在操作。那這樣的操作韓國瑜本人是否知情?我的看法是「不一定」。因為網路作這樣的操作本來就沒有一定要當事人的允許才能去做。就像SEO界有所謂的暗黑SEO,其中一種手法就是把別人的網站搞掉,這種他們當然不會跟當事人去講。所有的方法可以正著用,就可以反著用。如果外國勢力的目的是擾亂台灣的選舉,那當事人知不知道根本不重要。外國勢力想要「擾亂」的目的可以達成就好。

然後這篇文章上述提到的截圖,對應的原始數據資料我都有下載,大家可以自行到這裡下載,看看有沒有看出其他貓逆。

選舉網路聲量操作:特定關鍵字搜尋量操作可以達成哪些目的?

前面已經寫了很多篇關於搜尋量趨勢異常跟實際搜尋量級的異常。看完很多人的疑問是:所以操作關鍵字搜尋量到底可以幹嘛?

我自己本身之前是做網路行銷,比較偏向網站SEO操作多一點。所以我主要會從SEO的角度來看這件事。不過後面也會提供就我所知搜爬可以做的應用,串起來的可能性給大家參考。

先從SEO的角度來看,用比較簡單的一句話大概就是:透過搜尋量加上其他操作,決定你搜尋某些關鍵字時可以看到的資訊。

有人會反駁,他搜韓國瑜看到的資訊有好有壞,農場文也根本沒有排在前面,所以我這樣的假設不成立。但會有這樣的看法其實是對 SEO 有幾個誤解:

  1. 操作訊息排名一定是把「有利自己的資訊」給大家看得推到前面
  2. 操作搜尋排名等於要把農場文推到前面

但其實操作SEO有正向操作,跟反向操作。正向操作比較直覺,就是把希望大家看的資訊推到前面。例如我經營電商,那我就會希望大家搜尋某些產品關鍵字的時候,我的電商網站可以排名前面一點,使用者就比較有機會在我網站下單,進而得到商業利益。

那反向操作呢?反向操作就我所知至少有幾種:

  1. 用作弊操作的方式讓別人排名前面的網頁變成黑名單
  2. 把負面評價的網頁排名往後洗,讓別人看不到

而其實要做反向操作要用到的搜尋量跟整體投入資源要比正向操作多很多。

以1來說,就是用不正當的搜尋排名操作方式,讓google認為有不正當且明顯的人力介入,進而把網站 ban 掉。

以2來說,舉公投的例子,當搜尋公投排名前面都是愛家公投的資訊比較多的時候,人的決策行為其實很容易受到自己對這個資訊的第一印象所影響,那當看到愛家公投的資訊比較多,以一個對這個議題本身還沒有太多看法只是好奇的人來說,就有可能影響他對這個議題的看法走向。另外如果翻了兩三四頁都看不到其他差異比較大的資料,也會營造出「那應該大部分的人都這樣想這樣看這件事」的印象。

再舉韓國瑜為例子,因為媒體已經配合產出大量的內容,所以農場文只是用來做輪轉式網站SEO操作用,本身的排名不重要,他只是拿來助攻用。而新聞內容不一定要是加分,只要是只是在操作印象,而不是進一步要引導聽閱者思考或質疑的內容,都可以讓這些內容盡量都排名在前面。這樣就可以把一些比較有內容的分析文章往後擠。

於是當有人在line群這類封閉群組傳送的訊息,有人希望可以針對資料做一些基本查證的時候,會因為不容易找到相關資訊就放棄繼續查證或協助澄清。即使有人想要找資料也很難找,也會比較容易被容易找到的資訊影響決策。

另外,從會影響搜尋熱度的行為來看,會影響搜尋熱度的來源大致有兩個

  1. 真人的搜尋行為
  2. 機器的搜尋行為

2常見於網頁內容爬蟲的應用上。而跟搜尋行為有關的商業應用至少就有這幾項

  1. 搜尋結果網頁排名
  2. youtube影片排名
  3. 資料蒐集
  4. 情資分析
  5. 自動下注

所以如果先以直線思考來看,理論上可以做到類似這樣的影響

之前其實就聽過實體賭盤對投票意願的影響,所以透過影響賭盤來影響選舉也不無可能,不過這部分純粹是我從搜爬應用推斷的一種可能性。

當然,我必須承認操作搜尋量的實際影響其實很「幽微」,他要搭配的是一連串使用者「為什麼要做關鍵字搜尋 / 搜尋後可能影響到哪些行為」一起做考量。但搜尋量異常是事實(相關分析與數據請見「選舉觀察part6:「韓國瑜」與其他候選人搜尋行為差異比較與搜尋量解析」「實際月搜尋量及數據整理」),我認為這次大力介入網路的人,他們是在測試練兵,同時也在這個過程建立網路影響行為的關聯性調查。

我為什麼敢做這樣的推論呢?因為中國目前針對網站使用者行為調查比台灣成熟很多。以掏寶為例子,他們是有專門使用者行為調研的部門,在每次細節改版調整的時候收集數據分析影響轉單率多少,他們的使用者行為調查是做得很細的。「實驗」的說法不是無中生有,因為他們在商業上都已經在這樣做了,用在政治上只是小菜一碟而已。

選舉觀察part6:「韓國瑜」與其他候選人搜尋行為差異比較與搜尋量解析

這篇拖到現在才寫的原因是我一直在等 google ads 裡面 11 月搜尋量的資料。等到今天終於有了,也就是說 google ads 要到下個月11日以後才能查得到上個月的搜尋量。先講結論,這篇文章算是一半自打臉的文章。但另外一半也證明我之前的部分推論是正確的。

  • 自打臉的部分是:韓粉主要還是在台灣。美國也有韓粉,但還是沒有台灣的多。
  • 證明正確的部分是:韓國瑜的實際搜尋量確實有異常,而有趣的是全球都異常,不是只發生在台灣。

然後另外這篇會更詳細的分析「正常候選人會有的使用者搜尋行為」,由此可以看出韓國瑜的使用者搜尋行為異常。

「正常」的候選人搜尋行為模式是什麼?

我在寫『選舉觀察part5:「公投」使用者搜尋行為差異分析』跟『google trends 常見應用與使用者搜尋模式分析』一直在強調一件事:搜尋熱度異常不是只有看「爆量」,還要同時看「搜尋行為模式」是否也有異常。兩者同時發生才能推論有異常。

所以在看「異常」以前,要先來看「正常」的候選人搜尋行為模式有哪些。現在因為選完有一陣子了,所以可以直接把當選的候選人在選完後跟選前的搜尋模式一起列出來比較。

2008年馬英九搜尋趨勢(台灣)

2008年馬英九搜尋趨勢(美國)

2012年蔡英文搜尋趨勢(台灣)

2012年蔡英文搜尋趨勢(美國)

2014年柯文哲搜尋趨勢(台灣)

2014年柯文哲搜尋趨勢(美國)

2018年柯文哲搜尋趨勢(台灣)

2018年柯文哲搜尋趨勢(美國)

2018年盧秀燕搜尋趨勢(台灣)

上面幾個搜尋趨勢有幾個共同特色

  • 爆量點都是選舉當天
  • 爆量點至少是前面兩個禮拜(扣除爆量)平均搜尋量至少3倍以上
  • 搜尋量大幅度攀升都發生在選舉日前1周。
  • 選舉當地的搜尋量變化
    • 在選舉前2~2.5個月內有逐步增加的狀況,但增加幅度相較於爆量都是比較緩慢堆疊的。
    • 選後三天搜尋量會急劇下跌,2週後回到相對低點

那只有台灣的搜尋行為才是如此嗎?我們來看看美國總統選舉的搜尋行為是如何。

2008年歐巴馬

2012年歐巴馬

2016年川普

除了中間可能會因為事件發生有短暫的震盪,且震盪後很快都會回到相對低點。整體的搜尋行為模式跟台灣的搜尋行為模式是一致的,特色也是相同的。

事實上搜尋行為被大眾媒體,特別是電視媒體傳播的影響是很明顯的,從搜尋特色的以下這三點來看

  • 搜尋量大幅度攀升都發生在選舉日前1周。
  • 在選舉前2~2.5個月內有逐步增加的狀況,但增加幅度相較於爆量都是比較緩慢堆疊的。
  • 選後三天搜尋量會急劇下跌,2週後回到相對低點

這同時也與電視播放候選人的新聞密度相符合。

神奇的「韓國瑜」搜尋模式

有人會說,韓國瑜新聞那麼多,搜尋量大很正常。那我們來看看韓國瑜在台灣跟美國的搜尋量吧。

2018年韓國瑜(台灣)

2018年韓國瑜(美國)

  • 假設韓國瑜的搜尋量多真的全部都是由電視媒體的大量曝光帶來的。但這個理由拿來解釋美國的搜尋量變化是否合理呢?我是覺得不合理。
  • 其他人都明顯在選舉當天有個爆衝點,韓國瑜的暴衝點相對於他自己前面的流量顯得非常不暴衝。
  • 2.5個月內的搜尋量堆疊模式跟其他候選然完全不同。呈現一種很穩定的上升。連中間的爆發流量都顯得頻率很一致。

而且理論上韓國瑜如果呼聲真的那麼高,前面搜尋量真的那麼大,理論上選舉當天的量應該會爆高,但是如果把韓國瑜跟柯文哲的搜尋熱度放一起來看會發現…

柯文哲單日搜尋熱度還高於韓國瑜最高點再多25點以上。

依照韓國瑜這種搜尋行為堆疊的搜尋量,理論上實際搜尋量應該會很誇張。而依照我從 google ads 撈出來的結果,真的很誇張。因為數據很多,我直接用google sheets來整理。大家有興趣看數字的可以到這裡看

這個表裡面,除了顯示實際搜尋數量的量級數字外。我另外在後面計算了每個月跟上一個月相除後的數字,看看這個月跟上個月的量級增加了幾倍。

我這裡直接整理結論。

  • 在台灣的搜尋量級10月/9月的倍數,其他市長當選人落在1~2倍之間。只有韓國瑜在7倍以上。
  • 在台灣的搜尋量級11月/10月的倍數,其他市長當選人落在3~5倍之間,只有韓國瑜不到2倍。
  • 其他市長當選人在各國的搜尋量10月/9月的倍數,都落在1~3倍之間。只有韓國瑜大多落在5~10倍(法國除外)。
  • 其他市長當選人在各國的搜尋量11月/10月的倍數都落在3~7倍之間。只有韓國瑜在1~3倍之間。
  • 韓國瑜的搜尋量級在10月已經到達7位數 2240000,11月更高達 4090000。柯文哲11月還是6位數 450000,11月到7位數也才1500000。而普悠瑪事件發生在10月,當月搜尋量最高7位數也只有到 1220000
  • 10月普悠瑪事件發生,當月美國韓國瑜搜尋量級 90500,普悠瑪搜尋量級只有 14800。美國台人對普悠瑪的興趣比韓國瑜低?不可思議。
  • 韓國瑜的搜尋異常很一致的發生在各國。但主要最大搜尋量級還是在台灣。

所以韓國瑜的搜尋熱度毫無疑問是有異常的,不過美國韓粉確實沒有我以為的比台灣多。而這樣的異常即使經過 google ads 整理過的數據還是可以很明顯地看得出來。


下面是額外的紀錄。是在寫這篇的時候有觀察到 google trends 與 google ads 兩邊資料有落差的現象,在這篇記錄一下我的觀察。

有的關鍵字12個月搜尋熱度在google trends  相互比較的時候,「捷運」比「台鐵」高,但是最後在 google ads 查到的12個月搜尋量「台鐵」卻都比 「捷運」高。我自己的判斷是因為 google ads 提供的是商業下廣告的評估依據,他的準確度論上應該要更高,並且前一個月的搜尋量並不是一到隔月1日就釋出,而是隔了10天以後才有,應該表示 google trends 的資料比較即時,但針對搜尋行為過濾的條件比較少。而 google ads 過濾的條件可能比較多,所以有的字如果比較容易讓單一使用者短期內重複搜尋,可能在 google trends 顯示的熱度會比較高,但在更嚴謹的把同一使用者短時間重複搜尋行為過濾掉後,才是 google ads 那裡會呈現的數字。

google trends 常見應用與使用者搜尋模式分析

因為之前的文章,這禮拜被邀請去分享。考慮到聽的人可能不一定知道什麼是google trends 。所以有特別整理一份簡報,從什麼是 google trends 開始介紹。後面因為要分析「異常」之前,要先知道怎樣是「正常」,所以又整理的很多例子。想說簡報都整理了,就把這幾段重點再整理一下寫成文章,所以就有這篇囉。

google trends 是什麼?

  • 2006年 google 推出的工具
  • 可輸入關鍵字,觀察各國關鍵字搜尋熱度趨勢
  • 可觀察各區域的關鍵字搜尋熱度趨勢
  • 提供使用者針對該關鍵字的相關搜尋
  • 最早的資料從2004年1月開始記錄
  • 提供年度搜尋排行榜

他呈現的「趨勢」就是針對搜尋量。沒有別的了。跟網頁數量也完全沒有關係,他就是在統計使用者實際上搜尋的數量呈現出來的趨勢圖。

google 趨勢的主頁上有「每日搜尋趨勢」跟「即時搜尋趨勢」,兩者的差異是即時搜尋趨勢會同時呈現熱門新聞報導的數量。但是兩者的圖表還是分開的喔。後者是用灰色長條圖顯示。如下圖。

然後只要我們輸入關鍵字查詢的,都屬於每日搜尋趨勢。所以裡面不會另外顯示新聞報導數量長條圖,也不會有數據。就只有搜尋量的趨勢分佈圖。

google trends 的常見應用

大致可以分成這幾類(但當然不限於這些)

  • 關鍵字研究 / 搜尋排名操作分析
  • 品牌趨勢 / 產品趨勢 / 行業趨勢
  • 競爭對手分析

過去因為我要幫公司下廣告,所以偶爾會用 google trends ,主要是拿來作為挑選關鍵字跟決定怎麼操作關鍵字的依據。舉例來說,我之前的工作是幫公司賣手工醬油。所以我同時搜尋幾個可以算是有關聯的關鍵字如下圖。

依照這個趨勢我大概可以做幾個歸納:

  • 料理這個字最大,但包含的搜尋目的也比較廣,例如可能是想要吃某種料理,也有可能是自己要做料理。無論如何他都算是業內的「大字」,如果要操作或下廣告,難度會比較高,也比較貴,但帶來的流量也會比較多。這個時候我就會考慮多搜一些料理複合字,例如中華料理 / 日本料理 / 泰式料理等等。來決定之後經營網站內容的走向。
  • 食譜的這字比料理小,但還是比產品字要大得多。但是他的搜尋目的相較於料理已經收斂,醬油本來就是拿來做菜的,所以很適合操作食譜的相關關鍵字。

品牌趨勢 / 產品趨勢 / 行業趨勢  這三種我就截圖大概說明一下。因為品牌趨勢其實跟競爭對手分析本質差不多,我就算同一種。

品牌趨勢

可以看得出來可口可樂的曝光比百事可樂高,所以帶動的搜尋量也多。

產品趨勢

  • 電腦需求量逐年下滑
  • 2007年前電腦需求高於手機。2007~2010還在纏鬥,2010後,差不多就是智慧型手機需求開始起飛,於是手機的需求就逐年上升,但明顯從2016年開始就呈現飽和
  • 電視需求也逐年下滑,但沒有電腦來的嚴重。
  • 螢幕需求穩定且逐年緩慢上升。

行業趨勢

  • 2010/6 前有很高的網頁設計需求
  • 2010/6~2014/7 網頁設計需求下降到大致是2010/6 前的一半
  • 2014/7 後逐年下降

因為我算是這個產業的人,而且我從高中就開始接觸網頁設計,也正好對「網頁設計」這個字的搜尋結果差異很有感覺。所以這樣的搜尋趨勢我大概會這樣詮釋:早期因為人才少,且客製需求量大,所以有興趣學習這個技能的人也多,因此需要網頁設計跟想學網頁設計同時反映在搜尋量上,但當時搜網頁設計還會看到很多html的語法教學資料。現在因為人力多,網路各種簡單上手的網頁設計工具也多,而且技術分眾又變得更細,所以現在會打「網頁設計」要找的就是網頁設計公司比較多。但某個程度上應該也反映出市場對網頁設計的需求也是有下降的。

從關鍵字一探網路聲量變化

這裡就直接舉幾個例子,來看大眾媒體(主要是電視+廣播,報紙次之)對搜尋行為的直接影響。

姚文智的搜尋趨勢(2018/5/23~2018/11/23)

柯文哲的搜尋趨勢(2018/5/23~2018/11/23)

棒球的搜尋趨勢(過去5年)

服貿的搜尋趨勢(過去5年)

從這裡可以知道不管是人物還是事件,爆起的搜尋量都會跟大眾媒體是否有大量報導有很大的關聯性。

在談「異常」之前:「正常」搜尋行為模式有哪些?

有人質疑說大眾媒體報導本來就會帶來搜尋量,韓國瑜的爆量本來就很正常,有外力介入是在幻想。

大眾媒體報導本來就會帶來搜尋量,這點我完全不否認,上面的例子也都很明顯反映出這是事實。但我會判斷韓國瑜爆量有異常的原因是:雖然大眾媒體的報導確實會帶來搜尋量,但韓國瑜爆量的模式跟其他人,或是其他事件的模式差異太大,這才是我判斷他的爆量有問題的原因。我幾乎是一眼看到就覺得怪怪的,可是這件事如果沒有常常在看搜尋行為模式的人,老實說很難體會。

這篇不會討論韓國瑜搜尋模式哪裏異常,這個後面會另外專文再繼續寫。但是說「異常」以前,要先知道「正常」長怎樣,所以先來看看那什麼是「正常」的搜尋行為模式。我把常見的搜尋行為模式大致整理成以下幾個分類:

  • 週期性:暴衝型 / 堆疊暴衝型 / 穩定循環型
  • 長期穩定需求
  • 突發爆紅

直接看圖囉!

週期性:暴衝型 – 威力彩

威力彩四天開一次獎,所以搜尋量也很穩定的每四天就會衝一波。後面的階層暴衝是因為10月中開始一直累積彩金,所以後來每次的搜尋量一次比一次高。等到後來彩金被拿走的隔週就恢復到平常的搜尋量。

週期性:堆疊暴衝型  – 母親節

母親節是一年一個週期,所以要拉五年才看得出週期性。但這裡我說是堆疊暴衝的原因要把週期改成一年才看得出來。

這裡可以看得出來3月~4月搜尋量就逐漸上升。但一直從4月開始上升幅度才又提高,5月又會再提高。但到5月第二週一次衝到高峰後,不到5月底就下降到谷底。

這也反應使用者前面還在思考規劃母親節要送什麼或吃什麼,但到5月要確認下單的時候搜尋需求就會大爆發。

週期性:穩定循環型 – 週年慶

有在做電商或百貨業的人對週年慶一定都很熟悉。現在基本上大家都約定成俗的會在9月~12月會有一連串的週年慶活動。所以週年慶也是一年一個循環。

週年慶跟母親節最大的差異在於他維持的時間比較長,並不集中在某一天,每個商家的週年慶時間也會不同。只是都會落在9~12月。這段時間不管電視廣告平面媒體或是網路廣告,都會輪番上陣廣告週年慶的優惠,從線下到線上都有。所以可以看到從9月~12月這段時間,搜尋熱度是緩緩上升又緩緩下降。中間可能因為不同的電視媒體特別針對某些週年慶做廣告的時候,就會有幾波的暴衝點。但暴衝完都會回歸到暴衝前的基準點再略高一些,而不會一直撐在上面不掉下來。

長期穩定需求 – 日本

這類關鍵字的特點就是「大字」,代表搜尋目的本來就包含得比較廣。以「日本」來說,搜尋目的可能是要出去玩,或是只是想了解日本的相關資訊(文化 / 新聞 / 八卦)等等。這類字事實上如果更細的去分析還是會有週期,但不會像上述的特定關鍵字那麼強烈。

突發爆紅 – 蜂蜜檸檬 & 服貿

這裡直接舉兩個例子,一個是短期爆紅,一個是為期比較長一點的爆紅

蜂蜜檸檬

11/9 還是 0,11/10 電視辯論會後急劇上升,到 11/12 連三天爆衝,11/12 到100,接著就開始下滑。回到穩定低點是11/22後。為期13天。

服貿

318晚上佔領,319到達搜尋高峰。323發生佔領行政院事件,324再出現搜尋高峰。330反服貿遊行,因為遊行前就開始集結,所以當天搜尋量也最高。後面就持續下滑。4/18(4/10出關後8天)回到相對搜尋低點。從爆量回到低點為期約1個月。

常見的搜尋模式大概有這些。關於「異常」的部分,之後再另外寫文囉。