餘裕

前幾個禮拜大侄子發燒感冒,一來就在沙發上睡覺,睡了幾乎一整天。後來中間醒來吃藥,吐了。因為吐到棉被褲子衣服,但是因為他本來來就沒有要過夜,所以他爸媽也沒多帶他的衣服來。當時他爸媽外出。所以我爸媽跟老妹就分頭洗衣服洗棉被然後要快速吹乾,然後讓他暫時先直接穿外套。

大侄子身體還是很不舒服,套著外套沒有穿褲子,在那裡哭鬧,說為什麼有帶弟弟的衣服卻沒有他的(其實是都沒有帶)。我這時候從房間走出問怎麼了,才知道狀況。後來就帶他到和室去安撫他睡覺。

事後我妹就說他們負責處理事故現場,我負責處理大侄子的心事。

我在想的只是,如果今天這所有的事情都落在一個媽媽身上。那多累多辛苦。我可以很悠哉地處理他的心事,那也只是因為我不用去處理其他事,所以有那個空間跟時間。那當父母照顧小孩因為資源與時間不足,而沒有這個餘裕的空間的時候,他們又能如何處理小孩的心事呢?

這幾天晚上陪小姪子畫圖,我也是在想,那是我晚上回來陪到他睡覺就好,所以我可以很有耐心陪他畫圖跟他聊天陪他玩。重點是只有幾天,不是長期。資源不夠的,或是沒有家庭成員支持的小家庭,要如何能有這種餘裕?

有沒有餘裕的背後,是滿滿的階級複製。有多餘的資源才能累積資源。而累積了資源才有機會做階級翻轉。但累積的資源同時也會造就階級複製。

我不談有餘裕卻不用有餘裕的方法養小孩的那種事,那就是有得選卻不這樣選,是父母的問題。真正的貧窮沒有餘裕,是你真的得為生活奔波到幾乎沒得選。

所以為什麼民主是有人富起來以後才有的東西,沒有餘裕,長不出民主。

我說的餘裕不等於富裕,但他確實需要資源的支持才能夠有。

從網站流量來源是使用桌機還手機的百分比,可以看到哪些事?

會寫這篇文章,是前幾天看到臉書牆上有人說「現在這個世代不要再用桌面版看視覺呈現,光你在看這篇貼文基本上 80% 的機會是用手機看的,為什麼你會覺得你的受眾多數時間會用電腦看你的活動頁跟商品頁」。後來我在我自己牆上murmur了一陣子,加上朋友留言後有一些討論覺得還不錯,想說還是順手多找些其他資料,就整理一下發個文留作紀錄吧。

先說我個人對開頭那段話不認同的原因,大家可以試圖回答這個問題:哪些因素會影響一個網站被使用手機平板與桌機瀏覽的比例?

當時我只想到至少有一個原因,不過後來整理數據發現可能的原因有更多,其他我後面再說,這裡先說第一個原因:你用什麼方式導流,會大大影響你這個站被用甚麼裝置觀看的比例。

現在很多網站的主要導流都只靠臉書,而很多人使用臉書的習慣都是用手機或手機app,那從臉書在導流到自己賺上,那網站的手機瀏覽比例超級高其實只是剛好。

我不是在否認手機瀏覽在整體使用趨勢是每年增高,後面我會再提到一些分析。我只是要提醒,手機瀏覽比例超級高,例如高到80%以上,可能也意味你網站的導流途徑太單一了,其他的來源過低才顯得用手機看的人超級多。

好了,那我就在想,所以一個網站的手機流量佔比多少才算「健康」「合理」?正好我手邊還有幾個站,類型差異也很大,很適合拿出來比較,整理出以下數據。以下比例由左而右順序是「行動裝置包含平板電腦: 桌機」。時間代表網站上線至今多久,以下數據是我從該站開站到今天的統計,用GA跑出來的數字計算的結果。

  • 網站A(商業網站 / 一年):
    57.51%:42.49%
  • 網站B(商業網站 / 兩年):
    71.94%:28.06%
  • 網站C(商業網站 / 兩年):
    58.35%:41.65%
  • 網站D(開放資料 / 兩個月):
    76.41%:23.59%
  • 網站E(開放資料 / 四年):
    49.98%:50.02%
  • 網站F(人民團體 / 四年):
    50.00%:50.00%

我手上沒有一個站用手機瀏覽有到80%的。當然我不否認還是可能有網站因為他產業屬性的關係,可能他的網站流量真的會到80%都是手機瀏覽,但至少我手上的商業網站裡面,A屬於藝文類,B是心理諮商,C屬於鋁門窗業。只有心理諮商手機流量比較高有將近72%。

B網站搜尋流量佔了62%,而即使是把搜尋流量單獨抽出來看,行動裝置比桌機也是70%:30%,顯示搜尋這類關鍵字的人,習慣使用的載具以行動裝置比較多。

然後是D網站,這個站當初選前導流完全靠臉書,所以有近77%流量是手機瀏覽。這也應證我之前說如果你流量來源大量都是FB,你手機流量會特別高只是剛好。

但很有趣的是網站F,他網站總流量來源,有52%都是臉書來的。但是他單純臉書流量行動裝置:桌機,卻約略是60%:40%。所以加上其他來源總計,反而變成50%:50%。代表他的使用者即使使用臉書的,也至少有40%還是使用桌機。

在流量來源「有兼顧社群跟搜尋引擎」的前提下,這可以得到幾個結論

  1. 手機瀏覽數佔有至少50%以上,所以做網站必須要同時考慮手機。
  2. 不同產業,手機流量佔比數的差異還是會很大,原因應該是因為不同的使用需求 / 使用者年齡,會對應到不同的搜尋載具使用習慣,因此影響流量統計的結果。而佔比數不同,你就得考慮要怎樣設計才能同時讓桌機跟手機都有很好的使用性。
  3. 即使流量從FB來,不同產業 / 主題的使用者,使用FB時習慣用的載具差異還是很大。

然後後來幾個朋友提供了他們手上站的數據給我。

  • 網站G:73% 手機
  • 網站H:最近七天 13% 手機, 1.5 平板 , 85.5% 桌機
  • 網站I:行動裝置比例 66.23%

朋友提到網站G是一個診所的網站。我比對結果發現73%這數字,這跟我手上心理諮商診所的網站流量分佈很相似,而我手上這個站他不管來自關鍵字搜尋,或是外站導流(主要是FB)整體都是手機大大多於桌機(至少27%以上)。我在想會不會是因為通常有這方面需求的人,是想到要搜的狀態都正好不會是在電腦前,而是類似例如在車上,在床上,在顧小孩等等。而這些情境只能用手機上網。所以不管是來自於FB導流也好,或是關鍵字搜尋也好,手機流量都比較多。

但是像網站E,這個站的自然搜尋就還是桌機多於手機(但也只差了13%,所以手機流量還是很多的)。也許代表人在搜某些資訊的時候,在有電腦的情境下會想到要搜,例如上班時間突然看到一個新聞想google一下這類的,但如果是看新聞想google,可能也會同時發生在坐車無聊滑手機的時候,所以也有一定程度手機的搜尋量。

而朋友的網站H是一個 有關 android 程式開發的說明索引網站。他搜尋量有85.5%是桌機我猜有幾個可能的原因:

  1. 主題:這個站看起來像是一個給開發者查資料用的資料索引網站。所以本來使用者比較多就會是在用桌機的時候用這個站
  2. 網站本身的版面優化:我用手機看的時候他版面跟桌機是一樣的,這個應該也會影響到他在手機上被搜尋的排名。

不過我覺得應該1的影響比較大。然後朋友回我說「阿宅才用桌機, 一般人用手機 XDDDDD」,雖然乍看之下很好笑,但我是覺得蠻有道理的。

另外朋友也提到「不過很多人搜尋用手機, 訂購用桌機倒是真的」,這點我也很認同。

這其實跟台灣使用電腦習慣的歷史有很大的關係,因為台灣人早期上網從桌機開始,很多人已經很習慣桌機的使用,所以手機的轉單率偏低,主要原因就是使用習慣,因為訂購要填資料比較多,還是覺得用桌機填比較方便。

幾年前我有去聽過一些講座,提到像印度跟中國的手機轉單率很高。後來有人猜測主要原因是當地很多人第一次上網用的就是手機,所以當然直接用手機做所有操作,包含下單,所以他們的手機轉單率自然會高。

台灣的話,我猜一接觸網路就用手機的人,使用習慣應該也會朝向習慣直接用手機下單,但也因為這個背景不同,所以反而在台灣設計網站,更得同時顧及桌機跟手機。

寫到這,回到一開始我提出的問題:哪些因素會影響一個網站被使用手機平板與桌機瀏覽的比例?

以上述內容至少可以歸納出幾項

  1. 網站本身的主題:要找技術主題跟生病要找診所,本身的使用情境可能就有不同,因此會影響到使用者用什麼設備上完來找資料。
  2. 網站的主要使用者:這跟1算是有關聯,網站主題會影響實際使用的TA,不同的TA使用習慣不同,習慣用來搜尋的設備也會不同。
  3. 用什麼方式導流:導流的媒介網站本身,使用者是習慣使用手機看還是桌機看?如果是使用手機多,例如FB,或是line,那導過來的流量手機自然也會多。

然後我找了幾個跟上述網站相關的關鍵字丟去 google ads 看了以下數據趨勢圖,並列出他們12月的總量跟行動裝置搜尋數量級,以下所有圖表藍色是總計,紅色是行動裝置。
鋁窗
總計:1600
行動裝置:834(52.12%)

心理諮商
總計:9900
行動裝置:6840(69.09%)

診所
總計:165000
行動裝置:117990(71.5%)

很有趣的是「心理諮商」跟「診所」兩個字的google搜尋量中行動裝置分佈,正好跟我手上心理諮商網站以及朋友的診所網站的結果算是很相近。

黃國昌
總計:74000
行動裝置:42141(56.94%)

林岱樺
總計:8100
行動裝置:4491(55.44%)

上述兩個立委的搜尋量分佈,也跟網站E,一個做國會監督的網站的流量分佈很相近。

綜合上面所有數據簡單歸納出幾個點

  1. 目前大部分跟商業有關的關鍵字,手機版流量確實至少都佔有50%以上,所以設計上必須要同時兼顧桌機跟手機
  2. 在流量來源健全且主要使用者的使用習慣不是使用手機的前提下,手機來的流量佔比大概在50%~67%之間
  3. 但即使主要透過手機導流(不管這個主要是來自於使用者習慣,還是使用導流方式造成的),手機流量佔比大概最多在70~78%之間。

2的部分有沒有可能超過80%?我很努力的想了一些關鍵字丟google ads,絕大部分都在70%以下,終於讓我找到幾個個關鍵字手機搜尋量超過80%的,跟幾個長期手機佔比很接近80%的。

計程車(這是一整年都超過80%的)
總計:40500
行動裝置:32410(85.69%)

減肥(只有11月的超過80%,10月有79.93%)
總計:40500
行動裝置:32410(80.02%)

徵信(只有11月的超過)
總計:12100
行動裝置:10251(84.71%)

按摩
總計:110000
行動裝置:84727(77.02%)

憂鬱症
12月
總計:40500
行動裝置:31377(77.22%)

歸納上述資料,可以推論單一網站的流量手機可能超過80%的原因如下

  1. 你的網站主題屬於計程車相關,因為叫車在路上叫的機率最大,這時候用手機搜尋的需求大,如果你特站排名又前面的時後,手機流量超過80%也是非常合理的。
  2. 你的網站主題屬於減肥,徵信,按摩,或跟精神疾病門診有關,然後網站要有一大部分流量來自FB導流。
  3. 你的網站主要TA是一出生就接觸手機的世代。
  4. 你的網站本身流量組成就不夠豐富,過度依賴FB導流:
    如果你的網站主題不在上述,且用google ads搜尋確認相關關鍵字手機版流量在80%以下,而你的網站手機流量卻在80%以上。那代表網站本身流量組成就不夠豐富,完全沒有吃到自然搜尋來的量。如果是這個,你該想的是怎麼豐富你的流量來源,想辦法改善SEO,而不是相信只要顧手機就好了。

那整體手機流量還有可能在持續上升嗎?我的判斷是現在應該已經到某個程度的飽和了,雖然還是會穩定微幅上升,但已經不會有爆發式的成長了。判斷來自於這張google趨勢圖。

2011年3月~2014年2月是手機的狂飆年代,當時也是智慧型手機興起的時候,所以這階段手機流量增多也是很正常的事情。2014年2月~2015年11月穩定高峰,2015年11月後穩定下降,代表需求已經飽和,大概能買智慧型手機的人都已經買了而且不只一支。所以我看不太出來整體手機流量有什麼理由再像2011年3月~2014年2月這段時間一樣有猛爆式的增長,但還是會持續穩定增長,原因是新世代的小朋友第一次上網應該都是用手機,以及越來越多長輩也跟著用智慧型手機。

但這裡要注意到,整體手機流量逐漸趨近飽和或沒有跳躍式增長,跟你的網站手機流量飽和了沒是兩件事喔。

另外這是上述某一個網站這幾年的使用者分佈。橘色是行動裝置含平板,綠色是桌機。

簡單來說,如果你搜尋引擎的流量有經營起來,你會發現手機流量+桌機流量都是逐年上升。這代表並不是手機搜尋量「取代」了桌機搜尋量,而是人花更多的時間在搜尋上,這些流量是過去所沒有的。既然兩種流量都在上升,那要做的不是只考慮手機看,而是桌機手機都得兼顧。

特別整理這篇,其實我主要的感想是:

  1. 數字不要亂喊。
  2. 亮數據做為說法的時候必須要很小心,有時候誰是因誰是果詮釋結果就差很多。
  3. 你的受眾也許多數時間會用手機看資料,但用桌機看的一樣不少,而他們會用桌機下單。
  4. 網站呈現只顧桌機固然是偏見,但只管手機也是偏見。醒醒吧,這就是一個桌機手機呈現都要顧的時代,就像過去有段時間做網頁設計要同時顧及IE6一樣。
  5. 不管是哪個神人說的話,如果心裡有疑問,試著自己去查資料驗證吧。不要那麼容易相信誰說得一定沒問題。這幾年已經看太多神人被請下神壇了。

認真說我也沒有要嗆人,只是最近驗證數據到有點上癮,既然這是自己可驗證的,已經認真整理數據了,就寫出來給大家參考參考囉。

SEO講師沒有用無痕視窗解說不專業嗎?

好幾天前看到幾個創業網紅在嗆用關鍵字看排名沒用無痕視窗,中間問朋友才知道他們在嗆誰,又聽到一些事,只覺得商場啊人性啊…

總之針對無痕視窗的問題想講幾件事:

  1. 自己在檢查SEO操作成效的時候,確實要用無痕視窗來檢查。
  2. 上課或講座的場合提到操作成效,要開畫面做說明的時候,用不用無痕視窗其實沒差。

自己操作要用無痕視窗檢查的原因,是因為真的在做追蹤的,定期都要做,做追蹤也一定是用自己的電腦,如果自己曾經查過相關關鍵字也有做點擊過,那自己電腦查到的排名就有很大可能會跟別人查到的不同,那又不可能每次檢查都要清除一次cookie跟登出帳號,所以都會直接用無痕視窗,這樣查出來的排名才會準。

而乍看之下2跟1好像相衝,但我會這樣說的原因很簡單:

  1. 有時候講課用的不一定是自己的電腦,在這種狀況下沒開無痕本來就也沒差。因為講課的電腦有很大機率不會是查過自己操作的那些關鍵字,那沒開無痕基本上查詢的結果差異不會太大。
  2. 退一萬步來說就算用的是自己電腦,如果不是排名真的有操作上去,底下學生自己用自己電腦一查也就露餡了。就是有自信知道是有操作上去,也不怕學生自己驗證,所以用不用無痕就根本沒差。

但是如果不懂或是懂一點點,可能看這樣寫好像很厲害,以為這樣的說法是什麼大發現。而我只覺得抓著一個在不同情境下可有可無的技術小辮子說那些,那也不過代表能力也就那樣而已。

一個關於決定要不要做手機網站的故事

這是發生在我前前公司的事,一開始進去的前半年我們做了一個新的購物站(做好大概是2013年),到了隔年2014年又決定要多做手機版,當時做法是用大小網的方式做。然要來說的就是為什麼當時決定要做手機版,又為什麼是選擇大小網的做法。

雖然iphone第一代在2007年就上市了,但至少就我個人,有網站要做手機版的概念要到2013年,真的開始認真學怎麼做RWD網站,也已經是2015年的事。在2014年以前,我做的網站都只有桌機版,沒有手機版,也沒有RWD,那時候甚至也還沒有什麼前後端工程師的區隔。當然我開始接觸RWD的技術時,已經算很晚了,台灣大概2012年開始就有一些RWD的站,那時候國外RWD已經算顯學了,但當時在台灣並不算普遍。

當時公司的購物網站是從2012年開始規劃開工,2013年完成,那時候網站來自手機的流量並不算到很多。加上我陸續也有去聽一些講座,有些大企業走的比較前面已經有做手機版了,普遍聽到都是手機版的轉單率很低,低到行銷人員都懷疑在這裡施力到底對不對。所以一直覺得還沒有做手機版網站的必要,畢竟人力有限。但是就在2014年後,手機版的流量逐年快速上升,半年前可能還只有不到1成,半年後已經2成快3成,而且看起來還在持續升高中。看這態勢變成就算轉單率還拉不起來,手機版勢必都要做,只是何時做跟怎麼做的問題。

會選擇大小網的做法有幾個原因:
1.大網才經營不到一年,現在就打掉似乎也有點浪費
2.桌機原本可以看的範圍就比較大,還是希望塞多一點資訊
3.我當時還不會RWD網站的做法

所以後來就做了大小網。當然等我後來離職然後網站被收掉那又是另外一件事了。

我要說的是,一個公司如果他現在才要做網站,那直接說服他們做RWD基本上可以說沒有懸念。但如果他有一個舊的網站,改版不只是技術問題,有時候會大大牽扯到公司內部政治角力(我當時算是沒有,但我也有聽說朋友的公司有這樣的狀況)。還有改版真的有利嗎?(就像我前面寫的,手機版的轉單率很低)這些都想清楚了,才有可能來看怎麼改版。

特別是「改版真的有利嗎?」這點要說服老闆的時候,完全不能只靠膝反射的直覺。你必須得拿相關證據去證明我們現在應該要切入。畢竟站在老闆的立場,就是要他現在拿一筆錢來做新網站,而大部分的老闆都還是會有「網站明明還可以用,為什麼要改?」的想法,你如果站在他們的年紀跟要面對的問題去看,他們會這樣想其實也很自然。

選舉網路聲量操作:特定關鍵字搜尋量操作可以達成哪些目的?

前面已經寫了很多篇關於搜尋量趨勢異常跟實際搜尋量級的異常。看完很多人的疑問是:所以操作關鍵字搜尋量到底可以幹嘛?

我自己本身之前是做網路行銷,比較偏向網站SEO操作多一點。所以我主要會從SEO的角度來看這件事。不過後面也會提供就我所知搜爬可以做的應用,串起來的可能性給大家參考。

先從SEO的角度來看,用比較簡單的一句話大概就是:透過搜尋量加上其他操作,決定你搜尋某些關鍵字時可以看到的資訊。

有人會反駁,他搜韓國瑜看到的資訊有好有壞,農場文也根本沒有排在前面,所以我這樣的假設不成立。但會有這樣的看法其實是對 SEO 有幾個誤解:

  1. 操作訊息排名一定是把「有利自己的資訊」給大家看得推到前面
  2. 操作搜尋排名等於要把農場文推到前面

但其實操作SEO有正向操作,跟反向操作。正向操作比較直覺,就是把希望大家看的資訊推到前面。例如我經營電商,那我就會希望大家搜尋某些產品關鍵字的時候,我的電商網站可以排名前面一點,使用者就比較有機會在我網站下單,進而得到商業利益。

那反向操作呢?反向操作就我所知至少有幾種:

  1. 用作弊操作的方式讓別人排名前面的網頁變成黑名單
  2. 把負面評價的網頁排名往後洗,讓別人看不到

而其實要做反向操作要用到的搜尋量跟整體投入資源要比正向操作多很多。

以1來說,就是用不正當的搜尋排名操作方式,讓google認為有不正當且明顯的人力介入,進而把網站 ban 掉。

以2來說,舉公投的例子,當搜尋公投排名前面都是愛家公投的資訊比較多的時候,人的決策行為其實很容易受到自己對這個資訊的第一印象所影響,那當看到愛家公投的資訊比較多,以一個對這個議題本身還沒有太多看法只是好奇的人來說,就有可能影響他對這個議題的看法走向。另外如果翻了兩三四頁都看不到其他差異比較大的資料,也會營造出「那應該大部分的人都這樣想這樣看這件事」的印象。

再舉韓國瑜為例子,因為媒體已經配合產出大量的內容,所以農場文只是用來做輪轉式網站SEO操作用,本身的排名不重要,他只是拿來助攻用。而新聞內容不一定要是加分,只要是只是在操作印象,而不是進一步要引導聽閱者思考或質疑的內容,都可以讓這些內容盡量都排名在前面。這樣就可以把一些比較有內容的分析文章往後擠。

於是當有人在line群這類封閉群組傳送的訊息,有人希望可以針對資料做一些基本查證的時候,會因為不容易找到相關資訊就放棄繼續查證或協助澄清。即使有人想要找資料也很難找,也會比較容易被容易找到的資訊影響決策。

另外,從會影響搜尋熱度的行為來看,會影響搜尋熱度的來源大致有兩個

  1. 真人的搜尋行為
  2. 機器的搜尋行為

2常見於網頁內容爬蟲的應用上。而跟搜尋行為有關的商業應用至少就有這幾項

  1. 搜尋結果網頁排名
  2. youtube影片排名
  3. 資料蒐集
  4. 情資分析
  5. 自動下注

所以如果先以直線思考來看,理論上可以做到類似這樣的影響

之前其實就聽過實體賭盤對投票意願的影響,所以透過影響賭盤來影響選舉也不無可能,不過這部分純粹是我從搜爬應用推斷的一種可能性。

當然,我必須承認操作搜尋量的實際影響其實很「幽微」,他要搭配的是一連串使用者「為什麼要做關鍵字搜尋 / 搜尋後可能影響到哪些行為」一起做考量。但搜尋量異常是事實(相關分析與數據請見「選舉觀察part6:「韓國瑜」與其他候選人搜尋行為差異比較與搜尋量解析」「實際月搜尋量及數據整理」),我認為這次大力介入網路的人,他們是在測試練兵,同時也在這個過程建立網路影響行為的關聯性調查。

我為什麼敢做這樣的推論呢?因為中國目前針對網站使用者行為調查比台灣成熟很多。以掏寶為例子,他們是有專門使用者行為調研的部門,在每次細節改版調整的時候收集數據分析影響轉單率多少,他們的使用者行為調查是做得很細的。「實驗」的說法不是無中生有,因為他們在商業上都已經在這樣做了,用在政治上只是小菜一碟而已。

選舉觀察part6:「韓國瑜」與其他候選人搜尋行為差異比較與搜尋量解析

這篇拖到現在才寫的原因是我一直在等 google ads 裡面 11 月搜尋量的資料。等到今天終於有了,也就是說 google ads 要到下個月11日以後才能查得到上個月的搜尋量。先講結論,這篇文章算是一半自打臉的文章。但另外一半也證明我之前的部分推論是正確的。

  • 自打臉的部分是:韓粉主要還是在台灣。美國也有韓粉,但還是沒有台灣的多。
  • 證明正確的部分是:韓國瑜的實際搜尋量確實有異常,而有趣的是全球都異常,不是只發生在台灣。

然後另外這篇會更詳細的分析「正常候選人會有的使用者搜尋行為」,由此可以看出韓國瑜的使用者搜尋行為異常。

「正常」的候選人搜尋行為模式是什麼?

我在寫『選舉觀察part5:「公投」使用者搜尋行為差異分析』跟『google trends 常見應用與使用者搜尋模式分析』一直在強調一件事:搜尋熱度異常不是只有看「爆量」,還要同時看「搜尋行為模式」是否也有異常。兩者同時發生才能推論有異常。

所以在看「異常」以前,要先來看「正常」的候選人搜尋行為模式有哪些。現在因為選完有一陣子了,所以可以直接把當選的候選人在選完後跟選前的搜尋模式一起列出來比較。

2008年馬英九搜尋趨勢(台灣)

2008年馬英九搜尋趨勢(美國)

2012年蔡英文搜尋趨勢(台灣)

2012年蔡英文搜尋趨勢(美國)

2014年柯文哲搜尋趨勢(台灣)

2014年柯文哲搜尋趨勢(美國)

2018年柯文哲搜尋趨勢(台灣)

2018年柯文哲搜尋趨勢(美國)

2018年盧秀燕搜尋趨勢(台灣)

上面幾個搜尋趨勢有幾個共同特色

  • 爆量點都是選舉當天
  • 爆量點至少是前面兩個禮拜(扣除爆量)平均搜尋量至少3倍以上
  • 搜尋量大幅度攀升都發生在選舉日前1周。
  • 選舉當地的搜尋量變化
    • 在選舉前2~2.5個月內有逐步增加的狀況,但增加幅度相較於爆量都是比較緩慢堆疊的。
    • 選後三天搜尋量會急劇下跌,2週後回到相對低點

那只有台灣的搜尋行為才是如此嗎?我們來看看美國總統選舉的搜尋行為是如何。

2008年歐巴馬

2012年歐巴馬

2016年川普

除了中間可能會因為事件發生有短暫的震盪,且震盪後很快都會回到相對低點。整體的搜尋行為模式跟台灣的搜尋行為模式是一致的,特色也是相同的。

事實上搜尋行為被大眾媒體,特別是電視媒體傳播的影響是很明顯的,從搜尋特色的以下這三點來看

  • 搜尋量大幅度攀升都發生在選舉日前1周。
  • 在選舉前2~2.5個月內有逐步增加的狀況,但增加幅度相較於爆量都是比較緩慢堆疊的。
  • 選後三天搜尋量會急劇下跌,2週後回到相對低點

這同時也與電視播放候選人的新聞密度相符合。

神奇的「韓國瑜」搜尋模式

有人會說,韓國瑜新聞那麼多,搜尋量大很正常。那我們來看看韓國瑜在台灣跟美國的搜尋量吧。

2018年韓國瑜(台灣)

2018年韓國瑜(美國)

  • 假設韓國瑜的搜尋量多真的全部都是由電視媒體的大量曝光帶來的。但這個理由拿來解釋美國的搜尋量變化是否合理呢?我是覺得不合理。
  • 其他人都明顯在選舉當天有個爆衝點,韓國瑜的暴衝點相對於他自己前面的流量顯得非常不暴衝。
  • 2.5個月內的搜尋量堆疊模式跟其他候選然完全不同。呈現一種很穩定的上升。連中間的爆發流量都顯得頻率很一致。

而且理論上韓國瑜如果呼聲真的那麼高,前面搜尋量真的那麼大,理論上選舉當天的量應該會爆高,但是如果把韓國瑜跟柯文哲的搜尋熱度放一起來看會發現…

柯文哲單日搜尋熱度還高於韓國瑜最高點再多25點以上。

依照韓國瑜這種搜尋行為堆疊的搜尋量,理論上實際搜尋量應該會很誇張。而依照我從 google ads 撈出來的結果,真的很誇張。因為數據很多,我直接用google sheets來整理。大家有興趣看數字的可以到這裡看

這個表裡面,除了顯示實際搜尋數量的量級數字外。我另外在後面計算了每個月跟上一個月相除後的數字,看看這個月跟上個月的量級增加了幾倍。

我這裡直接整理結論。

  • 在台灣的搜尋量級10月/9月的倍數,其他市長當選人落在1~2倍之間。只有韓國瑜在7倍以上。
  • 在台灣的搜尋量級11月/10月的倍數,其他市長當選人落在3~5倍之間,只有韓國瑜不到2倍。
  • 其他市長當選人在各國的搜尋量10月/9月的倍數,都落在1~3倍之間。只有韓國瑜大多落在5~10倍(法國除外)。
  • 其他市長當選人在各國的搜尋量11月/10月的倍數都落在3~7倍之間。只有韓國瑜在1~3倍之間。
  • 韓國瑜的搜尋量級在10月已經到達7位數 2240000,11月更高達 4090000。柯文哲11月還是6位數 450000,11月到7位數也才1500000。而普悠瑪事件發生在10月,當月搜尋量最高7位數也只有到 1220000
  • 10月普悠瑪事件發生,當月美國韓國瑜搜尋量級 90500,普悠瑪搜尋量級只有 14800。美國台人對普悠瑪的興趣比韓國瑜低?不可思議。
  • 韓國瑜的搜尋異常很一致的發生在各國。但主要最大搜尋量級還是在台灣。

所以韓國瑜的搜尋熱度毫無疑問是有異常的,不過美國韓粉確實沒有我以為的比台灣多。而這樣的異常即使經過 google ads 整理過的數據還是可以很明顯地看得出來。


下面是額外的紀錄。是在寫這篇的時候有觀察到 google trends 與 google ads 兩邊資料有落差的現象,在這篇記錄一下我的觀察。

有的關鍵字12個月搜尋熱度在google trends  相互比較的時候,「捷運」比「台鐵」高,但是最後在 google ads 查到的12個月搜尋量「台鐵」卻都比 「捷運」高。我自己的判斷是因為 google ads 提供的是商業下廣告的評估依據,他的準確度論上應該要更高,並且前一個月的搜尋量並不是一到隔月1日就釋出,而是隔了10天以後才有,應該表示 google trends 的資料比較即時,但針對搜尋行為過濾的條件比較少。而 google ads 過濾的條件可能比較多,所以有的字如果比較容易讓單一使用者短期內重複搜尋,可能在 google trends 顯示的熱度會比較高,但在更嚴謹的把同一使用者短時間重複搜尋行為過濾掉後,才是 google ads 那裡會呈現的數字。

google trends 常見應用與使用者搜尋模式分析

因為之前的文章,這禮拜被邀請去分享。考慮到聽的人可能不一定知道什麼是google trends 。所以有特別整理一份簡報,從什麼是 google trends 開始介紹。後面因為要分析「異常」之前,要先知道怎樣是「正常」,所以又整理的很多例子。想說簡報都整理了,就把這幾段重點再整理一下寫成文章,所以就有這篇囉。

google trends 是什麼?

  • 2006年 google 推出的工具
  • 可輸入關鍵字,觀察各國關鍵字搜尋熱度趨勢
  • 可觀察各區域的關鍵字搜尋熱度趨勢
  • 提供使用者針對該關鍵字的相關搜尋
  • 最早的資料從2004年1月開始記錄
  • 提供年度搜尋排行榜

他呈現的「趨勢」就是針對搜尋量。沒有別的了。跟網頁數量也完全沒有關係,他就是在統計使用者實際上搜尋的數量呈現出來的趨勢圖。

google 趨勢的主頁上有「每日搜尋趨勢」跟「即時搜尋趨勢」,兩者的差異是即時搜尋趨勢會同時呈現熱門新聞報導的數量。但是兩者的圖表還是分開的喔。後者是用灰色長條圖顯示。如下圖。

然後只要我們輸入關鍵字查詢的,都屬於每日搜尋趨勢。所以裡面不會另外顯示新聞報導數量長條圖,也不會有數據。就只有搜尋量的趨勢分佈圖。

google trends 的常見應用

大致可以分成這幾類(但當然不限於這些)

  • 關鍵字研究 / 搜尋排名操作分析
  • 品牌趨勢 / 產品趨勢 / 行業趨勢
  • 競爭對手分析

過去因為我要幫公司下廣告,所以偶爾會用 google trends ,主要是拿來作為挑選關鍵字跟決定怎麼操作關鍵字的依據。舉例來說,我之前的工作是幫公司賣手工醬油。所以我同時搜尋幾個可以算是有關聯的關鍵字如下圖。

依照這個趨勢我大概可以做幾個歸納:

  • 料理這個字最大,但包含的搜尋目的也比較廣,例如可能是想要吃某種料理,也有可能是自己要做料理。無論如何他都算是業內的「大字」,如果要操作或下廣告,難度會比較高,也比較貴,但帶來的流量也會比較多。這個時候我就會考慮多搜一些料理複合字,例如中華料理 / 日本料理 / 泰式料理等等。來決定之後經營網站內容的走向。
  • 食譜的這字比料理小,但還是比產品字要大得多。但是他的搜尋目的相較於料理已經收斂,醬油本來就是拿來做菜的,所以很適合操作食譜的相關關鍵字。

品牌趨勢 / 產品趨勢 / 行業趨勢  這三種我就截圖大概說明一下。因為品牌趨勢其實跟競爭對手分析本質差不多,我就算同一種。

品牌趨勢

可以看得出來可口可樂的曝光比百事可樂高,所以帶動的搜尋量也多。

產品趨勢

  • 電腦需求量逐年下滑
  • 2007年前電腦需求高於手機。2007~2010還在纏鬥,2010後,差不多就是智慧型手機需求開始起飛,於是手機的需求就逐年上升,但明顯從2016年開始就呈現飽和
  • 電視需求也逐年下滑,但沒有電腦來的嚴重。
  • 螢幕需求穩定且逐年緩慢上升。

行業趨勢

  • 2010/6 前有很高的網頁設計需求
  • 2010/6~2014/7 網頁設計需求下降到大致是2010/6 前的一半
  • 2014/7 後逐年下降

因為我算是這個產業的人,而且我從高中就開始接觸網頁設計,也正好對「網頁設計」這個字的搜尋結果差異很有感覺。所以這樣的搜尋趨勢我大概會這樣詮釋:早期因為人才少,且客製需求量大,所以有興趣學習這個技能的人也多,因此需要網頁設計跟想學網頁設計同時反映在搜尋量上,但當時搜網頁設計還會看到很多html的語法教學資料。現在因為人力多,網路各種簡單上手的網頁設計工具也多,而且技術分眾又變得更細,所以現在會打「網頁設計」要找的就是網頁設計公司比較多。但某個程度上應該也反映出市場對網頁設計的需求也是有下降的。

從關鍵字一探網路聲量變化

這裡就直接舉幾個例子,來看大眾媒體(主要是電視+廣播,報紙次之)對搜尋行為的直接影響。

姚文智的搜尋趨勢(2018/5/23~2018/11/23)

柯文哲的搜尋趨勢(2018/5/23~2018/11/23)

棒球的搜尋趨勢(過去5年)

服貿的搜尋趨勢(過去5年)

從這裡可以知道不管是人物還是事件,爆起的搜尋量都會跟大眾媒體是否有大量報導有很大的關聯性。

在談「異常」之前:「正常」搜尋行為模式有哪些?

有人質疑說大眾媒體報導本來就會帶來搜尋量,韓國瑜的爆量本來就很正常,有外力介入是在幻想。

大眾媒體報導本來就會帶來搜尋量,這點我完全不否認,上面的例子也都很明顯反映出這是事實。但我會判斷韓國瑜爆量有異常的原因是:雖然大眾媒體的報導確實會帶來搜尋量,但韓國瑜爆量的模式跟其他人,或是其他事件的模式差異太大,這才是我判斷他的爆量有問題的原因。我幾乎是一眼看到就覺得怪怪的,可是這件事如果沒有常常在看搜尋行為模式的人,老實說很難體會。

這篇不會討論韓國瑜搜尋模式哪裏異常,這個後面會另外專文再繼續寫。但是說「異常」以前,要先知道「正常」長怎樣,所以先來看看那什麼是「正常」的搜尋行為模式。我把常見的搜尋行為模式大致整理成以下幾個分類:

  • 週期性:暴衝型 / 堆疊暴衝型 / 穩定循環型
  • 長期穩定需求
  • 突發爆紅

直接看圖囉!

週期性:暴衝型 – 威力彩

威力彩四天開一次獎,所以搜尋量也很穩定的每四天就會衝一波。後面的階層暴衝是因為10月中開始一直累積彩金,所以後來每次的搜尋量一次比一次高。等到後來彩金被拿走的隔週就恢復到平常的搜尋量。

週期性:堆疊暴衝型  – 母親節

母親節是一年一個週期,所以要拉五年才看得出週期性。但這裡我說是堆疊暴衝的原因要把週期改成一年才看得出來。

這裡可以看得出來3月~4月搜尋量就逐漸上升。但一直從4月開始上升幅度才又提高,5月又會再提高。但到5月第二週一次衝到高峰後,不到5月底就下降到谷底。

這也反應使用者前面還在思考規劃母親節要送什麼或吃什麼,但到5月要確認下單的時候搜尋需求就會大爆發。

週期性:穩定循環型 – 週年慶

有在做電商或百貨業的人對週年慶一定都很熟悉。現在基本上大家都約定成俗的會在9月~12月會有一連串的週年慶活動。所以週年慶也是一年一個循環。

週年慶跟母親節最大的差異在於他維持的時間比較長,並不集中在某一天,每個商家的週年慶時間也會不同。只是都會落在9~12月。這段時間不管電視廣告平面媒體或是網路廣告,都會輪番上陣廣告週年慶的優惠,從線下到線上都有。所以可以看到從9月~12月這段時間,搜尋熱度是緩緩上升又緩緩下降。中間可能因為不同的電視媒體特別針對某些週年慶做廣告的時候,就會有幾波的暴衝點。但暴衝完都會回歸到暴衝前的基準點再略高一些,而不會一直撐在上面不掉下來。

長期穩定需求 – 日本

這類關鍵字的特點就是「大字」,代表搜尋目的本來就包含得比較廣。以「日本」來說,搜尋目的可能是要出去玩,或是只是想了解日本的相關資訊(文化 / 新聞 / 八卦)等等。這類字事實上如果更細的去分析還是會有週期,但不會像上述的特定關鍵字那麼強烈。

突發爆紅 – 蜂蜜檸檬 & 服貿

這裡直接舉兩個例子,一個是短期爆紅,一個是為期比較長一點的爆紅

蜂蜜檸檬

11/9 還是 0,11/10 電視辯論會後急劇上升,到 11/12 連三天爆衝,11/12 到100,接著就開始下滑。回到穩定低點是11/22後。為期13天。

服貿

318晚上佔領,319到達搜尋高峰。323發生佔領行政院事件,324再出現搜尋高峰。330反服貿遊行,因為遊行前就開始集結,所以當天搜尋量也最高。後面就持續下滑。4/18(4/10出關後8天)回到相對搜尋低點。從爆量回到低點為期約1個月。

常見的搜尋模式大概有這些。關於「異常」的部分,之後再另外寫文囉。

選舉觀察part5:「公投」使用者搜尋行為差異分析

這篇內容是跟上一篇做呼應。但這篇或著重在搜尋行為分析上。加上我突然想到因為工作的緣故,我其實可以從 google ads 拿得到實際的每月搜尋量。所以本文最後會附上2017/11~2018/10 從 google ads 撈出來的關鍵字每月搜尋量數據,有興趣的就自己看看吧。

另外,很幸運的因為google趨勢的資料是從2004年1月開始就有,正好中間經歷兩次公投綁大選,這兩次的搜尋熱度都可以查得到。因此可以跟這次的公投搜尋行為放在一起做比較,讓大家可以比較清楚知道為什麼我會強調的異常是「爆量加上穩定增加的搜尋量這件事怪怪的」,而不只是因為爆量就認定有異常。

公投三次的比較區間,取樣時間是投票前3天,再往前推3個月。會這要挑一來今天是投票前三天,已經可以開始看到不管哪個政黨的候選人的搜尋熱度都開始節節高升。依照之前其他候選人的比較,最高峰會是在投票開完票那時候。當選的那天,呼聲最高的候選人搜尋量會再次衝破天際,落選後7天內會回到谷底。下圖擷取幾次總統大選的搜尋趨勢做參考。大家可以自行去搜以前幾次選舉,搜尋趨勢分布的狀況大同小異。

2012年

2008年,臺灣入聯公民投票綁大選(同時一共有4案公投)

2004年,防禦性公投綁大選(同時一共2案公投)

雖然公投跟其他候選人放一起顯突起的趨勢不是那麼明顯,但還是可以看得出來高點落在選舉開票後三天內。2004年的走勢比較特別,公投跟陳水扁是錯開的。不過時間很久遠所以我現在也不確定當時怎麼了,也許是有遊行這類的。但大致上還是看得出來搜尋量攀升會落在選舉前2周。

這次這篇文章寫在選舉前,一來今天還沒選舉,二來我主要希望分析的是「投票前的搜尋趨勢」,所以以下比較都會排除投票日,比較區間一律取從投票日往前推前3天到再往前推3個月。以下是包含這次,三次綁大選的公投的搜尋趨勢,不跟其他關鍵字比較,只跟自己比。

2018/8/21~2018/11/21(投票日11/24)

  • 9/26~10/13,18天,搜尋量從1提升到5,斜率0.22
  • 10/13~26,9天,搜尋量從5提升到26,呈現很「穩定」的上升,斜率2.3
  • 10/23~11/13,21天,搜尋量從26提升到45,呈現很「穩定」的上升,斜率0.9
  • 11/13~11/18,5天,搜尋量從45提升到100,而且是一天高過一天,斜率11
  • 10/13 ~ 11/18,持續37天,搜尋量穩定升高

2007/12/19~2008/3/18(投票日3/22)

2004/1/1~2004/3/31(投票日3/20)

因為google趨勢最早的資料只能查到2004年1月,所以我就從2004/1抓3的月,讓圖表每個點之間的間隔比較一致,降低趨勢斜率比較上的誤差。

2007/12/19~2008/3/18 跟 2004/1/1~2004/3/31 兩張看都會發現,2004/2/29 這天不知道發生什麼事?總之2004這次公投,搜尋流量最高峰並不是投票日那天,其次是搜尋規律不強。但勉強在選前3周的搜尋量都還是有略微上升

相較之下 2018 這次公投的搜尋熱度走勢可說是「非常漂亮」。漂亮的讓我覺得應該來買張公投股票才對…

不過很有趣的是,若把台灣跟全球,把2004年到現在做比較的話。

台灣的

全球的

中國的

前面兩個高點,跟後面的起伏,中國跟全球比,全球好像是中國的略為壓扁版的。所以應該可以推測全球的搜尋量主要是被中國的搜尋量拉起來的。

前兩次公投可能是因為主題(入聯 / 購買軍武)的關係,中國人顯然很有興趣,而這次大概是因為公投題目太多惹,他們完全冷掉。以下是中國針對公投這個字不同時間區間的搜尋趨勢圖。

2018/8/21~2018/11/21 一大堆公投案很明顯地有一搭沒一搭的。興趣不大。

2007/12/19~2008/3/18 臺灣入聯公民投票綁大選(投票日3/22)

  • 1/30~2/28 搜尋熱度大致維持在4上下,除了2/3有一波搜尋熱點,4天就恢復一般搜尋水準。
  • 2/28~3/14,16天,搜尋量從4提升到26,斜率1.375
  • 3/14~18,3天,搜尋量從26提升到100,斜率24
  • 2/28~3/18,持續20天,搜尋量穩定升高

2004/1/1~2004/3/31防禦性公投綁大選(投票日3/20)3/20爆量。但是單一爆量會壓縮到前面的趨勢起伏,所以我這裡調整一下日期區間改為2004/1/1~2004/3/18

  • 1/30 搜尋熱度0
  • 1/30~2/26 搜尋熱度大致維持在13上下
  • 2/26~3/15,16天,搜尋量從13提升到46,斜率2.0625
  • 3/15~18,3天,搜尋量從48提升到100,斜率17.33
  • 2/26~3/18,持續22天,搜尋量穩定升高

我比較好奇的是,台灣總統的搜尋曲線會怎麼分佈。所以再把總統的拉出來比較,一樣扣除投票日當天。

2015/10/14~ 2016/1/14(1/16投票)

  • 12/9 前維持在25
  • 12/9~1/5,28天,搜尋量從25提升到50,斜率2.6
  • 1/5~1/14,10天,搜尋量從50提升到100,斜率5
  • 12/9~1/14,持續36天,搜尋量穩定升高

然後來兩張公投自己從2004/1~2018/10與2004/1~2018/11的趨勢圖

2004/1~2018/10(台灣)

2004/1~2018/11(台灣)

上述幾個圖綜合比較的結論如下

  • 針對「公投」,先排除2018年11月數據的話,10月的搜尋熱度是77,2004年2月是84,3月是100。若把2018年11月數據拉進來比,很顯然11月會高過於2004年3月的高峰。最後會高多少要等下個月看才知道,不過目前預測看起來至少高2倍有。
  • 以台灣的月搜尋熱度來比較,截止到10月是:2004公投 > 2018公投 > 2008公投。截止到11月是:2018公投 > 2004公投 > 2008公投。
  • 2004與2008的公投,相較於2014的公投,在投票前3個月的搜尋趨勢,不像2018這次有明顯且穩定的上升。2004與2008的公投搜尋趨勢規律性低。2018的公投搜尋則有高度的規律性。2004年的公投雖然總搜尋量高點高於2018年10月結算。但2004年的公投搜尋習慣跟2018年有很顯著的不同。
  • 2016年蔡英文搜尋趨勢跟2018年公投的上升趨勢有點像。但是2016年蔡英文的搜尋量上下變動很大大。2018年公投的上下變化卻非常輕微。
  • 中國對2004公投興趣很高,2008其次,這次則完全沒興趣。兩次的搜尋趨勢分佈在時間與增長幅度上有很高的雷同。

綜合以上,我個人還是維持「2018年公投搜尋量有異常」的結論。而「公投」這樣的搜尋行為趨勢,跟一個人很像,那個人就是「韓國瑜」。但他搜尋行為不正常的堆疊時間拉得更長。

最後,附上 2017/11~2018/10 從 google ads 撈出來的關鍵字搜尋量數據,挑的是我之前寫文用過的關鍵字,不過寫到這我已經懶得算了…有興趣的人可以自己搭配google趨勢每月的搜尋量分佈圖,去大概算一下當月最高搜尋日那天的搜尋量是多少。這都只有台灣的搜尋量,不是全球的喔。

喔,看完我必須要說,以台灣的搜尋量「韓國瑜」從2018年8月起可以連三個月超越「日本」,然後2018年10月「公投」搜尋量也超越「日本」,我是真的蠻驚訝的啦。而這兩件事在「google 趨勢」看完全是不一樣的。這部分的資料呈現不一致是什麼原因我不清楚。也許推說 google 數據不準是個好方法?也不要問我為什麼10月韓國瑜的搜尋數量直接多一位數。以下數字我沒有變造過,完全是直接從 google ads 匯出來的。

不過我只能說看搜尋趨勢真的不準,因為現實搜尋數字的變化量級比搜尋趨勢所呈現的更驚悚。就醬子~~

2018/11~2018/4

Keyword Searches: Nov 2017 Searches: Dec 2017 Searches: Jan 2018 Searches: Feb 2018 Searches: Mar 2018 Searches: Apr 2018
公投 1300 4400 4400 1600 2900 12100
婚姻 3600 3600 2900 2400 3600 3600
貿 1900 1600 1600 590 1600 1300
柯文哲 110000 110000 110000 110000 165000 165000
總統 2900 2900 2900 3600 3600 3600
英文 60500 74000 90500 74000 90500 90500
連勝 8100 5400 6600 4400 6600 9900
陳水扁 9900 12100 22200 12100 22200 18100
馬英九 27100 49500 33100 49500 60500 40500
丁守中 9900 6600 18100 9900 9900 14800
侯友宜 6600 9900 12100 22200 49500 74000
姚文智 2900 14800 9900 12100 14800 49500
貞昌 1900 2900 8100 6600 6600 74000
陳其邁 9900 9900 18100 9900 40500 9900
日本 90500 90500 90500 90500 110000 90500
減肥 60500 40500 49500 49500 60500 60500
韓劇 201000 201000 246000 165000 201000 165000
韓國 49500 49500 60500 49500 60500 60500
韓國 6600 5400 6600 5400 40500 33100

2018/5~2018/10

Keyword Searches: May 2018 Searches: Jun 2018 Searches: Jul 2018 Searches: Aug 2018 Searches: Sep 2018 Searches: Oct 2018
公投 3600 4400 6600 22200 27100 165000
婚姻 3600 3600 3600 4400 4400 4400
貿 1900 1300 1300 1300 1000 2400
柯文哲 368000 301000 550000 550000 368000 450000
總統 4400 3600 4400 4400 3600 4400
英文 135000 135000 135000 165000 135000 110000
連勝 12100 9900 12100 14800 12100 22200
陳水扁 18100 14800 22200 18100 27100 33100
馬英九 74000 40500 90500 49500 49500 74000
丁守中 74000 33100 60500 74000 33100 60500
侯友宜 33100 110000 74000 40500 49500 60500
姚文智 74000 110000 110000 135000 74000 90500
貞昌 33100 33100 33100 33100 90500 60500
陳其邁 12100 14800 18100 33100 49500 246000
日本 90500 135000 135000 90500 135000 90500
減肥 60500 60500 74000 60500 49500 49500
韓劇 165000 165000 201000 201000 165000 201000
韓國 60500 74000 60500 60500 60500 60500
韓國 74000 110000 110000 246000 301000 2240000

 

選舉觀察part4:「公投」的搜尋熱度爬升異常分析

這是在寫part1的時候意外的發現。當時是為了拿來跟韓國瑜做比較,結果意外發現公投搜尋量的異常增加。

所以決定進一步交叉比對。因為4月苗博雅發起了婚姻平權公投,所以從4月開始看相關關鍵字的搜尋趨勢。

可以看出「公投」從10/14起,就有倍數的大躍進。4/14的高點是因為當時苗博雅發起婚姻平權公投,要反制愛家公投,所以當時公投有個熱搜點。8/27的高點是因為那時候要拼公投綁大選,希望大家8/30前可以寄回第二階段公投連署。這天連「婚姻」的搜尋熱度也到差不多的高度。這兩個高點都是相對正常的。

但是10/14開始的大躍進就令人非常費解。而且「公投」搜尋熱度大躍進到超越柯文哲,且持續超越中。就算把愛家 / 婚姻 / 正名的搜尋熱度疊加,也追不上公投的上升曲線。

這是11/16擷取的7天搜尋熱度趨勢

這是11/19擷取的7天搜尋熱度趨勢

可以發現幾個現象

  1. 蜂蜜檸檬(台北市長辯論會那幾天)跟陳其邁(造勢晚會)都曾經超越公投一點點,但後來很快就下降。
  2. 公投的上升曲線非常的「穩定」而且每天的搜尋熱度相較於其他關鍵字,呈現一種很穩定但顯得很奇怪的規律。

比較一下這7天的搜尋區域分佈圖

  1. 蜂蜜檸檬顯然只有北高兩市的人比較有興趣
  2. 柯文哲的搜尋熱度主要分布在北部中部地區
  3. 陳其邁的搜尋熱度主要分布在中部南部
  4. 公投很神奇的受到東部「壽豐鄉」跟海上「馬公市」的青睞。而且搜尋熱度分布區域也很廣,北中南都很熱。

因為我算是有長期在關注公投這個議題,這樣的搜尋熱度增量方式,跟區域分布實在讓我太驚訝了。我有朋友提到現在愛家公投的人他們都會開手機上網秀畫面,詢問公投的搜尋熱度有沒有可能是因為這樣造成的。但我覺得這樣的搜尋量應該也不足以讓公投的搜尋熱度呈現「穩定且持續上升」的狀況。

所以我想進一步的看,那在我覺得公投搜尋量異常的時間點以前,公投的主要搜尋區域都分佈在哪些地方呢?於是我以2018/4/1~2018/10/14的數據來做比較。這時間點的搜尋熱度是這樣的。

  1. 柯文哲這段時間的搜尋熱度都相對高,這不意外,因為柯文哲的新聞一直都不少。
  2. 公投在8/24後出現急遽上升的趨勢,8/27這天最熱,到9/1就急劇下跌了。即使算到9/7回歸一般熱度,這期間也不過14天。
  3. 婚姻的搜尋熱點跟公投相同,推測應該都是在搜尋跟婚姻平權有關的事。

那這三個字當時的搜尋都分佈在哪些城市?

  1. 搜公投跟搜婚姻的地區分佈相符
  2. 柯文哲的搜尋在這時候就已經遍佈全台

不過這時候我發現搜尋7天的區域分布,不能直接拿來跟之前的直接比較。因為感覺他資料呈現的比例是不太一樣的。不過東部「壽豐鄉」跟「馬公市」的七天搜尋熱度很高的這點還是讓我很意外。

那海外華人對「公投」這個字的搜尋熱度又如何?一樣用7天來,用美國 / 加拿大 / 澳洲來比較。

看起來這7天的海外搜尋熱度,公投跟柯文哲是相當。那如果把時間拉長為1年呢?

  1. 美國華人對柯文哲的興趣逐月增高
  2. 只有台灣人對「公投」在這一個月內高於柯文哲。

我目前想不到什麼合理的解釋可以說明這種搜尋熱度。只能說「搜尋熱度每天呈現穩定的成長」這件事,在我看起來,是有人為介入的可能性。那個穩定程度讓我懷疑是用搜爬程式跑出來的,至於目的為何,我有的資訊不足以判斷。但只能說「公投」的搜尋熱度應該是有異常。

選舉觀察part3:從「蜂蜜檸檬」看「韓國瑜」搜尋熱度異常,真韓粉其實在美國?!

這幾天我一直在想一個問題:一個台灣的熱門政治人物,搜尋熱度的上限要到多少才能說得上「沒有異常」?結果這幾天就出現「蜂蜜檸檬」,不但引起大家購買蜂蜜檸檬的風潮,還出現一大堆音樂kuso二創大爆發。放上我覺得最好聽的和弦版本。

所以短期內「蜂蜜檸檬」會大熱搜應該是可預期的。那實際狀況是多熱呢?
這是90天的韓國瑜 / 柯文哲 / 蜂蜜檸檬的搜尋趨勢

  1. 蜂蜜檸檬最後這周狠狠地超越了柯文哲,最高點高出柯文哲2倍。
  2. 但在韓國瑜面前還是輸了
  3. 從9月29日開始,韓國瑜的搜尋熱度上升曲線非常明顯。

來看看過去7天的韓國瑜 / 柯文哲 / 蜂蜜檸檬

  1. 台北市市長辯論會的日期是11/10,在那之前蜂蜜檸檬乏人聞問,突然大家都「搜起來」了
  2. 蜂蜜檸檬這三天的搜尋量都超越柯文哲
  3. 蜂蜜檸檬只有在11/12早上9:00~11/13早上1:00這段時間略為超車韓國瑜。其他時間還是輸給韓國瑜。

不過這些搜尋都是針對台灣,如果依照我之前推論韓國瑜的搜尋有更大的外力介入,是不是在全球搜尋能看出些什麼呢?結果發現一個很有趣的現象…

那個莫名的律動是怎麼回事??

如果比對上一張圖,蜂蜜檸檬超越韓國瑜的時間,跟這張是一致是沒錯。但為什麼這張會有那麼明顯的搜尋量循環?而且這個循環不是只出現在韓國瑜,是所有的字都有這個現象。為什麼?

看看搜尋低點的時間,都落在每天凌晨4點。那個時間大家都在幹嘛?

 

睡覺。

所以這個搜尋量循環反應的,是一天的作息時間囉?這個假設對嗎?我決定先拋開政治人物,拋開蜂蜜檸檬,我們一樣來搜尋減肥。
台灣7日搜尋趨勢

全球7日搜尋趨勢

所以台灣跟全球都有一樣的律動。那…不同時區的作息時間,是否會出現偏移?,來增加搜尋日文的「体重」,跟英文的「lose weight」

可以看出來時區差異越大,低點會偏移,但整體依照時間造成點搜尋熱度潮起潮落模式是相同的。

那為什麼只看台灣的搜尋量的時候,看不太出來這樣的趨勢?

上面兩張圖放一起比,可以發現如果台灣只搜減肥,高低起落其實是很明顯的。只是當減肥跟柯文哲 / 韓國瑜 一起比較的時候,那個依照一日作息高低起落的相對性,比起韓國瑜的搜尋量變化,太微小不足道了,以至於被壓扁了。

可是當搜尋熱度拉到全球的時候,這時候如果有外力介入搜尋,且搜尋量很大,且大的很規律的時候。那巨大的一日作息的高低起落搜尋量總數,就又把韓國瑜在台灣的搜尋量的高低起伏給沖淡。

這個現象我想到的假設有兩種:

  1. 外力介入者的搜尋行為跟我們很近,推測他們的作息時間跟台灣的差異不大。
  2. 外力介入者因為主要要介入台灣的選舉,所以他們操作的方式也必須因此符合台灣的作息時間,才能有最大的影響力。

不管是1還是2還是混合,至少都可以看得出外力介入的搜尋量一定是很大,才會導致一樣的時間區間,台灣跟全球的搜尋熱度曲線有如此巨大的差異。

那外力介入的巨量搜尋量,若以ip位置來看會來自於哪裡呢?如果上述1的假設正確,那我猜巨量搜尋量應該來自於中國?這次我把簡體的韓國瑜也加進來搜搜看。

很意外的,不是。中國的搜尋量規律性沒那麼強。韓國瑜的搜尋量有除了台灣中國,也分佈在美國跟澳洲。那試試看美國?

中了。巨量「繁體韓國瑜」搜尋來自美國,且熱度分佈符合台灣的一日作息。那來自美國的搜尋量,分佈在美國哪裡呢?

最多的搜尋量來自加州,加州跟台灣的時差是16小時。台灣凌晨4:00的時間,加州時間應該是,中午12:00。所以理論上加州的正常一日搜尋熱度分佈,應該會跟台灣的錯開。但顯然在這幾個關鍵字上來自美國的流量並沒有錯開。從這裡可以推出我的1的假設是錯的。2的假設可能性比較高,而且大量外力介入的搜尋量來自美國的ip。那至於這是「真美國人」幹的?還是「有人用vpn跳轉ip」做的?還是有人直接設點在美國操作?這些可能性都是有的,我就不下定論了。

不過大概可以得到一個結論,就是真韓粉其實在美國(?

台灣政治人物搜尋熱度的上限在哪?

不管前面的異常流量來源要怎樣解釋,但這些證據都只是繼續應證「韓國瑜」搜尋熱度有很大的異常。有大量人為操作應該是很確定的了。那到底台灣政治人物搜尋熱度的上限又在哪呢?

因為正好台灣這幾年出了幾個應該大家都會覺得算有名的政治人物,例如柯文哲,撇開柯文哲上一屆以黑馬之姿拿下台北市市長寶座。我相信以總統等級來說,馬英九 / 蔡英文 在搜尋熱度上應該也不會太差。連勝文雖然輸了,但當年「希望的種子」網路也很多人kuso二創,可以猜想他的網路搜尋量應該也不會太差。又正好這五年除了有台北市長選舉,也歷經總統選舉,那何不一起來做比較試試?

近5年熱門候選人的搜尋趨勢圖

滑鼠移到點上可以看到搜尋熱度的相對比較數字,從5年的圖表可以看出幾件事:

  1. 五個人的相對搜尋熱度高點:
    韓國瑜100,蔡英文(2016年) 54,馬英九(2012年) 30,柯文哲(2014年) 65 ,連勝文(2014年) 37
  2. 「韓國瑜」搜尋熱度是「蔡英文」最高點的近2倍。是「馬英九」最高點近3倍
  3. 一樣是中國國民黨的候選人,本身也是財力資源雄厚的「連勝文」,搜尋熱度最高的時候比馬英九略高。但也只有到「韓國瑜」的3.5成。
  4. 「柯文哲」在上屆選舉最高熱度只到「韓國瑜」的6.5成。

那如果從google趨勢 2004 年開始有紀錄起,先踢掉連勝文,把陳水扁選總統的紀錄也列入的話呢?

  1. 五個人的相對搜尋熱度高點:
    韓國瑜100,蔡英文(2016年) 32,馬英九(2008年) 41,柯文哲(2014年) 42 ,陳水扁(2004年) 23
  2. 馬英九在2008年的網路聲勢與2014年的柯文哲相當

綜合上述兩張圖。以台灣要靠近選舉大家才會對政治人物有高度搜尋興趣的這個特點來說,並把所有熱門人物並列,我大概可以下幾個簡單的結論:

  1. 柯文哲在 2014 年選舉的最高熱搜點,大概就是一個「直轄市」候選人在台灣同時狹電視+網路推波助瀾的熱度極限。
  2. 總統級的選舉,除非未來出了更厲害的明日之星,不然短期內,極限應該也差不多是柯文哲 2014年熱搜高點。
  3. 不管是哪個候選人,熱搜的最高點都出現在「當選那天」「當選那周」。只有韓國瑜的熱搜高點「還沒到選前就連續近兩個月不斷的自我突破」