選舉觀察part3:從「蜂蜜檸檬」看「韓國瑜」搜尋熱度異常,真韓粉其實在美國?!

這幾天我一直在想一個問題:一個台灣的熱門政治人物,搜尋熱度的上限要到多少才能說得上「沒有異常」?結果這幾天就出現「蜂蜜檸檬」,不但引起大家購買蜂蜜檸檬的風潮,還出現一大堆音樂kuso二創大爆發。放上我覺得最好聽的和弦版本。

所以短期內「蜂蜜檸檬」會大熱搜應該是可預期的。那實際狀況是多熱呢?
這是90天的韓國瑜 / 柯文哲 / 蜂蜜檸檬的搜尋趨勢

  1. 蜂蜜檸檬最後這周狠狠地超越了柯文哲,最高點高出柯文哲2倍。
  2. 但在韓國瑜面前還是輸了
  3. 從9月29日開始,韓國瑜的搜尋熱度上升曲線非常明顯。

來看看過去7天的韓國瑜 / 柯文哲 / 蜂蜜檸檬

  1. 台北市市長辯論會的日期是11/10,在那之前蜂蜜檸檬乏人聞問,突然大家都「搜起來」了
  2. 蜂蜜檸檬這三天的搜尋量都超越柯文哲
  3. 蜂蜜檸檬只有在11/12早上9:00~11/13早上1:00這段時間略為超車韓國瑜。其他時間還是輸給韓國瑜。

不過這些搜尋都是針對台灣,如果依照我之前推論韓國瑜的搜尋有更大的外力介入,是不是在全球搜尋能看出些什麼呢?結果發現一個很有趣的現象…

那個莫名的律動是怎麼回事??

如果比對上一張圖,蜂蜜檸檬超越韓國瑜的時間,跟這張是一致是沒錯。但為什麼這張會有那麼明顯的搜尋量循環?而且這個循環不是只出現在韓國瑜,是所有的字都有這個現象。為什麼?

看看搜尋低點的時間,都落在每天凌晨4點。那個時間大家都在幹嘛?

 

睡覺。

所以這個搜尋量循環反應的,是一天的作息時間囉?這個假設對嗎?我決定先拋開政治人物,拋開蜂蜜檸檬,我們一樣來搜尋減肥。
台灣7日搜尋趨勢

全球7日搜尋趨勢

所以台灣跟全球都有一樣的律動。那…不同時區的作息時間,是否會出現偏移?,來增加搜尋日文的「体重」,跟英文的「lose weight」

可以看出來時區差異越大,低點會偏移,但整體依照時間造成點搜尋熱度潮起潮落模式是相同的。

那為什麼只看台灣的搜尋量的時候,看不太出來這樣的趨勢?

上面兩張圖放一起比,可以發現如果台灣只搜減肥,高低起落其實是很明顯的。只是當減肥跟柯文哲 / 韓國瑜 一起比較的時候,那個依照一日作息高低起落的相對性,比起韓國瑜的搜尋量變化,太微小不足道了,以至於被壓扁了。

可是當搜尋熱度拉到全球的時候,這時候如果有外力介入搜尋,且搜尋量很大,且大的很規律的時候。那巨大的一日作息的高低起落搜尋量總數,就又把韓國瑜在台灣的搜尋量的高低起伏給沖淡。

這個現象我想到的假設有兩種:

  1. 外力介入者的搜尋行為跟我們很近,推測他們的作息時間跟台灣的差異不大。
  2. 外力介入者因為主要要介入台灣的選舉,所以他們操作的方式也必須因此符合台灣的作息時間,才能有最大的影響力。

不管是1還是2還是混合,至少都可以看得出外力介入的搜尋量一定是很大,才會導致一樣的時間區間,台灣跟全球的搜尋熱度曲線有如此巨大的差異。

那外力介入的巨量搜尋量,若以ip位置來看會來自於哪裡呢?如果上述1的假設正確,那我猜巨量搜尋量應該來自於中國?這次我把簡體的韓國瑜也加進來搜搜看。

很意外的,不是。中國的搜尋量規律性沒那麼強。韓國瑜的搜尋量有除了台灣中國,也分佈在美國跟澳洲。那試試看美國?

中了。巨量「繁體韓國瑜」搜尋來自美國,且熱度分佈符合台灣的一日作息。那來自美國的搜尋量,分佈在美國哪裡呢?

最多的搜尋量來自加州,加州跟台灣的時差是16小時。台灣凌晨4:00的時間,加州時間應該是,中午12:00。所以理論上加州的正常一日搜尋熱度分佈,應該會跟台灣的錯開。但顯然在這幾個關鍵字上來自美國的流量並沒有錯開。從這裡可以推出我的1的假設是錯的。2的假設可能性比較高,而且大量外力介入的搜尋量來自美國的ip。那至於這是「真美國人」幹的?還是「有人用vpn跳轉ip」做的?還是有人直接設點在美國操作?這些可能性都是有的,我就不下定論了。

不過大概可以得到一個結論,就是真韓粉其實在美國(?

台灣政治人物搜尋熱度的上限在哪?

不管前面的異常流量來源要怎樣解釋,但這些證據都只是繼續應證「韓國瑜」搜尋熱度有很大的異常。有大量人為操作應該是很確定的了。那到底台灣政治人物搜尋熱度的上限又在哪呢?

因為正好台灣這幾年出了幾個應該大家都會覺得算有名的政治人物,例如柯文哲,撇開柯文哲上一屆以黑馬之姿拿下台北市市長寶座。我相信以總統等級來說,馬英九 / 蔡英文 在搜尋熱度上應該也不會太差。連勝文雖然輸了,但當年「希望的種子」網路也很多人kuso二創,可以猜想他的網路搜尋量應該也不會太差。又正好這五年除了有台北市長選舉,也歷經總統選舉,那何不一起來做比較試試?

近5年熱門候選人的搜尋趨勢圖

滑鼠移到點上可以看到搜尋熱度的相對比較數字,從5年的圖表可以看出幾件事:

  1. 五個人的相對搜尋熱度高點:
    韓國瑜100,蔡英文(2016年) 54,馬英九(2012年) 30,柯文哲(2014年) 65 ,連勝文(2014年) 37
  2. 「韓國瑜」搜尋熱度是「蔡英文」最高點的近2倍。是「馬英九」最高點近3倍
  3. 一樣是中國國民黨的候選人,本身也是財力資源雄厚的「連勝文」,搜尋熱度最高的時候比馬英九略高。但也只有到「韓國瑜」的3.5成。
  4. 「柯文哲」在上屆選舉最高熱度只到「韓國瑜」的6.5成。

那如果從google趨勢 2004 年開始有紀錄起,先踢掉連勝文,把陳水扁選總統的紀錄也列入的話呢?

  1. 五個人的相對搜尋熱度高點:
    韓國瑜100,蔡英文(2016年) 32,馬英九(2008年) 41,柯文哲(2014年) 42 ,陳水扁(2004年) 23
  2. 馬英九在2008年的網路聲勢與2014年的柯文哲相當

綜合上述兩張圖。以台灣要靠近選舉大家才會對政治人物有高度搜尋興趣的這個特點來說,並把所有熱門人物並列,我大概可以下幾個簡單的結論:

  1. 柯文哲在 2014 年選舉的最高熱搜點,大概就是一個「直轄市」候選人在台灣同時狹電視+網路推波助瀾的熱度極限。
  2. 總統級的選舉,除非未來出了更厲害的明日之星,不然短期內,極限應該也差不多是柯文哲 2014年熱搜高點。
  3. 不管是哪個候選人,熱搜的最高點都出現在「當選那天」「當選那周」。只有韓國瑜的熱搜高點「還沒到選前就連續近兩個月不斷的自我突破」