選舉觀察part5:「公投」使用者搜尋行為差異分析

這篇內容是跟上一篇做呼應。但這篇或著重在搜尋行為分析上。加上我突然想到因為工作的緣故,我其實可以從 google ads 拿得到實際的每月搜尋量。所以本文最後會附上2017/11~2018/10 從 google ads 撈出來的關鍵字每月搜尋量數據,有興趣的就自己看看吧。

另外,很幸運的因為google趨勢的資料是從2004年1月開始就有,正好中間經歷兩次公投綁大選,這兩次的搜尋熱度都可以查得到。因此可以跟這次的公投搜尋行為放在一起做比較,讓大家可以比較清楚知道為什麼我會強調的異常是「爆量加上穩定增加的搜尋量這件事怪怪的」,而不只是因為爆量就認定有異常。

公投三次的比較區間,取樣時間是投票前3天,再往前推3個月。會這要挑一來今天是投票前三天,已經可以開始看到不管哪個政黨的候選人的搜尋熱度都開始節節高升。依照之前其他候選人的比較,最高峰會是在投票開完票那時候。當選的那天,呼聲最高的候選人搜尋量會再次衝破天際,落選後7天內會回到谷底。下圖擷取幾次總統大選的搜尋趨勢做參考。大家可以自行去搜以前幾次選舉,搜尋趨勢分布的狀況大同小異。

2012年

2008年,臺灣入聯公民投票綁大選(同時一共有4案公投)

2004年,防禦性公投綁大選(同時一共2案公投)

雖然公投跟其他候選人放一起顯突起的趨勢不是那麼明顯,但還是可以看得出來高點落在選舉開票後三天內。2004年的走勢比較特別,公投跟陳水扁是錯開的。不過時間很久遠所以我現在也不確定當時怎麼了,也許是有遊行這類的。但大致上還是看得出來搜尋量攀升會落在選舉前2周。

這次這篇文章寫在選舉前,一來今天還沒選舉,二來我主要希望分析的是「投票前的搜尋趨勢」,所以以下比較都會排除投票日,比較區間一律取從投票日往前推前3天到再往前推3個月。以下是包含這次,三次綁大選的公投的搜尋趨勢,不跟其他關鍵字比較,只跟自己比。

2018/8/21~2018/11/21(投票日11/24)

  • 9/26~10/13,18天,搜尋量從1提升到5,斜率0.22
  • 10/13~26,9天,搜尋量從5提升到26,呈現很「穩定」的上升,斜率2.3
  • 10/23~11/13,21天,搜尋量從26提升到45,呈現很「穩定」的上升,斜率0.9
  • 11/13~11/18,5天,搜尋量從45提升到100,而且是一天高過一天,斜率11
  • 10/13 ~ 11/18,持續37天,搜尋量穩定升高

2007/12/19~2008/3/18(投票日3/22)

2004/1/1~2004/3/31(投票日3/20)

因為google趨勢最早的資料只能查到2004年1月,所以我就從2004/1抓3的月,讓圖表每個點之間的間隔比較一致,降低趨勢斜率比較上的誤差。

2007/12/19~2008/3/18 跟 2004/1/1~2004/3/31 兩張看都會發現,2004/2/29 這天不知道發生什麼事?總之2004這次公投,搜尋流量最高峰並不是投票日那天,其次是搜尋規律不強。但勉強在選前3周的搜尋量都還是有略微上升

相較之下 2018 這次公投的搜尋熱度走勢可說是「非常漂亮」。漂亮的讓我覺得應該來買張公投股票才對…

不過很有趣的是,若把台灣跟全球,把2004年到現在做比較的話。

台灣的

全球的

中國的

前面兩個高點,跟後面的起伏,中國跟全球比,全球好像是中國的略為壓扁版的。所以應該可以推測全球的搜尋量主要是被中國的搜尋量拉起來的。

前兩次公投可能是因為主題(入聯 / 購買軍武)的關係,中國人顯然很有興趣,而這次大概是因為公投題目太多惹,他們完全冷掉。以下是中國針對公投這個字不同時間區間的搜尋趨勢圖。

2018/8/21~2018/11/21 一大堆公投案很明顯地有一搭沒一搭的。興趣不大。

2007/12/19~2008/3/18 臺灣入聯公民投票綁大選(投票日3/22)

  • 1/30~2/28 搜尋熱度大致維持在4上下,除了2/3有一波搜尋熱點,4天就恢復一般搜尋水準。
  • 2/28~3/14,16天,搜尋量從4提升到26,斜率1.375
  • 3/14~18,3天,搜尋量從26提升到100,斜率24
  • 2/28~3/18,持續20天,搜尋量穩定升高

2004/1/1~2004/3/31防禦性公投綁大選(投票日3/20)3/20爆量。但是單一爆量會壓縮到前面的趨勢起伏,所以我這裡調整一下日期區間改為2004/1/1~2004/3/18

  • 1/30 搜尋熱度0
  • 1/30~2/26 搜尋熱度大致維持在13上下
  • 2/26~3/15,16天,搜尋量從13提升到46,斜率2.0625
  • 3/15~18,3天,搜尋量從48提升到100,斜率17.33
  • 2/26~3/18,持續22天,搜尋量穩定升高

我比較好奇的是,台灣總統的搜尋曲線會怎麼分佈。所以再把總統的拉出來比較,一樣扣除投票日當天。

2015/10/14~ 2016/1/14(1/16投票)

  • 12/9 前維持在25
  • 12/9~1/5,28天,搜尋量從25提升到50,斜率2.6
  • 1/5~1/14,10天,搜尋量從50提升到100,斜率5
  • 12/9~1/14,持續36天,搜尋量穩定升高

然後來兩張公投自己從2004/1~2018/10與2004/1~2018/11的趨勢圖

2004/1~2018/10(台灣)

2004/1~2018/11(台灣)

上述幾個圖綜合比較的結論如下

  • 針對「公投」,先排除2018年11月數據的話,10月的搜尋熱度是77,2004年2月是84,3月是100。若把2018年11月數據拉進來比,很顯然11月會高過於2004年3月的高峰。最後會高多少要等下個月看才知道,不過目前預測看起來至少高2倍有。
  • 以台灣的月搜尋熱度來比較,截止到10月是:2004公投 > 2018公投 > 2008公投。截止到11月是:2018公投 > 2004公投 > 2008公投。
  • 2004與2008的公投,相較於2014的公投,在投票前3個月的搜尋趨勢,不像2018這次有明顯且穩定的上升。2004與2008的公投搜尋趨勢規律性低。2018的公投搜尋則有高度的規律性。2004年的公投雖然總搜尋量高點高於2018年10月結算。但2004年的公投搜尋習慣跟2018年有很顯著的不同。
  • 2016年蔡英文搜尋趨勢跟2018年公投的上升趨勢有點像。但是2016年蔡英文的搜尋量上下變動很大大。2018年公投的上下變化卻非常輕微。
  • 中國對2004公投興趣很高,2008其次,這次則完全沒興趣。兩次的搜尋趨勢分佈在時間與增長幅度上有很高的雷同。

綜合以上,我個人還是維持「2018年公投搜尋量有異常」的結論。而「公投」這樣的搜尋行為趨勢,跟一個人很像,那個人就是「韓國瑜」。但他搜尋行為不正常的堆疊時間拉得更長。

最後,附上 2017/11~2018/10 從 google ads 撈出來的關鍵字搜尋量數據,挑的是我之前寫文用過的關鍵字,不過寫到這我已經懶得算了…有興趣的人可以自己搭配google趨勢每月的搜尋量分佈圖,去大概算一下當月最高搜尋日那天的搜尋量是多少。這都只有台灣的搜尋量,不是全球的喔。

喔,看完我必須要說,以台灣的搜尋量「韓國瑜」從2018年8月起可以連三個月超越「日本」,然後2018年10月「公投」搜尋量也超越「日本」,我是真的蠻驚訝的啦。而這兩件事在「google 趨勢」看完全是不一樣的。這部分的資料呈現不一致是什麼原因我不清楚。也許推說 google 數據不準是個好方法?也不要問我為什麼10月韓國瑜的搜尋數量直接多一位數。以下數字我沒有變造過,完全是直接從 google ads 匯出來的。

不過我只能說看搜尋趨勢真的不準,因為現實搜尋數字的變化量級比搜尋趨勢所呈現的更驚悚。就醬子~~

2018/11~2018/4

Keyword Searches: Nov 2017 Searches: Dec 2017 Searches: Jan 2018 Searches: Feb 2018 Searches: Mar 2018 Searches: Apr 2018
公投 1300 4400 4400 1600 2900 12100
婚姻 3600 3600 2900 2400 3600 3600
貿 1900 1600 1600 590 1600 1300
柯文哲 110000 110000 110000 110000 165000 165000
總統 2900 2900 2900 3600 3600 3600
英文 60500 74000 90500 74000 90500 90500
連勝 8100 5400 6600 4400 6600 9900
陳水扁 9900 12100 22200 12100 22200 18100
馬英九 27100 49500 33100 49500 60500 40500
丁守中 9900 6600 18100 9900 9900 14800
侯友宜 6600 9900 12100 22200 49500 74000
姚文智 2900 14800 9900 12100 14800 49500
貞昌 1900 2900 8100 6600 6600 74000
陳其邁 9900 9900 18100 9900 40500 9900
日本 90500 90500 90500 90500 110000 90500
減肥 60500 40500 49500 49500 60500 60500
韓劇 201000 201000 246000 165000 201000 165000
韓國 49500 49500 60500 49500 60500 60500
韓國 6600 5400 6600 5400 40500 33100

2018/5~2018/10

Keyword Searches: May 2018 Searches: Jun 2018 Searches: Jul 2018 Searches: Aug 2018 Searches: Sep 2018 Searches: Oct 2018
公投 3600 4400 6600 22200 27100 165000
婚姻 3600 3600 3600 4400 4400 4400
貿 1900 1300 1300 1300 1000 2400
柯文哲 368000 301000 550000 550000 368000 450000
總統 4400 3600 4400 4400 3600 4400
英文 135000 135000 135000 165000 135000 110000
連勝 12100 9900 12100 14800 12100 22200
陳水扁 18100 14800 22200 18100 27100 33100
馬英九 74000 40500 90500 49500 49500 74000
丁守中 74000 33100 60500 74000 33100 60500
侯友宜 33100 110000 74000 40500 49500 60500
姚文智 74000 110000 110000 135000 74000 90500
貞昌 33100 33100 33100 33100 90500 60500
陳其邁 12100 14800 18100 33100 49500 246000
日本 90500 135000 135000 90500 135000 90500
減肥 60500 60500 74000 60500 49500 49500
韓劇 165000 165000 201000 201000 165000 201000
韓國 60500 74000 60500 60500 60500 60500
韓國 74000 110000 110000 246000 301000 2240000

 

選舉觀察part4:「公投」的搜尋熱度爬升異常分析

這是在寫part1的時候意外的發現。當時是為了拿來跟韓國瑜做比較,結果意外發現公投搜尋量的異常增加。

所以決定進一步交叉比對。因為4月苗博雅發起了婚姻平權公投,所以從4月開始看相關關鍵字的搜尋趨勢。

可以看出「公投」從10/14起,就有倍數的大躍進。4/14的高點是因為當時苗博雅發起婚姻平權公投,要反制愛家公投,所以當時公投有個熱搜點。8/27的高點是因為那時候要拼公投綁大選,希望大家8/30前可以寄回第二階段公投連署。這天連「婚姻」的搜尋熱度也到差不多的高度。這兩個高點都是相對正常的。

但是10/14開始的大躍進就令人非常費解。而且「公投」搜尋熱度大躍進到超越柯文哲,且持續超越中。就算把愛家 / 婚姻 / 正名的搜尋熱度疊加,也追不上公投的上升曲線。

這是11/16擷取的7天搜尋熱度趨勢

這是11/19擷取的7天搜尋熱度趨勢

可以發現幾個現象

  1. 蜂蜜檸檬(台北市長辯論會那幾天)跟陳其邁(造勢晚會)都曾經超越公投一點點,但後來很快就下降。
  2. 公投的上升曲線非常的「穩定」而且每天的搜尋熱度相較於其他關鍵字,呈現一種很穩定但顯得很奇怪的規律。

比較一下這7天的搜尋區域分佈圖

  1. 蜂蜜檸檬顯然只有北高兩市的人比較有興趣
  2. 柯文哲的搜尋熱度主要分布在北部中部地區
  3. 陳其邁的搜尋熱度主要分布在中部南部
  4. 公投很神奇的受到東部「壽豐鄉」跟海上「馬公市」的青睞。而且搜尋熱度分布區域也很廣,北中南都很熱。

因為我算是有長期在關注公投這個議題,這樣的搜尋熱度增量方式,跟區域分布實在讓我太驚訝了。我有朋友提到現在愛家公投的人他們都會開手機上網秀畫面,詢問公投的搜尋熱度有沒有可能是因為這樣造成的。但我覺得這樣的搜尋量應該也不足以讓公投的搜尋熱度呈現「穩定且持續上升」的狀況。

所以我想進一步的看,那在我覺得公投搜尋量異常的時間點以前,公投的主要搜尋區域都分佈在哪些地方呢?於是我以2018/4/1~2018/10/14的數據來做比較。這時間點的搜尋熱度是這樣的。

  1. 柯文哲這段時間的搜尋熱度都相對高,這不意外,因為柯文哲的新聞一直都不少。
  2. 公投在8/24後出現急遽上升的趨勢,8/27這天最熱,到9/1就急劇下跌了。即使算到9/7回歸一般熱度,這期間也不過14天。
  3. 婚姻的搜尋熱點跟公投相同,推測應該都是在搜尋跟婚姻平權有關的事。

那這三個字當時的搜尋都分佈在哪些城市?

  1. 搜公投跟搜婚姻的地區分佈相符
  2. 柯文哲的搜尋在這時候就已經遍佈全台

不過這時候我發現搜尋7天的區域分布,不能直接拿來跟之前的直接比較。因為感覺他資料呈現的比例是不太一樣的。不過東部「壽豐鄉」跟「馬公市」的七天搜尋熱度很高的這點還是讓我很意外。

那海外華人對「公投」這個字的搜尋熱度又如何?一樣用7天來,用美國 / 加拿大 / 澳洲來比較。

看起來這7天的海外搜尋熱度,公投跟柯文哲是相當。那如果把時間拉長為1年呢?

  1. 美國華人對柯文哲的興趣逐月增高
  2. 只有台灣人對「公投」在這一個月內高於柯文哲。

我目前想不到什麼合理的解釋可以說明這種搜尋熱度。只能說「搜尋熱度每天呈現穩定的成長」這件事,在我看起來,是有人為介入的可能性。那個穩定程度讓我懷疑是用搜爬程式跑出來的,至於目的為何,我有的資訊不足以判斷。但只能說「公投」的搜尋熱度應該是有異常。