王浩宇罷免案投票分析

王浩宇罷免案投票數可以看出一件很有趣的事情。

議員是多位當選。所以他當初拿到16292票就可以當選,同選區第一名魯明哲也不過得到23056票。但要把他罷免,是要中壢選舉人25%,也就是81940票。代表議員是選上比較容易(得到的票數少),罷免比較難(需要同意罷免票多)。

然後我們看一下數字(以下數字參考wiki整理)

同意罷免成功門檻:81940票
同意罷免王浩宇票數:84582票
2018年投國民黨籍議員候選人,包括未當選者的總票數:81300票

這三個數字代表什麼意思?

  1. 投國民黨的所有選舉人數,低於罷免門檻。代表如果只是投國民黨的人全部被動員出來,王浩宇還不會被罷免掉。
  2. 實際上,當然不可能所有投國民黨的人都會出來投罷免,也就是王浩宇的84582票不會只有來自藍營選民。所以如果民進黨是真心把罷免成功歸納於藍營動員不是只是官話的話,我認為是太小看公民的力量,又太放大藍營的影響力。我臉書上說「爽」的可都是淺綠選民啊,沒有一個是藍的喔,就知道王浩宇搞的多天怒人怨了。
  3. 我今天不投你是一回事,但除非你作風太糟糕,我才會被逼的要特別出來投罷免票。不然大部分人只會覺得也沒糟糕到需要浪費自己的時間出來。

之所以拿議員選舉票數,而非立委選舉票數來分析藍綠,原因在於立委是多搶一,有明顯對決的性質,在這種情況下中間選民也會因為選制而必須要選邊站。但是議員因為是多位當選制,這種必然要選邊站的效應會變低,大家會更有意願依照自己的喜好投票,所以在這種情況下如果還是非國民黨不投的,我認為會更接近真正的藍營基本盤。

台灣人其實對政治人物非常寬容。你沒有做到讓人家覺得你咖差不多一點。大部分的人會覺得反正你上了就讓你做完。所以投票投到25%,絕對不會只有那些本身真的恨的牙癢癢的在主動活動的那些人,一定要有其他人也一起被動員出來投票,25%門檻才能過。

王浩宇罷免案後看到很多人在討論仇恨式罷免。但我其實不太擔心仇恨式罷免,因為不管怎麼說,公民自行集結的難度,絕對都遠高於特定政黨集結的難度。因為擁有資源大小不同。但當公民展現集結的能力,該怕的,就是所有的政黨。

還有,當一個政治人物可以搞到被仇恨式罷免,問題還是在於政治人物本身的作風。韓國瑜如此,王浩宇也是。他們都有個特點,就是作風問題搞到同黨同陣營的人都不見得會想支持。一樣是罷免,韓國瑜罷的掉,換一個藍營縣市卻很難真的罷掉,大家可以想想這其中差異在哪。有些事情,我覺得就只是物極必反而已。

大家可以拿黃國昌罷免案來比較一下。很多綠營的人討厭黃國昌。但當初黃國昌被罷免的時候是沒有過25%門檻的。當然因為罷免方一定會動員,同意罷免票絕對都會高於不同意,綠營的人討厭黃國昌,但至少他在地的選民沒有到覺得非得罷免他不可。所以最終安定力量的罷免案是失敗的。安定力量其實他們背後的資源是很多的。所以連他們有資源想要動員罷免,選民都不必然會買單。就知道罷免並不是銀彈多就一定會成功的東西。

可見同意罷免的選舉人25%門檻過不過的了,被罷免者個人作風才是影響最終結果的關鍵。

所以你說王浩宇這84582票誰動員出來的。就是他自己動員出來的啊不然咧。

從 google 趨勢看政治人物聲量 vs 從臉書統計看政治人物聲量

今天在網路看到這篇

覺得蠻有意思的。「聲量看政治」的統計數據資料來源是FB。所以他反應的政治聲量比較算是從「特定人物字詞,在FB上有多少po文、留言、分享、讚」來做統計。留言,評論,分享也都算發文一種,因為本質是「發文」,也就是說他反應的是FB內容產出的統計。

我覺得這統計很棒。因為可以拿來跟google趨勢的搜尋結果參照一件事情:內容創造與帶動主動搜尋量之間是否有關係。所以我這篇就以他這篇的日期區間(1/12~9/27)與政治人物為基礎,到google趨勢撈資料看能觀察到什麼。

柯文哲 vs 韓國瑜

由於google趨勢是相對數據,一次最多比五個字。且如果有數據偏離太多的時候,數據少的會被壓扁。所以先來看「聲量看政治」政治人物聲量最高的兩位

  1. 1/12是剛選完所以有一次高峰
  2. 6/6罷免投票,8月正式卸任高雄市長,韓國瑜有兩次明顯的井噴式高峰

所以韓國瑜這段聲量高,有很大部分應該是因為霸韓。

兩個人相對搜尋熱度數總計如下
柯文哲:254
韓國瑜:768

但是如果留著韓國瑜的線,其他人都不用看了。所以我把韓國瑜拿掉。然後照著「聲量看政治」的排名依次跟後面3個人做比較

柯文哲 vs 朱立倫 vs 江啟臣 vs 鄭文燦

  1. 整體來說柯文哲比其他三個人的搜尋量明顯要來得多
  2. 朱立倫的搜尋量是四個人裡面最低的
  3. 江啟臣的搜尋量高峰是3/7,因為當選國民黨主席,前面1/25有一波量是當時宣布要選國民黨主席。3~4月很鬧的數位諸葛選拔雖然我在同溫層FB看大家轉傳得很high,但顯然沒反應在搜尋量的變化上。反而6/8傳坐鎮高雄反霸韓跟罷韓投票後有一小波搜尋量。7/23的搜尋量則是因為李眉蓁涉論文抄襲時的發言。
  4. 鄭文燦搜尋量相對高點有三個,當天對應的新聞:2/25,鄭文燦取消龍德宮接駕。5/31前一天母親過世。7/4母喪告別式
  5. 朱立倫搜尋量相對高點有三個,當天對應的新聞:1/12總統選舉剛結束。6/6~6/11當時是罷韓前後。6/18發布「朱立倫倡議」網站,倡議打造藍軍大智庫

在「聲量看政治」中朱立倫的排名是第三。但很顯然他在臉書的「量」只存在於臉書,完全沒有反映在搜尋量上。而鄭文燦的搜尋熱點就我個人同溫層觀察,取消龍德宮接駕當時有一波新聞討論,是有一些討論熱度但我個人覺得熱度普通。但這件事卻有反映在搜尋行為上。然後他母親過世的事情我是整理這篇才發現有這個新聞。從這可以隱約感覺出臉書上同溫層會熱議的主題,跟會反映在搜尋行為的新聞間主題上的差異。

四個人相對搜尋熱度數總計如下
柯文哲:3092
朱立倫:458
江啟臣:941
鄭文燦:594

柯文哲 vs 郭台銘 vs 蘇貞昌 vs 林佳龍

郭台銘搜尋量相對高點有三個,當天對應的新聞:1/12總統選舉剛結束。1/22鴻海尾牙。5/26周刊爆郭台銘捐款台大癌醫跳票。然後其他人的新聞點我懶得查了XD

四個人相對搜尋熱度數總計如下
柯文哲:4485
郭台銘:1928
蘇貞昌:1845
林佳龍:872

郭台銘略高於蘇貞昌。蘇貞昌則是林佳龍2倍以上。這部分跟「聲量看政治」中三個人的數據分佈也是有差異的。

柯文哲 vs 賴清德 vs 馬英九 vs 侯友宜

比較有意思的是,馬英九的網路搜尋量是上述國民黨人中最高的。而且也是最會創造搜尋話題的。

四個人相對搜尋熱度數總計如下
柯文哲:4485
賴清德:1504
馬英九:2979
侯友宜:1291

綜合搜尋熱度總計比較

上述所有人的搜尋熱度,以柯文哲的4485做基準以等比例調整後。大家數值與圖表如下。跟「聲量看政治」的排序做個對照,大家可以比較一下「社群媒體聲量」跟「使用者搜尋熱度」的差異。

「聲量看政治」圖表

「使用者搜尋熱度」圖表

柯文哲:4485
韓國瑜:13561
朱立倫:664
江啟臣:1365
鄭文燦:862
郭台銘:1928
蘇貞昌:1845
林佳龍:872
賴清德:1504
馬英九:2979
侯友宜:1291

在臉書上馬英九排名很後面。但在搜尋他排第三。反而是朱立倫在臉書統計上排名第三,搜尋熱度吊車尾。然後綠營的政治人物排名也與臉書有所差異。

另外從前面搜尋凸起點可以發現,一般使用者的搜尋行為還是很受傳統電視新聞媒體的影響。電視報比較多,或是電子媒體有些比較聳動的新聞,通常都會帶動關鍵字搜尋量。

這裡要提一件事。就是不管是從FB看聲量,還是從google趨勢看聲量。都要先有個前提認知:這些數量都無法反應「沒有出聲只是看」的人的感受,而這有時候其實才是關鍵。所以大家看網路大數據分析很精彩的時候,請不要忘記沈默螺旋與倖存者偏誤的效應。

資訊戰真的存在嗎?從韓國瑜的搜尋量看資訊戰

選舉又要到了,去年這個時候寫了韓國瑜。今年韓國瑜出來選總統,就再來寫寫韓國瑜。

台灣政治人物搜尋次數量級的上限。我覺得應該可以拿總統作為一個標準因為總統是全國性的,屬於大家都會知道的人。現在的總統是蔡英文。所以拿蔡英文作為一個比較基準。

近七天搜尋熱度趨勢分析

最近因為有短暫熱點「王立強」共諜案,先來看看過去七天的搜尋熱度趨勢分析。這個圖表的搜尋時間是2019年11月26日中午12:00。

(點我看大圖)

  1. 韓國瑜最高,還是在一個很詭異的搜尋熱度
  2. 蔡英文其次
  3. 吳斯懷在剛開始中國國民黨提名不分區立委那陣子搜尋量有上來,快跟蔡英文相當,後來就降下去
  4. 王立強最近新聞開始爆之後搜尋量大增,超越蔡英文但也不算超越的非常多。
  5. 拿新北耶誕城作為比較,是因為這個活動是年輕人跟小家庭都會想去的,猜測會有一定的搜尋量,也確實有很明顯的搜尋週期,週四搜尋從下午兩點開始上高峰。週五下午五點開始,週六跟週日下午三點開始,週一就趨緩沒有在週末那麼熱。很符合想出去玩之前要先找資料的時間。但即便是週一搜尋量還是跟搜蔡英文的熱度相當。

七天搜尋量的城市分布

再來看看搜尋量的城市分布

  1. 人名(蔡英文、韓國瑜、吳斯懷、王立強)的搜尋城市分布遍佈全台灣。
  2. 活動(新北耶誕)明顯集中在雙北,然後少量在桃竹苗。但跟近七天搜尋熱度趨勢放在一起看,表示大型活動的搜尋量,在活動熱度高的時候,即使是區域型活動還是有辦法超越全國性政治人物的搜尋量。

你一直說韓國瑜搜尋熱度詭異的高,你是不是有偏見?

首先,這個看法去年我就提出過了,可以回顧以下舊文,裡面有當時的分析。
選舉觀察part2:看「韓國瑜」網路資訊風向的被操弄

另外關於搜尋量異常,以下舊文後面也要附上當時查的 google ads 實際搜尋量的資料。特別要注意到的是 google ads 實際搜尋量 跟 google 搜尋趨勢顯示的搜尋熱度意義是不同的,google ads 查到的是搜尋次數的量級統計。
選舉觀察part5:「公投」使用者搜尋行為差異分析

既然去年查過。今年我當然也要再來查一下。這兩年因為剛好歷經六都市長選舉,還有兩大黨的總統候選人黨內初選,所以我就拿蔡英文、柯文哲、郭台銘,韓國瑜來比較,以下是從 google ads 撈出的兩年數據(2017/11~2019/10)做出的折線圖,分析如下。

(點我看大圖)

這份是2015/11~2016/10,蔡英文的搜尋量。由於 google ads 最早只能查到2015/11,所以沒有更之前的資料。同時比較當時的對手朱力倫與上一屆總統馬英九的搜尋量。

(點我看大圖)

  1. 2018年市長選舉,可以看得出來柯文哲的搜尋量從2018年4月開始就逐漸攀升。而韓國瑜的搜尋量在7月前都趴在地上,8月9月開始有起色,接著從10月開始噴井式突破天際,月搜尋量到達400萬的等級。這數字有多驚人呢?以總統選舉來看。蔡英文當選得票數是 6,894,744。這人數跟馬英九第二屆的得票人數是相當的。台灣兩千三百萬人口。我假設一個搜尋量代表一個人搜尋一次的話,代表2018年11月,全台灣有17.4%的人都去搜尋過韓國瑜。從2019年1月開始。韓國瑜就一直維持在月搜尋量82萬以上的搜尋量級。
  2. 柯文哲在2018年11月(市長選舉月)當月的搜尋量也有噴井式的狀況。但也不過就是150萬。跟韓國瑜409萬比起來根本完全就是小兒科。韓國瑜的月搜尋量足足是柯文哲的2.7倍。
  3. 蔡英文的月搜尋量一直處在一個平凡而穩定的狀態。最高月搜尋量不過24.6萬。沒有選舉的時甚至只有6萬。唯一可以預期的是2020年1月總統選舉月,不管當選與否都一定會有噴井式的搜尋量,到時候我們可以來看看他的搜尋量有多少(2016年1月蔡英文的搜尋量是55萬,2016年5月就任,搜尋量是30萬),可以作為以後分析的一個標準。
  4. 郭台銘的數據可以視為「有錢人撲天蓋地選舉時,到底可以對網路搜尋量影響多大」的一個標的。搜尋量高點在2019年4月跟9月。4月的時候是國民黨黨內初選。9月的時候是最後宣布不選總統的時間。也就是說有錢人選舉對搜尋量影響的極限,大概可以說就是在月搜尋量67.3萬。

我沒有辦法去判斷柯文哲跟郭台銘的搜尋量有沒有被外來勢力影響,因為看起來還在可能正常的範圍內。但是韓國瑜的搜尋量一枝獨秀的超越他們近兩倍有。肯定是有其他勢力介入操作狂打雞血才有可能。以中國國民黨的現況,我不認為中國國民黨自己有那個本事作這些操作。

小結

最近很多人在那裡說哪有資訊戰。我覺得大家在討論資訊戰的時候,要釐清幾個點。

  1. 選舉影響有效/無效不能拿來證明資訊戰的有/無。有資訊戰不一定代表會對選舉產生明顯的「有效」影響,因為光釐清什麼叫做「有效」就有很多可以討論。但是「有沒有人在操作」資訊戰是有跡可尋的。很多人在討論的時候會把這兩個觀念互相抽換混淆,不可不慎。以數據來說,我會說資訊戰就是確實存在的。但很難說他最後的「影響」有多大。這兩者之間的關連性到什麼程度本來就很難評估。有沒有做,跟做完有沒有影響。完全是兩件事。
  2. 「有資訊戰操作」不等於什麼東西的歸因都是資訊戰。這就很像我們做網路行銷SEO的時候,順風大家都是SEO專家,逆風大家都怪演算法變更一樣。現在資訊戰也常常被拿來作為某件事情成功/失敗的藉口。我個人是覺得這樣的心態也不太健康。
  3. 韓國瑜的網路搜尋量很明顯是有被操作的,但我也沒有進一步證據可以證明是誰操作的。只能說確定有人在操作。那這樣的操作韓國瑜本人是否知情?我的看法是「不一定」。因為網路作這樣的操作本來就沒有一定要當事人的允許才能去做。就像SEO界有所謂的暗黑SEO,其中一種手法就是把別人的網站搞掉,這種他們當然不會跟當事人去講。所有的方法可以正著用,就可以反著用。如果外國勢力的目的是擾亂台灣的選舉,那當事人知不知道根本不重要。外國勢力想要「擾亂」的目的可以達成就好。

然後這篇文章上述提到的截圖,對應的原始數據資料我都有下載,大家可以自行到這裡下載,看看有沒有看出其他貓逆。

選舉網路聲量操作:特定關鍵字搜尋量操作可以達成哪些目的?

前面已經寫了很多篇關於搜尋量趨勢異常跟實際搜尋量級的異常。看完很多人的疑問是:所以操作關鍵字搜尋量到底可以幹嘛?

我自己本身之前是做網路行銷,比較偏向網站SEO操作多一點。所以我主要會從SEO的角度來看這件事。不過後面也會提供就我所知搜爬可以做的應用,串起來的可能性給大家參考。

先從SEO的角度來看,用比較簡單的一句話大概就是:透過搜尋量加上其他操作,決定你搜尋某些關鍵字時可以看到的資訊。

有人會反駁,他搜韓國瑜看到的資訊有好有壞,農場文也根本沒有排在前面,所以我這樣的假設不成立。但會有這樣的看法其實是對 SEO 有幾個誤解:

  1. 操作訊息排名一定是把「有利自己的資訊」給大家看得推到前面
  2. 操作搜尋排名等於要把農場文推到前面

但其實操作SEO有正向操作,跟反向操作。正向操作比較直覺,就是把希望大家看的資訊推到前面。例如我經營電商,那我就會希望大家搜尋某些產品關鍵字的時候,我的電商網站可以排名前面一點,使用者就比較有機會在我網站下單,進而得到商業利益。

那反向操作呢?反向操作就我所知至少有幾種:

  1. 用作弊操作的方式讓別人排名前面的網頁變成黑名單
  2. 把負面評價的網頁排名往後洗,讓別人看不到

而其實要做反向操作要用到的搜尋量跟整體投入資源要比正向操作多很多。

以1來說,就是用不正當的搜尋排名操作方式,讓google認為有不正當且明顯的人力介入,進而把網站 ban 掉。

以2來說,舉公投的例子,當搜尋公投排名前面都是愛家公投的資訊比較多的時候,人的決策行為其實很容易受到自己對這個資訊的第一印象所影響,那當看到愛家公投的資訊比較多,以一個對這個議題本身還沒有太多看法只是好奇的人來說,就有可能影響他對這個議題的看法走向。另外如果翻了兩三四頁都看不到其他差異比較大的資料,也會營造出「那應該大部分的人都這樣想這樣看這件事」的印象。

再舉韓國瑜為例子,因為媒體已經配合產出大量的內容,所以農場文只是用來做輪轉式網站SEO操作用,本身的排名不重要,他只是拿來助攻用。而新聞內容不一定要是加分,只要是只是在操作印象,而不是進一步要引導聽閱者思考或質疑的內容,都可以讓這些內容盡量都排名在前面。這樣就可以把一些比較有內容的分析文章往後擠。

於是當有人在line群這類封閉群組傳送的訊息,有人希望可以針對資料做一些基本查證的時候,會因為不容易找到相關資訊就放棄繼續查證或協助澄清。即使有人想要找資料也很難找,也會比較容易被容易找到的資訊影響決策。

另外,從會影響搜尋熱度的行為來看,會影響搜尋熱度的來源大致有兩個

  1. 真人的搜尋行為
  2. 機器的搜尋行為

2常見於網頁內容爬蟲的應用上。而跟搜尋行為有關的商業應用至少就有這幾項

  1. 搜尋結果網頁排名
  2. youtube影片排名
  3. 資料蒐集
  4. 情資分析
  5. 自動下注

所以如果先以直線思考來看,理論上可以做到類似這樣的影響

之前其實就聽過實體賭盤對投票意願的影響,所以透過影響賭盤來影響選舉也不無可能,不過這部分純粹是我從搜爬應用推斷的一種可能性。

當然,我必須承認操作搜尋量的實際影響其實很「幽微」,他要搭配的是一連串使用者「為什麼要做關鍵字搜尋 / 搜尋後可能影響到哪些行為」一起做考量。但搜尋量異常是事實(相關分析與數據請見「選舉觀察part6:「韓國瑜」與其他候選人搜尋行為差異比較與搜尋量解析」「實際月搜尋量及數據整理」),我認為這次大力介入網路的人,他們是在測試練兵,同時也在這個過程建立網路影響行為的關聯性調查。

我為什麼敢做這樣的推論呢?因為中國目前針對網站使用者行為調查比台灣成熟很多。以掏寶為例子,他們是有專門使用者行為調研的部門,在每次細節改版調整的時候收集數據分析影響轉單率多少,他們的使用者行為調查是做得很細的。「實驗」的說法不是無中生有,因為他們在商業上都已經在這樣做了,用在政治上只是小菜一碟而已。

選舉觀察part6:「韓國瑜」與其他候選人搜尋行為差異比較與搜尋量解析

這篇拖到現在才寫的原因是我一直在等 google ads 裡面 11 月搜尋量的資料。等到今天終於有了,也就是說 google ads 要到下個月11日以後才能查得到上個月的搜尋量。先講結論,這篇文章算是一半自打臉的文章。但另外一半也證明我之前的部分推論是正確的。

  • 自打臉的部分是:韓粉主要還是在台灣。美國也有韓粉,但還是沒有台灣的多。
  • 證明正確的部分是:韓國瑜的實際搜尋量確實有異常,而有趣的是全球都異常,不是只發生在台灣。

然後另外這篇會更詳細的分析「正常候選人會有的使用者搜尋行為」,由此可以看出韓國瑜的使用者搜尋行為異常。

「正常」的候選人搜尋行為模式是什麼?

我在寫『選舉觀察part5:「公投」使用者搜尋行為差異分析』跟『google trends 常見應用與使用者搜尋模式分析』一直在強調一件事:搜尋熱度異常不是只有看「爆量」,還要同時看「搜尋行為模式」是否也有異常。兩者同時發生才能推論有異常。

所以在看「異常」以前,要先來看「正常」的候選人搜尋行為模式有哪些。現在因為選完有一陣子了,所以可以直接把當選的候選人在選完後跟選前的搜尋模式一起列出來比較。

2008年馬英九搜尋趨勢(台灣)

2008年馬英九搜尋趨勢(美國)

2012年蔡英文搜尋趨勢(台灣)

2012年蔡英文搜尋趨勢(美國)

2014年柯文哲搜尋趨勢(台灣)

2014年柯文哲搜尋趨勢(美國)

2018年柯文哲搜尋趨勢(台灣)

2018年柯文哲搜尋趨勢(美國)

2018年盧秀燕搜尋趨勢(台灣)

上面幾個搜尋趨勢有幾個共同特色

  • 爆量點都是選舉當天
  • 爆量點至少是前面兩個禮拜(扣除爆量)平均搜尋量至少3倍以上
  • 搜尋量大幅度攀升都發生在選舉日前1周。
  • 選舉當地的搜尋量變化
    • 在選舉前2~2.5個月內有逐步增加的狀況,但增加幅度相較於爆量都是比較緩慢堆疊的。
    • 選後三天搜尋量會急劇下跌,2週後回到相對低點

那只有台灣的搜尋行為才是如此嗎?我們來看看美國總統選舉的搜尋行為是如何。

2008年歐巴馬

2012年歐巴馬

2016年川普

除了中間可能會因為事件發生有短暫的震盪,且震盪後很快都會回到相對低點。整體的搜尋行為模式跟台灣的搜尋行為模式是一致的,特色也是相同的。

事實上搜尋行為被大眾媒體,特別是電視媒體傳播的影響是很明顯的,從搜尋特色的以下這三點來看

  • 搜尋量大幅度攀升都發生在選舉日前1周。
  • 在選舉前2~2.5個月內有逐步增加的狀況,但增加幅度相較於爆量都是比較緩慢堆疊的。
  • 選後三天搜尋量會急劇下跌,2週後回到相對低點

這同時也與電視播放候選人的新聞密度相符合。

神奇的「韓國瑜」搜尋模式

有人會說,韓國瑜新聞那麼多,搜尋量大很正常。那我們來看看韓國瑜在台灣跟美國的搜尋量吧。

2018年韓國瑜(台灣)

2018年韓國瑜(美國)

  • 假設韓國瑜的搜尋量多真的全部都是由電視媒體的大量曝光帶來的。但這個理由拿來解釋美國的搜尋量變化是否合理呢?我是覺得不合理。
  • 其他人都明顯在選舉當天有個爆衝點,韓國瑜的暴衝點相對於他自己前面的流量顯得非常不暴衝。
  • 2.5個月內的搜尋量堆疊模式跟其他候選然完全不同。呈現一種很穩定的上升。連中間的爆發流量都顯得頻率很一致。

而且理論上韓國瑜如果呼聲真的那麼高,前面搜尋量真的那麼大,理論上選舉當天的量應該會爆高,但是如果把韓國瑜跟柯文哲的搜尋熱度放一起來看會發現…

柯文哲單日搜尋熱度還高於韓國瑜最高點再多25點以上。

依照韓國瑜這種搜尋行為堆疊的搜尋量,理論上實際搜尋量應該會很誇張。而依照我從 google ads 撈出來的結果,真的很誇張。因為數據很多,我直接用google sheets來整理。大家有興趣看數字的可以到這裡看

這個表裡面,除了顯示實際搜尋數量的量級數字外。我另外在後面計算了每個月跟上一個月相除後的數字,看看這個月跟上個月的量級增加了幾倍。

我這裡直接整理結論。

  • 在台灣的搜尋量級10月/9月的倍數,其他市長當選人落在1~2倍之間。只有韓國瑜在7倍以上。
  • 在台灣的搜尋量級11月/10月的倍數,其他市長當選人落在3~5倍之間,只有韓國瑜不到2倍。
  • 其他市長當選人在各國的搜尋量10月/9月的倍數,都落在1~3倍之間。只有韓國瑜大多落在5~10倍(法國除外)。
  • 其他市長當選人在各國的搜尋量11月/10月的倍數都落在3~7倍之間。只有韓國瑜在1~3倍之間。
  • 韓國瑜的搜尋量級在10月已經到達7位數 2240000,11月更高達 4090000。柯文哲11月還是6位數 450000,11月到7位數也才1500000。而普悠瑪事件發生在10月,當月搜尋量最高7位數也只有到 1220000
  • 10月普悠瑪事件發生,當月美國韓國瑜搜尋量級 90500,普悠瑪搜尋量級只有 14800。美國台人對普悠瑪的興趣比韓國瑜低?不可思議。
  • 韓國瑜的搜尋異常很一致的發生在各國。但主要最大搜尋量級還是在台灣。

所以韓國瑜的搜尋熱度毫無疑問是有異常的,不過美國韓粉確實沒有我以為的比台灣多。而這樣的異常即使經過 google ads 整理過的數據還是可以很明顯地看得出來。


下面是額外的紀錄。是在寫這篇的時候有觀察到 google trends 與 google ads 兩邊資料有落差的現象,在這篇記錄一下我的觀察。

有的關鍵字12個月搜尋熱度在google trends  相互比較的時候,「捷運」比「台鐵」高,但是最後在 google ads 查到的12個月搜尋量「台鐵」卻都比 「捷運」高。我自己的判斷是因為 google ads 提供的是商業下廣告的評估依據,他的準確度論上應該要更高,並且前一個月的搜尋量並不是一到隔月1日就釋出,而是隔了10天以後才有,應該表示 google trends 的資料比較即時,但針對搜尋行為過濾的條件比較少。而 google ads 過濾的條件可能比較多,所以有的字如果比較容易讓單一使用者短期內重複搜尋,可能在 google trends 顯示的熱度會比較高,但在更嚴謹的把同一使用者短時間重複搜尋行為過濾掉後,才是 google ads 那裡會呈現的數字。

選舉觀察part5:「公投」使用者搜尋行為差異分析

這篇內容是跟上一篇做呼應。但這篇或著重在搜尋行為分析上。加上我突然想到因為工作的緣故,我其實可以從 google ads 拿得到實際的每月搜尋量。所以本文最後會附上2017/11~2018/10 從 google ads 撈出來的關鍵字每月搜尋量數據,有興趣的就自己看看吧。

另外,很幸運的因為google趨勢的資料是從2004年1月開始就有,正好中間經歷兩次公投綁大選,這兩次的搜尋熱度都可以查得到。因此可以跟這次的公投搜尋行為放在一起做比較,讓大家可以比較清楚知道為什麼我會強調的異常是「爆量加上穩定增加的搜尋量這件事怪怪的」,而不只是因為爆量就認定有異常。

公投三次的比較區間,取樣時間是投票前3天,再往前推3個月。會這要挑一來今天是投票前三天,已經可以開始看到不管哪個政黨的候選人的搜尋熱度都開始節節高升。依照之前其他候選人的比較,最高峰會是在投票開完票那時候。當選的那天,呼聲最高的候選人搜尋量會再次衝破天際,落選後7天內會回到谷底。下圖擷取幾次總統大選的搜尋趨勢做參考。大家可以自行去搜以前幾次選舉,搜尋趨勢分布的狀況大同小異。

2012年

2008年,臺灣入聯公民投票綁大選(同時一共有4案公投)

2004年,防禦性公投綁大選(同時一共2案公投)

雖然公投跟其他候選人放一起顯突起的趨勢不是那麼明顯,但還是可以看得出來高點落在選舉開票後三天內。2004年的走勢比較特別,公投跟陳水扁是錯開的。不過時間很久遠所以我現在也不確定當時怎麼了,也許是有遊行這類的。但大致上還是看得出來搜尋量攀升會落在選舉前2周。

這次這篇文章寫在選舉前,一來今天還沒選舉,二來我主要希望分析的是「投票前的搜尋趨勢」,所以以下比較都會排除投票日,比較區間一律取從投票日往前推前3天到再往前推3個月。以下是包含這次,三次綁大選的公投的搜尋趨勢,不跟其他關鍵字比較,只跟自己比。

2018/8/21~2018/11/21(投票日11/24)

  • 9/26~10/13,18天,搜尋量從1提升到5,斜率0.22
  • 10/13~26,9天,搜尋量從5提升到26,呈現很「穩定」的上升,斜率2.3
  • 10/23~11/13,21天,搜尋量從26提升到45,呈現很「穩定」的上升,斜率0.9
  • 11/13~11/18,5天,搜尋量從45提升到100,而且是一天高過一天,斜率11
  • 10/13 ~ 11/18,持續37天,搜尋量穩定升高

2007/12/19~2008/3/18(投票日3/22)

2004/1/1~2004/3/31(投票日3/20)

因為google趨勢最早的資料只能查到2004年1月,所以我就從2004/1抓3的月,讓圖表每個點之間的間隔比較一致,降低趨勢斜率比較上的誤差。

2007/12/19~2008/3/18 跟 2004/1/1~2004/3/31 兩張看都會發現,2004/2/29 這天不知道發生什麼事?總之2004這次公投,搜尋流量最高峰並不是投票日那天,其次是搜尋規律不強。但勉強在選前3周的搜尋量都還是有略微上升

相較之下 2018 這次公投的搜尋熱度走勢可說是「非常漂亮」。漂亮的讓我覺得應該來買張公投股票才對…

不過很有趣的是,若把台灣跟全球,把2004年到現在做比較的話。

台灣的

全球的

中國的

前面兩個高點,跟後面的起伏,中國跟全球比,全球好像是中國的略為壓扁版的。所以應該可以推測全球的搜尋量主要是被中國的搜尋量拉起來的。

前兩次公投可能是因為主題(入聯 / 購買軍武)的關係,中國人顯然很有興趣,而這次大概是因為公投題目太多惹,他們完全冷掉。以下是中國針對公投這個字不同時間區間的搜尋趨勢圖。

2018/8/21~2018/11/21 一大堆公投案很明顯地有一搭沒一搭的。興趣不大。

2007/12/19~2008/3/18 臺灣入聯公民投票綁大選(投票日3/22)

  • 1/30~2/28 搜尋熱度大致維持在4上下,除了2/3有一波搜尋熱點,4天就恢復一般搜尋水準。
  • 2/28~3/14,16天,搜尋量從4提升到26,斜率1.375
  • 3/14~18,3天,搜尋量從26提升到100,斜率24
  • 2/28~3/18,持續20天,搜尋量穩定升高

2004/1/1~2004/3/31防禦性公投綁大選(投票日3/20)3/20爆量。但是單一爆量會壓縮到前面的趨勢起伏,所以我這裡調整一下日期區間改為2004/1/1~2004/3/18

  • 1/30 搜尋熱度0
  • 1/30~2/26 搜尋熱度大致維持在13上下
  • 2/26~3/15,16天,搜尋量從13提升到46,斜率2.0625
  • 3/15~18,3天,搜尋量從48提升到100,斜率17.33
  • 2/26~3/18,持續22天,搜尋量穩定升高

我比較好奇的是,台灣總統的搜尋曲線會怎麼分佈。所以再把總統的拉出來比較,一樣扣除投票日當天。

2015/10/14~ 2016/1/14(1/16投票)

  • 12/9 前維持在25
  • 12/9~1/5,28天,搜尋量從25提升到50,斜率2.6
  • 1/5~1/14,10天,搜尋量從50提升到100,斜率5
  • 12/9~1/14,持續36天,搜尋量穩定升高

然後來兩張公投自己從2004/1~2018/10與2004/1~2018/11的趨勢圖

2004/1~2018/10(台灣)

2004/1~2018/11(台灣)

上述幾個圖綜合比較的結論如下

  • 針對「公投」,先排除2018年11月數據的話,10月的搜尋熱度是77,2004年2月是84,3月是100。若把2018年11月數據拉進來比,很顯然11月會高過於2004年3月的高峰。最後會高多少要等下個月看才知道,不過目前預測看起來至少高2倍有。
  • 以台灣的月搜尋熱度來比較,截止到10月是:2004公投 > 2018公投 > 2008公投。截止到11月是:2018公投 > 2004公投 > 2008公投。
  • 2004與2008的公投,相較於2014的公投,在投票前3個月的搜尋趨勢,不像2018這次有明顯且穩定的上升。2004與2008的公投搜尋趨勢規律性低。2018的公投搜尋則有高度的規律性。2004年的公投雖然總搜尋量高點高於2018年10月結算。但2004年的公投搜尋習慣跟2018年有很顯著的不同。
  • 2016年蔡英文搜尋趨勢跟2018年公投的上升趨勢有點像。但是2016年蔡英文的搜尋量上下變動很大大。2018年公投的上下變化卻非常輕微。
  • 中國對2004公投興趣很高,2008其次,這次則完全沒興趣。兩次的搜尋趨勢分佈在時間與增長幅度上有很高的雷同。

綜合以上,我個人還是維持「2018年公投搜尋量有異常」的結論。而「公投」這樣的搜尋行為趨勢,跟一個人很像,那個人就是「韓國瑜」。但他搜尋行為不正常的堆疊時間拉得更長。

最後,附上 2017/11~2018/10 從 google ads 撈出來的關鍵字搜尋量數據,挑的是我之前寫文用過的關鍵字,不過寫到這我已經懶得算了…有興趣的人可以自己搭配google趨勢每月的搜尋量分佈圖,去大概算一下當月最高搜尋日那天的搜尋量是多少。這都只有台灣的搜尋量,不是全球的喔。

喔,看完我必須要說,以台灣的搜尋量「韓國瑜」從2018年8月起可以連三個月超越「日本」,然後2018年10月「公投」搜尋量也超越「日本」,我是真的蠻驚訝的啦。而這兩件事在「google 趨勢」看完全是不一樣的。這部分的資料呈現不一致是什麼原因我不清楚。也許推說 google 數據不準是個好方法?也不要問我為什麼10月韓國瑜的搜尋數量直接多一位數。以下數字我沒有變造過,完全是直接從 google ads 匯出來的。

不過我只能說看搜尋趨勢真的不準,因為現實搜尋數字的變化量級比搜尋趨勢所呈現的更驚悚。就醬子~~

2018/11~2018/4

Keyword Searches: Nov 2017 Searches: Dec 2017 Searches: Jan 2018 Searches: Feb 2018 Searches: Mar 2018 Searches: Apr 2018
公投 1300 4400 4400 1600 2900 12100
婚姻 3600 3600 2900 2400 3600 3600
貿 1900 1600 1600 590 1600 1300
柯文哲 110000 110000 110000 110000 165000 165000
總統 2900 2900 2900 3600 3600 3600
英文 60500 74000 90500 74000 90500 90500
連勝 8100 5400 6600 4400 6600 9900
陳水扁 9900 12100 22200 12100 22200 18100
馬英九 27100 49500 33100 49500 60500 40500
丁守中 9900 6600 18100 9900 9900 14800
侯友宜 6600 9900 12100 22200 49500 74000
姚文智 2900 14800 9900 12100 14800 49500
貞昌 1900 2900 8100 6600 6600 74000
陳其邁 9900 9900 18100 9900 40500 9900
日本 90500 90500 90500 90500 110000 90500
減肥 60500 40500 49500 49500 60500 60500
韓劇 201000 201000 246000 165000 201000 165000
韓國 49500 49500 60500 49500 60500 60500
韓國 6600 5400 6600 5400 40500 33100

2018/5~2018/10

Keyword Searches: May 2018 Searches: Jun 2018 Searches: Jul 2018 Searches: Aug 2018 Searches: Sep 2018 Searches: Oct 2018
公投 3600 4400 6600 22200 27100 165000
婚姻 3600 3600 3600 4400 4400 4400
貿 1900 1300 1300 1300 1000 2400
柯文哲 368000 301000 550000 550000 368000 450000
總統 4400 3600 4400 4400 3600 4400
英文 135000 135000 135000 165000 135000 110000
連勝 12100 9900 12100 14800 12100 22200
陳水扁 18100 14800 22200 18100 27100 33100
馬英九 74000 40500 90500 49500 49500 74000
丁守中 74000 33100 60500 74000 33100 60500
侯友宜 33100 110000 74000 40500 49500 60500
姚文智 74000 110000 110000 135000 74000 90500
貞昌 33100 33100 33100 33100 90500 60500
陳其邁 12100 14800 18100 33100 49500 246000
日本 90500 135000 135000 90500 135000 90500
減肥 60500 60500 74000 60500 49500 49500
韓劇 165000 165000 201000 201000 165000 201000
韓國 60500 74000 60500 60500 60500 60500
韓國 74000 110000 110000 246000 301000 2240000

 

選舉觀察part4:「公投」的搜尋熱度爬升異常分析

這是在寫part1的時候意外的發現。當時是為了拿來跟韓國瑜做比較,結果意外發現公投搜尋量的異常增加。

所以決定進一步交叉比對。因為4月苗博雅發起了婚姻平權公投,所以從4月開始看相關關鍵字的搜尋趨勢。

可以看出「公投」從10/14起,就有倍數的大躍進。4/14的高點是因為當時苗博雅發起婚姻平權公投,要反制愛家公投,所以當時公投有個熱搜點。8/27的高點是因為那時候要拼公投綁大選,希望大家8/30前可以寄回第二階段公投連署。這天連「婚姻」的搜尋熱度也到差不多的高度。這兩個高點都是相對正常的。

但是10/14開始的大躍進就令人非常費解。而且「公投」搜尋熱度大躍進到超越柯文哲,且持續超越中。就算把愛家 / 婚姻 / 正名的搜尋熱度疊加,也追不上公投的上升曲線。

這是11/16擷取的7天搜尋熱度趨勢

這是11/19擷取的7天搜尋熱度趨勢

可以發現幾個現象

  1. 蜂蜜檸檬(台北市長辯論會那幾天)跟陳其邁(造勢晚會)都曾經超越公投一點點,但後來很快就下降。
  2. 公投的上升曲線非常的「穩定」而且每天的搜尋熱度相較於其他關鍵字,呈現一種很穩定但顯得很奇怪的規律。

比較一下這7天的搜尋區域分佈圖

  1. 蜂蜜檸檬顯然只有北高兩市的人比較有興趣
  2. 柯文哲的搜尋熱度主要分布在北部中部地區
  3. 陳其邁的搜尋熱度主要分布在中部南部
  4. 公投很神奇的受到東部「壽豐鄉」跟海上「馬公市」的青睞。而且搜尋熱度分布區域也很廣,北中南都很熱。

因為我算是有長期在關注公投這個議題,這樣的搜尋熱度增量方式,跟區域分布實在讓我太驚訝了。我有朋友提到現在愛家公投的人他們都會開手機上網秀畫面,詢問公投的搜尋熱度有沒有可能是因為這樣造成的。但我覺得這樣的搜尋量應該也不足以讓公投的搜尋熱度呈現「穩定且持續上升」的狀況。

所以我想進一步的看,那在我覺得公投搜尋量異常的時間點以前,公投的主要搜尋區域都分佈在哪些地方呢?於是我以2018/4/1~2018/10/14的數據來做比較。這時間點的搜尋熱度是這樣的。

  1. 柯文哲這段時間的搜尋熱度都相對高,這不意外,因為柯文哲的新聞一直都不少。
  2. 公投在8/24後出現急遽上升的趨勢,8/27這天最熱,到9/1就急劇下跌了。即使算到9/7回歸一般熱度,這期間也不過14天。
  3. 婚姻的搜尋熱點跟公投相同,推測應該都是在搜尋跟婚姻平權有關的事。

那這三個字當時的搜尋都分佈在哪些城市?

  1. 搜公投跟搜婚姻的地區分佈相符
  2. 柯文哲的搜尋在這時候就已經遍佈全台

不過這時候我發現搜尋7天的區域分布,不能直接拿來跟之前的直接比較。因為感覺他資料呈現的比例是不太一樣的。不過東部「壽豐鄉」跟「馬公市」的七天搜尋熱度很高的這點還是讓我很意外。

那海外華人對「公投」這個字的搜尋熱度又如何?一樣用7天來,用美國 / 加拿大 / 澳洲來比較。

看起來這7天的海外搜尋熱度,公投跟柯文哲是相當。那如果把時間拉長為1年呢?

  1. 美國華人對柯文哲的興趣逐月增高
  2. 只有台灣人對「公投」在這一個月內高於柯文哲。

我目前想不到什麼合理的解釋可以說明這種搜尋熱度。只能說「搜尋熱度每天呈現穩定的成長」這件事,在我看起來,是有人為介入的可能性。那個穩定程度讓我懷疑是用搜爬程式跑出來的,至於目的為何,我有的資訊不足以判斷。但只能說「公投」的搜尋熱度應該是有異常。

選舉觀察part3:從「蜂蜜檸檬」看「韓國瑜」搜尋熱度異常,真韓粉其實在美國?!

這幾天我一直在想一個問題:一個台灣的熱門政治人物,搜尋熱度的上限要到多少才能說得上「沒有異常」?結果這幾天就出現「蜂蜜檸檬」,不但引起大家購買蜂蜜檸檬的風潮,還出現一大堆音樂kuso二創大爆發。放上我覺得最好聽的和弦版本。

所以短期內「蜂蜜檸檬」會大熱搜應該是可預期的。那實際狀況是多熱呢?
這是90天的韓國瑜 / 柯文哲 / 蜂蜜檸檬的搜尋趨勢

  1. 蜂蜜檸檬最後這周狠狠地超越了柯文哲,最高點高出柯文哲2倍。
  2. 但在韓國瑜面前還是輸了
  3. 從9月29日開始,韓國瑜的搜尋熱度上升曲線非常明顯。

來看看過去7天的韓國瑜 / 柯文哲 / 蜂蜜檸檬

  1. 台北市市長辯論會的日期是11/10,在那之前蜂蜜檸檬乏人聞問,突然大家都「搜起來」了
  2. 蜂蜜檸檬這三天的搜尋量都超越柯文哲
  3. 蜂蜜檸檬只有在11/12早上9:00~11/13早上1:00這段時間略為超車韓國瑜。其他時間還是輸給韓國瑜。

不過這些搜尋都是針對台灣,如果依照我之前推論韓國瑜的搜尋有更大的外力介入,是不是在全球搜尋能看出些什麼呢?結果發現一個很有趣的現象…

那個莫名的律動是怎麼回事??

如果比對上一張圖,蜂蜜檸檬超越韓國瑜的時間,跟這張是一致是沒錯。但為什麼這張會有那麼明顯的搜尋量循環?而且這個循環不是只出現在韓國瑜,是所有的字都有這個現象。為什麼?

看看搜尋低點的時間,都落在每天凌晨4點。那個時間大家都在幹嘛?

 

睡覺。

所以這個搜尋量循環反應的,是一天的作息時間囉?這個假設對嗎?我決定先拋開政治人物,拋開蜂蜜檸檬,我們一樣來搜尋減肥。
台灣7日搜尋趨勢

全球7日搜尋趨勢

所以台灣跟全球都有一樣的律動。那…不同時區的作息時間,是否會出現偏移?,來增加搜尋日文的「体重」,跟英文的「lose weight」

可以看出來時區差異越大,低點會偏移,但整體依照時間造成點搜尋熱度潮起潮落模式是相同的。

那為什麼只看台灣的搜尋量的時候,看不太出來這樣的趨勢?

上面兩張圖放一起比,可以發現如果台灣只搜減肥,高低起落其實是很明顯的。只是當減肥跟柯文哲 / 韓國瑜 一起比較的時候,那個依照一日作息高低起落的相對性,比起韓國瑜的搜尋量變化,太微小不足道了,以至於被壓扁了。

可是當搜尋熱度拉到全球的時候,這時候如果有外力介入搜尋,且搜尋量很大,且大的很規律的時候。那巨大的一日作息的高低起落搜尋量總數,就又把韓國瑜在台灣的搜尋量的高低起伏給沖淡。

這個現象我想到的假設有兩種:

  1. 外力介入者的搜尋行為跟我們很近,推測他們的作息時間跟台灣的差異不大。
  2. 外力介入者因為主要要介入台灣的選舉,所以他們操作的方式也必須因此符合台灣的作息時間,才能有最大的影響力。

不管是1還是2還是混合,至少都可以看得出外力介入的搜尋量一定是很大,才會導致一樣的時間區間,台灣跟全球的搜尋熱度曲線有如此巨大的差異。

那外力介入的巨量搜尋量,若以ip位置來看會來自於哪裡呢?如果上述1的假設正確,那我猜巨量搜尋量應該來自於中國?這次我把簡體的韓國瑜也加進來搜搜看。

很意外的,不是。中國的搜尋量規律性沒那麼強。韓國瑜的搜尋量有除了台灣中國,也分佈在美國跟澳洲。那試試看美國?

中了。巨量「繁體韓國瑜」搜尋來自美國,且熱度分佈符合台灣的一日作息。那來自美國的搜尋量,分佈在美國哪裡呢?

最多的搜尋量來自加州,加州跟台灣的時差是16小時。台灣凌晨4:00的時間,加州時間應該是,中午12:00。所以理論上加州的正常一日搜尋熱度分佈,應該會跟台灣的錯開。但顯然在這幾個關鍵字上來自美國的流量並沒有錯開。從這裡可以推出我的1的假設是錯的。2的假設可能性比較高,而且大量外力介入的搜尋量來自美國的ip。那至於這是「真美國人」幹的?還是「有人用vpn跳轉ip」做的?還是有人直接設點在美國操作?這些可能性都是有的,我就不下定論了。

不過大概可以得到一個結論,就是真韓粉其實在美國(?

台灣政治人物搜尋熱度的上限在哪?

不管前面的異常流量來源要怎樣解釋,但這些證據都只是繼續應證「韓國瑜」搜尋熱度有很大的異常。有大量人為操作應該是很確定的了。那到底台灣政治人物搜尋熱度的上限又在哪呢?

因為正好台灣這幾年出了幾個應該大家都會覺得算有名的政治人物,例如柯文哲,撇開柯文哲上一屆以黑馬之姿拿下台北市市長寶座。我相信以總統等級來說,馬英九 / 蔡英文 在搜尋熱度上應該也不會太差。連勝文雖然輸了,但當年「希望的種子」網路也很多人kuso二創,可以猜想他的網路搜尋量應該也不會太差。又正好這五年除了有台北市長選舉,也歷經總統選舉,那何不一起來做比較試試?

近5年熱門候選人的搜尋趨勢圖

滑鼠移到點上可以看到搜尋熱度的相對比較數字,從5年的圖表可以看出幾件事:

  1. 五個人的相對搜尋熱度高點:
    韓國瑜100,蔡英文(2016年) 54,馬英九(2012年) 30,柯文哲(2014年) 65 ,連勝文(2014年) 37
  2. 「韓國瑜」搜尋熱度是「蔡英文」最高點的近2倍。是「馬英九」最高點近3倍
  3. 一樣是中國國民黨的候選人,本身也是財力資源雄厚的「連勝文」,搜尋熱度最高的時候比馬英九略高。但也只有到「韓國瑜」的3.5成。
  4. 「柯文哲」在上屆選舉最高熱度只到「韓國瑜」的6.5成。

那如果從google趨勢 2004 年開始有紀錄起,先踢掉連勝文,把陳水扁選總統的紀錄也列入的話呢?

  1. 五個人的相對搜尋熱度高點:
    韓國瑜100,蔡英文(2016年) 32,馬英九(2008年) 41,柯文哲(2014年) 42 ,陳水扁(2004年) 23
  2. 馬英九在2008年的網路聲勢與2014年的柯文哲相當

綜合上述兩張圖。以台灣要靠近選舉大家才會對政治人物有高度搜尋興趣的這個特點來說,並把所有熱門人物並列,我大概可以下幾個簡單的結論:

  1. 柯文哲在 2014 年選舉的最高熱搜點,大概就是一個「直轄市」候選人在台灣同時狹電視+網路推波助瀾的熱度極限。
  2. 總統級的選舉,除非未來出了更厲害的明日之星,不然短期內,極限應該也差不多是柯文哲 2014年熱搜高點。
  3. 不管是哪個候選人,熱搜的最高點都出現在「當選那天」「當選那周」。只有韓國瑜的熱搜高點「還沒到選前就連續近兩個月不斷的自我突破」

選舉觀察part2:看「韓國瑜」網路資訊風向的被操弄

再寫這篇,算是回應朋友在我臉書的留言的某些疑問,跟一些網路留言。我先把他們的疑問大概條列整理。問題大概可以歸類到這幾個,這些問題我依照我預備回答的順序整理如下。

  1. 韓國瑜在這個時間點搜尋量大得多不是很正常的事情嗎?
  2. 拿韓國瑜跟跟韓劇、林志玲這種常用詞彙比較適當嗎?
  3. 是搜「韓國」的人的搜尋熱度跟「韓國瑜」的混在一起了吧?
  4. google Trends 的計量正確可以信任嗎?有相關機制來確保他們的計量不失真嗎?
  5. 搜尋結果數量的大爆發應該是中時系統大量新聞發新聞的結果吧?
  6. 網軍主戰場在臉書的留言、按讚、分享,還有八卦版,操作google關鍵字搜尋量有什麼意義?

1.韓國瑜在這個時間點搜尋量大得多不是很正常的事情嗎?

這是根基於「韓引起比較多的興趣(正面反面都是)很正常,搜尋量當然大的多。」所推導的結果。所以要進一步問的是「搜尋量大到多少算正常?大到多少算不正常?我憑什麼說韓國瑜的搜尋量大到不正常?」

這個問題,用一張圖就可以回答。一樣是用 google Trends 拉出韓國瑜 / 柯文哲 / 金庸 /韓劇 四個關鍵字搜尋熱度的資料。但是把時間軸拉到5年,也就是柯文哲上次選舉的時間一起納入。

這是全球的搜尋量

這是台灣的搜尋量

以金庸來比較,可以看出台灣跟全球的搜尋量差別很大,代表很多搜尋金庸的人不在台灣,合理推測應該是在中國的比較多。

以全球搜尋量來說,在8月中以前,金庸的搜尋量都高過於韓國瑜。然後韓國瑜在8月中後黃金交叉,9月中後就一飛沖天沒下滑過。直到金庸過世時,瞬間衝高搜尋熱度,搜尋量才又高過於韓國瑜。所以韓國瑜何德何能讓大家從9月中開始「持續都想搜尋」?

另外,以柯文哲上次選舉13個月的搜尋趨勢,跟這次選舉從今天往前推13個月的搜尋趨勢來比較。先只用柯文哲搜。

2013/11~2014/12

2017/10~2018/11

柯文哲在上次選舉的搜尋熱度,前面是經過階段堆疊的,2013年12月~2014年5月一階,5~8月底拉高一階,9~10月再拉高一階,最後11月選舉月才衝上高峰。但即使衝上高峰也不是一口氣就衝上去。從最低拉到最高花了半年時間。

今年因為柯文哲跟上一次比「有名了」,所以原本就有一定的搜尋熱度,但搜尋熱度上升趨勢還不至於衝的很誇張,一樣有順著時間接近選舉,逐漸「堆疊」的狀況。

那一樣的時間長度,把韓國瑜放一起比較的話呢?

所以韓國瑜狠狠打趴柯阿伯啊。再看一次五年的比較

韓國瑜,一個在半年前名不見經傳的人,在都7月以前搜尋熱度都遠低於柯文哲。何德何能可以在一個半月內衝破高峰,比三年前的那個經歷被KMT弄的柯文哲,搞到後來出來選的柯文哲,要來的有更多的搜尋量?

政治人物的名字不是不能有瞬間搜尋量,但重點在於搜尋熱度是否經過正常的堆疊過程。韓國瑜搜尋量的瞬間增加「是否為正常」,各位就自行判斷吧。

2.拿韓國瑜跟跟韓劇、減肥、林志玲這種常用詞彙比較適當嗎?

這是針對上一篇文章,很多人提出的問題。所以要說明一下為什麼我要挑這些詞。我刻意在拿韓劇這個關鍵字來比較,是因為演藝娛樂相關的文字,搜尋量大過於政治人物是很正常的,因為對演藝娛樂有興趣的人一定多過於對政治人物有興趣的人。另外減肥這個詞,所適用的族群(性別,年紀)相對於政治人物也是比較廣的,這兩個字從五年的搜尋量來看,都可以看出他們是長期的熱搜字。我需要的長期且穩定的熱搜字作為一個比較的基準線,這是我挑選這兩個字的原因。至於為什麼是這兩個字,不是其他字,沒別的理由,憑感覺撈,這點我不否認。

但我知道像林志玲這種明星字,他的搜尋曲線一定是不穩定的,所以我只是把的搜尋後的網頁收錄數量拿來做相對比較,就沒有把它丟到 google trend 做趨勢比較。我當時只是推測,理論上韓國瑜的搜尋網頁收錄數量不應該大過於明星,所以挑了一個我覺得應該大家一定都聽過的明星來做比較。不過這裡要強調一件事,網頁收錄數量跟搜尋熱度是兩件事,兩者沒有關聯性。

另外也感謝網友來信的提醒,11/9他來信提到Google 搜尋關鍵字有無雙引號,會影響搜尋的精確度。確實用這樣的方式搜尋,搜尋結果數量比較正常一點。但這裡簡單說明一下為什麼會有差。如果搜「韓國瑜」會把「韓國 瑜」的網頁搜尋結果也算進來。「韓國 瑜」這個詞的搜尋意義比較接近「如果一個網頁內容有韓國,也有瑜,就算進來,但韓國跟瑜這個字不一定完全連在一起」,但如果搜「”韓國瑜”」,意思是「我就是要搜網頁內容精準符合有『韓國瑜』三個字連在一起的才算數」,那自然網頁內容比對上要更精準。以前者來說,隨便舉個例子喔,也就是網頁如果內容寫到「韓國」跟「周子瑜」,這樣的網頁也會被計算進來。

也許有人說,抓到了!所以不精準!我下一個問題會用另外一個關鍵字例子回答這件事。不過這裡我只問一個問題:你覺得就搜尋行為來說,搜尋「韓國 瑜」是要找「韓國瑜」的機會比較大?還是要找「韓國 周子瑜」或其他「韓國 xx瑜」的機會比較大?

3.是搜韓國的人的搜尋熱度跟韓國瑜的混在一起了吧?

這個質疑我覺得是所有質疑中最棒的一個,有沒有這個可能性呢?確實有喔!而這個問題也反映了電腦邏輯判斷誤區跟極限。但這個問題其實也非常容易回答。我們只要把「韓國」跟「韓國瑜」兩個字的搜尋熱度放在一起比較,不就知道了嗎?

來看看這5年「韓國」跟「韓國瑜」的搜尋趨勢

從這張圖可以看到幾個現象:

  1. 「韓國」這個字是一個有穩定搜尋量的字,五年的搜尋量前面看起來都很平穩。而且搜尋量真的很高。
  2. 當「韓國瑜」搜尋量沖天炮的時候,「韓國」的搜尋量一樣被計算到沖天。
  3. 兩者沖天的趨勢與幅度幾乎是一樣的。
  4. 韓國瑜的搜尋熱度最高的時候,可以達到「韓國」五年以來搜尋量的平均水平。
  5. 韓國瑜搜尋熱度的高點,是「韓國」這個詞五年來搜尋量平均水準的2倍多。

所以到底是搜「韓國 瑜」的讓搜「韓國」的字熱度衝高?還是搜「韓國」的讓「韓國瑜」的搜尋熱度衝高?

這個例子很好的關係在於,「韓國」正好就是一個「有穩定搜尋量而且量很大的關鍵字」。難道是台灣從9月開始想去韓國的人變多了?那來同時搜一下日本美國跟歐洲好了?

原來對韓國瑜有興趣的人可以超過對美國有興趣的人呢,真是大開眼界了~其他的不多說,總之感謝「韓國瑜」的名字有「韓國」,讓我們用這個例子來看出電腦判斷的極限。並增加台灣人對韓國的興趣(誤

認真說,如果沒有這次機會把韓國跟韓國瑜比,可能真的有人會誤會想去韓國的人變多了呢。

google Trends 的計量正確可以信任嗎?有相關機制來確保他們的計量不失真嗎?

先講結論,如果google自己出的資料是不可信任 / 失真嚴重,說真的,我也沒其他更可以信任的資料能夠分析了。如果「google的資料不可信任」這個前提你認為成立,那我也直白的說,這兩篇文章都可以不用讀了。

我也承認,我沒有能力去確認「他們是否有相關機制確保資料不失真」。我只能用我過去使用 google adsense 跟 google Analytices 的經驗,判斷他們的數據應該有做過濾確保不失真,也相信他們一定有足夠的技術可以做這件事。

先來看google自己怎麼解釋「搜尋熱度的趨勢變化」。大家可以自己去google trend按「搜尋熱度的趨勢變化」標題旁邊的「?」,我這裡直接貼他寫的文字啦。

「這些數字代表搜尋字詞在特定區域和時間範圍內的熱門程度變化趨勢,以圖表中的最高點做為比較基準。100 分代表該字詞的熱門程度在該時間點達到最高峰。50 分表示該字詞的熱門程度為最高點的一半,0 分則表示該字詞熱門程度的資料不足。」

因為 google Trends 主要是用歷史資料來看哪些字的搜尋熱度變化。所以在我所認識的業界,最常使用 google Trends 的是做 SEO 網路排名跟網路行銷的代理商 / 網路行銷公司。他們看 google Trends 的目的是挑選適合操作的關鍵字。不管是操作網路廣告也好,或是操作網站的網路排名也好,都適用。

也因為這樣,在使用 google Trends 的時候,我們會輸入多組關鍵字。因為我們要知道的是哪些關鍵字比較熱,哪些關鍵字比較冷。這是為什麼我的分析會拿 google Trends 來作為比較的原因。

回到我前面說的,我為什麼可以確信 google 有足夠的技術可以做到「判斷他們的數據應該有做過濾確保不失真」,這要講到十幾年前我做過的一件蠢事。我很早就有部落格,當時用的是sina,然後我有掛 google adsense ,希望可加減賺廣告費。但掛了才發現其實很難賺。有一次我很無聊,用我自己的電腦點了我自己部落格的廣告,過一陣子發現 google adsense 那裡顯示我有廣告收益。於是我動了壞心眼,如果在別的地方有機會用電腦,我就上網搜尋我的部落格,打開後點一下廣告,而且很克制的只點一下。一個月內我大概做這事情不到五次吧,畢竟那時候還沒有手機平板,我也不上網咖,在別的地方用電腦的機會其實也不是那麼多。

然後過了一個月,我的 google adsense 被停權了。

我知道這很蠢,但我是要用這個例子來說,google透過使用者點擊統計,可以判斷這個使用者行為是否屬於「正常」範圍。我當時之所以被停權,是因為我的部落格流量並不大,他們長期統計已經大概知道正常的流量對應廣告點擊率大概的範圍,雖然我點不到五次,但跟我當時網站的流量做比較,那個廣告點擊的頻率大大超出正常範圍,所以他們判定我人為作弊,所以停權。

另外 google Analytices 在統計流量的時候,也早就已經做到不會因為你用同一台電腦一直重整畫面,網站流量就不正常攀升。所以你說 google 有沒有相關機制來確保他們的計量不失真?至少我相信是有。那你要不相信,就不相信吧。

5.搜尋結果網頁的大爆發應該是中時系統大量新聞發新聞的結果吧?

我直接來針對台灣幾個新聞網站搜一下他們在google被收錄的數量來做比較。又因為這問題我其實沒有覺得很重要,所以懶得截圖了,大家有興趣的可以自己花兩天時間搜尋紀錄試試看。以下是我搜尋的紀錄與分析。

11/9 晚上11:00 媒體網站被收錄數量

  • 中國時報 約有 1,220 項結果(搜尋字詞:site:chinatimes.com.tw)
  • 中天新聞 約有 812 項結果(搜尋字詞:site:www.ctitv.com.tw)
  • 風傳媒 約有 324,000 項結果(搜尋字詞:site:www.storm.mg)
  • 天下雜誌 約有 111,000 項結果(搜尋字詞:site:www.cw.com.tw)
  • 蘋果日報(全球) 約有 10,500,000 項結果(搜尋字詞:site:appledaily.com)
  • 蘋果日報(台灣) 約有 4,500,000 項結結果(搜尋字詞:site:tw.appledaily.com)
  • 聯合報 約有 8,210,000 項結果(搜尋字詞:site:udn.com)
  • 自由時報 約有 3,880,000 項結果(搜尋字詞:site:ltn.com.tw)
  • LINE TODAY 約有 2,350,000 項結果(搜尋字詞:site:today.line.me)

名人關鍵字搜尋結果數量(以下搜尋量採用前後加上””的方式搜尋)

  • 柯文哲:約有 14,900,000 項結果
  • 韓國瑜:約有 18,200,000 項結果
  • 林志玲:約有 30,100,000 項結果
  • 蔡英文:約有 35,200,000 項結果

11/10 早上9:00 搜尋媒體網站被收錄數量

因為媒體產出的量級數字跟名人關鍵字搜尋數量的量級差太多了,「小媒體」的我今天就沒搜。只挑聯合報跟蘋果日報(全球)。

  • 聯合報 約有 8,390,000 項結果(搜尋字詞:site:udn.com)
  • 蘋果日報(全球) 約有 10,800,000 項結果(搜尋字詞:site:appledaily.com)

名人關鍵字搜尋結果數量

  • 柯文哲:約有 13,800,000 項結果
  • 韓國瑜:約有 19,300,000 項結果
  • 林志玲:約有 27,700,000 項結果
  • 蔡英文:約有 42,000,000 項結果

網頁收錄量也跟搜尋熱度一樣會有高有低,所以有增加減少的變化很正常,我這裡要看的是增加減少的「量級數」。

網頁收錄數量一次增加減少的量級都是用幾百萬的變化的。台灣媒體網站頁面被收錄最多的網站是聯合報,隔一天增加的網頁數是18萬。即使用蘋果日報(全球)來看,也不過增加30萬。而且這是「全站總網頁被收錄數」,並沒有只針對「韓國瑜」這個字詞作過濾。

也就是單一關鍵字網頁收錄數要做到百萬變化,要有很多網站一起做。但是看看台灣媒體其他網站的整體被搜尋數量,就可以看出這也不是台灣「各大媒體網站狂出新聞稿」就可以操作出來的數字。

再提醒一次,請大家在講「大量」的時候,不要只憑感覺。把數字拿出來。

6.網軍主戰場在臉書的留言、按讚、分享,還有八卦版,操作google關鍵字搜尋量有什麼意義?

我這裡就不解釋搜尋排名操作的理論,簡單回答:你覺得當你搜尋的時候,誰決定哪些文章可以排在前幾頁?

基本上操作關鍵字就是在操作網頁排名,把他希望大家可以優先看到的資訊往前擠。又為什麼韓國瑜大部分的搜尋看起來都在台灣?若要操作排名在中國不能操作嗎?基本上現在google可以根據你的地點做在地搜尋。例如你在台北,跟你在高雄,一樣搜尋「餐廳」,手機的搜尋結果是不同的。桌機也是一樣,像我用電腦搜尋餐廳,他前面先顯示google map的資料,就會顯示我家巷口的熱炒店。

那做在地排名要根據什麼?在地的搜尋熱度跟搜尋後實際看了哪些網頁是其中一項因素。所以如果要操作當台灣人搜尋韓國瑜的時候,哪些資訊排前面,那搭配在地關鍵字搜尋行為就是必要的。另外我上一篇會比較收錄網頁數量,是想驗證他們有沒有在大量產出網頁,做網頁外連,用這個方式推特定網頁的排名。當然,熟知搜尋排名的都知道,要更細緻的操作遠遠不止這些。這裡只是其中一小部分。

但不要誤會,我不是說你現在看到所有韓國瑜的新聞「一定」都是他們操作上去的,因為「新聞」的排名速度更迭本來就變化的很快。且每個人的搜尋結果也會根據個人的搜尋習慣 / 地點 / 設備不同而略有變化。這裡只是要說操作關鍵字搜尋行為,再搭配一些作法,是能夠直接影響什麼網頁排在前面的。

想一個假設性問題:你今天投票意向不是鐵票,藍的綠的都投過,但想知道投誰贏面比較大,你上網打韓國瑜,搜的結果是預測韓國瑜會贏,跟預測韓國瑜會輸,兩者的結果會不會間接影響你的投票意向?

如果你只把網路戰鎖定在社群媒體跟ptt,那真的把網路戰看得太淺了。人家有計劃有組織的網路戰,做的可是全套的。

***************
感恩讚嘆蜂蜜檸檬,於是又有了第三篇….
選舉觀察part3:從「蜂蜜檸檬」看「韓國瑜」搜尋熱度異常,真韓粉其實在美國?!

選舉觀察:台灣新聞自由的被箝制與網路資訊風向的被操弄

之前只是跟朋友聊到韓國瑜的網路資訊有很明顯的操作痕跡,但今天發現一件事讓我覺得毛毛的。覺得一定要趁還有印象的時候記錄下來。

事情是這樣的,前幾天我在滑臉書的時候看到朋友分享了一篇文章,是天下雜誌寫的,標題我印象中有提到愛家公投跟中國因素,當時想說車上不方便看就先轉貼到自己的牆上備份起來。這幾天有時間想說要回頭好好來讀一下的時候,赫然發現該文章不見了!

這很奇怪,這篇文章上架沒幾天,為什麼會突然刪掉呢?一般來說台灣的新聞如果是內容有更動,反正都網頁化了,直接更新內容就好。由於之前已經耳聞過很多因為高層壓力而下架新聞的事件,我覺得這案情實在不單純。但在這之前我應該要先趕快把網路上找得到的資料先備份下來,免得口說無憑。

於是我重新在 google 搜尋「愛家公投 中國 天下」,搜尋結果如下,可以看到文章是三天前收錄到google的。針對像這種新聞大站,google的收錄都是很即時的,所以可以合理推論這篇文章三天前確實存在。但什麼時候被刪除?不確定。

然後我想想看看google有沒有留著暫存頁面。所以點進去頁面庫存檔,發現竟然完全沒有頁面庫存。

這就很詭異了。你可能會說,文章都被刪掉了,沒有頁面庫存有什麼奇怪的嗎?但就我個人的操作經驗來說,依照 google 爬蟲的運作,如果今天不是文章來源網站本身主動要求刪除頁面庫存,google自行刪除已收錄的庫存資料的速度是不會那麼快的。這個很顯然天下應該有使用 google console 去對 google 要求刪除庫存資料,才會那麼快庫存頁面就消失了。

我決定再碰一下運氣,用 wayback machine 網頁時光機找找看有沒有庫存。搜尋結果如下

所以他在11/6的時候確實也有收錄過。點進去看他收錄的版本

「反同婚教會背後有中國因素?學者:中國利用台灣矛盾、借力使力」文章上下架時間軸

所以看得出來 wayback machine 爬到的資料,當時已經改成「付費閱讀」了 可能因為爬天下的網站上限超過,所以顯示成「付費閱讀」以至於沒有爬到完整內容。然後從這裡也可以看到該篇文章的發文日期是2018/11/5。所以可以合理推測這篇文章「反同婚教會背後有中國因素?學者:中國利用台灣矛盾、借力使力」的時間軸如下:

  • 11/5 上稿
  • 11/6 被改成限付費閱讀 wayback machine 爬到的資料
  • 11/7(或更早)文章被刪除了

但幸好我用標題搜尋ptt後發現,ptt那裡已經有人全文轉錄了(備份網址一)(備份網址二)。說真的看了全文內容後,我個人真的覺得這就是一篇專訪,沒什麼大不了的。但為什麼我眼裡沒什麼大不了的文章,竟然會落得下架?

我在想的問題是:是誰要他們下架?反同教會?中國?還是其他?又就算姑且不論背後的勢力為何,但這是否也意味著確實有外部壓力正在影響甚至箝制台灣的新聞自由?

這也讓我想到之前觀察韓國瑜網路訊息的現象,當時我覺得韓國瑜的新聞感覺好像多到一種不太正常的地步。於是用google大神打了幾個關鍵字。我相信在此時刻的台灣,柯文哲的新聞多應該不是什麼很奇怪的事,於是我打了「柯文哲」跟「韓國瑜」比較一下他們的搜尋結果。

這是10/31我傳給朋友看的訊息

  • 韓國瑜:約有 46,900,000 項結果
  • 柯文哲:約有 14,000,000 項結果

避免有人說我在虎爛。截圖證明一下

這是我今天(11/8)為了整理這篇文章再次搜尋的結果

  • 韓國瑜:約有 53,400,000 項結果
  • 柯文哲:約有 14,700,000 項結果

這是今天重新搜尋的截圖

中間經過8天,柯文哲的搜尋結果增加了700,000,平均一天增加87,500。韓國瑜的搜尋結果增加了6,500,000,平均一天增加812,500。韓國瑜一天的新網頁收錄數量是柯文哲的9.28倍。以我以前在操作公司跟追蹤對手網站SEO的經驗判斷,這其實有非常明顯的人為操作。但是會是KMT在操作嗎?我認為他們沒那麼聰明。那會是誰在操作的?

另外如果我做SEO操作,不會只有「大量生產內容」,還要想辦法讓這些內容「排名可以排前面」,那就必須配合大量的關鍵字搜尋跟點擊的行為,那這件事是否同時發生呢?所以我到 google 趨勢去查詢,同時輸入幾個政治人物的名字做比對。

紅線是柯文哲,他長期搜尋熱度高不意外。綠線是黃國昌,前面有一個突起是當時在「罷免黃國昌」的關係。從這個趨勢可以很明顯地看出韓國瑜的搜尋熱度不但很高,而且高的很誇張,並且是從9月中開始上升,9月底開始誇張的沖天。

這是只有在台灣,那如果把搜尋結果改成全球呢?

因為全球包含台灣,所以搜尋結果差不多也很正常。韓國瑜看起來有更多外力支撐他在高點。我好奇全球都是哪些區域在搜尋的。來看一下區域搜尋熱度比較看看。

顯然中國對黃國昌很沒興趣啊。然後我進一步想,那如果我把這一年幾個重大社會議題一起拉進來比較的話呢?

勞基法凸起來的時間點就是一例一休修法的前後。我比較意外的是公投從10月中後跟柯文哲的搜尋趨勢黃金交叉,也呈現沖天炮的趨勢。

不論是勞基法還是罷免,上升到高點回到一般值經歷的時間差不多都在20天內,也就是三個禮拜。但是韓國瑜的搜尋熱度從9月中開始上升以來,到現在都還在高點。這本身就是一個不正常的搜尋趨勢。

韓國瑜比志玲姐姐還紅,關心韓國瑜的人比看韓劇的人多

我突然想到,前陣子金庸過世,當時不管台灣還是中國都有很多人弔念,那當時的搜尋趨勢跟韓國瑜比會是如何呢?

結果金庸的搜尋熱度高點竟然只比韓國瑜多一點點而已,而且很明顯一周內 google 也預測會下跌。那我不禁在想,韓國瑜的網頁收錄數跟金庸,志玲姐姐還有蔡英文總統比,誰多誰少呢?今天(11/8)搜尋結果如下

  • 柯文哲:約有 14,700,000 項結果
  • 韓國瑜:約有 53,400,000 項結果
  • 金    庸:約有 58,700,000 項結果
  • 林志玲:約有 31,800,000 項結果
  • 蔡英文:約有 60,600,000 項結果
11/9 補充資訊:有網友來信提醒,關鍵字搜尋頭尾加上””搜尋的數量比較精準。前面計算因為都是用沒有加””的方式搜尋,數字我就不修正了。但過幾天我會用這個方法重新搜尋,再持續追蹤看看數量變化。11/9重新用這個方式搜尋結果如下。

  • 柯文哲:約有 14,900,000 項結果
  • 韓國瑜:約有 18,200,000 項結果
  • 金    庸:約有 51,600,000 項結果
  • 林志玲:約有 30,100,000 項結果
  • 蔡英文:約有 35,200,000 項結果

原來韓國瑜比志玲姐姐還紅耶,我也是醉惹…..而且我相信以現在這種速度增加,韓國瑜的網頁收錄數量要超越蔡總統不遠惹~不然我來搜一些其他熱門字好惹,例如減肥,韓劇,看看他們的搜尋趨勢跟韓國瑜比又是如何。

原來台灣人對減肥跟韓劇的搜尋熱度還少於韓國瑜。在9月底的時候,大家對韓國瑜的熱度就超越減肥了。到10月中的時候還超越韓劇。果然只有韓國瑜可以超越韓劇(?

從 google 看公投議題被外力操作的痕跡

回到公投,這趨勢我也覺得有點誇張,不只高過柯文哲,而且還是持續上升。在10/14前的上升幅度還算正常範圍,但是10/14後明顯搜尋熱度上升的速度變快。且是持續三週上升,這個模式跟勞基法與罷免是第二週到最高點第三週回到正常水平,明顯是有差異的。

所以來看看有哪些地區對公投跟勞基法有興趣。

顯然中國對台灣公投也是很有興趣的,但是對勞基法就完全沒興趣了。

搜尋趨勢的部分我如果把時間軸拉短,改成90日。比較韓國瑜 / 柯文哲 / 陳其邁 / 公投。加上一個金庸。

可以看到金庸搜尋熱度一周內就回到平常狀態。韓國瑜的搜尋熱度上升的很不正常。公投的搜尋熱度持續維持還高於柯文哲也很詭異。

搜尋時間軸若改成30日。把金庸拿掉,改用減肥來比較。

你相信搜公投的人可以連著兩個禮拜比搜減肥的多嗎?我是不相信啦….

另外,網路搜尋使用者行為如果只看台灣,也不要傻傻的以為那真的都是台灣人自發性的搜尋結果。要記得一件事:中國如果想來台灣設置VPN跳板,是非常簡單的事。在網路上把自己的位置偽裝成台灣,特別是中國有錢有資源,一點都不是什麼很困難的事。我甚至敢大膽的推測,這已經是現在進行式了。

所以上述 google 趨勢,若對照「反同婚教會背後有中國因素?學者:中國利用台灣矛盾、借力使力」的來看,我覺得中國利用台灣矛盾借力使力,是很明顯的。他們其實不在乎什麼挺同反同,但他們在乎的是怎麼利用這些「勢」來影響台灣的政治,影響台灣的媒體,所以你會發現,只要這個「勢」可以影醒台灣政治的,他們就會有興趣,例如公投,例如反同。但如果這個「勢」對他們沒有太大幫助,例如黃國昌,例如勞基法,他們就沒興趣。而這才是我們需要提防的。

****************************

針對以下疑問與質疑

  1. 韓國瑜在這個時間點搜尋量大得多不是很正常的事情嗎?
  2. 拿韓國瑜跟跟韓劇、林志玲這種常用詞彙比較適當嗎?
  3. 是搜「韓國」的人的搜尋熱度跟「韓國瑜」的混在一起了吧?
  4. google Trends 的計量正確可以信任嗎?有相關機制來確保他們的計量不失真嗎?
  5. 搜尋結果數量的大爆發應該是中時系統大量新聞發新聞的結果吧?
  6. 網軍主戰場在臉書的留言、按讚、分享,還有八卦版,操作google關鍵字搜尋量有什麼意義?

請見選舉觀察part2:看「韓國瑜」網路資訊風向的被操弄