政治人物關鍵字搜尋量分析:柯文哲的搜尋量比韓國瑜更奇怪?

之前有做過總統候選人人名關鍵字搜尋量的分析(見:資訊戰真的存在嗎?從韓國瑜的搜尋量看資訊戰),這幾天我就在想,一般在做政治人名搜尋的時候,如果他今天真的是想針對這個人某個項目找資料,就有很大的可能會做複合關鍵字搜尋。例如搜「韓國瑜 行程」「蔡英文 民調」這類的關鍵字,所以我就在想,今天要操作關鍵字搜尋量,政治人名當然是最大宗,但也許不會刻意去操作這種很瑣碎的複合關鍵字。那我是否能從這種關鍵字的搜尋量去反推比較合理的搜尋量可能是什麼?

所以這篇文章的分析,有幾個假設是:

  1. 政治人物姓名(例如「蔡英文」),跟姓名相關的複合關鍵字搜尋總和(例如「蔡英文 行程」),存在某種合理比例分布關係。
  2. 如果複合關鍵字搜尋總和占政治人物姓名關鍵字搜尋量比例過低,那代表政治人物姓名的搜尋量可能有被操作的痕跡。

所以要做這樣的假設分析需要幾個資料

  1. 政治人物人名總搜尋量
  2. 政治人物人名複合關鍵字搜尋總搜尋量

1很簡單,只要在 google ads 關鍵字規劃工具,就可以取得每個月搜尋量級的數字,這裡我用「搜尋量級」的原因是,他提供的不是「精確的搜尋量數字」,所以那裡撈出來的數字結尾一定是0,但這個數字基本上已經讓你足以判斷這個關鍵字搜尋次數大概落在那個數字區間。

但是2要怎麼取得?因為這種關鍵字很細碎。我希望可以盡量收集所有這類的複合關鍵字。我後來用第三方工具 keywordtool 來找。取樣流程如下:

  1. https://keywordtool.io/ 輸入政治人物姓名,撈出政治人物相關搜尋字詞
  2. 到 google ads 的關鍵字規劃工具把字詞都丟進去,撈出12個月內具有搜尋量級資料,把沒有搜尋量級資料的字詞都刪除,只保留有搜尋量級的字詞。

可能有的人會覺得很奇怪,既然 keywordtool 查的到,那為什麼 google ads 的關鍵字規劃工具會沒有量級資料?這基本上有兩種可能性。

  1. 因為 keywordtool 查的到的資料是這個月的熱門搜尋字。所以每個月的熱門搜尋字都可能不同。更不要說複合關鍵字的差異會更大。
  2. 這關鍵字有人搜,但每個月的搜尋量低到還沒達到 google 關鍵字規劃工具統計的最低量級數量,所以就會顯示沒有數據。

總之用上述方法,我整理出這個大表格。裡面包含綜合比較,還有政治人物以及其複合關鍵字的搜尋量。有好幾個分頁,對數字有興趣的可以到這裡看,這裡就不貼了。

然後我挑選的標的分了四組

  1. 正式的總統候選人:蔡英文、韓國瑜、宋楚瑜
  2. 曾經可能的總統參選人:郭台銘、柯文哲
  3. 現任第三勢力立委,跟網路熱門立委新科參選人:黃國昌、吳怡農
  4. 現在立院三大政黨

比較需要解釋的是3。1跟2都算是「總統候選人」,所以是全國性知名的人物。但我也好奇網路熱門搜尋但知名度相對沒那麼高的政治人物,他們的這種關鍵字搜尋量分布會不會有所不同?所以拿時代力量最熱的黃國昌,還有近期網路崛起且很多網紅推薦的吳怡農來做比較。4的話單純是個人好奇,政黨跟人在搜尋量分析上是否有模式的差異。

複合關鍵字搜尋總量比較

(原始大圖)

複合關鍵字搜尋總量分析:韓國瑜與蔡英文的差異不大、柯文哲搜尋量持續走低

從上面這張表可以看得出來,如果排除單純姓名搜尋,只看複合關鍵字搜尋總量,其實韓國瑜與蔡英文的差異不大。然後兩者都會因為當月大事件,而搜尋量暴增。

  • 韓國瑜:5~7月搜尋量大增。這時候是國民黨初選。「韓國瑜民調」「韓國瑜造勢」搜尋量暴增。10月~11月又往上增加,「韓國瑜行程」搜尋量從10月開始激增,「韓國瑜豪宅」「韓國瑜電話」從11月開始激增。因為壹週刊報豪宅,還有博恩夜夜秀提到韓國瑜的電話被邱毅在媒體上的截圖公開。
  • 蔡英文:3~6月搜尋量有拉一波,這時後是民進黨初選。9月10月拉一大波,這是論文事件,「蔡英文學歷」搜尋量暴增。11月宣傳上打政績牌,連帶「蔡英文政績」搜尋量暴增。
  • 宋楚瑜:11月宣布參選總統。所以拉了一波。
  • 郭台銘:4月宣布加入國民黨總統初選。5~7月國民黨初選,所以這段時間搜尋量都在高峰。9月正式宣布不選。10月開始搜尋量就大幅下降。
  • 柯文哲:搜尋量相較於其他總統候選人,複合關鍵字搜尋總量一直都很低迷。

人名搜尋量與複合關鍵字搜尋總量比較

(原始大圖)

(原始大圖)

神奇的6%分水嶺:韓國瑜與柯文哲姓名複合字搜尋搜尋量占比都異常低

之前我就分析過韓國瑜的搜尋總量是有異常的。如果我上面的假設正確,我預期韓國瑜的其他複合字搜尋總和占單獨名字搜尋量的比例會偏低。以圖表跟數據來說。確實在2018年12月~2019年4月這段時間是偏低的。都未達5%。

但奇怪的是,柯文哲的這個比例,在2018年12月~2019年3月、2019年7.8.11月,這段時間也都偏低,而且未達4%。只有2019年4.5.6.9.10這五個月有高一點,但未達6%。

我們把所有人每月搜尋數量的數據都撈出來看

  • 蔡英文:每月最低8%以上,年複合字搜尋量總和比例35.28%
  • 韓國瑜:每月最低3.5%以上,年複合字搜尋量總和比例10.29%
  • 宋楚瑜:每月最低6%以上,年複合字搜尋量總和比例16.18%
  • 郭台銘:每月最低6%以上,年複合字搜尋量總和比例13.68%
  • 柯文哲:每月最低2.4%以上,年複合字搜尋量總和比例3.93%

對照組

  • 黃國昌:每月最低都在6%以上,年搜尋量總和比例10.95%
  • 吳怡農:最後三的月才有足夠數據,分別是9.94%、4.57%、5.63%,年搜尋量總和比例6.56%

以新人來說,每個月用 6% 分水嶺看是否適用?這個我覺得可以再找更多的例子來分析看看。但這不是本篇重點就先跳過。

以每月最低6%以下為異常的有:韓國瑜、柯文哲。而且柯文哲還低於韓國瑜,柯文哲12個月都低於6%。韓國瑜在幾個熱門月至少都還有超過6%。

綜合上述圖表,我取每月數據跟突發數據爆衝比較沒有那麼嚴重的宋楚瑜、郭台銘、黃國昌三個人的數據來看。我推測具有全國知名度的政治人物來說,年搜尋量總和比例比較合理的比例應該是在10~17%中間,超過應該是有很突發的狀況造成的爆衝異常,過低則是可能是姓名搜尋量異常高才導致這個比例太低。

所以有異常的有:蔡英文(過高爆衝)、柯文哲(過低)、吳怡農(過低)

但吳怡農是投入選舉後才變熱門,而且才三個月時間。這個數字我覺得取樣還不夠,所以可以先不計。

結論

以複合字搜尋總和占單獨名字搜尋量的比例來看。韓國瑜與柯文哲的每月搜尋數量有很多個月比例都偏低,而柯文哲一直都很低,而且比韓國瑜更低。以年搜尋量總和比例來說。柯文哲的最為異常。

韓國瑜的姓名搜尋量因為高到異常破表,所以即使沒有作這次的分析就已經足以證明他的姓名搜尋量有被操作,但這次分析只是加強了這個論點。我比較意外的是這反而挖出柯文哲的總搜尋量有異常的狀況。

而我其實還是沒辦法確定單獨柯文哲姓名的總搜尋量是否有被操作,因為他正好2018年歷經市長選舉,2019年又一直被當成兩黨的假想敵。有一定的搜尋量好像也不奇怪。但他的複合字搜尋量占整體比例偏低這件事情,我現在沒有其他合理的解釋。

資訊戰真的存在嗎?從韓國瑜的搜尋量看資訊戰

選舉又要到了,去年這個時候寫了韓國瑜。今年韓國瑜出來選總統,就再來寫寫韓國瑜。

台灣政治人物搜尋次數量級的上限。我覺得應該可以拿總統作為一個標準因為總統是全國性的,屬於大家都會知道的人。現在的總統是蔡英文。所以拿蔡英文作為一個比較基準。

近七天搜尋熱度趨勢分析

最近因為有短暫熱點「王立強」共諜案,先來看看過去七天的搜尋熱度趨勢分析。這個圖表的搜尋時間是2019年11月26日中午12:00。

(點我看大圖)

  1. 韓國瑜最高,還是在一個很詭異的搜尋熱度
  2. 蔡英文其次
  3. 吳斯懷在剛開始中國國民黨提名不分區立委那陣子搜尋量有上來,快跟蔡英文相當,後來就降下去
  4. 王立強最近新聞開始爆之後搜尋量大增,超越蔡英文但也不算超越的非常多。
  5. 拿新北耶誕城作為比較,是因為這個活動是年輕人跟小家庭都會想去的,猜測會有一定的搜尋量,也確實有很明顯的搜尋週期,週四搜尋從下午兩點開始上高峰。週五下午五點開始,週六跟週日下午三點開始,週一就趨緩沒有在週末那麼熱。很符合想出去玩之前要先找資料的時間。但即便是週一搜尋量還是跟搜蔡英文的熱度相當。

七天搜尋量的城市分布

再來看看搜尋量的城市分布

  1. 人名(蔡英文、韓國瑜、吳斯懷、王立強)的搜尋城市分布遍佈全台灣。
  2. 活動(新北耶誕)明顯集中在雙北,然後少量在桃竹苗。但跟近七天搜尋熱度趨勢放在一起看,表示大型活動的搜尋量,在活動熱度高的時候,即使是區域型活動還是有辦法超越全國性政治人物的搜尋量。

你一直說韓國瑜搜尋熱度詭異的高,你是不是有偏見?

首先,這個看法去年我就提出過了,可以回顧以下舊文,裡面有當時的分析。
選舉觀察part2:看「韓國瑜」網路資訊風向的被操弄

另外關於搜尋量異常,以下舊文後面也要附上當時查的 google ads 實際搜尋量的資料。特別要注意到的是 google ads 實際搜尋量 跟 google 搜尋趨勢顯示的搜尋熱度意義是不同的,google ads 查到的是搜尋次數的量級統計。
選舉觀察part5:「公投」使用者搜尋行為差異分析

既然去年查過。今年我當然也要再來查一下。這兩年因為剛好歷經六都市長選舉,還有兩大黨的總統候選人黨內初選,所以我就拿蔡英文、柯文哲、郭台銘,韓國瑜來比較,以下是從 google ads 撈出的兩年數據(2017/11~2019/10)做出的折線圖,分析如下。

(點我看大圖)

這份是2015/11~2016/10,蔡英文的搜尋量。由於 google ads 最早只能查到2015/11,所以沒有更之前的資料。同時比較當時的對手朱力倫與上一屆總統馬英九的搜尋量。

(點我看大圖)

  1. 2018年市長選舉,可以看得出來柯文哲的搜尋量從2018年4月開始就逐漸攀升。而韓國瑜的搜尋量在7月前都趴在地上,8月9月開始有起色,接著從10月開始噴井式突破天際,月搜尋量到達400萬的等級。這數字有多驚人呢?以總統選舉來看。蔡英文當選得票數是 6,894,744。這人數跟馬英九第二屆的得票人數是相當的。台灣兩千三百萬人口。我假設一個搜尋量代表一個人搜尋一次的話,代表2018年11月,全台灣有17.4%的人都去搜尋過韓國瑜。從2019年1月開始。韓國瑜就一直維持在月搜尋量82萬以上的搜尋量級。
  2. 柯文哲在2018年11月(市長選舉月)當月的搜尋量也有噴井式的狀況。但也不過就是150萬。跟韓國瑜409萬比起來根本完全就是小兒科。韓國瑜的月搜尋量足足是柯文哲的2.7倍。
  3. 蔡英文的月搜尋量一直處在一個平凡而穩定的狀態。最高月搜尋量不過24.6萬。沒有選舉的時甚至只有6萬。唯一可以預期的是2020年1月總統選舉月,不管當選與否都一定會有噴井式的搜尋量,到時候我們可以來看看他的搜尋量有多少(2016年1月蔡英文的搜尋量是55萬,2016年5月就任,搜尋量是30萬),可以作為以後分析的一個標準。
  4. 郭台銘的數據可以視為「有錢人撲天蓋地選舉時,到底可以對網路搜尋量影響多大」的一個標的。搜尋量高點在2019年4月跟9月。4月的時候是國民黨黨內初選。9月的時候是最後宣布不選總統的時間。也就是說有錢人選舉對搜尋量影響的極限,大概可以說就是在月搜尋量67.3萬。

我沒有辦法去判斷柯文哲跟郭台銘的搜尋量有沒有被外來勢力影響,因為看起來還在可能正常的範圍內。但是韓國瑜的搜尋量一枝獨秀的超越他們近兩倍有。肯定是有其他勢力介入操作狂打雞血才有可能。以中國國民黨的現況,我不認為中國國民黨自己有那個本事作這些操作。

小結

最近很多人在那裡說哪有資訊戰。我覺得大家在討論資訊戰的時候,要釐清幾個點。

  1. 選舉影響有效/無效不能拿來證明資訊戰的有/無。有資訊戰不一定代表會對選舉產生明顯的「有效」影響,因為光釐清什麼叫做「有效」就有很多可以討論。但是「有沒有人在操作」資訊戰是有跡可尋的。很多人在討論的時候會把這兩個觀念互相抽換混淆,不可不慎。以數據來說,我會說資訊戰就是確實存在的。但很難說他最後的「影響」有多大。這兩者之間的關連性到什麼程度本來就很難評估。有沒有做,跟做完有沒有影響。完全是兩件事。
  2. 「有資訊戰操作」不等於什麼東西的歸因都是資訊戰。這就很像我們做網路行銷SEO的時候,順風大家都是SEO專家,逆風大家都怪演算法變更一樣。現在資訊戰也常常被拿來作為某件事情成功/失敗的藉口。我個人是覺得這樣的心態也不太健康。
  3. 韓國瑜的網路搜尋量很明顯是有被操作的,但我也沒有進一步證據可以證明是誰操作的。只能說確定有人在操作。那這樣的操作韓國瑜本人是否知情?我的看法是「不一定」。因為網路作這樣的操作本來就沒有一定要當事人的允許才能去做。就像SEO界有所謂的暗黑SEO,其中一種手法就是把別人的網站搞掉,這種他們當然不會跟當事人去講。所有的方法可以正著用,就可以反著用。如果外國勢力的目的是擾亂台灣的選舉,那當事人知不知道根本不重要。外國勢力想要「擾亂」的目的可以達成就好。

然後這篇文章上述提到的截圖,對應的原始數據資料我都有下載,大家可以自行到這裡下載,看看有沒有看出其他貓逆。

選舉觀察part6:「韓國瑜」與其他候選人搜尋行為差異比較與搜尋量解析

這篇拖到現在才寫的原因是我一直在等 google ads 裡面 11 月搜尋量的資料。等到今天終於有了,也就是說 google ads 要到下個月11日以後才能查得到上個月的搜尋量。先講結論,這篇文章算是一半自打臉的文章。但另外一半也證明我之前的部分推論是正確的。

  • 自打臉的部分是:韓粉主要還是在台灣。美國也有韓粉,但還是沒有台灣的多。
  • 證明正確的部分是:韓國瑜的實際搜尋量確實有異常,而有趣的是全球都異常,不是只發生在台灣。

然後另外這篇會更詳細的分析「正常候選人會有的使用者搜尋行為」,由此可以看出韓國瑜的使用者搜尋行為異常。

「正常」的候選人搜尋行為模式是什麼?

我在寫『選舉觀察part5:「公投」使用者搜尋行為差異分析』跟『google trends 常見應用與使用者搜尋模式分析』一直在強調一件事:搜尋熱度異常不是只有看「爆量」,還要同時看「搜尋行為模式」是否也有異常。兩者同時發生才能推論有異常。

所以在看「異常」以前,要先來看「正常」的候選人搜尋行為模式有哪些。現在因為選完有一陣子了,所以可以直接把當選的候選人在選完後跟選前的搜尋模式一起列出來比較。

2008年馬英九搜尋趨勢(台灣)

2008年馬英九搜尋趨勢(美國)

2012年蔡英文搜尋趨勢(台灣)

2012年蔡英文搜尋趨勢(美國)

2014年柯文哲搜尋趨勢(台灣)

2014年柯文哲搜尋趨勢(美國)

2018年柯文哲搜尋趨勢(台灣)

2018年柯文哲搜尋趨勢(美國)

2018年盧秀燕搜尋趨勢(台灣)

上面幾個搜尋趨勢有幾個共同特色

  • 爆量點都是選舉當天
  • 爆量點至少是前面兩個禮拜(扣除爆量)平均搜尋量至少3倍以上
  • 搜尋量大幅度攀升都發生在選舉日前1周。
  • 選舉當地的搜尋量變化
    • 在選舉前2~2.5個月內有逐步增加的狀況,但增加幅度相較於爆量都是比較緩慢堆疊的。
    • 選後三天搜尋量會急劇下跌,2週後回到相對低點

那只有台灣的搜尋行為才是如此嗎?我們來看看美國總統選舉的搜尋行為是如何。

2008年歐巴馬

2012年歐巴馬

2016年川普

除了中間可能會因為事件發生有短暫的震盪,且震盪後很快都會回到相對低點。整體的搜尋行為模式跟台灣的搜尋行為模式是一致的,特色也是相同的。

事實上搜尋行為被大眾媒體,特別是電視媒體傳播的影響是很明顯的,從搜尋特色的以下這三點來看

  • 搜尋量大幅度攀升都發生在選舉日前1周。
  • 在選舉前2~2.5個月內有逐步增加的狀況,但增加幅度相較於爆量都是比較緩慢堆疊的。
  • 選後三天搜尋量會急劇下跌,2週後回到相對低點

這同時也與電視播放候選人的新聞密度相符合。

神奇的「韓國瑜」搜尋模式

有人會說,韓國瑜新聞那麼多,搜尋量大很正常。那我們來看看韓國瑜在台灣跟美國的搜尋量吧。

2018年韓國瑜(台灣)

2018年韓國瑜(美國)

  • 假設韓國瑜的搜尋量多真的全部都是由電視媒體的大量曝光帶來的。但這個理由拿來解釋美國的搜尋量變化是否合理呢?我是覺得不合理。
  • 其他人都明顯在選舉當天有個爆衝點,韓國瑜的暴衝點相對於他自己前面的流量顯得非常不暴衝。
  • 2.5個月內的搜尋量堆疊模式跟其他候選然完全不同。呈現一種很穩定的上升。連中間的爆發流量都顯得頻率很一致。

而且理論上韓國瑜如果呼聲真的那麼高,前面搜尋量真的那麼大,理論上選舉當天的量應該會爆高,但是如果把韓國瑜跟柯文哲的搜尋熱度放一起來看會發現…

柯文哲單日搜尋熱度還高於韓國瑜最高點再多25點以上。

依照韓國瑜這種搜尋行為堆疊的搜尋量,理論上實際搜尋量應該會很誇張。而依照我從 google ads 撈出來的結果,真的很誇張。因為數據很多,我直接用google sheets來整理。大家有興趣看數字的可以到這裡看

這個表裡面,除了顯示實際搜尋數量的量級數字外。我另外在後面計算了每個月跟上一個月相除後的數字,看看這個月跟上個月的量級增加了幾倍。

我這裡直接整理結論。

  • 在台灣的搜尋量級10月/9月的倍數,其他市長當選人落在1~2倍之間。只有韓國瑜在7倍以上。
  • 在台灣的搜尋量級11月/10月的倍數,其他市長當選人落在3~5倍之間,只有韓國瑜不到2倍。
  • 其他市長當選人在各國的搜尋量10月/9月的倍數,都落在1~3倍之間。只有韓國瑜大多落在5~10倍(法國除外)。
  • 其他市長當選人在各國的搜尋量11月/10月的倍數都落在3~7倍之間。只有韓國瑜在1~3倍之間。
  • 韓國瑜的搜尋量級在10月已經到達7位數 2240000,11月更高達 4090000。柯文哲11月還是6位數 450000,11月到7位數也才1500000。而普悠瑪事件發生在10月,當月搜尋量最高7位數也只有到 1220000
  • 10月普悠瑪事件發生,當月美國韓國瑜搜尋量級 90500,普悠瑪搜尋量級只有 14800。美國台人對普悠瑪的興趣比韓國瑜低?不可思議。
  • 韓國瑜的搜尋異常很一致的發生在各國。但主要最大搜尋量級還是在台灣。

所以韓國瑜的搜尋熱度毫無疑問是有異常的,不過美國韓粉確實沒有我以為的比台灣多。而這樣的異常即使經過 google ads 整理過的數據還是可以很明顯地看得出來。


下面是額外的紀錄。是在寫這篇的時候有觀察到 google trends 與 google ads 兩邊資料有落差的現象,在這篇記錄一下我的觀察。

有的關鍵字12個月搜尋熱度在google trends  相互比較的時候,「捷運」比「台鐵」高,但是最後在 google ads 查到的12個月搜尋量「台鐵」卻都比 「捷運」高。我自己的判斷是因為 google ads 提供的是商業下廣告的評估依據,他的準確度論上應該要更高,並且前一個月的搜尋量並不是一到隔月1日就釋出,而是隔了10天以後才有,應該表示 google trends 的資料比較即時,但針對搜尋行為過濾的條件比較少。而 google ads 過濾的條件可能比較多,所以有的字如果比較容易讓單一使用者短期內重複搜尋,可能在 google trends 顯示的熱度會比較高,但在更嚴謹的把同一使用者短時間重複搜尋行為過濾掉後,才是 google ads 那裡會呈現的數字。

選舉觀察part2:看「韓國瑜」網路資訊風向的被操弄

再寫這篇,算是回應朋友在我臉書的留言的某些疑問,跟一些網路留言。我先把他們的疑問大概條列整理。問題大概可以歸類到這幾個,這些問題我依照我預備回答的順序整理如下。

  1. 韓國瑜在這個時間點搜尋量大得多不是很正常的事情嗎?
  2. 拿韓國瑜跟跟韓劇、林志玲這種常用詞彙比較適當嗎?
  3. 是搜「韓國」的人的搜尋熱度跟「韓國瑜」的混在一起了吧?
  4. google Trends 的計量正確可以信任嗎?有相關機制來確保他們的計量不失真嗎?
  5. 搜尋結果數量的大爆發應該是中時系統大量新聞發新聞的結果吧?
  6. 網軍主戰場在臉書的留言、按讚、分享,還有八卦版,操作google關鍵字搜尋量有什麼意義?

1.韓國瑜在這個時間點搜尋量大得多不是很正常的事情嗎?

這是根基於「韓引起比較多的興趣(正面反面都是)很正常,搜尋量當然大的多。」所推導的結果。所以要進一步問的是「搜尋量大到多少算正常?大到多少算不正常?我憑什麼說韓國瑜的搜尋量大到不正常?」

這個問題,用一張圖就可以回答。一樣是用 google Trends 拉出韓國瑜 / 柯文哲 / 金庸 /韓劇 四個關鍵字搜尋熱度的資料。但是把時間軸拉到5年,也就是柯文哲上次選舉的時間一起納入。

這是全球的搜尋量

這是台灣的搜尋量

以金庸來比較,可以看出台灣跟全球的搜尋量差別很大,代表很多搜尋金庸的人不在台灣,合理推測應該是在中國的比較多。

以全球搜尋量來說,在8月中以前,金庸的搜尋量都高過於韓國瑜。然後韓國瑜在8月中後黃金交叉,9月中後就一飛沖天沒下滑過。直到金庸過世時,瞬間衝高搜尋熱度,搜尋量才又高過於韓國瑜。所以韓國瑜何德何能讓大家從9月中開始「持續都想搜尋」?

另外,以柯文哲上次選舉13個月的搜尋趨勢,跟這次選舉從今天往前推13個月的搜尋趨勢來比較。先只用柯文哲搜。

2013/11~2014/12

2017/10~2018/11

柯文哲在上次選舉的搜尋熱度,前面是經過階段堆疊的,2013年12月~2014年5月一階,5~8月底拉高一階,9~10月再拉高一階,最後11月選舉月才衝上高峰。但即使衝上高峰也不是一口氣就衝上去。從最低拉到最高花了半年時間。

今年因為柯文哲跟上一次比「有名了」,所以原本就有一定的搜尋熱度,但搜尋熱度上升趨勢還不至於衝的很誇張,一樣有順著時間接近選舉,逐漸「堆疊」的狀況。

那一樣的時間長度,把韓國瑜放一起比較的話呢?

所以韓國瑜狠狠打趴柯阿伯啊。再看一次五年的比較

韓國瑜,一個在半年前名不見經傳的人,在都7月以前搜尋熱度都遠低於柯文哲。何德何能可以在一個半月內衝破高峰,比三年前的那個經歷被KMT弄的柯文哲,搞到後來出來選的柯文哲,要來的有更多的搜尋量?

政治人物的名字不是不能有瞬間搜尋量,但重點在於搜尋熱度是否經過正常的堆疊過程。韓國瑜搜尋量的瞬間增加「是否為正常」,各位就自行判斷吧。

2.拿韓國瑜跟跟韓劇、減肥、林志玲這種常用詞彙比較適當嗎?

這是針對上一篇文章,很多人提出的問題。所以要說明一下為什麼我要挑這些詞。我刻意在拿韓劇這個關鍵字來比較,是因為演藝娛樂相關的文字,搜尋量大過於政治人物是很正常的,因為對演藝娛樂有興趣的人一定多過於對政治人物有興趣的人。另外減肥這個詞,所適用的族群(性別,年紀)相對於政治人物也是比較廣的,這兩個字從五年的搜尋量來看,都可以看出他們是長期的熱搜字。我需要的長期且穩定的熱搜字作為一個比較的基準線,這是我挑選這兩個字的原因。至於為什麼是這兩個字,不是其他字,沒別的理由,憑感覺撈,這點我不否認。

但我知道像林志玲這種明星字,他的搜尋曲線一定是不穩定的,所以我只是把的搜尋後的網頁收錄數量拿來做相對比較,就沒有把它丟到 google trend 做趨勢比較。我當時只是推測,理論上韓國瑜的搜尋網頁收錄數量不應該大過於明星,所以挑了一個我覺得應該大家一定都聽過的明星來做比較。不過這裡要強調一件事,網頁收錄數量跟搜尋熱度是兩件事,兩者沒有關聯性。

另外也感謝網友來信的提醒,11/9他來信提到Google 搜尋關鍵字有無雙引號,會影響搜尋的精確度。確實用這樣的方式搜尋,搜尋結果數量比較正常一點。但這裡簡單說明一下為什麼會有差。如果搜「韓國瑜」會把「韓國 瑜」的網頁搜尋結果也算進來。「韓國 瑜」這個詞的搜尋意義比較接近「如果一個網頁內容有韓國,也有瑜,就算進來,但韓國跟瑜這個字不一定完全連在一起」,但如果搜「”韓國瑜”」,意思是「我就是要搜網頁內容精準符合有『韓國瑜』三個字連在一起的才算數」,那自然網頁內容比對上要更精準。以前者來說,隨便舉個例子喔,也就是網頁如果內容寫到「韓國」跟「周子瑜」,這樣的網頁也會被計算進來。

也許有人說,抓到了!所以不精準!我下一個問題會用另外一個關鍵字例子回答這件事。不過這裡我只問一個問題:你覺得就搜尋行為來說,搜尋「韓國 瑜」是要找「韓國瑜」的機會比較大?還是要找「韓國 周子瑜」或其他「韓國 xx瑜」的機會比較大?

3.是搜韓國的人的搜尋熱度跟韓國瑜的混在一起了吧?

這個質疑我覺得是所有質疑中最棒的一個,有沒有這個可能性呢?確實有喔!而這個問題也反映了電腦邏輯判斷誤區跟極限。但這個問題其實也非常容易回答。我們只要把「韓國」跟「韓國瑜」兩個字的搜尋熱度放在一起比較,不就知道了嗎?

來看看這5年「韓國」跟「韓國瑜」的搜尋趨勢

從這張圖可以看到幾個現象:

  1. 「韓國」這個字是一個有穩定搜尋量的字,五年的搜尋量前面看起來都很平穩。而且搜尋量真的很高。
  2. 當「韓國瑜」搜尋量沖天炮的時候,「韓國」的搜尋量一樣被計算到沖天。
  3. 兩者沖天的趨勢與幅度幾乎是一樣的。
  4. 韓國瑜的搜尋熱度最高的時候,可以達到「韓國」五年以來搜尋量的平均水平。
  5. 韓國瑜搜尋熱度的高點,是「韓國」這個詞五年來搜尋量平均水準的2倍多。

所以到底是搜「韓國 瑜」的讓搜「韓國」的字熱度衝高?還是搜「韓國」的讓「韓國瑜」的搜尋熱度衝高?

這個例子很好的關係在於,「韓國」正好就是一個「有穩定搜尋量而且量很大的關鍵字」。難道是台灣從9月開始想去韓國的人變多了?那來同時搜一下日本美國跟歐洲好了?

原來對韓國瑜有興趣的人可以超過對美國有興趣的人呢,真是大開眼界了~其他的不多說,總之感謝「韓國瑜」的名字有「韓國」,讓我們用這個例子來看出電腦判斷的極限。並增加台灣人對韓國的興趣(誤

認真說,如果沒有這次機會把韓國跟韓國瑜比,可能真的有人會誤會想去韓國的人變多了呢。

google Trends 的計量正確可以信任嗎?有相關機制來確保他們的計量不失真嗎?

先講結論,如果google自己出的資料是不可信任 / 失真嚴重,說真的,我也沒其他更可以信任的資料能夠分析了。如果「google的資料不可信任」這個前提你認為成立,那我也直白的說,這兩篇文章都可以不用讀了。

我也承認,我沒有能力去確認「他們是否有相關機制確保資料不失真」。我只能用我過去使用 google adsense 跟 google Analytices 的經驗,判斷他們的數據應該有做過濾確保不失真,也相信他們一定有足夠的技術可以做這件事。

先來看google自己怎麼解釋「搜尋熱度的趨勢變化」。大家可以自己去google trend按「搜尋熱度的趨勢變化」標題旁邊的「?」,我這裡直接貼他寫的文字啦。

「這些數字代表搜尋字詞在特定區域和時間範圍內的熱門程度變化趨勢,以圖表中的最高點做為比較基準。100 分代表該字詞的熱門程度在該時間點達到最高峰。50 分表示該字詞的熱門程度為最高點的一半,0 分則表示該字詞熱門程度的資料不足。」

因為 google Trends 主要是用歷史資料來看哪些字的搜尋熱度變化。所以在我所認識的業界,最常使用 google Trends 的是做 SEO 網路排名跟網路行銷的代理商 / 網路行銷公司。他們看 google Trends 的目的是挑選適合操作的關鍵字。不管是操作網路廣告也好,或是操作網站的網路排名也好,都適用。

也因為這樣,在使用 google Trends 的時候,我們會輸入多組關鍵字。因為我們要知道的是哪些關鍵字比較熱,哪些關鍵字比較冷。這是為什麼我的分析會拿 google Trends 來作為比較的原因。

回到我前面說的,我為什麼可以確信 google 有足夠的技術可以做到「判斷他們的數據應該有做過濾確保不失真」,這要講到十幾年前我做過的一件蠢事。我很早就有部落格,當時用的是sina,然後我有掛 google adsense ,希望可加減賺廣告費。但掛了才發現其實很難賺。有一次我很無聊,用我自己的電腦點了我自己部落格的廣告,過一陣子發現 google adsense 那裡顯示我有廣告收益。於是我動了壞心眼,如果在別的地方有機會用電腦,我就上網搜尋我的部落格,打開後點一下廣告,而且很克制的只點一下。一個月內我大概做這事情不到五次吧,畢竟那時候還沒有手機平板,我也不上網咖,在別的地方用電腦的機會其實也不是那麼多。

然後過了一個月,我的 google adsense 被停權了。

我知道這很蠢,但我是要用這個例子來說,google透過使用者點擊統計,可以判斷這個使用者行為是否屬於「正常」範圍。我當時之所以被停權,是因為我的部落格流量並不大,他們長期統計已經大概知道正常的流量對應廣告點擊率大概的範圍,雖然我點不到五次,但跟我當時網站的流量做比較,那個廣告點擊的頻率大大超出正常範圍,所以他們判定我人為作弊,所以停權。

另外 google Analytices 在統計流量的時候,也早就已經做到不會因為你用同一台電腦一直重整畫面,網站流量就不正常攀升。所以你說 google 有沒有相關機制來確保他們的計量不失真?至少我相信是有。那你要不相信,就不相信吧。

5.搜尋結果網頁的大爆發應該是中時系統大量新聞發新聞的結果吧?

我直接來針對台灣幾個新聞網站搜一下他們在google被收錄的數量來做比較。又因為這問題我其實沒有覺得很重要,所以懶得截圖了,大家有興趣的可以自己花兩天時間搜尋紀錄試試看。以下是我搜尋的紀錄與分析。

11/9 晚上11:00 媒體網站被收錄數量

  • 中國時報 約有 1,220 項結果(搜尋字詞:site:chinatimes.com.tw)
  • 中天新聞 約有 812 項結果(搜尋字詞:site:www.ctitv.com.tw)
  • 風傳媒 約有 324,000 項結果(搜尋字詞:site:www.storm.mg)
  • 天下雜誌 約有 111,000 項結果(搜尋字詞:site:www.cw.com.tw)
  • 蘋果日報(全球) 約有 10,500,000 項結果(搜尋字詞:site:appledaily.com)
  • 蘋果日報(台灣) 約有 4,500,000 項結結果(搜尋字詞:site:tw.appledaily.com)
  • 聯合報 約有 8,210,000 項結果(搜尋字詞:site:udn.com)
  • 自由時報 約有 3,880,000 項結果(搜尋字詞:site:ltn.com.tw)
  • LINE TODAY 約有 2,350,000 項結果(搜尋字詞:site:today.line.me)

名人關鍵字搜尋結果數量(以下搜尋量採用前後加上””的方式搜尋)

  • 柯文哲:約有 14,900,000 項結果
  • 韓國瑜:約有 18,200,000 項結果
  • 林志玲:約有 30,100,000 項結果
  • 蔡英文:約有 35,200,000 項結果

11/10 早上9:00 搜尋媒體網站被收錄數量

因為媒體產出的量級數字跟名人關鍵字搜尋數量的量級差太多了,「小媒體」的我今天就沒搜。只挑聯合報跟蘋果日報(全球)。

  • 聯合報 約有 8,390,000 項結果(搜尋字詞:site:udn.com)
  • 蘋果日報(全球) 約有 10,800,000 項結果(搜尋字詞:site:appledaily.com)

名人關鍵字搜尋結果數量

  • 柯文哲:約有 13,800,000 項結果
  • 韓國瑜:約有 19,300,000 項結果
  • 林志玲:約有 27,700,000 項結果
  • 蔡英文:約有 42,000,000 項結果

網頁收錄量也跟搜尋熱度一樣會有高有低,所以有增加減少的變化很正常,我這裡要看的是增加減少的「量級數」。

網頁收錄數量一次增加減少的量級都是用幾百萬的變化的。台灣媒體網站頁面被收錄最多的網站是聯合報,隔一天增加的網頁數是18萬。即使用蘋果日報(全球)來看,也不過增加30萬。而且這是「全站總網頁被收錄數」,並沒有只針對「韓國瑜」這個字詞作過濾。

也就是單一關鍵字網頁收錄數要做到百萬變化,要有很多網站一起做。但是看看台灣媒體其他網站的整體被搜尋數量,就可以看出這也不是台灣「各大媒體網站狂出新聞稿」就可以操作出來的數字。

再提醒一次,請大家在講「大量」的時候,不要只憑感覺。把數字拿出來。

6.網軍主戰場在臉書的留言、按讚、分享,還有八卦版,操作google關鍵字搜尋量有什麼意義?

我這裡就不解釋搜尋排名操作的理論,簡單回答:你覺得當你搜尋的時候,誰決定哪些文章可以排在前幾頁?

基本上操作關鍵字就是在操作網頁排名,把他希望大家可以優先看到的資訊往前擠。又為什麼韓國瑜大部分的搜尋看起來都在台灣?若要操作排名在中國不能操作嗎?基本上現在google可以根據你的地點做在地搜尋。例如你在台北,跟你在高雄,一樣搜尋「餐廳」,手機的搜尋結果是不同的。桌機也是一樣,像我用電腦搜尋餐廳,他前面先顯示google map的資料,就會顯示我家巷口的熱炒店。

那做在地排名要根據什麼?在地的搜尋熱度跟搜尋後實際看了哪些網頁是其中一項因素。所以如果要操作當台灣人搜尋韓國瑜的時候,哪些資訊排前面,那搭配在地關鍵字搜尋行為就是必要的。另外我上一篇會比較收錄網頁數量,是想驗證他們有沒有在大量產出網頁,做網頁外連,用這個方式推特定網頁的排名。當然,熟知搜尋排名的都知道,要更細緻的操作遠遠不止這些。這裡只是其中一小部分。

但不要誤會,我不是說你現在看到所有韓國瑜的新聞「一定」都是他們操作上去的,因為「新聞」的排名速度更迭本來就變化的很快。且每個人的搜尋結果也會根據個人的搜尋習慣 / 地點 / 設備不同而略有變化。這裡只是要說操作關鍵字搜尋行為,再搭配一些作法,是能夠直接影響什麼網頁排在前面的。

想一個假設性問題:你今天投票意向不是鐵票,藍的綠的都投過,但想知道投誰贏面比較大,你上網打韓國瑜,搜的結果是預測韓國瑜會贏,跟預測韓國瑜會輸,兩者的結果會不會間接影響你的投票意向?

如果你只把網路戰鎖定在社群媒體跟ptt,那真的把網路戰看得太淺了。人家有計劃有組織的網路戰,做的可是全套的。

***************
感恩讚嘆蜂蜜檸檬,於是又有了第三篇….
選舉觀察part3:從「蜂蜜檸檬」看「韓國瑜」搜尋熱度異常,真韓粉其實在美國?!