政治人物關鍵字搜尋量分析:柯文哲的搜尋量比韓國瑜更奇怪?

之前有做過總統候選人人名關鍵字搜尋量的分析(見:資訊戰真的存在嗎?從韓國瑜的搜尋量看資訊戰),這幾天我就在想,一般在做政治人名搜尋的時候,如果他今天真的是想針對這個人某個項目找資料,就有很大的可能會做複合關鍵字搜尋。例如搜「韓國瑜 行程」「蔡英文 民調」這類的關鍵字,所以我就在想,今天要操作關鍵字搜尋量,政治人名當然是最大宗,但也許不會刻意去操作這種很瑣碎的複合關鍵字。那我是否能從這種關鍵字的搜尋量去反推比較合理的搜尋量可能是什麼?

所以這篇文章的分析,有幾個假設是:

  1. 政治人物姓名(例如「蔡英文」),跟姓名相關的複合關鍵字搜尋總和(例如「蔡英文 行程」),存在某種合理比例分布關係。
  2. 如果複合關鍵字搜尋總和占政治人物姓名關鍵字搜尋量比例過低,那代表政治人物姓名的搜尋量可能有被操作的痕跡。

所以要做這樣的假設分析需要幾個資料

  1. 政治人物人名總搜尋量
  2. 政治人物人名複合關鍵字搜尋總搜尋量

1很簡單,只要在 google ads 關鍵字規劃工具,就可以取得每個月搜尋量級的數字,這裡我用「搜尋量級」的原因是,他提供的不是「精確的搜尋量數字」,所以那裡撈出來的數字結尾一定是0,但這個數字基本上已經讓你足以判斷這個關鍵字搜尋次數大概落在那個數字區間。

但是2要怎麼取得?因為這種關鍵字很細碎。我希望可以盡量收集所有這類的複合關鍵字。我後來用第三方工具 keywordtool 來找。取樣流程如下:

  1. https://keywordtool.io/ 輸入政治人物姓名,撈出政治人物相關搜尋字詞
  2. 到 google ads 的關鍵字規劃工具把字詞都丟進去,撈出12個月內具有搜尋量級資料,把沒有搜尋量級資料的字詞都刪除,只保留有搜尋量級的字詞。

可能有的人會覺得很奇怪,既然 keywordtool 查的到,那為什麼 google ads 的關鍵字規劃工具會沒有量級資料?這基本上有兩種可能性。

  1. 因為 keywordtool 查的到的資料是這個月的熱門搜尋字。所以每個月的熱門搜尋字都可能不同。更不要說複合關鍵字的差異會更大。
  2. 這關鍵字有人搜,但每個月的搜尋量低到還沒達到 google 關鍵字規劃工具統計的最低量級數量,所以就會顯示沒有數據。

總之用上述方法,我整理出這個大表格。裡面包含綜合比較,還有政治人物以及其複合關鍵字的搜尋量。有好幾個分頁,對數字有興趣的可以到這裡看,這裡就不貼了。

然後我挑選的標的分了四組

  1. 正式的總統候選人:蔡英文、韓國瑜、宋楚瑜
  2. 曾經可能的總統參選人:郭台銘、柯文哲
  3. 現任第三勢力立委,跟網路熱門立委新科參選人:黃國昌、吳怡農
  4. 現在立院三大政黨

比較需要解釋的是3。1跟2都算是「總統候選人」,所以是全國性知名的人物。但我也好奇網路熱門搜尋但知名度相對沒那麼高的政治人物,他們的這種關鍵字搜尋量分布會不會有所不同?所以拿時代力量最熱的黃國昌,還有近期網路崛起且很多網紅推薦的吳怡農來做比較。4的話單純是個人好奇,政黨跟人在搜尋量分析上是否有模式的差異。

複合關鍵字搜尋總量比較

(原始大圖)

複合關鍵字搜尋總量分析:韓國瑜與蔡英文的差異不大、柯文哲搜尋量持續走低

從上面這張表可以看得出來,如果排除單純姓名搜尋,只看複合關鍵字搜尋總量,其實韓國瑜與蔡英文的差異不大。然後兩者都會因為當月大事件,而搜尋量暴增。

  • 韓國瑜:5~7月搜尋量大增。這時候是國民黨初選。「韓國瑜民調」「韓國瑜造勢」搜尋量暴增。10月~11月又往上增加,「韓國瑜行程」搜尋量從10月開始激增,「韓國瑜豪宅」「韓國瑜電話」從11月開始激增。因為壹週刊報豪宅,還有博恩夜夜秀提到韓國瑜的電話被邱毅在媒體上的截圖公開。
  • 蔡英文:3~6月搜尋量有拉一波,這時後是民進黨初選。9月10月拉一大波,這是論文事件,「蔡英文學歷」搜尋量暴增。11月宣傳上打政績牌,連帶「蔡英文政績」搜尋量暴增。
  • 宋楚瑜:11月宣布參選總統。所以拉了一波。
  • 郭台銘:4月宣布加入國民黨總統初選。5~7月國民黨初選,所以這段時間搜尋量都在高峰。9月正式宣布不選。10月開始搜尋量就大幅下降。
  • 柯文哲:搜尋量相較於其他總統候選人,複合關鍵字搜尋總量一直都很低迷。

人名搜尋量與複合關鍵字搜尋總量比較

(原始大圖)

(原始大圖)

神奇的6%分水嶺:韓國瑜與柯文哲姓名複合字搜尋搜尋量占比都異常低

之前我就分析過韓國瑜的搜尋總量是有異常的。如果我上面的假設正確,我預期韓國瑜的其他複合字搜尋總和占單獨名字搜尋量的比例會偏低。以圖表跟數據來說。確實在2018年12月~2019年4月這段時間是偏低的。都未達5%。

但奇怪的是,柯文哲的這個比例,在2018年12月~2019年3月、2019年7.8.11月,這段時間也都偏低,而且未達4%。只有2019年4.5.6.9.10這五個月有高一點,但未達6%。

我們把所有人每月搜尋數量的數據都撈出來看

  • 蔡英文:每月最低8%以上,年複合字搜尋量總和比例35.28%
  • 韓國瑜:每月最低3.5%以上,年複合字搜尋量總和比例10.29%
  • 宋楚瑜:每月最低6%以上,年複合字搜尋量總和比例16.18%
  • 郭台銘:每月最低6%以上,年複合字搜尋量總和比例13.68%
  • 柯文哲:每月最低2.4%以上,年複合字搜尋量總和比例3.93%

對照組

  • 黃國昌:每月最低都在6%以上,年搜尋量總和比例10.95%
  • 吳怡農:最後三的月才有足夠數據,分別是9.94%、4.57%、5.63%,年搜尋量總和比例6.56%

以新人來說,每個月用 6% 分水嶺看是否適用?這個我覺得可以再找更多的例子來分析看看。但這不是本篇重點就先跳過。

以每月最低6%以下為異常的有:韓國瑜、柯文哲。而且柯文哲還低於韓國瑜,柯文哲12個月都低於6%。韓國瑜在幾個熱門月至少都還有超過6%。

綜合上述圖表,我取每月數據跟突發數據爆衝比較沒有那麼嚴重的宋楚瑜、郭台銘、黃國昌三個人的數據來看。我推測具有全國知名度的政治人物來說,年搜尋量總和比例比較合理的比例應該是在10~17%中間,超過應該是有很突發的狀況造成的爆衝異常,過低則是可能是姓名搜尋量異常高才導致這個比例太低。

所以有異常的有:蔡英文(過高爆衝)、柯文哲(過低)、吳怡農(過低)

但吳怡農是投入選舉後才變熱門,而且才三個月時間。這個數字我覺得取樣還不夠,所以可以先不計。

結論

以複合字搜尋總和占單獨名字搜尋量的比例來看。韓國瑜與柯文哲的每月搜尋數量有很多個月比例都偏低,而柯文哲一直都很低,而且比韓國瑜更低。以年搜尋量總和比例來說。柯文哲的最為異常。

韓國瑜的姓名搜尋量因為高到異常破表,所以即使沒有作這次的分析就已經足以證明他的姓名搜尋量有被操作,但這次分析只是加強了這個論點。我比較意外的是這反而挖出柯文哲的總搜尋量有異常的狀況。

而我其實還是沒辦法確定單獨柯文哲姓名的總搜尋量是否有被操作,因為他正好2018年歷經市長選舉,2019年又一直被當成兩黨的假想敵。有一定的搜尋量好像也不奇怪。但他的複合字搜尋量占整體比例偏低這件事情,我現在沒有其他合理的解釋。