選舉觀察:台灣新聞自由的被箝制與網路資訊風向的被操弄

之前只是跟朋友聊到韓國瑜的網路資訊有很明顯的操作痕跡,但今天發現一件事讓我覺得毛毛的。覺得一定要趁還有印象的時候記錄下來。

事情是這樣的,前幾天我在滑臉書的時候看到朋友分享了一篇文章,是天下雜誌寫的,標題我印象中有提到愛家公投跟中國因素,當時想說車上不方便看就先轉貼到自己的牆上備份起來。這幾天有時間想說要回頭好好來讀一下的時候,赫然發現該文章不見了!

這很奇怪,這篇文章上架沒幾天,為什麼會突然刪掉呢?一般來說台灣的新聞如果是內容有更動,反正都網頁化了,直接更新內容就好。由於之前已經耳聞過很多因為高層壓力而下架新聞的事件,我覺得這案情實在不單純。但在這之前我應該要先趕快把網路上找得到的資料先備份下來,免得口說無憑。

於是我重新在 google 搜尋「愛家公投 中國 天下」,搜尋結果如下,可以看到文章是三天前收錄到google的。針對像這種新聞大站,google的收錄都是很即時的,所以可以合理推論這篇文章三天前確實存在。但什麼時候被刪除?不確定。

然後我想想看看google有沒有留著暫存頁面。所以點進去頁面庫存檔,發現竟然完全沒有頁面庫存。

這就很詭異了。你可能會說,文章都被刪掉了,沒有頁面庫存有什麼奇怪的嗎?但就我個人的操作經驗來說,依照 google 爬蟲的運作,如果今天不是文章來源網站本身主動要求刪除頁面庫存,google自行刪除已收錄的庫存資料的速度是不會那麼快的。這個很顯然天下應該有使用 google console 去對 google 要求刪除庫存資料,才會那麼快庫存頁面就消失了。

我決定再碰一下運氣,用 wayback machine 網頁時光機找找看有沒有庫存。搜尋結果如下

所以他在11/6的時候確實也有收錄過。點進去看他收錄的版本

「反同婚教會背後有中國因素?學者:中國利用台灣矛盾、借力使力」文章上下架時間軸

所以看得出來 wayback machine 爬到的資料,當時已經改成「付費閱讀」了 可能因為爬天下的網站上限超過,所以顯示成「付費閱讀」以至於沒有爬到完整內容。然後從這裡也可以看到該篇文章的發文日期是2018/11/5。所以可以合理推測這篇文章「反同婚教會背後有中國因素?學者:中國利用台灣矛盾、借力使力」的時間軸如下:

  • 11/5 上稿
  • 11/6 被改成限付費閱讀 wayback machine 爬到的資料
  • 11/7(或更早)文章被刪除了

但幸好我用標題搜尋ptt後發現,ptt那裡已經有人全文轉錄了(備份網址一)(備份網址二)。說真的看了全文內容後,我個人真的覺得這就是一篇專訪,沒什麼大不了的。但為什麼我眼裡沒什麼大不了的文章,竟然會落得下架?

我在想的問題是:是誰要他們下架?反同教會?中國?還是其他?又就算姑且不論背後的勢力為何,但這是否也意味著確實有外部壓力正在影響甚至箝制台灣的新聞自由?

這也讓我想到之前觀察韓國瑜網路訊息的現象,當時我覺得韓國瑜的新聞感覺好像多到一種不太正常的地步。於是用google大神打了幾個關鍵字。我相信在此時刻的台灣,柯文哲的新聞多應該不是什麼很奇怪的事,於是我打了「柯文哲」跟「韓國瑜」比較一下他們的搜尋結果。

這是10/31我傳給朋友看的訊息

  • 韓國瑜:約有 46,900,000 項結果
  • 柯文哲:約有 14,000,000 項結果

避免有人說我在虎爛。截圖證明一下

這是我今天(11/8)為了整理這篇文章再次搜尋的結果

  • 韓國瑜:約有 53,400,000 項結果
  • 柯文哲:約有 14,700,000 項結果

這是今天重新搜尋的截圖

中間經過8天,柯文哲的搜尋結果增加了700,000,平均一天增加87,500。韓國瑜的搜尋結果增加了6,500,000,平均一天增加812,500。韓國瑜一天的新網頁收錄數量是柯文哲的9.28倍。以我以前在操作公司跟追蹤對手網站SEO的經驗判斷,這其實有非常明顯的人為操作。但是會是KMT在操作嗎?我認為他們沒那麼聰明。那會是誰在操作的?

另外如果我做SEO操作,不會只有「大量生產內容」,還要想辦法讓這些內容「排名可以排前面」,那就必須配合大量的關鍵字搜尋跟點擊的行為,那這件事是否同時發生呢?所以我到 google 趨勢去查詢,同時輸入幾個政治人物的名字做比對。

紅線是柯文哲,他長期搜尋熱度高不意外。綠線是黃國昌,前面有一個突起是當時在「罷免黃國昌」的關係。從這個趨勢可以很明顯地看出韓國瑜的搜尋熱度不但很高,而且高的很誇張,並且是從9月中開始上升,9月底開始誇張的沖天。

這是只有在台灣,那如果把搜尋結果改成全球呢?

因為全球包含台灣,所以搜尋結果差不多也很正常。韓國瑜看起來有更多外力支撐他在高點。我好奇全球都是哪些區域在搜尋的。來看一下區域搜尋熱度比較看看。

顯然中國對黃國昌很沒興趣啊。然後我進一步想,那如果我把這一年幾個重大社會議題一起拉進來比較的話呢?

勞基法凸起來的時間點就是一例一休修法的前後。我比較意外的是公投從10月中後跟柯文哲的搜尋趨勢黃金交叉,也呈現沖天炮的趨勢。

不論是勞基法還是罷免,上升到高點回到一般值經歷的時間差不多都在20天內,也就是三個禮拜。但是韓國瑜的搜尋熱度從9月中開始上升以來,到現在都還在高點。這本身就是一個不正常的搜尋趨勢。

韓國瑜比志玲姐姐還紅,關心韓國瑜的人比看韓劇的人多

我突然想到,前陣子金庸過世,當時不管台灣還是中國都有很多人弔念,那當時的搜尋趨勢跟韓國瑜比會是如何呢?

結果金庸的搜尋熱度高點竟然只比韓國瑜多一點點而已,而且很明顯一周內 google 也預測會下跌。那我不禁在想,韓國瑜的網頁收錄數跟金庸,志玲姐姐還有蔡英文總統比,誰多誰少呢?今天(11/8)搜尋結果如下

  • 柯文哲:約有 14,700,000 項結果
  • 韓國瑜:約有 53,400,000 項結果
  • 金    庸:約有 58,700,000 項結果
  • 林志玲:約有 31,800,000 項結果
  • 蔡英文:約有 60,600,000 項結果
11/9 補充資訊:有網友來信提醒,關鍵字搜尋頭尾加上””搜尋的數量比較精準。前面計算因為都是用沒有加””的方式搜尋,數字我就不修正了。但過幾天我會用這個方法重新搜尋,再持續追蹤看看數量變化。11/9重新用這個方式搜尋結果如下。

  • 柯文哲:約有 14,900,000 項結果
  • 韓國瑜:約有 18,200,000 項結果
  • 金    庸:約有 51,600,000 項結果
  • 林志玲:約有 30,100,000 項結果
  • 蔡英文:約有 35,200,000 項結果

原來韓國瑜比志玲姐姐還紅耶,我也是醉惹…..而且我相信以現在這種速度增加,韓國瑜的網頁收錄數量要超越蔡總統不遠惹~不然我來搜一些其他熱門字好惹,例如減肥,韓劇,看看他們的搜尋趨勢跟韓國瑜比又是如何。

原來台灣人對減肥跟韓劇的搜尋熱度還少於韓國瑜。在9月底的時候,大家對韓國瑜的熱度就超越減肥了。到10月中的時候還超越韓劇。果然只有韓國瑜可以超越韓劇(?

從 google 看公投議題被外力操作的痕跡

回到公投,這趨勢我也覺得有點誇張,不只高過柯文哲,而且還是持續上升。在10/14前的上升幅度還算正常範圍,但是10/14後明顯搜尋熱度上升的速度變快。且是持續三週上升,這個模式跟勞基法與罷免是第二週到最高點第三週回到正常水平,明顯是有差異的。

所以來看看有哪些地區對公投跟勞基法有興趣。

顯然中國對台灣公投也是很有興趣的,但是對勞基法就完全沒興趣了。

搜尋趨勢的部分我如果把時間軸拉短,改成90日。比較韓國瑜 / 柯文哲 / 陳其邁 / 公投。加上一個金庸。

可以看到金庸搜尋熱度一周內就回到平常狀態。韓國瑜的搜尋熱度上升的很不正常。公投的搜尋熱度持續維持還高於柯文哲也很詭異。

搜尋時間軸若改成30日。把金庸拿掉,改用減肥來比較。

你相信搜公投的人可以連著兩個禮拜比搜減肥的多嗎?我是不相信啦….

另外,網路搜尋使用者行為如果只看台灣,也不要傻傻的以為那真的都是台灣人自發性的搜尋結果。要記得一件事:中國如果想來台灣設置VPN跳板,是非常簡單的事。在網路上把自己的位置偽裝成台灣,特別是中國有錢有資源,一點都不是什麼很困難的事。我甚至敢大膽的推測,這已經是現在進行式了。

所以上述 google 趨勢,若對照「反同婚教會背後有中國因素?學者:中國利用台灣矛盾、借力使力」的來看,我覺得中國利用台灣矛盾借力使力,是很明顯的。他們其實不在乎什麼挺同反同,但他們在乎的是怎麼利用這些「勢」來影響台灣的政治,影響台灣的媒體,所以你會發現,只要這個「勢」可以影醒台灣政治的,他們就會有興趣,例如公投,例如反同。但如果這個「勢」對他們沒有太大幫助,例如黃國昌,例如勞基法,他們就沒興趣。而這才是我們需要提防的。

****************************

針對以下疑問與質疑

  1. 韓國瑜在這個時間點搜尋量大得多不是很正常的事情嗎?
  2. 拿韓國瑜跟跟韓劇、林志玲這種常用詞彙比較適當嗎?
  3. 是搜「韓國」的人的搜尋熱度跟「韓國瑜」的混在一起了吧?
  4. google Trends 的計量正確可以信任嗎?有相關機制來確保他們的計量不失真嗎?
  5. 搜尋結果數量的大爆發應該是中時系統大量新聞發新聞的結果吧?
  6. 網軍主戰場在臉書的留言、按讚、分享,還有八卦版,操作google關鍵字搜尋量有什麼意義?

請見選舉觀察part2:看「韓國瑜」網路資訊風向的被操弄