從google趨勢看台灣重大事件搜尋熱度:蔡英文、韓國瑜、陳時中、確診、酒精、衛生紙、口罩

到目前為止最大的事件還是武漢肺炎。在這個時間點正好可以把在台灣當下的熱門事件搜尋,跟選前韓國瑜的數據做個比較,找出台灣政治人物搜尋熱度的某種「正常基準值」。

衛生紙之亂 vs 韓國瑜誰比較熱門?

先用這五個字來看:蔡英文、韓國瑜、確診、酒精、衛生紙

從這張圖可以看出幾件事

  1. 兩次的衛生紙之亂都反映在搜尋熱度上,一次2月初,一次3月中。
  2. 1月的時候確診數相對還比較少的時候,大家更關心買不買的到酒精。
  3. 2月底之後酒精的搜尋熱度有走下的趨勢,但還是維持在一個程度的搜尋量,代表持續有酒精的需求。這部分我想應該是反應還要營業的店家有固定酒精消毒的需求,之前沒有現在有,所以現在酒精的搜尋熱度會比之前的搜尋量維持在一定的量。
  4. 3月中境外疑入確診數連續好幾天飆高,也反映在搜尋確診的熱度上。搜尋熱度也在這個時候超越了酒精。

確診人數 vs 韓國瑜誰比較熱門?

為什麼我要拿韓國瑜來比?因為我之前就一直說韓國瑜的搜尋熱度不正常。正好拿現在的事件來做比較。

把時間再往前拉一點看,會看到在選前9月到11月韓國瑜的搜尋量一直維持在跟現在確診2月初到3月的搜尋熱度。我個人還是認為是個不正常的狀態就對了。因為我覺得持續關心確診很正常,但持續關心韓國瑜很奇怪,即便是選舉還是一樣。而且關心確診的人不可能比關心韓國瑜的人少。

口罩 vs 韓國瑜誰比較熱門?

那發生重大事件時,特定關鍵字的搜尋量跟全國知名政治人物相比,搜尋熱度有多大的差異呢?現在防疫最熱門的話題應該就屬口罩了。所以拿口罩跟蔡英文、韓國瑜來比比看。

口罩大大的超越了所有的字。就算相對搜尋熱度的低點也比確診的高點更高。這表示在重大事件的特殊關鍵字,台灣的搜尋量是可以超越總統當選人當選那天的搜尋量很多很多的,這是有可能的,但需要符合重大的特殊事件。口罩這個詞基本上在這段時間可以說是全民談資,所以能夠達到這樣的搜尋熱度也是很合理的。

另外3/21後隨著確診人數不再那麼猛爆性增加,搜尋量也隨之緩慢下跌,但會發現搜尋口罩的搜尋熱度在3/21後卻是逐日往上成長。特別是清明節其間,大家應該都有被外出人潮嚇到。在那到現在口罩搜尋量一直都上升。我想這反應的是台灣然在確診人數增加後,危機意識還是有一定程度的提升,所以關心要去哪買口罩的量有變多。

政治人物正常的搜尋量級到底是多少?

上述這些字跟這段時間很紅的陳時中搜尋量相比又是如何呢?

從2月以後看,整體都比蔡英文高,這應該算正常,畢竟現在跟防疫有關的記者會都是他在說明。然後如果陳時中3/14後(就是開始很多境外移入案例爆炸的時間)跟蔡英文選前2019年12月比的話,兩者的搜尋熱度是相當的。

從這裡我大概可以下一個判斷:政治人物人名在台灣的「正常」搜尋熱度。排除選舉日當天當月,但在選舉期間或因故熱門(這次來說是疫情)期間,搜尋量的熱度上限大約就是蔡英文在2019年11、12月與陳時中2020年2、3月這段時間的搜尋熱度。那如果換算成實際搜尋量大概是多少呢?

我這裡用 https://keywordtool.io/ 撈,可能會跟 google ads 直接提供的數據有一點落差。但大致可以做個參考。

蔡英文2019年11月搜尋量級

蔡英文2019年11月搜尋量級

 

蔡英文2019年12月搜尋量級

蔡英文2019年12月搜尋量級

陳時中2020年2月搜尋量級

陳時中2020年3月搜尋量級

https://keywordtool.io/ 撈 google 的月總搜尋量級,蔡英文2019年11月是550000,2019年12月是823000。陳時中在2020年2月是823000,2020年3月則是550000。這與前面分析陳時中與蔡英文在這兩個時間的搜尋熱度相當是相符合的。

也就是未來在台灣如果有那個政治人物的月搜尋量級可以莫名且持續數月超越這個數字,我們可以合理的懷疑他背後應該有神秘水軍在操作。

後面補上韓國瑜一樣從 https://keywordtool.io/ 撈 google 月總搜尋量級,從2019年11月~2020年3月數據做參考。

韓國瑜2019年11月搜尋量級

韓國瑜2019年12月搜尋量級

韓國瑜2020年1月搜尋量級

韓國瑜2020年2月搜尋量級

韓國瑜2020年3月搜尋量級

從google趨勢看各國疫情變化

今天朋友丟了一篇臉書文,內容是用google趨勢找台灣這七天搜尋台灣跟譚得賽(兩者都是英文)的比較。問我有什麼看法。

我覺得他的比較蠻有趣的,但是我對他選的標的比較有疑問一點。是他選的字詞是 Taiwan 跟 Tedros。

因為Taiwan這個詞可以包含的範圍很廣,不只是這次肺炎的事,而Tedros只是單一人名,所以文中寫說「全球各大國家對台灣的搜尋量,比對譚先生的搜尋量還大。」,這其實是必然的。這不用看這七天的資料。在之前就是如此。

當然譚得賽先生的發言有帶動 Taiwan 這個字詞的搜尋更上層樓,這點是無庸置疑的。

不過這篇就引發我去想要搜什麼字來看這次武漢肺炎相關的趨勢。

病毒名稱字:coronavirus、冠状病毒

簡體中文還略高於英文,這我有點小意外。不過有沒有可能是因為發源地是中國,所以大家好奇中國的資訊?

武漢字:Wuhan、武漢、武汉

針對地名的話,英文搜尋高於繁體再高於簡體。

各地病情字:國家名 + coronavirus 還是 coronavirus in 國家?

我先打了 taiwan coronavirus ,但朋友說這字是不是會被認為是台灣肺炎?

不過做了測試以後我覺得不會。因為我使用 coronavirus in taiwan 。後面 taiwan 換成其他國家名稱。都明顯是使用 國家名 + coronavirus 的搜尋量比較大。所以在語意上大家應該要查的就是某國家的冠狀病毒資訊。而不是認為這個冠狀病毒源自某國家所以這樣搜尋。

各國疫情的搜尋熱度比較

先比較東方台灣、日本、韓國

韓國的疫情是在2/19的時候攀高,在搜尋上也是那時候開始拉高。這個狀況台灣也有(但要用中文搜尋「確診」)。日本從2/22拉高,大概是接在2/19鑽石公主號乘客開始可以下船之後。

如果把中國加進來呢?

很好,大家都被壓扁了呢。我對中國這段時間到底爆了哪些新聞沒興趣所以就不去找他為什麼搜尋量從3/8之後又步步高昇的原因了。不過很有趣的是中國不是說自己零確診嗎?顯然其他國家的人民可能並不是那麼放心。

既然台日韓已經被中國的搜尋量壓扁了,就不跟台日韓比了,我們直接來做大國之間的比較

中國跟美國搜尋量不相上下。當然中國因為比較早就出事了,所以早期搜尋量就比較高。義大利搜尋量3/8上升,3/18後提高更多,時間點大約是更在開始部分封城到鎖國兩個時間點。

那把英國加進來看看?

不知道是不是因為英國中標的包含皇室成員以及首相,英國的搜尋量超出中國美國的很多,也超越義大利。

那搜尋譚得賽跟搜尋各國確診人數比較呢?

恩,譚得賽跟歐美疫情比,大家比較關心疫情。那譚得賽跟東方各國疫情比呢?

關心譚得賽跟台灣疫情的搜尋在後期才有高有低,早期還是關心台灣疫情的人多於譚得賽。但基本上關心日本韓國疫情的人明顯是更多的。

簡單小結:

  1. 遇到確診數大增、宣布封城時,搜尋量都會有一波大增,各國都是。
  2. 關心疫情的人還是比較多,至於全球對譚得賽的注意其實相對還是比較少的。

從google趨勢看武漢肺炎疫情對生活的影響

武漢肺炎後,改變了很多我們的生活習慣。例如這段時間大家減少外出,顯而易見造成旅遊業的重大衝擊。我也觀察到身邊很多人開始自己煮吃的,就在想,那像這些生活的改變,是否可以從google趨勢中看到一些端倪呢?

所以挑了這些詞組的五年搜尋熱度資料來做比較。分別是:旅遊、機票、旅館、電鍋、烤箱、微波爐、冰箱、電腦、網路、foodpanda、ubereat、泡麵、罐頭、額溫槍、耳溫槍、計程車、腳踏車,以及「確診」

以下只針對個別字的搜尋熱度作自我的搜尋趨勢比較。不同字的搜尋熱度點數不等於搜尋量所以不能直接跨字互相比較喔。

出遊字:旅遊、機票、hotel 搜尋量大大降低,旅館緩步下跌

不意外,這週「旅遊」的搜尋熱度20點,比2018年最低49點的一半還少。這週「機票」的搜尋熱度13點,也比2016年最低點34點的一半還少。這週「hotel」搜尋熱度低點是47點,也比2016年的低點64點少了三成。

讓我比較意外的是旅館這個字,也是呈現下跌趨勢,但沒有「旅遊」「機票」「hotel」崩盤的那麼明顯。可能代表國內旅遊還是大家會考慮的?

廚具字:電鍋、烤箱大漲,冰箱短波小漲,微波爐緩步上升

電鍋烤箱搜尋熱度明顯都是過去五年的最高。冰箱小漲的幅度沒那麼明顯,但如果跟過去同時期比,過去每年2/2~4/4正好都是冰箱搜尋的相對中低點且搜尋趨勢持平,今年搜尋熱度明顯上升,與其他年不同。

微波爐的搜尋趨勢因為正好五年是緩步上升的,一時間看不出有差異。但如果把過去同時期拉出來比較,會觀察到微波爐在過年前會有兩波搜尋高波,隨後往下降。但今年卻是緩步往上,代表搜尋行為還是不同與前幾年,有增加的趨勢。至於過年前為什麼有兩波高波…我猜是買來熱年菜的人變多?

這些字對應的應該是在家裡煮的人變多了,所以有找廚具的需要。

3C字:電腦與網路跟同期比搜尋熱度都微幅上升

似乎是找廚具比想買電腦接網路的人要多一點。但跟同時期比,「電腦」跟「網路」的搜尋熱度都是上升的。「網路」比較有趣是他只要再過年放假期間,就會有一個搜尋熱度凹陷的狀況。大家都放假出去玩啦。

外送字:foodpanda 與 ubereat 正夯

這兩個字不意外,搜尋熱度都大漲走高。代表叫外賣的人變多了。

戰備物資字:泡麵、罐頭、耳溫槍、額溫槍大家買

跟旅遊字相反,泡麵罐頭搜尋量都大增。大家都在囤貨啊。另外耳溫槍、額溫槍搜尋熱度也有井噴式的爆發狀況,從平常搜尋熱度低點爆衝到跟泡麵相當,額溫槍甚至比泡麵還高。

交通字:計程車下滑,機車持平,腳踏車上升。

外出交通,計程車搜尋量整體是下滑,但其中有兩段驟升,前面驟升的時間點正好跟開始有確診消息的時間有重疊。可能是一開始宣布確診後,比較多人有交通需求寧可選擇計程車而不是大眾運輸工具。但後來確診人數又大增,整體出門的意願降低,所以就往下滑了。

想騎腳踏車的變多了。機車反而變化不大。機車變化不大我有點意外,是因為比起機車,腳踏車更便宜嗎?

大趨勢字:確診,搜尋熱度走高走低都跟他有關

確診這個字,對應其他字會發現,不管他們走高還走低,時間點都跟確診有相當的關連性。

然後因為打「確診」注音輸入法在mac電腦上如果有點問題的時候,很容易不小心打出ㄑㄩ,結果也呈現搜尋熱度微幅上升的趨勢,算是一個小有趣的發現。

 

 

國際橋牌社裡那些當年的社會氛圍與社會事件 part 1:吐槽篇

聽說這個劇的評價在戲劇圈普普。可是好像在我的社運同溫層內評價還行。我自己是蠻喜歡他整個戲劇節奏,不會太拖但也不會快到搞不清楚狀況。還有運鏡的方式比較接近電影的感覺。

但不可否認他在描述李郝政權(劇中的黎清波與處長青)的政爭內鬥的部分,大多只有點到為止。正如有的人留言說他覺得看wiki還比較精彩。這留言雖然有點殘忍卻也是事實。

但我對這個劇整體還是持正面態度,因為台灣終於有人敢拍近代政治劇了。他當然有很多缺點,如同之前看返校一樣,劇裡面的細節呈現有所不足,跟當年實際狀況的氛圍也多所落差,但對我來說,這個劇對我個人的意義,比較像是讓我有個機會回頭去看那段歷史,從這個點去找更多當時了事件。

由於閃光常在講以前那時候的政治事,我想找他一起看他應該會講很多有趣的事。也確實是如此,簡單來說就是有諸多吐槽XD

但整個重看過還是太花時間了,所以我自己看完之前漏看的集數之後就懶了。也想趕快趁有印象時把這篇寫起來,簡單做個交代。這篇著重的不是戲本身,而是他帶出的當時的相關社會事件、跟當時真實的氛圍比較。也順便把看的過程另外找到的資料一起補上。

警總比戲劇演的更黑暗可怕

第一集裡面,有出現總統的侍衛車。閃光說「車牌號碼確實有比照當時的編號方式,不過字體不是那樣」。我心理只OS你為什麼記得這種事XD

裡面有兩幕記者追問的畫面,一個是在黎清波上樓梯時記者的追問。另外一個是一群記者想問問題然後很近距離的被侍衛長擋在外面。閃光說這種場景在當時都是不可能的。那時候還有警備總部,他想弄你,可以偷偷跑到你家動你家的東西、殺你家的寵物來警告你。那時候的人歷經過戒嚴,他們都知道警備總部會幹嘛。

戲中有個獨家新聞報,說是影射首都早報。閃光說他對這個報完全沒有任何印象。上網一查創辦人為康寧祥。他說康寧祥他就有印象了,問我知不知道,我說我不知道他是誰。

康寧祥wiki

簡單來說,康寧祥是在民進黨早期創黨很重要的一個人物。他當年的聲勢有名程度可比後來的政治金童趙少康。而我比較熟悉的民進黨人物,已經比較是美麗島大審後的那些人。閃光對此覺得不甚唏噓,才幾年的光景,大家就都對這些歷史完全遺忘了。

我看到後面覺得獨家新聞報與其說是影射首都早報,不如說是那個年代所有報社的集體縮影,像後面有一集演到報社被警總搜查沒收東西,我想這在當年對報社可能根本就是日常。不過這段劇情也被閃光吐槽XD。他一看到警總進來,記者們敲桌子抗議,就說「又跟返校一樣了」。

他說警總如果要搜查報社,一定是叫你裡面的人先出去。他們很知道你們可能會有什麼動作,所以根本上就會避免讓你們有機會作這件事。另外就是戲裡面的記者看起來好像無所畏懼,他說歷經過戒嚴時代,每個人心裡有個小警總,所以他們即使想要報一些比較突破尺寸的事情,都要百般小心,演員並沒有把那種時代氣氛給演出來。強調警總是黑化王聰明,不是只會無腦動手的技安。

「小蜜蜂」出自野百合

楚長青(影射郝柏村)上任的時候,有抗議說反對軍人干政。閃光說那個年代有小蜜蜂,會到處噴漆,像反對軍人干政,他以前確實在路上有看過。

關於小蜜蜂的紀錄可以參考以下兩篇
學者從政 郝小子不忍父孤單

曾經他是被街上「小蜜蜂」四處噴漆反對「軍人干政」的行政院長,是威權體制時代遺留的軍事強人。

看見野百合學運世代崛起

野百合學運後,學運團體也達成校際間合作的共識,成立了「全國學生運動聯盟」(簡稱「全學聯」)。全學聯、教授、社運人士和民進黨,於是在五月策劃了一波又一波的「反軍人干政」的遊行抗爭活動。5月5日起,憤怒的「全國學生聯盟」再度集結中正紀念堂,全學聯並派出「小蜜蜂」特攻隊,這是學生一種新型態的抗爭方式,在台北街頭以「噴漆」方式宣傳學生的想法,這場「遍地烽火」抗爭方式,讓警方疲於奔命,這些小蜜蜂也曾經遭到情治人員的毆打。他們同時也抗議電視台與部份報紙媒體,封鎖學運的消息。

所以難怪318之後很多社運活動,會把做社運宣傳的這些社群稱為「小蜜蜂」由來在此。

民間的新聞印象「一百行動聯盟」大於獨台會案

劇中演到獨台會案有五個大學生被抓,閃光說那時候這件事不是新聞重點,因為那時候人被抓還是很稀鬆平常的事,即使已經解嚴了。也因為不是新聞重點所以他其實毫無印象,反倒是因為此案後來而起訴求廢除刑法一百條的的一百行動聯盟,他們抗議很長的時間,在當時是很大的事情。戲裡面對這個運動的著墨很少,針對修法也只提到黎清波希望洪新介(影射時任民主進步黨主席黃信介)可以支持「修」而不是「廢」。

但其實一百行動聯盟反而才是促成廢除刑法一百條的關鍵開端。

根據這篇
臺灣民主運動小故事(二):「一百行動聯盟」末代國慶閱兵大典搗蛋計畫
裡面有提到

這個主要由知識份子主導的運動組織,幹過最「暴民」的一件事情,大概就是在體制內的辦法走完以後,便對外宣布說要在當年的國慶典禮上,發動一場「反閱兵,廢惡法」的非暴力抗爭。這群平常溫文儒雅的讀書人並且明確宣示:只要刑法一百條立即修法的訴求未能得到回應,他們的行動「絕無妥協餘地」。

這個爆炸性的搗蛋宣言,引發了政府的高度緊張,特別因為閱兵這件事情,可能還會牽動到當時李登輝與郝柏村的政治鬥爭,連美國在臺協會都曾特別關切「一百行動聯盟」的行動,可見這個主意確實造成了相當程度的壓力。

閃光說他為這件事情很有印象。他說解嚴後的那個年代,各種實體抗議很多,每月都有不奇怪。因為以前沒網路,要支持就是得要上街。但那時候新聞也不像現在整天都可以播,新聞畫面很有限。但那個年代水車跟警察打人並不奇怪。去參與抗議的人,也都有心裡準備會被警察抓到很遠的地方丟包。他朋友以前就曾經被抓到現在士林天文台那裡附近丟包。說走了好幾個小時才回到家。

解嚴後的警察打人與水車驅離

318的時候,很多小朋友對人會被警察打噴水車感到很驚訝。他說為什麼要那麼驚訝?這以前就發生過了。然後提到520農民運動。

520農民運動wiki

發生在1988。所以這不在國際橋牌社演的時間軸內(他們是從1990開始寫)。不過在社運史上,這是台灣解嚴後首次爆發激烈警民衝突的社會群眾運動,發生於1988年5月20日李登輝任內。

那時候抗議多激烈呢?可以看這系列新聞影像紀錄

這裡有鎮暴警察與水車驅逐民眾

上述系列影片看下來也會發現到幾件事,例如民進黨當時都有參與。新聞畫面帶過去有時候會帶到他們的「戰車」跟旗子。但報導本身完全不會提到他們。簡單來說就時不會讓你有讓大家知道你是誰的機會。

另外大家可以注意看新聞旁邊講話的是誰:p
就是年輕時候的彭文正。

野百合學運與山中傳奇

劇裡面有演到野百合學運。閃光說其實野百合最開始沒有什麼媒體報導的。但因為當時的國代們自己想延長任期。這是「山中傳奇」事件。大家不爽後開始有媒體報導野百合集結,之後人才變多。

為什麼叫「山中傳奇」可以參考這篇
遙想當年台灣的「山中傳奇」(管仁健/著)

所謂「山中傳奇」,原本是知名華人導演胡金銓的一部電影,但多少年下來,台灣媒體都習慣用「山中傳奇」來形容國民大會,因為國民大會總是在陽明山硫磺氣飄渺的中山樓開會。

郝柏村的治安內閣與六年國建

劇中楚長青上任後,說定位為治安內閣。閃光說治安內閣的部分在新聞曝光上他沒有什麼印象,但倒是對六年國建很有印象。郝柏村一上去就推六年國建。而郝柏村當行政院長的時候,新聞都報郝柏村,幾乎沒提李登輝。後來換成連戰之後,才變成都報導總統李登輝而比較少提到行政院長。

台灣的民主之路,李登輝確實功勞很大。不過以國際橋牌攝取的點,其實在這部分的著墨反而是不多的。想看更詳細的介紹可以看【台灣民主化之路】

寫的很亂…不過先寫到這。下一篇會針對劇中有提到的一些其他社會事件條列介紹。

政治人物關鍵字搜尋量分析追蹤紀錄

從google趨勢看,韓國瑜搜尋熱終於在二月之後恢復到正常狀態惹。

在去年12月我寫過一篇「政治人物關鍵字搜尋量分析:柯文哲的搜尋量比韓國瑜更奇怪?」

政治人物關鍵字搜尋量分析:柯文哲的搜尋量比韓國瑜更奇怪?

那時候追蹤的是2018/12~2019/11的數據。

現在選完兩個月了,理論上應該大家的數據都會有變動,因為不再是選前那個情況了,所以再來追蹤一年的數字觀察有什麼變化。

不過因為使用的工具跟上次有不同,上次搜尋量的部分我是直接從 google ads 撈的,這次因為我手上有的 google ads 帳戶都沒有下廣告了,無法查搜尋量。所以我直接付費使用 https://keywordtool.io/ ,比對有重複的前半年區間趨勢差不多,但兩者數字上有蠻大的差異,所以無法直接拿數值跟上次作比較。

理論上這工具他應該數字也是從 google 透過 api 拉過來的,但至於為什麼數字的差異有點大,這點我無法探究原因。

也因為數值無法直接做比較,所以這篇主要只講趨勢變化的部分。

數據報表的部分,有興趣的可以到這裡觀看。以下圖表點擊圖檔可以看原始大圖。

名字總搜尋量

2019年10月 – 2019年11月 名字總搜尋量(搜尋量數字由 google ads 撈取)

2019年3月 – 2020年2月 名字總搜尋量(搜尋量數字由 keywordtool.io 撈取)

  1. 選前「韓國瑜」的搜尋量一直在不正常的高點。2020年1月選舉結束後,2020年2月數字驟降。應該是反正已經沒選上了,網路水軍就都撤退了。
  2. 「蔡英文」的搜尋量只有在2020年1月選舉月時大幅攀升。2020年2月驟降。
  3. 「宋楚瑜」的搜尋量在正式宣佈選舉後,2019年11月~2020年1月明顯比更之前搜尋量有大幅的增加。

名字關連字總搜尋量

2019年10月 – 2019年11月 名字關連字總搜尋量(搜尋量數字由 google ads 撈取)

2019年3月 – 2020年2月 名字關連字總搜尋量(搜尋量數字由 keywordtool.io 撈取)

  1. 2019年4月之前「韓國瑜」名字關連字總搜尋量比蔡英文略高,但多出來的幅度沒有名字總搜尋量多的那麼誇張。但2019年4月之後也大幅拉高。2019年6月來到第一波高點,這個月有多場造勢大會。整體名字關連字總搜尋量高出其他候選人很多。
  2. 「蔡英文」名字關連字總搜尋量從2019年3月起也開始緩步上升,2019年9月因為論文事件大幅拉高。後面因進入選戰一直維持在相對高的搜尋量,2020年1月到達最高點。2020年2月驟降。

複合字搜尋總和 / 單獨名字 占比

2019年10月 – 2019年11月 複合字搜尋總和 / 單獨名字 占比(搜尋量數字由 google ads 撈取)

2019年3月 – 2020年2月 複合字搜尋總和 / 單獨名字 占比(搜尋量數字由 keywordtool.io 撈取)

2019年4月之前,韓國瑜跟柯文哲的複合字占比都明顯偏低。連宋楚瑜的占比都比他們高。2019年7月之後,除了郭台銘因國迷檔初選落敗,搜尋占比走勢往下,韓國瑜,蔡英文,宋楚瑜搜尋占比都呈現持平往上的趨勢。柯文哲的複合字占比在這時候都還是偏低。選後2020年2月,除了郭台銘因為口罩所以搜尋占比拉高,其他人的複合字搜尋總和占比都下降。

沒啥驚人結論。之後大概就是半年一年追蹤一次這樣。要長期追蹤的原因是這樣才能建立出有沒有「大量中國網軍介入」的標準線。所以必須要在非選舉的時候就要收集資料,因為這時候相對是網軍介入最少的時候。而且至少一年要次,這樣才能撈到那一年有的姓名關連搜尋關鍵字資料。

然後可能要控制都用同樣的管道取得數據,這樣才能把之後的跟之前比較。但 https://keywordtool.io/ 顯示的資料跟 google ads 差異真的有點大,這讓我真的蠻意外的…

政治人物關鍵字搜尋量分析:柯文哲的搜尋量比韓國瑜更奇怪?

之前有做過總統候選人人名關鍵字搜尋量的分析(見:資訊戰真的存在嗎?從韓國瑜的搜尋量看資訊戰),這幾天我就在想,一般在做政治人名搜尋的時候,如果他今天真的是想針對這個人某個項目找資料,就有很大的可能會做複合關鍵字搜尋。例如搜「韓國瑜 行程」「蔡英文 民調」這類的關鍵字,所以我就在想,今天要操作關鍵字搜尋量,政治人名當然是最大宗,但也許不會刻意去操作這種很瑣碎的複合關鍵字。那我是否能從這種關鍵字的搜尋量去反推比較合理的搜尋量可能是什麼?

所以這篇文章的分析,有幾個假設是:

  1. 政治人物姓名(例如「蔡英文」),跟姓名相關的複合關鍵字搜尋總和(例如「蔡英文 行程」),存在某種合理比例分布關係。
  2. 如果複合關鍵字搜尋總和占政治人物姓名關鍵字搜尋量比例過低,那代表政治人物姓名的搜尋量可能有被操作的痕跡。

所以要做這樣的假設分析需要幾個資料

  1. 政治人物人名總搜尋量
  2. 政治人物人名複合關鍵字搜尋總搜尋量

1很簡單,只要在 google ads 關鍵字規劃工具,就可以取得每個月搜尋量級的數字,這裡我用「搜尋量級」的原因是,他提供的不是「精確的搜尋量數字」,所以那裡撈出來的數字結尾一定是0,但這個數字基本上已經讓你足以判斷這個關鍵字搜尋次數大概落在那個數字區間。

但是2要怎麼取得?因為這種關鍵字很細碎。我希望可以盡量收集所有這類的複合關鍵字。我後來用第三方工具 keywordtool 來找。取樣流程如下:

  1. https://keywordtool.io/ 輸入政治人物姓名,撈出政治人物相關搜尋字詞
  2. 到 google ads 的關鍵字規劃工具把字詞都丟進去,撈出12個月內具有搜尋量級資料,把沒有搜尋量級資料的字詞都刪除,只保留有搜尋量級的字詞。

可能有的人會覺得很奇怪,既然 keywordtool 查的到,那為什麼 google ads 的關鍵字規劃工具會沒有量級資料?這基本上有兩種可能性。

  1. 因為 keywordtool 查的到的資料是這個月的熱門搜尋字。所以每個月的熱門搜尋字都可能不同。更不要說複合關鍵字的差異會更大。
  2. 這關鍵字有人搜,但每個月的搜尋量低到還沒達到 google 關鍵字規劃工具統計的最低量級數量,所以就會顯示沒有數據。

總之用上述方法,我整理出這個大表格。裡面包含綜合比較,還有政治人物以及其複合關鍵字的搜尋量。有好幾個分頁,對數字有興趣的可以到這裡看,這裡就不貼了。

然後我挑選的標的分了四組

  1. 正式的總統候選人:蔡英文、韓國瑜、宋楚瑜
  2. 曾經可能的總統參選人:郭台銘、柯文哲
  3. 現任第三勢力立委,跟網路熱門立委新科參選人:黃國昌、吳怡農
  4. 現在立院三大政黨

比較需要解釋的是3。1跟2都算是「總統候選人」,所以是全國性知名的人物。但我也好奇網路熱門搜尋但知名度相對沒那麼高的政治人物,他們的這種關鍵字搜尋量分布會不會有所不同?所以拿時代力量最熱的黃國昌,還有近期網路崛起且很多網紅推薦的吳怡農來做比較。4的話單純是個人好奇,政黨跟人在搜尋量分析上是否有模式的差異。

複合關鍵字搜尋總量比較

(原始大圖)

複合關鍵字搜尋總量分析:韓國瑜與蔡英文的差異不大、柯文哲搜尋量持續走低

從上面這張表可以看得出來,如果排除單純姓名搜尋,只看複合關鍵字搜尋總量,其實韓國瑜與蔡英文的差異不大。然後兩者都會因為當月大事件,而搜尋量暴增。

  • 韓國瑜:5~7月搜尋量大增。這時候是國民黨初選。「韓國瑜民調」「韓國瑜造勢」搜尋量暴增。10月~11月又往上增加,「韓國瑜行程」搜尋量從10月開始激增,「韓國瑜豪宅」「韓國瑜電話」從11月開始激增。因為壹週刊報豪宅,還有博恩夜夜秀提到韓國瑜的電話被邱毅在媒體上的截圖公開。
  • 蔡英文:3~6月搜尋量有拉一波,這時後是民進黨初選。9月10月拉一大波,這是論文事件,「蔡英文學歷」搜尋量暴增。11月宣傳上打政績牌,連帶「蔡英文政績」搜尋量暴增。
  • 宋楚瑜:11月宣布參選總統。所以拉了一波。
  • 郭台銘:4月宣布加入國民黨總統初選。5~7月國民黨初選,所以這段時間搜尋量都在高峰。9月正式宣布不選。10月開始搜尋量就大幅下降。
  • 柯文哲:搜尋量相較於其他總統候選人,複合關鍵字搜尋總量一直都很低迷。

人名搜尋量與複合關鍵字搜尋總量比較

(原始大圖)

(原始大圖)

神奇的6%分水嶺:韓國瑜與柯文哲姓名複合字搜尋搜尋量占比都異常低

之前我就分析過韓國瑜的搜尋總量是有異常的。如果我上面的假設正確,我預期韓國瑜的其他複合字搜尋總和占單獨名字搜尋量的比例會偏低。以圖表跟數據來說。確實在2018年12月~2019年4月這段時間是偏低的。都未達5%。

但奇怪的是,柯文哲的這個比例,在2018年12月~2019年3月、2019年7.8.11月,這段時間也都偏低,而且未達4%。只有2019年4.5.6.9.10這五個月有高一點,但未達6%。

我們把所有人每月搜尋數量的數據都撈出來看

  • 蔡英文:每月最低8%以上,年複合字搜尋量總和比例35.28%
  • 韓國瑜:每月最低3.5%以上,年複合字搜尋量總和比例10.29%
  • 宋楚瑜:每月最低6%以上,年複合字搜尋量總和比例16.18%
  • 郭台銘:每月最低6%以上,年複合字搜尋量總和比例13.68%
  • 柯文哲:每月最低2.4%以上,年複合字搜尋量總和比例3.93%

對照組

  • 黃國昌:每月最低都在6%以上,年搜尋量總和比例10.95%
  • 吳怡農:最後三的月才有足夠數據,分別是9.94%、4.57%、5.63%,年搜尋量總和比例6.56%

以新人來說,每個月用 6% 分水嶺看是否適用?這個我覺得可以再找更多的例子來分析看看。但這不是本篇重點就先跳過。

以每月最低6%以下為異常的有:韓國瑜、柯文哲。而且柯文哲還低於韓國瑜,柯文哲12個月都低於6%。韓國瑜在幾個熱門月至少都還有超過6%。

綜合上述圖表,我取每月數據跟突發數據爆衝比較沒有那麼嚴重的宋楚瑜、郭台銘、黃國昌三個人的數據來看。我推測具有全國知名度的政治人物來說,年搜尋量總和比例比較合理的比例應該是在10~17%中間,超過應該是有很突發的狀況造成的爆衝異常,過低則是可能是姓名搜尋量異常高才導致這個比例太低。

所以有異常的有:蔡英文(過高爆衝)、柯文哲(過低)、吳怡農(過低)

但吳怡農是投入選舉後才變熱門,而且才三個月時間。這個數字我覺得取樣還不夠,所以可以先不計。

結論

以複合字搜尋總和占單獨名字搜尋量的比例來看。韓國瑜與柯文哲的每月搜尋數量有很多個月比例都偏低,而柯文哲一直都很低,而且比韓國瑜更低。以年搜尋量總和比例來說。柯文哲的最為異常。

韓國瑜的姓名搜尋量因為高到異常破表,所以即使沒有作這次的分析就已經足以證明他的姓名搜尋量有被操作,但這次分析只是加強了這個論點。我比較意外的是這反而挖出柯文哲的總搜尋量有異常的狀況。

而我其實還是沒辦法確定單獨柯文哲姓名的總搜尋量是否有被操作,因為他正好2018年歷經市長選舉,2019年又一直被當成兩黨的假想敵。有一定的搜尋量好像也不奇怪。但他的複合字搜尋量占整體比例偏低這件事情,我現在沒有其他合理的解釋。

資訊戰真的存在嗎?從韓國瑜的搜尋量看資訊戰

選舉又要到了,去年這個時候寫了韓國瑜。今年韓國瑜出來選總統,就再來寫寫韓國瑜。

台灣政治人物搜尋次數量級的上限。我覺得應該可以拿總統作為一個標準因為總統是全國性的,屬於大家都會知道的人。現在的總統是蔡英文。所以拿蔡英文作為一個比較基準。

近七天搜尋熱度趨勢分析

最近因為有短暫熱點「王立強」共諜案,先來看看過去七天的搜尋熱度趨勢分析。這個圖表的搜尋時間是2019年11月26日中午12:00。

(點我看大圖)

  1. 韓國瑜最高,還是在一個很詭異的搜尋熱度
  2. 蔡英文其次
  3. 吳斯懷在剛開始中國國民黨提名不分區立委那陣子搜尋量有上來,快跟蔡英文相當,後來就降下去
  4. 王立強最近新聞開始爆之後搜尋量大增,超越蔡英文但也不算超越的非常多。
  5. 拿新北耶誕城作為比較,是因為這個活動是年輕人跟小家庭都會想去的,猜測會有一定的搜尋量,也確實有很明顯的搜尋週期,週四搜尋從下午兩點開始上高峰。週五下午五點開始,週六跟週日下午三點開始,週一就趨緩沒有在週末那麼熱。很符合想出去玩之前要先找資料的時間。但即便是週一搜尋量還是跟搜蔡英文的熱度相當。

七天搜尋量的城市分布

再來看看搜尋量的城市分布

  1. 人名(蔡英文、韓國瑜、吳斯懷、王立強)的搜尋城市分布遍佈全台灣。
  2. 活動(新北耶誕)明顯集中在雙北,然後少量在桃竹苗。但跟近七天搜尋熱度趨勢放在一起看,表示大型活動的搜尋量,在活動熱度高的時候,即使是區域型活動還是有辦法超越全國性政治人物的搜尋量。

你一直說韓國瑜搜尋熱度詭異的高,你是不是有偏見?

首先,這個看法去年我就提出過了,可以回顧以下舊文,裡面有當時的分析。
選舉觀察part2:看「韓國瑜」網路資訊風向的被操弄

另外關於搜尋量異常,以下舊文後面也要附上當時查的 google ads 實際搜尋量的資料。特別要注意到的是 google ads 實際搜尋量 跟 google 搜尋趨勢顯示的搜尋熱度意義是不同的,google ads 查到的是搜尋次數的量級統計。
選舉觀察part5:「公投」使用者搜尋行為差異分析

既然去年查過。今年我當然也要再來查一下。這兩年因為剛好歷經六都市長選舉,還有兩大黨的總統候選人黨內初選,所以我就拿蔡英文、柯文哲、郭台銘,韓國瑜來比較,以下是從 google ads 撈出的兩年數據(2017/11~2019/10)做出的折線圖,分析如下。

(點我看大圖)

這份是2015/11~2016/10,蔡英文的搜尋量。由於 google ads 最早只能查到2015/11,所以沒有更之前的資料。同時比較當時的對手朱力倫與上一屆總統馬英九的搜尋量。

(點我看大圖)

  1. 2018年市長選舉,可以看得出來柯文哲的搜尋量從2018年4月開始就逐漸攀升。而韓國瑜的搜尋量在7月前都趴在地上,8月9月開始有起色,接著從10月開始噴井式突破天際,月搜尋量到達400萬的等級。這數字有多驚人呢?以總統選舉來看。蔡英文當選得票數是 6,894,744。這人數跟馬英九第二屆的得票人數是相當的。台灣兩千三百萬人口。我假設一個搜尋量代表一個人搜尋一次的話,代表2018年11月,全台灣有17.4%的人都去搜尋過韓國瑜。從2019年1月開始。韓國瑜就一直維持在月搜尋量82萬以上的搜尋量級。
  2. 柯文哲在2018年11月(市長選舉月)當月的搜尋量也有噴井式的狀況。但也不過就是150萬。跟韓國瑜409萬比起來根本完全就是小兒科。韓國瑜的月搜尋量足足是柯文哲的2.7倍。
  3. 蔡英文的月搜尋量一直處在一個平凡而穩定的狀態。最高月搜尋量不過24.6萬。沒有選舉的時甚至只有6萬。唯一可以預期的是2020年1月總統選舉月,不管當選與否都一定會有噴井式的搜尋量,到時候我們可以來看看他的搜尋量有多少(2016年1月蔡英文的搜尋量是55萬,2016年5月就任,搜尋量是30萬),可以作為以後分析的一個標準。
  4. 郭台銘的數據可以視為「有錢人撲天蓋地選舉時,到底可以對網路搜尋量影響多大」的一個標的。搜尋量高點在2019年4月跟9月。4月的時候是國民黨黨內初選。9月的時候是最後宣布不選總統的時間。也就是說有錢人選舉對搜尋量影響的極限,大概可以說就是在月搜尋量67.3萬。

我沒有辦法去判斷柯文哲跟郭台銘的搜尋量有沒有被外來勢力影響,因為看起來還在可能正常的範圍內。但是韓國瑜的搜尋量一枝獨秀的超越他們近兩倍有。肯定是有其他勢力介入操作狂打雞血才有可能。以中國國民黨的現況,我不認為中國國民黨自己有那個本事作這些操作。

小結

最近很多人在那裡說哪有資訊戰。我覺得大家在討論資訊戰的時候,要釐清幾個點。

  1. 選舉影響有效/無效不能拿來證明資訊戰的有/無。有資訊戰不一定代表會對選舉產生明顯的「有效」影響,因為光釐清什麼叫做「有效」就有很多可以討論。但是「有沒有人在操作」資訊戰是有跡可尋的。很多人在討論的時候會把這兩個觀念互相抽換混淆,不可不慎。以數據來說,我會說資訊戰就是確實存在的。但很難說他最後的「影響」有多大。這兩者之間的關連性到什麼程度本來就很難評估。有沒有做,跟做完有沒有影響。完全是兩件事。
  2. 「有資訊戰操作」不等於什麼東西的歸因都是資訊戰。這就很像我們做網路行銷SEO的時候,順風大家都是SEO專家,逆風大家都怪演算法變更一樣。現在資訊戰也常常被拿來作為某件事情成功/失敗的藉口。我個人是覺得這樣的心態也不太健康。
  3. 韓國瑜的網路搜尋量很明顯是有被操作的,但我也沒有進一步證據可以證明是誰操作的。只能說確定有人在操作。那這樣的操作韓國瑜本人是否知情?我的看法是「不一定」。因為網路作這樣的操作本來就沒有一定要當事人的允許才能去做。就像SEO界有所謂的暗黑SEO,其中一種手法就是把別人的網站搞掉,這種他們當然不會跟當事人去講。所有的方法可以正著用,就可以反著用。如果外國勢力的目的是擾亂台灣的選舉,那當事人知不知道根本不重要。外國勢力想要「擾亂」的目的可以達成就好。

然後這篇文章上述提到的截圖,對應的原始數據資料我都有下載,大家可以自行到這裡下載,看看有沒有看出其他貓逆。

從傳統媒體報多少國際新聞看台灣與中國的差異

從三分鐘開始看,年輕人很棒,裡面提到台灣媒體幾乎不報國際新聞的事。

最近做青平台認識中國的專案,陸續整理活動內容,把分享者跟諮詢顧問的內容回應一篇一篇整理起來,準備要放在網站上。

我得非常老實的說,當時提議做網站某部分是我的私心。那個私心是在整個活動中我聽到很多很關於中國經驗、中國研究的內容分享,這些內容是非常有價值的,但這些內容即使我在當下聽到了,我在事後想要重新去看卻沒辦法取用。即使我想把當時聽到的某些內容取出來寫文章,除了記憶的太片段不完整之外,也無法有來源引用加強內容的可信度。我真的很希望這些資料未來可以被取用跟再散播。所以後來在青平台努力下爭取到經費,有機會可以做成網站時,我非常樂於把這些資料整理成一篇一篇的文章,再一篇一篇的放到網站上。整理的過程,等於自己又重新看了這些人分享的內容一次,印象會更深刻。

中國言論不自由只限於政治與社會議題,在其他產業專業上有強過於台灣的深入與廣泛

然後我要說的是,這其中我印象最深刻的,是中國的「言論不自由」真的只限於政治跟某些社會議題。除此之外,他們在其他產業、專業上的內容產出跟討論,跟台灣完全是不同等級的,那個部分他們是非常自由而且可以談論得很深入的。

我記得我第一次有這樣衝擊的時候,是好幾年以前我聽從中國淘寶做使用者研究的人來台灣分享的講座。當時的我還沒有像現在投入社會運動那麼的多,但因為家庭背景的關係,本來就比較會看跟討論政治的東西。當時感觸就很深,他們在使用者研究上做的考慮的已經到了這樣的程度,一樣的思辯竟然沒有發生在政治上,總覺得有點不可思議。這至少是七八年前的事情。那次的講座聽完,我對於他們的思考可以那麼深入與進步真心感到吃驚。

在中國於一般媒體取得國際新聞的機會比在台灣容易

然後在認識中國專案的活動裡面,有台灣記者去中國新媒體工作後再回來的經驗分享。然後還有與會同組參與者分享他去中國的經驗。我突然理解到一件事情,對中共來說,你今天不可能真的完全阻斷人民談政治的這件事,那不談國內政治,談國外政治總行吧?所以在中國一般人要看到國際新聞是非常容易的一件事情,所有媒體都會播放國際新聞,當然我不否認這背後絕對有中共本身的算計。但落實到生活上,他們能在電視上看到的國際新聞的就是會比台灣人要來的多。

我還記得我那組的參與者講到這件事情的時候,他說他很喜歡在中國各種資訊很多很豐富,而且他當時去的還是三四線城市,不是沿海城市。別人問他說那你不會想翻牆看什麼嗎?他說那裡可以看的東西實在太多了,所以今天除非是偶爾追劇他才需要翻牆。

這反應什麼?因為人的注意力就是有限。當你在中國裡面已經被太豐富的資訊給佔滿的時候,而且你同時是可以得到很多國際資訊的時候。他就是會分散掉人的注意力,讓人覺得也沒有一定要特別去關注社會議題、甚至沒有一定要去談論國內政治。其他比這個事情有趣且深入的資訊很多,看那些就好啦。然後常看國際資訊也會讓人有一種滿足,確實也可以提供比較寬廣的視野(當然,只要不談論國內政治都ok),所以他們覺得台灣人眼界狹隘其實也不是沒有原因。

自由媒體環境不等於聽閱者就能取得更廣泛與深入的資訊

然後反過來看台灣,台灣是有自由的媒體環境,卻在商業掛帥的前提下,閱聽者可以拿到的選擇反而是少的。這真的是極其諷刺的事情。這個再去對照前陣子聽端傳媒分享,他們說他們服務中文世界,很多去端傳媒看國際新聞的,都是台灣人。來自香港跟中國的反而是少數。這再再都顯示台灣不是沒有人要看國際新聞,但容易取得的資源反而是相對匱乏的。

我真的很認同,今天既使我不喜歡中國,也不能用標籤化、妖魔化、膚淺化的方式去看待中國。必須要去理解他們大國在各地的巨大差異性,不管是地區環境,還是人都是如此。如果今天我們討厭有人用片段化的資訊理解議題,那就也必須用同樣的標準提醒自己,不要只用片段化的資訊理解中國。

對於某些政治菁英發言的murmur

朋友轉貼一篇文章。我指出文章內容不錯,但有一段我看了很不舒服。然後延伸出一些討論。想說整理一下。

文章裡面有一段提到「憲政制度、選舉制度與政黨體系的關係,我以為對所有參與政治、討論政治的人,都是很清楚明瞭的。

昨天我看到青年政治學者Fang-Yu Chen的文章,介紹政治學上的杜瓦傑法則,我才察覺到可能有些參與政治的人不知道這個基本原理。」

我說這段我實在是不知道寫在文章裡面幹嘛,這就是我有時候不喜歡一些學者講話調調的一種原因。他要酸黃國昌,不想講的那麼明白的話,大可以說「我以為對所有有社會科學背景且已經進入體系參與政治的人,都是很清楚明瞭的。」

他那篇提到關於政黨的基本概念其實應該要讓更多一般民眾知道。但就是一定要用這種地圖炮的說法把所有關心政治的民眾一起酸下去。他這段話放前面,就是很有效的讓人先感到不爽。

我雖然不喜歡韓國瑜,但政治社會學菁英沒察覺自己的菁英口吻讓人討厭其實問題也很大啦,他們如果溝通的是自己人,在自己的學術圈子用語要多菁英都沒差,那本來就是他們的世界。但他寫在臉書上,我想一定程度目的也是希望公開讓大家看,結果那一段我看了只覺得「喔,所以你好棒棒嗎?」

我不是學社會科學出身的,但一些談社會分析的文章,我願意看,所以我很喜歡看菜市場政治學跟法律白話文。我自認我應該還算認真的人,雖然不是本科系,有些東西即使有些專有名詞,多看幾次多配合google也是可以慢慢看懂。

以前文盲多,你可以說當時的人無法選擇不無知。

可是現在文字閱讀普及率那麼高。這些「政治菁英」「政治學者」又做了什麼讓這些人理解政治?

我知道這不是單一ngo的責任,不是單一社會科學教授的責任。但那個感覺就像上一屆立委。兵團夥伴剪過田秋堇的一個影片,在講那個時候,有個外交官是賭上自己的性命建議蔣中正改用台灣不要用中國作為國號去申請留在聯合國。然後我把影片貼去ptt,結果底下就被一些我不知道是不是歷史系但就是對那段歷史比較熟悉的人酸「怎麼連這個都不知道」。

我心裡只覺得,我又不念歷史系,國民教育又沒教過,我為什麼要知道啊?

我做網頁設計到現在已經十幾年了,大家都會上網,但我也不會理所當然覺得其他人都該懂網頁。請問你憑什麼理所當然覺得我要熟悉歷史?要說我無知不認真。可是我在我本科專業上我很認真啊。為什麼我一定要對歷史、政治學認真啊?

我講的不客氣一點。以前我在社大教網頁設計課。可以讓沒有接觸過網頁設計的人知道怎麼寫網頁,也知道網頁、主機的相關連知識。我覺得這些知識相較於社會學這門研究人類行為的學科,其實更加抽象。可是我花時間可以讓想學的人懂。

要比抽象社會科學會比物理化學資訊這些理工科學來的抽象嗎?那為什麼這些學社會科學的人,沒辦法把他們學的東西講到讓一般人懂?究竟是沒辦法還是不想?

朋友說「以前有人做社會知識科普,馬上就會被罵『稀釋知識含量』,這會導致升等困難、找不到教職、被認為是麻煩人物喔。」

說到底,就是學界一種保護自我利益的方法吧,只是包裝的比較漂亮。這話聽起來勢必學界前輩。而且一定覺得會因此受威脅才會這樣說。因為如果不會被威脅根本不用理會啊。但如果要繼續往學界發展的年輕人,聽到前輩這樣說,想一想自己還要在這個圈子混下去,自然不得不因此放棄做社會知識普及。

我覺得很妙啦,理科的東西很多理論本身都很抽象,例如軌域、質能轉換,這是很抽象的概念,結果理工類的科普反而很多人會做,試圖用具像的方式解釋。

社會科學其實剛好相反,是把具象的人類行為進行研究後,收攏歸納後進行抽象討論。但結果他們反而沒那麼大意願去做社會科學普及。但他討論本質是建立在人類行為上,其實要具象討論反而是比較好舉例的

社會學他是要解決人的事情,所謂的制度、結構,他的本質都是架接在這些制度結構是人組成的。如果不是因為有人的存在,也不需要有制度跟結構。也就不會有社會科學存在意義跟價值。

結果你講的沒人聽的懂,這是多諷刺的事情?沒人聽的懂,所以要怎麼拿來解決人的問題?

我可以接受,因為無利可圖,所以也不想做公共溝通。但我不能接受,你好像想做公共溝通,結果在酸做的好的人,然後其實自己也做不好。以及你其實沒意願作公共溝通,然後還去酸那些做公共溝通的人。

內容農場分析

有朋友貼這個粉專:https://www.facebook.com/Playing.KIWI

我覺得很奇妙…他的粉絲數很高,可是對應每個貼文底下的分享跟讚數完全不相稱。想說來分析一下。然後發現了幾個狀況,他們臉書上貼的連結都是這兩個開頭。

連過去會發現網址會換。這兩個網址尾巴去掉,會發現是內部的轉址系統,要登入才能使用,應該是拿來轉址看數據的。這兩個網址的ip相同。查詢是 linode 放在新加坡的主機。

然後這個粉專主要連的連結有這幾個

這幾個網址有個共同特色就是都躲在 cloudflare 後面。所以查不出原始主機 ip。

看起來流量都逐月被頂上去,且數量還不錯。

這幾個站的流量來源有個共同特色,就是 Referrals 都偏高判斷應該是因為他們去外面貼連結的時候,都用「轉址服務」,所以不管原始來源從哪,都會被算去 Referrals。我猜應該還是以social + direct為主力。

 

但我覺得比較微妙的是他們自己粉絲團本身的讚跟分享是少的,那來自於social 的流量哪裡來的?我猜測是可能他們有把一樣的轉址大量貼去留言或是社團。這種就不太好抓。

然後這幾個站我以 https://thefundaily.co 當成主要網站,因為這是這個粉專主推連結比較多的站。用 ahref.com 服務去查詢有哪些外站連回此站,有興趣看細節的可以看這裡下載

下面直接寫歸納

主要提供 dofolow 連結的外站

  • candymush.com
    來自搜尋的流量很高,來自各外站的 dofollow回連分布的很平均,沒有哪個站高的特別誇張,都在100以下
  • whatsopps.com
    來自搜尋的流量很高,其次是直接。但整體流量好像不高以至於沒資料。來自各站的 dofollow 回連分布的很平均,沒有哪個站高的特別誇張,都在30以下
  • josconcept.com
    來自搜尋的流量很高,但整體流量好像不高以至於沒資料,主要是在提供連結給別人,連去 plays01.com newsancai.co imgs.cc 都破千,有10個站從此站連過去都超過500以上。他站連回來的則很少。
  • 88gag.com
    來自搜尋的流量很高,其他很低,主要是在提供外連結,連去 on.cc 東網的很多。 nextmedia.com、stheadline.com,這個感覺有同時在經營連外。
  • fundiscuss.com
    來自 josconcept.com josconcept.com dofollow的連結很多,加起來超過500,連外也很多,很多都破2千以上,連外的網站 plays01.com、nextmedia.com、on.cc這幾個都跟上面那個重複
  • yes-news.com
    外站連回的連結也很多,破千。站內連外的也很多。
  • markfruit.com 外站連回的連結只來自一個站,主要是拿來做內站連外的小站

如果肉粽抓起來應該可以畫一個彼此的內容農場連來連去的分布圖,但我很懶就算了…

上面綜合下來做一些歸類,內容農場角色分類如下:

  1. 主攻:就是主要要頂上去的站,如果不是綜合,通常站外連內會大大多於站內連外。經營方式:
    1. 社群媒體型:主要以社群媒體例如FB做導流,搜尋其次。
    2. 搜尋型:主攻搜尋引擎,FB只是拿來作為社群訊號經營,但不是主要流量來源。
  2. 經營連外站:就是要助攻的站。連外比例會很高,會連去很多主攻站,但外站連回來相對於內站連外則會少很多。以經營連外站為主的站本身流量可能都比較低。
  3. 綜合:既是主攻也經營連外。這種站的流量不一定會比主攻低。特色是外站連回或是站內連外都會很多。

在業主要暫停用 ahref.com 以前趕快寫一篇廢文紀念…

*****

後來用其他資料交叉比對後的整理出來的其他結論

  1. 最前面主要調查的這幾個網站,應該是在賺 google adsense 的廣告費的。很有趣的是人在看這些網站並不會看到廣告。但其實裡面有放,還用css把廣告隱藏。如果要給人點不會這樣設定。所以明顯是用機器人做點擊。
  2. 手法簡單來說就是自己用機器人製造假流量跟假廣告點擊,但廣告點擊次數在 google 廣告認定的正常範圍內。但如果假廣告點擊次數要多,對應的假流量也要高。
  3. Fb粉絲團簡單來說只是拿來做假流量的跳板。這樣流量來源主要來自於 social 跟 Referrals 就非常合理了。都只是流量跳板。
  4. 假流量意思就是靠別的方式弄出來的流量,不是真人點擊產生的。轉址服務也是一種矇騙流量來源的方法。特別是有轉址的話,用機器人模擬點擊比較不那麼容易被發現。
  5. 我猜他們應該有其他的FB粉專是直接貼網址,而不是貼轉址網址。這樣才可以模擬兩種不同的流量來源。但他們不敢直接點擊轉址網址怕太明顯,所以還是要把轉址網址放到FB當跳板來做點擊。
  6. 後來幾個新站,我猜是前面測試的網站吃到甜頭覺得這模式可以,就繼續用同樣的方式弄更多站起來賺廣告費。
  7. 有 dofolow 連結的外部網站跟這幾個內容農場網站應該都沒有直接的關係。只是因為農場網站本來就有很大機會互相抓資料。正好被當作標的抓而已,所以純粹巧合。