從傳統媒體報多少國際新聞看台灣與中國的差異

從三分鐘開始看,年輕人很棒,裡面提到台灣媒體幾乎不報國際新聞的事。

最近做青平台認識中國的專案,陸續整理活動內容,把分享者跟諮詢顧問的內容回應一篇一篇整理起來,準備要放在網站上。

我得非常老實的說,當時提議做網站某部分是我的私心。那個私心是在整個活動中我聽到很多很關於中國經驗、中國研究的內容分享,這些內容是非常有價值的,但這些內容即使我在當下聽到了,我在事後想要重新去看卻沒辦法取用。即使我想把當時聽到的某些內容取出來寫文章,除了記憶的太片段不完整之外,也無法有來源引用加強內容的可信度。我真的很希望這些資料未來可以被取用跟再散播。所以後來在青平台努力下爭取到經費,有機會可以做成網站時,我非常樂於把這些資料整理成一篇一篇的文章,再一篇一篇的放到網站上。整理的過程,等於自己又重新看了這些人分享的內容一次,印象會更深刻。

中國言論不自由只限於政治與社會議題,在其他產業專業上有強過於台灣的深入與廣泛

然後我要說的是,這其中我印象最深刻的,是中國的「言論不自由」真的只限於政治跟某些社會議題。除此之外,他們在其他產業、專業上的內容產出跟討論,跟台灣完全是不同等級的,那個部分他們是非常自由而且可以談論得很深入的。

我記得我第一次有這樣衝擊的時候,是好幾年以前我聽從中國淘寶做使用者研究的人來台灣分享的講座。當時的我還沒有像現在投入社會運動那麼的多,但因為家庭背景的關係,本來就比較會看跟討論政治的東西。當時感觸就很深,他們在使用者研究上做的考慮的已經到了這樣的程度,一樣的思辯竟然沒有發生在政治上,總覺得有點不可思議。這至少是七八年前的事情。那次的講座聽完,我對於他們的思考可以那麼深入與進步真心感到吃驚。

在中國於一般媒體取得國際新聞的機會比在台灣容易

然後在認識中國專案的活動裡面,有台灣記者去中國新媒體工作後再回來的經驗分享。然後還有與會同組參與者分享他去中國的經驗。我突然理解到一件事情,對中共來說,你今天不可能真的完全阻斷人民談政治的這件事,那不談國內政治,談國外政治總行吧?所以在中國一般人要看到國際新聞是非常容易的一件事情,所有媒體都會播放國際新聞,當然我不否認這背後絕對有中共本身的算計。但落實到生活上,他們能在電視上看到的國際新聞的就是會比台灣人要來的多。

我還記得我那組的參與者講到這件事情的時候,他說他很喜歡在中國各種資訊很多很豐富,而且他當時去的還是三四線城市,不是沿海城市。別人問他說那你不會想翻牆看什麼嗎?他說那裡可以看的東西實在太多了,所以今天除非是偶爾追劇他才需要翻牆。

這反應什麼?因為人的注意力就是有限。當你在中國裡面已經被太豐富的資訊給佔滿的時候,而且你同時是可以得到很多國際資訊的時候。他就是會分散掉人的注意力,讓人覺得也沒有一定要特別去關注社會議題、甚至沒有一定要去談論國內政治。其他比這個事情有趣且深入的資訊很多,看那些就好啦。然後常看國際資訊也會讓人有一種滿足,確實也可以提供比較寬廣的視野(當然,只要不談論國內政治都ok),所以他們覺得台灣人眼界狹隘其實也不是沒有原因。

自由媒體環境不等於聽閱者就能取得更廣泛與深入的資訊

然後反過來看台灣,台灣是有自由的媒體環境,卻在商業掛帥的前提下,閱聽者可以拿到的選擇反而是少的。這真的是極其諷刺的事情。這個再去對照前陣子聽端傳媒分享,他們說他們服務中文世界,很多去端傳媒看國際新聞的,都是台灣人。來自香港跟中國的反而是少數。這再再都顯示台灣不是沒有人要看國際新聞,但容易取得的資源反而是相對匱乏的。

我真的很認同,今天既使我不喜歡中國,也不能用標籤化、妖魔化、膚淺化的方式去看待中國。必須要去理解他們大國在各地的巨大差異性,不管是地區環境,還是人都是如此。如果今天我們討厭有人用片段化的資訊理解議題,那就也必須用同樣的標準提醒自己,不要只用片段化的資訊理解中國。

對於某些政治菁英發言的murmur

朋友轉貼一篇文章。我指出文章內容不錯,但有一段我看了很不舒服。然後延伸出一些討論。想說整理一下。

文章裡面有一段提到「憲政制度、選舉制度與政黨體系的關係,我以為對所有參與政治、討論政治的人,都是很清楚明瞭的。

昨天我看到青年政治學者Fang-Yu Chen的文章,介紹政治學上的杜瓦傑法則,我才察覺到可能有些參與政治的人不知道這個基本原理。」

我說這段我實在是不知道寫在文章裡面幹嘛,這就是我有時候不喜歡一些學者講話調調的一種原因。他要酸黃國昌,不想講的那麼明白的話,大可以說「我以為對所有有社會科學背景且已經進入體系參與政治的人,都是很清楚明瞭的。」

他那篇提到關於政黨的基本概念其實應該要讓更多一般民眾知道。但就是一定要用這種地圖炮的說法把所有關心政治的民眾一起酸下去。他這段話放前面,就是很有效的讓人先感到不爽。

我雖然不喜歡韓國瑜,但政治社會學菁英沒察覺自己的菁英口吻讓人討厭其實問題也很大啦,他們如果溝通的是自己人,在自己的學術圈子用語要多菁英都沒差,那本來就是他們的世界。但他寫在臉書上,我想一定程度目的也是希望公開讓大家看,結果那一段我看了只覺得「喔,所以你好棒棒嗎?」

我不是學社會科學出身的,但一些談社會分析的文章,我願意看,所以我很喜歡看菜市場政治學跟法律白話文。我自認我應該還算認真的人,雖然不是本科系,有些東西即使有些專有名詞,多看幾次多配合google也是可以慢慢看懂。

以前文盲多,你可以說當時的人無法選擇不無知。

可是現在文字閱讀普及率那麼高。這些「政治菁英」「政治學者」又做了什麼讓這些人理解政治?

我知道這不是單一ngo的責任,不是單一社會科學教授的責任。但那個感覺就像上一屆立委。兵團夥伴剪過田秋堇的一個影片,在講那個時候,有個外交官是賭上自己的性命建議蔣中正改用台灣不要用中國作為國號去申請留在聯合國。然後我把影片貼去ptt,結果底下就被一些我不知道是不是歷史系但就是對那段歷史比較熟悉的人酸「怎麼連這個都不知道」。

我心裡只覺得,我又不念歷史系,國民教育又沒教過,我為什麼要知道啊?

我做網頁設計到現在已經十幾年了,大家都會上網,但我也不會理所當然覺得其他人都該懂網頁。請問你憑什麼理所當然覺得我要熟悉歷史?要說我無知不認真。可是我在我本科專業上我很認真啊。為什麼我一定要對歷史、政治學認真啊?

我講的不客氣一點。以前我在社大教網頁設計課。可以讓沒有接觸過網頁設計的人知道怎麼寫網頁,也知道網頁、主機的相關連知識。我覺得這些知識相較於社會學這門研究人類行為的學科,其實更加抽象。可是我花時間可以讓想學的人懂。

要比抽象社會科學會比物理化學資訊這些理工科學來的抽象嗎?那為什麼這些學社會科學的人,沒辦法把他們學的東西講到讓一般人懂?究竟是沒辦法還是不想?

朋友說「以前有人做社會知識科普,馬上就會被罵『稀釋知識含量』,這會導致升等困難、找不到教職、被認為是麻煩人物喔。」

說到底,就是學界一種保護自我利益的方法吧,只是包裝的比較漂亮。這話聽起來勢必學界前輩。而且一定覺得會因此受威脅才會這樣說。因為如果不會被威脅根本不用理會啊。但如果要繼續往學界發展的年輕人,聽到前輩這樣說,想一想自己還要在這個圈子混下去,自然不得不因此放棄做社會知識普及。

我覺得很妙啦,理科的東西很多理論本身都很抽象,例如軌域、質能轉換,這是很抽象的概念,結果理工類的科普反而很多人會做,試圖用具像的方式解釋。

社會科學其實剛好相反,是把具象的人類行為進行研究後,收攏歸納後進行抽象討論。但結果他們反而沒那麼大意願去做社會科學普及。但他討論本質是建立在人類行為上,其實要具象討論反而是比較好舉例的

社會學他是要解決人的事情,所謂的制度、結構,他的本質都是架接在這些制度結構是人組成的。如果不是因為有人的存在,也不需要有制度跟結構。也就不會有社會科學存在意義跟價值。

結果你講的沒人聽的懂,這是多諷刺的事情?沒人聽的懂,所以要怎麼拿來解決人的問題?

我可以接受,因為無利可圖,所以也不想做公共溝通。但我不能接受,你好像想做公共溝通,結果在酸做的好的人,然後其實自己也做不好。以及你其實沒意願作公共溝通,然後還去酸那些做公共溝通的人。

內容農場分析

有朋友貼這個粉專:https://www.facebook.com/Playing.KIWI

我覺得很奇妙…他的粉絲數很高,可是對應每個貼文底下的分享跟讚數完全不相稱。想說來分析一下。然後發現了幾個狀況,他們臉書上貼的連結都是這兩個開頭。

連過去會發現網址會換。這兩個網址尾巴去掉,會發現是內部的轉址系統,要登入才能使用,應該是拿來轉址看數據的。這兩個網址的ip相同。查詢是 linode 放在新加坡的主機。

然後這個粉專主要連的連結有這幾個

這幾個網址有個共同特色就是都躲在 cloudflare 後面。所以查不出原始主機 ip。

看起來流量都逐月被頂上去,且數量還不錯。

這幾個站的流量來源有個共同特色,就是 Referrals 都偏高判斷應該是因為他們去外面貼連結的時候,都用「轉址服務」,所以不管原始來源從哪,都會被算去 Referrals。我猜應該還是以social + direct為主力。

 

但我覺得比較微妙的是他們自己粉絲團本身的讚跟分享是少的,那來自於social 的流量哪裡來的?我猜測是可能他們有把一樣的轉址大量貼去留言或是社團。這種就不太好抓。

然後這幾個站我以 https://thefundaily.co 當成主要網站,因為這是這個粉專主推連結比較多的站。用 ahref.com 服務去查詢有哪些外站連回此站,有興趣看細節的可以看這裡下載

下面直接寫歸納

主要提供 dofolow 連結的外站

  • candymush.com
    來自搜尋的流量很高,來自各外站的 dofollow回連分布的很平均,沒有哪個站高的特別誇張,都在100以下
  • whatsopps.com
    來自搜尋的流量很高,其次是直接。但整體流量好像不高以至於沒資料。來自各站的 dofollow 回連分布的很平均,沒有哪個站高的特別誇張,都在30以下
  • josconcept.com
    來自搜尋的流量很高,但整體流量好像不高以至於沒資料,主要是在提供連結給別人,連去 plays01.com newsancai.co imgs.cc 都破千,有10個站從此站連過去都超過500以上。他站連回來的則很少。
  • 88gag.com
    來自搜尋的流量很高,其他很低,主要是在提供外連結,連去 on.cc 東網的很多。 nextmedia.com、stheadline.com,這個感覺有同時在經營連外。
  • fundiscuss.com
    來自 josconcept.com josconcept.com dofollow的連結很多,加起來超過500,連外也很多,很多都破2千以上,連外的網站 plays01.com、nextmedia.com、on.cc這幾個都跟上面那個重複
  • yes-news.com
    外站連回的連結也很多,破千。站內連外的也很多。
  • markfruit.com 外站連回的連結只來自一個站,主要是拿來做內站連外的小站

如果肉粽抓起來應該可以畫一個彼此的內容農場連來連去的分布圖,但我很懶就算了…

上面綜合下來做一些歸類,內容農場角色分類如下:

  1. 主攻:就是主要要頂上去的站,如果不是綜合,通常站外連內會大大多於站內連外。經營方式:
    1. 社群媒體型:主要以社群媒體例如FB做導流,搜尋其次。
    2. 搜尋型:主攻搜尋引擎,FB只是拿來作為社群訊號經營,但不是主要流量來源。
  2. 經營連外站:就是要助攻的站。連外比例會很高,會連去很多主攻站,但外站連回來相對於內站連外則會少很多。以經營連外站為主的站本身流量可能都比較低。
  3. 綜合:既是主攻也經營連外。這種站的流量不一定會比主攻低。特色是外站連回或是站內連外都會很多。

在業主要暫停用 ahref.com 以前趕快寫一篇廢文紀念…

*****

後來用其他資料交叉比對後的整理出來的其他結論

  1. 最前面主要調查的這幾個網站,應該是在賺 google adsense 的廣告費的。很有趣的是人在看這些網站並不會看到廣告。但其實裡面有放,還用css把廣告隱藏。如果要給人點不會這樣設定。所以明顯是用機器人做點擊。
  2. 手法簡單來說就是自己用機器人製造假流量跟假廣告點擊,但廣告點擊次數在 google 廣告認定的正常範圍內。但如果假廣告點擊次數要多,對應的假流量也要高。
  3. Fb粉絲團簡單來說只是拿來做假流量的跳板。這樣流量來源主要來自於 social 跟 Referrals 就非常合理了。都只是流量跳板。
  4. 假流量意思就是靠別的方式弄出來的流量,不是真人點擊產生的。轉址服務也是一種矇騙流量來源的方法。特別是有轉址的話,用機器人模擬點擊比較不那麼容易被發現。
  5. 我猜他們應該有其他的FB粉專是直接貼網址,而不是貼轉址網址。這樣才可以模擬兩種不同的流量來源。但他們不敢直接點擊轉址網址怕太明顯,所以還是要把轉址網址放到FB當跳板來做點擊。
  6. 後來幾個新站,我猜是前面測試的網站吃到甜頭覺得這模式可以,就繼續用同樣的方式弄更多站起來賺廣告費。
  7. 有 dofolow 連結的外部網站跟這幾個內容農場網站應該都沒有直接的關係。只是因為農場網站本來就有很大機會互相抓資料。正好被當作標的抓而已,所以純粹巧合。

關於密訊-內容農場抓肉粽

因為剛好手邊一個案子在用 https://ahrefs.com/ ,想說用這個來撈一下內容農場的關係圖好了。

本來找到的標的是「歡享網」「新政聞」 跟台灣的「密訊」,但查了一下覺得密訊的外部連結比較多,有破千,很明顯有操作,反而是歡享網跟新政聞相對少很多,只有一百多,這個量看起來他們外部其他操作是比較少的(至少在看得到的部分,私人網路line傳來傳去那種就沒辦法統計),就比較是一般的內容農場,所以就不分析了。

「密訊」網站分析

先貼一張密訊的流量分析圖

看起來有大部分流量來自FB。很少來自於搜尋。那是否代表他們沒有做搜尋優化這塊呢?

我從 https://ahrefs.com/ 下載外連資料,再手動整理統計結果。
統計表如下,這裡我只列出外連結有超過10的,前面()內的數字是聯結數量,沒超過10的自己到這裡看詳細資料,歡迎其他人拿去做更多的分析。

  • (690)https://nooho.net/
  • (53)https://www.dcard.tw/
  • (31)https://cofacts.g0v.tw/
  • (23)https://pttweb.tw/gossiping/
  • (22)https://www.mobile01.com/
  • (17)http://2016news2016.blogspot.com/
  • (17)http://cicdblue.blogspot.com/
  • (17)http://cicdview2.blogspot.com/
  • (16)https://disp.cc/
  • (14)https://pttread.com/
  • (12)https://www.ptt.cc/
  • (11) https://bullticle.com/

「密訊」網站分析結論

  1. 外連結獨立網域總計有 140 個,ahrefs有紀錄的連結數1126,可以判斷他們有在經營外連結。所以應該有在做一些網路搜尋排名優化。但做得算聰明,沒有用太多垃圾部落格或垃圾連結去堆疊。
  2. 外部連結先排除 g0v 新聞闢謠的網站,最大宗為怒吼 ,其他則是 dcard(53)、ptt衍生各種網頁版(總計65)、mobile01(22)、blogspot系列部落格(總計51)
  3. 很多只有1個連結的網站,都是在各種奇怪的論壇出現,應該是公關公司有刻意去做一些外連結置入,增加外連的網域數量。
  4. 網址尾巴為 domain-list-61 有 37 個,前面網址雖不同但網址過去畫面都一樣。這應該是有找做 seo 經營外聯的網站去搞的連結聯盟弄出來的。

我自己覺得最要注意的其實是2,代表他們至少應該有公關公司有在操作社群討論這塊去置入他們的連結。而且涵蓋台灣最常用的幾個社群平台。

然後怒吼這個站啊,就有趣了…..他反向連結有 22,621 個,比密訊1126多很多倍。但是他關鍵字排名有排上100名的,數量少於密訊(怒吼3188,密訊11439),怒吼這個站的主要作用應該就是拿來拱密訊(不排除同時拱其他內容農場網站),然後用更多內容農場網站連怒吼,來做SEO輪鍊。

但是怒吼這站的外連結太多了,我沒時間就不分析了。有興趣可以從這裡下載csv回去分析。

台灣人政黨偏好分佈:中立選民流向分析


臉書上看到這張圖,我有重新加工一下,把這幾年重大事件,總統任期、總統選舉年標注出來做個比較。

這張圖表的來源在此,想說把數字抄出來分析看看。

下面的推論前提是:選民的投票意向,一但是堅定的某個政黨時,例如國民黨,他的選票最多會流向意識形態類似的政黨,例如親民黨、新黨。或是流向中立。也就是中立是一個「停泊」的狀態。

中立可能流向藍,可能流向綠。但直接由藍流向綠的比例很低,所以先忽略。我想分析的是中立選民跟藍綠選民的流向分佈。

歷年選舉選民政黨偏好流向分析

1992~1994
中立無反應:減少9
民進黨:增加8.8
國民黨:減少5.4
新黨:增加5.6
中立選民主要流向民進黨(8.8),少部分跑去新黨(0.2)。國民黨減少的都跑去新黨(5.4)。

1994~1996
中立無反應:減少8.4
國民黨:增加3.1
民進黨:增加0.7
新黨:增加4.2
中立選民主要流向國民黨+新黨,民進黨一點點。

1996~1997
中立無反應:增加6.4
國民黨:減少7.2
民進黨:增加3.7
新黨:減少3.4
國民黨+新黨,總共減少10.6
中立選民+民進黨,總共增加10.1
國民黨跟新黨減少的流向中立,
民進黨增加的是從中立選民轉移過來的。

1997~1999
中立無反應:減少11.1
國民黨:增加8.7
民進黨:增加5.5
新黨:減少2.6
民進黨增加的是從中立選民轉移過來。
國民黨增加的是從中立選民跟新黨轉移過來的。
中立選民轉移給民進黨5.5,轉移給國民黨5.6。中立選民轉移出去藍綠,比例大概各半。

1999~2000
中立無反應:增加1.1
國民黨:減少12.5
民進黨:增加4
新黨:減少1.4
親民黨:增加9.0
親民黨增加的主要從國民黨轉移過來,
國民黨與新黨減少的,一部分轉移去中立選民。
中立選民中部分轉移給民進黨4,
但因為國民黨新黨轉移去中立選民的多一點(12.5+1.4-9=4.9)。所以中立選民略微增加。

2000~2001
中立無反應:增加1.3
國民黨:減少6.3
民進黨:減少1
新黨:減少1.5
親民黨:增加6.7
台聯:0.9
親民黨增加的主要從國民黨轉移過來,少部分新黨轉移過來,
民進黨減少的主要是跑去台聯,少數跑去中立選民。
中立選民增加的主要來自國民黨與新黨。

2001~2002
各方數據都持平,變動都在1%內,就不比較了。

2002~2004
中立無反應:減少1
國民黨:增加5.3
民進黨:減少0.8
新黨:增加0.5
親民黨:減少4.8
台聯:增加0.8
國民黨增加主要從親民黨轉移過來。
中立減少的主要流向國民黨跟新黨。
台聯增加主要來自民進黨。

2004~2006
中立無反應:減少0.6
國民黨:增加14.3
民進黨:減少6
新黨:減少0.4
親民黨:減少6.9
台聯:增加0.3
國民黨增加的14.3中,7.3應來自親民黨與新黨。多出來的主要來自中立選民。
民進黨減少的主要流向中立選民,少部分流向台聯。

2006~2007
中立無反應:增加2.4
國民黨:減少1.5
民進黨:增加1.4
新黨:不變
親民黨:減少0.9
台聯:減少1.5
中立選民增加主要來自於國民黨與親民黨。
民進黨增加主要來自於台聯。

2007~2008
中立無反應:減少4.6
國民黨:增加1.5
民進黨:增加1.1
新黨:增加0.9
親民黨:增加0.5
台聯:增加0.7
中立選民流向各政黨。

2008~2009
中立無反應:增加5
國民黨:減少1.6
民進黨:減少1.7
新黨:減少0.6
親民黨:減少0.4
台聯:減少0.7
各政黨都減少流向中間選民。幾乎是前一年增加的這一年還回去。

2009~2011
中立無反應:減少12.9
國民黨:增加5.6
民進黨:增加5.4
新黨:不變
親民黨:增加2.1
台聯:減少0.1
中立選民流向國民黨、民進黨、親民黨。

2011~2014
中立無反應:增加14.6
國民黨:減少16.6
民進黨:增加1.8
新黨:減少0.1
親民黨:減少0.6
台聯:增加0.8
中立選民主要來自國民黨,
部分中立選民流向民進黨與台聯。

2014~2015
中立無反應:減少3.8
國民黨:減少0.8
民進黨:增加4.5
新黨:減少0.2
親民黨:增加1
台聯:減少0.7
國民黨跟新黨減少的跑去親民黨,
台聯跟中立選民減少的流向民進黨。

2015~2017
中立無反應:增加7.3
國民黨:增加0.1
民進黨:減少7.5
新黨:減少0.3
親民黨:減少2.3
台聯:減少1.1
時代力量:增加3.7
民進黨親民黨流向中立選民,
台聯流向時代力量,
民進黨約2.6流向時代力量,其他流向中立選民。
親民黨流去中立選民。
所以中立選民增加的約有4.9來自民進黨,2.3來自親民黨。

2017~2018
中立無反應:增加0.6
國民黨:增加3.2
民進黨:減少3.6
新黨:不變
親民黨:減少0.4
台聯:不變
時代力量:增加0.3
親民黨流向國民黨,
中立選民約2.8流向國民黨(3.2-0.4=2.8),
民進黨主要流向中立選民。
時代力量增加的,應該是從部分民進黨與中立選民來的。

歷年選民政黨立場變化

歷年比較下來會發現幾個點

  1. 李登輝時期,遇到選舉年的時候,支持國民黨勇於表態的人會變多。
  2. 陳水扁時期,第一屆的時候政黨支持度變化很少。然後那時候國民黨跟親民黨在內戰中,但如果比照下面「中間選民 vs. 泛綠選民 vs. 泛藍選民歷屆分佈圖」看,泛藍整體選民沒有變少。
  3. 馬英九時期,第二屆選舉年的支持國民黨勇於表態的人大幅增加,總計43.7%,跟前一年比增加7.5%,是歷年最高。
  4. 國民黨支持率上下起伏震盪遠大於民進黨
  5. 陳水扁、馬英九任內的共同現象是,第一屆總統隸屬的政黨跟第二屆比,第二屆都明顯下滑。

中間選民 vs. 泛綠選民 vs. 泛藍選民歷屆分佈圖

然後根據上述資料另外畫了這張圖
泛綠包含民進黨、台聯、時代力量
泛藍包含國民黨、親民黨、新黨

可以歸納幾個點

  1. 泛綠支持者在2016年以前,整體算成長,高峰是34.2%,2016~2018年後支持者傾向不表態的,因此約10%從泛綠轉移為中間選民。
  2. 2011~2016年增加的中間選民是從泛藍的支持者跑過去的,約17%。2016~2018有3.%中間選民跑回泛藍。也就是說中間選民內大約有14%,原本投票意向是偏泛藍。
  3. 綜合第一二點,2018中間選民49.1%中,至少有14%泛藍,10%泛綠。剩下25.1%投票意向不明。

然後看下來我有個疑問,就是2011年支持泛藍的,原本在前一年屬於中間選民的7.5%的人。他們對泛藍到底有多「忠貞」?會有這個疑問的原因是這一年泛藍的支持比例是有史以來最高到達43.7%。泛藍第二高是在1996年,41.9%,多了1.8%。上述第三點的14%泛藍是包含這7.5%的。我不太確定這7.5%的投票意向能不能完全歸類到泛藍,還是要算是搖擺票?

關於下次總統選舉的幾個結論

目前整體泛藍泛綠選民分佈,泛藍還是略高。而且民進黨現在是執政黨,執政黨的特色就是一定都會被罵被當沙包打。且中間選民中,可確認的泛藍選民比泛綠選民多,如果藍綠對決,關鍵會是中間選民中25.1%的投票意向。

雖然蔡英文贏得民進黨內初選,但這不等於下次選舉就一定選得上,泛藍勢力還是很強大,而且人家錢比你多很多。我個人是支持蔡英文啦,但選舉變數很大,民進黨也沒有很穩,支持者應該要戒慎恐懼、努力拉票。

國民黨支持者挪移到中間選民,整體來說還是好事,這代表他們慢慢的不是鐵板一塊,還有半年的時間,努力跟身旁的人好好說話聊天,理解對方的想法,我們都生活在這塊島嶼上,只要想留在這塊土地上打拼的人,都是我們該努力拉到同一陣線的對象,大家一起加油吧。

從「劉曉波」看中時電子報站內搜尋禁止字

早上發了「從中時電子報(中國時報)刪除站內「六四」歷史新聞,反思新聞自由」以後,看其他人分享提到,他們在中國時報站內搜尋「劉曉波」也搜不到東西。我測試了一下確實搜不到,但用一樣方式在google輸入
劉曉波 site:https://www.chinatimes.com

找到的文章都是可以正常連過去的。這個例子正好可以拿來說明「站內搜尋搜不到不一定等於資料被刪除(或下架)」

google 有收錄,且文章連的過去,代表文章狀態是「上架」(我習慣用商品上下架來形容,有的人可能比較喜歡「公開」「私人」,簡單來說文章狀態就是一個文章要不要正式發表的開關),但站內搜尋搜不到,這代表文章存在,只是不讓你在站內用關鍵字找到。

這種「資料在但不讓你找」的狀況,在程式設計上有幾種可能的做法:

  1. 每篇文章都有一個「搜尋狀態」,分為「可搜尋」及「不可搜尋」,只要設定為「不可搜尋」,即使文章是上架狀態,也無法使用站內搜尋搜到該文章。
  2. 另外設計「黑名單」,只要被列入黑名單的「關鍵字」,一律不顯示搜尋結果。
  3. 限制可搜尋的資料日期範圍,例如最多可搜尋最近6個月,或是最多可搜尋2017年ˇ以後的文章。

第一個做法的好處是可以人工審核哪些一定不能搜到,哪些可以放掉。第二個做法是對於想要排除字詞來說,設定上比較快速。第三種做法常見於網路銀行搜尋個人帳目資料、以及網路購物網站搜尋個人訂單,主要用來限制 end user 最多只能找什麼時間範圍內的資料,在資料量破表大的網站中,這種做法可以透過縮小資料庫的可搜範圍,降低資料庫的負荷,但資料本身都是還在不會被刪除。一般新聞網站如果使用三的方法,大抵是因為他們把更舊的新聞資料拿來賣,必須要付費才能查詢。例如 udn 新聞就是。

我不知道中時電子報用哪一種做法,不過如果是特定關鍵字全部資料都找不到的狀況下,大多會使用「黑名單」的方式來做。而不管用一、或是用二,基本上就是針對搜尋結果作過濾屏蔽,但不等於原始資料被刪除或下架。所以在中時電子報網站上,「劉曉波」搜不到東西,跟「六四」搜不到東西,對使用者來說結果一樣,但是在資料是否存在上是不同的兩件事。

你可能會說,幹嘛設計那麼複雜,要上架的內容為什麼不給人搜呢?除了前面提到「把更舊的新聞資料拿來賣,必須要付費才能查詢。」,我用相簿服務作為例子,有的平台有提供相簿服務,也提供站內相簿搜尋。只要這種可以上傳圖片的平台,就會有人上傳色情圖片。色情圖片理論上平台可能會被要求掃蕩,但色情圖片往往又是大宗流量來源,那怎麼辦呢?資料留著,但是特定關鍵字不給搜,兩全其美。資料可不可站內搜尋說穿了就是反應平台商業經營的各種考量而已,跟資料是否要公開是分開思考的。

而我比較疑惑的是我不太懂為什麼中時電子報要把「劉曉波」的站內搜尋結果屏蔽掉,但這很顯然有特別人指示,才會做這件事情吧。那為什麼那麼巧搜不到的都跟中共敏感詞彙有關呢?

我已經不知道能用什麼形容中時電子報的這種自我墮落了,一個在台灣的媒體,這樣自我閹割新聞自由、自我言論審查,真的很悲哀。

從中時電子報(中國時報)刪除站內「六四」歷史新聞,反思新聞自由

我先是在臉書上看到這個消息,想說查證一下,結果發現真的是刪掉了。這件事我覺得是台灣這個有民主法治的社會中,一件很諷刺、很悲哀、但也應該被記錄的事情。所以寫了這篇文。

事情的開始是這樣,我看朋友分享了這個臉書粉專貼文,原文在這:https://www.facebook.com/312238709415165/photos/a.312248932747476/369642953674740/?type=3&theater

01-中時電子報刪除站內「六四」歷史新聞

台灣媒體中時電子報自行刪除六四文章,可能嗎?

但是因為他是使用「站內搜尋」。我們在做網站的時候,站內搜尋其實是可以做到針對特定條件作屏蔽,例如針對特定字詞,或是針對日期,讓你不能搜到某些字詞的內容,或是只能搜到某個日期之後的文章。這在站內搜尋技術上都是做得到的。(對設計原理有興趣的可以看這篇「從「劉曉波」看中時電子報站內搜尋禁止字」)

也就是說資料搜不到也許不見得被刪掉了,但是你用站內搜尋找不到。雖然我不喜歡中國時報,但以我一開始並不想那麼鐵口直斷說他們真的把資料刪光了。

那要怎麼確認他們真的把資料刪掉了呢?還好,因為中時電子報是一個新聞網站,每天會產出大量的內容, google 對這類網站的內容收錄是非常友好的,針對新聞類型的網站 google bot 每天都會很勤勞的去爬他們他們的網站內容,看有什麼新的內容產出,並且很快地收錄到 google 索引內,並正式放到 google 搜尋結果資料庫內,所以一般人可以很快的可以透過 google 搜尋到這些資料。

google 也有提供「在google  已經納入索引的資料中,只針對某一個特定網站,搜尋這個網站內有某個關鍵字的網頁」的搜尋語法,所以我先打了這個
天安門 site:https://www.chinatimes.com/
搜尋結果如下

02-中時電子報刪除站內「六四」歷史新聞

點了第一筆:「六四天安門事件」他肉身擋坦克!27年後如今
網站顯示404錯誤畫面

03-中時電子報刪除站內「六四」歷史新聞

點了第二筆:天安門城樓拉皮迎陸建國70年
網站顯示正常

然後我再往下滑,點了:現場側寫-天安門升旗、六四天安門事件大事紀
網站顯示404錯誤畫面

我選了第二頁,點了:北京天安門城樓15日起修繕關閉至明年4月
網站顯示正常

所以顯然如果只是搜「天安門」,有的新聞被刪除了,有的還在。所以應該不是針對「天安門」這個字詞作過濾。

那如果改搜六四呢?
六四 site:https://www.chinatimes.com/

04-中時電子報刪除站內「六四」歷史新聞

在第一頁搜尋結果中,除了「六四新聞- 中時電子報- Chinatimes.com」可以點選外,其他結果都是404錯誤畫面。

但是「六四新聞- 中時電子報- Chinatimes.com」點進去看到的結果,會發現裡面完全沒有我們要找的那個「六四天安門」事件的新聞。

05-中時電子報刪除站內「六四」歷史新聞

在第二、三頁搜尋結果中,所有單篇連結點過去都是404
而「六四天安門事件的懶人包@ 不可不讀- 中時電子報」點進去看的結果空空如也

06-中時電子報刪除站內「六四」歷史新聞

檢查到這裡差不多可以確定,中時電子報確實把自己網站上,標題跟內文有「六四」的文章都刪掉了(或是換個說法,至少是被下架掉)。

針對上述404的內容,我趁google還有庫存頁面的狀況下,先把搜尋結果,與已經404的庫存頁面畫面擷取下來放雲端(見:中時電子報搜尋結果與庫存頁面截圖)。因為現在不截圖,過一陣子google 就會因為這些頁面已經變成 404 ,進一步將這些資料從 google 的搜尋資料庫清除了(有興趣的人,可以繼續看搜尋結果五、六以及更之後的,會發現有的文章只剩下「索引結果」,但是「庫存頁面」已經沒了,這就是 google 正在陸續整理中時電子報的 404 頁面)。然後這件事就不會再有人知道曾經發生過。

搜尋結果的部分,除了「全部」,「圖片」「新聞」「影片」也有同樣的狀況。google收錄的暫存檔還存在,但是點過去會發現都404了。

然後針對「新聞」的部分,會發現幾個現象

從上述觀察可以歸納幾個

  • 刪除「六四」文章不是純粹用資料庫搜「六四」就全部刪掉,因為這樣可能很多財經文章提到這個數字都會一起死
  • 刪除「六四」的文章,內容必然經過一定程度的人工審核。不然無法解釋同樣標題都沒有「六四」,但內文有提到「六四」,有的內容是政治人物說話,其中一段在說六四,卻沒有刪掉。而有的只是略為提及他在六四裡面的角色,根本沒有對六四著墨太多,卻被刪了。

中時電子報何時刪除站內「六四」文章?

接下來我想知道的是:「中國時報是什麼時候刪除這些資料的?」,雖然沒有辦法找到明確的時間,但可以從 google 有庫存頁面的網頁,以及我當初看到發現這個狀況的粉專貼文做推敲。

寫「搜尋六四」找不到相關事件的貼文,該文章發表時間是 6/11 下午6:56 ,所以顯然中國時報是在這時間前就把資料都刪掉了。

07-中時電子報刪除站內「六四」歷史新聞

然後針對在 google 的搜尋結果,最新收錄中時電子報網站中,跟「六四」有關的一則,是兩天前的「星期評論薛中鼎》三十年後看六四」(截圖看這

08-中時電子報刪除站內「六四」歷史新聞

google 快照時間是 2019年6月9日 20:13:43 GMT 。而網頁上顯示的發文時間是「01:16 2019/06/10」,代表該網頁至少在 2019/06/10 凌晨 01:16 有重新修改發布。所以可以推測中時電子報「動刀」的時間是落在 2019/06/10 凌晨 01:16 到 6/11 下午6:56 間。

這兩天發生什麼事,讓中時要把六四的文章刪掉?我不知道,我初步只想到前幾天看到 ptt 這篇爆卦「 [爆卦] 中國網路城牆封鎖新增台媒:中國時報 」,兩者之間是否有什麼因果關係?不得而知。但在這篇文章中提到有篇標題為「要求撤回修法港辦反送中大遊行」的新聞被刪除了,我 google 了一下,確實點過去 404。但這篇文章本身沒有「六四」,根據 google 庫存頁面,該文章發表時間是 04:10 2019/06/10,這篇新聞也有轉貼去 yahoo 新聞,那裡的po文時間是 2019年6月10日 上午5:50

但這件事也讓我想到更早的時候看到的這則消息「【百度貼吧衰亡史】百度貼吧清空2017年以前內容,中國網民15年的歷史一夜消失

中國的網站把過去的資料刪掉,我相信其中應該有中共政府人治做言論管制的痕跡,數位資產就這樣消失,雖然覺得遺憾,但並不意外。而台灣雖然邁向民主法治,公民運動蓬勃發展。但顯然台灣有些媒體並不珍惜在這個民主法治社會下,才能擁有的新聞自由與言論自由。所以媒體可以自我閹割,中時電子報願意自己把自己網站上關於「六四」的所有新聞、輿論、評論文章甚是書評全部刪光光。

擁有新聞自由、言論自由,不等於懂得珍惜這些自由

如果以為有新聞自由、言論自由,就代表擁有「資訊自由」,擁有「知的權利」,看看中時電子報所做的。我們以為我們有資訊自由,但其實並沒有。因為實際上是媒體想給你什麼,你才看得到什麼。問問我們自己,台灣的媒體,報導的國際新聞多嗎?報導的國際新聞我們又看了多少呢?會不會,我們只是表面上擁有新聞自由言論自由,但我們從來沒有去正視與珍惜過?而台灣的自由,真的能夠讓我們繼續這樣揮霍下去嗎?

對照香港現在正在發生的反送中遊行,看看台灣媒體是怎麼報導這些內容的,台灣人想要怎樣的未來?這個問題,真的需要我們一起好好的思考。

看台鐵環島之星升級新聞有感

看到這則新聞:直擊/耗費7900萬!升級版環島之星「超蝦趴」登場 有景觀迴轉椅、卡拉ok室

然後不管是臉書,或是新聞下的留言,很多人在批評美感,不過我覺得以台鐵的內部狀態,坦白說這件事應該要給他們一些鼓勵。

環島之星我之前跟爸媽去搭過,目前還是委託易遊網經營,需要買他們旅遊套票才能搭。個人覺得搭乘的整體體驗其實還不錯。是不美,但搭起來是舒服的。我也覺得不美,也覺得有改善空間。但也許當你要去環島旅遊,同時考量費用跟舒適度的時候,它其實還算可以稱的上是一個不錯的選擇。

然後認真說,搭車的時候,我注意比較多其實是椅子舒不舒服,他們椅子確實比一般自強號車廂的椅子更舒適,還有在景觀車窗邊看風景邊吃便當的感覺很好有人說卡啦ok點歌本很老舊。問題你不會去搭,對會搭的,其實那樣很足夠了。

車廂內不美在整個體驗中反而是最小的事。因為你在車上要嘛睡覺,要嘛看報紙,要嘛看風景,要嘛聊天。你不會一直盯著車廂看。

我真的覺得很多東西表面看跟進去體驗是兩件事。

當然我不否認,跟日本比,或跟其他國家比,大家會覺得花了錢「才這樣」,因為有失望感才會批評。那些批評都不是無的放矢,但真要說,那些批評其實也對提升觀光產業有任何的作用。真的出去玩,去搭車,搭車後反應可以改善的要點,更多人都這樣做,他們才會有動力覺得自己要改。

新媒體的困境

今天跟朋友捷運上小聊,朋友提到現在大家對媒體的信任度,是新媒體高過於傳統媒體。這讓我想到之前跟別的朋友聊過新媒體的困境。

先想一個問題,「媒體」本身是可以賺錢的行業嗎?

如果去看所謂傳統媒體,其實你會發現那些媒體背後的資本家,他手上不是只有在經營媒體,是同時會經營其他主業。自由時報林榮三就是一個很鮮明的例子。自由時報本身賠錢,但林榮三靠的是房地產。媒體只是他整體事業戰略佈局的一個棋子,賠錢根本沒關係。

又例如三立新聞,背後其實是一整個事業體。本業是做錄影帶節目起家,創辦人後來也是去投資土地跟不動產。走的是多元系統台的經營,所以他們的戲劇也有對海外輸出,不是只有做「新聞類」的媒體。

可是當「新媒體」是直接把「新聞類媒體」這件事獨立出來的時候,最大的問題就是媒體本身變現困難。傳統媒體的「商業模式」是賣廣告,但那是因為電視頻道數量相對還是「有限」,加上站到早期入場時間的利基點,還有內容的多元性,觸及的群眾階層夠廣,所以即使到今天還有吃老本的本錢,這老本即使在不斷的衰退,但目前看還是可以撐個好幾年,也就代表傳統媒體在這好幾年還是會有一定程度的影響力。

可是「新媒體」說多元不夠多元,又不像傳統媒體是資本方事業戰略佈局的一部分。網路廣告又無法像電視廣告那樣做到稱得起損益打平,所以勢必要走多元收入。但是本身內容就很難多元了要怎麼走多元收入?結果到後來大家都只好去寫政府案子爭取政府補助經費。

大家對新媒體的信任度高於傳統舊媒體,意義上代表在職業層面來說做「資訊記者」變成是一種職業選擇,未來這部分應該只會更蓬勃的發展。但我對獨立型的小型新媒體能夠活多久這件事是相對悲觀的,到最後可以活下去的,大概還是得有更大的資本家因為戰略需求而合併的那些才能長久經營。

選舉網路聲量操作:特定關鍵字搜尋量操作可以達成哪些目的?

前面已經寫了很多篇關於搜尋量趨勢異常跟實際搜尋量級的異常。看完很多人的疑問是:所以操作關鍵字搜尋量到底可以幹嘛?

我自己本身之前是做網路行銷,比較偏向網站SEO操作多一點。所以我主要會從SEO的角度來看這件事。不過後面也會提供就我所知搜爬可以做的應用,串起來的可能性給大家參考。

先從SEO的角度來看,用比較簡單的一句話大概就是:透過搜尋量加上其他操作,決定你搜尋某些關鍵字時可以看到的資訊。

有人會反駁,他搜韓國瑜看到的資訊有好有壞,農場文也根本沒有排在前面,所以我這樣的假設不成立。但會有這樣的看法其實是對 SEO 有幾個誤解:

  1. 操作訊息排名一定是把「有利自己的資訊」給大家看得推到前面
  2. 操作搜尋排名等於要把農場文推到前面

但其實操作SEO有正向操作,跟反向操作。正向操作比較直覺,就是把希望大家看的資訊推到前面。例如我經營電商,那我就會希望大家搜尋某些產品關鍵字的時候,我的電商網站可以排名前面一點,使用者就比較有機會在我網站下單,進而得到商業利益。

那反向操作呢?反向操作就我所知至少有幾種:

  1. 用作弊操作的方式讓別人排名前面的網頁變成黑名單
  2. 把負面評價的網頁排名往後洗,讓別人看不到

而其實要做反向操作要用到的搜尋量跟整體投入資源要比正向操作多很多。

以1來說,就是用不正當的搜尋排名操作方式,讓google認為有不正當且明顯的人力介入,進而把網站 ban 掉。

以2來說,舉公投的例子,當搜尋公投排名前面都是愛家公投的資訊比較多的時候,人的決策行為其實很容易受到自己對這個資訊的第一印象所影響,那當看到愛家公投的資訊比較多,以一個對這個議題本身還沒有太多看法只是好奇的人來說,就有可能影響他對這個議題的看法走向。另外如果翻了兩三四頁都看不到其他差異比較大的資料,也會營造出「那應該大部分的人都這樣想這樣看這件事」的印象。

再舉韓國瑜為例子,因為媒體已經配合產出大量的內容,所以農場文只是用來做輪轉式網站SEO操作用,本身的排名不重要,他只是拿來助攻用。而新聞內容不一定要是加分,只要是只是在操作印象,而不是進一步要引導聽閱者思考或質疑的內容,都可以讓這些內容盡量都排名在前面。這樣就可以把一些比較有內容的分析文章往後擠。

於是當有人在line群這類封閉群組傳送的訊息,有人希望可以針對資料做一些基本查證的時候,會因為不容易找到相關資訊就放棄繼續查證或協助澄清。即使有人想要找資料也很難找,也會比較容易被容易找到的資訊影響決策。

另外,從會影響搜尋熱度的行為來看,會影響搜尋熱度的來源大致有兩個

  1. 真人的搜尋行為
  2. 機器的搜尋行為

2常見於網頁內容爬蟲的應用上。而跟搜尋行為有關的商業應用至少就有這幾項

  1. 搜尋結果網頁排名
  2. youtube影片排名
  3. 資料蒐集
  4. 情資分析
  5. 自動下注

所以如果先以直線思考來看,理論上可以做到類似這樣的影響

之前其實就聽過實體賭盤對投票意願的影響,所以透過影響賭盤來影響選舉也不無可能,不過這部分純粹是我從搜爬應用推斷的一種可能性。

當然,我必須承認操作搜尋量的實際影響其實很「幽微」,他要搭配的是一連串使用者「為什麼要做關鍵字搜尋 / 搜尋後可能影響到哪些行為」一起做考量。但搜尋量異常是事實(相關分析與數據請見「選舉觀察part6:「韓國瑜」與其他候選人搜尋行為差異比較與搜尋量解析」「實際月搜尋量及數據整理」),我認為這次大力介入網路的人,他們是在測試練兵,同時也在這個過程建立網路影響行為的關聯性調查。

我為什麼敢做這樣的推論呢?因為中國目前針對網站使用者行為調查比台灣成熟很多。以掏寶為例子,他們是有專門使用者行為調研的部門,在每次細節改版調整的時候收集數據分析影響轉單率多少,他們的使用者行為調查是做得很細的。「實驗」的說法不是無中生有,因為他們在商業上都已經在這樣做了,用在政治上只是小菜一碟而已。