許多人懷疑當前坊間民調作假,根據長期檢定,常見的9家民調,有6家並沒有作假,但今年起因應手機流行、年輕受訪者偏少,加入想當然耳的手機民調、與年齡加權,這兩種直覺的處理,其實違反科學原理,反而會擴大誤差。而長期一面倒的錯誤民調,則可能導致不投票,影響選舉勝負。

坊間民調習慣宣稱「誤差為正負3%」,但以2018選舉的43個封關預測為例,沒有任何一個民調的主要候選人真實得票率都符合宣稱。有37個民調,即86%的民調與至少一位主要候選人的誤差在10%以上,亦即並無可參考價值。各坊間民調公司,都綁在同一套調查系統上,使用相同的工具,必然出現共同的錯誤。

為何由少數樣本可以猜出全體?必須「過5關」與符合200項條件。第一關就是抽樣必須達成「隨機性」。隨機性的中譯一詞非常難懂,易被誤解。「隨機性」的真正意義是「等機率性」,亦即母群中每一個樣本都有相同的機率被抽中。

在實務上有2大條件,第一、要取得完整的「母群清冊」,每一個樣本都在清冊之中,才有被抽中的平均機會。第二、樣本選定之後不能更換,替換樣本就改變了受訪機率。當前第一輪訪問能夠找到受訪者,通常低於20%,現今坊間民調的標準作法,是開始就抽出11倍樣本以供替換。宣稱「有效樣本」為1000個,實際上是在11000個樣本中,只找到了1000個,等機率程度只有9%。

民調業界的高替換率是個長久的事實,但從未被揭露、報導過。民調宣稱隨機,實為隨便,全部未滿足隨機性。市話的實體清冊有困難,還可以使用「隨機數技術」設計虛擬母群清冊。而當前對手機並無法設計完整虛擬清冊,手機號碼無論是自己收集的、買來的、或是加了隨機碼,都是不完整的。

而政黨委託的民調,經常是由政黨提供手機號碼,其間可以「處理」的空間就非常大了。加入手機號碼,直覺上是想接觸手機使用者,但事實上是降低「隨機性/等機率性」,一定會更擴大誤差。對年輕受訪者加權的直覺原因是,中外民調都有「在家男性偏少、年輕人偏少」的現象。所以就將樣本的性別、年齡,依據普查資料加權。

但長期研究顯示,年輕人投票的比例本來就比較低,而去投票的通常意識型態比較鮮明、政治態度積極度超過同儕。即願意回答選舉民調的是年輕人的少數,但經過加權後,他們變成虛胖的多數,更提高了年齡層的影響力,造成巨大的扭曲。

檢驗某案例,甲候選人事實勝選乙候選人3%以上,但坊間民調加權後,甲反以45.17:54.83,大幅落後乙近10%。以上總誤差有可能超過10%、甚至20%。選民中有15%的「輕泛藍」會因競爭差距大而放棄投票,所以長期一面倒的錯誤民調,易導致不投票,而有利於綠營。

(作者為退休大學教師)

#民調