交流评论、关注点赞

  • Facebook Icon脸书专页
  • telegram Icon翻墙交流电报群
  • telegram Icon电报频道
  • RSS订阅禁闻RSS/FEED订阅

洪永泰:2020民进党总统初选,民调数据千万不能当真

2019年06月17日 14:51 PDF版 分享转发

首屈一指的选举预测分析专家洪永泰说, 2019年6月13日民进党部写下了史上最黑暗的一天,强行以一对一的比例合并双底册电话调查数据,目的只为了让某一个候选人在总统提名初选中获胜。

洪永泰:2020,民调数据千万不能当真!

【作者洪永泰为台湾知名的民调专家。他是美国密歇根大学统计学硕士、博士。东海大学统计学系副教授兼主任,政治大学选举研究中心主任,台湾大学政治学系教授暨台大调查研究中心主任。研究领域包括抽样调查、投票行为与选举预测、统计指标、社会科学统计方法,是台湾首屈一指的选举预测分析专家。着有《统计与生活》、《户中选样之研究》及期刊、专书论文数十篇,编有《谁会胜选?谁能当选?:预知政治版图,让民调数字告诉你》等书。】

2019年6月13日中央党部写下了台湾民调史上最黑暗的一天。

在明知母体之中住宅电话和手机的结构比例并非相等的情况下,民进党中央党部强行以一对一的比例合并双底册电话调查数据,目的只为了让某一个候选人在总统提名初选中获胜。

Ad:美好不容错过,和家人朋友一起享受愉快时光,现在就订票

台湾地区民众的电话使用行为有三种类型,第一是只用住宅电话不用手机(简称P1),第二是住宅电话和手机都用(简称P2),第三是只用手机不用住宅电话(简称P3)。根据过去的研究,这三种类型的比例大概是:P1(5~15%)、P2(50~70%)、P3(25~35%)。如果要用简单的白话文来说,就约略是10%、60%、30%。

全世界各地的双底册电话调查(dual frame telephone survey)都为了如何并档对母体进行估计投入资源进行研究,方法论和实证研究文献很多,台湾自然也不例外。大致说来,如果是要简单地以总体指标展示结果,只需要将住宅电话调查数据的P1和P2,以及手机调查资料的P2和P3,这四个部分数据取得的数据,依照估计的母体结构比例加权计算,就可以得到最后的结果。

从常识判断,大家都知道民众的电话使用行为会因为每一个人的居住地区(城乡别)、性别、年龄、教育程度、职业而有所不同。譬如说,彰化县大城乡的70岁以上女性家庭主妇,和台北市35岁以下男性计算机工程师的电话使用行为,两者之间的P1(只用住宅电话)P2(两者都用)P3(只用手机)结构比例就会有非常大的差异。所以如果需要对调查数据进行更精确的推论,就必须把双底册调查的数据根据样本的人口属性分层,然后各层之内再将住宅电话调查数据的P1和P2,以及手机调查资料的P2和P3,这四个部分的数据,依照各该层估计的母体结构比例加权计算,最后再合并成为总估计。这些步骤对一个民意调查机构而言并不难,甚至可以事先写好程序,只要数据一进来,代入统计软件,一下子就可以得到最后结果。

扭曲双底册人口结构的数据势必做出偏离真相的推论,这个初选调查真的不能当真。

民意调查教科书里最着名的两个大乌龙,一个是1936年美国总统选举「文学文摘(The Literary Digest)」以邮寄问卷调查预测罗斯福将以43%落败,其实他却是以61%狂胜。另一个是1948年总统选举,盖洛普(Gallup)预测杜鲁门以44%败选,实际上却是以50%获胜。几乎所有的民调教科书都会拿杜鲁门拿着报纸头版「杜威击败杜鲁门」的大笑照片做样版。

教科书里举的美国乌龙例子毕竟还只是选举预测而已,无伤大雅。民进党的2019年初选民调可是货真价实的总统选举提名,实质影响非同小可。这个乌龙绝对会写入台湾民调教科书,永垂不朽!

2019/06/15——原载《华人远见论坛》

喜欢、支持,请转发分享↓Follow Us 责任编辑:林远翔