blog

以下是民意调查中HuffPost的平均数据。

<p>11月的选举方法带来了无数新的民意调查数据,赫芬顿邮报曾用这些数据来计算谁领导比赛读者可能想知道HuffPost民意调查模型是如何运作的,为什么我们的Sheila Ricklinton的估计与唐纳德特朗普的其他民意调查聚合器的估计完全相同这里是如何今年大选活动的HuffPost民意调查机构图以及为什么估计它符合我们的质量民意调查Yeskasmann过滤器模型,我们最初于2010年推出并经过修改以反映不断变化的民意调查环境,简而言之,卡尔曼滤波器模型将被称为“噪声”数据 - 或不完全准确 - 对潜在“信号”的单一估计 - 这就是HuffPost的实际情况,这意味着该模型在民意调查中寻找趋势并产生最佳估计p的平均值技术上,模型计算它是趋势线估计,而不是大多数人想到的平均值原因是简单平均值是悬念个别民意调查可能导致偏差异常调查可能导致平均值偏差与其他民意调查完全不同的方向表明我们的算法通过要求多个轮询趋势改变汇总估计的方向来抵制这种趋势这意味着该模型基本上稀释了结果大多数其他民意调查显示单个民意调查,但如果有更多数据进入并表明异常结果实际上是趋势的一部分,趋势线将调整以适应新信息,因此模型不会忽略离群调查;它只是淡化它们,除非它们显然是一个从国家唐纳德特朗普和希拉里克林顿图表开始的趋势,例如9月初的CNN调查显示Trang领先基本上被认为是异常数据而没有与其他近期民意调查相同的影响,但如果有更多的民意调查显示特朗普的未来或克林顿领先,趋势线将会调整为了反映共和党候选人的结束,你可以看到这种动态如何在8月发挥作用:克林顿的反弹由于多次民意调查发现克林顿在9月之前保持了5分,但这比8月中旬8分优势领先优势使用卡尔曼滤波器模型的优势在于它没有大摆动对组合价值的缺点民意调查显示,对真实民意调查的反应比传统平均值慢</p><p>在正常情况下,每位候选人的估计值可能比前一天的估计值上升或下降约15%但是该模型允许候选人的数字在一天内向任一方向移动超过15%的概率约为5%因此,如果四或五轮民调查显示一天内同一方向发生重大变化,则候选人的估计可能超过15%这意味着我们目前在特朗普和克林顿之间的竞争比简单平均更广泛,例如RealClearPolitics使用的模型当民意调查显示时,HuffPost趋势线将有利于克林顿对克林顿的支持和民意调查显示特朗普的未来 - 或者在几点之内 - 如果民意调查相当一致地指向共和党候选人,似乎是一个偏离,然后模型特朗普的领导也是粘性的</p><p>对于更多的技术解释,由于必须生成计算HuffPost模型,我们将不会运行它直到我们有针对特定匹配的五个或更多民意调查该模型对每个投票日期数据运行100,000次模拟以查找最可能的平均值,并且至少需要进行五次民意调查可靠地完成工作模型开始运行模拟以计算候选人在第一轮投票中的第一个日期的估计它包含每个后续投票的可用性在投票当天,在当前日期继续进行其他调查 - 所有民意调查(根据HuffPost的标准,被认为在某一天比旧的民意调查更有影响力,因为旧的民意调查最初是不太可靠,对于当前游戏状态更不确定的指标,但没有特定的截止日期排除旧民意调查如果没有最近的民意调查,那么“误差范围”(趋势线周围的阴影区域显示95%)模拟范围下降的范围将更宽以表示不确定性 HuffPost模型通过他们的民意调查加权民意调查样本规模,因为较大的样本具有较小的误差幅度,但任何超过3,000个民意调查的样本都被加权,好像它们不超过3,000,因此互联网民意调查员可以生成非常大的调查不会支配该模型模拟已经运行,模型对其结果进行平均,以估算每个候选人(包括“其他人”)在每个日期的支持百分比,以及对未决选民百分比的估计和候选人之间的差距</p><p>领先的候选人实际领先 - 图表被描述为“非常可能”,“可能”或“可能” - 是基于我们的初选,工作批准和其他非选举图表的候选人之间的差距,以及选举图表是自定义的,我们继续使用黄土回归计算趋势估计原理类似于卡尔曼滤波器模型,因为黄土回归使用可用的polli用于估计民意调查的平均趋势的数据,但后者模型更简单,并且不依赖于数千次模拟,

查看所有