Las estimaciones de voto a partir de encuesta fallaron el 26-J. Principalmente porque no pudieron responder a dos preguntas claves sobre el resultado: la ocurrencia del sorpasso de Unidos Podemos al PSOE y el aumento de voto del PP. Los gráficos 1 y 2 muestran algunos datos sobre estos fallos. Para realizar los gráficos he seleccionado la última encuesta que realizó cada empresa demoscópica durante la campaña, además de las encuestas a pie de urna.
El gráfico 1 trata sobre el sorpasso. Como se puede ver, ninguna de las encuestas realizadas antes o el mismo día de las elecciones estimó que el porcentaje de voto al PSOE estaba por encima del de Unidos-Podemos. Esto ocurrió principalmente por que el voto a Unidos Podemos fue sobreestimado, y en menor medida, el voto al PSOE fue subestimado.
El gráfico 2 muestra la diferencia entre el porcentaje de voto al PP estimado por las encuestas y el porcentaje de voto real que obtuvo el 26-J. De nuevo existe un sesgo porque todas las encuestas, sin excepción, estimaron que el PP tenía un porcentaje de voto menor del que finalmente tuvo el 26-J.
Las encuestas se basan en muestras, y se podría argumentar que teniendo en cuenta la incertidumbre derivada de preguntar solo a una pequeña fracción de la población, tanto el sorpasso como el ascenso del PP estaban contemplados. Sobre este problema en el contexto de las encuestas del 26-J han escrito María Ramos y Kiko Llaneras. Sin embargo, aunque la incertidumbre introducida por el error muestral puede hacer variar el resultado de las estimaciones de voto, en los gráficos de arriba se observa como las diferencias son sistemáticas. En todas las encuestas se observa la misma tendencia. Por lo tanto estas estimaciones de voto están sesgadas, y la pregunta es: ¿cuál es el origen de esos sesgos?
Cambio de última hora: Una de las primeras explicaciones que han aparecido tras el día de las elecciones es la posibilidad de que el Brexit haya provocado un movimiento de votantes de última hora desde las opciones emergentes (Unidos Podemos y Cs) hacia los partidos tradicionales (PP y PSOE). Esta opción es difícil de sostener porque los mismos sesgos que hemos visto en las encuesta durante la campaña (gráficos 1 y 2), también se observan en los sondeos realizados en los últimos días (GESOP) o el mismo día de las elecciones (GAD3 y Sigma Dos).
Participación electoral: Uno de los desafíos de las encuestas electorales es estimar la participación electoral, es decir, determinar quién va a ir a votar. Este es el paso previo a la realización de la estimación de voto. Si, por ejemplo, los potenciales votantes de un partido tienden a ir a votar en mayor medida que los votantes de otras formaciones, la encuesta necesita ser ajustada. Si este ajuste no se realiza la estimación de voto estará sesgada. Una de las hipótesis que se baraja con fuerza para explicar la incapacidad de las encuestas para detectar el no-sorpasso es que se ha sobreestimado la probabilidad de acudir a las urnas de los potenciales votantes de Unidos-Podemos.
Voto oculto: Otra hipótesis tiene que ver con la no-respuesta. Aquellos que rehúsan tomar parte en las encuestas, y aquellos que participando deciden no desvelar su intención de voto, pueden tener diferentes preferencias electorales. Si los que responden son más dados a votar a un partido que los que no responden, la estimación de voto estará sesgada. En nuestro caso se trataría de si los votantes de Unidos Podemos son más dados a responder encuestas en general, y a desvelar su voto, comparado con los votantes del Partido Popular. La “cocina” de las encuestas son los ajustes que se encargan principalmente de mitigar el problema de la no-respuesta. Los cambios continuos en el comportamiento electoral en los últimos dos años han hecho especialmente difícil detectar y ajustar el sesgo de no-respuesta en las encuestas pre-electorales.
Tipo de muestreo: La clave de una encuesta es que la muestra seleccionada sea representativa de la población, por eso el tipo de muestreo es importante. Las encuestas de opinión realizadas no seleccionan a los entrevistados aleatoriamente, lo hacen utilizando cuotas, por ejemplo de sexo y edad. En este tipo de muestreo, en primer lugar se eligen números de teléfonos o domicilios de manera aleatoria, posteriormente, una vez se ha contactado con el hogar, se elige a una persona que cumpla las características de las cuotas asignadas a los entrevistadores. Tras el fallo generalizado de las encuestas para estimar el resultado de las Elecciones Generales en Reino Unido en mayo de 2015, la comisión encargada de investigarlo concluyó que uno de los principales problemas es la falta de representatividad de las muestras por cuotas. Este podría ser otro aspecto a investigar en el caso español.
Modo de administración de la encuesta: Las encuestas pueden producir diferentes estimaciones según sea telefónica, personal o por internet. En el caso de España este es un punto menor dado que la inmensa mayoría de las encuestas utilizadas son telefónicas. Un aspecto a contemplar es cómo las empresas demoscópicas tienen en cuenta el hecho de que parte de la población tiene líneas fija y móvil, otra parte solo teléfono fijo y otra solo móvil.
La pregunta y el cuestionario: Diferentes preguntas sobre el mismo aspecto pueden llevar al mismo entrevistado a diferentes respuestas. Estos efectos han sido tenidos en cuenta durante mucho tiempo, sin embargo, sigue siendo una cuestión especialmente sensible a la hora de estimar la participación en las elecciones, paso previo a la estimación de voto.
Efecto “manada”: También conocido como “herding”, se refiere a un efecto psico-sociológico por el que las organizaciones o empresas que realizan encuestas tienden a confluir en sus resultados. No se trata de ninguna conspiración. Puede pasar en la medida que una casa de encuestas realice una estimación alejada de toda la información que existe en el momento y decida replantear la metodología de la estimación para ajustar su estimación a lo que el resto está publicando.
Estas son solo algunas de las hipótesis que se pueden plantear acerca del sesgo de las encuestas pre-electorales del 26-J. La estimación de resultados electorales a partir de encuestas es una tarea compleja, hay que asumir que a veces las encuestas fallan, especialmente en contextos políticos complejos. Sin embargo, ese no es el principal problema, lo grave es que aparte de plantear algunas ideas sobre las causas de los sesgos no se desarrolla una investigación sobre por qué ha sucedido este fallo generalizado. La clave sigue estando en la transparencia en la metodología. Las encuestas no dejan de ser elementos de utilidad pública con un papel destacado en el sistema político, y por lo tanto, deberían ser tratadas con la máxima transparencia siempre que vayan total o parcialmente dirigidas a los ciudadanos en general.
El gráfico 1 trata sobre el sorpasso. Como se puede ver, ninguna de las encuestas realizadas antes o el mismo día de las elecciones estimó que el porcentaje de voto al PSOE estaba por encima del de Unidos-Podemos. Esto ocurrió principalmente por que el voto a Unidos Podemos fue sobreestimado, y en menor medida, el voto al PSOE fue subestimado.
El gráfico 2 muestra la diferencia entre el porcentaje de voto al PP estimado por las encuestas y el porcentaje de voto real que obtuvo el 26-J. De nuevo existe un sesgo porque todas las encuestas, sin excepción, estimaron que el PP tenía un porcentaje de voto menor del que finalmente tuvo el 26-J.
Las encuestas se basan en muestras, y se podría argumentar que teniendo en cuenta la incertidumbre derivada de preguntar solo a una pequeña fracción de la población, tanto el sorpasso como el ascenso del PP estaban contemplados. Sobre este problema en el contexto de las encuestas del 26-J han escrito María Ramos y Kiko Llaneras. Sin embargo, aunque la incertidumbre introducida por el error muestral puede hacer variar el resultado de las estimaciones de voto, en los gráficos de arriba se observa como las diferencias son sistemáticas. En todas las encuestas se observa la misma tendencia. Por lo tanto estas estimaciones de voto están sesgadas, y la pregunta es: ¿cuál es el origen de esos sesgos?
Cambio de última hora: Una de las primeras explicaciones que han aparecido tras el día de las elecciones es la posibilidad de que el Brexit haya provocado un movimiento de votantes de última hora desde las opciones emergentes (Unidos Podemos y Cs) hacia los partidos tradicionales (PP y PSOE). Esta opción es difícil de sostener porque los mismos sesgos que hemos visto en las encuesta durante la campaña (gráficos 1 y 2), también se observan en los sondeos realizados en los últimos días (GESOP) o el mismo día de las elecciones (GAD3 y Sigma Dos).
Participación electoral: Uno de los desafíos de las encuestas electorales es estimar la participación electoral, es decir, determinar quién va a ir a votar. Este es el paso previo a la realización de la estimación de voto. Si, por ejemplo, los potenciales votantes de un partido tienden a ir a votar en mayor medida que los votantes de otras formaciones, la encuesta necesita ser ajustada. Si este ajuste no se realiza la estimación de voto estará sesgada. Una de las hipótesis que se baraja con fuerza para explicar la incapacidad de las encuestas para detectar el no-sorpasso es que se ha sobreestimado la probabilidad de acudir a las urnas de los potenciales votantes de Unidos-Podemos.
Voto oculto: Otra hipótesis tiene que ver con la no-respuesta. Aquellos que rehúsan tomar parte en las encuestas, y aquellos que participando deciden no desvelar su intención de voto, pueden tener diferentes preferencias electorales. Si los que responden son más dados a votar a un partido que los que no responden, la estimación de voto estará sesgada. En nuestro caso se trataría de si los votantes de Unidos Podemos son más dados a responder encuestas en general, y a desvelar su voto, comparado con los votantes del Partido Popular. La “cocina” de las encuestas son los ajustes que se encargan principalmente de mitigar el problema de la no-respuesta. Los cambios continuos en el comportamiento electoral en los últimos dos años han hecho especialmente difícil detectar y ajustar el sesgo de no-respuesta en las encuestas pre-electorales.
Tipo de muestreo: La clave de una encuesta es que la muestra seleccionada sea representativa de la población, por eso el tipo de muestreo es importante. Las encuestas de opinión realizadas no seleccionan a los entrevistados aleatoriamente, lo hacen utilizando cuotas, por ejemplo de sexo y edad. En este tipo de muestreo, en primer lugar se eligen números de teléfonos o domicilios de manera aleatoria, posteriormente, una vez se ha contactado con el hogar, se elige a una persona que cumpla las características de las cuotas asignadas a los entrevistadores. Tras el fallo generalizado de las encuestas para estimar el resultado de las Elecciones Generales en Reino Unido en mayo de 2015, la comisión encargada de investigarlo concluyó que uno de los principales problemas es la falta de representatividad de las muestras por cuotas. Este podría ser otro aspecto a investigar en el caso español.
Modo de administración de la encuesta: Las encuestas pueden producir diferentes estimaciones según sea telefónica, personal o por internet. En el caso de España este es un punto menor dado que la inmensa mayoría de las encuestas utilizadas son telefónicas. Un aspecto a contemplar es cómo las empresas demoscópicas tienen en cuenta el hecho de que parte de la población tiene líneas fija y móvil, otra parte solo teléfono fijo y otra solo móvil.
La pregunta y el cuestionario: Diferentes preguntas sobre el mismo aspecto pueden llevar al mismo entrevistado a diferentes respuestas. Estos efectos han sido tenidos en cuenta durante mucho tiempo, sin embargo, sigue siendo una cuestión especialmente sensible a la hora de estimar la participación en las elecciones, paso previo a la estimación de voto.
Efecto “manada”: También conocido como “herding”, se refiere a un efecto psico-sociológico por el que las organizaciones o empresas que realizan encuestas tienden a confluir en sus resultados. No se trata de ninguna conspiración. Puede pasar en la medida que una casa de encuestas realice una estimación alejada de toda la información que existe en el momento y decida replantear la metodología de la estimación para ajustar su estimación a lo que el resto está publicando.
Estas son solo algunas de las hipótesis que se pueden plantear acerca del sesgo de las encuestas pre-electorales del 26-J. La estimación de resultados electorales a partir de encuestas es una tarea compleja, hay que asumir que a veces las encuestas fallan, especialmente en contextos políticos complejos. Sin embargo, ese no es el principal problema, lo grave es que aparte de plantear algunas ideas sobre las causas de los sesgos no se desarrolla una investigación sobre por qué ha sucedido este fallo generalizado. La clave sigue estando en la transparencia en la metodología. Las encuestas no dejan de ser elementos de utilidad pública con un papel destacado en el sistema político, y por lo tanto, deberían ser tratadas con la máxima transparencia siempre que vayan total o parcialmente dirigidas a los ciudadanos en general.