생활지식창고

반응형

여러가지 이유가 있지만, 표본집단의 대표성 문제 때문에 여론 조사 결과와 실제 결과가 상당히 다를 수 있다는 것이 제 추측입니다.
표본집단의 대표성 문제에 대해 오늘 중앙일보에서 난 기사를 가지고 설명을 하도록 하겠습니다.
해당 글의 원문은 아래에 링크를 걸어 둘 테니 제 포스팅을 보시고 기사를 보시면 더 잘 이해가 될 것입니다.
여론 조사를 하기 위해서 가장 중요한 것은 모집단을 완벽하게 대표할 수 있는 표본집단을 구성하는 것입니다.
예를 들어 지역구 유권자가 15만명이라면 이 모집단 특성을 모두 갖춘 500명의 대표를 뽑은 것이 표본집단입니다.
여기서 특성은 연령, 성별, 나이, 직업 등 다양한 생물학적, 사회적 특성을 의미합니다.

 


만약 15만명 중 50대가 3만명이라면, 500명의 표본집단(여론조사 대상)에도 이 비율 만큼의 50대가 포함되어야 합니다. 따라서, 여론조사에 20%, 즉 100명의 50대가 참여하여야 이 표본이 모집단을 제대로 반영한 것이 됩니다
우리 나라 선거법은 이런 인구통계학적 요소를 반영한 표본집단을 사전에 확정하고 여론조사를 하도록 규정하고 있습니다.
그런데 이 표본집단의 대표성에서 문제가 되는 것이 "평소의 정당지지도" 입니다.
전체 모집단이 어떤 정당지지도를 가지고 있는 지는 전체 모집단을 대상으로 전수 조사를 하기 전에는 알 수가 없습니다. 또한 정당에 대한 지지라는 것은 하루 아침에도 바뀔 수 있는 부분이기 때문에 이를 사전에 확정한다는 것은 불가능합니다.

 


바로 이 부분 때문에 여론조사의 편향성 시비가 생깁니다. 여당 지지자는 여당지지자 대로 여론조사 기관을 비난하고, 야당 지지자는 야당 지지자 대로 여론조사가 엉터리라고 주장합니다.
보다 자세한 설명을 위해 광진구 을 지역구의 20대 총선 결과와 이번 중앙일보 3차 여론조사 결과 발표를 가지고 설명하겠습니다.
먼저 20대 총선 당시 광진구 을 지역구의 선거 결과 입니다

 

20대 총선 당시 추미애 의원은 전체 91,613 표 중 무효표 994 표를 제외한 90,619 표 중 53,980 표를 얻어 당선되었습니다. 이는 전체 유권자 수 153,250명을 기준으로 하면 28.7%에 해당합니다.
다음은 오늘 중앙일보에 게재된 광진구 을 지역의 여론조사 결과 입니다

 

.

 

.
 
 
 

 

 

중앙일보는 3차례에 걸쳐 여론조사를 실시하였는데 마지막 3차 여론조사에 응답한 응답자 중에서 20대 총선 당시 추미애 의원에 투표하였다고 대답한 사람의 비율이 48.7% 입니다.
반면에 정준길 후보를 지지하였다고 답한 사람의 비율은 14.6% 로 실제 정준길 후보에게 투표하였던 유권자 비율 22% 보다 많이 낮게 나타났습니다.


즉, 20대 총선에서 추미애 의원에 투표한 계층이 이번 여론조사에 훨씬 적극적으로 참여한 반면, 정준길 후보에 투표한 유권자 계층은 덜 참여하였다는 말이 됩니다.
선거 여론을 보다 정확하게 파악하기 위해서는 표본집단 500명 중 추미애 후보를 지지한 사람이 28.7%, 즉 143명이 포함되고, 정준길 후보를 지지한 사람이 110명 포함되어야 바람직한데, 실제 설문에 응답한 사람은 추미애 후보를 지지한 사람이 243~4명, 정준길 후보를 지지한 사람이 73~4명이기 때문에 중앙일보 여론조사의 표본집단이 민주당 쪽으로 우호적으로 구성되었을 가능성이 존재한다는 의미가 되겠습니다.
하지만, 이런 부분은 여론조사기관이 어떻게 할 수 있는 부분이 아니기 때문에 이를 여론조사 기관의 조작으로 몰고 가는 것은 바람직하지 않습니다.

 

.

 
 


이런 부분은 여론조사 결과를 보는 사람이 자체적으로 보정을 해 가며 볼 수 밖에 없다는 것이 필자의 생각입니다. 다만, 현실적으로는 이번 중앙일보 여론 조사와 달리 여론조사 결과 발표에 응답자의 과거 선거 이력을 넣어서 발표하는 곳은 잘 없습니다. 오히려 이 부분이 더 문제라고 할 수 있습니다.
이런 현상은 단지 광진구에서만 일어나는 것은 아니고 전국적으로 동일하게 발생하는 것 같습니다. 과거 20대 총선 여론조사와 결과를 보면 비단 이번 총선에서만 발생하는 문제인 것도 아닌 것 같습니다.
결론은 현재 여론조사에는 일정 부분 표본집단의 편향 문제가 있을 수 있기 때문에, 제가 포스팅하는 것과 같은 압도적인 차이는 발생하지 않을 것입니다.
그럼에도 제가 여론조사 결과를 요약할 때 이런 부분을 반영하지 않는 것은 객관적으로 공표된 데이터에 제 주관을 개입시키지 않기 때문입니다.
제 주관을 기초한 전체적인 판세 분석은 이번 주말 경에 포스팅할 예정이니 많은 관심 부탁 드립니다.

 

반응형

이 글을 공유합시다

facebook twitter googleplus kakaoTalk kakaostory naver band