여론 조사 결과 해석하기

3월 3주차 주중에 나온 리얼미터의 정당 지지도에 대한 결과다. 이 결과를 가지고 다음과 같은 기사가 나왔다.

통합당, 민주당과 격차 5.8% 좁혀..민주당, 5주 연속 40%대 유지. 민주당, 광주·전라 및 20대에서 지지율 하락. 통합당, 서울·광주·전라 등에서 지지율 상승..20·30도 약진.

https://news.v.daum.net/v/20200319093110906

리얼미터의 조사 결과를 바탕으로 한 이 신문 기사는 결과 해석에 대해 여러가지 문제가 있다.

일단, 격차가 좁혀졌다는 문제.

해당 여론 조사는 95% 신뢰수준에서 표본오차가 +-2.5%라고 한다. 내가 이해하기로는, 신뢰수준이라고 하면 이와 같은 조사를 다시 한다면 그 만큼의 확신으로 같은 결과가 나올 것이라고 예측할 수 있다는 뜻이고, 표본오차는 결과값이 그 숫자만큼 더 나올 수도 덜 나올 수도 있다는 뜻이다.

그렇다면, 3월 3주차에 35.1%가 나온 결과는 -2.5를 한 32.6%일수도 있고, +2.5%를 한 37.6%일 수도 있다는 뜻이다. 그 전 주인 3월 2주차에 나온 결과 32.1%에 +-2.5%를 해 보면 그 범위가 29.6%에서 34.6%가 되기 때문에, 3월 2주차 결과를 최대치인 34.6%로 가정하고 3월 3주차의 최저치인 32.6%를 고려하면 지지율은 오히려 떨어진 결과로 해석할 수가 있다. 따라서 이 조사결과를 가지고 격차가 좁혀졌다고 해석하면 안된다. 이 지지율 격차는 실제로는 더 벌어진 것일 수도 있기 때문이다.

권역별 등락을 표현할 때도 크게 하락했다 또는 약진했다는 식으로 표현하면 안되는데 그 이유는 다음과 같다.

해당 조사는 표본수가 전국 성인 1,501명을 기준으로 한 것이다. 권역별로 인구비율대로 나눈다면 광주와 전라도 인구가 2020년 2월 현재 약 510만이고, 우리나라 인구가 약 5,200만이므로 약 1/10이다. 표본수가 권역별 인구로 보정되었다는 가정하에 광주, 전라 지역의 표본 수는 150명 정도가 되겠다. 표본수가 작은 곳에서 민주당, 통합당 지지도를 물으니 표본오차는 더 커질 수 밖에 없다. +-2.5의 표본오차는 전체 표본에 대한 것이지 특정 권역에 대한 것이 아니다.

해당 기사에는 없지만, 때에 따라서는 다시 권역별 연령별로 결과를 해석하기도 하는데, 이것은 앞서 말한 것과 같은 이유로 그대로 믿어서는 안된다.

예를 들어, 광주, 전라 지역의 20대 인구는 64만 6천명 (2019년 12월 5일 기준)이므로 약 13%가 된다. 표본 수 150명에 적용해 보면 20대의 총 표본 수는 크게 잡아도 20명이다.

http://kosis.kr/statHtml/statHtml.do?orgId=350&tblId=DT_35003_A304&conn_path=I2

이처럼, 특정 지역의 특정 연령대에 대한 조사값은 표본수 자체가 워낙 더 작아지기 때문에 해석에 신중을 기해야 한다.

위의 그래프는 지난 한 달 간의 주중 정당 지지율 추이를 +-2.5%를 함께 표시한 것이다. 그냥 변화가 거의 없다고 말하는 편이 옳다.

작은 변화에 의미를 부여해서 자신의 정치적 이익에 부합하는 주장을 하려고 하는 기사가 많다. 생각이 달라서 다른 주장을 할 수는 있지만 사기는 치지말자.