2019-10-16 02:10 (수)
[(주)그릿펀딩 박범석 대표 칼럼] P2P와 통계의 오인
상태바
[(주)그릿펀딩 박범석 대표 칼럼] P2P와 통계의 오인
  • 이수현 기자
  • 승인 2019.08.09 20:51
  • 댓글 0
이 기사를 공유합니다

부동산학 박사 (주)그릿펀딩 박범석대표
부동산학 박사 (주)그릿펀딩 박범석대표

2019. 6. 23일자 세계일보에 “통계 체계 바꾸자 갑자기 좋아진 ‘삶의 질’”이라는 기사가 실렸다. 기사 골자는 통계청이 2018년 국민의 삶 측정지표 개편 후 올해 71개 지표 중 54개 좋아진 것으로 나타나, 개선율이 줄곧 50%대서 76%로 상승하였으며, 지니계수 등 단골 ‘악화’ 지표를 대거 삭제하여 ‘정책 맞춤통계’ 라는 지적이 있는 내용이었다.

이 기사와 같이 국가기관인 통계청 발표조차도, 통계 신뢰성에 대한 이견을 제기하기도 한다. 일반적으로 통계자료를 접하면 통계 결과치에 주목하고, 표본설정, 조사 및 처리방법, 결과해석에 대해서는 알고자하지 않는다. 물론 그에 대한 정보도 제한적이기는 하지만 통계 한계에 대한 명확한 이해 없이 결과를 맹신하는 경우가 많다. 그렇다면 우리가 일상적으로 접하게 되는 수많은 통계자료 오인을 피하는 방법은 없을까? 자! 통계자료 오인을 피하기 위한 몇 가지 열쇠를 살펴보자.

첫째, 누가 발표했는가? 출처를 확인하여야 한다.

발표자에게 유리한 통계결과를 도출하기 위해 데이터, 측정단위, 기준연도 적용 등에서 왜곡 가능성을 염두에 두어야 한다. 특히 ‘권위라는 이름’으로 통칭되는 유명인사, 기관들의 이름 밑에 숨겨진 의도를 살펴야 한다.

둘째, 어떤 방법으로 알게 되었는지 조사 방법에 주의해야 한다.

경기추세를 예측하기 위해 중견기업 이상의 800개 회사에 설문지를 돌렸다고 하자. 그런데 14%의 회사만이 회답하였다면, 86%의 회사는 설문에 응하지 않은 셈이다. 이 사실을 공표하지 않은 체, 14%만의 설문을 기초로 경기를 예측하는 것이 타당할까? 또한 소규모 기업이 배제된 이 설문이 경기추세의 대표성이 있을까? 결국 통계값에 표본수의 과소, 표본 추출의 왜곡이 없는지 확인이 요구된다.

셋째, 빠진 데이터는 없는지 숨겨진 자료를 찾아봐야 한다.

표본의 크기나 신뢰도에 관한 자료(확률오차, 표준편차)가 누락된 상관관계에 대하여 살펴보아야 한다. 어느 회사 발표에 따르면, 회사 주주는 3,003명으로 주주 한 명당 보유 평균 주식수는 660주라 하였다. 그런데 이 회사 200만주 주식 중 3/4에 해당하는 주식은 단 3명의 주주가 보유하고 있으며, 나머지 1/4을 3000명이 나누어 갖고 있다. 이런 경우 평균 보유 주식수의 의미가 있는 것 일까? 즉, 통계치에서 누락된 또는 숨겨진 자료가 없는지 숙고하여야 한다.

넷째, 내용이 뒤바뀐 것은 아닐지 쟁점 바꿔치기에 주의해야 한다.

“전년도에 비해 갑상선암 환자가 3배 증가하였다.”는 기사발표를 보았다면 독자 입장에서 어떻게 생각할까? 일반적으로 증가 이유보다는 해당 질환이 급격히 늘어났다는 점에 주목할 것이다. 그러나 종양의 크기 2cm 이상을 갑상선암으로 판정하던 것을 1.5cm로 판정기준을 하향 조정하거나 또는 검진장비의 획기적 개선에 따른 것이라면 전혀 다른 이야기가 될 수 있다. 따라서 통계값이 의미하는 본질적 쟁점이 무엇인지 의문을 제기하여야 한다.

다섯째, 상식적으로 말이 되는 이야기인가 살펴 봐야한다. 석연치 않은 부분은 조사해라.

증명되지 않은 가정을 토대로 장황하게 설명이 전개될 때 ‘상식적으로 말이 되는 것인가?’와 같은 질문은 통계숫자를 과대평가하지 않고 제대로 파악할 수 있게 한다. 우리나라는 2018년 잠정 출산율 0.98로 세계 최저이자 세계 최초로 1.0이하 국가로 집계되었다. 이러한 출산율 저하는 가까운 미래에 국가적 재앙이 될 것으로 예측되고 있다. 불과 40년전 인 1981년, 정부는 인구증가 억제를 목표로 인구증가율을 1.6%로 설정하였으며, 이를 달성하기 위해 많은 정책을 펼쳤다는 점을 상기한다면, 당시 인구추계 시계열 통계분석이 장기적 인구재배치 상황을 담보하지 못하였음을 보여준다. 결국 과도한 통계적 인구증가의 우려가 전혀 상반된 결과를 낳게 되었다는 점에 유의할 필요가 있다.

P2P회사에 대한 통계자료도, 예를 들어 2019. 6.10일 데일리한국의 “P2P금융업계 연체율 8.5%…통계 집계 이후 최고치 달해” 기사에 따르면, “한국P2P금융협회 조사 결과 지난 4월 말 기준 협회 소속 P2P금융업체 45곳의 평균 연체율은 8.5%를 기록했다. 이는 지난 2016년 6월 관련 집계가 시작된 이후 가장 높은 수치다.” 라고 게시되었다. 과연 이 기사에서 제시한 통계자료가 적합한 것일까? 이 기사의 P2P업체 표본수는 2018년 말 기준 205개의 P2P회사가 있음에도 불과 45곳만을 대상으로 한 협회자료를 근거하고 있다. 과소 표본수의 평균 연체율이 전체 P2P회사의 연체율로서 대표성을 가질 수 있을까? 통계집계 이래 가장 높은 수치라는 내용도 비교시점의 업체수의 변동 또한 연체율은 누적대출액과 연동되는데 비교시점의 누적대출액 차이를 반영한 것일까? 이러한 의문에 따라 P2P업체 및 언론매체가 제시하는 P2P통계자료도 앞에서 제시한 ‘오인을 피하는 열쇠’를 적용하여 검토할 필요가 있을 것으로 보인다.

글 : (주)그릿펀딩 대표 / 부동산학박사 박범석

 

사진 = 그릿펀딩 제공
사진 = 그릿펀딩 제공

 


관련기사

주요기사
이슈포토