Seer's Blog
The Outpost

먼저 아래의 기사를 읽어주시기 바란다.


집값 비싼 30곳, SKY 합격 ‘절반


전국 232개 시·군·구 가운데 집값이 비싼 30개 지역 학생들이 고려대와 서울대, 연세대 등 3개 명문대 합격자의 절반 가까이를 차지하는 것으로 조사됐다.

20일 국회 교육과학기술위원회 소속 권영길 민주노동당 의원이 전국 232개 시·군·구 주택가격(지난해 4분기 공시지가 기준)과 지난 3년 동안 고려·서울·연세대 합격자 수의 상관관계를 분석한 결과를 보면, 집값 상위 30개 지역 고교 출신 학생들의 세 대학 합격자는 전체 합격자 수의 49.6%(5445명)로 나타났다. 이는 이들 30개 지역의 고3 학생이 전국 고3 학생에서 차지하는 비율(25.6%)에 견줘 2배 가까이 되는 수치다.


또 세 대학 합격자 수를 기준으로 상위 10위에 드는 지역 가운데 7곳은 집값 순위에서도 10위 안에 들었으며, 2009학년도 입시에서 이 3개 대학에 합격자를 내지 못한 19개 지역의 집값 순위는 모두 100위권 밖으로 밀려나, 집값과 3개 대학 합격률 사이에 높은 상관관계가 있음을 보여줬다.


특히 2009학년도 3개 대학 합격률(해당 지역 고3 학생 수 대비 합격자 수)을 기준으로 1·2·3위인 3개 지역(서울 강남·서초구, 경기 과천시)은 집값 순위에서도 1~3위를 차지한 것으로 조사됐다.


권 의원은 “이번 분석 결과는 부모의 자산·소득 등 사회경제적 배경이 교육을 통한 계층이동을 강하게 제약하고 있다는 사실을 분명하게 보여준다”며 “좀 더 많은 학생이 자신의 능력을 충분히 발휘할 수 있도록 저소득층이 많은 지역에 지원을 집중해야 한다”고 지적했다.



나는 이런 식의 기사를 읽을때마다 화가 치밀어오른다.


두 가지 이유 때문인데, 첫째로 나름 일국의 최고입법기관인 국회에서 나왔다는 "분석"이 학문적인 근거를 전혀 가지고 있지 못해 혹시나 나를 가르치신 교수님들이 보시면 어쩌나 두려울 정도로 부끄러운 수준이기 때문이요, 둘째로 여론 호도와 군중 선동을 노리는 얕은 노림수를 가린다고 가린 꼴이 마치 불 난 모텔에서 뛰쳐나온 사람들이 두 손만 가지고 몸을 가리려는 꼴마냥 추잡하여 역겨운 마음이 절로 일기 때문이다.

첫 번째 얘기부터 해 보자. 경제학에서 데이터 분석을 할 때 가장 먼저 배우는 것 중 하나가 변수 A와 B를 놓고 그냥 마구잡이 리그레션을 돌린다고 해 봤자 의미있는 결과는 단 하나도 얻을 수 없다는 사실이다. 왜냐, 그렇게 분석을 해서 얻을 수 있는 것은 A와 B 사이의 correlation에 불과하기 때문이다. Correlation은 대칭성을 가지고 있다. 집값과 성적이 correlate되어있다고 말하는 것은 성적과 집값이 correlate되어있다고 말하는 것과 같기 때문이다. 즉, 이러한 상태에서는 집값이 높아서 성적이 올라가는 것인지 아니면 성적이 높아서 집값이 올라가는 것인지 알 도리가 전혀 없다는 얘기다.


이러한 결과를 가지고 위 "분석"의 주인장께서는 부모의 자산과 소득이 자녀의 성적에 지대한 영향을 끼치는 양 말씀을 하고 계시나, 실상 그 "분석"은 이러한 시나리오들로도 충분히 설명이 가능하단 얘기다. 일례로 대치동의 아이들을 생각해보자.


1. 일반적으로 지능과 소득수준은 강한 상관관계를 가진다. 그 이유인즉슨 지능이 높으면 높을수록 일반적으로 직장에서의 효율, 업무혁신능력 등이 높고 이에 따라서 회사가 고용을 위해서 지불하고자 하는 대가의 수준 역시 높아지기 때문이다. 대치동 집값이 원래 높았고, 대한민국에서 고소득을 과시하는 중요한 통로 중 하나는 비싼 동네에 거주하는 것이므로 지능이 높고 소득수준이 높은 사람들이 대치동으로 이사를 갔다. 일반적으로 지능이 높은 사람은 지능이 높은 배우자를 만날 확률이 높고, 이 결과 그들의 자식 역시 지능이 높을 확률이 크다. 이렇게 지능이 높은 아이들이 대치동에서 태어나게 되었으며, 이에 따라서 공부를 당연히 잘 하게 되는 것이다.

OR,

2. 어느날 우연의 일치로 대치동에 공부 잘하는 아이들이 몇몇 모여들었다. 교육열에 불타는, 그리고 자식이 어지간히 공부는 해서 아직 희망을 잃지 않은 학부모들은 대치동이 공부 잘 하는 동네라니 점점 대치동으로 몰려들기 시작한다. 주택의 공급은 정해져있는데 수요가 늘어나니 집값이 올라가기 시작한다. 집값이 오르니 아 여기 집을 사 놓으면 돈을 벌겠구나 싶은 투기세력도 모여들기 시작한다. 집값은 더 올라간다. 비싼 집값을 주고 온 대치동이니만큼 학부모들은 아이들을 세게 굴리고 아이들도 공부 이외에는 생각하지 못하는 삶을 살게 된다. 성적도 올라간다. 학교들은 경쟁이 치열해지고 명문학교라는 소문이 난다. 집값은 더 올라간다. 그리고 이 사이클이 반복된다.


이 이외에도 가능한 시나리오는 수없이 많다. 그러나 이 "분석"을 하신 분께선 유독 부모 소득수준이 자식 성적에 지대한 영향을 끼친다는 가설만 밀고 계신거다. 이 가설을 부정하고자 하는 게 아니다. 만약 그렇게 한다면 이유없이 그 가설을 미는 행동과 똑같이 학문적으로 근거 없는 행동을 하게 되니까. 다만, 그렇게 주장을 하려면 그 주장을 뒷받침하는 증거를 제대로 보이란 말이다. 하다못해 학부 경제학 전공이면 다 아는 Instrumental Variable이라도 제발 좀 써달란 말이다. 내가 이제까지 신문기사에서 "미녀일수록 소득 높아" 내지는 "고소득자일수록 암 발병 확률 낮아" 등의 타이틀을 보면서 단 한번도 제대로 된 통계학적 분석을 본 적이 없다. 경제학 공부를 오래 하지 못했지만 IV 쓰자마자 correlation에서 anti-causal로 돌아서는 케이스들을 수없이 많이 봐 왔다. 제발 실험 자체에 이런 식의 문제가 있으면 어떻게든 robustness를 좀 찾아서 통계 해석을 내 놓아 줬으면 좋겠다. 이 따위 근거를 가지고 전 국민이 접근하는 언론에다가 기사를 낸단 말인가? 정말 이건 뭐 병신도 아니고 말이다.


쓰다 보니 두 번째 이야기까지 쓰기에는 말이 너무 길어져버렸다.


기회가 되면 두 번째 이야기도 마무리짓도록 하겠다.

TRACKBACK :: http://outpost.ivyro.net/tt/trackback/206

  1. Subject: 흔한 통계오류

    Tracked from 침묵의 소리  삭제

    우리는 실생활에서 많은 통계를 접한다. 통계는 주로 어떤 주장의 수치적·정량적 근거로 사용된다. 그러나 통계자료를 수집하는 방법이나 혹은 나중에 그것을 해석하는 과정에서, 의도적으..

    2009/07/18 21:41
  2. Subject: 캘빈의 생각

    Tracked from kelvinkim's me2DAY  삭제

    26살에 카이스트 교수가 된 사람 기사를 보았는데, 과연 저 친구는 '대학생활'을 충분히 누려봤을까 하는 걱정아닌 걱정이 든다. 어쨌든 축하할 일이다. 영수가 열다섯살에 MIT에 갔으니 저 기..

    2009/07/22 16:55

댓글을 달아 주세요

  1. 비밀방문자  댓글주소  수정/삭제  댓글쓰기

    관리자만 볼 수 있는 댓글입니다.

    2009/04/21 19:39
  2. kelvin  댓글주소  수정/삭제  댓글쓰기

    하하 맞는말. 그나저나 위의 비밀방문자 볼드체로되어있으니 굉장히 궁금해진다 (...)

    2009/04/22 11:23
  3. 정민영  댓글주소  수정/삭제  댓글쓰기

    안녕하세요?
    위 기사를 쓴 한겨레 정민영 기자입니다. 기사를 보고 그렇게 화가 치밀어 오르셨다니 죄송하네요. 안그래도 팍팍한 세상에.
    두번째 이야기도 궁금해지는군요. 시간 괜찮으시면 전화한번 주세요. 010-4366-7288 입니다

    2009/04/24 10:46
    • Seer  댓글주소  수정/삭제

      아, 기사에서 기자님 성함을 미처 못 뺀 점은 사과드립니다. 지금 지우도록 하겠습니다. 그리고 제 화를 치밀어오르게 한 사람은 기자님보다도 기사에서 소개하신 "분석"의 주인장 되시는 민주노동당 권영길 의원 쪽이니 너무 노여워 마시길 바랍니다. 오히려 아직도 이런 쓰레기 통계가 국회에서 판을 치고 다닌다는 사실을 소개해 주신 점을 감사드려야겠네요. =)

      언젠가 다시 이 곳에 오시게 된다면 그 때는 두 번째 이야기도 마저 써 놓도록 노력해보지요. 제가 외국에 있어서 전화 못 드리는 점 용서하시구요. 팍팍한 세상, 좀 덜 팍팍하게 만드는 좋은 기자 되시기를.

      2009/04/25 02:29
  4. wk  댓글주소  수정/삭제  댓글쓰기

    http://xkcd.com/552/

    2009/04/24 17:28
  5. 人鬪  댓글주소  수정/삭제  댓글쓰기

    시원하다. 같은 주제로 꼭 한 번 쓰고 싶었던 글이다.

    2009/05/04 20:02
  6. Andante  댓글주소  수정/삭제  댓글쓰기

    뭐, 굳이 경제학 전공 갈것도 없이 중학교 3학년 통계부분에서 상관관계 배워요 그리고 상관관계와 인과관계는 아~~~~~~~~~~~~~~무런 상관도 없다고 가르치죠 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ

    2009/05/05 02:06
  7. polarnara  댓글주소  수정/삭제  댓글쓰기

    이 글이 처음 쓰였을 때 한 번 보고 (거의) 한 달 쯤 지나서 다시 보는데, 기사에는 문제가 없지 않아? 기사에 따르면 분석에서는 "집값과 3개 대학 합격률 사이에 높은 상관관계가" 있다고만 말하고 있지 "인과관계"를 언급하고 있지 않아. 니가 쓴대로 "부모 소득수준이 자식 성적에 지대한 영향을 끼친다는 가설"은 (최소한 저 기사가 소개하는 분석 결과에서는) 찾아볼 수 없는데. 마지막 문단 권의원의 말에서 그런 뉘앙스가 살짝 풍기는 지는 모르겠지만 내가 읽기엔 상관관계를 가정하고 있지 인과관계를 가정하고 있지는 않은 것 같아. "고소득자일수록 암 발병 확률 낮아" 류의 타이틀도 그 자체로는 상관관계를 말하는 지극히 중립적인 문장. 문제는 상관과 인과의 차이를 모르는 독자가 읽었을 때 혼란이 발생할 수 있다, 정도가 아닐까.

    2009/05/15 04:39

1 2 3 4 5 6  ... 34 
전체 (34)
01. Midnight Chats (11)
02. Outpost Story (2)
03. Sharing Sights (0)
04. Musica (4)
05. Cinema (0)
06. Logs (0)
07. Fun Stuff (0)