상관관계는 인과관계가 아니다(Correlation does not imply causation)
(* 초콜릿 소비량이 많은 나라일수록 노벨상 수상자 수가 많았다. 그러면 초콜릿 소비를 늘리면 노벨상 수상 기회가 더 커질까? 초콜릿 소비량과 노벨상 수상은 상관관계가 있기는 하지만 인과관계는 없다. 단지 '경제 수준'이라는 제3의 변수에 의해 현혹되었을 뿐이다. 우리는 많은 경우에 상관관계와 인과관계를 오인한다. "상관관계가 인과관계를 의미하지 않는다(Correlation does not imply causation)"를 핵심 주제로 하여 분석해본다.)
통계적 관점
국가별 1인당 초콜릿 소비량(가로축)과 인구 1천만 명당 노벨상 수상자 수(세로축) 간의 산점도를 보여주는 그림이 있다. Messerli 등의 연구에 따르면 두 변수 사이에 강한 양의 선형 상관관계가 있으며(r=0.791, p<0.0001), 이는 통계적으로 매우 유의미하다. 즉, 초콜릿 소비량이 많은 나라일수록 노벨상 수상자가 많아지는 경향이 관찰되었음을 뜻한다. 상관계수 r≈0.79는 +1.0에 가까워 높음을 의미하고, p값이 0.0001 미만이라는 것은 ‘영가설(상관없음)’ 하에서 이런 결과가 나올 확률이 0.01% 이하라는 뜻이다.
하지만 상관관계는 인과관계를 증명하지 않는다. 예를 들어, 초콜릿을 많이 먹는 것이 곧 노벨상을 받는 원인이라 해석할 수는 없다. Messerli는 “초콜릿이 인지기능을 향상시킬 수 있다”는 가설에 착안했으나, 연구 끝부분에서도 “초콜릿 섭취가 실제로 관찰된 상관관계의 근본 원인인지 여부는 불명”이라고 밝혔다scottbarrykaufman.com. 오히려 선진국일수록 교육․연구 인프라가 잘 갖춰져 노벨상 수상자가 많고, 이런 나라들이 경제적 여유가 있어 초콜릿 소비도 많을 가능성이 크다. 즉 제3의 변수(예: 경제발전 정도)가 두 변수에 동시에 영향을 미칠 수 있다data.europa.eu.
또한 이 분석은 국가 단위의 평균값으로 이루어졌다는 점에서, 개인 수준의 인과 해석은 부적절하다. 이를 ‘생태학적 오류(ecological fallacy)’라 하는데, 실제로 노벨상 수상자 개인이 많은 초콜릿을 섭취했는지 알 수 없으며, 상관그래프에 포함된 일반 인구의 초콜릿 소비가 노벨상과 연관되었을 뿐일 수 있다. 어떤 사람이 “노벨상을 받으려면 초콜릿을 먹어야 한다”라고 결론 내리면, 그래프의 국가평균값만으로는 증명되지 않는 오류다data.europa.eu. 결론적으로 이 데이터로부터 유추할 수 있는 것은 “국가 평균에서 두 변수 간 연관성이 확인되었다”는 정도이며, 인과성이나 개별 결과에 대해서는 결코 단정할 수 없다.
철학적 관점
이러한 결과는 과학철학적으로도 통찰을 준다. 데이비드 흄은 반복적 상관(항상 함께 발생)이 반드시 인과를 보장하지 않는다고 보았다. 흄에 따르면 A와 B가 늘 함께 나타나도, 우리는 ‘A가 B를 일으킨다’는 필연적 인과성을 경험적으로 확신할 수 없으며 이는 단지 심리적 습관에 불과하다iep.utm.edu. 칼 포퍼도 인과에 대한 맹목적 믿음을 “형이상학적”이라고 비판하며, 인과관계를 주장할 때는 철저한 검증(반증가능성)을 요구했다. 다시 말해, 두 변수의 상관관계만으로 ‘인과’를 단정하는 것은 과학적 합리성의 한계를 넘어서는 성급한 일반화일 수 있다.
또 한편, 인간은 무질서 속에서 의미를 찾으려는 패턴 인식 성향이 강하다. 정신의학에서는 이를 아포페니아(apophenia) 혹은 마이클 셔머가 명명한 *패터니시티(patternicity)*라고 한다en.wikipedia.org. 즉, 실제로는 관련 없는 정보 속에서 의미 있는 규칙성을 느끼려는 심리적 경향이다. 위 그래프처럼 상관관계가 나타나면 우리 뇌는 “A가 B를 일으켰나?”라고 자연스레 연결짓곤 한다. Medium 칼럼에서도 “인간은 우연의 패턴에서 리듬을 찾아내고, 인과가 없는 상관관계를 인과처럼 받아들이는 경향이 있다”라고 지적된다. 이처럼 철학적․심리학적 관점에서는, 해당 통계 결과가 나타내는 우연적 일치에 지나지 않을 가능성을 염두에 두어야 한다는 성찰이 도출된다.
유머와 풍자
사실 이 연구 결과는 처음부터 풍자의 성격을 띤 것으로 알려졌다. WBUR의 Carey Goldberg 기자는 “이 논문은 정말로 utterly tongue-in-cheek, NEJM의 유머 칼럼”이라고 평하며, “주장은 농담이고 데이터와 통계분석만 정확하다”고 정리했다. 실제로 전 세계 언론의 반응도 가지각색이었다. 예컨대 스페인어권 매체들은 이를 두고 태양흑점과 우울증 같은 터무니없는 연관성과 함께 농담 소재로 다루었다wbur.org.
인터넷과 대중문화에서는 이 그래프가 엉뚱한 상관관계의 대표적 사례로 널리 회자된다. 미국 로스앤젤레스타임스 등은 치즈 소비량과 침대시트에 얽힌 사망자 수, 메인주의 마가린 소비량과 이혼율 같은 황당한 상관관계 예시를 소개하며, 타일러 비겐의 「Spurious Correlations」 사이트를 언급했다latimes.com. 이처럼 “상관관계는 인과관계가 아니다”를 강조하려는 유머 문화 속에서 초콜릿–노벨상 그래프는 패러디 대상이 되었다.
사람들이 이러한 통계적 우연에서 유머를 느끼는 이유는 불일치(incongruity) 때문이다. 기대와 전혀 다른 엉뚱한 연관성이 등장하면, 뇌는 당혹감과 놀라움을 느끼며 이를 해소하려고 한다. 「웃음 이론」에서도 말하듯, 예측과 어긋나는 부조리한 상황은 인지적 긴장을 일으키고, 그 긴장이 웃음으로 해소된다. 즉, “초콜릿을 더 많이 먹으면 노벨상을 딴다”는 직관에 반하는 주장이 역설과 풍자로 작용하여 사람들에게 웃음을 주는 것이다. 또한 이런 사례는 바넘 효과나 확인편향 같은 심리적 요인과도 관련된다. 무작위로 보이는 패턴에서 의미를 부여하려는 우리의 욕구가 의도적으로 과장되자, 오히려 그 이질감이 코미디적 효과를 낳는 셈이다.

**
<상관관계는 인과관계가 아니다: 데이터 시대의 비판적 사고를 위한 심층 분석>
I. 서론: 패턴의 유혹과 위험
현대 사회는 데이터의 홍수 속에서 살아가고 있다. 비즈니스 전략 수립에서부터 공공 정책 결정, 개인의 건강 관리에 이르기까지, 데이터에 기반한 의사결정은 더 이상 선택이 아닌 필수가 되었다.1 방대한 데이터 속에서 변수들 간의 관계, 즉 패턴을 발견하는 능력은 새로운 통찰력을 얻는 강력한 도구가 된다. 그러나 이 패턴의 이면에는 심각한 함정이 도사리고 있다. 바로 두 변수가 함께 움직인다는 사실만으로 하나가 다른 하나의 원인이라고 성급하게 결론 내리는 오류이다. "상관관계는 인과관계가 아니다(Correlation does not imply causation)"라는 경고는 통계학의 기본 원칙을 넘어, 복잡한 세상을 이해하려는 모든 이가 갖춰야 할 핵심적인 지적 도구이다.2
이 명제는 단순히 제한적인 규칙이 아니라, 엄밀한 탐구의 여정을 시작하는 출발점이다. 데이터가 넘쳐날수록 변수들 사이의 우연한 연관성은 기하급수적으로 증가하며, 우리의 직관은 이러한 연관성을 인과적 서사로 엮어내려는 강한 유혹을 받는다. 인간의 뇌는 생존을 위해 주변 환경에서 패턴을 신속하게 파악하고 인과관계를 추론하도록 진화해왔다.3 덤불이 흔들리는 소리와 포식자의 등장을 연결 짓는 능력은 우리 조상들의 생존에 필수적이었다. 이러한 진화적 유산은 현대 사회에서도 여전히 강력한 힘을 발휘하여, 우리는 두 사건이 동시에 발생하면 그 사이에 어떤 필연적인 연결고리가 있을 것이라고 무의식적으로 추정하는 경향이 있다.1
하지만 의학, 경제, 사회 정책과 같이 수많은 변수가 복잡하게 얽혀있는 시스템에서 잘못된 인과관계 추론은 치명적인 결과를 초래할 수 있다. 상관관계에만 의존한 잘못된 의학 정보는 건강을 해칠 수 있으며, 허위 상관에 기반한 정책은 막대한 사회적 비용을 낭비하게 만든다. 따라서 데이터가 많아질수록, 그리고 데이터에 대한 의존도가 높아질수록 상관관계와 인과관계를 명확히 구분하는 능력은 단순한 학문적 소양을 넘어, 개인과 사회의 명운을 가르는 비판적 생존 기술이 된다.
본 보고서는 "상관관계는 인과관계가 아니다"라는 명제를 심층적으로 해부하고자 한다. 이를 위해 먼저 상관관계와 인과관계의 개념적, 통계학적 정의를 명확히 하고, 상관관계가 인과관계로 오인되는 다섯 가지 논리적 함정을 구체적인 사례를 통해 분석할 것이다. 나아가 이러한 오류가 단순한 논리적 실수를 넘어 인간의 깊은 인지적 편향에 뿌리내리고 있음을 심리학적 관점에서 탐구한다. 그리고 이러한 함정과 편향을 극복하고 과학적으로 인과관계를 추론하기 위해 고안된 정교한 방법론들—무작위 대조 시험부터 브래드포드 힐의 기준까지—을 살펴볼 것이다. 마지막으로, 인과관계 개념 자체에 대한 철학적 고찰을 통해 이 문제가 지닌 인식론적 깊이를 조명하고, 데이터 시대의 현명한 시민으로서 우리가 갖춰야 할 지적 태도를 제시하고자 한다. 이 여정의 궁극적인 목표는 독자들이 패턴의 유혹에 맞서고, 데이터의 홍수 속에서 길을 잃지 않도록 돕는 견고한 비판적 사고의 틀을 제공하는 것이다.
II. 개념 해부: 상관관계 대 인과관계
상간관계와 인과관계는 두 변수 사이의 관계를 설명한다는 공통점이 있지만, 그 본질과 함의는 근본적으로 다르다.4 이 둘을 명확히 구분하는 것은 모든 데이터 분석과 비판적 사고의 첫걸음이다.
상관관계: 관계의 측정
상관관계(Correlation)는 두 개 이상의 변수가 함께 변하는 경향이나 정도를 나타내는 통계적 측정치이다.4 한 변수의 값이 변할 때 다른 변수의 값이 예측 가능한 방식으로 함께 변한다면, 두 변수 사이에는 상관관계가 존재한다고 말한다.6 상관관계는 관계의 존재 유무와 그 방향성, 그리고 강도를 설명하지만, 그 관계의 근본적인 원인이나 메커니즘에 대해서는 아무런 정보를 제공하지 않는다. 즉, 상관관계는 현상을 '기술(describe)'할 뿐 '설명(explain)'하지는 못한다.7
상관관계의 강도와 방향은 상관계수($r$)로 표현되며, 이 값은 -1에서 +1 사이의 값을 갖는다.6
- 양의 상관관계 (Positive Correlation, $r > 0$): 한 변수가 증가할 때 다른 변수도 함께 증가하는 경향을 보인다. 상관계수가 +1에 가까울수록 강한 양의 상관관계를 의미한다. 예를 들어, 일반적으로 학습 시간이 길어질수록 시험 점수가 높아지는 경향이 있으며, 이는 두 변수 간의 양의 상관관계를 시사한다.5
- 음의 상관관계 (Negative Correlation, $r < 0$): 한 변수가 증가할 때 다른 변수는 감소하는 경향을 보인다. 상관계수가 -1에 가까울수록 강한 음의 상관관계를 의미한다. 예를 들어, 운동 시간이 늘어날수록 체중이 감소하는 경향은 음의 상관관계의 대표적인 사례이다.5
- 무상관 (No Correlation, $r \approx 0$): 두 변수 사이에 뚜렷한 선형 관계가 존재하지 않음을 의미한다. 한 변수의 변화가 다른 변수의 변화에 대해 어떠한 정보도 주지 못한다. 예를 들어, 한 도시의 강수량과 다른 나라의 주식 시장 지수 사이에는 특별한 관계가 없을 가능성이 높다.5
상관관계의 핵심적인 특징은 '대칭성'이다. 변수 A와 B의 상관관계는 B와 A의 상관관계와 동일하다. 이는 어느 한쪽이 다른 한쪽에 우선하거나 영향을 미친다는 개념을 포함하지 않기 때문이다.
인과관계: 영향의 메커니즘
인과관계(Causation)는 한 사건(원인)이 다른 사건(결과)을 직접적으로 발생시키는 관계를 의미한다.5 이는 단순한 동반 발생을 넘어, 원인의 변화가 결과의 변화를 필연적으로 유발하는 기계적, 논리적 연결을 함축한다. 인과관계는 "왜"라는 질문에 답하며, 현상의 근본적인 작동 원리를 설명하고자 한다.7
과학적, 철학적으로 인과관계가 성립하기 위해서는 일반적으로 다음 세 가지 필수 조건이 충족되어야 한다.
- 공변성 (Covariation): 원인과 결과는 함께 변해야 한다. 즉, 두 변수 사이에 상관관계가 존재해야 한다. 원인이 존재할 때 결과가 나타나고, 원인이 부재할 때 결과도 나타나지 않는 경향이 관찰되어야 한다. 바로 이 지점에서 상관관계는 인과관계의 '필요조건'이 된다. 하지만 이것만으로는 충분하지 않다.8
- 시간적 선행성 (Temporal Precedence): 원인은 결과보다 반드시 시간적으로 먼저 발생해야 한다.5 어떤 사건이 그보다 나중에 일어난 사건의 원인이 될 수는 없다. 이 조건은 인과관계의 비대칭적, 단방향적 특성을 규정한다.
- 외부 변수 배제 (Nonspuriousness / No Third Factors): 관찰된 두 변수 간의 관계가 우연이나 제3의 외부 변수에 의해 설명되어서는 안 된다. 이 조건은 인과관계를 입증하는 과정에서 가장 까다롭고 중요한 부분이며, 상관관계가 인과관계가 아닌 대부분의 경우가 이 조건을 충족시키지 못하기 때문이다.
이러한 조건들을 종합해 볼 때, 인과관계는 상관관계보다 훨씬 더 엄격하고 강력한 주장이다. 상관관계가 데이터에서 관찰되는 '패턴'이라면, 인과관계는 그 패턴을 만들어내는 '프로세스'에 대한 가설이다.
표 1: 상관관계와 인과관계의 핵심 비교
| 특징 | 상관관계 (Correlation) | 인과관계 (Causation) |
| 정의 | 두 변수가 함께 변하는 통계적 관계 | 한 사건이 다른 사건을 직접적으로 유발하는 관계 |
| 방향성 | 대칭적 (A↔B) | 비대칭적 / 단방향적 (A→B) 5 |
| 본질 | 기술적 ("어떤 패턴이 있는가?") 7 | 설명적 ("왜 이런 일이 일어나는가?") |
| 함의 | 잠재적 연관성을 시사 | 영향의 메커니즘을 확립 |
| 제3 변수 | 관계가 제3 변수에 의해 발생할 수 있음 5 | 제3 변수의 영향이 배제되어야 함 5 |
III. 논리의 지뢰밭: 상관관계가 현혹하는 다섯 가지 방식
두 변수 X와 Y 사이에 통계적으로 유의미한 상관관계가 관찰되었을 때, 우리의 직관은 "X가 Y의 원인이다"라는 결론으로 비약하기 쉽다. 그러나 논리적으로 가능한 시나리오는 이보다 훨씬 다양하며, 성급한 결론은 대부분 오류로 이어진다. 상관관계가 확인되었을 때 잠재적 인과관계에 대해 고려해야 할 다섯 가지 가능성은 다음과 같다.8 이 다섯 가지 시나리오를 체계적으로 검토하는 것은 비판적 사고의 핵심적인 훈련이다.
시나리오 1: 순전한 우연 (허위 상관)
가장 단순하지만 간과하기 쉬운 가능성은 관찰된 상관관계가 아무런 의미 없는 순전한 우연의 일치일 경우이다.8 세상에는 무수히 많은 데이터가 존재하며, 데이터의 양이 많아질수록 무작위적인 변동만으로도 두 변수가 일시적으로 같은 패턴을 보일 확률은 필연적으로 높아진다. 이러한 상관관계를 '허위 상관(Spurious Correlation)'이라고 부른다.
예를 들어, 미국 메인 주의 이혼율과 1인당 마가린 소비량 사이에는 수년간 매우 높은 상관관계($r=0.99$)가 나타났다. 또한, 배우 니콜라스 케이지가 출연한 영화의 수와 수영장에서 익사한 사람의 수 사이에도 강한 상관관계가 존재했다. 이러한 통계적 연관성은 수학적으로는 실재하지만, 개념적으로는 완전히 무의미하다. 마가린 소비가 이혼을 유발하거나, 니콜라스 케이지의 영화가 익사 사고를 일으킨다는 어떠한 합리적인 메커니즘도 존재하지 않는다. 이는 방대한 데이터 속에서 우연히 발견된 통계적 유령일 뿐이다. 이러한 사례들은 통계적 유의성만으로 인과관계를 주장하는 것이 얼마나 위험한지를 명확히 보여준다.
시나리오 2: 숨겨진 변수 (공통 원인 / 교란)
상관관계를 인과관계로 오인하게 만드는 가장 흔하고 교묘한 함정은 '숨겨진 제3의 변수(Confounding Variable)'의 존재이다.8 이 시나리오에서는 관찰된 두 변수 X와 Y가 서로 직접적인 인과관계를 갖는 것이 아니라, 관찰되지 않은 제3의 변수 Z가 X와 Y 모두의 원인이 되어 둘 사이에 거짓된 상관관계를 만들어낸다.
- 사례 1: 아이스크림 판매량과 익사 사고 발생률 9
- 관찰된 상관관계: 여름철 아이스크림 판매량이 증가하면 익사 사고 발생률도 함께 증가한다.
- 잘못된 인과 추론: 아이스크림 섭취가 익사를 유발한다.
- 숨겨진 공통 원인 (Z): '더운 날씨'이다. 더운 날씨(Z)는 아이스크림 판매량을 증가시키고(Z→X), 동시에 물놀이하는 사람의 수를 늘려 익사 사고 발생률을 높인다(Z→Y). 아이스크림과 익사 사고 사이에는 직접적인 인과관계가 없다.
- 사례 2: 운동과 피부암 10
- 관찰된 상관관계: 운동을 더 많이 하는 사람들이 피부암에 걸릴 확률이 더 높은 경향이 있다.
- 잘못된 인과 추론: 운동이 피부암의 원인이다.
- 숨겨진 공통 원인 (Z): '햇빛 노출'이다. 야외에서 운동하는 사람들(X)은 자연스럽게 햇빛에 더 많이 노출되고(Z→X), 증가된 햇빛 노출(Z)은 피부암 발병 위험을 높인다(Z→Y).
- 사례 3: 대학 졸업 여부와 소득 수준 11
- 관찰된 상관관계: 대학 졸업자들은 비졸업자들에 비해 평균적으로 더 높은 소득을 얻는다.
- 일반적인 인과 추론: 대학 교육이 높은 소득의 원인이다.
- 잠재적 공통 원인 (Z): '개인의 능력', '성실성', '가정의 사회경제적 배경' 등 다양한 요인이 존재할 수 있다. 예를 들어, 원래부터 능력이 뛰어나고 성실한 사람(Z)은 대학에 진학할 가능성도 높고(Z→X), 동시에 노동 시장에서 높은 소득을 올릴 가능성도 높다(Z→Y). 이 경우, 대학 교육의 효과는 과대평가될 수 있다.
시나리오 3: 인과관계의 역전
관찰된 상관관계가 실제로 인과관계에 기반한 것일 수 있지만, 그 인과관계의 방향이 우리가 가정한 것과 정반대인 경우가 있다.8 즉, Y가 X의 원인인데, 우리는 X가 Y의 원인이라고 착각하는 것이다.
- 사례: 소방관의 수와 화재 피해 규모 9
- 관찰된 상관관계: 화재 현장에 출동한 소방관의 수가 많을수록 화재로 인한 재산 피해액이 크다.
- 잘못된 인과 추론: 소방관들이 불을 끄는 과정에서 더 많은 피해를 유발한다.
- 실제 인과관계: 화재의 규모(Y)가 클수록 더 많은 수의 소방관이 현장에 투입된다(X). 즉, 인과관계의 방향은 '화재 규모 → 소방관 수'이지, 그 반대가 아니다.
시나리오 4: 양방향 또는 순환적 인과관계
두 변수 간의 관계가 단순한 일방통행이 아니라, 서로가 서로에게 원인이자 결과가 되는 복잡한 상호작용일 수 있다.8 이러한 관계는 종종 시간이 지남에 따라 서로를 강화하는 피드백 루프(feedback loop)의 형태를 띤다.
- 사례: 우울감과 자존감 1
- 관찰된 상관관계: 우울 수준이 높은 사람들은 자존감이 낮은 경향이 있다.
- 단순한 인과 추론: 낮은 자존감이 우울증을 유발한다 (또는 그 반대).
- 복잡한 실제 관계: 낮은 자존감은 우울한 감정을 촉발하는 요인이 될 수 있다 (자존감↓ → 우울감↑). 동시에, 우울증을 겪으면서 무력감과 부정적 사고가 심화되어 자존감이 더욱 낮아질 수 있다 (우울감↑ → 자존감↓). 이처럼 두 변수는 서로를 악화시키는 순환 고리를 형성할 수 있다. 어느 한쪽만을 원인으로 지목하는 것은 현실을 지나치게 단순화하는 것이다.
시나리오 5: 실제 인과관계 (X가 Y의 원인)
마지막으로, 관찰된 상관관계가 실제로 우리가 가정한 인과관계(X → Y)를 반영하는 경우도 물론 존재한다.8 담배를 많이 피울수록 폐암에 걸릴 확률이 높아지는 것처럼 7, 수많은 과학적 발견은 상관관계의 관찰에서부터 시작되었다.
중요한 점은, 이 다섯 번째 가능성은 다른 네 가지 가능성(우연, 공통 원인, 역인과, 양방향 인과)을 체계적으로 배제한 후에야 비로소 잠정적으로 채택할 수 있는 가설이라는 것이다. 상관관계의 발견은 인과관계 탐구의 끝이 아니라, 이제 막 시작되었음을 알리는 신호탄에 불과하다. 따라서 어떤 상관관계 주장을 접했을 때, 이 다섯 가지 시나리오를 '논리적 체크리스트'로 활용하여 성급한 결론을 내리기 전에 모든 가능성을 검토하는 습관은 비판적 사고의 핵심이다.
IV. 도약의 심리학: 왜 우리의 뇌는 논리를 배반하는가
상관관계를 인과관계로 착각하는 오류가 단지 논리적 훈련의 부족 문제라면, 교육을 통해 쉽게 교정될 수 있을 것이다. 그러나 이 오류는 인간의 인지 구조 깊숙이 뿌리내린 심리적 경향성에서 비롯된다. 우리의 뇌는 논리적 정확성보다는 생존을 위한 신속한 판단에 최적화되어 있으며, 이 과정에서 발생하는 다양한 인지 편향(cognitive bias)이 상관관계를 인과관계로 비약시키는 주된 원인이 된다.3
패턴을 찾는 기계로서의 뇌
인간의 뇌는 본질적으로 '패턴 탐색 기계'이다. 진화의 과정에서 우리 조상들은 불확실한 환경 속에서 생존 확률을 높이기 위해 주변의 단서들을 연결하고 미래를 예측하는 능력을 발전시켜야 했다. 이 과정에서 두 사건이 함께 발생하는 것을 관찰하면, 그 사이에 인과적 연결이 있다고 가정하는 것이 매우 효율적인 생존 전략이었다.1
이러한 경향은 오류의 비용 측면에서 설명될 수 있다. 덤불 속에서 나는 소리를 듣고 포식자의 존재를 가정하고 도망치는 것(실제로는 바람 소리였을지라도)은 '긍정 오류(false positive)'에 해당한다. 이 오류의 비용은 약간의 에너지를 낭비하는 정도에 그친다. 반면, 덤불 속 소리를 무시했다가 실제로 포식자에게 공격당하는 것(실제 인과관계를 놓친 것)은 '부정 오류(false negative)'이며, 그 비용은 생명 그 자체이다. 따라서 진화는 부정 오류를 피하는 방향으로, 즉 인과관계를 관대하게 추정하는 쪽으로 우리의 뇌를 설계했다. 이러한 진화적 유산은 현대의 데이터 기반 사회에서 우리의 판단을 체계적으로 왜곡하는 원인이 된다.
오류를 부추기는 인지 편향들
현대 인지심리학은 인간의 비논리적 추론 패턴을 다양한 인지 편향으로 설명한다.3 그중에서도 상관관계를 인과관계로 오인하는 데 특히 깊이 관여하는 편향들은 다음과 같다.
- 착각 상관 (Illusory Correlation):
이것은 상관관계 오류의 핵심에 있는 심리 현상으로, 실제로는 아무런 관계가 없는 두 변수 사이에 관계가 존재한다고 인식하는 경향을 말한다.1 이는 특히 두 사건이 동시에 발생했을 때 두드러지거나 기억에 남을 경우에 강하게 나타난다. 예를 들어, 중요한 시험 날 아침에 특정 색깔의 옷을 입고 시험을 잘 봤다면, 우리는 그 옷과 좋은 성적 사이에 특별한 연관성이 있다고 믿기 시작할 수 있다. 이후 그 옷을 입고 시험을 망친 여러 번의 경험은 쉽게 잊히는 반면, 우연히 다시 잘 본 경험은 "역시 이 옷은 행운의 옷이야"라는 믿음을 강화하는 증거로 채택된다. 운동선수들의 '징크스'나 일상적인 미신 대부분이 이러한 착각 상관에 기반한다.14 - 확증 편향 (Confirmation Bias):
확증 편향은 자신의 기존 신념이나 가설을 지지하는 정보는 적극적으로 찾고 받아들이는 반면, 반대되는 정보는 무시하거나 외면하는 경향을 말한다.3 이 편향은 착각 상관을 더욱 공고하게 만든다. 일단 "비 오는 날에는 관절염이 심해진다"는 믿음이 생기면, 우리는 비가 오고 실제로 관절이 아팠던 날은 생생하게 기억하지만, 비가 왔지만 아프지 않았거나 맑은 날에 아팠던 수많은 날들은 기억에서 쉽게 지워버린다.14 이러한 선택적 기억은 존재하지 않는 상관관계를 실제 하는 것처럼 보이게 만들고, 이를 인과관계로 착각하게 만든다. 미디어가 특정 집단과 범죄를 반복적으로 연관시켜 보도하면, 사람들은 확증 편향에 따라 해당 집단과 관련된 범죄 사례만을 더 잘 기억하게 되어, "특정 집단은 범죄 성향이 높다"는 잘못된 인과적 고정관념을 형성할 수 있다.15 - 가용성 휴리스틱 (Availability Heuristic):
가용성 휴리스틱은 어떤 사건의 빈도나 확률을 판단할 때, 그 사례가 얼마나 쉽게 머릿속에 떠오르는가에 의존하는 인지적 지름길이다.3 기억에서 쉽게 '가용'한 정보일수록 더 중요하고 빈번하게 발생한다고 착각하는 것이다. 미디어는 이 휴리스틱에 지대한 영향을 미친다. 비행기 사고나 상어 공격 같은 극적이고 충격적인 사건은 언론에 대대적으로 보도되기 때문에 우리의 기억에 쉽게 각인된다. 그 결과, 사람들은 실제 통계와는 다르게 자동차 사고나 심장 질환과 같은 훨씬 흔하지만 덜 극적인 위험보다 비행기 사고로 사망할 확률을 과대평가하게 된다.17 이는 '비행'이라는 행위와 '사망'이라는 결과 사이에 실제보다 훨씬 강한 상관관계가 있는 것처럼 느끼게 만들고, 인과적 위험 판단을 왜곡한다.
이러한 인지적 함정들은 우리가 데이터를 해석할 때 단순히 논리 규칙을 아는 것만으로는 충분하지 않음을 시사한다. 우리 자신의 뇌가 체계적으로 우리를 속이려 한다는 사실을 인지하고, 이러한 내재된 편향에 적극적으로 저항하려는 의식적인 노력이 필요하다. 결국, 뒤이어 살펴볼 과학적 방법론들은 이러한 인간의 인지적 한계를 극복하기 위해 고안된 정교한 '탈편향(de-biasing)' 도구라고 재해석할 수 있다.
V. 과학적 도구상자: 인과관계의 확립
상관관계가 인과관계의 충분조건이 아니며, 우리의 뇌가 끊임없이 오류를 범하려 한다면, 어떻게 우리는 원인과 결과를 신뢰성 있게 규명할 수 있을까? 과학은 이러한 도전에 맞서기 위해 수 세기에 걸쳐 정교한 연구 방법론들을 발전시켜왔다. 이 방법론들은 논리적 함정을 피하고 인지적 편향을 최소화하여, 단순한 연관성을 넘어 인과적 주장에 대한 증거의 강도를 높이는 것을 목표로 한다.
황금률: 무작위 대조 시험 (RCT)
인과관계 추론의 가장 강력하고 신뢰성 높은 방법론은 '무작위 대조 시험(Randomized Controlled Trial, RCT)'이다.18 의학, 약학, 공공 정책 평가 등 다양한 분야에서 '황금률(gold standard)'로 여겨지는 RCT의 핵심은 '무작위 배정(randomization)'에 있다.
- 작동 원리: 연구자는 연구 대상을 두 개 이상의 집단으로 나눈 뒤, 어떤 집단이 특정 개입(예: 신약 투여, 새로운 교육 프로그램)을 받을지 무작위로 결정한다. 개입을 받는 집단을 '실험군(treatment group)'이라 하고, 받지 않는 집단(또는 위약(placebo)을 받는 집단)을 '대조군(control group)'이라고 한다.18 연구자는 일정 기간이 지난 후 두 집단의 결과(예: 질병 회복률, 학업 성취도)를 비교한다.
- 무작위화의 힘: 무작위 배정의 진정한 힘은 우리가 알고 있는 변수뿐만 아니라, 측정하지 못했거나 존재 자체를 모르는 잠재적인 모든 제3의 변수(교란 변수)들을 통계적으로 통제하는 데 있다.20 표본 크기가 충분히 크다면, 무작위 배정 과정을 통해 나이, 성별, 건강 상태, 생활 습관, 사회경제적 지위 등 결과에 영향을 미칠 수 있는 모든 요인들이 실험군과 대조군에 평균적으로 동일하게 분포될 것이라고 기대할 수 있다.18 그 결과, 두 집단 간의 유일한 체계적인 차이점은 '개입의 유무' 하나만 남게 된다. 따라서 연구 종료 시점에서 두 집단 간에 유의미한 결과 차이가 관찰된다면, 이는 다른 어떤 요인이 아닌 바로 그 '개입' 때문에 발생했다고 강력하게 추론할 수 있다.
- 장점과 한계: RCT는 교란 변수의 영향을 최소화하여 인과관계를 가장 명확하게 입증할 수 있는 높은 내적 타당도를 자랑한다.18 하지만 모든 경우에 적용할 수 있는 만능 해결책은 아니다. 막대한 비용과 시간이 소요될 수 있으며, 윤리적인 문제로 인해 시행이 불가능한 경우가 많다. 예를 들어, 흡연이 폐암에 미치는 영향을 알아보기 위해 사람들을 무작위로 흡연 그룹과 비흡연 그룹에 배정하여 수십 년간 관찰하는 것은 비윤리적이다.22 또한, 통제된 실험 환경이 실제 현실 세계의 복잡성을 제대로 반영하지 못할 수도 있다는 한계도 존재한다.
강력한 대안: 관찰 연구
RCT가 불가능하거나 비현실적인 경우, 연구자들은 '관찰 연구(Observational Study)'를 통해 인과관계의 단서를 찾는다. 관찰 연구는 연구자가 변수를 직접 조작하거나 개입하지 않고, 현실 세계에서 자연적으로 발생하는 현상을 관찰하고 분석하는 방법이다.
- 코호트 연구 (Cohort Study):
관찰 연구 중에서 인과관계 추론에 가장 강력한 설계 중 하나는 코호트 연구이다.23 코호트 연구는 특정 특성을 공유하는 집단(코호트)을 설정하고, 이들을 장기간에 걸쳐 추적 관찰하는 연구이다.24 연구 시작 시점에서 특정 요인(예: 특정 화학물질 노출, 특정 식습관)에 노출된 집단과 노출되지 않은 집단을 구분한 뒤, 미래에 특정 결과(예: 질병 발생)가 각 집단에서 얼마나 발생하는지를 비교한다.
- 인과 추론에서의 강점: 코호트 연구의 가장 큰 강점은 '시간적 선행성'을 명확히 확립할 수 있다는 점이다. 연구 시작 시점에 모든 대상자는 결과(질병)를 가지고 있지 않으며, 노출 여부를 먼저 측정한 후 시간의 흐름에 따라 결과를 관찰한다. 이는 원인이 결과보다 앞선다는 인과관계의 핵심 조건을 충족시킨다.22
- 약점: RCT와 달리 노출이 무작위로 배정되지 않기 때문에, 교란 변수의 영향을 완벽하게 통제하기 어렵다. 예를 들어, 특정 식습관을 가진 사람들은 다른 생활 습관(운동, 흡연 여부 등)에서도 차이를 보일 수 있으며, 이러한 요인들이 결과에 영향을 미칠 수 있다.22 연구자들은 정교한 통계 기법을 사용하여 알려진 교란 변수들을 보정하려 노력하지만, 알려지지 않은 변수의 영향은 여전히 남을 수 있다.
증거의 종합: 브래드포드 힐 기준
단 하나의 연구만으로 인과관계를 확립하는 것은 거의 불가능하다. 특히 RCT가 불가능한 복잡한 문제(예: 흡연과 폐암의 관계)에 대해서는, 다양한 연구에서 나온 증거들을 종합적으로 평가하여 인과적 결론에 도달해야 한다. 1965년 영국의 역학자 오스틴 브래드포드 힐(Austin Bradford Hill)은 흡연과 폐암의 연관성을 평가하면서, 관찰된 연관성이 인과관계일 가능성을 판단하는 데 도움이 되는 9가지 기준을 제시했다.25 이 기준들은 엄격한 체크리스트가 아니라, 종합적인 추론을 위한 가이드라인으로 활용된다.
표 2: 인과관계 추론을 위한 브래드포드 힐 9가지 기준 25
| 기준 | 설명 |
| 1. 연관성의 강도 (Strength) | 연관성이 강할수록 (예: 상대위험도가 매우 높을수록) 인과관계일 가능성이 높다. |
| 2. 일관성 (Consistency) | 다른 연구자, 다른 장소, 다른 시점, 다른 연구 설계에서도 동일한 연관성이 반복적으로 관찰된다. |
| 3. 특이성 (Specificity) | 특정 노출이 다른 여러 결과가 아닌, 특정한 단일 결과로 이어지는 경향이 있다.26 |
| 4. 시간성 (Temporality) | 원인은 반드시 결과보다 시간적으로 앞서야 한다. (필수불가결한 조건) |
| 5. 생물학적 농도-반응 관계 (Biological Gradient) | 노출의 양(농도, 기간)이 증가함에 따라 결과의 발생 위험도 비례하여 증가한다. |
| 6. 개연성 (Plausibility) | 관찰된 연관성을 설명할 수 있는 생물학적 또는 사회학적 메커니즘이 존재한다. |
| 7. 일치성 (Coherence) | 해당 인과관계 가설이 기존에 알려진 과학적 지식이나 질병의 자연사와 충돌하지 않는다. |
| 8. 실험적 증거 (Experiment) | 통제된 실험(예: 동물 실험, 또는 RCT)을 통해 연관성이 뒷받침된다. |
| 9. 유사성 (Analogy) | 유사한 다른 노출 요인이 유사한 결과를 초래한다는 사실이 이미 알려져 있다. |
이러한 과학적 도구들은 상관관계라는 원석을 인과관계라는 보석으로 제련하는 과정과 같다. 각 방법론은 고유한 강점과 약점을 지니고 있으며, 어떤 단일 방법도 완벽한 해답을 제공하지는 않는다. 신뢰할 수 있는 인과적 지식은 다양한 방법론을 통해 축적된 증거들이 일관된 방향을 가리킬 때 비로소 구축될 수 있다.
VI. 철학적 뿌리: 흄의 회의주의와 인과관계의 본질
상관관계와 인과관계의 구분이 통계학과 과학 방법론의 영역을 넘어, 인간 지식의 근본적인 한계와 본질에 대한 깊은 철학적 질문과 맞닿아 있음을 이해하는 것은 이 문제를 더욱 심오하게 만든다. 18세기 스코틀랜드의 철학자 데이비드 흄(David Hume)은 인과관계 개념 자체에 대해 근본적인 회의주의를 제기하며, 이 논의의 지평을 완전히 바꾸어 놓았다.
귀납의 문제와 흄의 도전
흄은 우리가 과연 '인과관계' 그 자체를 경험할 수 있는지에 대해 의문을 던졌다.27 그의 주장에 따르면, 우리가 경험하는 것은 오직 한 사건(A)이 다른 사건(B)에 뒤이어 발생하는 것뿐이다. 예를 들어, 당구대 위에서 흰 공이 빨간 공을 때리고(사건 A), 그 직후 빨간 공이 움직이는 것(사건 B)을 우리는 관찰한다. 이러한 관찰이 수없이 반복될 때, 우리는 A와 B 사이에 '인과관계'가 있다고 말한다.
그러나 흄은 우리가 아무리 면밀히 관찰하더라도, A가 B를 '필연적으로' 발생시키는 어떤 숨겨진 힘이나 연결고리 자체를 직접 지각할 수는 없다고 주장했다. 우리가 실제로 관찰하는 것은 두 사건의 '항상적 결합(constant conjunction)'에 불과하다.28 즉, 과거의 경험 속에서 A 유형의 사건 다음에는 항상 B 유형의 사건이 뒤따라왔다는 규칙성만을 인지할 뿐이다.29
항상적 결합 대 필연적 연결
그렇다면 우리는 왜 이 단순한 시간적 계승 관계에 '원인'과 '결과'라는 특별한 지위를 부여하고, 둘 사이에 '필연적 연결(necessary connection)'이 존재한다고 믿는 것일까? 흄의 혁신적인 답변은 그 믿음이 외부 세계의 객관적 속성이 아니라, 우리 마음의 습관에서 비롯된다는 것이다.30
반복적으로 A와 B의 결합을 경험한 우리의 마음은, A를 관찰하면 습관적으로 B를 기대하게 된다. 이 심리적 기대감, 즉 미래에도 과거의 규칙성이 반복될 것이라는 믿음이 바로 우리가 '필연성'이라고 부르는 것의 정체이다. 다시 말해, 인과관계는 세계에서 우리가 '발견'하는 것이 아니라, 반복된 경험을 통해 형성된 우리 마음의 습관을 세계에 '투사'한 결과물이라는 것이다. 우리는 인과관계 자체를 경험하는 것이 아니라, 단지 반복적인 패턴을 보고 습관적으로 두 사건을 연결할 뿐이다.28
과학에 대한 함의
흄의 이러한 주장은 과학적 지식의 근간을 뒤흔드는 심오한 함의를 지닌다. 만약 인과관계가 객관적 실재가 아닌 심리적 습관에 불과하다면, 귀납적 추론에 기반한 모든 과학 법칙(예: "모든 물체는 중력의 영향을 받는다")의 확실성은 보장될 수 없다. 내일 아침에도 태양이 뜰 것이라는 우리의 믿음은 논리적 필연성이 아니라, 지금까지 매일 그래왔다는 과거의 경험에 기반한 개연적인 기대일 뿐이다.29
이러한 철학적 관점은 "상관관계는 인과관계가 아니다"라는 명제에 새로운 깊이를 더한다. 흄의 시각에서 보면, 우리가 상관관계(항상적 결합)에서 인과관계(필연적 연결)로 도약하는 것은 단지 논리적 오류가 아니라, 인간 정신의 근본적인 작동 방식 그 자체이다. 그러나 그 도약은 궁극적으로 이성적 정당화를 결여하고 있다.
따라서 5장에서 논의된 과학적 방법론들은 흄이 제기한 심오한 인식론적 문제에 대한 실용적인 답변으로 재해석될 수 있다. 과학은 흄이 불가능하다고 본 '절대적이고 형이상학적인 인과관계 증명'을 목표로 하는 것이 아니다. 대신, 무작위 대조 시험이나 브래드포드 힐 기준과 같은 엄격한 절차를 통해, 특정 연관성이 단순한 우연이나 심리적 습관의 산물이 아님을 '합리적인 의심의 여지가 없는 수준까지' 보여주려 노력한다. 과학은 절대적 확실성을 추구하는 대신, 예측과 개입을 가능하게 하는 신뢰성 높은 인과적 지식 체계를 구축하는 것을 목표로 한다. 결국, 과학적 인과 추론의 전체 과정은 흄의 회의주의를 극복하려는 인류의 장대한 지적 투쟁이라고 볼 수 있다.
VII. 결론: 지혜롭게 패턴의 세계를 항해하기
"상관관계는 인과관계가 아니다"라는 간결한 경고는 데이터로 가득 찬 현대 사회를 살아가는 우리에게 단순한 통계학적 원칙을 넘어선 깊은 지혜를 담고 있다. 본 보고서는 이 명제를 다각적으로 분석하며, 그것이 논리적, 심리적, 방법론적, 그리고 철학적 차원을 아우르는 비판적 사고의 핵심임을 보였다.
우리는 먼저 상관관계가 두 변수 간의 동반 변화를 기술하는 통계적 '패턴'에 불과한 반면, 인과관계는 하나의 변수가 다른 변수를 유발하는 근본적인 '프로세스'에 대한 강력한 주장임을 명확히 했다. 그리고 하나의 상관관계가 관찰되었을 때, 그것이 순전한 우연, 숨겨진 제3의 변수, 인과관계의 역전, 혹은 복잡한 상호작용의 결과일 수 있다는 다섯 가지 논리적 가능성을 탐구했다. 이러한 논리적 함정들은 우리의 뇌가 생존을 위해 패턴을 찾고 성급하게 인과관계를 추론하도록 진화해 온 깊은 심리적 경향성, 즉 착각 상관, 확증 편향, 가용성 휴리스틱과 같은 인지 편향에 의해 더욱 강화된다.
이러한 인간의 내재적 한계를 극복하기 위해 과학은 무작위 대조 시험(RCT)과 같은 엄격한 실험 설계와 코호트 연구, 브래드포드 힐 기준과 같은 정교한 관찰 및 추론의 도구들을 발전시켜왔다. 이 도구들은 우리로 하여금 패턴의 유혹에서 한 걸음 물러나, 증거에 기반하여 신중하게 인과적 결론을 내리도록 돕는다. 더 나아가 데이비드 흄의 철학적 고찰은 인과관계 개념 자체가 지닌 인식론적 불확실성을 드러내며, 과학적 방법론이 절대적 진리를 증명하는 것이 아니라, 합리적 의심을 넘어선 수준의 신뢰성 있는 지식을 구축하는 과정임을 일깨워주었다.
이 모든 논의를 종합할 때, 우리는 상관관계가 결코 무가치한 것이 아님을 인지해야 한다. 상관관계는 인과관계 탐구의 필수적인 출발점이며, 어디를 더 깊이 파고들어야 할지 알려주는 소중한 신호이다. 수많은 위대한 과학적 발견은 "왜 이 두 변수가 함께 움직이는가?"라는 질문, 즉 상관관계에 대한 호기심에서 시작되었다. 우리가 경계해야 할 것은 상관관계를 '발견'하는 행위가 아니라, 그곳에서 '탐구를 멈추는' 태도이다.
이러한 이해는 우리 각자에게, 그리고 사회 전체에 중요한 시사점을 던진다.
- 개인에게는 인지적 겸손을 요구한다. 자신의 직관이 얼마나 쉽게 패턴에 현혹될 수 있는지를 인정하고, 매력적인 서사에 안주하기보다 반대 증거를 찾아보려는 노력이 필요하다. "혹시 다른 설명은 없을까?"라는 질문을 습관화하는 것이 비판적 사고의 시작이다.
- 미디어와 정책 결정자에게는 막중한 사회적 책임을 부과한다. 연구 결과를 보도하거나 정책을 수립할 때, 연관성과 인과성을 신중하게 구분하여 대중의 오해를 막고, 허위 상관에 기반한 비효율적이거나 심지어 해로운 정책이 시행되는 것을 방지해야 한다.15
- 미래를 향해서는 새로운 시대의 문해력(literacy)을 제시한다. 인공지능과 빅데이터 알고리즘이 인간이 인지하지 못하는 수많은 상관관계를 끊임없이 찾아내는 시대에, 그 패턴의 의미를 해석하고 "왜"라는 질문을 던지는 인간의 비판적 판단 능력은 그 어느 때보다 중요해질 것이다.
결론적으로, 상관관계와 인과관계를 구분하는 능력은 단순히 데이터를 다루는 기술이 아니라, 불확실성 속에서 현명한 판단을 내리고, 복잡한 세상의 본질에 더 가까이 다가가려는 지적 태도 그 자체이다. 이 능력을 연마하는 것은 21세기를 살아가는 우리 모두에게 주어진 과제이자, 더 나은 미래를 만들기 위한 지혜의 초석이다.
참고 자료
- [이동귀의 심리학이야기] 급한 약속 있을 땐 늘 빨간불? 우연인데 관련성 과장해 생각, 10월 24, 2025에 액세스, http://newsteacher.chosun.com/site/data/html_dir/2019/05/23/2019052300389.html
- 인과관계와 상관관계의 차이와 그 사례들, 10월 24, 2025에 액세스, https://cosmy.tistory.com/entry/%EC%9D%B8%EA%B3%BC%EA%B4%80%EA%B3%84%EC%99%80-%EC%83%81%EA%B4%80%EA%B4%80%EA%B3%84%EC%9D%98-%EC%B0%A8%EC%9D%B4%EC%99%80-%EA%B7%B8-%EC%82%AC%EB%A1%80%EB%93%A4
- 인지 편향 - 위키백과, 우리 모두의 백과사전, 10월 24, 2025에 액세스, https://ko.wikipedia.org/wiki/%EC%9D%B8%EC%A7%80_%ED%8E%B8%ED%96%A5
- 기초 통계 분석 4 : 관계 - 상관관계 & 인과관계 - YouTube, 10월 24, 2025에 액세스, https://www.youtube.com/watch?v=A8aZzvaRbz0
- [개념정리] 상관관계 vs 인과관계 - velog, 10월 24, 2025에 액세스, https://velog.io/@euisuk-chung/%EA%B0%9C%EB%85%90%EC%A0%95%EB%A6%AC-%EC%83%81%EA%B4%80%EA%B4%80%EA%B3%84-vs-%EC%9D%B8%EA%B3%BC%EA%B4%80%EA%B3%84
- 재미있는 통계 44상관관계와 인과관계 - 생글생글, 10월 24, 2025에 액세스, https://sgsg.hankyung.com/article/2006041234291
- [그림으로 완벽정리 :: 통계학] 인과관계 vs 상관관계? - YouTube, 10월 24, 2025에 액세스, https://www.youtube.com/watch?v=cSA-ys8Xokk
- 상관관계와 인과관계 - 나무위키, 10월 24, 2025에 액세스, https://namu.wiki/w/%EC%83%81%EA%B4%80%EA%B4%80%EA%B3%84%EC%99%80%20%EC%9D%B8%EA%B3%BC%EA%B4%80%EA%B3%84
- 상관관계와 인과관계 - 위키백과, 우리 모두의 백과사전, 10월 24, 2025에 액세스, https://ko.wikipedia.org/wiki/%EC%83%81%EA%B4%80%EA%B4%80%EA%B3%84%EC%99%80_%EC%9D%B8%EA%B3%BC%EA%B4%80%EA%B3%84
- 상관관계 및 인과관계 - JMP, 10월 24, 2025에 액세스, https://www.jmp.com/ko/statistics-knowledge-portal/what-is-correlation/correlation-vs-causation
- 재미있는 통계이야기 45 인과관계의 방향 | 생글생글, 10월 24, 2025에 액세스, https://sgsg.hankyung.com/article/2006041850611
- 상관관계와 인과관계 / 개념과 차이점! - 대전 소리통, 10월 24, 2025에 액세스, https://goldcham.tistory.com/1121
- 상관관계와 인과관계 (r28 판) - 나무위키, 10월 24, 2025에 액세스, https://namu.wiki/w/%EC%83%81%EA%B4%80%EA%B4%80%EA%B3%84%EC%99%80%20%EC%9D%B8%EA%B3%BC%EA%B4%80%EA%B3%84?uuid=03f5032b-ef77-4d64-b9e9-4ecdb71c0d34
- 운이 나쁘다고 느낀다면, 착각적 상관을 확인해보세요 | 하루잇문학 - 교보생명, 10월 24, 2025에 액세스, https://www.kyobo.com/dgt/web/kbstory/contents/detail/879
- 상관관계 환상: 인과 착각과 확증 편향 - FasterCapital, 10월 24, 2025에 액세스, https://fastercapital.com/ko/content/%EC%83%81%EA%B4%80%EA%B4%80%EA%B3%84-%ED%99%98%EC%83%81--%EC%9D%B8%EA%B3%BC-%EC%B0%A9%EA%B0%81%EA%B3%BC-%ED%99%95%EC%A6%9D-%ED%8E%B8%ED%96%A5.html
- 휴리스틱스(heuristics): 의사 결정에서 유용성 오류(availability heuristic), 대표성 오류(representativeness heuristic), 고착과 조정오류(anchoring and adjustment heuristic)의 원인 - 인간바다, 10월 24, 2025에 액세스, https://seaofhuman.tistory.com/entry/%ED%9C%B4%EB%A6%AC%EC%8A%A4%ED%8B%B1%EC%8A%A4heuristics-%EC%9D%98%EC%82%AC-%EA%B2%B0%EC%A0%95%EC%97%90%EC%84%9C-%EC%9C%A0%EC%9A%A9%EC%84%B1-%EC%98%A4%EB%A5%98availability-heuristic-%EB%8C%80%ED%91%9C%EC%84%B1-%EC%98%A4%EB%A5%98representativeness-heuristic-%EA%B3%A0%EC%B0%A9%EA%B3%BC-%EC%A1%B0%EC%A0%95%EC%98%A4%EB%A5%98anchoring-and-adjustment-heuristic%EC%9D%98-%EC%9B%90%EC%9D%B8
- 가용성 휴리스틱 - 위키백과, 우리 모두의 백과사전, 10월 24, 2025에 액세스, https://ko.wikipedia.org/wiki/%EA%B0%80%EC%9A%A9%EC%84%B1_%ED%9C%B4%EB%A6%AC%EC%8A%A4%ED%8B%B1
- Observational Study - 비전공자 데이터분석 노트 - 티스토리, 10월 24, 2025에 액세스, https://bigdaheta.tistory.com/121
- 업로드용.pptx, 10월 24, 2025에 액세스, https://www.gachon.ac.kr/bbs/gradhealth/529/117765/download.do
- 무작위 대조 시험 - 위키백과, 우리 모두의 백과사전, 10월 24, 2025에 액세스, https://ko.wikipedia.org/wiki/%EB%AC%B4%EC%9E%91%EC%9C%84_%EB%8C%80%EC%A1%B0_%EC%8B%9C%ED%97%98
- RCT의 목적 [질문] : r/statistics - Reddit, 10월 24, 2025에 액세스, https://www.reddit.com/r/statistics/comments/yyuw97/the_purpose_of_rcts_q/?tl=ko
- [양적연구] 관찰 연구 방법 연구 설계 II: 코호트, 횡단면 및 사례 대조 연구, 10월 24, 2025에 액세스, https://meded.tistory.com/499
- 3.6. 코호트 연구(cohort study) - 이원진 (Lee, Won Jin), 10월 24, 2025에 액세스, https://www.wonjinlee.com/%EB%B0%A9%EC%82%AC%EC%84%A0-%EC%97%AD%ED%95%99radiation-epidemiology/3-%EC%97%AD%ED%95%99%EC%97%B0%EA%B5%AC%EB%B0%A9%EB%B2%95epidemiological-study-design/3-6-%EC%BD%94%ED%98%B8%ED%8A%B8-%EC%97%B0%EA%B5%ACcohort-study
- 연구설계, 10월 24, 2025에 액세스, http://contents.kocw.or.kr/KOCW/document/2014/honam/leedongwoo/3.pdf
- 브래드포드 힐 판정 - 위키백과, 우리 모두의 백과사전, 10월 24, 2025에 액세스, https://ko.wikipedia.org/wiki/%EB%B8%8C%EB%9E%98%EB%93%9C%ED%8F%AC%EB%93%9C_%ED%9E%90_%ED%8C%90%EC%A0%95
- 힐의 기준 - 나무위키, 10월 24, 2025에 액세스, https://namu.wiki/w/%ED%9E%90%EC%9D%98%20%EA%B8%B0%EC%A4%80
- 데이비드 흄 (r310 판) - 나무위키, 10월 24, 2025에 액세스, https://namu.wiki/w/%EB%8D%B0%EC%9D%B4%EB%B9%84%EB%93%9C%20%ED%9D%84?uuid=45d54bf6-9e91-4d32-bedf-d33ad41f02ba
- 데이비드 흄 - 위키백과, 우리 모두의 백과사전, 10월 24, 2025에 액세스, https://ko.wikipedia.org/wiki/%EB%8D%B0%EC%9D%B4%EB%B9%84%EB%93%9C_%ED%9D%84
- 데이빗 흄, <인간의 이해력에 관한 탐구> 요약 - theatrum mundi, 10월 24, 2025에 액세스, https://diephilosophin.tistory.com/48
- 데이비드 흄의 '인상'과 '관념' - 이해를 추구하는 신앙, 10월 24, 2025에 액세스, https://antlema.tistory.com/entry/%EB%8D%B0%EC%9D%B4%EB%B9%84%EB%93%9C-%ED%9D%84%EC%9D%98-%EC%9D%B8%EC%83%81%EA%B3%BC-%EA%B4%80%EB%85%90

이 이미지는 여섯 개의 개별 그래프(Fig. 1부터 Fig. 6)로 구성되어 있으며, 각 그래프는 서로 상관관계가 없어 보이는 두 가지 데이터 세트의 추이를 비교하고 있습니다. 이는 종종 상관관계가 인과관계를 의미하지 않는다는 점을 유머러스하게 또는 시각적으로 보여주기 위해 사용되는 방식입니다.
각 그래프의 내용은 다음과 같습니다:
Fig. 1 - 페이스북이 그리스 부채 위기를 몰고 있는가?
- 검은색 선: 활성 페이스북 사용자 수 (2005년 550만 명 $\rightarrow$ 2011년 7억 5천만 명)
- 노란색 선: 10년 만기 그리스 국채 수익률 (2005년 3.6% $\rightarrow$ 2011년 16.82%)
- 두 데이터 모두 유사하게 증가하는 추세를 보입니다.
Fig. 2 - 지구 온난화는 과학자들이 퍼뜨린 거짓말인가?
- 검은색 선: 평균 지구 기온 (1993년 기준 1950-1980년 평균 대비 $+0.13^\circ\text{C}$ $\rightarrow$ 2009년 $+0.63^\circ\text{C}$)
- 노란색 선: 미국 국립과학재단(NSF) 연구개발(R&D) 예산 (1993년 $698억 $\rightarrow$ 2009년 $1469억)
- 두 데이터 모두 전반적으로 증가하는 추세를 보입니다.
Fig. 3 - "Ava"라는 이름이 미국 주택 거품을 야기했는가?
- 검은색 선: "Ava"라고 명명된 아기 수 (1991년 281명 $\rightarrow$ 2009년 15,826명)
- 노란색 선: 주택 가격 지수 (1991년 100 $\rightarrow$ 2009년 193.74)
- 두 데이터 모두 2000년대 중반까지 증가하다가 이후 하락하는 유사한 패턴을 보입니다.
Fig. 4 - 사람들이 신문을 더 많이 사면 M. 나이트 샤말란이 다시 좋은 영화를 만들까?
- 검은색 선: 샤말란 영화의 로튼 토마토 평점 (1999년 '식스 센스' 85% $\rightarrow$ 2010년 '라스트 에어벤더' 6%)
- 노란색 선: 총 신문 광고 판매액 (1999년 $462억 8천만 $\rightarrow$ 2010년 $227억 9천 5백만)
- 두 데이터 모두 시간이 지남에 따라 감소하는 추세를 보입니다.
Fig. 5 - 구글 검색 트렌드가 미셸 바흐만(Michele Bachmann)의 출마에 영향을 미쳤는가?
- 검은색 선: 스테이튼 아일랜드 케이크에 대한 구글 트렌드 지수 (2011년 6월 4.8% $\rightarrow$ 2011년 11월 3.3%)
- 노란색 선: 미셸 바흐만의 여론조사 평균 (2011년 6월경 높았다가 이후 하락)
- 두 데이터는 2011년 6월부터 11월 사이에 변동성이 크며 어느 정도 유사한 패턴을 공유합니다.
Fig. 6 - 이 산악 지형의 비율이 살인율에 영향을 미치는가?
- 검은색 선: 뉴욕주의 살인 사건 수 (1965년 836건 $\rightarrow$ 2015년 866건)
- 노란색 선: 산악 지형을 형상화한 듯한 그래프 (특정 데이터가 명시되어 있지는 않으나, 시각적으로 살인 사건 수 그래프와는 다른 패턴을 보임)
- 이 그래프는 산의 형태와 살인율의 변화를 시각적으로 대조하여 보여줍니다. (실제 데이터의 상관관계가 아닌, 산의 높이와 살인율을 연결하려는 시도 자체가 비논리적임을 보여줍니다.)


'學而 > 토피카' 카테고리의 다른 글
| 디오티마의 '사랑의 사다리'(The ladder of love) _ 플라톤의 『향연』 (1) | 2025.10.26 |
|---|---|
| [허성원 변리사 칼럼]#206 책임이 멈추는 곳에서 신뢰가 시작된다 (0) | 2025.10.25 |
| 사랑이란 _ 플라톤의 『향연』 (1) | 2025.10.23 |
| 스테이블 코인 (2) | 2025.10.22 |
| 동일결과성(Equifinality) (1) | 2025.10.21 |