FMB819: R을 이용한 데이터분석
인과관계(Causality) vs. 상관관계(Correlation)
잠재 결과 프레임워크(Potential Outcomes Framework)
무작위 통제 실험(Randomized Controlled Trials, RCTs)
학급 규모(class size)와 학생 성취(student performance)에 대한 실증 분석 심화
“상관관계는 인과관계가 아니다”라는 말은 매우 흔하게 사용됨.
그런데 왜 이것이 사실인지 설명할 수 있는가?
일부 상관관계는 명백히 인과관계를 의미하지 않음.
(예: 가짜 상관관계 모음 링크)

상관관계와 인과관계를 구분하기 어려운 경우가 잦음.
흡연이 폐암을 유발하는가?
오늘날 우리는 답이 “예(YES)”라는 것을 알고 있음!
하지만 1950년대에는…

거시적 교란 요인 (Macro Confounding Factors)
폐암을 유발할 수 있는 다른 거시적 요인들도 1900년~1950년 사이에 변화했음:
자기 선택 편향 (Self Selection)
흡연자와 비흡연자는 원래부터 다를 가능성이 있음:
관측 가능한 특징에 따른 선택(selection on observables): 연령, 교육 수준, 소득 등.
관측 불가능한 특징에 따른 선택(selection on unobservables): 유전자?
교육 연수(years of education) \(\rightarrow\) 소득?
최저임금 \(\rightarrow\) 고용률(employment rate)? - 정책 결정자들은 고용률이 높은 시기에 최저임금을 인상할 가능성이 있음. \(\rightarrow\) 역인과관계(reverse causality) / 동시성(simultaneity)
금융 발전 \(\rightarrow\) 경제 성장?
개인은 자신의 효용(utility)을 극대화(maximise)하기 위해 행동한다면…
개인들은 무작위(random ways)로 행동하지 않음. \(\rightarrow\) 즉, 개인의 행동은 내생적(endogenous)이라고 볼 수 있음.
데이터에서 발견된 상관관계를 무조건 믿어서는 안 됨. 언제나 의심하는 태도가 필요함.
📌 그렇다면, 어떻게 인과적 주장(causal claims)을 할 수 있을까?
잠재 결과 프레임워크(Potential Outcomes Framework)가 유용한 길잡이.
인과관계(Causality)란 무엇을 의미하는가?
X가 Y를 유발한다(causes)… 의미?
만약 다른 모든 것은 그대로 둔 채 우리가 X의 값을 변경(intervene and change)한다면,
그 결과로 Y도 변화하게 된다는 의미.
여기서 핵심은 “다른 모든 것은 그대로 둔다”는 가정임.
이는 흔히 “세테리스 파리부스(ceteris paribus, all else equal)” 가정이라고 불림.
하지만, 이것은 X가 Y를 유발하는 유일한 요인이라는 뜻이 아님!
이 모델은 Rubin의 인과 모델(Rubin Causal Model)이라고도 불리며, 통계학자 Donald Rubin이 1970년대에 이를 일반화하고 체계화함.
핵심 아이디어 (Key Idea)
각 개인은 여러 개의 대체적 처치 상태(alternative treatment states)에 노출될 수 있음.
처치 변수 \(D_i\)를 이진 변수(binary variable)로 정의 $$
\[ D_i = \begin{cases} 1 \textrm{ if individual $i$ is treated} \\\\ 0 \textrm{ if individual $i$ is not treated} \end{cases} \]
✅ Treatment group
all the individuals such that \(D_i = 1\).
❌ Control group
all the individuals such that \(D_i = 0\).
이 프레임워크에서는 각 개인이 두 개의 잠재적 결과(potential outcomes)를 가짐. 하지만 실제로는 하나의 관측된 결과(observed outcome) \(Y_i\)만 확인 가능함.
현실에서는 단 하나의 결과 \(Y_i\)만을 관측할 수 있으며, 이는 다음과 같이 표현됨: \[ Y_i = D_i \times Y_i^1 + (1- D_i) \times Y_i^0 \]
🔥 인과 추론의 근본적인 문제 (Fundamental Problem of Causal Inference) 어떤 개인 \(i\)에 대해, 두 개의 잠재적 결과 중 오직 하나만 관측할 수 있음. (Holland, 1986).
| Group | \(Y_i^1\) | \(Y_i^0\) |
|---|---|---|
| 처치 그룹 \((D_i = 1)\) | ✅ 관측 가능 (Observed as \(Y_i\)) | ❌ 반사실적 결과 (Counterfactual) |
| 통제 그룹 \((D_i = 0)\) | ❌ 반사실적 결과 (Counterfactual) | ✅ 관측 가능 (Observed as \(Y_i\)) |
위 개념을 바탕으로, 개별 처치 효과(individual treatment effect) \(\delta_i\)를 정의할 수 있음. \[ \delta_i = Y_i^1 - Y_i^0 \]
\(\delta_i\)는 처치 \((D_i)\)가 개인 \(i\)의 결과 변수 \(Y\)에 미치는 인과적 효과(causal effect)를 측정함.
⚠️ 핵심 문제: 개별 처치 효과 \(\delta_i\)는 개인 수준에서는 절대 관측할 수 없음! 대안: 집단 평균(population averages)을 이용.
🎲 주사위를 무한히 던지면 평균적으로 몇이 나올까?
\[ \mathop{\mathbb{E}}(X) = \frac{1}{6} \times 1 + \frac{1}{6} \times 2 + \frac{1}{6} \times 3 + \frac{1}{6} \times 4 + \frac{1}{6} \times 5 + \frac{1}{6} \times 6 = 3.5 \]
\(\mathop{\mathbb{E}}(\cdot)\) 연산자는 기대값(expectation) 또는 모집단 평균(population mean)을 의미함.
\(\mathop{\mathbb{E}}(\cdot)\) 연산자는 선형(linear) 연산자이므로,
\[ \mathop{\mathbb{E}}(X+Y) = \mathop{\mathbb{E}}(X) + \mathop{\mathbb{E}}(Y) \] - 여기서 \(X\)와 \(Y\)는 두 개의 확률 변수임.
🎲 두 개의 주사위를 던질 때, 한 주사위가 5일 경우, 합의 평균은?
\(X\)가 첫 번째 주사위의 숫자를 나타내는 확률 변수, \(Y\)가 두 번째 주사위의 숫자를 나타내는 확률 변수라 하면:
\[ \begin{align} \mathop{\mathbb{E}}(X+Y|Y = 5) &= \mathop{\mathbb{E}}(X|Y = 5) + \mathop{\mathbb{E}}(Y|Y = 5) \\ &= \mathop{\mathbb{E}}(X) + 5 \\ &= 3.5 + 5 \\ &= 8.5 \end{align} \]
\[ \begin{align} ATE &= \mathop{\mathbb{E}}(\delta_i) \\ &= \mathop{\mathbb{E}}(Y_i^1 - Y_i^0) \\ &= \mathop{\mathbb{E}}(Y_i^1) - \mathop{\mathbb{E}}(Y_i^0) \end{align} \]
🔗 부록(Appendix): 처치군에 대한 평균 처치 효과(ATT)와 비처치군에 대한 평균 처치 효과(ATU)
| 학생 | \(Y^1\) | \(Y^0\) | \(\delta\) |
|---|---|---|---|
| 1 | 5 | 2 | 3 |
| 2 | 6 | 4 | 2 |
| 3 | 3 | 6 | -3 |
| 4 | 5 | 4 | 1 |
| 5 | 10 | 8 | 2 |
| 6 | 2 | 4 | -2 |
| 7 | 5 | 2 | 3 |
| 8 | 6 | 4 | 2 |
| 9 | 2 | 9 | -7 |
| 10 | 8 | 2 | 6 |
| 평균 | 5.2 | 4.5 | 0.7 |
\[ \begin{align} \color{#d90502}{\text{ATE}} &= \mathbb{E}(\delta) \\ &=\mathbb{E}(Y^1) - \mathbb{E}(Y^0) \\ &= 5.2 - 4.5 \\ &= 0.7 \end{align} \]
\(\rightarrow\) 소규모 학급이 대규모 학급보다 평균적으로 GPA를 0.7점 높이는 효과가 있음.
-📊 데이터를 이용하면, 처치군과 통제군의 단순 평균 차(Simple Difference in mean Outcomes, SDO)가 계산됨.
\[ \begin{align} SDO &= \mathop{\mathbb{E}}(Y_i^1|D_i=1) - \mathop{\mathbb{E}}(Y_i^0|D_i=0) \\ &= \underbrace{\frac{1}{N_T}\sum_{i=1}^{N_T}(Y_i|D_i=1)}_{\text{처치군의 평균 결과}} - \underbrace{\frac{1}{N_C}\sum_{i=1}^{N_C}(Y_i|D_i=0)}_{\text{통제군의 평균 결과}} \end{align} \]
| 학생 | \(Y^1\) | \(Y^0\) | \(\delta\) | \(Y\) | \(D\) |
|---|---|---|---|---|---|
| 1 | 5 | 2 | 3 | ||
| 2 | 6 | 4 | 2 | ||
| 3 | 3 | 6 | -3 | ||
| 4 | 5 | 4 | 1 | ||
| 5 | 10 | 8 | 2 | ||
| 6 | 2 | 4 | -2 | ||
| 7 | 5 | 2 | 3 | ||
| 8 | 6 | 4 | 2 | ||
| 9 | 2 | 9 | -7 | ||
| 10 | 8 | 2 | 6 | ||
| 평균 | 0.7 |
| 학생 | \(Y^1\) | \(Y^0\) | \(\delta\) | \(Y\) | \(D\) |
|---|---|---|---|---|---|
| 1 | 5 | 2 | 3 | 5 | 1 |
| 2 | 6 | 4 | 2 | 6 | 1 |
| 3 | 3 | 6 | -3 | 6 | 0 |
| 4 | 5 | 4 | 1 | 5 | 1 |
| 5 | 10 | 8 | 2 | 10 | 1 |
| 6 | 2 | 4 | -2 | 4 | 0 |
| 7 | 5 | 2 | 3 | 5 | 1 |
| 8 | 6 | 4 | 2 | 6 | 1 |
| 9 | 2 | 9 | -7 | 9 | 0 |
| 10 | 8 | 2 | 6 | 8 | 1 |
| 평균 | 0.7 |
| 학생 | \(Y\) (관측값) | \(D\) | \(\delta\) |
|---|---|---|---|
| 1 | 5 | 1 | 3 |
| 2 | 6 | 1 | 2 |
| 3 | 6 | 0 | -3 |
| 4 | 5 | 1 | 1 |
| 5 | 10 | 1 | 2 |
| 6 | 4 | 0 | -2 |
| 7 | 5 | 1 | 3 |
| 8 | 6 | 1 | 2 |
| 9 | 9 | 0 | -7 |
| 10 | 8 | 1 | 6 |
| 평균 | 0.7 |
🔢 단순 평균 차이 (SDO) 계산
\[ \begin{align} SDO &= \frac{5+6+5+10+5+6+8}{7} - \frac{6+4+9}{3} \\ &\approx 6.43 - 6.33 \approx 0.1 \end{align} \]
📌 SDO 값이 ATE(0.7)보다 작음!
📌 이러한 차이는 인과관계를 제대로 반영하지 못할 가능성이 높음.
📌 이런 “단순 비교”를 하면 안됨.
📌 단순 평균 차이 (SDO)를 다시 작성하여 개별 처치 효과 \((\delta_i)\)가 나타나도록 변형 \[ \begin{align} SDO &= \mathop{\mathbb{E}}(Y_i^1|D_i=1) - \mathop{\mathbb{E}}(Y_i^0|D_i=0) \\ &= \mathop{\mathbb{E}}(Y_i^0 + \delta_i | D_i = 1) - \mathop{\mathbb{E}}(Y_i^0 | D_i = 0) \end{align} \]
✨ 가정: 모든 개인에 대해 처치 효과가 일정하다고 가정 하자. (즉, \(\delta_i = \delta\)) \[ SDO = \delta + \mathop{\mathbb{E}}(Y_i^0 | D_i = 1) - \mathop{\mathbb{E}}(Y_i^0 | D_i = 0) \]
그리고, \[ ATE = \mathop{\mathbb{E}}(\delta_i) = \mathop{\mathbb{E}}(\delta) = \delta \]
(위 가정에 의해) 따라서: \[ \begin{equation} SDO = ATE + \underbrace{\mathop{\mathbb{E}}(Y_i^0 | D_i = 1) - \mathop{\mathbb{E}}(Y_i^0 | D_i = 0)}_\text{선택 편향 (Selection Bias)} \end{equation} \]
🔗 부록(Appendix): 만약 처치 효과가 일정하다는 가정이 완화되면, 추가적인 편향 항(bias term)이 나타남.
10:00 📂 1. 데이터 불러오기 및 변수 생성
데이터 다운로드 링크. read.csv()를 사용하여 데이터를 불러오기.
변수 설명
group_dummy: 처치를 받았는지 여부 (1 = 처치군, 0 = 통제군).Y0: 처치를 받지 않았을 경우의 잠재적 결과 \((Y_i^0)\).Y1: 처치를 받았을 경우의 잠재적 결과 \((Y_i^1)\).다음 변수들을 생성하시오.
📊 2. ATE 및 SDO 계산
🔀 3. 무작위 배정된 데이터에서 SDO 계산
새로운 데이터 다운로드 링크. 이 데이터에서는 동일한 개인을 임의로 무작위 배정(random assignment)하였음.
\(Y_i\) 재계산 하시오. 새로운 처치 배정에 맞춰 다시 계산해야 함.
무작위 배정에서 SDO 계산
📌 4. (Optional) 편향 요소 확인
📌 무작위 실험(Randomized experiments):
- 사람들을 무작위(randomly)로 처치군과 통제군에 배정함.
- 이 경우, 처치 배정은 잠재적 결과(potential outcomes)와 독립적(independent). - 즉 \(\mathbb{E}(Y_i^0 | D_i = 1)\)과 \(\mathbb{E}(Y_i^0 | D_i = 0)\)이 서로 다를 이유가 없음.
- 따라서, 선택 편향(selection bias)이 0이 됨.
✅ 무작위 배정이 이루어진다면:
\[ SDO = \mathop{\mathbb{E}}(Y_i^1|D_i=1) - \mathop{\mathbb{E}}(Y_i^0|D_i=0) = ATE \]
👉 즉, 데이터를 이용해 직접 ATE를 추정할 수 있음!
흔히 무작위 통제 실험(Randomized Controlled Trials, RCTs)이라고 불림.
최초의 RCT는 18~19세기에 주로 의학 분야에서 수행됨.
20세기 초반, 통계학자 J. Neyman과 R.A. Fisher에 의해 널리 보급됨.
이후 공공정책 평가(public policy evaluation)의 신뢰할 수 있는 도구로 점차 자리 잡음.
경제학(Economics)에서도 RCT의 영향력 증가
지난 주, 학생들의 평균 수학 또는 읽기 점수(math/reading score)를 학급 규모(class size)에 대해 회귀 분석하였음.
\[ \textrm{math score}_i = b_0 + b_1 \textrm{class size}_i + e_i \]
그러나 \(b_1^{OLS}\)는 인과관계(causal relationship)가 아니라 단순한 상관관계(association)만을 보여줌.
📌 왜 OLS 계수 \(b_1\)이 인과관계를 추정할 수 없는가?
학생의 자기 선택(Student sorting): 학부모들이 작은 학급이 더 낫다는 선입견을 가지고 있다면, 자녀를 그런 학교에 보내려고 할 것.
교사의 자기 선택(Teacher sorting): 작은 학급이 가르치기 더 쉬움 → 교사들은 작은 학급이 있는 학교로 이동하려 할 것. 만약 작은 학급이 있는 학교에 경쟁이 존재한다면, 우수한 교사(high-quality teachers)가 더 유리할 가능성이 큼.
지역(Location effect): 대규모 학급은 부유한 대도시에서 더 흔할 수 있음. 소규모 학급은 가난한 농촌 지역에서 더 흔할 가능성이 있음.
✅ RCT를 수행하면 이러한 모든 편향(bias)을 제거할 가눙성이 높아짐
테네시 학생-교사 성취 비율 실험 (Tennessee Student/Teacher Achievement Ratio Experiment) 📖 Krueger (1999) 참고.
🔬 실험 설계
11,600명의 학생과 교사가 무작위로(randomly assigned) 아래 3개 그룹 중 하나에 배정됨. 실험은 유치원부터 3학년까지(Kindergarten ~ 3rd grade) 지속됨.
1️⃣ 소규모 학급: 학생 수: 13~17명 / 교사 1인
2️⃣ 일반 학급 :학생 수: 22~25명 / 교사 1인
3️⃣ 일반 학급 + 보조 교사: 학생 수: 22~25명 / 교사 1인 + 풀타임 보조 교사
📊 실험 과정
⚠️ 비랜덤 탈락 문제(Non-random Attrition)
10:00 star_df 객체에 저장. 변수 설명 도움말 확인.star, (ii) 학생의 학년(class grade): grade, (iii) 결과 변수(outcomes of interest): read & mathNA는 여러 가지 이유로 실험을 떠나게 된 학생들임.(📌 힌트: 다음 코드로 여학생 비율 계산 가능 (dplyr 활용 필요): share_female = mean(gender == "female") * 100.)
✅ RCT에서 평균 처치 효과(ATE) 추정 방법
다음과 같은 설정:
| grade | test | mean regular | mean small | ATE |
|---|---|---|---|---|
| k | math | 484.45 | 493.34 | 8.9 |
| k | read | 435.76 | 441.13 | 5.37 |
📌 이 ATE 값들의 해석은?
📉 회귀분석(regression)으로 표현할 수 있을까?
🎯 RCT에서 결과 변수의 기본 표현
\[ Y_i = D_i Y_i^1 + (1 - D_i) Y_i^0 \]
✨ \(D_i\)로 묶어주고, \(Y_i^1 - Y_i^0\)를 \(\delta_i\)로 대체하면:
\[ \begin{align} Y_i &= Y_i^0 + D_i (Y_i^1 - Y_i^0) \\ &= Y_i^0 + D_i \delta_i \end{align} \]
📌 \(\delta_i = \delta\) (모든 \(i\)에 대해 동일한 처치 효과 가정)
\[ Y_i = Y_i^0 + D_i \delta \]
🔄 우항에 \(\mathbb{E}[Y_i^0] - \mathbb{E}[Y_i^0] = 0\)을 추가하면:
\[ \begin{align} Y_i &= \mathbb{E}[Y_i^0] + D_i \delta + Y_i^0 - \mathbb{E}[Y_i^0] \\ &= b_0 + \delta D_i + e_i \end{align} \]
여기서,
- \(b_0 = \mathbb{E}[Y_i^0]\) (통제군의 평균 결과)
- \(e_i = Y_i^0 - \mathbb{E}[Y_i^0]\) (오차항, 개별적 변동)
✅ 즉, RCT를 단순한 회귀 분석 형태로 나타낼 수 있음!
이제 실제 데이터에서 이를 어떻게 추정할지 살펴보자. 🚀
✅ 소규모 학급에 배정된 것이 수학 성적에 미치는 ATE를 추정해보자.
📊 추정할 회귀 모델: \(\text{math score}_i = b_0 + \delta \text{small}_i + e_i\)
여기서,
\[
\text{small}_i =
\begin{cases}
1 \quad \text{(소규모 학급 배정)} \\\\
0 \quad \text{(일반 학급 배정)}
\end{cases}
\]
📌 추정할 회귀 모델 \(\text{math score}_i = b_0 + \delta \text{small}_i + e_i\)
##
## Call:
## lm(formula = math ~ small, data = star_df_k_small)
##
## Coefficients:
## (Intercept) smallTRUE
## 484.446 8.895
📌 회귀 분석 계수 의미 정리: \(b_0 = \mathbb{E}[Y_i^0]\) and \(\delta = \mathbb{E}[Y_i | D_i = 1] - \mathbb{E}[Y_i | D_i = 0]\)
📌 회귀 분석의 독립 변수(regressor)는 더미 변수(dummy variable)
📌 회귀 분석의 독립 변수(regressor)는 더미 변수(dummy variable)
📌 회귀 분석의 독립 변수(regressor)는 더미 변수(dummy variable)
📌 회귀 분석의 독립 변수(regressor)는 더미 변수(dummy variable)
📌 회귀 모델: \(\text{math score}_i = b_0 + \delta \text{small}_i + e_i\)
📌 일반 학급(통제군, \(small_i = 0\))에서의 기대값 \[ \begin{align} \mathbb{E}[\textrm{math score} | \text{small}_i = 0] &= \mathbb{E}[b_0 + \delta \text{small}_i + e_i | \text{small}_i = 0] \\ &= b_0 + \delta \mathbb{E}[\text{small}_i| \text{small}_i = 0] + \mathbb{E}[e_i|\text{small}_i = 0] \\ &= b_0 \end{align} \]
📌 소규모 학급(처리군, \(small_i = 1\))에서의 기대값 \[ \begin{align} \mathbb{E}[\textrm{math score} | \text{small}_i = 1] &= \mathbb{E}[b_0 + \delta \text{small}_i + e_i | \text{small}_i = 1] \\ &= b_0 + \delta \mathbb{E}[\text{small}_i| \text{small}_i = 1] + \mathbb{E}[e_i|\text{small}_i = 1] \\ &= b_0 + \delta \end{align} \]
📌 평균 처치 효과 (ATE) 계산 \[ \begin{align} ATE &= \mathbb{E}[\textrm{math score} | \text{small}_i = 1] - \mathbb{E}[\textrm{math score} | \text{small}_i = 0] \\ &= b_0 + \delta - b_0 \\ &= \delta \end{align} \]
✅ 이미 알고 있었지만, 이제 이 결과가 왜 성립하는지 공식적으로 이해할 수 있음! 🎉
10:00 treatment = (star == "small").📈 4. 회귀 분석 실행
❓ 5. 결과 해석: 회귀 분석 결과가 2번 질문에서 구한 평균 차이와 일치하는가?
✅ RCTs는 강력한 내부 타당성(Internal Validity)을 가지며, 인과관계를 명확히 확인할 수 있음. 하지만 몇 가지 중요한 한계점이 존재함.
✅ RCT는 인과관계를 분석하는 강력한 도구지만, 한계를 이해하고 보완할 필요가 있음! 🎯
✅ RCT에 의존할 수 없다면?
- 우리는 실험 데이터(Experimental Data) 가 아닌, 관측 데이터(Observational Data) 를 이용하여 인과 추론(Causal Inference) 을 수행할 수 있음.
📌 두 가지 주요한 경우
✅ 데이터를 어떻게 다룰까? : 읽기(Read), 정리(Tidy), 시각화(Visualize)…
🚧 변수간 관계를 어떻게 요약할까? …단순 선형 회귀(Simple Linear Regression) …계속 학습
✅ 인과 관계(Causality)란 무엇인가?
❌ 전체 모집단을 관측하지 못하면 어떻게 할까?
❌ 우리의 연구 결과가 단순한 무작위(Randomness) 때문일 수도 있을까?
❌ 실제로 외생성을 어떻게 찾아낼 수 있을까?
THE END!
다른 조건부(Conditional) 평균 처치 효과도 중요할 수 있음.
📌 처리 집단에서의 평균 처치 효과 (ATT) (Average Treatment on the Treated, ATT)
\[ \begin{align} ATT &= \mathop{\mathbb{E}}(\delta_i | D_i = 1) \\ &= \mathop{\mathbb{E}}(Y_i^1 - Y_i^0 | D_i = 1) \\ &= \mathop{\mathbb{E}}(Y_i^1 | D_i = 1) - \mathop{\mathbb{E}}(Y_i^0 | D_i = 1) \end{align} \]
📌 통제 집단에서의 평균 처치 효과 (ATU) (Average Treatment on the Untreated, ATU)
\[ \begin{align} ATU &= \mathop{\mathbb{E}}(\delta_i | D_i = 0) \\ &= \mathop{\mathbb{E}}(Y_i^1 - Y_i^0 | D_i = 0) \\ &= \mathop{\mathbb{E}}(Y_i^1 | D_i = 0) - \mathop{\mathbb{E}}(Y_i^0 | D_i = 0) \end{align} \]
📌 중요: 대부분의 경우, ATE ≠ ATT ≠ ATU!
처치 효과가 모든 개인에게 동일하다는 가정을 완화해 보자.
수식을 전개하면 다음과 같은 형태로 SDO(Simple Difference in Outcomes)를 분해할 수 있음:
\[ \begin{align} SDO &= ATE + \underbrace{\mathop{\mathbb{E}}(Y_i^0 | D_i = 1) - \mathop{\mathbb{E}}(Y_i^0 | D_i = 0)}_\text{Selection bias} \\ & \quad \quad \quad \quad + \underbrace{(1-\pi)(ATT - ATU)}_\text{Heterogeneous treatment effect bias} \end{align} \]
여기서 \(1 - \pi\)는 통제 그룹(Control Group)의 비율을 의미함.
📌 새로운 편향 요소: 개인별 처치 효과의 이질성 (Heterogeneity)
1️⃣ 선택 편향(Selection Bias):
- 대학에 진학하는 학생들은 기본적인 인지 능력이 더 높을 가능성이 높음 (대학 여부와 관계없이).
2️⃣ 이질적 처치 효과 편향(Heterogeneous Treatment Effect Bias):
- 대학에 가는 학생들이 대학에서 더 많은 학습 효과를 얻을 가능성이 높음 (더 동기 부여된 학생들일 수 있음).