λΆ„μ‚° 뢄석(ANOVA)

 

μ •μ˜

  • ν†΅κ³„ν•™μ—μ„œ 두 개 μ΄μƒμ˜ λ‹€μˆ˜μ˜ 집단을 비ꡐ할 λ•Œ F뢄포λ₯Ό μ΄μš©ν•˜μ—¬ 가섀검정을 ν•˜λŠ” 방법
  • ANOVA = ANalysis Of VAriance

역사

  • ν†΅κ³„ν•™μž λ‘œλ‚ λ“œ ν”Όμ…” (R.A.Fisher)에 μ˜ν•΄ 1920λ…„λŒ€ ~ 1930λ…„λŒ€μ— 걸쳐 μž‘μ„±

 

F뢄포

 

μ •μ˜

  • λΆ„μ‚°μ˜ 비ꡐλ₯Ό ν†΅ν•˜μ—¬ μ–»μ–΄μ§€λŠ” 뢄포 λΉ„μœ¨
  • F = (ꡰ간변동) / (ꡰ내변동) *κ΅°=집단

 

νŠΉμ„±

  • 집단 κ°„μ˜ λ™μ§ˆμ„±μ„ κ°€μ •ν•˜κ³  뢄석
  • ꡰ내변동이 크면 -> 집단 κ°„ 평균 차이 확인 어렀움
  • λΆ„μ‚° 차이가 큰 경우 -> 유발 원인 제거 ν•„μš”

 

FλΆ„ν¬μ˜ κ°€μ •

 

μ •κ·œμ„± κ°€μ •

  • λͺ¨μ§‘λ‹¨μ—μ„œ 변인 YλŠ” μ •κ·œλΆ„ν¬λ₯Ό λ”°λ₯Έλ‹€.
  • λͺ¨μ§‘λ‹¨μ—μ„œ 변인 Y의 평균은 λ‹€λ₯Ό 수 μžˆλ‹€.

λΆ„μ‚°μ˜ λ™μ§ˆμ„± κ°€μ •

  • Y의 λͺ¨μ§‘단 뢄산은 각 λͺ¨μ§‘λ‹¨μ—μ„œ λ™μΌν•˜λ‹€.

 

κ΄€μ°°μ˜ 독립성 κ°€μ •

  • 각각의 λͺ¨μ§‘λ‹¨μ—μ„œ 크기가 n1, n2인 ν‘œλ³Έμ΄ λ…λ¦½μ μœΌλ‘œ ν‘œμ§‘λœλ‹€.

 

 

FλΆ„ν¬μ˜ 계산

 

Fν†΅κ³„μΉ˜

  •  λͺ¨μ§‘단 λΆ„μ‚°μ˜ μΆ”μ •μΉ˜μ˜ λΉ„μœ¨ 계산

  • F값은 νŠΉμ •ν•œ 이둠적 ν™•λ₯ λΆ„포인 F뢄포λ₯Ό 따름

 

λΆ„μ‚°λΆ„μ„μ˜ λͺ¨ν˜•

  • κ³ μ •νš¨κ³Ό λͺ¨ν˜•: μˆ˜μ€€μ˜ 선택이 기술적으둜 μ •ν•΄μ§€κ³  각 μˆ˜μ€€μ΄ 기술적 의미λ₯Ό κ°€μ§„ 효과 인자
  • λ¬΄μ„ νš¨κ³Ό λͺ¨ν˜•: μˆ˜μ€€μ˜ 선택이 μž„μ˜λ‘œ 이루어지며 각 μˆ˜μ€€μ΄ κΈ°μˆ™μ  의미λ₯Ό κ°€μ§€μ§€ μ•Šμ€ 효과 인자
  • ν˜Όν•©νš¨κ³Ό λͺ¨ν˜•: κ³ μ •νš¨κ³Ό μΈμžμ™€ λ¬΄μ„ νš¨κ³Ό μΈμžκ°€ ν•¨κ»˜ μ‚¬μš©λœ 경우

 

λΆ„μ‚°λΆ„μ„μ˜ μ’…λ₯˜

  • 일원뢄산뢄석(one-way ANOVA): 쒅속변인이 1개이며 독립변인 집단도 1개
  • 이원뢄산뢄석(two-way ANOVA): λ…λ¦½λ³€μΈμ˜ μˆ˜κ°€ 2개 이상일 λ•Œ 집단 비ꡐ
  • λ‹€μ›λ³€λŸ‰λΆ„μ‚°λΆ„μ„(MANOVA): 두 개 이상 쒅속변인이 κ΄€κ³„λœ 상황에 적용
  • 곡뢄산뢄석(ANCOVA): νŠΉμ •ν•œ 독립변인 μœ„μ£Όλ‘œ λΆ„μ„ν•˜κ³  λ‹€λ₯Έ 독립변인은 ν†΅μ œλ³€μˆ˜λ‘œ μ„€μ • 뢄석

 

 

상관뢄석(Correlation Analysis)

 

μ •μ˜

  • 두 λ³€μˆ˜ κ°„μ˜ μ„ ν˜•μ  관계λ₯Ό λΆ„μ„ν•˜λŠ” 방법
  • 두 λ³€μˆ˜λŠ” λ…λ¦½μ μ΄κ±°λ‚˜ 상관될 수 μžˆλ‹€.
  • 두 λ³€μˆ˜ κ°„μ˜ 강도λ₯Ό 상관과계라고 함 (Correlation, Correlation coefficient)

 

μƒκ΄€λΆ„μ„μ˜ κ°€μ •

  • μ„ ν˜•μ„±: 두 변인 X, Y의 직선적인 정도, 선점도λ₯Ό μ‚¬μš©
  • λ™λ³€λŸ‰μ„±: X의 값에 관계없이 Y의 흩어진 정도가 같은 것 (μ΄λΆ„μ‚°μ„±μ˜ λ°˜λŒ€μ–΄)
  • μ •κ·œλΆ„ν¬μ„±: 두 λ³€μΈμ˜ μΈ‘μ •μΉ˜ λΆ„ν¬λŠ” λͺ¨μ§‘λ‹¨μ—μ„œ μ •κ·œλΆ„ν¬
  • λ¬΄μ„ λ…λ¦½ν‘œλ³Έ: λͺ¨μ§‘λ‹¨μ—μ„œ ν‘œλ³Έμ„ μΆ”μΆœν•  λ–„ ν‘œλ³ΈλŒ€μƒμ΄ ν™•λ₯ μ μœΌλ‘œ μ„ μ •λ˜λŠ” 것

 

μƒκ΄€λΆ„μ„μ˜ 뢄석 방법

 

1. ν”Όμ–΄μŠ¨ μƒκ΄€κ³„μˆ˜(Pearson Correlation Coefficient)

  • 두 λ³€μˆ˜ κ°„μ˜ 관련성을 κ΅¬ν•˜κΈ° μœ„ν•΄ 보편적 이용
  • r=(X와 Y의 λ³€ν™” 정도)/(X와 Y 각각 λ³€ν•˜λŠ” 정도)
  • r의 값에 따라 λ‹€μŒκ³Ό 같이 해석
    • +1 = X와 Yκ°€ μ™„μ „ 동일
    • 0 = X와 Yκ°€ μ „ν˜€ λ‹€λ₯Έ 경우
    • -1 = X와 Yκ°€ λ°˜λŒ€λ°©ν–₯으둜 동일
  • r2 = κ²°μ •κ³„μˆ˜ (Coefficient of determination)

 

2. μŠ€ν”Όμ–΄λ§Œ μƒκ΄€κ³„μˆ˜(Spearman Correlation Coefficient)

  • 데이터가 μ„œμ—΄μ²™λ„(μˆœμœ„κ°’)인 경우의 μƒκ΄€κ³„μˆ˜
  • 데이터λ₯Ό μž‘μ€ 것뢀터 μ°¨λ‘€λ‘œ μˆœμœ„λ₯Ό 맀겨 μ„œμ—΄ μˆœμ„œλ‘œ λ°”κΎΌ λ’€ μˆœμœ„λ₯Ό μ΄μš©ν•˜μ—¬ μƒκ΄€κ³„μˆ˜ 계산
  • μžλ£Œμ— 이상점이 μžˆκ±°λ‚˜ ν‘œλ³Έν¬κΈ°κ°€ μž‘μ„ λ•Œ 유용
  • μƒκ΄€κ³„μˆ˜κ°’μ— λ”°λ₯Έ λΆ„λ₯˜
    • +1 = 두 λ³€μˆ˜ μ•ˆμ˜ μˆœμœ„κ°€ μ™„μ „νžˆ 일치
    • -1 = 두 λ³€μˆ˜ μ•ˆμ˜ μˆœμœ„κ°€ μ—­μˆœμΈ 경우

 

3. 크둠바흐 μ•ŒνŒŒ κ³„μˆ˜ 신뒰도(Cronbach's Alpha)

  • κ²€μ‚¬μ˜ 내적 일관성을 λ‚˜νƒ€λ‚΄λŠ” κ°’ a계산
  • ν•œ 검사 λ‚΄μ—μ„œ λ³€μˆ˜λ“€ κ°„μ˜ 평균상관관계에 κ·Όκ±°ν•˜μ—¬ 검사문항듀이 λ™μ§ˆμ  μš”μ†Œλ‘œ κ΅¬μ„±λ˜μ–΄ μžˆλŠ”μ§€λ₯Ό λΆ„μ„ν•˜λŠ” 방법
  • λ™μΌν•œ κ°œλ…μΈ 경우 -> κ²°κ³Όκ°€ λΉ„μŠ·
  • λ™μΌν•˜μ§€ μ•Šμ€ κ°œλ…μΈ 경우 -> κ²°κ³Όκ°€ 상이

 

 

 

νšŒκ·€λΆ„μ„(Regression Analysis)

 

νšŒκ·€(λ˜λŒμ•„κ°„λ‹€)

μ •μ˜: κ΄€μ°°λœ μ—°μ†ν˜• λ³€μˆ˜λ“€ κ°„μ˜ λͺ¨ν˜•을 κ΅¬ν•œ λ’€ 적합도λ₯Ό μΈ‘μ •ν•˜λŠ” 뢄석 방법

 

 

νšŒκ·€λΆ„μ„μ˜ κ°€μ •

  • μ˜€μ°¨ν•­μ€ λͺ¨λ“  λ…λ¦½λ³€μˆ˜μ— λŒ€ν•˜μ—¬ 동일 뢄산을 가짐
  • μ˜€μ°¨ν•­μ˜ 평균(κΈ°λŒ“κ°’)은 0이닀.
  • μˆ˜μ§‘λœ λ°μ΄ν„°μ˜ ν™•λ₯  λΆ„ν¬λŠ” μ •κ·œ 뢄포λ₯Ό 이룬닀.
  • λ…λ¦½λ³€μˆ˜ κ°„μ—λŠ” 상관관계가 μ—†μ–΄μ•Ό ν•œλ‹€.
  • μ‹œκ°„μ— 따라 μˆ˜μ§‘λœ λ°μ΄ν„°λŠ” 작음 영ν–₯이 μ—†λ‹€.

νšŒκ·€λΆ„μ„μ˜ μ˜ˆμ‹œ

 

 

 

 

μ‹œκ³„μ—΄ 데이터

 

μ‹œκ³„μ—΄(Time series): 일정 κ°„κ²©μœΌλ‘œ 배치된 λ°μ΄ν„°μ˜ μˆ˜μ—΄

μ‹œκ³„μ—΄ 해석(Time Series Analysis)

  • μ‹œκ³„μ—΄μ„ ν•΄μ„ν•˜κ³  μ΄ν•΄ν•˜λŠ” 방법
  • μ‹œκ³„μ—΄μ΄ μ–΄λ– ν•œ λ²•μΉ™μ—μ„œ μƒμ„±λ˜λŠ”μ§€ λ°ν˜€λ‚΄λŠ” μž‘μ—…

 

μ‹œκ³„μ—΄ 예츑(Time Series Prediction)

  • μ‹œκ³„μ—΄μ„ 기반으둜 μˆ˜ν•™μ  λͺ¨λΈμ„ κ΅¬μΆ•ν•˜κ³  λ―Έλž˜μ— λ°œμƒν•˜λŠ” μ‹œκ³„μ—΄μ˜ ν˜•νƒœλ₯Ό μ˜ˆμΈ‘ν•˜λŠ” μž‘μ—…
  • 곡학, κ³Όν•™, κΈˆμœ΅μ‹œμž₯ λ“±μ—μ„œ μ‚¬μš©

 

μ‹œκ³„μ—΄ 데이터 뢄석

 

Autoregressive (AR) λͺ¨λΈ 

  • μžκΈ°μƒκ΄€μ„±(autocorrlation) 정보λ₯Ό 기반
  • μ–΄λ– ν•œ 변인에 λŒ€ν•˜μ—¬ μ΄μ „μ˜ 값이 μ΄ν›„μ˜ 값에 영ν–₯을 λ―ΈμΉ˜λŠ” 상황을 λͺ¨λΈλ§
  • 예) μ΄μ „μ˜ 값이 κ°μ†Œ -> μ΄ν›„μ˜ 값이 κ°μ†Œ
  • AR λͺ¨ν˜•

 

 

Moving Average (MA) λͺ¨λΈ - μ΄λ™ν•˜λŠ” 평균 λͺ¨λΈ

  • μ–΄λ–€ λ³€μˆ˜μ˜ 평균값이 μ§€μ†μ μœΌλ‘œ μ¦κ°€ν•˜κ±°λ‚˜ κ°μ†Œν•˜λŠ” κ²½ν–₯에 λŒ€ν•œ λͺ¨λΈλ§
  • 예) λ΄„μ—μ„œ 여름이 되면 μ „κΈ° μˆ˜μš”κ°€ λŒ€μ²΄λ‘œ 증가
  • MAλͺ¨ν˜•

 

 

ARMAλͺ¨λΈ

  • 기쑴의 AR λͺ¨λΈκ³Ό MAλͺ¨λΈμ„ ν†΅ν•©ν•˜μ—¬ λ‹€μ–‘ν•œ 톡합 λͺ¨λΈμ΄ λ„μΆœλ  수 있음
  • ARMAλͺ¨λΈ

 

 

Integrated (I) λͺ¨λΈ - ν†΅ν•©λœ λͺ¨λΈ

  • ARλͺ¨λΈ, MAλͺ¨λΈ 외에 톡합 λͺ¨λΈμ„ κ³ λ €
  • 과거의 데이터 뿐만 μ•„λ‹ˆλΌ μΆ”μ„Έ(momentum)κΉŒμ§€ λ°˜μ˜ν•œ λͺ¨λΈ
  • ARIMA λͺ¨λΈ

 

 

 

+ Recent posts