PHÂN TÍCH PHƯƠNG SAI ANOVA
Phân tích phương sai ANOVA được sử dụng để phân tích sự khác biệt giữa các đặc điểm của biến phân loại định tính đối với biến định lượng với qua trị trung bình.
Để kiểm định trị trung bình 2 tổng thể, sử dụng kiểm định 2 mẫu độc lập; với kiểm định giá trị trung bình của nhiều hơn 2 tổng thể, sử dụng phân tích ANOVA.
1. Kiểm định trung bình 2 tổng thể (mẫu độc lập)
Kiểm định sự khác nhau ở giá trị trung bình của 2 tổng thể có trung bình mẫu lần lượt là μ1 và μ2, biến định lượng (Scale) mẫu độc lập.
Kiểm định mô hình theo quy trình 4 bước sau.
1. Giả thuyết (kiểm định 2 phía)
- H0: μx – μy = 0
- H1: μx – μy ≠ 0
2. Trị tới hạn
3. Tính trị thống kê
Nếu σx12 = σx22
t có (n1 + n2 – 2) bậc tự do
Trong đó,
Nếu σx12¹ σx22
Trị thống kê t có bậc tự do được tính bởi công thức:
Trong đó,
μx1 = μx2 = 0; S2x1 =S2x2: Phương sai mẫu.
nx1, nx2: Kích thước mẫu; X1, X2 (trung bình): Trung bình mẫu.
4. Kết luận
Bác H0 nếu t < -tn-1, a/2
hay t > tn-1, a/2
2. Kiểm định trung bình nhiều hơn 2 tổng thể (ANOVA)
Để kiểm định (so sánh) trị trung bình nhiều hơn 2 tổng thể (nghĩa là từ 3 nhóm trở lên), người ta sử dụng phương pháp ANOVA (ANalysis Of VAriance). Gọi bằng thuật ngữ phân tích phương sai vì quá trình này dựa vào sự biến động của phương sai để kiểm định trị trung bình. Phân tích phương sai (ANOVA) đánh giá một biến phụ thuộc Yij với một hay nhiều biến độc lập Xi,với ba dạng.
- Phân tích phương sai (ANOVA) 1 nhân tố: khi phân tích chỉ có 1 biến độc lập Xi.
- Phân tích phương sai (ANOVA) 2 nhân tố: Có 2 biến độc lập Xi.
- Phân tích phương sai (ANOVA) đa biến: Được gọi là MANOVA (Multivariate Analysis Of Variance).
Phân tích phương sai ANOVA 1 nhân tố là phân tích ảnh hưởng nhiều thành phần của một nhân tố nguyên nhân đến một nhân tố kết quả. Trước khi kiểm định trung bình, cần kiểm định sự bằng nhau của phương sai các tổng thể tức là kiểm tra tính đồng nhất của phương sai (kiểm định Leneve). Phương sai của các tổng thể đồng nhất là điều kiện cần để tiến hành phân tích phương sai ANOVA. Kỹ thuật này dựa trên cơ sở tính toán mức độ biến thiên ở nội bộ các nhóm (Hình 1) và biến thiên giữa các trung bình nhóm (Hình 2). Dựa trên hai ước lượng này của mức độ biến thiên để rút ra kết luận về mức độ khác nhau giữa các trung bình nhóm.
Kiểm định phương sai đồng nhất (Levene)
1. Giả thuyết
- H0: σ12 = σ22 = ... = σk2;
- H1: σi2¹ σi'2 có ít nhất một cặp tổng thể có phương sai khác nhau.
2. Trị tới hạn
Tra phân bố Fisher dựa vào bậc tự do df1 = k – 1, df2 = n – k, và mức ý nghĩa a.
3. Trị thống kê
Trong đó, Xij = |Xij - Xi(trung bình)| với Xi(trung bình) là trung bình nhóm thứ i;
Xi(trung bình) là trung bình độ lệch của nhóm thứ i;
X(trung bình) là trung bình độ lệch chung của các nhóm.
4. Kết luận
F > Fk-1,n-k,a, bác H0. Kết luận phương sai bằng nhau với Fk-1,n-k,a là trị tới hạn của phân bố F với k-1 và n-k là bậc tự do tại mức ý nghĩa a.
3. Qui trình phân tích phương sai ANOVA (một nhân tố)
1. Giả thuyết
- H0: μ1 = μ2 = ... = μk;
- H1: μi2¹ μi'2, ít nhất hai trung bình tổng thể khác biệt.
2. Trị tới hạn (phân bố Fisher)
Hoàn toàn tương tự giá trị của kiểm định phương sai đồng nhất Levene.
3. Trị thống kê
Tính trị thống kê F theo quy trình trình bày ở Bảng 1, trong đó:
Tổng phương sai nội nhóm SSW: Tính tổng phương sai mỗi nhóm rồi cộng giữa các nhóm.
hay
Trong đó,
k: Số lượng nhóm;
ni: Kích thước mẫu từ nhóm i;
Xi(trung bình): Trung bình mẫu từ nhóm i;
Xij: Quan sát thứ j thuộc nhóm i.
[Nguồn: nghiencuukhoahoc.edu.vn, 2017]
Hình 1. Phương sai nội nhóm
Tổng phương sai ngoại nhóm SSG:
hay
Trong đó,
k: Số lượng nhóm;
ni: Kích thước mẫu từ nhóm i;
Xi(trung bình): Trung bình mẫu từ nhóm i;
Xi(trung bình): Trung bình mẫu (của toàn bộ dữ liệu).
[Nguồn: nghiencuukhoahoc.edu.vn, 2017]
Hình 2. Phương sai ngoại nhóm
4. Kết luận: F > Fdf1,dfn,a, bác H0. Kết luận có ít nhất một khác biệt ở các trung bình mẫu.
Bảng 1. Tổng kết qui trình tính trị thống kê F, phương sai một yếu tố
Nguồn biến thiên |
Tổng phương sai |
Bậc tự do |
Phương sai |
Trị thống kê F |
Ngoại nhóm |
SSG |
df1 = k - 1 |
MSG = SSG/(k - 1) |
F = MSG/MSW |
Nội nhóm |
SSW |
df2 = n - k |
MSW = SSW/(n - k) |
|
Tổng |
SST = SSG + SSW |
n - 1 |
MST = SST/(n - 1) |
[Nguồn: nghiencuukhoahoc.edu.vn, 2017]
Kết thúc.
Xem thêm