KIỂM ĐỊNH BOOTSTRAP
Bootstrap là phương pháp lấy mẫu lặp lại có thay thế, trong đó mẫu ban đầu đóng vai trò là đám đông, giúp đánh giá độ tin cậy của các ước lượng với số mẫu lớn.
1. Tổng quan về kiểm định Bootstrap
Để đánh giá độ tin cậy của các ước lượng, trong các phương pháp nghiên cứu định lượng bằng phương pháp lấy mẫu, thông thường chúng ta phải chia mẫu ra làm hai mẫu con. Một nửa dùng để ước lượng các tham số mô hình, và một nửa dùng để đánh giá lại. Cách khác là lặp lại nghiên cứu bằng một mẫu khác. Hai cách trên đây thường không thực tế vì phương pháp cấu trúc đòi hỏi mẫu lớn nên việc làm này tốn kém nhiều thời gian và chi phí (Anderson và Gerbing, 1988). Trong những trường hợp như vậy thì Bootstrap là phương pháp phù hợp để thay thế (Schumacker và Lomax, 2010). Bootstrap là phương pháp lấy mẫu lặp lại có thay thế, trong đó mẫu ban đầu đóng vai trò là đám đông.
Phương pháp Bootstrap thực hiện với số mẫu lặp lại là N lần. Kết quả ước lượng từ N mẫu được tính trung bình và giá trị này có xu hướng gần đến ước lượng của tổng thể. Khoảng chênh lệch giữa giá trị trung bình ước lượng bằng Bootstrap và ước lượng mô hình với mẫu ban đầu càng nhỏ cho phép kết luận các ước lượng mô hình có thể tin cậy được.
Ví dụ: Từ đám đông (mẫu ban đầu) có 200 quan sát. Với dữ liệu của mẫu ban đầu, ta sẽ tính toán được các ước lượng (các trọng số hồi qui…). Trong Bootstrap, máy tính sẽ chọn ra những mẫu khác, ví dụ 400 mẫu khác chẳng hạn theo phương pháp lặp lại, và có thay thế. Và mỗi một mẫu lặp lại có thể có cùng số quan sát với số quan sát ban đầu: 200. Và theo bạn như vậy thì trong một mẫu mà Bootstrap chọn ra, có khi nào có 2 hay nhiều quan sát trùng nhau không? Dĩ nhiên là hoàn toàn có thể có điều đó xảy ra. Và từ 400 mẫu này có thể tính được trung bình của các ước lượng (các trọng số hồi qui…). Hiệu số giữa trung bình các ước lượng từ Bootstrap và các ước lượng ban đầu gọi là độ chệch. Trị tuyệt đối các độ chệch này càng nhỏ, càng không có ý nghĩa thống kê càng tốt.
Lưu ý:
- Sử dụng phương pháp Maximum Likelihood để ước lượng các ước lượng bình thường.
- Hiệu số giữa trung bình các ước lượng từ Bootstrap và các ước lượng ban đầu gọi là độ lệch Bias (bs), trong đó, Bias = Mean – Estimate.
- CR = Mean/(SE – Bias). Trị tuyệt đối CR rất nhỏ so với 1,96 thì có thể nói là độ chệch là rất nhỏ, không có ý nghĩa thống kê ở độ tin cậy 95%. Kết luận: Các ước lượng trong mô hình ban đầu có thể tin cậy.
2. Phương pháp kiểm định
So sánh giá trị CR này với 1,96 (do 1,96 là giá trị của phân phối chuẩn ở mức 0,975 hay 97,5%, nghĩa là 2,5% một phía, hai phía sẽ là 5%). Nếu p-value < 5% thì kết luận là giả thuyết Bias khác 0 có ý nghĩa thống kê. Do giả thuyết:
H0: Bias = 0;
H1: Bias ≠ 0.
Nếu giá trị tuyệt đối của CR lớn hơn 1,96 thì suy ra p-value < 5%, chấp nhập H1, kết luận độ lệch khác 0 có ý nghĩa thống kê ở mức tin cậy 95%.
Còn nếu giá trị tuyệt đối của CR nhỏ hơn 1,96, suy ra p-value > 5%, bác bỏ H1, chấp nhận H0, kết luận độ lệch khác 0 không có ý nghĩa thống kê ở mức tin cậy 95%, và như thế kết luận được mô hình ước lượng ban đầu có thể tin cậy được. Thông thường đây là kết quả mong đợi khi phân tích SEM.
Tài liệu tham khảo
- Anderson, J. C., & Gerbing, D. W. (1988). Structural equation modeling in practice: A review and recommended two-step approach. Psychological Bulletin, 103(3), 411–423.
- Schumacker, R. E. & Lomax, R. G. (2010). A Beginners Guide to Structural Equation Modeling. Routledge, New York.
Kết thúc.
Xem thêm