CHỈ SỐ PHÙ HỢP MÔ HÌNH NHÂN TỐ KHẲNG ĐỊNH
Các loại chỉ số phù hợp của mô hình nhân tố khẳng định như Chi bình phương, chỉ số phù hợp tuyệt đối và tương đối, chỉ số phù hợp hợp lý, cùng với cách thức diễn giải các chỉ số được giới thiệu sau đây.
1. Chi bình phương
Chỉ số thể hiện mức độ phù hợp cổ điển là chi bình phương χ2. Theo ước lượng Mô hình Maximum Likelihood ML điển hình, χ2 được tính như sau:
χ2 = FML(N – 1)
Nhược điểm của kiểm định Chi bình phươn χ2 là:
- Trong nhiều trường hợp (dữ liệu N nhỏ, dữ liệu không có phân phối chuẩn) phân phối tiềm ẩn của nó không phải phân phối χ2 (làm ảnh hưởng đến các kiểm định ý nghĩa thống kê của mô hình χ2);
- Nó bị sai lệch bởi kích thước mẫu (nếu N bằng 100 trong mô hình mô phỏng ước lượng các tham số mô hình Ức chế hành vi, Từ chối trường học và Lo lắng xã hội ở bài viết ƯỚC LƯỢNG CÁC THAM SỐ MÔ HÌNH NHÂN TỐ KHẲNG ĐỊNH, thì χ2 = 40,14), và do đó, N lớn, giả thuyết H0 cho rằng S = Σ thường bị bác bỏ ngay cả khi sự khác biệt giữa S và Σ là không đáng kể;
- Nó dựa trên giả thuyết rất nghiêm ngặt rằng S = Σ.
Như được thảo luận tiếp theo, nhiều chỉ số phù hợp thay thế dựa trên các tiêu chuẩn ít nghiêm ngặt hơn, chẳng hạn như phù hợp hợp lý và phù hợp với mô hình độc lập. Tuy nhiên, χ2 được sử dụng cho các mục đích khác, chẳng hạn như so sánh mô hình lồng vào nhau và tính toán các chỉ số phù hợp khác. Trong khi χ2 được báo cáo thường xuyên trong nghiên cứu CFA, các chỉ số phù hợp khác thường được dựa nhiều hơn vào việc đánh giá mức độ phù hợp của mô hình.
Mặc dù có sẵn một loạt các chỉ số phù hợp, nhưng chỉ một số ít được mô tả và trình bày. Những chỉ số phù hợp này đã được lựa chọn trên cơ sở mức độ phổ biến của chúng trong các tài liệu ứng dụng.
2. Sự phù hợp tuyệt đối
Chỉ số phù hợp tuyệt đối đánh giá mô hình phù hợp ở mức tuyệt đối. Theo nhiều cách khác nhau, chúng đánh giá tính hợp lý của giả thuyết rằng S = Σ mà không tính đến các khía cạnh khác. Do đó, Chi bình phương χ2 là một ví dụ về chỉ số phù hợp tuyệt đối.
Một chỉ số khác nằm trong danh mục này là trung bình số dư bình phương gốc chuẩn hóa (the Standardized Root Mean Square Residual – SRMR). Về mặt khái niệm, SRMR có thể được xem là sự khác biệt trung bình giữa các tương quan mẫu trong ma trận đầu vào và các tương quan dự đoán bởi mô hình (mặc dù trong thực tế, SRMR là trung bình căn bậc hai). Theo đó, nó nhận được từ ma trận tương quan phần dư.
Một chỉ số có tên tương tự, trung bình số dư bình phương gốc (the Root Mean Square Residual – RMR), phản ánh sự khác biệt trung bình giữa hiệp phương sai mẫu và dự đoán. Tuy nhiên, RMR có thể khó diễn giải vì giá trị của nó bị ảnh hưởng bởi số liệu của các biến đầu vào, do đó, SRMR thường được sử dụng hơn.
SRMR có phạm vi giá trị trong khoảng từ 0,00 đến 1,00, với 0,00 cho thấy sự phù hợp hoàn hảo. Nghĩa là, SRMR càng nhỏ, mô hình càng phù hợp.
3. Sự phù hợp hợp lý
Một chỉ báo được sử dụng rộng rãi và được đề xuất từ danh mục này là trung bình sai số bình phương gốc xấp xỉ (the Root Mean Square Error of Approximation – RMSEA; Steiger và Lind, 1980). RMSEA là một chỉ báo dựa trên tổng thể của phân phối Chi bình phương χ2 lệch (phi tập trung). Phân phối χ2 lệch bao gồm một tham số phi tập trung (Noncentrality Parameter – NCP), thể hiện bậc của sự không chỉ rõ mô hình. NCP được ước lượng là χ2 - df (nếu kết quả là số âm, NCP = 0). Khi sự phù hợp của mô hình hoàn hảo, NCP = 0 và phân phối χ2 hoàn hảo. Khi sự phù hợp của mô hình không hoàn hảo, NCP lớn hơn 0 và dịch chuyển giá trị kỳ vọng của phân phối sang bên phải của phân phối χ2 hoàn hảo (xem MacCallum, Browne và Sugawara, 1996). RMSEA là một chỉ số sai số xấp xỉ bởi vì nó đánh giá mức độ mà một mô hình phù hợp với tổng thể một cách hợp lý (trái ngược với việc kiểm tra xem mô hình có phù hợp với tổng thể hay không).
RMSEA được tính toán như sau:
Mặc dù giới hạn trên của nó không bị ràng buộc, nhưng rất hiếm khi thấy RMSEA vượt quá 1,00.
Phân phối Chi bình phương χ2 lệch có thể được sử dụng để đạt được khoảng tin cậy cho RMSEA (thường sử dụng khoảng 90%). Khoảng tin cậy cho thấy độ chính xác của ước lượng điểm RMSEA. Các nhà phương pháp học khuyến nghị bao gồm khoảng tin cậy này khi báo cáo RMSEA (MacCallum, Browne và Sugawara, 1996). Tuy nhiên, các nhà nghiên cứu cần lưu ý rằng độ rộng của khoảng tin cậy bị ảnh hưởng bởi kích thước mẫu và số lượng tham số ước lượng tự do trong mô hình (trừ khi N rất lớn, các mô hình phức tạp thường liên quan đến khoảng tin cậy RMSEA rộng).
Ngoài ra, để giải quyết tính chất quá nghiêm ngặt của Chi bình phương χ2 (tức là, nó kiểm tra mức độ phù hợp hoàn hảo), Browne và Cudek (1993) đã phát triển một kiểm định thống kê về mức độ chặt chẽ của mô hình phù hợp bằng RMSEA. Cụ thể, độ gần phù hợp (CFit) được cung cấp dưới dạng giá trị RMSEA nhỏ hơn hoặc bằng 0,05. Kiểm định này xuất hiện trong đầu ra của hầu hết các phần mềm dưới dạng giá trị xác suất mà RMSEA ≤ 0,05. Các giá trị xác suất không đáng kể (nghĩa là, p > 0,05) có thể được xem phù hợp với sự phù hợp của mô hình có thể chấp nhận, mặc dù một số nhà phương pháp đã lập luận cho các hướng dẫn chặt chẽ hơn (Jöreskog và Sörbom, 1996).
4. Sự phù hợp tương đối
Các chỉ số phù hợp tương đối (còn được gọi là các chỉ số phù hợp gia tăng; Hu và Bentler, 1998) đánh giá mức độ phù hợp của giải pháp do người dùng chỉ định liên quan đến mô hình cơ sở lồng vào nhau, mô hình hạn chế hơn. Thông thường, mô hình cơ sở này là mô hình độc lập hoặc không, trong đó các hiệp phương sai tất cả các biến đầu vào được cố định bằng 0. Như bạn có thể mong đợi, tiêu chí tương đối tự do về đánh giá sự phù hợp mô hình với giải pháp không có mối quan hệ giữa các biến, các chỉ số phù hợp tương đối thường có vẻ thuận lợi hơn so với các chỉ số đã trình bày trước.
Một trong những chỉ số đó là, chỉ số phù hợp tương đối (the Comparative Fit Index – CFI; Bentler, 1990). CFI có phạm vi giá trị từ 0,00 đến 1,00, với các giá trị gần hơn với 1,00 có nghĩa là càng phù hợp với mô hình.
Chỉ số CFI được tính toán như sau:
trong đó,
χT2 là giá trị χ2 của mô hình mục tiêu (mô hình được đánh giá);
dfT là bậc tự do của mô hình mục tiêu;
χB2 là giá trị χ2 của mô hình cơ sở (nghĩa là mô hình không);
dfB là bậc tự do của mô hình cơ sở;
max cho biết sử dụng giá trị lớn nhất.
Một chỉ số phổ biến khác là chỉ số Tucker - Lewis (Tucker–Lewis Index – TLI; Tucker và Lewis, 1973), được gọi là chỉ số phù hợp không định mức. Ngoài ra, TLI có các tính năng bù cho sự tác động của mô hình phức tạp.
Chỉ số TLI được tính toán như sau:
Không giống như CFI, giá trị TLI không bị giới hạn, nghĩa là các giá trị của nó có thể nằm ngoài phạm vi 0,00 đến 1,00. Tuy nhiên, nó được diễn giải theo kiểu tương tự CFI ở chỗ các giá trị càng gần 1,00 sẽ cho thấy sự phù hợp với mô hình.
5. Diễn giải các chỉ số phù hợp
Các chỉ số phù hợp thường bị ảnh hưởng khác nhau bởi các khía cạnh khác nhau của tình huống phân tích, chẳng hạn như kích thước mẫu, độ phức tạp của mô hình, phương pháp ước lượng (ML, WLS), số lượng và loại đặc điểm, tính chuẩn hóa của dữ liệu và loại dữ liệu (TLI và RMSEA có xu hướng bác bỏ sai lầm các mô hình khi N nhỏ (Hu và Bentler, 1999); SRMR dường như không hoạt động tốt trong mô hình CFA dựa trên các chỉ báo phân loại (Yu, 2002)).
Một trong những đánh giá gần đây và toàn diện về các tiêu chí giới hạn, những phát hiện của các nghiên cứu mô phỏng được thực hiện bởi Hu và Bentler (1999) cho thấy các hướng dẫn sau đây. Hỗ trợ cho sự tranh luận phù hợp hợp lý giữa mô hình mục tiêu và dữ liệu quan sát (giả sử ước lượng ML) thu được trong các trường hợp trong đó:
- Giá trị SRMR gần bằng 0,08 hoặc thấp hơn;
- Giá trị RMSEA gần bằng 0,06 hoặc thấp hơn;
- Giá trị CFI và TLI gần bằng 0,95 hoặc cao hơn.
Việc sử dụng tiêu chí của Hu và Bentler (1999) không phải là ngẫu nhiên, bởi vì các giá trị được sử dụng trong sự kết hợp với các chỉ số phù hợp khác (khả năng chấp nhận tỷ lệ sai số Loại I và Loại II thường được cải thiện khi sử dụng kết hợp các chỉ số).
Các nhà phương pháp học khác đã xử lý các phức tạp này bằng cách cung cấp các nguồn tin cậy mô tả cho các phạm vi khác nhau của các giá trị chỉ số phù hợp thay vì chỉ định các ngưỡng rõ ràng. Chẳng hạn, Browne và Cudeck (1993) đề xuất, theo nguyên tắc thông thường, các giá trị RMSEA nhỏ hơn 0,08 cho thấy sự phù hợp của mô hình (nghĩa là một sai số hợp lý xấp xỉ), các giá trị RMSEA nhỏ hơn 0,05 cho thấy mô hình phù hợp tốt và các mô hình có RMSEA ≥ 0,10 là không phù hợp (MacCallum và cộng sự, 1996, đã xây dựng thêm các hướng dẫn này bằng cách khẳng định rằng RMSEA trong phạm vi 0,08 – 0,10 có mức độ phù hợp thường). Hỗ trợ bổ sung cho sự phù hợp của giải pháp sẽ được chứng minh bằng khoảng tin cậy 90% của RMSEA có giới hạn trên, nằm dưới các giá trị ngưỡng 0,08. Như đã lưu ý trước đó, một CFit không có ý nghĩa (RMSEA < 0,05) cũng có thể được hiểu theo sự phù hợp với mô hình phù hợp có thể chấp nhận.
Tương tự, các nhà phương pháp học đã lưu ý rằng trong khi các giá trị CFI và TLI dưới 0,90 sẽ khiến nhà nghiên cứu nghi ngờ (từ chối) giải pháp, các giá trị CFI và TLI trong phạm vi 0,90 – 0,95 được cho là mô hình phù hợp có thể chấp nhận được (Bentler, 1990). Tuy nhiên, khi các chỉ số phù hợp rơi vào các phạm vi cận biên này, điều đặc biệt quan trọng là phải xem xét tính nhất quán của sự phù hợp mô hình như được thể hiện bởi các loại chỉ số phù hợp khác nhau song song với các khía cạnh cụ thể của tình huống phân tích; Ví dụ, khi N hơi nhỏ, RMSEA = 0,08 có thể được chấp nhận nếu tất cả các chỉ số khác đều trong phạm vi cho phép mô hình phù hợp.
Mặt khác, PCLOSE là giá trị để kiểm định giả thiết không rằng RMSEA của tổng thể không lớn hơn 0,05.
Theo Browne và Cudeck (1993), RMSEA khoảng 0,05 hoặc nhỏ hơn thì mô hình gần phù hợp. Do đó giá trị p này được đặt tên là PCLOSE, dùng để kiểm tra mức độ gần phù hợp (Close fit). Lưu ý là khái niệm Close fit gắn liền với giá trị RMSEA.
Nếu PCLOSE nhỏ hơn 0,05, thì bác bỏ giả thuyết không, và kết luận RMSEA lớn hơn 0,05 (mô hình chưa đạt được Close fit, hay chưa đạt được độ gần phù hợp). Vì thế chúng ta mong muốn giá trị PCLOSE lớn hơn 0,05 để kết luận được rằng RMSEA bé hơn 0,05.
Tài liệu tham khảo
- Bentler, P. M. (1990). Comparative fit indexes in structural models. Psychological Bulletin, 107(), 238–246.
- Browne, M. W., & Cudeck, R. (1993). Alternative ways of assessing model fit. In K. A. Bollen and J. S. Long (Eds.), Testing structural equation models (pp. 136-162). Newbury Park, CA: Sage.
- Hair, J. F. Jr, Anderson, R-E, Tatham, R. L., & Blak, W.C. (1998). Multivariate Data Analysis, 5th Edition. Prentice Hall.
- Hu, L. & Bentler, P. (1998). Fit Indices in Covariance Structure modeling: Sensitivity to underparameterized model misspecification. Psychological Methods, 3(), 424-453.
- Hu, L. & Bentler, P. (1999). Cutoff criteria for fit indices in covariance structure analysis: Conventional criteria versus new alternatives. Structural Equation Modeling, 6(), 1-55.
- Jöreskog, K.G. & Sörbom, D. (1996). LISREL 8 User's reference guide. Chicago: Scientific Software.
- MacCallum, R. C., Browne, M. W., & Sugawara, H. M. (1996). Power analysis and determination of sample size for covariance structure modeling. Psychological Methods, 1(2), 130–149.
- Steiger, J. H. & Lind, J. C. (1980). Statistically-based tests for the number of common factors. Paper presented at the Annual Spring Meeting of the Psychometric Society, Iowa City.
- Tucker, L. R & Lewis, C. (1973). A reliability coefficient for maximum likelihood factor analysis. Psychometrika, 38(), 1–10.
- Yu, C. Y. (2002). Evaluation of model fit indices for latent variable models with categorical and continuous outcomes. Unpublished dissertation.
Kết thúc.
Nội dung các chỉ số phù hợp của mô hình nhân tố khẳng định CFA được trình bày rất chi tiết ở nội dung bài viết trên, tuy nhiên, để có thể sử dụng và đánh giá mô hình CFA một cách đầy đủ và chính xác thì Chương 7 của cuốn sách NGHIÊN CỨU KHOA HỌC TRONG KINH TẾ - XÃ HỘI & Hướng dẫn viết luận văn/luận án 2023 sẽ là một sự lựa chọn không thể bỏ qua. Tham khảo để thấy cách bạn sẽ được sở hữu một sản phẩm chất lượng thuộc Top 100 sản phẩm Phân tích kinh tế bán chạy của tháng tại Fahasa.com.
Xem thêm