DMCA.com Protection Status

QUY TRÌNH THU THẬP DỮ LIỆU NGHIÊN CỨU

Quy trình 8 bước thu thập dữ liệu cho một nghiên cứu định lượng được tổng hợp và giới thiệu chi tiết để các nhà nghiên cứu có thể triển khai thực tế.

Sự cần thiết phải thu thập dữ liệu

Thu thập toàn bộ dữ liệu có thể là một quyết định không hợp lý và cần thiết xét về mặt chi phí và thời gian. Thay vào đó, chỉ cần lấy số lượng mẫu phù hợp khi thu thập dữ liệu.

Ngoài ra, với một số tổng thể, người ta không thể tiến hành nghiên cứu đối với toàn bộ các phần tử của tổng thể. Anh/Chị không thể hỏi em bé 10 ngày tuổi nhu cầu của bé về đồ ăn hay bất kỳ loại thức uống nào. Bé này thậm chí còn chưa biết nói, biết đọc cho mục đích trả lời câu hỏi nghiên cứu của bạn.

Khi tiến hành lấy mẫu, tham số quan trọng cần lưu tâm là số lượng mẫu thu thập, được gọi bằng thuật ngữ kích thước mẫu, ký hiệu n. Kích thước mẫu n càng lớn, độ tin cậy của dữ liệu thu được càng tăng; tuy nhiên điều này cũng làm gia tăng chi phí.

Đinh Bá Hùng Anh và cộng sự (2017) đã tổng hợp và đưa ra quy trình thu thập dữ liệu nghiên cứu như trình bày ở Hình 1.

[Nguồn: nghiencuukhoahoc.edu.vn, 2017]

Hình 1. Quy trình thu thập dữ liệu nghiên cứu

Bước 1. Xác định tổng thể

Trong thực tiễn nghiên cứu, nhà nghiên cứu thường dựa vào dữ liệu thứ cấp để xác định tổng thể. Tuy nhiên dữ liệu này thường lạc hậu và tồn tại sai số. Do vậy cần dựa vào dữ liệu thứ cấp rồi ước lượng để xác định quy mô tổng thể (ký hiệu: N, Hình 2). Việc ước lượng này được gọi là xác định tổng thể.

[Nguồn: nghiencuukhoahoc.edu.vn, 2017]

Hình 2. Phân biệt tổng thể và mẫu nghiên cứu

Ví dụ: Nhà nghiên cứu có thể dựa trên kết quả điều tra dân số mới nhất của Tổng cục Thống kê Việt Nam để ước lượng quy mô của người tiêu dùng ở độ tuổi từ 18 đến 45 tại thị trường Tp.HCM. Nếu sử dụng trực tiếp kết quả điều tra dân số chắc chắn sẽ khác với thị trường hiện tại. Bởi vì điều tra dân số được thực hiện 10 năm một lần và bắt đầu từ năm 1999, nghĩa là kết quả được cập nhật vào các năm 1999, 2009, 2019... nên thiếu tính thời sự.

Bước 2. Đơn vị chọn mẫu

Tổng thể có thể chia thành nhiều nhóm để dễ quản lý. Mỗi nhóm được hình thành bởi một hoặc nhiều phần tử để thực hiện việc lấy mẫu.

Ví dụ: Có thể chia thị trường quận Z thành các phường, rồi đến hộ gia đình. Đơn vị hành chính cấp phường được gọi là nhóm, còn hộ gia đình – nhân tố không thể chia tách được nữa là phần tử. Mỗi phần tử gọi là đơn vị chọn mẫu.

Bước 3. Cấu trúc mẫu

Cấu trúc mẫu là danh sách liệt kê thông tin cần thiết của tất cả các phần tử tổng thể (đơn vị lấy mẫu) phục vụ việc lấy mẫu như tuổi tác, nghề nghiệp, thu nhập… Trong quy trình thu thập dữ liệu, hình thành cấu trúc mẫu (khung lấy mẫu) là công việc phức tạp. Nếu không có dữ liệu thứ cấp, người tiến hành nghiên cứu cần thu thập dữ liệu về cấu trúc mẫu bằng việc phỏng vấn, công việc này tốn nhiều thời gian và chi phí.

Bước 4. Phương pháp lấy mẫu

Có hai phương pháp lấy mẫu thường được sử dụng, đó là mẫu phi xác suất và mẫu xác suất.

  • Các phương pháp lấy mẫu thuộc nhóm phi xác suất bao gồm: (1) Mẫu thuận tiện, (2) Mẫu phán đoán, (3) Mẫu theo lớp và (4) Mẫu theo mầm.

  • Các phương pháp lấy mẫu thuộc nhóm xác suất (hay ngẫu nhiên) bao gồm: (1) Ngẫu nhiên đơn giản, (2) Hệ thống, (3) Phân tầng và (4) Theo nhóm.

Chi tiết về cách thức lấy mẫu của mỗi phương pháp được trình bày cụ thể ở bài viết PHƯƠNG PHÁP LẤY MẪU.

Bước 5. Cỡ mẫu

Nhà nghiên cứu dựa vào tham số mẫu để chọn công thức tính cỡ mẫu cho tổng thể có phân phối chuẩn.

Theo tỷ lệ tổng thể – Chất lượng

Mức độ biến động của dữ liệu: V = q (1 – q) tỷ lệ thuận với kích thước mẫu. q thể hiện tỷ lệ xuất hiện của các phần tử trong đơn vị lấy mẫu đúng như mục tiêu chọn mẫu (q dao động từ 0 đến 1).

Độ tin cậy của phương pháp lấy mẫu liên hệ với giá trị Z; thường chọn giá trị Z tương ứng với độ tin cậy 90% hoặc 95%. Tra Bảng 1 để được giá trị Z khi đã biết độ tin cậy.

Bảng 1. Giá trị Z và độ tin cậy thông dụng

Độ tin cậy* (%)

Z

90.00

1.65

95.00

1.96

95.45

2.00

99.00

2.58

99.73

3.00

* Độ tin cậy = 1 - α

[Nguồn: nghiencuukhoahoc.edu.vn, 2017]

Tỷ lệ sai số ước lượng D (nếu điều tra toàn bộ tổng thể thì D = 0).

Ví dụ: Xác định tỷ lệ học sinh bệnh thiếu máu ở bậc tiểu học tại huyện X. Tiến hành khảo sát một trường được tỷ lệ học sinh thiếu máu q = 30%.

Tính kích thước mẫu ở độ tin cậy 95% và cho phép sai số (mẫu) so với tỷ lệ thiếu máu thực là 4%?

Áp dụng công thức theo tỷ lệ tổng thể để tính kích thước mẫu.

Vậy kích thước mẫu là 505.

Theo trung bình – Số lượng

Trong đó,

Z: Trị thống kê tương ứng với độ tin cậy;

s: Độ lệch chuẩn của mẫu ban đầu;

: Trung bình của mẫu ban đầu;

α: Tỷ lệ sai lệch mẫu, giá trị hệ số này phụ thuộc vào độ nhạy của kết quả nghiên cứu;

Giá trị tuyệt đối D = α, tức D là sai số tuyệt đối, kích thước mẫu.

Phụ thuộc độ chính xác mong muốn và tỷ lệ sai lệch mẫu mà sử dụng công thức trên.

Ví dụ: Chọn mức ý nghĩa g = 95%; độ lệch chuẩn s = 1.0;

Trung bình mẫu = 3.0, tỷ lệ sai lệch cho phép α = 0.05.

Độ tin cậy 5% => Z = 1.96 (Bảng tra Phân phối chuẩn).

Vậy kích thước mẫu là 171.

Bước 6. Sơ đồ chọn mẫu

Trường hợp địa bàn rộng, cần quản lý chặt chẽ nhóm nghiên cứu thì cần xây dựng sơ đồ chọn mẫu. Xây dựng bằng cách vẽ phác họa sơ đồ khu vực chọn mẫu, đánh dấu các số nhà trên địa bàn. Chia nhỏ các ô trên bản đồ thành phố, quận, huyện… Đánh số thứ tự các ô, chọn ngẫu nhiên các ô để xác định các hộ gia đình, cửa hàng…

Bước 7. Tiến hành lấy mẫu

Tiến hành lấy mẫu theo quy trình đã trình bày ở trên. Quá trình chọn mẫu có thể sẽ không theo các bước đã chuẩn bị từ trước, vì thế nhà nghiên cứu phải chủ động trong quá trình lấy mẫu để có được kết quả phù hợp.

Bước 8. Kiểm tra và mã hóa dữ liệu

Giám sát viên hoặc nhà nghiên cứu tổ chức kiểm tra thực địa ít nhất 20% số mẫu thu thập được. Kiểm tra bằng cách trở lại địa chỉ đã lấy mẫu, hỏi một vài chỉ tiêu quan trọng và kiểm tra phần xác nhận để đối chiếu.

Mã hóa dữ liệu là quá trình gán mã số (số hoặc nhãn) cho các biến và câu trả lời. Khi mã hóa cần tuân theo nguyên tắc phù hợp, toàn diện, độc nhất và đơn nguyên.

Mỗi mã số chỉ được đại diện cho một câu hỏi hay biến.

Đối với phần mềm thống kê SPSS, biến định tính bao gồm Nominal và Ordinal (đại diện thang đo Nominal và Ordinal), biến định lượng chỉ có Scale (đại diện cho thang đo Interval và Ratio). Tham khảo thêm bài viết THANG ĐO NGHIÊN CỨU để nắm bắt thuộc tính của các thang đo.

 

Kết thúc.


Tin tức liên quan

Mô hình năm khoảng cách chất lượng dịch vụ
Mô hình năm khoảng cách chất lượng dịch vụ

Parasuraman và cộng sự (1985, 1988) đưa ra mô hình năm khoảng cách chất lượng dịch vụ.

Mối quan hệ giữa chất lượng dịch vụ và sự hài lòng khách hàng
Mối quan hệ giữa chất lượng dịch vụ và sự hài lòng khách hàng

Chất lượng dịch vụ là nhân tố tác động nhiều nhất đến sự hài lòng của khách hàng. Nếu nhà cung cấp dịch vụ đem đến cho khách hàng những sản phẩm có chất lượng thỏa mãn nhu cầu của họ thì doanh nghiệp đó đã bước đầu làm cho khách hàng hài lòng.

PHƯƠNG PHÁP LẤY MẪU
PHƯƠNG PHÁP LẤY MẪU

Có hai phương pháp lấy mẫu thường được sử dụng, đó là mẫu phi xác suất và mẫu xác suất, trong đó, mỗi phương pháp thành phần loại có ưu, nhược điểm riêng.


Bình luận
  • Đánh giá của bạn
Đã thêm vào giỏ hàng