Trong các nghiên cứu sử dụng các công cụ thống kê, kết quả được trình bày bao gồm biên sai số, còn được gọi là khoảng tin cậy. Bất kể ý kiến về sản phẩm hay về các vấn đề chính trị được nghiên cứu hay không, các cuộc khảo sát đã thu thập dữ liệu trong một mẫu của một nhóm dân số nhất định sẽ hiển thị kết quả là một giá trị nhất định, thường là theo tỷ lệ phần trăm , kèm theo một giá trị khác đứng trước ký hiệu +/- . Giá trị thứ hai này là lỗi và xác định, cùng với giá trị được đo trong mẫu, phạm vi giá trị trong đó giá trị thực được nghiên cứu trong dân số được ước tính là khác nhau; giá trị dưới của phạm vi này là giá trị đo được trừ sai số, trong khi giá trị trên là giá trị đo được cộng với sai số.
Hãy xem xét trường hợp chung của một mẫu đơn giản được lấy ngẫu nhiên từ một tổng thể đủ lớn. Một ví dụ có thể là nghiên cứu tỷ lệ dân số của một thành phố tiêu thụ một sản phẩm nhất định; Đối với điều này, một nhóm bao gồm nhiều người từ thành phố đó, được chọn ngẫu nhiên, sẽ được hỏi ý kiến nếu họ tiêu thụ sản phẩm nói trên.
Quyết định đầu tiên phải được đưa ra là mức độ tin cậy mà biên độ sai số sẽ được xác định. Mức độ tin cậy được xác định là tỷ lệ phần trăm mà chúng ta muốn xem xét trong khu vực của phân phối chuẩn chuẩn, là phân phối xác suất mà các sự kiện tuân theo các điều kiện đã đề cập. Như thể hiện trong hình bên dưới, diện tích xác định giá trị của z α/2 ; diện tích càng lớn thì mức độ tin cậy về sai số được xem xét càng cao.
Bảng sau đây hiển thị các giá trị của tham số z α/2 cho các giá trị khác nhau của mức độ tin cậy, thể hiện diện tích của phân phối chuẩn được bao phủ, được biểu thị bằng phần trăm của tổng diện tích.
Khi mức độ tin cậy được xác định, biên độ lỗi được tính như
e = z α/2 /( 2√n )
Trong đó n là số trường hợp tạo nên mẫu được phân tích. Khi áp dụng công thức này, rõ ràng là cỡ mẫu mà chúng ta nghiên cứu càng lớn thì biên độ sai số càng nhỏ.
Trong ví dụ trước, nếu nhóm người được tư vấn bao gồm 900 cá nhân và mong muốn có một biên độ sai số với mức độ tin cậy là 95%, thì giá trị của z α/2 là 1,96; Từ việc áp dụng công thức, thu được e = 0,0327, được biểu thị bằng phần trăm là 3,27%. Nếu kết quả của cuộc khảo sát là một nửa số người được hỏi tiêu dùng sản phẩm, nghĩa là giá trị v = 50%, thì kết quả của cuộc khảo sát sẽ là V = 50 +/- 3%, xấp xỉ biên độ 3%. sai lầm. Diễn đạt theo cách khác, dữ liệu cần thu được sẽ nằm trong khoảng giá trị từ 47 đến 53%, với độ tin cậy là 95%.
nguồn
Tâm trạng, Alexander; Graybill, Franklin A.; Boes, Duane C. Giới thiệu về lý thuyết thống kê . Tái bản lần thứ ba, McGraw-Hill, 1974.
Kiểm tra giả thuyết . Suy luận thống kê. Đại học Tự trị Quốc gia Mexico. Truy cập tháng 10 năm 2021.
Westfall, Peter H. Tìm hiểu các phương pháp thống kê nâng cao . Boca Raton, FL: Nhà xuất bản CRC, 2013.