Sự khác biệt giữa độ lệch chuẩn dân số và mẫu

Artículo revisado y aprobado por nuestro equipo editorial, siguiendo los criterios de redacción y edición de YuBrain.


Trong thống kê mô tả, có một loạt các biện pháp cho phép chúng ta quan sát các khía cạnh chung khác nhau của dữ liệu tổng thể. Một số được sử dụng để đo xu hướng trung tâm của dữ liệu, trong khi một số khác tìm cách đưa ra ý tưởng về tính biến thiên hoặc phân tán của dữ liệu, nghĩa là cách dữ liệu được phân phối xung quanh xu hướng trung tâm nói trên.

Hai biện pháp quan trọng của sự thay đổi hoặc phân tán là phương sai và độ lệch chuẩn. Hai thước đo này có quan hệ chặt chẽ với nhau, tuy nhiên, có hai phiên bản của phương sai và hai phiên bản tương ứng của độ lệch chuẩn, đó là tổng thể và mẫu.

Tóm tắt thống kê dân số so với mẫu

Điều đáng chú ý là một thực tế có tầm quan trọng lớn, đó là trong thống kê, thường có hai phiên bản của mỗi biện pháp tóm tắt hành vi của một chuỗi dữ liệu và được sử dụng trong các ngữ cảnh khác nhau.

Để bắt đầu, chúng ta phải phân biệt giữa dữ liệu từ tổng thể (hoặc dữ liệu dân số) và dữ liệu từ tập hợp con của tổng thể đó, được gọi là mẫu. Mặc dù dữ liệu dân số và dữ liệu mẫu không thể phân biệt về mặt toán học, nhưng về mặt khái niệm, chúng rất khác nhau.

tổng điều tra dân số

Dữ liệu dân số là dữ liệu thu được thông qua điều tra thống kê, nghĩa là đo lường hoặc phân tích từng thành phần hoặc cá nhân tạo nên dân số (tất nhiên là miễn là nó hữu hạn). Khi chúng tôi tính toán các biện pháp đo lường xu hướng trung tâm hoặc phân tán cho dữ liệu dân số, chúng tôi thu được các biện pháp tóm tắt hành vi chung của dân số, mà chúng tôi gọi là tham số dân số và là giá trị cố định cho dân số (nghĩa là dân số chỉ có một giá trị trung bình , một chế độ, một độ lệch chuẩn, v.v. tại một thời điểm nhất định). Trong trường hợp này, chúng tôi đang sử dụng thống kê mô tả .

Lấy mẫu

Mặt khác, trong nhiều tình huống khác nhau, chúng tôi thực hiện quy trình lấy mẫu để chỉ phân tích một số thành phần của tổng thể, do đó thu được dữ liệu mẫu. Trong những trường hợp này, chúng tôi cũng có thể sử dụng các công cụ thống kê mô tả để quan sát hành vi chung của những dữ liệu này, tuy nhiên, chúng tôi không thực sự thực hiện thống kê mô tả trên dân số, mà chỉ trên mẫu.

Tóm tắt số của mẫu không phải là tham số, nhưng được gọi là số liệu thống kê (mặc dù một số người cũng gọi chúng là số liệu thống kê). Không giống như các tham số, số liệu thống kê thay đổi từ mẫu này sang mẫu khác , ngay cả khi các mẫu được lấy từ cùng một quần thể. Điều này là do, khi chọn một tập hợp con của tổng thể, có thể có nhiều tổ hợp các phần tử có thể tạo nên mẫu. Vì lý do này, nói chung, các mẫu được tạo thành từ các đối tượng, cá nhân hoặc yếu tố khác nhau, dẫn đến các số liệu thống kê khác nhau.

Mục tiêu cuối cùng của việc tính toán các số liệu thống kê này trên mẫu là có thể sử dụng chúng làm công cụ ước tính các tham số dân số tương ứng. Quá trình suy luận hoặc ước tính hành vi của dữ liệu dân số từ dữ liệu mẫu là những gì thống kê suy luận chịu trách nhiệm . Điều này làm cho các phương sai tổng thể và mẫu và độ lệch chuẩn về cơ bản là khác nhau.

Nhưng chính xác thì phương sai và độ lệch chuẩn là gì?

Phương sai là gì?

Phương sai là thước đo độ phân tán từ giá trị trung bình của một tập dữ liệu. Nó được định nghĩa là giá trị trung bình của các độ lệch bình phương của tất cả dữ liệu so với giá trị trung bình. Là trung bình cộng của bình phương sự khác biệt, nó luôn là một đại lượng dương.

Độ lệch chuẩn là gì?

Mặt khác, độ lệch chuẩn chỉ đơn giản là căn bậc hai dương của phương sai. Nó cũng đo lường sự phân tán xung quanh giá trị trung bình, chỉ có điều nó làm như vậy về cùng một đơn vị dữ liệu và giá trị trung bình. Điều này làm cho nó dễ hiểu và diễn giải hơn phương sai.

Vì độ lệch chuẩn được tính bằng căn bậc hai của phương sai, sẽ không có ý nghĩa gì khi nói về độ lệch chuẩn của tổng thể và mẫu mà không nói về phương sai của tổng thể và mẫu.

Sự khác biệt quan trọng nhất giữa các biện pháp phổ biến phân tán xung quanh giá trị trung bình sẽ được mô tả chi tiết trong các phần sau.

Sự khác biệt 1: Độ lệch chuẩn và phương sai tổng thể và mẫu được thể hiện bằng các ký hiệu khác nhau

Sự khác biệt đầu tiên cần xem xét khi so sánh phương sai của tổng thể và mẫu và độ lệch chuẩn của tổng thể và mẫu là ký hiệu được sử dụng để biểu thị chúng. Trong thống kê, các bản tóm tắt hoặc tham số số dân số thường được biểu thị bằng các chữ cái Hy Lạp , trong khi các phiên bản mẫu hoặc thống kê được biểu thị bằng các chữ cái tương đương của bảng chữ cái Latinh .

Theo nghĩa này, cả phương sai và độ lệch chuẩn dân số đều được liên kết với chữ sigma chữ thường trong tiếng Hy Lạp trong khi các phiên bản mẫu được biểu thị bằng chữ s . Nghĩa là , phương sai tổng thể là σ 2độ lệch chuẩn tổng thể là σ , trong khi phương sai mẫu được biểu thị bằng s 2độ lệch chuẩn mẫu được biểu thị bằng s .

Sự khác biệt 2: Chúng được tính bằng các công thức khác nhau

Cả độ lệch chuẩn của tổng thể và mẫu được tính bằng căn bậc hai dương của phương sai tương ứng, nghĩa là:

Sự khác biệt giữa độ lệch chuẩn dân số và mẫu

Tuy nhiên, phương sai tổng thể và mẫu được tính bằng các công thức hơi khác nhau. Trong trường hợp phương sai tổng thể, giá trị này được tính bằng giá trị trung bình của bình phương độ lệch của mỗi mốc so với trung bình tổng thể. Nghĩa là, nó được tính bằng một trong các biểu thức tương đương sau:

Sự khác biệt giữa độ lệch chuẩn dân số và mẫu

Trong đó x i đại diện cho giá trị của từng mục dữ liệu trong tổng thể, μ đại diện cho giá trị trung bình của tổng thể và N là quy mô của tổng thể. Do đó, độ lệch chuẩn dân số được tính như sau:

Sự khác biệt giữa độ lệch chuẩn dân số và mẫu

Thay vào đó, thay vì chia cho số điểm dữ liệu, n , như mong đợi, phương sai mẫu được tính bằng cách chia tổng bình phương độ lệch từ trung bình mẫu cho n – 1 . Nói cách khác, phương sai mẫu được tính như sau:

Sự khác biệt giữa độ lệch chuẩn dân số và mẫu

Trong đó x i đại diện cho giá trị của từng mục dữ liệu trong mẫu, x̄ đại diện cho giá trị trung bình của mẫu và n là kích thước mẫu. Theo quan điểm trên, độ lệch chuẩn mẫu được tính như sau:

Sự khác biệt giữa độ lệch chuẩn dân số và mẫu

Biện minh cho việc chia cho n – 1 thay vì n

Một câu hỏi phổ biến nảy sinh khi so sánh độ lệch chuẩn của dân số và mẫu là tại sao lại chia cho n – 1 mà không phải cho n ? Lý do rất đơn giản.

Như đã đề cập trước đây, việc tính toán các số liệu thống kê như độ lệch chuẩn mẫu tìm cách thiết lập các công cụ ước tính càng gần với các tham số dân số tương ứng càng tốt. Điều này có nghĩa là độ lệch chuẩn của mẫu phải được tính sao cho kết quả càng gần với độ lệch chuẩn của tổng thể càng tốt.

Điều này gợi ý rằng chúng nên được tính bằng các công thức tương đương, nhưng điều này không phải lúc nào cũng đúng. Vấn đề là độ lệch chuẩn của mẫu đo lường mức chênh lệch xung quanh giá trị trung bình của mẫu chứ không phải giá trị trung bình của tổng thể. Mặc dù trung bình mẫu là một thống kê được sử dụng như một công cụ ước tính trung bình dân số, nhưng nó không chính xác bằng nó. Điều này làm cho các giá trị riêng lẻ trong mỗi mẫu gần với giá trị trung bình của mẫu (thực tế là thước đo xu hướng trung tâm của dữ liệu đó) hơn là giá trị trung bình của tổng thể. Quá hạn,

Để hiệu chỉnh sự khác biệt này, một đơn vị được trừ đi từ mẫu số để làm cho độ lệch chuẩn của mẫu lớn hơn, và do đó gần với độ lệch chuẩn của tổng thể hơn.

Sự khác biệt 3: Chúng hiếm khi giống nhau

Bất kể những hiệu chỉnh có thể được thực hiện đối với độ lệch chuẩn của mẫu, nó hiếm khi bằng với độ lệch chuẩn của tổng thể. Điều này là do, trong một tổng thể, dữ liệu có thể thay đổi ngẫu nhiên, do đó, các mẫu khác nhau sẽ dẫn đến độ lệch chuẩn mẫu khác nhau. Trên thực tế, có một phân phối toàn bộ các giá trị có thể có của độ lệch chuẩn mẫu tùy thuộc vào kích thước của mẫu.

Sự khác biệt 4: Độ lệch chuẩn của mẫu luôn có thể được biết hoặc xác định, trong khi độ lệch chuẩn của tổng thể gần như không bao giờ được biết một cách chắc chắn.

Một sự khác biệt quan trọng khác giữa hai biện pháp phân tán này là độ lệch chuẩn tổng thể (và thực tế là bất kỳ tham số tổng thể nào) hiếm khi được biết đến. Trong một số trường hợp, điều này là do những hạn chế về kỹ thuật hoặc kinh tế, vì nó rất tốn kém và hơn nữa, không có khả năng đo lường hoàn toàn tất cả dữ liệu của dân số. Trong các trường hợp khác, việc xác định các tham số dân số đơn giản là không thể, vì dân số là vô hạn hoặc đơn giản là vì chúng ta không có quyền truy cập vào tất cả các phần tử tạo nên nó.

Nói cách khác, chúng ta gần như không bao giờ biết tất cả N giá trị của x i trong một tổng thể, khiến cho việc tính toán trung bình tổng thể, phương sai và nói rộng ra là độ lệch chuẩn là không thể. Điều tốt nhất chúng ta có thể biết là ước tính điểm của một tham số, chẳng hạn như độ lệch chuẩn hoặc khoảng giá trị trong đó chúng ta có một số mức độ tin cậy rằng độ lệch chuẩn hoặc tham số tổng thể khác nằm.

Mặt khác, trong trường hợp mẫu, chúng tôi biết tất cả dữ liệu, vì vậy chúng tôi luôn có thể tính toán độ lệch chuẩn của bất kỳ mẫu nào, bất kể kích thước của mẫu.

Tóm tắt sự khác biệt giữa độ lệch chuẩn dân số và mẫu

Bảng sau đây tóm tắt sự khác biệt giữa độ lệch chuẩn tổng thể và độ lệch chuẩn mẫu được thảo luận trong các phần trước:

đặc trưng Độ lệch tiêu chuẩn dân số Độ lệch chuẩn mẫu
Biểu tượng σ Đúng
Nó được tính cho dữ liệu dân số dữ liệu mẫu
Chi nhánh thống kê trong đó nó được sử dụng Thống kê mô tả thống kê suy luận
Loại biện pháp Tham số thống kê
Công thức Chia cho N, quy mô dân số Chia cho n – 1, trong đó n là cỡ mẫu
sự thay đổi Nó được cố định cho một dân số nhất định tại một thời điểm nhất định Thay đổi từ mẫu này sang mẫu khác, bất kể các mẫu có cùng kích thước và được lấy từ cùng một quần thể hay không
Sự chắc chắn về giá trị của nó Nó nói chung là không rõ. Chỉ có một ước tính của nó có sẵn. Được biết với mỗi mẫu

Người giới thiệu

Các trung tâm học tập cộng đồng. (nd). Độ lệch Chuẩn . http://www.cca.org.mx/cca/cursos/estadistica/html/m11/desviacion_estandar.htm

Levy Sarfin, R. (sf). Sự khác biệt giữa mẫu và độ lệch chuẩn dân số là gì . Giọng nói. https://pyme.lavoztx.com/what-is-the-difference-entre-la-sample-and-the-standard-deviation-of-the-population-5641.html

MateMobile. (2021, ngày 1 tháng 1). Phương sai và độ lệch chuẩn, ví dụ và bài tập . https://matemovil.com/varianza-y-desviacion-estandar-ejemplos-y-ejercicios/

Molina, M. (2016, ngày 27 tháng 1). Tại sao phụ tùng một? Ước tính các tham số dân số . Gây mê. https://anestesiar.org/2016/por-que-sobra-uno-estimando-parametros-de-la-poblacion/

Serra, BR (2020, ngày 26 tháng 10). Độ lệch tiêu chuẩn hoặc tiêu chuẩn . Công thức vũ trụ. https://www.universoformulas.com/estadistica/descriptiva/desviacion-típica/

-Quảng cáo-

Israel Parada (Licentiate,Professor ULA)
Israel Parada (Licentiate,Professor ULA)
(Licenciado en Química) - AUTOR. Profesor universitario de Química. Divulgador científico.

Artículos relacionados