Tabla de Contenidos
Độ lệch chuẩn của một tập dữ liệu hoặc của một mẫu từ một quần thể nhất định là một tham số thống kê mô tả để đo mức độ lan truyền của các giá trị trong tập hợp đó. Nếu tính trung bình của một tập hợp các giá trị, thì độ lệch chuẩn đánh giá sự khác biệt của các giá trị trong tập hợp so với giá trị trung bình.
Độ lệch chuẩn là một số thực không âm. Vì 0 là một số thực không âm, nên cần đặt câu hỏi khi nào thì độ lệch chuẩn sẽ bằng 0 và điều đó có nghĩa là gì. Điều này chỉ xảy ra trong một trường hợp rất cụ thể, đó là khi tất cả các giá trị trong tập dữ liệu hoàn toàn giống nhau.
độ lệch chuẩn
Khi bạn có một tập dữ liệu, cho dù đó là một mẫu từ một tập hợp nhất định hay một tập hợp các giá trị do một hệ thống nhất định tạo ra, thì có hai câu hỏi ngay lập tức xuất hiện: chúng ta có thể liên kết tập dữ liệu với giá trị xác định nào và giá trị là gì? sự phân tán của tập dữ liệu? tập dữ liệu chúng tôi phân tích.
Trong cái gọi là thống kê mô tả, có các tham số khác nhau tìm cách trả lời hai câu hỏi này. Để đánh giá giá trị mà chúng ta có thể liên kết với tập dữ liệu, chúng ta có thể tính giá trị trung bình hoặc trung bình số học, trung bình hình học, trung bình điều hòa, chế độ, phạm vi trung bình hoặc trung bình. Trong trường hợp này, chúng tôi sẽ sử dụng trung bình hoặc trung bình cộng: trung bình của một tập hợp các giá trị n là tổng của tất cả chúng chia cho số giá trị n .
Sự lan rộng của các giá trị trong một tập hợp có thể được đánh giá bằng cách tính toán độ lệch chuẩn, phạm vi hoặc phạm vi liên vùng. Hình dưới đây cho thấy công thức chung được sử dụng để tính độ lệch chuẩn σ . Được thể hiện bằng lời: chúng tôi trừ đi từ mỗi giá trị của tập hợp mà chúng tôi phân tích, mà chúng tôi lưu ý với chỉ số i , giá trị trung bình của tất cả các giá trị; chúng tôi bình phương từng điểm khác biệt này và cộng chúng lại; Chúng tôi chia kết quả cho số lượng giá trị trong tập hợp trừ đi 1 và tính căn bậc hai của giá trị này.
Độ lệch chuẩn có hai định nghĩa khác nhau, tùy thuộc vào loại dữ liệu chúng tôi đang phân tích. Sự khác biệt này ngụ ý một tính toán hơi khác nhau. Độ lệch chuẩn có thể tính trên tổng thể hoặc trên mẫu.
Nếu dữ liệu được thu thập từ tất cả các thành viên của tổng thể hoặc một tập hợp, thì phải sử dụng độ lệch chuẩn của tổng thể. Nếu bạn đang phân tích dữ liệu đại diện cho một mẫu từ tổng thể lớn hơn, bạn phải sử dụng độ lệch chuẩn của mẫu. Sự khác biệt trong tính toán là trong trường hợp độ lệch chuẩn của một mẫu, sự khác biệt giữa từng giá trị và trung bình bình phương được chia cho số lượng giá trị trừ đi 1 ( n – 1), như thể hiện trong hình . Đối với độ lệch chuẩn của dân số, hãy chia cho n .
Độ lệch chuẩn bằng không.
Độ lệch chuẩn σ được tính theo cách này đánh giá mức độ phân tán của các giá trị trong tập hợp: giá trị của nó càng lớn thì mức độ lây lan càng lớn. Y luôn là một số dương, vì nó là tổng của các giá trị bình phương, do đó, tất cả sẽ dương. Vì vậy, theo trực giác, nếu giá trị của độ lệch chuẩn bằng 0 thì mức chênh lệch sẽ bằng không. Và điều này xảy ra khi tất cả các giá trị trong tập hợp trùng khớp: không có sự phân tán.
Đổi lại, nếu tất cả các giá trị trong tập hợp khớp với nhau, thì giá trị trung bình cũng khớp với giá trị đó. Theo định nghĩa trước đây về trung bình cộng, nếu n giá trị của tập hợp bằng nhau, tổng của n giá trị chuyển thành phép nhân giá trị đó với n ; khi chia nó cho n để tính giá trị trung bình, cả hai giá trị của n đều bị loại bỏ và khi đó chúng ta có giá trị trung bình bằng giá trị duy nhất của tập hợp. Phát triển mô tả này trong một phương trình, nếu có n giá trị bằng nhau, được biểu thị bằng x , giá trị trung bình được tính là
( x + x + x + x + x +…+ x )/ n = nx / n = x
Hãy xem điều gì xảy ra với phép tính độ lệch chuẩn bằng công thức được mô tả trước đây. Trong công thức đó, mỗi giá trị x i đều bằng x , và lần lượt bằng giá trị trung bình. Do đó, khi lấy giá trị trung bình trừ đi từng giá trị x i , kết quả sẽ bằng không. Có một tổng với tất cả các phần bổ sung của nó bằng 0, kết quả cũng sẽ bằng 0. Và khi đó kết quả cuối cùng của độ lệch chuẩn sẽ bằng không.
Sau đó, chúng ta đã thấy rằng khi tất cả các giá trị trong một tập hợp bằng nhau, giá trị trung bình bằng giá trị đó và độ lệch chuẩn bằng không. Hãy xem xét tình huống ngược lại: độ lệch chuẩn chỉ bằng 0 nếu tất cả các giá trị trong tập hợp đều bằng nhau?
Để kiểm tra điều này, hãy xem điều gì sẽ xảy ra nếu chỉ có một giá trị khác nhau. Điều đó có nghĩa là giá trị trung bình không còn bằng tất cả các giá trị trong tập hợp và khi đó ít nhất một trong các phần bổ sung của phép tính độ lệch chuẩn sẽ khác 0: do đó, độ lệch chuẩn sẽ không bằng 0. Vì tổng này được phát triển trên các giá trị được nâng lên bình phương, nên tất cả các phép cộng đều dương và không thể bù chúng trong một phép trừ. Cách duy nhất để tổng các số dương bằng 0 là tất cả các số cộng bằng 0; do đó, cách duy nhất để độ lệch chuẩn bằng 0 là tất cả các giá trị trong nhóm bằng giá trị trung bình, và do đó bằng nhau.
Cả hai đối số tạo thành điều kiện cần và đủ: độ lệch chuẩn của một tập hợp các giá trị chỉ bằng 0 nếu tất cả các giá trị trong tập hợp đó đều bằng nhau.
Đài phun nước
Yadolah Dodge. Bách khoa toàn thư ngắn gọn về thống kê . New York: Mùa xuân, 2010.