Tabla de Contenidos
Η περιγραφική στατιστική μας επιτρέπει να συνοψίσουμε ένα σύνολο δεδομένων σε μικρό αριθμό αριθμών ή μετρήσεων που χρησιμεύουν για να περιγράψουν τον τρόπο διανομής αυτών των δεδομένων. Υπάρχουν διάφορα μέτρα που χρησιμεύουν για την περιγραφή της κεντρικής τάσης των δεδομένων, της διασποράς τους και του σχήματος των καμπυλών κατανομής, μερικά από τα οποία βρίσκονται στην πενταριθμητική περίληψη.
Ποια είναι η περίληψη των πέντε αριθμών;
Με βάση τα παραπάνω, η σύνοψη πέντε αριθμών μπορεί να οριστεί ως ένα σύνολο πέντε μέτρων ή στατιστικών που σχετίζονται με ένα σύνολο δεδομένων που επιτρέπουν την περιγραφή με πολύ απλό τρόπο του πλάτους του συνόλου, της διασποράς του. Παρέχει επίσης ένα μέτρο της κεντρικής του τάσης. Επιπλέον, η σύνοψη των πέντε αριθμών μπορεί επίσης να αναπαρασταθεί γραφικά, καθιστώντας εύκολη την οπτικοποίηση αυτών των χαρακτηριστικών ενός συνόλου δεδομένων, ενώ επιτρέπει την εύκολη σύγκριση με άλλα σχετικά σύνολα δεδομένων.
Ποιοι είναι οι πέντε αριθμοί και τι σημαίνουν;
Η σύνοψη πέντε αριθμών αποτελείται από την ελάχιστη τιμή, τα τρία τεταρτημόρια και τη μέγιστη τιμή μιας σειράς στατιστικών δεδομένων. Τα τεταρτημόρια είναι εκείνα τα δεδομένα ή οι τιμές που διαιρούν το ταξινομημένο σύνολο όλων των δεδομένων σε τέσσερις υποομάδες με τον ίδιο αριθμό στοιχείων . Έτσι, εάν έχουμε ένα σύνολο 100 δεδομένων, τα τεταρτημόρια είναι εκείνα τα δεδομένα ή οι τιμές που χωρίζουν το σύνολο σε 4 υποσύνολα των 25 δεδομένων το καθένα.
Τα τεταρτημόρια ονομάζονται με τη σειρά με την οποία εμφανίζονται, από το χαμηλότερο προς το υψηλότερο, όπως το πρώτο, το δεύτερο και το τρίτο τεταρτημόριο. Επιπλέον, αντιπροσωπεύονται με το κεφαλαίο γράμμα Q ακολουθούμενο από τον αριθμό που υποδηλώνει τη σειρά τους. Με τον ορισμό του, το δεύτερο τεταρτημόριο, το Q2, είναι επίσης γνωστό ως διάμεσος ή μέσος των δεδομένων . Δεν πρέπει να συγχέεται με τον μέσο όρο, που είναι ο αριθμητικός μέσος όρος των δεδομένων.
Εκτός από τα τρία τεταρτημόρια (Q1, Q2 και Q3), η σύνοψη με πέντε αριθμούς περιλαμβάνει επίσης την ελάχιστη τιμή των δεδομένων, με σειρά από το μικρότερο προς το μεγαλύτερο, και τη μέγιστη τιμή. Με άλλα λόγια, οι πέντε αριθμοί σε αυτήν την περίληψη είναι:
- Ελάχιστο.– Είναι η πρώτη τιμή ενός συνόλου στατιστικών δεδομένων ταξινομημένων από το χαμηλότερο στο υψηλότερο. Είναι τα δεδομένα χαμηλότερης τιμής.
- Q1 ή πρώτο τεταρτημόριο.– Είναι τα δεδομένα ή η τιμή που διαιρεί το σύνολο δεδομένων, αφήνοντας το 25% (ή το ένα τέταρτο) από αυτά κάτω και το άλλο 75% πάνω.
- Q2 ή δεύτερο τεταρτημόριο.– Είναι τα δεδομένα ή η τιμή που χωρίζει το σύνολο δεδομένων σε δύο ίσες ομάδες. Δηλαδή, είναι η τιμή που αφήνει το 50% των δεδομένων τόσο κάτω όσο και πάνω από αυτό, άρα αντιπροσωπεύει και τη διάμεσο ή το μέσο των δεδομένων.
- Q3 ή τρίτο τεταρτημόριο.– Αυτά είναι τα δεδομένα ή η τιμή που αφήνει το 75% ή τα τρία τέταρτα των δεδομένων παρακάτω και το άλλο 25% πάνω.
- Maximum.– Όπως υποδηλώνει το όνομά του, είναι τα δεδομένα με την υψηλότερη τιμή από ολόκληρη τη σειρά δεδομένων. Δηλαδή, είναι τα τελευταία δεδομένα όταν ταξινομούνται από το χαμηλότερο στο υψηλότερο.
Κατά την ερμηνεία της σύνοψης πέντε αριθμών, η διαφορά μεταξύ της ελάχιστης και της μέγιστης τιμής παρέχει αυτό που είναι γνωστό ως πλάτος της σειράς δεδομένων. Από την άλλη πλευρά, η διαφορά μεταξύ του τρίτου και του πρώτου τεταρτημορίου, που ονομάζεται Interquartile Range (RIC), μας δείχνει πόσο διασκορπισμένα είναι τα δεδομένα, αφού υποδεικνύει το εύρος τιμών που περιέχει το 50% των κεντρικών δεδομένων.
Από την άλλη πλευρά, το δεύτερο τεταρτημόριο ή διάμεσος είναι ένα μέτρο της κεντρικής τάσης που μπορεί να χρησιμοποιηθεί για να αναπαραστήσει την τιμή όλων των δεδομένων της σειράς σε έναν μόνο αριθμό. Αν και ο μέσος όρος χρησιμοποιείται συχνά ως μέτρο της κεντρικής τάσης σε πολλές καταστάσεις, ο διάμεσος προσφέρει το πλεονέκτημα ότι δεν είναι ευαίσθητος σε ακραίες τιμές (πολύ υψηλές ή πολύ χαμηλές).
Πλαίσια γραφήματα: η γραφική αναπαράσταση της περίληψης πέντε αριθμών
Ένας πρακτικός τρόπος για να απεικονίσετε μια σύνοψη πέντε αριθμών είναι μέσω αυτού που ονομάζεται διάγραμμα πλαισίου ή Διάγραμμα πλαισίου . Σε αυτόν τον τύπο αναπαράστασης, το διατεταρτημόριο (IQR) αναπαρίσταται ως ένα ορθογώνιο ή πλαίσιο που εκτείνεται από το Q1 έως το Q3 και διαιρείται στα δύο με μια γραμμή κάθετη στον άξονα μέτρησης που βρίσκεται στο Q2, δηλαδή στη διάμεσο.
Τέλος, σε κάθε πλευρά του κιβωτίου σχεδιάζονται γραμμές παράλληλες με τον άξονα μέτρησης που εκτείνονται από το ελάχιστο έως το Q1 και από το Q3 στο μέγιστο, εφόσον το ελάχιστο και το μέγιστο δεν υπερβαίνουν το 1,5.RIC απόστασης προς τα αριστερά και δικαίωμα του Q1 και του Q3, αντίστοιχα. Αυτές οι πλευρικές γραμμές είναι γνωστές ως τα μουστάκια του κουτιού. Εάν υπάρχουν δεδομένα εκτός του εύρους που οριοθετείται από Q1 – 1.5.RIC και Q3 + 1.5.RIC, τότε οι πλευρές (μερικές φορές ονομάζονται μουστάκια) επεκτείνονται μέχρι τα δεδομένα που βρίσκονται πιο μακριά από το πλαίσιο που βρίσκεται μέσα σε αυτό το εύρος και οι υπόλοιπες σημειώνονται ως ακραίες τιμές.
Παράδειγμα προετοιμασίας της περίληψης πέντε αριθμών για μια σειρά δεδομένων
Στη συνέχεια, παρουσιάζεται, βήμα προς βήμα, η διαδικασία για την επεξεργασία μιας περίληψης πέντε αριθμών από ένα σύνολο στατιστικών δεδομένων. Επιπλέον, εξηγεί πώς να δημιουργήσετε την γραφική παράσταση πλαισίου για την απεικόνιση αυτής της περίληψης σε γραφική μορφή.
Τα δεδομένα αντιστοιχούν στον αριθμό των ειδών που πωλήθηκαν στο γυναικείο τμήμα ενός πολυκαταστήματος κατά τη διάρκεια μιας περιόδου 10 εβδομάδων. Τα αποτελέσματα της μελέτης παρουσιάζονται παρακάτω:
Δευτέρα | Τρίτη | Τετάρτη | Πέμπτη | Παρασκευή | Σάββατο | Κυριακή | |
Εβδομάδα 1 | 158 | 145 | 156 | 156 | 164 | 167 | 147 |
εβδομάδα 2 | 161 | 146 | 157 | 152 | 162 | 160 | 153 |
Εβδομάδα 3 | 152 | 150 | 157 | 155 | 164 | 166 | 152 |
εβδομάδα 4 | 150 | 149 | 153 | 162 | 169 | 162 | 149 |
εβδομάδα 5 | 157 | 152 | 154 | 155 | 168 | 161 | 155 |
εβδομάδα 6 | 157 | 145 | 160 | 164 | 164 | 168 | 149 |
εβδομάδα 7 | 160 | 152 | 151 | 152 | 168 | 163 | 145 |
εβδομάδα 8 | 157 | 152 | 155 | 156 | 162 | 169 | 155 |
εβδομάδα 9 | 160 | 148 | 157 | 150 | 164 | 170 | 154 |
εβδομάδα 10 | 158 | 146 | 163 | 158 | 165 | 169 | 150 |
Βήμα 1: Ταξινομήστε όλα τα δεδομένα από το μικρότερο στο μεγαλύτερο και αντιστοιχίστε τους ένα ευρετήριο που ξεκινά από το 1.
Το αποτέλεσμα αυτού του βήματος παρουσιάζεται παρακάτω:
Δείκτης | Αξία | Δείκτης | Αξία | Δείκτης | Αξία | Δείκτης | Αξία |
1 | 145 | 22 | 152 | 43 | 158 | 64 | 168 |
2 | 145 | 23 | 153 | 44 | 160 | 65 | 168 |
3 | 145 | 24 | 153 | Τέσσερα πέντε | 160 | 66 | 168 |
4 | 146 | 25 | 154 | 46 | 160 | 67 | 169 |
5 | 146 | 26 | 154 | 47 | 160 | 68 | 169 |
6 | 147 | 27 | 155 | 48 | 161 | 69 | 169 |
7 | 148 | 28 | 155 | 49 | 161 | 70 | 170 |
8 | 149 | 29 | 155 | πενήντα | 162 | ||
9 | 149 | 30 | 155 | 51 | 162 | ||
10 | 149 | 31 | 155 | 52 | 162 | ||
έντεκα | 150 | 32 | 156 | 53 | 162 | ||
12 | 150 | 33 | 156 | 54 | 163 | ||
13 | 150 | 3. 4 | 156 | 55 | 163 | ||
14 | 150 | 35 | 157 | 56 | 164 | ||
δεκαπέντε | 151 | 36 | 157 | 57 | 164 | ||
16 | 152 | 37 | 157 | 58 | 164 | ||
17 | 152 | 38 | 157 | 59 | 164 | ||
18 | 152 | 39 | 157 | 60 | 164 | ||
19 | 152 | 40 | 157 | 61 | 165 | ||
είκοσι | 152 | 41 | 158 | 62 | 166 | ||
είκοσι ένα | 152 | 42 | 158 | 63 | 167 |
Βήμα 2: Προσδιορίστε τα τεταρτημόρια Q1 και Q3
Για να προσδιορίσουμε τα τεταρτημόρια Q1, Q2 και Q3, ξεκινάμε με τον υπολογισμό ενός δείκτη για τα δεδομένα που αντιστοιχούν σε κάθε τεταρτημόριο. Ο τύπος είναι ο εξής:
Όπου N είναι ο συνολικός αριθμός δεδομένων. Αυτός ο υπολογισμός μπορεί να είναι ακέραιος ή όχι, επομένως η διαδικασία χωρίζεται σε δύο περιπτώσεις:
Περίπτωση 1: Ακέραιο αποτέλεσμα
Εάν το αποτέλεσμα είναι ακέραιος, τότε το αντίστοιχο τεταρτημόριο θα είναι η τιμή των δεδομένων στα οποία αντιστοιχεί ο δείκτης. Για παράδειγμα, εάν ο δείκτης του Q1 δίνει 10, αυτό σημαίνει ότι το Q1 θα είναι η τιμή του αριθμού δεδομένων 10 (149 στο παράδειγμά μας).
Περίπτωση 2: Δεκαδικό αποτέλεσμα
Εάν ο δείκτης είναι δεκαδικός αριθμός, τότε το τεταρτημόριο δεν θα αντιστοιχεί ακριβώς σε κανένα από τα δεδομένα που υπάρχουν στη σειρά. Σε αυτήν την περίπτωση, το αποτέλεσμα στρογγυλοποιείται προς τα κάτω και το τεταρτημόριο υπολογίζεται από αυτά τα δεδομένα και αυτό που το ακολουθεί, χρησιμοποιώντας τον ακόλουθο τύπο:
Όπου d αντιπροσωπεύει το δεκαδικό μέρος του δείκτη, x i είναι τα δεδομένα με τον δείκτη στρογγυλοποιημένο προς τα κάτω και x i+1 είναι το επόμενο σημείο δεδομένων.
Στην περίπτωση του παραδείγματός μας, αυτό είναι το αποτέλεσμα του υπολογισμού των δεικτών των τριών τεταρτημορίων:
Σε όλες τις περιπτώσεις το αποτέλεσμα ήταν ένας δεκαδικός αριθμός, οπότε τώρα εφαρμόζουμε τον τύπο από την περίπτωση 2 για να προσδιορίσουμε την τιμή κάθε τεταρτημορίου:
Βήμα 3: Προσδιορίστε τους πέντε αριθμούς
Τώρα που έχουμε ταξινομήσει τα δεδομένα και προσδιορίσαμε επίσης τις τιμές των τριών τεταρτημορίων, η σύνοψη των πέντε αριθμών είναι:
Ελάχιστο: | 145 |
Ε1: | 152 |
Q2 ή διάμεσος: | 157 |
Ε3: | 162,25 |
Ανώτατο όριο: | 170 |
Βήμα 4: Κατασκευάστε το πλαίσιο
Έχουμε ήδη όλα τα απαραίτητα για την κατασκευή του boxplot εκτός από το RIC. Με βάση το αποτέλεσμα που λήφθηκε στο προηγούμενο βήμα, η διαφορά μεταξύ Q3 και Q1 είναι:
Για να προσδιορίσουμε αν υπάρχουν ακραίες τιμές, υπολογίζουμε το Q1 – 1,5 IQR και το Q3 + 1,5 IQR και συγκρίνουμε με το ελάχιστο και το μέγιστο:
Όπως μπορούμε να δούμε, δεν υπάρχουν ακραίες τιμές αφού το ελάχιστο, 140, είναι μεγαλύτερο από 136.625. Επίσης, δεν υπάρχουν ακραίες τιμές, καθώς το μέγιστο, 170, είναι μικρότερο από 177.625.
Το παρακάτω σχήμα δείχνει το αποτέλεσμα της κατασκευής του τετραγώνου που αντιστοιχεί στο παράδειγμα:
βιβλιογραφικές αναφορές
Πώς να συγκεντρώσετε μια πενταψήφια περίληψη ενός στατιστικού δείγματος . (ν). FaqSalex.info. https://faqsalex.info/educaci%C3%B3n/21361-c%C3%B3mo-reunir-a-un-resumen-de-cinco-n%C3%BAmeros-de-una.html
McAdams, D. (2009, 4 Μαρτίου). Σύνοψη πέντε αριθμών. Η ζωή είναι μια ιστορία Problem.org. https://lifeisastoryproblem.tripod.com/es/f/fivenumbersummary.html
Serra, BR (2020, 22 Νοεμβρίου). διάμεσος . Universe Formulas. https://www.universoformulas.com/estadistica/descriptiva/mediana/#calculo
Serra, BR (2021, 4 Αυγούστου). τεταρτημόρια . Universe Formulas. https://www.universoformulas.com/estadistica/descriptiva/cuartiles/#example
Zentica Global. (ν). Brutalk – Πώς να υπολογίσετε την περίληψη 5 αριθμών για τα δεδομένα σας στην Python . Brutalk. https://www.brutalk.com/en/news/brutalk-blog/view/how-to-calculate-the-summary-of-5-numbers-for-your-data-in-python-6047097da7d56