Một phần đặc biệt của mô tả tài liệu là việc thực hiện thống kê nắm tắt để mô tả các đặc trưng đặc biệt của một phân phối. Bố thống kê mô tả thiết yếu giúp trình bày phân phối dữ liệu là các thước đo về địa chỉ hoặc xu hướng trung tâm, các thước đo về hình dạng và các thước đo về độ phân tán (lan truyền).

Bạn đang xem: Phân tích thống kê mô tả

1. Đo lường xu thế hướng tâm

Các thống kê phổ biến để xác định trung trung khu của phân phối bao gồm mode, trung vị (median) cùng trung bình cộng số học (arithmetic mean). Các phép đo trung tâm ít phổ cập hơn là trung bình gồm trọng số (Weighted mean), trung bình đã cắt bớt (trimmed mean) với trung bình cộng hình học (geometric mean).

*

Mode là giá bán trị lộ diện thường xuyên tuyệt nhất trong một phân phối. Ví dụ, trong cung cấp của 10 giá trị sau: 2 10 8 2 13 12 0 6 11 4, mode là 2. Vào phân phối gia tốc được nhóm gộp, khoảng chừng lớp có tần số lớn số 1 được điện thoại tư vấn là khoảng phương thức (modal interval).Trung vị là phân vị vật dụng 50 hoặc giá trị giữa trong một tập hợp những quan sát là vật dụng tự được trong độ lớn. Vào một chuỗi tất cả thứ tự bao gồm số lẻ của các giá trị, trung vị là cực hiếm giữa. Vào một chuỗi tất cả thứ tự gồm số chẵn, ví dụ, 0 2 2 4 6 8 10 11 12 13, trung vị là giá trị trung bình của hai cực hiếm ở giữa. Trong ví dụ này, trung vị là nằm giữa giá trị sản phẩm công nghệ 5 và thứ 6, tức là (6 + 8) /2=7.Trung bình cùng số học (arithmetic mean) là bằng tổng các giá trị trong một phân phối chia mang đến tổng số giá trị. Đối cùng với 10 số sau, 2 10 8 2 13 12 0 6 11 4, trung bình cùng số học tập là: (2+10+8+2+13+12+0+6+11+4)/10 = 68/10 = 6.8 . Cực hiếm trung bình tương xứng với trung trọng tâm của một phân phối.

Ba thước đo xu hướng trung tâm, mode, trung vị cùng trung bình sẽ đủ cho đa số các tình huống bạn cũng có thể gặp phải. Mặc dù nhiên, có hai trường hợp khi trung bình cùng số học (arithmetic mean) hoàn toàn có thể không phù hợp. Khi tất cả các quý hiếm trong một phân phối không tồn tại tầm đặc trưng như nhau hoặc khi họ muốn tính một trung bình toàn diện từ hai mẫu được kết hợp. Giữa những trường vừa lòng này, chúng ta nên đưa ra trọng số tương đối cho các giá trị.

Khi phối kết hợp các quý hiếm từ hai hoặc những mẫu, trung bình cộng số học vẫn bị lệch lạc trừ khi các mẫu được phối hợp có size bằng nhau. Mỗi mẫu mã được phối kết hợp phải được xem trọng số bằng con số quan giáp trong mẫu. Điều này là do độ tin tưởng của vừa phải mẫu phần trăm với số lượng của cực hiếm trong mẫu. Những mẫu nhỏ dại hơn kém tin tưởng hơn các mẫu to hơn và vì thế nên tất cả trọng số nhỏ dại hơn khi tính cực hiếm trung bình tổng thể. Hãy cẩn thận một mẫu với 10 quan tiền sát, 2 10 8 2 13 12 0 6 11 4, và chủng loại thứ nhị với 5 quan lại sát, 18 8 trăng tròn 15 15.

Trung bình cộng số học tập của chủng loại một là 68/10 = 6.8 và chủng loại hai là 76/5 = 15.2. Chúng ta cũng có thể nghĩ rằng quý giá trung bình toàn diện chỉ dễ dàng là vừa đủ cộng của cả hai mẫu, tất cả nghĩa là, (6.8 + 15.2)/2=11. Tuy nhiên, điều đó không đúng mực vì trọng số cân nhau được cân nặng bằng cho tất cả hai mẫu.

Xem thêm: 10 Mẹo Loại Bỏ Tàn Nhang Nhanh Chóng Trên Da, Làm Thế Nào Để Thoát Khỏi Tàn Nhang

Trung bình tất cả trọng số (weighted mean) mang lại hai mẫu là tổng của các trung chủng loại nhân với trọng số tương thích của nó, toàn bộ chia mang đến tổng của các trọng số.Trung bình bao gồm trọng số = <(6.8 × 10) + (15.2 × 5)>/(10+5) = 9.6

Giá trị 9.6 này là giá trị tựa như mà bạn sẽ nhận được nếu như khách hàng thực hiện 15 quan lại sát là một trong những mẫu. Kết hợp hai trung bình chủng loại mà không trọng số bọn chúng dẫn mang lại giá trị cao hơn của 11 so với mức giá trị trung bình có trọng số của 9.6. Cực hiếm trung bình toàn diện được kéo lên vày giá trị trung bình tương đối lớn hơn của mẫu nhỏ hơn.

Trung bình đã cắt bớt (trimmed mean) rất có thể được thực hiện với những mẫu lớn và giống như như cực hiếm trung bình cộng số học (arithmetic mean) nhưng có một trong những giá trị bé dại nhất và mập nhất bị loại bỏ trước lúc tính toán. Thông thường, 5% quý hiếm dưới thuộc và bên trên cùng bị nockout bỏ và quý giá trung bình được tính trên 90% giá trị còn lại. Cảm giác là bớt thiểu tác động của quan sát ngoại lệ cực trị trong giám sát và đo lường giá trị trung bình.Trung bình cùng hình học (geometric mean) rất có ích để tính trung bình của những tỉ lệ. Mang sử một khu nhà ở mới áp dụng chính sách ưu đãi giảm giá trị còn 95% giá trị lúc đầu của nó trong năm đầu tiên. Trong thời điểm tiếp theo, giá trị sụt giảm còn 90% giá bán trị mà nó tất cả vào đầu năm mới thứ nhị và trong những năm thứ ba, quý hiếm vẫn thường xuyên giảm xuống còn 80% giá trị vào đầu năm mới thứ ba. Tỷ lệ giảm giá trị mức độ vừa phải trong khoảng thời hạn ba năm vẫn dẫn mang đến cùng một cực hiếm của ngôi nhà vào thời gian cuối ba năm được cho vì trung bình cùng hình học của bố tỷ lệ.Tỷ lệ giảm ngay trung bình trong 3 năm là: tỷ lệ1 × tỷ lệ2 × tỷ lệ3 = 95 × 90 × 80 = 684000 = tỷ lệ3, vì chưng vậy tỷ lệ = căn bậc ba của 684000 = 88.1 phần trăm.Ký hiệu thông thường là căn thiết bị n của tích (phép nhân) của những giá trị tỷ lệ, trong số ấy n nhắc đến con số giá trịMột cách đơn giản dễ dàng hơn để đo lường trung bình cộng hình học là đem đối số của lôgarit (Antilogarit) của mức độ vừa phải của lôgarit tự nhiên của các tỷ lệ. Logarit cơ số e, được cam kết hiệu là logexi (với xi là một số trong những thực dương bất kỳ) được hotline là logarit trường đoản cú nhiên. Ví dụ: loge2 = 0,693. Trung bình cộng hình học của tía tỷ lệ, 95%, 90% và 80% là = (loge95 + loge90 + loge80)/3=13.436/3=4.479. Đối số của logarit của cực hiếm này là = 88.1. Có nghĩa là loge88.1 = 4.479.

2. Đo lường hình dạng

Hình dạng của một trưng bày là thường xuyên được đối chiếu với đều gì được gọi là một trong phân phối chuẩn. Đây thực sự là một trong phân bố kim chỉ nan được xác minh bằng toán học đến một số lượng dân sinh và đặc thù bởi những thuộc tính:

Đường cong là trơn, gồm một điểm tối đa nằm vị trí trung tâm của phân phối.Mode, trung vị và trung bình đều phải có cùng quý giá và đã cho thấy trung trung khu của phân phối.Đường cong là đặc trưng hình chuông. Điểm cao nhất của mặt đường cong nằm tại chính giữa và các đuôi kéo dãn dài ra cả phía 2 bên của trung chổ chính giữa đến các đầu của đường cung cấp một biện pháp mượt mà.Đường cong là đối xứng.

*

Phân phối chuẩn chỉnh là bổ ích không chỉ hỗ trợ một tiêu chuẩn cho những phân phối thực nghiệm có thể được so sánh, nhưng nó còn đóng góp một vai trò rất quan trọng đặc biệt trong thống kê lại suy luận. Vì sao là bởi vì nhiều hiện tượng xảy ra tự nhiên, chẳng hạn như chiều cao hoặc cân nặng của các đối tượng, sấp xỉ với một phân phối chuẩn chỉnh trong dân số. Những thử nghiệm thống kê giả định các giá trị vào tập dữ liệu đại diện thay mặt một mẫu từ một số lượng dân sinh có phân phối chuẩn cơ bản.

Khi nhìn vào một phân phối dữ liệu, đôi lúc rất cực nhọc để reviews mức độ không chuẩn của dữ liệu. Nhị thước đo khám nghiệm mức độ chuẩn của dữ liệu, đó là độ lệch (skewness) độ nhọn (kurtosis).

Độ lệch là 1 trong chỉ số về nấc độ phân bố không đối xứng hoặc ko chuẩn. Một cung cấp lệch (skewed distribution) bao gồm phần đuôi của đường phân phối hoàn toàn có thể kéo dài sang một bên hơn là bên kia. Nếu phần đuôi của một phân phối kéo dài sang bên cần thì nó tất cả một độ lệch dương (positive skewness). Mức độ vừa phải được kéo về bên phải của trung vị. Nếu phần đuôi của một bản phân phối kéo dãn sang mặt trái, nó sẽ sở hữu độ lệch âm (negative skewness). Trung bình được kéo trở về bên cạnh trái của trung vị.

Nếu một phân phối là đối xứng, độ lệch gần bởi không. Nếu như một trưng bày bị lệch đề nghị thì nó có thông số độ lệch dương với nếu lệch trái sẽ có hệ số âm. Cảnh giác trọng khi lý giải các hệ số lệch nhất là khi các mẫu nhỏ dại ( 1 2 3 4