Academia.eduAcademia.edu
Thống kê ứng dụng Thống kê ứng dụng N.T. M. Ngọc N.T. M. Ngọc 1. Biến ngẫu nhiên Chương 3 Phân phối xác suất của trung bình mẫu, của tỉ lệ mẫu 2. Phân phối xác suất 3. Phân phối xác suất của trung bình mẫu 3.1 Các đặc trưng của mẫu ngẫu nhiên 3.2 Phân phối xác suất của trung bình mẫu Nguyễn Thị Mộng Ngọc University of Science, VNU - HCM ngtmngoc@hcmus.edu.vn Thống kê ứng dụng N.T. M. Ngọc 1. Biến ngẫu nhiên 2. Phân phối xác suất 3. Phân phối xác suất của trung bình mẫu 3.1 Các đặc trưng của mẫu ngẫu nhiên 3.2 Phân phối xác suất của trung bình mẫu Ví dụ: Xét phép thử tung hai đồng xu. Không gian mẫu của phép thử này là Ω = {SS, SN, NS, NN} Gọi X là số mặt ngửa xuất hiện. Khi đó, X là một ánh xạ từ không gian mẫu Ω vào R như: ω SS NS SN NN X (ω) 0 1 1 2 Biến ngẫu nhiên là mô tả bằng số các kết quả của một phép thử. Định nghĩa: Biến ngẫu nhiên X là một ánh xạ từ không gian sơ cấp Ω vào R, X :Ω→R ω 7→ X (ω) = x Giá trị x đgl một giá trị của biến ngẫu nhiên X . • Kí hiệu: X , Y , . . . là các biến ngẫu nhiên, x , y , . . . là giá trị của các biến ngẫu nhiên đó. Thống kê ứng dụng Ví dụ: Các đại lượng sau là biến ngẫu nhiên: - Số chấm xuất hiện khi thực hiện phép thử tung con xúc xắc. - Tuổi thọ của một thiết bị đang hoạt động. - Số cuộc gọi đến tổng đài. Định nghĩa biến ngẫu nhiên N.T. M. Ngọc 1. Biến ngẫu nhiên 2. Phân phối xác suất 3. Phân phối xác suất của trung bình mẫu 3.1 Các đặc trưng của mẫu ngẫu nhiên 3.2 Phân phối xác suất của trung bình mẫu Phân loại biến ngẫu nhiên Dựa vào miền giá trị của biến ngẫu nhiên mà ta phân thành 2 loại chính như: 1. Biến ngẫu nhiên rời rạc 2. Biến ngẫu liên tục Thống kê ứng dụng N.T. M. Ngọc 1. Biến ngẫu nhiên 2. Phân phối xác suất 3. Phân phối xác suất của trung bình mẫu 3.1 Các đặc trưng của mẫu ngẫu nhiên 3.2 Phân phối xác suất của trung bình mẫu Biến ngẫu nhiên rời rạc Biến ngẫu nhiên X gọi là biến ngẫu nhiên rời rạc, nếu X (Ω) là một tập hợp hữu hạn {x1 , x2 , . . . , xn } hoặc vô hạn đếm được. Nói cách khác, biến ngẫu nhiên sẽ rời rạc nếu ta có thể liệt kê tất cả các giá trị có thể của nó. VD: Các biến ngẫu nhiên sau là các biến ngẫu nhiên rời rạc: • Số sản phẩm kém chất lượng trong một lô hàng; • Số con trong một gia đình. Thống kê ứng dụng Biến ngẫu nhiên rời rạc N.T. M. Ngọc 1. Biến ngẫu nhiên 2. Phân phối xác suất 3. Phân phối xác suất của trung bình mẫu 3.1 Các đặc trưng của mẫu ngẫu nhiên 3.2 Phân phối xác suất của trung bình mẫu Trong một vài trường hợp, kết quả của phép thử không thể biểu diễn được dưới dạng số. Chẳng hạn, một phỏng vấn yêu cầu một cá nhân nhắc lại thông điệp trong một mẫu quảng cáo vừa chiếu. Kết quả của phép thử có thể xảy ra một trong 2 trường hợp sau: • không thể nhắc lại được; • có thể nhắc lại được. VD: Trong phép thử tung con xúc xắc, nếu ta gọi X là ”số điểm xuất hiện“ thì X là biến ngẫu nhiên rời rạc vì X (Ω) = {1, 2, 3, 4, 5, 6} là một tập hợp hữu hạn. Chúng ta có thể biểu diễn các kết quả của phép thử trên dưới dạng số bằng cách định nghĩa một biến ngẫu nhiên rời rạc X như sau: • x = 0 nếu cá nhân không thể nhắc lại thông tin; VD: Gọi Y là ”số người vào mua hàng tại một siêu thị trong • x = 1 nếu cá nhân có thể nhắc lại thông tin. một ngày“ thì Y là biến ngẫu nhiên rời rạc vì Y (Ω) = {0, 1, 2, 3, . . . } là một tập hợp vô hạn đếm được. Thống kê ứng dụng N.T. M. Ngọc Biến ngẫu nhiên rời rạc 1. Biến ngẫu nhiên 2. Phân phối xác suất 3. Phân phối xác suất của trung bình mẫu Thống kê ứng dụng N.T. M. Ngọc 1. Biến ngẫu nhiên Một vài ví dụ khác: 2. Phân phối xác suất 3. Phân phối xác suất của trung bình mẫu 3.1 Các đặc trưng của mẫu ngẫu nhiên 3.1 Các đặc trưng của mẫu ngẫu nhiên 3.2 Phân phối xác suất của trung bình mẫu 3.2 Phân phối xác suất của trung bình mẫu Biến ngẫu nhiên liên tục Biến ngẫu nhiên X gọi là biến ngẫu nhiên liên tục, nếu X (Ω) lấy đầy một khoảng nào đó của R (hoặc cả R). Đối với biến ngẫu nhiên liên tục ta không thể liệt kê được tất cả các giá trị có thể của nó. VD: Trong phép thử bắn một phát súng vào bia, nếu ta gọi X là” khoảng cách từ điểm chạm của viên đạn đến tâm bia“ thì X là biến ngẫu nhiên liên tục. Vì ta không thể liệt kê được tất cả các giá trị có thể của nó mà ta chỉ có thể nói rằng các giá trị có thể của X nằm trong khoảng (a, b) nào đó với a < b, a ∈ R, b ∈ R. VD: Chọn ngẫu nhiên một bóng đèn, gọi Y là ”tuổi thọ của bóng đèn đó“ thì Y là biến ngẫu nhiên, Y (Ω) lấy đầy một khoảng giá trị. Thống kê ứng dụng Biến ngẫu nhiên liên tục N.T. M. Ngọc 1. Biến ngẫu nhiên 2. Phân phối xác suất Thống kê ứng dụng 1. Biến ngẫu nhiên Một vài ví dụ khác: 2. Phân phối xác suất 3. Phân phối xác suất của trung bình mẫu 3. Phân phối xác suất của trung bình mẫu 3.1 Các đặc trưng của mẫu ngẫu nhiên 3.1 Các đặc trưng của mẫu ngẫu nhiên 3.2 Phân phối xác suất của trung bình mẫu 3.2 Phân phối xác suất của trung bình mẫu Thống kê ứng dụng Thống kê ứng dụng Bảng phân phối xác suất N.T. M. Ngọc 1. Biến ngẫu nhiên 2. Phân phối xác suất 3. Phân phối xác suất của trung bình mẫu 3.1 Các đặc trưng của mẫu ngẫu nhiên Giả sử biến ngẫu nhiên X có thể nhận các giá trị có thể có là x1 , x2 , . . . , xn với các xác suất tương ứng là p1 , p2 , . . . , pn . Bảng phân phối xác suất của biến ngẫu nhiên rời rạc X có dạng: 3.2 Phân phối xác suất của trung bình mẫu xi . . . pi . . . Trong pi phải thoả mãn     ∀i, 0 ≤ pi ≤ 1, với pi n X   pi = 1   i=1 xn Tổng pn 1 hai điều kiện: = P(X = xi ) Phân phối xác suất là hình thức diễn đạt mối quan hệ giữa giá trị của biến ngẫu nhiên với xác suất tương ứng. • Bảng phân phối xác suất dùng để mô tả quy luật phân phối xác suất của biến ngẫu nhiên rời rạc. • Hàm mật độ xác suất dùng để mô tả quy luật phân phối xác suất của biến ngẫu nhiên liên tục. Ví dụ N.T. M. Ngọc 1. Biến ngẫu nhiên 2. Phân phối xác suất 3. Phân phối xác suất của trung bình mẫu 3.1 Các đặc trưng của mẫu ngẫu nhiên 3.2 Phân phối xác suất của trung bình mẫu X x1 x2 . . . P p1 p2 . . . Phân phối xác suất N.T. M. Ngọc Một lô hàng có 10 sản phẩm trong đó có 8 sản phẩm tốt. Lấy ngẫu nhiên 2 sản phẩm từ lô hàng này. Tìm quy luật phân phối xác suất của số sản phẩm tốt trong 2 sản phẩm được lấy ra. Gọi X là ”số sản phẩm tốt trong 2 sản phẩm được lấy ra“. Vậy X là biến ngẫu nhiên rời rạc có thể nhận các giá trị có thể có 0, 1, 2; và các xác suất tương ứng được tính theo định nghĩa cổ điển như sau: C22 C81 × C21 1 16 ; P(X = 1) = ; = = 2 2 45 45 C10 C10 28 C2 . P(X = 2) = 28 = 45 C10 P(X = 0) = Như vậy, quy luật phân phối xác suất của X được biểu thị bởi phân phối xác suất sau: X 0 1 2 Tổng 1 16 P 45 45 28 1 45 Thống kê ứng dụng Hàm mật độ xác suất N.T. M. Ngọc 1. Biến ngẫu nhiên 2. Phân phối xác suất 3. Phân phối xác suất của trung bình mẫu 3.1 Các đặc trưng của mẫu ngẫu nhiên 3.2 Phân phối xác suất của trung bình mẫu Luật phân phối xác suất của biến ngẫu nhiên liên tục X được biểu thị bởi hàm số f (x ) xác định trên R thỏa mãn các điều kiện: • f (x ) ≥ 0, ∀x Z • P(X ∈ I) = f (x )dx ; ∀I ⊂ R • N.T. M. Ngọc 1. Biến ngẫu nhiên 2. Phân phối xác suất 3. Phân phối xác suất của trung bình mẫu I Z Thống kê ứng dụng +∞ Ví dụ Phân phối xác suất của biến ngẫu nhiên liên tục X là một hàm f(x) sao cho P(a < X < b) = Z b a f (x )dx 3.1 Các đặc trưng của mẫu ngẫu nhiên f (x )dx = 1 −∞ f (x ) gọi là hàm mật độ xác suất của X . Nhận xét: Mọi hàm f (x ) không âm và thỏa mãn điều kiện Z +∞ f (x )dx = 1 đều là hàm mật độ xác suất của biến ngẫu nhiên 3.2 Phân phối xác suất của trung bình mẫu −∞ X nào đó. Tính chất: X là biến ngẫu nhiên liên tục • P(X = x0 ) = 0, ∀x0 ∈ R; Z b • P(a < X < b) = f (x )dx a Thống kê ứng dụng Mẫu ngẫu nhiên N.T. M. Ngọc 1. Biến ngẫu nhiên 2. Phân phối xác suất 3. Phân phối xác suất của trung bình mẫu 3.1 Các đặc trưng của mẫu ngẫu nhiên 3.2 Phân phối xác suất của trung bình mẫu Mẫu ngẫu nhiên Mẫu ngẫu nhiên kích thước n là tập hợp của n biến ngẫu nhiên độc lập X1 , X2 , . . . , Xn được thành lập từ biến ngẫu nhiên X trong tổng thể nghiên cứu và có cùng quy luật phân phối xác suất với X . Kí hiệu: (X1 , X2 , . . . , Xn ) Thống kê Một thống kê (statistic) là một hàm bất kì của các quan sát trong một mẫu ngẫu nhiên. Thống kê ứng dụng N.T. M. Ngọc 1. Biến ngẫu nhiên 2. Phân phối xác suất 3. Phân phối xác suất của trung bình mẫu 3.1 Các đặc trưng của mẫu ngẫu nhiên 3.2 Phân phối xác suất của trung bình mẫu Các đặc trưng của mẫu ngẫu nhiên Nếu (X1 , X2 , . . . , Xn ) là một mẫu ngẫu nhiên kích thước n thì: n 1X Xi ◦ Trung bình mẫu: X̄ = n i=1 Y ◦ Tỉ lệ mẫu: P̂ = , n ◦ Phương sai mẫu (có hiệu chỉnh): n 1 X (Xi − X̄ )2 n − 1 i=1 √ ◦ Độ lệch chuẩn mẫu: S = S 2 đều là các thống kê. S2 = Thống kê ứng dụng Thống kê ứng dụng N.T. M. Ngọc N.T. M. Ngọc 1. Biến ngẫu nhiên 2. Phân phối xác suất 3. Phân phối xác suất của trung bình mẫu 3.1 Các đặc trưng của mẫu ngẫu nhiên 3.2 Phân phối xác suất của trung bình mẫu Nếu x1 , x2 , . . . , xn lần lượt là các giá trị của các biến ngẫu nhiên X1 , X2 , . . . , Xn của mẫu ngẫu nhiên trên (kích thước n) thì giá trị của : n 1X xi ◦ Trung bình mẫu: x̄ = n i=1 y ◦ Tỉ lệ mẫu: p̂ = , n ◦ Phương sai mẫu (có hiệu chỉnh): 1. Biến ngẫu nhiên 2. Phân phối xác suất 3. Phân phối xác suất của trung bình mẫu 3.1 Các đặc trưng của mẫu ngẫu nhiên 3.2 Phân phối xác suất của trung bình mẫu N.T. M. Ngọc 1. Biến ngẫu nhiên 2. Phân phối xác suất 3. Phân phối xác suất của trung bình mẫu 3.1 Các đặc trưng của mẫu ngẫu nhiên 3.2 Phân phối xác suất của trung bình mẫu trong đó, µ là trung bình của tổng thể. 3.2 Phân phối xác suất của trung bình mẫu X̄ Phương sai của trung bình mẫu: Nếu tổng thể N phần tử (N → ∞) và chọn mẫu ngẫu nhiên hoặc nếu tổng thể có N hữu hạn phần tử và chọn mẫu có hoàn lại thì phương sai của trung bình mẫu, kí hiệu là σX̄2 , được cho bởi E[(X̄ − µ)2 ] = σX̄2 = Kỳ vọng của trung bình mẫu: Trung bình của trung bình mẫu, kí hiệu là µX̄ , được cho bởi E[X̄ ] = µX̄ = µ n 1 X (xi − x̄ )2 s = n − 1 i=1 √ ◦ Độ lệch chuẩn mẫu: s = s 2 2 Thống kê ứng dụng 3.2 Phân phối xác suất của trung bình mẫu X̄ 2 σ n trong đó, σ 2 là phương sai của tổng thể. Thống kê ứng dụng N.T. M. Ngọc 1. Biến ngẫu nhiên 2. Phân phối xác suất 3. Phân phối xác suất của trung bình mẫu 3.1 Các đặc trưng của mẫu ngẫu nhiên 3.2 Phân phối xác suất của trung bình mẫu 3.2 Phân phối xác suất của trung bình mẫu X̄ • Nếu tổng thể có kích thước là N, chọn mẫu không hoàn và kích thước mẫu là n ≤ N thì phương sai của trung bình mẫu là σX̄2 σ2 N − n = n N −1 ! • Nếu tổng thể có phân phối chuẩn N (µ, σ 2 ) với trung bình µ và phương sai σ 2 . Một mẫu được chọn từ tổng thể này thì trung bình mẫu X̄ cũng có phân phối chuẩn với trung σ2 σ2 hay X̄ ∼ N (µ, ). bình µ và phương sai n n Thống kê ứng dụng N.T. M. Ngọc 1. Biến ngẫu nhiên 3.2 Phân phối xác suất của trung bình mẫu X̄ 2. Phân phối xác suất 3. Phân phối xác suất của trung bình mẫu 3.1 Các đặc trưng của mẫu ngẫu nhiên 3.2 Phân phối xác suất của trung bình mẫu • Nếu tổng thể có phân phối (không nhất thiết là phân phối chuẩn) với trung bình µ và phương sai σ 2 . Một mẫu được chọn từ tổng thể này thì biến ngẫu nhiên X̄ được chuẩn hóa như: X̄ − µ Z= √ σ n Thống kê ứng dụng Phân phối mẫu của tỉ lệ N.T. M. Ngọc 2. Phân phối xác suất 3. Phân phối xác suất của trung bình mẫu 3.1 Các đặc trưng của mẫu ngẫu nhiên 3.2 Phân phối xác suất của trung bình mẫu Kì vọng và phương sai của P̂ là E(P̂) = µP̂ = p, Var (P̂) = σP̂2 = p(1 − p) n Theo định lí giới hạn trung tâm ta có P̂ − p r p(1−p) n D −→ N (0, 1) Vì vậy trong thực hành, khi np ≥ 5, n(1 − p) ≥ 5, thì phân phối xác suất  của tỉ lệ mẫu  P̂ xấp xỉ p(1 − p) . phân phối chuẩn N p, n 3.3 Phân phối xác suất của tỉ lệ mẫu N.T. M. Ngọc 1. Biến ngẫu nhiên 2. Phân phối xác suất xấp xỉ phân phối chuẩn tắc N (0; 1). 1. Biến ngẫu nhiên Thống kê ứng dụng 3. Phân phối xác suất của trung bình mẫu 3.1 Các đặc trưng của mẫu ngẫu nhiên 3.2 Phân phối xác suất của trung bình mẫu Giả sử cần khảo sát đặc trưng A của tổng thể, khảo sát n phần tử và đặt ( 1 nếu thỏa A Xi = 0 nếu khác thu được mẫu ngẫu nhiên X1 , . . . , Xn với Xi ∼ B(1, p), p là tỉ lệ phần tử thỏa đặc trưng A. Đặt Y = n X i=1 Xi là số phần tử thỏa đặc trưng A trong mẫu khảo sát, thì Y ∼ B(n, p). Tỉ lệ mẫu P̂ là một ước lượng của tỉ lệ p được xác định bởi P̂ = Y n