« Home « Kết quả tìm kiếm

XÁC SUẤT VS THỐNG KÊ


Tóm tắt Xem thử

- XÁC SUẤT VS THỐNG KÊ PHẠM ĐĂNG QUYẾT [email protected] GIỚI THIỆU Xác suất và thống kê (Probability and statistics) là hai ngành học liên quan nhưng riêng biệt XÁC SUẤT THỐNG KÊ ■ Từ xác suất (probability) bắt nguồn từ ■ Thuật ngữ “thống kê” của tiếng Anh “statistics” có gốc từ chữ probare trong tiếng Latin và có nghĩa là "để chứng “state” (nghĩa là quốc gia), nguồn gốc La tinh “statisticum minh, để kiểm chứng".
- sự kiện hoặc kiến thức chưa chắc chắn, và thường đi ■ Ban đầu, thống kê dùng để diễn tả các hoạt động ghi kèm với các từ như "có vẻ là", "mạo hiểm", "may rủi", chép số liệu của một quốc gia như dân số, tài sản, "không chắc chắn" hay "nghi ngờ", tùy vào ngữ cảnh.
- Thống kê có thể được cho là đã bắt đầu trong nền "Cơ hội" (chance), "cá cược" (odds, bet) là những từ cho văn minh cổ xưa, ít nhất là từ cuối thế kỷ thứ 5 TCN, khái niệm tương tự.
- nhưng cho đến thế kỷ 18 thì nó mới chịu ảnh hưởng ■ Xác suất chính là một khái niệm được nói đến khi tính nhiều hơn từ số học và lý thuyết xác suất.
- Xác suất đã khả năng xác suất xảy ra của các sự kiện, sự vật trong trở thành một trong những công cụ thống kê cơ bản.
- Thống kê là một phần toán học của khoa học gắn liền với không có bất kì điều gì có thể dự đoán chính xác được.
- tập hợp dữ liệu, phân tích, giải thích hoặc thảo luận về ■ Lý thuyết xác suất là ngành toán học chuyên nghiên một vấn đề nào đó, và trình bày dữ liệu.
- Có thể xem cứu xác suất đã được phát triển vào thế kỷ 17.
- Lý thuyết thống kê là một môn khoa học riêng biệt chứ không phải xác suất biểu diễn các khái niệm xác suất bằng các thuật là một nhánh của toán học, nó chính là một phần của ngữ hình thức - nghĩa là các thuật ngữ mà có thể xác khoa học dữ liệu.
- Các thuật ngữ dữ liệu thành kiến thức và hiểu biết về thế giới xung hình thức này được thao tác bởi các quy luật toán học và quanh chúng ta.
- GIỚI THIỆU Xác suất và thống kê (Probability and statistics) là hai ngành học liên quan nhưng riêng biệt XÁC SUẤT THỐNG KÊ John Wilder Tukey was an American mathematician best known for development of the Fast Fourier Transform (FFT) algorithm and box plot XÁC SUẤT VS THỐNG KÊ XÁC SUẤT THỐNG KÊ XÁC SUẤT VS THỐNG KÊ XÁC SUẤT THỐNG KÊ ■ Lý thuyết xác suất là ngành toán học chuyên ■ Lý thuyết thống kê liên quan tới những lập luận nghiên cứu xác suất logic cơ bản giải thích của phương pháp tiếp cận kết luận thống kê, cũng bao gồm toán thống kê.
- XÁC SUẤT VS THỐNG KÊ XÁC SUẤT THỐNG KÊ ■ Thuật ngữ ■ Thuật ngữ ■ NGẪU NHIÊN VÀ XÁC SUẤT ■ TỔNG THỂ VÀ MẪU ■ Một hiện tượng ngẫu nhiên có các kết cục ■ Toàn bộ nhóm các cá thể mà chúng ta muốn có không thể dự đoán trước nhưng lại có quy luật thông tin về nó được gọi là tổng thể.
- phân bố nhất định sau nhiều lần lặp lại thử nghiệm.
- Một mẫu là một phần của tổng thể mà thực tế chúng ta khảo sát để thu thập thông tin.
- Xác suất của một biến cố là tỉ lệ số lần xuất hiện biến cố đó sau nhiều lần lặp đi lặp lại thử ■ THAM SỐ VÀ THỐNG KÊ nghiệm về một hiện tượng ngẫu nhiên.
- Một tham số ■ KHÔNG GIAN MẪU VÀ BIẾN CỐ là một số cố định, nhưng trong thực tế chúng ta ■ Không gian mẫu S của một hiện tượng ngẫu không biết giá trị của nó.
- nhiên là tập hợp của tất cả các kết cục có thể xảy ra.
- Thống kê là một số diễn tả mẫu.
- Giá trị của thống kê được biết khi chúng ta lấy mẫu, nhưng nó có ■ Biến cố là một kết cục hoặc một tập hợp các thể thay đổi theo từng mẫu.
- chúng ta thường sử kết cục của một hiện tượng ngẫu nhiên.
- Một dụng một thống kê để ước lượng một tham số biến cố là tập con của không gian mẫu.
- XÁC SUẤT VS THỐNG KÊ XÁC SUẤT THỐNG KÊ ■ Thuật ngữ ■ Thuật ngữ ■ MÔ HÌNH XÁC SUẤT ■ THỐNG KÊ MÔ TẢ ■ Sự mô tả một hiện tượng ngẫu nhiên bằng ■ Dữ liệu: Dữ liệu là các con số trong một ngữ ngôn ngữ toán học gọi là mô hình xác suất.
- cảnh cụ thể, và chúng ta cần hiểu ngữ cảnh đó nếu chúng ta muốn làm các con số trở ■ Biến ngẫu nhiên là biến lấy các giá trị bằng nên có nghĩa.
- số xác định bởi kết cục của một hiện tượng ngẫu nhiên.
- Các biến: Bất kỳ tệp dữ liệu nào cũng đều chứa các thông tin về một nhóm nào đó của ■ Phân bố xác suất của một biến ngẫu nhiên X các cá thể.
- Thông tin được tổ chức vào các cho ta biết các giá trị có thể có của X là gì và biến.
- xác suất được tìm cho các giá trị đó như thế nào.
- Phân bố của một biến cho chúng ta biết nó nhận những trị số nào và nhận những trị số đó bao nhiêu lần.
- XÁC SUẤT VS THỐNG KÊ XÁC SUẤT THỐNG KÊ ■ QUY LUẬT SỐ LỚN ■ THỐNG KÊ MÔ TẢ - CÁC PHÂN BỐ ■ Phân bố xác suất chuẩn ■ Trung bình, phương sai và độ lệch chuẩn của biến ngẫu nhiên ■ Quy luật số lớn chỉ ra rằng trung bình các giá trị của X trong nhiều lần thử phải tiến gần đến µ.
- Quy luật số lớn theo xác suất và thống kê cho rằng khi kích thước mẫu tăng lên, giá trị trung bình của nó sẽ gần với mức trung bình của toàn bộ tổng thể.
- XÁC SUẤT VS THỐNG KÊ XÁC SUẤT THỐNG KÊ ■ ĐỊNH LÝ GIỚI HẠN TRUNG TÂM ■ THỐNG KÊ SUY LUẬN – KHOẢNG TIN CẬY ■ Định lý giới hạn trung tâm tuyên bố rằng đối với n lớn, phân bố mẫu của 𝑥 gần đúng phân bố Chuẩn N(μ, σ/ 𝑛 ) cho bất kỳ tổng thể nào với trung bình μ và độ lệch chuẩn hữu hạn σ.
- Khi cỡ mẫu được tăng lên, sự phân bố lấy mẫu của trung bình sẽ xấp xỉ phân phối chuẩn.
- Điều này là đúng không phân biệt hình dạng phân bố của các giá trị cá thể trong tổng thể.
- XÁC SUẤT VS THỐNG KÊ XÁC SUẤT THỐNG KÊ Xác suất: Tại sao.
- THỐNG KÊ SUY LUẬN – SAI SÔ CHUẨN Thống kê không chứng minh bất cứ điều gì.
- Do đó, chúng ta sử dụng xác suất để nêu rõ mức độ tự tin của mình trong việc chỉ ra một cái gì đó là sai lầm ■ XÁC SUẤT VS THỐNG KÊ XÁC SUẤT THỐNG KÊ Xác suất: Tại sao.
- THỐNG KÊ SUY LUẬN – KIỂM ĐỊNH GIẢ THUYẾT Trong thống kê, tôi không thể chứng minh bất cứ điều gì là đúng, nhưng chỉ cho thấy ngoài nghi ngờ hợp lý rằng một cái gì đó là sai Vì vậy, với mỗi tuyên bố này tôi sẽ nói rằng không có sự khác biệt giữa các trung bình mẫu và trung bình tổng thể được giả thuyết ■ XÁC SUẤT VS THỐNG KÊ XÁC SUẤT THỐNG KÊ Xác suất: Tại sao.
- SUY LUẬN THỐNG KÊ CHO HỒI QUI Thống kê không chứng minh bất cứ điều gì.
- Do đó, chúng ta sử dụng xác suất để nêu rõ mức độ tự tin của mình trong việc chỉ ra một cái gì đó là sai lầm ■ XÁC SUẤT VS THỐNG KÊ XÁC SUẤT THỐNG KÊ Xác suất có điều kiện ■ SUY LUẬN BAYES ■ Xác suất mà biến cố A xảy ra, cho rằng biến cố ■ Định lý Bayes điều chỉnh các xác suất khi được cho B đã xảy ra bằng chứng mới theo cách sau đây: P ( A and B ) P( A | B.
- H0 đại diện cho một giả thuyết, gọi là một giả thuyết ■ Xác suất tiên nghiệm (prior probability) hay xác không (null hypothesis) suất vô điều kiện (unconditional probability): là xác suất của một sự kiện trong điều kiện không ■ P(H0) được gọi là xác suất tiên nghiệm của H0 có tri thức bổ sung cho sự có mặt hay vắng mặt của nó.
- P(E|H0) được gọi là xác suất có điều kiện của việc quan sát thấy bằng chứng E nếu biết rằng giả thuyết ■ Xác suất hậu nghiệm (posterior probability ) H0 là đúng hay xác suất có điều kiện (conditional probability): là xác suất của một sự kiện khi biết ■ P(E) được gọi là xác suất biên của E hay bằng chứng: trước một hay nhiều sự kiện khác xác suất của việc chứng kiến bằng chứng mới E dưới ■ tất cả các giả thuyết loại trừ nhau đôi một.
- P(H0|E) được gọi là xác suất hậu nghiệm của H0 nếu biết E XÁC SUẤT VS THỐNG KÊ XÁC SUẤT THỐNG KÊ Ý nghĩa của việc kiểm định - Frequentist vs Bayesian ■ Bayes Factor (BF.
- p-value ■ Bayes Factor tương đương với giá trị p trong thống kê Bayesian.
- Trong đó, tính t-score cho một mẫu cụ thể từ một phân bố mẫu Hãy hiểu nó một cách toàn diện.
- Sau đó, p-values được dự ■ Null hypothesis trong Bayesian giả định phân bố xác suất ∞ chỉ đoán.
- Chúng ta có thể giải thích các p-values như (lấy ví dụ trường hợp p-value = 0,02 cho một phân bố có mean = 100): ở một giá trị cụ thể của một tham số (VD: θ = 0.5) và xác suất Có 2% xác suất rằng mẫu sẽ có mean = 100.
- Một p-value < phân bố này.
- Trong bảng A (thể hiện ở bên): thanh trái (M1) là xác suất prior của null hypothesis.
- Trong bảng B (hiển thị), thanh bên trái là xác suất posterior của null hypothesis