« Home « Kết quả tìm kiếm

sử dụng xác suất thống kê


Tóm tắt Xem thử

- SỰ CẦN THIẾT VÀ Ý NGHĨA CỦA VIỆC SỬ DỤNG XÁC SUẤT THỐNG KÊ TRONG NGHIÊN CỨU GIÁO DỤC HỌC VÀ CÁC KHOA HỌC XÃ HỘI SỰ CẦN THIẾT VÀ Ý NGHĨA CỦA VIỆC SỬ DỤNG XÁC SUẤT THỐNG KÊ TRONG NGHIÊN CỨU GIÁO DỤC HỌC VÀ CÁC KHOA HỌC XÃ HỘI.
- Tác giả: Trần Văn Công, Bahr Weiss Tóm tắt: Khi các nhà khoa học xã hội Việt Nam thực hiện các nghiên cứu của mình, họ có thể dùng hoặc không dùng đến xác suất thống kê trong phân tích dữ liệu, nhưng nhiều người có thể chưa biết đến tầm quan trọng cũng như giá trị mà xác suất thống kê có thể mang lại cho nghiên cứu của mình.
- Bài báo này nhằm bàn luận về ý nghĩa của việc sử dụng xác suất thống kê trong nghiên cứu giáo dục học cũng như các khoa học xã hội.
- Ngoài những khái niệm quen thuộc đối với độc giả, chúng tôi cũng giới thiệu một vài mô hình thống kê cao cấp đang được sử dụng phổ biến trên thế giới..
- Xác suất thống kê là một cách mô tả thế giới, một cách tóm tắt những thông tin hoặc tri thức quá phức tạp mà không thể hiểu một cách trực tiếp.
- Chúng ta có thể bắt đầu với một ví dụ về bảng điểm của 10 học sinh lớp 12, được chọn một cách ngẫu nhiên từ một trường phổ thông ở Hà Nội.
- Điểm trung bình.
- Không cần dùng đến khoa học thống kê.
- bạn vẫn có thể biết được ai được bao nhiêu điểm ở thang đo nào, xếp thứ bao nhiêu, nhưng không thể biết được những điều phức tạp hơn như ảnh hưởng của stress và động cơ học tập đối với kết quả học tập như thế nào..
- Với thang điểm 10, một điểm 9.5 của Lê Thị E có thể coi là rất cao, thực tế là điểm cao nhất lớp, với điểm Z9.5 = 1.4.
- Như vậy, bằng việc dùng những khái niệm đầu tiên và cơ bản nhất của xác suất thống kê như trung bình (mean), khoảng (range) và chỉ số Z (Z score), chúng ta có thể thấy nhiều hơn và sâu hơn ý nghĩa của từng điểm số hoặc điểm của từng cá nhân.
- Ngoài ra, xác suất thống kê còn cho phép chúng ta xem mức độ liên quan giữa hai loại điểm, ví dụ như tương quan (correlation) giữa điểm môn X và điểm trung bình, hay tương quan giữa điểm trung bình và mức độ stress ở học sinh.
- Tương quan giữa điểm trung bình và môn X là -0.137.
- Chúng ta có thể nói rằng điểm trung bình có tương quan ngược với môn X.
- Nhưng kết quả thống kê của SPSS cho thấy con số này không có ý nghĩa đại diện cho toàn bộ dân cư (hay tổng thể thống kê).
- Vì vậy, trong trường hợp này, chúng ta không thể khái quát cho tất cả học sinh cùng học môn X… Từ đây chúng ta cũng có thể suy ra rằng điểm môn X không phản ánh được tốt kết quả học tập, vì những học sinh điểm cao ở môn X lại có điểm trung bình thấp, nhưng không hoàn toàn, vì tương quan rất thấp, hơn nữa lại không có ý nghĩa thống kê.
- Tương quan giữa điểm trung bình (điểm càng cao thì học càng giỏi) và thang đo stress (điểm càng cao thì càng bị stress) là 0.301, ở mức độ trung bình, có nghĩa là học sinh điểm càng cao, kết quả học tập càng tốt thì stress càng cao nhưng không phải tất cả.
- Điều này nói lên rằng thang đo stress này có hiệu lực hoặc có ý nghĩa khi đo stress ở học sinh.
- Trong khi tương quan giữa điểm trung bình và thang đo động cơ lại là -0.872, là tương quan ngược ở mức độ rất cao.
- Xác suất thống kê là gì? Khoa học thống kê là một lĩnh vực của khoa học toán học liên quan tới việc thu thập, phân tích và diễn giải hay giải thích và trình bày số liệu.
- Các nhà thống kê giúp cải thiện chất lượng của số liệu với việc thiết kế thực nghiệm và lấy mẫu nghiên cứu.
- Xác suất thống kê cũng cung cấp những công cụ để dự đoán và dự báo bằng việc sử dụng số liệu và các mô hình thống kê.
- Xác suất thống kê được ứng dụng vào nhiều lĩnh vực học thuật khác nhau, bao gồm khoa học tự nhiên và xã hội, quản lý của chính phủ và kinh doanh..
- Các phương pháp thống kê có thể được sử dụng để tóm tắt hay mô tả tập hợp của số liệu, gọi là thống kê mô tả (descriptive statistics).
- Điều này rất hữu ích trong nghiên cứu, khi nhà nghiên cứu muốn phổ biến kết quả nghiên cứu hoặc thực nghiệm của họ.
- Hơn nữa, các mẫu trong số liệu có thể được mô hình hóa theo cách mà có thể kiểm soát được tính ngẫu nhiên và tính không chắc chắc trong quan sát, và sau đó được sử dụng để đưa ra các suy luận về quá trình hay về tổng thể (population) được nghiên cứu.
- cái này được gọi là thống kê suy luận (inferential statistics).
- Các nhà nghiên cứu giáo dục học và khoa học xã hội cần biết và sử dụng xác suất thống kê, nhưng họ không cần biết quá sâu về toán học.
- Vì hiện nay các chương trình phần mềm xác suất thống kê ngày càng phổ biến và mạnh mẽ (như SPSS, SAS và R), và các công thức tính đã được lập trình sẵn, thì yêu cầu về khả năng toán học không phải là chủ chốt.
- Vì vậy, đối với các nhà giáo dục học, hiểu ý nghĩa của những thuật toán và mô hình thống kê khác nhau trong những khung cảnh khác nhau mới là điều quan trọng..
- Xác suất thống kê trong nghiên cứu giáo dục học và các khoa học xã hội.
- Việc hiểu biết xác suất thống kê giúp nhà giáo dục hiểu được và đánh giá được chất lượng các bài nghiên cứu.
- Trong dạy học, điều này là quan trọng, khi các giáo viên áp dụng các thành tựu nghiên cứu mới vào công việc giảng dạy của mình.
- Một giáo viên giỏi sẽ biết đọc các nghiên cứu mới về phương các phương pháp sư phạm và ứng dụng những phương pháp mới trong tiết dạy học của mình.
- Thứ hai, họ có thể thực hiện được các nghiên cứu giáo dục học (Schuyten G., 1990).
- Trong giáo dục học và các khoa học xã hội, nghiên cứu có vai trò rất quan trọng vì nó giúp con người nhìn nhận thế giới một cách khách quan.
- Xác suất thống kê giúp làm giảm tính chủ quan và tăng cường tính khách quan..
- Xác suất thống kê giúp nhà nghiên cứu khái quát hóa ra cái chung, cái tổng quát.
- Vì mọi nghiên cứu xã hội đều có giới hạn về thời gian, tài chính, không gian, độ tin cậy nên hầu như không bao giờ có nghiên cứu nào có thể “vươn tới” mọi đối tượng cần nghiên cứu hay có thể đạt được độ chính xác tuyệt đối.
- Xác suất thống kê có các biện pháp dự đoán, dự báo toàn bộ nhóm đối tượng nào đó (ví dụ như học sinh phổ thông, giáo viên, sinh viên đại học) từ một mẫu nghiên cứu với số lượng nhất định (ví dụ như học sinh ở 3 trường phổ thông, giáo viên ở một phường, xã nào đó hoặc sinh viên bộ môn Toán, Lý, Hóa của Đại học Giáo dục)..
- Một số khái niệm hữu ích của xác suất thống kê được sử dụng thường xuyên trong nghiên cứu giáo dục và khoa học xã hội.
- Xác suất (probability) Giá trị p (p value).
- Giả sử nhà nghiên cứu muốn tìm hiểu xem có sự khác biệt điểm trung bình môn toán giữa học sinh nam và học sinh nữ cấp III hay không.
- Vì vậy, chúng ta cần mẫu để nghiên cứu.
- Từ tất cả học sinh cấp III Việt Nam, chúng ta sẽ lựa chọn ngẫu nhiên 100 học sinh nam, 100 học sinh nữ.
- Sau khi thu thập, phân tích, xử lý số liệu, chúng ta kết luận rằng học sinh nam có điểm trung bình môn toán cao hơn học sinh nữ.
- Giá trị p là khả năng mà, khi cho rằng không có sự khác nhau giữa điểm trung bình môn toán ở nam và nữ của tổng thể, nhà nghiên cứu sẽ tìm thấy độ khác biệt ở trong một mẫu nghiên cứu khác bất kì và sự khác biệt đó bằng hoặc lớn hơn độ khác biệt mà nhà nghiên cứu tìm thấy trong mẫu nghiên cứu của họ.
- Vì vậy nếu giá trị p = 0.12 khi so sánh điểm trung bình môn toán của nam và nữ thì chỉ có 12% số lần nhà nghiên cứu sẽ tìm thấy sự khác nhau bằng hoặc cao hơn 0.8 ở điểm số của nam và nữ.
- Nếu nghiên cứu này được làm đi làm lại 100 lần, lựa chọn 100 mẫu khác nhau, và tính điểm trung bình 100 lần, thì giá trị p nói lên rằng nếu thực sự không có sự khác biệt điểm môn toán giữa nam và nữ trong tổng thể, họ vẫn có thể tìm thấy điểm trung bình của nam cao hơn nữ bằng hoặc ít nhất 0.8 (là điểm họ tìm ra trong nghiên cứu) 12 trong số 100 lần, hay 12%.
- Như vậy, nếu giá trị p càng nhỏ thì nhà nghiên cứu càng có thể tự tin rằng kết quả nghiên cứu của mình là đúng.
- thống nhất rằng khi giá trị nhỏ hơn hoặc bằng 0.05, hay 5% thì chúng ta có đủ tự tin để nói rằng có sự khác nhau trong tổng thể nghiên cứu..
- Cỡ tác dụng là một khái niệm thống kê đo độ mạnh của mối quan hệ giữa hai biến.
- Trong xác suất thống kê suy luận, cỡ tác dụng giúp chúng ta xác định xem liệu sự khác nhau có ý nghĩa thống kê có khác nhau trong khung cảnh thực tế nào đó không.
- Ví dụ, ở trường phổ thông A, điểm trung bình môn toán của học sinh nam cao hơn học sinh nữ là 0.8, cỡ tác dụng sẽ biết sự khác biệt đó có ý nghĩa thống kê hay không.
- Bởi trong các nghiên cứu bao gồm nhiều khách thể (mẫu nghiên cứu lớn), các test so sánh luôn cho thấy sự khác biệt giữa các nhóm.
- Ví dụ nhà nghiên cứu muốn tìm hiểu xem phương pháp dạy học X và Y có hiệu quả khác nhau hay không.
- Sau khi có được điểm trung bình của hai nhóm, nhà nghiên cứu sẽ dùng t-test để kiểm tra xem hai điểm trung bình của hai nhóm (với các điều kiện ban đầu như học lực, hứng thú là như nhau) có khác nhau một cách có ý nghĩa thống kê (statistical significant) hay không.
- Từ đó họ có thể suy ra hai phương pháp dạy học đó hiệu quả khác nhau không và cũng tìm ra phương pháp nào hiệu quả hơn..
- Tuy vậy, nhiều khi nhà nghiên cứu lại muốn tìm hiểu xem có sự khác biệt hay không giữa ba hoặc hơn ba nhóm, ví dụ ba nhóm học sinh được dạy theo phương pháp X, Y và Z.
- Trong tình huống này, họ có thể dùng ba t-test để so sánh: X,Y – Y,Z và Z,X.
- Phân tích phương sai, hay ANOVA (viết tắt của analysis of variance) có thể giúp nhà nghiên cứu trả lời câu hỏi này..
- Có nhiều mô hình ANOVA khác nhau tùy thuộc vào số lượng các phương pháp dạy và học và đối tượng nghiên cứu.
- Thường thì người ta dùng ANOVA một chiều để so sánh sự khác nhau giữa ít nhất là ba nhóm, vì so sánh hai nhóm có thể được thực hiện bởi T-test (Gossett, 1908).
- ANOVA giai thừa cũng có thể ở đa cấp như 3x3, hoặc cao hơn như 2x2x2.
- Nhưng ANOVA ở các cấp cao như vậy khó có thể làm bằng tay bởi các phép tính rất dài và phức tạp.
- Nhưng do sự phổ biến của các phần mềm thống kê, việc sử dụng ANOVA trong nghiên cứu trở nên khá phổ biến và thông dụng.
- Tương quan và hồi quy Một chức năng cơ bản của thống kê mô tả là nhằm cung cấp chỉ số cho mối quan hệ giữa hai biến.
- Chỉ số tuyến tính được sử dụng khi với biến ngẫu nhiên và biến được cố định bởi người nghiên cứu..
- c) Tương quan (correlation).
- Trong nghiên cứu không có tương quan “tốt” hay “xấu”, hay cả tương quan “cao” hay “thấp” cũng rất tương đối vì nó còn phụ thuộc vào khung cảnh và mục đích nghiên cứu.
- Hệ số tương quan là 0.9 có thể là rất thấp khi một người kiểm tra lại kích thước của một loại máy móc nào đó và dùng thước đo chính xác cao (đến mức độ micromet chẳng hạn).
- Nhưng 0.9 lại là rất cao trong nghiên cứu xã hội, vì có quá nhiều sai số từ những yếu tố phức tạp khác.
- Tương quan nghịch (hệ số ρ < 0).
- Tương quan thuận (hệ số ρ > 0) Thấp.
- 0.1 đến 0.3 Trung bình.
- Hình hồi quy bội là một hướng cơ bản của phân tích thống kê ở hầu hết các lĩnh vực bởi nó rất mạnh và linh hoạt..
- Các phân tích tuyến tính được sử dụng rộng rãi trong nghiên cứu.
- Nói chung, hồi quy tuyến tính cho phép nhà nghiên cứu có thể đặt câu hỏi (và trả lời) “Dự báo tốt nhất của yếu tố… là gì.
- Một nhà tâm lý có thể quan tâm đến việc yếu tố nào của nhân cách dự đoán tốt nhất sự hòa nhập xã hội của họ.
- Một nhà xã hội học có thể muốn tìm hiểu tập hợp những chỉ số xã hội nào dự đoán liệu một nhóm người di cư có thể thích nghi vào môi trường xã hội mới.
- Trong giáo dục, cán bộ phụ trách tuyển sinh của một trường đại học có thể quan tâm tới việc lấy những tiêu chí nào để chọn được những ứng viên có khả năng hoàn thành chương trình học cao nhất.
- Khả năng hoàn thành chương trình học có thể được đại diện bằng điểm tổng kết (ĐTK) là một biến chưa có và cần được dự đoán.
- Những biến sẵn có và để dự đoán bao gồm điểm thi đại học (ĐTĐH), điểm trung bình của ba năm cấp III (ĐTBCIII), bản đánh giá về ý thức học tập trong học bạ (YTHT)… Hồi quy bội có thể giúp chúng ta dự đoán khả năng hoàn thành chương trình của ứng viên từ những chỉ số sẵn có.
- Một công thức tuyến tính đa chiều có thể được biểu diễn như sau:.
- Vì chỉ số β1 nhỏ hơn chỉ số β2, cán bộ phụ trách đó có thể kết luận rằng, điểm trung bình ba năm cấp III là chỉ số dự đoán chính xác nhất cho khả năng hoàn thành khóa học, chứ không phải điểm thi đại học.
- Mô hình đẳng thức cấu trúc (Structural Equation Modeling, viết tắt là SEM) là một dạng phân tích thống kê cao cấp, trong đó dự đoán độ lớn và mức độ ý nghĩa thống kê của quan hệ nhân quả giữa các biến.
- Để lấy ví dụ về tính hữu ích của SEM, chúng tôi xin trích một phần trong một nghiên cứu gần đây của chúng tôi [8], về mối liên hệ giữa việc bị bắt nạt, nhận thức và trầm cảm ở nạn nhân (xem biểu đồ 1)..
- Tất cả các số liệu nghiên cứu đều có sai số.
- Trong đó, điểm của mỗi khách thể trả lời bảng nghiên cứu bị ảnh hưởng bởi các biến ẩn mà chúng ta quan tâm và những yếu tố khác không liên quan tới những biến ẩn này.
- Biểu đồ 1 biểu diễn SEM được thực hiện trong nghiên cứu của chúng tôi.
- Một ưu điểm khác của SEM là nó có thể khống chế sai số của thang đo trong các bảng hỏi, và đánh giá mối liên hệ giữa các biến ẩn (không có sai số) hơn việc đánh giá các liên hệ giữa biến sẵn có (luôn có sai số).
- Vì vậy, SEM có thể đo đạc chính xác hơn mối quan hệ giữa các thang đo (các biến ẩn) bằng cách loại bỏ sai số ra khỏi các biến sẵn có.
- Giáo trình lý thuyết thống kê.
- Nhà xuất bản thống kê – Trường đại học kinh tế quốc dân.
- Giáo trình lý thuyết xác suất và thống kê toán.
- Xác suất thống kê.
- Bị bắt nạt bởi bạn cùng lứa và mối liên hệ tới nhận thức bản thân và trầm cảm ở học sinh phổ thông..
- Nghiên cứu sinh tâm lý học lâm sàng tại đại học Vanderbilt, Hoa Kỳ.
- Số lượng khách thể tối thiểu để thực hiện xác suất thống kê thường lớn hơn rất nhiều.
- Tiếng Anh là statistics, chúng tôi dịch là “khoa học thống kê” hoặc “xác suất thống kê”, cùng chỉ statistics � Tác giả mong nhận được sự góp ý của bạn đọc về việc chuyển ngữ � T-test được giới thiệu vào năm 1908 bởi William Sealy Gosset, một nhà hóa học làm việc cho nhà máy bia Guinness ở Dublin, Aixlen (“Student” là bút danh của ông)