« Home « Kết quả tìm kiếm

Ứng dụng phần mềm SPSS 12.0 trong xử lý thống kê


Tóm tắt Xem thử

- t-test (phép thử, kiểm tra, phân tích.
- Nhưng phần Output – SPSS Viewer đã được thiết kế tiện lợi hơn cho người sử dụng.
- Mục này bao gồm các bảng kết quả (ví dụ như bảng phân tích phương sai, bảng thống kê mô tả.
- II/ MỘT SỐ KIỂU THIẾT KẾ THÍ NGHIỆM VÀ ỨNG DỤNG SPSS ĐỂ SỬ LÝ SỐ LIỆU 2.1.
- Thiết kế thí nghiệm theo kiểu ngẫu nhiên hoàn toàn (CRD – Completely Randomised Design) Thiết kế thí nghiệm theo kiểu ngẫu nhiên hoàn toàn có nghĩa là các nghiệm thức được phân vào các đơn vị thí nghiệm một cách hoàn toàn ngẫu nhiên, hay mỗi đơn vị thí nghiệm có một cơ hội giống nhau để được tiếp nhận một nghiệm thức.
- Thiết kế thí nghiệm theo kiểu này rất hiệu quả trong trường hợp các đơn vị thí nghiệm đồng đều nhau và ngược lại sẽ không hiệu quả nếu các đơn vị thí nghiệm không đồng nhất.
- Bao gồm thiết kế thí nghiệm ngẫu nhiên hoàn toàn một nhân tố và thiết kế thí nghiệm ngẫu nhiên hoàn toàn đa nhân tố.
- Các nhân tố trong thí nghiệm có thể chỉ có nhân tố định tính hoặc định lượng hoặc bao gồm cả hai.
- Trong các nhân tố thí nghiệm lại có thể có nhiều mức nhân tố.
- Thí nghiệm một nhân tố cung cấp thông tinh về ảnh hưởng chính chỉ của một nhân tố thí nghiệm.
- Thí nghiệm đa nhân tố Có hai hoặc nhiều hơn nhân tố được nghiên cứu đồng thời.
- Có hiệu quả hơn so với tiến hành từng thí nghiệm riêng lẻ và cung cấp thông tin về ảnh hưởng chính và ảnh hưởng của tương tác giữa các nhân tố.
- 2 * Mô hình ANOVA một nhân tố yij=μ+Ai+eij – yij: Giá trị của biến phụ thuộc của con vật j trong nghiệm thức i (i=1,…a.
- i chỉ số mức của nhân tố, j chỉ số lần lặp lại – μ: Là trung bình tổng thể – Ai: Là ảnh hưởng cố định hoặc ngẫu nhiên của nhân tố nghiên cứu với mức i – eij: Là hiệu dư, IID N(0,σ2), independent identically distributed B¶ng 1 .
- B¶ng tãm t¾t AN OVA trong thí nghiệm kiểu CRD với 1 nhân tố Nguån biÕn ®éng df MS F Gi÷a c¸c nhãm/ nhân a-1 MST MST/MS E tố thí nghiệm Trong c¸c nhãm a(n-1) MSE Tæng an-1 1.
- Tình huống 1: Nghiên cứu ảnh hưởng của 3 mức protein 14%.
- Phân tích tình huống - Nhân tố thí nghiệm: 1 nhân tố, là mức protein.
- Mức nhân tố: 3 mức (14% pro, 17% pro, 18% pro.
- Kiểu thiết kế thí nghiệm: ngẫu nhiên hoàn toàn.
- Đơn vị thí nghiệm: mỗi cá thể lợn.
- b.Thiết kế thí nghiệm (bằng Excel.
- B1: Liệt kê danh sách các ô chuồng tương ứng cho từng cá thể lợn thí nghiệm (ochuong.
- B3: Dùng hàm SORT trong thẻ DA TA, có thể dùng ascending hay descending, SORT theo số ngẫu nhiên vừa mới tạo (Rand1), chú ý bao gồm cả số ô chuồng (ochuong.
- Đồng thời tạo số ngẫu nhiên thứ 2 (Rand 2.
- B5: SORT lần thứ 2 theo cột vùng chứa 2 cột mức protein (muc protein) và số ngẫu nhiên 2 (Rand 2.
- 3 Hình1: Thiết kế thí nghiệm ngẫu nhiên hoàn toàn một nhân tố bằng Excel Kết quả thiết kế: Các mức protein được phân chia hoàn toàn ngẫu nhiên vào các cá thể lợn như sau.
- Chú ý: Về cách thiết kế thí nghiệm trên: Cách làm như trên gọi là Double randomization tuy nhiên, theo tài liệu Design of Experiments: Statistical Principles of Research Design and Analysis (Kuehl, 2000), thì ở bước thứ 4 có thể trực tiếp phân các mức protein vào các ô chuồng, 18, 18…18.
- Nhập kết quả và xử lý bằng SPSS * Nhập số liệu: Giả sử kết quả tăng trọng (kg/tháng) trong thí nghiệm thu được như sau: 4 Mức protein.
- Cá thể Như vậy, số liệu thí nghiệm sẽ được nhập theo cột tương ứng với từng mức protein trong Excel.
- Xử lý bằng SPSS - Phân tích thống kê Chọn thẻ Analyze/ Descriptive Statistics, sau đó tùy theo từng thí nghiệm và mục đích phân tích thống kê để chọn các thẻ khác nhau.
- Frequencies cho phân tích theo tần số, tấn suất.
- Descriptives cho phân tích mô tả.
- Exprore cho phân tích mô tả chi tiết.
- Ratio cho phân tích theo tỷ lệ, tỷ số.
- Trong tình huống này, phép phân tích mô tả chi tiết cho biết thông tin đầy đủ nhất.
- Chọn Discriptives/ Histogram cho dạng biểu đồ, Boxplots /Factor level together cho trường hợp biểu đồ biểu diễn các mức nhân tố với nhau, dạng biểu đồ khối hộp.
- Deviation 2.976 Minimum 6 Maximum 16 Range 10 Interquartile Range 3 Skewness Kurtosis tangtrong mucprotein Qua bảng Descriptives có thể rút ra một số kết quả cần thiết sau: Bảng 1: Thống kê mô tả ảnh hưởng của các mức protein khác nhau đến tăng trọng của lợn Nhóm Tbình Phương sai Qua biểu đồ trên, cho thấy các giá trị tăng trọng của lợn trong mỗi mức protein có phân bố chuẩn.
- Các mức protein khác nhau có ảnh hưởng đến tăng trọng lợn khác nhau.
- Chưa chỉ ra sự sai khác về ảnh hưởng của các mức protein khác nhau đến tăng trọng lợn.
- Do đó cần tiến hành kiểm tra phương sai (ANOV A) và hậu ANOV A (kiểm tra post-hoc) để biết ảnh hưởng khác nhau của các nhóm như thế nào.
- Trước khi phân tích ANOV A, cần kiểm tra xem các số liệu có theo phân bố chuẩn hay không.
- 3.636 N tangtrong Trong đó df1 là số bậc tự do của mức nhân tố.
- Khi Sig > 0,05 thì tiến hành phân tích phương sai.
- Phép phân tích phương sai trong SPSS tiến hành như sau: Mean : cho phép so sánh các giá trị trung bình.
- Univariate: cho trường hợp có một biến phụ thuộc (bao gồm 1 hoặc nhiều mức nhân tố) Hoặc chọn Analyze /General linear model Multivariate: cho trường hợp có từ hai biến phụ thuộc trở lên (bao gồm một hoặc nhiều mức nhân tố) Tuy nhiên, trong SPSS kiểm tra phân bố chuẩn và phân tích ANOV A thường không tiến hành đơn lẻ.
- Khi máy tính xử lý sẽ tự động kiểm tra phân bố chuẩn trước, sau đó phân tích phương sai.
- mucprotein là nhân tố cố định (ô Factor).
- Trong hộp thoại One- Way ANOVA: Ở mục contrasts chọn polynomial (trong trường hợp khoảng cách giữa các mức nhân tố không đều 14.
- 5th …cho dạng phương trình bậc 4, bậc 5…không chọn polynomial cho trường hợp khoảng cách các mức nhân tố bằng nhau.
- N mucprotein tangtrong Biểu đồ dạng Boxplots Đồ thị kiểm tra mức độ tập trung, theo phân bố chuẩn của số liệu * Mô hình ANOVA hai nhân tố yijk=μ+Ai+Bj + ABij +eijk – yijk: Giá trị của biến phụ thuộc của con vật k trong nghiệm thức A mức i và nhân tố B mức j (i=1,…a.
- μ: Là trung bình tổng thể – Ai: Là ảnh hưởng cố định hoặc ngẫu nhiên của nhân tố A với mức i – Bj: Là ảnh hưởng cố định hoặc ngẫu nhiên của B nghiên cứu với mức j – ABij: Là ảnh hưởng cố định hoặc ngẫu nhiên của tương tác giữa i và j – eijk: Là hiệu dư, IID N(0,σ2.
- Tãm t¾t ANOVA hai nh©n tè Nguån biÕn ®éng df MS F Nh©n tè A a-1 MSA MSA/MSW Nh©n tè B b-1 MSB MSB/MSW AXB (a-1)(b-1) MSAB MSAB/MSW NgÈu nhiªn (trong NT-ab MSW c¸c nhãm) Tæng NT-1 Tình huống 2: Nghiên cứu hàm lượng canxi trong máu của gà thuộc 2 giới tính khác nhau do ảnh hưởng của việc có hay không có xử lý hormone – 20 con gà (10 trống, 10 mái) tương đồng nhau về các yếu tố tuổi tác, trọng lượng.
- Phân tích tình huống.
- Nhân tố thí nghiệm: 2 nhân tố • Giới tính: Trống và Mái • Hormone: Có xử lý hormone, không xử lý hormone.
- Kiểu thiết kế thí nghiệm: Ngẫu nhiên hoàn toàn – Đơn vị thí nghiệm: Mỗi cá thể gà – Số lần lặp lại: 5 b.
- Thiết kế thí nghiệm ( sử dụng Excel 4.0) c.
- Nhập số liệu và phân tích thống kê bằng SPSS Nhập số liệu trực tiếp trên SPSS hoặc trên Excel rồi mở bằng SPSS.
- 7 .15 69 N Canxi mau - Sự bổ sung Hormon có ảnh hưởng đến hàm lượng canxi trong máu (p sự sai khác có ý nghĩa thống kê.
- Giới tính không có ảnh hưởng đến hàm lượng canxi trong máu (p sự sai khác không có ý nghĩa thống kê.
- Không có ảnh hưởng tương tác giữa hormone và giới tính (p .
- Ảnh hưởng của hormone đến hàm lượng canxi trong máu của gà (mg/100ml) Hormon Trống Mái Trung bình Có 27,020a 25,620a 26,320a Không có 14,080b 12,920b 13,50b Trung bình a, b chỉ sự sai khác có ý nghĩa ở mức p= 0.05 2.2.
- Thiết kế thí nghiệm theo kiểu ngẫu nhiên hoàn toàn theo khối (RCB - Randomized Completed Block Design).
- Thế nào là thiết kế theo khối ngẫu nhiên hoàn toàn? Thiết kế theo khối ngẫu nhiên hoàn toàn là thiết kế thí nghiệm có các đặc tính sau.
- Theo khối: Các nhóm của thiết kế ngẫu nhiên hoàn toàn – Ngẫu nhiên: Áp dụng ngẫu nhiên trong mỗi khối – Hoàn toàn:Tất cả nghiệm thức được phân vào trong mỗi khối * Ưu điểm của thiết kế ngẫu nhiên hoàn toàn theo khối 16 RCB hiệu quả hơn CRD • Các đơn vị thí nghiệm trong các nhóm là tương đồng với nhau hơn • Các đơn vị thí nghiệm giữa các nhóm là khác nhau hơn • Sai số thí nghiệm là nhỏ hơn * M« h×nh cña thiÕt kÕ thÝ nghiÖm theo khèi ngÉu nhiªn hoàn toàn Mô hình tuyến tính không tương tác: yij = µ+ Bi + Dj + εij • yij : Träng l­îng ban ®Çu • Bi : ¶nh hö¬ng cña khèi • Dj: ¶nh hö¬ng cña nh©n tè thÝ nghiÖm • εij: hiÖu d.
- Mô hình tuyến tính có tương tác: yijk = µ + Bi + Dj + BDij + εijk yijk = quan sát trên cá thể k cho nhân tố i, j.
- BDij: là ảnh hưởng của tương tác giữa 2 nhân tố i, j.
- Ảnh hưởng của các khẩu phần đến tăng trọng của lợn - 4 khẩu phần - 6 con/khẩu phần - Nuôi cá thể Các đơn vị thí nghiệm được phân chia một cách ngẫu nhiên vào các khẩu phần.
- Phân tích tình huống: Để đánh giá được ảnh hưởng của các khẩu phần đến tăng trọng lợn thì cần phải loại bỏ hoặc tính toán được các ảnh hưởng khác không phải từ khẩu phần để hiệu chỉnh sai số do các ảnh hưởng này mang lại.
- Vì vậy các lợn thí nghiệm cần được phân chia một cách ngẫu nhiên vào 4 khẩu phần, làm thế nào đó để trọng lượng ban đầu là giống nhau cho mỗi khẩu phần (khối lượng lợn thí nghiệm trong mỗi khẩu phần tương đối đồng nhất).
- Thiết kế thí nghiệm kiểu khối ngẫu nhiên hoàn toàn.
- Nhân tố thí nghiệm: khẩu phần ăn - Mức nhân tố: 4 mức - Đơn vị thí nghiệm: mỗi các thể lợn - Số lần lặp lại = số khối = 6.
- Cách thiết kế thí nghiệm 17 c.
- khauphan*khoi để xem ảnh hưởng cộng gộp của khối và phẩu phần.
- Tuy nhiên, trong bảng kiểm tra các yếu tố ảnh hưởng Tests of Between-Subjects Effects vẫn cho thấy ảnh hưởng của khẩu phần và ảnh hưởng của khối là có ý nghĩa với mức ý nghĩa p tương ứng là 0.000 và 0.007.
- Nếu bỏ khoi ra khỏi ô Random factor và tiến hành phân tích chỉ ảnh hưởng của khauphan tới tăng trọng thì kết quả sau đây trong hộp thoại Output – SPSS Viewer: 20 Univariate Analysis of Variance Between-Subjects Factors N Khaupha A 6 n B 6 C 6 D 6 Descriptive Statistics Dependent Variable: tangtrong Khauphan Mean Std.
- Các kết quả trên cho biết các ảnh hưởng của khẩu phần rõ ràng hơn, đồng thời so sánh được ảnh hưởng khác nhau của các khẩu phần.
- Trong trường hợp này, ảnh hưởng của khoi đã được chuyển vào ảnh hưởng của các khẩu phần.
- Thiết kế thí nghiệm theo kiểu ô vuông Latinh (Latin Square Design- LSD) Thế nào là thiết kế thí nghiệm theo kiểu ô vuông Latinh ? Thiết kế thí nghiệm theo kiểu ô vuông Latinh là thiết kế ë ®ã c¸c ch÷ la tinh cã thÓ ®­îc tæ chøc nhãm thµnh mét ma trËn vu«ng, mçi ch÷ chØ ®­îc xuÊt hiÖn mét vµ chØ mét lÇn mµ th«i t¹i mét « vu«ng trong mçi hµng vµ mçi cét.
- Thiết kế thí nghiệm kiểu ô vuông Latinh có các đặc điểm sau.
- Các đơn vị thí nghiệm được phân tổ theo hai cách: các hàng và các cột.
- Mỗi hàng và mỗi cột là một thiết kế thí nghiệm RCB.
- Không có sự tương tác giữa các nhân tố.
- Không nên sử dụng khi xác định ảnh hưởng lâu dài, tích luỷ của nhân tố thí nghiệm.
- Nghiên cứu ảnh hưởng của chế độ ăn mùa Đông đến năng suất sữa.
- Cơ sở thí nghiệm có thể cung cấp 4 con bò.
- Nhân tố thí nghiệm: khẩu phần thức ăn, với 4 mức: A, B, C, D - Đơn vị thí nghiệm: không phải là BÒ mà là BÒ và GIAI ĐOẠN - Số lần lặp lại =4 - Có 2 nguồn biến động ngoài nhân tố thí nghiệm: Giống và Giai Đoạn (4 giống, 4 giai đoạn.
- Phương pháp phân tích: giống như phân tích theo khối ngẫu nhiên + 1 nguồn biến động.
- Dk: Ảnh hưởng của khẩu phần - Yijk: Tổng lượng sữa của cá thể bò i, giai đoạn j và được ăn khẩu phần k * Thiết kế thí nghiệm và sử lý thống kê.
- Thiết kế thí nghiệm: Tất cả các hình vuông la tinh với một kích thước xác định đều có thể lấy từ các hình vuông la tinh chuẩn Hình vuông la tinh chuẩn có các ký hiệu của nghiệm thức là A, B, C, D… và các ký hiệu này được viết theo thứ tự alphabet trong dòng đầu tiên và hàng đầu tiên • Khi t=2 hoặc 3 thì có 1 hình vuông la tinh chuẩn (HVLTC) 23 • Khi t =4 thì có 4 HVL TC • Khi t = 5 thì có 56 HVL TC • Khi t = 6 thì có 9408 HVL TC • HVL TC với bất kỳ kích thước nào đều có thể tạo bằng cách § Viết các ký tự của hàng đầu tiên theo thứ tự alphabet A, B, C.
- Hàng thứ 2 được xác định từ hàng thứ nhất bằng cách chuyển hàng thứ nhất một ký tự về phía trái, chuyển ký tự A về phía cuối của hàng về phái bên phải § Hàng thứ 3 được xác định bằng cách chuyển hàng thứ 2 tương tự như trên Làm thế nào để thiết kế ngẫu nhiên Nếu chúng ta có HVL TC với kích thước t x t, thì quá trình ngẫu nhiên được thực hiện như sau (HVL TC có thể tự tạo, có thể lấy từ bất cứ sách thiết kế thí nghiệm nào).
- B1: Chọn ngẫu nhiên một hình vuông la tinh chuẩn (trong trường hợp này là hình vuông Latinh chuẩn với 4 nghiệm thức).
- A B C D B C D A C D A B D A B C B2: Ngẫu nhiên hóa trật tự tất cả các hàng ngoại trừ hàng thứ nhất + Để thực hiện B2 cần có các số ngẫu nhiên cho 3 hàng cuối (dùng hàm RAN.
- để sắp xếp trật tự 3 hàng cuối/hoán vị trật tự (nếu không có hình vuông Latinh chuẩn thì tiến hành ngẫu nhiên hóa tất cả các hàng.
- Dùng hàm Data/Sort để sort theo cột số ngẫu nhiên (RAND) chỉ với 3 hàng cuối.
- 24 B3: Ngẫu nhiên hóa trật tự tất cả các cột + Tạo số ngẫu nhiên theo hàng và sort theo hàng ( Data/Sort/Sort option/Sort left to right ) Sau khi sắp xếp hình vuông Latinh sẽ có dạng sau: B4: Phân chia một cách ngẫu nhiên các nghiệm thức vào các ký tự + Cần có các số ngẫu nhiên để phân các nghiệm thức vào các ký tự.
- Nếu HVL TC là đã được chọn một cách ngẫu nhiên từ các HVLTC có khả năng, thì bước này không cần thiết.
- ü Giả sử ta không chọn ngẫu nhiên HVLTC ü Giả sử các nghiệm thức là x.
- Như vậy ta đã tiến hành bố trí ngẫu nhiên các nghiệm thức (các nhân tố hoặc mức nhân tố thí nghiệm, vdụ: khẩu phần) vào các ký tự (các cá thể thí nghiệm, các ô chuồng.
- Kiểu thiết kế trên đã phân ngẫu nhiên các nghiệm thức vào các đối tượng thí nghiệm và ngẫu nhiên trong từng giai đoạn thí nghiệm (hoàn toàn ngẫu nhiên ở mỗi hàng và mỗi cột).
- 25 - Nhập số liệu: Giả sử kết quả thí nghiệm được ghi chép như sau: Nhập số liệu trong Exel hoặc trong SPSS sẽ có dạng sau: 26 - Xử lý số liệu trong SPSS: 27