« Home « Kết quả tìm kiếm

Phân tích dữ liệu bằng SPSS - Phần 2


Tóm tắt Xem thử

- CHƯƠNG 5: CÁC PHÉP BIẾN ĐỔI VÀ THAO TÁC TRÊN TẬP DỮ LIỆU.
- Recode là công cụ dùng để mã hóa lại các giá trị trong một biến thành các giá trị mã hóa mới phù hợp với đòi hỏi của quá trình phân tích dữ liệu.
- Tuy nhiên do nhu cầu xữ lý sau này, người nghiên cứu muốn nhóm các giá trị được mã hóa riêng biệt này thành ba loại nguồn quảng cáo chính là Báo, Tạp Chí và Tivi.
- Công cụ Recode cho phép ta định lại các giá trị riêng biệt về nguồn quảng cáo ban đầu thành ba nguồn quảng cáo chung là Báo, Tivi và tạp chí..
- Recode trên cùng một biến là mã hóa lại những giá trị trong một biến hiện hữu thành những giá trị mới và các giá trị mới này sẽ nằm ngay trong biến hiện hữu và thay thế các giá trị củ trên biến đó.
- Khi sử dụng công cụ này ta sẽ mất đi các giá trị đã khai báo ban đầu trong biến mà ta thực hiện lệnh Recode.
- Chú ý các giá trị vừa được tạo ra chưa có nhãn, do đó sau khi thực hiện lệnh ta phải tiến hành khai báo nhãn cho giá trị (đã đề cập trong phần khai báo biến).
- định lại giá trị của biến trên cùng một biến.
- Ta có hộp thoại như hình 5-1:.
- Chuyển các biến cần mã hóa lại sang hộp thoại variables, nhấn thanh Old and New Values để chuyển các giá trị củ cần thay đổi thành các giá trị mới.
- Old value dùng để khai báo giá trị củ cần chuyển đổi.
- Giá trị củ này có thể là một giá trị đơn lẻ(Value), một giá trị khuyết mặc định hay giá trị khuyết khai báo (System­missing or User­missing), một dãy các giá trị (Range), hoặc toàn bộ các giá trị nào đó trong biến (All other values).
- New value dùng để khai báo giá trị mới sẽ thay thế cho giá trị củ tương ứng.
- Các giá trị chuyển đổi có thể sửa chửa hoặc loại bỏ bằng cách di chuyển vệt tối đến biểu thức thể hiện sự chuyển đổi trong hộp thoại Old­>New và nhấn thanh Change cho sự thay đổi hoặc Remove để loại bỏ..
- Nếu việc định lại giá trị của các giá trị của biến có một số điều kiện kèm theo, ta có thể dùng.
- Trong hộp thoại If Cases, mặc định là không có điều kiện nào cả, phép định lại giá trị của biến được thực hiện cho tất cả các quan sát, ở đây hiển thị là Include all cases.
- Chọn lệnh include if case satisfies condition để xác định các điều kiện trong việc định lại giá trị của biến.
- Chuyển tên biến cần định lại các giá trị vào hộp thoại bên phải.
- Lúc này phép định lại giá trị của biến nói trên chỉ được thực hiện đối với các quan sát nào thỏa mãn được biểu thức điều kiện được thể hiện trong hộp thoại điều kiện này.
- Trong trường hợp định lại các giá trị hiện tại của một biến thành các giá trị mới trong một biến mới ta sẽ lựa chọn transform/recode/into different variable và ta có.
- hộp thoại như hình 5-4:.
- Sử dụng phương pháp recode vào một biến mới máy tính sẽ tự động tạo ra một biến mới trên cơ sở dữ liệu để chứa các giá trị mới vừa được tạo ra, đồng thời ta cũng vẫn lưu giữ được biến củ với các giá trị mã hóa củ trên cơ sở dữ liệu.
- Chú ý các giá trị vừa được tạo ra chưa có nhãn, do đó sau khi thực hiện lệnh ta phải tiến.
- hành khai báo nhãn cho giá trị (đã đề cập trong phần khai báo biến).
- Việc mã hóa lại các giá trị vào trong một biến mới được thực hiện qua các bước sau:.
- Chuyển tên biến cần định lại giá trị vào trong hộp thoại variables.
- Khai báo tên biến mới và nhãn biến mới sẽ chứa các giá trị vừa được mã hóa lại trong hộp thoại Output variable.
- Các công cụ If và Old and New Values cũng có ý nghĩa và thao tác tương tự như trường hợp định lại giá trị cho cùng một biến, đã được đề cập ở phần trên..
- Công cụ này có ưa điểm là ta vừa tạo ra được một biến mới với các giá trị được mã hóa theo cách mới nhưng đồng thời vẫn giữa được biến gốc với các giá trị mã hóa ban đầu.
- Trong khi với phương pháp mã hóa lại dữ liệu trên cùng một biến, các giá trị mã hóa mới sẽ chồng lên các giá trị củ và ta đã mất đi các giá trị mã hóa ban đầu trên biến đó..
- Công cụ tự động mã hóa lại (Automatic Recode) Là phương pháp mã hóa tự động các giá trị dạng chuổi sang dạng số vào trong một biến mới.
- Biến mới này sẽ chứa các con số nguyên liên tục, mỗi con số nguyên trong biến mới sẽ đại diện cho các giá trị dạng chuổi giống nhau.
- Ví dụ khi ban đầu ta nhập dữ liệu địa bàn nghiên cứu (quận) như Bình Thạnh, Quận 1, Quận 2, Tân Bình.
- Ta có thể recode các giá trị này thành các giá trị số như 1, 2, 3 một các tự động bằng công cụ Automatic Recode.
- Đối với cách Recode này các giá trị nguyên thủy (quận 1, quận 2.
- sẽ được sữ dụng như là nhãn của giá trị đã được recode trong biến mới được tạo ra từ lệnh Automatic Recode.
- Các giá trị dạng chuổi được mã hóa theo thứ tự alphabe..
- Lựa chọn các quan sát (Select Cases).
- Ta cũng có thể dùng phương pháp này để lựa chọn một mẫu ngẫu nhiên các trường hợp quan sát từ tổng thể dữ liệu.
- Chú ý sau khi thực hiện việc chọn lựa các trường hợp..
- Do đó sau khi thực hiện việc phân tích trên các trường hợp được lựa chọn, ta cần trả dữ liệu lại trạng thái ban đầu (kh6ng có lựa chọn các trường hợp) bằng cách chọn All Cases trong phần Select của hộp thoại Select Cases..
- Trong phần Unselected Cases cho biết trạng thái của các trường hợp không được lựa chọn.
- với các trường hợp được chọn có giá trị 1 và các trường hợp không được chọn có giá trị 0.
- Deleted cho phép loại bỏ toàn bộ các trường hợp không được chọn ra khỏi dữ liệu..
- Để nhận biết được các trường hợp nào được chọn hoặc không được chọn ta có thể nhìn vào các giá trị trong biến FILTER.
- các trường hợp được chọn có giá trị 1 và những trường hợp không được chọn có giá trị 0.
- xếp theo thứ tự các trường hợp được chọn hay không được chọn (Sort cases theo biến FILTER_$)..
- Để tiến hành chọn lựa các trường hợp ta có thể dùng các cách sau:.
- Lựa chọn công cụ If conditions are satisfied (xem hình 5-6) cho phép ta lựa chọn các trường hợp dựa trên các biểu thức điều kiện.
- Một biểu thức điều kiện cho ta các giá trị đúng hoặc sai của các trường hợp..
- Ví dụ đối với biến giới tính (GTinh)có hai giá trị là Nam: 1 và Nữ: 2.
- Lúc đó các trường hợp nào thỏa mãn điều kiện Gtinh=1 sẽ được lựa chọn.
- màn hình dữ liệu của SPSS.
- Tách tập dữ liệu (Split File).
- Công cụ Split File cho phép tách dữ liệu trong tập dữ liệu đang quan sát thành những nhóm nhỏ riêng biệt và sau khi thực hiện lệnh Split file này các phân tích xữ lý thống kê sẽ cho ta các kết quả thống kê đã được thực hiện riêng biệt theo từng nhóm nhỏ dữ liệu này..
- Việc phân tách này dựa trên việc phân dữ liệu thành những nhóm tương đương với các giá trị trong biến được lựa chọn để tiến hành phân nhóm.
- Được sử dụng cho việc phân tích dựa trên những giá trị của một hay nhiều biến đã được phân nhóm.
- Nếu ta lựa chọn việc phân tách dựa trên nhiều biến, dữ liệu sẽ được nhóm theo thứ tự biến được khai báo trong hộp thoại Groups Based On list..
- Chọn Compare groups: Các dữ liệu phân tích sẽ được tách theo các giá trị của biến được lựa chọn để tách dữ liệu (hiễn thị trong hộp Groups Based On list), và việc tách này mang tính chất so sánh do đó khi tiến hành phân tích dữ liệu các phân tích dựa trên sự phân tách này những vẫn được thể hiện trên cùng một bảng..
- Chọn Organize output by groups: Các dữ liệu phân tích sẽ được tách theo các giá trị của biến được lựa chọn để tách dữ liệu (hiễn thị trong hộp Groups Based On list), và việc tách này mang tính chất tổ chức lại dữ liệu thành những nhóm nhỏ do đó khi tiến hành phân tích dữ liệu các phân tích dựa trên sự phân tách và được thể hiện một các riêng biệt giữa các nhóm phân tách.
- Chú ý sau ki tiến hành phân tích trên sự phân tách, để trở lại trạng thái bình thường của dữ liệu đòi hỏi phải bỏ đi lệnh tách dữ liệu vừa đưa ra bằng cách chọn phần Analyze all cases, do not create groups trong hộp thoại Slipt Files.
- Công cụ compute được dùng để tính toán giữa các giá trị trong các biến và kết quả sẽ được lưu giữ trong một biến mới hoặc là một biến khác sẳn có hoặc biến chứa đựng giá trị đang tính toán..
- Target variable chứa đựng tên biến sẽ nhận giá trị được tính.
- Ta có thể khái báo kiểu và gán nhãn cho các giá trị của biến bằng cách nhấn vào thanh Type&lable.
- Ô Numeric Expression chứa đựng các biểu thức số được dùng để tính giá trị cho biến đích (biến chứa đựng giá trị mới), biểu thức này có thể dùng tên các biến sẵn có, các hằng, các toán tử và các hàm số.
- Công cụ này được dùng để tạo ra một biến mới chứa kết quả số lần xuất hiện (số đếm) của một giá trị hay nhiều giá trị được chỉ định ra trong danh sách các biến được chọn trong ơ variables trong mỗi trường hợp.
- Một biến mới sẽ được tạo ra khi ta thực hiện thủ tục Count gọi là biến đích (Taget variable) sẽ chứa đựng giá trị cộng dồn mỗi khi gặp được giá trị cần đếm trong một hoặc nhiều biến đã được khai báo trước trong hộp thoại Numeric variables..
- Giá trị cần đếm sẽ được định rõ trong phần Define values (hình 5-12).
- Giá trị khai báo để đếm có thể là những giá trị cụ thể nàu đó (Value), hoặc những giá trị rỗng (System missing) hoặc là một dãy các giá trị (range).
- Sau khi khai báo giá trị cần đếm ta dùng thanh Add để xác nhận giá trị cần đếm vào trong hộp thoại Values to count.
- hoặc loại bỏ giá trị cần đếm (giá trị đã được đánh dấu bằng vết đen)..
- Hợp nhất các tập dữ liệu (Merge files).
- SPSS cho phép ta hợp các dữ liệu quan sát từ trong một tập dữ liệu bên ngoài vào tập dữ liệu đang sử dụng..
- Hoặc hợp các biến mới trong tập dữ liệu bên ngoài vào tập dữ liệu đang hoạt động.
- Cả hai đều tạo ra một tập dữ liệu mới có thể chứa tất cả các quan sát được hợp lại hoặc tất cả các biến đưọc hợp tùy theo ta chọn Add Cases hay Add Variables.
- Công cụ Add Cases cho phép ta hợp dữ liệu trong tập dữ liệu đang hoạt động với dữ liệu trong một tập dữ liệu bên ngoài, với điều kiện tập dữ liệu đó phải chứa các biến giống như biến trong tập dữ liệu đang hoạt động.
- Sau khi thao tác, một tập dữ liệu mới (chưa được khai báo tên, và ta phải tiến hành lưu và khai báo tên mới) sẽ được tạo ra chứa các dữ liệu trong cả hai tập dữ liệu vừa được hợp lại với nhau.
- Trong trường hợp hai tập dữ liệu hợp với nhau nhưng có các biến khác nhau (khác nhau về tên biến hoặc loại biến) thì sau khi hợp tập dữ liệu mới sẽ tự động loại bỏ các biến khác nhau này, ta có thể sẽ bị mất dữ liệu chứa trong các biến bị loại bỏ này..
- Công cụ này rất thích hợp cho việc hợp nhất dữ liệu nghiên cứu ở các khu vực khác nhau, ví dụ như một cuộc khảo sát được tiến hành ở ba khu vực Hà Nội, Đà Nẵng, và TP.HCM, dữ liệu thu thập về sẽ được nhập, chỉnh sửa cho ba khu vực riêng biệt.
- Tuy nhiên sau đó ta có thể tiến hành hợp dữ liệu ở ba khu vực này vào một tập dữ liệu thống nhất để tiến hành phân tích và xữ lý.
- Hộp thoại Read File cho phép ta lựa chọn tập dữ liệu sẽ được hợp với tập dữ liệu đang hoạt động (working file)..
- Sau khi lựa chọn xong tập dữ sẽ được kết hợp, ta sẽ có một hộp thoại mới như hình 5-14:.
- Unpaired Variables: liệt kê các biến không giống nhau giữa hai tập dữ liệu đang được tiến hành hợp nhất lại, các biến không giống nhau này sẽ bị loại ra và không có trong tập dữ liệu mới được tạo ra từ việc hợp nhất hai tập dữ liệu ban đầu.
- đại diện cho các biến trong tập dữ liệu đang hoạt động và.
- đại diện cho các biến trong tập dữ liệu được truy xuất từ bên ngoài.
- Hai biến có tên biến được khai báo khác nhau - Những biến có dạng dữ liệu khác nhau.
- Cac biến này như đã nói sẽ bị loại bỏ ra khỏi tập dữ liệu vừa hợp nhất, điều này đồng nghĩa ta bị mất dữ liệu sau khi hợp nhất, do đó cần phải khắc phục sai sót này để bảo đảm tính đầy đủ của dữ liệu sau khi hợp nhất.
- Các biến này sẽ được hợp lại với nhau bằng cánh đánh dấu hai biến đó (trong hộp thoại Unpaired Variables) và nhấn thanh Pair, lúc đó dữ liệu trong hai biến này sẽ được hợp nhất và được chứa đựng trong biến lấy tên biến giống như tên biến trong tập tin đang hoạt động.
- Hộp thoại Variables in New Working Data File liệt kê các biến sẽ có trong tập tin mới được tạo ra từ việc hợp nhất hai tập dữ liệu ban đầu.
- Toàn bộ các biến trong hai tập tin ban đầu thỏa mãn các điều kiện giống nhau về tên và loại dữ liệu (số hoặc chuổi) sẽ được liệt kê vào hộp thoại này.
- Chúng ta cũng có thể loại bỏ những biến mà chúng ta không muốn có trong tập dữ liệu hợp nhất.
- Công cụ Add Variables cho phép hợp nhất dữ liệu trong tập tin đang hoạt động với một tập tin bên ngoài với điều kiện tập tin bên ngoài này phải chứa đựng cùng các quan sát với tập tin đang sử dụng, nhưng khác nhau về biến (khai báo tên biến khác với tập tin đang được sử dụng), quá trình này sẽ tạo ra một tập dữ liệu mới chứa cùng các quan sát nhưng tập hợp tất cả các biến khác nhau trong hai tập dữ liệu ban đầu..
- Các quan sát (Cases) trong cả hai tập tin cần hợp nhất biến phải được xắp xếp theo cùng một thứ tự, thông thường thứ tự này được quản lý bằng một tập tin chứa các giá trị là số bảng câu hỏi.
- Điều phải bảo đảm trước khi tiến hành hợp nhất biến giữa hai tập dữ liệu này là ta phải xắp xếp dữ liệu trong hai biến khóa của hai tập dữ liệu theo thứ tự từ nhỏ đến lớn..
- Từ tập dữ liệu đang thao tác ta mở công cụ Data/Merge Files/Adds Variables từ menu, SPSS sẽ truy suất hộp thoại Add Variables: Read File để ta lựa chọn tập dữ liệu sẽ được hợp với tập dữ liệu đang hoạt động.
- Sau khi lựa chọn được tập dữ liệu sẽ.
- hợp biến với tập dữ liệu đang hoạt động.
- Nếu muốn các biến giống tên nhau này có trong tập dữ liệu mới ta phải tiến hành rename nó lại và chuyển nó sang hộp thoại chứa các biến sẽ có trong tập tin mới (New Working Data File).
- Các trường hợp không thỏa mãn với biến khóa thì vẫn bao hàm trong tập dữ liệu mới nhưng sẽ không được hợp với các trường hợp trong tập tin khác.
- Những trường hợp này chỉ chứa đựng giá trị riêng biệt của tập dữ liệu mà nó bao hàm từ trước (trước khi tiến hành hợp nhất) và các trường hợp này sẽ có giá trị khuyết trong các biến chứa đựng trong tập tin thứ hai mà ta sẽ hợp nhất.

Xem thử không khả dụng, vui lòng xem tại trang nguồn
hoặc xem Tóm tắt