Professional Documents
Culture Documents
7 Xu Ly Du Lieu Ung Dung Phan Mem Spss V 4563
7 Xu Ly Du Lieu Ung Dung Phan Mem Spss V 4563
HỒ CHÍ MINH
K H O A Q U ẢN TR Ị K IN H D O A N H
NGHIÊN CỨU
MARKETING
CHƯƠNG 7
XỬ LÝ DỮ LIỆU-
ỨNG DỤNG PHẦN MỀM SPSS
1
NỘI DUNG
A. XỬ LÝ DỮ LIỆU
1. Các phương pháp xử lý dữ liệu;
2. Các giai đoạn xử lý dữ liệu.
A. ỨNG DỤNG PHẦN MỀM SPSS
1. Giới thiệu phần mềm SPSS;
2. Chuẩn bị dữ liệu;
3. Định biến và nhập dữ liệu;
4. Các phép biến đổi và thao tác trên tập dữ liệu.
2
A. XỬ LÝ DỮ LIỆU TRONG NC MAR
3
1. Các phương pháp xử lý dữ liệu
Xử lý
Xử lý
với trợ giúp
thủ công
của máy tính
4
2. Các giai đoạn xử lý dữ liệu
Giả sử rằng “Các yếu tố tác động đến quyết định lựa
chọn (mua) mì ăn liền nhãn hiệu “Hảo Hảo” của khách hàng
trên thị trường TP.HCM” là: (a1) Chất lượng SP; (a2) Khẩu vị
phù hợp; (a3) Định lượng vừa đủ; (a4) Dễ dàng mua; (a5) Bao
bì hấp dẫn.
Khi đi sâu nghiên cứu về “ chất lượng” sản phẩm, các thuộc
tính cấu thành kết luận chất lượng sản phẩm tốt của mì ăn
liền ”Hảo Hảo” gồm có: (a1.1) Sợi mì dai (khi ăn); (a1.2) Màu
sắc của mì và nước dùng tươi ngon; (a1.3) Có thành phần dinh
dưỡng cao; … Và các yếu tố còn lại cũng có các thuộc tính xác
9
Thí dụ về biến nghiên cứu
Ở thí dụ trên các biến số: a1; a2; a3; a4 là các biến
số trực tiếp (cấp 1) tác động đến quyết định lựa chọn mì
ăn liến “ Hảo Hảo”. Còn các biến số a1.1; a1.2; … là các
biến số cấp 2 ( Xem mô hình nghiên cứu).
Thí dụ: Với câu hỏi “ Xin vui lòng cho biết sở thích của
bạn đối với sữa chua Vinamilk? -> Ta có thể định biến
nghiên cứu là:
c3: Sở thích của khách hàng đối với sữa chua Vinamilk.
10
2.1.3 Mã hoá dữ liệu
Thí dụ: Với câu hỏi “ Xin vui lòng cho biết sở thích của bạn đối
với sữa chua Vinamilk?
Code: 1 2 3 4 5
Rất ghét Ghét Tạm được Thích Rất thích
11
2.1.3 Mã hoá dữ liệu
Mã hoá còn giúp giảm thiểu các câu trả lời bằng
cách nhóm các câu trả lời vào 1 nhóm có cùng ý nghiã. Mã
hoá dữ liệu làm cơ sở cho việc thống kê phân tích dữ liệu.
Tiến trình mã hoá có thể được tiến hành bằng việc lập Sổ
mã hoá dữ liệu như sau:
Xác định loại câu trả lời cho những câu hỏi tương ứng.
Những câu trả lời này có thể thu thập từ một mẫu các
bảng câu hỏi đã hoàn tất;
Xây dựng một danh mục liệt kê các câu trả lời;
Gán cho các câu trả lời một nhãn hiệu, ký hiệu, một giá
trị (thường là một con số cụ thể).
12
Hình 7.1: Sổ mã hoá dữ liệu
TT Câu hỏi nghiên cứu Biến quan sát Mã trả Trả lời
lời
1 Vui lòng cho biết giới tính a1:Giới tính 1 Nam
của bạn? 2 Nữ
2 Xin vui lòng cho biết bạn a2: Nhóm tuổi 1 Dưới 18 tuổi
thuộc nhóm tuổi nào dưới 2 Từ 19- 25
đây?
3 Từ 26-35
4 Từ 36-45
5 Trên 45 tuổi
3 Xin vui lòng cho biết sở a3: Sở thích 1 Rất ghét
thích của bạn đối với sữa của khách hàng 2 Ghét
chua Vinamilk? đối với sữa
chua Vinamilk. 3 Tạm được
4 Thích
5 Rất thích
… 13
2.2 Nhập dữ liệu và lưu trữ
15
2.2.2 Làm sạch dữ liệu
2- Trả lời
1- Ô trống
không hợp lý
(Missing data)
(Roque value)
16
2.2.2 Làm sạch dữ liệu
Dạng thống kê
18
3.1 Tóm tắt dạng thống kê
X = (1/n ). Σni=1Xi
Trung vị là giá trị nằm giữa của thang đo.
Mode là giá trị có tần số xuất hiện lớn nhất của một
tập hợp các số đo.
20
3.1 Tóm tắt thống kê
2
3.1.2 Đo lường mức độ phân tán
21
3.2 Tóm tắt dạng bảng
1- Bảng đơn
2- Bảng chéo
(Simple one-way
(Cross- Tabulation)
Tabulation)
22
Bảng đơn (mẫu)
C3: Sở thích của khách hàng đối với sữa chua Vinamilk.
4- Thích 100 50 70
3- Tạm được 30 15 85
2- Ghét 20 10 95
23
Bảng chéo (mẫu)
24
3.3 Tóm tắt dạng đồ thị
Bar Pie
chart chart
Scatter
Line
graph
graph
3.3 Tóm tắt dạng đồ thị
26
3.3 Tóm tắt dạng đồ thị
27
3.3 Tóm tắt dạng đồ thị
28
4. CHỌN PHƯƠNG PHÁP PHÂN TÍCH
DỮ LIỆU
1- Thang đo
2- Phân bố 4- Số biến
của dữ liệu cần phân tích
31
4.3 Phương pháp chọn mẫu
1- Chọn mẫu theo xác suất 2- Chọn mẫu phi xác suất
Đây là phương pháp tốt nhất Việc chọn mẫu phi ngẫu nhiên
để ta có thể chọn ra một mẫu hoàn toàn phụ thuộc vào kinh
có khả năng đại biểu cho tổng nghiệm và sự hiểu biết về tổng
thể. Vì có thể tính được sai số thể của người nghiên cứu nên kết
do chọn mẫu, nhờ đó ta có thể quả điều tra thường mang tính
áp dụng được các phương chủ quan của người nghiên cứu.
pháp ước lượng thống kê, Mặt khác, ta không thể tính được
kiểm định giả thuyết thống kê sai số do chọn mẫu, do đó không
trong xử lý dữ liệu để suy thể áp dụng phương pháp ước
rộng kết quả trên mẫu cho lượng thống kê để suy rộng kết
tổng thể chung quả trên mẫu cho tổng thể chung
32
4.4 Số biến cần phân tích
Các nhà nghiên cứu thường căn cứ vào số lượng
biến số cần phân tích để phân loại các phương pháp
phân tích dữ liệu:
Khi số biến được phân tích là 1 thì được gọi là
phương pháp phân tích đơn biến (Univariate data
analysic);
Khi số biến được phân tích là 2 thì gọi là phương
pháp phân tích nhị biến (Bivariate data analysic);
Khi có nhiều biến để phân tích thì các phương pháp
phân tích đó gọi là phương pháp phân tích đa biến
(Multivariate data analysic). 33
4.5 Mối quan hệ giữa các biến
2- Phân tích
1- Phân tích
phụ thuộc
phụ thuộc
lẫn nhau
34
4.5.1 Phân tích phụ thuộc
Khi các biến phân tích được chia thành hai nhóm:
Bíên độc lập – biến phụ thuộc thí phương pháp phân
tích là phân tích phụ thuộc. Các phương pháp phổ biến
trong nhóm này có thể kể như:
(1)Phân tích hồi qui đa biến (Multiple regression
analysis);
(2)Phân tích phân biệt (Discriminant analysis);
(3)Phân tích phương sai đa biến (Multivariate analysis of
variance).
35
4.5.2 Phân tích phụ thuộc lẫn nhau
Trong trường hợp không có biến độc lập và biến
phụ thuộc mà các biến này phụ thuộc lẫn nhau thì
phương pháp phân tích là phân tích phụ thuộc lẫn nhau.
Các phương pháp thường dùng trong nhóm này như:
(1)Phân tích yếu tố khám phá (Exploratory factor analysis);
(2)Phân tích nhóm đồng nhất (Cluster analysis);
(3)Phân tích đa hướng (Multidimensional Scaling);…
36
B: ỨNG DỤNG SPSS TRONG XỬ LÝ DỮ LIỆU
38
1. Giới thiệu phần mềm SPSS
Phần mềm SPSS có tất cả 3 dạng màn hình:
Màn hình
hiển thị dữ liệu
(Data view)
40
1. Giới thiệu phần mềm SPSS
Màn hình quản lý biến (Variable view): Là nơi
quản lý các biến (Variable) và các thông số đặc tính của
biến. Trong màn hình này mỗi dòng quản lý một biến, và
mỗi cột thể hiện một thông số đặc tính của biến. Cụ thể
như sau:
41
1. Giới thiệu phần mềm SPSS
- Tên biến ( Name): Là tên đại diện cho biến. Tên biến sẽ hiển
thị trên đầu mỗi cột trong màn hình quản lý dữ liệu.
- Lọai biến (Type): Thể hiện định dạng dữ liệu trong biến: Dang
số- Numeric (mặc định); Dạng chuỗi – String; Dạng ngày tháng –
Date; Dạng đơn vị tiền tệ - Currency;…
- Chiều rộng cột (Width): Chỉ số lượng ký tự được hiển thị;
- Hiển thị số lẻ (Decimals) : Thể hiện số lượng con số sau dấu
phẩy được hiển thị;
- Nhãn của biến (Label): Nêu rõ hơn về ý nghĩa của biến số;
- Giá trị trong biến (Values): Cho phép khai báo các giá trị trong
biến với ý nghĩa cụ thể;
- Giá trị khuyết (Missing): Do thiết kế bảng câu hỏi có một số
giá trị chỉ mang tính chất quản lý, không có ý nghĩa phân tích. Để
lọai bỏ biến này ta cần khai báo nó như là giá trị khuyết để lọai bỏ
giá trị này ra khỏi các phân tích thống kê.
- Dạng thang đo (Measures): Hiển thị dạng thang đo của giá trị
trong biến.
42
1. Giới thiệu phần mềm SPSS
43
2. Định biến và nhập dữ liệu trên
SPSS
2.1 Định biến trên SPSS
Định biến trong màn hình quản lý biến (Variables view)
thực hiện trước khi nhập dữ liệu vào máy tính. Qui trình
định biến như sau:
1. Đặt tên biến (Name);
2. Định dạng biến (Type);
3. Xác định số lượng con số hiển thị cho giá trị biến (Width)
và số lượng con số lẻ hiển thị (Decimals);
4. Gán nhãn cho biến (Variable Label);
5. Định tên cho các giá trị trong biến (Value labels);
6. Định nghiã các giá trị khuyết (Missing values);
7. Định kích thước cột (Column format);
8. Định vị trí hiển thị giá trị (Align);
9. Định dạng thang đo (Measurement)
44
2. Định biến và nhập dữ liệu trên
SPSS
2.2 Nhập dữ liệu trên SPSS
Dữ liệu được nhập từ màn hình quản lý dữ liệu (Data
view). Màn hình này thể hiện ra một ma trận dữ liệu
gồm: Cột; hàng; và ô. Với các cột lần lượt tương ứng
với các biến, các dòng tương ứng với mỗi phần tử. Ta
cũng có thể nhập dữ liệu từ các phần mềm khác như
Excel, Fox sau đó chuyển vào SPSS bằng lệnh Copy.
45
3. Các phép biến đổi và thao tác
trên tập dữ liệu
Có 5 phép biến đổi trên tập dữ liệu
thường sử dụng là:
Làm sạch
Mã hoá
Và tóm tắt
lại dữ liệu
Hợp nhất
tập dữ Đánh giá độ
liệu tin cậy của
thang đo
Tách tập
dữ liệu
3.1 Mã hoá lại
Mã hoá lại (Recode) là công cụ biến đổi các giá
trị (đã mã hoá) thành các mã hoá mới phù hợp
với đòi hỏi của việc phân tích dữ liệu. SPSS
cung cấp cho ta 2 loại mã hoá lại là:
47
3.1 Mã hoá lại
Mã hoá lại trên cùng một biến thì các giá trị được
mã hoá lại sẽ thay thế cho các giá trị cũ (các giá trị này sẽ
mất đi), cần chú ý rằng các giá trị vừa được mã hoá lại
chưa có nhãn, do đó sau khi recode ta phải khi báo lại
nhãn cho giá trị. Qui trình này được thực hiện qua các
bước sau:
Transform/ Recode/ Recode into same variables ta sẽ có hộp
thoại (7.4);
Chọn và chuyển các biến cần mã hoá lại sang hộp thoại variables,
nhấn Old and new value để chuyển các giá trị cũ thành các giá trị
mới. Old value dùng để khai báo các giá trị cũ cần chuyển đổi, New
value dùng để khai báo giá trị mới sẽ thay thế cho giá trị cũ. Add để
48
3.1 Mã hoá lại
Mã hoá lại vào biến khác thì các giá trị hiện tại
của một biến trở thành giá trị mới trong một biến khác.
Qui trình này thực hiện như sau:
Transform/ Recode into different variables ta sẽ có
hộp thoại (7.7);
Chọn và chuyển các biến cần mã hoá lại vào hộp thoại
variables, khai báo tên biến mới và nhãn biến mới trong
hộp thoại Output variable. Nhấn Change để xác nhận
khai báo này.
49
3.2 Làm sạch và tóm tắt dữ liệu với
SPSS
Để làm sạch dữ liệu với SPSS ta chỉ cần thực hiện
tính tần số với thao tác đơn giản:
Analyze/ Descriptive statistics/ Frequencies. Ta có
hộp thoại tóm tắt tần số, ta cần chọn và đưa các biến
cần tính vào ô variables. Nhấn OK ta sẽ có bảng tóm tắt
tần số. Các bạn chú ý phần Missing (lỗi) nếu có thì phải
hiệu chỉnh lại dữ liệu nhé.
Để tóm tắt thống kê dữ liệu trên SPSS như: (1) Min;
(2) Max; (3) Mean; (4) Phương sai chỉ cần thao tác.
Tại hộp thoại tóm tắt tần số ta chọn Statistics rồi
chọn ô cần thiết rồi Continue/ OK bạn sẽ có kết quả
ngay lập tức.
50
3.3 Đánh giá độ tin cậy của thang đo bằng
Cronbach Alpha trên SPSS
Khi thực hiện các nghiên cứu định lượng, người nghiên
cứu phải sử dụng nhiều thang đo lường khác nhau. Hiện
tượng kinh tế - xã hội vốn rất phức tạp nên việc lượng hoá
các khái niệm nghiên cứu đòi hỏi phải có sự kiểm tra độ tin
cậy của các thang đo trước khi sử dụng. Phần này chúng ta sẽ
thực hành kiểm tra độ tin cậy của thang đo bằng công cụ
Cronbach Alpha trên SPSS.
Thí dụ: Giả sử rằng “Các yếu tố tác động đến quyết định lựa
chọn (mua) mì ăn liền nhãn hiệu “Hảo Hảo” của khách hàng
trên thị trường TP.HCM” là:
(a1) Chất lượng SP;
(a2) Khẩu vị phù hợp;
(a3) Định lượng vừa đủ;
(a4) Dễ dàng mua;
(a5) Bao bì hấp dẫn.
51
3.3 Đánh giá độ tin cậy của thang đo bằng
Cronbach Alpha trên SPSS
52
3.3 Đánh giá độ tin cậy của thang đo bằng
Cronbach Alpha trên SPSS
Xin bạn vui lòng trả lời bằng cách khoanh tròn vào một con
số ở từng dòng. Những con số này thể hiện mức độ bạn đồng ý hay
không đồng ý đối với các phát biểu theo qui ước sau:
Rất không đồng ý Không đồng ý Trung lập Đồng ý Rất đồng
ý
1 2 3 4 5
a1: Chất lượng của mì ăn liền “Hảo Hảo” là yếu tố quyết 1 2 3 4 5
định việc tôi lựa chọn nó:
a2: Khẩu vị phù hợp là yếu tố quyết định việc tôi lựa chọn 1 2 3 4 5
mì ăn liền “Hảo Hảo”
a3: Mì ăn liền “Hảo Hảo” có định lượng vừa dủ là yếu tố 1 2 3 4 5
quyết định việc tôi lựa chọn nó.
a4: Việc tôi cá thể mua mì ăn liền “Hảo Hảo” một cách 1 2 3 4 5
dễ dàng, ở mọi nơi là yếu tố quyết định việc tôi lựa chọn
nó.
a5: Bao bì của mì ăn liền “Hảo Hảo” rất hấp dẫn là yếu 1 2 3 4 5
53
3.3 Đánh giá độ tin cậy của thang đo bằng
Cronbach Alpha trên SPSS
Vấn đề ở đây là đây có phải là một thang đo tốt
cho một khía cạnh khái niệm mà ta quan tâm hay không?
Để trả lời câu hỏi này ta sẽ tính toán đại lượng Cronbach
54
3.3 Đánh giá độ tin cậy của thang đo bằng
Cronbach Alpha trên SPSS
Với kết quả Alpha từ :
>0.8 -> Là thang đo tốt;
0.7- 0.8 -> Là thang đo sử dụng được;
0.6 – 0.7 -> Là thang đo sử dụng được đối với
những khái niệm mới, hoặc cho SV mới bắt đầu học
nghiên cứu;
< 0.6 -> Là thang đo không đảm bảo độ tin cậy,
không sử dụng được và bạn phải sửa chữa bảng câu hỏi.
Chú ý cột Alpha if item deleted nếu có tồn tại giá
trị lớn hơn Alpha thì hãy loại bỏ đi mục hỏi đó (mức độ
tác động đến quyết định … của yếu tố đó là thấp/ không 55
3.4 Tách tập dữ liệu (Split file)
56
3.5 Hợp nhất các tập dữ liệu (Merge files)
57
C. Hướng dẫn tiểu luận môn học
58
XIN CẢM ƠN CÁC BẠN!
59