You are on page 1of 59

TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP.

HỒ CHÍ MINH
K H O A  Q U ẢN  TR Ị K IN H  D O A N H

NGHIÊN CỨU
MARKETING

CHƯƠNG 7
XỬ LÝ DỮ LIỆU-
ỨNG DỤNG PHẦN MỀM SPSS

1
NỘI DUNG

A. XỬ LÝ DỮ LIỆU
1. Các phương pháp xử lý dữ liệu;
2. Các giai đoạn xử lý dữ liệu.
A. ỨNG DỤNG PHẦN MỀM SPSS
1. Giới thiệu phần mềm SPSS;
2. Chuẩn bị dữ liệu;
3. Định biến và nhập dữ liệu;
4. Các phép biến đổi và thao tác trên tập dữ liệu.

2
A. XỬ LÝ DỮ LIỆU TRONG NC MAR

Nhiệm vụ tổng quát của việc xử lý dữ liệu là “chuyển


hóa” những ghi chép quan sát hoặc các câu trả lời dưới
dạng “thô” thành các con số thống kê theo một trật tự
nhất định để chuẩn bị cho việc phân tích và diễn giải các
kết quả nghiên cứu thu được.

3
1. Các phương pháp xử lý dữ liệu

Có 2 phương pháp xử lý dữ liệu cơ bản là :

Xử lý
Xử lý
với trợ giúp
thủ công
của máy tính

4
2. Các giai đoạn xử lý dữ liệu

Chuẩn bị dữ liệu Nhập dữ liệu và lưu trữ

Giai đọan này gổm 3 Giai đọan này cũng gồm


bước: 3 bước:
 Kiểm tra và hiệu  Nhập dữ liệu vào
chỉnh dữ liệu; máy tính;
 Định biến dữ liệu;  Làm sạch dữ liệu;
 Mã hóa dữ liệu.  Lưu trữ dữ liệu.
5
2.1.1 Kiểm tra và hiệu chỉnh dữ liệu
Đây là bước kiểm tra chất lượng thông tin trong
bảng câu hỏi nhằm đảm bảo không có bảng câu hỏi nào
bị thiếu hoặc chứa đựng những thông tin sai sót theo yêu
cầu thiết kế ban đầu. Người kiểm tra phải bảo đảm tính
toàn vẹn và tính chính xác của từng bảng câu hỏi. Thông
thường ở bước này các nhà nghiên cứu sẽ tiến hành kiểm
tra các đặc tính cơ bản của bảng câu hỏi. Cụ thể:
 Tính lôgíc của các câu trả lời;
 Tính đầy đủ của một câu trả lời và của một bảng câu
hỏi;
6
2.1.1 Kiểm tra và hiệu chỉnh dữ liệu
Quá trình kiểm tra, rà soát lại bảng câu hỏi là
nhằm mục đích kiểm tra, phát hiện, sửa chữa và thông
báo kịp thời cho người thu thập dữ liệu để tránh những
sai sót tương tự. Để xử lý các sai sót phát hiện được qua
kiểm tra, ta có thể chọn cách xử lý tuỳ thuộc vào mức độ
sai sót. Cụ thể:
 Trả về cho bộ phận thu thập dữ liệu nhằm làm sáng tỏ
vấn đề;
 Suy luận từ các câu trả lời khác;
 Loại bỏ bảng câu hỏi.
7
2.1.2 Định biến dữ liệu

Biến nghiên cứu là tập hợp các khái niệm có ý nghiã mô


tả (định tính, định lượng ) cho mục tiêu nghiên cứu, được
thể hiện bằng các ký hiệu (mã hoá) theo một qui ước nào
đó. Biến nghiên cứu được thể hiện và là một bộ phận
không thể thiếu trong mô hình nghiên cứu.
Biến nghiên cứu có thể được phân loại theo kiểu
dữ liệu (dạng thang đo). Biến định tính là biến chứa các
giá trị quan sát ở dạng thang đo biểu danh và thang đo xếp
hạng theo bậc. Biến định lượng là biến chứa các giá trị
quan sát ở dạng thang đo khoảng và thang đo tỷ lệ. Trong
bảng câu hỏi, mỗi một câu hỏi thường phải nhằm một
mục đích quan sát nào đó. Do vậy, thường mỗi một câu
hỏi tương ứng với một biến quan sát.
8
Thí dụ về biến nghiên cứu

Giả sử rằng “Các yếu tố tác động đến quyết định lựa
chọn (mua) mì ăn liền nhãn hiệu “Hảo Hảo” của khách hàng
trên thị trường TP.HCM” là: (a1) Chất lượng SP; (a2) Khẩu vị
phù hợp; (a3) Định lượng vừa đủ; (a4) Dễ dàng mua; (a5) Bao
bì hấp dẫn.
Khi đi sâu nghiên cứu về “ chất lượng” sản phẩm, các thuộc
tính cấu thành kết luận chất lượng sản phẩm tốt của mì ăn
liền ”Hảo Hảo” gồm có: (a1.1) Sợi mì dai (khi ăn); (a1.2) Màu
sắc của mì và nước dùng tươi ngon; (a1.3) Có thành phần dinh
dưỡng cao; … Và các yếu tố còn lại cũng có các thuộc tính xác
9
Thí dụ về biến nghiên cứu
Ở thí dụ trên các biến số: a1; a2; a3; a4 là các biến
số trực tiếp (cấp 1) tác động đến quyết định lựa chọn mì
ăn liến “ Hảo Hảo”. Còn các biến số a1.1; a1.2; … là các
biến số cấp 2 ( Xem mô hình nghiên cứu).

Thí dụ: Với câu hỏi “ Xin vui lòng cho biết sở thích của
bạn đối với sữa chua Vinamilk? -> Ta có thể định biến
nghiên cứu là:
c3: Sở thích của khách hàng đối với sữa chua Vinamilk.
10
2.1.3 Mã hoá dữ liệu

Mã hoá dữ liệu (Coding) là quá trình chuyển đổi các


trả lời thành dạng mã số để nhập và xử lý dữ liệu. Mục
đích của việc mã hoá là tạo nhãn (labels) cho các câu trả
lời, thường là bằng các con số, hay ký hiệu. Một trả lời
khi mã hoá thường sẽ thể hiện bằng 1ký tự chỉ số trả lời
(số đo).

Thí dụ: Với câu hỏi “ Xin vui lòng cho biết sở thích của bạn đối
với sữa chua Vinamilk?
Code: 1 2 3 4 5
Rất ghét Ghét Tạm được Thích Rất thích
11
2.1.3 Mã hoá dữ liệu
Mã hoá còn giúp giảm thiểu các câu trả lời bằng
cách nhóm các câu trả lời vào 1 nhóm có cùng ý nghiã. Mã
hoá dữ liệu làm cơ sở cho việc thống kê phân tích dữ liệu.
Tiến trình mã hoá có thể được tiến hành bằng việc lập Sổ
mã hoá dữ liệu như sau:
 Xác định loại câu trả lời cho những câu hỏi tương ứng.
Những câu trả lời này có thể thu thập từ một mẫu các
bảng câu hỏi đã hoàn tất;
 Xây dựng một danh mục liệt kê các câu trả lời;
 Gán cho các câu trả lời một nhãn hiệu, ký hiệu, một giá
trị (thường là một con số cụ thể).
12
Hình 7.1: Sổ mã hoá dữ liệu
TT Câu hỏi nghiên cứu Biến quan sát Mã trả Trả lời
lời
1 Vui lòng cho biết giới tính a1:Giới tính 1 Nam
của bạn? 2 Nữ
2 Xin vui lòng cho biết bạn a2: Nhóm tuổi 1 Dưới 18 tuổi
thuộc nhóm tuổi nào dưới 2 Từ 19- 25
đây?
3 Từ 26-35
4 Từ 36-45
5 Trên 45 tuổi
3 Xin vui lòng cho biết sở a3: Sở thích 1 Rất ghét
thích của bạn đối với sữa của khách hàng 2 Ghét
chua Vinamilk? đối với sữa
chua Vinamilk. 3 Tạm được
4 Thích
5 Rất thích
… 13
2.2 Nhập dữ liệu và lưu trữ

2.2.1- Nhập dữ liệu vào máy tính


CÁC BƯỚC CÔNG ViỆC

(Inputing data into computer)

2.2.2- Làm sạch dữ liệu


(Data cleaning)

2.2.3- Lưu trữ dữ liệu


(Data saving)
2.2.1 Nhập dữ liệu vào máy tính

Bảng câu hỏi sau khi phỏng vấn, hiệu chỉnh và mã


hoá dữ liệu thì công việc tiếp theo là nhập dữ liệu vào
máy. Dữ liệu sau khi nhập xong ở dạng một ma trận
được gọi là Ma trận dữ liệu (data matrix). Các phần
mềm xử lý dữ liệu trong thống kê đều cần dữ liệu ở
dạng ma trận.

15
2.2.2 Làm sạch dữ liệu

Có 2 sai sót thường gặp trong nhập dữ liệu là :

2- Trả lời
1- Ô trống
không hợp lý
(Missing data)
(Roque value)

16
2.2.2 Làm sạch dữ liệu

Các ô trống là các ô của ma trận không chứa đựng


dữ liệu trả lời. Nguyên nhân của sai sót là do thu thập dữ
liệu bị sót, hoặc nhập dữ liệu sai. Để phát hiện ô trống ta
có thể dùng phép đếm (count) theo các biến, vì số ô theo
các biến sẽ phải có số lượng đúng bằng cỡ mẫu. Khi
phát hiện sai sót phải chỉnh sửa lại.
Trả lời không hợp lý là các trả lời có dữ liệu
không nằm trong thang đo đã thiết kế. Ví dụ: thang đo có
5 bậc (từ 1-5), nhưng lại có dự liệu là 7, hoặc 33 là
những dữ liệu không hợp lý. Để phát hiện các trả lời
không hợp lý ta chỉ cần tính tần số theo cột (biến). Loại
sai sót này chủ yếu do nhập liệu (do gõ sai).
2.2.3 Lưu trữ dữ liệu: Dưới dạng văn bản hoặc files.
17
3. TÓM TẮT DỮ LIỆU
Dữ liệu sau khi được lưu giữ ở dạng ma trận dữ liệu,
công việc tiếp theo là tóm tắt chúng để chuẩn bị cho các
phương pháp phân tích tiếp theo. Dữ liệu thường được
tóm tắt ở 3 dạng:

Dạng thống kê

Dạng bảng, biểu Dạng đồ thị

18
3.1 Tóm tắt dạng thống kê

1- Đo lường mức độ tập trung 2- Đo lường mức độ phân tán


(Measure of centrality) (Measure of dispersion)
Gồm có: Gồm có:
 Trung bình (mean);  Phương sai (Variance);
 Trung vị ( Median); Độ lệch chuẩn
 Mode. (Standard Deviation);
 Khoảng biến thiên
(Range)
19
3.1 Tóm tắt thống kê

3.1.1 Đo lường mức độ tập trung


Ba đại lượng thường sử dụng trong đo lường mức
độ tập trung của các quan sát có công thức tính như sau:
 Trung bình của biến Xi ( i= 1,2,3… n) của mẫu:

X = (1/n ). Σni=1Xi
 Trung vị là giá trị nằm giữa của thang đo.
 Mode là giá trị có tần số xuất hiện lớn nhất của một
tập hợp các số đo.

20
3.1 Tóm tắt thống kê
2
3.1.2 Đo lường mức độ phân tán

 21
3.2 Tóm tắt dạng bảng

Hai dạng bảng thường dùng trong nghiên cứu


thị trường là:

1- Bảng đơn
2- Bảng chéo
(Simple one-way
(Cross- Tabulation)
Tabulation)

22
Bảng đơn (mẫu)

C3: Sở thích của khách hàng đối với sữa chua Vinamilk.

Thang đo Tần số Tần số Tần sô tích


tuyệt đối tương đối luỹ (%)
(%)
5- Rất thích 40 20 20

4- Thích 100 50 70

3- Tạm được 30 15 85

2- Ghét 20 10 95

1- Rất ghét 10 5 100

Tổng N= 200 100%

23
Bảng chéo (mẫu)

C7: Sở thích về sữa chua Vinamilk theo giới tính.


Thang đo Giới tính Giới tính Tổng
Nam Nữ
5- Rất thích 10 30 40
4- Thích 40 60 100
3- Tạm được 24 6 30
2- Ghét 18 2 20
1- Rất ghét 8 2 10
Tổng 100 100 N= 200

24
       3.3 Tóm tắt dạng đồ thị

Có 4 dạng đồ thị thường dùng là:

Bar Pie
chart chart

Scatter
Line
graph
graph
3.3 Tóm tắt dạng đồ thị

Đồ thị thanh thường


được sử dụng cho các câu
hỏi cho nhiều trả lời để
biểu diễn tần số - tổng
của nó lớn hơn kích
thước mẫu ( tần số tuyệt
đối) hay lớn hơn 100%
tần số tương đối.

26
3.3 Tóm tắt dạng đồ thị

Đồ thị bánh thường


được sử dụng cho các
câu hỏi đơn trả lời
để biểu diễn tần số
tương đối – Tổng
của nó bằng 100%.

27
3.3 Tóm tắt dạng đồ thị

Đồ thị đường và Đồ thị phân tán được sử dụng để biểu


diễn mối quan hệ giữa các biến.

28
4. CHỌN PHƯƠNG PHÁP PHÂN TÍCH
DỮ LIỆU

Để chọn phương pháp phân tích dữ liệu phù hợp, nhà


nghiên cứu cần chú ý một số vấn đề có ý nghiã quan
trọng sau:

1- Thang đo

2- Phân bố 4- Số biến
của dữ liệu cần phân tích

3­ Phương pháp 5- Mối quan hệ


chọn mẫu giữa các biến
29
4.1 Thang đo
Có các cách phân tích thích hợp đối với mỗi loại
thang đo:
 Thang đo định danh chỉ cho chúng ta tính: tần số;
kiểm định tần số (Chi- bình phương).
 Thang đo xếp hạng theo thứ tự cho phép chúng ta tính:
tần số; trung vị; kiểm định tần số; Kolmogorov –
Smirnov; Wilcoxon.
 Thang đo khoảng và thang đo tỷ lệ cho phép chúng ta
thực hiện các phân tích nêu trên. Bên cạnh đó còn cho
phép ta tính: giá trị trung bình; Các phép kiểm định Z,
30
4.2 Phân bố của dữ liệu

Tuỳ theo sự phân bố của dữ liệu ở các dạng chúng


ta có phương pháp phân tích tương thích:
(1)Phân bố tham số (Parametric) : => dùng phép kiểm
định Z,t;
(2)Phân bố phi tham số (Non- Parametric): => dùng
phép kiểm định tần số; Wilcoxon.

31
4.3 Phương pháp chọn mẫu

1- Chọn mẫu theo xác suất 2- Chọn mẫu phi xác suất

Đây là phương pháp tốt nhất Việc chọn mẫu phi ngẫu nhiên
để ta có thể chọn ra một mẫu hoàn toàn phụ thuộc vào kinh
có khả năng đại biểu cho tổng nghiệm và sự hiểu biết về tổng
thể. Vì có thể tính được sai số thể của người nghiên cứu nên kết
do chọn mẫu, nhờ đó ta có thể quả điều tra thường mang tính
áp dụng được các phương chủ quan của người nghiên cứu.
pháp ước lượng thống kê, Mặt khác, ta không thể tính được
kiểm định giả thuyết thống kê sai số do chọn mẫu, do đó không
trong xử lý dữ liệu để suy thể áp dụng phương pháp ước
rộng kết quả trên mẫu cho lượng thống kê để suy rộng kết
tổng thể chung quả trên mẫu cho tổng thể chung
32
4.4 Số biến cần phân tích
Các nhà nghiên cứu thường căn cứ vào số lượng
biến số cần phân tích để phân loại các phương pháp
phân tích dữ liệu:
 Khi số biến được phân tích là 1 thì được gọi là
phương pháp phân tích đơn biến (Univariate data
analysic);
 Khi số biến được phân tích là 2 thì gọi là phương
pháp phân tích nhị biến (Bivariate data analysic);
 Khi có nhiều biến để phân tích thì các phương pháp
phân tích đó gọi là phương pháp phân tích đa biến
(Multivariate data analysic). 33
4.5 Mối quan hệ giữa các biến

Xét về mối liên hệ giữa các biến, chúng ta có


hai nhóm phân tích chính:

2- Phân tích
1- Phân tích
phụ thuộc
phụ thuộc
lẫn nhau

34
4.5.1 Phân tích phụ thuộc

Khi các biến phân tích được chia thành hai nhóm:
Bíên độc lập – biến phụ thuộc thí phương pháp phân
tích là phân tích phụ thuộc. Các phương pháp phổ biến
trong nhóm này có thể kể như:
(1)Phân tích hồi qui đa biến (Multiple regression
analysis);
(2)Phân tích phân biệt (Discriminant analysis);
(3)Phân tích phương sai đa biến (Multivariate analysis of
variance).

35
4.5.2 Phân tích phụ thuộc lẫn nhau
Trong trường hợp không có biến độc lập và biến
phụ thuộc mà các biến này phụ thuộc lẫn nhau thì
phương pháp phân tích là phân tích phụ thuộc lẫn nhau.
Các phương pháp thường dùng trong nhóm này như:
(1)Phân tích yếu tố khám phá (Exploratory factor analysis);
(2)Phân tích nhóm đồng nhất (Cluster analysis);
(3)Phân tích đa hướng (Multidimensional Scaling);…

36
B: ỨNG DỤNG SPSS TRONG XỬ LÝ DỮ LIỆU

3- Các thao tác và phép biến đổi trên


tập dữ liệu

2- Định biến và nhập dữ liệu trên SPSS

1- Giới thiệu phần mềm SPSS


1. Giới thiệu phần mềm SPSS
SPSS (viết tắt của Statistical Package for the Social
Sciences) là một chương trình máy tính phục vụ công tác
thống kê. SPSS được sử dụng rộng rãi trong công tác
thống kê xã hội. Thế hệ đầu tiên của SPSS được đưa ra từ
năm 1968. Thế hệ mới nhất là thế hệ (Verison) 18.0 được
giới thiệu từ tháng 8 năm 2008, có cả phiên bản cho các
hệ điều hành Microsoft Windows, Mac, và Linux / UNIX.
Trong phạm vi môn học này, chúng ta thống nhất sử dụng
SPSS 15.0 cho việc xử lý dữ liệu.

38
1. Giới thiệu phần mềm SPSS
Phần mềm SPSS có tất cả 3 dạng màn hình:

Màn hình
hiển thị dữ liệu
(Data view)

Màn hình Màn hình


hiển thị biến hiển thị kết quả
(Variables view) (Output)
39
1. Giới thiệu phần mềm SPSS
Màn hình quản lý dữ liệu (Data view): là nơi lưu
trữ dữ liệu nghiên cứu với một cấu trúc cơ sở dữ liệu
(data) bao gồm: Cột (Colum)- Đại diện cho biến quan sát,
mỗi cột chứa đựng các dữ liệu (n dữ liệu); Hàng (Row)-
Đại diện cho 1 phần tử được quan sát, mỗi hàng chức
đựng tất cả các câu trả lời (dữ liệu) của một đối tượng
nghiên cứu; và ô (Cell)- Chứa đựng một kết quả trả lời
tương ứng với một câu hỏi khảo sát (biến) và một phần
tử.

40
1. Giới thiệu phần mềm SPSS
Màn hình quản lý biến (Variable view): Là nơi
quản lý các biến (Variable) và các thông số đặc tính của
biến. Trong màn hình này mỗi dòng quản lý một biến, và
mỗi cột thể hiện một thông số đặc tính của biến. Cụ thể
như sau:

41
1. Giới thiệu phần mềm SPSS
- Tên biến ( Name): Là tên đại diện cho biến. Tên biến sẽ hiển
thị trên đầu mỗi cột trong màn hình quản lý dữ liệu.
- Lọai biến (Type): Thể hiện định dạng dữ liệu trong biến: Dang
số- Numeric (mặc định); Dạng chuỗi – String; Dạng ngày tháng –
Date; Dạng đơn vị tiền tệ - Currency;…
- Chiều rộng cột (Width): Chỉ số lượng ký tự được hiển thị;
- Hiển thị số lẻ (Decimals) : Thể hiện số lượng con số sau dấu
phẩy được hiển thị;
- Nhãn của biến (Label): Nêu rõ hơn về ý nghĩa của biến số;
- Giá trị trong biến (Values): Cho phép khai báo các giá trị trong
biến với ý nghĩa cụ thể;
- Giá trị khuyết (Missing): Do thiết kế bảng câu hỏi có một số
giá trị chỉ mang tính chất quản lý, không có ý nghĩa phân tích. Để
lọai bỏ biến này ta cần khai báo nó như là giá trị khuyết để lọai bỏ
giá trị này ra khỏi các phân tích thống kê.
- Dạng thang đo (Measures): Hiển thị dạng thang đo của giá trị
trong biến.
42
1. Giới thiệu phần mềm SPSS

Màn hình hiển thị kết quả (output):


Các phép phân tích thống kê sẽ cho ra các kết
quả như bảng biểu, đồ thị và các kết quả kiểm
định. Các kết quả này sẽ được truy xuất ra một
màn hình, và được lưu giữ dưới một tập tin khác
(.SPO). Màn hình này cho phép ta xem và lưu giữ
kết quả phân tích.

43
2. Định biến và nhập dữ liệu trên
SPSS
2.1 Định biến trên SPSS
Định biến trong màn hình quản lý biến (Variables view)
thực hiện trước khi nhập dữ liệu vào máy tính. Qui trình
định biến như sau:
1. Đặt tên biến (Name);
2. Định dạng biến (Type);
3. Xác định số lượng con số hiển thị cho giá trị biến (Width)
và số lượng con số lẻ hiển thị (Decimals);
4. Gán nhãn cho biến (Variable Label);
5. Định tên cho các giá trị trong biến (Value labels);
6. Định nghiã các giá trị khuyết (Missing values);
7. Định kích thước cột (Column format);
8. Định vị trí hiển thị giá trị (Align);
9. Định dạng thang đo (Measurement)
44
2. Định biến và nhập dữ liệu trên
SPSS
2.2 Nhập dữ liệu trên SPSS
Dữ liệu được nhập từ màn hình quản lý dữ liệu (Data
view). Màn hình này thể hiện ra một ma trận dữ liệu
gồm: Cột; hàng; và ô. Với các cột lần lượt tương ứng
với các biến, các dòng tương ứng với mỗi phần tử. Ta
cũng có thể nhập dữ liệu từ các phần mềm khác như
Excel, Fox sau đó chuyển vào SPSS bằng lệnh Copy.

45
3. Các phép biến đổi và thao tác
trên tập dữ liệu
Có 5 phép biến đổi trên tập dữ liệu
thường sử dụng là:
Làm sạch
Mã hoá
Và tóm tắt
lại dữ liệu
Hợp nhất
tập dữ Đánh giá độ
liệu tin cậy của
thang đo
Tách tập
dữ liệu
3.1 Mã hoá lại
Mã hoá lại (Recode) là công cụ biến đổi các giá
trị (đã mã hoá) thành các mã hoá mới phù hợp
với đòi hỏi của việc phân tích dữ liệu. SPSS
cung cấp cho ta 2 loại mã hoá lại là:

1- Mã hoá lại 2- Mã hoá


trên cùng 1 biến vào biến khác
(Recode into difference
(Recode into same variable)
Variable)

47
3.1 Mã hoá lại
Mã hoá lại trên cùng một biến thì các giá trị được
mã hoá lại sẽ thay thế cho các giá trị cũ (các giá trị này sẽ
mất đi), cần chú ý rằng các giá trị vừa được mã hoá lại
chưa có nhãn, do đó sau khi recode ta phải khi báo lại
nhãn cho giá trị. Qui trình này được thực hiện qua các
bước sau:
 Transform/ Recode/ Recode into same variables ta sẽ có hộp
thoại (7.4);
 Chọn và chuyển các biến cần mã hoá lại sang hộp thoại variables,
nhấn Old and new value để chuyển các giá trị cũ thành các giá trị
mới. Old value dùng để khai báo các giá trị cũ cần chuyển đổi, New
value dùng để khai báo giá trị mới sẽ thay thế cho giá trị cũ. Add để
48
3.1 Mã hoá lại
Mã hoá lại vào biến khác thì các giá trị hiện tại
của một biến trở thành giá trị mới trong một biến khác.
Qui trình này thực hiện như sau:
 Transform/ Recode into different variables ta sẽ có
hộp thoại (7.7);
 Chọn và chuyển các biến cần mã hoá lại vào hộp thoại
variables, khai báo tên biến mới và nhãn biến mới trong
hộp thoại Output variable. Nhấn Change để xác nhận
khai báo này.

49
3.2 Làm sạch và tóm tắt dữ liệu với
SPSS
Để làm sạch dữ liệu với SPSS ta chỉ cần thực hiện
tính tần số với thao tác đơn giản:
 Analyze/ Descriptive statistics/ Frequencies. Ta có
hộp thoại tóm tắt tần số, ta cần chọn và đưa các biến
cần tính vào ô variables. Nhấn OK ta sẽ có bảng tóm tắt
tần số. Các bạn chú ý phần Missing (lỗi) nếu có thì phải
hiệu chỉnh lại dữ liệu nhé.
 Để tóm tắt thống kê dữ liệu trên SPSS như: (1) Min;
(2) Max; (3) Mean; (4) Phương sai chỉ cần thao tác.
Tại hộp thoại tóm tắt tần số ta chọn Statistics rồi
chọn ô cần thiết rồi Continue/ OK bạn sẽ có kết quả
ngay lập tức.

50
3.3 Đánh giá độ tin cậy của thang đo bằng
Cronbach Alpha trên SPSS
Khi thực hiện các nghiên cứu định lượng, người nghiên
cứu phải sử dụng nhiều thang đo lường khác nhau. Hiện
tượng kinh tế - xã hội vốn rất phức tạp nên việc lượng hoá
các khái niệm nghiên cứu đòi hỏi phải có sự kiểm tra độ tin
cậy của các thang đo trước khi sử dụng. Phần này chúng ta sẽ
thực hành kiểm tra độ tin cậy của thang đo bằng công cụ
Cronbach Alpha trên SPSS.
Thí dụ: Giả sử rằng “Các yếu tố tác động đến quyết định lựa
chọn (mua) mì ăn liền nhãn hiệu “Hảo Hảo” của khách hàng
trên thị trường TP.HCM” là:
(a1) Chất lượng SP;
(a2) Khẩu vị phù hợp;
(a3) Định lượng vừa đủ;
(a4) Dễ dàng mua;
(a5) Bao bì hấp dẫn.
51
3.3 Đánh giá độ tin cậy của thang đo bằng
Cronbach Alpha trên SPSS

Người nghiên cứu quan tâm và muốn đo lường


xem trong 5 nhân tố nêu trện thì mức độ tác động của các
yếu tố nào là mạnh hơn đến quyết định lựa chọn sản
phẩm.
Muốn vậy, ta phải xây dựng các câu hỏi và thang
đo có độ tin cậy về khái niệm “ Các yếu tố tác động đến
quyết định lựa chọn (mua) mì ăn liền “Hảo Hảo”.
Theo nghiên cứu trước đó thì các yếu tố quyết
định… gồm 5 khiá cạnh. Chúng ta sẽ xem xét tính toán
Cronbach Alpha đối với các mục hỏi của từng khiá cạnh.
Câu hỏi liên quan đến đo lường mức độ tác động của các
yếu tố … như sau:

52
3.3 Đánh giá độ tin cậy của thang đo bằng
Cronbach Alpha trên SPSS
Xin bạn vui lòng trả lời bằng cách khoanh tròn vào một con
số ở từng dòng. Những con số này thể hiện mức độ bạn đồng ý hay
không đồng ý đối với các phát biểu theo qui ước sau:
Rất không đồng ý Không đồng ý Trung lập Đồng ý Rất đồng
ý
1 2 3 4 5
a1: Chất lượng của mì ăn liền “Hảo Hảo” là yếu tố quyết 1 2 3 4 5
định việc tôi lựa chọn nó:
a2: Khẩu vị phù hợp là yếu tố quyết định việc tôi lựa chọn 1 2 3 4 5
mì ăn liền “Hảo Hảo”
a3: Mì ăn liền “Hảo Hảo” có định lượng vừa dủ là yếu tố 1 2 3 4 5
quyết định việc tôi lựa chọn nó.
a4: Việc tôi cá thể mua mì ăn liền “Hảo Hảo” một cách 1 2 3 4 5
dễ dàng, ở mọi nơi là yếu tố quyết định việc tôi lựa chọn
nó.
a5: Bao bì của mì ăn liền “Hảo Hảo” rất hấp dẫn là yếu 1 2 3 4 5
53
3.3 Đánh giá độ tin cậy của thang đo bằng
Cronbach Alpha trên SPSS
Vấn đề ở đây là đây có phải là một thang đo tốt
cho một khía cạnh khái niệm mà ta quan tâm hay không?
Để trả lời câu hỏi này ta sẽ tính toán đại lượng Cronbach

54
3.3 Đánh giá độ tin cậy của thang đo bằng
Cronbach Alpha trên SPSS
Với kết quả Alpha từ :
 >0.8 -> Là thang đo tốt;
 0.7- 0.8 -> Là thang đo sử dụng được;
 0.6 – 0.7 -> Là thang đo sử dụng được đối với
những khái niệm mới, hoặc cho SV mới bắt đầu học
nghiên cứu;
 < 0.6 -> Là thang đo không đảm bảo độ tin cậy,
không sử dụng được và bạn phải sửa chữa bảng câu hỏi.
Chú ý cột Alpha if item deleted nếu có tồn tại giá
trị lớn hơn Alpha thì hãy loại bỏ đi mục hỏi đó (mức độ
tác động đến quyết định … của yếu tố đó là thấp/ không 55
3.4 Tách tập dữ liệu (Split file)

Công cụ Split file cho phép tách dữ liệu trong


tập dữ liệu đang quan sát thành những nhóm nhỏ riêng
biệt. Sau khi thực hiện lệnh này các phân tích xử lý thống
kê sẽ cho kết quả riêng biệt theo từng nhóm được tách ra
này.
Data/ Split file ta có hộp thoại. Ta chọn Group based
on list và chọn các biến để phân tách dữ liệu, và OK.

56
3.5 Hợp nhất các tập dữ liệu (Merge files)

SPSS cho phép ta hợp nhất các dữ liệu/ biến


quan sát từ trong một tập dữ liệu vào tập dữ liệu đang sử
dụng. Cả hai tạo ra một tập dữ liệu/ biến mới chứa đựng
tất cả các quan sát từ 2 tập dữ liệu.
 Add Cases/ hay Add Variables và OK.

57
C. Hướng dẫn tiểu luận môn học

Sau khi hoàn chỉnh Bảng câu hỏi, và điều tra

58
XIN CẢM ƠN CÁC BẠN!

59

You might also like