You are on page 1of 14

Câu 1 Dữ liệu là gì Ví dụ??

Dữ liệu là các sự kiện, đồ họa, hình ảnh, văn bản, đoạn phim, video có ý
nghĩa trong môi trường của người dùng
(​Dữ liệu là thông tin dưới dạng văn bản, hình ảnh, âm thanh hoặc dạng tương tự.)
ví dụ: (sách thầy viết)
chẳng hạn như trong cơ sở dữ liệu về các cuốn sách, dữ liệu bao gồm các sự kiện như tên sách,
năm xuất bản, nhà xuất bản.
hay trong csdl về số điện thoại dữ liệu là tên người quen, số điện thoại và địa chỉ của họ

Câu 2 Thông tin là gì? Ví dụ


Vở thầy:
thông tin là 1 dữ liệu tinh chế đã được tinh lọc
Sách thầy:
Thông tin là dữ liệu được xử lý theo các cách để làm tăng hiểu biết của
người đang sử dụng dữ liệu này

Ví dụ: Trong thực tế , các cơ sở dữ liệu lưu trữ cả dữ liệu lẫn thông tin .
Chẳng hạn, CSDL chứa bảng dữ liệu về số lượng các cuốn sách và cả đồ thị
so sánh về số lượng giữa các chủ đề

Câu 3 Hệ thống thông tin là gì


- Hệ thống thông tin là một hệ thống bao gồm các yếu tố có quan hệ với nhau
cùng làm nhiệm vụ thu thập, xử lý , lưu trữ và phân phối thông tin và dữ liệu,
cung cấp 1 cơ chế phản hồi để đạt được 1 mục tiêu định trước
- Hệ thống là tập hợp các phần tử có quan hệ hữu cơ với nhau , tác động ,
chi phối lẫn nhau theo các quy luật nhất định để trở thành 1 chỉnh thể
( vở thầy cho ghi: hệ thống gồm các thành phần có đầu vào đầu ra và phần
xử lý với đầu vào đầu ra là thông tin)
(hệ thống I/O là gồm những thiết bị phần cứng giao tiếp với một máy tính. ví
dụ: bàn phím, chuột,...)
- I/O:thông tin vào , thông tin ra trong 1 hệ thống

Câu 4 Cơ sở dữ liệu là gì?


Cơ sở dữ liệu là tập hợp có tổ chức các dữ liệu có liên quan đến nhau về mặt
logic
Truy cập trực tiếp là:

Câu 5 Hệ quản trị file/tệp?


(1958-1960)
Hệ quản trị tệp là hệ thống truy cập tệp nhờ ngôn ngữ lập trình.
Ngôn ngữ lập trình: Tệp các câu lệnh , danh từ , động từ điều khiển máy
Tệp là đơn vị dữ liệu , có tên duy nhất
(ngôn ngữ lập trình là một tập con của ngôn ngữ máy tính, dùng để giao tiếp
giữa lập trình viên và máy tính để tạo ra các chương trình máy nhằm mục
đích điều khiển máy tính hoặc mô tả các thuật toán để người khác đọc hiểu.)
(trong vở:
hệ quản trị tệp là hệ thống dùng ngôn ngữ lập trình cấp cao trong truy cập
dữ liệu
FORTRAN (Formula Translator) ngôn ngữ xử lý bài toán KHKT 1958
COBOL (Common Business Oriented Language) ngôn ngữ cho bộ phận
quản trị kinh doanh)

Lý do không là DBMS :vì không đáp ứng đủ yêu cầu của DBMS : vi phạm
nguyên tắc độc lập vật lý.
(những ý buổi cuối thầy đọc t chép lại nhưng chép không đủ:
độc lập vật lý, độc lập logic, ngôn ngữ hỏi, không dư thừa, có toàn vẹn, có
tăng tốc, có an toàn, chia sẻ dữ liệu, có tối ưu, có admin,.)
)
Câu 6 Đối tượng của quản trị tệp
Xí nghiệp
Ngôn ngữ chủ
Bộ nhớ
+ Bộ nhớ là : nơi lưu trữ dữ liệu
- Tệp
- Disk stack : chồng đĩa có nhiều đầu từ, chung trục
- Loại: USB, đĩa quang
+ Bộ nhớ ổn định : là bộ nhớ dài hạn, xác định thời gian bộ nhớ có
thể tồn tại nếu không được truy xuất

Câu 7 Hệ thống cơ sở dữ liệu là gì


Là hệ thống thông tin , cho phép người dùng dùng chung các dữ liệu có trong
hệ thống
Người dùng ←→ Giao diện ←→ DBMS ←→ CSDL.

Câu 8 DBMS
DBMS là phần mềm cho phép mô tả lưu trữ, cập nhật xử lý dữ liệu 1 cách
khoa học
10 tính chất:
- độc lập vật lý
- độc lập logic
- không dư thừa dữ liệu vì dư thừa = mất thông tin.
áp dụng các dạng chuẩn 1NF, 2NF,...
- có quan hệ phi thủ tục (SQL, QBE, QUEL,...)
- áp dụng dữ liệu
- người quản trị
- an toàn dữ liệu
- toàn vẹn dữ liệu
- bộ nhớ tương đối (truy cập nhanh)
- tối ưu câu truy vấn.

Câu 9 Mô hình dữ liệu là -tập mô tả, quy luật mô tả (Thầy)


Thầy: là tập các mô tả và quy tắc mô tả tập dữ liệu
Các nguồn trên google
Mô hình dữ liệu là một tập khái niệm dùng để mô tả cấu trúc dữ liệu, các thao tác dữ liệu, các ràng
buộc dữ liệu của một CSDL.
Theo các mức mô tả chi tiết về CSDL, có thể phân chia các mô hình dữ liệu thành hai loại:
● Mô hình logic (còn gọi là mô hình dữ liệu bậc cao) cho mô tả CSDL ở mức khái niệm và mức
khung nhìn, mô tả bản chất logic của dữ liệu được lưu trữ;
● Mô hình vật lí (còn gọi là mô hình dữ liệu bậc thấp) cho mô tả CSDL ở mức vật lí, trả lời cho
câu hỏi "Dữ liệu được lưu trữ như thế nào?".

Câu 10 Lược đồ dữ liệu, giống mô tả (Nhưng cho tập dữ liệu cụ thể) -


Thầy
Trong vở:

lược đồ dữ liệu là tập mô tả các dữ liệu cụ thể


thế giới thực -> lược đồ ngoài -> lược đồ khái niệm / logic -> lược đồ trong
có nhiều lược đồ ngoài nhưng 1 lược đồ khái niệm
Google:
Lược đồ cơ sở dữ liệu (Database Schema): là biểu diễn của cơ sở dữ liệu, bao gồm cấu trúc cơ
sở dữ liệu và những ràng buộc trên dữ liệu.
ràng buộc dữ liệu là luật định mà người dùng trong csdl không được vi phạm
Câu 11 Liệt kê mô hình dữ liệu(sách thầy trang 33-39 viết chi tiết đoạn
này nên đọc)
Thầy :

- 1960 (DBMS điều hướng )


+ Mô hình phân cấp.
đại diện: CSDL IMS(Information Management System​) của công ty IBM .
Ngôn ngữ hỏi dữ liệu: DL/1 query language.
+​ Mô hình mạng.
đại diện CSDL CODASYL(Conference/Committee on Data Systems Languages​) của
nhóm DBTG (​ ​DataBase Task Group​).
Ngôn ngữ hỏi: Cobol/ CODASYL

-> tạo ra DBMS thế hệ 1


( DBMS database management system là phần mềm cho phép mô tả lưu trữ xử lí dữ liệu 1
cách khoa học)

- 1970( DBMS quan hệ) có 10 mô hình quan hệ


đại diện SYSTEM/R , IBM (do E.F. CODD)
ngôn ngữ hỏi : 3 lớp ngôn ngữ
+ Relational Algebra (Đại số quan hệ)
+ Tuple Relational Calculus(Phép toán quan hệ trên bộ khoảng 1980)
+ Domain Relational Calculus(Phép toán quan hệ trên miền 1972)
Đại số quan hệ là phép đại số trên các quan hệ
quan hệ là tập con của tích đề các
-> mô hình quan hệ tạo nên DBMS thế hệ 2( máy tính đã qua 5 thế hê
1.bóng đèn điện tử
2. bóng đèn bóng dẫn
3. bóng đèn IC
4. Mạng tích hợp cỡ lớn + ngôn ngữ lập trình
5. máy CSDL + AI (1980)
)

- sau 1980​: các CSDL tiên tiến hiện đại phù hợp nhu cầu
+ mạng máy tính: CSDL phân tán
+ đối tượng: CSDL hướng đối tượng
+ lũy tiến: CSDL suy diễn( trí tuệ)
(ngôn ngữ hỏi là ngôn ngữ mà người dùng yêu cầu thông tin từ csdl/ là ngôn ngữ cho phép đặt
câu hỏi tìm kiếm xử lý dữ liệu như 1 cái máy)

Câu 12 CSDL tiên tiến (nâng cao)


Thầy :
tại sao sinh ra???
+ nhu cầu mạng máy tính: CSDL phân tán
+ nhu cầu hướng đối tượng: CSDL hướng đối tượng
+ nhu cầu tri thức: CSDL suy diễn
Google
-Mô hình dữ liệu hướng đối tượng Là mô hình dữ liệu trong đó các thuộc tính dữ liệu và các
phương thức thao tác trên các thuộc tính đó đều được đóng gói trong các cấu trúc gọi là đối
tượng.Tập dữ liệu được tổ chức theo cấu trúc của mô hình dữ liệu hướng đối tượng gọi là CSDL
hướng đối tượng.Mô hình dữ liệu hướng đối tượng là mô hình của tương lai đang được phát triển
và ngày càng hoàn thiện hơn
- Cơ sở dữ liệu suy diễn là cơ sở dữ liệu có khả năng suy diễn ra một số sự kiện mới từ những
sự kiện được lưu trữ trong CSDL, nó gồm hai thành phần: cơ sở dữ liệu ngoại diên và CSDL nội
hàm (CSDL ngoại diên là một CSDL quan hệ tiêu chuẩn, có lược đồ gồm một tập các lược đồ
quan hệ. CSDL nội hàm được xác định bởi một tập các lược đồ quan hệ và một chương trình
Datalog định nghĩa các quan hệ đó. )
- Một cơ sở dữ liệu phân tán là một cơ sở dữ liệu logic đơn lẻ mà được trải ra về mặt vật lý trên
nhiều máy tính ở nhiều vị trí địa lý khác nhau. Có hai kiểu chung nhất của các hệ cơ sở dữ liệu
phân tán là: hệ cơ sở dữ liệu phân tán thuần nhất và hệ cơ sở dữ liệu phân tán không thuần nhất.
Câu 13 Mô hình ER(Mô hình thực thể quan hệ) sách thầy trang 62-..
Entity Association Relationship
Thầy:
-1970 IBM P.Chen (trong vở thầy cho ghi 1970, trong sách và wiki bảo được xuất bản trong một bài
báo năm 1976.​ )
-ER = EAR

- Người ta dùng mô hình ER để mô hình hóa bài toán sau đó dựa trên đó áp
dụng 1 CSDL cụ thể
-Để thiết kế khái niệm: thế giới thực->đặt bài toán->sử dụng mô hình er ->theo bất kì mô hình đại
diện nào -> cơ sở dữ liệu
nhắc lại thiết kế khái niệm:
+ mô hình ngoài : đặt bài toán -> mô hình khái niệm : Mô hình er ->mô hình trong (logic /vật
lý) :áp dụng CSDL quan hệ
- ER:
+thực thể: là 1 đối tượng để ta nghiên cứu các thuộc tính vd người(hình chữ nhật)
+thuộc tính là cái vốn có của thực thể vd tuổi
+mối quan hệ: cái để liên kết các thực thể(hình thoi)
+ hướng đi mũi tên:

- Các loại quan hệ


+ quan hệ giữa 2 thực thể
+ quan hệ trên 2 thực thể
+ tự liên kết
(Có 9 bước để từ ER -> bảng quan hệ)
Google:

Mô hình thực thể - liên kết dùng trong giai đoạn phân tích phần mềm để xây dựng mô hình CSDL ở mức 
khái niệm 

Câu 14 Mô hình quan hệ


Thầy:
- mô tả :
+ miền :miền giá trị
+ thuộc tính :cái vốn có
+ quan hệ: tập con tích Decac
+ CSDL quan hệ: tập các quan hệ
quan hệ là tập con của tích decac của các miền
miền giá trị của bảng quan hệ là miền xác định các giá trị của thuộc tính trong
bảng quan hệ
Google
Mô hình dữ liệu quan hệ (gọi tắt là mô hình quan hệ) được E. F. Codd đề xuất năm 1970. Trong
khoảng ba mươi năm trở lại đây, các hệ CSDL xây dựng theo mô hình quan hệ được dùng rất phổ
biến.
Trong mô hình quan hệ:
● Về mặt cấu trúc:
○ Dữ liệu được thể hiện trong các bảng.
○ Mỗi bảng bao gồm các hàng​ và c ​ ác cột thể hiện thông tin về một chủ thể.
○ Các cột b ​ iểu thị ​các thuộc tính của chủ thể và tên cột thường là tên của thuộc tính.
○ Mỗi hàng biểu thị cho một cá thể, gồm một bộ các giá trị tương ứng với các cột.
● Về mặt thao tác trên dữ liệu:
○ Có thể cập nhật dữ liệu như thêm, xóa hay sửa bản ghi trong một bảng.
○ Các ​kết quả tìm kiếm thông tin qua truy vấn dữ liệu có được nhờ thực hiện các thao
tác trên dữ liệu.
● Về mặt các ràng buộc dữ liệu: Dữ liệu trong các bảng phải thoả mãn một số ràng buộc. Chẳng
hạn, không được có hai bộ nào trong một bảng giống nhau hoàn toàn.

Câu 15 Quan hệ
Thầy:
Quan hệ là tập con của tích Decac của một hoặc nhiều miền
Có ít nhất là 1 cột, Tối thiểu là 0 dòng, Miền là tập giá trị của thuộc
tính.
Tích decac:
Tích decac của A B là tập các x,y mà x thuộc A và y thuộc B
AxB={x,y} x thuộc A, y thuộc B.
ví dụ :
B = tròn, vuông
C = toto,titi
A= BxC
A=tròn toto, tròn titi, vuông toto, vuông titi
(theo lý thuyết tập)
wiki:
tích Descartes của 2 tập hợp là một phép toán 2 ngôi​ trên các tập hợp.
Ví dụ, nếu: A​ = {1,2} ​B​ = {p,q,r}
thì:
​ ​B​ = {(1,p),(1,q),(1,r),(2,p),(2,q),(2,r)}

Câu 16: Đại số quan hệ ( sách thầy có nói về từng phép từ trang 92)
- ​ Do E.F.Codd đưa ra năm 1970.
- Là phép toán đại số trên các quan hệ.
- Có 5 phép chính (hạn chế, chiếu, nhân, hợp, trừ) + 3 phép dẫn
xuất (nối, giao, chia).
wiki :​ Trước đây, đại số quan hệ ít được quan tâm cho đến khi Edgar F. Codd​ đưa ra ​mô hình
dữ liệu quan hệ(​relational model​) vào năm ​1970​. Từ đó đến nay, đại số quan hệ được xem
là nền tảng cho các ngôn ngữ truy vấn cơ sở dữ liệu.

Câu 17: Phép chiếu


- Định nghĩa: Chiếu (Project) của quan hệ R(A1​​,..,A​n​) trên các thuộc

tính A​i​...A​j​ là quan hệ S(Ai​...A​j​) có các dòng là dòng của R ứng với
(A​i​...A​j​) bỏ đi dòng trùng (do lí thuyết tập cổ điển nên giá trị dòng
không trùng nhau).
- Ví dụ: Có bảng Người(Tên, Tuổi, Địa chỉ)

Tên Tuổi Địa chỉ Người

A 15 HN

B 16 HCM

C 15 ĐN

S= Chiếu tuổi (Người)

Tuổi S

15

16

Câu 18: Phép nhân


- Đ
​ ịnh nghĩa: thường được gọi là tích, tích Đề Các, được thực hiện
trên 2 quan hệ. Thu được tích D của 2 bảng, là bảng có các cột là
gộp của các cột của 2 bảng, các dòng là ghép các dòng của bảng
này với dòng của bảng kia (số lượng cột, dòng tăng kích thước;
cộng cột nhân hàng).
- Ví dụ: Tích của quan hệ R(A1​,…,A​n​) và S(B​1​,…,B​n​) là quan hệ T(A1​,…,A​n​ , B​1​,…,B​n​)
có các dòng là ghép dòng của R với dòng S.
2 cột 3 dòng x 3 cột 3 dòng -> 5 cột 9 dòng

Câu 19: Phép trừ


- Định nghĩa: Phép trừ 2 bảng thực hiện trên 2 bảng có cùng các

thuộc tính (như yêu cầu với phép hợp). Bảng kết quả có cùng các
thuộc tính, nhưng chỉ có những bộ xuất hiện trong bảng thứ nhất,
nhưng không xuất hiện trong bảng thứ 2. Các bộ có mặt trong bảng
2 sẽ bị loại đi.

Mã số Tên Nhân viên 2

3 C

5 B

- Ví dụ: có 2 bảng

Mã số Tên Nhân viên 1

1 A

5 B

S= Nhân viên 1 – Nhân viên 2

Mã số Tên S
1 A

Câu 20: Phép hạn chế(Restriction, select,..)


- ​ Định nghĩa: Hạn chế quan hệ R(A1​,…,A​n​) theo điều kiện Q là quan
hệ S(A1​,…,A​n​) có cùng lược đồ, có các dòng là dòng của R thỏa
mãn điều kiện Q (điều kiện là biểu thức logic, kết hợp của các điều
kiện trên thuộc tính với các phép AND, OR, NOT).
- lấy ra dòng thỏa mãn điều kiện ( làm giảm số dòng)
- điều kiện Q:
+ biểu thức logic: phép toán logic + hạng thức, gồm and / or / tương đương/ phủ định/ kéo
theo
+ tên thuộc tính + (phép so sánh)+ hằng số : so sánh <.>,=,#,>=,<=.

Câu 21 : Phép hợp


- Đ
​ ịnh nghĩa : phép hợp 2 quan hệ có cùng thuộc tính cho kết quả là
bảng quan hệ có cùng số cột thuộc tính, và các dòng là hợp lại của
các dòng của 2 bảng thành phần. Để thực hiện phép hợp, các bảng
tham gia cần có thuộc tính như nhau và các miền giá trị tương thích.
Các bộ có mặt trong nhiều bảng đương nhiên chỉ xuất hiện 1 lần
trong bảng kết quả.
- Ví dụ: Hợp các quan hệ R(A1​,…,A​n​) và S(A​1​,…,A​n​) có cùng lược đồ là T(A1​,…,A​n​) có
các dòng hoặc là dòng của R hoặc là dòng của S.
Câu 22: An toàn dữ liệu(gợi ý của thầy:bí mật, sẵn sàng)
Sách thầy trang 255:

- An toàn csdl là việc bảo vệ các dữ liệu chống lại các rủi ro, mất mát, phá
hủy hay sử dụng không hợp lệ.
- An toàn dữ liệu thuộc về 2 mức
+ an toàn đối với các lỗi nghiêm trọng
+ an toàn chống lại truy cập bất hợp pháp
- Tất cả những quyền trên đối tượng cần được đặt dưới sự điều khiển
của người quản trị cơ sở dữ liệu
- Các quy luật về quyền truy cập là các điều khiển gắn trong hệ thống
quản trị cơ sở dữ liệu nhằm hạn chế truy cập dữ liệu, cũng như hạn
chế các hành động trên dữ liệu một khi dữ liệu bị truy cập
- hệ thống phục vụ người dùng được chia thành
+ hệ thống đóng: chỉ cho phép người có quyền truy cập
+ hệ thống mở: chỉ cấm những người không được phép truy cập
- mật mã là việc mã hóa hay đổi dạng dữ liệu để con người không thể
đọc dữ liệu này
- nguyên nhân mất an toàn dữ liệu : máy, con người , thiên nhiên,
Google

Tam giác C.I.A. : tính bảo mật, tính toàn vẹn, tính sẵn sàng (Confidentiality, Integrity, Availiability)
Chính sách an toàn phải cân đối dựa theo tam giác C.I.A
Tính bảo mật (Confidentiality): bảo vệ dữ liệu không bị lộ ra ngoài một cách trái phép. Ví dụ: Trong hệ
thống ngân hàng, một khách hàng được phép xem thông tin số dư tài khoản của mình nhưng không được
phép xem thông tin của khách hàng khác.
Tính toàn vẹn (Integrity): Chỉ những người dùng được ủy quyền mới được phép chỉnh sửa dữ liệu. Ví dụ:
Trong hệ thống ngân hàng, không cho phép khách hàng tự thay đối thông tin số dư của tài khoản của mình.
Tính sẵn sàng (Availability): Đảm bảo dữ liệu luôn sẵn sàng khi những người dùng hoặc ứng dụng được ủy
quyền yêu cầu. Ví dụ: Trong hệ thống ngân hàng, cần đảm bảo rằng khách hàng có thể truy vấn thông tin số
dư tài khoản bất kỳ lúc nào theo như quy định.

(Tính chống thoái thác (Non-repudiation): Khả năng ngăn chặn việc từ chối một hành vi đã làm. Ví dụ:
Trong hệ thống ngân hàng, có khả năng cung cấp bằng chứng để chứng minh một hành vi khách hàng đã
làm, như rút tiền, chuyển tiền)-- 1 số tài liệu tính cả cái này

Câu 22 + 23 :
(thầy cho ghi) an toàn dữ liệu là đảm bảo dữ liệu được bí mật và sẵn sàng
phục vụ người dùng.
vi phạm an toàn dữ liệu là hành động làm mất an toàn cơ sở dữ liệu.
nguy cơ mất an toàn dữ liệu:
- do thiên tai
- hệ thống: + phần cứng: HDD, CPU,..
+ phần mềm: OS, DBMS….
- con người: + vô tình thấy
+ cố tình
+ không theo truy trình truy cập cơ sở dữ liệu. (vidu: select * from
tenbang)
Câu 24+25 Hệ thống mở , hệ thống đóng
- Quyền truy cập ở đây được phân ra thành quyền đọc, ghi, thay đổi đối
tượng cơ sở dữ liệu
- hệ thống đóng: cho phép người dùng truy cập có quyền truy cập (vidu:
thư viện quân đội,...)
- hệ thống mở: là hệ thống cấm người không được phép (vidu: thư viện
nhân dân,...)
cấp quyền sử dụng cơ sở dữ liệu:
+ có tổ chức cấp quyền (admin)
+ mật khẩu người dùng.
+ ghi lại pass ở file log
+ quản trị quyền
+ hệ thống cần có cơ chế andit cho phép kiểm tra lại công tác an toàn dữ
liệu trong hệ thống.
Câu 26 Tổ chức tệp
tổ chức bộ nhớ là cách sắp xếp các bản ghi trong tệp: tệp -> bản ghi-> data item
(bản ghi: thông tin đầy đủ về đối tượng)
dưới bản ghi -> mục ghi -> data -> byte -> bit
Câu 27 Tổ chức tuần tự
Để đếm được bản ghi i cần duyệt qua i-1 bản ghi trước đó
Câu 28 Vẽ sơ đồ khối tìm bản ghi X trong tệp tuần tự
bài thầy chữa 1 lần

Câu 29 Tổ chức kiểu index dữ liệu ->


dùng index để tìm kiếm nhanh
bảng index nhỏ hơn bảng dữ liệu

Câu 30 Sơ đồ khối tìm x trong tệp đã index


Câu 31 tổ chức tệp theo hàm địa chỉ
là phương pháp tổ chức dùng 1 hàm cho biến địa chỉ của bản ghi theo giá trị khóa
(key) giá trị đại diện cho bản ghi.
hàm địa chỉ f(k) -> hàm băm h(k)
giả sử:
h(k)=k mod 7 ->7 chỗ
lưu trữ : toto h(k)=16%7=2 -> số 2; titi h(k)=30%7=2 -> xung đột
có 4 giải pháp giải quyết xung đột trong đó có giải pháp nhét xuống dưới
Câu 32 Tìm bản ghi x trong tệp tổ chức ngẫu nhiên theo hàm địa chỉ

You might also like