« Home « Kết quả tìm kiếm

ÔN TẬP KHOA HỌC DỮ LIỆU


Tóm tắt Xem thử

- Internet vạn vật khiến cho lượng dữ liệu được thu thập tăng cao.
- AI sử dụng kết quả từ khoa học dữ liệu để có thể thông minh hơn, chính xác hơn.
- Bigdata là công nghệ lưu trữ và khai thác dữ liệu có dung lượng lớn (volume), đa dạng (variety), yêu cầu tốc độ cao (velocity) và có tính xác thực (Veracity).
- Data mining là một phương pháp phân tích dữ liệu của khoa học dữ liệu.
- Kết quả mà khoa học dữ liệu hướng đến là: a.
- Dữ liệu b.
- Công cụ thống kê mô tả nào được sử dụng khi cần tổng hợp dữ liệu đa chiều a.
- Công cụ thống kê mô tả nào có thể sử dụng trong trường hợp dữ liệu 2 chiều: a.
- Để hợp nhất dữ liệu từ nhiều bảng không cùng cấu trúc khác nhau ta sử dụng: a.
- Để tính chỉ số EMA của chứng khoán người ta sử dụng phương pháp nào sau đây: a.
- Ta sử dụng công cụ nào sau đây: a.
- Lựa chọn nào sau đây không phải là một bước trong quy trình khai thác dữ liệu: a.
- Thuộc tính “Loại khách hàng” có hai giá trị: “VIP”, “Premium” và “Economic” là thuộc tính thuộc kiểu dữ liệu nào sau đây: a.
- Tiền xử lý dữ liệu không bao gồm các bước nào sau đây: a.
- Làm sạch dữ liệu b.
- Chuyển đổi dữ liệu c.
- Thu thập dữ liệu d.
- Rút gọn dữ liệu 4.
- Có mấy cách dùng để xử lý khi dữ liệu bị thiếu: a.
- Khi nào thì ta cần rời rạc hóa dữ liệu: a.
- Dữ liệu bị thiếu b.
- Dữ liệu thuộc kiểu số học c.
- Dữ liệu thuộc kiểu định danh d.
- Dữ liệu thuộc kiểu nhị phân Chương 4 1.
- Phân lớp dữ liệu là thuộc phương pháp: a.
- Phương pháp lai 2.
- Thuật toán phân lớp tham gia vào quá trình nào sau đây trong mô hình phân lớp dữ liệu: a.
- Đánh giá d.
- Thuật toán phân lớp nào sau đây cho phép xử lý trên nhiều kiểu/loại dữ liệu khác nhau: a.
- Trong orange, biến có kiểu dữ liệu categorical là để chỉ các thuộc tính: a.
- Phương pháp chọn mẫu dữ liệu nào sau đây dùng để khắc phục tình trạng over-fitting: a.
- Huấn luyện và kiểm thử trên cùng tập dữ liệu 8.
- Phân cụm dữ liệu là thuộc phương pháp a.
- Phương pháp lai d.
- Một phương pháp phân cụm tốt là phương pháp cho kết quả phân cụm mà trong đó: a.
- Thuật toán nào sau đây cho phép một phần tử có thể thuộc về một hoặc nhiều cụm khác nhau: a.
- Thuật toán phân cụm nào sau đây không cần biết trước số cụm: a.
- Chọn phương pháp tính khoảng cách trước khi chọn thuật toán.
- So sánh kết quả giữa các mô hình để xem xét tính hiệu quả của việc phân cụm thuộc cách đánh giá nào sau đây: a.
- Trong Orange, đối với thuật toán K-mean, tham số đầu vào nào sau đây dùng để kiểm soát trong trường hợp dữ liệu hội tụ chậm hoặc không hội tụ: a