Bộ đề 1

Câu 1

Trong khai phá dữ liệu, phương pháp nào thường được sử dụng để giảm số lượng chiều dữ liệu, đồng thời giữ lại thông tin quan trọng nhất?

Câu 2

Trong khai phá dữ liệu, mục đích của việc sử dụng 'validation set' là gì?

Câu 3

Thuật toán nào sau đây thường được sử dụng để tìm các quy luật kết hợp (association rules) trong dữ liệu giao dịch?

Câu 4

Trong khai phá dữ liệu, 'curse of dimensionality' đề cập đến vấn đề gì?

Câu 5

Đâu là một ví dụ về ứng dụng của khai phá dữ liệu trong lĩnh vực bán lẻ?

Câu 6

Trong khai phá dữ liệu, 'feature engineering' là gì?

Câu 7

Thuật toán nào sau đây thường được sử dụng để phân loại dữ liệu dựa trên khoảng cách đến các điểm dữ liệu lân cận?

Câu 8

Trong ngữ cảnh của khai phá dữ liệu, 'feature selection' là gì?

Câu 9

Trong khai phá dữ liệu, 'outlier' là gì?

Câu 10

Phương pháp nào sau đây thường được sử dụng để xử lý dữ liệu thiếu?

Câu 11

Trong khai phá dữ liệu, 'precision' và 'recall' là gì?

Câu 12

Phương pháp nào sau đây thường được sử dụng để đánh giá mức độ tin cậy của các quy luật kết hợp (association rules)?

Câu 13

Phương pháp nào sau đây được sử dụng để tìm các nhóm đối tượng tương tự nhau trong một tập dữ liệu?

Câu 14

Thuật toán nào thường được sử dụng để xây dựng mô hình dự đoán dựa trên một tập hợp các luật 'if-then'?

Câu 15

Phương pháp nào sau đây thường được sử dụng để chuẩn hóa dữ liệu?

Câu 16

Đâu là một ví dụ về ứng dụng của khai phá dữ liệu trong lĩnh vực y tế?

Câu 17

Đâu là một phương pháp đánh giá hiệu quả mô hình phân loại?

Câu 18

Khi triển khai một mô hình khai phá dữ liệu vào thực tế, yếu tố nào sau đây là quan trọng nhất để đảm bảo thành công?

Câu 19

Phương pháp nào sau đây thường được sử dụng để đánh giá sự tương quan giữa hai biến số?

Câu 20

Trong khai phá dữ liệu, mục đích chính của việc tiền xử lý dữ liệu là gì?

Câu 21

Trong khai phá dữ liệu, 'overfitting' xảy ra khi nào?

Câu 22

Trong khai phá dữ liệu, kỹ thuật nào thường được sử dụng để giảm nhiễu trong dữ liệu?

Câu 23

Trong khai phá dữ liệu, 'data mining' khác với 'data analysis' như thế nào?

Câu 24

Trong khai phá dữ liệu, 'cross-validation' là gì?

Câu 25

Trong quá trình xây dựng mô hình, khi nào thì cần sử dụng kỹ thuật 'regularization'?

Câu 26

Đâu là một ví dụ về ứng dụng của khai phá dữ liệu trong lĩnh vực tài chính?

Câu 27

Thuật toán nào sau đây thường được sử dụng để dự đoán giá trị liên tục?

Câu 28

Trong khai phá dữ liệu, 'ensemble learning' là gì?

Câu 29

Trong khai phá dữ liệu, 'bias-variance tradeoff' đề cập đến điều gì?

Câu 30

Trong khai phá dữ liệu, 'ROC curve' được sử dụng để làm gì?