Bộ đề 1

Câu 1

Trong phân tích marketing, bạn muốn xác định khách hàng nào có khả năng rời bỏ (churn) cao nhất. Bạn nên sử dụng mô hình nào?

Câu 2

Trong lĩnh vực marketing, kỹ thuật phân cụm (clustering) khách hàng thường được sử dụng để làm gì?

Câu 3

Trong phân tích rủi ro hoạt động của một ngân hàng, khoa học dữ liệu có thể giúp phát hiện điều gì?

Câu 4

Trong lĩnh vực chuỗi cung ứng, khoa học dữ liệu có thể được ứng dụng để giải quyết bài toán nào sau đây?

Câu 5

Trong phân tích rủi ro tín dụng, mô hình nào sau đây thường được sử dụng để dự đoán khả năng một khách hàng sẽ vỡ nợ?

Câu 6

Trong tài chính, mô hình định giá tài sản vốn (Capital Asset Pricing Model - CAPM) được sử dụng để làm gì?

Câu 7

Trong khoa học dữ liệu, thuật ngữ 'bias-variance tradeoff' đề cập đến điều gì?

Câu 8

Trong phân tích dữ liệu bán hàng, bạn muốn xác định mối quan hệ giữa các sản phẩm được mua cùng nhau. Bạn nên sử dụng kỹ thuật nào?

Câu 9

Trong khoa học dữ liệu, kỹ thuật nào sau đây thường được sử dụng để xử lý dữ liệu văn bản (text data) trước khi đưa vào mô hình học máy?

Câu 10

Trong quản lý rủi ro tài chính, mô hình nào sau đây thường được sử dụng để ước tính giá trị có thể mất (Value at Risk - VaR)?

Câu 11

Trong phân tích dữ liệu lớn (big data) kinh tế, kỹ thuật MapReduce thường được sử dụng để làm gì?

Câu 12

Trong khoa học dữ liệu, ROC curve và AUC được sử dụng để đánh giá điều gì?

Câu 13

Trong phân tích chuỗi cung ứng, khoa học dữ liệu có thể giúp dự đoán điều gì để giảm thiểu rủi ro?

Câu 14

Trong khoa học dữ liệu, thuật ngữ 'overfitting' đề cập đến tình trạng gì?

Câu 15

Khi xây dựng mô hình dự đoán giá nhà, bạn nhận thấy rằng các biến độc lập có tương quan cao với nhau. Vấn đề này được gọi là gì và có thể ảnh hưởng đến mô hình như thế nào?

Câu 16

Trong khoa học dữ liệu, phương pháp nào sau đây giúp giảm thiểu tác động của outliers (giá trị ngoại lệ) trong dữ liệu?

Câu 17

Trong phân tích sentiment (sentiment analysis) trên mạng xã hội để đánh giá phản hồi của khách hàng về một sản phẩm, kỹ thuật nào sau đây thường được sử dụng?

Câu 18

Trong quản lý chuỗi cung ứng, khoa học dữ liệu có thể giúp tối ưu hóa điều gì để giảm chi phí vận chuyển?

Câu 19

Trong marketing, phân tích cohort (cohort analysis) được sử dụng để làm gì?

Câu 20

Trong kinh tế và kinh doanh, thuật ngữ 'feature engineering' trong khoa học dữ liệu đề cập đến điều gì?

Câu 21

Trong lĩnh vực bảo hiểm, mô hình nào sau đây thường được sử dụng để dự đoán số lượng yêu cầu bồi thường (claims) trong một khoảng thời gian nhất định?

Câu 22

Trong kinh tế lượng, phương pháp bình phương tối thiểu (Ordinary Least Squares - OLS) được sử dụng để làm gì?

Câu 23

Trong phân tích dữ liệu, imputation là gì và khi nào nó được sử dụng?

Câu 24

Trong phân tích chuỗi thời gian (time series analysis) kinh tế, thành phần nào sau đây thể hiện xu hướng dài hạn của dữ liệu?

Câu 25

Trong khoa học dữ liệu, khi nào thì bạn nên sử dụng một mô hình non-parametric thay vì parametric?

Câu 26

Phương pháp nào sau đây thường được sử dụng để giảm số chiều dữ liệu (dimensionality reduction) trong khoa học dữ liệu kinh tế, nhằm đơn giản hóa mô hình và tránh overfitting?

Câu 27

Trong lĩnh vực nguồn nhân lực, khoa học dữ liệu có thể được sử dụng để dự đoán điều gì?

Câu 28

Trong kinh doanh, chỉ số RFM (Recency, Frequency, Monetary) thường được sử dụng để làm gì?

Câu 29

Trong khoa học dữ liệu, cross-validation là gì và tại sao nó quan trọng?

Câu 30

Trong lĩnh vực bán lẻ, thuật toán Apriori thường được sử dụng để làm gì?