150+ câu trắc nghiệm Khoa học dữ liệu trong kinh tế và kinh doanh có đáp án

Câu 1

Trong phân tích marketing, bạn muốn xác định khách hàng nào có khả năng rời bỏ (churn) cao nhất. Bạn nên sử dụng mô hình nào?

A. Mô hình phân cụm.
B. Mô hình hồi quy tuyến tính.
C. Mô hình phân loại (ví dụ: Logistic Regression, Random Forest).
D. Mô hình chuỗi thời gian.

Câu 2

Trong lĩnh vực marketing, kỹ thuật phân cụm (clustering) khách hàng thường được sử dụng để làm gì?

A. Dự đoán doanh thu bán hàng.
B. Phân loại khách hàng thành các nhóm có đặc điểm tương đồng.
C. Đánh giá hiệu quả của chiến dịch quảng cáo.
D. Xác định mối quan hệ nhân quả giữa các biến marketing.

Câu 3

Trong phân tích rủi ro hoạt động của một ngân hàng, khoa học dữ liệu có thể giúp phát hiện điều gì?

A. Sở thích âm nhạc của khách hàng.
B. Các giao dịch gian lận hoặc bất thường.
C. Xu hướng thời trang của nhân viên.
D. Địa điểm ăn trưa yêu thích của nhân viên.

Câu 4

Trong lĩnh vực chuỗi cung ứng, khoa học dữ liệu có thể được ứng dụng để giải quyết bài toán nào sau đây?

A. Tuyển dụng nhân viên mới.
B. Dự báo nhu cầu và tối ưu hóa lượng hàng tồn kho.
C. Thiết kế logo sản phẩm.
D. Xây dựng mối quan hệ với khách hàng.

Câu 5

Trong phân tích rủi ro tín dụng, mô hình nào sau đây thường được sử dụng để dự đoán khả năng một khách hàng sẽ vỡ nợ?

A. Mô hình ARIMA.
B. Mô hình Logistic Regression.
C. Mô hình K-means.
D. Mô hình Apriori.

Câu 6

Trong tài chính, mô hình định giá tài sản vốn (Capital Asset Pricing Model - CAPM) được sử dụng để làm gì?

A. Dự đoán lãi suất.
B. Đánh giá rủi ro tín dụng.
C. Ước tính lợi nhuận kỳ vọng của một tài sản dựa trên rủi ro hệ thống của nó.
D. Phân tích xu hướng thị trường chứng khoán.

Câu 7

Trong khoa học dữ liệu, thuật ngữ 'bias-variance tradeoff' đề cập đến điều gì?

A. Sự đánh đổi giữa chi phí và lợi nhuận trong việc thu thập dữ liệu.
B. Sự đánh đổi giữa độ chính xác và tốc độ của thuật toán.
C. Sự đánh đổi giữa việc mô hình quá khớp (overfitting) và mô hình quá đơn giản (underfitting).
D. Sự đánh đổi giữa việc sử dụng dữ liệu có cấu trúc và dữ liệu phi cấu trúc.

Câu 8

Trong phân tích dữ liệu bán hàng, bạn muốn xác định mối quan hệ giữa các sản phẩm được mua cùng nhau. Bạn nên sử dụng kỹ thuật nào?

A. Phân tích hồi quy.
B. Phân tích cụm.
C. Phân tích kết hợp (Association rule mining).
D. Phân tích chuỗi thời gian.

Câu 9

Trong khoa học dữ liệu, kỹ thuật nào sau đây thường được sử dụng để xử lý dữ liệu văn bản (text data) trước khi đưa vào mô hình học máy?

A. Chuẩn hóa (Normalization).
B. Mã hóa one-hot (One-hot encoding).
C. Stemming và Lemmatization.
D. Scaling.

Câu 10

Trong quản lý rủi ro tài chính, mô hình nào sau đây thường được sử dụng để ước tính giá trị có thể mất (Value at Risk - VaR)?

A. Mô hình hồi quy tuyến tính.
B. Mô hình cây quyết định.
C. Mô hình Monte Carlo.
D. Mô hình mạng nơ-ron.

Câu 11

Trong phân tích dữ liệu lớn (big data) kinh tế, kỹ thuật MapReduce thường được sử dụng để làm gì?

A. Trực quan hóa dữ liệu.
B. Làm sạch dữ liệu.
C. Xử lý song song và phân tán dữ liệu trên nhiều máy tính.
D. Xây dựng mô hình học máy.

Câu 12

Trong khoa học dữ liệu, ROC curve và AUC được sử dụng để đánh giá điều gì?

A. Hiệu suất của mô hình hồi quy.
B. Hiệu suất của mô hình phân loại.
C. Hiệu suất của mô hình phân cụm.
D. Hiệu suất của mô hình giảm chiều.

Câu 13

Trong phân tích chuỗi cung ứng, khoa học dữ liệu có thể giúp dự đoán điều gì để giảm thiểu rủi ro?

A. Sở thích cá nhân của nhân viên.
B. Sự thay đổi của tỷ giá hối đoái.
C. Sự gián đoạn trong chuỗi cung ứng do thiên tai hoặc các sự kiện bất ngờ.
D. Màu sắc ưa thích của khách hàng.

Câu 14

Trong khoa học dữ liệu, thuật ngữ 'overfitting' đề cập đến tình trạng gì?

A. Mô hình quá đơn giản và không thể nắm bắt được các mối quan hệ phức tạp trong dữ liệu.
B. Mô hình quá phức tạp và học thuộc lòng dữ liệu huấn luyện, dẫn đến hiệu suất kém trên dữ liệu mới.
C. Dữ liệu bị thiếu hoặc chứa các giá trị ngoại lệ.
D. Mô hình không hội tụ được trong quá trình huấn luyện.

Câu 15

Khi xây dựng mô hình dự đoán giá nhà, bạn nhận thấy rằng các biến độc lập có tương quan cao với nhau. Vấn đề này được gọi là gì và có thể ảnh hưởng đến mô hình như thế nào?

A. Heteroscedasticity, làm cho mô hình trở nên không ổn định.
B. Autocorrelation, làm cho mô hình dự đoán sai lệch.
C. Multicollinearity, làm cho các hệ số hồi quy không ổn định và khó diễn giải.
D. Endogeneity, làm cho mô hình không thể hội tụ.

Câu 16

Trong khoa học dữ liệu, phương pháp nào sau đây giúp giảm thiểu tác động của outliers (giá trị ngoại lệ) trong dữ liệu?

A. Sử dụng mean imputation.
B. Sử dụng scaling (ví dụ: StandardScaler).
C. Sử dụng robust scaling (ví dụ: RobustScaler).
D. Sử dụng one-hot encoding.

Câu 17

Trong phân tích sentiment (sentiment analysis) trên mạng xã hội để đánh giá phản hồi của khách hàng về một sản phẩm, kỹ thuật nào sau đây thường được sử dụng?

A. Phân tích hồi quy.
B. Xử lý ngôn ngữ tự nhiên (Natural Language Processing - NLP).
C. Phân tích phương sai.
D. Phân tích thành phần chính.

Câu 18

Trong quản lý chuỗi cung ứng, khoa học dữ liệu có thể giúp tối ưu hóa điều gì để giảm chi phí vận chuyển?

A. Màu sắc của xe tải.
B. Lịch trình và tuyến đường vận chuyển.
C. Âm nhạc phát trên xe tải.
D. Đồng phục của tài xế.

Câu 19

Trong marketing, phân tích cohort (cohort analysis) được sử dụng để làm gì?

A. Dự đoán doanh số bán hàng trong tương lai.
B. Phân tích hành vi của các nhóm khách hàng có chung đặc điểm hoặc thời điểm tham gia.
C. Đánh giá hiệu quả của các kênh marketing khác nhau.
D. Xác định các yếu tố ảnh hưởng đến sự hài lòng của khách hàng.

Câu 20

Trong kinh tế và kinh doanh, thuật ngữ 'feature engineering' trong khoa học dữ liệu đề cập đến điều gì?

A. Quá trình lựa chọn thuật toán phù hợp nhất cho một bài toán.
B. Quá trình biến đổi dữ liệu thô thành các thuộc tính (features) phù hợp để sử dụng trong các mô hình học máy.
C. Quá trình triển khai mô hình học máy vào thực tế.
D. Quá trình đánh giá hiệu suất của một mô hình học máy.

Câu 21

Trong lĩnh vực bảo hiểm, mô hình nào sau đây thường được sử dụng để dự đoán số lượng yêu cầu bồi thường (claims) trong một khoảng thời gian nhất định?

A. Mô hình Poisson Regression.
B. Mô hình Linear Regression.
C. Mô hình K-means.
D. Mô hình SVM.

Câu 22

Trong kinh tế lượng, phương pháp bình phương tối thiểu (Ordinary Least Squares - OLS) được sử dụng để làm gì?

A. Ước lượng các tham số của mô hình hồi quy tuyến tính bằng cách giảm thiểu tổng bình phương sai số.
B. Phân tích chuỗi thời gian.
C. Phân tích dữ liệu phân loại.
D. Phân tích dữ liệu không gian.

Câu 23

Trong phân tích dữ liệu, imputation là gì và khi nào nó được sử dụng?

A. Một phương pháp để trực quan hóa dữ liệu.
B. Một phương pháp để mã hóa dữ liệu.
C. Một phương pháp để điền vào các giá trị bị thiếu trong dữ liệu.
D. Một phương pháp để loại bỏ các giá trị ngoại lệ.

Câu 24

Trong phân tích chuỗi thời gian (time series analysis) kinh tế, thành phần nào sau đây thể hiện xu hướng dài hạn của dữ liệu?

A. Tính mùa vụ (Seasonality).
B. Chu kỳ (Cycle).
C. Xu hướng (Trend).
D. Tính ngẫu nhiên (Randomness).

Câu 25

Trong khoa học dữ liệu, khi nào thì bạn nên sử dụng một mô hình non-parametric thay vì parametric?

A. Khi bạn có ít dữ liệu.
B. Khi bạn biết phân phối của dữ liệu.
C. Khi bạn không biết hoặc không thể giả định phân phối của dữ liệu.
D. Khi bạn muốn mô hình đơn giản.

Câu 26

Phương pháp nào sau đây thường được sử dụng để giảm số chiều dữ liệu (dimensionality reduction) trong khoa học dữ liệu kinh tế, nhằm đơn giản hóa mô hình và tránh overfitting?

A. Phân tích phương sai (ANOVA).
B. Hồi quy tuyến tính (Linear Regression).
C. Phân tích thành phần chính (Principal Component Analysis - PCA).
D. Phân tích tương quan (Correlation Analysis).

Câu 27

Trong lĩnh vực nguồn nhân lực, khoa học dữ liệu có thể được sử dụng để dự đoán điều gì?

A. Sở thích ăn uống của nhân viên.
B. Khả năng nhân viên sẽ rời bỏ công ty (attrition).
C. Màu sắc yêu thích của nhân viên.
D. Địa điểm du lịch ưa thích của nhân viên.

Câu 28

Trong kinh doanh, chỉ số RFM (Recency, Frequency, Monetary) thường được sử dụng để làm gì?

A. Đo lường mức độ hài lòng của khách hàng.
B. Đánh giá hiệu quả của chiến dịch marketing.
C. Phân tích hành vi mua hàng và đánh giá giá trị của khách hàng.
D. Dự đoán xu hướng thị trường.

Câu 29

Trong khoa học dữ liệu, cross-validation là gì và tại sao nó quan trọng?

A. Một kỹ thuật để trực quan hóa dữ liệu, giúp hiểu rõ hơn về cấu trúc dữ liệu.
B. Một kỹ thuật để đánh giá hiệu suất của mô hình trên dữ liệu chưa thấy, giúp tránh overfitting và đánh giá khả năng tổng quát hóa của mô hình.
C. Một kỹ thuật để làm sạch dữ liệu, giúp loại bỏ các giá trị ngoại lệ.
D. Một kỹ thuật để giảm số chiều dữ liệu, giúp đơn giản hóa mô hình.

Câu 30

Trong lĩnh vực bán lẻ, thuật toán Apriori thường được sử dụng để làm gì?

A. Dự đoán doanh số bán hàng.
B. Phân tích giỏ hàng (market basket analysis) để tìm ra các sản phẩm thường được mua cùng nhau.
C. Phân cụm khách hàng.
D. Đánh giá hiệu quả của chương trình khuyến mãi.

Or check our Popular Categories...

Or check our Popular Categories...