1. Trong phân tích marketing, bạn muốn xác định khách hàng nào có khả năng rời bỏ (churn) cao nhất. Bạn nên sử dụng mô hình nào?
A. Mô hình phân cụm.
B. Mô hình hồi quy tuyến tính.
C. Mô hình phân loại (ví dụ: Logistic Regression, Random Forest).
D. Mô hình chuỗi thời gian.
2. Trong lĩnh vực marketing, kỹ thuật phân cụm (clustering) khách hàng thường được sử dụng để làm gì?
A. Dự đoán doanh thu bán hàng.
B. Phân loại khách hàng thành các nhóm có đặc điểm tương đồng.
C. Đánh giá hiệu quả của chiến dịch quảng cáo.
D. Xác định mối quan hệ nhân quả giữa các biến marketing.
3. Trong phân tích rủi ro hoạt động của một ngân hàng, khoa học dữ liệu có thể giúp phát hiện điều gì?
A. Sở thích âm nhạc của khách hàng.
B. Các giao dịch gian lận hoặc bất thường.
C. Xu hướng thời trang của nhân viên.
D. Địa điểm ăn trưa yêu thích của nhân viên.
4. Trong lĩnh vực chuỗi cung ứng, khoa học dữ liệu có thể được ứng dụng để giải quyết bài toán nào sau đây?
A. Tuyển dụng nhân viên mới.
B. Dự báo nhu cầu và tối ưu hóa lượng hàng tồn kho.
C. Thiết kế logo sản phẩm.
D. Xây dựng mối quan hệ với khách hàng.
5. Trong phân tích rủi ro tín dụng, mô hình nào sau đây thường được sử dụng để dự đoán khả năng một khách hàng sẽ vỡ nợ?
A. Mô hình ARIMA.
B. Mô hình Logistic Regression.
C. Mô hình K-means.
D. Mô hình Apriori.
6. Trong tài chính, mô hình định giá tài sản vốn (Capital Asset Pricing Model – CAPM) được sử dụng để làm gì?
A. Dự đoán lãi suất.
B. Đánh giá rủi ro tín dụng.
C. Ước tính lợi nhuận kỳ vọng của một tài sản dựa trên rủi ro hệ thống của nó.
D. Phân tích xu hướng thị trường chứng khoán.
7. Trong khoa học dữ liệu, thuật ngữ ‘bias-variance tradeoff’ đề cập đến điều gì?
A. Sự đánh đổi giữa chi phí và lợi nhuận trong việc thu thập dữ liệu.
B. Sự đánh đổi giữa độ chính xác và tốc độ của thuật toán.
C. Sự đánh đổi giữa việc mô hình quá khớp (overfitting) và mô hình quá đơn giản (underfitting).
D. Sự đánh đổi giữa việc sử dụng dữ liệu có cấu trúc và dữ liệu phi cấu trúc.
8. Trong phân tích dữ liệu bán hàng, bạn muốn xác định mối quan hệ giữa các sản phẩm được mua cùng nhau. Bạn nên sử dụng kỹ thuật nào?
A. Phân tích hồi quy.
B. Phân tích cụm.
C. Phân tích kết hợp (Association rule mining).
D. Phân tích chuỗi thời gian.
9. Trong khoa học dữ liệu, kỹ thuật nào sau đây thường được sử dụng để xử lý dữ liệu văn bản (text data) trước khi đưa vào mô hình học máy?
A. Chuẩn hóa (Normalization).
B. Mã hóa one-hot (One-hot encoding).
C. Stemming và Lemmatization.
D. Scaling.
10. Trong quản lý rủi ro tài chính, mô hình nào sau đây thường được sử dụng để ước tính giá trị có thể mất (Value at Risk – VaR)?
A. Mô hình hồi quy tuyến tính.
B. Mô hình cây quyết định.
C. Mô hình Monte Carlo.
D. Mô hình mạng nơ-ron.
11. Trong phân tích dữ liệu lớn (big data) kinh tế, kỹ thuật MapReduce thường được sử dụng để làm gì?
A. Trực quan hóa dữ liệu.
B. Làm sạch dữ liệu.
C. Xử lý song song và phân tán dữ liệu trên nhiều máy tính.
D. Xây dựng mô hình học máy.
12. Trong khoa học dữ liệu, ROC curve và AUC được sử dụng để đánh giá điều gì?
A. Hiệu suất của mô hình hồi quy.
B. Hiệu suất của mô hình phân loại.
C. Hiệu suất của mô hình phân cụm.
D. Hiệu suất của mô hình giảm chiều.
13. Trong phân tích chuỗi cung ứng, khoa học dữ liệu có thể giúp dự đoán điều gì để giảm thiểu rủi ro?
A. Sở thích cá nhân của nhân viên.
B. Sự thay đổi của tỷ giá hối đoái.
C. Sự gián đoạn trong chuỗi cung ứng do thiên tai hoặc các sự kiện bất ngờ.
D. Màu sắc ưa thích của khách hàng.
14. Trong khoa học dữ liệu, thuật ngữ ‘overfitting’ đề cập đến tình trạng gì?
A. Mô hình quá đơn giản và không thể nắm bắt được các mối quan hệ phức tạp trong dữ liệu.
B. Mô hình quá phức tạp và học thuộc lòng dữ liệu huấn luyện, dẫn đến hiệu suất kém trên dữ liệu mới.
C. Dữ liệu bị thiếu hoặc chứa các giá trị ngoại lệ.
D. Mô hình không hội tụ được trong quá trình huấn luyện.
15. Khi xây dựng mô hình dự đoán giá nhà, bạn nhận thấy rằng các biến độc lập có tương quan cao với nhau. Vấn đề này được gọi là gì và có thể ảnh hưởng đến mô hình như thế nào?
A. Heteroscedasticity, làm cho mô hình trở nên không ổn định.
B. Autocorrelation, làm cho mô hình dự đoán sai lệch.
C. Multicollinearity, làm cho các hệ số hồi quy không ổn định và khó diễn giải.
D. Endogeneity, làm cho mô hình không thể hội tụ.
16. Trong khoa học dữ liệu, phương pháp nào sau đây giúp giảm thiểu tác động của outliers (giá trị ngoại lệ) trong dữ liệu?
A. Sử dụng mean imputation.
B. Sử dụng scaling (ví dụ: StandardScaler).
C. Sử dụng robust scaling (ví dụ: RobustScaler).
D. Sử dụng one-hot encoding.
17. Trong phân tích sentiment (sentiment analysis) trên mạng xã hội để đánh giá phản hồi của khách hàng về một sản phẩm, kỹ thuật nào sau đây thường được sử dụng?
A. Phân tích hồi quy.
B. Xử lý ngôn ngữ tự nhiên (Natural Language Processing – NLP).
C. Phân tích phương sai.
D. Phân tích thành phần chính.
18. Trong quản lý chuỗi cung ứng, khoa học dữ liệu có thể giúp tối ưu hóa điều gì để giảm chi phí vận chuyển?
A. Màu sắc của xe tải.
B. Lịch trình và tuyến đường vận chuyển.
C. Âm nhạc phát trên xe tải.
D. Đồng phục của tài xế.
19. Trong marketing, phân tích cohort (cohort analysis) được sử dụng để làm gì?
A. Dự đoán doanh số bán hàng trong tương lai.
B. Phân tích hành vi của các nhóm khách hàng có chung đặc điểm hoặc thời điểm tham gia.
C. Đánh giá hiệu quả của các kênh marketing khác nhau.
D. Xác định các yếu tố ảnh hưởng đến sự hài lòng của khách hàng.
20. Trong kinh tế và kinh doanh, thuật ngữ ‘feature engineering’ trong khoa học dữ liệu đề cập đến điều gì?
A. Quá trình lựa chọn thuật toán phù hợp nhất cho một bài toán.
B. Quá trình biến đổi dữ liệu thô thành các thuộc tính (features) phù hợp để sử dụng trong các mô hình học máy.
C. Quá trình triển khai mô hình học máy vào thực tế.
D. Quá trình đánh giá hiệu suất của một mô hình học máy.
21. Trong lĩnh vực bảo hiểm, mô hình nào sau đây thường được sử dụng để dự đoán số lượng yêu cầu bồi thường (claims) trong một khoảng thời gian nhất định?
A. Mô hình Poisson Regression.
B. Mô hình Linear Regression.
C. Mô hình K-means.
D. Mô hình SVM.
22. Trong kinh tế lượng, phương pháp bình phương tối thiểu (Ordinary Least Squares – OLS) được sử dụng để làm gì?
A. Ước lượng các tham số của mô hình hồi quy tuyến tính bằng cách giảm thiểu tổng bình phương sai số.
B. Phân tích chuỗi thời gian.
C. Phân tích dữ liệu phân loại.
D. Phân tích dữ liệu không gian.
23. Trong phân tích dữ liệu, imputation là gì và khi nào nó được sử dụng?
A. Một phương pháp để trực quan hóa dữ liệu.
B. Một phương pháp để mã hóa dữ liệu.
C. Một phương pháp để điền vào các giá trị bị thiếu trong dữ liệu.
D. Một phương pháp để loại bỏ các giá trị ngoại lệ.
24. Trong phân tích chuỗi thời gian (time series analysis) kinh tế, thành phần nào sau đây thể hiện xu hướng dài hạn của dữ liệu?
A. Tính mùa vụ (Seasonality).
B. Chu kỳ (Cycle).
C. Xu hướng (Trend).
D. Tính ngẫu nhiên (Randomness).
25. Trong khoa học dữ liệu, khi nào thì bạn nên sử dụng một mô hình non-parametric thay vì parametric?
A. Khi bạn có ít dữ liệu.
B. Khi bạn biết phân phối của dữ liệu.
C. Khi bạn không biết hoặc không thể giả định phân phối của dữ liệu.
D. Khi bạn muốn mô hình đơn giản.
26. Phương pháp nào sau đây thường được sử dụng để giảm số chiều dữ liệu (dimensionality reduction) trong khoa học dữ liệu kinh tế, nhằm đơn giản hóa mô hình và tránh overfitting?
A. Phân tích phương sai (ANOVA).
B. Hồi quy tuyến tính (Linear Regression).
C. Phân tích thành phần chính (Principal Component Analysis – PCA).
D. Phân tích tương quan (Correlation Analysis).
27. Trong lĩnh vực nguồn nhân lực, khoa học dữ liệu có thể được sử dụng để dự đoán điều gì?
A. Sở thích ăn uống của nhân viên.
B. Khả năng nhân viên sẽ rời bỏ công ty (attrition).
C. Màu sắc yêu thích của nhân viên.
D. Địa điểm du lịch ưa thích của nhân viên.
28. Trong kinh doanh, chỉ số RFM (Recency, Frequency, Monetary) thường được sử dụng để làm gì?
A. Đo lường mức độ hài lòng của khách hàng.
B. Đánh giá hiệu quả của chiến dịch marketing.
C. Phân tích hành vi mua hàng và đánh giá giá trị của khách hàng.
D. Dự đoán xu hướng thị trường.
29. Trong khoa học dữ liệu, cross-validation là gì và tại sao nó quan trọng?
A. Một kỹ thuật để trực quan hóa dữ liệu, giúp hiểu rõ hơn về cấu trúc dữ liệu.
B. Một kỹ thuật để đánh giá hiệu suất của mô hình trên dữ liệu chưa thấy, giúp tránh overfitting và đánh giá khả năng tổng quát hóa của mô hình.
C. Một kỹ thuật để làm sạch dữ liệu, giúp loại bỏ các giá trị ngoại lệ.
D. Một kỹ thuật để giảm số chiều dữ liệu, giúp đơn giản hóa mô hình.
30. Trong lĩnh vực bán lẻ, thuật toán Apriori thường được sử dụng để làm gì?
A. Dự đoán doanh số bán hàng.
B. Phân tích giỏ hàng (market basket analysis) để tìm ra các sản phẩm thường được mua cùng nhau.
C. Phân cụm khách hàng.
D. Đánh giá hiệu quả của chương trình khuyến mãi.
31. Trong kinh tế và kinh doanh, thuật ngữ ‘feature engineering’ trong khoa học dữ liệu đề cập đến điều gì?
A. Quá trình lựa chọn thuật toán máy học phù hợp nhất cho bài toán.
B. Quá trình tạo ra các biến mới từ dữ liệu hiện có để cải thiện hiệu suất của mô hình.
C. Quá trình thu thập dữ liệu từ nhiều nguồn khác nhau.
D. Quá trình đánh giá hiệu quả của mô hình trên dữ liệu kiểm tra.
32. Trong khoa học dữ liệu, kỹ thuật ‘cross-validation’ (kiểm định chéo) được sử dụng để làm gì?
A. Để tăng tốc độ tính toán của mô hình.
B. Để ước lượng hiệu suất của mô hình trên dữ liệu mới.
C. Để giảm số lượng biến đầu vào của mô hình.
D. Để trực quan hóa dữ liệu một cách hiệu quả.
33. Trong khoa học dữ liệu, thuật ngữ ‘regularization’ (chính quy hóa) đề cập đến kỹ thuật nào?
A. Kỹ thuật giảm số chiều dữ liệu.
B. Kỹ thuật thêm một khoản phạt vào hàm mất mát để tránh overfitting.
C. Kỹ thuật tăng tốc độ tính toán của mô hình.
D. Kỹ thuật trực quan hóa dữ liệu.
34. Trong lĩnh vực kinh doanh, việc sử dụng thuật toán ‘clustering’ (phân cụm) trong khoa học dữ liệu có thể giúp ích gì?
A. Dự đoán giá cổ phiếu trong tương lai.
B. Phân loại khách hàng thành các nhóm khác nhau dựa trên hành vi và đặc điểm của họ.
C. Tối ưu hóa quy trình sản xuất.
D. Phát hiện gian lận trong giao dịch tài chính.
35. Trong khoa học dữ liệu, thuật ngữ ‘ensemble learning’ (học tập hợp) đề cập đến phương pháp nào?
A. Phương pháp sử dụng một mô hình duy nhất để dự đoán.
B. Phương pháp kết hợp nhiều mô hình khác nhau để cải thiện hiệu suất.
C. Phương pháp giảm số chiều dữ liệu.
D. Phương pháp trực quan hóa dữ liệu.
36. Phương pháp nào sau đây thường được sử dụng để giảm số chiều dữ liệu trong khoa học dữ liệu, giúp đơn giản hóa mô hình và giảm nguy cơ overfitting?
A. Phân tích phương sai (ANOVA).
B. Phân tích hồi quy tuyến tính.
C. Phân tích thành phần chính (PCA).
D. Phân tích chuỗi thời gian.
37. Trong khoa học dữ liệu, ‘p-value’ được sử dụng để làm gì trong kiểm định giả thuyết (hypothesis testing)?
A. Để đo lường độ lớn của hiệu ứng (effect size).
B. Để xác định mức ý nghĩa thống kê (statistical significance).
C. Để ước lượng giá trị của tham số.
D. Để trực quan hóa dữ liệu.
38. Một công ty muốn phân khúc khách hàng thành các nhóm khác nhau dựa trên hành vi mua sắm. Phương pháp khoa học dữ liệu nào phù hợp nhất để giải quyết vấn đề này?
A. Phân tích hồi quy (Regression analysis)
B. Phân tích cụm (Clustering)
C. Phân tích phân loại (Classification)
D. Phân tích chuỗi thời gian (Time series analysis)
39. Trong kinh doanh, việc sử dụng khoa học dữ liệu để phân tích ‘market basket analysis’ (phân tích giỏ hàng) có thể giúp ích gì?
A. Dự đoán giá cổ phiếu.
B. Tìm ra các sản phẩm thường được mua cùng nhau.
C. Phân loại khách hàng.
D. Đánh giá rủi ro tín dụng.
40. Trong khoa học dữ liệu, kỹ thuật nào được sử dụng để chuyển đổi dữ liệu định tính (categorical data) thành dữ liệu định lượng (numerical data)?
A. Chuẩn hóa dữ liệu (Data normalization)
B. Mã hóa one-hot (One-hot encoding)
C. Giảm chiều dữ liệu (Dimensionality reduction)
D. Phân tích phương sai (ANOVA)
41. Một công ty muốn phân tích xu hướng bán hàng theo thời gian. Phương pháp khoa học dữ liệu nào phù hợp nhất để giải quyết vấn đề này?
A. Phân tích cụm (Clustering)
B. Phân tích hồi quy (Regression analysis)
C. Phân tích chuỗi thời gian (Time series analysis)
D. Phân tích phân loại (Classification)
42. Khi xây dựng mô hình dự đoán trong kinh doanh, hiện tượng ‘overfitting’ (quá khớp) xảy ra khi nào?
A. Khi mô hình quá đơn giản và không thể nắm bắt được các mẫu trong dữ liệu.
B. Khi mô hình học quá kỹ các chi tiết nhiễu trong dữ liệu huấn luyện và không thể khái quát hóa tốt trên dữ liệu mới.
C. Khi dữ liệu huấn luyện quá ít.
D. Khi mô hình được huấn luyện quá nhanh.
43. Một công ty muốn dự đoán doanh số bán hàng trong quý tới dựa trên dữ liệu lịch sử và các yếu tố kinh tế vĩ mô. Phương pháp khoa học dữ liệu nào phù hợp nhất để giải quyết vấn đề này?
A. Phân tích cụm (Clustering)
B. Phân tích hồi quy (Regression analysis)
C. Phân tích phân loại (Classification)
D. Phân tích thành phần chính (PCA)
44. Trong khoa học dữ liệu, kỹ thuật nào thường được sử dụng để đánh giá tầm quan trọng của các biến (feature importance) trong mô hình học máy?
A. Chuẩn hóa dữ liệu (Data normalization)
B. Giảm chiều dữ liệu (Dimensionality reduction)
C. Sử dụng các thuật toán như Random Forest hoặc Gradient Boosting
D. Mã hóa one-hot (One-hot encoding)
45. Một công ty muốn dự đoán khả năng khách hàng sẽ rời bỏ dịch vụ (churn prediction). Phương pháp khoa học dữ liệu nào phù hợp nhất để giải quyết vấn đề này?
A. Phân tích hồi quy (Regression analysis)
B. Phân tích cụm (Clustering)
C. Phân tích phân loại (Classification)
D. Phân tích chuỗi thời gian (Time series analysis)
46. Trong khoa học dữ liệu, ‘precision’ (độ chính xác) và ‘recall’ (độ phủ) là gì và chúng liên quan đến nhau như thế nào?
A. Precision là tỷ lệ dự đoán đúng trên tổng số dự đoán, recall là tỷ lệ dự đoán đúng trên tổng số thực tế, và chúng thường có sự đánh đổi lẫn nhau.
B. Precision là tỷ lệ dự đoán sai trên tổng số dự đoán, recall là tỷ lệ dự đoán sai trên tổng số thực tế, và chúng luôn đồng biến.
C. Precision là tỷ lệ dự đoán đúng trên tổng số thực tế, recall là tỷ lệ dự đoán đúng trên tổng số dự đoán, và chúng không liên quan đến nhau.
D. Precision và recall đều là tỷ lệ dự đoán đúng trên tổng số dự đoán, và chúng luôn bằng nhau.
47. Trong khoa học dữ liệu, kỹ thuật nào thường được sử dụng để xử lý dữ liệu bị thiếu (missing data)?
A. Chuẩn hóa dữ liệu (Data normalization)
B. Điền giá trị trung bình/trung vị (Imputation)
C. Giảm chiều dữ liệu (Dimensionality reduction)
D. Phân tích phương sai (ANOVA)
48. Trong khoa học dữ liệu, thuật ngữ ‘feature scaling’ (tỉ lệ hóa đặc trưng) đề cập đến kỹ thuật nào?
A. Kỹ thuật giảm số chiều dữ liệu.
B. Kỹ thuật chuyển đổi dữ liệu về một phạm vi giá trị nhất định.
C. Kỹ thuật xử lý dữ liệu bị thiếu.
D. Kỹ thuật đánh giá tầm quan trọng của các biến.
49. Trong bối cảnh phân tích dữ liệu kinh doanh, chỉ số ‘churn rate’ (tỷ lệ khách hàng rời bỏ) có ý nghĩa gì?
A. Tỷ lệ tăng trưởng doanh thu hàng năm của công ty.
B. Tỷ lệ phần trăm khách hàng rời bỏ dịch vụ hoặc sản phẩm của công ty trong một khoảng thời gian nhất định.
C. Tỷ lệ khách hàng mới đăng ký sử dụng dịch vụ của công ty.
D. Tỷ lệ chuyển đổi từ khách hàng tiềm năng thành khách hàng thực tế.
50. Trong khoa học dữ liệu, ‘gradient descent’ (gradient xuống dốc) là thuật toán được sử dụng để làm gì?
A. Để giảm số chiều dữ liệu.
B. Để tìm giá trị tối ưu của các tham số trong mô hình.
C. Để phân loại dữ liệu.
D. Để trực quan hóa dữ liệu.
51. Trong bối cảnh kinh doanh, việc sử dụng ‘A/B testing’ (thử nghiệm A/B) trong khoa học dữ liệu có mục đích gì?
A. Để dự đoán doanh thu bán hàng.
B. Để so sánh hiệu quả của hai phiên bản khác nhau của một sản phẩm hoặc dịch vụ.
C. Để phân loại khách hàng thành các nhóm khác nhau.
D. Để phát hiện gian lận trong giao dịch tài chính.
52. Một ngân hàng muốn xác định các giao dịch gian lận. Phương pháp khoa học dữ liệu nào phù hợp nhất để giải quyết vấn đề này?
A. Phân tích hồi quy (Regression analysis)
B. Phân tích cụm (Clustering)
C. Phân tích phân loại (Classification)
D. Phân tích chuỗi thời gian (Time series analysis)
53. Một công ty thương mại điện tử muốn cá nhân hóa trải nghiệm mua sắm cho khách hàng. Phương pháp khoa học dữ liệu nào phù hợp nhất để giải quyết vấn đề này?
A. Phân tích cụm (Clustering)
B. Hệ thống gợi ý (Recommender system)
C. Phân tích hồi quy (Regression analysis)
D. Phân tích chuỗi thời gian (Time series analysis)
54. Trong khoa học dữ liệu, thuật ngữ ‘bias’ (độ lệch) và ‘variance’ (phương sai) đề cập đến điều gì trong mô hình học máy?
A. Bias là lỗi do giả định đơn giản hóa mô hình, variance là độ nhạy của mô hình với sự thay đổi trong dữ liệu huấn luyện.
B. Bias là độ phức tạp của mô hình, variance là khả năng khái quát hóa của mô hình.
C. Bias là lượng dữ liệu huấn luyện, variance là lượng dữ liệu kiểm tra.
D. Bias và variance đều là các phương pháp giảm chiều dữ liệu.
55. Trong khoa học dữ liệu, ROC curve (Receiver Operating Characteristic curve) được sử dụng để đánh giá hiệu suất của mô hình nào?
A. Mô hình hồi quy (Regression model)
B. Mô hình phân loại (Classification model)
C. Mô hình cụm (Clustering model)
D. Mô hình giảm chiều (Dimensionality reduction model)
56. Trong khoa học dữ liệu, ‘F1-score’ là gì và nó được tính như thế nào?
A. Trung bình cộng của precision và recall.
B. Trung bình nhân của precision và recall.
C. Trung bình điều hòa của precision và recall.
D. Tổng của precision và recall.
57. Trong kinh doanh, việc phân tích ‘sentiment analysis’ (phân tích cảm xúc) có thể giúp ích gì cho doanh nghiệp?
A. Dự đoán doanh thu bán hàng trong tương lai.
B. Đánh giá cảm xúc của khách hàng về sản phẩm hoặc dịch vụ của doanh nghiệp thông qua phân tích văn bản.
C. Tối ưu hóa chi phí quảng cáo.
D. Phát hiện gian lận trong giao dịch tài chính.
58. Một công ty muốn tối ưu hóa chiến dịch marketing bằng cách xác định các kênh quảng cáo hiệu quả nhất. Phương pháp khoa học dữ liệu nào phù hợp nhất để giải quyết vấn đề này?
A. Phân tích hồi quy (Regression analysis)
B. Phân tích cụm (Clustering)
C. Phân tích phân loại (Classification)
D. Phân tích quy kết (Attribution analysis)
59. Trong kinh doanh, việc sử dụng khoa học dữ liệu để phân tích ‘customer lifetime value’ (CLTV) có ý nghĩa gì?
A. Dự đoán giá trị vòng đời của khách hàng, tức là tổng doanh thu mà một khách hàng có thể mang lại cho doanh nghiệp trong suốt thời gian họ là khách hàng.
B. Phân loại khách hàng thành các nhóm khác nhau dựa trên giá trị của họ.
C. Đánh giá mức độ hài lòng của khách hàng.
D. Tối ưu hóa chi phí marketing.
60. Một nhà bán lẻ muốn dự đoán nhu cầu sản phẩm trong tương lai để tối ưu hóa quản lý hàng tồn kho. Phương pháp khoa học dữ liệu nào phù hợp nhất?
A. Phân tích cảm xúc (Sentiment analysis)
B. Phân tích chuỗi thời gian (Time series analysis)
C. Phân tích cụm (Clustering)
D. Phân tích hồi quy (Regression analysis)
61. Đâu là một ứng dụng của kỹ thuật học máy (Machine Learning) trong lĩnh vực tài chính?
A. Dự báo giá cổ phiếu
B. Tối ưu hóa quy trình sản xuất
C. Quản lý chuỗi cung ứng
D. Phân tích đối thủ cạnh tranh
62. Trong khai phá dữ liệu, thuật ngữ ‘feature engineering’ đề cập đến quá trình nào?
A. Lựa chọn thuật toán phù hợp nhất
B. Xây dựng và lựa chọn các đặc trưng (features) phù hợp từ dữ liệu thô
C. Đánh giá hiệu quả của mô hình
D. Triển khai mô hình vào thực tế
63. Trong lĩnh vực nông nghiệp, khoa học dữ liệu có thể được sử dụng để làm gì?
A. Dự đoán năng suất cây trồng
B. Tối ưu hóa việc sử dụng phân bón và nước
C. Phát hiện sâu bệnh
D. Tất cả các đáp án trên
64. Trong lĩnh vực sản xuất, khoa học dữ liệu có thể giúp cải thiện điều gì?
A. Dự đoán hỏng hóc máy móc
B. Tối ưu hóa quy trình sản xuất
C. Kiểm soát chất lượng sản phẩm
D. Tất cả các đáp án trên
65. Trong phân tích dữ liệu lớn (Big Data) cho kinh doanh, kỹ thuật nào giúp xác định các nhóm khách hàng có đặc điểm tương đồng?
A. Hồi quy tuyến tính (Linear Regression)
B. Phân cụm (Clustering)
C. Phân tích phương sai (ANOVA)
D. Kiểm định giả thuyết (Hypothesis Testing)
66. Chỉ số Sharpe được sử dụng để đo lường điều gì trong quản lý rủi ro tài chính?
A. Mức độ biến động của lợi nhuận
B. Lợi nhuận điều chỉnh theo rủi ro
C. Khả năng thanh khoản của tài sản
D. Tỷ lệ nợ trên vốn chủ sở hữu
67. Trong thống kê suy diễn, khoảng tin cậy (confidence interval) thể hiện điều gì?
A. Xác suất một tham số nằm trong một khoảng giá trị nhất định
B. Một khoảng giá trị mà trong đó chúng ta tin rằng tham số thực tế của quần thể nằm trong đó với một độ tin cậy nhất định
C. Sai số chuẩn của ước lượng
D. Mức ý nghĩa thống kê của một kiểm định
68. Trong lĩnh vực thể thao, khoa học dữ liệu có thể được sử dụng để làm gì?
A. Phân tích hiệu suất vận động viên
B. Dự đoán kết quả trận đấu
C. Tối ưu hóa chiến thuật thi đấu
D. Tất cả các đáp án trên
69. Phương pháp nào sau đây thường được sử dụng để giảm số chiều của dữ liệu trong khoa học dữ liệu?
A. Hồi quy logistic
B. Phân tích thành phần chính (PCA)
C. Cây quyết định
D. Mạng nơ-ron
70. Trong lĩnh vực bất động sản, khoa học dữ liệu có thể được sử dụng để làm gì?
A. Dự đoán giá nhà
B. Phân tích xu hướng thị trường bất động sản
C. Đánh giá rủi ro đầu tư bất động sản
D. Tất cả các đáp án trên
71. Trong lĩnh vực y tế, ứng dụng nào của khoa học dữ liệu giúp cải thiện hiệu quả chẩn đoán bệnh?
A. Phân tích геном (genome analysis)
B. Xử lý ngôn ngữ tự nhiên (NLP) để phân tích bệnh án
C. Học sâu (deep learning) để phân tích hình ảnh y tế
D. Tất cả các đáp án trên
72. Trong lĩnh vực marketing, mô hình атрибуция (attribution model) được sử dụng để làm gì?
A. Dự báo doanh số bán hàng
B. Xác định các kênh marketing đóng góp vào chuyển đổi
C. Phân tích đối thủ cạnh tranh
D. Đo lường mức độ hài lòng của khách hàng
73. Trong phân tích cảm xúc (sentiment analysis) trên mạng xã hội, mục tiêu chính là gì?
A. Xác định chủ đề thảo luận
B. Đo lường thái độ và cảm xúc của mọi người đối với một chủ đề cụ thể
C. Phân tích mạng lưới quan hệ
D. Dự đoán xu hướng thị trường
74. Trong lĩnh vực bán lẻ, thuật toán ‘market basket analysis’ được sử dụng để làm gì?
A. Dự báo doanh số bán hàng
B. Xác định các sản phẩm thường được mua cùng nhau
C. Phân tích hành vi khách hàng
D. Tối ưu hóa giá sản phẩm
75. Trong kinh doanh, phân tích когорт (cohort analysis) thường được sử dụng để làm gì?
A. Dự báo doanh thu
B. Phân tích hành vi của các nhóm khách hàng theo thời gian
C. Đánh giá hiệu quả chiến dịch marketing
D. Xác định phân khúc thị trường mục tiêu
76. Trong lĩnh vực du lịch, khoa học dữ liệu có thể được sử dụng để làm gì?
A. Dự đoán nhu cầu du lịch
B. Cá nhân hóa trải nghiệm du lịch
C. Tối ưu hóa giá vé máy bay và khách sạn
D. Tất cả các đáp án trên
77. Trong lĩnh vực chính phủ, khoa học dữ liệu có thể được sử dụng để làm gì?
A. Phân tích dữ liệu tội phạm
B. Tối ưu hóa chính sách công
C. Cải thiện dịch vụ công
D. Tất cả các đáp án trên
78. Trong lĩnh vực ngân hàng, ứng dụng nào của khoa học dữ liệu giúp phát hiện giao dịch gian lận?
A. Phân tích chuỗi thời gian
B. Phân tích mạng lưới giao dịch
C. Học máy để phát hiện các mẫu giao dịch bất thường
D. Tất cả các đáp án trên
79. Trong phân tích rủi ro tín dụng, chỉ số nào được sử dụng để đo lường khả năng một khách hàng sẽ không trả được nợ?
A. Lãi suất
B. Điểm tín dụng (credit score)
C. Tỷ lệ nợ trên thu nhập
D. Thời gian vay
80. Trong lĩnh vực truyền thông, phân tích dữ liệu có thể được sử dụng để làm gì?
A. Phân tích xu hướng tin tức
B. Cá nhân hóa nội dung tin tức
C. Đo lường hiệu quả chiến dịch truyền thông
D. Tất cả các đáp án trên
81. Trong lĩnh vực logistics, bài toán ‘vehicle routing problem’ (VRP) nhằm mục đích gì?
A. Tối ưu hóa tuyến đường vận chuyển hàng hóa
B. Dự báo thời gian giao hàng
C. Quản lý kho hàng
D. Theo dõi vị trí xe
82. Trong phân tích dữ liệu, ‘A/B testing’ được sử dụng để làm gì?
A. So sánh hiệu quả của hai phiên bản khác nhau của một trang web hoặc ứng dụng
B. Phân tích hành vi khách hàng
C. Dự báo doanh số bán hàng
D. Đo lường mức độ hài lòng của khách hàng
83. Trong lĩnh vực năng lượng, khoa học dữ liệu có thể được sử dụng để làm gì?
A. Tối ưu hóa sản xuất điện
B. Dự báo nhu cầu năng lượng
C. Phát hiện gian lận trong sử dụng năng lượng
D. Tất cả các đáp án trên
84. Trong quản lý nhân sự, phân tích ‘churn rate’ giúp doanh nghiệp làm gì?
A. Dự báo hiệu suất làm việc của nhân viên
B. Đo lường tỷ lệ nhân viên rời bỏ công ty
C. Xác định các kỹ năng cần thiết cho công việc
D. Đánh giá mức độ hài lòng của nhân viên
85. Trong phân tích chuỗi thời gian, thành phần nào thể hiện sự biến động không đều và không thể dự đoán được trong ngắn hạn?
A. Xu hướng (Trend)
B. Tính thời vụ (Seasonality)
C. Chu kỳ (Cycle)
D. Thành phần ngẫu nhiên (Irregular Component)
86. Trong phân tích văn bản, kỹ thuật ‘topic modeling’ được sử dụng để làm gì?
A. Xác định các chủ đề chính trong một tập hợp văn bản
B. Phân loại văn bản
C. Dịch văn bản
D. Tóm tắt văn bản
87. Trong lĩnh vực giáo dục, ứng dụng nào của khoa học dữ liệu giúp cải thiện kết quả học tập của học sinh?
A. Cá nhân hóa lộ trình học tập
B. Dự đoán nguy cơ bỏ học
C. Đánh giá hiệu quả giảng dạy
D. Tất cả các đáp án trên
88. Trong lĩnh vực bảo hiểm, mô hình nào thường được sử dụng để dự đoán khả năng một khách hàng sẽ yêu cầu bồi thường?
A. Mô hình hồi quy tuyến tính
B. Mô hình phân loại (classification model)
C. Mô hình chuỗi thời gian
D. Mô hình phân cụm
89. Trong kinh tế lượng, phương pháp nào thường được sử dụng để ước lượng mối quan hệ giữa các biến khi có hiện tượng đa cộng tuyến?
A. Phương pháp bình phương tối thiểu thông thường (OLS)
B. Phương pháp hồi quy Ridge
C. Phương pháp Maximum Likelihood Estimation (MLE)
D. Phương pháp Moment
90. Trong quản lý chuỗi cung ứng, phân tích dự báo nhu cầu (demand forecasting) giúp doanh nghiệp làm gì?
A. Tối ưu hóa quy trình sản xuất
B. Dự đoán nhu cầu của khách hàng trong tương lai
C. Giảm chi phí vận chuyển
D. Cải thiện quan hệ với nhà cung cấp
91. Khi nào thì việc sử dụng một mô hình đơn giản (ví dụ: hồi quy tuyến tính) là phù hợp hơn một mô hình phức tạp?
A. Khi dữ liệu có mối quan hệ phi tuyến tính.
B. Khi cần giải quyết các vấn đề phức tạp.
C. Khi dữ liệu có cấu trúc đơn giản và mối quan hệ tuyến tính.
D. Khi cần độ chính xác tuyệt đối.
92. Trong phân tích dữ liệu lớn, kỹ thuật nào thường được sử dụng để giảm số lượng chiều dữ liệu trong khi vẫn giữ lại thông tin quan trọng?
A. Phân tích hồi quy.
B. Phân tích thành phần chính (PCA).
C. Phân tích tương quan.
D. Phân tích chuỗi thời gian.
93. Trong marketing, phân tích когорт (cohort analysis) được sử dụng để làm gì?
A. Dự đoán doanh số bán hàng trong tương lai.
B. Phân tích hiệu quả của các chiến dịch quảng cáo.
C. Nghiên cứu hành vi của các nhóm khách hàng theo thời gian.
D. Xác định phân khúc khách hàng mục tiêu.
94. Trong lĩnh vực du lịch, khoa học dữ liệu có thể được sử dụng để làm gì?
A. Dự đoán thời tiết.
B. Cá nhân hóa trải nghiệm du lịch cho khách hàng.
C. Phân tích rủi ro tín dụng.
D. Tối ưu hóa quy trình sản xuất.
95. Đâu là một thách thức lớn trong việc áp dụng khoa học dữ liệu vào kinh doanh?
A. Chi phí phần mềm phân tích dữ liệu quá cao.
B. Thiếu hụt nhân lực có kỹ năng phân tích dữ liệu.
C. Dữ liệu có sẵn quá nhiều.
D. Các mô hình phân tích quá phức tạp.
96. Trong phân tích dữ liệu, thuật ngữ ‘overfitting’ (quá khớp) có nghĩa là gì?
A. Mô hình hoạt động quá chậm.
B. Mô hình quá phức tạp và khớp quá chặt với dữ liệu huấn luyện, dẫn đến kém hiệu quả trên dữ liệu mới.
C. Dữ liệu bị thiếu thông tin.
D. Mô hình không đủ phức tạp để nắm bắt các mẫu trong dữ liệu.
97. Trong phân tích dữ liệu, thuật ngữ ‘correlation’ (tương quan) đo lường điều gì?
A. Mức độ biến động của dữ liệu.
B. Mức độ liên quan giữa hai biến số.
C. Mức độ chính xác của mô hình.
D. Mức độ tin cậy của dữ liệu.
98. Trong lĩnh vực logistics, khoa học dữ liệu có thể được sử dụng để làm gì?
A. Dự đoán thời tiết.
B. Tối ưu hóa lộ trình vận chuyển.
C. Phân tích tình cảm khách hàng.
D. Phát triển sản phẩm mới.
99. Trong lĩnh vực nông nghiệp, khoa học dữ liệu có thể được sử dụng để làm gì?
A. Dự đoán giá cổ phiếu.
B. Tối ưu hóa việc sử dụng phân bón và nước tưới.
C. Phân tích tình cảm khách hàng.
D. Phát triển sản phẩm mới trong ngành dược phẩm.
100. Trong phân tích chuỗi cung ứng, kỹ thuật nào có thể giúp xác định các nút thắt cổ chai trong quy trình sản xuất?
A. Phân tích hồi quy.
B. Mô phỏng Monte Carlo.
C. Phân tích độ nhạy.
D. Phân tích ABC.
101. Trong khai phá dữ liệu, thuật ngữ ‘feature engineering’ đề cập đến quá trình nào?
A. Lựa chọn các thuật toán phù hợp nhất để phân tích dữ liệu.
B. Xây dựng các đặc trưng (features) mới từ dữ liệu hiện có để cải thiện hiệu suất mô hình.
C. Làm sạch và tiền xử lý dữ liệu.
D. Trực quan hóa dữ liệu.
102. Phương pháp nào sau đây thường được sử dụng để đánh giá rủi ro tín dụng trong lĩnh vực ngân hàng?
A. Phân tích chuỗi thời gian.
B. Mô hình hóa rủi ro tín dụng bằng các thuật toán học máy.
C. Phân tích phương sai (ANOVA).
D. Kiểm định giả thuyết.
103. Trong phân tích dữ liệu, thuật ngữ ‘outlier’ (giá trị ngoại lệ) đề cập đến điều gì?
A. Các giá trị bị thiếu trong dữ liệu.
B. Các giá trị nằm ngoài phạm vi dự kiến và khác biệt đáng kể so với các giá trị khác.
C. Các giá trị được sử dụng để huấn luyện mô hình.
D. Các giá trị được sử dụng để kiểm tra mô hình.
104. Khi xây dựng một mô hình dự đoán, việc chia dữ liệu thành tập huấn luyện và tập kiểm tra nhằm mục đích gì?
A. Tăng tốc độ huấn luyện mô hình.
B. Đánh giá khả năng khái quát hóa của mô hình trên dữ liệu mới.
C. Giảm kích thước dữ liệu.
D. Đảm bảo tính bảo mật của dữ liệu.
105. Trong việc xây dựng mô hình, điều gì xảy ra khi bạn sử dụng quá nhiều biến độc lập (features) mà không có đủ dữ liệu?
A. Mô hình sẽ hoạt động nhanh hơn.
B. Mô hình có thể bị overfitting (quá khớp).
C. Mô hình sẽ trở nên chính xác hơn.
D. Không có ảnh hưởng gì.
106. Đâu là một ứng dụng của blockchain trong kinh doanh?
A. Phân tích văn bản.
B. Theo dõi và quản lý chuỗi cung ứng một cách minh bạch và an toàn.
C. Dự đoán giá nhà đất.
D. Tối ưu hóa chiến dịch quảng cáo.
107. Khi nào thì việc sử dụng một mô hình machine learning phức tạp (ví dụ: mạng neural sâu) là phù hợp?
A. Khi dữ liệu có cấu trúc đơn giản và số lượng ít.
B. Khi cần giải quyết các vấn đề phức tạp với dữ liệu lớn và phi tuyến tính.
C. Khi muốn giải thích kết quả một cách dễ dàng.
D. Khi cần triển khai mô hình nhanh chóng.
108. Đâu là một ứng dụng của Internet of Things (IoT) trong kinh doanh?
A. Phân tích văn bản.
B. Giám sát và tối ưu hóa hiệu suất thiết bị trong nhà máy.
C. Dự đoán giá cổ phiếu.
D. Tối ưu hóa chiến dịch marketing.
109. Đâu là một ứng dụng của machine learning trong lĩnh vực y tế?
A. Dự đoán giá cổ phiếu.
B. Phân tích rủi ro tín dụng.
C. Chẩn đoán bệnh dựa trên hình ảnh y tế.
D. Tối ưu hóa chiến dịch marketing.
110. Trong lĩnh vực năng lượng, khoa học dữ liệu có thể được sử dụng để làm gì?
A. Dự đoán giá bất động sản.
B. Tối ưu hóa sản xuất và phân phối điện.
C. Phân tích tình cảm khách hàng.
D. Phát triển sản phẩm mới trong ngành thực phẩm.
111. Trong lĩnh vực tài chính, khoa học dữ liệu có thể được sử dụng để phát hiện gian lận bằng cách nào?
A. Phân tích báo cáo tài chính hàng năm.
B. Xây dựng mô hình dự đoán rủi ro tín dụng.
C. Phân tích hành vi giao dịch bất thường.
D. Tối ưu hóa danh mục đầu tư.
112. Đâu là một lợi ích chính của việc sử dụng khoa học dữ liệu trong quản lý nhân sự?
A. Tự động hóa quy trình tuyển dụng.
B. Cải thiện hiệu quả đào tạo và phát triển nhân viên.
C. Giảm chi phí thuê văn phòng.
D. Tăng cường bảo mật thông tin cá nhân của nhân viên.
113. Đâu là một ứng dụng của xử lý ngôn ngữ tự nhiên (NLP) trong kinh doanh?
A. Phân tích hình ảnh sản phẩm.
B. Phân tích tình cảm khách hàng từ đánh giá trực tuyến.
C. Dự báo giá cổ phiếu.
D. Tối ưu hóa quy trình sản xuất.
114. Trong kinh tế lượng, phương pháp nào thường được sử dụng để ước lượng mối quan hệ giữa các biến số, đặc biệt khi có sự hiện diện của nhiều biến độc lập?
A. Phân tích chuỗi thời gian.
B. Hồi quy tuyến tính đa biến.
C. Kiểm định giả thuyết.
D. Phân tích phương sai (ANOVA).
115. Trong lĩnh vực bảo hiểm, khoa học dữ liệu được sử dụng để làm gì?
A. Định giá tài sản.
B. Dự đoán xu hướng thị trường chứng khoán.
C. Ước lượng rủi ro và định giá bảo hiểm.
D. Tối ưu hóa danh mục đầu tư.
116. Trong lĩnh vực bán lẻ, ứng dụng nào của khoa học dữ liệu giúp các nhà quản lý đưa ra quyết định về việc đặt sản phẩm nào ở vị trí nào trong cửa hàng?
A. Phân tích giỏ hàng (Market Basket Analysis).
B. Dự báo doanh số bán hàng.
C. Phân tích tình cảm khách hàng.
D. Phân tích когорт (cohort analysis).
117. Trong phân tích dữ liệu, thuật ngữ ‘data mining’ (khai phá dữ liệu) đề cập đến quá trình nào?
A. Thu thập dữ liệu từ các nguồn khác nhau.
B. Tìm kiếm các mẫu, xu hướng và thông tin hữu ích từ lượng lớn dữ liệu.
C. Làm sạch và tiền xử lý dữ liệu.
D. Trực quan hóa dữ liệu.
118. Đâu là một ứng dụng của thị giác máy tính (computer vision) trong kinh doanh?
A. Phân tích văn bản.
B. Nhận diện khuôn mặt khách hàng để cải thiện dịch vụ.
C. Dự đoán doanh số bán hàng.
D. Tối ưu hóa lộ trình vận chuyển.
119. Đâu là một ứng dụng phổ biến của khoa học dữ liệu trong quản lý chuỗi cung ứng?
A. Dự báo nhu cầu.
B. Tối ưu hóa bố trí văn phòng.
C. Phân tích tình cảm khách hàng trên mạng xã hội.
D. Phát triển sản phẩm mới.
120. Chỉ số nào sau đây thường được sử dụng để đánh giá hiệu quả của một mô hình phân loại trong khoa học dữ liệu?
A. R-squared.
B. RMSE (Root Mean Squared Error).
C. Độ chính xác (Accuracy).
D. P-value.
121. Trong phân tích chuỗi cung ứng, chỉ số ‘bullwhip effect’ mô tả hiện tượng gì?
A. Sự chậm trễ trong việc vận chuyển hàng hóa
B. Sự biến động ngày càng tăng của nhu cầu khi di chuyển ngược dòng chuỗi cung ứng
C. Sự thiếu hụt hàng tồn kho
D. Sự cạnh tranh giữa các nhà cung cấp
122. Trong marketing, phân tích RFM (Recency, Frequency, Monetary) được sử dụng để làm gì?
A. Dự báo xu hướng thị trường
B. Phân khúc khách hàng dựa trên hành vi mua hàng
C. Đo lường hiệu quả chiến dịch quảng cáo
D. Phân tích đối thủ cạnh tranh
123. Trong quản lý chuỗi cung ứng, ứng dụng nào sau đây của khoa học dữ liệu giúp tối ưu hóa việc vận chuyển hàng hóa?
A. Dự báo nhu cầu
B. Tối ưu hóa lộ trình vận chuyển
C. Quản lý kho hàng
D. Lựa chọn nhà cung cấp
124. Trong lĩnh vực thương mại điện tử, hệ thống gợi ý (recommendation system) được sử dụng để làm gì?
A. Xử lý thanh toán trực tuyến
B. Gợi ý sản phẩm phù hợp với sở thích và nhu cầu của khách hàng
C. Quản lý kho hàng
D. Theo dõi vận chuyển đơn hàng
125. Trong phân tích kinh doanh, KPI (Key Performance Indicator) là gì?
A. Các chỉ số đánh giá hiệu quả hoạt động chính của doanh nghiệp
B. Các yếu tố rủi ro chính ảnh hưởng đến doanh nghiệp
C. Các quy trình kinh doanh quan trọng của doanh nghiệp
D. Các nguồn lực tài chính chính của doanh nghiệp
126. Trong lĩnh vực Fintech, thuật ngữ ‘algorithmic trading’ đề cập đến điều gì?
A. Giao dịch tài chính được thực hiện tự động dựa trên các thuật toán
B. Phân tích dữ liệu tài chính bằng các thuật toán
C. Quản lý rủi ro tài chính bằng các thuật toán
D. Dự báo thị trường tài chính bằng các thuật toán
127. Trong quản trị rủi ro, phân tích Monte Carlo được sử dụng để làm gì?
A. Xác định các yếu tố rủi ro chính
B. Ước tính xác suất xảy ra rủi ro
C. Mô phỏng các kịch bản khác nhau để đánh giá tác động của rủi ro
D. Xây dựng kế hoạch ứng phó rủi ro
128. Trong lĩnh vực tài chính, mô hình định giá tài sản CAPM (Capital Asset Pricing Model) được sử dụng để làm gì?
A. Dự báo lạm phát
B. Định giá tài sản và tính toán lợi nhuận kỳ vọng
C. Phân tích rủi ro tín dụng
D. Quản lý danh mục đầu tư
129. Trong lĩnh vực nhân sự, ứng dụng nào sau đây của khoa học dữ liệu giúp cải thiện quy trình tuyển dụng?
A. Phân tích hiệu suất làm việc của nhân viên
B. Dự đoán tỷ lệ nghỉ việc của nhân viên
C. Sàng lọc hồ sơ ứng viên tự động
D. Quản lý lương thưởng
130. Trong thống kê, sai số loại I (Type I error) xảy ra khi nào?
A. Bác bỏ giả thuyết null khi nó thực sự đúng
B. Chấp nhận giả thuyết null khi nó thực sự sai
C. Không bác bỏ giả thuyết null khi nó thực sự đúng
D. Bác bỏ giả thuyết null khi nó thực sự sai
131. Trong phân tích mạng xã hội, độ đo ‘centrality’ được sử dụng để làm gì?
A. Đo lường mức độ kết nối giữa các thành viên trong mạng
B. Xác định các thành viên có ảnh hưởng lớn nhất trong mạng
C. Phân cụm các thành viên có chung đặc điểm
D. Dự đoán xu hướng lan truyền thông tin trong mạng
132. Trong kinh tế, chỉ số GDP (Gross Domestic Product) được sử dụng để đo lường điều gì?
A. Tổng sản phẩm quốc dân
B. Tổng thu nhập quốc dân
C. Tổng giá trị hàng hóa và dịch vụ được sản xuất trong một quốc gia trong một khoảng thời gian nhất định
D. Mức sống của người dân
133. Trong học máy, hiện tượng ‘overfitting’ xảy ra khi nào?
A. Mô hình quá đơn giản và không thể học được các mối quan hệ trong dữ liệu
B. Mô hình học quá tốt trên dữ liệu huấn luyện nhưng kém hiệu quả trên dữ liệu mới
C. Dữ liệu huấn luyện bị thiếu
D. Mô hình không hội tụ
134. Trong phân tích dữ liệu, kỹ thuật ‘clustering’ (phân cụm) được sử dụng để làm gì?
A. Dự đoán giá trị của một biến số
B. Phân loại dữ liệu thành các nhóm có đặc điểm tương đồng
C. Tìm kiếm mối quan hệ giữa các biến số
D. Giảm số lượng biến số
135. Chỉ số nào sau đây đo lường mức độ biến động của một cổ phiếu so với thị trường chung?
A. Alpha
B. Beta
C. Tỷ lệ Sharpe
D. Hệ số P/E
136. Trong phân tích rủi ro tín dụng, chỉ số nào sau đây thường được sử dụng để đánh giá khả năng thanh toán nợ của một doanh nghiệp?
A. Tỷ lệ ROE (Return on Equity)
B. Tỷ lệ nợ trên vốn chủ sở hữu (Debt-to-Equity Ratio)
C. Tỷ lệ vòng quay hàng tồn kho
D. Biên lợi nhuận gộp
137. Trong lĩnh vực tài chính, Value at Risk (VaR) là gì?
A. Giá trị thị trường của một tài sản
B. Ước tính tổn thất tối đa có thể xảy ra trong một khoảng thời gian nhất định với một mức độ tin cậy nhất định
C. Lợi nhuận kỳ vọng của một tài sản
D. Rủi ro tín dụng của một khoản vay
138. Đâu là một thách thức lớn khi làm việc với dữ liệu văn bản trong phân tích kinh doanh?
A. Dữ liệu văn bản luôn có cấu trúc rõ ràng
B. Xử lý ngôn ngữ tự nhiên (NLP) còn nhiều hạn chế
C. Dữ liệu văn bản thường có kích thước nhỏ
D. Không cần tiền xử lý dữ liệu văn bản
139. Trong phân tích dữ liệu, kỹ thuật ‘data mining’ được sử dụng để làm gì?
A. Thu thập dữ liệu từ nhiều nguồn khác nhau
B. Làm sạch và chuẩn hóa dữ liệu
C. Khám phá các mẫu, xu hướng và thông tin hữu ích từ lượng lớn dữ liệu
D. Trực quan hóa dữ liệu
140. Trong thống kê, kiểm định giả thuyết (hypothesis testing) được sử dụng để làm gì?
A. Tính toán giá trị trung bình của một mẫu
B. Đánh giá bằng chứng ủng hộ hoặc bác bỏ một giả thuyết về tổng thể
C. Mô tả đặc điểm của một mẫu dữ liệu
D. Tìm kiếm mối quan hệ giữa các biến
141. Đâu là một ứng dụng quan trọng của phân tích chuỗi thời gian trong kinh doanh?
A. Dự báo doanh số bán hàng trong tương lai
B. Phân tích tình cảm khách hàng
C. Phân cụm khách hàng dựa trên hành vi
D. Xây dựng hệ thống gợi ý sản phẩm
142. Trong marketing kỹ thuật số, SEO (Search Engine Optimization) là gì?
A. Tối ưu hóa công cụ tìm kiếm để tăng thứ hạng website
B. Quảng cáo trên mạng xã hội
C. Gửi email marketing hàng loạt
D. Thiết kế website thân thiện với người dùng
143. Trong phân tích độ co giãn của cầu, hệ số co giãn của cầu theo giá (price elasticity of demand) cho biết điều gì?
A. Sự thay đổi của lượng cầu khi thu nhập thay đổi
B. Sự thay đổi của lượng cung khi giá thay đổi
C. Sự thay đổi của lượng cầu khi giá thay đổi
D. Sự thay đổi của lượng cung khi thu nhập thay đổi
144. Trong quản lý dự án, phương pháp ‘Earned Value Management’ (EVM) được sử dụng để làm gì?
A. Lập kế hoạch dự án
B. Theo dõi tiến độ và hiệu suất dự án
C. Quản lý rủi ro dự án
D. Phân bổ nguồn lực dự án
145. Trong machine learning, thuật toán nào thường được sử dụng để phân loại khách hàng thành các nhóm khác nhau dựa trên đặc điểm của họ?
A. Hồi quy tuyến tính
B. Phân cụm K-means
C. Cây quyết định
D. Phân tích phương sai (ANOVA)
146. Phương pháp nào sau đây thường được sử dụng để giảm số lượng biến đầu vào trong mô hình học máy, giúp cải thiện hiệu suất và tránh overfitting?
A. Chuẩn hóa dữ liệu
B. Lựa chọn đặc trưng (Feature Selection)
C. Phân tích hồi quy
D. Phân cụm
147. Trong lĩnh vực bảo hiểm, mô hình nào sau đây thường được sử dụng để dự đoán khả năng xảy ra sự kiện bảo hiểm (ví dụ: tai nạn, bệnh tật)?
A. Mô hình hồi quy tuyến tính
B. Mô hình phân loại (ví dụ: Logistic Regression, Decision Tree)
C. Mô hình chuỗi thời gian
D. Mô hình phân cụm
148. Trong kinh tế lượng, phương pháp ước lượng nào thường được sử dụng để ước tính các hệ số trong mô hình hồi quy tuyến tính?
A. Phương pháp Maximum Likelihood (MLE)
B. Phương pháp Moment Matching
C. Phương pháp Bình phương tối thiểu (OLS)
D. Phương pháp Generalized Method of Moments (GMM)
149. Trong phân tích dữ liệu lớn, kỹ thuật MapReduce được sử dụng chủ yếu cho mục đích gì?
A. Trực quan hóa dữ liệu
B. Làm sạch dữ liệu
C. Xử lý song song và phân tán dữ liệu
D. Xây dựng mô hình dự đoán
150. Đâu là một ứng dụng của khoa học dữ liệu trong việc phát hiện gian lận?
A. Dự báo giá cổ phiếu
B. Phân tích tình cảm khách hàng
C. Phát hiện các giao dịch bất thường trong tài chính
D. Tối ưu hóa chiến dịch marketing