1. Phương pháp ARIMA trong phân tích chuỗi thời gian kết hợp các thành phần nào?
A. Xu hướng, mùa vụ và ngẫu nhiên.
B. Tự hồi quy (AR), tích hợp (I) và trung bình trượt (MA).
C. San bằng mũ đơn giản, san bằng mũ kép và san bằng mũ ba.
D. Phân tích Fourier và wavelet.
2. Mục đích chính của việc kiểm định tính dừng (stationarity) trong phân tích chuỗi thời gian là gì?
A. Để xác định xu hướng dài hạn.
B. Để đảm bảo rằng các đặc tính thống kê của chuỗi không thay đổi theo thời gian.
C. Để loại bỏ tính mùa vụ.
D. Để xác định các điểm bất thường.
3. Phương pháp san bằng mũ (exponential smoothing) được sử dụng để làm gì trong phân tích chuỗi thời gian?
A. Để xác định xu hướng dài hạn.
B. Để loại bỏ tính mùa vụ.
C. Để dự báo các giá trị tương lai dựa trên các giá trị quá khứ.
D. Để xác định các điểm bất thường.
4. Mục đích của việc sử dụng kiểm định Durbin-Watson trong phân tích hồi quy là gì?
A. Để kiểm tra tính chuẩn của sai số.
B. Để kiểm tra hiện tượng đa cộng tuyến.
C. Để kiểm tra tự tương quan của sai số.
D. Để kiểm tra phương sai của sai số không đổi.
5. Trong kiểm định giả thuyết, công suất kiểm định (power of the test) là gì?
A. Xác suất mắc sai số loại I.
B. Xác suất bác bỏ giả thuyết không khi nó sai.
C. Xác suất chấp nhận giả thuyết không khi nó đúng.
D. Mức ý nghĩa của kiểm định.
6. Trong phân tích chuỗi thời gian, ACF (Autocorrelation Function) được sử dụng để làm gì?
A. Để xác định xu hướng dài hạn.
B. Để đo lường mối tương quan giữa các giá trị trong chuỗi thời gian tại các khoảng thời gian khác nhau.
C. Để loại bỏ tính mùa vụ.
D. Để xác định các điểm bất thường.
7. Trong phân tích phương sai (ANOVA), SST (Tổng bình phương) được phân tích thành các thành phần nào?
A. SSR (Tổng bình phương hồi quy) và SSE (Tổng bình phương sai số).
B. SSB (Tổng bình phương giữa các nhóm) và SSW (Tổng bình phương trong các nhóm).
C. SSA (Tổng bình phương yếu tố A) và SSB (Tổng bình phương yếu tố B).
D. MST (Trung bình bình phương tổng) và MSE (Trung bình bình phương sai số).
8. Trong phân tích hồi quy, một biến gây nhiễu (confounding variable) là gì?
A. Một biến không liên quan đến cả biến độc lập và biến phụ thuộc.
B. Một biến ảnh hưởng đến cả biến độc lập và biến phụ thuộc, gây ra mối quan hệ giả tạo.
C. Một biến chỉ ảnh hưởng đến biến độc lập.
D. Một biến chỉ ảnh hưởng đến biến phụ thuộc.
9. Trong phân tích hồi quy đa biến, hiện tượng đa cộng tuyến (multicollinearity) đề cập đến vấn đề gì?
A. Mối quan hệ tuyến tính hoàn hảo giữa biến độc lập và biến phụ thuộc.
B. Mối quan hệ tuyến tính mạnh mẽ giữa các biến độc lập.
C. Phương sai của sai số không đồng nhất.
D. Sự thiếu tính chuẩn của sai số.
10. Trong phân tích hồi quy, khi nào thì cần kiểm tra phương sai của sai số không đổi (homoscedasticity)?
A. Để đảm bảo tính chuẩn của sai số.
B. Để đảm bảo tính chính xác của các ước lượng hệ số.
C. Để đảm bảo rằng sai số không tương quan với nhau.
D. Để đảm bảo rằng phương sai của sai số không thay đổi theo giá trị của biến độc lập.
11. Khi nào thì nên sử dụng kiểm định Kolmogorov-Smirnov?
A. Để so sánh trung bình của hai mẫu độc lập.
B. Để kiểm tra xem một mẫu có tuân theo một phân phối lý thuyết hay không.
C. Để so sánh phương sai của hai mẫu.
D. Để kiểm tra tính độc lập giữa hai biến.
12. Trong phân tích chuỗi thời gian, mục đích của việc phân rã chuỗi thời gian (time series decomposition) là gì?
A. Để xác định xu hướng dài hạn.
B. Để tách chuỗi thời gian thành các thành phần cơ bản như xu hướng, mùa vụ, chu kỳ và ngẫu nhiên.
C. Để dự báo các giá trị tương lai.
D. Để loại bỏ các điểm bất thường.
13. Khi nào thì nên sử dụng kiểm định Wilcoxon signed-rank test?
A. Để so sánh trung bình của hai mẫu độc lập khi dữ liệu tuân theo phân phối chuẩn.
B. Để so sánh trung bình của hai mẫu phụ thuộc khi dữ liệu không tuân theo phân phối chuẩn.
C. Để so sánh trung vị của hai mẫu độc lập khi dữ liệu không tuân theo phân phối chuẩn.
D. Để so sánh trung vị của hai mẫu phụ thuộc khi dữ liệu không tuân theo phân phối chuẩn.
14. Hạn chế chính của việc sử dụng phương pháp trung bình động (moving average) trong dự báo chuỗi thời gian là gì?
A. Nó không thể xử lý dữ liệu có tính mùa vụ.
B. Nó yêu cầu một lượng lớn dữ liệu lịch sử.
C. Nó không thể dự báo xu hướng.
D. Nó gán trọng số bằng nhau cho tất cả các quan sát trong khoảng thời gian.
15. Khi nào thì kiểm định Kruskal-Wallis được sử dụng thay cho ANOVA một yếu tố?
A. Khi kích thước mẫu quá nhỏ.
B. Khi giả định về tính chuẩn của dữ liệu bị vi phạm.
C. Khi có nhiều hơn một yếu tố.
D. Khi dữ liệu là định tính.
16. Trong phân tích hồi quy, khi nào thì cần sử dụng biến giả (dummy variable)?
A. Khi biến độc lập là định lượng.
B. Khi biến phụ thuộc là định tính.
C. Khi biến độc lập là định tính.
D. Khi có hiện tượng đa cộng tuyến.
17. Trong phân tích hồi quy, sai số chuẩn của hệ số (standard error of the coefficient) cho biết điều gì?
A. Mức độ mạnh mẽ của mối quan hệ giữa các biến.
B. Độ lệch chuẩn của ước lượng hệ số.
C. Tỷ lệ phương sai được giải thích bởi mô hình.
D. Giá trị p của hệ số.
18. Trong dự báo chuỗi thời gian, sai số bình phương trung bình gốc (Root Mean Squared Error – RMSE) được sử dụng để làm gì?
A. Để xác định xu hướng dài hạn.
B. Để đo lường độ chính xác của mô hình dự báo.
C. Để loại bỏ tính mùa vụ.
D. Để xác định các điểm bất thường.
19. Trong phân tích hồi quy, hệ số xác định (R-squared) cho biết điều gì?
A. Mức độ mạnh mẽ của mối quan hệ giữa các biến độc lập.
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi các biến độc lập.
C. Độ dốc của đường hồi quy.
D. Sai số chuẩn của ước lượng.
20. Trong phân tích phương sai (ANOVA), giả định nào sau đây là quan trọng nhất về các quần thể?
A. Các quần thể phải có kích thước mẫu bằng nhau.
B. Các quần thể phải có phương sai bằng nhau.
C. Các quần thể phải tuân theo phân phối chuẩn.
D. Các quần thể phải độc lập với nhau.
21. Giá trị p (p-value) trong kiểm định giả thuyết đại diện cho điều gì?
A. Xác suất giả thuyết không là đúng.
B. Xác suất quan sát được kết quả kiểm định (hoặc kết quả cực đoan hơn) nếu giả thuyết không là đúng.
C. Mức ý nghĩa của kiểm định.
D. Xác suất mắc sai số loại I.
22. Trong phân tích chuỗi thời gian, thành phần nào sau đây mô tả sự biến động không đều đặn và không thể dự đoán?
A. Xu hướng (Trend).
B. Tính mùa vụ (Seasonality).
C. Tính chu kỳ (Cyclical).
D. Tính ngẫu nhiên (Irregularity).
23. Trong phân tích hồi quy, ý nghĩa của hệ số chặn (intercept) là gì?
A. Giá trị của biến độc lập khi biến phụ thuộc bằng 0.
B. Giá trị dự đoán của biến phụ thuộc khi tất cả các biến độc lập bằng 0.
C. Độ dốc của đường hồi quy.
D. Mức độ mạnh mẽ của mối quan hệ giữa các biến.
24. Khi nào thì kiểm định Mann-Whitney U được sử dụng?
A. Để so sánh trung bình của hai mẫu độc lập khi dữ liệu tuân theo phân phối chuẩn.
B. Để so sánh trung bình của hai mẫu phụ thuộc khi dữ liệu không tuân theo phân phối chuẩn.
C. Để so sánh trung vị của hai mẫu độc lập khi dữ liệu không tuân theo phân phối chuẩn.
D. Để so sánh phương sai của hai mẫu độc lập.
25. Trong kiểm định giả thuyết, mức ý nghĩa (alpha) đại diện cho điều gì?
A. Xác suất mắc sai số loại II.
B. Xác suất bác bỏ giả thuyết không khi nó đúng (sai số loại I).
C. Xác suất chấp nhận giả thuyết không khi nó đúng.
D. Mức độ tin cậy của kiểm định.
26. Sai số loại II (Type II error) trong kiểm định giả thuyết là gì?
A. Bác bỏ giả thuyết không khi nó đúng.
B. Không bác bỏ giả thuyết không khi nó sai.
C. Chấp nhận giả thuyết thay thế khi nó đúng.
D. Tính toán sai giá trị p.
27. Trong phân tích phương sai hai yếu tố (Two-way ANOVA), điều gì được kiểm tra?
A. Ảnh hưởng của một biến độc lập duy nhất lên biến phụ thuộc.
B. Ảnh hưởng của hai biến độc lập lên biến phụ thuộc và tương tác giữa chúng.
C. Mối quan hệ giữa hai biến độc lập.
D. Sự khác biệt giữa các trung bình của hai mẫu độc lập.
28. Trong phân tích phương sai (ANOVA), hiệu ứng chính (main effect) đề cập đến điều gì?
A. Ảnh hưởng của sự tương tác giữa các biến độc lập.
B. Ảnh hưởng của một biến độc lập duy nhất lên biến phụ thuộc.
C. Sự khác biệt giữa các trung bình của tất cả các nhóm.
D. Tổng phương sai trong dữ liệu.
29. Trong phân tích chuỗi thời gian, PACF (Partial Autocorrelation Function) được sử dụng để làm gì?
A. Để xác định xu hướng dài hạn.
B. Để đo lường mối tương quan giữa các giá trị trong chuỗi thời gian sau khi loại bỏ ảnh hưởng của các giá trị trung gian.
C. Để loại bỏ tính mùa vụ.
D. Để xác định các điểm bất thường.
30. Khi nào thì nên sử dụng kiểm định Friedman thay vì ANOVA lặp lại (Repeated Measures ANOVA)?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi có nhiều hơn hai nhóm.
C. Khi giả định về tính chuẩn của dữ liệu bị vi phạm.
D. Khi kích thước mẫu lớn.
31. Khi nào thì nên sử dụng kiểm định Friedman thay cho ANOVA đo lặp lại (repeated measures ANOVA)?
A. Khi dữ liệu là độc lập.
B. Khi dữ liệu không có phân phối chuẩn hoặc kích thước mẫu nhỏ.
C. Khi phương sai của các nhóm bằng nhau.
D. Khi kích thước mẫu lớn hơn 30.
32. Khi nào thì nên sử dụng kiểm định Chi-bình phương (Chi-square) để kiểm tra tính độc lập giữa hai biến định tính?
A. Khi cả hai biến đều là định lượng.
B. Khi một trong hai biến là định lượng.
C. Khi các giá trị kỳ vọng trong bảng tần số đều lớn hơn 5.
D. Khi kích thước mẫu nhỏ hơn 30.
33. Khi nào thì nên sử dụng kiểm định dấu (sign test) thay cho kiểm định t ghép cặp?
A. Khi dữ liệu là độc lập.
B. Khi dữ liệu không có phân phối chuẩn hoặc kích thước mẫu nhỏ và chỉ quan tâm đến hướng của sự khác biệt.
C. Khi phương sai của các nhóm bằng nhau.
D. Khi kích thước mẫu lớn hơn 30.
34. Hệ số tương quan Pearson đo lường điều gì?
A. Mối quan hệ nhân quả giữa hai biến.
B. Mức độ liên kết tuyến tính giữa hai biến định lượng.
C. Mối quan hệ phi tuyến tính giữa hai biến.
D. Sự khác biệt giữa trung bình của hai biến.
35. Khi nào thì nên sử dụng kiểm định Runs để kiểm tra tính ngẫu nhiên của một chuỗi dữ liệu?
A. Khi dữ liệu có phân phối chuẩn.
B. Khi dữ liệu là định lượng.
C. Khi muốn kiểm tra xem một chuỗi dữ liệu có tuân theo một mẫu ngẫu nhiên hay không.
D. Khi muốn so sánh hai mẫu độc lập.
36. Điều gì xảy ra với sai số loại II (Type II error) khi sức mạnh của kiểm định tăng lên?
A. Sai số loại II tăng lên.
B. Sai số loại II giảm xuống.
C. Sai số loại II không thay đổi.
D. Sai số loại II trở thành 1.
37. Trong phân tích phân biệt (discriminant analysis), mục tiêu chính là gì?
A. Dự đoán giá trị của một biến phụ thuộc liên tục.
B. Phân loại các đối tượng vào các nhóm đã biết trước dựa trên các biến độc lập.
C. Giảm số lượng biến trong một tập dữ liệu.
D. Tìm mối quan hệ giữa các biến.
38. Điều gì xảy ra với giá trị p khi kích thước mẫu tăng lên, giả sử hiệu ứng thực tế không đổi?
A. Giá trị p tăng lên.
B. Giá trị p giảm xuống.
C. Giá trị p không thay đổi.
D. Giá trị p trở thành 1.
39. Điều gì xảy ra với khoảng tin cậy khi kích thước mẫu tăng lên?
A. Khoảng tin cậy trở nên rộng hơn.
B. Khoảng tin cậy trở nên hẹp hơn.
C. Khoảng tin cậy không thay đổi.
D. Khoảng tin cậy biến mất.
40. Trong phân tích hồi quy, hệ số xác định (R-squared) đo lường điều gì?
A. Mức độ mạnh mẽ của mối quan hệ giữa các biến độc lập và biến phụ thuộc.
B. Phần trăm biến thiên của biến phụ thuộc được giải thích bởi các biến độc lập.
C. Độ dốc của đường hồi quy.
D. Sai số chuẩn của ước lượng.
41. Khi nào thì nên sử dụng kiểm định Kolmogorov-Smirnov để kiểm tra tính phù hợp của phân phối?
A. Khi kích thước mẫu nhỏ hơn 30.
B. Khi dữ liệu là định tính.
C. Khi muốn so sánh hai mẫu độc lập.
D. Khi muốn kiểm tra xem một mẫu có tuân theo một phân phối lý thuyết cụ thể hay không.
42. Trong phân tích chuỗi thời gian, thành phần xu hướng (trend component) đề cập đến điều gì?
A. Sự biến động ngắn hạn trong dữ liệu.
B. Sự biến động theo mùa trong dữ liệu.
C. Sự thay đổi dài hạn và có hệ thống trong dữ liệu.
D. Sự biến động ngẫu nhiên trong dữ liệu.
43. Ý nghĩa của việc sử dụng kiểm định một phía (one-tailed test) so với kiểm định hai phía (two-tailed test) là gì?
A. Kiểm định một phía có sức mạnh thống kê cao hơn nếu hướng của hiệu ứng được dự đoán chính xác.
B. Kiểm định hai phía luôn có sức mạnh thống kê cao hơn.
C. Kiểm định một phía chỉ được sử dụng khi kích thước mẫu lớn.
D. Kiểm định hai phía chỉ được sử dụng khi mức ý nghĩa nhỏ.
44. Điều gì xảy ra với độ rộng của khoảng dự đoán (prediction interval) khi độ tin cậy tăng lên?
A. Khoảng dự đoán trở nên rộng hơn.
B. Khoảng dự đoán trở nên hẹp hơn.
C. Khoảng dự đoán không thay đổi.
D. Khoảng dự đoán biến mất.
45. Trong phân tích thành phần chính (principal component analysis – PCA), mục đích chính là gì?
A. Dự đoán giá trị của một biến phụ thuộc.
B. Phân loại các đối tượng thành các nhóm dựa trên sự tương đồng của chúng.
C. Giảm số lượng biến trong một tập dữ liệu trong khi vẫn giữ lại phần lớn thông tin.
D. Kiểm tra mối quan hệ nhân quả giữa các biến.
46. Trong phân tích sống sót (survival analysis), hàm sống sót (survival function) thể hiện điều gì?
A. Xác suất một sự kiện xảy ra tại một thời điểm cụ thể.
B. Xác suất một sự kiện không xảy ra cho đến một thời điểm cụ thể.
C. Thời gian trung bình cho đến khi một sự kiện xảy ra.
D. Tỷ lệ các sự kiện xảy ra trong một khoảng thời gian cụ thể.
47. Trong phân tích hồi quy logistic, biến phụ thuộc là loại biến gì?
A. Biến định lượng liên tục.
B. Biến định tính nhị phân (binary).
C. Biến định tính đa danh nghĩa (nominal).
D. Biến thứ bậc (ordinal).
48. Khi nào thì kiểm định Kruskal-Wallis được sử dụng thay cho kiểm định ANOVA một yếu tố?
A. Khi các quần thể không có phân phối chuẩn.
B. Khi các phương sai của các quần thể bằng nhau.
C. Khi kích thước mẫu của các nhóm bằng nhau.
D. Khi dữ liệu là định lượng.
49. Điều gì xảy ra với độ chính xác của ước lượng (precision of an estimate) khi kích thước mẫu giảm xuống?
A. Độ chính xác của ước lượng tăng lên.
B. Độ chính xác của ước lượng giảm xuống.
C. Độ chính xác của ước lượng không thay đổi.
D. Độ chính xác của ước lượng trở thành 0.
50. Trong phân tích phương sai hai yếu tố (two-way ANOVA), điều gì được kiểm tra ngoài tác động chính của mỗi yếu tố?
A. Tương tác giữa các yếu tố.
B. Phương sai của sai số.
C. Trung bình tổng thể.
D. Độ lệch chuẩn của các mẫu.
51. Trong phân tích phương sai (ANOVA), giả định nào sau đây KHÔNG cần thiết để kết quả kiểm định là hợp lệ?
A. Các quần thể phải có phương sai bằng nhau.
B. Các quần thể phải có phân phối chuẩn.
C. Các mẫu phải được chọn ngẫu nhiên và độc lập.
D. Kích thước mẫu của mỗi nhóm phải bằng nhau.
52. Trong phân tích cụm (cluster analysis), mục tiêu chính là gì?
A. Dự đoán giá trị của một biến phụ thuộc.
B. Phân loại các đối tượng thành các nhóm dựa trên sự tương đồng của chúng.
C. Kiểm tra mối quan hệ nhân quả giữa các biến.
D. Giảm số lượng biến trong một tập dữ liệu.
53. Trong phân tích hồi quy, hệ số phóng đại phương sai (variance inflation factor – VIF) được sử dụng để phát hiện điều gì?
A. Phương sai của sai số.
B. Đa cộng tuyến (multicollinearity) giữa các biến độc lập.
C. Sự không đồng nhất phương sai (heteroscedasticity).
D. Sự tự tương quan (autocorrelation).
54. Trong phân tích hồi quy đa biến, hiện tượng đa cộng tuyến (multicollinearity) đề cập đến điều gì?
A. Mối quan hệ tuyến tính mạnh mẽ giữa các biến độc lập.
B. Mối quan hệ phi tuyến tính giữa biến độc lập và biến phụ thuộc.
C. Sự thay đổi của phương sai sai số theo các giá trị của biến độc lập.
D. Sự tương quan giữa các sai số.
55. Trong phân tích rủi ro, giá trị kỳ vọng (expected value) được tính như thế nào?
A. Bằng cách lấy trung bình của tất cả các kết quả có thể xảy ra.
B. Bằng cách nhân mỗi kết quả có thể xảy ra với xác suất của nó và cộng tất cả các kết quả lại.
C. Bằng cách lấy kết quả có khả năng xảy ra nhất.
D. Bằng cách lấy kết quả tồi tệ nhất có thể xảy ra.
56. Khi nào thì nên sử dụng kiểm định Wilcoxon signed-rank thay cho kiểm định t ghép cặp?
A. Khi dữ liệu là độc lập.
B. Khi dữ liệu không có phân phối chuẩn hoặc kích thước mẫu nhỏ.
C. Khi phương sai của hai nhóm bằng nhau.
D. Khi kích thước mẫu lớn hơn 30.
57. Trong phân tích hồi quy, sai số chuẩn của ước lượng (standard error of the estimate) đo lường điều gì?
A. Mức độ phù hợp của mô hình hồi quy.
B. Độ lệch chuẩn của các sai số.
C. Phương sai của các biến độc lập.
D. Mức độ tương quan giữa các biến.
58. Điều gì xảy ra với sức mạnh của kiểm định (power of a test) khi mức ý nghĩa (alpha) tăng lên?
A. Sức mạnh của kiểm định tăng lên.
B. Sức mạnh của kiểm định giảm xuống.
C. Sức mạnh của kiểm định không thay đổi.
D. Sức mạnh của kiểm định trở thành 0.
59. Ý nghĩa của mức ý nghĩa (alpha) trong kiểm định giả thuyết là gì?
A. Xác suất mắc lỗi loại II (chấp nhận giả thuyết sai).
B. Xác suất mắc lỗi loại I (bác bỏ giả thuyết đúng).
C. Xác suất chấp nhận giả thuyết đúng.
D. Xác suất bác bỏ giả thuyết sai.
60. Khi nào thì sử dụng kiểm định Mann-Whitney U thay cho kiểm định t độc lập?
A. Khi kích thước mẫu lớn hơn 30.
B. Khi các quần thể có phân phối chuẩn.
C. Khi các quần thể không có phân phối chuẩn hoặc kích thước mẫu nhỏ.
D. Khi các phương sai của các quần thể bằng nhau.
61. Trong phân tích sống sót (survival analysis), hàm sống sót (survival function) biểu thị điều gì?
A. Xác suất một sự kiện xảy ra tại một thời điểm cụ thể.
B. Xác suất một sự kiện không xảy ra tại một thời điểm cụ thể.
C. Xác suất một cá thể sống sót vượt qua một thời điểm cụ thể.
D. Thời gian trung bình mà một sự kiện xảy ra.
62. Trong phân tích hồi quy, sai số chuẩn của hệ số hồi quy (standard error of the regression coefficient) đo lường điều gì?
A. Độ lệch chuẩn của biến phụ thuộc.
B. Độ lệch chuẩn của biến độc lập.
C. Độ chính xác của ước lượng hệ số hồi quy.
D. Mức độ phù hợp của mô hình hồi quy.
63. Trong phân tích hồi quy Poisson, biến phụ thuộc là gì?
A. Một biến định lượng liên tục.
B. Một biến đếm (count variable).
C. Một biến định tính có hai giá trị (nhị phân).
D. Một biến định tính có nhiều hơn hai giá trị.
64. Hệ số xác định (R-squared) trong phân tích hồi quy biểu thị điều gì?
A. Độ mạnh của mối quan hệ giữa các biến độc lập.
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi các biến độc lập trong mô hình.
C. Mức độ ý nghĩa thống kê của mô hình hồi quy.
D. Sai số chuẩn của ước lượng.
65. Phương pháp nào sau đây được sử dụng để dự báo chuỗi thời gian?
A. Phân tích phương sai (ANOVA).
B. Hồi quy tuyến tính.
C. Trung bình trượt (Moving average).
D. Kiểm định Chi-square.
66. Giá trị P (P-value) trong kiểm định giả thuyết cho biết điều gì?
A. Xác suất giả thuyết null là đúng.
B. Xác suất mắc lỗi loại I.
C. Xác suất quan sát được kết quả kiểm định (hoặc kết quả cực đoan hơn) nếu giả thuyết null là đúng.
D. Xác suất giả thuyết thay thế là đúng.
67. Giả thuyết null (Null hypothesis) thường phát biểu điều gì?
A. Không có sự khác biệt hoặc không có mối quan hệ.
B. Có sự khác biệt hoặc có mối quan hệ.
C. Kết quả là có ý nghĩa thống kê.
D. Kết quả là không có ý nghĩa thống kê.
68. Trong phân tích hồi quy, hệ số tương quan (r) đo lường điều gì?
A. Độ dốc của đường hồi quy.
B. Mức độ phù hợp của mô hình hồi quy.
C. Sự thay đổi trung bình của biến phụ thuộc khi biến độc lập thay đổi một đơn vị.
D. Mức độ liên kết tuyến tính giữa hai biến.
69. Trong phân tích hồi quy logistic, biến phụ thuộc là gì?
A. Một biến định lượng liên tục.
B. Một biến định tính có hai giá trị (nhị phân).
C. Một biến định tính có nhiều hơn hai giá trị.
D. Một biến thời gian.
70. Trong phân tích chuỗi thời gian, thành phần xu hướng (trend) đề cập đến điều gì?
A. Sự biến động ngẫu nhiên trong chuỗi.
B. Sự biến động theo mùa trong chuỗi.
C. Sự biến động dài hạn, tăng hoặc giảm, trong chuỗi.
D. Sự biến động chu kỳ trong chuỗi.
71. Trong phân tích ANOVA hai yếu tố (two-way ANOVA), chúng ta có thể kiểm tra điều gì?
A. Ảnh hưởng của một yếu tố duy nhất đến biến phụ thuộc.
B. Ảnh hưởng của hai yếu tố đến biến phụ thuộc và tương tác giữa chúng.
C. Mối quan hệ giữa hai biến độc lập.
D. Tính dừng của chuỗi thời gian.
72. Mục đích của việc chuẩn hóa dữ liệu (data normalization) là gì?
A. Loại bỏ các giá trị ngoại lệ.
B. Chuyển đổi dữ liệu về một phạm vi chung, thường là từ 0 đến 1.
C. Đảm bảo dữ liệu tuân theo phân phối chuẩn.
D. Giảm số lượng biến trong tập dữ liệu.
73. Khi nào nên sử dụng kiểm định Mann-Whitney U?
A. Khi so sánh trung bình của hai nhóm độc lập và dữ liệu tuân theo phân phối chuẩn.
B. Khi so sánh trung bình của hai nhóm phụ thuộc và dữ liệu tuân theo phân phối chuẩn.
C. Khi so sánh hai nhóm độc lập và dữ liệu không tuân theo phân phối chuẩn.
D. Khi so sánh hai nhóm phụ thuộc và dữ liệu không tuân theo phân phối chuẩn.
74. Lỗi loại I (Type I error) xảy ra khi nào?
A. Bác bỏ giả thuyết null khi nó thực sự đúng.
B. Không bác bỏ giả thuyết null khi nó thực sự sai.
C. Chọn một thống kê kiểm định không phù hợp.
D. Tính toán giá trị P sai.
75. Trong phân tích phương sai (ANOVA), mục đích chính của việc so sánh các phương sai giữa các nhóm là gì?
A. Kiểm tra xem trung bình của tất cả các nhóm có bằng nhau hay không.
B. Kiểm tra xem phương sai của tất cả các nhóm có bằng nhau hay không.
C. Ước lượng khoảng tin cậy cho trung bình của mỗi nhóm.
D. Xác định nhóm nào có trung bình lớn nhất.
76. Phương pháp nào sau đây được sử dụng để xác định giá trị ngoại lệ (outliers) trong dữ liệu?
A. Hồi quy tuyến tính.
B. Biểu đồ hộp (Box plot).
C. Phân tích phương sai (ANOVA).
D. Kiểm định t-student.
77. Lỗi loại II (Type II error) xảy ra khi nào?
A. Bác bỏ giả thuyết null khi nó thực sự đúng.
B. Không bác bỏ giả thuyết null khi nó thực sự sai.
C. Sử dụng kiểm định thống kê không phù hợp.
D. Tính toán sai giá trị tới hạn.
78. Trong phân tích hồi quy đa biến, hiện tượng đa cộng tuyến (multicollinearity) đề cập đến điều gì?
A. Mối tương quan cao giữa biến phụ thuộc và biến độc lập.
B. Mối tương quan cao giữa các biến độc lập.
C. Phương sai của sai số hồi quy không đồng nhất.
D. Dữ liệu không tuân theo phân phối chuẩn.
79. Khoảng tin cậy (Confidence interval) được sử dụng để làm gì?
A. Ước lượng một giá trị duy nhất của tham số quần thể.
B. Cung cấp một khoảng giá trị mà tham số quần thể có khả năng nằm trong đó với một độ tin cậy nhất định.
C. Kiểm định giả thuyết về tham số quần thể.
D. Tính toán sai số chuẩn.
80. Khi so sánh hai trung bình mẫu độc lập với phương sai chưa biết và không giả định bằng nhau, kiểm định nào phù hợp nhất?
A. Kiểm định t Student giả định phương sai bằng nhau.
B. Kiểm định t Welch.
C. Kiểm định z.
D. Kiểm định Chi-square.
81. Khi nào thì sử dụng kiểm định phi tham số (non-parametric tests) thay vì kiểm định tham số (parametric tests)?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc kích thước mẫu nhỏ.
D. Khi muốn ước lượng tham số của quần thể.
82. Hệ số phóng đại phương sai (Variance Inflation Factor – VIF) được sử dụng để đánh giá điều gì?
A. Phương sai của sai số hồi quy.
B. Mức độ đa cộng tuyến (multicollinearity) trong mô hình hồi quy.
C. Mức độ phù hợp của mô hình hồi quy.
D. Mức độ ý nghĩa thống kê của các biến độc lập.
83. Phương pháp nào sau đây được sử dụng để giảm số chiều của dữ liệu (dimensionality reduction)?
A. Hồi quy tuyến tính.
B. Phân tích phương sai (ANOVA).
C. Phân tích thành phần chính (PCA).
D. Kiểm định t-student.
84. Nếu giá trị P (P-value) nhỏ hơn mức ý nghĩa (significance level) alpha (α), chúng ta nên làm gì?
A. Không bác bỏ giả thuyết null.
B. Bác bỏ giả thuyết null.
C. Chấp nhận giả thuyết null.
D. Tăng kích thước mẫu.
85. Trong phân tích chuỗi thời gian, thành phần mùa vụ (seasonality) đề cập đến điều gì?
A. Sự biến động ngẫu nhiên trong chuỗi.
B. Sự biến động dài hạn, tăng hoặc giảm, trong chuỗi.
C. Sự biến động chu kỳ trong chuỗi.
D. Sự biến động lặp đi lặp lại trong khoảng thời gian cố định (ví dụ: hàng năm, hàng quý, hàng tháng).
86. Khi nào nên sử dụng kiểm định Wilcoxon signed-rank?
A. Khi so sánh trung bình của hai nhóm độc lập và dữ liệu tuân theo phân phối chuẩn.
B. Khi so sánh trung bình của hai nhóm phụ thuộc và dữ liệu tuân theo phân phối chuẩn.
C. Khi so sánh hai nhóm độc lập và dữ liệu không tuân theo phân phối chuẩn.
D. Khi so sánh hai nhóm phụ thuộc và dữ liệu không tuân theo phân phối chuẩn.
87. Trong kiểm định giả thuyết, mức ý nghĩa (significance level) thường được ký hiệu là alpha (α) biểu thị điều gì?
A. Xác suất mắc lỗi loại II.
B. Xác suất bác bỏ giả thuyết null khi nó thực sự đúng (xác suất mắc lỗi loại I).
C. Xác suất không bác bỏ giả thuyết null khi nó thực sự sai.
D. Xác suất giả thuyết null là đúng.
88. Khi nào nên sử dụng kiểm định Chi-square?
A. Khi so sánh trung bình của hai nhóm độc lập.
B. Khi so sánh phương sai của hai nhóm độc lập.
C. Khi phân tích mối quan hệ giữa hai biến định tính.
D. Khi phân tích mối quan hệ giữa hai biến định lượng.
89. Phương pháp nào sau đây được sử dụng để đánh giá độ tin cậy của thang đo (scale reliability)?
A. Hệ số tương quan Pearson.
B. Hệ số Cronbach’s alpha.
C. Kiểm định t-student.
D. Phân tích phương sai (ANOVA).
90. Phương pháp nào thường được sử dụng để kiểm tra tính dừng (stationarity) của chuỗi thời gian?
A. Kiểm định t-student.
B. Kiểm định F.
C. Kiểm định Dickey-Fuller.
D. Kiểm định Chi-square.
91. Trong phân tích chuỗi thời gian, trung bình trượt (moving average) được sử dụng để làm gì?
A. Dự báo giá trị tương lai.
B. Làm mịn dữ liệu và loại bỏ nhiễu.
C. Xác định xu hướng dài hạn.
D. Đo lường tính dừng của chuỗi thời gian.
92. Ý nghĩa của việc sử dụng kiểm định giả thuyết là gì?
A. Để chứng minh giả thuyết null là đúng.
B. Để cung cấp bằng chứng ủng hộ giả thuyết thay thế.
C. Để tính toán trung bình mẫu.
D. Để tránh sai lầm loại I.
93. Phân tích phương sai (ANOVA) được sử dụng để làm gì?
A. So sánh trung bình của hai nhóm.
B. So sánh phương sai của hai nhóm.
C. So sánh trung bình của ba nhóm trở lên.
D. Đo lường mối quan hệ giữa hai biến.
94. Trong thống kê, phương sai (variance) đo lường điều gì?
A. Giá trị trung bình của tập dữ liệu.
B. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình.
C. Mối quan hệ giữa hai biến.
D. Xác suất của một sự kiện.
95. Giá trị p trong kiểm định giả thuyết đại diện cho điều gì?
A. Xác suất giả thuyết null là đúng.
B. Xác suất quan sát được kết quả, hoặc kết quả cực đoan hơn, nếu giả thuyết null là đúng.
C. Mức ý nghĩa của kiểm định.
D. Xác suất mắc sai lầm loại II.
96. Kiểm định Chi-bình phương được sử dụng để làm gì?
A. So sánh trung bình của hai nhóm.
B. So sánh phương sai của hai nhóm.
C. Kiểm tra sự độc lập giữa hai biến phân loại.
D. Đo lường mối quan hệ tuyến tính giữa hai biến.
97. Trong phân tích hồi quy, hiện tượng đa cộng tuyến (multicollinearity) đề cập đến điều gì?
A. Mối quan hệ phi tuyến tính giữa các biến.
B. Mối quan hệ tuyến tính cao giữa các biến độc lập.
C. Sai số chuẩn lớn của các hệ số.
D. Giá trị p không có ý nghĩa.
98. Khoảng tin cậy 95% có nghĩa là gì?
A. Có 95% khả năng trung bình mẫu nằm trong khoảng tin cậy.
B. Có 95% khả năng trung bình quần thể nằm trong khoảng tin cậy.
C. Khoảng tin cậy chứa 95% dữ liệu trong mẫu.
D. Sai số chuẩn bằng 5%.
99. Phương pháp nào sau đây được sử dụng để giảm phương sai trong ước tính Monte Carlo?
A. Lấy mẫu ngẫu nhiên đơn giản.
B. Lấy mẫu phân tầng.
C. Lấy mẫu cụm.
D. Lấy mẫu thuận tiện.
100. Trong phân tích hồi quy, sai số chuẩn của ước lượng (standard error of the estimate) đo lường điều gì?
A. Độ lệch chuẩn của biến phụ thuộc.
B. Độ lệch chuẩn của các sai số.
C. Độ lệch chuẩn của biến độc lập.
D. Độ lệch chuẩn của các hệ số hồi quy.
101. Trong phân tích hồi quy, biến giả (dummy variable) được sử dụng để làm gì?
A. Để biểu diễn biến định lượng.
B. Để biểu diễn biến định tính.
C. Để giảm đa cộng tuyến.
D. Để tăng hệ số xác định.
102. Trong hồi quy tuyến tính, sai số chuẩn của hệ số hồi quy ước tính điều gì?
A. Độ lệch chuẩn của biến phụ thuộc.
B. Độ lệch chuẩn của các sai số.
C. Ước tính độ lệch chuẩn của phân phối lấy mẫu của hệ số.
D. Trung bình của các sai số.
103. Trong phân tích phương sai (ANOVA), giả định nào sau đây KHÔNG cần thiết?
A. Các quần thể có phương sai bằng nhau.
B. Các quần thể có phân phối chuẩn.
C. Các mẫu được chọn độc lập.
D. Kích thước mẫu bằng nhau giữa các nhóm.
104. Điều gì xảy ra với khoảng tin cậy khi cỡ mẫu tăng lên?
A. Khoảng tin cậy trở nên rộng hơn.
B. Khoảng tin cậy trở nên hẹp hơn.
C. Khoảng tin cậy không thay đổi.
D. Khoảng tin cậy trở nên không xác định.
105. Khi nào nên sử dụng kiểm định Mann-Whitney U?
A. Khi so sánh trung bình của hai mẫu liên quan.
B. Khi so sánh trung bình của hai mẫu độc lập tuân theo phân phối chuẩn.
C. Khi so sánh trung bình của hai mẫu độc lập không tuân theo phân phối chuẩn.
D. Khi so sánh phương sai của hai mẫu độc lập.
106. Khái niệm ‘power’ của một kiểm định thống kê là gì?
A. Xác suất mắc sai lầm loại I.
B. Xác suất mắc sai lầm loại II.
C. Xác suất bác bỏ đúng giả thuyết null khi nó sai.
D. Mức ý nghĩa của kiểm định.
107. Khi nào nên sử dụng kiểm định t một phía thay vì kiểm định t hai phía?
A. Khi bạn quan tâm đến cả hai hướng của sự khác biệt.
B. Khi bạn chỉ quan tâm đến một hướng của sự khác biệt.
C. Khi cỡ mẫu nhỏ.
D. Khi phương sai không bằng nhau.
108. Ý nghĩa của hệ số chặn (intercept) trong hồi quy tuyến tính là gì?
A. Giá trị của biến độc lập khi biến phụ thuộc bằng 0.
B. Giá trị của biến phụ thuộc khi biến độc lập bằng 0.
C. Mức độ thay đổi của biến phụ thuộc khi biến độc lập tăng một đơn vị.
D. Phương sai của các sai số.
109. Phương pháp kiểm định nào sau đây thích hợp để so sánh tỷ lệ của hai quần thể?
A. Kiểm định t.
B. Kiểm định Chi-bình phương.
C. Phân tích phương sai (ANOVA).
D. Phân tích hồi quy.
110. Khi nào nên sử dụng kiểm định Kruskal-Wallis?
A. Khi so sánh trung bình của hai nhóm độc lập.
B. Khi so sánh trung bình của hai nhóm liên quan.
C. Khi so sánh trung bình của ba nhóm trở lên không tuân theo phân phối chuẩn.
D. Khi so sánh phương sai của ba nhóm trở lên.
111. Khi nào nên sử dụng kiểm định phi tham số thay vì kiểm định tham số?
A. Khi cỡ mẫu lớn.
B. Khi dữ liệu tuân theo phân phối chuẩn.
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc cỡ mẫu nhỏ.
D. Khi phương sai của các quần thể bằng nhau.
112. Kiểm định Kolmogorov-Smirnov được sử dụng để làm gì?
A. So sánh trung bình của hai nhóm.
B. So sánh phương sai của hai nhóm.
C. Kiểm tra xem một mẫu có tuân theo một phân phối cụ thể hay không.
D. Đo lường mối quan hệ giữa hai biến.
113. Trong phân tích hồi quy, hệ số xác định (R-squared) đại diện cho điều gì?
A. Phương sai của biến phụ thuộc.
B. Tỷ lệ phương sai trong biến phụ thuộc được giải thích bởi biến độc lập.
C. Sai số chuẩn của hồi quy.
D. Mức ý nghĩa của hồi quy.
114. Điều gì xảy ra với sai số loại II khi tăng kích thước mẫu?
A. Sai số loại II tăng.
B. Sai số loại II giảm.
C. Sai số loại II không đổi.
D. Sai số loại II trở nên không xác định.
115. Khi so sánh hai trung bình mẫu độc lập với phương sai không bằng nhau, kiểm định nào phù hợp nhất?
A. Kiểm định t cặp.
B. Kiểm định t Student.
C. Kiểm định t Welch.
D. Kiểm định z.
116. Trong kiểm định giả thuyết, mức ý nghĩa (alpha) đại diện cho điều gì?
A. Xác suất mắc sai lầm loại II.
B. Xác suất bác bỏ đúng giả thuyết null.
C. Xác suất mắc sai lầm loại I.
D. Xác suất không bác bỏ giả thuyết null khi nó đúng.
117. Phương pháp nào sau đây được sử dụng để kiểm tra tính dừng (stationarity) của chuỗi thời gian?
A. Kiểm định Chi-bình phương.
B. Kiểm định t.
C. Kiểm định Augmented Dickey-Fuller (ADF).
D. Phân tích phương sai (ANOVA).
118. Trong phân tích chuỗi thời gian, tự tương quan (autocorrelation) đề cập đến điều gì?
A. Mối quan hệ giữa hai chuỗi thời gian khác nhau.
B. Mối quan hệ giữa các giá trị của cùng một chuỗi thời gian tại các thời điểm khác nhau.
C. Sự thay đổi ngẫu nhiên trong chuỗi thời gian.
D. Xu hướng dài hạn trong chuỗi thời gian.
119. Hệ số tương quan Pearson đo lường điều gì?
A. Mối quan hệ nhân quả giữa hai biến.
B. Mức độ biến động của một biến.
C. Mức độ của mối quan hệ tuyến tính giữa hai biến.
D. Sự khác biệt giữa trung bình của hai biến.
120. Sai lầm loại I trong kiểm định giả thuyết là gì?
A. Bác bỏ giả thuyết null khi nó thực sự đúng.
B. Không bác bỏ giả thuyết null khi nó thực sự sai.
C. Chấp nhận giả thuyết thay thế khi nó thực sự sai.
D. Tính toán sai giá trị p.
121. Phương pháp nào được sử dụng để kiểm tra sự hiện diện của đa cộng tuyến (multicollinearity) trong mô hình hồi quy?
A. Kiểm định F.
B. Kiểm định t.
C. Hệ số phóng đại phương sai (Variance Inflation Factor – VIF).
D. Biểu đồ phân tán.
122. Trong mô hình hồi quy, ‘biến trễ’ (lagged variable) là gì?
A. Một biến bị bỏ qua.
B. Một biến có giá trị bị trễ so với thời điểm hiện tại.
C. Một biến có giá trị bằng 0.
D. Một biến không quan trọng.
123. Biến giả (Dummy variable) được sử dụng để biểu diễn điều gì trong mô hình hồi quy?
A. Biến liên tục.
B. Biến định tính.
C. Biến trễ.
D. Biến ngoại sinh.
124. Giả định nào sau đây KHÔNG phải là một trong các giả định của mô hình hồi quy tuyến tính cổ điển (Classical Linear Regression Model – CLRM)?
A. Sai số có phân phối chuẩn.
B. Phương sai của sai số là hằng số (homoscedasticity).
C. Không có tự tương quan giữa các sai số.
D. Các biến độc lập phải có tương quan với nhau.
125. Điều gì xảy ra với khoảng tin cậy của hệ số hồi quy khi tăng kích thước mẫu?
A. Khoảng tin cậy trở nên rộng hơn.
B. Khoảng tin cậy không thay đổi.
C. Khoảng tin cậy trở nên hẹp hơn.
D. Không thể xác định.
126. Điều gì là quan trọng nhất khi diễn giải kết quả của một mô hình hồi quy?
A. Chỉ tập trung vào R-squared.
B. Chỉ tập trung vào giá trị p.
C. Xem xét cả ý nghĩa thống kê và ý nghĩa thực tế của các hệ số.
D. Bỏ qua các giả định của mô hình.
127. Trong mô hình hồi quy, giá trị p (p-value) được sử dụng để đánh giá điều gì?
A. Mức độ quan trọng của biến phụ thuộc.
B. Mức ý nghĩa thống kê của hệ số hồi quy.
C. Độ mạnh của mối quan hệ giữa các biến.
D. Phương sai của sai số.
128. Trong mô hình hồi quy, sai số chuẩn (standard error) của hệ số hồi quy ước lượng điều gì?
A. Độ lệch chuẩn của biến phụ thuộc.
B. Độ lệch chuẩn của sai số.
C. Độ lệch chuẩn của hệ số hồi quy ước lượng.
D. Giá trị trung bình của sai số.
129. Kiểm định Breusch-Pagan được sử dụng để kiểm tra điều gì?
A. Tự tương quan.
B. Đa cộng tuyến.
C. Phương sai sai số thay đổi.
D. Tính dừng của chuỗi thời gian.
130. Trong mô hình hồi quy, phương pháp bình phương tối thiểu (Ordinary Least Squares – OLS) tìm cách tối thiểu hóa điều gì?
A. Tổng giá trị tuyệt đối của sai số.
B. Tổng bình phương sai số.
C. Tổng sai số.
D. Phương sai của sai số.
131. Mục tiêu của việc xây dựng mô hình hồi quy là gì?
A. Dự đoán giá trị của biến độc lập.
B. Mô tả mối quan hệ giữa các biến.
C. Kiểm tra tính dừng của chuỗi thời gian.
D. Phân tích phương sai.
132. Trong phân tích hồi quy, hệ số xác định (R-squared) đo lường điều gì?
A. Độ mạnh của mối quan hệ nhân quả giữa các biến.
B. Phần trăm biến thiên của biến phụ thuộc được giải thích bởi các biến độc lập trong mô hình.
C. Mức ý nghĩa thống kê của các biến độc lập.
D. Độ chính xác của các hệ số hồi quy.
133. Kiểm định White được sử dụng để kiểm tra điều gì?
A. Tự tương quan.
B. Đa cộng tuyến.
C. Phương sai sai số thay đổi.
D. Tính dừng của chuỗi thời gian.
134. Trong hồi quy logistic, hàm liên kết (link function) được sử dụng để làm gì?
A. Biến đổi biến phụ thuộc để có phân phối chuẩn.
B. Liên kết biến phụ thuộc nhị phân với các biến độc lập.
C. Khắc phục hiện tượng phương sai sai số thay đổi.
D. Biểu diễn mối quan hệ phi tuyến tính.
135. Giả sử bạn có một mô hình hồi quy tuyến tính đơn giản với một biến độc lập. Nếu hệ số của biến độc lập là 2.5, điều này có nghĩa là gì?
A. Khi biến độc lập tăng 1 đơn vị, biến phụ thuộc giảm 2.5 đơn vị.
B. Khi biến độc lập tăng 1 đơn vị, biến phụ thuộc tăng 2.5 đơn vị.
C. Biến độc lập giải thích 2.5% sự biến thiên của biến phụ thuộc.
D. Mối quan hệ giữa hai biến là không đáng kể.
136. Trong phân tích chuỗi thời gian, hàm tự tương quan (Autocorrelation Function – ACF) được sử dụng để xác định điều gì?
A. Mối quan hệ giữa các biến khác nhau tại cùng một thời điểm.
B. Mối quan hệ giữa các giá trị của một biến tại các thời điểm khác nhau.
C. Phương sai của sai số.
D. Xu hướng của chuỗi thời gian.
137. Nếu bạn nghi ngờ rằng phương sai của sai số thay đổi theo giá trị của một biến độc lập, bạn nên sử dụng phương pháp nào để khắc phục?
A. Hồi quy tuyến tính đơn giản.
B. Hồi quy đa thức.
C. Hồi quy bình phương tối thiểu tổng quát (Generalized Least Squares – GLS).
D. Hồi quy Ridge.
138. Khi nào thì nên sử dụng mô hình ‘tác động cố định’ (fixed effects model) so với mô hình ‘tác động ngẫu nhiên’ (random effects model) trong phân tích dữ liệu bảng?
A. Khi các tác động riêng lẻ có tương quan với các biến độc lập.
B. Khi các tác động riêng lẻ không có tương quan với các biến độc lập.
C. Khi kích thước mẫu nhỏ.
D. Khi có phương sai sai số thay đổi.
139. Trong phân tích hồi quy, ‘ngoại lệ’ (outlier) là gì?
A. Một biến không quan trọng.
B. Một điểm dữ liệu có giá trị khác biệt đáng kể so với các điểm dữ liệu khác.
C. Một biến giả.
D. Một điểm dữ liệu có giá trị bằng 0.
140. Nếu bạn có một biến phụ thuộc liên tục và một biến độc lập định tính với ba nhóm, bạn cần bao nhiêu biến giả để đưa biến độc lập này vào mô hình hồi quy?
141. Khi nào thì nên sử dụng hồi quy đa thức (polynomial regression)?
A. Khi mối quan hệ giữa các biến là tuyến tính.
B. Khi mối quan hệ giữa các biến là phi tuyến tính.
C. Khi có đa cộng tuyến.
D. Khi có phương sai sai số thay đổi.
142. Kiểm định Durbin-Watson được sử dụng để kiểm tra điều gì?
A. Đa cộng tuyến.
B. Phương sai sai số thay đổi.
C. Tự tương quan.
D. Phân phối chuẩn của sai số.
143. Điều gì là ‘bẫy biến giả’ (dummy variable trap) trong phân tích hồi quy?
A. Sử dụng quá ít biến giả.
B. Sử dụng quá nhiều biến giả, dẫn đến đa cộng tuyến hoàn hảo.
C. Không sử dụng biến giả.
D. Sử dụng biến giả không đúng cách.
144. Điều gì xảy ra nếu bạn hồi quy một biến lên chính nó?
A. Bạn sẽ nhận được một mô hình không có ý nghĩa.
B. Bạn sẽ nhận được hệ số bằng 0.
C. Bạn sẽ nhận được hệ số bằng 1.
D. Bạn sẽ không thể thực hiện hồi quy.
145. Trong phân tích hồi quy, biến tương tác (interaction variable) được sử dụng để làm gì?
A. Biểu diễn mối quan hệ phi tuyến tính.
B. Đo lường tác động kết hợp của hai hoặc nhiều biến độc lập.
C. Khắc phục hiện tượng đa cộng tuyến.
D. Biểu diễn biến định tính.
146. Khi nào thì mô hình hồi quy được coi là ‘quá khớp’ (overfitting)?
A. Khi mô hình có quá ít biến.
B. Khi mô hình có quá nhiều biến và phù hợp quá chặt với dữ liệu huấn luyện.
C. Khi R-squared bằng 0.
D. Khi có đa cộng tuyến.
147. Hệ số tương quan (correlation coefficient) đo lường điều gì?
A. Mối quan hệ nhân quả giữa hai biến.
B. Mức độ biến động của một biến.
C. Mức độ liên kết tuyến tính giữa hai biến.
D. Độ dốc của đường hồi quy.
148. Khi nào thì hồi quy logistic (logistic regression) được sử dụng thay vì hồi quy tuyến tính?
A. Khi biến phụ thuộc là biến định lượng.
B. Khi biến phụ thuộc là biến định tính nhị phân.
C. Khi có đa cộng tuyến.
D. Khi có phương sai sai số thay đổi.
149. Trong phân tích hồi quy, hiện tượng ‘bỏ sót biến’ (omitted variable bias) xảy ra khi nào?
A. Khi một biến quan trọng không được đưa vào mô hình.
B. Khi một biến không quan trọng được đưa vào mô hình.
C. Khi có đa cộng tuyến.
D. Khi có phương sai sai số thay đổi.
150. Điều gì xảy ra nếu bạn đưa các biến độc lập không liên quan vào mô hình hồi quy?
A. R-squared sẽ luôn tăng.
B. R-squared sẽ luôn giảm.
C. R-squared điều chỉnh (Adjusted R-squared) sẽ tăng.
D. R-squared điều chỉnh (Adjusted R-squared) có thể giảm.