1. Trong mô hình hồi quy đa biến, biến giả (dummy variable) được sử dụng để làm gì?
A. Để biểu diễn các biến định tính.
B. Để loại bỏ các giá trị ngoại lệ.
C. Để chuẩn hóa dữ liệu.
D. Để tăng kích thước mẫu.
2. Hệ số tự tương quan (autocorrelation coefficient) đo lường điều gì?
A. Mức độ tương quan giữa hai chuỗi thời gian khác nhau.
B. Mức độ tương quan giữa các giá trị của một chuỗi thời gian tại các thời điểm khác nhau.
C. Mức độ biến động của chuỗi thời gian.
D. Mức độ xu hướng của chuỗi thời gian.
3. Nếu bạn nghi ngờ có hiện tượng tự tương quan (autocorrelation) trong mô hình hồi quy của mình, bạn nên sử dụng kiểm định nào?
A. Kiểm định Levene.
B. Kiểm định Durbin-Watson.
C. Kiểm định Kolmogorov-Smirnov.
D. Kiểm định Kruskal-Wallis.
4. Điều gì xảy ra với độ dài dự báo (forecast horizon) khi sử dụng phương pháp san bằng mũ?
A. Độ dài dự báo càng dài, độ chính xác càng cao.
B. Độ dài dự báo càng dài, độ chính xác càng giảm.
C. Độ dài dự báo không ảnh hưởng đến độ chính xác.
D. Độ dài dự báo chỉ ảnh hưởng đến độ chính xác trong các chuỗi thời gian có tính mùa vụ.
5. Trong phân tích hồi quy, nếu bạn nghi ngờ rằng có một mối quan hệ phi tuyến tính giữa biến độc lập và biến phụ thuộc, bạn có thể làm gì?
A. Loại bỏ biến độc lập.
B. Sử dụng mô hình hồi quy tuyến tính đơn giản.
C. Biến đổi biến độc lập (ví dụ: sử dụng logarit hoặc đa thức).
D. Tăng kích thước mẫu.
6. Trong phân tích hồi quy, điều gì xảy ra nếu bạn bỏ qua một biến quan trọng?
A. Các ước lượng hệ số sẽ không chệch.
B. Phương sai của các ước lượng hệ số sẽ giảm.
C. Các ước lượng hệ số có thể bị chệch.
D. R-squared sẽ tăng.
7. Khi nào thì mô hình hồi quy được coi là ‘phù hợp tốt’ (good fit)?
A. Khi các hệ số hồi quy đều dương.
B. Khi R-squared gần bằng 0.
C. Khi R-squared gần bằng 1.
D. Khi tất cả các biến độc lập đều có ý nghĩa thống kê.
8. Trong phân tích chuỗi thời gian, một ‘white noise’ process là gì?
A. Một chuỗi thời gian có xu hướng tăng đều đặn.
B. Một chuỗi thời gian có tính mùa vụ rõ rệt.
C. Một chuỗi thời gian mà các giá trị không tương quan với nhau và có phương sai không đổi.
D. Một chuỗi thời gian chứa nhiều giá trị ngoại lệ.
9. Sai số chuẩn của ước lượng (standard error of estimate) đo lường điều gì?
A. Mức độ biến động của các hệ số hồi quy.
B. Độ lệch trung bình của các giá trị thực tế so với các giá trị dự đoán.
C. Mức độ tương quan giữa các biến độc lập.
D. Mức độ ý nghĩa thống kê của mô hình.
10. Điều gì là quan trọng nhất khi lựa chọn giữa mô hình ARIMA và mô hình san bằng mũ để dự báo?
A. Kích thước mẫu.
B. Sự hiện diện của xu hướng và tính mùa vụ.
C. Số lượng biến độc lập.
D. Mức ý nghĩa thống kê của các hệ số.
11. Điều gì xảy ra với khoảng tin cậy của hệ số hồi quy khi kích thước mẫu tăng lên?
A. Khoảng tin cậy trở nên rộng hơn.
B. Khoảng tin cậy trở nên hẹp hơn.
C. Khoảng tin cậy không đổi.
D. Khoảng tin cậy dao động ngẫu nhiên.
12. Khi nào bạn nên sử dụng mô hình Logit thay vì mô hình hồi quy tuyến tính thông thường?
A. Khi biến phụ thuộc là biến định lượng liên tục.
B. Khi biến phụ thuộc là biến định tính nhị phân.
C. Khi các biến độc lập có tương quan cao.
D. Khi phương sai của sai số thay đổi.
13. Giá trị của thống kê Durbin-Watson gần bằng 2 cho thấy điều gì?
A. Có tự tương quan dương.
B. Có tự tương quan âm.
C. Không có tự tương quan.
D. Có phương sai sai số thay đổi.
14. Mục đích của việc sử dụng biến tương tác (interaction variable) trong mô hình hồi quy là gì?
A. Để giảm đa cộng tuyến.
B. Để kiểm tra xem tác động của một biến độc lập lên biến phụ thuộc có phụ thuộc vào giá trị của một biến độc lập khác hay không.
C. Để chuẩn hóa dữ liệu.
D. Để tăng kích thước mẫu.
15. Trong phân tích chuỗi thời gian, một chu kỳ (cycle) khác với một xu hướng (trend) như thế nào?
A. Chu kỳ có độ dài cố định, trong khi xu hướng thì không.
B. Chu kỳ là ngắn hạn, trong khi xu hướng là dài hạn.
C. Chu kỳ có tính lặp lại nhưng không nhất thiết đều đặn, trong khi xu hướng biểu thị sự thay đổi dài hạn và có hệ thống.
D. Chu kỳ chỉ xuất hiện trong dữ liệu kinh tế, trong khi xu hướng xuất hiện trong mọi loại dữ liệu.
16. Trong kiểm định giả thuyết về hệ số hồi quy, giả thuyết không (null hypothesis) thường là gì?
A. Hệ số hồi quy bằng 1.
B. Hệ số hồi quy lớn hơn 0.
C. Hệ số hồi quy nhỏ hơn 0.
D. Hệ số hồi quy bằng 0.
17. Phương pháp san bằng mũ (exponential smoothing) được sử dụng để làm gì?
A. Để loại bỏ tính mùa vụ trong chuỗi thời gian.
B. Để dự báo các giá trị tương lai dựa trên các giá trị quá khứ.
C. Để xác định các điểm uốn trong chuỗi thời gian.
D. Để phân tích mối tương quan giữa các chuỗi thời gian khác nhau.
18. Trong phân tích hồi quy, hệ số xác định (R-squared) đo lường điều gì?
A. Độ mạnh của mối quan hệ tuyến tính giữa các biến độc lập.
B. Phần trăm biến thiên của biến phụ thuộc được giải thích bởi các biến độc lập.
C. Mức ý nghĩa thống kê của các biến độc lập.
D. Sai số chuẩn của ước lượng.
19. Trong phân tích hồi quy, một giá trị ngoại lệ (outlier) là gì?
A. Một giá trị có tần suất xuất hiện cao.
B. Một giá trị nằm gần trung bình của dữ liệu.
C. Một giá trị khác biệt đáng kể so với các giá trị khác trong tập dữ liệu.
D. Một giá trị bị thiếu trong tập dữ liệu.
20. Hiện tượng đa cộng tuyến (multicollinearity) xảy ra khi nào?
A. Khi các biến độc lập trong mô hình hồi quy có mối tương quan cao với nhau.
B. Khi phương sai của sai số không đổi.
C. Khi sai số có phân phối chuẩn.
D. Khi không có biến độc lập nào tương quan với biến phụ thuộc.
21. Trong phân tích chuỗi thời gian, phương pháp nào phù hợp nhất để dự báo doanh số bán hàng của một sản phẩm mới?
A. ARIMA.
B. San bằng mũ (Exponential Smoothing).
C. Phân tích hồi quy với các biến bên ngoài.
D. Phân tích đường dẫn (Path Analysis).
22. Điều gì xảy ra với sai số chuẩn của các hệ số hồi quy khi đa cộng tuyến trở nên nghiêm trọng hơn?
A. Sai số chuẩn giảm.
B. Sai số chuẩn tăng.
C. Sai số chuẩn không đổi.
D. Sai số chuẩn trở nên không xác định.
23. Giả sử bạn có một mô hình hồi quy tuyến tính đơn giản. Nếu hệ số góc (slope) là 0, điều này có nghĩa là gì?
A. Không có mối quan hệ nào giữa biến độc lập và biến phụ thuộc.
B. Biến độc lập hoàn toàn giải thích được biến phụ thuộc.
C. Biến phụ thuộc không đổi.
D. Mô hình hồi quy là phi tuyến tính.
24. Trong phân tích chuỗi thời gian, hàm tự tương quan (ACF) và hàm tự tương quan từng phần (PACF) được sử dụng để làm gì?
A. Để kiểm tra tính dừng.
B. Để xác định bậc của mô hình ARIMA.
C. Để loại bỏ tính mùa vụ.
D. Để dự báo các giá trị tương lai.
25. Trong phân tích chuỗi thời gian, thành phần nào sau đây biểu thị xu hướng dài hạn của dữ liệu?
A. Tính mùa vụ (Seasonality).
B. Chu kỳ (Cycle).
C. Xu hướng (Trend).
D. Tính ngẫu nhiên (Irregularity).
26. Phương pháp ARIMA được sử dụng để làm gì trong phân tích chuỗi thời gian?
A. Để xác định các giá trị ngoại lệ.
B. Để dự báo các giá trị tương lai dựa trên các thành phần tự hồi quy, tích hợp và trung bình trượt.
C. Để làm mịn dữ liệu.
D. Để phân tích sự phụ thuộc giữa hai chuỗi thời gian.
27. Phương pháp nào thường được sử dụng để phát hiện hiện tượng phương sai sai số thay đổi (heteroscedasticity)?
A. Kiểm định Shapiro-Wilk.
B. Kiểm định Durbin-Watson.
C. Kiểm định Breusch-Pagan.
D. Kiểm định t-student.
28. Trong phân tích chuỗi thời gian, tính mùa vụ (seasonality) đề cập đến điều gì?
A. Sự biến động ngẫu nhiên trong dữ liệu.
B. Các mẫu lặp đi lặp lại trong một khoảng thời gian cố định.
C. Xu hướng dài hạn của dữ liệu.
D. Các chu kỳ kinh tế kéo dài nhiều năm.
29. Tại sao cần phải kiểm tra tính dừng (stationarity) của chuỗi thời gian trước khi áp dụng mô hình ARIMA?
A. Vì mô hình ARIMA chỉ phù hợp với các chuỗi thời gian dừng.
B. Vì tính dừng giúp loại bỏ tính mùa vụ.
C. Vì tính dừng giúp tăng độ chính xác của dự báo.
D. Vì tính dừng giúp đơn giản hóa việc tính toán các hệ số tự tương quan.
30. Khi thực hiện hồi quy, bạn thấy rằng các phần dư (residuals) có một mô hình rõ ràng (ví dụ: hình chữ U). Điều này cho thấy điều gì?
A. Mô hình có phương sai sai số không đổi.
B. Mô hình có tự tương quan.
C. Mô hình có thể bỏ sót một biến quan trọng hoặc mối quan hệ phi tuyến tính.
D. Mô hình có đa cộng tuyến.
31. Khi nào thì nên sử dụng kiểm định Fisher’s exact thay vì kiểm định Chi bình phương?
A. Khi kích thước mẫu lớn.
B. Khi giá trị kỳ vọng trong bất kỳ ô nào của bảng contingency nhỏ hơn 5.
C. Khi các biến có phân phối chuẩn.
D. Khi các biến là định lượng.
32. Kiểm định nào sau đây được sử dụng để kiểm tra sự khác biệt giữa quan sát và giá trị kỳ vọng?
A. Kiểm định t.
B. Kiểm định Z.
C. Kiểm định Chi bình phương.
D. Kiểm định F.
33. Phương pháp nào sau đây thường được sử dụng để làm mịn chuỗi thời gian và loại bỏ nhiễu?
A. Hồi quy tuyến tính.
B. Trung bình động (Moving average).
C. Kiểm định Chi bình phương.
D. Phân tích phương sai (ANOVA).
34. Trong kiểm định Chi bình phương, giá trị kỳ vọng được tính như thế nào?
A. (Tổng hàng + Tổng cột) / Tổng số quan sát
B. (Tổng hàng x Tổng cột) / Tổng số quan sát
C. Tổng hàng / Tổng số quan sát
D. Tổng cột / Tổng số quan sát
35. Tình huống nào sau đây phù hợp nhất để sử dụng kiểm định Chi bình phương?
A. So sánh trung bình của hai nhóm độc lập.
B. Xác định mối quan hệ giữa hai biến định lượng.
C. So sánh tỷ lệ của hai nhóm.
D. Xác định mối quan hệ giữa hai biến định tính.
36. Mô hình ARIMA (Autoregressive Integrated Moving Average) được sử dụng để làm gì?
A. Phân tích phương sai.
B. Dự báo chuỗi thời gian.
C. Kiểm định giả thuyết.
D. Phân tích hồi quy.
37. Thành phần nào của chuỗi thời gian thể hiện sự biến động dài hạn và nhất quán trong dữ liệu?
A. Tính thời vụ (Seasonality).
B. Xu hướng (Trend).
C. Chu kỳ (Cyclical).
D. Ngẫu nhiên (Randomness).
38. Trong phân tích phương sai (ANOVA), yếu tố nào sau đây KHÔNG ảnh hưởng đến giá trị thống kê F?
A. Tổng số quan sát trong mẫu.
B. Phương sai giữa các nhóm.
C. Phương sai trong mỗi nhóm.
D. Kích thước của các nhóm.
39. Trong kiểm định Chi bình phương về tính độc lập, giả thuyết không (null hypothesis) thường phát biểu điều gì?
A. Các biến có liên quan đến nhau.
B. Các biến không liên quan đến nhau.
C. Các biến có phân phối chuẩn.
D. Phương sai của các biến bằng nhau.
40. Trong dự báo chuỗi thời gian, sai số bình phương trung bình (Mean Squared Error – MSE) đo lường điều gì?
A. Độ lệch trung bình của các dự báo.
B. Độ chính xác của các dự báo.
C. Phương sai của các dự báo.
D. Độ lớn trung bình của các sai số dự báo.
41. Nếu kiểm định ANOVA cho kết quả có ý nghĩa thống kê, điều này có nghĩa là gì?
A. Tất cả các trung bình nhóm đều khác nhau.
B. Ít nhất hai trung bình nhóm khác nhau đáng kể.
C. Tất cả các nhóm đều có phương sai bằng nhau.
D. Không có sự khác biệt giữa các nhóm.
42. Trong ngữ cảnh của kiểm định phi tham số, kiểm định Kruskal-Wallis là một lựa chọn thay thế cho kiểm định tham số nào?
A. Kiểm định t độc lập.
B. Kiểm định t ghép cặp.
C. Phân tích phương sai (ANOVA) một yếu tố.
D. Hồi quy tuyến tính.
43. Giả định nào sau đây KHÔNG phải là một trong các giả định chính của hồi quy tuyến tính?
A. Mối quan hệ giữa các biến là tuyến tính.
B. Sai số có phương sai không đổi (homoscedasticity).
C. Các sai số độc lập với nhau.
D. Các biến độc lập có phân phối chuẩn.
44. Trong phân tích hồi quy tuyến tính đơn giản, một hệ số hồi quy (regression coefficient) dương cho biết điều gì?
A. Không có mối quan hệ giữa các biến.
B. Khi biến độc lập tăng, biến phụ thuộc giảm.
C. Khi biến độc lập tăng, biến phụ thuộc tăng.
D. Mối quan hệ là phi tuyến tính.
45. Trong phân tích chuỗi thời gian, thành phần nào sau đây KHÔNG thuộc các thành phần chính?
A. Xu hướng (Trend).
B. Tính thời vụ (Seasonality).
C. Chu kỳ (Cyclical).
D. Ngẫu nhiên (Randomness).
46. Trong ANOVA, ‘Tổng bình phương giữa các nhóm’ (SSB) đo lường điều gì?
A. Sự biến thiên tổng thể trong dữ liệu.
B. Sự biến thiên trong mỗi nhóm.
C. Sự biến thiên giữa các trung bình nhóm.
D. Sai số ngẫu nhiên trong dữ liệu.
47. Giả sử bạn muốn so sánh hiệu quả năng suất của 3 dây chuyền sản xuất khác nhau. Bạn nên sử dụng kiểm định thống kê nào?
A. Kiểm định t độc lập.
B. Kiểm định Chi bình phương.
C. Phân tích phương sai (ANOVA).
D. Hồi quy tuyến tính.
48. Độ đo nào sau đây thường được sử dụng để đánh giá kích thước ảnh hưởng (effect size) trong ANOVA?
A. Hệ số tương quan Pearson.
B. Độ lệch chuẩn.
C. Eta-squared (η²).
D. Giá trị p.
49. Thành phần nào của chuỗi thời gian thể hiện sự biến động lặp đi lặp lại trong một khoảng thời gian cố định (ví dụ: hàng năm, hàng quý)?
A. Xu hướng (Trend).
B. Tính thời vụ (Seasonality).
C. Chu kỳ (Cyclical).
D. Ngẫu nhiên (Randomness).
50. Phương pháp nào sau đây được sử dụng để kiểm tra tính tuyến tính trong phân tích hồi quy?
A. Vẽ biểu đồ phân tán của các sai số so với các giá trị dự đoán.
B. Tính hệ số tương quan Pearson.
C. Sử dụng kiểm định Chi bình phương.
D. Tính hệ số R-squared.
51. Điều gì xảy ra với giá trị thống kê F trong ANOVA khi phương sai giữa các nhóm tăng lên, trong khi phương sai trong mỗi nhóm không đổi?
A. Giá trị F giảm.
B. Giá trị F không đổi.
C. Giá trị F tăng.
D. Không thể xác định.
52. Vấn đề đa cộng tuyến (multicollinearity) trong hồi quy xảy ra khi nào?
A. Khi biến phụ thuộc không có phân phối chuẩn.
B. Khi các biến độc lập tương quan cao với nhau.
C. Khi sai số không có phương sai không đổi.
D. Khi mối quan hệ giữa các biến là phi tuyến tính.
53. Bậc tự do (degrees of freedom) trong kiểm định Chi bình phương cho bảng contingency (bảng chéo) r x c được tính như thế nào?
A. r + c – 1
B. r x c
C. (r – 1) x (c – 1)
D. r – c
54. Trong phân tích hồi quy, hệ số xác định (R-squared) đo lường điều gì?
A. Mức độ ý nghĩa thống kê của các biến độc lập.
B. Mối quan hệ nhân quả giữa các biến.
C. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi các biến độc lập.
D. Độ mạnh của mối quan hệ tuyến tính giữa các biến.
55. Trong phân tích hồi quy, giá trị p (p-value) liên kết với một hệ số hồi quy cho biết điều gì?
A. Độ lớn của hệ số hồi quy.
B. Hướng của mối quan hệ giữa các biến.
C. Xác suất để quan sát được một hệ số lớn hơn hệ số ước lượng nếu không có mối quan hệ thực sự.
D. Tỷ lệ phương sai được giải thích bởi biến độc lập.
56. Giả sử bạn muốn dự đoán doanh số bán hàng dựa trên chi phí quảng cáo. Phương pháp nào phù hợp nhất?
A. Kiểm định t.
B. Kiểm định Chi bình phương.
C. Phân tích hồi quy.
D. Phân tích phương sai (ANOVA).
57. Khi nào thì nên sử dụng hồi quy đa biến (multiple regression) thay vì hồi quy tuyến tính đơn giản?
A. Khi chỉ có một biến độc lập.
B. Khi có nhiều hơn một biến độc lập.
C. Khi biến phụ thuộc là định tính.
D. Khi không có mối quan hệ tuyến tính giữa các biến.
58. Giả định nào sau đây KHÔNG phải là một trong các giả định chính của ANOVA?
A. Các nhóm phải có kích thước bằng nhau.
B. Dữ liệu trong mỗi nhóm phải tuân theo phân phối chuẩn.
C. Phương sai giữa các nhóm phải bằng nhau.
D. Các quan sát phải độc lập với nhau.
59. Nếu giá trị p (p-value) của kiểm định Chi bình phương nhỏ hơn mức ý nghĩa (alpha), chúng ta nên kết luận điều gì?
A. Chấp nhận giả thuyết không.
B. Bác bỏ giả thuyết không.
C. Không có đủ bằng chứng để kết luận.
D. Giữ nguyên giả thuyết không.
60. Phương pháp nào sau đây được sử dụng để so sánh hai tỷ lệ khi các mẫu là độc lập?
A. Kiểm định t ghép cặp.
B. Kiểm định Chi bình phương.
C. Kiểm định ANOVA.
D. Kiểm định tương quan Pearson.
61. Hệ số phóng đại phương sai (Variance Inflation Factor – VIF) được sử dụng để phát hiện vấn đề gì trong hồi quy đa biến?
A. Phương sai sai số thay đổi.
B. Đa cộng tuyến.
C. Không có quan hệ tuyến tính.
D. Dữ liệu ngoại lai.
62. Kiểm định nào sau đây phù hợp để so sánh trung bình của hai mẫu độc lập khi phương sai của hai quần thể không bằng nhau?
A. Kiểm định t ghép cặp (Paired t-test).
B. Kiểm định t Student (Student’s t-test).
C. Kiểm định t Welch (Welch’s t-test).
D. Kiểm định z (z-test).
63. Điều gì xảy ra với khoảng tin cậy khi kích thước mẫu tăng lên, giả sử các yếu tố khác không đổi?
A. Khoảng tin cậy trở nên rộng hơn.
B. Khoảng tin cậy không thay đổi.
C. Khoảng tin cậy trở nên hẹp hơn.
D. Không thể xác định được sự thay đổi của khoảng tin cậy.
64. Phương pháp nào sau đây được sử dụng để kiểm tra tính đồng nhất phương sai (homoscedasticity) trong phân tích hồi quy?
A. Kiểm định t.
B. Kiểm định F.
C. Kiểm định Breusch-Pagan.
D. Kiểm định Chi bình phương.
65. Điều gì xảy ra với độ rộng của khoảng tin cậy khi mức độ tin cậy tăng lên?
A. Độ rộng của khoảng tin cậy giảm xuống.
B. Độ rộng của khoảng tin cậy tăng lên.
C. Độ rộng của khoảng tin cậy không đổi.
D. Không thể xác định được sự thay đổi của độ rộng khoảng tin cậy.
66. Trong kiểm định giả thuyết, lỗi loại I xảy ra khi nào?
A. Chúng ta bác bỏ giả thuyết không đúng.
B. Chúng ta chấp nhận giả thuyết không đúng.
C. Chúng ta bác bỏ giả thuyết không đúng.
D. Chúng ta bác bỏ giả thuyết không đúng khi nó thực sự đúng.
67. Trong phân tích rủi ro, phương pháp Monte Carlo được sử dụng để làm gì?
A. Ước lượng trung bình của một biến.
B. Mô phỏng các kết quả có thể xảy ra và đánh giá rủi ro.
C. Xác định mối quan hệ tuyến tính giữa các biến.
D. Kiểm tra giả thuyết thống kê.
68. Trong phân tích độ nhạy (sensitivity analysis), mục tiêu chính là gì?
A. Xác định các yếu tố quan trọng nhất ảnh hưởng đến kết quả.
B. Giảm thiểu sai số trong mô hình.
C. Tối đa hóa lợi nhuận.
D. Dự đoán chính xác kết quả trong tương lai.
69. Kiểm định Kolmogorov-Smirnov được sử dụng để làm gì?
A. So sánh trung bình của hai mẫu.
B. Kiểm tra tính độc lập giữa hai biến.
C. Kiểm tra xem một mẫu có tuân theo một phân phối cụ thể hay không.
D. Phân tích phương sai.
70. Phương pháp nào sau đây thường được sử dụng để kiểm tra sự độc lập giữa hai biến định tính?
A. Phân tích phương sai (ANOVA).
B. Kiểm định Chi bình phương (Chi-square test).
C. Hồi quy tuyến tính.
D. Kiểm định t (t-test).
71. Trong phân tích chuỗi thời gian, phương pháp trung bình trượt (moving average) được sử dụng để làm gì?
A. Dự đoán giá trị tương lai.
B. Loại bỏ xu hướng.
C. Làm mịn dữ liệu và loại bỏ nhiễu.
D. Xác định tính thời vụ.
72. Điều gì xảy ra với sai số chuẩn của trung bình mẫu khi kích thước mẫu tăng lên?
A. Sai số chuẩn tăng lên.
B. Sai số chuẩn giảm xuống.
C. Sai số chuẩn không đổi.
D. Không thể xác định được sự thay đổi của sai số chuẩn.
73. Phương pháp nào sau đây được sử dụng để đánh giá tính dừng của chuỗi thời gian?
A. Kiểm định Chi bình phương.
B. Kiểm định t.
C. Kiểm định Dickey-Fuller.
D. Phân tích phương sai.
74. Trong phân tích chuỗi thời gian, thành phần nào sau đây mô tả sự biến động ngắn hạn và không đều đặn?
A. Xu hướng (Trend).
B. Tính thời vụ (Seasonality).
C. Chu kỳ (Cycle).
D. Tính ngẫu nhiên (Irregularity).
75. Phương pháp nào sau đây được sử dụng để giảm phương sai của ước lượng trong phương pháp Monte Carlo?
A. Tăng số lượng mô phỏng.
B. Sử dụng các số ngẫu nhiên có tương quan âm.
C. Sử dụng các số ngẫu nhiên có tương quan dương.
D. Giảm số lượng mô phỏng.
76. Trong phân tích cụm (cluster analysis), mục tiêu chính là gì?
A. Dự đoán giá trị tương lai.
B. Phân loại các đối tượng thành các nhóm dựa trên sự tương đồng.
C. Xác định mối quan hệ nhân quả giữa các biến.
D. Kiểm tra giả thuyết thống kê.
77. Trong mô hình hồi quy, phần dư (residual) là gì?
A. Giá trị dự đoán của biến phụ thuộc.
B. Sai số chuẩn của ước lượng.
C. Hiệu số giữa giá trị thực tế và giá trị dự đoán của biến phụ thuộc.
D. Giá trị trung bình của biến phụ thuộc.
78. Hệ số xác định (R-squared) trong phân tích hồi quy cho biết điều gì?
A. Độ mạnh của mối quan hệ giữa các biến độc lập.
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi mô hình hồi quy.
C. Độ chính xác của các ước lượng hệ số hồi quy.
D. Mức ý nghĩa của mô hình hồi quy.
79. Trong phân tích hồi quy, biến giả (dummy variable) được sử dụng để biểu diễn điều gì?
A. Biến định lượng.
B. Biến định tính.
C. Biến liên tục.
D. Biến rời rạc.
80. Khi nào nên sử dụng kiểm định Wilcoxon signed-rank?
A. Để so sánh trung bình của hai mẫu độc lập.
B. Để so sánh trung bình của hai mẫu ghép cặp khi dữ liệu không tuân theo phân phối chuẩn.
C. Để kiểm tra tính độc lập giữa hai biến định tính.
D. Để phân tích phương sai.
81. Trong phân tích sự sống (survival analysis), hàm sống sót (survival function) cho biết điều gì?
A. Thời gian trung bình sống sót.
B. Xác suất một cá thể sống sót qua một thời điểm nhất định.
C. Tỷ lệ tử vong tại một thời điểm nhất định.
D. Tổng số cá thể trong nghiên cứu.
82. Khi nào nên sử dụng phân tích hồi quy logistic?
A. Khi biến phụ thuộc là định lượng.
B. Khi biến độc lập là định tính.
C. Khi biến phụ thuộc là định tính và có hai giá trị.
D. Khi biến độc lập là liên tục.
83. Điều gì xảy ra với công suất (power) của một kiểm định giả thuyết khi kích thước mẫu tăng lên?
A. Công suất giảm xuống.
B. Công suất tăng lên.
C. Công suất không đổi.
D. Không thể xác định được sự thay đổi của công suất.
84. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết không đúng.
B. Mức ý nghĩa của kiểm định.
C. Xác suất quan sát được kết quả kiểm định (hoặc kết quả khắc nghiệt hơn) nếu giả thuyết không là đúng.
D. Sai số chuẩn của ước lượng.
85. Trong phân tích hồi quy, hệ số tương quan (r) đo lường điều gì?
A. Mức độ phù hợp của mô hình hồi quy với dữ liệu.
B. Mức độ thay đổi của biến độc lập khi biến phụ thuộc thay đổi một đơn vị.
C. Độ mạnh và hướng của mối quan hệ tuyến tính giữa hai biến.
D. Sai số chuẩn của ước lượng.
86. Trong phân tích hồi quy đa biến, hiện tượng đa cộng tuyến (multicollinearity) đề cập đến vấn đề gì?
A. Mối quan hệ tuyến tính mạnh mẽ giữa các biến độc lập.
B. Mối quan hệ phi tuyến tính giữa biến độc lập và biến phụ thuộc.
C. Sự thay đổi của phương sai sai số theo các giá trị của biến độc lập.
D. Sự thiếu dữ liệu trong mẫu.
87. Trong phân tích phương sai (ANOVA), thống kê F được sử dụng để kiểm tra điều gì?
A. Sự bằng nhau của phương sai giữa hai mẫu.
B. Sự bằng nhau của trung bình giữa hai mẫu.
C. Sự bằng nhau của trung bình giữa nhiều hơn hai mẫu.
D. Mối quan hệ tuyến tính giữa hai biến.
88. Trong kiểm định giả thuyết, mức ý nghĩa (alpha) thể hiện điều gì?
A. Xác suất mắc lỗi loại II.
B. Xác suất mắc lỗi loại I.
C. Xác suất chấp nhận giả thuyết không đúng.
D. Xác suất bác bỏ giả thuyết không đúng.
89. Phương pháp nào sau đây được sử dụng để dự báo chuỗi thời gian dựa trên các giá trị quá khứ của chính nó?
A. Hồi quy tuyến tính.
B. Hồi quy đa biến.
C. Mô hình ARIMA.
D. Phân tích phương sai.
90. Khi nào nên sử dụng kiểm định phi tham số thay vì kiểm định tham số?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi các giả định của kiểm định tham số không được đáp ứng.
D. Khi cần tính toán khoảng tin cậy.
91. Nếu một chuỗi thời gian không dừng, phương pháp nào sau đây có thể được sử dụng để làm cho nó dừng?
A. Lấy sai phân (differencing).
B. Sử dụng biến trễ (lagged variable).
C. Loại bỏ xu hướng (detrending).
D. Tất cả các đáp án trên.
92. Phép quay nhân tố (factor rotation) được sử dụng để làm gì?
A. Để làm cho các nhân tố dễ diễn giải hơn.
B. Để tăng số lượng nhân tố.
C. Để giảm phương sai được giải thích bởi các nhân tố.
D. Để kiểm tra tính phù hợp của mô hình.
93. Sai số chuẩn của ước lượng (standard error of the estimate) trong hồi quy tuyến tính biểu thị điều gì?
A. Độ lệch chuẩn của các hệ số hồi quy.
B. Độ lệch chuẩn của sai số ngẫu nhiên.
C. Độ lệch chuẩn của biến phụ thuộc.
D. Độ lệch chuẩn của biến độc lập.
94. Khi nào thì kiểm định giả thuyết về hệ số hồi quy (β) có thể được sử dụng?
A. Để xác định xem biến độc lập có tác động đáng kể đến biến phụ thuộc hay không.
B. Để xác định xem mô hình hồi quy có phù hợp với dữ liệu hay không.
C. Để xác định xem có mối tương quan giữa các biến độc lập hay không.
D. Để xác định xem dữ liệu có tuân theo phân phối chuẩn hay không.
95. Nếu một biến giả có giá trị 1 cho nhóm A và 0 cho nhóm B, hệ số hồi quy của biến giả này thể hiện điều gì?
A. Sự khác biệt trung bình của biến phụ thuộc giữa nhóm A và nhóm B.
B. Tỷ lệ phần trăm biến phụ thuộc thay đổi khi chuyển từ nhóm B sang nhóm A.
C. Giá trị trung bình của biến phụ thuộc cho nhóm A.
D. Giá trị trung bình của biến phụ thuộc cho nhóm B.
96. Phương pháp nào sau đây thường được sử dụng để xác định số lượng nhân tố cần giữ lại trong phân tích nhân tố?
A. Scree plot.
B. Biểu đồ tần số.
C. Biểu đồ phân tán.
D. Biểu đồ hộp.
97. Cách khắc phục tự tương quan?
A. Sử dụng mô hình sai phân hoặc mô hình tự hồi quy.
B. Loại bỏ các biến ngoại lệ.
C. Tăng kích thước mẫu.
D. Sử dụng kiểm định phi tham số.
98. Phân tích nhân tố (factor analysis) được sử dụng để làm gì?
A. Để giảm số lượng biến bằng cách xác định các nhân tố tiềm ẩn.
B. Để phân loại các đối tượng vào các nhóm khác nhau.
C. Để dự đoán giá trị của một biến dựa trên các biến khác.
D. Để kiểm tra sự khác biệt giữa các giá trị trung bình của các nhóm.
99. Phương sai sai số thay đổi (heteroscedasticity) xảy ra khi nào?
A. Khi phương sai của sai số ngẫu nhiên không đồng nhất.
B. Khi các biến độc lập không tương quan với nhau.
C. Khi biến phụ thuộc không tuân theo phân phối chuẩn.
D. Khi kích thước mẫu quá nhỏ.
100. Mô hình ARMA kết hợp các thành phần nào?
A. Tự hồi quy (AR) và trung bình trượt (MA).
B. Tự hồi quy (AR) và tích hợp (I).
C. Trung bình trượt (MA) và tích hợp (I).
D. Tự hồi quy (AR), trung bình trượt (MA) và tích hợp (I).
101. Kiểm định Durbin-Watson được sử dụng để làm gì?
A. Kiểm tra tự tương quan.
B. Kiểm tra đa cộng tuyến.
C. Kiểm tra tính chuẩn của sai số.
D. Kiểm tra phương sai sai số thay đổi.
102. Hàm tự tương quan (ACF) và hàm tự tương quan từng phần (PACF) được sử dụng để làm gì trong mô hình ARIMA?
A. Để xác định bậc của các thành phần AR và MA.
B. Để kiểm tra tính dừng của chuỗi thời gian.
C. Để kiểm tra tự tương quan.
D. Để kiểm tra phương sai sai số thay đổi.
103. Phân tích hiệp phương sai (ANCOVA) khác gì so với ANOVA?
A. ANCOVA kiểm soát ảnh hưởng của các biến đồng biến (covariates).
B. ANCOVA không yêu cầu các nhóm phải độc lập.
C. ANCOVA không yêu cầu dữ liệu phải tuân theo phân phối chuẩn.
D. ANCOVA chỉ sử dụng cho dữ liệu định tính.
104. Phương pháp nào sau đây được sử dụng để giảm thiểu ảnh hưởng của đa cộng tuyến?
A. Loại bỏ một hoặc nhiều biến độc lập có tương quan cao.
B. Sử dụng biến phụ thuộc có độ biến động lớn hơn.
C. Tăng kích thước mẫu.
D. Sử dụng kiểm định t thay vì kiểm định F.
105. Nếu giá trị p của thống kê F nhỏ hơn mức ý nghĩa α, kết luận nào sau đây là đúng?
A. Bác bỏ giả thuyết không và kết luận rằng có ít nhất một sự khác biệt đáng kể giữa các giá trị trung bình của các nhóm.
B. Chấp nhận giả thuyết không và kết luận rằng không có sự khác biệt đáng kể giữa các giá trị trung bình của các nhóm.
C. Không thể đưa ra kết luận nào.
D. Cần kiểm tra thêm các giả định của ANOVA.
106. Hiện tượng đa cộng tuyến (multicollinearity) xảy ra khi nào trong phân tích hồi quy?
A. Khi có mối tương quan cao giữa các biến độc lập.
B. Khi có mối tương quan cao giữa biến độc lập và biến phụ thuộc.
C. Khi phương sai của sai số ngẫu nhiên không đồng nhất.
D. Khi sai số ngẫu nhiên không tuân theo phân phối chuẩn.
107. Kiểm định post-hoc được sử dụng khi nào trong ANOVA?
A. Khi bác bỏ giả thuyết không và muốn xác định cặp nhóm nào có sự khác biệt đáng kể.
B. Khi chấp nhận giả thuyết không và kết luận rằng không có sự khác biệt đáng kể giữa các nhóm.
C. Khi muốn kiểm tra các giả định của ANOVA.
D. Khi muốn tăng mức ý nghĩa α.
108. Kiểm định Breusch-Pagan được sử dụng để làm gì?
A. Kiểm tra phương sai sai số thay đổi.
B. Kiểm tra đa cộng tuyến.
C. Kiểm tra tính chuẩn của sai số.
D. Kiểm tra tính tự tương quan.
109. Mục đích của việc kiểm tra tính dừng (stationarity) trong phân tích chuỗi thời gian là gì?
A. Để đảm bảo rằng các thống kê mô tả (mean, variance) không thay đổi theo thời gian.
B. Để xác định xem có xu hướng trong dữ liệu hay không.
C. Để xác định xem có tính mùa vụ trong dữ liệu hay không.
D. Để đảm bảo rằng dữ liệu tuân theo phân phối chuẩn.
110. Trong phân tích hồi quy, hệ số xác định (R-squared) đo lường điều gì?
A. Mức độ quan trọng của các biến độc lập.
B. Mức độ phù hợp của mô hình hồi quy với dữ liệu.
C. Mức độ tương quan giữa các biến độc lập.
D. Mức độ biến động của biến phụ thuộc.
111. Trong phân tích nhân tố, eigenvalue thể hiện điều gì?
A. Phương sai được giải thích bởi một nhân tố.
B. Mức độ tương quan giữa các biến.
C. Mức độ phù hợp của mô hình.
D. Mức độ quan trọng của các biến.
112. Phân tích cụm (cluster analysis) được sử dụng để làm gì?
A. Để phân nhóm các đối tượng dựa trên sự tương đồng của chúng.
B. Để giảm số lượng biến bằng cách xác định các nhân tố tiềm ẩn.
C. Để dự đoán giá trị của một biến dựa trên các biến khác.
D. Để kiểm tra sự khác biệt giữa các giá trị trung bình của các nhóm.
113. Kiểm định Dickey-Fuller được sử dụng để làm gì?
A. Kiểm tra tính dừng của chuỗi thời gian.
B. Kiểm tra tự tương quan.
C. Kiểm tra phương sai sai số thay đổi.
D. Kiểm tra tính chuẩn của sai số.
114. Trong phân tích phương sai (ANOVA), giả thuyết không (null hypothesis) thường là gì?
A. Không có sự khác biệt đáng kể giữa các giá trị trung bình của các nhóm.
B. Có sự khác biệt đáng kể giữa các giá trị trung bình của các nhóm.
C. Các nhóm có phương sai bằng nhau.
D. Các nhóm có phương sai khác nhau.
115. Mô hình ARIMA mở rộng mô hình ARMA bằng cách thêm thành phần nào?
A. Tích hợp (I).
B. Xu hướng (T).
C. Mùa vụ (S).
D. Sai số (E).
116. Tự tương quan (autocorrelation) xảy ra khi nào?
A. Khi các sai số ngẫu nhiên có tương quan với nhau.
B. Khi các biến độc lập có tương quan với nhau.
C. Khi phương sai của sai số ngẫu nhiên không đồng nhất.
D. Khi biến phụ thuộc không tuân theo phân phối chuẩn.
117. Ví dụ về kiểm định post-hoc?
A. Tukey’s HSD (Honestly Significant Difference).
B. Breusch-Pagan.
C. Durbin-Watson.
D. Dickey-Fuller.
118. Khắc phục phương sai sai số thay đổi bằng cách nào?
A. Sử dụng phương pháp ước lượng bình phương tối thiểu tổng quát (GLS).
B. Loại bỏ các biến ngoại lệ.
C. Tăng kích thước mẫu.
D. Sử dụng kiểm định phi tham số.
119. Biến giả (dummy variable) được sử dụng để làm gì?
A. Để đưa các biến định tính vào mô hình hồi quy.
B. Để giảm thiểu đa cộng tuyến.
C. Để khắc phục phương sai sai số thay đổi.
D. Để kiểm tra tính chuẩn của sai số.
120. Thống kê F trong ANOVA được tính như thế nào?
A. Tỷ lệ giữa phương sai giữa các nhóm và phương sai trong các nhóm.
B. Tỷ lệ giữa phương sai trong các nhóm và phương sai giữa các nhóm.
C. Tổng của phương sai giữa các nhóm và phương sai trong các nhóm.
D. Hiệu của phương sai giữa các nhóm và phương sai trong các nhóm.
121. Khi nào thì kiểm định giả thuyết một phía (one-tailed test) phù hợp hơn kiểm định giả thuyết hai phía (two-tailed test)?
A. Khi không có thông tin trước về hướng của hiệu ứng.
B. Khi muốn kiểm tra xem giá trị tham số có khác 0 hay không.
C. Khi có kỳ vọng cụ thể về hướng của hiệu ứng.
D. Khi cỡ mẫu nhỏ.
122. Khi nào nên sử dụng kiểm định Chi-bình phương (Chi-square test)?
A. Khi so sánh trung bình của hai mẫu độc lập.
B. Khi so sánh phương sai của hai mẫu.
C. Khi phân tích mối quan hệ giữa hai biến định tính.
D. Khi phân tích mối quan hệ giữa hai biến định lượng.
123. Trong phân tích chuỗi thời gian, ACF (Autocorrelation Function) và PACF (Partial Autocorrelation Function) được sử dụng để làm gì?
A. Kiểm tra tính dừng của chuỗi thời gian.
B. Xác định bậc của mô hình ARIMA.
C. Dự báo giá trị tương lai của chuỗi thời gian.
D. Phân tích tính mùa vụ của chuỗi thời gian.
124. Trong phân tích hồi quy, hệ số xác định (R-squared) đo lường điều gì?
A. Mức độ phù hợp của mô hình hồi quy với dữ liệu thực tế.
B. Mức độ ý nghĩa thống kê của các biến độc lập.
C. Mức độ biến động của biến độc lập.
D. Mức độ biến động của sai số.
125. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết null là đúng.
B. Xác suất sai số loại I.
C. Xác suất thu được kết quả như quan sát (hoặc cực đoan hơn) nếu giả thuyết null là đúng.
D. Xác suất chấp nhận giả thuyết null.
126. Khi nào thì nên sử dụng kiểm định t (t-test) thay vì kiểm định z (z-test) để so sánh trung bình?
A. Khi cỡ mẫu lớn.
B. Khi biết phương sai của quần thể.
C. Khi cỡ mẫu nhỏ và phương sai của quần thể chưa biết.
D. Khi dữ liệu không tuân theo phân phối chuẩn.
127. Phương pháp nào sau đây thường được sử dụng để kiểm tra tính dừng của chuỗi thời gian?
A. Kiểm định Chi-bình phương.
B. Kiểm định t.
C. Kiểm định Dickey-Fuller.
D. Phân tích phương sai (ANOVA).
128. Ý nghĩa của khoảng tin cậy (confidence interval) là gì?
A. Xác suất mà tham số thực tế nằm trong khoảng đó.
B. Khoảng giá trị mà tham số mẫu có thể nhận.
C. Khoảng giá trị mà tham số thực tế có khả năng cao nằm trong đó.
D. Khoảng giá trị mà tất cả các giá trị mẫu có thể nhận.
129. Khi nào nên sử dụng kiểm định phi tham số (non-parametric test) thay vì kiểm định tham số (parametric test)?
A. Khi cỡ mẫu lớn.
B. Khi dữ liệu tuân theo phân phối chuẩn.
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc cỡ mẫu nhỏ.
D. Khi muốn so sánh trung bình của hai mẫu.
130. Phương pháp nào sau đây được sử dụng để giảm số lượng biến độc lập trong mô hình hồi quy mà vẫn giữ được khả năng giải thích tốt?
A. Sử dụng tất cả các biến độc lập có sẵn.
B. Sử dụng phương pháp lựa chọn biến (variable selection methods).
C. Sử dụng phương pháp hồi quy mạnh (robust regression).
D. Sử dụng phép biến đổi logarit.
131. Trong phân tích sống sót (survival analysis), hàm sống sót (survival function) thể hiện điều gì?
A. Xác suất một sự kiện xảy ra tại một thời điểm cụ thể.
B. Xác suất một sự kiện không xảy ra tại một thời điểm cụ thể.
C. Xác suất một sự kiện xảy ra trước một thời điểm cụ thể.
D. Xác suất một sự kiện không xảy ra trước một thời điểm cụ thể (tồn tại đến thời điểm đó).
132. Phương pháp nào sau đây có thể được sử dụng để khắc phục hiện tượng phương sai sai số không đồng nhất (heteroscedasticity)?
A. Sử dụng phương pháp bình phương tối thiểu thông thường (OLS).
B. Sử dụng phương pháp hồi quy mạnh (robust regression).
C. Sử dụng phép biến đổi logarit trên biến phụ thuộc.
D. Cả B và C.
133. Trong phân tích hồi quy đa biến, hiện tượng đa cộng tuyến (multicollinearity) xảy ra khi nào?
A. Khi có mối tương quan cao giữa các biến độc lập.
B. Khi có mối tương quan cao giữa biến độc lập và biến phụ thuộc.
C. Khi phương sai của sai số thay đổi.
D. Khi sai số không tuân theo phân phối chuẩn.
134. Khi thực hiện kiểm định giả thuyết, điều gì xảy ra nếu giá trị p nhỏ hơn mức ý nghĩa alpha (α)?
A. Chấp nhận giả thuyết null.
B. Bác bỏ giả thuyết null.
C. Không thể kết luận gì về giả thuyết null.
D. Tăng cỡ mẫu.
135. Sai số loại I (Type I error) trong kiểm định giả thuyết là gì?
A. Việc chấp nhận giả thuyết null khi nó thực sự đúng.
B. Việc bác bỏ giả thuyết null khi nó thực sự đúng.
C. Việc chấp nhận giả thuyết null khi nó thực sự sai.
D. Việc bác bỏ giả thuyết null khi nó thực sự sai.
136. Trong phân tích hồi quy logistic, biến phụ thuộc là loại biến gì?
A. Biến định lượng liên tục.
B. Biến định lượng rời rạc.
C. Biến định tính nhị phân.
D. Biến định tính đa phân.
137. Trong phân tích cụm (cluster analysis), mục tiêu chính là gì?
A. Dự đoán giá trị của một biến phụ thuộc.
B. Phân loại các đối tượng vào các nhóm dựa trên đặc điểm tương đồng.
C. Đo lường mối quan hệ giữa các biến.
D. Kiểm tra giả thuyết về sự khác biệt giữa các trung bình.
138. Điều gì xảy ra với độ rộng của khoảng tin cậy khi tăng cỡ mẫu?
A. Độ rộng tăng lên.
B. Độ rộng giảm xuống.
C. Độ rộng không thay đổi.
D. Độ rộng có thể tăng hoặc giảm tùy thuộc vào dữ liệu.
139. Trong phân tích tương quan, hệ số tương quan Pearson đo lường điều gì?
A. Mức độ phụ thuộc giữa hai biến định tính.
B. Mức độ quan hệ phi tuyến tính giữa hai biến định lượng.
C. Mức độ quan hệ tuyến tính giữa hai biến định lượng.
D. Mức độ biến động của hai biến.
140. Trong phân tích hồi quy, điều gì xảy ra nếu các sai số không có phương sai đồng nhất (heteroscedasticity)?
A. Các ước lượng hệ số hồi quy trở nên sai lệch.
B. Các ước lượng hệ số hồi quy trở nên không hiệu quả.
C. Các kiểm định giả thuyết trở nên không đáng tin cậy.
D. Tất cả các đáp án trên.
141. Sai số loại II (Type II error) trong kiểm định giả thuyết là gì?
A. Việc chấp nhận giả thuyết null khi nó thực sự đúng.
B. Việc bác bỏ giả thuyết null khi nó thực sự đúng.
C. Việc chấp nhận giả thuyết null khi nó thực sự sai.
D. Việc bác bỏ giả thuyết null khi nó thực sự sai.
142. Trong phân tích hồi quy, sai số chuẩn của hệ số hồi quy (standard error of the regression coefficient) đo lường điều gì?
A. Độ lệch chuẩn của biến phụ thuộc.
B. Độ lệch chuẩn của sai số.
C. Độ lệch chuẩn của hệ số hồi quy ước lượng.
D. Độ lệch chuẩn của biến độc lập.
143. Chỉ số VIF (Variance Inflation Factor) được sử dụng để đo lường điều gì trong phân tích hồi quy đa biến?
A. Mức độ phù hợp của mô hình.
B. Mức độ đa cộng tuyến giữa các biến độc lập.
C. Mức độ ảnh hưởng của các giá trị ngoại lệ.
D. Mức độ phương sai sai số không đồng nhất.
144. Khi thực hiện kiểm định giả thuyết về sự khác biệt giữa hai trung bình, kiểm định nào sau đây phù hợp khi các mẫu là độc lập và có phương sai bằng nhau?
A. Kiểm định t ghép cặp (paired t-test).
B. Kiểm định t cho hai mẫu độc lập với phương sai bằng nhau.
C. Kiểm định t cho hai mẫu độc lập với phương sai không bằng nhau (Welch’s t-test).
D. Kiểm định z.
145. Trong phân tích phương sai (ANOVA), mục tiêu chính là gì?
A. So sánh phương sai giữa các nhóm.
B. So sánh trung bình giữa hai nhóm.
C. So sánh trung bình giữa nhiều nhóm.
D. Đo lường mối quan hệ giữa các biến.
146. Trong kiểm định giả thuyết, mức ý nghĩa (significance level) thường được ký hiệu là alpha (α) đại diện cho điều gì?
A. Xác suất chấp nhận giả thuyết null khi nó đúng.
B. Xác suất bác bỏ giả thuyết null khi nó đúng (sai số loại I).
C. Xác suất chấp nhận giả thuyết null khi nó sai (sai số loại II).
D. Xác suất bác bỏ giả thuyết null khi nó sai.
147. Trong phân tích độ tin cậy, hệ số Cronbach’s alpha được sử dụng để đo lường điều gì?
A. Độ ổn định của các phép đo theo thời gian.
B. Độ tương đương giữa các phiên bản khác nhau của một công cụ đo.
C. Độ phù hợp bên trong của các mục trong một thang đo.
D. Độ chính xác của các phép đo.
148. Trong phân tích chuỗi thời gian, tính dừng (stationarity) của chuỗi thời gian có ý nghĩa gì?
A. Chuỗi thời gian có xu hướng tăng hoặc giảm theo thời gian.
B. Chuỗi thời gian có phương sai thay đổi theo thời gian.
C. Các đặc tính thống kê của chuỗi thời gian (như trung bình và phương sai) không thay đổi theo thời gian.
D. Chuỗi thời gian có tính mùa vụ rõ rệt.
149. Trong phân tích phương sai (ANOVA) hai yếu tố (two-way ANOVA), điều gì được kiểm tra?
A. Ảnh hưởng của một yếu tố duy nhất lên biến phụ thuộc.
B. Ảnh hưởng của hai yếu tố lên biến phụ thuộc và tương tác giữa chúng.
C. Mối quan hệ giữa hai biến độc lập.
D. Sự khác biệt giữa trung bình của hai nhóm.
150. Phương pháp nào sau đây giúp giảm thiểu tác động của các giá trị ngoại lệ (outliers) trong phân tích hồi quy?
A. Sử dụng phương pháp bình phương tối thiểu thông thường (OLS).
B. Sử dụng phương pháp hồi quy mạnh (robust regression).
C. Tăng cỡ mẫu.
D. Giảm số lượng biến độc lập.