1. Trong phân tích hồi quy, một ‘biến giả’ (dummy variable) thường được sử dụng để làm gì?
A. Đại diện cho các biến định tính.
B. Giảm thiểu hiện tượng đa cộng tuyến.
C. Cải thiện độ chính xác của dự báo.
D. Kiểm tra tính không đổi phương sai.
2. Hệ quả của việc bỏ sót một biến quan trọng trong mô hình hồi quy là gì?
A. Các ước lượng trở nên hiệu quả hơn.
B. Các ước lượng trở nên chệch.
C. Phương sai của sai số giảm.
D. R-squared tăng lên.
3. Đánh giá nào sau đây mô tả chính xác nhất ý nghĩa của hệ số xác định (R-squared) trong phân tích hồi quy?
A. Tỷ lệ phương sai của biến độc lập được giải thích bởi biến phụ thuộc.
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi biến độc lập.
C. Mức độ tương quan giữa các biến độc lập.
D. Sai số chuẩn của ước lượng.
4. Phương pháp nào sau đây được sử dụng để làm trơn chuỗi thời gian, giảm ảnh hưởng của các biến động ngẫu nhiên?
A. Hồi quy tuyến tính.
B. Trung bình động (Moving Average).
C. Phân tích phương sai (ANOVA).
D. Kiểm định khi bình phương (Chi-square test).
5. Trong phân tích chuỗi thời gian, việc phân rã chuỗi thời gian (time series decomposition) nhằm mục đích gì?
A. Để loại bỏ các điểm ngoại lai.
B. Để phân tách chuỗi thời gian thành các thành phần xu hướng, thời vụ, chu kỳ và ngẫu nhiên.
C. Để dự báo các giá trị tương lai.
D. Để kiểm tra tính dừng của chuỗi thời gian.
6. Trong phân tích ANOVA (Analysis of Variance), kiểm định F được sử dụng để làm gì?
A. So sánh trung bình của hai nhóm.
B. So sánh phương sai của hai nhóm.
C. So sánh trung bình của nhiều hơn hai nhóm.
D. Kiểm tra tính độc lập giữa hai biến định tính.
7. Trong phân tích chuỗi thời gian, thành phần nào sau đây KHÔNG thuộc các thành phần chính của chuỗi thời gian?
A. Xu hướng (Trend).
B. Tính thời vụ (Seasonality).
C. Tính chu kỳ (Cyclicality).
D. Tính ngẫu nhiên (Randomness).
8. Điều gì xảy ra với sai số chuẩn của các hệ số hồi quy khi có hiện tượng đa cộng tuyến?
A. Sai số chuẩn giảm xuống.
B. Sai số chuẩn tăng lên.
C. Sai số chuẩn không thay đổi.
D. Không thể xác định được sự thay đổi.
9. Kiểm định Durbin-Watson được sử dụng để kiểm tra điều gì trong mô hình hồi quy?
A. Phương sai sai số thay đổi (heteroscedasticity).
B. Đa cộng tuyến (multicollinearity).
C. Tự tương quan (autocorrelation).
D. Tính chuẩn của sai số.
10. Trong phân tích chuỗi thời gian, hàm tự tương quan (Autocorrelation Function – ACF) được sử dụng để làm gì?
A. Đo lường mối quan hệ giữa hai biến khác nhau.
B. Đo lường mối quan hệ giữa một biến và các giá trị trễ của chính nó.
C. Đo lường phương sai của sai số.
D. Đo lường xu hướng của chuỗi thời gian.
11. Ý nghĩa của việc chuẩn hóa (standardizing) các biến trong mô hình hồi quy là gì?
A. Để loại bỏ các điểm ngoại lai.
B. Để làm cho các hệ số hồi quy dễ so sánh hơn.
C. Để giảm hiện tượng đa cộng tuyến.
D. Để đảm bảo tính chuẩn của sai số.
12. Sai số Mean Squared Error (MSE) đo lường điều gì trong dự báo?
A. Giá trị trung bình của các sai số.
B. Giá trị trung bình của các sai số tuyệt đối.
C. Giá trị trung bình của các sai số bình phương.
D. Căn bậc hai của giá trị trung bình các sai số bình phương.
13. Hiện tượng đa cộng tuyến (multicollinearity) xảy ra khi nào?
A. Khi biến phụ thuộc có tương quan cao với chính nó.
B. Khi các biến độc lập có tương quan cao với nhau.
C. Khi sai số có phương sai thay đổi.
D. Khi mô hình không tuyến tính.
14. Trong phân tích hồi quy, hệ số phóng đại phương sai (Variance Inflation Factor – VIF) được sử dụng để đánh giá vấn đề gì?
A. Phương sai sai số thay đổi (heteroscedasticity).
B. Đa cộng tuyến (multicollinearity).
C. Tự tương quan (autocorrelation).
D. Tính chuẩn của sai số.
15. Trong phân tích hồi quy, biến tương tác (interaction variable) được sử dụng để làm gì?
A. Để đại diện cho các biến định tính.
B. Để kiểm tra tính phi tuyến tính.
C. Để xem xét ảnh hưởng kết hợp của hai hoặc nhiều biến độc lập.
D. Để giảm hiện tượng đa cộng tuyến.
16. Trong hồi quy tuyến tính đơn giản, hệ số chặn (intercept) biểu diễn điều gì?
A. Giá trị của biến độc lập khi biến phụ thuộc bằng 0.
B. Độ dốc của đường hồi quy.
C. Giá trị dự đoán của biến phụ thuộc khi biến độc lập bằng 0.
D. Mức độ biến thiên của biến độc lập.
17. Phương pháp san bằng mũ Holt-Winters được sử dụng khi nào?
A. Khi dữ liệu không có xu hướng và tính thời vụ.
B. Khi dữ liệu có xu hướng nhưng không có tính thời vụ.
C. Khi dữ liệu có cả xu hướng và tính thời vụ.
D. Khi dữ liệu không có xu hướng nhưng có tính thời vụ.
18. Trong phân tích hồi quy, khi nào thì nên sử dụng mô hình hồi quy phi tuyến tính?
A. Khi mối quan hệ giữa các biến là tuyến tính.
B. Khi các biến độc lập có tương quan cao với nhau.
C. Khi mối quan hệ giữa các biến là phi tuyến tính.
D. Khi sai số có phương sai thay đổi.
19. Trong phân tích hồi quy đa biến, điều gì xảy ra khi thêm một biến độc lập không liên quan vào mô hình?
A. R-squared luôn tăng lên.
B. R-squared luôn giảm xuống.
C. R-squared điều chỉnh (Adjusted R-squared) luôn tăng lên.
D. R-squared điều chỉnh (Adjusted R-squared) có thể tăng hoặc giảm.
20. Trong phân tích hồi quy, một điểm dữ liệu được coi là ‘điểm ngoại lai’ (outlier) khi nào?
A. Khi nó có giá trị lớn hơn giá trị trung bình.
B. Khi nó có giá trị nhỏ hơn giá trị trung bình.
C. Khi nó có giá trị khác biệt đáng kể so với các điểm dữ liệu khác.
D. Khi nó nằm trên đường hồi quy.
21. Khi nào thì nên sử dụng mô hình ARIMA trong phân tích chuỗi thời gian?
A. Khi dữ liệu không có xu hướng và tính thời vụ.
B. Khi dữ liệu có xu hướng và/hoặc tính thời vụ.
C. Khi các biến độc lập có tương quan cao với nhau.
D. Khi sai số có phương sai thay đổi.
22. Điều gì xảy ra với khoảng tin cậy của các hệ số hồi quy khi kích thước mẫu tăng lên?
A. Khoảng tin cậy trở nên rộng hơn.
B. Khoảng tin cậy trở nên hẹp hơn.
C. Khoảng tin cậy không thay đổi.
D. Không thể xác định được sự thay đổi.
23. Phương pháp nào sau đây KHÔNG phải là một phương pháp dự báo định lượng?
A. San bằng mũ (Exponential Smoothing).
B. Hồi quy (Regression).
C. Trung bình động (Moving Average).
D. Phương pháp Delphi.
24. Mục đích chính của việc phân tích chuỗi thời gian là gì?
A. Để xác định mối quan hệ nhân quả giữa các biến.
B. Để dự báo các giá trị tương lai dựa trên dữ liệu quá khứ.
C. Để so sánh hai hoặc nhiều nhóm dữ liệu.
D. Để kiểm tra tính độc lập của các biến.
25. Khi nào thì nên sử dụng mô hình Logit hoặc Probit thay vì mô hình hồi quy tuyến tính thông thường?
A. Khi biến phụ thuộc là biến định lượng liên tục.
B. Khi biến phụ thuộc là biến định tính nhị phân.
C. Khi các biến độc lập có tương quan cao với nhau.
D. Khi sai số có phương sai thay đổi.
26. Phương pháp nào sau đây thường được sử dụng để phát hiện hiện tượng phương sai sai số thay đổi (heteroscedasticity)?
A. Kiểm định t.
B. Kiểm định F.
C. Kiểm định Breusch-Pagan.
D. Kiểm định Durbin-Watson.
27. Trong phân tích hồi quy, kiểm định White được sử dụng để kiểm tra điều gì?
A. Tính chuẩn của sai số.
B. Tự tương quan.
C. Phương sai sai số thay đổi (heteroscedasticity).
D. Đa cộng tuyến.
28. Trong dự báo chuỗi thời gian, sai số Mean Absolute Deviation (MAD) đo lường điều gì?
A. Giá trị trung bình của các sai số.
B. Giá trị trung bình của các sai số tuyệt đối.
C. Phương sai của các sai số.
D. Căn bậc hai của giá trị trung bình các sai số bình phương.
29. Giả định nào sau đây KHÔNG phải là một trong những giả định OLS (Ordinary Least Squares) tiêu chuẩn trong hồi quy tuyến tính?
A. Sai số có giá trị trung bình bằng 0.
B. Các sai số có phương sai không đổi (homoscedasticity).
C. Các sai số tuân theo phân phối chuẩn.
D. Không có tự tương quan giữa các sai số.
30. Phương pháp san bằng mũ (Exponential Smoothing) phù hợp nhất cho loại dữ liệu chuỗi thời gian nào?
A. Dữ liệu không có xu hướng và tính thời vụ.
B. Dữ liệu có xu hướng tuyến tính.
C. Dữ liệu có tính thời vụ.
D. Tất cả các loại dữ liệu chuỗi thời gian.
31. Sai lầm loại II (Type II error) xảy ra khi nào?
A. Bác bỏ giả thuyết H0 khi nó đúng.
B. Chấp nhận giả thuyết H0 khi nó đúng.
C. Không bác bỏ giả thuyết H0 khi nó sai.
D. Bác bỏ giả thuyết H0 khi nó sai.
32. Trong kiểm định giả thuyết, việc tăng kích thước mẫu có xu hướng ảnh hưởng đến điều gì?
A. Tăng xác suất mắc sai lầm loại I.
B. Giảm ‘power’ của kiểm định.
C. Giảm xác suất mắc sai lầm loại II.
D. Không ảnh hưởng đến bất kỳ loại sai lầm nào.
33. Trong kiểm định giả thuyết, ‘power’ của một kiểm định (1-β) thể hiện điều gì?
A. Xác suất mắc sai lầm loại I.
B. Xác suất mắc sai lầm loại II.
C. Xác suất bác bỏ H0 khi H0 sai.
D. Xác suất không bác bỏ H0 khi H0 đúng.
34. Trong phân tích hồi quy, điều gì xảy ra nếu có hiện tượng đa cộng tuyến (multicollinearity)?
A. Các hệ số hồi quy trở nên ổn định hơn.
B. Các hệ số hồi quy trở nên khó giải thích và không đáng tin cậy.
C. Mô hình hồi quy trở nên chính xác hơn.
D. Phương sai sai số giảm.
35. Yếu tố nào sau đây không ảnh hưởng đến độ rộng của khoảng tin cậy?
A. Kích thước mẫu.
B. Độ lệch chuẩn của quần thể.
C. Mức độ tin cậy.
D. Giá trị trung bình của mẫu.
36. Trong kiểm định giả thuyết, giả thuyết nào luôn chứa dấu bằng (=, ≤, ≥)?
A. Giả thuyết thay thế (Alternative hypothesis).
B. Giả thuyết không (Null hypothesis).
C. Cả hai giả thuyết.
D. Không giả thuyết nào.
37. Trong kiểm định giả thuyết, điều gì ảnh hưởng đến ‘power’ của kiểm định?
A. Chỉ kích thước mẫu.
B. Chỉ mức ý nghĩa (α).
C. Kích thước mẫu, mức ý nghĩa (α) và độ lớn của hiệu ứng (effect size).
D. Không yếu tố nào cả.
38. Trong phân tích phương sai (ANOVA), giả thuyết H0 thường là gì?
A. Tất cả các trung bình quần thể đều khác nhau.
B. Ít nhất một trung bình quần thể khác với các trung bình còn lại.
C. Tất cả các trung bình quần thể đều bằng nhau.
D. Phương sai của tất cả các quần thể đều khác nhau.
39. Nếu giá trị p (p-value) nhỏ hơn mức ý nghĩa (α), chúng ta nên làm gì?
A. Chấp nhận giả thuyết H0.
B. Không bác bỏ giả thuyết H0.
C. Bác bỏ giả thuyết H0.
D. Tăng kích thước mẫu.
40. Giả sử bạn có một khoảng tin cậy 95% cho trung bình quần thể. Điều này có nghĩa là gì?
A. Có 95% khả năng trung bình mẫu nằm trong khoảng này.
B. Có 95% khả năng trung bình quần thể nằm trong khoảng này.
C. Có 5% khả năng trung bình quần thể không nằm trong khoảng này.
D. Nếu lặp lại quá trình lấy mẫu nhiều lần, 95% các khoảng tin cậy được tạo ra sẽ chứa trung bình quần thể.
41. Khi nào thì chúng ta sử dụng kiểm định Z một mẫu (one-sample Z test)?
A. Khi phương sai của quần thể chưa biết.
B. Khi kích thước mẫu nhỏ (n < 30).
C. Khi chúng ta muốn so sánh trung bình của mẫu với một giá trị đã biết và phương sai của quần thể đã biết.
D. Khi chúng ta muốn so sánh trung bình của hai mẫu độc lập.
42. Giả sử bạn thực hiện kiểm định giả thuyết và nhận được giá trị p = 0.08. Nếu mức ý nghĩa (α) là 0.05, bạn sẽ kết luận gì?
A. Bác bỏ giả thuyết H0.
B. Không bác bỏ giả thuyết H0.
C. Chấp nhận giả thuyết H1.
D. Cần thêm thông tin để đưa ra kết luận.
43. Một nhà quản lý muốn so sánh mức độ hài lòng của nhân viên giữa ba phòng ban khác nhau. Phương pháp thống kê nào phù hợp nhất?
A. Kiểm định t ghép cặp.
B. Kiểm định Z một mẫu.
C. Phân tích phương sai (ANOVA).
D. Kiểm định Chi-square.
44. Điều gì xảy ra với giá trị tới hạn (critical value) khi mức ý nghĩa (α) giảm xuống?
A. Giá trị tới hạn tăng lên.
B. Giá trị tới hạn giảm xuống.
C. Giá trị tới hạn không thay đổi.
D. Không thể xác định được sự thay đổi của giá trị tới hạn.
45. Khi kiểm định giả thuyết về sự khác biệt giữa hai trung bình quần thể độc lập, điều gì quan trọng cần xem xét trước khi chọn kiểm định t (t-test) hoặc kiểm định Z?
A. Kích thước của quần thể.
B. Phương sai của quần thể (đã biết hay chưa biết).
C. Giá trị trung bình của mẫu.
D. Mức ý nghĩa.
46. Một công ty muốn kiểm tra xem liệu một chiến dịch quảng cáo mới có làm tăng doanh số bán hàng trung bình hàng tháng hay không. Họ nên sử dụng loại kiểm định giả thuyết nào?
A. Kiểm định Chi-square.
B. Kiểm định t một phía (one-tailed t-test).
C. Kiểm định t hai phía (two-tailed t-test).
D. Phân tích phương sai (ANOVA).
47. Kiểm định Chi-square được sử dụng để làm gì?
A. Kiểm định về trung bình của hai quần thể.
B. Kiểm định về phương sai của một quần thể.
C. Kiểm định về sự độc lập giữa hai biến định tính.
D. Kiểm định về mối tương quan giữa hai biến định lượng.
48. Công thức tính khoảng tin cậy cho trung bình quần thể khi độ lệch chuẩn quần thể đã biết là gì?
A. χ ± z*(σ/√n)
B. χ ± t*(s/√n)
C. χ ± z*(s/√n)
D. χ ± t*(σ/√n)
49. Giá trị p (p-value) được sử dụng để làm gì trong kiểm định giả thuyết?
A. Đo lường độ mạnh của mối quan hệ giữa các biến.
B. Xác định kích thước mẫu cần thiết.
C. Quyết định xem có nên bác bỏ giả thuyết H0 hay không.
D. Ước lượng tham số của quần thể.
50. Điều gì xảy ra với độ rộng của khoảng tin cậy khi kích thước mẫu tăng lên (giả sử các yếu tố khác không đổi)?
A. Độ rộng của khoảng tin cậy tăng lên.
B. Độ rộng của khoảng tin cậy giảm xuống.
C. Độ rộng của khoảng tin cậy không thay đổi.
D. Không thể xác định được sự thay đổi của độ rộng khoảng tin cậy.
51. Khi nào thì chúng ta sử dụng kiểm định F?
A. Khi so sánh trung bình của hai nhóm.
B. Khi so sánh phương sai của hai nhóm.
C. Khi so sánh trung bình của ba nhóm trở lên (ANOVA) hoặc kiểm tra ý nghĩa tổng thể của mô hình hồi quy.
D. Khi kiểm tra sự độc lập giữa hai biến định tính.
52. Mối quan hệ giữa mức ý nghĩa (α) và độ tin cậy (confidence level) là gì?
A. α = Độ tin cậy.
B. α = 1 – Độ tin cậy.
C. α = 1 / Độ tin cậy.
D. α = – Độ tin cậy.
53. Khoảng tin cậy (Confidence interval) là gì?
A. Một khoảng giá trị mà chúng ta tin rằng chứa giá trị trung bình mẫu.
B. Một khoảng giá trị mà chúng ta tin rằng chứa tham số quần thể với một mức độ tin cậy nhất định.
C. Xác suất mà tham số quần thể nằm trong một khoảng giá trị nhất định.
D. Một khoảng giá trị mà chúng ta chắc chắn tham số quần thể sẽ nằm trong đó.
54. Khi nào thì chúng ta sử dụng kiểm định một phía (one-tailed test) thay vì kiểm định hai phía (two-tailed test)?
A. Khi chúng ta không có kỳ vọng về hướng của sự khác biệt.
B. Khi chúng ta muốn kiểm tra xem một tham số có khác 0 hay không.
C. Khi chúng ta có kỳ vọng cụ thể về hướng của sự khác biệt (lớn hơn hoặc nhỏ hơn).
D. Khi kích thước mẫu lớn.
55. Trong phân tích hồi quy, phần dư (residual) là gì?
A. Giá trị dự đoán của biến phụ thuộc.
B. Sai số chuẩn của các hệ số hồi quy.
C. Sự khác biệt giữa giá trị thực tế và giá trị dự đoán của biến phụ thuộc.
D. Độ dốc của đường hồi quy.
56. Trong kiểm định giả thuyết về trung bình của một quần thể, khi nào thì chúng ta sử dụng phân phối t (t-distribution) thay vì phân phối Z?
A. Khi kích thước mẫu lớn (n > 30).
B. Khi phương sai của quần thể đã biết.
C. Khi phương sai của quần thể chưa biết và kích thước mẫu nhỏ (n < 30).
D. Khi chúng ta muốn kiểm định về tỷ lệ.
57. Mức ý nghĩa (Significance level) trong kiểm định giả thuyết thường được ký hiệu là gì?
58. Trong phân tích hồi quy tuyến tính, hệ số xác định (R-squared) đo lường điều gì?
A. Độ mạnh của mối quan hệ giữa các biến độc lập.
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi các biến độc lập.
C. Độ dốc của đường hồi quy.
D. Sai số chuẩn của các hệ số hồi quy.
59. Trong kiểm định giả thuyết thống kê, sai lầm loại I (Type I error) xảy ra khi nào?
A. Chấp nhận giả thuyết H0 khi nó sai.
B. Bác bỏ giả thuyết H0 khi nó đúng.
C. Không bác bỏ giả thuyết H0 khi nó sai.
D. Bác bỏ giả thuyết H0 khi nó sai.
60. Khi nào thì chúng ta sử dụng kiểm định t ghép cặp (paired t-test)?
A. Khi so sánh trung bình của hai mẫu độc lập.
B. Khi so sánh trung bình của hai mẫu phụ thuộc (ví dụ: trước và sau can thiệp).
C. Khi so sánh trung bình của một mẫu với một giá trị đã biết.
D. Khi so sánh phương sai của hai mẫu.
61. Một công ty muốn ước tính doanh số bán hàng trung bình hàng tháng của một sản phẩm mới. Họ thu thập dữ liệu từ 30 cửa hàng bán lẻ trong một tháng. Phương pháp nào sau đây phù hợp nhất để ước tính khoảng tin cậy cho doanh số bán hàng trung bình?
A. Kiểm định Chi-square.
B. Phân tích phương sai (ANOVA).
C. Kiểm định t (t-test).
D. Phân tích hồi quy.
62. Trong hồi quy tuyến tính, hệ số xác định (R-squared) cho biết điều gì?
A. Mức độ ý nghĩa thống kê của các biến độc lập.
B. Tỷ lệ phần trăm biến thiên của biến phụ thuộc được giải thích bởi các biến độc lập trong mô hình.
C. Độ lớn của hệ số hồi quy.
D. Sai số chuẩn của ước lượng.
63. Trong phân tích hồi quy, hiện tượng đa cộng tuyến (multicollinearity) xảy ra khi nào?
A. Khi có mối tương quan cao giữa các biến độc lập.
B. Khi phương sai của sai số thay đổi.
C. Khi sai số không tuân theo phân phối chuẩn.
D. Khi số lượng biến độc lập lớn hơn số lượng quan sát.
64. Ý nghĩa của việc tính toán khoảng tin cậy (confidence interval) là gì?
A. Ước lượng một giá trị duy nhất cho tham số tổng thể.
B. Cung cấp một khoảng giá trị mà trong đó tham số tổng thể có khả năng nằm trong đó với một độ tin cậy nhất định.
C. Kiểm định xem giả thuyết có đúng hay không.
D. Tính toán độ lệch chuẩn của mẫu.
65. Một công ty muốn biết liệu có sự khác biệt đáng kể về mức độ hài lòng của khách hàng giữa ba chi nhánh khác nhau hay không. Phương pháp thống kê nào phù hợp nhất để sử dụng?
A. Kiểm định t (t-test).
B. Phân tích phương sai (ANOVA).
C. Hồi quy tuyến tính.
D. Kiểm định Chi-square.
66. Trong phân tích hồi quy, biến giả (dummy variable) được sử dụng để làm gì?
A. Để mã hóa các biến định lượng.
B. Để mã hóa các biến định tính.
C. Để giảm hiện tượng đa cộng tuyến.
D. Để tăng độ chính xác của ước lượng.
67. Trong phân tích chuỗi thời gian, thành phần xu hướng (trend) thể hiện điều gì?
A. Sự biến động ngẫu nhiên trong dữ liệu.
B. Sự biến động theo mùa trong dữ liệu.
C. Sự biến động dài hạn trong dữ liệu.
D. Sự biến động theo chu kỳ kinh tế.
68. Lỗi loại I (Type I error) trong kiểm định giả thuyết xảy ra khi nào?
A. Chấp nhận giả thuyết H0 khi H0 sai.
B. Bác bỏ giả thuyết H0 khi H0 đúng.
C. Chấp nhận giả thuyết H1 khi H1 sai.
D. Bác bỏ giả thuyết H1 khi H1 đúng.
69. Trong phân tích phương sai (ANOVA), ‘Tổng bình phương giữa các nhóm’ (Sum of Squares Between Groups – SSB) thể hiện điều gì?
A. Sự biến thiên tổng thể trong dữ liệu.
B. Sự biến thiên trong mỗi nhóm.
C. Sự biến thiên giữa các nhóm.
D. Sai số ngẫu nhiên.
70. Một nhà nghiên cứu muốn so sánh hiệu quả của ba phương pháp giảng dạy khác nhau. Ông chia sinh viên thành ba nhóm và áp dụng mỗi phương pháp cho một nhóm. Sau đó, ông kiểm tra kết quả học tập của sinh viên. Phương pháp thống kê nào phù hợp nhất để phân tích dữ liệu?
A. Kiểm định t (t-test).
B. Phân tích phương sai (ANOVA).
C. Hồi quy tuyến tính.
D. Kiểm định Chi-square.
71. Lỗi loại II (Type II error) trong kiểm định giả thuyết xảy ra khi nào?
A. Bác bỏ giả thuyết H0 khi H0 đúng.
B. Chấp nhận giả thuyết H0 khi H0 đúng.
C. Chấp nhận giả thuyết H0 khi H0 sai.
D. Bác bỏ giả thuyết H1 khi H1 đúng.
72. Khi nào thì nên sử dụng kiểm định Kolmogorov-Smirnov?
A. Để so sánh trung bình của hai mẫu.
B. Để kiểm tra xem một mẫu dữ liệu có tuân theo một phân phối cụ thể hay không.
C. Để đo lường mối quan hệ giữa hai biến định lượng.
D. Để so sánh phương sai của hai mẫu.
73. Giả sử bạn có dữ liệu về xếp hạng hài lòng của khách hàng (từ 1 đến 5) cho hai sản phẩm khác nhau. Bạn muốn so sánh xem có sự khác biệt đáng kể về mức độ hài lòng giữa hai sản phẩm hay không. Kiểm định nào sau đây phù hợp nhất?
A. Kiểm định t cho hai mẫu độc lập.
B. Kiểm định ANOVA.
C. Kiểm định Mann-Whitney U.
D. Kiểm định Chi-square.
74. Khi nào thì sử dụng kiểm định t (t-test) thay vì kiểm định z (z-test) để so sánh trung bình của hai mẫu?
A. Khi kích thước mẫu lớn (n > 30).
B. Khi phương sai của tổng thể đã biết.
C. Khi phương sai của tổng thể chưa biết và kích thước mẫu nhỏ (n < 30).
D. Khi dữ liệu tuân theo phân phối chuẩn.
75. Khi nào thì nên sử dụng kiểm định Wilcoxon signed-rank test?
A. Để so sánh trung bình của hai mẫu độc lập.
B. Để so sánh trung bình của hai mẫu phụ thuộc khi dữ liệu không tuân theo phân phối chuẩn.
C. Để kiểm tra sự phù hợp của một phân phối lý thuyết.
D. Để đo lường mối quan hệ tuyến tính giữa hai biến.
76. Mục đích chính của việc chuẩn hóa dữ liệu (data normalization) là gì?
A. Loại bỏ các giá trị ngoại lệ (outliers).
B. Chuyển đổi dữ liệu về cùng một thang đo để so sánh và phân tích dễ dàng hơn.
C. Đảm bảo dữ liệu tuân theo phân phối chuẩn.
D. Tăng kích thước mẫu.
77. Trong kiểm định giả thuyết, p-value là gì?
A. Xác suất giả thuyết H0 là đúng.
B. Xác suất quan sát được kết quả (hoặc kết quả cực đoan hơn) nếu giả thuyết H0 là đúng.
C. Xác suất mắc lỗi loại I.
D. Xác suất mắc lỗi loại II.
78. Một nhà quản lý muốn xác định xem có mối quan hệ giữa chi phí quảng cáo và doanh thu bán hàng hay không. Phương pháp thống kê nào phù hợp nhất để sử dụng?
A. Kiểm định t (t-test).
B. Phân tích phương sai (ANOVA).
C. Phân tích tương quan và hồi quy.
D. Kiểm định Chi-square.
79. Trong phân tích phương sai (ANOVA), yếu tố (factor) là gì?
A. Biến phụ thuộc được đo lường.
B. Biến độc lập định tính được sử dụng để phân loại các nhóm.
C. Tổng bình phương sai số trong các nhóm.
D. Giá trị trung bình của tất cả các quan sát.
80. Trong phân tích hồi quy, hệ số phóng đại phương sai (Variance Inflation Factor – VIF) được sử dụng để làm gì?
A. Để đo lường mức độ phù hợp của mô hình.
B. Để phát hiện hiện tượng đa cộng tuyến (multicollinearity).
C. Để kiểm tra phương sai của sai số.
D. Để chuẩn hóa dữ liệu.
81. Trong kiểm định giả thuyết, mức ý nghĩa (significance level) thường được ký hiệu là α, thể hiện điều gì?
A. Xác suất mắc lỗi loại II.
B. Xác suất bác bỏ giả thuyết H0 khi H0 đúng.
C. Xác suất chấp nhận giả thuyết H0 khi H0 sai.
D. Xác suất chấp nhận giả thuyết H0 khi H0 đúng.
82. Trong phân tích hồi quy, sai số chuẩn (standard error) của hệ số hồi quy đo lường điều gì?
A. Độ lệch chuẩn của biến phụ thuộc.
B. Độ lệch chuẩn của biến độc lập.
C. Độ chính xác của ước lượng hệ số hồi quy.
D. Mức độ phù hợp của mô hình hồi quy.
83. Khi nào thì nên sử dụng kiểm định Kruskal-Wallis?
A. Để so sánh trung bình của hai mẫu độc lập.
B. Để so sánh trung bình của ba mẫu trở lên khi dữ liệu không tuân theo phân phối chuẩn.
C. Để kiểm tra mối quan hệ giữa hai biến định tính.
D. Để dự báo giá trị tương lai của một biến.
84. Khi nào thì nên sử dụng kiểm định Chi-square?
A. Để so sánh trung bình của hai mẫu độc lập.
B. Để kiểm tra sự phù hợp của một phân phối lý thuyết với dữ liệu thực tế hoặc kiểm tra tính độc lập giữa hai biến định tính.
C. Để đo lường mối quan hệ tuyến tính giữa hai biến định lượng.
D. Để ước lượng khoảng tin cậy cho trung bình tổng thể.
85. Trong kiểm định giả thuyết, việc tăng kích thước mẫu (sample size) có ảnh hưởng gì đến khả năng bác bỏ giả thuyết H0 khi H0 sai?
A. Giảm khả năng bác bỏ H0.
B. Tăng khả năng bác bỏ H0.
C. Không ảnh hưởng đến khả năng bác bỏ H0.
D. Chỉ ảnh hưởng đến mức ý nghĩa (significance level).
86. Một nhà đầu tư muốn đánh giá rủi ro của một danh mục đầu tư. Chỉ số nào sau đây phù hợp nhất để đo lường rủi ro?
A. Giá trị trung bình.
B. Phương sai hoặc độ lệch chuẩn.
C. Trung vị.
D. Mốt.
87. Trong phân tích hồi quy, hiện tượng phương sai sai số thay đổi (heteroscedasticity) có nghĩa là gì?
A. Phương sai của sai số là không đổi.
B. Phương sai của sai số thay đổi theo giá trị của biến độc lập.
C. Các biến độc lập có tương quan cao với nhau.
D. Sai số tuân theo phân phối chuẩn.
88. Trong phân tích hồi quy, phương pháp bình phương tối thiểu (Ordinary Least Squares – OLS) được sử dụng để làm gì?
A. Ước lượng các hệ số hồi quy sao cho tổng bình phương sai số là nhỏ nhất.
B. Kiểm tra tính độc lập giữa các biến độc lập.
C. Dự báo giá trị của biến phụ thuộc.
D. Tính toán hệ số xác định (R-squared).
89. Giả sử bạn có một mẫu dữ liệu về doanh thu của một công ty trong 12 tháng. Bạn muốn dự báo doanh thu cho tháng tiếp theo. Phương pháp nào sau đây phù hợp nhất?
A. Phân tích phương sai (ANOVA).
B. Hồi quy tuyến tính.
C. Phân tích chuỗi thời gian (Time series analysis).
D. Kiểm định Chi-square.
90. Khi nào thì nên sử dụng kiểm định phi tham số (non-parametric test)?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn (n > 30).
C. Khi các giả định về phân phối của dữ liệu không được đáp ứng.
D. Khi phương sai của tổng thể đã biết.
91. Sự khác biệt chính giữa mô hình tác động cố định (fixed effects model) và mô hình tác động ngẫu nhiên (random effects model) trong phân tích dữ liệu bảng là gì?
A. Mô hình tác động cố định giả định rằng các tác động riêng của từng đơn vị có tương quan với các biến độc lập, trong khi mô hình tác động ngẫu nhiên giả định rằng chúng không có tương quan.
B. Mô hình tác động ngẫu nhiên giả định rằng các tác động riêng của từng đơn vị có tương quan với các biến độc lập, trong khi mô hình tác động cố định giả định rằng chúng không có tương quan.
C. Mô hình tác động cố định sử dụng phương pháp bình phương tối thiểu tổng quát (Generalized Least Squares – GLS), trong khi mô hình tác động ngẫu nhiên sử dụng phương pháp bình phương tối thiểu thông thường (Ordinary Least Squares – OLS).
D. Mô hình tác động ngẫu nhiên phù hợp hơn khi số lượng đơn vị lớn hơn số lượng thời kỳ, trong khi mô hình tác động cố định phù hợp hơn khi số lượng thời kỳ lớn hơn số lượng đơn vị.
92. Khi nào thì nên sử dụng mô hình hồi quy logistic thay vì mô hình hồi quy tuyến tính?
A. Khi biến phụ thuộc là biến định tính (categorical).
B. Khi các biến độc lập có mối quan hệ phi tuyến tính với biến phụ thuộc.
C. Khi có hiện tượng đa cộng tuyến.
D. Khi phương sai của sai số thay đổi.
93. Trong phân tích chuỗi thời gian, chỉ số nào sau đây đo lường mức độ biến động của chuỗi thời gian so với giá trị trung bình của nó?
A. Phương sai.
B. Độ lệch chuẩn.
C. Hệ số biến thiên (Coefficient of Variation).
D. Hệ số tương quan.
94. Trong phân tích dữ liệu bảng, kiểm định Hausman được sử dụng để làm gì?
A. Kiểm tra sự phù hợp của mô hình hồi quy.
B. Kiểm tra tính dừng của chuỗi thời gian.
C. Kiểm tra xem nên sử dụng mô hình tác động cố định hay mô hình tác động ngẫu nhiên.
D. Kiểm tra hiện tượng đa cộng tuyến.
95. Trong mô hình hồi quy đa biến, hệ số hồi quy riêng phần (partial regression coefficient) cho biết điều gì?
A. Mức thay đổi của biến phụ thuộc khi một biến độc lập thay đổi một đơn vị, giữ các biến độc lập khác không đổi.
B. Mức thay đổi của biến phụ thuộc khi tất cả các biến độc lập thay đổi một đơn vị.
C. Mức độ tương quan giữa biến độc lập và biến phụ thuộc.
D. Mức độ quan trọng của một biến độc lập trong mô hình.
96. Trong hồi quy tuyến tính đơn giản, hệ số chặn (intercept) biểu diễn điều gì?
A. Giá trị của biến độc lập khi biến phụ thuộc bằng 0.
B. Mức thay đổi trung bình của biến phụ thuộc khi biến độc lập tăng một đơn vị.
C. Giá trị dự đoán của biến phụ thuộc khi tất cả các biến độc lập bằng 0.
D. Độ mạnh của mối quan hệ giữa biến độc lập và biến phụ thuộc.
97. Phương pháp trung bình trượt (moving average) được sử dụng để làm gì trong phân tích chuỗi thời gian?
A. Dự báo giá trị tương lai của chuỗi thời gian.
B. Làm mịn chuỗi thời gian để loại bỏ các biến động ngắn hạn.
C. Xác định xu hướng của chuỗi thời gian.
D. Phân tích tính thời vụ của chuỗi thời gian.
98. Khi nào thì nên sử dụng mô hình VAR (Vector Autoregression)?
A. Khi có nhiều chuỗi thời gian có ảnh hưởng lẫn nhau.
B. Khi chỉ có một chuỗi thời gian.
C. Khi muốn dự báo giá trị của một biến dựa trên các biến khác.
D. Khi muốn phân tích tính thời vụ của chuỗi thời gian.
99. Trong phân tích hồi quy, nếu bạn nghi ngờ rằng có một số điểm dữ liệu có ảnh hưởng lớn đến kết quả (outliers), bạn nên sử dụng phương pháp nào để giảm thiểu ảnh hưởng của chúng?
A. Hồi quy mạnh (Robust Regression).
B. Hồi quy Ridge.
C. Hồi quy Lasso.
D. Hồi quy Quantile.
100. Trong phân tích phương sai (ANOVA), thống kê F được sử dụng để kiểm định giả thuyết nào?
A. Tất cả các trung bình của các nhóm đều bằng nhau.
B. Ít nhất một cặp trung bình của các nhóm khác nhau.
C. Phương sai của các nhóm bằng nhau.
D. Các nhóm có phân phối chuẩn.
101. Sự khác biệt chính giữa hồi quy Ridge (Ridge Regression) và hồi quy Lasso (Lasso Regression) là gì?
A. Hồi quy Ridge có xu hướng thu nhỏ các hệ số về 0, trong khi hồi quy Lasso có thể loại bỏ hoàn toàn một số biến khỏi mô hình.
B. Hồi quy Lasso có xu hướng thu nhỏ các hệ số về 0, trong khi hồi quy Ridge có thể loại bỏ hoàn toàn một số biến khỏi mô hình.
C. Hồi quy Ridge sử dụng chuẩn L1 để phạt các hệ số, trong khi hồi quy Lasso sử dụng chuẩn L2.
D. Hồi quy Lasso phù hợp hơn khi có nhiều biến quan trọng, trong khi hồi quy Ridge phù hợp hơn khi có ít biến quan trọng.
102. Trong mô hình VAR, khái niệm ‘impulse response function’ (hàm phản ứng xung) được sử dụng để làm gì?
A. Để đo lường tác động của một cú sốc (shock) lên một biến trong mô hình đến các biến khác theo thời gian.
B. Để dự báo giá trị tương lai của các biến trong mô hình.
C. Để kiểm tra tính dừng của các chuỗi thời gian.
D. Để phân tích phương sai của các biến trong mô hình.
103. Mục đích của việc phân tích chuỗi thời gian là gì?
A. Để dự đoán các giá trị tương lai dựa trên các giá trị quá khứ.
B. Để xác định mối quan hệ nhân quả giữa các biến.
C. Để so sánh các chuỗi thời gian khác nhau.
D. Để phân tích phương sai của dữ liệu.
104. Trong phân tích chuỗi thời gian, thành phần nào sau đây KHÔNG thuộc các thành phần chính của chuỗi thời gian?
A. Xu hướng (Trend).
B. Tính thời vụ (Seasonality).
C. Tính chu kỳ (Cyclical).
D. Tính ngẫu nhiên (Randomness).
105. Mục đích chính của việc sử dụng dữ liệu bảng (panel data) là gì?
A. Để tăng kích thước mẫu.
B. Để kiểm soát các yếu tố không quan sát được và không thay đổi theo thời gian.
C. Để phân tích mối quan hệ nhân quả giữa các biến.
D. Tất cả các đáp án trên.
106. Ý nghĩa của hệ số xác định (R-squared) trong phân tích hồi quy là gì?
A. Đo lường mức độ phù hợp của mô hình hồi quy với dữ liệu.
B. Ước lượng sai số chuẩn của các hệ số hồi quy.
C. Xác định mối quan hệ nhân quả giữa các biến.
D. Tính toán giá trị p cho các hệ số hồi quy.
107. Khi kiểm định giả thuyết về một hệ số hồi quy, giá trị p (p-value) cho biết điều gì?
A. Xác suất mà giả thuyết không bị bác bỏ.
B. Xác suất quan sát được một thống kê kiểm định có giá trị lớn hơn hoặc bằng giá trị quan sát được, giả sử giả thuyết không đúng là đúng.
C. Mức ý nghĩa của kiểm định.
D. Sai số loại I.
108. Trong phân tích dữ liệu bảng (panel data), tác động cố định (fixed effects) được sử dụng để kiểm soát yếu tố nào?
A. Các đặc điểm không quan sát được và không thay đổi theo thời gian của từng đơn vị.
B. Các đặc điểm quan sát được và thay đổi theo thời gian của từng đơn vị.
C. Các đặc điểm không quan sát được và thay đổi theo thời gian của từng đơn vị.
D. Các đặc điểm quan sát được và không thay đổi theo thời gian của từng đơn vị.
109. Trong phân tích hồi quy, kiểm định White được sử dụng để kiểm tra hiện tượng nào?
A. Đa cộng tuyến.
B. Tự tương quan.
C. Phương sai sai số thay đổi.
D. Sai số có phân phối không chuẩn.
110. Hệ số tự tương quan (autocorrelation) đo lường điều gì trong phân tích chuỗi thời gian?
A. Mức độ tương quan giữa các giá trị của chuỗi thời gian tại các thời điểm khác nhau.
B. Mức độ biến động của chuỗi thời gian.
C. Xu hướng của chuỗi thời gian.
D. Tính thời vụ của chuỗi thời gian.
111. Khi nào nên sử dụng hồi quy Ridge (Ridge Regression) hoặc hồi quy Lasso (Lasso Regression) thay vì hồi quy tuyến tính thông thường?
A. Khi có hiện tượng đa cộng tuyến hoặc khi số lượng biến độc lập lớn hơn số lượng quan sát.
B. Khi không có hiện tượng đa cộng tuyến và số lượng biến độc lập nhỏ hơn số lượng quan sát.
C. Khi biến phụ thuộc là biến định tính.
D. Khi phương sai của sai số thay đổi.
112. Giả định nào sau đây KHÔNG phải là một trong những giả định chính của mô hình hồi quy tuyến tính cổ điển (Classical Linear Regression Model – CLRM)?
A. Sai số có phân phối chuẩn.
B. Giá trị trung bình của sai số bằng 0.
C. Phương sai của sai số không đổi (homoscedasticity).
D. Không có tự tương quan giữa các sai số.
113. Trong phân tích chuỗi thời gian, phương pháp nào sau đây sử dụng các giá trị quá khứ của chuỗi thời gian để dự báo các giá trị tương lai?
A. Hồi quy tuyến tính.
B. Trung bình trượt.
C. San bằng hàm mũ (Exponential Smoothing).
D. Tất cả các đáp án trên.
114. Trong mô hình VAR, kiểm định Granger causality được sử dụng để làm gì?
A. Để xác định xem một chuỗi thời gian có giúp dự báo một chuỗi thời gian khác hay không.
B. Để kiểm tra tính dừng của các chuỗi thời gian.
C. Để kiểm tra phương sai sai số thay đổi.
D. Để kiểm tra đa cộng tuyến.
115. Khi nào thì nên sử dụng phương pháp san bằng hàm mũ (exponential smoothing) thay vì phương pháp trung bình trượt (moving average) trong phân tích chuỗi thời gian?
A. Khi chuỗi thời gian có xu hướng hoặc tính thời vụ.
B. Khi chuỗi thời gian không có xu hướng hoặc tính thời vụ.
C. Khi cần làm mịn chuỗi thời gian.
D. Khi cần xác định hệ số tự tương quan.
116. Trong phân tích hồi quy, điều gì xảy ra khi có hiện tượng đa cộng tuyến (multicollinearity)?
A. Các hệ số hồi quy trở nên ổn định và dễ diễn giải hơn.
B. Phương sai của các hệ số hồi quy tăng lên, làm cho các ước lượng kém chính xác hơn.
C. Giá trị R-squared giảm đáng kể.
D. Mô hình hồi quy trở nên phù hợp hơn với dữ liệu.
117. Kiểm định Durbin-Watson được sử dụng để phát hiện hiện tượng nào trong mô hình hồi quy?
A. Đa cộng tuyến.
B. Phương sai sai số thay đổi.
C. Tự tương quan.
D. Sai số có phân phối không chuẩn.
118. Trong phân tích dữ liệu bảng, phương pháp sai phân bậc nhất (first difference) được sử dụng để giải quyết vấn đề nào?
A. Phương sai sai số thay đổi.
B. Tự tương quan.
C. Các biến không quan sát được và không thay đổi theo thời gian.
D. Đa cộng tuyến.
119. Điều gì xảy ra nếu các chuỗi thời gian trong mô hình VAR không dừng (non-stationary)?
A. Các kết quả của mô hình VAR có thể không đáng tin cậy và dẫn đến hồi quy giả mạo (spurious regression).
B. Mô hình VAR sẽ tự động điều chỉnh để xử lý tính không dừng.
C. Kiểm định Granger causality sẽ không thể thực hiện được.
D. Hàm phản ứng xung (impulse response function) sẽ không thể tính toán được.
120. Phương pháp nào sau đây thường được sử dụng để khắc phục hiện tượng phương sai sai số thay đổi (heteroscedasticity) trong mô hình hồi quy?
A. Sử dụng biến giả (dummy variable).
B. Biến đổi logarit cho biến phụ thuộc.
C. Kiểm định Durbin-Watson.
D. Loại bỏ các biến độc lập không quan trọng.
121. Trong phân tích phương sai (ANOVA) hai yếu tố (two-way ANOVA), chúng ta có thể kiểm tra điều gì?
A. Tác động của một yếu tố duy nhất.
B. Tác động của hai yếu tố và tương tác giữa chúng.
C. Mối tương quan giữa hai biến liên tục.
D. Sự khác biệt giữa các phương sai.
122. Điều kiện nào sau đây KHÔNG phải là điều kiện để sử dụng kiểm định z?
A. Tổng thể có phân phối chuẩn hoặc kích thước mẫu đủ lớn (n > 30).
B. Độ lệch chuẩn của tổng thể đã biết.
C. Kích thước mẫu nhỏ (n < 30).
D. Mục tiêu là kiểm định về trung bình tổng thể.
123. Khi nào thì chúng ta sử dụng kiểm định Wilcoxon signed-rank test?
A. Để so sánh trung bình của hai mẫu độc lập.
B. Để so sánh trung bình của hai mẫu liên quan khi dữ liệu không tuân theo phân phối chuẩn.
C. Để so sánh phương sai của hai mẫu.
D. Để kiểm tra tính độc lập của hai biến định tính.
124. Trong phân tích chuỗi thời gian, thành phần mùa vụ (seasonal component) thể hiện điều gì?
A. Sự biến động dài hạn và có hệ thống.
B. Sự biến động ngắn hạn và ngẫu nhiên.
C. Sự biến động lặp đi lặp lại trong một khoảng thời gian cố định (ví dụ: hàng năm, hàng quý).
D. Sự biến động theo chu kỳ kinh tế.
125. Trong hồi quy tuyến tính, sai số chuẩn (standard error) của hệ số hồi quy đo lường điều gì?
A. Độ lệch chuẩn của biến phụ thuộc.
B. Độ lệch chuẩn của biến độc lập.
C. Độ lệch chuẩn của các sai số (residuals).
D. Độ lệch chuẩn của ước lượng hệ số hồi quy.
126. Trong phân tích hồi quy đa biến, hiện tượng đa cộng tuyến (multicollinearity) xảy ra khi nào?
A. Khi biến phụ thuộc tương quan với chính nó.
B. Khi các biến độc lập tương quan cao với nhau.
C. Khi các sai số (residuals) tương quan với nhau.
D. Khi biến độc lập không tương quan với biến phụ thuộc.
127. Trong kiểm định giả thuyết, mức ý nghĩa (significance level) thường được ký hiệu là α (alpha) đại diện cho điều gì?
A. Xác suất mắc lỗi loại II.
B. Xác suất bác bỏ giả thuyết H0 khi H0 đúng.
C. Xác suất chấp nhận giả thuyết H0 khi H0 sai.
D. Xác suất chấp nhận giả thuyết H0 khi H0 đúng.
128. Khi nào thì nên sử dụng kiểm định t (t-test) thay vì kiểm định z (z-test) trong thống kê?
A. Khi kích thước mẫu lớn (n > 30) và độ lệch chuẩn của tổng thể đã biết.
B. Khi kích thước mẫu nhỏ (n < 30) và độ lệch chuẩn của tổng thể chưa biết.
C. Khi phương sai của hai mẫu bằng nhau.
D. Khi dữ liệu tuân theo phân phối chuẩn.
129. Trong kiểm định χ² (Chi-square) về tính độc lập, giả thuyết H0 là gì?
A. Hai biến có liên quan đến nhau.
B. Hai biến không liên quan đến nhau.
C. Hai biến có phân phối giống nhau.
D. Hai biến có trung bình bằng nhau.
130. Lỗi loại II (Type II error) trong kiểm định giả thuyết xảy ra khi nào?
A. Bác bỏ giả thuyết H0 khi H0 đúng.
B. Chấp nhận giả thuyết H0 khi H0 đúng.
C. Bác bỏ giả thuyết H0 khi H0 sai.
D. Chấp nhận giả thuyết H0 khi H0 sai.
131. Phương pháp nào sau đây được sử dụng để kiểm tra tính dừng (stationarity) của chuỗi thời gian?
A. Phân tích hồi quy.
B. Kiểm định Dickey-Fuller.
C. Phương pháp trung bình trượt.
D. Phân tích phương sai.
132. Trong kiểm định giả thuyết, nếu giá trị p nhỏ hơn mức ý nghĩa α, chúng ta nên làm gì?
A. Chấp nhận giả thuyết H0.
B. Bác bỏ giả thuyết H0.
C. Không đưa ra kết luận.
D. Tăng kích thước mẫu.
133. Khi nào thì chúng ta sử dụng kiểm định Kruskal-Wallis test?
A. Để so sánh trung bình của hai mẫu độc lập.
B. Để so sánh trung bình của ba nhóm trở lên khi dữ liệu không tuân theo phân phối chuẩn.
C. Để so sánh phương sai của hai mẫu.
D. Để kiểm tra tính độc lập của hai biến định tính.
134. Lỗi loại I (Type I error) trong kiểm định giả thuyết xảy ra khi nào?
A. Bác bỏ giả thuyết H0 khi H0 đúng.
B. Chấp nhận giả thuyết H0 khi H0 đúng.
C. Bác bỏ giả thuyết H0 khi H0 sai.
D. Chấp nhận giả thuyết H0 khi H0 sai.
135. Độ mạnh của kiểm định (power of a test) được định nghĩa là gì?
A. Xác suất mắc lỗi loại I.
B. Xác suất mắc lỗi loại II.
C. Xác suất bác bỏ H0 khi H0 sai.
D. Xác suất chấp nhận H0 khi H0 đúng.
136. Khi nào chúng ta sử dụng kiểm định phi tham số (non-parametric test) thay vì kiểm định tham số (parametric test)?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc kích thước mẫu nhỏ.
D. Khi phương sai của các nhóm bằng nhau.
137. Trong phân tích hồi quy, hiện tượng phương sai của sai số thay đổi (heteroscedasticity) có nghĩa là gì?
A. Các sai số (residuals) có phương sai không đổi.
B. Các sai số (residuals) có phương sai thay đổi theo giá trị của biến độc lập.
C. Các biến độc lập tương quan với nhau.
D. Mô hình không tuyến tính.
138. Trong phân tích phương sai (ANOVA), yếu tố nào sau đây được sử dụng để so sánh sự khác biệt giữa các nhóm?
A. Độ lệch chuẩn.
B. Phương sai.
C. Trung bình.
D. Trung vị.
139. Hệ số tương quan (correlation coefficient) có giá trị bằng -1 có ý nghĩa gì?
A. Không có mối tương quan tuyến tính giữa hai biến.
B. Có mối tương quan tuyến tính hoàn hảo và dương giữa hai biến.
C. Có mối tương quan tuyến tính hoàn hảo và âm giữa hai biến.
D. Có mối tương quan phi tuyến tính giữa hai biến.
140. Khi thực hiện kiểm định giả thuyết về tỷ lệ, chúng ta sử dụng phân phối nào?
A. Phân phối t.
B. Phân phối chuẩn.
C. Phân phối χ².
D. Phân phối F.
141. Khi nào thì nên sử dụng kiểm định F (F-test)?
A. Để so sánh trung bình của hai nhóm.
B. Để so sánh phương sai của hai nhóm.
C. Để so sánh trung bình của ba nhóm trở lên.
D. Để kiểm tra tính độc lập của hai biến định tính.
142. Trong kiểm định χ² (Chi-square), thống kê kiểm định được tính dựa trên sự khác biệt giữa giá trị quan sát được và giá trị nào?
A. Giá trị trung bình.
B. Giá trị kỳ vọng.
C. Giá trị trung vị.
D. Giá trị lớn nhất.
143. Trong phân tích hồi quy, hệ số xác định (R-squared) đo lường điều gì?
A. Mức độ tương quan giữa các biến độc lập.
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi các biến độc lập.
C. Độ lệch chuẩn của các sai số (residuals).
D. Mức độ ý nghĩa thống kê của các hệ số hồi quy.
144. Hệ số phóng đại phương sai (Variance Inflation Factor – VIF) được sử dụng để phát hiện vấn đề gì trong hồi quy tuyến tính?
A. Phương sai của sai số (residuals) thay đổi.
B. Đa cộng tuyến (multicollinearity).
C. Dữ liệu ngoại lệ (outliers).
D. Mô hình không tuyến tính.
145. Khi nào thì chúng ta sử dụng kiểm định Mann-Whitney U test?
A. Để so sánh trung bình của hai mẫu liên quan.
B. Để so sánh trung bình của hai mẫu độc lập khi dữ liệu không tuân theo phân phối chuẩn.
C. Để so sánh phương sai của hai mẫu.
D. Để kiểm tra tính độc lập của hai biến định tính.
146. Trong phân tích chuỗi thời gian, phương pháp trung bình trượt (moving average) được sử dụng để làm gì?
A. Dự báo giá trị tương lai.
B. Loại bỏ thành phần xu hướng.
C. Làm mịn dữ liệu và giảm nhiễu.
D. Phân tích sự biến động theo mùa.
147. Trong phân tích chuỗi thời gian (time series analysis), thành phần xu hướng (trend) thể hiện điều gì?
A. Sự biến động ngắn hạn và ngẫu nhiên.
B. Sự biến động theo mùa.
C. Sự biến động dài hạn và có hệ thống.
D. Sự biến động theo chu kỳ kinh tế.
148. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết H0 là đúng.
B. Xác suất giả thuyết H1 là đúng.
C. Xác suất thu được kết quả (hoặc kết quả cực đoan hơn) nếu H0 là đúng.
D. Xác suất mắc lỗi loại II.
149. Khoảng tin cậy (confidence interval) cho trung bình tổng thể được tính như thế nào?
A. Trung bình mẫu ± (giá trị tới hạn * sai số chuẩn).
B. Trung bình mẫu / (giá trị tới hạn * sai số chuẩn).
C. Trung bình mẫu + (giá trị tới hạn / sai số chuẩn).
D. Trung bình mẫu – (giá trị tới hạn / sai số chuẩn).
150. Trong phân tích hồi quy, sai số chuẩn của ước lượng (standard error of the estimate) đo lường điều gì?
A. Độ lệch chuẩn của biến phụ thuộc.
B. Độ lệch chuẩn của biến độc lập.
C. Độ lệch chuẩn của các sai số (residuals).
D. Độ lệch chuẩn của các hệ số hồi quy.