1. Giả định nào sau đây KHÔNG phải là một trong các giả định OLS (Ordinary Least Squares) tiêu chuẩn trong hồi quy tuyến tính?
A. Sai số có phân phối chuẩn với trung bình bằng 0.
B. Các sai số có phương sai không đổi (tính đồng nhất phương sai).
C. Không có đa cộng tuyến hoàn hảo giữa các biến độc lập.
D. Các biến độc lập phải có phân phối chuẩn.
2. Trong phân tích hồi quy, ‘biến trễ’ (lagged variable) thường được sử dụng để:
A. Đại diện cho các biến định tính.
B. Mô hình hóa tác động của các giá trị quá khứ của một biến lên giá trị hiện tại của biến khác hoặc chính nó.
C. Giảm hiện tượng đa cộng tuyến.
D. Cải thiện độ chính xác của dự báo.
3. Phương pháp nào sau đây thường được sử dụng để kiểm tra tính dừng của chuỗi thời gian?
A. Kiểm định Breusch-Pagan.
B. Kiểm định Durbin-Watson.
C. Kiểm định Augmented Dickey-Fuller (ADF).
D. Kiểm định Shapiro-Wilk.
4. Trong mô hình ARIMA, thành phần ‘I’ đại diện cho:
A. Trung bình trượt (Moving Average).
B. Tích hợp (Integration) – số lần sai phân cần thiết để làm cho chuỗi dừng.
C. Tự hồi quy (Autoregression).
D. Tính mùa vụ (Seasonality).
5. Khi nào thì nên sử dụng mô hình Poisson regression?
A. Khi biến phụ thuộc là biến liên tục.
B. Khi biến phụ thuộc là biến đếm (count variable).
C. Khi biến phụ thuộc là biến nhị phân.
D. Khi có hiện tượng đa cộng tuyến.
6. Trong phân tích chuỗi thời gian, một chuỗi được coi là dừng (stationary) nếu:
A. Trung bình và phương sai của chuỗi không đổi theo thời gian.
B. Chuỗi có xu hướng tăng hoặc giảm rõ rệt.
C. Chuỗi có tính mùa vụ mạnh.
D. Chuỗi có tự tương quan bằng 0.
7. Nếu một biến độc lập trong mô hình hồi quy có p-value lớn hơn mức ý nghĩa (ví dụ: 0.05), điều này có nghĩa là:
A. Biến độc lập đó có ý nghĩa thống kê và nên được giữ lại trong mô hình.
B. Biến độc lập đó không có ý nghĩa thống kê và có thể bị loại bỏ khỏi mô hình.
C. Có hiện tượng đa cộng tuyến trong mô hình.
D. Mô hình hồi quy không phù hợp.
8. Trong phân tích dữ liệu bảng, kiểm định Hausman được sử dụng để:
A. Kiểm tra tính dừng của chuỗi thời gian.
B. Kiểm tra phương sai sai số thay đổi.
C. Lựa chọn giữa mô hình tác động cố định và mô hình tác động ngẫu nhiên.
D. Kiểm tra đa cộng tuyến.
9. Mô hình nào sau đây phù hợp nhất để dự báo dữ liệu chuỗi thời gian có tính mùa vụ?
A. Mô hình hồi quy tuyến tính đơn.
B. Mô hình ARIMA không mùa vụ.
C. Mô hình ARIMA mùa vụ (SARIMA).
D. Mô hình GARCH.
10. Hệ số tương quan phần (partial correlation coefficient) đo lường điều gì?
A. Mối tương quan giữa hai biến sau khi kiểm soát ảnh hưởng của các biến khác.
B. Mối tương quan giữa tất cả các biến trong mô hình.
C. Mức độ phù hợp của mô hình hồi quy.
D. Mức độ thay đổi của biến phụ thuộc khi biến độc lập thay đổi.
11. Trong hồi quy tuyến tính bội, hệ số xác định (R-squared) điều chỉnh được sử dụng để:
A. Đo lường mối quan hệ tuyến tính giữa các biến độc lập.
B. Ước lượng phương sai của sai số ngẫu nhiên.
C. Đánh giá mức độ phù hợp của mô hình, có tính đến số lượng biến độc lập trong mô hình.
D. Kiểm tra sự phù hợp của mô hình hồi quy tuyến tính đơn.
12. Trong mô hình hồi quy, biến giả (dummy variable) thường được sử dụng để:
A. Đại diện cho các biến định tính (qualitative variables).
B. Giảm hiện tượng đa cộng tuyến.
C. Cải thiện độ chính xác của dự báo.
D. Đo lường tác động phi tuyến tính của các biến độc lập.
13. Kiểm định Durbin-Watson được sử dụng để kiểm tra:
A. Phương sai sai số thay đổi.
B. Tự tương quan (autocorrelation) trong các sai số.
C. Đa cộng tuyến.
D. Tính dừng của chuỗi thời gian.
14. Ý nghĩa của hệ số chặn (intercept) trong mô hình hồi quy là gì?
A. Giá trị của biến phụ thuộc khi tất cả các biến độc lập bằng 0.
B. Mức độ thay đổi của biến phụ thuộc khi một biến độc lập thay đổi một đơn vị.
C. Độ dốc của đường hồi quy.
D. Phương sai của sai số.
15. Phương pháp nào sau đây thường được sử dụng để phát hiện hiện tượng phương sai sai số thay đổi (heteroscedasticity)?
A. Kiểm định Durbin-Watson.
B. Kiểm định Breusch-Pagan.
C. Kiểm định Shapiro-Wilk.
D. Kiểm định Augmented Dickey-Fuller.
16. Điều gì KHÔNG phải là một vấn đề tiềm ẩn trong phân tích hồi quy?
A. Đa cộng tuyến.
B. Phương sai sai số thay đổi.
C. Tự tương quan.
D. Tính đồng nhất.
17. Khi nào thì kiểm định F được sử dụng trong phân tích hồi quy?
A. Để kiểm tra xem một biến độc lập cụ thể có ý nghĩa thống kê hay không.
B. Để kiểm tra xem toàn bộ mô hình hồi quy có ý nghĩa thống kê hay không.
C. Để kiểm tra tính đa cộng tuyến giữa các biến độc lập.
D. Để kiểm tra tính dừng của chuỗi thời gian.
18. Phương pháp nào sau đây thường được sử dụng để xử lý phương sai sai số thay đổi?
A. Sử dụng sai số chuẩn mạnh (robust standard errors).
B. Sử dụng kiểm định Durbin-Watson.
C. Loại bỏ các biến độc lập.
D. Tăng kích thước mẫu.
19. Khi nào thì nên sử dụng mô hình Logit hoặc Probit thay vì hồi quy tuyến tính?
A. Khi biến phụ thuộc là biến liên tục.
B. Khi biến phụ thuộc là biến nhị phân (binary).
C. Khi có hiện tượng đa cộng tuyến.
D. Khi các sai số không có phân phối chuẩn.
20. Hàm phản ứng đẩy (impulse response function) trong mô hình VAR được sử dụng để:
A. Đo lường tác động của một cú sốc (shock) đối với một biến lên các biến khác trong hệ thống theo thời gian.
B. Kiểm tra tính dừng của chuỗi thời gian.
C. Ước lượng các hệ số trong mô hình hồi quy.
D. Phát hiện phương sai sai số thay đổi.
21. Trong mô hình VAR (Vector Autoregression), mục tiêu chính là:
A. Dự báo một biến duy nhất dựa trên các giá trị quá khứ của nó.
B. Mô hình hóa mối quan hệ tương tác giữa nhiều chuỗi thời gian.
C. Kiểm tra tính dừng của chuỗi thời gian.
D. Phát hiện phương sai sai số thay đổi.
22. Hiện tượng đa cộng tuyến (multicollinearity) xảy ra khi:
A. Có mối tương quan tuyến tính hoàn hảo hoặc gần hoàn hảo giữa hai hoặc nhiều biến độc lập trong mô hình hồi quy.
B. Phương sai của sai số thay đổi theo giá trị của biến độc lập.
C. Các sai số không độc lập với nhau.
D. Mô hình hồi quy không tuyến tính.
23. Điều gì KHÔNG phải là một biện pháp để giảm thiểu tác động của đa cộng tuyến?
A. Tăng kích thước mẫu.
B. Loại bỏ một hoặc nhiều biến độc lập có tương quan cao.
C. Biến đổi các biến độc lập (ví dụ: tạo biến tương tác).
D. Sử dụng kiểm định Durbin-Watson.
24. Điều gì KHÔNG phải là một lợi ích của việc sử dụng dữ liệu bảng?
A. Kiểm soát các biến số không quan sát được không đổi theo thời gian.
B. Nghiên cứu động lực học của sự thay đổi.
C. Giảm hiện tượng đa cộng tuyến.
D. Tăng kích thước mẫu và độ mạnh của kiểm định.
25. Điều gì xảy ra nếu bạn bỏ qua một biến quan trọng trong mô hình hồi quy?
A. Các ước lượng hệ số sẽ không chệch và hiệu quả.
B. Các ước lượng hệ số có thể bị chệch và không nhất quán.
C. Phương sai của sai số sẽ giảm.
D. R-squared sẽ tăng lên.
26. Nếu bạn nghi ngờ rằng có một mối quan hệ phi tuyến tính giữa biến độc lập và biến phụ thuộc, bạn có thể:
A. Loại bỏ biến độc lập đó khỏi mô hình.
B. Sử dụng biến giả.
C. Biến đổi biến độc lập (ví dụ: lấy logarit) hoặc thêm các số hạng bậc cao của biến đó vào mô hình.
D. Sử dụng kiểm định Durbin-Watson.
27. Hàm tự tương quan (ACF) được sử dụng để:
A. Đo lường mức độ tương quan giữa một chuỗi thời gian và các giá trị trễ của chính nó.
B. Phát hiện phương sai sai số thay đổi.
C. Kiểm tra tính dừng của chuỗi thời gian.
D. Ước lượng các hệ số trong mô hình hồi quy.
28. Mục tiêu của việc dự báo chuỗi thời gian là:
A. Giải thích các mối quan hệ nhân quả giữa các biến.
B. Ước lượng các hệ số trong mô hình hồi quy.
C. Dự đoán các giá trị tương lai của chuỗi dựa trên các giá trị quá khứ.
D. Phát hiện phương sai sai số thay đổi.
29. Trong mô hình GARCH, mục tiêu chính là:
A. Dự báo giá trị trung bình của một chuỗi thời gian.
B. Mô hình hóa phương sai thay đổi theo thời gian (time-varying volatility).
C. Kiểm tra tính dừng của chuỗi thời gian.
D. Mô hình hóa mối quan hệ tuyến tính giữa các biến.
30. Khi nào thì nên sử dụng mô hình tác động cố định (fixed effects model) so với mô hình tác động ngẫu nhiên (random effects model) trong phân tích dữ liệu bảng?
A. Khi các tác động riêng của các đơn vị (ví dụ: cá nhân, công ty) không tương quan với các biến độc lập.
B. Khi các tác động riêng của các đơn vị có tương quan với các biến độc lập.
C. Khi kích thước mẫu nhỏ.
D. Khi không có biến độc lập nào.
31. Khi nào thì nên sử dụng kiểm định phi tham số (non-parametric test) thay vì kiểm định tham số (parametric test)?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc kích thước mẫu nhỏ.
D. Khi phương sai của quần thể đã biết.
32. Trong kiểm định giả thuyết về trung bình của một quần thể, khi nào thì sử dụng kiểm định t (t-test) thay vì kiểm định z (z-test)?
A. Khi kích thước mẫu lớn (n > 30).
B. Khi phương sai của quần thể đã biết.
C. Khi phương sai của quần thể chưa biết và kích thước mẫu nhỏ (n < 30).
D. Khi dữ liệu tuân theo phân phối chuẩn.
33. Trong phân tích chuỗi thời gian, thành phần xu hướng (trend component) thể hiện điều gì?
A. Sự biến động ngắn hạn và ngẫu nhiên.
B. Sự biến động theo mùa.
C. Sự biến động dài hạn và ổn định theo một hướng nhất định.
D. Sự biến động theo chu kỳ kinh tế.
34. Giả thuyết H0 trong kiểm định ANOVA (Phân tích phương sai) thường là gì?
A. Tất cả các giá trị trung bình của các nhóm đều khác nhau.
B. Tất cả các giá trị trung bình của các nhóm đều bằng nhau.
C. Phương sai của các nhóm khác nhau.
D. Phương sai của các nhóm bằng nhau.
35. Hệ số xác định (coefficient of determination) R² trong hồi quy tuyến tính thể hiện điều gì?
A. Độ dốc của đường hồi quy.
B. Phương sai của biến độc lập.
C. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi biến độc lập.
D. Sai số chuẩn của ước lượng.
36. Thành phần mùa vụ (seasonal component) trong phân tích chuỗi thời gian là gì?
A. Sự biến động dài hạn của dữ liệu.
B. Sự biến động ngẫu nhiên của dữ liệu.
C. Sự biến động lặp đi lặp lại trong một khoảng thời gian cố định (ví dụ: hàng quý hoặc hàng năm).
D. Sự biến động do các sự kiện bất thường gây ra.
37. Phương pháp bình phương tối thiểu (ordinary least squares – OLS) được sử dụng để làm gì trong hồi quy tuyến tính?
A. Ước lượng các tham số của mô hình sao cho tổng bình phương sai số là nhỏ nhất.
B. Kiểm định giả thuyết về các tham số của mô hình.
C. Tính hệ số tương quan giữa các biến.
D. Loại bỏ hiện tượng đa cộng tuyến.
38. Phương pháp ARIMA được sử dụng để làm gì trong phân tích chuỗi thời gian?
A. Loại bỏ thành phần xu hướng.
B. Dự báo chuỗi thời gian dựa trên các giá trị quá khứ và sai số.
C. Xác định thành phần mùa vụ.
D. Kiểm tra tính dừng.
39. Kiểm định tính dừng (stationarity test) được sử dụng để làm gì trong phân tích chuỗi thời gian?
A. Xác định thành phần xu hướng.
B. Xác định thành phần mùa vụ.
C. Kiểm tra xem chuỗi thời gian có các đặc tính thống kê không đổi theo thời gian hay không.
D. Dự báo giá trị tương lai của chuỗi thời gian.
40. Sai số chuẩn (standard error) của ước lượng trong hồi quy tuyến tính đo lường điều gì?
A. Mức độ biến động của biến độc lập.
B. Mức độ biến động của biến phụ thuộc.
C. Mức độ chính xác của các ước lượng tham số.
D. Mức độ tương quan giữa các biến.
41. Khi nào thì sử dụng kiểm định Mann-Whitney U?
A. Để so sánh trung bình của hai mẫu độc lập khi dữ liệu tuân theo phân phối chuẩn.
B. Để so sánh trung bình của hai mẫu phụ thuộc khi dữ liệu không tuân theo phân phối chuẩn.
C. Để so sánh trung vị của hai mẫu độc lập khi dữ liệu không tuân theo phân phối chuẩn.
D. Để so sánh phương sai của hai mẫu độc lập.
42. Trong phân tích hồi quy, hiện tượng đa cộng tuyến (multicollinearity) xảy ra khi nào?
A. Khi các biến độc lập không tương quan với nhau.
B. Khi biến phụ thuộc không tương quan với các biến độc lập.
C. Khi có mối tương quan cao giữa các biến độc lập.
D. Khi phương sai của sai số không đồng nhất.
43. Trong phân tích chuỗi thời gian, PACF là viết tắt của cụm từ nào?
A. Partial Autocorrelation Function.
B. Predictive Autocorrelation Factor.
C. Principal Component Analysis Function.
D. Periodic Autocorrelation Filter.
44. Mức ý nghĩa (significance level) α thường được sử dụng trong kiểm định giả thuyết là bao nhiêu?
A. 0.01
B. 0.05
C. 0.10
D. Tất cả các đáp án trên đều đúng, tùy thuộc vào ngữ cảnh.
45. Độ mạnh của kiểm định (power of a test) được định nghĩa là gì?
A. Xác suất mắc sai lầm loại I.
B. Xác suất mắc sai lầm loại II.
C. Xác suất bác bỏ đúng giả thuyết H0 khi nó sai.
D. Xác suất không bác bỏ giả thuyết H0 khi nó đúng.
46. Điều gì xảy ra với giá trị tới hạn (critical value) khi mức ý nghĩa α giảm?
A. Giá trị tới hạn tăng.
B. Giá trị tới hạn giảm.
C. Giá trị tới hạn không thay đổi.
D. Không thể xác định.
47. Hệ số tương quan (correlation coefficient) r đo lường điều gì?
A. Mối quan hệ nhân quả giữa hai biến.
B. Mức độ biến động của một biến.
C. Mức độ liên kết tuyến tính giữa hai biến.
D. Độ dốc của đường hồi quy.
48. Trong phân tích hồi quy đa biến, biến giả (dummy variable) được sử dụng để làm gì?
A. Biểu diễn các biến định tính (categorical variables).
B. Loại bỏ hiện tượng đa cộng tuyến.
C. Chuẩn hóa dữ liệu.
D. Dự báo giá trị tương lai.
49. Khi nào chúng ta bác bỏ giả thuyết H0 trong kiểm định giả thuyết?
A. Khi giá trị p lớn hơn mức ý nghĩa α.
B. Khi giá trị p nhỏ hơn hoặc bằng mức ý nghĩa α.
C. Khi giá trị p bằng 0.
D. Khi giá trị p bằng 1.
50. Điều gì xảy ra với khoảng tin cậy (confidence interval) khi kích thước mẫu tăng lên?
A. Khoảng tin cậy trở nên rộng hơn.
B. Khoảng tin cậy trở nên hẹp hơn.
C. Khoảng tin cậy không thay đổi.
D. Không thể xác định.
51. Phương pháp trung bình động (moving average) được sử dụng để làm gì trong phân tích chuỗi thời gian?
A. Dự báo giá trị tương lai của chuỗi thời gian.
B. Loại bỏ thành phần xu hướng.
C. Làm mịn chuỗi thời gian và loại bỏ nhiễu.
D. Xác định thành phần mùa vụ.
52. Trong kiểm định giả thuyết, điều gì xảy ra khi tăng kích thước mẫu?
A. Xác suất mắc sai lầm loại I tăng.
B. Xác suất mắc sai lầm loại II tăng.
C. Độ mạnh của kiểm định tăng.
D. Không có gì thay đổi.
53. Khi nào thì sử dụng kiểm định một phía (one-tailed test) thay vì kiểm định hai phía (two-tailed test)?
A. Khi không có giả thuyết cụ thể về hướng của hiệu ứng.
B. Khi giả thuyết chỉ ra một hướng cụ thể của hiệu ứng (lớn hơn hoặc nhỏ hơn).
C. Khi kích thước mẫu lớn.
D. Khi phương sai của quần thể đã biết.
54. Phương pháp san bằng hàm mũ (exponential smoothing) được sử dụng để làm gì?
A. Phân tích hồi quy.
B. Dự báo chuỗi thời gian.
C. Kiểm định giả thuyết.
D. Phân tích phương sai.
55. Trong phân tích phương sai (ANOVA), yếu tố nào sau đây ảnh hưởng đến giá trị F?
A. Phương sai giữa các nhóm.
B. Phương sai trong nội bộ các nhóm.
C. Kích thước mẫu của các nhóm.
D. Tất cả các đáp án trên.
56. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết H0 là đúng.
B. Xác suất mắc sai lầm loại II.
C. Xác suất quan sát được kết quả kiểm định (hoặc kết quả cực đoan hơn) nếu H0 là đúng.
D. Mức ý nghĩa (significance level) của kiểm định.
57. Trong kiểm định giả thuyết, sai lầm loại I (Type I error) xảy ra khi nào?
A. Chấp nhận giả thuyết H0 khi nó sai.
B. Bác bỏ giả thuyết H0 khi nó đúng.
C. Không bác bỏ giả thuyết H0 khi nó sai.
D. Bác bỏ giả thuyết H0 khi nó sai.
58. Sai lầm loại II (Type II error) trong kiểm định giả thuyết xảy ra khi nào?
A. Bác bỏ giả thuyết H0 khi nó đúng.
B. Chấp nhận giả thuyết H0 khi nó đúng.
C. Không bác bỏ giả thuyết H0 khi nó sai.
D. Bác bỏ giả thuyết H0 khi nó sai.
59. Hệ số VIF (Variance Inflation Factor) được sử dụng để phát hiện vấn đề gì trong hồi quy?
A. Phương sai của sai số thay đổi.
B. Giá trị ngoại lệ.
C. Đa cộng tuyến.
D. Không có biến nào quan trọng.
60. Trong kiểm định khi bình phương (chi-square test), giả thuyết H0 thường là gì?
A. Có mối liên hệ giữa các biến.
B. Không có mối liên hệ giữa các biến.
C. Các biến tuân theo phân phối chuẩn.
D. Các biến có phương sai bằng nhau.
61. Nếu bạn muốn kiểm soát ảnh hưởng của một biến đồng biến (covariate) trong ANOVA, bạn sẽ sử dụng phương pháp nào?
A. ANOVA
B. ANCOVA
C. MANOVA
D. Kiểm định t
62. Trong ANOVA hai yếu tố, ảnh hưởng tương tác (interaction effect) cho biết điều gì?
A. Ảnh hưởng của một yếu tố lên biến phụ thuộc là như nhau đối với tất cả các mức của yếu tố kia
B. Ảnh hưởng của một yếu tố lên biến phụ thuộc khác nhau tùy thuộc vào mức của yếu tố kia
C. Hai yếu tố không ảnh hưởng đến biến phụ thuộc
D. Hai yếu tố có ảnh hưởng giống hệt nhau lên biến phụ thuộc
63. Ý nghĩa của việc kiểm tra tính thuần nhất của phương sai (homogeneity of variances) trước khi thực hiện ANOVA là gì?
A. Để đảm bảo rằng các nhóm có kích thước mẫu bằng nhau
B. Để đảm bảo rằng các nhóm có trung bình bằng nhau
C. Để đảm bảo rằng các phương sai của các nhóm là tương đương
D. Để đảm bảo rằng dữ liệu tuân theo phân phối chuẩn
64. Khi nào nên sử dụng kiểm định post-hoc trong ANOVA?
A. Khi giả thuyết null bị bác bỏ
B. Khi giả thuyết null được chấp nhận
C. Khi kích thước mẫu nhỏ
D. Khi phương sai của các nhóm bằng nhau
65. Nếu bạn có hai yếu tố và một biến phụ thuộc, và bạn muốn xem xét ảnh hưởng của cả hai yếu tố và tương tác giữa chúng, bạn sẽ sử dụng loại ANOVA nào?
A. ANOVA một yếu tố
B. ANOVA hai yếu tố
C. MANOVA
D. ANCOVA
66. Giá trị F trong ANOVA được tính như thế nào?
A. Tỷ lệ giữa phương sai trong các nhóm và phương sai giữa các nhóm
B. Tỷ lệ giữa phương sai giữa các nhóm và phương sai trong các nhóm
C. Tổng của phương sai giữa các nhóm và phương sai trong các nhóm
D. Hiệu của phương sai giữa các nhóm và phương sai trong các nhóm
67. Kiểm định nào sau đây là một ví dụ về kiểm định post-hoc?
A. Kiểm định t
B. Kiểm định F
C. Kiểm định Tukey
D. Kiểm định Chi bình phương
68. Ý nghĩa của việc sử dụng kiểm định post-hoc là gì khi bạn bác bỏ giả thuyết null trong ANOVA?
A. Để xác định xem giả thuyết null có thực sự sai hay không
B. Để xác định nhóm nào khác biệt đáng kể so với các nhóm khác
C. Để điều chỉnh mức ý nghĩa (alpha)
D. Để tăng kích thước mẫu
69. Trong kiểm định ANOVA, giả thuyết null thường phát biểu điều gì về các trung bình của các nhóm?
A. Ít nhất một trung bình khác biệt so với các trung bình khác
B. Tất cả các trung bình đều bằng nhau
C. Tất cả các trung bình đều khác nhau
D. Các trung bình có xu hướng tăng dần
70. Một nhà quản lý muốn so sánh năng suất làm việc trung bình của nhân viên từ ba phòng ban khác nhau. Để kiểm tra xem có sự khác biệt đáng kể giữa các phòng ban hay không, nên sử dụng phương pháp thống kê nào?
A. Kiểm định t một mẫu
B. ANOVA một yếu tố
C. Hồi quy tuyến tính đơn
D. Kiểm định Chi-bình phương
71. Trong phân tích phương sai (ANOVA), yếu tố nào sau đây KHÔNG ảnh hưởng đến việc bác bỏ giả thuyết null?
A. Mức ý nghĩa (alpha)
B. Bậc tự do giữa các nhóm (df giữa)
C. Phương sai tổng thể
D. Bậc tự do trong các nhóm (df trong)
72. Nếu bạn có nhiều biến phụ thuộc và muốn so sánh sự khác biệt giữa các nhóm, bạn nên sử dụng phương pháp nào?
A. ANOVA
B. MANOVA
C. ANCOVA
D. Hồi quy đa biến
73. Trong ANOVA, kiểm định Levene được sử dụng để kiểm tra điều gì?
A. Tính chuẩn của dữ liệu
B. Tính thuần nhất của phương sai
C. Tính độc lập của các quan sát
D. Tính tuyến tính của mối quan hệ
74. Trong ANOVA, ‘Tổng bình phương sai số’ (Sum of Squares Error – SSE) đại diện cho điều gì?
A. Biến động giữa các nhóm
B. Biến động trong các nhóm
C. Tổng biến động
D. Biến động do yếu tố đang nghiên cứu
75. Khi nào thì thích hợp sử dụng kiểm định Welch thay vì ANOVA thông thường?
A. Khi dữ liệu tuân theo phân phối chuẩn
B. Khi các nhóm có kích thước mẫu bằng nhau
C. Khi phương sai của các nhóm không bằng nhau
D. Khi có một biến đồng biến
76. Khi thực hiện kiểm định giả thuyết về sự bằng nhau của hai phương sai, thống kê kiểm định nào thường được sử dụng?
A. Thống kê t
B. Thống kê F
C. Thống kê Z
D. Thống kê Chi bình phương
77. ANOVA được sử dụng để so sánh loại dữ liệu nào?
A. Dữ liệu định tính
B. Dữ liệu định lượng
C. Dữ liệu thứ hạng
D. Dữ liệu nhị phân
78. Trong bảng ANOVA, cột ‘df’ thường viết tắt cho điều gì?
A. Độ lệch chuẩn
B. Bậc tự do
C. Giá trị trung bình
D. Phương sai
79. Nếu giả định về tính thuần nhất của phương sai bị vi phạm, bạn nên làm gì?
A. Tiếp tục sử dụng ANOVA mà không điều chỉnh
B. Sử dụng một kiểm định ANOVA thay thế không yêu cầu giả định này (ví dụ: Welch’s ANOVA)
C. Tăng kích thước mẫu
D. Giảm mức ý nghĩa (alpha)
80. Bậc tự do (degrees of freedom) trong ANOVA ảnh hưởng đến điều gì?
A. Giá trị trung bình của các nhóm
B. Hình dạng của phân phối F
C. Mức ý nghĩa (alpha)
D. Kích thước mẫu
81. Trong ngữ cảnh của ANOVA, ‘Mean Square’ (MS) đại diện cho điều gì?
A. Tổng bình phương
B. Trung bình của các quan sát
C. Ước tính phương sai
D. Độ lệch chuẩn
82. Điều gì xảy ra khi giá trị p nhỏ hơn mức ý nghĩa (alpha) trong kiểm định ANOVA?
A. Chấp nhận giả thuyết null
B. Bác bỏ giả thuyết null
C. Không thể kết luận
D. Tăng kích thước mẫu
83. Trong ANOVA, yếu tố nào sau đây KHÔNG phải là một nguồn biến động?
A. Biến động giữa các nhóm
B. Biến động trong các nhóm
C. Biến động tổng thể
D. Biến động của trung bình tổng thể
84. Giá trị p trong kiểm định ANOVA thể hiện điều gì?
A. Xác suất giả thuyết null là đúng
B. Xác suất quan sát được kết quả hiện tại (hoặc kết quả cực đoan hơn) nếu giả thuyết null là đúng
C. Mức ý nghĩa của kiểm định
D. Kích thước ảnh hưởng của các yếu tố
85. Điều gì xảy ra với giá trị F khi biến động giữa các nhóm tăng lên?
A. Giá trị F tăng lên
B. Giá trị F giảm xuống
C. Giá trị F không đổi
D. Không thể dự đoán
86. Giả sử bạn muốn so sánh hiệu quả của bốn chiến dịch quảng cáo khác nhau. Bạn thu thập dữ liệu về doanh số bán hàng sau mỗi chiến dịch. Phương pháp nào phù hợp nhất?
A. Kiểm định t ghép cặp
B. ANOVA một yếu tố
C. Hồi quy đa biến
D. Kiểm định Chi bình phương
87. Trong ANOVA hai yếu tố, yếu tố nào sau đây KHÔNG được kiểm định?
A. Ảnh hưởng của yếu tố A
B. Ảnh hưởng của yếu tố B
C. Ảnh hưởng tương tác giữa A và B
D. Ảnh hưởng của yếu tố C
88. Giả sử bạn muốn so sánh doanh thu trung bình của ba chi nhánh khác nhau. Phương pháp thống kê nào phù hợp nhất?
A. Kiểm định t độc lập
B. Phân tích phương sai (ANOVA)
C. Hồi quy tuyến tính
D. Kiểm định Chi bình phương
89. Trong ANOVA, ‘Tổng bình phương giữa các nhóm’ (Sum of Squares Between – SSB) đại diện cho điều gì?
A. Biến động trong các nhóm
B. Biến động giữa các nhóm
C. Tổng biến động
D. Biến động ngẫu nhiên
90. Nếu bạn thực hiện ANOVA và nhận thấy rằng không có sự khác biệt đáng kể giữa các nhóm, điều này có nghĩa là gì?
A. Tất cả các nhóm đều có trung bình bằng nhau
B. Không có đủ bằng chứng để kết luận rằng có sự khác biệt giữa các nhóm
C. Có một lỗi trong quá trình tính toán
D. Kích thước mẫu quá nhỏ
91. Trong phân tích hồi quy đa biến, hiện tượng đa cộng tuyến (multicollinearity) xảy ra khi nào?
A. Khi các biến độc lập có tương quan cao với nhau.
B. Khi biến phụ thuộc không tuân theo phân phối chuẩn.
C. Khi phương sai của sai số thay đổi.
D. Khi kích thước mẫu quá nhỏ.
92. Mục đích chính của việc kiểm định tính dừng (stationarity) trong chuỗi thời gian là gì?
A. Để xác định xu hướng của chuỗi thời gian.
B. Để loại bỏ tính mùa vụ khỏi chuỗi thời gian.
C. Để đảm bảo rằng các thuộc tính thống kê của chuỗi thời gian không thay đổi theo thời gian.
D. Để ước lượng các hệ số tương quan.
93. Giá trị AIC (Akaike Information Criterion) được sử dụng để làm gì?
A. Ước lượng phương sai của quần thể.
B. Đánh giá và so sánh các mô hình thống kê khác nhau.
C. Kiểm tra tính dừng của chuỗi thời gian.
D. Phân tích phương sai giữa các nhóm.
94. Khi nào nên sử dụng kiểm định Shapiro-Wilk test?
A. Để so sánh trung bình của hai mẫu.
B. Để kiểm tra xem một mẫu dữ liệu có tuân theo phân phối chuẩn hay không.
C. Để kiểm tra sự độc lập giữa hai biến định tính.
D. Để ước lượng hệ số tương quan.
95. Khi nào nên sử dụng kiểm định Friedman test?
A. Để so sánh trung bình của hai mẫu độc lập.
B. Để so sánh trung bình của nhiều hơn hai mẫu phụ thuộc khi dữ liệu không tuân theo phân phối chuẩn.
C. Để kiểm tra sự độc lập giữa hai biến định tính.
D. Để ước lượng hệ số tương quan giữa hai biến định lượng.
96. Kiểm định Kolmogorov-Smirnov được sử dụng để làm gì?
A. So sánh trung bình của hai mẫu.
B. Kiểm tra sự phù hợp của một mẫu với một phân phối lý thuyết.
C. Kiểm tra sự độc lập giữa hai biến định tính.
D. Ước lượng hệ số tương quan.
97. Khi nào nên sử dụng kiểm định Kruskal-Wallis test?
A. Để so sánh trung bình của hai mẫu độc lập.
B. Để so sánh trung bình của nhiều hơn hai mẫu độc lập khi dữ liệu không tuân theo phân phối chuẩn.
C. Để kiểm tra sự độc lập giữa hai biến định tính.
D. Để ước lượng hệ số tương quan giữa hai biến định lượng.
98. Độ mạnh của kiểm định (power of a test) là gì?
A. Xác suất bác bỏ giả thuyết null khi nó thực sự đúng.
B. Xác suất không bác bỏ giả thuyết null khi nó thực sự sai.
C. Xác suất bác bỏ giả thuyết null khi nó thực sự sai.
D. Xác suất chấp nhận giả thuyết null khi nó thực sự đúng.
99. Trong phân tích sống sót (survival analysis), hàm sống sót (survival function) biểu thị điều gì?
A. Thời gian trung bình mà một sự kiện xảy ra.
B. Xác suất một sự kiện xảy ra tại một thời điểm cụ thể.
C. Xác suất một sự kiện chưa xảy ra cho đến một thời điểm cụ thể.
D. Tỷ lệ sự kiện xảy ra trong một khoảng thời gian.
100. Trong phân tích hồi quy logistic, biến phụ thuộc có đặc điểm gì?
A. Là biến định lượng liên tục.
B. Là biến định tính có hai giá trị (nhị phân).
C. Là biến định tính có nhiều hơn hai giá trị.
D. Là biến thứ bậc.
101. Trong phân tích thời gian (time series analysis), thành phần nào sau đây thể hiện xu hướng dài hạn của dữ liệu?
A. Tính mùa vụ (Seasonality).
B. Chu kỳ (Cyclical).
C. Xu hướng (Trend).
D. Ngẫu nhiên (Irregular).
102. Trong phân tích độ tin cậy (reliability analysis), hệ số Cronbach’s alpha được sử dụng để đánh giá điều gì?
A. Mức độ tương quan giữa hai biến.
B. Mức độ phù hợp của mô hình hồi quy.
C. Mức độ nhất quán nội tại của một thang đo.
D. Mức độ ổn định của kết quả theo thời gian.
103. Trong phân tích rủi ro, giá trị VaR (Value at Risk) được sử dụng để đo lường điều gì?
A. Lợi nhuận kỳ vọng.
B. Phương sai của lợi nhuận.
C. Mức lỗ tối đa có thể xảy ra trong một khoảng thời gian nhất định với một mức độ tin cậy nhất định.
D. Xác suất đạt được lợi nhuận mục tiêu.
104. Trong phân tích phương sai hai yếu tố (two-way ANOVA), điều gì được kiểm tra?
A. Ảnh hưởng của một yếu tố duy nhất lên biến phụ thuộc.
B. Ảnh hưởng của hai yếu tố lên biến phụ thuộc và tương tác giữa chúng.
C. Sự khác biệt giữa các phương sai của hai mẫu.
D. Mối quan hệ tuyến tính giữa hai biến.
105. Phương pháp ARIMA được sử dụng để làm gì?
A. Phân tích phương sai.
B. Dự báo chuỗi thời gian.
C. Phân tích hồi quy tuyến tính.
D. Phân tích thành phần chính.
106. Khi nào nên sử dụng kiểm định Wilcoxon signed-rank test?
A. Để so sánh trung bình của hai mẫu độc lập.
B. Để so sánh trung bình của hai mẫu phụ thuộc khi dữ liệu không tuân theo phân phối chuẩn.
C. Để kiểm tra sự độc lập giữa hai biến định tính.
D. Để ước lượng hệ số tương quan giữa hai biến định lượng.
107. Phương pháp nào sau đây được sử dụng để kiểm tra sự độc lập giữa hai biến định tính?
A. Kiểm định t (t-test).
B. Kiểm định F (F-test).
C. Kiểm định Chi-bình phương (Chi-square test).
D. Hồi quy tuyến tính (Linear regression).
108. Khi nào nên sử dụng kiểm định Mann-Whitney U test?
A. Để so sánh trung bình của hai mẫu phụ thuộc.
B. Để so sánh trung bình của hai mẫu độc lập khi dữ liệu không tuân theo phân phối chuẩn.
C. Để kiểm tra sự độc lập giữa hai biến định tính.
D. Để ước lượng hệ số tương quan giữa hai biến định lượng.
109. Khi nào nên sử dụng kiểm định phi tham số thay vì kiểm định tham số?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi giả định về phân phối của dữ liệu không được đáp ứng.
D. Khi muốn ước lượng tham số của quần thể.
110. Phương pháp nào sau đây được sử dụng để xác định các điểm ngoại lệ (outliers) trong dữ liệu?
A. Phân tích phương sai (ANOVA).
B. Sử dụng hộp đồ thị (Box plot).
C. Hồi quy tuyến tính (Linear regression).
D. Kiểm định t (t-test).
111. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết null là đúng.
B. Xác suất mắc sai lầm loại I.
C. Xác suất thu được kết quả như quan sát hoặc cực đoan hơn, giả sử giả thuyết null là đúng.
D. Mức ý nghĩa của kiểm định.
112. Trong phân tích phương sai (ANOVA), giả định nào sau đây KHÔNG cần thiết?
A. Các quần thể phải có phương sai bằng nhau.
B. Các quần thể phải tuân theo phân phối chuẩn.
C. Các mẫu phải được chọn ngẫu nhiên và độc lập.
D. Kích thước mẫu của mỗi nhóm phải bằng nhau.
113. Trong hồi quy tuyến tính, hệ số xác định (R-squared) đo lường điều gì?
A. Mức độ phù hợp của mô hình hồi quy với dữ liệu.
B. Mức độ ảnh hưởng của biến độc lập lên biến phụ thuộc.
C. Mức độ tương quan giữa các biến độc lập.
D. Mức độ tin cậy của các hệ số hồi quy.
114. Trong phân tích thành phần chính (principal component analysis – PCA), mục tiêu chính là gì?
A. Tìm các biến quan trọng nhất trong dữ liệu.
B. Giảm số lượng biến trong dữ liệu trong khi vẫn giữ lại phần lớn thông tin.
C. Phân loại dữ liệu thành các nhóm khác nhau.
D. Dự báo các giá trị tương lai.
115. Trong kiểm định giả thuyết, sai lầm loại I (Type I error) xảy ra khi nào?
A. Bác bỏ giả thuyết null khi nó thực sự đúng.
B. Không bác bỏ giả thuyết null khi nó thực sự sai.
C. Chấp nhận giả thuyết thay thế khi nó thực sự sai.
D. Không đưa ra quyết định nào cả.
116. Phương pháp san bằng hàm mũ (exponential smoothing) được sử dụng để làm gì?
A. Ước lượng phương sai của quần thể.
B. Dự báo các giá trị tương lai trong chuỗi thời gian.
C. Kiểm tra sự phù hợp của mô hình hồi quy.
D. Phân tích phương sai giữa các nhóm.
117. Trong phân tích cụm (cluster analysis), phương pháp nào sau đây thuộc loại phân cụm phân cấp (hierarchical clustering)?
A. K-means clustering.
B. DBSCAN.
C. Agglomerative clustering.
D. PCA.
118. Phương pháp nào sau đây được sử dụng để xử lý dữ liệu bị thiếu (missing data)?
A. Chuẩn hóa dữ liệu (Data normalization).
B. Rời rạc hóa dữ liệu (Data discretization).
C. Thay thế bằng giá trị trung bình (Mean imputation).
D. Phân tích hồi quy (Regression analysis).
119. Trong phân tích trung gian (mediation analysis), biến trung gian (mediator variable) có vai trò gì?
A. Giải thích mối quan hệ giữa biến độc lập và biến phụ thuộc.
B. Làm mạnh thêm mối quan hệ giữa biến độc lập và biến phụ thuộc.
C. Không ảnh hưởng đến mối quan hệ giữa biến độc lập và biến phụ thuộc.
D. Làm yếu đi mối quan hệ giữa biến độc lập và biến phụ thuộc.
120. Trong phân tích dữ liệu bảng (panel data analysis), hiệu ứng cố định (fixed effects) được sử dụng để kiểm soát điều gì?
A. Sự khác biệt giữa các biến.
B. Sự khác biệt không quan sát được giữa các đơn vị (ví dụ: cá nhân, công ty) không thay đổi theo thời gian.
C. Sự thay đổi của các biến theo thời gian.
D. Sự tương quan giữa các biến.
121. Điều gì xảy ra với sai số loại I khi bạn giảm mức ý nghĩa (alpha)?
A. Xác suất mắc sai số loại I tăng lên
B. Xác suất mắc sai số loại I giảm xuống
C. Xác suất mắc sai số loại I không đổi
D. Mối quan hệ phụ thuộc vào kích thước mẫu
122. Kiểm định Kolmogorov-Smirnov được sử dụng để làm gì?
A. Kiểm tra sự khác biệt giữa hai trung bình mẫu
B. Kiểm tra xem một mẫu có tuân theo một phân phối cụ thể hay không
C. Kiểm tra mối quan hệ giữa hai biến định tính
D. Kiểm tra phương sai bằng nhau
123. Điều gì xảy ra với công suất của một kiểm định thống kê khi kích thước mẫu tăng lên?
A. Công suất tăng lên
B. Công suất giảm xuống
C. Công suất không đổi
D. Không thể xác định nếu không có mức ý nghĩa
124. Sai số chuẩn của trung bình mẫu đo lường điều gì?
A. Độ lệch chuẩn của mẫu
B. Độ lệch chuẩn của tổng thể
C. Độ lệch chuẩn của phân phối lấy mẫu của trung bình mẫu
D. Phương sai của mẫu
125. Kiểm định Durbin-Watson được sử dụng để kiểm tra vấn đề gì trong phân tích hồi quy?
A. Đa cộng tuyến
B. Dị phương sai
C. Tự tương quan của phần dư
D. Tính tuyến tính
126. Khi so sánh hai mẫu độc lập, kiểm định nào sau đây phù hợp nhất để sử dụng nếu dữ liệu không tuân theo phân phối chuẩn?
A. Kiểm định t
B. Kiểm định z
C. Kiểm định Mann-Whitney U
D. Kiểm định ANOVA
127. Khi nào thì phù hợp để sử dụng kiểm định ANOVA hai yếu tố?
A. Khi so sánh trung bình của hai nhóm
B. Khi so sánh phương sai của hai nhóm
C. Khi so sánh trung bình của ba nhóm trở lên với hai biến độc lập
D. Khi so sánh mối quan hệ giữa hai biến phân loại
128. Mục đích chính của việc sử dụng kiểm định Chi-bình phương (Chi-square test) là gì?
A. So sánh trung bình của hai mẫu
B. Kiểm tra mối quan hệ giữa hai biến định tính
C. Ước tính hệ số tương quan
D. Dự đoán giá trị của một biến dựa trên biến khác
129. Phân tích tương quan đo lường điều gì?
A. Quan hệ nhân quả giữa hai biến
B. Sức mạnh và hướng của mối quan hệ tuyến tính giữa hai biến
C. Sự khác biệt giữa trung bình của hai biến
D. Phương sai của một biến
130. Khi nào thì phù hợp nhất để sử dụng kiểm định t (t-test) thay vì kiểm định z (z-test)?
A. Khi kích thước mẫu lớn (n > 30)
B. Khi độ lệch chuẩn của tổng thể đã biết
C. Khi kích thước mẫu nhỏ (n < 30) và độ lệch chuẩn của tổng thể chưa biết
D. Khi bạn muốn kiểm tra sự khác biệt giữa các phương sai
131. Điều gì xảy ra với khoảng tin cậy khi kích thước mẫu tăng lên, giả sử tất cả các yếu tố khác không đổi?
A. Khoảng tin cậy trở nên rộng hơn
B. Khoảng tin cậy không đổi
C. Khoảng tin cậy trở nên hẹp hơn
D. Không thể xác định nếu không có độ lệch chuẩn
132. Trong kiểm định giả thuyết, lỗi Loại II (Type II error) xảy ra khi nào?
A. Chúng ta bác bỏ giả thuyết không đúng
B. Chúng ta không bác bỏ giả thuyết không đúng
C. Chúng ta bác bỏ giả thuyết không đúng
D. Chúng ta không bác bỏ giả thuyết không đúng
133. Trong phân tích độ tin cậy, Cronbach’s alpha đo lường điều gì?
A. Tính hợp lệ của một thước đo
B. Độ tin cậy bên trong của một thước đo
C. Độ ổn định của một thước đo theo thời gian
D. Độ nhạy của một thước đo
134. Giá trị p trong kiểm định giả thuyết đại diện cho điều gì?
A. Xác suất giả thuyết không đúng là đúng
B. Xác suất quan sát được dữ liệu, hoặc dữ liệu cực đoan hơn, nếu giả thuyết không là đúng
C. Mức ý nghĩa của kiểm định
D. Xác suất mắc lỗi Loại I
135. Trong phân tích hồi quy logistic, biến phụ thuộc là gì?
A. Liên tục
B. Phân loại
C. Đếm
D. Chuỗi thời gian
136. Trong phân tích hồi quy đa biến, VIF (Variance Inflation Factor) được sử dụng để phát hiện vấn đề gì?
A. Dị phương sai
B. Tự tương quan
C. Đa cộng tuyến
D. Ngoại lệ
137. Trong phân tích phương sai (ANOVA), yếu tố nào sau đây KHÔNG ảnh hưởng đến kích thước của thống kê F?
A. Phương sai giữa các nhóm
B. Kích thước mẫu của mỗi nhóm
C. Phương sai trong các nhóm
D. Giá trị trung bình tổng thể
138. Trong phân tích chuỗi thời gian, ACF (Hàm tự tương quan) được sử dụng để xác định điều gì?
A. Xu hướng trong dữ liệu
B. Tính mùa vụ trong dữ liệu
C. Mối tương quan giữa các quan sát theo thời gian
D. Phương sai của dữ liệu
139. Trong phân tích phương sai, SST (Tổng bình phương) được phân tách thành những thành phần nào?
A. SSB (Bình phương giữa các nhóm) và SSW (Bình phương trong các nhóm)
B. SSE (Bình phương sai số) và SSR (Bình phương hồi quy)
C. SSTR (Bình phương điều trị) và SSE (Bình phương sai số)
D. SSM (Bình phương trung bình) và SSE (Bình phương sai số)
140. Ý nghĩa của hệ số hồi quy trong mô hình hồi quy tuyến tính bội là gì?
A. Sự thay đổi trong biến độc lập tương ứng với sự thay đổi một đơn vị trong biến phụ thuộc
B. Sự thay đổi trong biến phụ thuộc tương ứng với sự thay đổi một đơn vị trong biến độc lập, khi các biến độc lập khác được giữ không đổi
C. Mức độ phù hợp của mô hình
D. Mức độ ý nghĩa thống kê của mô hình
141. Phương pháp nào sau đây được sử dụng để xử lý các giá trị bị thiếu trong một tập dữ liệu?
A. Chuẩn hóa
B. Rời rạc hóa
C. Thay thế
D. Phân cụm
142. Trong phân tích chuỗi thời gian, thành phần nào sau đây KHÔNG phải là một thành phần điển hình?
A. Xu hướng
B. Tính mùa vụ
C. Tính chu kỳ
D. Tính ngẫu nhiên
143. Phương pháp nào sau đây được sử dụng để làm mịn dữ liệu chuỗi thời gian để loại bỏ nhiễu và làm nổi bật các xu hướng cơ bản?
A. Hồi quy
B. Trung bình động
C. Phân tích phương sai
D. Kiểm định Chi-bình phương
144. Trong phân tích hồi quy, hệ số xác định (R-squared) đo lường điều gì?
A. Độ mạnh của mối quan hệ nhân quả giữa các biến
B. Tỷ lệ phương sai trong biến phụ thuộc được giải thích bởi các biến độc lập
C. Mức độ ý nghĩa thống kê của các biến độc lập
D. Độ chính xác của các ước lượng hệ số hồi quy
145. Ý nghĩa của thống kê kiểm định là gì?
A. Xác suất giả thuyết không là đúng
B. Một thước đo bằng chứng chống lại giả thuyết không
C. Kích thước của mẫu
D. Độ lệch chuẩn của tổng thể
146. Giả sử bạn đang thực hiện kiểm định giả thuyết về sự khác biệt giữa hai trung bình mẫu độc lập với phương sai không bằng nhau. Bậc tự do nào sau đây được sử dụng cho thống kê t?
A. n1 + n2 – 2
B. n1 + n2
C. Giá trị nhỏ hơn của n1 – 1 và n2 – 1
D. Một công thức phức tạp ước tính bậc tự do hiệu quả
147. Giả sử bạn đang thực hiện kiểm định giả thuyết một đuôi (one-tailed test). Điều này có nghĩa là gì?
A. Bạn quan tâm đến việc phát hiện bất kỳ sự khác biệt nào
B. Bạn chỉ quan tâm đến việc phát hiện sự khác biệt theo một hướng cụ thể
C. Bạn cần chia giá trị alpha cho hai
D. Bạn đang kiểm tra sự khác biệt giữa hai phương sai
148. Trong phân tích hồi quy, phần dư (residuals) đại diện cho điều gì?
A. Giá trị dự đoán của biến phụ thuộc
B. Sự khác biệt giữa giá trị quan sát được và giá trị dự đoán của biến phụ thuộc
C. Độ dốc của đường hồi quy
D. Giá trị chặn của đường hồi quy
149. Trong phân tích hồi quy Poisson, biến phụ thuộc là gì?
A. Liên tục
B. Phân loại
C. Biến đếm
D. Nhị phân
150. ROC curve (Đường cong đặc tính hoạt động của máy thu) được sử dụng để đánh giá điều gì?
A. Mức độ phù hợp của mô hình hồi quy
B. Độ chính xác của mô hình phân loại
C. Độ tin cậy của một thước đo
D. Đa cộng tuyến trong hồi quy