1. Điều gì xảy ra với độ rộng của khoảng tin cậy khi tăng mức độ tin cậy (confidence level)?
A. Độ rộng của khoảng tin cậy giảm.
B. Độ rộng của khoảng tin cậy tăng.
C. Độ rộng của khoảng tin cậy không thay đổi.
D. Không thể xác định.
2. Trong hồi quy tuyến tính, ý nghĩa của hệ số chặn (intercept) là gì?
A. Độ dốc của đường hồi quy.
B. Giá trị dự đoán của biến phụ thuộc khi tất cả các biến độc lập bằng 0.
C. Mức độ phù hợp của mô hình hồi quy.
D. Sai số chuẩn của ước lượng.
3. Khoảng tin cậy (confidence interval) là gì?
A. Một khoảng giá trị mà tham số thực tế của quần thể chắc chắn nằm trong đó.
B. Một khoảng giá trị mà tham số thực tế của quần thể có khả năng nằm trong đó với một độ tin cậy nhất định.
C. Một khoảng giá trị dùng để bác bỏ giả thuyết.
D. Một khoảng giá trị dùng để chấp nhận giả thuyết.
4. Ý nghĩa của việc chuẩn hóa dữ liệu (data normalization) trong thống kê là gì?
A. Làm cho dữ liệu tuân theo phân phối chuẩn.
B. Chuyển đổi dữ liệu về một khoảng giá trị chung (ví dụ, từ 0 đến 1).
C. Loại bỏ các giá trị ngoại lệ (outliers).
D. Tính toán giá trị trung bình của dữ liệu.
5. Phương pháp Bootstrap trong thống kê được sử dụng để làm gì?
A. Ước lượng tham số của quần thể bằng cách lấy mẫu lại từ dữ liệu ban đầu.
B. Kiểm tra sự phù hợp của một phân phối lý thuyết với dữ liệu quan sát được.
C. Loại bỏ các giá trị ngoại lệ (outliers).
D. Tính toán giá trị trung bình của dữ liệu.
6. Khi nào nên sử dụng kiểm định một phía (one-tailed test) thay vì kiểm định hai phía (two-tailed test)?
A. Khi không có giả thuyết cụ thể về hướng của sự khác biệt.
B. Khi quan tâm đến việc phát hiện sự khác biệt theo cả hai hướng.
C. Khi có giả thuyết cụ thể về hướng của sự khác biệt.
D. Khi kích thước mẫu nhỏ.
7. Trong kiểm định giả thuyết thống kê, sai lầm loại I xảy ra khi nào?
A. Chấp nhận giả thuyết H0 khi nó sai.
B. Bác bỏ giả thuyết H0 khi nó đúng.
C. Chấp nhận giả thuyết H1 khi nó đúng.
D. Bác bỏ giả thuyết H1 khi nó sai.
8. Trong phân tích hồi quy, hiện tượng đa cộng tuyến (multicollinearity) đề cập đến vấn đề gì?
A. Sự tương quan cao giữa các biến độc lập.
B. Sự tương quan cao giữa biến độc lập và biến phụ thuộc.
C. Sự không tuyến tính trong mối quan hệ giữa các biến.
D. Sự phân tán không đều của phần dư.
9. Trong kiểm định giả thuyết, điều gì xảy ra khi giảm mức ý nghĩa (significance level)?
A. Tăng xác suất mắc sai lầm loại I.
B. Giảm xác suất mắc sai lầm loại I.
C. Tăng xác suất mắc sai lầm loại II.
D. Không ảnh hưởng đến kết quả kiểm định.
10. Khi nào nên sử dụng kiểm định Kolmogorov-Smirnov?
A. Để so sánh trung bình của hai quần thể.
B. Để kiểm tra xem một mẫu dữ liệu có tuân theo một phân phối cụ thể hay không.
C. Để phân tích phương sai (ANOVA).
D. Để kiểm tra tính độc lập giữa các biến phân loại.
11. Trong phân tích hồi quy, phương sai của sai số (error variance) thể hiện điều gì?
A. Mức độ phù hợp của mô hình hồi quy với dữ liệu.
B. Mức độ biến động của các sai số ngẫu nhiên trong mô hình.
C. Mức độ tương quan giữa các biến độc lập.
D. Độ dốc của đường hồi quy.
12. Hệ số tương quan (correlation coefficient) đo lường điều gì?
A. Mức độ biến động của một biến.
B. Mức độ quan hệ tuyến tính giữa hai biến.
C. Mức độ khác biệt giữa hai nhóm.
D. Mức độ phù hợp của một mô hình thống kê.
13. Sự khác biệt chính giữa kiểm định tham số (parametric test) và kiểm định phi tham số (non-parametric test) là gì?
A. Kiểm định tham số yêu cầu dữ liệu tuân theo một phân phối cụ thể, trong khi kiểm định phi tham số không yêu cầu điều này.
B. Kiểm định phi tham số mạnh hơn kiểm định tham số.
C. Kiểm định tham số chỉ áp dụng cho dữ liệu định tính.
D. Kiểm định phi tham số chỉ áp dụng cho dữ liệu định lượng.
14. Trong kiểm định giả thuyết, giá trị tới hạn (critical value) là gì?
A. Giá trị của thống kê kiểm định.
B. Giá trị phân chia vùng bác bỏ và vùng không bác bỏ.
C. Giá trị p (p-value).
D. Mức ý nghĩa (significance level).
15. Độ mạnh của kiểm định (power of a test) được định nghĩa là gì?
A. Xác suất mắc sai lầm loại I.
B. Xác suất mắc sai lầm loại II.
C. Xác suất bác bỏ giả thuyết H0 khi nó sai.
D. Xác suất chấp nhận giả thuyết H0 khi nó đúng.
16. Sai lầm loại II (Type II error) trong kiểm định giả thuyết là gì?
A. Bác bỏ giả thuyết H0 khi nó đúng.
B. Chấp nhận giả thuyết H0 khi nó đúng.
C. Bác bỏ giả thuyết H0 khi nó sai.
D. Chấp nhận giả thuyết H0 khi nó sai.
17. Trong phân tích phương sai (ANOVA), yếu tố nào sau đây được so sánh để kiểm tra sự khác biệt giữa các nhóm?
A. Độ lệch chuẩn của các nhóm.
B. Phương sai giữa các nhóm và phương sai trong nội bộ các nhóm.
C. Trung vị của các nhóm.
D. Số lượng quan sát trong mỗi nhóm.
18. Trong phân tích hồi quy, phần dư (residual) là gì?
A. Giá trị dự đoán của biến phụ thuộc.
B. Sự khác biệt giữa giá trị thực tế và giá trị dự đoán của biến phụ thuộc.
C. Độ dốc của đường hồi quy.
D. Hệ số chặn (intercept).
19. Trong thống kê, ý nghĩa của thuật ngữ ‘bậc tự do’ (degrees of freedom) là gì?
A. Số lượng quan sát trong dữ liệu.
B. Số lượng biến trong mô hình.
C. Số lượng giá trị độc lập có thể thay đổi trong một ước lượng tham số.
D. Mức ý nghĩa (significance level).
20. Trong kiểm định giả thuyết, điều gì xảy ra khi tăng kích thước mẫu?
A. Giảm độ mạnh của kiểm định.
B. Tăng xác suất mắc sai lầm loại I.
C. Giảm xác suất mắc sai lầm loại II.
D. Không ảnh hưởng đến kết quả kiểm định.
21. Trong kiểm định giả thuyết, mức ý nghĩa (significance level) thường được ký hiệu là gì?
22. Khi nào nên sử dụng kiểm định Mann-Whitney U?
A. Để so sánh trung bình của hai quần thể độc lập khi dữ liệu không tuân theo phân phối chuẩn.
B. Để so sánh trung bình của hai quần thể phụ thuộc.
C. Để kiểm tra sự phù hợp của một phân phối lý thuyết với dữ liệu quan sát được.
D. Để phân tích phương sai (ANOVA).
23. Kiểm định chi bình phương (Chi-square test) thường được sử dụng để làm gì?
A. So sánh trung bình của hai quần thể.
B. Kiểm tra sự phù hợp của một phân phối lý thuyết với dữ liệu quan sát được.
C. Ước lượng khoảng tin cậy cho trung bình quần thể.
D. Phân tích phương sai (ANOVA).
24. Khi nào nên sử dụng kiểm định Kruskal-Wallis?
A. Để so sánh trung bình của hai quần thể.
B. Để so sánh trung bình của ba hoặc nhiều hơn các quần thể độc lập khi dữ liệu không tuân theo phân phối chuẩn.
C. Để kiểm tra sự phù hợp của một phân phối lý thuyết với dữ liệu quan sát được.
D. Để phân tích phương sai (ANOVA) khi dữ liệu tuân theo phân phối chuẩn.
25. Độ lệch chuẩn (standard deviation) đo lường điều gì?
A. Giá trị trung bình của dữ liệu.
B. Mức độ phân tán của dữ liệu so với giá trị trung bình.
C. Số lượng quan sát trong dữ liệu.
D. Giá trị lớn nhất của dữ liệu.
26. Trong thống kê, phương sai (variance) đo lường điều gì?
A. Giá trị trung bình của dữ liệu.
B. Độ lệch chuẩn của dữ liệu.
C. Mức độ phân tán của dữ liệu so với giá trị trung bình.
D. Số lượng quan sát trong dữ liệu.
27. Giá trị p (p-value) trong kiểm định giả thuyết là gì?
A. Xác suất mắc sai lầm loại II.
B. Xác suất bác bỏ H0 khi H0 sai.
C. Xác suất quan sát được kết quả (hoặc kết quả cực đoan hơn) nếu H0 đúng.
D. Xác suất chấp nhận H0 khi H0 đúng.
28. Khi nào nên sử dụng kiểm định t (t-test) thay vì kiểm định z (z-test)?
A. Khi kích thước mẫu lớn (n > 30) và độ lệch chuẩn của quần thể đã biết.
B. Khi kích thước mẫu nhỏ (n < 30) và độ lệch chuẩn của quần thể chưa biết.
C. Khi so sánh phương sai của hai quần thể.
D. Khi dữ liệu không tuân theo phân phối chuẩn.
29. Kiểm định Shapiro-Wilk được sử dụng để làm gì?
A. So sánh trung bình của hai quần thể.
B. Kiểm tra xem dữ liệu có tuân theo phân phối chuẩn hay không.
C. Phân tích phương sai (ANOVA).
D. Kiểm tra tính độc lập giữa các biến phân loại.
30. Hệ số xác định (R-squared) trong hồi quy tuyến tính đo lường điều gì?
A. Độ dốc của đường hồi quy.
B. Mức độ phù hợp của mô hình hồi quy với dữ liệu.
C. Mức độ tương quan giữa các biến độc lập.
D. Sai số chuẩn của ước lượng.
31. Giá trị tới hạn (critical value) trong kiểm định giả thuyết là gì?
A. Xác suất mắc sai lầm loại I.
B. Điểm phân chia vùng bác bỏ và vùng không bác bỏ của giả thuyết H0.
C. Giá trị của thống kê kiểm định.
D. Kích thước mẫu cần thiết.
32. Loại kiểm định nào được sử dụng để so sánh phương sai của hai quần thể độc lập?
A. Kiểm định t.
B. Kiểm định Z.
C. Kiểm định Chi bình phương (χ²).
D. Kiểm định F.
33. Trong phân tích hồi quy, hệ số xác định (R-squared) đo lường điều gì?
A. Mức độ quan hệ nhân quả giữa các biến.
B. Phần trăm phương sai của biến phụ thuộc được giải thích bởi biến độc lập.
C. Độ dốc của đường hồi quy.
D. Sai số chuẩn của ước lượng.
34. Trong kiểm định Chi bình phương (χ²) cho tính độc lập, bậc tự do (degrees of freedom) được tính như thế nào?
A. (Số hàng – 1) + (Số cột – 1)
B. (Số hàng – 1) * (Số cột – 1)
C. Số hàng * Số cột
D. Tổng số quan sát – 1
35. Kiểm định Mann-Whitney U test được sử dụng để làm gì?
A. So sánh trung bình của hai mẫu phụ thuộc.
B. So sánh trung bình của hai mẫu độc lập khi dữ liệu không tuân theo phân phối chuẩn.
C. Kiểm tra tính độc lập giữa hai biến định tính.
D. Kiểm tra sự phù hợp của dữ liệu với phân phối chuẩn.
36. Trong kiểm định giả thuyết, vùng bác bỏ (rejection region) là gì?
A. Tập hợp các giá trị của thống kê kiểm định mà ta chấp nhận giả thuyết H0.
B. Tập hợp các giá trị của thống kê kiểm định mà ta bác bỏ giả thuyết H0.
C. Mức ý nghĩa của kiểm định.
D. Khoảng tin cậy cho tham số quần thể.
37. Ý nghĩa của việc tính toán khoảng tin cậy (confidence interval) là gì?
A. Ước lượng một giá trị duy nhất cho tham số quần thể.
B. Ước lượng một khoảng giá trị mà tham số quần thể có khả năng nằm trong đó với một độ tin cậy nhất định.
C. Kiểm định một giả thuyết về tham số quần thể.
D. Đo lường độ lệch chuẩn của mẫu.
38. Công thức tính thống kê kiểm định (test statistic) cho kiểm định Z về trung bình của một quần thể khi phương sai quần thể đã biết là gì?
A. t = (x̄ – μ) / (s / √n)
B. Z = (x̄ – μ) / (σ / √n)
C. χ² = Σ [(Oi – Ei)² / Ei]
D. F = MSB / MSW
39. Trong kiểm định giả thuyết, sai lầm loại I xảy ra khi nào?
A. Chấp nhận giả thuyết H0 khi nó sai.
B. Bác bỏ giả thuyết H0 khi nó đúng.
C. Chấp nhận giả thuyết H1 khi nó đúng.
D. Bác bỏ giả thuyết H1 khi nó sai.
40. Điều gì xảy ra với công suất kiểm định (power of the test) khi tăng kích thước mẫu?
A. Công suất kiểm định giảm.
B. Công suất kiểm định tăng.
C. Công suất kiểm định không thay đổi.
D. Không thể xác định được sự thay đổi.
41. Khi nào thì việc sử dụng kiểm định phi tham số (non-parametric test) là phù hợp hơn kiểm định tham số (parametric test)?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc có outliers.
D. Khi phương sai của các quần thể bằng nhau.
42. Trong phân tích phương sai (ANOVA), yếu tố nào sau đây KHÔNG ảnh hưởng đến giá trị F?
A. Sự khác biệt giữa các trung bình nhóm.
B. Phương sai trong các nhóm.
C. Kích thước mẫu của các nhóm.
D. Trung bình tổng thể của tất cả các nhóm.
43. Để so sánh trung bình của ba nhóm trở lên, khi các nhóm này độc lập và dữ liệu tuân theo phân phối chuẩn, ta sử dụng kiểm định nào?
A. Kiểm định t.
B. Kiểm định Z.
C. Kiểm định ANOVA.
D. Kiểm định Chi bình phương (χ²).
44. Trong kiểm định giả thuyết, khi giá trị p nhỏ hơn mức ý nghĩa α, ta nên làm gì?
A. Chấp nhận giả thuyết H0.
B. Bác bỏ giả thuyết H0.
C. Không đưa ra kết luận.
D. Tăng kích thước mẫu.
45. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết H0 là đúng.
B. Xác suất mắc sai lầm loại II.
C. Xác suất quan sát được kết quả (hoặc kết quả cực đoan hơn) nếu H0 là đúng.
D. Mức ý nghĩa của kiểm định.
46. Khi thực hiện kiểm định giả thuyết, điều gì xảy ra nếu ta tăng mức ý nghĩa α?
A. Xác suất mắc sai lầm loại I giảm.
B. Xác suất mắc sai lầm loại II giảm.
C. Xác suất mắc cả hai loại sai lầm đều giảm.
D. Không có sự thay đổi về xác suất mắc sai lầm.
47. Trong kiểm định giả thuyết, điều gì xảy ra nếu ta giảm mức ý nghĩa α?
A. Xác suất mắc sai lầm loại I tăng.
B. Xác suất mắc sai lầm loại I giảm.
C. Xác suất mắc sai lầm loại II giảm.
D. Không có sự thay đổi về xác suất mắc sai lầm.
48. Trong kiểm định giả thuyết về tỷ lệ, ta sử dụng phân phối nào?
A. Phân phối Student (t).
B. Phân phối chuẩn (Z).
C. Phân phối Chi bình phương (χ²).
D. Phân phối F.
49. Trong kiểm định ANOVA, giả thuyết H0 thường là gì?
A. Tất cả các trung bình quần thể đều bằng nhau.
B. Ít nhất một trung bình quần thể khác với các trung bình còn lại.
C. Phương sai của tất cả các quần thể đều bằng nhau.
D. Các quần thể không có phân phối chuẩn.
50. Trong kiểm định giả thuyết về trung bình của một quần thể khi phương sai quần thể chưa biết, ta sử dụng phân phối nào?
A. Phân phối chuẩn (Z).
B. Phân phối Student (t).
C. Phân phối Chi bình phương (χ²).
D. Phân phối F.
51. Mức ý nghĩa (significance level) α trong kiểm định giả thuyết thường được chọn là bao nhiêu?
A. 0.1
B. 0.01
C. 0.05
D. Tất cả các đáp án trên đều đúng, tùy thuộc vào bài toán.
52. Điều gì xảy ra với độ rộng của khoảng tin cậy khi tăng kích thước mẫu?
A. Độ rộng của khoảng tin cậy tăng lên.
B. Độ rộng của khoảng tin cậy giảm xuống.
C. Độ rộng của khoảng tin cậy không thay đổi.
D. Không thể xác định được sự thay đổi.
53. Để kiểm định sự độc lập giữa hai biến định tính, ta sử dụng kiểm định nào?
A. Kiểm định t.
B. Kiểm định ANOVA.
C. Kiểm định Chi bình phương (χ²).
D. Kiểm định Z.
54. Khi nào thì sử dụng kiểm định Wilcoxon signed-rank test?
A. Để so sánh trung bình của hai mẫu độc lập.
B. Để so sánh trung bình của hai mẫu phụ thuộc.
C. Để kiểm tra tính độc lập giữa hai biến định tính.
D. Để kiểm tra sự phù hợp của dữ liệu với phân phối chuẩn.
55. Điều kiện nào sau đây KHÔNG phải là điều kiện cần thiết để sử dụng kiểm định t cho hai mẫu độc lập?
A. Hai mẫu phải độc lập.
B. Dữ liệu phải tuân theo phân phối chuẩn hoặc gần chuẩn.
C. Phương sai của hai quần thể phải bằng nhau.
D. Kích thước của hai mẫu phải bằng nhau.
56. Nếu khoảng tin cậy 95% cho trung bình của một quần thể là (10, 15), điều này có nghĩa là gì?
A. 95% các giá trị trong quần thể nằm giữa 10 và 15.
B. Có 95% khả năng trung bình mẫu nằm giữa 10 và 15.
C. Có 95% khả năng trung bình quần thể nằm giữa 10 và 15.
D. Trung bình mẫu chắc chắn nằm giữa 10 và 15.
57. Trong phân tích hồi quy tuyến tính, điều gì xảy ra nếu có hiện tượng đa cộng tuyến (multicollinearity) giữa các biến độc lập?
A. Các hệ số hồi quy trở nên ổn định hơn.
B. Sai số chuẩn của các hệ số hồi quy tăng lên.
C. Giá trị R-squared giảm xuống.
D. Không có ảnh hưởng gì đến mô hình.
58. Kiểm định nào sau đây được sử dụng để kiểm tra sự phù hợp của dữ liệu với một phân phối lý thuyết (ví dụ: phân phối chuẩn)?
A. Kiểm định t.
B. Kiểm định Z.
C. Kiểm định Chi bình phương (χ²) goodness-of-fit.
D. Kiểm định F.
59. Khi nào nên sử dụng kiểm định một phía (one-tailed test) thay vì kiểm định hai phía (two-tailed test)?
A. Khi ta không có bất kỳ giả định nào về hướng của sự khác biệt.
B. Khi ta chỉ quan tâm đến sự khác biệt theo một hướng cụ thể.
C. Khi kích thước mẫu nhỏ.
D. Khi phương sai quần thể chưa biết.
60. Sai số loại II (Type II error) trong kiểm định giả thuyết còn được gọi là gì?
A. Mức ý nghĩa.
B. Công suất kiểm định.
C. Xác suất bác bỏ giả thuyết H0 khi nó đúng.
D. Xác suất chấp nhận giả thuyết H0 khi nó sai.
61. Kiểm định Kolmogorov-Smirnov được sử dụng để làm gì?
A. So sánh trung bình của hai mẫu.
B. Kiểm tra tính độc lập của hai biến.
C. Kiểm tra xem một mẫu có tuân theo một phân phối cụ thể hay không.
D. So sánh phương sai của hai mẫu.
62. Trong kiểm định giả thuyết, sai lầm loại I (Type I error) xảy ra khi nào?
A. Chấp nhận giả thuyết H0 khi nó đúng.
B. Bác bỏ giả thuyết H0 khi nó sai.
C. Chấp nhận giả thuyết H0 khi nó sai.
D. Bác bỏ giả thuyết H0 khi nó đúng.
63. Khoảng tin cậy (Confidence Interval) là gì?
A. Một khoảng giá trị mà ta chắc chắn rằng tham số tổng thể nằm trong đó.
B. Một khoảng giá trị mà ta ước lượng tham số tổng thể nằm trong đó với một độ tin cậy nhất định.
C. Một giá trị duy nhất mà ta ước lượng tham số tổng thể bằng.
D. Một tập hợp các giá trị có thể có của tham số tổng thể.
64. Trong kiểm định giả thuyết, giá trị tới hạn (critical value) là gì?
A. Giá trị của thống kê kiểm định.
B. Giá trị phân chia vùng bác bỏ và vùng không bác bỏ.
C. Xác suất mắc sai lầm loại I.
D. Xác suất mắc sai lầm loại II.
65. Mục đích chính của việc sử dụng kiểm định giả thuyết là gì?
A. Để ước lượng giá trị của tham số tổng thể một cách chính xác.
B. Để xác định xem có đủ bằng chứng thống kê để bác bỏ một giả thuyết về tham số tổng thể hay không.
C. Để tính toán khoảng tin cậy cho tham số tổng thể.
D. Để mô tả dữ liệu mẫu một cách chi tiết.
66. Độ mạnh của kiểm định (Power of a test) được định nghĩa là gì?
A. Xác suất bác bỏ giả thuyết H0 khi nó đúng.
B. Xác suất chấp nhận giả thuyết H0 khi nó sai.
C. Xác suất bác bỏ giả thuyết H0 khi nó sai.
D. Xác suất chấp nhận giả thuyết H0 khi nó đúng.
67. Hệ số tương quan (Correlation coefficient) đo lường điều gì?
A. Mức độ biến động của dữ liệu.
B. Mức độ phụ thuộc tuyến tính giữa hai biến.
C. Mức độ khác biệt giữa các trung bình của các nhóm.
D. Mức độ phù hợp của một mô hình với dữ liệu.
68. Trong hồi quy tuyến tính, ý nghĩa của hệ số chặn (Intercept) là gì?
A. Sự thay đổi trong biến phụ thuộc khi biến độc lập tăng thêm một đơn vị.
B. Giá trị dự đoán của biến phụ thuộc khi tất cả các biến độc lập bằng 0.
C. Độ dốc của đường hồi quy.
D. Mức độ phù hợp của mô hình hồi quy.
69. Khi nào nên sử dụng kiểm định t ghép cặp (Paired t-test)?
A. Khi so sánh trung bình của hai mẫu độc lập.
B. Khi so sánh trung bình của hai mẫu có liên quan (ví dụ: trước và sau can thiệp).
C. Khi kiểm định giả thuyết về phương sai của một tổng thể.
D. Khi kiểm định tính độc lập giữa hai biến định tính.
70. Khi nào nên sử dụng kiểm định Kruskal-Wallis test?
A. Khi so sánh trung bình của hai mẫu độc lập.
B. Khi so sánh trung bình của ba nhóm trở lên mà dữ liệu không tuân theo phân phối chuẩn.
C. Khi kiểm định giả thuyết về phương sai của một tổng thể.
D. Khi kiểm định tính độc lập giữa hai biến định tính.
71. Khi nào nên sử dụng kiểm định một phía (one-tailed test) thay vì kiểm định hai phía (two-tailed test)?
A. Khi ta không có bất kỳ giả định nào về hướng của sự khác biệt.
B. Khi ta chỉ quan tâm đến việc liệu tham số có lớn hơn một giá trị cụ thể hay không.
C. Khi ta muốn kiểm định xem tham số có khác với một giá trị cụ thể hay không.
D. Khi cỡ mẫu nhỏ.
72. Trong kiểm định giả thuyết, thống kê kiểm định (test statistic) là gì?
A. Một giá trị được tính từ dữ liệu mẫu để kiểm định giả thuyết.
B. Mức ý nghĩa của kiểm định.
C. Sai số chuẩn của ước lượng.
D. Độ mạnh của kiểm định.
73. Khi so sánh hai phương sai của hai tổng thể độc lập, ta thường sử dụng kiểm định nào?
A. Kiểm định t.
B. Kiểm định Chi bình phương.
C. Kiểm định F.
D. Kiểm định Z.
74. Trong phân tích phương sai (ANOVA), giả định quan trọng nhất là gì?
A. Dữ liệu phải tuân theo phân phối chuẩn.
B. Phương sai của các nhóm phải bằng nhau.
C. Cỡ mẫu của các nhóm phải bằng nhau.
D. Các nhóm phải độc lập với nhau.
75. Khi muốn so sánh trung bình của ba nhóm trở lên, ta sử dụng phương pháp nào?
A. Kiểm định t.
B. Kiểm định z.
C. Phân tích phương sai (ANOVA).
D. Kiểm định Chi bình phương.
76. Nếu giá trị p (p-value) nhỏ hơn mức ý nghĩa (α), ta nên làm gì?
A. Chấp nhận giả thuyết H0.
B. Bác bỏ giả thuyết H0.
C. Không đưa ra kết luận gì.
D. Tăng cỡ mẫu.
77. Khi nào nên sử dụng kiểm định Mann-Whitney U test?
A. Khi so sánh trung bình của hai mẫu độc lập mà dữ liệu không tuân theo phân phối chuẩn.
B. Khi so sánh trung bình của hai mẫu có liên quan.
C. Khi kiểm định giả thuyết về phương sai của một tổng thể.
D. Khi kiểm định tính độc lập giữa hai biến định tính.
78. Trong phân tích hồi quy, hệ số xác định (R-squared) cho biết điều gì?
A. Độ dốc của đường hồi quy.
B. Mức độ biến động của biến phụ thuộc.
C. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi các biến độc lập.
D. Sai số chuẩn của ước lượng.
79. Mối quan hệ giữa sai lầm loại I (Type I error) và mức ý nghĩa (α) của kiểm định là gì?
A. Mức ý nghĩa (α) là xác suất mắc sai lầm loại I.
B. Mức ý nghĩa (α) là xác suất mắc sai lầm loại II.
C. Mức ý nghĩa (α) là 1 trừ đi xác suất mắc sai lầm loại I.
D. Không có mối quan hệ nào giữa mức ý nghĩa (α) và sai lầm loại I.
80. Sai lầm loại II (Type II error) xảy ra khi nào?
A. Bác bỏ giả thuyết H0 khi nó đúng.
B. Chấp nhận giả thuyết H0 khi nó đúng.
C. Bác bỏ giả thuyết H0 khi nó sai.
D. Chấp nhận giả thuyết H0 khi nó sai.
81. Trong phân tích phương sai (ANOVA), giả thuyết H0 thường là gì?
A. Tất cả các trung bình của các nhóm đều bằng nhau.
B. Ít nhất một trung bình của các nhóm khác với các trung bình còn lại.
C. Phương sai của tất cả các nhóm đều bằng nhau.
D. Phương sai của ít nhất một nhóm khác với các phương sai còn lại.
82. Trong kiểm định giả thuyết, việc giảm mức ý nghĩa (α) sẽ ảnh hưởng như thế nào đến xác suất mắc sai lầm loại II (β)?
A. Làm giảm xác suất mắc sai lầm loại II (β).
B. Không ảnh hưởng đến xác suất mắc sai lầm loại II (β).
C. Làm tăng xác suất mắc sai lầm loại II (β).
D. Ảnh hưởng không đoán trước được đến xác suất mắc sai lầm loại II (β).
83. Ý nghĩa của mức ý nghĩa (significance level) trong kiểm định giả thuyết là gì?
A. Xác suất chấp nhận giả thuyết H0 khi nó đúng.
B. Xác suất bác bỏ giả thuyết H0 khi nó đúng.
C. Xác suất chấp nhận giả thuyết H0 khi nó sai.
D. Xác suất bác bỏ giả thuyết H0 khi nó sai.
84. Kiểm định phi tham số (Non-parametric test) được sử dụng khi nào?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi cỡ mẫu lớn.
C. Khi giả định về phân phối của dữ liệu không được đáp ứng.
D. Khi cần ước lượng tham số tổng thể.
85. Trong kiểm định giả thuyết, việc tăng cỡ mẫu (sample size) có ảnh hưởng như thế nào đến độ mạnh của kiểm định (power of the test)?
A. Làm giảm độ mạnh của kiểm định.
B. Không ảnh hưởng đến độ mạnh của kiểm định.
C. Làm tăng độ mạnh của kiểm định.
D. Ảnh hưởng không đoán trước được đến độ mạnh của kiểm định.
86. Trong kiểm định giả thuyết về trung bình của một tổng thể khi phương sai tổng thể chưa biết, ta thường sử dụng phân phối nào?
A. Phân phối chuẩn (Z).
B. Phân phối Student’s t.
C. Phân phối Chi bình phương (Chi-square).
D. Phân phối F.
87. Khi nào nên sử dụng kiểm định Chi bình phương (Chi-square test)?
A. Để kiểm định giả thuyết về trung bình của một tổng thể.
B. Để kiểm định giả thuyết về phương sai của một tổng thể.
C. Để kiểm định tính độc lập giữa hai biến định tính.
D. Để kiểm định sự phù hợp của một mô hình hồi quy.
88. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết H0 là đúng.
B. Xác suất mắc sai lầm loại II.
C. Xác suất thu được kết quả (hoặc kết quả cực đoan hơn) như quan sát được, giả sử H0 là đúng.
D. Mức ý nghĩa của kiểm định.
89. Khi nào nên sử dụng kiểm định Wilcoxon signed-rank test?
A. Khi so sánh trung bình của hai mẫu độc lập.
B. Khi so sánh trung bình của hai mẫu có liên quan mà dữ liệu không tuân theo phân phối chuẩn.
C. Khi kiểm định giả thuyết về phương sai của một tổng thể.
D. Khi kiểm định tính độc lập giữa hai biến định tính.
90. Nếu khoảng tin cậy 95% cho trung bình của một tổng thể là (10, 15), điều này có nghĩa là gì?
A. Trung bình mẫu nằm trong khoảng (10, 15).
B. 95% dữ liệu nằm trong khoảng (10, 15).
C. Chúng ta tin rằng với độ tin cậy 95%, trung bình tổng thể nằm trong khoảng (10, 15).
D. Xác suất trung bình tổng thể nằm trong khoảng (10, 15) là 95%.
91. Khi nào nên sử dụng kiểm định Kruskal-Wallis test?
A. Khi so sánh trung bình của hai mẫu độc lập.
B. Khi so sánh trung vị của ba hoặc nhiều hơn các mẫu độc lập.
C. Khi so sánh trung bình của ba hoặc nhiều hơn các mẫu liên quan.
D. Khi kiểm tra tính độc lập giữa hai biến định tính.
92. Trong kiểm định giả thuyết, vùng bác bỏ (rejection region) là gì?
A. Khoảng giá trị mà nếu thống kê kiểm định rơi vào đó, ta chấp nhận H0.
B. Khoảng giá trị mà nếu thống kê kiểm định rơi vào đó, ta bác bỏ H0.
C. Khoảng tin cậy cho tham số tổng thể.
D. Mức ý nghĩa (alpha).
93. Khi thực hiện kiểm định giả thuyết, nếu giá trị p (p-value) nhỏ hơn mức ý nghĩa (alpha), thì kết luận nào là đúng?
A. Chấp nhận giả thuyết H0.
B. Bác bỏ giả thuyết H0.
C. Không thể đưa ra kết luận.
D. Cần tăng kích thước mẫu để có kết luận chính xác.
94. Khi nào nên sử dụng kiểm định paired t-test?
A. Khi so sánh trung bình của hai mẫu độc lập.
B. Khi so sánh trung bình của hai mẫu liên quan.
C. Khi so sánh phương sai của hai mẫu độc lập.
D. Khi so sánh phương sai của hai mẫu liên quan.
95. Trong kiểm định giả thuyết, ‘hiệu ứng cỡ lớn’ (large effect size) có ý nghĩa gì?
A. Kích thước mẫu lớn.
B. Mức ý nghĩa (alpha) lớn.
C. Sự khác biệt thực tế giữa các nhóm hoặc biến lớn.
D. Giá trị p (p-value) nhỏ.
96. Ý nghĩa của việc hiệu chỉnh Bonferroni trong kiểm định đa giả thuyết (multiple hypothesis testing) là gì?
A. Tăng ‘power’ của kiểm định.
B. Giảm khả năng mắc sai lầm loại II.
C. Giảm khả năng mắc sai lầm loại I khi thực hiện nhiều kiểm định đồng thời.
D. Đơn giản hóa việc tính toán giá trị p (p-value).
97. Trong kiểm định giả thuyết, điều gì xảy ra khi giảm mức ý nghĩa (alpha)?
A. Tăng khả năng mắc sai lầm loại I.
B. Giảm khả năng mắc sai lầm loại I và tăng khả năng mắc sai lầm loại II.
C. Tăng khả năng mắc sai lầm loại II và giảm khả năng mắc sai lầm loại I.
D. Giảm khả năng mắc sai lầm loại I và loại II.
98. Kiểm định Kolmogorov-Smirnov (K-S test) được sử dụng để làm gì?
A. So sánh trung bình của hai mẫu.
B. Kiểm tra tính độc lập giữa hai biến định tính.
C. Kiểm tra xem một mẫu có tuân theo một phân phối cụ thể hay không.
D. Phân tích phương sai.
99. Khi nào nên sử dụng kiểm định t (t-test) thay vì kiểm định z (z-test) để so sánh trung bình của hai mẫu?
A. Khi kích thước mẫu lớn (n > 30).
B. Khi phương sai của tổng thể đã biết.
C. Khi phương sai của tổng thể chưa biết và kích thước mẫu nhỏ (n < 30).
D. Khi dữ liệu không tuân theo phân phối chuẩn.
100. Trong kiểm định giả thuyết, sai lầm loại I xảy ra khi nào?
A. Bác bỏ giả thuyết H0 khi nó sai.
B. Chấp nhận giả thuyết H0 khi nó đúng.
C. Bác bỏ giả thuyết H0 khi nó đúng.
D. Chấp nhận giả thuyết H0 khi nó sai.
101. Ưu điểm của việc sử dụng khoảng tin cậy (confidence interval) so với kiểm định giả thuyết là gì?
A. Khoảng tin cậy chỉ cung cấp thông tin về việc có bác bỏ H0 hay không.
B. Khoảng tin cậy cung cấp một khoảng giá trị hợp lý cho tham số tổng thể, thay vì chỉ kết luận bác bỏ hay không bác bỏ H0.
C. Khoảng tin cậy dễ tính toán hơn.
D. Khoảng tin cậy không bị ảnh hưởng bởi kích thước mẫu.
102. Trong kiểm định giả thuyết, sai lầm loại II xảy ra khi nào?
A. Bác bỏ giả thuyết H0 khi nó đúng.
B. Chấp nhận giả thuyết H0 khi nó đúng.
C. Bác bỏ giả thuyết H0 khi nó sai.
D. Chấp nhận giả thuyết H0 khi nó sai.
103. Trong kiểm định Chi-bình phương, bậc tự do (degrees of freedom) được tính như thế nào khi kiểm tra tính độc lập giữa hai biến định tính?
A. (Số hàng – 1) + (Số cột – 1).
B. (Số hàng – 1) * (Số cột – 1).
C. Số hàng * Số cột.
D. Tổng số quan sát – 1.
104. Khi nào thì kiểm định phi tham số (non-parametric test) được ưu tiên sử dụng hơn kiểm định tham số (parametric test)?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn (n > 30).
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc kích thước mẫu nhỏ.
D. Khi phương sai của tổng thể đã biết.
105. Kiểm định Levene’s test được sử dụng để làm gì?
A. So sánh trung bình của hai mẫu.
B. Kiểm tra tính độc lập giữa hai biến định tính.
C. Kiểm tra xem phương sai của các nhóm có bằng nhau hay không (homogeneity of variance).
D. Kiểm tra xem một mẫu có tuân theo phân phối chuẩn hay không.
106. Mục đích chính của kiểm định Chi-bình phương (Chi-square test) là gì?
A. So sánh trung bình của hai mẫu.
B. Kiểm tra sự độc lập giữa hai biến định tính.
C. Ước lượng khoảng tin cậy cho trung bình.
D. Phân tích hồi quy tuyến tính.
107. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết H0 là đúng.
B. Xác suất mắc sai lầm loại I.
C. Xác suất thu được kết quả kiểm định (hoặc kết quả cực đoan hơn) nếu H0 là đúng.
D. Xác suất mắc sai lầm loại II.
108. Trong kiểm định Chi-bình phương, điều gì xảy ra nếu giá trị kỳ vọng (expected value) trong một ô của bảng tần số quá nhỏ?
A. Không ảnh hưởng đến kết quả kiểm định.
B. Kết quả kiểm định trở nên đáng tin cậy hơn.
C. Kết quả kiểm định có thể không chính xác.
D. Cần sử dụng kiểm định t thay thế.
109. Hệ quả của việc tăng mức ý nghĩa (alpha) trong kiểm định giả thuyết là gì?
A. Giảm khả năng mắc sai lầm loại I và loại II.
B. Tăng khả năng mắc sai lầm loại I và giảm khả năng mắc sai lầm loại II.
C. Giảm khả năng mắc sai lầm loại I và tăng khả năng mắc sai lầm loại II.
D. Tăng khả năng mắc sai lầm loại I và loại II.
110. Trong kiểm định giả thuyết về tỷ lệ, thống kê kiểm định (test statistic) thường tuân theo phân phối nào?
A. Phân phối t (t-distribution).
B. Phân phối Chi-bình phương (Chi-square distribution).
C. Phân phối chuẩn (Normal distribution).
D. Phân phối F (F-distribution).
111. Trong phân tích phương sai (ANOVA), yếu tố nào được sử dụng để so sánh sự khác biệt giữa các nhóm?
A. Độ lệch chuẩn.
B. Phương sai.
C. Trung bình.
D. Trung vị.
112. Khi nào nên sử dụng kiểm định ANOVA hai yếu tố (two-way ANOVA) thay vì ANOVA một yếu tố (one-way ANOVA)?
A. Khi chỉ có một biến độc lập.
B. Khi có hai hoặc nhiều biến độc lập và muốn xem xét tương tác giữa chúng.
C. Khi biến phụ thuộc là biến định tính.
D. Khi kích thước mẫu nhỏ.
113. Trong kiểm định giả thuyết, ‘power’ của một kiểm định (1-β) đại diện cho điều gì?
A. Xác suất mắc sai lầm loại I.
B. Xác suất mắc sai lầm loại II.
C. Xác suất bác bỏ H0 khi nó sai.
D. Xác suất chấp nhận H0 khi nó đúng.
114. Trong kiểm định giả thuyết, điều gì xảy ra khi tăng kích thước mẫu (n)?
A. Tăng khả năng mắc sai lầm loại I.
B. Giảm ‘power’ của kiểm định.
C. Giảm cả sai số chuẩn và giá trị p (p-value).
D. Không ảnh hưởng đến kết quả kiểm định.
115. Trong kiểm định phi tham số, kiểm định Mann-Whitney U test được sử dụng để làm gì?
A. So sánh trung bình của hai mẫu liên quan.
B. So sánh trung vị của hai mẫu độc lập.
C. Kiểm tra tính độc lập giữa hai biến định tính.
D. Kiểm tra xem một mẫu có tuân theo phân phối chuẩn hay không.
116. Trong phân tích ANOVA, giả định nào sau đây là quan trọng nhất?
A. Các mẫu phải có kích thước bằng nhau.
B. Dữ liệu phải tuân theo phân phối nhị thức.
C. Phương sai của các nhóm phải bằng nhau (homogeneity of variance).
D. Dữ liệu phải là biến định tính.
117. Kiểm định Shapiro-Wilk được sử dụng để làm gì?
A. So sánh trung bình của hai mẫu.
B. Kiểm tra tính độc lập giữa hai biến định tính.
C. Kiểm tra xem một mẫu có tuân theo phân phối chuẩn hay không.
D. Phân tích phương sai.
118. Khi nào nên sử dụng kiểm định Friedman test?
A. Khi so sánh trung bình của hai mẫu độc lập.
B. Khi so sánh trung vị của ba hoặc nhiều hơn các mẫu độc lập.
C. Khi so sánh trung vị của ba hoặc nhiều hơn các mẫu liên quan.
D. Khi kiểm tra tính độc lập giữa hai biến định tính.
119. Khi nào nên sử dụng kiểm định Wilcoxon signed-rank test?
A. Khi so sánh trung bình của hai mẫu độc lập tuân theo phân phối chuẩn.
B. Khi so sánh trung bình của hai mẫu liên quan tuân theo phân phối chuẩn.
C. Khi so sánh trung vị của hai mẫu liên quan mà không có giả định về phân phối.
D. Khi so sánh phương sai của hai mẫu độc lập.
120. Ý nghĩa của việc sử dụng kiểm định một phía (one-tailed test) so với kiểm định hai phía (two-tailed test) là gì?
A. Kiểm định một phía luôn cho kết quả chính xác hơn.
B. Kiểm định một phía chỉ được sử dụng khi kích thước mẫu lớn.
C. Kiểm định một phía có ‘power’ cao hơn nếu hướng của hiệu ứng đã được xác định trước.
D. Kiểm định hai phía dễ thực hiện hơn.
121. Hệ số tương quan Pearson đo lường điều gì?
A. Mối quan hệ nhân quả giữa hai biến.
B. Mức độ phù hợp của mô hình hồi quy.
C. Mối quan hệ tuyến tính giữa hai biến.
D. Sự khác biệt giữa trung bình của hai nhóm.
122. Trong phân tích chuỗi thời gian, thành phần nào thể hiện sự biến động ngẫu nhiên và không thể dự đoán?
A. Xu hướng (Trend).
B. Tính mùa vụ (Seasonality).
C. Chu kỳ (Cycle).
D. Phần dư (Irregular Component).
123. Trong phân tích sống sót (survival analysis), hàm sống sót (survival function) biểu thị điều gì?
A. Thời gian trung bình mà một sự kiện xảy ra.
B. Xác suất một sự kiện xảy ra tại một thời điểm cụ thể.
C. Xác suất một sự kiện chưa xảy ra cho đến một thời điểm cụ thể.
D. Tỷ lệ các sự kiện xảy ra trong một khoảng thời gian nhất định.
124. Khoảng tin cậy 95% có nghĩa là gì?
A. Có 95% khả năng tham số thực tế nằm trong khoảng này.
B. Có 5% khả năng tham số thực tế nằm ngoài khoảng này.
C. Nếu lặp lại quá trình lấy mẫu nhiều lần, 95% các khoảng tin cậy được tạo ra sẽ chứa tham số thực tế.
D. Có 95% khả năng mẫu được chọn là đại diện cho quần thể.
125. Trong một phân phối chuẩn, khoảng cách từ trung bình đến điểm uốn (inflection point) bằng bao nhiêu?
A. Bằng phương sai.
B. Bằng độ lệch chuẩn.
C. Bằng trung vị.
D. Bằng khoảng tứ phân vị.
126. Điều gì xảy ra với công suất của kiểm định (power of a test) khi kích thước mẫu tăng?
A. Công suất tăng.
B. Công suất giảm.
C. Công suất không đổi.
D. Công suất có thể tăng hoặc giảm tùy thuộc vào dữ liệu.
127. Trong phân tích hồi quy tuyến tính, hệ số xác định (R-squared) đo lường điều gì?
A. Mức độ quan trọng của các biến độc lập.
B. Mức độ phù hợp của mô hình hồi quy với dữ liệu.
C. Độ dốc của đường hồi quy.
D. Sai số chuẩn của các hệ số hồi quy.
128. Khi nào thì nên sử dụng kiểm định Wilcoxon signed-rank?
A. Để so sánh trung bình của hai mẫu độc lập khi dữ liệu tuân theo phân phối chuẩn.
B. Để so sánh trung vị của hai mẫu độc lập khi dữ liệu không tuân theo phân phối chuẩn.
C. Để so sánh trung vị của hai mẫu phụ thuộc (paired samples) khi dữ liệu không tuân theo phân phối chuẩn.
D. Để so sánh phương sai của hai mẫu độc lập.
129. Sự khác biệt chính giữa kiểm định một phía (one-tailed test) và kiểm định hai phía (two-tailed test) là gì?
A. Kiểm định một phía có công suất cao hơn.
B. Kiểm định hai phía dễ thực hiện hơn.
C. Kiểm định một phía chỉ kiểm tra sự khác biệt theo một hướng cụ thể, trong khi kiểm định hai phía kiểm tra sự khác biệt theo cả hai hướng.
D. Kiểm định hai phía chỉ sử dụng cho mẫu lớn.
130. Trong phân tích phương sai (ANOVA), điều gì được kiểm định?
A. Sự khác biệt giữa các phương sai của hai quần thể.
B. Sự khác biệt giữa các trung bình của hai quần thể.
C. Sự khác biệt giữa các trung bình của ba hoặc nhiều hơn quần thể.
D. Mối quan hệ giữa hai biến định lượng.
131. Phân tích hồi quy logistic được sử dụng khi nào?
A. Khi biến phụ thuộc là định lượng.
B. Khi biến độc lập là định tính.
C. Khi biến phụ thuộc là định tính (categorical).
D. Khi biến độc lập và phụ thuộc đều là định lượng.
132. Sai lầm loại II trong kiểm định giả thuyết còn được gọi là gì?
A. Lỗi alpha.
B. Lỗi beta.
C. Mức ý nghĩa.
D. Công suất kiểm định.
133. Khi nào thì nên sử dụng kiểm định phi tham số thay vì kiểm định tham số?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi giả định về phân phối của dữ liệu không được đáp ứng.
D. Khi phương sai của quần thể đã biết.
134. Khi nào thì nên sử dụng kiểm định t thay vì kiểm định z?
A. Khi kích thước mẫu lớn (n > 30).
B. Khi phương sai của quần thể đã biết.
C. Khi kích thước mẫu nhỏ (n < 30) và phương sai của quần thể chưa biết.
D. Khi dữ liệu tuân theo phân phối chuẩn.
135. Ý nghĩa của thống kê kiểm định trong kiểm định giả thuyết là gì?
A. Đo lường sự khác biệt giữa dữ liệu mẫu và giả thuyết null.
B. Xác định mức ý nghĩa của kiểm định.
C. Ước lượng giá trị của tham số quần thể.
D. Xác định kích thước mẫu cần thiết.
136. Điều gì xảy ra với độ rộng của khoảng tin cậy khi kích thước mẫu tăng?
A. Độ rộng tăng.
B. Độ rộng giảm.
C. Độ rộng không đổi.
D. Độ rộng có thể tăng hoặc giảm tùy thuộc vào dữ liệu.
137. Khi nào thì nên sử dụng kiểm định Mann-Whitney U?
A. Để so sánh trung bình của hai mẫu độc lập khi dữ liệu tuân theo phân phối chuẩn.
B. Để so sánh trung bình của hai mẫu phụ thuộc khi dữ liệu không tuân theo phân phối chuẩn.
C. Để so sánh trung vị của hai mẫu độc lập khi dữ liệu không tuân theo phân phối chuẩn.
D. Để so sánh phương sai của hai mẫu độc lập.
138. Giá trị p trong kiểm định giả thuyết biểu thị điều gì?
A. Xác suất giả thuyết null là đúng.
B. Mức ý nghĩa của kiểm định.
C. Xác suất thu được kết quả như quan sát hoặc cực đoan hơn nếu giả thuyết null là đúng.
D. Xác suất mắc sai lầm loại II.
139. Ý nghĩa của mức ý nghĩa (alpha) trong kiểm định giả thuyết là gì?
A. Xác suất mắc sai lầm loại II.
B. Xác suất chấp nhận giả thuyết null khi nó sai.
C. Xác suất bác bỏ giả thuyết null khi nó đúng.
D. Xác suất giả thuyết null là đúng.
140. Thống kê nào được sử dụng để đo lường độ lệch của phân phối dữ liệu so với phân phối chuẩn?
A. Phương sai.
B. Độ lệch chuẩn.
C. Độ xiên (Skewness).
D. Kurtosis.
141. Trong kiểm định khi bình phương, cái gì được so sánh?
A. Trung bình mẫu và trung bình quần thể.
B. Tần số quan sát được và tần số kỳ vọng.
C. Phương sai mẫu và phương sai quần thể.
D. Tỷ lệ mẫu và tỷ lệ quần thể.
142. Mục đích của việc chuẩn hóa dữ liệu là gì?
A. Giảm kích thước mẫu.
B. Thay đổi hình dạng phân phối dữ liệu.
C. Chuyển đổi dữ liệu về cùng một thang đo.
D. Loại bỏ các giá trị ngoại lệ.
143. Phân tích nhân tố (factor analysis) được sử dụng để làm gì?
A. Dự đoán giá trị của một biến dựa trên các biến khác.
B. Xác định các yếu tố tiềm ẩn giải thích sự tương quan giữa các biến quan sát được.
C. So sánh trung bình của các nhóm.
D. Phân nhóm các đối tượng tương tự thành các cụm.
144. Phương pháp nào được sử dụng để giảm số lượng biến trong một tập dữ liệu trong khi vẫn giữ lại phần lớn thông tin?
A. Phân tích hồi quy.
B. Phân tích phương sai (ANOVA).
C. Phân tích thành phần chính (Principal Component Analysis).
D. Kiểm định khi bình phương.
145. Khi nào thì nên sử dụng kiểm định Kruskal-Wallis?
A. Để so sánh trung bình của hai mẫu độc lập khi dữ liệu tuân theo phân phối chuẩn.
B. Để so sánh trung vị của ba hoặc nhiều hơn mẫu độc lập khi dữ liệu không tuân theo phân phối chuẩn.
C. Để so sánh trung bình của hai mẫu phụ thuộc khi dữ liệu không tuân theo phân phối chuẩn.
D. Để so sánh phương sai của hai mẫu độc lập.
146. Trong kiểm định giả thuyết, điều gì xảy ra nếu giá trị p nhỏ hơn mức ý nghĩa (alpha)?
A. Chấp nhận giả thuyết null.
B. Bác bỏ giả thuyết null.
C. Không thể đưa ra kết luận.
D. Cần tăng kích thước mẫu.
147. Trong kiểm định giả thuyết, sai lầm loại I xảy ra khi nào?
A. Bác bỏ giả thuyết null khi nó thực sự đúng.
B. Chấp nhận giả thuyết null khi nó thực sự sai.
C. Không bác bỏ giả thuyết null khi nó thực sự đúng.
D. Bác bỏ giả thuyết null khi nó thực sự sai.
148. Phương pháp nào được sử dụng để kiểm tra tính dừng của chuỗi thời gian?
A. Phân tích hồi quy.
B. Kiểm định Dickey-Fuller.
C. Phân tích phương sai (ANOVA).
D. Kiểm định khi bình phương.
149. Trong phân tích cụm (cluster analysis), mục tiêu là gì?
A. Dự đoán giá trị của một biến dựa trên các biến khác.
B. Phân nhóm các đối tượng tương tự thành các cụm.
C. Kiểm tra sự khác biệt giữa các trung bình của các nhóm.
D. Đo lường mối quan hệ tuyến tính giữa hai biến.
150. Khoảng dự đoán (prediction interval) khác với khoảng tin cậy (confidence interval) như thế nào?
A. Khoảng dự đoán hẹp hơn khoảng tin cậy.
B. Khoảng tin cậy dùng để ước lượng tham số quần thể, khoảng dự đoán dùng để dự đoán giá trị của một quan sát đơn lẻ.
C. Khoảng tin cậy dùng cho mẫu nhỏ, khoảng dự đoán dùng cho mẫu lớn.
D. Khoảng tin cậy và khoảng dự đoán là giống nhau.