1. Khi nào nên sử dụng kiểm định Wilcoxon signed-rank test?
A. Để so sánh trung bình của hai mẫu độc lập.
B. Để so sánh trung bình của hai mẫu liên quan khi dữ liệu không tuân theo phân phối chuẩn.
C. Để kiểm tra tính độc lập giữa hai biến định tính.
D. Để phân tích phương sai.
2. Trong phân tích hồi quy, sai số chuẩn của hệ số hồi quy (standard error of the regression coefficient) đo lường điều gì?
A. Mức độ phù hợp của mô hình với dữ liệu.
B. Độ chính xác của ước lượng hệ số hồi quy.
C. Tỷ lệ phương sai được giải thích bởi mô hình.
D. Mối quan hệ nhân quả giữa các biến.
3. Kiểm định giả thuyết một phía (one-tailed test) khác với kiểm định giả thuyết hai phía (two-tailed test) ở điểm nào?
A. Kiểm định một phía chỉ kiểm định cho một giá trị cụ thể.
B. Kiểm định một phía chỉ kiểm định cho một hướng (lớn hơn hoặc nhỏ hơn), trong khi kiểm định hai phía kiểm định cho cả hai hướng.
C. Kiểm định hai phía dễ bác bỏ giả thuyết H0 hơn.
D. Kiểm định một phía luôn cho kết quả chính xác hơn.
4. Trong phân tích chuỗi thời gian, thành phần nào sau đây biểu thị xu hướng dài hạn của dữ liệu?
A. Tính mùa vụ (seasonality).
B. Tính chu kỳ (cyclicality).
C. Xu hướng (trend).
D. Tính ngẫu nhiên (randomness).
5. Mức ý nghĩa (significance level) α thường được sử dụng trong kiểm định giả thuyết là bao nhiêu?
A. 0.01
B. 0.05
C. 0.10
D. Tất cả các đáp án trên đều có thể.
6. Ý nghĩa của việc thực hiện kiểm định hậu nghiệm (post-hoc test) trong ANOVA là gì?
A. Để xác định xem có sự khác biệt đáng kể giữa các nhóm hay không.
B. Để xác định cặp nhóm nào có sự khác biệt đáng kể sau khi đã bác bỏ giả thuyết H0 trong ANOVA.
C. Để kiểm tra các giả định của ANOVA.
D. Để tăng sức mạnh của kiểm định ANOVA.
7. Khi nào nên sử dụng kiểm định Chi-square?
A. Để so sánh trung bình của hai nhóm.
B. Để kiểm tra sự phù hợp của một phân phối lý thuyết với dữ liệu thực tế hoặc kiểm tra tính độc lập giữa các biến định tính.
C. Để dự đoán giá trị của một biến số.
D. Để phân tích phương sai.
8. Trong kiểm định giả thuyết, ‘vùng bác bỏ’ (rejection region) là gì?
A. Vùng chứa các giá trị mà nếu thống kê kiểm định rơi vào đó, chúng ta sẽ chấp nhận giả thuyết H0.
B. Vùng chứa các giá trị mà nếu thống kê kiểm định rơi vào đó, chúng ta sẽ bác bỏ giả thuyết H0.
C. Vùng chứa tất cả các giá trị có thể có của thống kê kiểm định.
D. Vùng chứa các giá trị p nhỏ hơn mức ý nghĩa α.
9. Khi nào nên sử dụng kiểm định Mann-Whitney U test?
A. Để so sánh trung bình của hai mẫu liên quan.
B. Để so sánh trung bình của hai mẫu độc lập khi dữ liệu không tuân theo phân phối chuẩn.
C. Để kiểm tra sự phù hợp của một phân phối.
D. Để phân tích phương sai.
10. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết H0 là đúng.
B. Xác suất mắc sai lầm loại II.
C. Xác suất quan sát được kết quả như hiện tại (hoặc cực đoan hơn) nếu H0 là đúng.
D. Mức ý nghĩa (significance level) của kiểm định.
11. Ý nghĩa của việc tăng kích thước mẫu trong kiểm định giả thuyết là gì?
A. Làm tăng xác suất mắc sai lầm loại I.
B. Làm giảm sức mạnh của kiểm định.
C. Làm giảm xác suất mắc sai lầm loại II và tăng sức mạnh của kiểm định.
D. Không ảnh hưởng đến kết quả kiểm định.
12. Ý nghĩa của ‘bậc tự do’ (degrees of freedom) trong thống kê là gì?
A. Số lượng biến trong một mô hình.
B. Số lượng quan sát trong một mẫu.
C. Số lượng giá trị trong tính toán cuối cùng của một thống kê có thể thay đổi tự do.
D. Mức ý nghĩa của kiểm định.
13. Sức mạnh của một kiểm định (power of a test) là gì?
A. Xác suất mắc sai lầm loại I.
B. Xác suất mắc sai lầm loại II.
C. Xác suất bác bỏ giả thuyết H0 khi nó sai (tức là phát hiện ra một hiệu ứng thực sự).
D. Mức ý nghĩa của kiểm định.
14. Khi nào nên sử dụng kiểm định phi tham số (non-parametric test)?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi các giả định của kiểm định tham số không được đáp ứng (ví dụ, dữ liệu không tuân theo phân phối chuẩn).
D. Khi muốn so sánh trung bình.
15. Khi thực hiện kiểm định t độc lập (independent t-test), giả định nào sau đây là quan trọng?
A. Dữ liệu phải tuân theo phân phối nhị thức.
B. Phương sai của hai nhóm phải bằng nhau (hoặc gần bằng).
C. Kích thước mẫu phải lớn hơn 30.
D. Các quan sát phải phụ thuộc lẫn nhau.
16. Trong thống kê, ‘phân phối lấy mẫu’ (sampling distribution) là gì?
A. Phân phối của dữ liệu trong một mẫu duy nhất.
B. Phân phối của tất cả các giá trị có thể có của một thống kê (ví dụ, trung bình mẫu) từ tất cả các mẫu có thể có cùng kích thước được lấy từ một quần thể.
C. Phân phối của quần thể gốc.
D. Phân phối của sai số.
17. Trong kiểm định giả thuyết, điều gì xảy ra khi giá trị p nhỏ hơn mức ý nghĩa α?
A. Chấp nhận giả thuyết H0.
B. Bác bỏ giả thuyết H0.
C. Không thể đưa ra kết luận.
D. Tăng kích thước mẫu.
18. Kiểm định Kolmogorov-Smirnov được sử dụng để làm gì?
A. So sánh trung bình của hai mẫu.
B. Kiểm tra xem một mẫu có tuân theo một phân phối cụ thể hay không.
C. Đo lường mối quan hệ giữa hai biến định tính.
D. Phân tích phương sai.
19. Phương pháp Bootstrap trong thống kê được sử dụng để làm gì?
A. Để ước lượng tham số của quần thể khi dữ liệu tuân theo phân phối chuẩn.
B. Để ước lượng sai số chuẩn và khoảng tin cậy bằng cách lấy mẫu lại từ dữ liệu hiện có.
C. Để kiểm tra tính độc lập giữa các biến.
D. Để giảm kích thước mẫu.
20. Trong phân tích phương sai (ANOVA), giả thuyết H0 thường là gì?
A. Tất cả các trung bình của các nhóm đều khác nhau.
B. Ít nhất một trung bình của các nhóm khác với các nhóm còn lại.
C. Tất cả các phương sai của các nhóm đều bằng nhau.
D. Tất cả các trung bình của các nhóm đều bằng nhau.
21. Khi so sánh hai phương sai, kiểm định nào thường được sử dụng?
A. Kiểm định t.
B. Kiểm định z.
C. Kiểm định F.
D. Kiểm định Chi-square.
22. Khi nào nên sử dụng kiểm định t (t-test) thay vì kiểm định z (z-test)?
A. Khi kích thước mẫu lớn (n > 30).
B. Khi độ lệch chuẩn của quần thể đã biết.
C. Khi kích thước mẫu nhỏ (n < 30) và độ lệch chuẩn của quần thể chưa biết.
D. Khi cần kiểm định phương sai.
23. Trong phân tích phương sai (ANOVA), ‘tổng bình phương giữa các nhóm’ (sum of squares between groups) đo lường điều gì?
A. Sự biến thiên trong mỗi nhóm.
B. Sự biến thiên giữa các nhóm.
C. Tổng sự biến thiên trong toàn bộ dữ liệu.
D. Sai số ngẫu nhiên.
24. Điều gì xảy ra với khoảng tin cậy khi tăng độ tin cậy (ví dụ, từ 95% lên 99%)?
A. Khoảng tin cậy hẹp hơn.
B. Khoảng tin cậy rộng hơn.
C. Khoảng tin cậy không thay đổi.
D. Không thể xác định.
25. Hệ số tương quan Pearson đo lường điều gì?
A. Mối quan hệ nhân quả giữa hai biến.
B. Mức độ liên kết tuyến tính giữa hai biến định lượng.
C. Mức độ liên kết phi tuyến tính giữa hai biến.
D. Sự khác biệt giữa trung bình của hai nhóm.
26. Trong kiểm định giả thuyết, sai lầm loại I (Type I error) xảy ra khi nào?
A. Chấp nhận giả thuyết H0 khi nó đúng.
B. Bác bỏ giả thuyết H0 khi nó sai.
C. Chấp nhận giả thuyết H0 khi nó sai.
D. Bác bỏ giả thuyết H0 khi nó đúng.
27. Trong phân tích hồi quy, nếu có hiện tượng đa cộng tuyến (multicollinearity), điều gì có thể xảy ra?
A. Các hệ số hồi quy trở nên ổn định hơn.
B. Các hệ số hồi quy trở nên không đáng tin cậy và khó diễn giải.
C. Giá trị R-squared tăng lên đáng kể.
D. Sai số chuẩn của ước lượng giảm xuống.
28. Sai lầm loại II (Type II error) xảy ra khi nào?
A. Bác bỏ giả thuyết H0 khi nó đúng.
B. Chấp nhận giả thuyết H0 khi nó đúng.
C. Bác bỏ giả thuyết H0 khi nó sai.
D. Chấp nhận giả thuyết H0 khi nó sai.
29. Trong hồi quy tuyến tính, hệ số xác định (R-squared) đo lường điều gì?
A. Mức độ quan hệ nhân quả giữa các biến.
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi biến độc lập.
C. Độ dốc của đường hồi quy.
D. Sai số chuẩn của ước lượng.
30. Trong phân tích chuỗi thời gian, ‘tự tương quan’ (autocorrelation) là gì?
A. Mối quan hệ giữa hai chuỗi thời gian khác nhau.
B. Mối quan hệ giữa các giá trị của cùng một chuỗi thời gian tại các thời điểm khác nhau.
C. Sự biến động ngẫu nhiên trong chuỗi thời gian.
D. Xu hướng dài hạn của chuỗi thời gian.
31. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết H0 là đúng.
B. Mức ý nghĩa (significance level) của kiểm định.
C. Xác suất mắc sai lầm loại II.
D. Xác suất quan sát được kết quả (hoặc kết quả cực đoan hơn) nếu giả thuyết H0 là đúng.
32. Khi nào thì nên sử dụng kiểm định Kruskal-Wallis test?
A. Để so sánh trung bình của hai nhóm độc lập.
B. Để so sánh trung bình của ba hoặc nhiều nhóm độc lập khi dữ liệu không tuân theo phân phối chuẩn.
C. Để so sánh trung bình của ba hoặc nhiều nhóm phụ thuộc khi dữ liệu tuân theo phân phối chuẩn.
D. Để kiểm tra sự độc lập giữa hai biến định tính.
33. Khi nào thì nên sử dụng kiểm định ANOVA hai yếu tố (two-way ANOVA)?
A. Khi muốn so sánh trung bình của hai nhóm.
B. Khi muốn kiểm tra sự độc lập giữa hai biến định tính.
C. Khi muốn phân tích ảnh hưởng của hai biến độc lập định tính lên một biến phụ thuộc định lượng.
D. Khi muốn phân tích mối quan hệ giữa hai biến định lượng.
34. Khi nào thì nên sử dụng kiểm định Friedman test?
A. Để so sánh trung bình của hai nhóm độc lập.
B. Để so sánh trung bình của ba hoặc nhiều nhóm độc lập.
C. Để so sánh trung bình của ba hoặc nhiều nhóm phụ thuộc khi dữ liệu không tuân theo phân phối chuẩn.
D. Để kiểm tra sự độc lập giữa hai biến định tính.
35. Mục đích chính của việc sử dụng kiểm định Chi-bình phương (Chi-square test) là gì?
A. So sánh trung bình của hai quần thể.
B. Kiểm tra sự độc lập giữa hai biến định tính.
C. Ước lượng khoảng tin cậy cho trung bình quần thể.
D. Phân tích phương sai giữa các nhóm.
36. Khi nào thì nên sử dụng kiểm định Mann-Whitney U test?
A. Để so sánh trung bình của hai mẫu độc lập khi dữ liệu tuân theo phân phối chuẩn.
B. Để so sánh trung bình của hai mẫu phụ thuộc khi dữ liệu không tuân theo phân phối chuẩn.
C. Để so sánh trung bình của hai mẫu độc lập khi dữ liệu không tuân theo phân phối chuẩn.
D. Để kiểm tra sự độc lập giữa hai biến định tính.
37. Trong phân tích sống sót (survival analysis), hàm sống sót (survival function) biểu thị điều gì?
A. Thời gian trung bình mà một đối tượng sống sót.
B. Xác suất một đối tượng sống sót qua một thời điểm nhất định.
C. Tỷ lệ đối tượng chết tại một thời điểm nhất định.
D. Tổng số đối tượng trong nghiên cứu.
38. Mục đích của việc chuẩn hóa dữ liệu (data normalization) là gì?
A. Để loại bỏ các giá trị ngoại lệ (outliers).
B. Để chuyển đổi dữ liệu về cùng một thang đo, thường là từ 0 đến 1.
C. Để làm cho dữ liệu tuân theo phân phối chuẩn.
D. Để mã hóa các biến định tính thành biến định lượng.
39. Trong kiểm định giả thuyết, mức ý nghĩa (significance level) thường được ký hiệu là α (alpha) đại diện cho điều gì?
A. Xác suất mắc sai lầm loại II.
B. Xác suất chấp nhận giả thuyết H0 khi nó thực sự đúng.
C. Xác suất bác bỏ giả thuyết H0 khi nó thực sự đúng (sai lầm loại I).
D. Xác suất bác bỏ giả thuyết H0 khi nó thực sự sai.
40. Trong phân tích hồi quy, hệ số xác định (R-squared) cho biết điều gì?
A. Mức độ quan hệ nhân quả giữa các biến.
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi các biến độc lập trong mô hình.
C. Độ dốc của đường hồi quy.
D. Sai số chuẩn của ước lượng.
41. Khoảng tin cậy (confidence interval) là gì?
A. Một khoảng giá trị mà chúng ta tin rằng chứa tham số quần thể với một mức độ tin cậy nhất định.
B. Một khoảng giá trị mà chúng ta chắc chắn chứa tham số quần thể.
C. Một khoảng giá trị được sử dụng để kiểm định giả thuyết.
D. Một khoảng giá trị đại diện cho sai số chuẩn.
42. Trong phân tích cụm (cluster analysis), mục tiêu chính là gì?
A. Dự đoán giá trị của một biến phụ thuộc.
B. Phân loại các đối tượng vào các nhóm dựa trên sự tương đồng của chúng.
C. Kiểm tra sự độc lập giữa hai biến.
D. Ước lượng khoảng tin cậy.
43. Khi nào thì nên sử dụng kiểm định Chi-bình phương tính độc lập (Chi-square test of independence)?
A. Để so sánh trung bình của hai nhóm độc lập.
B. Để kiểm tra xem một mẫu có tuân theo một phân phối cụ thể hay không.
C. Để xác định xem có mối quan hệ giữa hai biến định tính hay không.
D. Để ước lượng khoảng tin cậy cho một tỷ lệ.
44. Phương pháp nào sau đây thường được sử dụng để giảm số lượng biến trong một tập dữ liệu trong khi vẫn giữ lại phần lớn thông tin?
A. Phân tích hồi quy.
B. Phân tích phương sai (ANOVA).
C. Phân tích thành phần chính (Principal Component Analysis – PCA).
D. Kiểm định Chi-bình phương.
45. Kiểm định Kolmogorov-Smirnov được sử dụng để làm gì?
A. So sánh trung bình của hai mẫu.
B. Kiểm tra xem một mẫu có tuân theo một phân phối cụ thể hay không.
C. Kiểm tra sự độc lập giữa hai biến định tính.
D. Ước lượng khoảng tin cậy.
46. Ý nghĩa của việc kiểm định một đuôi (one-tailed test) so với kiểm định hai đuôi (two-tailed test) là gì?
A. Kiểm định một đuôi luôn cho kết quả chính xác hơn kiểm định hai đuôi.
B. Kiểm định một đuôi chỉ được sử dụng khi kích thước mẫu lớn.
C. Kiểm định một đuôi được sử dụng khi chúng ta chỉ quan tâm đến sự khác biệt theo một hướng cụ thể.
D. Kiểm định hai đuôi được sử dụng khi chúng ta có giả thuyết cụ thể về hướng của sự khác biệt.
47. Sai lầm loại II (Type II error) trong kiểm định giả thuyết xảy ra khi nào?
A. Bác bỏ giả thuyết H0 khi nó thực sự đúng.
B. Chấp nhận giả thuyết H0 khi nó thực sự đúng.
C. Bác bỏ giả thuyết H0 khi nó thực sự sai.
D. Chấp nhận giả thuyết H0 khi nó thực sự sai.
48. Trong kiểm định giả thuyết, sai lầm loại I (Type I error) xảy ra khi nào?
A. Chấp nhận giả thuyết H0 khi nó thực sự đúng.
B. Bác bỏ giả thuyết H0 khi nó thực sự sai.
C. Chấp nhận giả thuyết H0 khi nó thực sự sai.
D. Bác bỏ giả thuyết H0 khi nó thực sự đúng.
49. Trong phân tích hồi quy tuyến tính, hệ số chặn (intercept) đại diện cho điều gì?
A. Sự thay đổi trung bình của biến phụ thuộc khi biến độc lập tăng một đơn vị.
B. Giá trị dự đoán của biến phụ thuộc khi tất cả các biến độc lập bằng 0.
C. Độ mạnh của mối quan hệ giữa biến độc lập và biến phụ thuộc.
D. Sai số chuẩn của ước lượng.
50. Điều gì xảy ra với độ rộng của khoảng tin cậy khi kích thước mẫu tăng lên?
A. Độ rộng của khoảng tin cậy tăng lên.
B. Độ rộng của khoảng tin cậy giảm xuống.
C. Độ rộng của khoảng tin cậy không đổi.
D. Không thể xác định được sự thay đổi.
51. Khi nào thì nên sử dụng kiểm định t (t-test) thay vì kiểm định z (z-test) để so sánh trung bình của hai mẫu?
A. Khi kích thước mẫu lớn (n > 30) và độ lệch chuẩn của quần thể đã biết.
B. Khi kích thước mẫu nhỏ (n < 30) và độ lệch chuẩn của quần thể đã biết.
C. Khi kích thước mẫu lớn (n > 30) và độ lệch chuẩn của quần thể chưa biết.
D. Khi kích thước mẫu nhỏ (n < 30) và độ lệch chuẩn của quần thể chưa biết.
52. Khi nào thì nên sử dụng kiểm định phi tham số (non-parametric test) thay vì kiểm định tham số (parametric test)?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn (n > 30).
C. Khi các giả định của kiểm định tham số không được đáp ứng.
D. Khi muốn ước lượng khoảng tin cậy.
53. Thống kê nào được sử dụng để đo lường độ lệch của một phân phối so với phân phối chuẩn?
A. Phương sai.
B. Độ lệch chuẩn.
C. Skewness (Độ lệch).
D. Kurtosis (Độ nhọn).
54. Khi nào thì nên sử dụng kiểm định Wilcoxon signed-rank test?
A. Để so sánh trung bình của hai mẫu độc lập khi dữ liệu tuân theo phân phối chuẩn.
B. Để so sánh trung bình của hai mẫu phụ thuộc khi dữ liệu không tuân theo phân phối chuẩn.
C. Để so sánh trung bình của hai mẫu độc lập khi dữ liệu không tuân theo phân phối chuẩn.
D. Để kiểm tra sự độc lập giữa hai biến định tính.
55. Trong phân tích hồi quy logistic, biến phụ thuộc (dependent variable) có đặc điểm gì?
A. Là một biến định lượng liên tục.
B. Là một biến định tính có hai giá trị (nhị phân).
C. Là một biến định tính có nhiều hơn hai giá trị.
D. Là một biến thứ bậc.
56. Trong phân tích chuỗi thời gian (time series analysis), thành phần xu hướng (trend) thể hiện điều gì?
A. Sự biến động ngắn hạn và ngẫu nhiên.
B. Sự biến động theo mùa.
C. Sự biến động dài hạn và có hệ thống.
D. Sự biến động theo chu kỳ kinh tế.
57. Trong phân tích phương sai (ANOVA), yếu tố (factor) là gì?
A. Một biến số định lượng được đo lường.
B. Một biến số định tính được sử dụng để phân loại các nhóm.
C. Tổng bình phương sai số.
D. Trung bình của tất cả các quan sát.
58. Hệ số tương quan (correlation coefficient) đo lường điều gì?
A. Mức độ biến động của dữ liệu.
B. Mức độ quan hệ tuyến tính giữa hai biến.
C. Mức độ quan hệ phi tuyến tính giữa hai biến.
D. Mức độ quan hệ nhân quả giữa hai biến.
59. Trong phân tích hồi quy đa biến (multiple regression), hiện tượng đa cộng tuyến (multicollinearity) xảy ra khi nào?
A. Khi biến phụ thuộc có tương quan cao với chính nó.
B. Khi các biến độc lập có tương quan cao với nhau.
C. Khi mô hình hồi quy không phù hợp với dữ liệu.
D. Khi có quá nhiều biến độc lập trong mô hình.
60. Trong phân tích phương sai (ANOVA), thống kê F (F-statistic) được sử dụng để làm gì?
A. So sánh trung bình của hai nhóm.
B. Kiểm tra sự độc lập giữa hai biến.
C. So sánh phương sai giữa các nhóm với phương sai trong mỗi nhóm.
D. Ước lượng khoảng tin cậy.
61. Kiểm định Kolmogorov-Smirnov được sử dụng để làm gì?
A. So sánh trung bình của hai mẫu.
B. Kiểm tra xem một mẫu có tuân theo một phân phối cụ thể hay không.
C. Kiểm tra sự độc lập giữa hai biến định tính.
D. Phân tích phương sai.
62. Nếu giá trị p nhỏ hơn mức ý nghĩa (alpha), chúng ta nên làm gì?
A. Chấp nhận giả thuyết H0.
B. Không đưa ra kết luận.
C. Bác bỏ giả thuyết H0.
D. Tăng kích thước mẫu.
63. Tại sao cần kiểm tra các giả định của một kiểm định thống kê trước khi sử dụng nó?
A. Để làm cho kết quả trông đẹp hơn.
B. Để đảm bảo rằng kiểm định được sử dụng là phù hợp và kết quả là hợp lệ.
C. Để tiết kiệm thời gian.
D. Các giả định không quan trọng.
64. Lỗi loại II (Type II error) trong kiểm định giả thuyết xảy ra khi nào?
A. Bác bỏ giả thuyết H0 khi nó thực sự đúng.
B. Chấp nhận giả thuyết H0 khi nó thực sự đúng.
C. Bác bỏ giả thuyết H0 khi nó thực sự sai.
D. Chấp nhận giả thuyết H0 khi nó thực sự sai.
65. Giả thuyết H1 (alternative hypothesis) là gì?
A. Giả thuyết mà chúng ta cố gắng chứng minh.
B. Giả thuyết mặc định được cho là đúng.
C. Giả thuyết luôn bị bác bỏ.
D. Giả thuyết không thể kiểm định.
66. Khi nào nên sử dụng kiểm định ANOVA hai yếu tố (two-way ANOVA)?
A. Khi so sánh trung bình của hai nhóm.
B. Khi phân tích ảnh hưởng của hai biến độc lập phân loại lên một biến phụ thuộc liên tục.
C. Khi kiểm tra sự độc lập giữa hai biến định tính.
D. Khi phân tích một biến độc lập lên nhiều biến phụ thuộc.
67. Trong ANOVA, ‘treatment’ (xử lý) đề cập đến điều gì?
A. Biến phụ thuộc.
B. Các cấp độ khác nhau của yếu tố (biến độc lập).
C. Sai số ngẫu nhiên.
D. Tổng bình phương.
68. Khi nào nên sử dụng kiểm định Chi-square?
A. Khi so sánh trung bình của hai mẫu độc lập.
B. Khi so sánh phương sai của hai mẫu.
C. Khi kiểm tra sự độc lập giữa hai biến định tính.
D. Khi phân tích phương sai.
69. Trong kiểm định giả thuyết, điều gì xảy ra nếu bạn giảm mức ý nghĩa (alpha)?
A. Tăng nguy cơ mắc lỗi loại I và giảm nguy cơ mắc lỗi loại II.
B. Giảm nguy cơ mắc lỗi loại I và tăng nguy cơ mắc lỗi loại II.
C. Tăng cả nguy cơ mắc lỗi loại I và loại II.
D. Giảm cả nguy cơ mắc lỗi loại I và loại II.
70. Kiểm định Mann-Whitney U được sử dụng để làm gì?
A. So sánh trung bình của hai mẫu phụ thuộc.
B. So sánh trung bình của hai mẫu độc lập khi dữ liệu không tuân theo phân phối chuẩn.
C. Kiểm tra sự độc lập giữa hai biến định tính.
D. Phân tích phương sai.
71. Nếu bạn thực hiện nhiều kiểm định t (ví dụ: so sánh trung bình của nhiều cặp nhóm), bạn cần điều chỉnh mức ý nghĩa (alpha) để tránh điều gì?
A. Lỗi loại II.
B. Lạm phát Lỗi loại I.
C. Giảm sức mạnh của kiểm định.
D. Tăng giá trị p.
72. Khi nào nên sử dụng kiểm định Kruskal-Wallis?
A. Khi so sánh trung bình của hai mẫu.
B. Khi so sánh trung bình của ba hoặc nhiều hơn các nhóm độc lập khi dữ liệu không tuân theo phân phối chuẩn.
C. Khi kiểm tra sự độc lập giữa hai biến định tính.
D. Khi phân tích phương sai.
73. Trong kiểm định giả thuyết, mức ý nghĩa (alpha) thể hiện điều gì?
A. Xác suất mắc lỗi loại II (chấp nhận H0 sai).
B. Xác suất bác bỏ giả thuyết H0 khi nó thực sự đúng.
C. Xác suất chấp nhận giả thuyết H0 khi nó thực sự đúng.
D. Xác suất bác bỏ giả thuyết H0 khi nó thực sự sai.
74. Điều gì xảy ra với sức mạnh của kiểm định (power) khi kích thước mẫu tăng lên?
A. Sức mạnh của kiểm định giảm xuống.
B. Sức mạnh của kiểm định tăng lên.
C. Sức mạnh của kiểm định không đổi.
D. Không thể xác định.
75. Mục đích chính của việc kiểm định giả thuyết là gì?
A. Ước lượng giá trị của tham số tổng thể.
B. Thu thập dữ liệu.
C. Đưa ra quyết định về một giả thuyết dựa trên bằng chứng mẫu.
D. Tính toán thống kê mô tả.
76. Kiểm định Shapiro-Wilk được sử dụng để làm gì?
A. So sánh trung bình của hai mẫu.
B. Kiểm tra xem dữ liệu có tuân theo phân phối chuẩn hay không.
C. Kiểm tra sự độc lập giữa hai biến định tính.
D. Phân tích phương sai.
77. Trong phân tích ANOVA, ‘Mean Square’ (MS) được tính như thế nào?
A. Tổng bình phương (SS) nhân với bậc tự do (df).
B. Tổng bình phương (SS) chia cho bậc tự do (df).
C. Căn bậc hai của tổng bình phương (SS).
D. Bậc tự do (df) chia cho tổng bình phương (SS).
78. Khi nào nên sử dụng kiểm định t một mẫu?
A. Khi so sánh trung bình của hai mẫu độc lập với phương sai bằng nhau.
B. Khi so sánh trung bình của một mẫu với một giá trị đã biết.
C. Khi so sánh phương sai của hai mẫu.
D. Khi phân tích sự khác biệt giữa các nhóm trong ANOVA.
79. Trong kiểm định giả thuyết, ‘power’ (sức mạnh) của kiểm định là gì?
A. Xác suất mắc lỗi loại I.
B. Xác suất mắc lỗi loại II.
C. Xác suất bác bỏ giả thuyết H0 khi nó thực sự sai.
D. Xác suất chấp nhận giả thuyết H0 khi nó thực sự đúng.
80. Khi nào nên sử dụng kiểm định Wilcoxon signed-rank?
A. Khi so sánh trung bình của hai mẫu độc lập.
B. Khi so sánh trung bình của hai mẫu phụ thuộc (paired) mà dữ liệu không tuân theo phân phối chuẩn.
C. Khi kiểm tra sự độc lập giữa hai biến định tính.
D. Khi phân tích phương sai.
81. Khi nào nên sử dụng kiểm định z?
A. Khi kích thước mẫu nhỏ (n < 30) và độ lệch chuẩn tổng thể chưa biết.
B. Khi kích thước mẫu lớn (n >= 30) và độ lệch chuẩn tổng thể đã biết.
C. Khi so sánh trung bình của hai mẫu phụ thuộc.
D. Khi kiểm tra sự độc lập giữa hai biến định tính.
82. Giả sử bạn đang so sánh hiệu quả của ba phương pháp điều trị khác nhau (A, B, C) trên cùng một nhóm bệnh nhân. Kiểm định nào phù hợp nhất?
A. ANOVA một yếu tố.
B. ANOVA lặp lại (Repeated Measures ANOVA).
C. Kiểm định Chi-square.
D. Kiểm định t độc lập.
83. Khi nào nên sử dụng kiểm định Friedman?
A. Khi so sánh trung bình của hai mẫu.
B. Khi so sánh trung bình của ba hoặc nhiều hơn các nhóm liên quan (repeated measures) khi dữ liệu không tuân theo phân phối chuẩn.
C. Khi kiểm tra sự độc lập giữa hai biến định tính.
D. Khi phân tích phương sai.
84. Trong kiểm định giả thuyết, ‘bậc tự do’ (degrees of freedom) là gì?
A. Số lượng quan sát trong mẫu.
B. Số lượng tham số được ước tính.
C. Số lượng quan sát độc lập trong mẫu có sẵn để ước tính các tham số.
D. Mức ý nghĩa.
85. Ý nghĩa của việc ‘điều chỉnh Bonferroni’ trong kiểm định đa giả thuyết là gì?
A. Để tăng sức mạnh của kiểm định.
B. Để kiểm soát tỷ lệ lỗi loại I tổng thể khi thực hiện nhiều kiểm định.
C. Để giảm kích thước mẫu cần thiết.
D. Để đơn giản hóa các tính toán.
86. Kiểm định nào được sử dụng để so sánh tần số quan sát được với tần số kỳ vọng trong một hoặc nhiều danh mục?
A. Kiểm định t.
B. Kiểm định z.
C. Kiểm định Chi-square goodness-of-fit.
D. Kiểm định ANOVA.
87. Trong phân tích phương sai (ANOVA), yếu tố (factor) là gì?
A. Biến phụ thuộc.
B. Biến độc lập phân loại.
C. Biến độc lập liên tục.
D. Sai số ngẫu nhiên.
88. Trong kiểm định giả thuyết, vùng bác bỏ (rejection region) là gì?
A. Tập hợp các giá trị mà nếu thống kê kiểm định rơi vào đó, chúng ta chấp nhận H0.
B. Tập hợp các giá trị mà nếu thống kê kiểm định rơi vào đó, chúng ta bác bỏ H0.
C. Kích thước mẫu.
D. Mức ý nghĩa.
89. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết H0 là đúng.
B. Xác suất thu được kết quả như quan sát hoặc cực đoan hơn, giả sử H0 là đúng.
C. Mức ý nghĩa của kiểm định.
D. Kích thước của mẫu.
90. Kiểm định giả thuyết nào phù hợp để so sánh trung bình của hai mẫu độc lập khi phương sai của chúng không bằng nhau?
A. Kiểm định t Student.
B. Kiểm định t Welch.
C. Kiểm định z.
D. Kiểm định Chi-square.
91. Kiểm định một phía (one-tailed test) được sử dụng khi nào?
A. Khi chúng ta quan tâm đến sự khác biệt theo cả hai hướng (lớn hơn hoặc nhỏ hơn).
B. Khi chúng ta chỉ quan tâm đến sự khác biệt theo một hướng cụ thể (lớn hơn hoặc nhỏ hơn).
C. Khi chúng ta không có giả thuyết cụ thể về hướng của sự khác biệt.
D. Khi chúng ta muốn kiểm tra xem hai quần thể có bằng nhau hay không.
92. Mức ý nghĩa (Significance level) trong kiểm định giả thuyết thường được ký hiệu là gì?
93. Công suất kiểm định (Power of a test) là gì?
A. Xác suất mắc phải sai lầm loại I.
B. Xác suất mắc phải sai lầm loại II.
C. Xác suất bác bỏ giả thuyết null khi nó thực sự sai.
D. Xác suất chấp nhận giả thuyết null khi nó thực sự đúng.
94. Khi nào thì việc sử dụng kiểm định Kruskal-Wallis test là phù hợp?
A. Khi chúng ta muốn so sánh trung bình của hai nhóm độc lập.
B. Khi chúng ta muốn so sánh trung bình của ba hoặc nhiều hơn nhóm độc lập và dữ liệu không tuân theo phân phối chuẩn.
C. Khi chúng ta muốn so sánh phương sai của hai nhóm.
D. Khi chúng ta muốn kiểm định sự độc lập giữa hai biến định tính.
95. Trong kiểm định giả thuyết về phương sai của một quần thể, chúng ta sử dụng phân phối nào?
A. Phân phối z.
B. Phân phối t.
C. Phân phối Chi bình phương (χ²).
D. Phân phối F.
96. Yếu tố nào sau đây không ảnh hưởng đến công suất kiểm định?
A. Kích thước mẫu.
B. Mức ý nghĩa α.
C. Độ lớn của hiệu ứng thực sự.
D. Màu sắc của biểu đồ.
97. Trong kiểm định giả thuyết về tỷ lệ của một quần thể, chúng ta thường sử dụng phân phối nào?
A. Phân phối t.
B. Phân phối Chi bình phương (χ²).
C. Phân phối F.
D. Phân phối z.
98. Trong kiểm định giả thuyết, điều gì xảy ra khi chúng ta tăng kích thước mẫu?
A. Giảm công suất kiểm định.
B. Tăng xác suất mắc phải sai lầm loại I.
C. Tăng công suất kiểm định.
D. Giảm mức ý nghĩa α.
99. Trong kiểm định giả thuyết về trung bình của một quần thể, khi nào chúng ta sử dụng phân phối t (t-distribution) thay vì phân phối z (z-distribution)?
A. Khi kích thước mẫu lớn (n > 30) và độ lệch chuẩn quần thể đã biết.
B. Khi kích thước mẫu nhỏ (n < 30) và độ lệch chuẩn quần thể đã biết.
C. Khi kích thước mẫu nhỏ (n < 30) và độ lệch chuẩn quần thể chưa biết.
D. Khi kích thước mẫu lớn (n > 30) và độ lệch chuẩn quần thể chưa biết.
100. Trong kiểm định giả thuyết, một thống kê kiểm định (test statistic) được sử dụng để làm gì?
A. Ước lượng tham số quần thể.
B. Tính toán giá trị p.
C. Đo lường mức độ phù hợp của dữ liệu với giả thuyết null.
D. Xác định kích thước mẫu cần thiết.
101. Giá trị p (p-value) là gì trong kiểm định giả thuyết?
A. Xác suất bác bỏ giả thuyết thay thế khi nó đúng.
B. Xác suất quan sát được kết quả kiểm định (hoặc kết quả cực đoan hơn) nếu giả thuyết null là đúng.
C. Xác suất chấp nhận giả thuyết null khi nó sai.
D. Xác suất chấp nhận giả thuyết thay thế khi nó đúng.
102. Nếu giá trị p từ kiểm định ANOVA nhỏ hơn mức ý nghĩa α, chúng ta kết luận điều gì?
A. Chấp nhận giả thuyết null, nghĩa là tất cả các trung bình quần thể đều bằng nhau.
B. Bác bỏ giả thuyết null, nghĩa là có ít nhất một trung bình quần thể khác với các trung bình còn lại.
C. Không có đủ bằng chứng để kết luận về sự khác biệt giữa các trung bình.
D. Phương sai của các quần thể là bằng nhau.
103. Giả thuyết null trong ANOVA thường là gì?
A. Tất cả các trung bình quần thể đều khác nhau.
B. Ít nhất một trung bình quần thể khác với các trung bình còn lại.
C. Tất cả các trung bình quần thể đều bằng nhau.
D. Tất cả các phương sai quần thể đều bằng nhau.
104. Khi nào thì việc sử dụng kiểm định phi tham số (non-parametric test) là phù hợp?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc kích thước mẫu nhỏ.
D. Khi chúng ta muốn so sánh trung bình của hai quần thể.
105. Khi nào thì việc sử dụng kiểm định t ghép cặp (paired t-test) là phù hợp?
A. Khi chúng ta muốn so sánh trung bình của hai nhóm độc lập.
B. Khi chúng ta muốn so sánh trung bình của hai nhóm có liên quan (ví dụ: trước và sau can thiệp).
C. Khi chúng ta muốn so sánh phương sai của hai nhóm.
D. Khi chúng ta muốn kiểm định sự độc lập giữa hai biến định tính.
106. Điều gì xảy ra với độ rộng của khoảng tin cậy (confidence interval) khi chúng ta tăng mức độ tin cậy (confidence level)?
A. Độ rộng của khoảng tin cậy giảm.
B. Độ rộng của khoảng tin cậy tăng.
C. Độ rộng của khoảng tin cậy không đổi.
D. Độ rộng của khoảng tin cậy trở nên âm.
107. Trong kiểm định giả thuyết, điều gì xảy ra nếu chúng ta giảm mức ý nghĩa α?
A. Tăng xác suất mắc phải sai lầm loại I và giảm xác suất mắc phải sai lầm loại II.
B. Giảm xác suất mắc phải sai lầm loại I và tăng xác suất mắc phải sai lầm loại II.
C. Tăng cả xác suất mắc phải sai lầm loại I và sai lầm loại II.
D. Giảm cả xác suất mắc phải sai lầm loại I và sai lầm loại II.
108. Trong kiểm định giả thuyết, ‘vùng bác bỏ’ (rejection region) là gì?
A. Tập hợp các giá trị thống kê kiểm định mà nếu giá trị thống kê rơi vào đó, chúng ta chấp nhận giả thuyết null.
B. Tập hợp các giá trị thống kê kiểm định mà nếu giá trị thống kê rơi vào đó, chúng ta bác bỏ giả thuyết null.
C. Tập hợp tất cả các giá trị có thể của thống kê kiểm định.
D. Vùng xung quanh giá trị trung bình của phân phối.
109. Trong kiểm định giả thuyết, sai lầm loại I (Type I error) xảy ra khi nào?
A. Chấp nhận giả thuyết null khi nó thực sự đúng.
B. Bác bỏ giả thuyết null khi nó thực sự sai.
C. Bác bỏ giả thuyết null khi nó thực sự đúng.
D. Chấp nhận giả thuyết null khi nó thực sự sai.
110. Khi nào thì việc sử dụng kiểm định Wilcoxon signed-rank test là phù hợp?
A. Khi chúng ta muốn so sánh trung bình của hai nhóm độc lập.
B. Khi chúng ta muốn so sánh trung bình của hai nhóm có liên quan (ví dụ: trước và sau can thiệp) và dữ liệu không tuân theo phân phối chuẩn.
C. Khi chúng ta muốn so sánh phương sai của hai nhóm.
D. Khi chúng ta muốn kiểm định sự độc lập giữa hai biến định tính.
111. Kiểm định Chi bình phương (χ²) thường được sử dụng để làm gì?
A. So sánh trung bình của hai quần thể.
B. So sánh phương sai của hai quần thể.
C. Kiểm định sự độc lập giữa hai biến định tính.
D. Kiểm định sự phù hợp của một phân phối.
112. ANOVA (Phân tích phương sai) được sử dụng để làm gì?
A. So sánh trung bình của hai quần thể.
B. So sánh phương sai của hai quần thể.
C. So sánh trung bình của ba hoặc nhiều hơn quần thể.
D. So sánh tỷ lệ của hai quần thể.
113. Bậc tự do (degrees of freedom) trong kiểm định Chi bình phương (χ²) cho bảng contingency r x c được tính như thế nào?
A. r + c – 1
B. r x c
C. (r – 1) x (c – 1)
D. r + c
114. Khi nào chúng ta bác bỏ giả thuyết null dựa trên giá trị p (p-value)?
A. Khi giá trị p lớn hơn mức ý nghĩa α.
B. Khi giá trị p bằng mức ý nghĩa α.
C. Khi giá trị p nhỏ hơn hoặc bằng mức ý nghĩa α.
D. Khi giá trị p lớn hơn 1 – α.
115. Ví dụ về một kiểm định phi tham số để so sánh hai nhóm độc lập là gì?
A. Kiểm định t (t-test).
B. ANOVA.
C. Kiểm định Mann-Whitney U.
D. Kiểm định Chi bình phương (χ²).
116. Điều gì xảy ra với công suất kiểm định khi độ lớn của hiệu ứng thực sự tăng lên?
A. Công suất kiểm định giảm.
B. Công suất kiểm định tăng.
C. Công suất kiểm định không đổi.
D. Công suất kiểm định trở nên âm.
117. Mối quan hệ giữa mức ý nghĩa α và xác suất mắc phải sai lầm loại I là gì?
A. Mức ý nghĩa α là xác suất mắc phải sai lầm loại I.
B. Mức ý nghĩa α là 1 trừ xác suất mắc phải sai lầm loại I.
C. Mức ý nghĩa α là xác suất mắc phải sai lầm loại II.
D. Mức ý nghĩa α không liên quan đến xác suất mắc phải sai lầm loại I.
118. Sai lầm loại II (Type II error) xảy ra khi nào?
A. Bác bỏ giả thuyết null khi nó thực sự đúng.
B. Chấp nhận giả thuyết null khi nó thực sự sai.
C. Bác bỏ giả thuyết null khi nó thực sự sai.
D. Chấp nhận giả thuyết null khi nó thực sự đúng.
119. Kiểm định F (F-test) thường được sử dụng để làm gì?
A. Kiểm định sự bằng nhau của hai trung bình.
B. Kiểm định sự bằng nhau của hai phương sai.
C. Kiểm định sự độc lập của hai biến định tính.
D. Kiểm định sự phù hợp của một phân phối.
120. Khoảng tin cậy (confidence interval) là gì?
A. Một giá trị duy nhất ước tính cho tham số quần thể.
B. Một khoảng giá trị mà chúng ta tin rằng chứa tham số quần thể với một độ tin cậy nhất định.
C. Xác suất mà tham số quần thể nằm trong một khoảng giá trị cụ thể.
D. Một kiểm định để bác bỏ giả thuyết null.
121. Trong kiểm định giả thuyết, sai lầm loại I (Type I error) xảy ra khi nào?
A. Chấp nhận giả thuyết H0 khi nó thực sự đúng.
B. Bác bỏ giả thuyết H0 khi nó thực sự sai.
C. Chấp nhận giả thuyết H0 khi nó thực sự sai.
D. Bác bỏ giả thuyết H0 khi nó thực sự đúng.
122. Trong phân tích hồi quy bội (multiple regression), hệ số hồi quy riêng phần (partial regression coefficient) cho biết điều gì?
A. Sự thay đổi của biến phụ thuộc khi tất cả các biến độc lập khác không đổi.
B. Sự thay đổi của biến phụ thuộc khi biến độc lập tương ứng tăng một đơn vị, giữ các biến độc lập khác không đổi.
C. Mức độ phù hợp của mô hình hồi quy.
D. Mức độ tương quan giữa các biến độc lập.
123. Nếu giá trị p (p-value) nhỏ hơn mức ý nghĩa (alpha), chúng ta nên làm gì?
A. Chấp nhận giả thuyết H0.
B. Bác bỏ giả thuyết H0.
C. Không đưa ra kết luận gì.
D. Tăng kích thước mẫu.
124. Bạn thu thập dữ liệu về chiều cao của sinh viên trong một trường đại học và nhận thấy rằng dữ liệu không tuân theo phân phối chuẩn. Kiểm định nào sau đây phù hợp nhất để so sánh chiều cao trung bình giữa sinh viên nam và nữ?
A. Kiểm định t (t-test) cho hai mẫu độc lập.
B. Kiểm định z (z-test) cho hai mẫu độc lập.
C. Kiểm định Mann-Whitney U test.
D. Phân tích phương sai (ANOVA).
125. Sức mạnh của kiểm định (power of the test) được định nghĩa là gì?
A. Xác suất mắc sai lầm loại I.
B. Xác suất mắc sai lầm loại II.
C. Xác suất bác bỏ giả thuyết H0 khi nó thực sự sai.
D. Xác suất chấp nhận giả thuyết H0 khi nó thực sự đúng.
126. Sai lầm loại II (Type II error) xảy ra khi nào?
A. Bác bỏ giả thuyết H0 khi nó thực sự đúng.
B. Chấp nhận giả thuyết H0 khi nó thực sự đúng.
C. Chấp nhận giả thuyết H0 khi nó thực sự sai.
D. Bác bỏ giả thuyết H0 khi nó thực sự sai.
127. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết H0 là đúng.
B. Xác suất mắc sai lầm loại II.
C. Xác suất quan sát được kết quả hiện tại (hoặc kết quả cực đoan hơn) nếu giả thuyết H0 là đúng.
D. Mức ý nghĩa (significance level) của kiểm định.
128. Giả sử bạn muốn kiểm tra xem có sự khác biệt về điểm trung bình của sinh viên giữa ba trường đại học khác nhau hay không. Kiểm định nào phù hợp nhất để sử dụng?
A. Kiểm định t (t-test).
B. Kiểm định z (z-test).
C. Phân tích phương sai (ANOVA).
D. Kiểm định Chi-bình phương (Chi-square test).
129. Trong ANOVA, thống kê F được tính như thế nào?
A. Tỷ lệ giữa phương sai giữa các nhóm và phương sai trong các nhóm.
B. Tỷ lệ giữa phương sai trong các nhóm và phương sai giữa các nhóm.
C. Tổng của phương sai giữa các nhóm và phương sai trong các nhóm.
D. Hiệu của phương sai giữa các nhóm và phương sai trong các nhóm.
130. Kiểm định giả thuyết hai đuôi (two-tailed test) được sử dụng khi nào?
A. Khi chỉ quan tâm đến sự khác biệt theo một hướng cụ thể (lớn hơn hoặc nhỏ hơn).
B. Khi quan tâm đến sự khác biệt theo cả hai hướng (lớn hơn hoặc nhỏ hơn).
C. Khi không có giả thuyết nào được đưa ra trước.
D. Khi kích thước mẫu nhỏ.
131. Trong kiểm định giả thuyết một đuôi (one-tailed test), vùng bác bỏ (rejection region) nằm ở đâu?
A. Chia đều ở cả hai phía của phân phối.
B. Tập trung ở một phía của phân phối.
C. Nằm ở giữa phân phối.
D. Không có vùng bác bỏ trong kiểm định một đuôi.
132. Khi nào nên sử dụng kiểm định F (F-test)?
A. Để so sánh trung bình của hai mẫu.
B. Để kiểm tra sự phù hợp của một phân phối.
C. Để so sánh phương sai của hai hay nhiều quần thể hoặc để phân tích phương sai (ANOVA).
D. Để kiểm tra tính độc lập giữa hai biến định tính.
133. Khi nào nên sử dụng kiểm định Chi-bình phương (Chi-square test)?
A. Để so sánh trung bình của hai mẫu.
B. Để kiểm tra sự phù hợp của một phân phối lý thuyết với dữ liệu thực tế hoặc kiểm tra tính độc lập giữa hai biến định tính.
C. Để ước lượng khoảng tin cậy cho trung bình.
D. Để phân tích phương sai giữa các nhóm.
134. Hệ quả của việc tăng kích thước mẫu trong kiểm định giả thuyết là gì?
A. Tăng xác suất mắc sai lầm loại I.
B. Giảm sức mạnh của kiểm định (power of the test).
C. Giảm xác suất mắc sai lầm loại II và tăng sức mạnh của kiểm định.
D. Không ảnh hưởng đến kết quả kiểm định.
135. Khi nào nên sử dụng kiểm định Kruskal-Wallis test?
A. Để so sánh trung bình của hai mẫu độc lập.
B. Để so sánh trung bình của ba mẫu trở lên khi dữ liệu tuân theo phân phối chuẩn.
C. Để so sánh trung bình của ba mẫu trở lên khi dữ liệu không tuân theo phân phối chuẩn.
D. Để kiểm tra tính độc lập giữa hai biến định tính.
136. Giả sử bạn muốn ước lượng tỷ lệ cử tri ủng hộ một ứng cử viên trong một cuộc bầu cử. Bạn nên sử dụng phương pháp nào?
A. Kiểm định t (t-test).
B. Phân tích phương sai (ANOVA).
C. Khoảng tin cậy cho tỷ lệ.
D. Kiểm định Chi-bình phương (Chi-square test).
137. Bạn muốn kiểm tra xem có mối liên hệ giữa giới tính (nam/nữ) và việc hút thuốc (có/không) hay không. Phương pháp thống kê nào phù hợp nhất?
A. Kiểm định t (t-test).
B. Phân tích hồi quy tuyến tính.
C. Kiểm định Chi-bình phương (Chi-square test).
D. Phân tích phương sai (ANOVA).
138. Điều gì xảy ra với sai số chuẩn (standard error) của trung bình mẫu khi tăng kích thước mẫu?
A. Sai số chuẩn tăng.
B. Sai số chuẩn giảm.
C. Sai số chuẩn không đổi.
D. Không thể xác định được sự thay đổi.
139. Trong kiểm định Chi-bình phương, bậc tự do (degrees of freedom) được tính như thế nào khi kiểm tra tính độc lập giữa hai biến định tính?
A. (Số hàng – 1) + (Số cột – 1).
B. (Số hàng – 1) * (Số cột – 1).
C. Số hàng * Số cột.
D. Tổng số quan sát – 1.
140. Khi nào nên sử dụng kiểm định Wilcoxon signed-rank test?
A. Để so sánh trung bình của hai mẫu độc lập khi dữ liệu tuân theo phân phối chuẩn.
B. Để so sánh trung bình của hai mẫu liên quan khi dữ liệu không tuân theo phân phối chuẩn.
C. Để kiểm tra tính độc lập giữa hai biến định tính.
D. Để so sánh phương sai của hai mẫu.
141. Điều gì xảy ra với độ rộng của khoảng tin cậy khi tăng mức độ tin cậy (confidence level)?
A. Độ rộng của khoảng tin cậy giảm.
B. Độ rộng của khoảng tin cậy tăng.
C. Độ rộng của khoảng tin cậy không đổi.
D. Không thể xác định được sự thay đổi.
142. Khoảng tin cậy 95% có nghĩa là gì?
A. Có 95% khả năng tham số quần thể nằm trong khoảng này.
B. Nếu lặp lại quá trình lấy mẫu nhiều lần, 95% các khoảng tin cậy được tạo ra sẽ chứa tham số quần thể thực sự.
C. Có 5% khả năng tham số quần thể không nằm trong khoảng này.
D. Tất cả các đáp án trên đều đúng.
143. Ý nghĩa của mức ý nghĩa (alpha) trong kiểm định giả thuyết là gì?
A. Xác suất chấp nhận giả thuyết H0 khi nó sai.
B. Xác suất bác bỏ giả thuyết H0 khi nó đúng (sai lầm loại I).
C. Xác suất bác bỏ giả thuyết H0 khi nó sai.
D. Xác suất chấp nhận giả thuyết H0 khi nó đúng.
144. Trong phân tích phương sai (ANOVA), giả thuyết H0 thường được phát biểu như thế nào?
A. Tất cả các trung bình của các nhóm đều khác nhau.
B. Ít nhất một trung bình của các nhóm khác biệt đáng kể.
C. Tất cả các trung bình của các nhóm đều bằng nhau.
D. Phương sai của tất cả các nhóm đều khác nhau.
145. Trong kiểm định giả thuyết, một kiểm định có ‘sức mạnh’ cao có nghĩa là gì?
A. Nó có khả năng cao mắc sai lầm loại I.
B. Nó có khả năng cao mắc sai lầm loại II.
C. Nó có khả năng cao bác bỏ giả thuyết H0 khi H0 thực sự sai.
D. Nó có khả năng cao chấp nhận giả thuyết H0 khi H0 thực sự đúng.
146. Trong hồi quy tuyến tính, hệ số chặn (intercept) biểu thị điều gì?
A. Sự thay đổi của biến phụ thuộc khi biến độc lập tăng một đơn vị.
B. Giá trị dự đoán của biến phụ thuộc khi tất cả các biến độc lập bằng 0.
C. Mức độ phù hợp của mô hình hồi quy.
D. Sai số chuẩn của các hệ số hồi quy.
147. Khi nào nên sử dụng kiểm định phi tham số (non-parametric test)?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi các giả định về phân phối của dữ liệu không được đáp ứng.
D. Khi cần tính toán trung bình.
148. Một nhà nghiên cứu tiến hành kiểm định giả thuyết và thu được giá trị p = 0.06. Nếu mức ý nghĩa (alpha) là 0.05, kết luận nào sau đây là đúng?
A. Bác bỏ giả thuyết H0.
B. Chấp nhận giả thuyết H0.
C. Không thể đưa ra kết luận gì.
D. Cần tăng kích thước mẫu.
149. Mục đích chính của việc xây dựng khoảng tin cậy (confidence interval) là gì?
A. Để kiểm định giả thuyết về một tham số của quần thể.
B. Để ước lượng một khoảng giá trị mà tham số của quần thể có khả năng nằm trong đó với một độ tin cậy nhất định.
C. Để xác định giá trị chính xác của tham số quần thể.
D. Để giảm sai số loại I trong kiểm định giả thuyết.
150. Khi nào nên sử dụng kiểm định t (t-test) thay vì kiểm định z (z-test) để so sánh trung bình của hai mẫu?
A. Khi kích thước mẫu lớn (n > 30).
B. Khi phương sai của quần thể đã biết.
C. Khi kích thước mẫu nhỏ (n < 30) và phương sai của quần thể chưa biết.
D. Khi so sánh trung bình của nhiều hơn hai mẫu.