1. Kiểm định giả thuyết một phía (one-tailed test) được sử dụng khi nào?
A. Khi ta chỉ quan tâm đến sự khác biệt theo một hướng cụ thể
B. Khi ta quan tâm đến sự khác biệt theo cả hai hướng
C. Khi kích thước mẫu nhỏ
D. Khi phương sai của tổng thể chưa biết
2. Khi nào nên sử dụng kiểm định Mann-Whitney U?
A. Khi muốn so sánh hai nhóm độc lập với dữ liệu không tuân theo phân phối chuẩn
B. Khi muốn so sánh hai nhóm liên quan với dữ liệu tuân theo phân phối chuẩn
C. Khi muốn kiểm tra sự độc lập giữa hai biến định tính
D. Khi muốn ước lượng tham số tổng thể
3. Đại lượng nào sau đây không phải là tham số đặc trưng cho một tổng thể?
A. Trung bình mẫu
B. Phương sai tổng thể
C. Trung bình tổng thể
D. Độ lệch chuẩn tổng thể
4. Ý nghĩa của hệ số tương quan (correlation coefficient) là gì?
A. Đo lường mức độ và hướng của mối quan hệ tuyến tính giữa hai biến
B. Đo lường sự khác biệt giữa hai trung bình
C. Đo lường phương sai của một biến
D. Đo lường độ tin cậy của một ước lượng
5. Khi nào nên sử dụng kiểm định t thay vì kiểm định z?
A. Khi kích thước mẫu nhỏ và phương sai tổng thể chưa biết
B. Khi kích thước mẫu lớn và phương sai tổng thể đã biết
C. Khi dữ liệu tuân theo phân phối chuẩn
D. Khi muốn so sánh hai trung bình mẫu
6. Phân phối t (t-distribution) khác với phân phối chuẩn (normal distribution) như thế nào?
A. Phân phối t có đuôi dày hơn và phụ thuộc vào bậc tự do
B. Phân phối t có đuôi mỏng hơn và không phụ thuộc vào bậc tự do
C. Phân phối t luôn đối xứng quanh 0
D. Phân phối t có phương sai bằng 1
7. Điều gì xảy ra với sai số chuẩn của trung bình khi kích thước mẫu tăng lên?
A. Sai số chuẩn giảm
B. Sai số chuẩn tăng
C. Sai số chuẩn không đổi
D. Không thể xác định
8. Trong hồi quy đa biến, biến nào được sử dụng để dự đoán biến phụ thuộc?
A. Biến độc lập
B. Biến phụ thuộc
C. Biến kiểm soát
D. Biến trung gian
9. Điều gì xảy ra với khoảng tin cậy khi mức độ tin cậy tăng lên, giả sử các yếu tố khác không đổi?
A. Độ rộng của khoảng tin cậy tăng
B. Độ rộng của khoảng tin cậy giảm
C. Độ rộng của khoảng tin cậy không đổi
D. Không thể xác định
10. Ước lượng điểm (point estimate) là gì?
A. Một giá trị duy nhất được sử dụng để ước lượng tham số tổng thể
B. Một khoảng giá trị được sử dụng để ước lượng tham số tổng thể
C. Một phương pháp để kiểm định giả thuyết
D. Một phương pháp để tính toán sai số chuẩn
11. Khi nào thì nên sử dụng kiểm định phi tham số?
A. Khi dữ liệu không tuân theo phân phối chuẩn hoặc khi kích thước mẫu nhỏ
B. Khi dữ liệu tuân theo phân phối chuẩn và kích thước mẫu lớn
C. Khi muốn ước lượng tham số tổng thể
D. Khi muốn so sánh hai trung bình mẫu
12. Chọn khẳng định đúng về mối quan hệ giữa sai số chuẩn và kích thước mẫu.
A. Sai số chuẩn giảm khi kích thước mẫu tăng.
B. Sai số chuẩn tăng khi kích thước mẫu tăng.
C. Sai số chuẩn không đổi khi kích thước mẫu tăng.
D. Không có mối quan hệ giữa sai số chuẩn và kích thước mẫu.
13. Kiểm định Kolmogorov-Smirnov được sử dụng để làm gì?
A. Kiểm tra xem một mẫu có tuân theo một phân phối cụ thể hay không
B. So sánh trung bình của hai nhóm
C. Kiểm tra sự độc lập giữa hai biến định tính
D. Ước lượng tham số tổng thể
14. Khi nào thì sử dụng kiểm định Chi-bình phương?
A. Để kiểm tra sự độc lập giữa hai biến định tính
B. Để so sánh trung bình của hai nhóm
C. Để kiểm tra phương sai của một tổng thể
D. Để ước lượng tham số tổng thể
15. Trong phân tích hồi quy, hệ số xác định (R-squared) cho biết điều gì?
A. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi các biến độc lập trong mô hình
B. Sai số chuẩn của ước lượng
C. Mức độ ý nghĩa của các biến độc lập
D. Mức độ tương quan giữa các biến độc lập
16. Khi nào nên sử dụng kiểm định ANOVA hai yếu tố?
A. Khi muốn kiểm tra ảnh hưởng của hai biến độc lập lên một biến phụ thuộc
B. Khi muốn so sánh trung bình của hai nhóm
C. Khi muốn kiểm tra sự độc lập giữa hai biến định tính
D. Khi muốn ước lượng tham số tổng thể
17. Trong kiểm định giả thuyết, vùng bác bỏ (rejection region) là gì?
A. Tập hợp các giá trị của thống kê kiểm định mà nếu giá trị thống kê rơi vào đó, ta sẽ bác bỏ giả thuyết H0
B. Tập hợp các giá trị mà ta chấp nhận giả thuyết H0
C. Xác suất mắc sai lầm loại I
D. Xác suất mắc sai lầm loại II
18. Trong kiểm định giả thuyết, sai lầm loại II xảy ra khi nào?
A. Chấp nhận giả thuyết H0 khi nó sai
B. Bác bỏ giả thuyết H0 khi nó đúng
C. Bác bỏ giả thuyết H0 khi nó sai
D. Chấp nhận giả thuyết H0 khi nó đúng
19. Trong hồi quy tuyến tính, hệ số chặn (intercept) biểu thị điều gì?
A. Giá trị của biến phụ thuộc khi tất cả các biến độc lập bằng 0
B. Mức độ thay đổi của biến phụ thuộc khi biến độc lập tăng một đơn vị
C. Sai số chuẩn của ước lượng
D. Mức độ phù hợp của mô hình
20. Khoảng tin cậy là gì?
A. Một khoảng giá trị mà trong đó tham số tổng thể có khả năng nằm trong đó với một độ tin cậy nhất định
B. Một giá trị duy nhất ước lượng cho tham số tổng thể
C. Một tập hợp tất cả các giá trị có thể của một biến
D. Một phương pháp để tính toán sai số chuẩn
21. Giá trị p (p-value) trong kiểm định giả thuyết là gì?
A. Xác suất quan sát được kết quả kiểm định (hoặc kết quả còn cực đoan hơn) nếu giả thuyết H0 là đúng
B. Xác suất giả thuyết H0 là đúng
C. Xác suất giả thuyết H1 là đúng
D. Xác suất mắc sai lầm loại I
22. Trong phân tích phương sai (ANOVA), thống kê F được tính như thế nào?
A. Tỷ lệ giữa phương sai giữa các nhóm và phương sai trong các nhóm
B. Tỷ lệ giữa phương sai trong các nhóm và phương sai giữa các nhóm
C. Hiệu giữa trung bình lớn nhất và trung bình nhỏ nhất
D. Tổng bình phương các sai số
23. Sai số loại I còn được gọi là gì?
A. Sai số alpha
B. Sai số beta
C. Công suất kiểm định
D. Mức ý nghĩa
24. Điều gì xảy ra với độ rộng của khoảng tin cậy khi kích thước mẫu tăng lên, giả sử các yếu tố khác không đổi?
A. Độ rộng của khoảng tin cậy giảm
B. Độ rộng của khoảng tin cậy tăng
C. Độ rộng của khoảng tin cậy không đổi
D. Không thể xác định
25. Trong phân tích phương sai (ANOVA), giả thuyết H0 thường là gì?
A. Tất cả các trung bình của các nhóm bằng nhau
B. Ít nhất một trung bình của các nhóm khác nhau
C. Phương sai của tất cả các nhóm bằng nhau
D. Phương sai của ít nhất một nhóm khác nhau
26. Trong kiểm định giả thuyết, sai lầm loại I xảy ra khi nào?
A. Bác bỏ giả thuyết H0 khi nó đúng
B. Chấp nhận giả thuyết H0 khi nó sai
C. Bác bỏ giả thuyết H0 khi nó sai
D. Chấp nhận giả thuyết H0 khi nó đúng
27. Trong phân tích hồi quy, hiện tượng đa cộng tuyến (multicollinearity) xảy ra khi nào?
A. Khi có mối tương quan cao giữa các biến độc lập
B. Khi có mối tương quan cao giữa biến độc lập và biến phụ thuộc
C. Khi sai số có phương sai không đổi
D. Khi sai số tuân theo phân phối chuẩn
28. Điều gì xảy ra với giá trị p khi kích thước mẫu tăng lên, giả sử hiệu ứng thực sự tồn tại?
A. Giá trị p giảm
B. Giá trị p tăng
C. Giá trị p không đổi
D. Không thể xác định
29. Mức ý nghĩa (alpha) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất mắc sai lầm loại I
B. Xác suất mắc sai lầm loại II
C. Xác suất chấp nhận giả thuyết H0 khi nó đúng
D. Xác suất bác bỏ giả thuyết H0 khi nó sai
30. Ý nghĩa của khoảng tin cậy 95% là gì?
A. Nếu lặp lại việc lấy mẫu và xây dựng khoảng tin cậy nhiều lần, khoảng 95% các khoảng tin cậy sẽ chứa tham số tổng thể thực sự
B. Xác suất tham số tổng thể nằm trong khoảng tin cậy là 95%
C. Sai số chuẩn của ước lượng là 5%
D. Mức ý nghĩa của kiểm định là 5%
31. Phân phối nhị thức mô tả điều gì?
A. Xác suất của một sự kiện liên tục xảy ra.
B. Xác suất của một số lượng thành công nhất định trong một chuỗi các thử nghiệm Bernoulli độc lập.
C. Xác suất của một sự kiện xảy ra trong một khoảng thời gian nhất định.
D. Phân phối của trung bình mẫu.
32. Sai số chuẩn của trung bình là gì?
A. Độ lệch chuẩn của quần thể.
B. Độ lệch chuẩn của trung bình mẫu.
C. Phương sai của quần thể.
D. Phương sai của trung bình mẫu.
33. Kiểm định Chi-bình phương (Chi-square test) được sử dụng để làm gì?
A. So sánh trung bình của hai nhóm.
B. So sánh phương sai của hai nhóm.
C. Kiểm tra sự độc lập giữa hai biến phân loại.
D. Đo lường mối quan hệ tuyến tính giữa hai biến liên tục.
34. Điều gì phân biệt biến ngẫu nhiên rời rạc với biến ngẫu nhiên liên tục?
A. Biến rời rạc có thể nhận bất kỳ giá trị nào trong một khoảng, trong khi biến liên tục chỉ có thể nhận các giá trị cụ thể.
B. Biến rời rạc chỉ có thể nhận các giá trị cụ thể, thường là số nguyên, trong khi biến liên tục có thể nhận bất kỳ giá trị nào trong một khoảng.
C. Biến rời rạc được sử dụng cho dữ liệu định tính, trong khi biến liên tục được sử dụng cho dữ liệu định lượng.
D. Biến rời rạc luôn có phân phối chuẩn, trong khi biến liên tục có phân phối bất kỳ.
35. Trong thống kê ứng dụng, thuật ngữ ‘biến ngẫu nhiên’ đề cập đến điều gì?
A. Một giá trị không đổi được sử dụng trong các phép tính.
B. Một hàm số gán một giá trị số cho mỗi kết quả trong không gian mẫu.
C. Một tập hợp các dữ liệu được thu thập từ một mẫu.
D. Một phương pháp để ước tính các tham số của quần thể.
36. Hệ số xác định (R-squared) trong hồi quy tuyến tính biểu thị điều gì?
A. Độ mạnh của mối quan hệ giữa các biến.
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi biến độc lập.
C. Sai số chuẩn của ước lượng.
D. Ý nghĩa thống kê của mô hình.
37. Đâu là đặc điểm của hàm khối xác suất (PMF)?
A. Nó được sử dụng cho các biến ngẫu nhiên liên tục.
B. Tổng của tất cả các giá trị của nó lớn hơn 1.
C. Nó cho xác suất của một biến ngẫu nhiên rời rạc nhận một giá trị cụ thể.
D. Nó là đạo hàm của hàm phân phối tích lũy (CDF).
38. Hàm mật độ xác suất (PDF) được sử dụng để mô tả loại biến ngẫu nhiên nào?
A. Biến ngẫu nhiên rời rạc.
B. Biến ngẫu nhiên liên tục.
C. Biến ngẫu nhiên nhị phân.
D. Biến ngẫu nhiên định tính.
39. Mức ý nghĩa (alpha) trong kiểm định giả thuyết đại diện cho điều gì?
A. Xác suất mắc lỗi loại II.
B. Xác suất bác bỏ giả thuyết không khi nó thực sự đúng (lỗi loại I).
C. Xác suất chấp nhận giả thuyết không khi nó thực sự sai (lỗi loại II).
D. Xác suất giả thuyết không là đúng.
40. Trong phân tích thời gian sống (survival analysis), hàm sống sót (survival function) cho biết điều gì?
A. Thời gian trung bình mà một sự kiện xảy ra.
B. Xác suất một cá nhân sống sót qua một thời điểm nhất định.
C. Tỷ lệ cá nhân gặp sự kiện trong một khoảng thời gian nhất định.
D. Độ lệch chuẩn của thời gian sống.
41. Mục đích của phân tích phương sai (ANOVA) là gì?
A. So sánh trung bình của hai quần thể.
B. So sánh phương sai của hai quần thể.
C. So sánh trung bình của ba hoặc nhiều hơn các quần thể.
D. Đo lường mối quan hệ giữa hai biến liên tục.
42. Trong hồi quy tuyến tính, điều gì xảy ra nếu có hiện tượng đa cộng tuyến (multicollinearity)?
A. Các ước lượng trở nên ổn định hơn.
B. Các ước lượng trở nên không chệch.
C. Các ước lượng trở nên kém chính xác hơn và khó diễn giải.
D. Phương sai của sai số giảm.
43. Thế nào là một mẫu ngẫu nhiên đơn giản?
A. Một mẫu được chọn một cách chủ quan bởi nhà nghiên cứu.
B. Một mẫu trong đó mỗi thành viên của quần thể có cơ hội được chọn bằng nhau.
C. Một mẫu được chọn từ một nhóm cụ thể của quần thể.
D. Một mẫu lớn hơn 30.
44. Phân phối Poisson thích hợp để mô hình hóa loại sự kiện nào?
A. Số lượng thành công trong một số lượng thử nghiệm cố định.
B. Thời gian giữa các sự kiện.
C. Số lượng sự kiện xảy ra trong một khoảng thời gian hoặc địa điểm nhất định.
D. Phân phối của sai số trong một mô hình hồi quy.
45. Định lý giới hạn trung tâm (Central Limit Theorem) phát biểu điều gì?
A. Phân phối của mẫu luôn là phân phối chuẩn.
B. Phân phối của tổng hoặc trung bình của một số lượng lớn các biến ngẫu nhiên độc lập có xu hướng phân phối chuẩn, bất kể phân phối ban đầu.
C. Phương sai của mẫu luôn bằng phương sai của quần thể.
D. Trung bình của mẫu luôn bằng trung bình của quần thể.
46. Quy tắc 68-95-99.7 trong phân phối chuẩn nói lên điều gì?
A. Khoảng tin cậy cho trung bình.
B. Tỷ lệ dữ liệu nằm trong 1, 2 và 3 độ lệch chuẩn của trung bình.
C. Xác suất của các sự kiện hiếm gặp.
D. Phân phối của trung bình mẫu.
47. Phương sai của một biến ngẫu nhiên đo lường điều gì?
A. Độ lệch trung bình của các giá trị so với giá trị kỳ vọng.
B. Độ lệch trung bình bình phương của các giá trị so với giá trị kỳ vọng.
C. Giá trị lớn nhất trừ giá trị nhỏ nhất của biến.
D. Tổng của tất cả các giá trị của biến.
48. Khi nào nên sử dụng kiểm định t (t-test) thay vì kiểm định z (z-test)?
A. Khi kích thước mẫu lớn (n > 30) và độ lệch chuẩn của quần thể đã biết.
B. Khi kích thước mẫu nhỏ (n < 30) và độ lệch chuẩn của quần thể chưa biết.
C. Khi dữ liệu không có phân phối chuẩn.
D. Khi so sánh phương sai của hai quần thể.
49. Đặc điểm chính của phân phối chuẩn là gì?
A. Nó là bất đối xứng.
B. Nó được xác định bởi hai tham số: trung bình và phương sai.
C. Nó có đuôi dày.
D. Nó chỉ được sử dụng cho các biến rời rạc.
50. Khi nào thì nên sử dụng kiểm định phi tham số (non-parametric test) thay vì kiểm định tham số (parametric test)?
A. Khi dữ liệu có phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi giả định về phân phối của dữ liệu không được đáp ứng.
D. Khi độ lệch chuẩn của quần thể đã biết.
51. Hệ số tương quan Pearson đo lường điều gì?
A. Mức độ biến động của một biến.
B. Mức độ quan hệ tuyến tính giữa hai biến liên tục.
C. Sự khác biệt giữa trung bình của hai nhóm.
D. Mức độ phù hợp của một mô hình thống kê.
52. Lỗi loại I trong kiểm định giả thuyết là gì?
A. Bác bỏ giả thuyết không khi nó thực sự đúng.
B. Chấp nhận giả thuyết không khi nó thực sự sai.
C. Không bác bỏ giả thuyết không khi nó thực sự đúng.
D. Không chấp nhận giả thuyết không khi nó thực sự sai.
53. Phân phối mũ (Exponential distribution) thường được sử dụng để mô hình hóa điều gì?
A. Số lượng sự kiện xảy ra trong một khoảng thời gian nhất định.
B. Thời gian giữa các sự kiện trong một quá trình Poisson.
C. Xác suất thành công trong một số lượng thử nghiệm cố định.
D. Phân phối của trung bình mẫu.
54. Giá trị kỳ vọng của một biến ngẫu nhiên được định nghĩa là gì?
A. Giá trị lớn nhất mà biến có thể nhận.
B. Giá trị trung bình có trọng số của biến.
C. Giá trị nhỏ nhất mà biến có thể nhận.
D. Phương sai của biến.
55. Độ lệch chuẩn là gì?
A. Bình phương của phương sai.
B. Căn bậc hai của phương sai.
C. Giá trị trung bình của biến.
D. Tổng của tất cả các giá trị của biến.
56. Điều gì là quan trọng nhất khi chọn một kiểm định thống kê?
A. Kích thước mẫu phải lớn.
B. Dữ liệu phải có phân phối chuẩn.
C. Kiểm định phải phù hợp với loại dữ liệu và câu hỏi nghiên cứu.
D. Giá trị p phải nhỏ hơn 0.05.
57. Phân phối Bernoulli mô tả loại thí nghiệm nào?
A. Một thí nghiệm với nhiều hơn hai kết quả có thể.
B. Một thí nghiệm với chính xác hai kết quả có thể, thành công hoặc thất bại.
C. Một thí nghiệm mà tất cả các kết quả đều có khả năng xảy ra như nhau.
D. Một thí nghiệm liên quan đến một biến ngẫu nhiên liên tục.
58. Giá trị p (p-value) trong kiểm định giả thuyết là gì?
A. Xác suất của giả thuyết không là đúng.
B. Xác suất thu được kết quả kiểm định ít nhất cực đoan như kết quả thực tế, giả sử giả thuyết không là đúng.
C. Xác suất mắc lỗi loại I.
D. Xác suất mắc lỗi loại II.
59. Lỗi loại II trong kiểm định giả thuyết là gì?
A. Bác bỏ giả thuyết không khi nó thực sự đúng.
B. Chấp nhận giả thuyết không khi nó thực sự sai.
C. Không bác bỏ giả thuyết không khi nó thực sự đúng.
D. Không chấp nhận giả thuyết không khi nó thực sự sai.
60. Khoảng tin cậy là gì?
A. Một giá trị duy nhất ước tính tham số của quần thể.
B. Một khoảng giá trị có khả năng chứa tham số của quần thể với một mức độ tin cậy nhất định.
C. Xác suất của một sự kiện xảy ra.
D. Một phép kiểm định giả thuyết.
61. Trong phân tích hồi quy đa biến, hiện tượng đa cộng tuyến (multicollinearity) đề cập đến vấn đề gì?
A. Mối quan hệ tuyến tính cao giữa các biến độc lập.
B. Mối quan hệ phi tuyến tính giữa các biến độc lập.
C. Mối quan hệ tuyến tính cao giữa biến độc lập và biến phụ thuộc.
D. Mối quan hệ phi tuyến tính giữa biến độc lập và biến phụ thuộc.
62. Hệ số tương quan Pearson (Pearson correlation coefficient) đo lường điều gì?
A. Mức độ biến thiên của hai biến.
B. Mức độ quan hệ phi tuyến tính giữa hai biến.
C. Mức độ quan hệ tuyến tính giữa hai biến.
D. Mức độ ảnh hưởng của một biến lên biến kia.
63. Khi nào nên sử dụng kiểm định Chi-square?
A. Khi so sánh trung bình của hai mẫu độc lập.
B. Khi so sánh phương sai của hai mẫu.
C. Khi phân tích mối quan hệ giữa hai biến định tính.
D. Khi phân tích mối quan hệ giữa hai biến định lượng.
64. Trong phân tích phương sai (ANOVA), giả thuyết không (null hypothesis) thường là gì?
A. Tất cả các trung bình của các nhóm đều bằng nhau.
B. Ít nhất một trung bình của một nhóm khác với các nhóm còn lại.
C. Phương sai của tất cả các nhóm đều bằng nhau.
D. Phương sai của ít nhất một nhóm khác với các nhóm còn lại.
65. Một công ty muốn khảo sát mức độ hài lòng của khách hàng về sản phẩm mới. Phương pháp thu thập dữ liệu nào phù hợp nhất?
A. Thực hiện thí nghiệm trong phòng thí nghiệm.
B. Quan sát hành vi của khách hàng trong cửa hàng.
C. Phỏng vấn hoặc khảo sát khách hàng.
D. Phân tích dữ liệu thứ cấp từ báo cáo tài chính.
66. Phương sai (variance) đo lường điều gì?
A. Giá trị trung bình của dữ liệu.
B. Độ lệch chuẩn của dữ liệu.
C. Mức độ phân tán của dữ liệu so với giá trị trung bình.
D. Mức độ tập trung của dữ liệu.
67. Mục đích của việc chuẩn hóa dữ liệu (data normalization) là gì?
A. Loại bỏ các giá trị ngoại lệ (outliers).
B. Chuyển đổi dữ liệu về cùng một thang đo.
C. Thay đổi phân phối của dữ liệu.
D. Giảm kích thước của dữ liệu.
68. Khoảng tin cậy 95% (95% confidence interval) có nghĩa là gì?
A. Có 95% khả năng giá trị thực của tham số nằm trong khoảng này.
B. Nếu lặp lại quá trình lấy mẫu nhiều lần, 95% các khoảng tin cậy được tạo ra sẽ chứa giá trị thực của tham số.
C. Có 5% khả năng giá trị thực của tham số nằm ngoài khoảng này.
D. Tất cả các đáp án trên đều đúng.
69. Trong phân tích thời gian (time series analysis), thành phần xu hướng (trend) đề cập đến điều gì?
A. Sự biến động ngắn hạn trong dữ liệu.
B. Sự biến động theo mùa trong dữ liệu.
C. Sự biến động ngẫu nhiên trong dữ liệu.
D. Sự thay đổi dài hạn trong dữ liệu.
70. Một nhà phân tích thị trường muốn xác định xem có mối quan hệ giữa chi tiêu quảng cáo và doanh số bán hàng hay không. Phương pháp nào phù hợp nhất?
A. Kiểm định t (t-test)
B. Phân tích phương sai (ANOVA)
C. Hồi quy tuyến tính
D. Kiểm định Chi-square
71. Giá trị p (p-value) trong kiểm định giả thuyết biểu diễn điều gì?
A. Xác suất giả thuyết không là đúng.
B. Xác suất quan sát được kết quả (hoặc kết quả cực đoan hơn) nếu giả thuyết không là đúng.
C. Xác suất giả thuyết thay thế là đúng.
D. Xác suất mắc sai lầm loại I.
72. Trong kiểm định giả thuyết, sai lầm loại I (Type I error) còn được gọi là gì?
A. Sai lầm dương tính giả (false positive).
B. Sai lầm âm tính giả (false negative).
C. Độ mạnh của kiểm định (power of the test).
D. Mức ý nghĩa (significance level).
73. Trong thống kê suy diễn, sai số chuẩn (standard error) ước tính điều gì?
A. Độ lệch chuẩn của mẫu.
B. Độ lệch chuẩn của quần thể.
C. Độ lệch chuẩn của phân phối lấy mẫu của một thống kê.
D. Phương sai của mẫu.
74. Trong kiểm định giả thuyết, sai lầm loại II (Type II error) xảy ra khi nào?
A. Bác bỏ giả thuyết không khi nó thực sự đúng.
B. Không bác bỏ giả thuyết không khi nó thực sự sai.
C. Bác bỏ giả thuyết không khi nó thực sự sai.
D. Không bác bỏ giả thuyết không khi nó thực sự đúng.
75. Một nhà khoa học muốn xác định xem có mối liên hệ giữa việc hút thuốc và nguy cơ mắc bệnh ung thư phổi hay không. Phương pháp nào phù hợp nhất?
A. Thực hiện một thí nghiệm ngẫu nhiên có kiểm soát.
B. Thực hiện một nghiên cứu quan sát.
C. Tính giá trị trung bình của số người hút thuốc.
D. Tính độ lệch chuẩn của số người mắc bệnh ung thư phổi.
76. Giả sử bạn thực hiện một kiểm định giả thuyết với mức ý nghĩa α = 0.05. Nếu giá trị p (p-value) của bạn là 0.03, bạn nên kết luận gì?
A. Bác bỏ giả thuyết không.
B. Không bác bỏ giả thuyết không.
C. Chấp nhận giả thuyết không.
D. Không thể đưa ra kết luận.
77. Hệ số xác định (R-squared) trong hồi quy tuyến tính biểu diễn điều gì?
A. Mức độ phù hợp của mô hình hồi quy với dữ liệu.
B. Mức độ biến thiên của biến độc lập.
C. Mức độ biến thiên của biến phụ thuộc.
D. Tỷ lệ phần trăm biến thiên của biến phụ thuộc được giải thích bởi biến độc lập.
78. Điều gì xảy ra với khoảng tin cậy (confidence interval) khi kích thước mẫu tăng lên?
A. Khoảng tin cậy trở nên rộng hơn.
B. Khoảng tin cậy trở nên hẹp hơn.
C. Khoảng tin cậy không thay đổi.
D. Khoảng tin cậy trở nên không xác định.
79. Giá trị ngoại lệ (outlier) là gì?
A. Giá trị trung bình của dữ liệu.
B. Giá trị xuất hiện nhiều nhất trong dữ liệu.
C. Giá trị nằm ngoài phạm vi của hầu hết các giá trị khác trong tập dữ liệu.
D. Giá trị nằm giữa của dữ liệu đã được sắp xếp.
80. Trong hồi quy tuyến tính đơn, hệ số chặn (intercept) biểu diễn điều gì?
A. Giá trị dự đoán của biến độc lập khi biến phụ thuộc bằng 0.
B. Giá trị trung bình của biến phụ thuộc.
C. Giá trị dự đoán của biến phụ thuộc khi tất cả các biến độc lập bằng 0.
D. Độ dốc của đường hồi quy.
81. Trong phân tích phương sai (ANOVA), mục đích chính là gì?
A. So sánh phương sai của hai mẫu.
B. So sánh trung bình của hai mẫu.
C. So sánh trung bình của nhiều hơn hai mẫu.
D. Đo lường mối quan hệ giữa hai biến định lượng.
82. Một nhà nghiên cứu muốn so sánh hiệu quả của 3 phương pháp giảng dạy khác nhau lên điểm thi của học sinh. Phép kiểm định thống kê nào phù hợp nhất?
A. Kiểm định t (t-test)
B. Phân tích phương sai (ANOVA)
C. Kiểm định Chi-square
D. Hồi quy tuyến tính
83. Độ lệch chuẩn (standard deviation) là gì?
A. Giá trị trung bình của dữ liệu.
B. Căn bậc hai của phương sai.
C. Phương sai của dữ liệu.
D. Mức độ tập trung của dữ liệu.
84. Trong phân tích hồi quy, phần dư (residual) là gì?
A. Giá trị dự đoán của biến phụ thuộc.
B. Giá trị thực tế của biến phụ thuộc.
C. Sự khác biệt giữa giá trị thực tế và giá trị dự đoán của biến phụ thuộc.
D. Độ dốc của đường hồi quy.
85. Trong thống kê mô tả, trung vị (median) là gì?
A. Giá trị trung bình của dữ liệu.
B. Giá trị xuất hiện nhiều nhất trong dữ liệu.
C. Giá trị nằm giữa của dữ liệu đã được sắp xếp.
D. Độ lệch chuẩn của dữ liệu.
86. Một nhà quản lý muốn biết liệu có sự khác biệt về năng suất giữa hai nhóm nhân viên sau khi áp dụng một chương trình đào tạo mới. Kiểm định nào phù hợp?
A. Kiểm định Chi-square
B. Kiểm định t (t-test)
C. Phân tích phương sai (ANOVA)
D. Hồi quy tuyến tính
87. Tại sao cần phải kiểm tra tính dừng (stationarity) trong phân tích chuỗi thời gian?
A. Để đảm bảo dữ liệu tuân theo phân phối chuẩn.
B. Để đơn giản hóa quá trình tính toán.
C. Để đảm bảo các kết quả phân tích là hợp lệ và không bị sai lệch.
D. Để loại bỏ các giá trị ngoại lệ.
88. Khi nào thì nên sử dụng thống kê phi tham số (non-parametric statistics)?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc kích thước mẫu nhỏ.
D. Khi cần tính giá trị trung bình.
89. Mức ý nghĩa (significance level) α trong kiểm định giả thuyết thường được chọn là bao nhiêu?
A. 0.01
B. 0.05
C. 0.10
D. Tất cả các đáp án trên đều có thể.
90. Khi nào nên sử dụng kiểm định Mann-Whitney U?
A. Khi so sánh trung bình của hai mẫu phụ thuộc.
B. Khi so sánh trung bình của hai mẫu độc lập và dữ liệu không tuân theo phân phối chuẩn.
C. Khi so sánh phương sai của hai mẫu.
D. Khi phân tích mối quan hệ giữa hai biến định tính.
91. Phân tích hồi quy logistic (logistic regression) được sử dụng khi nào?
A. Biến phụ thuộc là biến liên tục.
B. Biến phụ thuộc là biến định tính có hai giá trị (binary).
C. Biến phụ thuộc là biến định tính có nhiều hơn hai giá trị.
D. Biến độc lập là biến định tính.
92. Kiểm định post-hoc nào thường được sử dụng sau ANOVA?
A. Kiểm định t.
B. Kiểm định F.
C. Kiểm định Tukey.
D. Kiểm định Chi-square.
93. Điều gì xảy ra nếu sai số trong mô hình hồi quy không tuân theo phân phối chuẩn?
A. Các ước lượng hệ số trở nên không chệch.
B. Các kiểm định t và F trở nên không tin cậy (đặc biệt với mẫu nhỏ).
C. R-squared trở nên không chính xác.
D. Không có ảnh hưởng gì.
94. Phương pháp nào có thể được sử dụng để kiểm tra phương sai của sai số có đồng nhất hay không?
A. Kiểm định t.
B. Kiểm định F.
C. Kiểm định Breusch-Pagan.
D. Kiểm định Chi-square.
95. Nếu kết quả kiểm định ANOVA cho thấy có sự khác biệt đáng kể giữa các nhóm, điều gì xảy ra tiếp theo?
A. Kết luận rằng tất cả các nhóm đều có trung bình khác nhau.
B. Thực hiện các kiểm định post-hoc để xác định nhóm nào khác biệt.
C. Không cần thực hiện thêm kiểm định nào.
D. Thực hiện kiểm định t.
96. Trong phân tích phương sai (ANOVA), mục đích chính là gì?
A. Ước lượng hệ số hồi quy.
B. So sánh trung bình của hai mẫu.
C. So sánh trung bình của nhiều hơn hai nhóm.
D. Kiểm tra mối quan hệ tuyến tính.
97. Trong hồi quy đa thức (polynomial regression), bậc của đa thức ảnh hưởng đến điều gì?
A. Mức độ tuyến tính của mô hình.
B. Số lượng biến độc lập.
C. Độ phức tạp của đường cong hồi quy.
D. Giá trị của hệ số chặn.
98. Kiểm định nào được sử dụng để kiểm tra giả định về phương sai bằng nhau trong ANOVA?
A. Kiểm định t.
B. Kiểm định F.
C. Kiểm định Levene.
D. Kiểm định Chi-square.
99. Hàm liên kết (link function) trong hồi quy logistic là gì?
A. Hàm tuyến tính.
B. Hàm logit.
C. Hàm mũ.
D. Hàm đa thức.
100. Phương pháp nào có thể được sử dụng để kiểm tra xem sai số có tuân theo phân phối chuẩn hay không?
A. Kiểm định t.
B. Kiểm định F.
C. Kiểm định Shapiro-Wilk.
D. Kiểm định Breusch-Pagan.
101. Hiện tượng đa cộng tuyến (multicollinearity) xảy ra khi nào?
A. Có sự tương quan cao giữa biến phụ thuộc và biến độc lập.
B. Có sự tương quan cao giữa các biến độc lập.
C. Phương sai của sai số thay đổi.
D. Sai số không tuân theo phân phối chuẩn.
102. Kiểm định nào được sử dụng để đánh giá sự phù hợp của mô hình hồi quy logistic?
A. Kiểm định t.
B. Kiểm định F.
C. Kiểm định Hosmer-Lemeshow.
D. Kiểm định Shapiro-Wilk.
103. Giả định nào là quan trọng nhất trong phân tích phương sai (ANOVA)?
A. Các nhóm phải có kích thước bằng nhau.
B. Các nhóm phải có phương sai bằng nhau (homogeneity of variance).
C. Các nhóm phải có trung bình bằng nhau.
D. Các nhóm phải tuân theo phân phối chuẩn.
104. Ý nghĩa của hệ số xác định (R-squared) trong phân tích hồi quy là gì?
A. Độ mạnh của mối quan hệ giữa các biến độc lập.
B. Tỷ lệ phương sai của biến độc lập được giải thích bởi biến phụ thuộc.
C. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi các biến độc lập trong mô hình.
D. Mức độ ý nghĩa thống kê của các hệ số hồi quy.
105. Điều gì xảy ra khi bạn đưa một biến giả hoàn hảo (dummy variable trap) vào mô hình hồi quy?
A. Mô hình trở nên không xác định (undefined).
B. Mô hình trở nên hiệu quả hơn.
C. R-squared tăng lên đáng kể.
D. Không có ảnh hưởng gì.
106. Khi hệ số tương quan Pearson bằng 0, điều này có nghĩa là gì?
A. Có mối quan hệ nhân quả giữa hai biến.
B. Không có mối quan hệ tuyến tính giữa hai biến.
C. Có mối quan hệ phi tuyến tính giữa hai biến.
D. Hai biến hoàn toàn độc lập.
107. Thành phần nào thường được phân tích trong chuỗi thời gian?
A. Xu hướng (trend).
B. Tính thời vụ (seasonality).
C. Tính chu kỳ (cyclicality).
D. Tất cả các đáp án trên.
108. Trong phân tích hiệp phương sai (ANCOVA), biến hiệp biến (covariate) được sử dụng để làm gì?
A. Giảm kích thước mẫu.
B. Kiểm soát ảnh hưởng của một biến liên tục lên biến phụ thuộc.
C. Tăng số lượng nhóm.
D. Đại diện cho biến định tính.
109. Phân tích tương quan (correlation analysis) dùng để làm gì?
A. Xác định mối quan hệ nhân quả giữa các biến.
B. Đo lường mức độ liên kết tuyến tính giữa hai biến.
C. So sánh trung bình của hai nhóm.
D. Dự đoán giá trị của một biến dựa trên biến khác.
110. Mục đích của việc sử dụng biến tương tác (interaction variable) trong hồi quy là gì?
A. Giảm hiện tượng đa cộng tuyến.
B. Mô hình hóa tác động kết hợp của hai hoặc nhiều biến độc lập.
C. Tăng R-squared.
D. Đơn giản hóa mô hình.
111. Hệ số trong hồi quy logistic được giải thích như thế nào?
A. Ảnh hưởng của biến độc lập lên biến phụ thuộc.
B. Thay đổi trong odds ratio khi biến độc lập tăng một đơn vị.
C. Thay đổi trong xác suất khi biến độc lập tăng một đơn vị.
D. Mức độ quan trọng của biến độc lập.
112. Trong phân tích chuỗi thời gian (time series analysis), mục đích chính là gì?
A. So sánh trung bình của các nhóm.
B. Đo lường mối quan hệ giữa hai biến.
C. Phân tích dữ liệu theo thời gian để dự đoán các giá trị tương lai.
D. Phân tích dữ liệu không phụ thuộc vào thời gian.
113. Cách khắc phục hiện tượng đa cộng tuyến trong mô hình hồi quy là gì?
A. Thêm biến phụ thuộc vào mô hình.
B. Loại bỏ một hoặc nhiều biến độc lập có tương quan cao.
C. Sử dụng kiểm định t.
D. Thay đổi kích thước mẫu.
114. Điều gì xảy ra khi bạn thêm một biến độc lập vào mô hình hồi quy tuyến tính?
A. R-squared luôn giảm.
B. R-squared luôn tăng.
C. R-squared có thể tăng hoặc giảm, tùy thuộc vào mức độ liên quan của biến mới.
D. R-squared không thay đổi.
115. Hệ số tương quan Pearson (Pearson correlation coefficient) có giá trị nằm trong khoảng nào?
A. Từ 0 đến 1.
B. Từ -1 đến 0.
C. Từ -1 đến 1.
D. Từ 0 đến vô cực.
116. Phương pháp nào được sử dụng để kiểm tra sự phù hợp của mô hình hồi quy tuyến tính?
A. Kiểm định t.
B. Kiểm định z.
C. Kiểm định F.
D. Kiểm định Chi-square.
117. Điều gì xảy ra nếu vi phạm giả định về phương sai của sai số không đổi (homoscedasticity)?
A. Các ước lượng hệ số trở nên không chệch.
B. Các kiểm định t và F trở nên không tin cậy.
C. R-squared trở nên không chính xác.
D. Không có ảnh hưởng gì.
118. Trong phân tích hồi quy, biến giả (dummy variable) được sử dụng để làm gì?
A. Đại diện cho các biến định lượng.
B. Đại diện cho các biến định tính.
C. Giảm hiện tượng đa cộng tuyến.
D. Tăng R-squared.
119. Trong hồi quy tuyến tính, hệ số chặn (intercept) thể hiện điều gì?
A. Giá trị dự đoán của biến độc lập khi biến phụ thuộc bằng 0.
B. Độ dốc của đường hồi quy.
C. Giá trị trung bình của biến phụ thuộc.
D. Giá trị dự đoán của biến phụ thuộc khi tất cả các biến độc lập bằng 0.
120. Phương pháp nào được sử dụng để loại bỏ tính thời vụ trong chuỗi thời gian?
A. Lấy trung bình động (moving average).
B. Sai phân (differencing).
C. Decomposition.
D. Hồi quy tuyến tính.
121. Trong kiểm định giả thuyết, điều gì xảy ra khi tăng kích thước mẫu?
A. Xác suất mắc sai lầm loại I tăng lên.
B. Xác suất mắc sai lầm loại II tăng lên.
C. Công suất kiểm định (power of the test) tăng lên.
D. Mức ý nghĩa (significance level) giảm xuống.
122. Kiểm định Kolmogorov-Smirnov được sử dụng để làm gì?
A. Kiểm định sự bằng nhau của hai phương sai.
B. Kiểm định sự độc lập giữa hai biến định tính.
C. Kiểm định xem một mẫu có tuân theo một phân phối cụ thể hay không.
D. Kiểm định trung bình của một tổng thể.
123. Kiểm định Mann-Whitney U được sử dụng để làm gì?
A. Kiểm định sự khác biệt giữa trung bình của hai mẫu độc lập khi dữ liệu tuân theo phân phối chuẩn.
B. Kiểm định sự khác biệt giữa trung bình của hai mẫu phụ thuộc.
C. Kiểm định sự khác biệt giữa trung vị của hai mẫu độc lập khi dữ liệu không tuân theo phân phối chuẩn.
D. Kiểm định sự tương quan giữa hai biến.
124. Ước lượng điểm (point estimate) là gì?
A. Một khoảng giá trị mà ta tin rằng tham số tổng thể nằm trong đó.
B. Một giá trị duy nhất được sử dụng để ước tính tham số tổng thể.
C. Độ lệch chuẩn của mẫu.
D. Phương sai của mẫu.
125. Mức ý nghĩa (significance level) α thường được sử dụng trong kiểm định giả thuyết là bao nhiêu?
A. 0.1
B. 0.01
C. 0.05
D. Tất cả các đáp án trên đều có thể được sử dụng.
126. Kiểm định Chi-bình phương (Chi-square test) thường được sử dụng để làm gì?
A. Kiểm định trung bình của một tổng thể.
B. Kiểm định phương sai của một tổng thể.
C. Kiểm định sự độc lập giữa hai biến định tính.
D. Kiểm định sự khác biệt giữa hai trung bình.
127. Hệ số tương quan (correlation coefficient) r đo lường điều gì?
A. Mức độ biến động của dữ liệu.
B. Độ mạnh và hướng của mối quan hệ tuyến tính giữa hai biến.
C. Sự khác biệt giữa trung bình của hai mẫu.
D. Mức độ tin cậy của một ước lượng.
128. Khi nào thì nên sử dụng kiểm định phi tham số (non-parametric test)?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn (n > 30).
C. Khi các giả định của kiểm định tham số không được đáp ứng (ví dụ: dữ liệu không tuân theo phân phối chuẩn).
D. Khi muốn kiểm định trung bình của một tổng thể.
129. Trong phân tích phương sai (ANOVA), giả thuyết H0 phát biểu điều gì?
A. Tất cả các trung bình tổng thể đều khác nhau.
B. Ít nhất một trung bình tổng thể khác với các trung bình còn lại.
C. Tất cả các trung bình tổng thể đều bằng nhau.
D. Phương sai giữa các nhóm khác nhau.
130. Mục đích của việc chuẩn hóa dữ liệu (data standardization) là gì?
A. Để loại bỏ các giá trị ngoại lệ (outliers).
B. Để chuyển đổi dữ liệu về cùng một đơn vị đo.
C. Để dữ liệu có trung bình bằng 0 và độ lệch chuẩn bằng 1.
D. Để làm cho dữ liệu tuân theo phân phối chuẩn.
131. Điều gì xảy ra với khoảng tin cậy (confidence interval) khi kích thước mẫu tăng lên?
A. Khoảng tin cậy trở nên rộng hơn.
B. Khoảng tin cậy không thay đổi.
C. Khoảng tin cậy trở nên hẹp hơn.
D. Không thể xác định.
132. Trong hồi quy tuyến tính, hệ số chặn (intercept) biểu diễn điều gì?
A. Độ dốc của đường hồi quy.
B. Giá trị của biến độc lập khi biến phụ thuộc bằng 0.
C. Giá trị dự đoán của biến phụ thuộc khi tất cả các biến độc lập bằng 0.
D. Mức độ phù hợp của mô hình hồi quy.
133. Trong kiểm định giả thuyết thống kê, sai lầm loại I (Type I error) xảy ra khi nào?
A. Chấp nhận giả thuyết H0 khi nó đúng.
B. Bác bỏ giả thuyết H0 khi nó sai.
C. Chấp nhận giả thuyết H0 khi nó sai.
D. Bác bỏ giả thuyết H0 khi nó đúng.
134. Trong kiểm định giả thuyết về trung bình của một tổng thể, giả thuyết H0 thường phát biểu điều gì?
A. Trung bình mẫu bằng một giá trị cụ thể.
B. Trung bình tổng thể khác một giá trị cụ thể.
C. Trung bình tổng thể bằng một giá trị cụ thể.
D. Trung bình tổng thể lớn hơn một giá trị cụ thể.
135. Giá trị tới hạn (critical value) trong kiểm định giả thuyết là gì?
A. Xác suất mắc sai lầm loại I.
B. Giá trị mà nếu thống kê kiểm định vượt quá, ta sẽ bác bỏ giả thuyết H0.
C. Giá trị trung bình của mẫu.
D. Độ lệch chuẩn của mẫu.
136. Sai lầm loại II (Type II error) xảy ra khi nào?
A. Bác bỏ giả thuyết H0 khi nó đúng.
B. Chấp nhận giả thuyết H0 khi nó đúng.
C. Bác bỏ giả thuyết H0 khi nó sai.
D. Chấp nhận giả thuyết H0 khi nó sai.
137. Trong phân tích hồi quy đa biến, hiện tượng đa cộng tuyến (multicollinearity) xảy ra khi nào?
A. Khi có một số lượng lớn biến độc lập trong mô hình.
B. Khi các biến độc lập có mối tương quan cao với nhau.
C. Khi biến phụ thuộc không tuân theo phân phối chuẩn.
D. Khi có các giá trị ngoại lệ (outliers) trong dữ liệu.
138. Khi nào thì nên sử dụng kiểm định t (t-test) thay vì kiểm định z (z-test)?
A. Khi kích thước mẫu lớn (n > 30).
B. Khi độ lệch chuẩn của tổng thể đã biết.
C. Khi độ lệch chuẩn của tổng thể chưa biết và kích thước mẫu nhỏ (n < 30).
D. Khi muốn kiểm định sự khác biệt giữa hai tỷ lệ.
139. Giá trị p (p-value) trong kiểm định giả thuyết thống kê thể hiện điều gì?
A. Xác suất giả thuyết H0 là đúng.
B. Xác suất mắc sai lầm loại II.
C. Xác suất quan sát được kết quả như (hoặc cực đoan hơn) kết quả đã thấy nếu H0 là đúng.
D. Mức ý nghĩa (significance level) của kiểm định.
140. Khoảng tin cậy 95% có nghĩa là gì?
A. Có 95% khả năng tham số tổng thể nằm trong khoảng này.
B. Nếu lặp lại việc lấy mẫu nhiều lần, 95% các khoảng tin cậy được tạo ra sẽ chứa tham số tổng thể thực sự.
C. Có 5% khả năng tham số tổng thể không nằm trong khoảng này.
D. Tất cả các đáp án trên đều đúng.
141. Phương pháp nào sau đây giúp giảm thiểu ảnh hưởng của đa cộng tuyến trong mô hình hồi quy?
A. Loại bỏ các biến độc lập có tương quan cao.
B. Thêm nhiều biến độc lập hơn vào mô hình.
C. Sử dụng biến phụ thuộc đã được biến đổi (transformed).
D. Tăng kích thước mẫu.
142. Kiểm định Levene được sử dụng để làm gì?
A. Kiểm định sự khác biệt giữa hai trung bình.
B. Kiểm định sự bằng nhau của phương sai giữa các nhóm.
C. Kiểm định sự tương quan giữa hai biến.
D. Kiểm định sự độc lập giữa hai biến định tính.
143. Trong kiểm định giả thuyết, điều gì xảy ra khi giá trị p nhỏ hơn mức ý nghĩa α?
A. Chấp nhận giả thuyết H0.
B. Bác bỏ giả thuyết H0.
C. Không thể đưa ra kết luận.
D. Tăng kích thước mẫu.
144. Khi nào nên sử dụng kiểm định ANOVA hai yếu tố (two-way ANOVA)?
A. Khi muốn so sánh trung bình của hai nhóm.
B. Khi muốn so sánh trung bình của ba nhóm trở lên.
C. Khi muốn so sánh ảnh hưởng của hai yếu tố độc lập lên một biến phụ thuộc.
D. Khi muốn kiểm định sự tương quan giữa hai biến.
145. Khi nào nên sử dụng kiểm định Wilcoxon signed-rank test?
A. Để so sánh trung bình của hai mẫu độc lập.
B. Để so sánh trung bình của hai mẫu phụ thuộc khi dữ liệu tuân theo phân phối chuẩn.
C. Để so sánh trung vị của hai mẫu phụ thuộc khi dữ liệu không tuân theo phân phối chuẩn.
D. Để kiểm định sự tương quan giữa hai biến.
146. Hệ số V Cramer được sử dụng trong trường hợp nào?
A. Đo lường mối quan hệ tuyến tính giữa hai biến liên tục.
B. Đo lường mối quan hệ giữa hai biến định tính.
C. Đo lường sự khác biệt giữa hai trung bình.
D. Đo lường sự khác biệt giữa hai phương sai.
147. Kiểm định một phía (one-tailed test) được sử dụng khi nào?
A. Khi không có thông tin gì về hướng của sự khác biệt.
B. Khi muốn kiểm định xem có sự khác biệt hay không.
C. Khi chỉ quan tâm đến sự khác biệt theo một hướng cụ thể (lớn hơn hoặc nhỏ hơn).
D. Khi muốn kiểm định sự khác biệt giữa hai tổng thể.
148. Trong phân tích hồi quy, R-squared (hệ số xác định) cho biết điều gì?
A. Mức độ ý nghĩa thống kê của các hệ số hồi quy.
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi các biến độc lập trong mô hình.
C. Độ dốc của đường hồi quy.
D. Sai số chuẩn của ước lượng.
149. Ý nghĩa của việc thực hiện kiểm định hậu nghiệm (post-hoc test) trong ANOVA là gì?
A. Để xác định xem có sự khác biệt giữa các nhóm hay không.
B. Để kiểm định giả định về tính thuần nhất của phương sai.
C. Để xác định cặp nhóm nào có sự khác biệt đáng kể sau khi ANOVA đã cho thấy có sự khác biệt tổng thể.
D. Để điều chỉnh mức ý nghĩa (significance level) của kiểm định.
150. Trong kiểm định giả thuyết, ‘công suất kiểm định’ (power of a test) thể hiện điều gì?
A. Xác suất mắc sai lầm loại I.
B. Xác suất mắc sai lầm loại II.
C. Xác suất bác bỏ giả thuyết H0 khi nó sai.
D. Xác suất chấp nhận giả thuyết H0 khi nó đúng.