1. Trong phân tích chuỗi thời gian, thành phần nào thể hiện xu hướng dài hạn của dữ liệu?
A. Tính thời vụ.
B. Chu kỳ.
C. Xu hướng.
D. Tính ngẫu nhiên.
2. Trong phân tích hồi quy tuyến tính, R bình phương (R-squared) thể hiện điều gì?
A. Mức độ ý nghĩa thống kê của các biến độc lập.
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi các biến độc lập trong mô hình.
C. Độ lớn của hệ số hồi quy.
D. Sai số chuẩn của ước lượng.
3. Một nhà đầu tư muốn đánh giá rủi ro của một danh mục đầu tư. Thống kê nào sau đây hữu ích nhất?
A. Giá trị trung bình.
B. Độ lệch chuẩn.
C. Trung vị.
D. Mốt.
4. Trong kiểm định giả thuyết, giả thuyết null thường là gì?
A. Giả thuyết mà nhà nghiên cứu muốn chứng minh.
B. Giả thuyết mặc định hoặc giả thuyết không có sự khác biệt.
C. Giả thuyết đối lập với giả thuyết thay thế.
D. Giả thuyết được chấp nhận nếu giá trị p lớn hơn mức ý nghĩa.
5. Một nhà phân tích muốn xác định xem có mối quan hệ giữa trình độ học vấn và mức lương của nhân viên hay không. Phương pháp thống kê nào phù hợp nhất?
A. Kiểm định t (t-test).
B. Phân tích hồi quy.
C. Phân tích phương sai (ANOVA).
D. Phân tích tương quan.
6. Trong thống kê suy diễn, khoảng tin cậy (confidence interval) là gì?
A. Khoảng giá trị mà chúng ta chắc chắn 100% rằng tham số tổng thể nằm trong đó.
B. Khoảng giá trị mà chúng ta ước tính tham số tổng thể có khả năng nằm trong đó với một độ tin cậy nhất định.
C. Khoảng giá trị của mẫu mà chúng ta sử dụng để suy ra thông tin về tổng thể.
D. Khoảng giá trị mà chúng ta bác bỏ giả thuyết null.
7. Phương pháp nào sau đây giúp giảm thiểu tác động của các giá trị ngoại lệ trong phân tích?
A. Tính trung bình.
B. Tính độ lệch chuẩn.
C. Tính trung vị.
D. Tính mốt.
8. Trong phân tích thống kê, điều gì xảy ra khi kích thước mẫu tăng lên?
A. Khoảng tin cậy trở nên rộng hơn.
B. Sai số chuẩn giảm.
C. Giá trị p tăng lên.
D. Sai lầm loại II tăng lên.
9. Một nhà quản lý muốn đánh giá mức độ hài lòng của khách hàng về dịch vụ của công ty. Phương pháp thống kê nào phù hợp nhất để thu thập thông tin?
A. Phân tích hồi quy.
B. Khảo sát (survey).
C. Phân tích phương sai (ANOVA).
D. Kiểm định t (t-test).
10. Khi nào thì nên sử dụng phương pháp lấy mẫu phân tầng?
A. Khi tổng thể đồng nhất.
B. Khi tổng thể có các nhóm (strata) khác nhau và muốn đảm bảo mỗi nhóm đều được đại diện trong mẫu.
C. Khi muốn tiết kiệm chi phí và thời gian thu thập dữ liệu.
D. Khi không có thông tin gì về tổng thể.
11. Trong thống kê mô tả, độ lệch chuẩn đo lường điều gì?
A. Giá trị trung bình của dữ liệu.
B. Độ phân tán của dữ liệu so với giá trị trung bình.
C. Mức độ bất đối xứng của phân phối.
D. Giá trị lớn nhất trong tập dữ liệu.
12. Khi nào nên sử dụng kiểm định Chi bình phương (Chi-squared test)?
A. Khi so sánh trung bình của hai nhóm.
B. Khi phân tích mối quan hệ giữa hai biến định tính.
C. Khi dự đoán giá trị của một biến định lượng.
D. Khi kiểm tra sự khác biệt giữa các phương sai.
13. Trong kiểm định giả thuyết, mức ý nghĩa (alpha) thường được đặt là bao nhiêu?
A. 0.01.
B. 0.05.
C. 0.10.
D. Tất cả các đáp án trên đều có thể đúng, tùy thuộc vào bài toán.
14. Một nhà nghiên cứu muốn so sánh hiệu quả của hai loại thuốc khác nhau trong việc điều trị bệnh. Phương pháp thống kê nào phù hợp nhất?
A. Phân tích tương quan.
B. Phân tích hồi quy.
C. Kiểm định t (t-test).
D. Phân tích chuỗi thời gian.
15. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết null là đúng.
B. Xác suất mắc sai lầm loại II.
C. Xác suất thu được kết quả quan sát, hoặc kết quả cực đoan hơn, nếu giả thuyết null là đúng.
D. Mức ý nghĩa của kiểm định.
16. Trong thống kê, thuật ngữ ‘phương sai’ dùng để chỉ điều gì?
A. Giá trị trung bình của tập dữ liệu.
B. Độ lệch chuẩn của tập dữ liệu.
C. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình.
D. Giá trị lớn nhất trừ giá trị nhỏ nhất trong tập dữ liệu.
17. Một nhà bán lẻ muốn xác định xem có mối liên hệ giữa quảng cáo trên mạng xã hội và doanh số bán hàng hay không. Phương pháp thống kê nào phù hợp nhất?
A. Kiểm định t (t-test).
B. Phân tích phương sai (ANOVA).
C. Phân tích tương quan.
D. Phân tích chuỗi thời gian.
18. Biểu đồ hộp (boxplot) được sử dụng để làm gì?
A. Thể hiện mối quan hệ giữa hai biến định lượng.
B. So sánh tỷ lệ giữa các nhóm.
C. Mô tả phân phối của một biến định lượng và xác định giá trị ngoại lệ.
D. Thể hiện xu hướng theo thời gian.
19. Một nhà quản lý muốn so sánh năng suất làm việc của nhân viên giữa các phòng ban khác nhau. Thống kê nào sau đây sẽ hữu ích nhất để so sánh?
A. Độ lệch chuẩn.
B. Trung vị.
C. Giá trị trung bình.
D. Mốt.
20. Trong phân tích dữ liệu, giá trị ngoại lệ (outlier) là gì?
A. Giá trị trung bình của dữ liệu.
B. Giá trị xuất hiện nhiều nhất trong dữ liệu.
C. Giá trị khác biệt đáng kể so với các giá trị khác trong dữ liệu.
D. Giá trị nằm ở giữa tập dữ liệu.
21. Một công ty muốn dự đoán doanh số bán hàng trong tương lai dựa trên dữ liệu doanh số trong quá khứ. Phương pháp thống kê nào phù hợp nhất?
A. Phân tích phương sai (ANOVA).
B. Phân tích chuỗi thời gian.
C. Kiểm định Chi bình phương (Chi-squared test).
D. Phân tích tương quan.
22. Phương pháp lấy mẫu nào đảm bảo mỗi phần tử của tổng thể có cơ hội được chọn như nhau?
A. Lấy mẫu thuận tiện.
B. Lấy mẫu phân tầng.
C. Lấy mẫu ngẫu nhiên đơn giản.
D. Lấy mẫu theo cụm.
23. Trong phân tích hồi quy, hiện tượng đa cộng tuyến xảy ra khi nào?
A. Khi có sự tương quan cao giữa các biến độc lập.
B. Khi phương sai của sai số thay đổi.
C. Khi sai số không tuân theo phân phối chuẩn.
D. Khi có giá trị ngoại lệ trong dữ liệu.
24. Hệ số tương quan Pearson đo lường điều gì?
A. Mức độ quan hệ nhân quả giữa hai biến.
B. Mức độ biến động của một biến so với biến kia.
C. Mức độ liên hệ tuyến tính giữa hai biến định lượng.
D. Mức độ ảnh hưởng của nhiễu đối với mô hình.
25. Trong kiểm định giả thuyết thống kê, sai lầm loại I xảy ra khi nào?
A. Bác bỏ giả thuyết null khi nó thực sự đúng.
B. Chấp nhận giả thuyết null khi nó thực sự sai.
C. Bác bỏ giả thuyết thay thế khi nó thực sự đúng.
D. Chấp nhận giả thuyết thay thế khi nó thực sự sai.
26. Trong thống kê, ‘bậc tự do’ (degrees of freedom) thường liên quan đến điều gì?
A. Số lượng quan sát trong mẫu.
B. Số lượng biến trong mô hình.
C. Số lượng giá trị độc lập có thể thay đổi trong một phân tích thống kê.
D. Mức ý nghĩa của kiểm định.
27. Khi nào thì việc sử dụng ‘trung bình điều hòa’ (harmonic mean) phù hợp hơn so với ‘trung bình cộng’ (arithmetic mean)?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi dữ liệu chứa các giá trị âm.
C. Khi dữ liệu thể hiện tỷ lệ hoặc tốc độ.
D. Khi muốn loại bỏ ảnh hưởng của giá trị ngoại lệ.
28. Khi nào nên sử dụng kiểm định phi tham số thay vì kiểm định tham số?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi các giả định của kiểm định tham số không được đáp ứng.
D. Khi muốn so sánh trung bình của hai nhóm.
29. Chọn khẳng định đúng về mối quan hệ giữa trung bình, trung vị và mốt trong phân phối đối xứng.
A. Trung bình > Trung vị > Mốt.
B. Trung bình < Trung vị < Mốt.
C. Trung bình = Trung vị = Mốt.
D. Không có mối quan hệ nào giữa chúng.
30. Phương pháp nào sau đây phù hợp nhất để so sánh trung bình của ba nhóm độc lập trở lên?
A. Kiểm định t (t-test).
B. Phân tích phương sai (ANOVA).
C. Hồi quy tuyến tính.
D. Kiểm định Chi bình phương (Chi-squared test).
31. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết không (H0) là đúng.
B. Mức ý nghĩa thống kê được chọn trước.
C. Xác suất thu được kết quả kiểm định ít nhất cũng cực đoan như kết quả quan sát được, giả sử giả thuyết không (H0) là đúng.
D. Sai số chuẩn của thống kê kiểm định.
32. Trong phân tích độ tin cậy (reliability analysis), hệ số Cronbach’s alpha được sử dụng để đo lường điều gì?
A. Độ giá trị (validity) của một bài kiểm tra.
B. Độ tin cậy nội tại (internal consistency) của một thang đo.
C. Độ ổn định theo thời gian (test-retest reliability) của một bài kiểm tra.
D. Độ tin cậy giữa các người đánh giá (inter-rater reliability).
33. Trong kiểm định giả thuyết thống kê, sai lầm loại I (Type I error) xảy ra khi nào?
A. Chấp nhận giả thuyết không (H0) khi nó thực sự đúng.
B. Bác bỏ giả thuyết không (H0) khi nó thực sự sai.
C. Chấp nhận giả thuyết không (H0) khi nó thực sự sai.
D. Bác bỏ giả thuyết không (H0) khi nó thực sự đúng.
34. Trong phân tích hồi quy logistic, biến phụ thuộc (dependent variable) có đặc điểm gì?
A. Là một biến định lượng liên tục.
B. Là một biến định tính có hai giá trị (nhị phân).
C. Là một biến định tính có nhiều hơn hai giá trị.
D. Là một biến thời gian.
35. Trong phân tích hồi quy, phần dư (residual) là gì?
A. Giá trị dự đoán của biến phụ thuộc.
B. Sai số giữa giá trị thực tế và giá trị dự đoán của biến phụ thuộc.
C. Giá trị trung bình của biến phụ thuộc.
D. Độ lệch chuẩn của biến phụ thuộc.
36. Phương pháp nào sau đây được sử dụng để giảm số lượng biến trong một tập dữ liệu lớn trong khi vẫn giữ lại phần lớn thông tin?
A. Phân tích hồi quy.
B. Phân tích phương sai (ANOVA).
C. Phân tích thành phần chính (Principal Component Analysis – PCA).
D. Kiểm định Chi-bình phương.
37. Trong phân tích hồi quy đa biến, hiện tượng đa cộng tuyến (multicollinearity) xảy ra khi nào?
A. Khi có một giá trị ngoại lệ trong dữ liệu.
B. Khi các biến độc lập có tương quan cao với nhau.
C. Khi biến phụ thuộc không có phân phối chuẩn.
D. Khi mô hình hồi quy không phù hợp với dữ liệu.
38. Phương pháp nào sau đây được sử dụng để dự báo giá trị tương lai dựa trên dữ liệu chuỗi thời gian quá khứ?
A. Phân tích hồi quy tuyến tính.
B. Phân tích phương sai (ANOVA).
C. Mô hình ARIMA (Autoregressive Integrated Moving Average).
D. Kiểm định Chi-bình phương.
39. Chọn câu phát biểu đúng về ý nghĩa của khoảng tin cậy (confidence interval).
A. Khoảng tin cậy là khoảng giá trị mà chúng ta chắc chắn 100% rằng tham số quần thể nằm trong đó.
B. Khoảng tin cậy là khoảng giá trị mà chúng ta kỳ vọng tham số mẫu sẽ nằm trong đó.
C. Khoảng tin cậy là một khoảng giá trị được xây dựng sao cho nếu lặp lại việc lấy mẫu nhiều lần, thì một tỷ lệ nhất định (ví dụ, 95%) các khoảng tin cậy được xây dựng sẽ chứa tham số quần thể thực sự.
D. Khoảng tin cậy là khoảng giá trị mà chúng ta tin rằng tham số quần thể có khả năng cao nhất nằm trong đó.
40. Khi nào thì trung bình (mean) không phải là một thước đo tốt để đại diện cho trung tâm của dữ liệu?
A. Khi dữ liệu có phân phối đối xứng.
B. Khi dữ liệu có nhiều giá trị ngoại lệ (outliers).
C. Khi dữ liệu có kích thước mẫu lớn.
D. Khi dữ liệu có phương sai nhỏ.
41. Trong phân tích chuỗi thời gian, thành phần nào sau đây mô tả sự biến động ngắn hạn và không đều đặn?
A. Xu hướng (Trend).
B. Tính mùa vụ (Seasonality).
C. Tính chu kỳ (Cyclical).
D. Tính ngẫu nhiên (Irregularity).
42. Trong phân tích dữ liệu, kỹ thuật nào sau đây được sử dụng để khám phá các nhóm đối tượng tương tự nhau dựa trên nhiều biến?
A. Phân tích hồi quy.
B. Phân tích phương sai (ANOVA).
C. Phân tích cụm (Cluster analysis).
D. Kiểm định Chi-bình phương.
43. Khi nào thì trung vị (median) là một thước đo trung tâm tốt hơn so với trung bình (mean)?
A. Khi dữ liệu có phân phối chuẩn.
B. Khi dữ liệu có kích thước mẫu lớn.
C. Khi dữ liệu có nhiều giá trị ngoại lệ.
D. Khi dữ liệu có phương sai nhỏ.
44. Độ lệch chuẩn (standard deviation) đo lường điều gì?
A. Giá trị trung bình của một tập dữ liệu.
B. Mức độ phân tán của dữ liệu so với giá trị trung bình.
C. Mức độ tập trung của dữ liệu xung quanh giá trị trung vị.
D. Tổng của tất cả các giá trị trong tập dữ liệu.
45. Mục đích chính của việc lấy mẫu ngẫu nhiên là gì?
A. Giảm chi phí thu thập dữ liệu.
B. Đảm bảo mọi thành viên của quần thể đều có cơ hội được chọn vào mẫu.
C. Tăng kích thước mẫu.
D. Đơn giản hóa quá trình phân tích dữ liệu.
46. Điều gì xảy ra với độ rộng của khoảng tin cậy khi kích thước mẫu tăng lên, giả sử các yếu tố khác không đổi?
A. Độ rộng của khoảng tin cậy tăng lên.
B. Độ rộng của khoảng tin cậy giảm xuống.
C. Độ rộng của khoảng tin cậy không thay đổi.
D. Không thể xác định được sự thay đổi.
47. Trong phân tích phương sai (ANOVA), yếu tố nào sau đây được sử dụng để đánh giá sự khác biệt giữa các nhóm?
A. Tổng bình phương sai số (SSE).
B. Tổng bình phương giữa các nhóm (SSB).
C. Bậc tự do.
D. Giá trị trung bình.
48. Phương pháp nào sau đây thường được sử dụng để phân tích mối quan hệ giữa hai biến định tính?
A. Hệ số tương quan Pearson.
B. Phân tích phương sai (ANOVA).
C. Kiểm định Chi-bình phương (Chi-square test).
D. Hồi quy tuyến tính.
49. Sai số chuẩn (standard error) của trung bình mẫu đo lường điều gì?
A. Độ lệch chuẩn của quần thể.
B. Độ lệch chuẩn của mẫu.
C. Mức độ biến động của trung bình mẫu từ mẫu này sang mẫu khác.
D. Sai số do đo lường không chính xác.
50. Khi nào nên sử dụng kiểm định phi tham số (non-parametric test) thay vì kiểm định tham số (parametric test)?
A. Khi dữ liệu có phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi giả định về phân phối của dữ liệu không được đáp ứng.
D. Khi cần tính toán các tham số của quần thể.
51. Hệ số tương quan Pearson (Pearson correlation coefficient) có giá trị nằm trong khoảng nào?
A. Từ 0 đến 1.
B. Từ -1 đến 0.
C. Từ -1 đến 1.
D. Từ 0 đến vô cùng.
52. Trong thống kê mô tả, tứ phân vị (quartiles) chia dữ liệu thành bao nhiêu phần bằng nhau?
A. Hai phần.
B. Ba phần.
C. Bốn phần.
D. Năm phần.
53. Khi so sánh hai mẫu độc lập, kiểm định nào sau đây thường được sử dụng nếu dữ liệu không tuân theo phân phối chuẩn và kích thước mẫu nhỏ?
A. Kiểm định t (t-test).
B. Kiểm định z (z-test).
C. Kiểm định Mann-Whitney U.
D. Phân tích phương sai (ANOVA).
54. Trong kiểm định giả thuyết, mức ý nghĩa (significance level) thường được ký hiệu là α (alpha) đại diện cho điều gì?
A. Xác suất mắc sai lầm loại II.
B. Xác suất chấp nhận giả thuyết không khi nó đúng.
C. Xác suất mắc sai lầm loại I.
D. Công suất kiểm định (power of the test).
55. Mục đích của việc chuẩn hóa dữ liệu (data normalization) là gì?
A. Loại bỏ các giá trị ngoại lệ.
B. Chuyển đổi dữ liệu về cùng một thang đo để so sánh và phân tích dễ dàng hơn.
C. Đảm bảo dữ liệu có phân phối chuẩn.
D. Tăng kích thước mẫu.
56. Khi nào nên sử dụng kiểm định t (t-test) thay vì kiểm định z (z-test) để so sánh trung bình của hai mẫu?
A. Khi kích thước mẫu lớn (n > 30).
B. Khi phương sai của quần thể đã biết.
C. Khi kích thước mẫu nhỏ (n < 30) và phương sai của quần thể chưa biết.
D. Khi các mẫu không độc lập.
57. Trong lý thuyết xác suất, hai sự kiện được gọi là độc lập nếu điều gì xảy ra?
A. Chúng không thể xảy ra cùng một lúc.
B. Xác suất của sự kiện này ảnh hưởng đến xác suất của sự kiện kia.
C. Xác suất của sự kiện này không ảnh hưởng đến xác suất của sự kiện kia.
D. Tổng xác suất của chúng bằng 1.
58. Trong phân tích hồi quy tuyến tính đơn giản, hệ số xác định (R-squared) đo lường điều gì?
A. Mức độ ý nghĩa thống kê của các biến độc lập.
B. Độ mạnh của mối quan hệ giữa các biến độc lập.
C. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi biến độc lập.
D. Sai số chuẩn của ước lượng.
59. Điều gì xảy ra với công suất kiểm định (power of a test) khi kích thước mẫu tăng lên?
A. Công suất kiểm định tăng lên.
B. Công suất kiểm định giảm xuống.
C. Công suất kiểm định không thay đổi.
D. Không thể xác định được sự thay đổi.
60. Khi thực hiện kiểm định giả thuyết một đuôi (one-tailed test), điều gì khác biệt so với kiểm định hai đuôi (two-tailed test)?
A. Giá trị p được nhân đôi trong kiểm định một đuôi.
B. Miền bác bỏ (rejection region) nằm ở cả hai phía của phân phối trong kiểm định một đuôi.
C. Giả thuyết thay thế (alternative hypothesis) chỉ định hướng của sự khác biệt trong kiểm định một đuôi.
D. Kiểm định một đuôi luôn có kết quả chính xác hơn kiểm định hai đuôi.
61. Một nhà nghiên cứu muốn tìm hiểu xem có sự khác biệt về tỷ lệ người hút thuốc giữa hai thành phố hay không. Kiểm định nào phù hợp?
A. Kiểm định t.
B. Phân tích phương sai (ANOVA).
C. Kiểm định Chi bình phương (Chi-square test).
D. Hồi quy tuyến tính (Linear regression).
62. Khi dữ liệu không tuân theo phân phối chuẩn, phương pháp nào sau đây thích hợp để so sánh hai nhóm độc lập?
A. Kiểm định t Student.
B. Kiểm định Mann-Whitney U.
C. Phân tích phương sai (ANOVA).
D. Hồi quy tuyến tính.
63. Một cửa hàng muốn xác định xem có mối liên hệ giữa việc mua sản phẩm A và sản phẩm B hay không. Nên sử dụng phương pháp nào?
A. Kiểm định t.
B. Phân tích phương sai (ANOVA).
C. Phân tích tương quan (Correlation analysis).
D. Kiểm định Chi bình phương (Chi-square test).
64. Phương pháp nào sau đây được sử dụng để giảm số lượng biến trong một tập dữ liệu lớn trong khi vẫn giữ lại thông tin quan trọng?
A. Phân tích hồi quy (Regression analysis).
B. Phân tích phương sai (ANOVA).
C. Phân tích thành phần chính (Principal Component Analysis – PCA).
D. Phân tích tương quan (Correlation analysis).
65. Khi nào nên sử dụng trung vị (median) thay vì trung bình (mean) để đo lường xu hướng trung tâm?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi có giá trị ngoại lệ (outliers) trong dữ liệu.
C. Khi muốn tính toán nhanh chóng.
D. Khi dữ liệu có tính mùa vụ.
66. Trong kiểm định giả thuyết, giá trị tới hạn (critical value) được sử dụng để làm gì?
A. Ước lượng tham số của quần thể.
B. Xác định mức ý nghĩa (alpha).
C. So sánh với thống kê kiểm định để quyết định bác bỏ hay chấp nhận giả thuyết H0.
D. Tính toán khoảng tin cậy.
67. Trong thống kê suy luận, khoảng tin cậy (confidence interval) là gì?
A. Một giá trị duy nhất ước tính cho tham số của quần thể.
B. Một khoảng giá trị mà tham số của quần thể có khả năng nằm trong đó với một độ tin cậy nhất định.
C. Một thước đo độ phân tán của dữ liệu.
D. Một phương pháp để kiểm định giả thuyết.
68. Trong mô hình hóa dữ liệu, oversampling được sử dụng khi nào?
A. Khi dữ liệu có quá nhiều biến.
B. Khi dữ liệu bị thiếu.
C. Khi một lớp trong dữ liệu phân loại chiếm tỷ lệ rất nhỏ.
D. Khi cần tăng tốc độ xử lý dữ liệu.
69. Giá trị nào sau đây không thể là một xác suất?
70. Khi phân tích dữ liệu khảo sát, phương pháp nào phù hợp để tìm ra các nhóm khách hàng có đặc điểm tương đồng?
A. Phân tích hồi quy.
B. Phân tích phương sai.
C. Phân tích cụm (Cluster analysis).
D. Phân tích chuỗi thời gian.
71. Trong phân tích dữ liệu lớn, kỹ thuật nào sau đây được sử dụng để khám phá các mẫu (patterns) ẩn trong dữ liệu?
A. Thống kê mô tả.
B. Khai phá dữ liệu (Data mining).
C. Kiểm định giả thuyết.
D. Phân tích hồi quy.
72. Hệ số tương quan Pearson đo lường điều gì?
A. Mức độ biến động của dữ liệu.
B. Mức độ quan hệ tuyến tính giữa hai biến định lượng.
C. Mức độ quan hệ phi tuyến tính giữa hai biến định tính.
D. Mức độ phân tán của dữ liệu so với trung bình.
73. Trong lý thuyết xác suất, biến cố độc lập là gì?
A. Hai biến cố không thể xảy ra cùng một lúc.
B. Xác suất xảy ra biến cố này ảnh hưởng đến xác suất xảy ra biến cố kia.
C. Xác suất xảy ra biến cố này không ảnh hưởng đến xác suất xảy ra biến cố kia.
D. Tổng xác suất của hai biến cố bằng 1.
74. Trong kiểm định giả thuyết, mức ý nghĩa (alpha) thường được đặt ở mức nào?
A. 0.01
B. 0.05
C. 0.10
D. Tất cả các đáp án trên, tùy thuộc vào mức độ rủi ro chấp nhận được.
75. Trong kiểm định giả thuyết thống kê, sai lầm loại I xảy ra khi nào?
A. Chấp nhận giả thuyết H0 khi nó sai.
B. Bác bỏ giả thuyết H0 khi nó đúng.
C. Không bác bỏ giả thuyết H0 khi nó đúng.
D. Không bác bỏ giả thuyết H0 khi nó sai.
76. Trong phân tích hồi quy tuyến tính, giá trị p (p-value) được sử dụng để làm gì?
A. Đánh giá độ mạnh của mối quan hệ giữa các biến.
B. Kiểm tra ý nghĩa thống kê của các hệ số hồi quy.
C. Đo lường mức độ phù hợp của mô hình với dữ liệu.
D. Xác định biến độc lập quan trọng nhất.
77. Trong phân tích hồi quy đa biến, hiện tượng đa cộng tuyến (multicollinearity) xảy ra khi nào?
A. Khi các biến độc lập có mối tương quan cao với nhau.
B. Khi biến phụ thuộc không tuân theo phân phối chuẩn.
C. Khi có quá nhiều biến độc lập trong mô hình.
D. Khi mô hình không phù hợp với dữ liệu.
78. Trong phân tích survival, hàm Kaplan-Meier dùng để ước tính cái gì?
A. Tỷ lệ tử vong tức thời.
B. Thời gian sống trung bình.
C. Hàm sống sót.
D. Nguy cơ tương đối.
79. Một nhà quản lý muốn dự đoán doanh số bán hàng dựa trên chi phí quảng cáo. Phương pháp thống kê nào phù hợp nhất?
A. Kiểm định t.
B. Phân tích phương sai (ANOVA).
C. Hồi quy tuyến tính (Linear regression).
D. Kiểm định Chi bình phương (Chi-square test).
80. Một nhà kinh tế sử dụng mô hình ARIMA để dự báo GDP. ARIMA là viết tắt của?
A. AutoRegressive Integrated Moving Average.
B. Adjusted Regression and Integrated Moving Average.
C. Automatic Regression and Interval Moving Average.
D. Advanced Regression and Integrated Modeling Approach.
81. Kiểm định Chi bình phương (Chi-square test) thường được sử dụng để làm gì?
A. So sánh trung bình của hai nhóm.
B. Kiểm tra sự độc lập giữa hai biến định tính.
C. Đo lường mối quan hệ tuyến tính giữa hai biến định lượng.
D. Dự đoán giá trị của một biến dựa trên biến khác.
82. Trong phân tích độ tin cậy, hệ số Cronbach’s alpha được sử dụng để đo lường điều gì?
A. Mức độ ổn định của kết quả theo thời gian.
B. Mức độ tương quan giữa các biến.
C. Mức độ nhất quán nội tại của một thang đo.
D. Mức độ phù hợp của mô hình với dữ liệu.
83. Phương pháp nào sau đây phù hợp nhất để so sánh trung bình của ba nhóm độc lập trở lên?
A. Kiểm định t (t-test).
B. Phân tích phương sai (ANOVA).
C. Kiểm định Chi bình phương (Chi-square test).
D. Hồi quy tuyến tính (Linear regression).
84. Phương pháp nào sau đây được sử dụng để kiểm tra tính dừng (stationarity) của một chuỗi thời gian?
A. Kiểm định t.
B. Kiểm định Chi bình phương (Chi-square test).
C. Kiểm định Dickey-Fuller.
D. Phân tích phương sai (ANOVA).
85. Trong thống kê mô tả, độ lệch chuẩn đo lường điều gì?
A. Giá trị trung bình của dữ liệu.
B. Mức độ phân tán của dữ liệu so với giá trị trung bình.
C. Giá trị lớn nhất trong tập dữ liệu.
D. Giá trị nhỏ nhất trong tập dữ liệu.
86. Trong phân tích chuỗi thời gian, thành phần nào sau đây mô tả sự biến động ngẫu nhiên và không thể dự đoán?
A. Xu hướng (Trend).
B. Tính mùa vụ (Seasonality).
C. Chu kỳ (Cycle).
D. Tính bất thường (Irregularity).
87. Một nhà phân tích muốn xác định xem có sự khác biệt về doanh thu giữa các khu vực địa lý khác nhau hay không, sau khi đã kiểm soát ảnh hưởng của chi phí quảng cáo. Phương pháp nào phù hợp?
A. Kiểm định t.
B. Phân tích phương sai (ANOVA).
C. Phân tích hiệp phương sai (ANCOVA).
D. Hồi quy tuyến tính đơn.
88. Một công ty muốn khảo sát mức độ hài lòng của khách hàng. Thang đo Likert là gì?
A. Một phương pháp thu thập dữ liệu định lượng.
B. Một loại biểu đồ thể hiện tần suất.
C. Một thang đo định tính thường dùng để đo lường thái độ, ý kiến.
D. Một kỹ thuật phân tích hồi quy.
89. Khi nào nên sử dụng kiểm định phi tham số thay vì kiểm định tham số?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi cỡ mẫu lớn.
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc cỡ mẫu nhỏ.
D. Khi muốn so sánh phương sai của hai nhóm.
90. Trong phân tích phương sai (ANOVA), yếu tố nào sau đây ảnh hưởng đến giá trị F?
A. Kích thước mẫu.
B. Phương sai giữa các nhóm.
C. Phương sai trong các nhóm.
D. Tất cả các đáp án trên.
91. Sai số chuẩn (standard error) của trung bình mẫu đo lường điều gì?
A. Độ lệch chuẩn của mẫu.
B. Độ lệch chuẩn của phân phối lấy mẫu của trung bình mẫu.
C. Sai số do đo lường không chính xác.
D. Phương sai của mẫu.
92. Phương pháp nào sau đây được sử dụng để tìm ra các phân đoạn khách hàng khác nhau dựa trên đặc điểm của họ?
A. Phân tích hồi quy.
B. Phân tích phương sai.
C. Phân tích cụm (Cluster analysis).
D. Phân tích chuỗi thời gian.
93. Thang đo nào sau đây là thang đo định danh?
A. Nhiệt độ (độ C).
B. Thu nhập (VND).
C. Màu sắc (Đỏ, Xanh, Vàng).
D. Xếp hạng (Nhất, Nhì, Ba).
94. Phương pháp nào sau đây được sử dụng để giảm số lượng biến trong một tập dữ liệu lớn trong khi vẫn giữ lại thông tin quan trọng?
A. Phân tích hồi quy.
B. Phân tích phương sai.
C. Phân tích thành phần chính (Principal Component Analysis – PCA).
D. Kiểm định Chi bình phương.
95. Khi nào nên sử dụng kiểm định Chi bình phương (Chi-square test)?
A. Khi so sánh trung bình của hai nhóm.
B. Khi phân tích mối quan hệ giữa hai biến định tính.
C. Khi dự đoán giá trị của một biến liên tục.
D. Khi kiểm tra tính chuẩn của dữ liệu.
96. Phương pháp nào sau đây thường được sử dụng để kiểm tra sự khác biệt giữa trung bình của hai mẫu độc lập?
A. Phân tích phương sai (ANOVA).
B. Kiểm định t (t-test).
C. Hồi quy tuyến tính.
D. Kiểm định Chi bình phương (Chi-square test).
97. Trong phân tích phương sai (ANOVA), yếu tố nào sau đây được kiểm tra?
A. Sự khác biệt giữa các phương sai của các nhóm.
B. Sự khác biệt giữa các trung bình của các nhóm.
C. Mối quan hệ giữa các biến định tính.
D. Tính chuẩn của dữ liệu.
98. Phương pháp nào sau đây được sử dụng để ước lượng tham số của một tổng thể dựa trên dữ liệu mẫu?
A. Thống kê mô tả.
B. Suy luận thống kê.
C. Phân tích hồi quy.
D. Phân tích phương sai.
99. Khi nào nên sử dụng kiểm định Mann-Whitney U?
A. Khi so sánh trung bình của hai mẫu độc lập và dữ liệu tuân theo phân phối chuẩn.
B. Khi so sánh trung bình của hai mẫu phụ thuộc và dữ liệu tuân theo phân phối chuẩn.
C. Khi so sánh trung bình của hai mẫu độc lập và dữ liệu không tuân theo phân phối chuẩn.
D. Khi so sánh tỷ lệ của hai mẫu độc lập.
100. Trong phân tích hồi quy logistic, biến phụ thuộc là loại biến gì?
A. Biến liên tục.
B. Biến định tính có hai giá trị (binary).
C. Biến định tính có nhiều hơn hai giá trị.
D. Biến thứ bậc.
101. Trong kiểm định giả thuyết, mức ý nghĩa (significance level) thường được ký hiệu là gì?
102. Trong lý thuyết xác suất, quy tắc cộng xác suất (addition rule) được sử dụng khi nào?
A. Khi các sự kiện độc lập.
B. Khi các sự kiện phụ thuộc.
C. Khi các sự kiện xung khắc.
D. Khi các sự kiện chắc chắn xảy ra.
103. Độ lệch chuẩn (standard deviation) đo lường điều gì?
A. Giá trị trung bình của dữ liệu.
B. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình.
C. Mức độ lệch của dữ liệu so với phân phối chuẩn.
D. Giá trị lớn nhất của dữ liệu.
104. Trong phân tích hồi quy tuyến tính, hệ số xác định (R-squared) đo lường điều gì?
A. Mức độ ý nghĩa thống kê của các biến độc lập.
B. Mức độ phù hợp của mô hình hồi quy với dữ liệu.
C. Độ lớn của hệ số hồi quy.
D. Phương sai của sai số.
105. Trong phân tích hồi quy, hiện tượng đa cộng tuyến (multicollinearity) xảy ra khi nào?
A. Khi biến phụ thuộc tương quan với chính nó.
B. Khi các biến độc lập có mối tương quan cao với nhau.
C. Khi biến phụ thuộc không tuân theo phân phối chuẩn.
D. Khi mô hình hồi quy không phù hợp với dữ liệu.
106. Khi nào nên sử dụng kiểm định phi tham số?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc kích thước mẫu nhỏ.
D. Khi phân tích mối quan hệ giữa các biến định tính.
107. Trong phân tích chuỗi thời gian, thành phần nào sau đây thể hiện sự biến động ngắn hạn và không đều đặn?
A. Xu hướng (Trend).
B. Tính thời vụ (Seasonality).
C. Chu kỳ (Cycle).
D. Tính ngẫu nhiên (Irregularity).
108. Một nhà nghiên cứu muốn so sánh hiệu quả của ba phương pháp giảng dạy khác nhau. Phương pháp thống kê nào phù hợp?
A. Kiểm định t (t-test).
B. Phân tích phương sai (ANOVA).
C. Hồi quy tuyến tính.
D. Kiểm định Chi bình phương.
109. Một cửa hàng muốn phân tích xem có mối liên hệ giữa giới tính của khách hàng và loại sản phẩm họ mua hay không. Phương pháp nào phù hợp?
A. Kiểm định t (t-test).
B. Phân tích phương sai (ANOVA).
C. Hồi quy tuyến tính.
D. Kiểm định Chi bình phương.
110. Một nhà quản lý muốn theo dõi số lượng sản phẩm bị lỗi trong quá trình sản xuất. Loại biểu đồ nào phù hợp nhất?
A. Biểu đồ phân tán (Scatter plot).
B. Biểu đồ hộp (Box plot).
C. Biểu đồ kiểm soát (Control chart).
D. Biểu đồ Pareto.
111. Hệ số tương quan Pearson đo lường điều gì?
A. Mức độ biến động của dữ liệu.
B. Mối quan hệ tuyến tính giữa hai biến định lượng.
C. Mối quan hệ phi tuyến tính giữa hai biến định lượng.
D. Mối quan hệ giữa hai biến định tính.
112. Một công ty muốn dự đoán doanh số bán hàng dựa trên chi phí quảng cáo. Phương pháp thống kê nào phù hợp nhất?
A. Kiểm định Chi bình phương.
B. Phân tích phương sai (ANOVA).
C. Hồi quy tuyến tính.
D. Thống kê mô tả.
113. Giá trị trung vị (median) là gì?
A. Giá trị trung bình của dữ liệu.
B. Giá trị xuất hiện nhiều nhất trong dữ liệu.
C. Giá trị nằm giữa của dữ liệu đã sắp xếp.
D. Tổng của tất cả các giá trị chia cho số lượng giá trị.
114. Điều gì xảy ra với khoảng tin cậy khi kích thước mẫu tăng lên?
A. Khoảng tin cậy trở nên rộng hơn.
B. Khoảng tin cậy không thay đổi.
C. Khoảng tin cậy trở nên hẹp hơn.
D. Khoảng tin cậy biến mất.
115. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết H0 là đúng.
B. Xác suất mắc sai lầm loại I.
C. Xác suất thu được kết quả quan sát được (hoặc kết quả cực đoan hơn) nếu giả thuyết H0 là đúng.
D. Xác suất mắc sai lầm loại II.
116. Trong thống kê mô tả, tứ phân vị (quartiles) chia dữ liệu thành bao nhiêu phần bằng nhau?
117. Khi nào nên sử dụng kiểm định Wilcoxon signed-rank?
A. Khi so sánh trung bình của hai mẫu độc lập và dữ liệu tuân theo phân phối chuẩn.
B. Khi so sánh trung bình của hai mẫu phụ thuộc và dữ liệu tuân theo phân phối chuẩn.
C. Khi so sánh trung bình của hai mẫu độc lập và dữ liệu không tuân theo phân phối chuẩn.
D. Khi so sánh trung bình của hai mẫu phụ thuộc và dữ liệu không tuân theo phân phối chuẩn.
118. Trong kiểm định giả thuyết, sai lầm loại I (Type I error) xảy ra khi nào?
A. Chấp nhận giả thuyết H0 khi nó đúng.
B. Bác bỏ giả thuyết H0 khi nó sai.
C. Chấp nhận giả thuyết H0 khi nó sai.
D. Bác bỏ giả thuyết H0 khi nó đúng.
119. Trong phân tích phương sai (ANOVA) hai yếu tố, điều gì được kiểm tra?
A. Ảnh hưởng của một yếu tố duy nhất lên biến phụ thuộc.
B. Ảnh hưởng của hai yếu tố lên biến phụ thuộc và tương tác giữa chúng.
C. Mối quan hệ giữa hai biến độc lập.
D. Tính chuẩn của dữ liệu.
120. Ý nghĩa của khoảng tin cậy (confidence interval) là gì?
A. Xác suất giá trị tham số nằm trong khoảng đó.
B. Khoảng giá trị mà chúng ta tin rằng tham số tổng thể nằm trong đó với một mức độ tin cậy nhất định.
C. Độ lệch chuẩn của mẫu.
D. Giá trị trung bình của mẫu.
121. Khi nào nên sử dụng kiểm định Chi-square?
A. Khi so sánh trung bình của hai nhóm độc lập.
B. Khi phân tích mối quan hệ giữa hai biến định tính.
C. Khi kiểm tra sự khác biệt giữa các phương sai.
D. Khi phân tích hồi quy tuyến tính.
122. Trong phân tích rủi ro, giá trị kỳ vọng (expected value) được tính như thế nào?
A. Trung bình cộng của tất cả các kết quả có thể.
B. Tổng của các kết quả có thể nhân với xác suất tương ứng của chúng.
C. Kết quả có khả năng xảy ra cao nhất.
D. Độ lệch chuẩn của các kết quả có thể.
123. Ý nghĩa của hệ số xác định (R-squared) trong mô hình hồi quy là gì?
A. Đo lường mức độ tương quan giữa các biến độc lập.
B. Đo lường tỷ lệ phương sai của biến phụ thuộc được giải thích bởi các biến độc lập trong mô hình.
C. Đo lường mức độ phù hợp của mô hình với dữ liệu.
D. Đo lường sai số chuẩn của các hệ số hồi quy.
124. Khi nào nên sử dụng kiểm định t-Student thay vì kiểm định z?
A. Khi kích thước mẫu lớn (n > 30) và độ lệch chuẩn của tổng thể đã biết.
B. Khi kích thước mẫu nhỏ (n < 30) và độ lệch chuẩn của tổng thể chưa biết.
C. Khi dữ liệu tuân theo phân phối chuẩn.
D. Khi cần so sánh hai trung bình mẫu độc lập.
125. Ý nghĩa của việc sử dụng phương pháp lấy mẫu ngẫu nhiên là gì?
A. Đảm bảo mẫu có kích thước lớn.
B. Giảm thiểu sai số hệ thống và tăng tính đại diện của mẫu cho tổng thể.
C. Đơn giản hóa quá trình thu thập dữ liệu.
D. Tăng tính chính xác của các phép đo.
126. Trong phân tích độ tin cậy (reliability analysis), hệ số Cronbach’s alpha được sử dụng để đánh giá điều gì?
A. Mức độ tương quan giữa các biến.
B. Mức độ phù hợp của mô hình thống kê.
C. Mức độ nhất quán nội tại của một thang đo.
D. Mức độ tin cậy giữa các người đánh giá.
127. Trong kiểm định giả thuyết, lỗi loại I (Type I error) là gì?
A. Chấp nhận giả thuyết H0 khi nó sai.
B. Bác bỏ giả thuyết H0 khi nó đúng.
C. Không bác bỏ giả thuyết H0 khi nó sai.
D. Bác bỏ giả thuyết H0 khi nó sai.
128. Trong kiểm định giả thuyết, mức ý nghĩa (alpha) thể hiện điều gì?
A. Xác suất mắc lỗi loại II.
B. Xác suất bác bỏ giả thuyết H0 khi H0 đúng.
C. Xác suất chấp nhận giả thuyết H0 khi H0 sai.
D. Xác suất chấp nhận giả thuyết H0 khi H0 đúng.
129. Độ lệch chuẩn (standard deviation) đo lường điều gì?
A. Mức độ tập trung của dữ liệu xung quanh trung bình.
B. Mức độ phân tán của dữ liệu xung quanh trung bình.
C. Giá trị lớn nhất trong tập dữ liệu.
D. Giá trị trung bình của tập dữ liệu.
130. Phân phối Poisson thường được sử dụng để mô hình hóa điều gì?
A. Xác suất thành công trong một loạt các thử nghiệm độc lập.
B. Số lượng sự kiện xảy ra trong một khoảng thời gian hoặc không gian nhất định.
C. Phân phối của dữ liệu liên tục.
D. Phân phối của dữ liệu nhị phân.
131. Phương pháp Monte Carlo được sử dụng để làm gì?
A. Để giải các bài toán tối ưu hóa.
B. Để mô phỏng các hệ thống phức tạp bằng cách sử dụng các số ngẫu nhiên.
C. Để phân tích dữ liệu chuỗi thời gian.
D. Để kiểm định giả thuyết thống kê.
132. Trong phân tích phương sai (ANOVA), yếu tố nào được sử dụng để so sánh sự khác biệt giữa các nhóm?
A. Tổng bình phương sai số (SSE).
B. Tổng bình phương giữa các nhóm (SSB).
C. Thống kê t.
D. Hệ số tương quan.
133. Khi nào thì nên sử dụng phương pháp lấy mẫu phân tầng (stratified sampling)?
A. Khi tổng thể đồng nhất.
B. Khi muốn đảm bảo tính đại diện của các nhóm khác nhau trong tổng thể.
C. Khi không có thông tin về tổng thể.
D. Khi muốn tiết kiệm chi phí thu thập dữ liệu.
134. Trong thống kê mô tả, tứ phân vị (quartile) được sử dụng để làm gì?
A. Đo lường độ lệch chuẩn của dữ liệu.
B. Chia dữ liệu thành bốn phần bằng nhau.
C. Tính trung bình của dữ liệu.
D. Tìm giá trị lớn nhất và nhỏ nhất của dữ liệu.
135. Biến giả (dummy variable) được sử dụng để làm gì trong mô hình hồi quy?
A. Để biểu diễn các biến định lượng.
B. Để biểu diễn các biến định tính.
C. Để loại bỏ các giá trị ngoại lệ.
D. Để giảm hiện tượng đa cộng tuyến.
136. Trong phân tích chuỗi thời gian, thành phần xu hướng (trend) mô tả điều gì?
A. Sự biến động ngẫu nhiên trong chuỗi thời gian.
B. Sự biến động có tính chu kỳ trong chuỗi thời gian.
C. Sự biến động dài hạn và có hướng trong chuỗi thời gian.
D. Sự biến động theo mùa trong chuỗi thời gian.
137. Trong phân tích hồi quy đa biến, hiện tượng đa cộng tuyến (multicollinearity) xảy ra khi nào?
A. Khi có một biến độc lập có tác động lớn đến biến phụ thuộc.
B. Khi các biến độc lập có mối tương quan cao với nhau.
C. Khi mô hình hồi quy không phù hợp với dữ liệu.
D. Khi có quá nhiều biến độc lập trong mô hình.
138. Hệ số tương quan Pearson đo lường điều gì?
A. Mức độ biến động của dữ liệu.
B. Mức độ quan hệ tuyến tính giữa hai biến định lượng.
C. Mức độ quan hệ phi tuyến tính giữa hai biến định tính.
D. Mức độ phù hợp của mô hình hồi quy.
139. Trong kiểm định phi tham số, kiểm định Mann-Whitney U được sử dụng để làm gì?
A. So sánh trung bình của hai mẫu độc lập khi dữ liệu không tuân theo phân phối chuẩn.
B. So sánh phương sai của hai mẫu độc lập.
C. Phân tích mối quan hệ giữa hai biến định tính.
D. Kiểm tra tính độc lập của các biến.
140. Trong phân tích phương sai (ANOVA) hai yếu tố, điều gì được kiểm tra?
A. Ảnh hưởng của một yếu tố duy nhất lên biến phụ thuộc.
B. Ảnh hưởng của hai yếu tố và tương tác giữa chúng lên biến phụ thuộc.
C. Mối quan hệ giữa hai biến độc lập.
D. Độ tin cậy của dữ liệu.
141. Ý nghĩa của việc sử dụng kiểm định Shapiro-Wilk là gì?
A. Để kiểm tra tính độc lập của các biến.
B. Để kiểm tra xem dữ liệu có tuân theo phân phối chuẩn hay không.
C. Để so sánh trung bình của hai mẫu độc lập.
D. Để phân tích mối quan hệ giữa hai biến định tính.
142. Trong phân tích sống sót (survival analysis), hàm sống sót (survival function) biểu thị điều gì?
A. Xác suất một sự kiện xảy ra tại một thời điểm cụ thể.
B. Xác suất một sự kiện không xảy ra trước một thời điểm cụ thể.
C. Thời gian trung bình cho đến khi một sự kiện xảy ra.
D. Tỷ lệ các sự kiện xảy ra trong một khoảng thời gian nhất định.
143. Phân tích cụm (cluster analysis) được sử dụng để làm gì?
A. Để dự đoán giá trị của một biến phụ thuộc.
B. Để phân nhóm các đối tượng có đặc điểm tương đồng thành các cụm.
C. Để kiểm định giả thuyết về sự khác biệt giữa các nhóm.
D. Để đo lường mối quan hệ giữa các biến.
144. Trong phân tích thành phần chính (principal component analysis – PCA), mục tiêu chính là gì?
A. Để phân nhóm các đối tượng có đặc điểm tương đồng.
B. Để giảm số lượng biến bằng cách tạo ra các biến mới không tương quan tuyến tính.
C. Để dự đoán giá trị của một biến phụ thuộc.
D. Để kiểm định giả thuyết về sự khác biệt giữa các nhóm.
145. Mục đích của việc chuẩn hóa dữ liệu (standardization) là gì?
A. Để chuyển đổi dữ liệu về cùng một đơn vị đo lường.
B. Để loại bỏ các giá trị ngoại lệ.
C. Để đưa dữ liệu về phân phối chuẩn.
D. Để dữ liệu có trung bình bằng 0 và độ lệch chuẩn bằng 1.
146. Khi nào thì việc sử dụng thống kê phi tham số là phù hợp?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc có thang đo thứ bậc.
D. Khi cần tính toán trung bình mẫu.
147. Trong hồi quy tuyến tính, hệ số chặn (intercept) biểu thị điều gì?
A. Sự thay đổi của biến độc lập khi biến phụ thuộc tăng một đơn vị.
B. Giá trị dự đoán của biến phụ thuộc khi tất cả các biến độc lập bằng 0.
C. Mức độ phù hợp của mô hình hồi quy.
D. Sai số chuẩn của các hệ số hồi quy.
148. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết H0 là đúng.
B. Xác suất thu được kết quả như quan sát (hoặc cực đoan hơn) nếu giả thuyết H0 là đúng.
C. Xác suất mắc lỗi loại I.
D. Xác suất mắc lỗi loại II.
149. Khi nào thì nên sử dụng kiểm định Kruskal-Wallis?
A. Để so sánh trung bình của hai mẫu độc lập.
B. Để so sánh trung bình của ba hoặc nhiều hơn các mẫu độc lập khi dữ liệu không tuân theo phân phối chuẩn.
C. Để phân tích mối quan hệ giữa hai biến định tính.
D. Để kiểm tra tính độc lập của các biến.
150. Mục đích của việc sử dụng khoảng tin cậy (confidence interval) là gì?
A. Để ước lượng giá trị trung bình của mẫu.
B. Để ước lượng một khoảng giá trị mà tham số tổng thể có khả năng nằm trong đó.
C. Để kiểm định giả thuyết thống kê.
D. Để đo lường độ lệch chuẩn của tổng thể.