1. Trong phân tích hồi quy, ‘sai số’ (residual) được định nghĩa là gì?
A. Giá trị trung bình của biến phụ thuộc.
B. Giá trị dự đoán của biến phụ thuộc.
C. Sự khác biệt giữa giá trị thực tế và giá trị dự đoán của biến phụ thuộc.
D. Độ lệch chuẩn của biến phụ thuộc.
2. Trong phân tích hồi quy bội, khi nào thì xảy ra hiện tượng đa cộng tuyến (multicollinearity)?
A. Khi biến phụ thuộc có tương quan cao với chính nó.
B. Khi các biến độc lập có tương quan cao với nhau.
C. Khi sai số có tương quan với các biến độc lập.
D. Khi mô hình hồi quy không tuyến tính.
3. Một công ty muốn khảo sát mức độ hài lòng của khách hàng. Họ gửi email khảo sát đến 500 khách hàng đã mua sản phẩm trong tháng trước và nhận được phản hồi từ 100 khách hàng. Đây là loại mẫu nào?
A. Mẫu ngẫu nhiên đơn giản.
B. Mẫu phân tầng.
C. Mẫu thuận tiện.
D. Mẫu hệ thống.
4. Khi nào thì trung bình (mean) không phải là thước đo tốt để đại diện cho trung tâm của dữ liệu?
A. Khi dữ liệu có phân phối chuẩn.
B. Khi dữ liệu có giá trị ngoại lệ (outliers).
C. Khi dữ liệu có kích thước mẫu lớn.
D. Khi dữ liệu có phương sai nhỏ.
5. Một cửa hàng bán lẻ muốn xác định xem có mối quan hệ giữa số lượng khách hàng đến cửa hàng và doanh thu hàng ngày hay không. Họ nên sử dụng phương pháp thống kê nào?
A. Kiểm định t độc lập.
B. Kiểm định Chi bình phương.
C. Phân tích tương quan.
D. Phân tích phương sai (ANOVA).
6. Khi nào nên sử dụng kiểm định t (t-test) thay vì kiểm định z (z-test) để so sánh trung bình của hai mẫu?
A. Khi kích thước mẫu lớn (n > 30).
B. Khi độ lệch chuẩn của quần thể đã biết.
C. Khi kích thước mẫu nhỏ (n < 30) và độ lệch chuẩn của quần thể chưa biết.
D. Khi muốn so sánh phương sai của hai mẫu.
7. Khi nào nên sử dụng phân tích phương sai (ANOVA)?
A. Để so sánh trung bình của hai nhóm.
B. Để phân tích mối quan hệ giữa hai biến định lượng.
C. Để so sánh trung bình của ba nhóm trở lên.
D. Để dự đoán giá trị của một biến dựa trên các biến khác.
8. Trong kiểm định giả thuyết thống kê, sai lầm loại I xảy ra khi nào?
A. Chấp nhận giả thuyết H0 khi nó sai.
B. Bác bỏ giả thuyết H0 khi nó đúng.
C. Không bác bỏ giả thuyết H0 khi nó đúng.
D. Bác bỏ giả thuyết H0 khi nó sai.
9. Ý nghĩa của khoảng tin cậy 95% là gì?
A. Có 95% khả năng tham số của quần thể nằm trong khoảng này.
B. Nếu lặp lại quá trình lấy mẫu nhiều lần, 95% các khoảng tin cậy được tạo ra sẽ chứa tham số của quần thể.
C. Sai số chuẩn của ước lượng là 5%.
D. Mức ý nghĩa của kiểm định là 5%.
10. Trong phân tích hồi quy, sai số chuẩn của hệ số hồi quy (standard error of the regression coefficient) đo lường điều gì?
A. Mức độ phù hợp của mô hình hồi quy.
B. Độ chính xác của ước lượng hệ số hồi quy.
C. Mức độ phân tán của dữ liệu xung quanh đường hồi quy.
D. Mức độ tương quan giữa các biến độc lập.
11. Trong phân tích hồi quy tuyến tính, hệ số xác định (R-squared) đo lường điều gì?
A. Mức độ mạnh yếu của mối quan hệ giữa các biến.
B. Tỷ lệ phần trăm phương sai của biến phụ thuộc được giải thích bởi các biến độc lập.
C. Độ dốc của đường hồi quy.
D. Sai số chuẩn của các ước lượng hệ số.
12. Trong thống kê mô tả, đại lượng nào đo lường mức độ phân tán của dữ liệu xung quanh giá trị trung bình?
A. Trung vị.
B. Mode.
C. Độ lệch chuẩn.
D. Tần số.
13. Trong phân tích chuỗi thời gian, phương pháp trung bình trượt (moving average) được sử dụng để làm gì?
A. Dự đoán các giá trị tương lai.
B. Loại bỏ tính mùa vụ.
C. Làm mịn dữ liệu và loại bỏ các biến động ngẫu nhiên.
D. Xác định xu hướng dài hạn.
14. Trong kiểm định giả thuyết, mức ý nghĩa (alpha) thường được đặt ở mức 0.05. Điều này có nghĩa là gì?
A. Có 5% khả năng chấp nhận giả thuyết H0 khi nó sai.
B. Có 5% khả năng bác bỏ giả thuyết H0 khi nó đúng.
C. Có 95% khả năng chấp nhận giả thuyết H0 khi nó đúng.
D. Có 95% khả năng bác bỏ giả thuyết H0 khi nó sai.
15. Phương pháp lấy mẫu nào đảm bảo mọi phần tử của quần thể đều có cơ hội được chọn như nhau?
A. Lấy mẫu phân tầng.
B. Lấy mẫu cụm.
C. Lấy mẫu ngẫu nhiên đơn giản.
D. Lấy mẫu thuận tiện.
16. Một nhà nghiên cứu muốn so sánh mức độ hài lòng của nhân viên giữa ba phòng ban khác nhau trong công ty. Họ nên sử dụng phương pháp thống kê nào?
A. Kiểm định t độc lập.
B. Kiểm định Chi bình phương.
C. Phân tích tương quan.
D. Phân tích phương sai (ANOVA).
17. Trong phân tích chuỗi thời gian, thành phần nào thể hiện sự biến động không đều đặn và khó dự đoán?
A. Xu hướng (Trend).
B. Tính mùa vụ (Seasonality).
C. Chu kỳ (Cycle).
D. Tính ngẫu nhiên (Irregularity).
18. Một nhà nghiên cứu muốn ước tính tỷ lệ cử tri ủng hộ một ứng cử viên trong cuộc bầu cử sắp tới. Anh ta lấy mẫu ngẫu nhiên 400 cử tri và thấy rằng 220 người ủng hộ ứng cử viên đó. Khoảng tin cậy 95% cho tỷ lệ ủng hộ là bao nhiêu?
A. 0.55 ± 0.02
B. 0.55 ± 0.05
C. 0.55 ± 0.10
D. 0.55 ± 0.15
19. Một công ty muốn dự đoán doanh số bán hàng trong quý tới dựa trên dữ liệu doanh số của các quý trước. Họ nên sử dụng phương pháp thống kê nào?
A. Phân tích hồi quy tuyến tính.
B. Phân tích chuỗi thời gian.
C. Kiểm định Chi bình phương.
D. Phân tích phương sai (ANOVA).
20. Một nhà nghiên cứu muốn xác định xem có mối quan hệ giữa trình độ học vấn (cấp 3, cao đẳng, đại học, sau đại học) và thu nhập hàng tháng hay không. Họ nên sử dụng phương pháp thống kê nào?
A. Kiểm định t độc lập.
B. Kiểm định Chi bình phương.
C. Phân tích tương quan.
D. Phân tích phương sai (ANOVA).
21. Một công ty muốn so sánh hiệu quả của hai chiến dịch quảng cáo khác nhau. Họ chia khách hàng thành hai nhóm ngẫu nhiên và cho mỗi nhóm xem một chiến dịch quảng cáo. Sau đó, họ đo lường doanh số bán hàng của mỗi nhóm. Họ nên sử dụng phương pháp thống kê nào?
A. Kiểm định Chi bình phương.
B. Kiểm định t độc lập.
C. Phân tích tương quan.
D. Phân tích phương sai (ANOVA).
22. Một công ty sản xuất bóng đèn tuyên bố rằng tuổi thọ trung bình của bóng đèn là 1000 giờ. Để kiểm tra tuyên bố này, người ta lấy mẫu ngẫu nhiên 100 bóng đèn và thấy rằng tuổi thọ trung bình của mẫu là 950 giờ với độ lệch chuẩn là 80 giờ. Hãy thực hiện kiểm định giả thuyết với mức ý nghĩa 5%. Giả thuyết H0 và H1 là gì?
A. H0: μ = 950, H1: μ ≠ 950
B. H0: μ = 1000, H1: μ < 1000
C. H0: μ = 1000, H1: μ ≠ 1000
D. H0: μ < 1000, H1: μ = 1000
23. Một nhà quản lý muốn dự đoán doanh số bán hàng dựa trên chi phí quảng cáo. Anh ta thu thập dữ liệu về doanh số và chi phí quảng cáo trong 12 tháng qua và thực hiện phân tích hồi quy tuyến tính. Kết quả cho thấy hệ số hồi quy cho chi phí quảng cáo là 2.5. Ý nghĩa của hệ số này là gì?
A. Doanh số bán hàng tăng 2.5% mỗi khi chi phí quảng cáo tăng 1%.
B. Doanh số bán hàng tăng 2.5 đơn vị mỗi khi chi phí quảng cáo tăng 1 đơn vị.
C. Chi phí quảng cáo tăng 2.5 đơn vị mỗi khi doanh số bán hàng tăng 1 đơn vị.
D. Có mối tương quan mạnh giữa chi phí quảng cáo và doanh số bán hàng.
24. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết H0 là đúng.
B. Xác suất mắc sai lầm loại I.
C. Xác suất quan sát được kết quả kiểm định (hoặc kết quả khắc nghiệt hơn) nếu H0 là đúng.
D. Mức ý nghĩa của kiểm định.
25. Trong thống kê, ‘phương sai’ (variance) được định nghĩa là gì?
A. Giá trị trung bình của một tập dữ liệu.
B. Độ lệch chuẩn bình phương.
C. Giá trị lớn nhất trừ giá trị nhỏ nhất trong một tập dữ liệu.
D. Giá trị xuất hiện nhiều nhất trong một tập dữ liệu.
26. Khi nào nên sử dụng kiểm định phi tham số (non-parametric test) thay vì kiểm định tham số (parametric test)?
A. Khi dữ liệu có phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc kích thước mẫu nhỏ.
D. Khi muốn so sánh trung bình của hai nhóm.
27. Một nhà máy sản xuất ô tô muốn kiểm tra xem có sự khác biệt về mức tiêu thụ nhiên liệu giữa ba loại động cơ khác nhau hay không. Họ nên sử dụng phương pháp thống kê nào?
A. Kiểm định t độc lập.
B. Kiểm định Chi bình phương.
C. Phân tích phương sai (ANOVA).
D. Phân tích hồi quy tuyến tính.
28. Phương pháp nào sau đây thường được sử dụng để phân tích mối quan hệ giữa hai biến định tính?
A. Hệ số tương quan Pearson.
B. Kiểm định Chi bình phương.
C. Phân tích hồi quy tuyến tính.
D. Phân tích phương sai (ANOVA).
29. Trong thống kê, ‘độ lệch’ (skewness) đo lường điều gì?
A. Mức độ phân tán của dữ liệu.
B. Mức độ bất đối xứng của phân phối dữ liệu.
C. Giá trị trung bình của dữ liệu.
D. Giá trị xuất hiện nhiều nhất trong dữ liệu.
30. Trong thống kê, ‘phân vị’ (percentile) được sử dụng để làm gì?
A. Đo lường độ lệch chuẩn của dữ liệu.
B. Chia dữ liệu thành các phần bằng nhau để xác định vị trí tương đối của một giá trị.
C. Tính giá trị trung bình của một tập dữ liệu.
D. Xác định giá trị xuất hiện nhiều nhất trong một tập dữ liệu.
31. Độ lệch chuẩn của một mẫu là một thước đo của điều gì?
A. Mức độ tập trung của dữ liệu xung quanh trung bình mẫu.
B. Mức độ phân tán của dữ liệu xung quanh trung bình mẫu.
C. Giá trị lớn nhất trong mẫu.
D. Giá trị nhỏ nhất trong mẫu.
32. Một nhà nghiên cứu muốn xác định xem có mối liên hệ giữa việc hút thuốc và nguy cơ mắc bệnh ung thư phổi hay không. Họ nên sử dụng phương pháp thống kê nào?
A. Kiểm định t.
B. Phân tích hồi quy.
C. Kiểm định Chi-bình phương.
D. Phân tích phương sai (ANOVA).
33. Hệ số tương quan Pearson đo lường điều gì?
A. Mối quan hệ nhân quả giữa hai biến.
B. Mức độ biến động của một biến.
C. Mức độ liên kết tuyến tính giữa hai biến.
D. Giá trị trung bình của hai biến.
34. Phương pháp nào sau đây được sử dụng để dự báo giá trị tương lai dựa trên dữ liệu chuỗi thời gian trong quá khứ?
A. Phân tích hồi quy.
B. Trung bình trượt (Moving average).
C. Kiểm định t.
D. Phân tích phương sai (ANOVA).
35. Trong lý thuyết xác suất, hai sự kiện được gọi là độc lập khi nào?
A. Khi chúng không thể xảy ra cùng một lúc.
B. Khi xác suất xảy ra sự kiện này ảnh hưởng đến xác suất xảy ra sự kiện kia.
C. Khi xác suất xảy ra sự kiện này không ảnh hưởng đến xác suất xảy ra sự kiện kia.
D. Khi chúng có cùng xác suất xảy ra.
36. Trong phân tích phương sai (ANOVA), mục đích chính là gì?
A. So sánh phương sai của hai mẫu.
B. So sánh trung bình của hai mẫu.
C. So sánh trung bình của ba hoặc nhiều hơn các nhóm.
D. Đo lường mối quan hệ giữa hai biến.
37. Trong kiểm định giả thuyết, ‘bậc tự do’ (degrees of freedom) ảnh hưởng đến điều gì?
A. Kích thước mẫu.
B. Hình dạng của phân phối t hoặc Chi-bình phương.
C. Mức ý nghĩa (alpha).
D. Giá trị p (p-value).
38. Một công ty muốn ước tính tỷ lệ khách hàng hài lòng với sản phẩm mới của họ. Họ nên sử dụng phương pháp thống kê nào?
A. Kiểm định t.
B. Phân tích hồi quy.
C. Ước lượng khoảng tin cậy cho tỷ lệ.
D. Phân tích phương sai (ANOVA).
39. Điều gì xảy ra với khoảng tin cậy khi kích thước mẫu tăng lên?
A. Khoảng tin cậy trở nên rộng hơn.
B. Khoảng tin cậy trở nên hẹp hơn.
C. Khoảng tin cậy không thay đổi.
D. Khoảng tin cậy biến mất.
40. Một nhà quản lý muốn so sánh hiệu suất bán hàng của ba nhóm nhân viên khác nhau. Họ nên sử dụng phương pháp thống kê nào?
A. Kiểm định t.
B. Phân tích hồi quy.
C. Phân tích phương sai (ANOVA).
D. Kiểm định Chi-bình phương.
41. Ý nghĩa của khoảng tin cậy (confidence interval) là gì?
A. Xác suất tham số quần thể nằm trong khoảng ước lượng.
B. Một khoảng giá trị mà chúng ta tin rằng chứa tham số quần thể với một mức độ tin cậy nhất định.
C. Sai số chuẩn của ước lượng.
D. Mức ý nghĩa của kiểm định giả thuyết.
42. Loại biểu đồ nào sau đây phù hợp nhất để hiển thị phân phối tần suất của một biến liên tục?
A. Biểu đồ tròn.
B. Biểu đồ thanh.
C. Biểu đồ hộp.
D. Biểu đồ tần suất (histogram).
43. Trong phân tích hồi quy, hệ số xác định (R-squared) đo lường điều gì?
A. Độ mạnh của mối quan hệ giữa các biến độc lập.
B. Phần trăm phương sai của biến phụ thuộc được giải thích bởi các biến độc lập.
C. Sai số chuẩn của ước lượng.
D. Mức ý nghĩa của mô hình hồi quy.
44. Phương pháp nào sau đây được sử dụng để kiểm tra sự khác biệt giữa trung bình của hai nhóm độc lập?
A. Kiểm định Chi-bình phương.
B. Kiểm định t độc lập.
C. Phân tích phương sai (ANOVA).
D. Hồi quy tuyến tính.
45. Khi nào thì nên sử dụng kiểm định phi tham số thay vì kiểm định tham số?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi giả định về phân phối của dữ liệu không được đáp ứng.
D. Khi cần so sánh trung bình của hai nhóm.
46. Trong phân tích hồi quy đa biến, hiện tượng đa cộng tuyến (multicollinearity) xảy ra khi nào?
A. Khi các biến độc lập không tương quan với nhau.
B. Khi các biến độc lập có tương quan cao với nhau.
C. Khi biến phụ thuộc không tương quan với các biến độc lập.
D. Khi mô hình hồi quy không phù hợp với dữ liệu.
47. Giá trị p (p-value) trong kiểm định giả thuyết biểu thị điều gì?
A. Xác suất giả thuyết H0 là đúng.
B. Xác suất mắc sai lầm loại I.
C. Xác suất quan sát được kết quả kiểm định (hoặc kết quả cực đoan hơn) nếu giả thuyết H0 là đúng.
D. Xác suất giả thuyết H1 là đúng.
48. Trong kiểm định giả thuyết, mức ý nghĩa (alpha) thường được đặt ở mức 0.05. Điều này có nghĩa là gì?
A. Có 5% cơ hội chấp nhận giả thuyết H0 khi nó sai.
B. Có 5% cơ hội bác bỏ giả thuyết H0 khi nó đúng.
C. Có 95% cơ hội bác bỏ giả thuyết H0 khi nó sai.
D. Có 95% cơ hội chấp nhận giả thuyết H0 khi nó đúng.
49. Loại thang đo nào cho phép xác định thứ hạng nhưng không cho biết khoảng cách giữa các thứ hạng?
A. Định danh (Nominal).
B. Thứ bậc (Ordinal).
C. Khoảng (Interval).
D. Tỷ lệ (Ratio).
50. Phương pháp nào sau đây được sử dụng để giảm số lượng biến trong một tập dữ liệu trong khi vẫn giữ lại thông tin quan trọng?
A. Phân tích hồi quy.
B. Phân tích phương sai (ANOVA).
C. Phân tích thành phần chính (PCA).
D. Kiểm định Chi-bình phương.
51. Trong kiểm định giả thuyết thống kê, sai lầm loại I xảy ra khi nào?
A. Chấp nhận giả thuyết H0 khi nó đúng.
B. Bác bỏ giả thuyết H0 khi nó sai.
C. Chấp nhận giả thuyết H0 khi nó sai.
D. Bác bỏ giả thuyết H0 khi nó đúng.
52. Trong thống kê mô tả, ‘tứ phân vị’ được sử dụng để làm gì?
A. Tính trung bình cộng của dữ liệu.
B. Chia dữ liệu thành bốn phần bằng nhau.
C. Xác định giá trị lớn nhất và nhỏ nhất.
D. Tính độ lệch chuẩn của dữ liệu.
53. Phương pháp nào sau đây được sử dụng để phát hiện các giá trị ngoại lệ (outliers) trong một tập dữ liệu?
A. Kiểm định t.
B. Biểu đồ phân tán.
C. Biểu đồ hộp.
D. Phân tích phương sai (ANOVA).
54. Trong phân tích chuỗi thời gian, thành phần nào mô tả sự biến động ngắn hạn và không đều đặn?
A. Xu hướng (Trend).
B. Tính mùa vụ (Seasonality).
C. Chu kỳ (Cycle).
D. Ngẫu nhiên (Irregularity).
55. Phân phối nào thường được sử dụng để mô hình hóa số lượng sự kiện xảy ra trong một khoảng thời gian hoặc không gian nhất định?
A. Phân phối chuẩn.
B. Phân phối nhị thức.
C. Phân phối Poisson.
D. Phân phối mũ.
56. Trong thống kê, thuật ngữ ‘phương sai’ (variance) dùng để chỉ điều gì?
A. Giá trị trung bình của một tập dữ liệu.
B. Độ lệch chuẩn của một tập dữ liệu.
C. Mức độ phân tán của các giá trị trong một tập dữ liệu xung quanh giá trị trung bình.
D. Giá trị lớn nhất trừ giá trị nhỏ nhất trong một tập dữ liệu.
57. Khi nào thì nên sử dụng kiểm định Wilcoxon signed-rank?
A. Để so sánh trung bình của hai nhóm độc lập.
B. Để so sánh trung bình của hai nhóm liên quan (paired).
C. Để kiểm tra mối quan hệ giữa hai biến định tính.
D. Để dự đoán giá trị của một biến liên tục.
58. Trong phân tích hồi quy tuyến tính, ý nghĩa của hệ số chặn (intercept) là gì?
A. Giá trị của biến độc lập khi biến phụ thuộc bằng 0.
B. Giá trị của biến phụ thuộc khi biến độc lập bằng 1.
C. Giá trị của biến phụ thuộc khi biến độc lập bằng 0.
D. Độ dốc của đường hồi quy.
59. Trong thống kê, ‘phân phối lấy mẫu’ đề cập đến điều gì?
A. Phân phối của dữ liệu trong một mẫu duy nhất.
B. Phân phối của tất cả các giá trị có thể có của một thống kê mẫu (ví dụ: trung bình mẫu) từ các mẫu có cùng kích thước được lấy từ cùng một quần thể.
C. Phân phối của quần thể.
D. Phân phối của sai số.
60. Khi nào thì nên sử dụng kiểm định Chi-bình phương?
A. Để so sánh trung bình của hai nhóm.
B. Để kiểm tra mối quan hệ giữa hai biến định tính.
C. Để dự đoán giá trị của một biến liên tục.
D. Để đo lường sự tương quan giữa hai biến liên tục.
61. Trong phân tích hồi quy tuyến tính, giá trị R-squared (R bình phương) thể hiện điều gì?
A. Sai số chuẩn của ước lượng
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi biến độc lập
C. Mức ý nghĩa của mô hình
D. Hệ số tương quan giữa các biến độc lập
62. Một công ty muốn dự đoán doanh số bán hàng dựa trên chi phí quảng cáo. Phương pháp thống kê nào phù hợp nhất?
A. Kiểm định Chi-bình phương.
B. Hồi quy tuyến tính.
C. Kiểm định t.
D. Phân tích phương sai (ANOVA).
63. Khi thực hiện kiểm định t (t-test) cho hai mẫu độc lập, giả định nào sau đây là quan trọng nhất?
A. Phương sai của hai mẫu bằng nhau
B. Dữ liệu của hai mẫu tuân theo phân phối chuẩn
C. Kích thước của hai mẫu bằng nhau
D. Các quan sát trong mỗi mẫu độc lập với nhau
64. Một người tung đồng xu 10 lần và được 7 mặt ngửa. Kiểm định giả thuyết nào phù hợp để kiểm tra xem đồng xu có cân đối hay không?
A. Kiểm định t.
B. Kiểm định Chi-bình phương.
C. Kiểm định z cho tỷ lệ.
D. Phân tích phương sai (ANOVA).
65. Trong phân tích hồi quy đa biến, hiện tượng đa cộng tuyến (multicollinearity) đề cập đến điều gì?
A. Mối tương quan cao giữa biến phụ thuộc và biến độc lập.
B. Mối tương quan cao giữa các biến độc lập.
C. Phương sai của sai số thay đổi.
D. Sai số có phân phối không chuẩn.
66. Điều gì xảy ra với sai số loại II (Type II error) khi mức ý nghĩa (α) giảm xuống?
A. Sai số loại II giảm xuống.
B. Sai số loại II tăng lên.
C. Sai số loại II không thay đổi.
D. Sai số loại II bằng 0.
67. Trong thống kê mô tả, đại lượng nào sau đây được sử dụng để đo lường mức độ phân tán của dữ liệu xung quanh giá trị trung bình?
A. Trung vị
B. Mode (Yếu vị)
C. Độ lệch chuẩn
D. Giá trị lớn nhất
68. Khi nào thì giá trị trung bình (mean) bằng với trung vị (median) trong một phân phối?
A. Khi phân phối lệch trái.
B. Khi phân phối lệch phải.
C. Khi phân phối đối xứng.
D. Khi phân phối có nhiều mode.
69. Để so sánh tỷ lệ người hút thuốc lá giữa hai thành phố, kiểm định thống kê nào phù hợp nhất?
A. Kiểm định t cho hai mẫu độc lập.
B. Kiểm định Chi-bình phương.
C. Phân tích phương sai (ANOVA).
D. Hồi quy tuyến tính.
70. Trong thống kê, ‘phân phối lấy mẫu’ (sampling distribution) đề cập đến điều gì?
A. Phân phối của dữ liệu trong mẫu.
B. Phân phối của tất cả các giá trị có thể của một thống kê (statistic) từ các mẫu có cùng kích thước được lấy từ cùng một quần thể.
C. Phân phối của dữ liệu trong quần thể.
D. Phân phối của sai số.
71. Khi nào thì việc sử dụng trung vị (median) thích hợp hơn so với giá trị trung bình (mean) để đo lường xu hướng trung tâm của một tập dữ liệu?
A. Khi dữ liệu có phân phối chuẩn
B. Khi dữ liệu có giá trị ngoại lệ (outliers)
C. Khi dữ liệu có kích thước mẫu lớn
D. Khi dữ liệu không có giá trị âm
72. Điều gì xảy ra với khoảng tin cậy (confidence interval) khi kích thước mẫu tăng lên, giả sử các yếu tố khác không đổi?
A. Khoảng tin cậy trở nên rộng hơn.
B. Khoảng tin cậy không thay đổi.
C. Khoảng tin cậy trở nên hẹp hơn.
D. Khoảng tin cậy biến mất.
73. Trong thống kê suy diễn, ý nghĩa của việc sử dụng một thống kê (statistic) là gì?
A. Để mô tả đặc điểm của mẫu.
B. Để ước lượng tham số của quần thể.
C. Để tính toán độ lệch chuẩn.
D. Để vẽ biểu đồ.
74. Trong phân tích phương sai (ANOVA), mục đích chính của việc sử dụng kiểm định F là gì?
A. So sánh trung bình của hai nhóm
B. So sánh phương sai của hai nhóm
C. So sánh trung bình của nhiều hơn hai nhóm
D. So sánh tỷ lệ của hai nhóm
75. Trong một cuộc khảo sát, 60% người tham gia thích sản phẩm A. Nếu cỡ mẫu là 100, hãy tính khoảng tin cậy 95% cho tỷ lệ người thích sản phẩm A.
A. (0.50, 0.70)
B. (0.52, 0.68)
C. (0.54, 0.66)
D. (0.56, 0.64)
76. Trong phân tích dữ liệu, ý nghĩa của việc chuẩn hóa dữ liệu (data normalization) là gì?
A. Loại bỏ các giá trị ngoại lệ.
B. Chuyển đổi dữ liệu về cùng một thang đo.
C. Tính toán giá trị trung bình.
D. Sắp xếp dữ liệu theo thứ tự.
77. Một nhà nghiên cứu muốn so sánh chiều cao trung bình của sinh viên nam và sinh viên nữ. Họ thu thập dữ liệu từ hai mẫu độc lập. Kiểm định thống kê nào phù hợp nhất để sử dụng?
A. Kiểm định Chi-bình phương.
B. Kiểm định t cho hai mẫu độc lập.
C. Phân tích phương sai (ANOVA).
D. Hồi quy tuyến tính.
78. Hệ số tương quan Pearson (Pearson correlation coefficient) đo lường điều gì?
A. Mức độ ảnh hưởng của một biến lên biến khác
B. Mối quan hệ tuyến tính giữa hai biến định lượng
C. Mối quan hệ phi tuyến tính giữa hai biến định tính
D. Sự khác biệt giữa trung bình của hai nhóm
79. Khi nào thì nên sử dụng kiểm định phi tham số (non-parametric test) thay vì kiểm định tham số (parametric test)?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc kích thước mẫu nhỏ.
D. Khi muốn so sánh trung bình của hai nhóm.
80. Trong phân tích chuỗi thời gian (time series analysis), thành phần nào sau đây thể hiện sự biến động ngẫu nhiên và không thể dự đoán được?
A. Xu hướng (trend).
B. Tính mùa vụ (seasonality).
C. Chu kỳ (cycle).
D. Tính bất thường (irregularity).
81. Chọn câu phát biểu đúng về sai số loại I trong kiểm định giả thuyết:
A. Sai số loại I xảy ra khi ta chấp nhận giả thuyết H0 khi nó sai.
B. Sai số loại I xảy ra khi ta bác bỏ giả thuyết H0 khi nó đúng.
C. Sai số loại I là xác suất để chấp nhận H0 khi nó đúng.
D. Sai số loại I luôn nhỏ hơn sai số loại II.
82. Khi nào nên sử dụng kiểm định Chi-bình phương (Chi-square test)?
A. Để so sánh trung bình của hai nhóm.
B. Để phân tích mối quan hệ giữa hai biến định tính.
C. Để dự đoán giá trị của một biến định lượng.
D. Để kiểm tra sự khác biệt giữa phương sai của hai nhóm.
83. Cho một tập dữ liệu gồm các số: 2, 4, 6, 8, 10. Tính phương sai của tập dữ liệu này.
84. Một nhà nghiên cứu thu thập dữ liệu về thu nhập và trình độ học vấn của một nhóm người. Họ muốn đo lường mối quan hệ giữa hai biến này. Hệ số tương quan nào phù hợp nhất?
A. Hệ số tương quan Pearson.
B. Hệ số tương quan Spearman.
C. Hệ số tương quan Kendall.
D. Hệ số tương quan Cramer’s V.
85. Một công ty muốn kiểm tra xem một chiến dịch quảng cáo mới có làm tăng doanh số bán hàng hay không. Họ sử dụng kiểm định giả thuyết với giả thuyết H0: Doanh số không đổi và H1: Doanh số tăng. Nếu p-value = 0.03 và mức ý nghĩa α = 0.05, kết luận nào là đúng?
A. Chấp nhận H0, chiến dịch quảng cáo không hiệu quả.
B. Bác bỏ H0, chiến dịch quảng cáo có hiệu quả.
C. Không đủ bằng chứng để kết luận.
D. Chấp nhận H1, chiến dịch quảng cáo có hiệu quả.
86. Trong thống kê, thuật ngữ ‘bậc tự do’ (degrees of freedom) thường liên quan đến điều gì?
A. Số lượng quan sát trong mẫu.
B. Số lượng biến trong mô hình.
C. Số lượng thông tin độc lập có sẵn để ước tính một tham số.
D. Mức ý nghĩa của kiểm định.
87. Một tập dữ liệu có trung bình là 50 và độ lệch chuẩn là 10. Sử dụng quy tắc kinh nghiệm (empirical rule), khoảng bao nhiêu phần trăm dữ liệu nằm trong khoảng từ 30 đến 70?
A. Khoảng 68%
B. Khoảng 95%
C. Khoảng 99.7%
D. Khoảng 50%
88. Trong kiểm định giả thuyết thống kê, mức ý nghĩa (significance level) thường được ký hiệu là α, đại diện cho điều gì?
A. Xác suất mắc lỗi loại II
B. Xác suất bác bỏ giả thuyết H0 khi H0 đúng
C. Xác suất chấp nhận giả thuyết H0 khi H0 sai
D. Xác suất chấp nhận giả thuyết H0 khi H0 đúng
89. Trong phân tích hồi quy, ‘sai số chuẩn của ước lượng’ (standard error of the estimate) đo lường điều gì?
A. Độ lệch chuẩn của các hệ số hồi quy.
B. Độ lệch chuẩn của các giá trị dự đoán so với các giá trị thực tế.
C. Độ lệch chuẩn của các biến độc lập.
D. Mức ý nghĩa của mô hình.
90. Một nhà quản lý muốn biết liệu có sự khác biệt về mức độ hài lòng của nhân viên giữa các phòng ban khác nhau hay không. Phương pháp thống kê nào phù hợp nhất?
A. Hồi quy tuyến tính.
B. Kiểm định t.
C. Phân tích phương sai (ANOVA).
D. Tương quan Pearson.
91. Một nghiên cứu cho thấy rằng có một mối tương quan dương mạnh giữa số giờ học và điểm thi. Điều này có nghĩa là gì?
A. Số giờ học ít dẫn đến điểm thi cao.
B. Số giờ học nhiều dẫn đến điểm thi thấp.
C. Số giờ học nhiều có xu hướng đi kèm với điểm thi cao.
D. Không có mối liên hệ nào giữa số giờ học và điểm thi.
92. Một công ty muốn khảo sát mức độ hài lòng của khách hàng về sản phẩm mới. Phương pháp lấy mẫu nào sau đây đảm bảo tính đại diện cao nhất cho tổng thể khách hàng?
A. Lấy mẫu thuận tiện (chọn những khách hàng dễ tiếp cận nhất).
B. Lấy mẫu phán đoán (chọn những khách hàng mà người khảo sát cho là đại diện).
C. Lấy mẫu ngẫu nhiên đơn giản (mỗi khách hàng đều có cơ hội được chọn như nhau).
D. Lấy mẫu phân tầng (chia khách hàng thành các nhóm nhỏ, sau đó lấy mẫu ngẫu nhiên từ mỗi nhóm).
93. Trong thống kê suy diễn, mục tiêu chính là gì?
A. Mô tả các đặc điểm của mẫu.
B. Thu thập dữ liệu từ quần thể.
C. Ước lượng và kiểm định các đặc điểm của quần thể dựa trên thông tin từ mẫu.
D. Tính toán các thống kê mô tả cho quần thể.
94. Trong một phân phối nhị thức, điều gì xảy ra khi số lượng thử nghiệm (n) tăng lên rất lớn?
A. Phân phối nhị thức tiến gần đến phân phối Poisson.
B. Phân phối nhị thức tiến gần đến phân phối chuẩn.
C. Phân phối nhị thức trở nên bất đối xứng hơn.
D. Phân phối nhị thức không thay đổi.
95. Khi nào thì nên sử dụng biểu đồ hộp (boxplot)?
A. Để hiển thị tần suất của các giá trị trong dữ liệu.
B. Để so sánh trung bình của các nhóm.
C. Để xác định các giá trị ngoại lệ (outliers) trong dữ liệu.
D. Để hiển thị mối quan hệ giữa hai biến định lượng.
96. Điều gì xảy ra với khoảng tin cậy khi kích thước mẫu tăng lên (giả sử các yếu tố khác không đổi)?
A. Khoảng tin cậy trở nên rộng hơn.
B. Khoảng tin cậy trở nên hẹp hơn.
C. Khoảng tin cậy không thay đổi.
D. Khoảng tin cậy dao động ngẫu nhiên.
97. Trong thống kê, phương sai (Variance) được định nghĩa là gì?
A. Căn bậc hai của độ lệch chuẩn.
B. Trung bình cộng của các độ lệch tuyệt đối so với giá trị trung bình.
C. Trung bình cộng của các bình phương độ lệch so với giá trị trung bình.
D. Giá trị lớn nhất trừ giá trị nhỏ nhất trong tập dữ liệu.
98. Một công ty muốn dự đoán doanh số bán hàng dựa trên chi phí quảng cáo. Họ sử dụng phân tích hồi quy tuyến tính và thu được phương trình hồi quy: Doanh số = 100 + 5 * Chi phí quảng cáo. Nếu công ty chi 20 đơn vị tiền tệ cho quảng cáo, doanh số dự kiến là bao nhiêu?
99. Trong lý thuyết xác suất, hai sự kiện được gọi là độc lập nếu:
A. Chúng không thể xảy ra cùng một lúc.
B. Xác suất của sự kiện này ảnh hưởng đến xác suất của sự kiện kia.
C. Xác suất của sự kiện này không ảnh hưởng đến xác suất của sự kiện kia.
D. Tổng xác suất của chúng bằng 1.
100. Một người tung một đồng xu 10 lần và đều nhận được mặt ngửa. Xác suất để lần tung thứ 11 cũng là mặt ngửa là bao nhiêu?
A. 1/11
B. 1/2
C. 1/1024
D. 1
101. Độ lệch chuẩn (Standard Deviation) đo lường điều gì?
A. Mức độ tập trung của dữ liệu xung quanh giá trị trung bình.
B. Mức độ phân tán của dữ liệu so với giá trị trung bình.
C. Giá trị lớn nhất trong tập dữ liệu.
D. Giá trị trung bình của tập dữ liệu.
102. Phương pháp nào sau đây thường được sử dụng để ước lượng khoảng cho trung bình của một quần thể khi độ lệch chuẩn của quần thể không được biết và kích thước mẫu nhỏ (n < 30)?
A. Phân phối Z.
B. Phân phối t.
C. Phân phối Chi bình phương.
D. Phân phối F.
103. Một công ty tiến hành khảo sát và nhận thấy 60% khách hàng hài lòng với sản phẩm của họ. Nếu công ty lấy mẫu ngẫu nhiên 10 khách hàng, xác suất để có đúng 6 khách hàng hài lòng là bao nhiêu (sử dụng phân phối nhị thức)?
A. 0.06
B. 0.2007
C. 0.6
D. 1
104. Một nhà nghiên cứu muốn so sánh hiệu quả của hai phương pháp giảng dạy khác nhau. Họ chia ngẫu nhiên sinh viên thành hai nhóm và áp dụng mỗi phương pháp cho một nhóm. Loại kiểm định thống kê nào phù hợp nhất để so sánh kết quả học tập của hai nhóm?
A. Kiểm định Chi bình phương.
B. Kiểm định t độc lập.
C. Phân tích hồi quy tuyến tính.
D. Phân tích phương sai (ANOVA).
105. Một cửa hàng ghi nhận số lượng khách hàng đến mỗi ngày trong một tuần. Dữ liệu như sau: 20, 25, 30, 28, 22, 24, 26. Giá trị trung bình (Mean) của dữ liệu này là bao nhiêu?
106. Khi nào thì nên sử dụng kiểm định phi tham số thay vì kiểm định tham số?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc kích thước mẫu nhỏ.
D. Khi muốn ước lượng khoảng tin cậy.
107. Khi nào thì nên sử dụng kiểm định Chi bình phương?
A. Khi so sánh trung bình của hai quần thể độc lập.
B. Khi phân tích phương sai (ANOVA).
C. Khi kiểm tra sự phù hợp giữa dữ liệu quan sát và dữ liệu kỳ vọng.
D. Khi ước lượng khoảng tin cậy cho trung bình quần thể.
108. Trong phân tích hồi quy, sai số chuẩn của ước lượng (Standard Error of the Estimate) đo lường điều gì?
A. Mức độ phù hợp của mô hình hồi quy với dữ liệu.
B. Độ lệch chuẩn của các hệ số hồi quy.
C. Độ lệch chuẩn của các giá trị thực tế so với các giá trị dự đoán.
D. Mức độ quan hệ tuyến tính giữa các biến.
109. Trong phân tích hồi quy tuyến tính đơn giản, hệ số xác định (R-squared) đo lường điều gì?
A. Độ mạnh của mối quan hệ nhân quả giữa biến độc lập và biến phụ thuộc.
B. Tỷ lệ phần trăm biến thiên của biến phụ thuộc được giải thích bởi biến độc lập.
C. Sai số chuẩn của ước lượng.
D. Ý nghĩa thống kê của các hệ số hồi quy.
110. Trong kiểm định giả thuyết, sai lầm loại I xảy ra khi nào?
A. Chấp nhận giả thuyết H0 khi nó đúng.
B. Bác bỏ giả thuyết H0 khi nó sai.
C. Chấp nhận giả thuyết H0 khi nó sai.
D. Bác bỏ giả thuyết H0 khi nó đúng.
111. Giá trị trung vị (Median) của một tập dữ liệu là gì?
A. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
B. Giá trị trung bình cộng của tập dữ liệu.
C. Giá trị nằm chính giữa tập dữ liệu đã được sắp xếp.
D. Độ lệch chuẩn của tập dữ liệu.
112. Trong phân tích phương sai (ANOVA), yếu tố nào sau đây được kiểm tra?
A. Sự khác biệt giữa các phương sai của hai quần thể.
B. Sự khác biệt giữa các trung bình của hai hay nhiều quần thể.
C. Mối quan hệ giữa hai biến định lượng.
D. Sự phù hợp của một phân phối lý thuyết với dữ liệu thực tế.
113. Một nhà nghiên cứu muốn kiểm tra xem có mối liên hệ giữa hút thuốc và bệnh phổi hay không. Loại kiểm định thống kê nào phù hợp nhất để sử dụng?
A. Kiểm định t.
B. Phân tích phương sai (ANOVA).
C. Kiểm định Chi bình phương.
D. Phân tích hồi quy tuyến tính.
114. Một nhà máy sản xuất bóng đèn tuyên bố rằng tuổi thọ trung bình của bóng đèn là 1000 giờ. Để kiểm tra tuyên bố này, người ta lấy mẫu ngẫu nhiên 100 bóng đèn và tính được tuổi thọ trung bình mẫu là 950 giờ với độ lệch chuẩn mẫu là 100 giờ. Giả thuyết H0 trong trường hợp này là gì?
A. Tuổi thọ trung bình của bóng đèn nhỏ hơn 1000 giờ.
B. Tuổi thọ trung bình của bóng đèn lớn hơn 1000 giờ.
C. Tuổi thọ trung bình của bóng đèn bằng 1000 giờ.
D. Tuổi thọ trung bình của bóng đèn khác 1000 giờ.
115. Hệ số tương quan Pearson đo lường điều gì?
A. Mức độ biến thiên của một biến.
B. Mức độ tập trung của dữ liệu xung quanh giá trị trung bình.
C. Mức độ quan hệ tuyến tính giữa hai biến định lượng.
D. Mức độ quan hệ phi tuyến tính giữa hai biến định lượng.
116. Trong phân tích thời gian, thành phần nào sau đây thể hiện sự biến động ngắn hạn và không đều đặn trong chuỗi thời gian?
A. Xu hướng (Trend).
B. Tính mùa vụ (Seasonality).
C. Tính chu kỳ (Cyclical).
D. Tính ngẫu nhiên (Irregular).
117. Một tập dữ liệu có độ lệch trái (left-skewed). Điều này có nghĩa là gì?
A. Phần lớn dữ liệu tập trung ở phía bên phải của phân phối.
B. Phần lớn dữ liệu tập trung ở phía bên trái của phân phối.
C. Dữ liệu phân bố đều.
D. Không thể xác định được phân phối dữ liệu.
118. Trong kiểm định giả thuyết, giá trị p (p-value) thể hiện điều gì?
A. Xác suất giả thuyết H0 là đúng.
B. Xác suất mắc sai lầm loại I.
C. Xác suất thu được kết quả như quan sát (hoặc cực đoan hơn) nếu giả thuyết H0 là đúng.
D. Xác suất bác bỏ giả thuyết H0.
119. Trong phân tích chuỗi thời gian, phương pháp trung bình trượt (moving average) được sử dụng để làm gì?
A. Để dự đoán giá trị tương lai của chuỗi thời gian.
B. Để loại bỏ tính mùa vụ trong chuỗi thời gian.
C. Để làm mịn chuỗi thời gian và làm nổi bật xu hướng.
D. Để xác định các giá trị ngoại lệ trong chuỗi thời gian.
120. Trong thống kê, ‘phân phối chuẩn’ còn được gọi bằng tên nào khác?
A. Phân phối Poisson.
B. Phân phối Gaussian.
C. Phân phối Bernoulli.
D. Phân phối nhị thức.
121. Trong một phân phối chuẩn, khoảng bao nhiêu phần trăm dữ liệu nằm trong khoảng từ trung bình trừ đi một độ lệch chuẩn đến trung bình cộng với một độ lệch chuẩn?
A. Khoảng 50%.
B. Khoảng 68%.
C. Khoảng 95%.
D. Khoảng 99.7%.
122. Một công ty muốn ước tính tỷ lệ khách hàng hài lòng với sản phẩm mới của họ. Họ khảo sát 200 khách hàng và thấy rằng 160 người hài lòng. Khoảng tin cậy 95% cho tỷ lệ khách hàng hài lòng là bao nhiêu? (Giả sử sử dụng phương pháp ước lượng phù hợp)
A. 70% đến 90%
B. 73% đến 87%
C. 75% đến 85%
D. 77% đến 83%
123. Phân phối nào sau đây thường được sử dụng để mô hình hóa số lượng sự kiện xảy ra trong một khoảng thời gian hoặc không gian nhất định?
A. Phân phối chuẩn.
B. Phân phối nhị thức.
C. Phân phối Poisson.
D. Phân phối đều.
124. Một nhà máy sản xuất bóng đèn tuyên bố rằng tuổi thọ trung bình của bóng đèn là 1000 giờ. Một nhóm kiểm tra chất lượng lấy mẫu 50 bóng đèn và thấy tuổi thọ trung bình là 950 giờ với độ lệch chuẩn mẫu là 100 giờ. Sử dụng mức ý nghĩa 0.05, hãy cho biết kết luận về tuyên bố của nhà máy?
A. Có đủ bằng chứng để bác bỏ tuyên bố của nhà máy.
B. Không đủ bằng chứng để bác bỏ tuyên bố của nhà máy.
C. Cần thu thập thêm dữ liệu để đưa ra kết luận.
D. Không thể đưa ra kết luận dựa trên thông tin này.
125. Phương pháp nào thường được sử dụng để đo lường mức độ tương quan tuyến tính giữa hai biến định lượng?
A. Kiểm định Chi bình phương.
B. Hệ số tương quan Pearson.
C. Phân tích phương sai (ANOVA).
D. Hồi quy Logistic.
126. Trong thống kê, ‘mức ý nghĩa’ (significance level) thường được ký hiệu là gì?
A. β (beta).
B. σ (sigma).
C. α (alpha).
D. μ (mu).
127. Trong kiểm định giả thuyết thống kê, sai lầm loại I xảy ra khi nào?
A. Chấp nhận giả thuyết H0 khi nó đúng.
B. Bác bỏ giả thuyết H0 khi nó sai.
C. Chấp nhận giả thuyết H0 khi nó sai.
D. Bác bỏ giả thuyết H0 khi nó đúng.
128. Một tập dữ liệu có các giá trị sau: 2, 4, 6, 8, 10. Tính trung bình cộng của tập dữ liệu này.
129. Nếu hệ số tương quan Pearson giữa hai biến là -1, điều này có nghĩa là gì?
A. Không có mối tương quan giữa hai biến.
B. Có mối tương quan tuyến tính dương hoàn hảo giữa hai biến.
C. Có mối tương quan tuyến tính âm hoàn hảo giữa hai biến.
D. Có mối tương quan phi tuyến tính giữa hai biến.
130. Khi nào thì nên sử dụng kiểm định Chi bình phương (Chi-square test)?
A. Để so sánh trung bình của hai nhóm.
B. Để so sánh phương sai của hai nhóm.
C. Để kiểm tra mối quan hệ giữa hai biến định tính.
D. Để dự đoán giá trị của một biến định lượng.
131. Một cửa hàng ghi lại số lượng khách hàng ghé thăm mỗi ngày trong một tuần. Dữ liệu như sau: 20, 25, 30, 28, 22, 24, 26. Tính phương sai mẫu của dữ liệu này.
A. 8.16
B. 10.33
C. 12.50
D. 15.75
132. Trong thống kê mô tả, đại lượng nào đo lường mức độ phân tán của dữ liệu so với giá trị trung bình?
A. Trung vị.
B. Mốt.
C. Độ lệch chuẩn.
D. Tần số.
133. Một nhà nghiên cứu muốn so sánh hiệu quả của hai phương pháp giảng dạy khác nhau. Họ chia ngẫu nhiên 50 sinh viên thành hai nhóm, mỗi nhóm 25 người, và sử dụng hai phương pháp khác nhau. Sau đó, họ kiểm tra kết quả học tập của sinh viên. Kiểm định thống kê nào phù hợp nhất để so sánh kết quả học tập của hai nhóm?
A. Kiểm định Chi bình phương.
B. Kiểm định t độc lập.
C. Phân tích phương sai (ANOVA).
D. Hồi quy tuyến tính.
134. Một nhà nghiên cứu muốn xác định xem có mối liên hệ giữa việc hút thuốc và nguy cơ mắc bệnh phổi hay không. Họ thu thập dữ liệu từ 500 người và sử dụng kiểm định Chi bình phương. Giả thuyết H0 trong trường hợp này là gì?
A. Hút thuốc làm tăng nguy cơ mắc bệnh phổi.
B. Hút thuốc làm giảm nguy cơ mắc bệnh phổi.
C. Không có mối liên hệ giữa việc hút thuốc và nguy cơ mắc bệnh phổi.
D. Tất cả những người hút thuốc đều mắc bệnh phổi.
135. Trong thống kê, ‘khoảng tin cậy’ (confidence interval) dùng để làm gì?
A. Ước lượng một tham số của tổng thể với một mức độ tin cậy nhất định.
B. Kiểm định giả thuyết về một tham số của tổng thể.
C. Đo lường mức độ phân tán của dữ liệu mẫu.
D. Xác định kích thước mẫu cần thiết cho một nghiên cứu.
136. Khi nào nên sử dụng kiểm định t (t-test) thay vì kiểm định z (z-test)?
A. Khi kích thước mẫu lớn (n > 30) và độ lệch chuẩn của tổng thể đã biết.
B. Khi kích thước mẫu nhỏ (n < 30) và độ lệch chuẩn của tổng thể chưa biết.
C. Khi so sánh trung bình của hai tổng thể có độ lệch chuẩn bằng nhau.
D. Khi muốn kiểm tra sự khác biệt giữa hai phương sai.
137. Giả sử bạn thực hiện một kiểm định giả thuyết với mức ý nghĩa α = 0.05. Nếu giá trị p của bạn là 0.03, bạn sẽ đưa ra kết luận gì?
A. Chấp nhận giả thuyết H0.
B. Bác bỏ giả thuyết H0.
C. Không đủ bằng chứng để bác bỏ giả thuyết H0.
D. Cần thu thập thêm dữ liệu.
138. Trong phân tích phương sai (ANOVA), mục đích chính của việc sử dụng kiểm định F là gì?
A. So sánh trung bình của hai nhóm.
B. So sánh phương sai của hai nhóm.
C. So sánh trung bình của nhiều hơn hai nhóm.
D. Đo lường mối tương quan giữa hai biến.
139. Trong một cuộc khảo sát, người ta hỏi 1000 người về việc họ ủng hộ hay phản đối một dự luật mới. 600 người ủng hộ, 300 người phản đối, và 100 người không có ý kiến. Tính tỷ lệ người ủng hộ dự luật.
140. Khi nào thì nên sử dụng kiểm định phi tham số (non-parametric test) thay vì kiểm định tham số (parametric test)?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi các giả định của kiểm định tham số không được đáp ứng.
D. Khi muốn so sánh trung bình của hai nhóm.
141. Độ lệch chuẩn của một mẫu là 5. Tính phương sai của mẫu đó.
142. Trong phân tích hồi quy tuyến tính, ý nghĩa của hệ số chặn (intercept) là gì?
A. Độ dốc của đường hồi quy.
B. Giá trị dự đoán của biến phụ thuộc khi tất cả các biến độc lập bằng 0.
C. Mức độ biến thiên của biến phụ thuộc.
D. Sai số chuẩn của ước lượng.
143. Điều gì xảy ra với độ rộng của khoảng tin cậy khi kích thước mẫu tăng lên (giả sử các yếu tố khác không đổi)?
A. Độ rộng của khoảng tin cậy tăng lên.
B. Độ rộng của khoảng tin cậy giảm xuống.
C. Độ rộng của khoảng tin cậy không thay đổi.
D. Không thể xác định được sự thay đổi của độ rộng khoảng tin cậy.
144. Điều gì xảy ra với giá trị tới hạn (critical value) khi mức ý nghĩa (alpha) giảm xuống (ví dụ, từ 0.05 xuống 0.01)?
A. Giá trị tới hạn tăng lên.
B. Giá trị tới hạn giảm xuống.
C. Giá trị tới hạn không thay đổi.
D. Không thể xác định sự thay đổi của giá trị tới hạn.
145. Trong phân tích hồi quy, hệ số R bình phương (R^2) đo lường điều gì?
A. Mức độ tương quan giữa các biến độc lập.
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi các biến độc lập.
C. Sai số chuẩn của ước lượng.
D. Mức độ ý nghĩa thống kê của các hệ số hồi quy.
146. Trong thống kê suy diễn, mục đích chính là gì?
A. Mô tả các đặc điểm của một mẫu dữ liệu.
B. Thu thập dữ liệu từ một tổng thể lớn.
C. Đưa ra kết luận hoặc dự đoán về một tổng thể dựa trên thông tin từ một mẫu.
D. Tính toán các thống kê mô tả như trung bình và độ lệch chuẩn.
147. Một công ty muốn dự đoán doanh số bán hàng dựa trên chi phí quảng cáo. Họ thu thập dữ liệu về chi phí quảng cáo và doanh số bán hàng trong 12 tháng qua và thực hiện phân tích hồi quy tuyến tính. Biến nào là biến độc lập trong phân tích này?
A. Doanh số bán hàng.
B. Chi phí quảng cáo.
C. Thời gian (tháng).
D. Lợi nhuận.
148. Trong kiểm định giả thuyết, giá trị p (p-value) thể hiện điều gì?
A. Xác suất giả thuyết H0 là đúng.
B. Xác suất mắc sai lầm loại I.
C. Xác suất thu được kết quả như quan sát (hoặc cực đoan hơn) nếu giả thuyết H0 là đúng.
D. Xác suất mắc sai lầm loại II.
149. Phương pháp nào sau đây được sử dụng để giảm số lượng biến trong một tập dữ liệu lớn trong khi vẫn giữ lại phần lớn thông tin?
A. Phân tích hồi quy.
B. Phân tích phương sai (ANOVA).
C. Phân tích thành phần chính (PCA).
D. Kiểm định Chi bình phương.
150. Đại lượng nào sau đây không bị ảnh hưởng bởi các giá trị ngoại lệ (outliers) trong một tập dữ liệu?
A. Trung bình cộng.
B. Độ lệch chuẩn.
C. Trung vị.
D. Phương sai.