1. Điều gì xảy ra với khoảng tin cậy khi kích thước mẫu tăng lên, giả sử các yếu tố khác không đổi?
A. Khoảng tin cậy trở nên rộng hơn.
B. Khoảng tin cậy không thay đổi.
C. Khoảng tin cậy trở nên hẹp hơn.
D. Khoảng tin cậy dao động ngẫu nhiên.
2. Trong kiểm định Chi bình phương (Chi-square test), thống kê kiểm định được sử dụng để đánh giá điều gì?
A. Sự khác biệt giữa trung bình của hai mẫu.
B. Sự phù hợp giữa phân phối quan sát được và phân phối kỳ vọng.
C. Mối quan hệ tuyến tính giữa hai biến.
D. Phương sai của một mẫu.
3. Trong kiểm định giả thuyết thống kê, mức ý nghĩa (significance level) thường được ký hiệu là alpha (α) đại diện cho điều gì?
A. Xác suất mắc lỗi loại II (chấp nhận H0 khi H0 sai).
B. Xác suất bác bỏ giả thuyết H0 khi H0 đúng.
C. Xác suất chấp nhận giả thuyết H0 khi H0 đúng.
D. Xác suất mắc lỗi loại I (chấp nhận H0 khi H1 đúng).
4. Khái niệm nào sau đây mô tả việc chia tổng thể thành các nhóm nhỏ hơn (strata) và sau đó chọn mẫu ngẫu nhiên từ mỗi nhóm?
A. Lấy mẫu ngẫu nhiên đơn giản.
B. Lấy mẫu phân tầng.
C. Lấy mẫu cụm.
D. Lấy mẫu thuận tiện.
5. Một cửa hàng bán áo sơ mi có ba kích cỡ: nhỏ, vừa và lớn. Tỷ lệ bán được của mỗi kích cỡ lần lượt là 20%, 50% và 30%. Nếu chọn ngẫu nhiên 10 khách hàng, xác suất có đúng 2 khách hàng mua cỡ nhỏ, 5 khách hàng mua cỡ vừa và 3 khách hàng mua cỡ lớn là bao nhiêu (sử dụng phân phối đa thức)?
A. 0.0000
B. 0.0304
C. 0.2500
D. 0.3000
6. Biến ngẫu nhiên X tuân theo phân phối Poisson với tham số λ = 3. Tính xác suất P(X = 2).
A. 0.2240
B. 0.1494
C. 0.4481
D. 0.0498
7. Loại biểu đồ nào sau đây thích hợp nhất để so sánh phân phối của một biến số giữa hai nhóm khác nhau?
A. Biểu đồ phân tán (scatter plot).
B. Biểu đồ hộp (box plot).
C. Biểu đồ đường (line chart).
D. Biểu đồ tròn (pie chart).
8. Phương pháp nào sau đây được sử dụng để giảm số lượng biến trong một tập dữ liệu trong khi vẫn giữ lại thông tin quan trọng nhất?
A. Phân tích hồi quy (regression analysis).
B. Phân tích thành phần chính (principal component analysis).
C. Phân tích phương sai (ANOVA).
D. Phân tích tương quan (correlation analysis).
9. Trong kiểm định giả thuyết, khi nào thì ta bác bỏ giả thuyết H0?
A. Khi p-value lớn hơn mức ý nghĩa alpha.
B. Khi giá trị thống kê kiểm định nằm trong vùng chấp nhận.
C. Khi p-value nhỏ hơn hoặc bằng mức ý nghĩa alpha.
D. Khi kích thước mẫu quá nhỏ.
10. Cho hai biến ngẫu nhiên X và Y có E(X) = 2, E(Y) = 3, Var(X) = 1, Var(Y) = 4 và Cov(X, Y) = 1. Tính Var(X + Y).
11. Cho biến ngẫu nhiên X có hàm mật độ xác suất f(x) = kx, với 0 ≤ x ≤ 2. Tìm giá trị của k.
12. Trong phân tích phương sai (ANOVA), yếu tố nào sau đây được sử dụng để so sánh sự khác biệt giữa các nhóm?
A. T-test.
B. F-statistic.
C. Chi-square test.
D. Z-test.
13. Một hộp chứa 5 bi đỏ và 3 bi xanh. Nếu chọn ngẫu nhiên 2 bi mà không hoàn lại, xác suất để cả hai bi đều đỏ là bao nhiêu?
A. 5/14
B. 25/64
C. 10/56
D. 1/4
14. Một nhà máy sản xuất ốc vít có tỷ lệ ốc vít bị lỗi là 5%. Nếu chọn ngẫu nhiên 10 ốc vít, xác suất có đúng 1 ốc vít bị lỗi là bao nhiêu (sử dụng phân phối nhị thức)?
A. 0.5987
B. 0.3151
C. 0.05
D. 0.0000
15. Một người chơi tung một đồng xu ba lần. Tính xác suất để có ít nhất một mặt ngửa.
16. Một máy sản xuất các linh kiện điện tử. Xác suất để một linh kiện bị lỗi là 0.01. Nếu kiểm tra 200 linh kiện, sử dụng phân phối Poisson để xấp xỉ xác suất có đúng 3 linh kiện bị lỗi.
A. 0.0000
B. 0.1804
C. 0.5000
D. 0.0613
17. Trong phân tích hồi quy đa biến, hiện tượng đa cộng tuyến (multicollinearity) xảy ra khi nào?
A. Có sự tương quan cao giữa các biến độc lập.
B. Có sự tương quan cao giữa biến độc lập và biến phụ thuộc.
C. Phương sai của sai số thay đổi theo giá trị của biến độc lập.
D. Sai số có phân phối không chuẩn.
18. Một công ty sản xuất bóng đèn tuyên bố rằng tuổi thọ trung bình của bóng đèn là 1000 giờ. Để kiểm tra tuyên bố này, một mẫu 50 bóng đèn được kiểm tra và cho thấy tuổi thọ trung bình mẫu là 950 giờ với độ lệch chuẩn mẫu là 100 giờ. Sử dụng kiểm định t, giá trị thống kê t là bao nhiêu?
19. Trong phân tích thời gian, thành phần nào sau đây mô tả sự biến động ngắn hạn và không đều đặn trong chuỗi thời gian?
A. Xu hướng (trend).
B. Tính mùa vụ (seasonality).
C. Chu kỳ (cycle).
D. Tính ngẫu nhiên (irregularity).
20. Trong kiểm định giả thuyết, p-value là gì?
A. Xác suất giả thuyết H0 là đúng.
B. Xác suất thu được kết quả ít nhất cực đoan như kết quả quan sát được, giả sử H0 là đúng.
C. Xác suất mắc lỗi loại I.
D. Xác suất mắc lỗi loại II.
21. Độ lệch chuẩn (standard deviation) đo lường điều gì?
A. Mức độ tập trung của dữ liệu xung quanh giá trị trung bình.
B. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình.
C. Giá trị trung bình của dữ liệu.
D. Số lượng dữ liệu trong tập dữ liệu.
22. Phân phối nào sau đây thường được sử dụng để mô hình hóa số lượng sự kiện xảy ra trong một khoảng thời gian hoặc không gian nhất định?
A. Phân phối chuẩn.
B. Phân phối nhị thức.
C. Phân phối Poisson.
D. Phân phối mũ.
23. Trong thống kê suy diễn, lỗi loại II (Type II error) xảy ra khi nào?
A. Bác bỏ giả thuyết H0 khi H0 đúng.
B. Chấp nhận giả thuyết H0 khi H0 sai.
C. Bác bỏ giả thuyết H1 khi H1 đúng.
D. Chấp nhận giả thuyết H1 khi H1 sai.
24. Một nghiên cứu muốn so sánh hiệu quả của ba phương pháp giảng dạy khác nhau. Phương pháp thống kê nào sau đây phù hợp nhất để sử dụng?
A. Kiểm định t (t-test).
B. Phân tích phương sai (ANOVA).
C. Hồi quy tuyến tính (linear regression).
D. Kiểm định Chi bình phương (Chi-square test).
25. Trong lý thuyết ước lượng, một ước lượng không chệch (unbiased estimator) là gì?
A. Một ước lượng luôn bằng tham số thực tế.
B. Một ước lượng có phương sai nhỏ nhất.
C. Một ước lượng mà giá trị kỳ vọng của nó bằng tham số thực tế.
D. Một ước lượng luôn dương.
26. Trong kiểm định giả thuyết, độ mạnh của kiểm định (power of the test) là gì?
A. Xác suất mắc lỗi loại I.
B. Xác suất mắc lỗi loại II.
C. Xác suất bác bỏ H0 khi H0 sai.
D. Xác suất chấp nhận H0 khi H0 đúng.
27. Giá trị trung vị (median) của một tập dữ liệu là gì?
A. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
B. Giá trị trung bình cộng của tập dữ liệu.
C. Giá trị nằm chính giữa tập dữ liệu đã sắp xếp.
D. Giá trị lớn nhất trừ giá trị nhỏ nhất trong tập dữ liệu.
28. Trong hồi quy tuyến tính đơn giản, hệ số xác định (R-squared) đo lường điều gì?
A. Mức độ phù hợp của mô hình với dữ liệu.
B. Mức độ ý nghĩa thống kê của các biến độc lập.
C. Phương sai của sai số.
D. Độ lớn của hệ số hồi quy.
29. Một tập dữ liệu có phương sai bằng 0 có nghĩa là gì?
A. Tất cả các giá trị trong tập dữ liệu đều bằng nhau.
B. Giá trị trung bình của tập dữ liệu bằng 0.
C. Tập dữ liệu không có giá trị nào.
D. Tập dữ liệu có phân phối chuẩn.
30. Cho hai biến cố A và B độc lập. Biết P(A) = 0.4 và P(B) = 0.6. Tính P(A ∪ B).
31. Phương pháp nào sau đây được sử dụng để giảm số lượng biến trong một tập dữ liệu lớn trong khi vẫn giữ lại thông tin quan trọng?
A. Phân tích hồi quy.
B. Phân tích phương sai (ANOVA).
C. Phân tích thành phần chính (Principal Component Analysis – PCA).
D. Kiểm định Chi-bình phương.
32. Công thức nào sau đây được sử dụng để tính khoảng tin cậy cho trung bình của một mẫu khi độ lệch chuẩn của tổng thể không được biết?
A. z = (x̄ – μ) / (σ / √n)
B. t = (x̄ – μ) / (s / √n)
C. χ² = (n – 1)s² / σ²
D. F = s1² / s2²
33. Khi kích thước mẫu lớn (ví dụ: n > 30), định lý giới hạn trung tâm (Central Limit Theorem) nói rằng phân phối của trung bình mẫu sẽ tiệm cận với phân phối nào?
A. Phân phối Poisson.
B. Phân phối nhị thức.
C. Phân phối chuẩn.
D. Phân phối đều.
34. Giá trị kỳ vọng (Expected value) của một biến ngẫu nhiên rời rạc được tính như thế nào?
A. Là giá trị xuất hiện nhiều nhất.
B. Là trung bình cộng của tất cả các giá trị có thể.
C. Là tổng của mỗi giá trị có thể nhân với xác suất tương ứng của nó.
D. Là giá trị nằm ở giữa tập dữ liệu.
35. Trong hồi quy tuyến tính, hệ số chặn (intercept) biểu thị điều gì?
A. Độ dốc của đường hồi quy.
B. Giá trị dự đoán của biến phụ thuộc khi tất cả các biến độc lập bằng 0.
C. Mức độ phù hợp của mô hình.
D. Sai số chuẩn của các hệ số.
36. Trong hồi quy tuyến tính, hệ số góc (slope) biểu thị điều gì?
A. Giá trị dự đoán của biến phụ thuộc khi tất cả các biến độc lập bằng 0.
B. Sự thay đổi trong biến phụ thuộc khi biến độc lập tăng lên một đơn vị.
C. Mức độ phù hợp của mô hình.
D. Sai số chuẩn của các hệ số.
37. Hệ số tương quan Pearson (Pearson correlation coefficient) đo lường điều gì?
A. Mức độ biến động của dữ liệu.
B. Mức độ phù hợp của mô hình hồi quy.
C. Mối quan hệ tuyến tính giữa hai biến định lượng.
D. Mối quan hệ phi tuyến tính giữa hai biến định tính.
38. Mục tiêu của việc kiểm định giả thuyết là gì?
A. Để chứng minh rằng giả thuyết H0 là đúng.
B. Để xác định xem có đủ bằng chứng để bác bỏ giả thuyết H0 hay không.
C. Để tính toán giá trị trung bình của mẫu.
D. Để ước tính phương sai của tổng thể.
39. Khi nào thì nên sử dụng kiểm định Chi-bình phương (Chi-square test)?
A. Để so sánh trung bình của hai mẫu độc lập.
B. Để kiểm tra sự phù hợp của một phân phối lý thuyết với dữ liệu thực tế.
C. Để đo lường mối quan hệ tuyến tính giữa hai biến liên tục.
D. Để dự đoán giá trị của một biến dựa trên giá trị của biến khác.
40. Khi nào nên sử dụng kiểm định t ghép cặp (paired t-test)?
A. Để so sánh trung bình của hai mẫu độc lập.
B. Để so sánh trung bình của hai mẫu có liên quan (ví dụ: trước và sau can thiệp).
C. Để so sánh phương sai của hai mẫu.
D. Để kiểm tra sự phù hợp của một phân phối với dữ liệu.
41. Trong phân tích hồi quy, hệ số R-squared (R²) đo lường điều gì?
A. Độ mạnh của mối quan hệ giữa các biến độc lập.
B. Phần trăm phương sai của biến phụ thuộc được giải thích bởi các biến độc lập trong mô hình.
C. Mức độ ý nghĩa thống kê của các hệ số hồi quy.
D. Sai số chuẩn của các hệ số hồi quy.
42. Để kiểm tra xem có mối liên hệ giữa hai biến định tính hay không, chúng ta sử dụng kiểm định nào?
A. Kiểm định t-Student.
B. Phân tích phương sai (ANOVA).
C. Hồi quy tuyến tính.
D. Kiểm định Chi-bình phương.
43. Đặc điểm nào sau đây KHÔNG phải là đặc điểm của phân phối Poisson?
A. Các sự kiện xảy ra độc lập với nhau.
B. Số lượng sự kiện trung bình trong một khoảng thời gian hoặc không gian nhất định là không đổi.
C. Có hai kết quả có thể xảy ra: thành công hoặc thất bại.
D. Số lượng sự kiện có thể xảy ra là không giới hạn.
44. Điều gì xảy ra với độ rộng của khoảng tin cậy khi kích thước mẫu tăng lên (giả sử các yếu tố khác không đổi)?
A. Độ rộng của khoảng tin cậy tăng lên.
B. Độ rộng của khoảng tin cậy giảm xuống.
C. Độ rộng của khoảng tin cậy không thay đổi.
D. Không thể xác định được sự thay đổi.
45. Phân phối nào sau đây thường được sử dụng để mô hình hóa số lượng sự kiện xảy ra trong một khoảng thời gian hoặc không gian nhất định?
A. Phân phối chuẩn (Normal distribution).
B. Phân phối Poisson (Poisson distribution).
C. Phân phối nhị thức (Binomial distribution).
D. Phân phối đều (Uniform distribution).
46. Trong kiểm định giả thuyết thống kê, sai lầm loại I (Type I error) xảy ra khi nào?
A. Chấp nhận giả thuyết H0 khi nó sai.
B. Bác bỏ giả thuyết H0 khi nó đúng.
C. Chấp nhận giả thuyết H1 khi nó đúng.
D. Bác bỏ giả thuyết H1 khi nó sai.
47. Đại lượng nào sau đây đo lường mức độ phân tán của dữ liệu so với giá trị trung bình?
A. Trung vị (Median).
B. Giá trị lớn nhất (Maximum).
C. Phương sai (Variance).
D. Tần số (Frequency).
48. Phân phối nào sau đây thường được sử dụng để mô hình hóa xác suất thành công trong một số lượng thử nghiệm cố định?
A. Phân phối chuẩn (Normal distribution).
B. Phân phối Poisson (Poisson distribution).
C. Phân phối nhị thức (Binomial distribution).
D. Phân phối mũ (Exponential distribution).
49. Trong kiểm định giả thuyết, sai lầm loại II (Type II error) xảy ra khi nào?
A. Bác bỏ giả thuyết H0 khi nó đúng.
B. Chấp nhận giả thuyết H0 khi nó sai.
C. Bác bỏ giả thuyết H1 khi nó đúng.
D. Chấp nhận giả thuyết H1 khi nó sai.
50. Một cửa hàng muốn dự đoán doanh số bán hàng dựa trên chi phí quảng cáo. Phương pháp nào sau đây là phù hợp nhất?
A. Kiểm định t-Student.
B. Phân tích phương sai (ANOVA).
C. Hồi quy tuyến tính.
D. Kiểm định Chi-bình phương.
51. Trong thống kê mô tả, đại lượng nào sau đây được sử dụng để đo lường mức độ bất đối xứng của phân phối?
A. Phương sai.
B. Độ lệch chuẩn.
C. Độ nhọn (Kurtosis).
D. Độ xiên (Skewness).
52. Độ lệch chuẩn (Standard deviation) đo lường điều gì?
A. Giá trị trung bình của tập dữ liệu.
B. Mức độ phân tán của dữ liệu so với giá trị trung bình.
C. Giá trị lớn nhất trong tập dữ liệu.
D. Giá trị nhỏ nhất trong tập dữ liệu.
53. Một công ty muốn ước tính tỷ lệ khách hàng hài lòng với sản phẩm mới của họ. Họ nên sử dụng phương pháp thống kê nào?
A. Hồi quy tuyến tính.
B. Kiểm định t-Student.
C. Khoảng tin cậy cho tỷ lệ.
D. Phân tích phương sai (ANOVA).
54. Trong lý thuyết xác suất, hai sự kiện được gọi là độc lập nếu:
A. Sự xảy ra của sự kiện này ảnh hưởng đến xác suất xảy ra của sự kiện kia.
B. Chúng không thể xảy ra cùng một lúc.
C. Sự xảy ra của sự kiện này không ảnh hưởng đến xác suất xảy ra của sự kiện kia.
D. Tổng xác suất của chúng bằng 1.
55. Công thức nào sau đây được sử dụng để tính khoảng tin cậy cho phương sai của một mẫu?
A. t = (x̄ – μ) / (s / √n)
B. z = (x̄ – μ) / (σ / √n)
C. χ² = (n – 1)s² / σ²
D. F = s1² / s2²
56. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết H0 là đúng.
B. Xác suất quan sát được kết quả (hoặc kết quả cực đoan hơn) nếu giả thuyết H0 là đúng.
C. Xác suất mắc sai lầm loại I.
D. Xác suất mắc sai lầm loại II.
57. Đặc điểm nào sau đây KHÔNG phải là đặc điểm của phân phối chuẩn?
A. Đối xứng quanh giá trị trung bình.
B. Có hình dạng chuông.
C. Trung bình, trung vị và मोड bằng nhau.
D. Luôn luôn có giá trị từ 0 đến 1.
58. Trong phân tích phương sai (ANOVA), mục đích chính của việc so sánh các phương sai giữa các nhóm là gì?
A. Để xác định xem có sự khác biệt đáng kể giữa các trung bình của các nhóm hay không.
B. Để tính toán độ lệch chuẩn tổng thể.
C. Để xác định mối tương quan giữa các biến.
D. Để kiểm tra tính đồng nhất của phương sai.
59. Trong một bài toán kiểm định giả thuyết, mức ý nghĩa (significance level) thường được ký hiệu là α (alpha). α đại diện cho điều gì?
A. Xác suất chấp nhận giả thuyết H0 khi nó đúng.
B. Xác suất bác bỏ giả thuyết H0 khi nó đúng (sai lầm loại I).
C. Xác suất chấp nhận giả thuyết H0 khi nó sai (sai lầm loại II).
D. Xác suất bác bỏ giả thuyết H0 khi nó sai.
60. Một nhà nghiên cứu muốn so sánh hiệu quả của ba phương pháp giảng dạy khác nhau đối với kết quả học tập của sinh viên. Phương pháp thống kê nào phù hợp nhất?
A. Kiểm định t-Student độc lập.
B. Phân tích phương sai (ANOVA).
C. Hồi quy tuyến tính.
D. Kiểm định Chi-bình phương.
61. Một nhà đầu tư muốn so sánh lợi nhuận trung bình của hai loại cổ phiếu khác nhau. Kiểm định nào phù hợp nhất?
A. Kiểm định Chi bình phương.
B. Kiểm định t-Student hai mẫu độc lập.
C. Phân tích phương sai (ANOVA).
D. Phân tích hồi quy tuyến tính.
62. Một nhà nghiên cứu muốn so sánh hiệu quả của ba phương pháp giảng dạy khác nhau. Phương pháp thống kê nào phù hợp nhất để sử dụng?
A. Kiểm định t-Student.
B. Phân tích hồi quy tuyến tính.
C. Phân tích phương sai (ANOVA).
D. Kiểm định Chi bình phương.
63. Khi thực hiện kiểm định giả thuyết về sự khác biệt giữa hai trung bình, bạn sử dụng kiểm định t-Student nào nếu phương sai của hai quần thể không bằng nhau và chưa biết?
A. Kiểm định t ghép cặp (paired t-test).
B. Kiểm định t hai mẫu độc lập với phương sai bằng nhau.
C. Kiểm định t hai mẫu độc lập với phương sai không bằng nhau (Welch’s t-test).
D. Kiểm định z.
64. Trong phân tích phương sai (ANOVA), yếu tố nào được sử dụng để đánh giá sự khác biệt giữa các nhóm?
A. Tổng bình phương sai số (SSE).
B. Bậc tự do.
C. Thống kê F.
D. Giá trị p.
65. Khi nào thì nên sử dụng phân phối Poisson?
A. Khi mô tả số lần thành công trong một số lượng thử nghiệm cố định.
B. Khi mô tả thời gian giữa các sự kiện.
C. Khi mô tả số lượng sự kiện xảy ra trong một khoảng thời gian hoặc không gian nhất định.
D. Khi mô tả phân phối của dữ liệu liên tục.
66. Điều gì xảy ra với độ rộng của khoảng tin cậy khi tăng kích thước mẫu?
A. Độ rộng khoảng tin cậy tăng lên.
B. Độ rộng khoảng tin cậy giảm xuống.
C. Độ rộng khoảng tin cậy không đổi.
D. Không thể xác định được sự thay đổi.
67. Trong phân tích ANOVA một yếu tố, giả thuyết H0 thường được phát biểu như thế nào?
A. Tất cả các trung bình của các nhóm đều khác nhau.
B. Ít nhất một trung bình của các nhóm khác với các trung bình còn lại.
C. Tất cả các trung bình của các nhóm đều bằng nhau.
D. Phương sai của các nhóm khác nhau.
68. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết H0 là đúng.
B. Mức ý nghĩa (significance level) của kiểm định.
C. Xác suất quan sát được kết quả kiểm định (hoặc kết quả còn cực đoan hơn) nếu giả thuyết H0 là đúng.
D. Xác suất mắc sai lầm loại II.
69. Khi nào thì nên sử dụng kiểm định phi tham số thay vì kiểm định tham số?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc kích thước mẫu nhỏ.
D. Khi phương sai của các nhóm bằng nhau.
70. Khi nào thì nên sử dụng kiểm định Kruskal-Wallis?
A. Để so sánh trung bình của hai mẫu độc lập khi dữ liệu tuân theo phân phối chuẩn.
B. Để so sánh trung bình của ba nhóm trở lên khi dữ liệu không tuân theo phân phối chuẩn.
C. Để kiểm tra tính độc lập giữa hai biến định tính.
D. Để so sánh phương sai của hai mẫu.
71. Trong bài toán dự báo doanh số bán hàng, mô hình hồi quy nào phù hợp nhất khi có sự tương quan giữa các biến độc lập (đa cộng tuyến)?
A. Hồi quy tuyến tính đơn.
B. Hồi quy tuyến tính đa biến.
C. Hồi quy Ridge hoặc Lasso.
D. Hồi quy Logistic.
72. Một công ty muốn dự đoán doanh số bán hàng dựa trên chi phí quảng cáo. Mô hình nào phù hợp nhất?
A. Kiểm định t-Student.
B. Phân tích phương sai (ANOVA).
C. Phân tích hồi quy tuyến tính.
D. Kiểm định Chi bình phương.
73. Khi nào thì nên sử dụng kiểm định Wilcoxon signed-rank test?
A. Để so sánh trung bình của hai mẫu độc lập khi dữ liệu tuân theo phân phối chuẩn.
B. Để so sánh trung bình của hai mẫu ghép cặp khi dữ liệu không tuân theo phân phối chuẩn.
C. Để kiểm tra tính độc lập giữa hai biến định tính.
D. Để so sánh phương sai của hai mẫu.
74. Trong lý thuyết ước lượng điểm, ước lượng không chệch (unbiased estimator) là gì?
A. Ước lượng luôn bằng giá trị thực của tham số.
B. Ước lượng có phương sai nhỏ nhất.
C. Ước lượng mà giá trị kỳ vọng của nó bằng giá trị thực của tham số.
D. Ước lượng có sai số chuẩn bằng 0.
75. Một nhà máy sản xuất bóng đèn kiểm tra ngẫu nhiên 100 bóng và thấy có 5 bóng bị hỏng. Khoảng tin cậy 95% cho tỷ lệ bóng đèn hỏng của toàn bộ lô hàng là bao nhiêu? (Giả sử đã tính toán được khoảng tin cậy). Câu hỏi này thuộc loại nào?
A. Ước lượng điểm.
B. Kiểm định giả thuyết.
C. Ước lượng khoảng.
D. Phân tích hồi quy.
76. Trong thống kê mô tả, đại lượng nào đo lường mức độ phân tán của dữ liệu xung quanh giá trị trung bình?
A. Trung vị.
B. Mốt.
C. Độ lệch chuẩn.
D. Tứ phân vị.
77. Đâu là một đặc điểm của phân phối t-Student so với phân phối chuẩn?
A. Phân phối t-Student có đuôi mỏng hơn phân phối chuẩn.
B. Phân phối t-Student luôn đối xứng.
C. Phân phối t-Student có phương sai nhỏ hơn phân phối chuẩn.
D. Phân phối t-Student không phụ thuộc vào bậc tự do.
78. Một công ty muốn ước tính tỷ lệ khách hàng hài lòng với sản phẩm mới. Họ nên sử dụng loại khoảng tin cậy nào?
A. Khoảng tin cậy cho trung bình.
B. Khoảng tin cậy cho phương sai.
C. Khoảng tin cậy cho tỷ lệ.
D. Khoảng tin cậy cho độ lệch chuẩn.
79. Phương pháp nào sau đây được sử dụng để kiểm tra tính độc lập giữa hai biến định tính?
A. Kiểm định t-Student.
B. Phân tích phương sai (ANOVA).
C. Kiểm định Chi bình phương.
D. Phân tích hồi quy tuyến tính.
80. Một nhà quản lý muốn đánh giá xem có sự khác biệt về năng suất giữa hai ca làm việc (ca sáng và ca chiều) hay không. Kiểm định nào phù hợp nhất?
A. Kiểm định Chi bình phương.
B. Kiểm định t-Student hai mẫu độc lập.
C. Phân tích phương sai (ANOVA).
D. Phân tích hồi quy tuyến tính.
81. Trong phân tích tương quan, hệ số tương quan Pearson đo lường điều gì?
A. Mức độ phụ thuộc phi tuyến tính giữa hai biến.
B. Mức độ quan hệ tuyến tính giữa hai biến.
C. Mức độ ảnh hưởng của một biến lên biến khác.
D. Mức độ phân tán của dữ liệu.
82. Trong một cuộc khảo sát, bạn muốn xác định xem có mối liên hệ giữa giới tính (nam/nữ) và việc thích một loại sản phẩm cụ thể (có/không) hay không. Bạn nên sử dụng kiểm định nào?
A. Kiểm định t-Student.
B. Phân tích phương sai (ANOVA).
C. Kiểm định Chi bình phương.
D. Phân tích hồi quy tuyến tính.
83. Trong phân tích hồi quy tuyến tính, hệ số xác định (R-squared) cho biết điều gì?
A. Mức độ ý nghĩa của các biến độc lập.
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi các biến độc lập.
C. Độ lớn của hệ số hồi quy.
D. Sai số chuẩn của ước lượng.
84. Điều gì xảy ra với sai số chuẩn của trung bình mẫu khi kích thước mẫu tăng lên?
A. Sai số chuẩn tăng lên.
B. Sai số chuẩn giảm xuống.
C. Sai số chuẩn không đổi.
D. Không thể xác định.
85. Trong kiểm định giả thuyết, mức ý nghĩa (alpha) thường được chọn là 0.05. Điều này có nghĩa là gì?
A. Có 5% khả năng chấp nhận giả thuyết H0 khi nó sai.
B. Có 5% khả năng bác bỏ giả thuyết H0 khi nó đúng.
C. Có 95% khả năng chấp nhận giả thuyết H0 khi nó đúng.
D. Có 95% khả năng bác bỏ giả thuyết H0 khi nó sai.
86. Khoảng tin cậy (confidence interval) cho trung bình tổng thể được tính như thế nào khi độ lệch chuẩn của tổng thể đã biết?
A. Sử dụng phân phối t-Student.
B. Sử dụng phân phối chuẩn Z.
C. Sử dụng phân phối Chi bình phương.
D. Sử dụng phân phối F.
87. Khi nào thì nên sử dụng phân phối nhị thức?
A. Khi mô tả số lượng sự kiện xảy ra trong một khoảng thời gian nhất định.
B. Khi mô tả thời gian giữa các sự kiện.
C. Khi mô tả số lần thành công trong một số lượng thử nghiệm cố định, với mỗi thử nghiệm có hai kết quả (thành công/thất bại).
D. Khi mô tả dữ liệu liên tục.
88. Trong kiểm định giả thuyết thống kê, sai lầm loại I (Type I error) xảy ra khi nào?
A. Chấp nhận giả thuyết H0 khi nó sai.
B. Bác bỏ giả thuyết H0 khi nó đúng.
C. Chấp nhận giả thuyết H0 khi nó đúng.
D. Bác bỏ giả thuyết H0 khi nó sai.
89. Trong phân tích hồi quy, điều gì xảy ra nếu có hiện tượng đa cộng tuyến (multicollinearity)?
A. Các hệ số hồi quy trở nên ổn định hơn.
B. Phương sai của các hệ số hồi quy tăng lên.
C. Giá trị R-squared giảm xuống.
D. Mô hình trở nên dễ giải thích hơn.
90. Đâu là một đặc điểm của phân phối chuẩn?
A. Bất đối xứng.
B. Có hai đỉnh.
C. Đối xứng và có hình chuông.
D. Luôn luôn dương.
91. Trong một cuộc khảo sát, 60% người được hỏi thích sản phẩm A. Nếu chọn ngẫu nhiên 10 người, xác suất có đúng 6 người thích sản phẩm A là bao nhiêu (sử dụng phân phối nhị thức)?
A. 0.0403
B. 0.2007
C. 0.6
D. 0.1209
92. Một kỹ sư kiểm tra chất lượng sản phẩm và phát hiện ra rằng 10% sản phẩm bị lỗi. Nếu lấy ngẫu nhiên 5 sản phẩm, xác suất để có không quá 1 sản phẩm bị lỗi là bao nhiêu?
A. 0.9185
B. 0.5
C. 0.00045
D. 0.4095
93. Một cửa hàng ghi nhận số lượng khách hàng đến mỗi ngày trong một tuần như sau: 20, 25, 30, 28, 22, 24, 26. Tính độ lệch chuẩn của số lượng khách hàng.
A. 2.94
B. 3.16
C. 25
D. 7.84
94. Trong thống kê mô tả, phương sai đo lường điều gì?
A. Giá trị trung bình của tập dữ liệu.
B. Độ lệch trung bình tuyệt đối của các giá trị so với trung bình.
C. Độ phân tán của các giá trị so với trung bình.
D. Giá trị lớn nhất trừ giá trị nhỏ nhất trong tập dữ liệu.
95. Độ lệch chuẩn của một mẫu là 15. Nếu kích thước mẫu là 9, thì sai số chuẩn của trung bình mẫu là bao nhiêu?
96. Một công ty sản xuất bóng đèn. Tuổi thọ trung bình của bóng đèn là 1000 giờ với độ lệch chuẩn là 100 giờ. Giả sử tuổi thọ bóng đèn tuân theo phân phối chuẩn. Xác suất để một bóng đèn có tuổi thọ trên 1150 giờ là bao nhiêu?
A. 0.0668
B. 0.9332
C. 0.5
D. 0.1587
97. Phân phối nào sau đây thường được sử dụng để mô hình hóa số lượng sự kiện xảy ra trong một khoảng thời gian hoặc không gian nhất định?
A. Phân phối chuẩn.
B. Phân phối nhị thức.
C. Phân phối Poisson.
D. Phân phối mũ.
98. Trong phân tích hồi quy tuyến tính, hệ số xác định (R-squared) đo lường điều gì?
A. Mức độ ý nghĩa thống kê của các biến độc lập.
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi các biến độc lập.
C. Độ lớn của mối quan hệ giữa các biến độc lập.
D. Sai số chuẩn của các hệ số hồi quy.
99. Khi nào nên sử dụng kiểm định Chi-bình phương?
A. Để so sánh trung bình của hai nhóm độc lập.
B. Để phân tích mối quan hệ giữa hai biến định tính.
C. Để dự đoán giá trị của một biến liên tục dựa trên một biến khác.
D. Để kiểm tra sự khác biệt giữa các phương sai.
100. Khi nào nên sử dụng kiểm định phi tham số thay vì kiểm định tham số?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc kích thước mẫu nhỏ.
D. Khi muốn so sánh trung bình của hai nhóm.
101. Trong phân tích hồi quy đa biến, hiện tượng đa cộng tuyến (multicollinearity) xảy ra khi nào?
A. Khi các biến độc lập có tương quan cao với nhau.
B. Khi biến phụ thuộc có tương quan cao với chính nó.
C. Khi các hệ số hồi quy có giá trị lớn.
D. Khi mô hình hồi quy không phù hợp với dữ liệu.
102. Trong lý thuyết ước lượng, khoảng tin cậy 95% có nghĩa là gì?
A. Có 95% khả năng giá trị tham số thực nằm trong khoảng đó.
B. Nếu lặp lại quá trình lấy mẫu nhiều lần, 95% các khoảng tin cậy được tạo ra sẽ chứa giá trị tham số thực.
C. Có 5% khả năng giá trị tham số thực nằm ngoài khoảng đó.
D. Tất cả các đáp án trên.
103. Một nhà nghiên cứu muốn kiểm tra xem có sự khác biệt về điểm trung bình của sinh viên giữa ba trường đại học khác nhau hay không. Nên sử dụng kiểm định nào?
A. Kiểm định t (t-test).
B. Kiểm định Chi-bình phương.
C. Phân tích phương sai (ANOVA).
D. Phân tích hồi quy.
104. Một công ty muốn ước tính tỷ lệ khách hàng hài lòng với dịch vụ của họ. Họ lấy mẫu ngẫu nhiên 200 khách hàng và thấy có 160 người hài lòng. Hãy xây dựng khoảng tin cậy 99% cho tỷ lệ khách hàng hài lòng.
A. 0.8 ± 0.023
B. 0.8 ± 0.046
C. 0.8 ± 0.085
D. 0.8 ± 0.115
105. Một nhà máy sản xuất ốc vít. Người ta lấy ngẫu nhiên 100 ốc vít và thấy có 5 ốc vít bị lỗi. Hãy ước lượng tỷ lệ ốc vít bị lỗi của toàn bộ lô hàng với độ tin cậy 95%.
A. 0.05 ± 0.0196
B. 0.05 ± 0.098
C. 0.05 ± 0.00098
D. 0.05 ± 1.96
106. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết null là đúng.
B. Xác suất mắc sai lầm loại II.
C. Xác suất quan sát được kết quả (hoặc kết quả cực đoan hơn) nếu giả thuyết null là đúng.
D. Mức ý nghĩa của kiểm định.
107. Khi thực hiện kiểm định giả thuyết về trung bình của một quần thể, bạn có độ lệch chuẩn quần thể đã biết và kích thước mẫu nhỏ (n < 30). Nên sử dụng kiểm định nào?
A. Kiểm định z (z-test).
B. Kiểm định t (t-test).
C. Kiểm định Chi-bình phương.
D. Phân tích phương sai (ANOVA).
108. Trong thiết kế thí nghiệm, phương pháp chặn (blocking) được sử dụng để làm gì?
A. Để giảm kích thước mẫu.
B. Để kiểm soát các yếu tố gây nhiễu.
C. Để tăng số lượng biến độc lập.
D. Để đơn giản hóa quá trình phân tích dữ liệu.
109. Một người chơi tung một đồng xu 3 lần. Xác suất để có ít nhất một mặt ngửa là bao nhiêu?
110. Khi nào nên sử dụng kiểm định Wilcoxon signed-rank test?
A. Để so sánh trung bình của hai mẫu độc lập.
B. Để so sánh trung bình của hai mẫu liên quan (paired samples) khi dữ liệu không tuân theo phân phối chuẩn.
C. Để phân tích mối quan hệ giữa hai biến định tính.
D. Để so sánh phương sai của hai mẫu.
111. Khi nào thì trung vị (median) là thước đo xu hướng trung tâm tốt hơn so với trung bình (mean)?
A. Khi dữ liệu có phân phối đối xứng.
B. Khi dữ liệu có giá trị ngoại lệ (outliers).
C. Khi dữ liệu có kích thước mẫu lớn.
D. Khi tất cả các giá trị trong dữ liệu đều dương.
112. Trong phân tích chuỗi thời gian, thành phần nào sau đây thể hiện xu hướng dài hạn của dữ liệu?
A. Thành phần mùa vụ (seasonal).
B. Thành phần chu kỳ (cyclical).
C. Thành phần xu hướng (trend).
D. Thành phần ngẫu nhiên (random).
113. Một hộp chứa 5 viên bi đỏ và 3 viên bi xanh. Nếu bạn lấy ngẫu nhiên 2 viên bi, xác suất để cả hai viên bi đều màu đỏ là bao nhiêu?
A. 5/8
B. 25/64
C. 5/14
D. 10/56
114. Trong phân tích phương sai hai yếu tố (two-way ANOVA), điều gì được kiểm tra?
A. Ảnh hưởng của một yếu tố duy nhất lên biến phụ thuộc.
B. Ảnh hưởng của hai yếu tố lên biến phụ thuộc và tương tác giữa chúng.
C. Mối quan hệ giữa hai biến độc lập.
D. Sự khác biệt giữa các phương sai của hai nhóm.
115. Trong kiểm định giả thuyết thống kê, sai lầm loại I xảy ra khi nào?
A. Bác bỏ giả thuyết null khi nó thực sự đúng.
B. Chấp nhận giả thuyết null khi nó thực sự sai.
C. Không bác bỏ giả thuyết null khi nó thực sự đúng.
D. Bác bỏ giả thuyết null khi nó thực sự sai.
116. Trong phân tích phương sai (ANOVA), mục đích chính là gì?
A. Để so sánh trung bình của hai nhóm.
B. Để so sánh phương sai của hai nhóm.
C. Để so sánh trung bình của nhiều hơn hai nhóm.
D. Để phân tích mối quan hệ giữa hai biến định tính.
117. Nếu hệ số tương quan Pearson giữa hai biến là -1, điều này có nghĩa là gì?
A. Không có mối quan hệ tuyến tính giữa hai biến.
B. Có một mối quan hệ tuyến tính mạnh mẽ và dương giữa hai biến.
C. Có một mối quan hệ tuyến tính mạnh mẽ và âm giữa hai biến.
D. Hai biến này hoàn toàn không liên quan đến nhau.
118. Trong kiểm định giả thuyết, mức ý nghĩa (alpha) thường được chọn là 0.05. Điều này có nghĩa là gì?
A. Có 5% khả năng giả thuyết null là đúng.
B. Có 5% khả năng mắc sai lầm loại II.
C. Có 5% khả năng bác bỏ giả thuyết null khi nó thực sự đúng.
D. Có 95% khả năng chấp nhận giả thuyết null khi nó thực sự đúng.
119. Khi thực hiện kiểm định t (t-test) cho hai mẫu độc lập, giả định quan trọng nào cần được kiểm tra?
A. Dữ liệu phải tuân theo phân phối chuẩn.
B. Phương sai của hai mẫu phải bằng nhau (hoặc gần bằng).
C. Kích thước của hai mẫu phải bằng nhau.
D. Tất cả các đáp án trên.
120. Trong phân tích độ tin cậy (reliability analysis), hệ số Cronbach’s alpha đo lường điều gì?
A. Tính giá trị của các mục trong một thang đo.
B. Tính ổn định của một thang đo theo thời gian.
C. Tính nhất quán nội tại của một thang đo.
D. Tính tương đương giữa các phiên bản khác nhau của một thang đo.
121. Điều gì xảy ra với độ rộng của khoảng tin cậy khi kích thước mẫu tăng lên?
A. Độ rộng tăng lên.
B. Độ rộng giảm xuống.
C. Độ rộng không thay đổi.
D. Không thể xác định.
122. Hệ số tương quan Pearson đo lường điều gì?
A. Mức độ phụ thuộc phi tuyến tính giữa hai biến.
B. Mức độ quan hệ nhân quả giữa hai biến.
C. Mức độ liên kết tuyến tính giữa hai biến.
D. Mức độ khác biệt giữa hai biến.
123. Giả sử bạn có một tập dữ liệu chứa các giá trị ngoại lệ (outliers). Biện pháp nào sau đây ít bị ảnh hưởng bởi các giá trị ngoại lệ nhất?
A. Trung bình.
B. Độ lệch chuẩn.
C. Trung vị.
D. Phương sai.
124. Giả sử bạn có một mẫu dữ liệu và bạn muốn kiểm tra xem dữ liệu có tuân theo phân phối chuẩn hay không. Bạn nên sử dụng kiểm định nào?
A. Kiểm định t.
B. Hồi quy tuyến tính.
C. Kiểm định khi bình phương.
D. Kiểm định Shapiro-Wilk.
125. Khi nào thì nên sử dụng kiểm định t (t-test) thay vì kiểm định z (z-test) để so sánh trung bình của hai mẫu?
A. Khi kích thước mẫu lớn (n > 30).
B. Khi phương sai quần thể đã biết.
C. Khi kích thước mẫu nhỏ (n < 30) và phương sai quần thể chưa biết.
D. Khi các mẫu là độc lập.
126. Một công ty muốn ước tính tỷ lệ khách hàng hài lòng với sản phẩm mới của họ. Họ nên sử dụng phương pháp thống kê nào?
A. Hồi quy tuyến tính.
B. Kiểm định t.
C. Ước lượng khoảng tin cậy cho tỷ lệ.
D. Phân tích phương sai (ANOVA).
127. Trong phân tích phương sai (ANOVA), yếu tố nào sau đây được sử dụng để so sánh sự khác biệt giữa các nhóm?
A. Tổng bình phương sai số (SSE).
B. Tổng bình phương giữa các nhóm (SSB).
C. Bậc tự do.
D. Trung bình tổng thể.
128. Độ lệch chuẩn (standard deviation) đo lường điều gì?
A. Mức độ tập trung của dữ liệu xung quanh trung bình.
B. Mức độ phân tán của dữ liệu xung quanh trung bình.
C. Giá trị lớn nhất trong tập dữ liệu.
D. Giá trị nhỏ nhất trong tập dữ liệu.
129. Trong phân phối chuẩn, khoảng tin cậy 95% thường được xác định bằng cách nào?
A. Trung bình mẫu ± 1 độ lệch chuẩn.
B. Trung bình mẫu ± 1.645 độ lệch chuẩn.
C. Trung bình mẫu ± 1.96 độ lệch chuẩn.
D. Trung bình mẫu ± 2.576 độ lệch chuẩn.
130. Cho một biến ngẫu nhiên X tuân theo phân phối đều trên khoảng [a, b]. Công thức tính phương sai của X là gì?
A. (b-a)/2
B. (b-a)^2/2
C. (b-a)^2/12
D. (b+a)/2
131. Trong thống kê, ‘bậc tự do’ (degrees of freedom) thường liên quan đến điều gì?
A. Số lượng biến trong một mô hình.
B. Số lượng quan sát trong một mẫu.
C. Số lượng thông tin độc lập có sẵn để ước tính một tham số.
D. Mức ý nghĩa (alpha) được sử dụng trong kiểm định giả thuyết.
132. Một siêu thị muốn phân tích xem có mối liên hệ nào giữa việc mua tã giấy và mua bia hay không. Họ nên sử dụng phương pháp nào?
A. Kiểm định t.
B. Hồi quy tuyến tính.
C. Phân tích phương sai (ANOVA).
D. Kiểm định khi bình phương.
133. Một nhà khoa học muốn kiểm tra giả thuyết rằng một loại thuốc mới có hiệu quả hơn thuốc hiện tại. Họ tiến hành một thử nghiệm lâm sàng và thu thập dữ liệu. Loại kiểm định giả thuyết nào phù hợp nhất để sử dụng?
A. Kiểm định t một phía.
B. Kiểm định t hai phía.
C. Kiểm định khi bình phương.
D. Phân tích phương sai (ANOVA).
134. Một công ty bảo hiểm tính toán phí bảo hiểm dựa trên tuổi của khách hàng. Họ nhận thấy tuổi trung bình của khách hàng là 45 tuổi với độ lệch chuẩn là 10 tuổi. Nếu họ muốn tính phí bảo hiểm cho những khách hàng nằm trong top 5% những người lớn tuổi nhất, họ nên sử dụng giá trị tuổi nào làm ngưỡng?
A. 55 tuổi.
B. 61.45 tuổi.
C. 64.5 tuổi.
D. Không thể xác định.
135. Trong một cuộc khảo sát, 60% người được hỏi thích sản phẩm A. Nếu bạn chọn ngẫu nhiên 10 người, xác suất để có đúng 6 người thích sản phẩm A là bao nhiêu (sử dụng phân phối nhị thức)?
A. 0.111
B. 0.201
C. 0.251
D. 0.301
136. Một nhà nghiên cứu muốn xác định xem có sự khác biệt đáng kể về điểm trung bình của một bài kiểm tra giữa ba nhóm sinh viên khác nhau hay không. Phương pháp thống kê nào là phù hợp nhất để sử dụng?
A. Kiểm định t độc lập.
B. Kiểm định t ghép cặp.
C. Phân tích phương sai (ANOVA).
D. Hồi quy tuyến tính.
137. Đại lượng nào sau đây không phải là một tham số thống kê mô tả?
A. Trung bình mẫu.
B. Phương sai quần thể.
C. Độ lệch chuẩn mẫu.
D. Trung vị mẫu.
138. Phân phối nào sau đây thường được sử dụng để mô hình hóa số lượng sự kiện xảy ra trong một khoảng thời gian hoặc không gian nhất định?
A. Phân phối chuẩn.
B. Phân phối nhị thức.
C. Phân phối Poisson.
D. Phân phối mũ.
139. Một công ty muốn so sánh hiệu suất làm việc của ba nhóm nhân viên khác nhau. Họ nên sử dụng phương pháp thống kê nào?
A. Kiểm định t.
B. Hồi quy tuyến tính.
C. Phân tích phương sai (ANOVA).
D. Kiểm định khi bình phương.
140. Khi nào thì nên sử dụng kiểm định khi bình phương (Chi-square test)?
A. Để so sánh trung bình của hai mẫu.
B. Để kiểm tra sự phù hợp của một phân phối lý thuyết với dữ liệu thực tế.
C. Để ước tính khoảng tin cậy cho trung bình.
D. Để đo lường mối quan hệ tuyến tính giữa hai biến.
141. Trong lý thuyết xác suất, biến cố độc lập là gì?
A. Biến cố không thể xảy ra cùng một lúc.
B. Biến cố có xác suất xảy ra bằng nhau.
C. Biến cố mà việc xảy ra của biến cố này không ảnh hưởng đến xác suất xảy ra của biến cố kia.
D. Biến cố mà việc xảy ra của biến cố này chắc chắn kéo theo sự xảy ra của biến cố kia.
142. Chọn câu phát biểu đúng về ý nghĩa của mức ý nghĩa (alpha) trong kiểm định giả thuyết:
A. Xác suất mắc lỗi loại II.
B. Xác suất chấp nhận giả thuyết H0 khi nó đúng.
C. Xác suất bác bỏ giả thuyết H0 khi nó đúng.
D. Xác suất chấp nhận giả thuyết H0 khi nó sai.
143. Trong phân tích hồi quy, hệ số xác định (R-squared) đo lường điều gì?
A. Độ mạnh của mối quan hệ nhân quả giữa các biến.
B. Phần trăm biến thiên của biến phụ thuộc được giải thích bởi biến độc lập.
C. Độ chính xác của các hệ số hồi quy.
D. Ý nghĩa thống kê của mô hình hồi quy.
144. Trong một nghiên cứu về hiệu quả của một chương trình đào tạo, người ta chia ngẫu nhiên các nhân viên thành hai nhóm: một nhóm tham gia chương trình đào tạo và một nhóm không tham gia. Sau đó, người ta so sánh năng suất làm việc của hai nhóm. Đây là loại nghiên cứu nào?
A. Nghiên cứu quan sát.
B. Nghiên cứu thực nghiệm.
C. Nghiên cứu mô tả.
D. Nghiên cứu tương quan.
145. Trong kiểm định giả thuyết thống kê, sai lầm loại I (Type I error) xảy ra khi nào?
A. Chấp nhận giả thuyết H0 khi nó sai.
B. Bác bỏ giả thuyết H0 khi nó đúng.
C. Chấp nhận giả thuyết H0 khi nó đúng.
D. Bác bỏ giả thuyết H0 khi nó sai.
146. Một cửa hàng bán lẻ muốn dự đoán doanh số bán hàng dựa trên chi phí quảng cáo. Họ nên sử dụng kỹ thuật thống kê nào?
A. Kiểm định t.
B. Hồi quy tuyến tính.
C. Phân tích phương sai (ANOVA).
D. Kiểm định khi bình phương.
147. Trong một bài toán hồi quy tuyến tính đơn giản, hệ số góc (slope) biểu thị điều gì?
A. Giá trị của biến độc lập khi biến phụ thuộc bằng 0.
B. Giá trị của biến phụ thuộc khi biến độc lập bằng 0.
C. Sự thay đổi của biến phụ thuộc khi biến độc lập tăng một đơn vị.
D. Sự thay đổi của biến độc lập khi biến phụ thuộc tăng một đơn vị.
148. Khi nào thì nên sử dụng phương pháp lấy mẫu phân tầng (stratified sampling)?
A. Khi quần thể đồng nhất.
B. Khi muốn đảm bảo đại diện từ các nhóm con khác nhau trong quần thể.
C. Khi không có thông tin về quần thể.
D. Khi muốn tiết kiệm chi phí.
149. Một nhà máy sản xuất bóng đèn kiểm tra chất lượng sản phẩm. Họ chọn ngẫu nhiên 100 bóng đèn và thấy 5 bóng đèn bị lỗi. Hãy ước tính tỷ lệ bóng đèn bị lỗi của toàn bộ lô hàng.
A. 0.05
B. 0.95
C. 0.10
D. Không thể ước tính.
150. Giả sử bạn có dữ liệu về chiều cao và cân nặng của một nhóm người. Bạn muốn tìm hiểu xem chiều cao có dự đoán được cân nặng hay không. Bạn nên sử dụng phương pháp nào?
A. Kiểm định t.
B. Hồi quy tuyến tính.
C. Phân tích phương sai (ANOVA).
D. Kiểm định khi bình phương.