1. Khi nào thì sử dụng kiểm định Chi-bình phương (Chi-square test)?
A. Để so sánh trung bình của hai mẫu.
B. Để kiểm tra sự độc lập giữa hai biến định tính.
C. Để kiểm tra sự khác biệt giữa các phương sai.
D. Để ước lượng tham số của quần thể.
2. Tứ phân vị (quartiles) chia một tập dữ liệu thành bao nhiêu phần?
A. 2 phần
B. 3 phần
C. 4 phần
D. 5 phần
3. Phân phối nào thường được sử dụng để mô hình hóa số lượng sự kiện xảy ra trong một khoảng thời gian hoặc không gian nhất định?
A. Phân phối chuẩn.
B. Phân phối nhị thức.
C. Phân phối Poisson.
D. Phân phối mũ.
4. Độ lệch chuẩn (standard deviation) đo lường điều gì?
A. Giá trị trung bình của dữ liệu.
B. Mức độ phân tán của dữ liệu so với giá trị trung bình.
C. Độ tin cậy của ước lượng.
D. Mức độ tương quan giữa hai biến.
5. Khi nào thì sử dụng kiểm định F (F-test)?
A. Để so sánh trung bình của hai mẫu.
B. Để kiểm tra sự độc lập giữa hai biến định tính.
C. Để so sánh phương sai của hai hoặc nhiều quần thể (ANOVA).
D. Để ước lượng tham số của quần thể.
6. Điều gì xảy ra với khoảng tin cậy khi mức độ tin cậy tăng lên (ví dụ, từ 95% lên 99%)?
A. Khoảng tin cậy trở nên hẹp hơn.
B. Khoảng tin cậy trở nên rộng hơn.
C. Khoảng tin cậy không thay đổi.
D. Không thể xác định.
7. Trong kiểm định giả thuyết, sai lầm loại II xảy ra khi nào?
A. Bác bỏ giả thuyết H0 khi H0 đúng.
B. Chấp nhận giả thuyết H0 khi H0 sai.
C. Bác bỏ giả thuyết H1 khi H1 đúng.
D. Chấp nhận giả thuyết H1 khi H1 đúng.
8. Trong phân tích hồi quy, hiện tượng đa cộng tuyến (multicollinearity) xảy ra khi nào?
A. Khi có một biến độc lập duy nhất.
B. Khi các biến độc lập có mối tương quan cao với nhau.
C. Khi biến phụ thuộc không tuân theo phân phối chuẩn.
D. Khi sai số có phương sai thay đổi.
9. Sai số chuẩn (standard error) của trung bình mẫu đo lường điều gì?
A. Độ lệch chuẩn của quần thể.
B. Độ lệch chuẩn của mẫu.
C. Mức độ phân tán của các trung bình mẫu so với trung bình quần thể.
D. Giá trị trung bình của các mẫu.
10. Trong kiểm định giả thuyết, sai lầm loại I xảy ra khi nào?
A. Bác bỏ giả thuyết H0 khi H0 đúng.
B. Chấp nhận giả thuyết H0 khi H0 sai.
C. Bác bỏ giả thuyết H1 khi H1 đúng.
D. Chấp nhận giả thuyết H1 khi H1 sai.
11. Khi kích thước mẫu tăng lên, điều gì xảy ra với độ rộng của khoảng tin cậy?
A. Độ rộng của khoảng tin cậy tăng lên.
B. Độ rộng của khoảng tin cậy giảm xuống.
C. Độ rộng của khoảng tin cậy không thay đổi.
D. Không thể xác định sự thay đổi.
12. Trong phân tích hồi quy, hệ số xác định (R-squared) đo lường điều gì?
A. Độ dốc của đường hồi quy.
B. Mức độ phù hợp của mô hình hồi quy, tức là tỷ lệ phương sai của biến phụ thuộc được giải thích bởi các biến độc lập.
C. Sai số chuẩn của các ước lượng.
D. Mức độ tương quan giữa các biến độc lập.
13. Phân phối nhị thức (binomial distribution) mô tả điều gì?
A. Xác suất của một biến liên tục.
B. Số lượng thành công trong một chuỗi các thử nghiệm độc lập.
C. Thời gian cho đến khi một sự kiện xảy ra.
D. Số lượng sự kiện xảy ra trong một khoảng thời gian nhất định.
14. Trong kiểm định giả thuyết, ý nghĩa của việc tăng kích thước mẫu là gì?
A. Làm tăng xác suất mắc sai lầm loại I.
B. Làm giảm sức mạnh của kiểm định.
C. Làm giảm sai số chuẩn và tăng sức mạnh của kiểm định.
D. Không ảnh hưởng đến kết quả kiểm định.
15. Trong hồi quy tuyến tính, ý nghĩa của hệ số chặn (intercept) là gì?
A. Độ dốc của đường hồi quy.
B. Giá trị dự đoán của biến phụ thuộc khi tất cả các biến độc lập bằng 0.
C. Mức độ phù hợp của mô hình hồi quy.
D. Sai số chuẩn của các ước lượng.
16. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất mắc sai lầm loại II.
B. Xác suất giả thuyết H0 là đúng.
C. Xác suất thu được kết quả quan sát hoặc kết quả khắc nghiệt hơn nếu H0 là đúng.
D. Mức ý nghĩa α được chọn trước.
17. Trong phân tích phương sai (ANOVA), giả thuyết H0 thường là gì?
A. Tất cả các trung bình của các nhóm đều khác nhau.
B. Ít nhất một trung bình của các nhóm khác nhau.
C. Tất cả các trung bình của các nhóm đều bằng nhau.
D. Phương sai của các nhóm khác nhau.
18. Phương sai (variance) đo lường điều gì?
A. Giá trị trung bình của dữ liệu.
B. Mức độ phân tán của dữ liệu so với giá trị trung bình (bình phương độ lệch chuẩn).
C. Độ tin cậy của ước lượng.
D. Mức độ tương quan giữa hai biến.
19. Khi nào thì sử dụng kiểm định t (t-test) thay vì kiểm định z (z-test) để so sánh trung bình của hai mẫu?
A. Khi kích thước mẫu lớn (n > 30).
B. Khi phương sai của quần thể đã biết.
C. Khi phương sai của quần thể chưa biết và kích thước mẫu nhỏ (n < 30).
D. Khi dữ liệu tuân theo phân phối chuẩn.
20. Phân phối nào thường được sử dụng để mô hình hóa thời gian cho đến khi một sự kiện xảy ra?
A. Phân phối chuẩn.
B. Phân phối nhị thức.
C. Phân phối Poisson.
D. Phân phối mũ.
21. Hệ số chặn trong mô hình hồi quy bội biểu thị điều gì?
A. Sự thay đổi trung bình trong biến phụ thuộc ứng với một đơn vị thay đổi trong một biến độc lập cụ thể.
B. Giá trị dự đoán của biến phụ thuộc khi tất cả các biến độc lập đều bằng không.
C. Mức độ biến thiên trong biến phụ thuộc được giải thích bởi các biến độc lập.
D. Mức độ tương quan giữa các biến độc lập.
22. Trong kiểm định giả thuyết, nếu giá trị p nhỏ hơn mức ý nghĩa α, chúng ta nên làm gì?
A. Chấp nhận giả thuyết H0.
B. Bác bỏ giả thuyết H0.
C. Không đưa ra kết luận.
D. Tăng kích thước mẫu.
23. Hệ số tương quan (correlation coefficient) có giá trị nằm trong khoảng nào?
A. 0 đến 1
B. -1 đến 0
C. -∞ đến +∞
D. -1 đến +1
24. Ước lượng điểm (point estimate) là gì?
A. Một khoảng giá trị mà chúng ta tin rằng tham số của quần thể nằm trong đó.
B. Một giá trị duy nhất ước lượng cho tham số của quần thể.
C. Xác suất tham số của quần thể nằm trong một khoảng giá trị nhất định.
D. Sai số chuẩn của ước lượng.
25. Kiểm định giả thuyết một phía (one-tailed test) được sử dụng khi nào?
A. Khi chúng ta quan tâm đến cả hai hướng của sự khác biệt.
B. Khi chúng ta chỉ quan tâm đến một hướng của sự khác biệt.
C. Khi chúng ta không có giả thuyết cụ thể về hướng của sự khác biệt.
D. Khi kích thước mẫu lớn.
26. Khoảng tin cậy (confidence interval) là gì?
A. Một giá trị duy nhất ước lượng cho tham số của quần thể.
B. Một khoảng giá trị mà chúng ta tin rằng tham số của quần thể nằm trong đó với một độ tin cậy nhất định.
C. Xác suất tham số của quần thể nằm trong một khoảng giá trị nhất định.
D. Sai số chuẩn của ước lượng.
27. Trung vị (median) của một tập dữ liệu là gì?
A. Giá trị trung bình của tập dữ liệu.
B. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
C. Giá trị ở giữa của tập dữ liệu đã được sắp xếp.
D. Tổng của tất cả các giá trị chia cho số lượng giá trị.
28. Giá trị ngoại lệ (outlier) là gì?
A. Giá trị trung bình của tập dữ liệu.
B. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
C. Một giá trị rất khác biệt so với các giá trị khác trong tập dữ liệu.
D. Giá trị ở giữa của tập dữ liệu đã được sắp xếp.
29. Trong kiểm định giả thuyết, sức mạnh của kiểm định (power of the test) là gì?
A. Xác suất mắc sai lầm loại I.
B. Xác suất mắc sai lầm loại II.
C. Xác suất bác bỏ giả thuyết H0 khi nó sai.
D. Xác suất chấp nhận giả thuyết H0 khi nó đúng.
30. Mức ý nghĩa (α) trong kiểm định giả thuyết là gì?
A. Xác suất mắc sai lầm loại II.
B. Xác suất chấp nhận giả thuyết H0 khi nó sai.
C. Xác suất bác bỏ giả thuyết H0 khi nó đúng.
D. Xác suất chấp nhận giả thuyết H0 khi nó đúng.
31. Cho X và Y là hai biến ngẫu nhiên độc lập. Khi đó, Cov(X, Y) bằng bao nhiêu?
A. E(X)E(Y)
B. 0
C. Var(X)Var(Y)
D. E(XY)
32. Cho X và Y là hai biến ngẫu nhiên. Khi đó, Var(X + Y) bằng bao nhiêu nếu X và Y độc lập?
A. Var(X) + Var(Y) + 2Cov(X, Y)
B. Var(X) + Var(Y)
C. Var(X) + Var(Y) – 2Cov(X, Y)
D. Var(X) * Var(Y)
33. Hàm mật độ xác suất (PDF) của một biến ngẫu nhiên liên tục phải thỏa mãn điều kiện nào?
A. Luôn dương.
B. Luôn nhỏ hơn 1.
C. Tích phân trên toàn bộ miền xác định bằng 1.
D. Luôn là một đường thẳng.
34. Ý nghĩa của việc chuẩn hóa một biến ngẫu nhiên là gì?
A. Làm cho giá trị trung bình bằng 1.
B. Làm cho phương sai bằng 1.
C. Chuyển đổi biến về phân phối chuẩn tắc (mean=0, variance=1).
D. Loại bỏ các giá trị ngoại lệ.
35. Biến ngẫu nhiên X tuân theo phân phối Poisson với tham số λ. Phương sai của X bằng bao nhiêu?
36. Khi nào thì phân phối nhị thức có thể được xấp xỉ bằng phân phối Poisson?
A. Khi số lần thử nghiệm nhỏ.
B. Khi xác suất thành công lớn.
C. Khi số lần thử nghiệm lớn và xác suất thành công nhỏ.
D. Khi số lần thử nghiệm bằng xác suất thành công.
37. Giá trị kỳ vọng của một biến ngẫu nhiên rời rạc được tính bằng công thức nào?
A. Tổng của các giá trị có thể có.
B. Trung bình cộng của các giá trị có thể có.
C. Tổng của các giá trị có thể có nhân với xác suất tương ứng của chúng.
D. Tích của các giá trị có thể có và xác suất tương ứng của chúng.
38. Biến ngẫu nhiên X tuân theo phân phối Bernoulli với tham số p. Giá trị kỳ vọng của X bằng bao nhiêu?
A. 1 – p
B. p
C. p(1-p)
D. 1/p
39. Một máy sản xuất có tỷ lệ phế phẩm là 5%. Lấy ngẫu nhiên 10 sản phẩm. Tính xác suất để có đúng 1 phế phẩm.
A. 0.05
B. 0.5
C. 0.315
D. 0.000
40. Nếu X và Y là hai biến ngẫu nhiên độc lập và X ~ Poisson(2), Y ~ Poisson(3), thì X+Y tuân theo phân phối nào?
A. Poisson(1)
B. Poisson(5)
C. Nhị thức(5, p)
D. Chuẩn(5, σ^2)
41. Một hộp có 5 bi đỏ và 3 bi xanh. Lấy ngẫu nhiên 2 bi. Tính xác suất để cả 2 bi đều đỏ (lấy không hoàn lại).
A. 5/8
B. 25/64
C. 5/14
D. 10/56
42. Phương sai của một biến ngẫu nhiên đo lường điều gì?
A. Giá trị trung bình của biến.
B. Độ lệch chuẩn của biến.
C. Mức độ phân tán của các giá trị so với giá trị trung bình.
D. Xác suất xảy ra của biến.
43. Một đồng xu được tung 3 lần. Tính xác suất để có ít nhất 2 mặt ngửa.
44. Độ lệch chuẩn là căn bậc hai của đại lượng nào?
A. Giá trị kỳ vọng.
B. Phương sai.
C. Trung vị.
D. Mốt.
45. Ứng dụng quan trọng nhất của định lý giới hạn trung tâm là gì?
A. Tính toán giá trị kỳ vọng.
B. Ước lượng xác suất của các sự kiện.
C. Suy luận thống kê về trung bình của quần thể.
D. Tính toán phương sai.
46. Phân phối đều liên tục trên khoảng [a, b] có đặc điểm gì?
A. Xác suất tập trung ở trung tâm.
B. Xác suất giảm dần từ a đến b.
C. Mọi giá trị trong khoảng [a, b] có cùng xác suất.
D. Chỉ có hai giá trị a và b có xác suất khác 0.
47. Phân phối nào sau đây thường được sử dụng để mô hình hóa số lượng sự kiện xảy ra trong một khoảng thời gian hoặc không gian nhất định?
A. Phân phối chuẩn.
B. Phân phối nhị thức.
C. Phân phối Poisson.
D. Phân phối đều.
48. Cho X là biến ngẫu nhiên có hàm phân phối xác suất F(x). Khi đó, P(a <= X <= b) được tính như thế nào?
A. F(b) – F(a)
B. F(a) – F(b)
C. F(a) + F(b)
D. F(a) * F(b)
49. Định lý giới hạn trung tâm (Central Limit Theorem) phát biểu điều gì?
A. Tổng của các biến ngẫu nhiên độc lập có phân phối chuẩn.
B. Trung bình mẫu của một số lượng lớn các biến ngẫu nhiên độc lập, có cùng phân phối, sẽ xấp xỉ phân phối chuẩn.
C. Phương sai của tổng các biến ngẫu nhiên độc lập bằng tổng các phương sai.
D. Các biến ngẫu nhiên độc lập luôn có hệ số tương quan bằng 0.
50. Cho X ~ N(μ, σ^2). Tính P(μ – σ < X < μ + σ).
A. 0.5
B. 0.6827
C. 0.9545
D. 0.9973
51. Chọn khẳng định đúng về phân phối nhị thức.
A. Số lần thử nghiệm phải là vô hạn.
B. Các thử nghiệm phải phụ thuộc lẫn nhau.
C. Xác suất thành công phải giống nhau cho mỗi lần thử.
D. Biến ngẫu nhiên là liên tục.
52. Điều kiện nào sau đây không cần thiết để áp dụng định lý Chebyshev?
A. Biết giá trị trung bình.
B. Biết phương sai.
C. Biến ngẫu nhiên phải tuân theo phân phối chuẩn.
D. Biến ngẫu nhiên phải có giá trị trung bình và phương sai hữu hạn.
53. Cho X là biến ngẫu nhiên liên tục có hàm mật độ xác suất f(x) = kx, với 0 <= x <= 2. Tìm giá trị của k.
54. Cho X và Y là hai biến ngẫu nhiên độc lập. E(XY) bằng?
A. E(X) + E(Y)
B. E(X) – E(Y)
C. E(X) * E(Y)
D. E(X) / E(Y)
55. Nếu X là một biến ngẫu nhiên và a là một hằng số, thì Var(aX) bằng?
A. a * Var(X)
B. a^2 * Var(X)
C. Var(X)
D. a
56. Nếu hệ số tương quan giữa hai biến X và Y bằng 1, điều này có nghĩa là gì?
A. X và Y độc lập.
B. X và Y có mối quan hệ tuyến tính hoàn hảo và đồng biến.
C. X và Y có mối quan hệ tuyến tính hoàn hảo và nghịch biến.
D. Không có mối quan hệ nào giữa X và Y.
57. Biến ngẫu nhiên rời rạc là gì?
A. Biến có thể nhận bất kỳ giá trị nào trong một khoảng cho trước.
B. Biến có thể nhận một số lượng giá trị hữu hạn hoặc vô hạn đếm được.
C. Biến có phân phối đều.
D. Biến không thể xác định được giá trị.
58. Phân phối nào sau đây có hàm mật độ xác suất đối xứng qua giá trị trung bình?
A. Phân phối mũ.
B. Phân phối Poisson.
C. Phân phối chuẩn.
D. Phân phối siêu bội.
59. Cho X là biến ngẫu nhiên chỉ số thời gian sống có tham số λ. Tìm E(X).
A. λ
B. 1/λ
C. λ^2
D. 1/(λ^2)
60. Hệ số tương quan giữa hai biến ngẫu nhiên X và Y nằm trong khoảng nào?
A. (0, 1)
B. (-1, 1)
C. (-∞, +∞)
D. [0, +∞)
61. Nếu X là một biến ngẫu nhiên rời rạc và Y = aX + b, với a và b là các hằng số, thì phương sai Var(Y) bằng bao nhiêu?
A. aVar(X) + b
B. a^2Var(X)
C. aVar(X)
D. Var(X) + b
62. Cho một biến ngẫu nhiên X tuân theo phân phối chuẩn với trung bình μ = 5 và độ lệch chuẩn σ = 2. Tính P(X > 7). (Gợi ý: Sử dụng bảng Z hoặc công cụ tính toán)
A. 0.1587
B. 0.8413
C. 0.3085
D. 0.6915
63. Cho một biến ngẫu nhiên X tuân theo phân phối Bernoulli với p = 0.3. Tính kỳ vọng E(X).
64. Hàm phân phối xác suất (Probability Mass Function – PMF) được sử dụng cho loại biến ngẫu nhiên nào?
A. Biến ngẫu nhiên liên tục.
B. Biến ngẫu nhiên hỗn hợp.
C. Biến ngẫu nhiên rời rạc.
D. Biến ngẫu nhiên không xác định.
65. Phân phối siêu bội (Hypergeometric Distribution) khác với phân phối nhị thức như thế nào?
A. Phân phối siêu bội có các thử nghiệm độc lập, còn nhị thức thì không.
B. Phân phối siêu bội có các thử nghiệm không độc lập, còn nhị thức thì độc lập.
C. Phân phối siêu bội mô tả thời gian giữa các sự kiện, còn nhị thức thì số lần thành công.
D. Phân phối siêu bội chỉ áp dụng cho các biến liên tục.
66. Trong phân phối đều rời rạc (Discrete Uniform Distribution), xác suất của mỗi giá trị là gì?
A. Tỷ lệ thuận với giá trị đó.
B. Bằng nhau cho tất cả các giá trị.
C. Tỷ lệ nghịch với giá trị đó.
D. Bằng 0.
67. Phân phối mũ (Exponential Distribution) thường được sử dụng để mô hình hóa điều gì?
A. Số lượng sự kiện trong một khoảng thời gian.
B. Thời gian giữa các sự kiện trong một quá trình Poisson.
C. Xác suất thành công trong một thử nghiệm duy nhất.
D. Số lần thành công trong một số lượng thử nghiệm cố định.
68. Phân phối chuẩn (Normal Distribution) còn được gọi là gì?
A. Phân phối Poisson.
B. Phân phối Gauss.
C. Phân phối Bernoulli.
D. Phân phối nhị thức.
69. Cho một biến ngẫu nhiên X tuân theo phân phối Poisson với λ = 4. Tính xác suất P(X = 2).
A. 0.1465
B. 0.2707
C. 0.0733
D. 0.5413
70. Điều gì thể hiện diện tích dưới đường cong của hàm mật độ xác suất (PDF) trên toàn bộ miền xác định của biến ngẫu nhiên?
A. Giá trị trung bình của biến.
B. Phương sai của biến.
C. Bằng 1.
D. Bằng 0.
71. Điều kiện nào sau đây KHÔNG phải là điều kiện của phân phối nhị thức?
A. Các thử nghiệm phải độc lập.
B. Có một số lượng thử nghiệm cố định.
C. Xác suất thành công phải khác nhau trong mỗi thử nghiệm.
D. Mỗi thử nghiệm chỉ có hai kết quả có thể: thành công hoặc thất bại.
72. Biến ngẫu nhiên liên tục là gì?
A. Biến chỉ nhận giá trị nguyên.
B. Biến có thể nhận bất kỳ giá trị nào trong một khoảng cho trước.
C. Biến chỉ có thể nhận một số giá trị hữu hạn.
D. Biến không thể đo lường được.
73. Phân phối nhị thức (Binomial Distribution) mô tả điều gì?
A. Thời gian giữa các sự kiện.
B. Xác suất của một sự kiện đơn lẻ.
C. Số lần thành công trong một số lượng thử nghiệm độc lập cố định.
D. Tổng số thử nghiệm cần thiết để đạt được thành công đầu tiên.
74. Trong phân phối Poisson, điều gì xảy ra với phương sai khi giá trị trung bình (λ) tăng lên?
A. Phương sai giảm.
B. Phương sai tăng.
C. Phương sai không đổi.
D. Phương sai bằng 0.
75. Đặc điểm nào sau đây KHÔNG đúng với phân phối chuẩn?
A. Đối xứng quanh giá trị trung bình.
B. Giá trị trung bình, trung vị và mốt bằng nhau.
C. Có hai đỉnh.
D. Được xác định bởi hai tham số: trung bình và độ lệch chuẩn.
76. Hàm mật độ xác suất (Probability Density Function – PDF) được sử dụng cho loại biến ngẫu nhiên nào?
A. Biến ngẫu nhiên rời rạc.
B. Biến ngẫu nhiên hỗn hợp.
C. Biến ngẫu nhiên liên tục.
D. Biến ngẫu nhiên không xác định.
77. Phương sai (Variance) đo lường điều gì về một biến ngẫu nhiên?
A. Giá trị trung bình của biến.
B. Mức độ phân tán của các giá trị xung quanh giá trị trung bình.
C. Giá trị lớn nhất của biến.
D. Xác suất xảy ra giá trị trung bình.
78. Phân phối đều liên tục (Continuous Uniform Distribution) có đặc điểm gì?
A. Xác suất tập trung ở giá trị trung bình.
B. Xác suất giảm dần khi giá trị tăng.
C. Xác suất bằng nhau trên một khoảng xác định.
D. Xác suất thay đổi theo hàm mũ.
79. Độ lệch chuẩn (Standard Deviation) được tính như thế nào từ phương sai?
A. Bằng bình phương của phương sai.
B. Bằng căn bậc hai của phương sai.
C. Bằng nghịch đảo của phương sai.
D. Bằng logarit của phương sai.
80. Quy tắc 68-95-99.7 trong phân phối chuẩn nói về điều gì?
A. Tỷ lệ dữ liệu nằm trong 1, 2 và 3 độ lệch chuẩn so với trung bình.
B. Tỷ lệ dữ liệu nằm ngoài 1, 2 và 3 độ lệch chuẩn so với trung bình.
C. Xác suất dữ liệu bằng 68, 95 và 99.7.
D. Giá trị tới hạn cho kiểm định giả thuyết.
81. Phân phối Bernoulli mô tả điều gì?
A. Một chuỗi các thử nghiệm độc lập.
B. Xác suất của một sự kiện thành công hoặc thất bại trong một thử nghiệm duy nhất.
C. Số lần thành công trong một số lượng thử nghiệm cố định.
D. Thời gian giữa các sự kiện trong một quá trình Poisson.
82. Kỳ vọng (Expected Value) của một biến ngẫu nhiên rời rạc được tính như thế nào?
A. Tổng của các giá trị có thể nhân với xác suất tương ứng của chúng.
B. Giá trị lớn nhất trừ giá trị nhỏ nhất chia cho hai.
C. Giá trị xuất hiện nhiều nhất.
D. Tổng các giá trị có thể chia cho số lượng giá trị.
83. Phân phối Gamma là tổng quát hóa của phân phối nào?
A. Phân phối chuẩn.
B. Phân phối đều.
C. Phân phối mũ.
D. Phân phối Bernoulli.
84. Cho một biến ngẫu nhiên X tuân theo phân phối mũ với λ = 0.5. Tính P(X < 2).
A. 0.6321
B. 0.3679
C. 0.8647
D. 0.1353
85. Nếu X là một biến ngẫu nhiên liên tục và Y = aX + b, với a và b là các hằng số, thì kỳ vọng E(Y) bằng bao nhiêu?
A. aE(X) + b
B. aE(X)
C. E(X) + b
D. abE(X)
86. Phân phối Poisson mô tả điều gì?
A. Xác suất thành công trong một thử nghiệm duy nhất.
B. Số lượng sự kiện xảy ra trong một khoảng thời gian hoặc không gian nhất định.
C. Thời gian cần thiết để đạt được thành công đầu tiên.
D. Tỷ lệ thành công trên tổng số thử nghiệm.
87. Biến ngẫu nhiên rời rạc là gì?
A. Biến có thể nhận mọi giá trị trong một khoảng.
B. Biến có số lượng giá trị hữu hạn hoặc vô hạn đếm được.
C. Biến không thể đo lường được.
D. Biến chỉ nhận giá trị nguyên.
88. Cho một biến ngẫu nhiên X tuân theo phân phối nhị thức với n = 10 và p = 0.5. Tính phương sai Var(X).
89. Khi nào thì phân phối nhị thức có thể được xấp xỉ bằng phân phối Poisson?
A. Khi số lượng thử nghiệm (n) lớn và xác suất thành công (p) lớn.
B. Khi số lượng thử nghiệm (n) nhỏ và xác suất thành công (p) lớn.
C. Khi số lượng thử nghiệm (n) lớn và xác suất thành công (p) nhỏ.
D. Khi số lượng thử nghiệm (n) nhỏ và xác suất thành công (p) nhỏ.
90. Một hộp chứa 5 bóng đỏ và 5 bóng xanh. Nếu bạn rút ngẫu nhiên 3 bóng mà không hoàn lại, phân phối nào mô tả số lượng bóng đỏ bạn rút được?
A. Phân phối nhị thức.
B. Phân phối Poisson.
C. Phân phối siêu bội.
D. Phân phối Bernoulli.
91. Phân phối mũ (Exponential Distribution) thường được sử dụng để mô hình hóa điều gì?
A. Số lượng sự kiện xảy ra trong một khoảng thời gian cố định.
B. Thời gian giữa các sự kiện trong một quá trình Poisson.
C. Xác suất thành công trong một chuỗi thử nghiệm Bernoulli.
D. Phân phối của các giá trị trong một mẫu ngẫu nhiên.
92. Hàm phân phối tích lũy (CDF) của một biến ngẫu nhiên liên tục được định nghĩa như thế nào?
A. Tích phân của hàm mật độ xác suất từ âm vô cùng đến x.
B. Đạo hàm của hàm mật độ xác suất.
C. Giá trị trung bình của hàm mật độ xác suất.
D. Phương sai của hàm mật độ xác suất.
93. Khi nào thì cần sử dụng xấp xỉ phân phối chuẩn cho phân phối nhị thức?
A. Khi số lượng thử nghiệm nhỏ.
B. Khi xác suất thành công rất lớn.
C. Khi n*p ≥ 5 và n*(1-p) ≥ 5, với n là số thử nghiệm và p là xác suất thành công.
D. Khi phân phối nhị thức đối xứng.
94. Cho X là một biến ngẫu nhiên rời rạc với các giá trị có thể là 1, 2, 3 và P(X=1) = 0.2, P(X=2) = 0.3, P(X=3) = 0.5. Tính kỳ vọng E(X).
95. Giá trị p (p-value) trong kiểm định giả thuyết đại diện cho điều gì?
A. Xác suất mà giả thuyết null là đúng.
B. Xác suất mắc sai lầm loại I.
C. Xác suất thu được kết quả như quan sát (hoặc cực đoan hơn) nếu giả thuyết null là đúng.
D. Xác suất mắc sai lầm loại II.
96. Phân phối Bernoulli mô tả điều gì?
A. Số lượng thành công trong một loạt các thử nghiệm độc lập.
B. Xác suất của một sự kiện có hai kết quả có thể xảy ra.
C. Thời gian chờ đợi cho đến khi thành công đầu tiên.
D. Số lượng thử nghiệm cần thiết để đạt được một số lượng thành công nhất định.
97. Đặc điểm nào sau đây không phải là đặc điểm của hàm phân phối tích lũy (CDF)?
A. CDF là một hàm không giảm.
B. CDF có giá trị nằm trong khoảng [0, 1].
C. CDF luôn là một hàm liên tục.
D. CDF cho biết xác suất để biến ngẫu nhiên nhỏ hơn hoặc bằng một giá trị nào đó.
98. Cho X là một biến ngẫu nhiên liên tục có hàm mật độ xác suất f(x) = kx, với 0 ≤ x ≤ 2. Tìm giá trị của k.
99. Khi nào nên sử dụng kiểm định t (t-test) thay vì kiểm định z (z-test)?
A. Khi kích thước mẫu lớn.
B. Khi phương sai của quần thể đã biết.
C. Khi phương sai của quần thể chưa biết và kích thước mẫu nhỏ.
D. Khi dữ liệu không tuân theo phân phối chuẩn.
100. Phân phối chuẩn (Normal Distribution) có những tham số nào?
A. Trung bình và phương sai.
B. Số lượng thử nghiệm và xác suất thành công.
C. Tỷ lệ và kích thước mẫu.
D. Giới hạn trên và giới hạn dưới.
101. Khoảng tin cậy (Confidence Interval) cho trung bình quần thể cho biết điều gì?
A. Một giá trị duy nhất ước tính cho trung bình quần thể.
B. Một khoảng giá trị mà trung bình mẫu chắc chắn nằm trong đó.
C. Một khoảng giá trị mà trung bình quần thể có khả năng nằm trong đó với một độ tin cậy nhất định.
D. Độ lệch chuẩn của trung bình mẫu.
102. Quy tắc 68-95-99.7 trong phân phối chuẩn nói lên điều gì?
A. Khoảng tin cậy cho trung bình mẫu.
B. Tỷ lệ dữ liệu nằm trong 1, 2 và 3 độ lệch chuẩn so với trung bình.
C. Xác suất của các sự kiện hiếm.
D. Phân phối của sai số.
103. Trong kiểm định giả thuyết, sai lầm loại I (Type I error) là gì?
A. Chấp nhận giả thuyết null khi nó sai.
B. Bác bỏ giả thuyết null khi nó đúng.
C. Không bác bỏ giả thuyết null khi nó sai.
D. Không bác bỏ giả thuyết null khi nó đúng.
104. Hàm mật độ xác suất (PDF) của một biến ngẫu nhiên liên tục phải thỏa mãn điều kiện nào?
A. Giá trị của PDF phải luôn lớn hơn 1.
B. Diện tích dưới đường cong PDF phải bằng 1.
C. PDF phải là một hàm tăng.
D. PDF phải đối xứng qua trục tung.
105. Phân phối siêu bội (Hypergeometric distribution) khác với phân phối nhị thức như thế nào?
A. Phân phối siêu bội chỉ áp dụng cho các thử nghiệm độc lập.
B. Phân phối siêu bội liên quan đến việc lấy mẫu không hoàn lại.
C. Phân phối nhị thức liên quan đến việc lấy mẫu không hoàn lại.
D. Phân phối siêu bội chỉ có hai kết quả có thể xảy ra.
106. Phân phối đều liên tục (Continuous Uniform Distribution) có đặc điểm gì?
A. Xác suất tập trung ở một điểm duy nhất.
B. Xác suất bằng nhau trên một khoảng xác định.
C. Xác suất giảm dần theo giá trị của biến.
D. Xác suất tăng dần theo giá trị của biến.
107. Biến ngẫu nhiên liên tục khác biến ngẫu nhiên rời rạc ở điểm nào?
A. Biến liên tục chỉ nhận giá trị nguyên, biến rời rạc thì không.
B. Biến liên tục nhận giá trị trong một khoảng, biến rời rạc nhận giá trị đếm được.
C. Biến liên tục luôn có giá trị dương, biến rời rạc có thể âm.
D. Biến liên tục không có hàm mật độ xác suất.
108. Biến ngẫu nhiên rời rạc là gì?
A. Biến có thể nhận bất kỳ giá trị nào trong một khoảng.
B. Biến chỉ có thể nhận một số lượng hữu hạn giá trị hoặc vô hạn đếm được các giá trị.
C. Biến luôn có giá trị là số nguyên.
D. Biến không thể đo lường được.
109. Định lý giới hạn trung tâm (Central Limit Theorem) phát biểu rằng:
A. Trung bình của mẫu luôn bằng trung bình của quần thể.
B. Tổng của các biến ngẫu nhiên độc lập có phân phối bất kỳ sẽ hội tụ về phân phối chuẩn khi kích thước mẫu đủ lớn.
C. Phương sai của mẫu luôn bằng phương sai của quần thể.
D. Phân phối của mẫu luôn giống với phân phối của quần thể.
110. Biến ngẫu nhiên X có phân phối chuẩn với trung bình là 10 và độ lệch chuẩn là 2. Giá trị Z-score của X = 13 là bao nhiêu?
111. Mục đích của việc chuẩn hóa dữ liệu (ví dụ: Z-score) là gì?
A. Để thay đổi hình dạng của phân phối dữ liệu.
B. Để chuyển đổi dữ liệu về trung bình 0 và độ lệch chuẩn 1.
C. Để làm cho dữ liệu dễ dàng hơn để trực quan hóa.
D. Để loại bỏ các giá trị ngoại lệ.
112. Điều kiện nào sau đây là cần thiết để một chuỗi các thử nghiệm được coi là tuân theo phân phối nhị thức?
A. Các thử nghiệm phải phụ thuộc lẫn nhau.
B. Xác suất thành công phải khác nhau trong mỗi thử nghiệm.
C. Số lượng thử nghiệm phải hữu hạn và cố định.
D. Các thử nghiệm phải có nhiều hơn hai kết quả có thể.
113. Cho X là một biến ngẫu nhiên với E(X) = 3 và Var(X) = 4. Tính Var(2X + 1).
114. Giá trị kỳ vọng của một biến ngẫu nhiên liên tục được tính như thế nào?
A. Tổng của tất cả các giá trị có thể của biến.
B. Tích phân của x nhân với hàm mật độ xác suất trên toàn bộ miền xác định.
C. Đạo hàm của hàm mật độ xác suất tại điểm 0.
D. Giá trị lớn nhất của hàm mật độ xác suất.
115. Trong phân phối Poisson, tham số λ (lambda) đại diện cho điều gì?
A. Phương sai của phân phối.
B. Giá trị trung vị của phân phối.
C. Số lần xuất hiện trung bình của một sự kiện trong một khoảng thời gian hoặc không gian nhất định.
D. Xác suất thành công trong một thử nghiệm.
116. Phương sai của một biến ngẫu nhiên đo lường điều gì?
A. Giá trị trung bình của biến ngẫu nhiên.
B. Mức độ phân tán của các giá trị của biến ngẫu nhiên xung quanh giá trị trung bình.
C. Xác suất xảy ra giá trị lớn nhất của biến ngẫu nhiên.
D. Độ lệch của biến ngẫu nhiên so với 0.
117. Cho X là một biến ngẫu nhiên với E(X) = 5 và Var(X) = 2. Tính E(3X + 2).
118. Mức ý nghĩa (significance level) α trong kiểm định giả thuyết là gì?
A. Xác suất mắc sai lầm loại II.
B. Xác suất chấp nhận giả thuyết null khi nó đúng.
C. Ngưỡng xác suất để bác bỏ giả thuyết null.
D. Xác suất không bác bỏ giả thuyết null khi nó sai.
119. Hàm nào sau đây biểu diễn đúng hàm khối xác suất (PMF) của một biến ngẫu nhiên rời rạc X?
A. f(x) = P(X > x) với mọi x.
B. f(x) = P(X = x) với mọi x.
C. f(x) = P(X < x) với mọi x.
D. f(x) = P(X ≠ x) với mọi x.
120. Điều gì xảy ra với độ rộng của khoảng tin cậy khi tăng kích thước mẫu?
A. Độ rộng tăng lên.
B. Độ rộng giảm xuống.
C. Độ rộng không đổi.
D. Không thể xác định.
121. Giá trị p (p-value) trong kiểm định giả thuyết thống kê thể hiện điều gì?
A. Xác suất giả thuyết H0 là đúng.
B. Mức ý nghĩa α được chọn trước.
C. Xác suất mắc phải sai lầm loại II.
D. Xác suất quan sát được kết quả (hoặc kết quả cực đoan hơn) nếu H0 là đúng.
122. Sai lầm loại II (Type II error) trong kiểm định giả thuyết là gì?
A. Bác bỏ giả thuyết H0 khi nó đúng.
B. Chấp nhận giả thuyết H0 khi nó sai.
C. Bác bỏ giả thuyết H1 khi nó đúng.
D. Chấp nhận giả thuyết H1 khi nó sai.
123. Trong phân tích phương sai (ANOVA), giả thuyết H0 thường là gì?
A. Tất cả các trung bình quần thể đều khác nhau.
B. Ít nhất một trung bình quần thể khác với các trung bình còn lại.
C. Tất cả các phương sai quần thể đều bằng nhau.
D. Tất cả các trung bình quần thể đều bằng nhau.
124. Điều gì xảy ra với độ mạnh của kiểm định khi kích thước mẫu tăng lên?
A. Độ mạnh của kiểm định giảm xuống.
B. Độ mạnh của kiểm định tăng lên.
C. Không thay đổi.
D. Thay đổi ngẫu nhiên.
125. Trong phân tích hồi quy, một biến nhiễu (confounding variable) là gì?
A. Một biến không liên quan đến biến phụ thuộc.
B. Một biến gây ra mối quan hệ nhân quả giữa biến độc lập và biến phụ thuộc.
C. Một biến liên quan đến cả biến độc lập và biến phụ thuộc, làm sai lệch mối quan hệ giữa chúng.
D. Một biến chỉ ảnh hưởng đến biến độc lập.
126. Khi nào nên sử dụng kiểm định t (t-test) thay vì kiểm định z (z-test)?
A. Khi kích thước mẫu lớn (n > 30).
B. Khi phương sai của quần thể đã biết.
C. Khi phương sai của quần thể chưa biết và kích thước mẫu nhỏ (n < 30).
D. Khi dữ liệu tuân theo phân phối chuẩn.
127. Khi nào nên sử dụng kiểm định Kolmogorov-Smirnov?
A. Để so sánh phương sai của hai mẫu.
B. Để kiểm tra xem một mẫu có tuân theo một phân phối cụ thể hay không.
C. Để so sánh trung bình của hai mẫu độc lập.
D. Để kiểm tra mối liên hệ giữa hai biến định tính.
128. Khoảng tin cậy rộng hơn (wider confidence interval) có nghĩa là gì?
A. Độ tin cậy cao hơn.
B. Độ tin cậy thấp hơn.
C. Kích thước mẫu lớn hơn.
D. Ước lượng chính xác hơn.
129. Trong hồi quy tuyến tính, mục tiêu là gì?
A. Ước lượng phương sai của quần thể.
B. Tìm đường thẳng phù hợp nhất với dữ liệu.
C. Kiểm định giả thuyết về trung bình quần thể.
D. Phân loại dữ liệu thành các nhóm khác nhau.
130. Khi nào nên sử dụng kiểm định một phía (one-tailed test) thay vì kiểm định hai phía (two-tailed test)?
A. Khi không có giả thuyết cụ thể về hướng của sự khác biệt.
B. Khi quan tâm đến sự khác biệt theo cả hai hướng.
C. Khi có giả thuyết cụ thể về hướng của sự khác biệt.
D. Khi mức ý nghĩa α lớn hơn 0.05.
131. Một hệ số tương quan gần bằng 0 có nghĩa là gì?
A. Có một mối quan hệ tuyến tính mạnh giữa hai biến.
B. Không có mối quan hệ tuyến tính giữa hai biến.
C. Có một mối quan hệ phi tuyến tính mạnh giữa hai biến.
D. Hai biến giống hệt nhau.
132. Trong phân tích chuỗi thời gian, thành phần xu hướng (trend component) là gì?
A. Sự biến động ngắn hạn trong chuỗi thời gian.
B. Sự biến động theo mùa trong chuỗi thời gian.
C. Sự biến động ngẫu nhiên trong chuỗi thời gian.
D. Sự thay đổi dài hạn và có hệ thống trong chuỗi thời gian.
133. Hệ số xác định (R-squared) trong hồi quy tuyến tính đo lường điều gì?
A. Mức độ mạnh mẽ của mối quan hệ nhân quả.
B. Phần trăm phương sai của biến phụ thuộc được giải thích bởi biến độc lập.
C. Độ dốc của đường hồi quy.
D. Mức ý nghĩa của các hệ số hồi quy.
134. Mức ý nghĩa (significance level) α thường được chọn là bao nhiêu trong kiểm định giả thuyết?
A. 0.01, 0.05 hoặc 0.10
B. 0.5
C. 1.0
D. Bất kỳ giá trị nào từ 0 đến 1.
135. Bạn muốn so sánh trung bình của hai nhóm độc lập. Bạn nên sử dụng kiểm định nào?
A. Kiểm định t ghép cặp.
B. Kiểm định t hai mẫu độc lập.
C. Kiểm định ANOVA.
D. Kiểm định chi bình phương.
136. Trong kiểm định giả thuyết, độ mạnh của kiểm định (power of the test) là gì?
A. Xác suất mắc phải sai lầm loại I.
B. Xác suất mắc phải sai lầm loại II.
C. Xác suất bác bỏ giả thuyết H0 khi nó sai.
D. Xác suất chấp nhận giả thuyết H0 khi nó đúng.
137. Thống kê kiểm định (test statistic) được sử dụng để làm gì?
A. Ước lượng tham số của quần thể.
B. Đo lường độ tin cậy của ước lượng.
C. Đánh giá bằng chứng chống lại giả thuyết H0.
D. Xác định kích thước mẫu cần thiết.
138. Hệ số tương quan (correlation coefficient) đo lường điều gì?
A. Sự khác biệt giữa hai biến.
B. Mối quan hệ nhân quả giữa hai biến.
C. Mức độ liên kết tuyến tính giữa hai biến.
D. Phương sai của một biến.
139. Điều gì xảy ra với giá trị tới hạn (critical value) khi mức ý nghĩa α giảm xuống?
A. Giá trị tới hạn giảm xuống.
B. Giá trị tới hạn tăng lên.
C. Không thay đổi.
D. Thay đổi ngẫu nhiên.
140. Trong kiểm định giả thuyết, nếu giá trị p nhỏ hơn mức ý nghĩa α, ta nên làm gì?
A. Chấp nhận giả thuyết H0.
B. Không đưa ra kết luận gì.
C. Bác bỏ giả thuyết H0.
D. Tăng kích thước mẫu.
141. Phương pháp Bootstrap trong thống kê là gì?
A. Một phương pháp để ước lượng tham số quần thể bằng cách lấy mẫu lặp lại từ mẫu gốc.
B. Một phương pháp để giảm kích thước mẫu.
C. Một phương pháp để kiểm tra tính chuẩn của dữ liệu.
D. Một phương pháp để loại bỏ các giá trị ngoại lệ.
142. Khoảng tin cậy (confidence interval) là gì?
A. Một điểm ước lượng cho tham số.
B. Một khoảng giá trị mà ta chắc chắn tham số nằm trong đó.
C. Một khoảng giá trị mà ta tin rằng tham số có khả năng nằm trong đó với một độ tin cậy nhất định.
D. Một kiểm định giả thuyết.
143. Khi nào nên sử dụng kiểm định Mann-Whitney U?
A. Để so sánh trung bình của hai mẫu liên quan.
B. Để so sánh trung bình của hai mẫu độc lập khi dữ liệu không tuân theo phân phối chuẩn.
C. Để kiểm tra mối liên hệ giữa hai biến định tính.
D. Để so sánh phương sai của hai mẫu.
144. Trong kiểm định giả thuyết thống kê, sai lầm loại I xảy ra khi nào?
A. Chấp nhận giả thuyết H0 khi nó đúng.
B. Bác bỏ giả thuyết H0 khi nó sai.
C. Chấp nhận giả thuyết H0 khi nó sai.
D. Bác bỏ giả thuyết H0 khi nó đúng.
145. Bạn muốn kiểm tra xem có mối liên hệ giữa hai biến định tính hay không. Bạn nên sử dụng kiểm định nào?
A. Kiểm định t.
B. Kiểm định ANOVA.
C. Kiểm định chi bình phương.
D. Kiểm định tương quan.
146. Phương pháp bình phương tối thiểu (least squares method) được sử dụng để làm gì?
A. Ước lượng tham số trong mô hình hồi quy.
B. Kiểm định giả thuyết về trung bình quần thể.
C. Tính độ lệch chuẩn của mẫu.
D. Tìm giá trị lớn nhất trong một tập dữ liệu.
147. Trong thống kê Bayes, khái niệm ‘prior’ đề cập đến điều gì?
A. Xác suất của dữ liệu đã quan sát.
B. Xác suất ban đầu của giả thuyết trước khi xem xét dữ liệu.
C. Xác suất của giả thuyết sau khi xem xét dữ liệu.
D. Xác suất của việc mắc phải sai lầm loại I.
148. Điều gì xảy ra với độ rộng của khoảng tin cậy khi kích thước mẫu tăng lên?
A. Khoảng tin cậy rộng hơn.
B. Khoảng tin cậy hẹp hơn.
C. Không thay đổi.
D. Thay đổi ngẫu nhiên.
149. Thế nào là kiểm định phi tham số?
A. Kiểm định yêu cầu dữ liệu tuân theo phân phối chuẩn.
B. Kiểm định không yêu cầu giả định về phân phối của dữ liệu.
C. Kiểm định chỉ sử dụng cho dữ liệu định tính.
D. Kiểm định chỉ sử dụng cho dữ liệu định lượng.
150. Giả sử bạn có một mẫu dữ liệu và bạn muốn kiểm tra xem trung bình mẫu có khác biệt đáng kể so với một giá trị cụ thể hay không. Bạn nên sử dụng kiểm định nào?
A. Kiểm định ANOVA.
B. Kiểm định chi bình phương.
C. Kiểm định t một mẫu.
D. Kiểm định tương quan.