1. Phương sai (variance) đo lường điều gì?
A. Giá trị trung bình của dữ liệu.
B. Mức độ phân tán của dữ liệu so với giá trị trung bình.
C. Giá trị lớn nhất trong tập dữ liệu.
D. Giá trị nhỏ nhất trong tập dữ liệu.
2. Điều gì xảy ra với giá trị tới hạn (critical value) khi mức ý nghĩa (significance level) giảm xuống?
A. Giá trị tới hạn tăng lên.
B. Giá trị tới hạn giảm xuống.
C. Giá trị tới hạn không thay đổi.
D. Không thể xác định.
3. Sai số lấy mẫu (sampling error) là gì?
A. Sai sót do nhập liệu sai.
B. Sự khác biệt giữa thống kê mẫu và tham số tổng thể.
C. Sai sót do chọn mẫu không ngẫu nhiên.
D. Sai sót do sử dụng phương pháp thống kê không phù hợp.
4. Thống kê mô tả chủ yếu tập trung vào:
A. Dự đoán xu hướng tương lai dựa trên dữ liệu quá khứ.
B. Thu thập, tóm tắt và trình bày dữ liệu.
C. Kiểm định các giả thuyết về tổng thể.
D. Ước lượng các tham số của tổng thể.
5. Khi nào thì thích hợp sử dụng trung vị thay vì trung bình để đo xu hướng trung tâm?
A. Khi dữ liệu phân phối chuẩn.
B. Khi dữ liệu có giá trị ngoại lệ.
C. Khi muốn tính toán nhanh chóng.
D. Khi dữ liệu là số nguyên.
6. Giá trị nào sau đây KHÔNG phải là một độ đo xu hướng trung tâm?
A. Trung bình.
B. Trung vị.
C. Độ lệch chuẩn.
D. Mốt.
7. Loại dữ liệu nào sau đây là dữ liệu thứ bậc?
A. Nhiệt độ (Celsius).
B. Màu sắc.
C. Xếp hạng (ví dụ: nhất, nhì, ba).
D. Chiều cao.
8. Loại biểu đồ nào phù hợp nhất để so sánh tỷ lệ giữa các danh mục?
A. Biểu đồ đường.
B. Biểu đồ cột.
C. Biểu đồ tròn.
D. Biểu đồ phân tán.
9. Độ lệch chuẩn (standard deviation) được tính như thế nào?
A. Bằng căn bậc hai của phương sai.
B. Bằng bình phương của phương sai.
C. Bằng tổng các giá trị chia cho số lượng giá trị.
D. Bằng giá trị lớn nhất trừ giá trị nhỏ nhất.
10. Biểu đồ tần suất (histogram) thường được sử dụng để biểu diễn loại dữ liệu nào?
A. Dữ liệu định tính.
B. Dữ liệu định lượng liên tục.
C. Dữ liệu thứ bậc.
D. Dữ liệu tỷ lệ.
11. Loại biểu đồ nào phù hợp nhất để so sánh phân phối của một biến số giữa hai nhóm?
A. Biểu đồ đường.
B. Biểu đồ cột chồng.
C. Hộp biểu đồ song song.
D. Biểu đồ phân tán.
12. Trong một phân phối chuẩn, khoảng bao nhiêu phần trăm dữ liệu nằm trong khoảng một độ lệch chuẩn so với giá trị trung bình?
A. Khoảng 50%.
B. Khoảng 68%.
C. Khoảng 95%.
D. Khoảng 99.7%.
13. Trong thống kê, ‘mốt’ (mode) là gì?
A. Giá trị trung bình của tập dữ liệu.
B. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
C. Giá trị nằm giữa của tập dữ liệu.
D. Tổng của tất cả các giá trị chia cho số lượng giá trị.
14. Khi nào thì nên sử dụng biểu đồ phân tán (scatter plot)?
A. Để so sánh các danh mục.
B. Để hiển thị xu hướng theo thời gian.
C. Để khám phá mối quan hệ giữa hai biến định lượng.
D. Để biểu diễn phân phối tần số.
15. Điều nào sau đây là lợi ích của việc sử dụng mẫu (sample) thay vì tổng thể (population) trong thống kê?
A. Luôn cho kết quả chính xác hơn.
B. Tiết kiệm thời gian và chi phí.
C. Loại bỏ hoàn toàn sai số.
D. Đơn giản hóa việc tính toán các tham số.
16. Phân loại nào sau đây KHÔNG thuộc về các mức đo lường (scales of measurement)?
A. Định danh (Nominal).
B. Thứ bậc (Ordinal).
C. Tỷ lệ (Ratio).
D. Tuyệt đối (Absolute).
17. Tứ phân vị (quartiles) chia dữ liệu thành bao nhiêu phần bằng nhau?
A. 2 phần.
B. 3 phần.
C. 4 phần.
D. 5 phần.
18. Điều gì xảy ra với độ rộng của khoảng tin cậy (confidence interval) khi kích thước mẫu tăng lên?
A. Độ rộng tăng lên.
B. Độ rộng giảm xuống.
C. Độ rộng không thay đổi.
D. Không thể xác định.
19. Phân phối nào sau đây thường được sử dụng để mô hình hóa số lượng sự kiện xảy ra trong một khoảng thời gian hoặc không gian nhất định?
A. Phân phối chuẩn.
B. Phân phối nhị thức.
C. Phân phối Poisson.
D. Phân phối mũ.
20. Trong một hộp biểu đồ (box plot), đường thẳng nằm trong hộp biểu thị giá trị nào?
A. Giá trị trung bình.
B. Giá trị trung vị.
C. Giá trị mốt.
D. Độ lệch chuẩn.
21. Ý nghĩa của hệ số tương quan (correlation coefficient) bằng 0 là gì?
A. Có mối quan hệ tuyến tính mạnh giữa hai biến.
B. Không có mối quan hệ tuyến tính giữa hai biến.
C. Có mối quan hệ phi tuyến tính giữa hai biến.
D. Hai biến hoàn toàn giống nhau.
22. Khi nào thì trung bình (mean) không phải là một độ đo tốt về xu hướng trung tâm?
A. Khi dữ liệu phân phối chuẩn.
B. Khi dữ liệu có giá trị ngoại lệ (outliers).
C. Khi dữ liệu đối xứng.
D. Khi dữ liệu có nhiều giá trị trùng lặp.
23. Hệ số biến thiên (coefficient of variation) là gì?
A. Một độ đo độ lệch của phân phối.
B. Một độ đo xu hướng trung tâm.
C. Một độ đo độ phân tán tương đối, chuẩn hóa theo giá trị trung bình.
D. Một độ đo mối quan hệ tuyến tính.
24. Biến định tính (qualitative variable) là gì?
A. Biến có thể đo lường bằng số.
B. Biến có giá trị là các thuộc tính hoặc phân loại.
C. Biến chỉ có hai giá trị.
D. Biến liên tục.
25. Trong thống kê, ‘độ lệch’ (skewness) đo lường điều gì?
A. Mức độ tập trung của dữ liệu quanh giá trị trung bình.
B. Mức độ đối xứng của phân phối.
C. Mức độ phân tán của dữ liệu.
D. Mức độ tin cậy của kết quả.
26. Loại biểu đồ nào phù hợp nhất để hiển thị xu hướng của dữ liệu theo thời gian?
A. Biểu đồ cột.
B. Biểu đồ tròn.
C. Biểu đồ đường.
D. Biểu đồ phân tán.
27. Điều gì xảy ra với sai số chuẩn (standard error) của trung bình khi kích thước mẫu tăng lên?
A. Sai số chuẩn tăng lên.
B. Sai số chuẩn giảm xuống.
C. Sai số chuẩn không thay đổi.
D. Không thể xác định.
28. Điều gì KHÔNG phải là một đặc điểm của phân phối chuẩn?
A. Đối xứng.
B. Hình chuông.
C. Giá trị trung bình, trung vị và mốt bằng nhau.
D. Luôn bị lệch trái.
29. Điều gì xảy ra với khoảng tin cậy khi mức độ tin cậy (confidence level) tăng lên?
A. Khoảng tin cậy hẹp hơn.
B. Khoảng tin cậy rộng hơn.
C. Khoảng tin cậy không thay đổi.
D. Không thể xác định.
30. Trong thống kê, ‘phương sai mẫu’ (sample variance) được tính như thế nào so với ‘phương sai tổng thể’ (population variance)?
A. Phương sai mẫu luôn lớn hơn phương sai tổng thể.
B. Phương sai mẫu luôn nhỏ hơn phương sai tổng thể.
C. Phương sai mẫu sử dụng (n-1) ở mẫu số để ước tính tốt hơn phương sai tổng thể.
D. Phương sai mẫu và phương sai tổng thể luôn bằng nhau.
31. Độ lệch chuẩn (standard deviation) đo lường điều gì?
A. Vị trí trung tâm của dữ liệu.
B. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình.
C. Mức độ đối xứng của phân phối.
D. Mối quan hệ giữa hai biến.
32. Trong thống kê ứng dụng, thuật ngữ ‘dữ liệu bảng’ (panel data) đề cập đến loại dữ liệu nào?
A. Dữ liệu được thu thập từ một nhóm đối tượng tại một thời điểm duy nhất.
B. Dữ liệu được thu thập từ nhiều nhóm đối tượng tại nhiều thời điểm khác nhau.
C. Dữ liệu được thu thập từ cùng một nhóm đối tượng tại nhiều thời điểm khác nhau.
D. Dữ liệu được thu thập từ các nguồn khác nhau và được kết hợp lại.
33. Tứ phân vị (quartiles) chia tập dữ liệu thành bao nhiêu phần bằng nhau?
34. Hệ số tương quan (correlation coefficient) đo lường điều gì?
A. Mức độ biến thiên của một biến.
B. Mức độ liên hệ tuyến tính giữa hai biến.
C. Mức độ phân tán của dữ liệu.
D. Mức độ tập trung của dữ liệu.
35. Giá trị p (p-value) được sử dụng để làm gì?
A. Để đo lường độ lớn của hiệu ứng.
B. Để xác định xem kết quả có ý nghĩa thống kê hay không.
C. Để ước tính tham số tổng thể.
D. Để xác định phương pháp thống kê phù hợp.
36. Nếu hệ số tương quan giữa hai biến là 0, điều này có nghĩa là gì?
A. Có một mối quan hệ tuyến tính mạnh giữa hai biến.
B. Không có mối quan hệ tuyến tính giữa hai biến.
C. Có một mối quan hệ phi tuyến tính giữa hai biến.
D. Hai biến này hoàn toàn giống nhau.
37. Giá trị ngoại lệ (outlier) là gì?
A. Giá trị trung bình của tập dữ liệu.
B. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
C. Giá trị nằm ngoài khoảng Q1 – 1.5*IQR và Q3 + 1.5*IQR.
D. Giá trị nằm giữa Q1 và Q3.
38. Trong thống kê, ‘phân phối’ (distribution) đề cập đến điều gì?
A. Cách dữ liệu được thu thập.
B. Cách dữ liệu được trình bày trong bảng biểu.
C. Tần suất xuất hiện của các giá trị khác nhau trong một tập dữ liệu.
D. Mối quan hệ giữa các biến khác nhau.
39. Trong thống kê, ‘mẫu’ (sample) được hiểu là gì?
A. Toàn bộ các phần tử cần nghiên cứu.
B. Một tập hợp con của tổng thể được chọn để nghiên cứu.
C. Một giá trị số tóm tắt đặc điểm của tổng thể.
D. Một phương pháp thu thập dữ liệu.
40. Sai số loại I (Type I error) xảy ra khi nào?
A. Bác bỏ giả thuyết нуле khi nó thực sự đúng.
B. Chấp nhận giả thuyết нуле khi nó thực sự sai.
C. Tính toán sai giá trị p.
D. Chọn sai phương pháp thống kê.
41. Sai số lấy mẫu (sampling error) là gì?
A. Sai sót do nhập liệu sai.
B. Sai sót do tính toán sai.
C. Sự khác biệt giữa kết quả mẫu và kết quả tổng thể.
D. Sai sót do chọn sai phương pháp thống kê.
42. Trong phân tích hồi quy tuyến tính, mục tiêu là gì?
A. Tìm giá trị trung bình của biến phụ thuộc.
B. Tìm mối quan hệ nhân quả giữa hai biến.
C. Tìm phương trình đường thẳng mô tả mối quan hệ giữa biến độc lập và biến phụ thuộc.
D. Tìm độ lệch chuẩn của biến độc lập.
43. Thống kê mô tả KHÔNG bao gồm công việc nào sau đây?
A. Thu thập dữ liệu.
B. Trình bày dữ liệu bằng bảng biểu và đồ thị.
C. Tính toán các số đặc trưng mô tả mẫu.
D. Suy luận về tổng thể dựa trên mẫu.
44. Ý nghĩa của việc tính toán trung vị (median) thay vì trung bình (mean) khi dữ liệu có giá trị ngoại lệ là gì?
A. Trung bình luôn chính xác hơn trung vị.
B. Trung vị ít bị ảnh hưởng bởi giá trị ngoại lệ hơn trung bình.
C. Trung vị dễ tính toán hơn trung bình.
D. Trung bình dễ hiểu hơn trung vị.
45. Phương pháp nào sau đây KHÔNG phải là một phương pháp lấy mẫu ngẫu nhiên?
A. Lấy mẫu ngẫu nhiên đơn giản (simple random sampling).
B. Lấy mẫu phân tầng (stratified sampling).
C. Lấy mẫu cụm (cluster sampling).
D. Lấy mẫu thuận tiện (convenience sampling).
46. Phương pháp nào sau đây phù hợp nhất để phân tích dữ liệu khảo sát với nhiều câu hỏi đóng (multiple-choice questions)?
A. Phân tích hồi quy (regression analysis).
B. Phân tích phương sai (ANOVA).
C. Thống kê mô tả (descriptive statistics) và bảng tần số (frequency tables).
D. Phân tích thành phần chính (principal component analysis).
47. Khoảng tin cậy (confidence interval) là gì?
A. Một giá trị duy nhất ước tính cho tham số tổng thể.
B. Một khoảng giá trị mà chúng ta tin rằng tham số tổng thể nằm trong đó với một độ tin cậy nhất định.
C. Một thước đo độ phân tán của dữ liệu.
D. Một phương pháp thu thập dữ liệu.
48. Khi nào thì nên sử dụng biểu đồ hộp (boxplot)?
A. Để so sánh trung bình giữa các nhóm.
B. Để biểu diễn mối quan hệ giữa hai biến liên tục.
C. Để xác định giá trị ngoại lệ và phân phối của dữ liệu.
D. Để biểu diễn tần suất của các giá trị.
49. Mức đo lường nào sau đây cung cấp nhiều thông tin nhất?
A. Mức danh nghĩa (nominal).
B. Mức thứ bậc (ordinal).
C. Mức khoảng (interval).
D. Mức tỷ lệ (ratio).
50. Phương pháp nào sau đây được sử dụng để trực quan hóa mối quan hệ giữa hai biến định lượng?
A. Biểu đồ cột (bar chart).
B. Biểu đồ tròn (pie chart).
C. Biểu đồ phân tán (scatter plot).
D. Biểu đồ hộp (boxplot).
51. Nếu bạn muốn so sánh trung bình của ba nhóm độc lập, bạn nên sử dụng phương pháp nào?
A. Kiểm định t (t-test).
B. Phân tích phương sai (ANOVA).
C. Hồi quy tuyến tính (linear regression).
D. Tương quan (correlation).
52. Khi nào thì nên sử dụng kiểm định Chi bình phương (Chi-square test)?
A. Để so sánh trung bình của hai nhóm.
B. Để kiểm tra mối quan hệ giữa hai biến định tính.
C. Để dự đoán giá trị của một biến dựa trên biến khác.
D. Để kiểm tra sự khác biệt giữa các phương sai.
53. Mục đích của việc chuẩn hóa dữ liệu (data normalization) là gì?
A. Để loại bỏ các giá trị ngoại lệ.
B. Để chuyển đổi dữ liệu về một thang đo chung, giúp so sánh dễ dàng hơn.
C. Để mã hóa dữ liệu định tính thành số.
D. Để đảm bảo dữ liệu tuân theo phân phối chuẩn.
54. Loại biểu đồ nào sau đây phù hợp nhất để biểu diễn tần suất của các biến định tính?
A. Biểu đồ tần số (histogram).
B. Biểu đồ phân tán (scatter plot).
C. Biểu đồ tròn (pie chart) hoặc biểu đồ cột (bar chart).
D. Đường hồi quy (regression line).
55. Khi nào thì việc sử dụng ‘trọng số’ (weights) trở nên cần thiết trong phân tích thống kê?
A. Khi tất cả các quan sát đều có tầm quan trọng như nhau.
B. Khi có sự khác biệt về kích thước mẫu giữa các nhóm.
C. Khi có sự khác biệt về tầm quan trọng hoặc độ tin cậy của các quan sát.
D. Khi dữ liệu tuân theo phân phối chuẩn.
56. Phân phối chuẩn (normal distribution) có đặc điểm gì?
A. Bất đối xứng.
B. Có hai đỉnh.
C. Đối xứng và có hình chuông.
D. Phẳng và không có đỉnh.
57. Giả sử bạn có một tập dữ liệu về chiều cao của sinh viên trong một trường đại học. Bạn muốn ước tính chiều cao trung bình của tất cả sinh viên trong trường. Bạn nên sử dụng phương pháp thống kê nào?
A. Thống kê mô tả (descriptive statistics).
B. Thống kê suy diễn (inferential statistics).
C. Phân tích hồi quy (regression analysis).
D. Phân tích phương sai (ANOVA).
58. Giá trị nào sau đây KHÔNG phải là một số đo vị trí trung tâm?
A. Trung bình (mean).
B. Trung vị (median).
C. Phương sai (variance).
D. Mốt (mode).
59. Biến định tính (qualitative variable) KHÔNG bao gồm loại nào sau đây?
A. Biến định tính thứ bậc (ordinal).
B. Biến định tính danh nghĩa (nominal).
C. Biến định tính rời rạc (discrete).
D. Không có đáp án nào đúng.
60. Trong một nghiên cứu, biến độc lập là gì?
A. Biến được đo lường để xem có sự thay đổi hay không.
B. Biến được điều khiển hoặc thay đổi bởi nhà nghiên cứu.
C. Biến không ảnh hưởng đến kết quả nghiên cứu.
D. Biến được sử dụng để phân loại đối tượng nghiên cứu.
61. Biểu đồ nào thường được sử dụng để hiển thị phân phối tần số của một biến liên tục?
A. Biểu đồ tròn.
B. Biểu đồ thanh.
C. Biểu đồ hộp.
D. Biểu đồ histogram.
62. Trong một phân phối chuẩn, khoảng tin cậy 95% tương ứng với khoảng cách bao nhiêu độ lệch chuẩn so với trung bình?
A. 1 độ lệch chuẩn.
B. 1.96 độ lệch chuẩn.
C. 2.58 độ lệch chuẩn.
D. 3 độ lệch chuẩn.
63. Hệ số tương quan Pearson đo lường điều gì?
A. Mức độ biến động của dữ liệu.
B. Mối quan hệ tuyến tính giữa hai biến định lượng.
C. Sự khác biệt giữa trung bình của hai mẫu.
D. Tần số xuất hiện của các giá trị.
64. Thống kê ứng dụng được sử dụng rộng rãi trong lĩnh vực nào sau đây?
A. Chỉ trong toán học lý thuyết.
B. Chỉ trong vật lý học.
C. Chỉ trong hóa học.
D. Trong kinh tế, y học, kỹ thuật và nhiều lĩnh vực khác.
65. Điều gì là quan trọng nhất khi thiết kế một bảng câu hỏi?
A. Sử dụng các câu hỏi phức tạp để thu thập thông tin chi tiết.
B. Đảm bảo các câu hỏi rõ ràng, dễ hiểu và không gây nhầm lẫn.
C. Sử dụng nhiều câu hỏi mở để thu thập thông tin định tính.
D. Hỏi những câu hỏi mang tính chất cá nhân để tạo sự tin tưởng.
66. Điều nào sau đây KHÔNG phải là một phần của quy trình thống kê?
A. Thu thập dữ liệu.
B. Phân tích dữ liệu.
C. Trình bày dữ liệu.
D. Bịa đặt dữ liệu.
67. Thang đo nào có đầy đủ các tính chất: phân loại, xếp hạng, khoảng cách đều nhau và điểm gốc 0 tuyệt đối?
A. Thang đo định danh.
B. Thang đo thứ bậc.
C. Thang đo khoảng.
D. Thang đo tỷ lệ.
68. Mục đích của việc lấy mẫu là gì?
A. Đo lường toàn bộ tổng thể.
B. Thu thập dữ liệu từ một phần của tổng thể để suy luận về toàn bộ tổng thể.
C. Loại bỏ sự thiên vị trong dữ liệu.
D. Tăng độ chính xác của các phép đo.
69. Nếu hệ số tương quan giữa hai biến là -1, điều này có nghĩa là gì?
A. Không có mối quan hệ giữa hai biến.
B. Hai biến có mối quan hệ tuyến tính mạnh mẽ và đồng biến.
C. Hai biến có mối quan hệ tuyến tính mạnh mẽ và nghịch biến.
D. Hai biến có mối quan hệ phi tuyến tính.
70. Trong thống kê, ‘mode’ là gì?
A. Giá trị trung bình của tập dữ liệu.
B. Giá trị lớn nhất trong tập dữ liệu.
C. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
D. Giá trị nằm giữa tập dữ liệu đã sắp xếp.
71. Điều gì KHÔNG phải là một phương pháp thu thập dữ liệu sơ cấp?
A. Phỏng vấn.
B. Quan sát.
C. Thí nghiệm.
D. Sử dụng dữ liệu từ báo cáo của chính phủ.
72. Đâu là một ví dụ về biến định tính?
A. Nhiệt độ.
B. Chiều cao.
C. Màu sắc.
D. Cân nặng.
73. Điều gì KHÔNG phải là một biện pháp để đánh giá tính tin cậy của dữ liệu?
A. Kiểm tra tính nhất quán của dữ liệu.
B. So sánh dữ liệu với các nguồn khác.
C. Đảm bảo dữ liệu được thu thập bởi những người có chuyên môn.
D. Loại bỏ tất cả các giá trị ngoại lệ.
74. Giá trị nào chia một tập dữ liệu đã sắp xếp thành hai phần bằng nhau?
A. Trung bình.
B. Phương sai.
C. Trung vị.
D. Độ lệch chuẩn.
75. Khi nào thì nên sử dụng biểu đồ hộp?
A. Khi muốn so sánh tỷ lệ giữa các nhóm.
B. Khi muốn thể hiện xu hướng theo thời gian.
C. Khi muốn tóm tắt phân phối của một tập dữ liệu, bao gồm các giá trị ngoại lệ.
D. Khi muốn thể hiện mối quan hệ giữa hai biến liên tục.
76. Giá trị nào cho biết mức độ tập trung của dữ liệu xung quanh giá trị trung bình?
A. Phạm vi.
B. Phương sai.
C. Độ lệch chuẩn.
D. Hệ số biến thiên.
77. Biểu đồ nào được sử dụng để thể hiện mối quan hệ giữa hai biến định lượng?
A. Biểu đồ tròn.
B. Biểu đồ cột.
C. Biểu đồ phân tán.
D. Biểu đồ histogram.
78. Phương pháp nào được sử dụng để giảm thiểu sai số do chọn mẫu?
A. Tăng kích thước mẫu.
B. Giảm kích thước mẫu.
C. Sử dụng phương pháp lấy mẫu phi xác suất.
D. Chỉ thu thập dữ liệu từ những người tình nguyện.
79. Phương pháp nào sau đây là phương pháp lấy mẫu xác suất?
A. Lấy mẫu thuận tiện.
B. Lấy mẫu phán đoán.
C. Lấy mẫu ngẫu nhiên đơn giản.
D. Lấy mẫu theo chỉ tiêu.
80. Nếu một tập dữ liệu có một vài giá trị cực lớn, thước đo vị trí trung tâm nào ít bị ảnh hưởng nhất?
A. Trung bình.
B. Trung vị.
C. Mode.
D. Trung bình điều hòa.
81. Loại thang đo nào cho phép xác định sự khác biệt giữa các giá trị và thứ tự của chúng, nhưng không có điểm gốc tuyệt đối?
A. Tỷ lệ.
B. Định danh.
C. Thứ bậc.
D. Khoảng.
82. Nếu một biến có phương sai bằng 0, điều này có nghĩa là gì?
A. Tất cả các giá trị của biến đều bằng nhau.
B. Biến không có giá trị.
C. Giá trị trung bình của biến bằng 0.
D. Biến tuân theo phân phối chuẩn.
83. Đại lượng nào đo mức độ phân tán của dữ liệu so với giá trị trung bình?
A. Trung vị.
B. Mode.
C. Độ lệch chuẩn.
D. Phân vị.
84. Điều nào sau đây là một ví dụ về dữ liệu định lượng liên tục?
A. Số lượng ô tô trong một bãi đậu xe.
B. Màu sắc của áo sơ mi.
C. Chiều cao của một người.
D. Đánh giá của khách hàng về một sản phẩm (tốt, trung bình, kém).
85. Trong thống kê mô tả, mục tiêu chính là gì?
A. Dự đoán các giá trị tương lai.
B. Suy luận về tổng thể dựa trên mẫu.
C. Tóm tắt và trình bày dữ liệu.
D. Kiểm định các giả thuyết.
86. Thống kê ứng dụng chủ yếu tập trung vào điều gì?
A. Phát triển các lý thuyết thống kê mới.
B. Áp dụng các phương pháp thống kê để giải quyết các vấn đề thực tế.
C. Nghiên cứu lịch sử phát triển của thống kê.
D. Chứng minh các định lý toán học liên quan đến thống kê.
87. Trong thống kê, ‘phân vị’ (percentile) là gì?
A. Giá trị trung bình của tập dữ liệu.
B. Giá trị chia tập dữ liệu thành 100 phần bằng nhau.
C. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
D. Giá trị nằm giữa tập dữ liệu đã sắp xếp.
88. Điều nào sau đây KHÔNG phải là một thước đo vị trí trung tâm?
A. Trung bình.
B. Trung vị.
C. Mode.
D. Phạm vi.
89. Loại biểu đồ nào phù hợp nhất để so sánh các giá trị của các danh mục khác nhau?
A. Biểu đồ phân tán.
B. Biểu đồ đường.
C. Biểu đồ thanh.
D. Biểu đồ hộp.
90. Điều gì KHÔNG phải là một loại biểu đồ thường dùng để trình bày dữ liệu thống kê?
A. Biểu đồ Gantt.
B. Biểu đồ tròn.
C. Biểu đồ thanh.
D. Biểu đồ đường.
91. Biến nào sau đây là biến định lượng liên tục?
A. Số lượng khách hàng trong một cửa hàng.
B. Cân nặng của một người.
C. Số trang trong một cuốn sách.
D. Số xe ô tô trong một bãi đậu xe.
92. Điều gì là quan trọng nhất khi thiết kế một bảng câu hỏi khảo sát?
A. Sử dụng ngôn ngữ phức tạp để thể hiện sự chuyên nghiệp.
B. Đảm bảo câu hỏi rõ ràng, không gây nhầm lẫn.
C. Đặt nhiều câu hỏi nhất có thể để thu thập nhiều thông tin.
D. Sử dụng phông chữ đẹp và màu sắc bắt mắt.
93. Điều gì phân biệt dữ liệu khoảng và dữ liệu tỷ lệ?
A. Dữ liệu khoảng có giá trị 0 tuyệt đối.
B. Dữ liệu tỷ lệ không thể âm.
C. Dữ liệu khoảng không có giá trị 0 thực sự.
D. Dữ liệu tỷ lệ có thể được sắp xếp thứ tự.
94. Đâu là một nhược điểm của việc sử dụng dữ liệu thứ cấp?
A. Tốn ít chi phí hơn so với dữ liệu sơ cấp.
B. Dễ dàng tiếp cận hơn so với dữ liệu sơ cấp.
C. Có thể không phù hợp hoàn toàn với mục tiêu nghiên cứu.
D. Đã được thu thập và xử lý sẵn.
95. Đâu là một ví dụ về biến định tính?
A. Chiều cao của một người.
B. Nhiệt độ phòng.
C. Màu sắc của một chiếc xe.
D. Số lượng sản phẩm bán được.
96. Đâu là một ví dụ về thống kê suy diễn?
A. Tính trung bình điểm của sinh viên trong một lớp.
B. Vẽ biểu đồ phân phối thu nhập của một quốc gia.
C. Ước lượng tỷ lệ cử tri ủng hộ một ứng viên dựa trên một cuộc khảo sát.
D. Tính độ lệch chuẩn của giá cổ phiếu.
97. Tại sao cần phải xem xét đạo đức trong nghiên cứu thống kê?
A. Để đảm bảo nghiên cứu được tài trợ.
B. Để bảo vệ quyền lợi và sự riêng tư của người tham gia.
C. Để làm cho kết quả nghiên cứu ấn tượng hơn.
D. Để tránh bị kiện tụng.
98. Phương pháp nào sau đây có thể được sử dụng để xử lý giá trị ngoại lệ?
A. Thay thế bằng giá trị trung bình.
B. Thay thế bằng giá trị trung vị.
C. Loại bỏ giá trị ngoại lệ.
D. Tất cả các phương án trên.
99. Phương pháp lấy mẫu nào đảm bảo mỗi thành viên của tổng thể có cơ hội được chọn như nhau?
A. Lấy mẫu thuận tiện.
B. Lấy mẫu phân tầng.
C. Lấy mẫu ngẫu nhiên đơn giản.
D. Lấy mẫu cụm.
100. Thang đo Likert thường được sử dụng để đo lường điều gì?
A. Chiều cao của một người.
B. Cân nặng của một vật.
C. Thái độ hoặc ý kiến.
D. Nhiệt độ phòng.
101. Phân loại dữ liệu theo thứ tự (ví dụ: rất không hài lòng, không hài lòng, trung lập, hài lòng, rất hài lòng) được gọi là gì?
A. Dữ liệu định danh.
B. Dữ liệu thứ bậc.
C. Dữ liệu khoảng.
D. Dữ liệu tỷ lệ.
102. Phân tích phương sai (ANOVA) được sử dụng để làm gì?
A. Đo lường mối quan hệ giữa hai biến định lượng.
B. So sánh trung bình của hai nhóm.
C. So sánh trung bình của ba nhóm trở lên.
D. Dự đoán giá trị của một biến dựa trên biến khác.
103. Điều gì là ‘tính hợp lệ’ trong thống kê?
A. Mức độ mà một phương pháp đo lường cho kết quả nhất quán.
B. Mức độ mà một phương pháp đo lường đo lường những gì nó được cho là đo lường.
C. Mức độ mà kết quả có thể được khái quát hóa cho tổng thể.
D. Mức độ mà dữ liệu dễ dàng thu thập và phân tích.
104. Điều gì là quan trọng nhất khi diễn giải kết quả phân tích thống kê?
A. Chỉ tập trung vào các kết quả có ý nghĩa thống kê.
B. Xem xét bối cảnh và ý nghĩa thực tế của kết quả.
C. Bỏ qua các hạn chế của phân tích.
D. Sử dụng ngôn ngữ chuyên môn phức tạp để gây ấn tượng.
105. Trong thống kê, ‘độ tin cậy’ đề cập đến điều gì?
A. Mức độ mà một phương pháp đo lường cho kết quả nhất quán.
B. Mức độ mà một phương pháp đo lường đo lường những gì nó được cho là đo lường.
C. Mức độ mà kết quả có thể được khái quát hóa cho tổng thể.
D. Mức độ mà dữ liệu dễ dàng thu thập và phân tích.
106. Phương pháp nào sau đây được sử dụng để giảm sai số không lấy mẫu?
A. Tăng kích thước mẫu.
B. Sử dụng phương pháp lấy mẫu ngẫu nhiên.
C. Đào tạo kỹ lưỡng cho người thu thập dữ liệu.
D. Sử dụng phần mềm thống kê phức tạp.
107. Biểu đồ nào sau đây thích hợp để hiển thị phân phối tần số của dữ liệu định tính?
A. Biểu đồ Scatter.
B. Biểu đồ Histogram.
C. Biểu đồ Pie.
D. Biểu đồ Boxplot.
108. Thống kê ứng dụng chủ yếu tập trung vào điều gì?
A. Phát triển các phương pháp thống kê mới.
B. Ứng dụng các phương pháp thống kê vào các vấn đề thực tế.
C. Nghiên cứu các định lý toán học liên quan đến thống kê.
D. Xây dựng các mô hình toán học phức tạp.
109. Tại sao cần phải kiểm tra tính phân phối chuẩn của dữ liệu?
A. Để làm cho dữ liệu dễ nhìn hơn.
B. Để đảm bảo tính chính xác của các kiểm định thống kê.
C. Để giảm kích thước tập dữ liệu.
D. Để loại bỏ giá trị ngoại lệ.
110. Mục đích của việc chuẩn hóa dữ liệu là gì?
A. Để loại bỏ giá trị ngoại lệ.
B. Để chuyển đổi dữ liệu về cùng một thang đo.
C. Để làm cho dữ liệu dễ đọc hơn.
D. Để tăng kích thước tập dữ liệu.
111. Mục tiêu chính của thống kê mô tả là gì?
A. Dự đoán các xu hướng trong tương lai.
B. Mô tả và tóm tắt dữ liệu.
C. Kiểm định các giả thuyết.
D. Xây dựng các mô hình nhân quả.
112. Tại sao cần phải xử lý giá trị ngoại lệ?
A. Để làm cho dữ liệu dễ nhìn hơn.
B. Để đảm bảo tính nhất quán của dữ liệu.
C. Để tránh ảnh hưởng sai lệch đến kết quả phân tích.
D. Để giảm kích thước tập dữ liệu.
113. Điều gì xảy ra với sai số lấy mẫu khi kích thước mẫu tăng lên?
A. Sai số lấy mẫu tăng lên.
B. Sai số lấy mẫu giảm xuống.
C. Sai số lấy mẫu không đổi.
D. Không có mối quan hệ giữa kích thước mẫu và sai số lấy mẫu.
114. Biểu đồ nào sau đây thích hợp để hiển thị phân phối tần số của dữ liệu định lượng liên tục?
A. Biểu đồ Pareto.
B. Biểu đồ Histogram.
C. Biểu đồ Scatter.
D. Biểu đồ Boxplot.
115. Kiểm định Chi-bình phương được sử dụng để làm gì?
A. So sánh trung bình của hai nhóm.
B. Kiểm tra sự độc lập giữa hai biến định tính.
C. Đo lường mối quan hệ giữa hai biến định lượng.
D. Dự đoán giá trị của một biến dựa trên biến khác.
116. Sai số lấy mẫu là gì?
A. Sai sót trong quá trình nhập dữ liệu.
B. Sự khác biệt giữa kết quả mẫu và kết quả thực tế của tổng thể.
C. Lỗi do thiết kế bảng hỏi kém.
D. Sự thiên vị của người thu thập dữ liệu.
117. Phương pháp nào sau đây được sử dụng để giảm số lượng biến trong một tập dữ liệu?
A. Phân tích hồi quy.
B. Phân tích phương sai.
C. Phân tích thành phần chính.
D. Kiểm định Chi-bình phương.
118. Hồi quy tuyến tính được sử dụng để làm gì?
A. Đo lường mối quan hệ giữa hai biến định tính.
B. Dự đoán giá trị của một biến dựa trên biến khác.
C. So sánh trung bình của hai nhóm.
D. Phân loại dữ liệu thành các nhóm khác nhau.
119. Giá trị ngoại lệ (outlier) là gì?
A. Giá trị trung bình của tập dữ liệu.
B. Giá trị xuất hiện thường xuyên nhất trong tập dữ liệu.
C. Giá trị khác biệt đáng kể so với các giá trị khác trong tập dữ liệu.
D. Giá trị nằm ở giữa tập dữ liệu sau khi sắp xếp.
120. Điều gì là quan trọng nhất khi trình bày kết quả thống kê?
A. Sử dụng thuật ngữ chuyên môn phức tạp.
B. Trình bày kết quả một cách rõ ràng, dễ hiểu.
C. Chỉ trình bày kết quả ủng hộ giả thuyết.
D. Bỏ qua các hạn chế của nghiên cứu.
121. Điều gì là lợi thế chính của việc sử dụng một mẫu (sample) thay vì khảo sát toàn bộ tổng thể?
A. Luôn đảm bảo độ chính xác tuyệt đối.
B. Tiết kiệm thời gian và chi phí.
C. Loại bỏ hoàn toàn sai số.
D. Đơn giản hóa quá trình phân tích dữ liệu.
122. Biểu đồ tần suất (histogram) được sử dụng để biểu diễn loại dữ liệu nào?
A. Dữ liệu định tính.
B. Dữ liệu định lượng rời rạc.
C. Dữ liệu định lượng liên tục.
D. Dữ liệu thứ bậc.
123. Trong phân tích dữ liệu, ‘giá trị ngoại lệ’ (outlier) là gì?
A. Giá trị xuất hiện nhiều nhất trong dữ liệu.
B. Giá trị nằm gần giá trị trung bình.
C. Giá trị khác biệt đáng kể so với các giá trị khác trong tập dữ liệu.
D. Giá trị được sử dụng để tính toán độ lệch chuẩn.
124. Trong một nghiên cứu, biến độc lập (independent variable) là gì?
A. Biến được đo lường để xem nó bị ảnh hưởng như thế nào.
B. Biến được thao túng hoặc thay đổi để xem ảnh hưởng của nó đến biến khác.
C. Biến không thay đổi trong suốt nghiên cứu.
D. Biến được sử dụng để kiểm soát các yếu tố gây nhiễu.
125. Giá trị của hệ số tương quan (correlation coefficient) nằm trong khoảng nào?
A. Từ 0 đến 1.
B. Từ -1 đến 0.
C. Từ -1 đến 1.
D. Từ 0 đến vô cực.
126. Điều gì xảy ra nếu hệ số tương quan giữa hai biến là gần bằng 0?
A. Có một mối quan hệ tuyến tính mạnh mẽ giữa hai biến.
B. Có một mối quan hệ nhân quả giữa hai biến.
C. Không có mối quan hệ tuyến tính hoặc mối quan hệ rất yếu giữa hai biến.
D. Hai biến này hoàn toàn giống nhau.
127. Trong thống kê, ‘phân vị’ (percentile) là gì?
A. Giá trị trung bình của dữ liệu.
B. Giá trị chia dữ liệu thành 100 phần bằng nhau.
C. Giá trị xuất hiện nhiều nhất trong dữ liệu.
D. Độ lệch chuẩn của dữ liệu.
128. Điều gì là quan trọng nhất khi thiết kế một bảng hỏi khảo sát?
A. Sử dụng ngôn ngữ phức tạp để thể hiện sự chuyên nghiệp.
B. Đảm bảo câu hỏi rõ ràng, dễ hiểu và không gây nhầm lẫn.
C. Đặt càng nhiều câu hỏi càng tốt để thu thập được nhiều thông tin.
D. Sử dụng câu hỏi mở hoàn toàn để người trả lời tự do thể hiện ý kiến.
129. Độ lệch chuẩn (standard deviation) đo lường điều gì?
A. Mức độ tập trung của dữ liệu xung quanh giá trị trung bình.
B. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình.
C. Giá trị lớn nhất trong tập dữ liệu.
D. Giá trị trung bình của tập dữ liệu.
130. Hệ số tương quan (correlation coefficient) đo lường điều gì?
A. Mức độ biến động của dữ liệu.
B. Mối quan hệ nhân quả giữa hai biến.
C. Mối quan hệ tuyến tính giữa hai biến.
D. Sự khác biệt giữa giá trị lớn nhất và nhỏ nhất.
131. Phương pháp thu thập dữ liệu nào sau đây thường được sử dụng để thu thập thông tin định tính?
A. Khảo sát bằng bảng hỏi đóng.
B. Phỏng vấn sâu.
C. Thực nghiệm có kiểm soát.
D. Quan sát thống kê.
132. Biến định tính (Qualitative variable) là gì?
A. Biến có giá trị là số thực.
B. Biến có giá trị là số nguyên.
C. Biến có giá trị là các thuộc tính hoặc đặc điểm không số.
D. Biến có giá trị đo lường được bằng số.
133. Tứ phân vị (quartile) chia dữ liệu thành bao nhiêu phần?
A. 2 phần.
B. 3 phần.
C. 4 phần.
D. 10 phần.
134. Điều gì là quan trọng nhất khi trình bày dữ liệu thống kê?
A. Sử dụng nhiều màu sắc và hiệu ứng đặc biệt để thu hút sự chú ý.
B. Đảm bảo tính chính xác, rõ ràng và dễ hiểu.
C. Sử dụng ngôn ngữ chuyên môn phức tạp để thể hiện sự am hiểu.
D. Trình bày càng nhiều dữ liệu càng tốt, không cần quan tâm đến tính dễ hiểu.
135. Mục đích chính của thống kê suy diễn (Inferential statistics) là gì?
A. Mô tả các đặc điểm của mẫu.
B. Thu thập dữ liệu từ một tổng thể.
C. Đưa ra kết luận về một tổng thể dựa trên thông tin từ một mẫu.
D. Tính toán các số liệu thống kê mô tả.
136. Điều gì phân biệt thang đo tỷ lệ (Ratio scale) với thang đo khoảng (Interval scale)?
A. Thang đo tỷ lệ không có thứ tự.
B. Thang đo tỷ lệ có điểm gốc tuyệt đối.
C. Thang đo tỷ lệ không thể có giá trị âm.
D. Thang đo tỷ lệ không thể so sánh tỷ lệ giữa hai giá trị.
137. Trong một phân phối dữ liệu, giá trị nào sau đây là số trung vị (median)?
A. Giá trị xuất hiện nhiều nhất.
B. Giá trị trung bình cộng.
C. Giá trị nằm ở giữa khi dữ liệu được sắp xếp theo thứ tự.
D. Giá trị lớn nhất trừ giá trị nhỏ nhất.
138. Thống kê mô tả (Descriptive statistics) chủ yếu tập trung vào điều gì?
A. Dự đoán các giá trị tương lai dựa trên dữ liệu hiện có.
B. Thu thập, tóm tắt và trình bày dữ liệu.
C. Kiểm định các giả thuyết về một tổng thể.
D. Ước lượng các tham số của một tổng thể.
139. Đâu là một ví dụ về biến định lượng liên tục (Continuous quantitative variable)?
A. Số lượng sách trong thư viện.
B. Số lượng sinh viên trong một lớp.
C. Chiều cao của một người.
D. Số xe ô tô trong một bãi đỗ xe.
140. Loại biểu đồ nào sau đây phù hợp nhất để so sánh tần suất của các danh mục khác nhau?
A. Biểu đồ đường (Line chart).
B. Biểu đồ phân tán (Scatter plot).
C. Biểu đồ cột (Bar chart).
D. Biểu đồ hộp (Box plot).
141. Phương pháp lấy mẫu nào sau đây đảm bảo rằng mỗi thành viên của tổng thể có cơ hội được chọn như nhau?
A. Lấy mẫu thuận tiện (Convenience sampling).
B. Lấy mẫu phán đoán (Judgment sampling).
C. Lấy mẫu ngẫu nhiên đơn giản (Simple random sampling).
D. Lấy mẫu theo hạn ngạch (Quota sampling).
142. Khi nào nên sử dụng biểu đồ hộp (box plot)?
A. Để so sánh sự thay đổi của dữ liệu theo thời gian.
B. Để so sánh mối quan hệ giữa hai biến.
C. Để biểu diễn phân phối của dữ liệu và xác định các giá trị ngoại lệ.
D. Để biểu diễn tỷ lệ phần trăm của các phần trong một tổng thể.
143. Phương pháp nào sau đây có thể giúp giảm thiểu sai số do không phản hồi trong khảo sát?
A. Sử dụng mẫu lớn hơn.
B. Gửi thư nhắc nhở hoặc gọi điện thoại cho những người chưa phản hồi.
C. Sử dụng câu hỏi đóng hoàn toàn.
D. Sử dụng ngôn ngữ phức tạp để thể hiện sự chuyên nghiệp.
144. Khi nào nên sử dụng biểu đồ tròn (pie chart)?
A. Để so sánh sự thay đổi của dữ liệu theo thời gian.
B. Để so sánh mối quan hệ giữa hai biến.
C. Để biểu diễn tỷ lệ phần trăm của các phần trong một tổng thể.
D. Để biểu diễn phân phối tần suất của dữ liệu liên tục.
145. Ưu điểm của việc sử dụng dữ liệu thứ cấp (secondary data) là gì?
A. Luôn đảm bảo tính chính xác tuyệt đối.
B. Tiết kiệm thời gian và chi phí so với việc thu thập dữ liệu sơ cấp.
C. Hoàn toàn phù hợp với mục tiêu nghiên cứu của bạn.
D. Loại bỏ hoàn toàn sai số.
146. Trong thống kê, ‘tổng thể’ (population) đề cập đến điều gì?
A. Một nhóm nhỏ các cá nhân được chọn ngẫu nhiên.
B. Tất cả các cá nhân hoặc đối tượng mà chúng ta quan tâm nghiên cứu.
C. Một tập hợp dữ liệu đã được xử lý và phân tích.
D. Một mẫu đại diện cho một nhóm lớn hơn.
147. Trong thống kê, ‘sai số lấy mẫu’ (sampling error) là gì?
A. Sai sót trong quá trình nhập liệu.
B. Sai sót do thiết kế bảng hỏi không tốt.
C. Sự khác biệt giữa kết quả thu được từ mẫu và kết quả thực tế của tổng thể.
D. Sai sót do người trả lời cung cấp thông tin không chính xác.
148. Thang đo nào sau đây có tính chất của cả thứ tự và khoảng cách bằng nhau giữa các giá trị?
A. Thang đo định danh (Nominal scale).
B. Thang đo thứ bậc (Ordinal scale).
C. Thang đo khoảng (Interval scale).
D. Thang đo tỷ lệ (Ratio scale).
149. Khoảng biến thiên (range) được tính như thế nào?
A. Giá trị trung bình cộng trừ giá trị nhỏ nhất.
B. Giá trị lớn nhất trừ giá trị nhỏ nhất.
C. Tổng của tất cả các giá trị chia cho số lượng giá trị.
D. Độ lệch chuẩn nhân với số lượng giá trị.
150. Đâu là một ví dụ về dữ liệu thứ cấp (secondary data)?
A. Dữ liệu thu thập được từ một cuộc khảo sát do bạn tự thực hiện.
B. Dữ liệu thu thập được từ một thí nghiệm do bạn thiết kế.
C. Dữ liệu được công bố bởi một tổ chức chính phủ.
D. Dữ liệu thu thập được thông qua quan sát trực tiếp.