Bộ đề 1

Câu 1

Trong phân tích hồi quy, 'sai số' (residual) được định nghĩa là gì?

Câu 2

Trong phân tích hồi quy bội, khi nào thì xảy ra hiện tượng đa cộng tuyến (multicollinearity)?

Câu 3

Một công ty muốn khảo sát mức độ hài lòng của khách hàng. Họ gửi email khảo sát đến 500 khách hàng đã mua sản phẩm trong tháng trước và nhận được phản hồi từ 100 khách hàng. Đây là loại mẫu nào?

Câu 4

Khi nào thì trung bình (mean) không phải là thước đo tốt để đại diện cho trung tâm của dữ liệu?

Câu 5

Một cửa hàng bán lẻ muốn xác định xem có mối quan hệ giữa số lượng khách hàng đến cửa hàng và doanh thu hàng ngày hay không. Họ nên sử dụng phương pháp thống kê nào?

Câu 6

Khi nào nên sử dụng kiểm định t (t-test) thay vì kiểm định z (z-test) để so sánh trung bình của hai mẫu?

Câu 7

Khi nào nên sử dụng phân tích phương sai (ANOVA)?

Câu 8

Trong kiểm định giả thuyết thống kê, sai lầm loại I xảy ra khi nào?

Câu 9

Ý nghĩa của khoảng tin cậy 95% là gì?

Câu 10

Trong phân tích hồi quy, sai số chuẩn của hệ số hồi quy (standard error of the regression coefficient) đo lường điều gì?

Câu 11

Trong phân tích hồi quy tuyến tính, hệ số xác định (R-squared) đo lường điều gì?

Câu 12

Trong thống kê mô tả, đại lượng nào đo lường mức độ phân tán của dữ liệu xung quanh giá trị trung bình?

Câu 13

Trong phân tích chuỗi thời gian, phương pháp trung bình trượt (moving average) được sử dụng để làm gì?

Câu 14

Trong kiểm định giả thuyết, mức ý nghĩa (alpha) thường được đặt ở mức 0.05. Điều này có nghĩa là gì?

Câu 15

Phương pháp lấy mẫu nào đảm bảo mọi phần tử của quần thể đều có cơ hội được chọn như nhau?

Câu 16

Một nhà nghiên cứu muốn so sánh mức độ hài lòng của nhân viên giữa ba phòng ban khác nhau trong công ty. Họ nên sử dụng phương pháp thống kê nào?

Câu 17

Trong phân tích chuỗi thời gian, thành phần nào thể hiện sự biến động không đều đặn và khó dự đoán?

Câu 18

Một nhà nghiên cứu muốn ước tính tỷ lệ cử tri ủng hộ một ứng cử viên trong cuộc bầu cử sắp tới. Anh ta lấy mẫu ngẫu nhiên 400 cử tri và thấy rằng 220 người ủng hộ ứng cử viên đó. Khoảng tin cậy 95% cho tỷ lệ ủng hộ là bao nhiêu?

Câu 19

Một công ty muốn dự đoán doanh số bán hàng trong quý tới dựa trên dữ liệu doanh số của các quý trước. Họ nên sử dụng phương pháp thống kê nào?

Câu 20

Một nhà nghiên cứu muốn xác định xem có mối quan hệ giữa trình độ học vấn (cấp 3, cao đẳng, đại học, sau đại học) và thu nhập hàng tháng hay không. Họ nên sử dụng phương pháp thống kê nào?

Câu 21

Một công ty muốn so sánh hiệu quả của hai chiến dịch quảng cáo khác nhau. Họ chia khách hàng thành hai nhóm ngẫu nhiên và cho mỗi nhóm xem một chiến dịch quảng cáo. Sau đó, họ đo lường doanh số bán hàng của mỗi nhóm. Họ nên sử dụng phương pháp thống kê nào?

Câu 22

Một công ty sản xuất bóng đèn tuyên bố rằng tuổi thọ trung bình của bóng đèn là 1000 giờ. Để kiểm tra tuyên bố này, người ta lấy mẫu ngẫu nhiên 100 bóng đèn và thấy rằng tuổi thọ trung bình của mẫu là 950 giờ với độ lệch chuẩn là 80 giờ. Hãy thực hiện kiểm định giả thuyết với mức ý nghĩa 5%. Giả thuyết H0 và H1 là gì?

Câu 23

Một nhà quản lý muốn dự đoán doanh số bán hàng dựa trên chi phí quảng cáo. Anh ta thu thập dữ liệu về doanh số và chi phí quảng cáo trong 12 tháng qua và thực hiện phân tích hồi quy tuyến tính. Kết quả cho thấy hệ số hồi quy cho chi phí quảng cáo là 2.5. Ý nghĩa của hệ số này là gì?

Câu 24

Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?

Câu 25

Trong thống kê, 'phương sai' (variance) được định nghĩa là gì?

Câu 26

Khi nào nên sử dụng kiểm định phi tham số (non-parametric test) thay vì kiểm định tham số (parametric test)?

Câu 27

Một nhà máy sản xuất ô tô muốn kiểm tra xem có sự khác biệt về mức tiêu thụ nhiên liệu giữa ba loại động cơ khác nhau hay không. Họ nên sử dụng phương pháp thống kê nào?

Câu 28

Phương pháp nào sau đây thường được sử dụng để phân tích mối quan hệ giữa hai biến định tính?

Câu 29

Trong thống kê, 'độ lệch' (skewness) đo lường điều gì?

Câu 30

Trong thống kê, 'phân vị' (percentile) được sử dụng để làm gì?