Các bộ trắc nghiệm liên quan:
Trắc nghiệm Công nghệ thông tin & Dữ liệu
150+ câu trắc nghiệm Dữ liệu lớn (BigData) có đáp án
📜 Đọc lưu ý & miễn trừ trách nhiệm trước khi làm bài (Click để đọc)
Lưu ý và Miễn trừ trách nhiệm:Các câu hỏi và đáp án trong các bộ trắc nghiệm này được biên soạn nhằm phục vụ mục đích tham khảo và ôn luyện kiến thức. Chúng không đại diện cho bất kỳ tài liệu, đề thi chính thức hay đề thi chứng chỉ nào từ các tổ chức giáo dục hoặc cơ quan cấp chứng chỉ chuyên môn. Admin không chịu trách nhiệm về tính chính xác tuyệt đối của nội dung hoặc bất kỳ quyết định nào của bạn được đưa ra dựa trên kết quả của các bài trắc nghiệm.
Bộ đề 1
Câu 1
Chức năng chính của Apache Kafka là gì?
Câu 2
Bạn đang làm việc với một tập dữ liệu lớn chứa thông tin về các bài đăng trên mạng xã hội. Bạn muốn phân tích xem những chủ đề nào đang được thảo luận nhiều nhất. Kỹ thuật nào sau đây là phù hợp nhất?
Câu 3
Điều gì KHÔNG phải là một lợi ích của việc sử dụng các giải pháp Big Data?
Câu 4
Trong lĩnh vực Big Data, thuật ngữ 'data governance' (quản trị dữ liệu) có ý nghĩa gì?
Câu 5
MapReduce là một mô hình lập trình để xử lý song song dữ liệu lớn. Giai đoạn nào sau đây KHÔNG thuộc quy trình MapReduce?
Câu 6
Bạn cần chọn một ngôn ngữ lập trình để phát triển các ứng dụng Big Data. Ngôn ngữ nào sau đây thường được sử dụng cho cả xử lý dữ liệu và xây dựng mô hình machine learning?
Câu 7
Trong một hệ thống Big Data, bạn nhận thấy rằng hiệu suất truy vấn đang chậm. Nguyên nhân nào sau đây có thể KHÔNG phải là nguyên nhân?
Câu 8
Trong bối cảnh của Big Data, thuật ngữ 'data wrangling' (xử lý dữ liệu) đề cập đến điều gì?
Câu 9
Bạn muốn sử dụng một công cụ để điều phối (orchestrate) các công việc (jobs) Big Data, chẳng hạn như chạy các quy trình ETL và huấn luyện mô hình machine learning theo lịch trình. Công cụ nào sau đây phù hợp nhất?
Câu 10
Bạn cần xây dựng một hệ thống Big Data để phân tích dữ liệu giao dịch tài chính và phát hiện các hành vi gian lận. Yếu tố nào sau đây là quan trọng nhất?
Câu 11
Trong quá trình xây dựng một mô hình machine learning trên dữ liệu lớn, bạn nhận thấy rằng mô hình của bạn đang bị 'overfitting' (quá khớp). Biện pháp nào sau đây có thể giúp giảm thiểu overfitting?
Câu 12
Công nghệ nào sau đây thường được sử dụng để thu thập dữ liệu từ các nguồn streaming khác nhau (ví dụ: log files, sensor data)?
Câu 13
Bạn cần xây dựng một ứng dụng Big Data để phân tích dữ liệu cảm biến từ các thiết bị IoT trong thời gian thực. Yêu cầu nào sau đây là quan trọng nhất?
Câu 14
Chọn phát biểu đúng nhất về Apache Spark.
Câu 15
Bạn đang thiết kế một hệ thống Big Data để lưu trữ và phân tích dữ liệu nhật ký (log data). Bạn muốn đảm bảo rằng dữ liệu của bạn là bất biến (immutable), nghĩa là một khi đã được ghi, dữ liệu không thể bị thay đổi. Công nghệ nào sau đây phù hợp nhất?
Câu 16
Bạn cần xây dựng một data pipeline để di chuyển dữ liệu từ một cơ sở dữ liệu quan hệ (RDBMS) vào Hadoop. Công cụ nào sau đây phù hợp nhất?
Câu 17
Giả sử bạn có một tập dữ liệu lớn chứa thông tin về các giao dịch mua hàng của khách hàng. Bạn muốn phân tích xem khách hàng nào có khả năng rời bỏ (churn) cao nhất. Phương pháp phân tích nào sau đây là phù hợp nhất?
Câu 18
Trong kiến trúc Data Mesh, trách nhiệm quản lý và sở hữu dữ liệu thuộc về ai?
Câu 19
Thuật ngữ 'Data Lake' (Hồ dữ liệu) đề cập đến điều gì?
Câu 20
HDFS (Hadoop Distributed File System) được thiết kế để làm gì?
Câu 21
Trong một dự án Big Data, bạn cần lựa chọn một định dạng tệp để lưu trữ dữ liệu. Định dạng nào sau đây là phù hợp nhất cho việc lưu trữ dữ liệu có cấu trúc dạng cột, cho phép truy vấn nhanh hơn?
Câu 22
YARN (Yet Another Resource Negotiator) là một thành phần quan trọng trong hệ sinh thái Hadoop, nó có chức năng chính là gì?
Câu 23
Chọn phát biểu đúng về hệ thống NoSQL.
Câu 24
Công cụ nào sau đây thường được sử dụng để truy vấn và phân tích dữ liệu trong Hadoop sử dụng cú pháp SQL?
Câu 25
Trong kiến trúc Kappa, dữ liệu được xử lý như thế nào?
Câu 26
Bạn muốn triển khai một hệ thống Big Data trên đám mây. Lựa chọn nào sau đây cung cấp một nền tảng Hadoop-as-a-Service?
Câu 27
Trong Big Data, 'Cardinality' (bản số) đề cập đến điều gì?
Câu 28
Trong ngữ cảnh của Big Data, 'schema-on-read' có nghĩa là gì?
Câu 29
Trong kiến trúc Lambda, lớp nào chịu trách nhiệm xử lý dữ liệu theo lô (batch processing)?
Câu 30
Bạn cần xây dựng một hệ thống để xử lý dữ liệu log từ các máy chủ web trong thời gian thực để phát hiện các cuộc tấn công DDoS. Công nghệ nào sau đây phù hợp nhất?
