Bộ đề 1

Câu 1

Trong lĩnh vực xử lý ngôn ngữ tự nhiên, 'knowledge graph' (đồ thị tri thức) được sử dụng để làm gì?

Câu 2

Khi xử lý văn bản tiếng Việt, vấn đề nào sau đây là đặc thù so với tiếng Anh?

Câu 3

Trong xử lý ngôn ngữ tự nhiên, 'TF-IDF' là viết tắt của cụm từ nào?

Câu 4

Trong các phương pháp đánh giá mô hình sinh ngôn ngữ (ví dụ: mô hình dịch máy), độ đo BLEU (Bilingual Evaluation Understudy) được sử dụng để đánh giá yếu tố nào?

Câu 5

Trong xử lý ngôn ngữ tự nhiên, phương pháp nào thường được sử dụng để giảm số chiều của dữ liệu văn bản, giúp giảm độ phức tạp tính toán và cải thiện hiệu suất mô hình?

Câu 6

Ứng dụng nào sau đây thể hiện việc sử dụng thành công của xử lý ngôn ngữ tự nhiên trong lĩnh vực y tế?

Câu 7

Trong ngữ cảnh của chatbot, kỹ thuật 'intent recognition' (nhận dạng ý định) có vai trò gì?

Câu 8

Trong xử lý ngôn ngữ tự nhiên, kỹ thuật 'word sense disambiguation' (WSD) nhằm mục đích gì?

Câu 9

Trong xử lý ngôn ngữ tự nhiên, kỹ thuật 'topic modeling' (mô hình hóa chủ đề) nhằm mục đích gì?

Câu 10

Trong xử lý ngôn ngữ tự nhiên, kỹ thuật 'chunking' (phân đoạn) thường được sử dụng để làm gì?

Câu 11

Phương pháp nào sau đây được sử dụng để đánh giá sự tương đồng giữa hai văn bản?

Câu 12

Cho đoạn văn bản: 'Hôm nay, trời Hà Nội nhiều mây và có mưa rào.' Thao tác nào sau đây thuộc về phân tích cú pháp (syntactic parsing)?

Câu 13

Khi xây dựng một hệ thống phân tích cảm xúc (sentiment analysis), điều gì quan trọng nhất cần xem xét để đảm bảo tính chính xác của hệ thống?

Câu 14

Trong lĩnh vực xử lý ngôn ngữ tự nhiên, thuật ngữ 'n-gram' đề cập đến điều gì?

Câu 15

Trong mô hình hóa ngôn ngữ, 'perplexity' là gì?

Câu 16

Phương pháp nào sau đây có thể giúp cải thiện hiệu suất của mô hình ngôn ngữ khi dữ liệu huấn luyện bị thiếu?

Câu 17

Phương pháp nào sau đây KHÔNG thuộc về các kỹ thuật giảm chiều dữ liệu (dimensionality reduction) trong xử lý ngôn ngữ tự nhiên?

Câu 18

Ứng dụng nào sau đây KHÔNG phải là một ứng dụng của xử lý ngôn ngữ tự nhiên trong lĩnh vực marketing?

Câu 19

Phương pháp nào sau đây thường được sử dụng để xử lý vấn đề 'Out-of-Vocabulary' (OOV) trong các mô hình ngôn ngữ dựa trên từ (word-based)?

Câu 20

Kỹ thuật nào sau đây thường được sử dụng để giảm thiểu ảnh hưởng của các từ phổ biến (ví dụ: 'the', 'a', 'is') trong quá trình phân tích văn bản?

Câu 21

Trong xử lý ngôn ngữ tự nhiên, 'coreference resolution' (giải quyết đồng tham chiếu) là gì?

Câu 22

Ứng dụng nào sau đây KHÔNG phải là một ứng dụng phổ biến của kỹ thuật Named Entity Recognition (NER) trong xử lý ngôn ngữ tự nhiên?

Câu 23

Kỹ thuật nào sau đây thường được sử dụng để tạo ra các biến thể khác nhau của một câu, nhằm tăng cường dữ liệu huấn luyện cho các mô hình NLP?

Câu 24

Trong các bước tiền xử lý văn bản, kỹ thuật 'stemming' (tách gốc từ) có tác dụng gì?

Câu 25

Khi đánh giá hiệu suất của một mô hình phân loại văn bản, độ đo 'F1-score' là gì?

Câu 26

Trong các mô hình transformer, cơ chế 'self-attention' (tự chú ý) cho phép mô hình làm gì?

Câu 27

Mục tiêu chính của kỹ thuật 'machine translation' (dịch máy) là gì?

Câu 28

Trong các mô hình học sâu cho NLP, recurrent neural network (RNN) đặc biệt phù hợp với loại dữ liệu nào?

Câu 29

Trong lĩnh vực xử lý ngôn ngữ tự nhiên, 'attention mechanism' (cơ chế chú ý) giải quyết vấn đề chính nào trong các mô hình sequence-to-sequence?

Câu 30

Ưu điểm chính của việc sử dụng 'word embeddings' (ví dụ: Word2Vec, GloVe) so với các phương pháp biểu diễn từ truyền thống như 'one-hot encoding' là gì?