Hiểu cơ bản về AI và NLP

Sau khi đã nói về Prompt Engineering ở bài trước, trong bài này mình muốn lùi lại một bước để nhìn rõ hơn: AI thực sự xử lý ngôn ngữ như thế nào?

Rất nhiều người (trong đó có mình lúc mới bắt đầu) thường nghĩ AI “hiểu” ngôn ngữ giống con người. Nhưng thực tế thì không hẳn như vậy. Việc nắm được cách AI vận hành ở mức cơ bản sẽ giúp chúng ta:

Bớt kỳ vọng sai vào AI
Hiểu vì sao có những câu trả lời rất hay, nhưng cũng có lúc sai hoặc vô nghĩa
Và quan trọng hơn, biết cách làm việc với AI hiệu quả hơn

1. AI xử lý ngôn ngữ như thế nào?

AI không hiểu ngôn ngữ theo nghĩa “hiểu ý” như con người. Thay vào đó, nó hoạt động dựa trên nhận diện mẫu (pattern recognition) và xác suất thống kê.

Các mô hình ngôn ngữ lớn (LLM) được huấn luyện trên lượng dữ liệu văn bản khổng lồ. Từ đó, chúng học cách:

Dự đoán từ tiếp theo có khả năng xuất hiện cao nhất
Nhận ra các mẫu quen thuộc trong ngữ cảnh
Tạo ra văn bản trông giống như được con người viết

Khi bạn nhập một câu hỏi, quá trình xử lý thường diễn ra theo các bước:

Tiếp nhận văn bản đầu vào
Chuyển đổi văn bản thành dạng mà máy có thể xử lý
Phân tích ngữ cảnh dựa trên dữ liệu đã học
Tạo ra phản hồi cuối cùng

Điều này giải thích vì sao AI có thể viết rất trôi chảy, nhưng đôi khi lại trả lời sai bản chất vấn đề.

2. Một số khái niệm kỹ thuật cốt lõi

Để hiểu AI hoạt động ở mức cơ bản, có ba khái niệm quan trọng thường xuyên được nhắc đến.

Tokenization (Mã hóa)

Đây là bước đầu tiên trong xử lý ngôn ngữ. Văn bản sẽ được chia nhỏ thành các token, có thể là:

Một từ
Một phần của từ
Hoặc thậm chí là ký tự

AI không làm việc trực tiếp với câu chữ hoàn chỉnh, mà với các token này.

Embeddings (Nhúng)

Sau khi token hóa, các token sẽ được chuyển thành vector số trong một không gian nhiều chiều.

Cách làm này giúp AI nhận ra mối quan hệ về nghĩa giữa các từ. Ví dụ:

Những từ có nghĩa gần nhau sẽ có vector nằm gần nhau
Những từ khác nghĩa sẽ nằm xa hơn

Nhờ embeddings, AI có thể hiểu được mối liên hệ ngữ nghĩa, chứ không chỉ là so khớp từ khóa đơn thuần.

Huấn luyện mô hình (Model Training)

AI học thông qua nhiều cách khác nhau, phổ biến nhất gồm:

Học có giám sát: dữ liệu đã được gán nhãn
Học không giám sát: tự tìm ra mẫu trong dữ liệu
Học tăng cường: cải thiện dựa trên phản hồi

Thông thường, một mô hình sẽ trải qua:

Tiền huấn luyện (pre-training) để học ngôn ngữ và kiến thức chung
Tinh chỉnh (fine-tuning) để phục vụ các mục đích cụ thể như hội thoại, viết code, hay phân tích dữ liệu

3. Một số mô hình ngôn ngữ lớn phổ biến

Hiện nay có nhiều mô hình LLM khác nhau, mỗi mô hình có triết lý thiết kế và điểm mạnh riêng.

GPT (:contentReference[oaicite:0]{index=0})
Mạnh về hội thoại, tóm tắt, viết nội dung và hỗ trợ lập trình. Đây là nhóm mô hình được sử dụng rộng rãi nhất hiện nay.
LLaMA (:contentReference[oaicite:1]{index=1})
Được thiết kế để đạt hiệu suất cao nhưng tối ưu tài nguyên, phù hợp cho nghiên cứu và triển khai linh hoạt.
Claude (:contentReference[oaicite:2]{index=2})
Tập trung nhiều vào yếu tố an toàn, đạo đức và giảm thiểu thiên lệch trong phản hồi.

Hiểu sự khác nhau giữa các mô hình giúp bạn chọn đúng công cụ cho từng nhu cầu, thay vì dùng một mô hình cho mọi việc.

Kết luận

Khi hiểu được cách AI xử lý ngôn ngữ và cách các mô hình được xây dựng, bạn sẽ:

Thực tế hơn khi làm việc với AI
Dễ chấp nhận các giới hạn của mô hình
Và biết cách đặt câu lệnh phù hợp hơn để tận dụng điểm mạnh của chúng

Đây cũng là nền tảng quan trọng để sử dụng Prompt Engineering một cách hiệu quả hơn.

Ví dụ minh họa

Có thể tưởng tượng AI giống như một người phiên dịch mã số.

Khi bạn đưa cho nó một câu văn, nó không “đọc” chữ như con người, mà chuyển từng phần của câu thành các con số trên một bản đồ khổng lồ.

Bằng cách so sánh khoảng cách giữa những con số đó, AI biết được từ nào liên quan đến từ nào, từ đó ghép lại thành một câu trả lời trông có vẻ hợp lý.

Day 2 - AI & NLP