Skip to content
Go back

Day 2 - AI & NLP

Published:  at  05:00 PM

Hiểu cơ bản về AI và NLP

Sau khi đã nói về Prompt Engineering ở bài trước, trong bài này mình muốn lùi lại một bước để nhìn rõ hơn: AI thực sự xử lý ngôn ngữ như thế nào?

Rất nhiều người (trong đó có mình lúc mới bắt đầu) thường nghĩ AI “hiểu” ngôn ngữ giống con người. Nhưng thực tế thì không hẳn như vậy. Việc nắm được cách AI vận hành ở mức cơ bản sẽ giúp chúng ta:


1. AI xử lý ngôn ngữ như thế nào?

AI không hiểu ngôn ngữ theo nghĩa “hiểu ý” như con người. Thay vào đó, nó hoạt động dựa trên nhận diện mẫu (pattern recognition)xác suất thống kê.

Các mô hình ngôn ngữ lớn (LLM) được huấn luyện trên lượng dữ liệu văn bản khổng lồ. Từ đó, chúng học cách:

Khi bạn nhập một câu hỏi, quá trình xử lý thường diễn ra theo các bước:

  1. Tiếp nhận văn bản đầu vào
  2. Chuyển đổi văn bản thành dạng mà máy có thể xử lý
  3. Phân tích ngữ cảnh dựa trên dữ liệu đã học
  4. Tạo ra phản hồi cuối cùng

Điều này giải thích vì sao AI có thể viết rất trôi chảy, nhưng đôi khi lại trả lời sai bản chất vấn đề.


2. Một số khái niệm kỹ thuật cốt lõi

Để hiểu AI hoạt động ở mức cơ bản, có ba khái niệm quan trọng thường xuyên được nhắc đến.

Tokenization (Mã hóa)

Đây là bước đầu tiên trong xử lý ngôn ngữ. Văn bản sẽ được chia nhỏ thành các token, có thể là:

AI không làm việc trực tiếp với câu chữ hoàn chỉnh, mà với các token này.


Embeddings (Nhúng)

Sau khi token hóa, các token sẽ được chuyển thành vector số trong một không gian nhiều chiều.

Cách làm này giúp AI nhận ra mối quan hệ về nghĩa giữa các từ. Ví dụ:

Nhờ embeddings, AI có thể hiểu được mối liên hệ ngữ nghĩa, chứ không chỉ là so khớp từ khóa đơn thuần.


Huấn luyện mô hình (Model Training)

AI học thông qua nhiều cách khác nhau, phổ biến nhất gồm:

Thông thường, một mô hình sẽ trải qua:


3. Một số mô hình ngôn ngữ lớn phổ biến

Hiện nay có nhiều mô hình LLM khác nhau, mỗi mô hình có triết lý thiết kế và điểm mạnh riêng.

Hiểu sự khác nhau giữa các mô hình giúp bạn chọn đúng công cụ cho từng nhu cầu, thay vì dùng một mô hình cho mọi việc.


Kết luận

Khi hiểu được cách AI xử lý ngôn ngữ và cách các mô hình được xây dựng, bạn sẽ:

Đây cũng là nền tảng quan trọng để sử dụng Prompt Engineering một cách hiệu quả hơn.


Ví dụ minh họa

Có thể tưởng tượng AI giống như một người phiên dịch mã số.

Khi bạn đưa cho nó một câu văn, nó không “đọc” chữ như con người, mà chuyển từng phần của câu thành các con số trên một bản đồ khổng lồ.

Bằng cách so sánh khoảng cách giữa những con số đó, AI biết được từ nào liên quan đến từ nào, từ đó ghép lại thành một câu trả lời trông có vẻ hợp lý.


Suggest Changes

Previous Post
Day 2 - AI & NLP
Next Post
Vibe Coding or AI-Assisted Engineering