Gen AI cho Marketer: Làm chủ và Nghệ thuật ra lệnh cho AI

Gen AI cho Marketer: Làm chủ và Nghệ thuật ra lệnh cho AI

Chào bạn, Trí đây!

Ở bài trước, chúng ta đã khám phá sức mạnh sáng tạo của Generative AI và các Mô hình Nền tảng (Foundation Model). Chắc hẳn bạn đã rất ấn tượng với khả năng viết lách, vẽ tranh của chúng. Nhưng có lẽ bạn cũng đã từng gặp trường hợp AI trả lời chung chung, không đúng ý, hoặc thậm chí... "bịa" ra thông tin sai sự thật.

Vậy làm sao để khai thác tối đa sức mạnh của những hệ thống này? Và điều gì xảy ra bên trong "bộ não" của AI khiến nó có thể học mà không cần chúng ta? Hãy cùng Trí khám phá hai mảnh ghép cuối cùng: Prompt Engineering  Self-Supervised Learning.

 

Prompt Engineering: Khi Bạn Cần Trở Thành "Chỉ Huy" Của AI

 

Để hiểu tầm quan trọng của việc "ra lệnh" cho AI, chúng ta hãy quay về quá khứ của các công cụ tìm kiếm.

Tại Sao Generative AI Giống Như Google Thời "Sơ Khai"?

 

Những năm 1990, các công cụ tìm kiếm như Lycos hay Alta Vista cần những câu lệnh rất cụ thể. Nếu bạn tìm "where to buy local plants" (mua cây cối địa phương ở đâu),bạn có thể nhận về kết quả về nhà máy (factories),các loại cây công nghiệp, hoặc thậm chí là... salad. Chúng không hiểu được bối cảnh (context).

Sau này, Google và Bing đã giải quyết vấn đề đó bằng cách thu thập dữ liệu về bạn (lịch sử tìm kiếm, vị trí...) để hiểu bạn hơn. Cùng một câu lệnh "local plants", một kỹ sư sẽ thấy danh sách nhà máy sản xuất, còn một người làm vườn sẽ thấy các vườn ươm cây cảnh.

Hiện tại, Generative AI giống như các công cụ tìm kiếm thời đầu. Dù mạnh mẽ hơn gấp bội, chúng vẫn chưa hiểu rõ về bạn. Vì vậy, để có kết quả tốt nhất, bạn cần cung cấp cho chúng bối cảnh cần thiết. Kỹ thuật này được gọi là Prompt Engineering (Kỹ thuật câu lệnh).

 

3 Kỹ Thuật "Ra Lệnh" Đơn Giản Mà Hiệu Quả

 

Giả sử bạn muốn nhờ ChatGPT so sánh giữa máy tính bảng Surface và iPad.

Cách thông thường (kết quả chung chung):

"Sự khác biệt giữa Surface và iPad là gì?"

Sử dụng Prompt Engineering (kết quả tùy chỉnh):

Tạo một Vai Trò (Persona): Yêu cầu AI nhìn vấn đề từ góc nhìn của một người cụ thể.

"Hãy tưởng tượng bạn là một chuyên gia sáng tạo, dành phần lớn thời gian sử dụng phần mềm vẽ minh họa. Lợi ích của Surface so với iPad là gì?"

Kết quả có thể sẽ đề cập đến các phần mềm chuyên dụng, độ trễ của bút cảm ứng... những thông tin mà một người dùng thông thường không quan tâm.

Chuỗi Suy Nghĩ (Chain of Thought): Chia một nhiệm vụ lớn thành các bước nhỏ.

"Hãy suy nghĩ từng bước một. Tưởng tượng bạn là một chuyên gia sáng tạo muốn làm việc từ xa. Một vài lựa chọn tốt nhất là gì?"

Sau khi AI liệt kê các lựa chọn, bạn có thể hỏi tiếp: "Dựa trên lựa chọn số 2, hãy phân tích sâu hơn về khả năng tương thích phần mềm."

Yêu Cầu Định Dạng Cụ Thể:

"...cuối cùng, hãy tóm tắt toàn bộ suy nghĩ của bạn vào một bảng so sánh."

Kỹ ThuậtPrompt Đơn GiảnPrompt Được Tinh Chỉnh (Engineered)
Mục tiêuSo sánh Surface và iPad.So sánh Surface và iPad cho một họa sĩ digital.
Câu lệnh"Sự khác biệt giữa Surface và iPad là gì?""Hãy đóng vai một họa sĩ digital. Phân tích từng bước một về ưu nhược điểm của Surface và iPad cho công việc vẽ. Cuối cùng, tóm tắt trong một bảng."
Kết quảThông tin chung về hệ điều hành, giá cả.Phân tích sâu về bút, màn hình, phần mềm chuyên dụng, được trình bày rõ ràng.

Lưu ý: Prompt Engineering là một kỹ năng quan trọng ở thời điểm hiện tại. Trong 5-10 năm tới, có thể AI sẽ tự động hiểu bối cảnh về bạn tốt hơn, nhưng bây giờ, việc "ra lệnh" tốt sẽ tạo ra sự khác biệt khổng lồ.

AI Tự Học Không Cần Con Người: Bí Mật Của Self-Supervised Learning

 

Nhưng để AI có thể trả lời những câu lệnh phức tạp đó, nó cần một kho kiến thức khổng lồ. Vậy nó học như thế nào từ hàng tỷ dữ liệu trên internet mà phần lớn đều không được dán nhãn?

 

Bài Toán Nan Giải: Dữ Liệu Khổng Lồ Nhưng "Vô Danh"

 

Chúng ta biết rằng có hai loại dữ liệu:

  • Dữ liệu có nhãn (Labeled data): Một bức ảnh có chú thích "hình ảnh con chó".
  • Dữ liệu không nhãn (Unlabeled data): Một bức ảnh chỉ là một tệp tin, không có mô tả gì.

Học có giám sát (Supervised Learning) cần dữ liệu có nhãn. Học không giám sát (Unsupervised Learning) có thể gom cụm các bức ảnh giống nhau (ví dụ: cụm các ảnh có chó) nhưng nó không biết gọi cụm đó là gì. Việc thuê người đi dán nhãn cho toàn bộ internet là điều không tưởng.

 

Giải Pháp "Tự Giám Sát": Khi AI Tự Dán Nhãn Cho Dữ Liệu

 

Đây là lúc kỹ thuật Self-Supervised Learning (Học tự giám sát) tỏa sáng. Nó là sự kết hợp thông minh giữa hai phương pháp trên. Nôm na là:

  1. Hệ thống dùng Unsupervised Learning để gom cụm dữ liệu không nhãn.
  2. Sau đó, nó tự suy đoán nhãn cho các cụm đó dựa vào bối cảnh xung quanh. Các nhãn tự tạo này được gọi là "nhãn giả" (pseudo label).

Ví dụ: Hệ thống thấy hàng triệu bức ảnh có chứa một con vật bốn chân. Trong đó, nhiều bức ảnh có phần văn bản đi kèm là "Dẫn Charlie đi dạo công viên". Hệ thống sẽ tự suy luận và tạo ra một "nhãn giả" là "chó" cho toàn bộ cụm ảnh đó.

Nó giống như việc AI vừa "hút bụi" (thu thập dữ liệu) vừa "tự sắp xếp" (tạo nhãn) cùng một lúc, mà không cần sự can thiệp liên tục của con người.

Mặt Tối Của Việc Tự Học: "Ảo Giác" Của AI (Hallucination)

 

Vì việc dán nhãn này chỉ là "suy đoán", nó không phải lúc nào cũng chính xác. Đây chính là nguồn gốc của hiện tượng Hallucination (Ảo giác) - khi AI đưa ra một tuyên bố sai sự thật một cách chắc chắn.

Ví dụ:

  • Hệ thống thấy một bức ảnh chụp một người đang ôm con mèo.
  • Dòng chú thích bên dưới là: "Nó rất sợ chó."
  • Hệ thống có thể tạo ra một "nhãn giả" sai lầm, gắn nhãn "chó" cho bức ảnh có con mèo này.
  • Nó đã học một điều sai.
  • Sau này, khi bạn yêu cầu "cho tôi xem ảnh một người và một con chó", nó có thể sẽ hiển thị bức ảnh người ôm mèo kia.

Đây là một trong những thách thức lớn nhất của Generative AI hiện nay.

 

Lời Kết: Trở Thành Người Dùng AI Thông Thái

 

Vậy là chúng ta đã cùng nhau đi hết một hành trình dài để hiểu về thế giới AI, từ những khái niệm cơ bản nhất đến những công nghệ tiên tiến đang định hình tương lai.

Để làm chủ Generative AI, chúng ta cần hai thứ:

  1. Trở thành người "chỉ huy" giỏi: Sử dụng Prompt Engineering để cung cấp bối cảnh rõ ràng, giúp AI hiểu đúng ý bạn và tạo ra kết quả xuất sắc.
  2. Trở thành người dùng thông thái: Hiểu rằng AI học hỏi qua Self-Supervised Learning, nghĩa là nó có thể mắc sai lầm và tạo ra "ảo giác". Luôn kiểm tra lại những thông tin quan trọng mà AI cung cấp.

AI là một công cụ vô cùng mạnh mẽ, và khi chúng ta hiểu cách nó hoạt động, chúng ta có thể khai thác tiềm năng của nó một cách hiệu quả và an toàn hơn.

Bạn đã từng gặp phải "ảo giác" nào của AI chưa? Hãy chia sẻ câu chuyện của bạn ở phần bình luận bên dưới nhé!

Võ Minh Trí

Article by Võ Minh Trí

Published 27 Oct 2025