Getting better results

Các thách thức thường gặp và cách khắc phục

Khi bắt đầu làm việc với Claude, bạn có thể gặp những lúc phản hồi không như mong đợi. Đây là cơ hội để tinh chỉnh phương pháp tiếp cận của bạn. Dưới đây là các thách thức phổ biến và cách giải quyết:

  • Phản hồi của Claude quá chung chung: Điều này xảy ra do lời nhắc của bạn thiếu ngữ cảnh cụ thể về tình huống. Hãy thử thêm chi tiết về đối tượng, vai trò hoặc các hạn chế. Ví dụ, thay vì nói “Hãy viết một email về việc dự án bị chậm trễ”, hãy thử: “Hãy viết email gửi cho khách hàng doanh nghiệp giải thích rằng việc tích hợp phần mềm sẽ bị chậm hai tuần. Họ đã kiên nhẫn nhưng đây là lần trì hoãn thứ hai. Hãy giữ giọng văn chuyên nghiệp nhưng hối lỗi”.
  • Phản hồi quá dài hoặc quá ngắn: Claude đang tự đoán độ dài phù hợp. Hãy nêu rõ yêu cầu: “Cho tôi một bản tóm tắt gồm hai đoạn văn”, “Giữ nội dung dưới 100 từ” hoặc “Tôi cần một bản phân tích toàn diện—độ dài không thành vấn đề”.
  • Claude không tuân thủ định dạng: Claude có thể hiểu bạn muốn gì nhưng không hiểu cách trình bày. Hãy áp dụng phương pháp “Show, don’t just tell” (Cho xem thay vì chỉ nói). Cung cấp một ví dụ về định dạng hoặc mô tả cấu trúc rõ ràng: “Sử dụng các dấu đầu dòng với tiêu đề in đậm cho mỗi phần”.
  • Thông tin nghe có vẻ thuyết phục nhưng lại sai: Claude thỉnh thoảng tạo ra thông tin nghe có vẻ hợp lý nhưng không chính xác, đặc biệt là với các sự thật cụ thể hoặc chủ đề ngách. Đối với các công việc quan trọng, hãy xác minh các sự thật chính một cách độc lập. Bạn có thể yêu cầu Claude trích dẫn nguồn hoặc chỉ ra mức độ tin cậy, đồng thời bật tính năng tìm kiếm web để đối chiếu với thông tin hiện tại.
  • Giọng điệu không phù hợp: Claude mặc định sử dụng giọng văn hữu ích và chuyên nghiệp, điều này có thể không khớp với nhu cầu của bạn. Hãy mô tả giọng điệu bằng ngôn ngữ thông thường: “Hãy làm cho nội dung này mang tính đối thoại hơn” hoặc “Nội dung này cần nghe có vẻ uy quyền và trang trọng”. Bạn cũng có thể cung cấp một ví dụ về phong cách viết mà bạn mong muốn.

Tư duy lặp lại

Một trong những thay đổi quan trọng nhất khi làm việc với Claude là nhận ra rằng lời nhắc đầu tiên hiếm khi tạo ra kết quả hoàn hảo. Hãy coi lời nhắc ban đầu là sự bắt đầu của một cuộc trò chuyện thay vì một yêu cầu duy nhất. Những người dùng Claude hiệu quả thường:

  • Coi bản thảo đầu tiên là điểm bắt đầu. Họ xem xét kết quả, xác định cái gì hiệu quả và cái gì không, sau đó tinh chỉnh.
  • Đưa ra phản hồi cụ thể. “Hãy viết ngắn lại” thì cũng ổn, nhưng “Hãy cắt bỏ hai đoạn đầu và làm cho phần kết luận mang tính định hướng hành động hơn” sẽ tốt hơn.
  • Biết khi nào nên bắt đầu lại từ đầu. Nếu cuộc trò chuyện đã đi chệch hướng, đôi khi mở một cuộc trò chuyện mới với lời nhắc rõ ràng hơn sẽ nhanh hơn là cố gắng điều chỉnh lại.

Năng lực AI (AI Fluency) là gì?

Năng lực AI là khả năng cộng tác hiệu quả với các công cụ AI—không chỉ là biết nhấp vào nút nào mà còn phát triển tư duy phán đoán để sử dụng AI tốt trong các tình huống khác nhau. Khung năng lực 4D bao gồm bốn năng lực cốt lõi:

  • Delegation (Ủy thác): Quyết định việc gì nên do con người làm, việc gì nên giao cho AI và cách phân bổ nhiệm vụ. Điều này bao gồm việc hiểu mục tiêu của bạn, khả năng của AI và đưa ra các lựa chọn chiến lược về sự cộng tác.
  • Description (Mô tả): Giao tiếp hiệu quả với hệ thống AI, bao gồm việc xác định rõ ràng đầu ra, hướng dẫn quy trình và chỉ định các hành vi cũng như tương tác mong muốn của AI.
  • Discernment (Sáng suốt): Đánh giá một cách chu đáo và phản biện các đầu ra, quy trình, hành vi và tương tác của AI. Điều này bao gồm việc đánh giá chất lượng, độ chính xác, tính phù hợp và xác định các lĩnh vực cần cải thiện.
  • Diligence (Sự cần mẫn): Sử dụng AI một cách có trách nhiệm và đạo đức. Bao gồm việc đưa ra các lựa chọn thấu đáo về hệ thống AI, duy trì tính minh bạch và chịu trách nhiệm về các công việc có sự hỗ trợ của AI.

Đánh giá Claude cho quy trình làm việc của bạn (Evals)

Khi bắt đầu tích hợp Claude sâu hơn, bạn có thể tự hỏi: làm thế nào để biết Claude thực sự giỏi ở một nhiệm vụ cụ thể? Đây là lúc năng lực “Sáng suốt” trở nên thiết yếu. Evals (viết tắt của evaluations - đánh giá) là các cách có hệ thống để kiểm tra xem Claude hoạt động tốt như thế nào đối với các loại nhiệm vụ cụ thể quan trọng với bạn.

Việc chạy các bài đánh giá đơn giản giúp bạn:

  • Hiểu nơi Claude mang lại nhiều giá trị nhất trong quy trình làm việc của bạn.
  • Xác định các nhiệm vụ cần thêm ngữ cảnh hoặc ví dụ.
  • Xây dựng sự tự tin vào kết quả của Claude cho các nhiệm vụ lặp lại.

Phương pháp đánh giá đơn giản:

  1. Thu thập ví dụ: Tập hợp 5-10 ví dụ về một nhiệm vụ bạn làm thường xuyên (email, báo cáo, phân tích).
  2. Tạo lời nhắc kiểm tra: Viết các lời nhắc để tạo ra các đầu ra tương tự, bao gồm cả ngữ cảnh bạn thường có khi làm việc này.
  3. So sánh kết quả: Chạy các lời nhắc và so sánh phản hồi của Claude với các ví dụ thực tế của bạn. Hãy tự hỏi: Claude có nắm bắt được thông tin chính không? Giọng điệu có phù hợp không? Cái gì còn thiếu hoặc cần cải thiện?
  4. Tinh chỉnh phương pháp: Dựa trên những gì học được, hãy điều chỉnh lời nhắc, thêm ví dụ để cho Claude thấy thế nào là “tốt”, hoặc xác định nơi nào nhất thiết cần con người xem xét lại.

Ví dụ thực tế: Vòng lặp Ủy thác và Cần mẫn

Hãy xem xét ví dụ về Rio, giám đốc chương trình tại một tổ chức dịch vụ dành cho cựu chiến binh. Rio cần phân tích tỷ lệ tham gia chương trình và kết quả việc làm hàng quý, một công việc thường tiêu tốn của ông nhiều giờ đồng hồ.

Rio sử dụng dữ liệu của quý trước—thứ mà ông đã biết rõ kết quả—để làm trường hợp kiểm tra (test case). Ông tải dữ liệu thô chưa qua xử lý lên và làm việc với Claude để tái hiện lại các phân tích cũ. Mỗi khi AI phản hồi, Rio đối chiếu với kết quả thực tế và ghi lại các lỗ hổng trong lập luận của AI.

  • Trong lần thử đầu tiên, Rio yêu cầu phân tích mô hình tham gia và vẽ biểu đồ tương quan. Claude xác định đúng mối tương quan giữa việc tham gia và tìm việc nhưng lại bỏ lỡ một hiểu biết quan trọng về chương trình hỗ trợ nhà ở kết hợp.
  • Rio tinh chỉnh phần mô tả, yêu cầu Claude chú ý đặc biệt đến loại chương trình. Lần này Claude đã bắt được lỗi. Rio ghi chú lại rằng trong tương lai, ông cần yêu cầu AI xem xét loại chương trình ngay từ đầu.
  • Rio tiếp tục thử thách khó hơn bằng cách yêu cầu phân tích dựa trên thời điểm người tham gia đăng ký. Ông nhận thấy dù AI không biết dữ liệu đăng ký nhưng nó có thể giúp trích xuất chúng.

Bằng cách này, Rio đã xác thực một cách hệ thống những gì AI có thể và không thể làm. Ông học được rằng với mô tả đúng, AI có thể tái hiện chính xác các phân tích cũ, nhưng cũng nhận ra giới hạn: AI cần ngày đăng ký rõ ràng để phân tích nhóm (cohort analysis), nếu không nó sẽ tự suy diễn sai. Giờ đây ông làm việc với sự tự tin đã được xác thực chứ không phải đoán mò.

Khung làm việc cho các nhiệm vụ phân tích

Để xây dựng sự tự tin khi ủy thác các nhiệm vụ phân tích cho AI, bạn có thể áp dụng quy trình sau:

  1. Xác định nhiệm vụ cụ thể mà bạn muốn ủy thác và nêu chính xác yêu cầu.
  2. Tìm dữ liệu cũ mà bạn đã hoàn thành phân tích để có câu trả lời đúng nhằm đánh giá AI.
  3. Làm việc với AI để tái hiện phân tích cũ và đánh giá một cách hệ thống: AI đã tạo ra gì? Cách tiếp cận ra sao? Cách truyền đạt kết quả như thế nào?
  4. Xác định lỗ hổng, tinh chỉnh việc ủy thác và kiểm tra lại. Nếu sau nhiều lần tinh chỉnh mà AI vẫn không cho kết quả đúng, bạn sẽ biết rằng đây không phải là nhiệm vụ nên ủy thác.

Nếu bạn không thành thạo về dữ liệu

Ngay cả khi bạn không giỏi về dữ liệu để tự mình phát hiện ra các lỗ hổng quy trình, AI vẫn có thể là công cụ hữu ích để động não và triển khai các giải pháp. Vì các mô hình AI rất giỏi lập trình, chúng có thể giúp viết công thức Excel, định dạng lại dữ liệu lộn xộn và nhiều việc khác.

Trong những trường hợp này, bạn có thể đưa câu hỏi hoặc ý tưởng của mình cho AI và yêu cầu nó giúp hiểu một giải pháp có thể trông như thế nào, giống như cách bạn làm việc với một chuyên gia phân tích dữ liệu trong nhóm. Hãy liên tục yêu cầu giải thích rõ ràng để bạn có thể theo dõi quy trình và hiểu đầu ra cuối cùng. Hãy nhớ rằng: việc xác nhận giúp xây dựng sự tự tin, nhưng nó không loại bỏ trách nhiệm. Bạn vẫn là người chịu trách nhiệm cuối cùng trong việc kiểm tra xem các kết quả có hợp lý không và minh bạch về vai trò của AI.

Resumed conversation: 83515854-abd2-450c-96a2-214402b8dd47

Video

Câu hỏi ôn tập

  • Which of the common challenges have you already encountered? What techniques might you try next time?
  • Where in your work would a simple eval help you understand if Claude is a good fit for a recurring task?
  • How might the 4D Framework help you think about your collaboration with Claude?

Tóm tắt

Nguồn tài liệu này hướng dẫn người dùng tối ưu hóa hiệu quả khi làm việc với trí tuệ nhân tạo thông qua khái niệm AI Fluency (Sự thông thạo AI) và mô hình 4D Framework bao gồm: Ủy thác, Mô tả, Nhận thức và Cần mẫn. Văn bản nhấn mạnh rằng việc tương tác với AI là một quá trình lặp đi lặp lại, nơi người dùng cần chủ động giải quyết các thách thức phổ biến như phản hồi quá chung chung hoặc sai lệch thông tin bằng cách cung cấp ngữ cảnh chi tiết và ví dụ cụ thể. Để xây dựng niềm tin và sự chính xác, tác giả đề xuất phương pháp thiết lập hệ thống đánh giá (evals), trong đó người dùng so sánh kết quả của AI với các dữ liệu thực tế đã biết trước khi áp dụng vào quy trình công việc mới. Mục tiêu cuối cùng của tài liệu là giúp người dùng phát triển tư duy cộng tác chiến lược, biết cách kiểm chứng năng lực của mô hình để sử dụng AI một cách có trách nhiệm và tự tin trong các tác vụ phức tạp như phân tích dữ liệu.

Từ khóa: Khắc phục lỗi Prompt · Khái niệm AI Fluency · Khung năng lực 4D · Đánh giá hệ thống (Evals) · Quy trình ủy thác dữ liệu

Câu hỏi kiểm tra

1. Mục đích chính của việc tham gia các khóa học tại Anthropic Academy là gì?

2. Khi Claude đưa ra câu trả lời quá chung chung, kỹ thuật nào sau đây được khuyến khích sử dụng?

3. Trong khung năng lực 4D về sự thông thạo AI (AI Fluency), 'Delegation' (Ủy thác) được định nghĩa như thế nào?

4. Để đảm bảo Claude tuân thủ một định dạng (format) cụ thể, phương pháp 'Show, don't just tell' có nghĩa là gì?

5. Khái niệm 'Evals' (Đánh giá) trong quy trình làm việc với Claude có vai trò gì?

6. Trong ví dụ về Rio, tại sao anh ấy lại sử dụng dữ liệu cũ của quý trước để kiểm tra AI?

7. Theo tài liệu, người dùng nên làm gì nếu kết quả từ AI có vẻ rất tự tin nhưng lại sai lệch thông tin?

8. Lợi ích của 'tư duy lặp lại' (iteration mindset) khi làm việc với Claude là gì?

9. Năng lực 'Discernment' (Nhận thức/Phán đoán) trong AI Fluency yêu cầu người dùng thực hiện điều gì?

10. Nếu một cuộc hội thoại với Claude đã đi chệch hướng quá xa, lời khuyên nào sau đây là phù hợp nhất?

Thẻ học

1 / 25
Khi phản hồi của Claude quá chung chung, người dùng nên bổ sung chi tiết nào vào câu lệnh để cải thiện?
Bổ sung thông tin về đối tượng khán giả, vai trò hoặc các hạn chế cụ thể.

Nhấn thẻ để lật · Dùng nút để điều hướng

Nhớ: 0 / 25

Sơ đồ tư duy

Tài nguyên Học tập Anthropic
  • Anthropic Academy
    • Khóa học nổi bật
      • Claude 101
      • Claude Code thực tế
      • Phát triển API
      • Giao thức bối cảnh mô hình
    • Mục tiêu học tập
      • Xây dựng ứng dụng với Claude
      • Tối ưu năng suất công việc
      • Sử dụng cho mục đích cá nhân
  • Khung năng lực AI Fluency (4D)
    • Delegation (Ủy thác): Phân chia việc người và AI
    • Description (Mô tả): Giao tiếp và định hướng đầu ra
    • Discernment (Nhận thức): Đánh giá chất lượng và độ chính xác
    • Diligence (Siêng năng): Sử dụng trách nhiệm và đạo đức
  • Khắc phục thử thách thường gặp
    • Câu trả lời chung chung
      • Thêm bối cảnh, vai trò và giới hạn
    • Độ dài không phù hợp
      • Yêu cầu rõ số từ hoặc đoạn văn
    • Không tuân thủ định dạng
      • Cung cấp ví dụ cụ thể (Few-shot)
    • Thông tin sai lệch (Hallucination)
      • Xác minh độc lập và bật tìm kiếm web
  • Quy trình Đánh giá (Evals)
    • Thu thập ví dụ thực tế
    • Tạo lời nhắc thử nghiệm
    • So sánh kết quả Claude với thực tế
    • Tinh chỉnh lời nhắc và dữ liệu
  • Sản phẩm & Mô hình
    • Mô hình Claude
      • Opus
      • Sonnet
      • Haiku
    • Công cụ
      • Claude Code
      • Claude for Chrome/Slack/M365
      • Claude Desktop App

Tài liệu liên quan


Link Nguồn