Best practices for working safely

Vai trò của bạn trong việc làm việc an toàn với Cowork

Bạn đã biết rằng theo mặc định, Claude luôn hỏi ý kiến bạn trước khi xóa và trước khi gửi hoặc chia sẻ nội dung. Đó là mức độ bảo vệ cơ bản. Bài học này tập trung vào những gì bạn cần thực hiện thêm—đó là các bước chủ động để ngăn chặn một công cụ tự trị có quyền truy cập vào tệp, ứng dụng và trình kết nối thực hiện những điều bạn không mong muốn.

Thiết lập để sai sót không ảnh hưởng đến dữ liệu quan trọng

Hành động có tác động lớn nhất chính là thư mục mà bạn chỉ định cho Claude. Đây là ranh giới xác định những gì Claude có thể đọc, viết và (với sự xác nhận của bạn) xóa. Bạn nên sử dụng một thư mục làm việc chuyên dụng thay vì một thư mục chung. Việc chỉ định Claude vào các thư mục như Documents (Tài liệu), Downloads (Tải xuống) hoặc Desktop (Màn hình chính) cũng tương tự như việc cho phép một đồng nghiệp mới lục lọi mọi tệp tin bạn có. Hãy tạo một thư mục riêng cho công việc, di chuyển hoặc sao chép những gì cần thiết vào đó, rồi mới chỉ định Claude làm việc tại đó.

Hãy sao lưu mọi thứ không thể thay thế trước khi bắt đầu. Nếu một tệp tin là quan trọng và không thể tạo lại bản mới—chẳng hạn như các sản phẩm bàn giao cho khách hàng cũ, hợp đồng không thể cấp lại, hoặc bất cứ thứ gì bạn sẽ hối tiếc nếu mất đi—hãy đảm bảo một bản sao của chúng nằm ở nơi Cowork không thể chạm tới như: sao lưu đám mây, một thư mục riêng biệt, hoặc một ổ đĩa không kết nối. Mặc dù Claude sẽ không xóa mà không hỏi, nhưng cái giá của việc vô tình nhấp chuột xác nhận sai chính là việc mất tệp tin đó.

Ngoài ra, hãy thử nghiệm các quy trình làm việc mới trên các bản sao trước. Ví dụ, nếu bạn đang xây dựng một tác vụ định kỳ sẽ chạy vào mỗi thứ Sáu, lần chạy đầu tiên nên thực hiện với một bản sao của dữ liệu. Sau khi bạn đã thấy nó hoạt động đúng như mong đợi, lúc đó mới chỉ định nó vào thư mục dữ liệu thực tế.

Viết lời nhắc không để lại sơ hở cho các hành động sai

Cách bạn yêu cầu cũng quan trọng như thư mục bạn chỉ định. Hãy cực kỳ cụ thể về các động từ mang tính chất thay đổi hoặc xóa bỏ dữ liệu. Từ “Cắt” (Cut) một phần nội dung có thể được hiểu là “xóa khỏi tầm nhìn” hoặc “xóa hẳn khỏi tệp”. Từ “Cập nhật tệp” (Update the file) có thể có nghĩa là “viết lại toàn bộ” hoặc chỉ là “thêm nội dung vào đó”. Nếu một cách hiểu sai có thể dẫn đến hậu quả không thể phục hồi, hãy gọi tên chính xác hành động bạn muốn: “Loại bỏ phần này khỏi bản thảo, nhưng vẫn giữ lại tệp” hoặc “Thêm một phụ lục mới; đừng viết lại các phần hiện có”.

Hãy xác định rõ các ranh giới ngay trong lời nhắc. Ví dụ: “Chỉ thực hiện với 3 tệp được cập nhật gần đây nhất trong thư mục này”, “Chỉ xử lý các hợp đồng đã chốt trong Quý 3”, hoặc “Đừng nhắn tin cho bất kỳ ai — chỉ tạo bản thảo thôi”. Việc này giúp thu hẹp phạm vi hoạt động của Cowork và giúp bạn dễ dàng phát hiện nếu công cụ thực hiện sai hướng.

Đối với các tác vụ định kỳ, hãy ưu tiên yêu cầu tạo bản thảo trước. Vì các tác vụ này chạy khi bạn không trực tiếp quan sát, nên cho đến khi bạn hoàn toàn tin tưởng rằng tác vụ chạy đúng như ý muốn, hãy nhắc Claude tạo bản thảo để bạn xem xét thay vì để nó tự động gửi đi thay mặt bạn.

Ba bước kiểm tra tức thì để ngăn chặn rủi ro

Đầu tiên, hãy đọc kế hoạch sau khi nó được lập. Khi Claude bắt đầu một tác vụ, nó sẽ trình bày những gì định làm trong tab tiến trình. Bạn nên đọc lướt qua để cân nhắc xem: kế hoạch có hợp lý không? các bước có đúng thứ tự không? và nó có đang sử dụng đúng nguồn dữ liệu hay không? Hãy điều chỉnh ngay nếu thấy cần thiết.

Thứ hai, hãy theo dõi các mẫu bất thường. Bạn không cần phải xác nhận mọi câu lệnh, nhưng nếu Claude chạm vào các tệp hoặc trang web mà bạn không hề đề cập, hoặc phạm vi công việc đang mở rộng quá mức so với yêu cầu, hãy dừng tác vụ đó ngay. Cảm giác “có gì đó không ổn” là một tín hiệu quan trọng mà bạn cần chú ý.

Thứ ba, hãy phê duyệt các thông báo xác nhận một cách thận trọng. Hãy duy trì chế độ “Hỏi trước khi thực hiện” (Ask before acting) cho bất kỳ hành động nào liên quan đến việc gửi, đăng hoặc chia sẻ nội dung. Khi thông báo xác nhận xuất hiện, hãy đọc kỹ nó. Hầu hết các sai lầm xảy ra không phải vì các biện pháp bảo vệ thất bại, mà vì người dùng đã nhấp chuột qua một xác nhận cho một hành động không hoàn toàn đúng như ý định của họ. Các hộp thoại này tồn tại vì hành động đó thực sự quan trọng.

Khi nào Cowork không phải là công cụ phù hợp

Có một danh sách ngắn các trường hợp bạn không nên sử dụng Cowork:

  • Các quy trình làm việc có tính quy định cao: Những việc cần nhật ký kiểm tra (audit trail) chi tiết, vì hoạt động của Cowork hiện không được ghi lại trong nhật ký kiểm tra, Compliance API hoặc xuất dữ liệu.
  • Các việc bạn không tin tưởng giao cho đồng nghiệp làm mà không giám sát: Ví dụ như gửi tài liệu pháp lý cho đối tác, đăng thông báo công khai cho công chúng, hoặc đẩy một thay đổi trực tiếp đến khách hàng. Claude có thể chuẩn bị nội dung, nhưng bạn phải là người thực hiện bước cuối cùng.
  • Dữ liệu cá nhân cực kỳ nhạy cảm: Bất kỳ thông tin nào nằm ngoài ranh giới mà nhóm CNTT của bạn đã phê duyệt rõ ràng.

Nhận diện các mối nguy hại tiềm ẩn (Ví dụ minh họa)

Trong một tình huống giả định, một tác vụ được thiết lập như sau: Sử dụng các trình kết nối Microsoft 365 và Asana để “Dọn dẹp các tệp khách hàng của quý trước — lưu trữ những thứ cũ và đăng một ghi chú vào kênh Slack của mỗi khách hàng rằng thư mục của họ đã được dọn dẹp”. Tác vụ này được lên lịch chạy vào mỗi 5 giờ chiều Thứ Sáu tại thư mục ~/Documents/Work.

Năm điểm rủi ro khiến một người cẩn thận phải cân nhắc lại trong ví dụ này bao gồm:

  1. Thư mục quá rộng: Sử dụng thư mục ~/Documents/Work thay vì một thư mục cụ thể cho dự án.
  2. Động từ không rõ ràng: Sử dụng từ “Dọn dẹp” (Clean up) dễ gây hiểu lầm.
  3. Đối tượng không xác định: Cụm từ “những thứ cũ” (old stuff) không có tiêu chuẩn cụ thể để lọc.
  4. Tự động gửi thông báo: Đăng ghi chú vào Slack của khách hàng một cách tự động mà không có bước xem xét lại.
  5. Chạy tự động trên dữ liệu thực: Lên lịch chạy định kỳ hàng tuần mà không qua kiểm tra bản thảo trước.

Resumed conversation: 1f9f93f9-2883-4f13-85db-d28382e6c119

Câu hỏi ôn tập

  • Which folder would you point Claude at — and is there anything inside it that shouldn't be reachable, or anything irreplaceable that needs to be backed up first?
  • Is there a destructive verb in the prompt you'd write that you'd want to be more specific about?

Tóm tắt

Tài liệu này cung cấp các hướng dẫn thiết yếu để thiết lập ranh giới an toàn khi sử dụng các công cụ trí tuệ nhân tạo tự trị có khả năng truy cập tệp tin và ứng dụng. Nội dung nhấn mạnh tầm quan trọng của việc cô lập môi trường làm việc bằng cách chỉ định các thư mục riêng biệt và sao lưu dữ liệu quan trọng nhằm ngăn chặn các thao tác xóa nhầm không thể khôi phục. Người dùng được khuyến khích sử dụng ngôn từ chính xác và cụ thể trong các câu lệnh để tránh sự mơ hồ, đồng thời phải luôn duy trì vai trò giám sát thông qua việc kiểm chứng các kế hoạch hành động và phê duyệt các yêu cầu xác nhận một cách cẩn trọng. Mục tiêu cốt lõi của văn bản là chuyển đổi tư duy từ vận hành tốc độ sang việc ưu tiên tính kiểm soát, đảm bảo rằng AI đóng vai trò như một cộng sự hỗ trợ chuẩn bị thay vì là thực thể duy nhất thực hiện các quyết định có tính rủi ro cao.

Từ khóa: Thiết lập thư mục · Sao lưu dữ liệu · Kỹ thuật viết prompt · Kiểm tra kế hoạch · Quy trình làm việc

Câu hỏi kiểm tra

1. Khi hoàn thành các khóa học tại Anthropic Academy, người học có thể nhận được gì để xác nhận kết quả học tập của mình?

2. Hành động nào được coi là biện pháp then chốt nhất để bảo vệ dữ liệu cá nhân khi cấp quyền truy cập tệp cho Claude Cowork?

3. Trong chế độ "Act without asking" (Hành động không cần hỏi), rủi ro lớn nhất mà người dùng phải đối mặt là gì?

4. Đặc điểm nào của tính năng "Computer use" (Sử dụng máy tính) khiến nó tiềm ẩn nhiều rủi ro hơn so với việc thực thi mã thông thường?

5. Tại sao việc sử dụng các động từ cụ thể trong lời nhắc (prompt) lại quan trọng đối với sự an toàn của dữ liệu?

6. Khi thiết lập một tác vụ lập lịch (scheduled task) mới, bước kiểm tra an toàn nào được khuyến nghị thực hiện đầu tiên?

7. Thông tin nào sau đây về việc lưu trữ hoạt động của Cowork là chính xác?

8. Claude thực hiện biện pháp an toàn nào trước khi thực hiện hành động xóa tệp vĩnh viễn?

9. Điều gì mô tả đúng nhất về trách nhiệm của người dùng khi sử dụng các tác tử AI như Claude Cowork?

10. Khi sử dụng Claude for Excel kết hợp với Cowork, rủi ro về luồng dữ liệu (data flow) nào cần lưu ý?

Thẻ học

1 / 17
Claude Cowork là gì?
Là tính năng cho phép Claude truy cập và làm việc trực tiếp trên máy tính, tệp tin, trình duyệt và các ứng dụng của người dùng.

Nhấn thẻ để lật · Dùng nút để điều hướng

Nhớ: 0 / 17

Sơ đồ tư duy

Hệ sinh thái Anthropic & Claude
  • Anthropic Academy
    • Khóa học nổi bật
      • Claude 101
      • Claude Code in action
      • Cowork 101
      • AI Fluency
    • Tài nguyên học tập
      • Hướng dẫn API
      • Thực hành triển khai doanh nghiệp
      • Bản tin AI Fluency
  • Sản phẩm & Mô hình
    • Các dòng mô hình
      • Opus
      • Sonnet
      • Haiku
      • Mythos preview
    • Công cụ & Ứng dụng
      • Claude Code
      • Claude Cowork
      • Claude for Chrome/Slack/M365
      • Bản Desktop (macOS/Windows)
  • Claude Cowork & An toàn
    • Biện pháp bảo vệ
      • Đào tạo mô hình (RL)
      • Bộ phân loại nội dung
      • Xác nhận quyền xóa file
      • Yêu cầu quyền truy cập ứng dụng
    • Thực hành an toàn
      • Sử dụng thư mục làm việc riêng
      • Sao lưu dữ liệu quan trọng
      • Kiểm tra kỹ kế hoạch hành động
      • Hạn chế quyền Act without asking
    • Rủi ro cần lưu ý
      • Tấn công Prompt Injection
      • Dữ liệu nhạy cảm
      • Tự động hóa tác vụ định kỳ
  • Nền tảng & Giải pháp
    • Đối tác đám mây
      • Amazon Bedrock
      • Google Cloud Vertex AI
      • Microsoft Foundry
    • Lĩnh vực giải pháp
      • Đại lý AI (AI Agents)
      • Hiện đại hóa mã nguồn
      • Dịch vụ tài chính & Y tế
      • Chính phủ & Phi lợi nhuận
  • Công ty & Chính sách
    • Hiến pháp Claude
    • Chính sách mở rộng có trách nhiệm
    • Quyền riêng tư & Tuân thủ
    • Nghiên cứu kinh tế tương lai

Tài liệu liên quan


Link Nguồn