LINK-V · Bài viết

AI Agent biết hết mật khẩu của bạn. Chúng đi đâu?

AI agent rất hữu ích. Bạn giao cho nó một việc, nó tự đi làm: đọc file của bạn, đăng nhập vào tài khoản, xử lý mọi thứ trong khi bạn làm chuyện khác.

Để làm được vậy, nó cần quyền truy cập. Mật khẩu email. Thông tin đăng nhập tài khoản. API key. Và để thực sự hoạt động, nó cần nhìn thấy dữ liệu của bạn. Hợp đồng, thông tin khách hàng, địa chỉ, cái NDA mà bạn đang bị ràng buộc, những thứ bạn không bao giờ đăng công khai.

Câu hỏi gần như chẳng ai đặt ra lại đơn giản vô cùng. Tất cả những thứ đó đi đâu?

Đi thẳng vào model

Hầu hết AI agent lấy bất cứ thứ gì chúng cần rồi nhét hết vào language model. Đó là cách chúng hoạt động. Model đọc nhiệm vụ, đọc file, đọc ngữ cảnh, và đúng vậy, thường đọc cả thông tin đăng nhập.

Nghĩa là mật khẩu của bạn không nằm yên trên máy tính. Nó chạy qua internet đến nhà cung cấp model, nằm trong hệ thống của họ, và đi qua không biết bao nhiêu server trên đường đi. Hợp đồng bạn vừa upload, danh sách khách hàng, tài liệu mật, cái địa chỉ nhà trong email kia cũng vậy.

Bạn gõ nó một lần. Giờ nó nằm ở đâu đó bạn không thấy được, dưới những điều khoản thay đổi mỗi tháng, trên hạ tầng bạn không kiểm soát.

"Đã xóa" không có nghĩa là đã xóa

Người ta nghĩ rằng xong việc thì dữ liệu cũng biến mất. Không hề. Bạn chỉ không nhìn thấy nó nữa thôi.

Các nhà cung cấp giữ log. Những cuộc trò chuyện với AI bị lưu lại để rà soát an toàn, phát hiện lạm dụng, đôi khi để huấn luyện, và thậm chí có người thật đọc chúng. Câu "Chúng tôi không huấn luyện trên dữ liệu của bạn" thường có dấu hoa thị đi kèm, và kể cả khi đó là sự thật, dữ liệu vẫn đã đi qua và được lưu lại dọc đường. Bạn không có cách nào thực sự để xác nhận thứ gì đã được giữ lại và giữ trong bao lâu.

Với một câu hỏi tào lao thì không sao. Nhưng với một mật khẩu, một NDA đã ký, thông tin cá nhân của khách hàng, đó là vùng nguy hiểm. Thông tin mà bạn chịu trách nhiệm pháp lý phải bảo vệ thì không nên nằm trong một hộp đen mà bạn không thể kiểm tra.

Cái NDA mà bạn vừa vi phạm

Đây là phần khiến nhiều người sập bẫy. Nếu bạn đang chịu NDA, hoặc bạn nắm dữ liệu khách hàng theo GDPR, thì việc nhét thứ đó vào một model bên thứ ba có thể tự nó đã là vi phạm - bạn vừa trao thông tin được bảo vệ cho một bên chưa bao giờ được phép nhận. Rồi hệ thống bị hack và toàn bộ thông tin lộ ra ngoài.

Hầu hết người làm chuyện này không hề biết mình đang làm vậy. Cái agent khiến mọi thứ quá dễ dàng, còn áp lực xã hội thì khiến bạn cảm thấy mình đang làm sai nếu không bỏ hết mọi thứ vào.

Có một cách làm cẩn thận hơn

Một agent không nhất thiết phải hoạt động như vậy. Nó có thể làm xong việc mà không rải bí mật của bạn khắp internet.

Agent chẳng qua là cái tên hoa mỹ cho phần mềm có tính xác định (deterministic) - những chương trình và ứng dụng vốn đã luôn tồn tại, và nó chỉ làm đúng những gì được bảo.

Mật khẩu và key của bạn có thể nằm yên ở một nơi an toàn duy nhất để agent dùng mà language model không bao giờ nhìn thấy chúng. Agent đăng nhập, hành động thay bạn, làm xong việc, còn bản thân bí mật thì không bao giờ chạy đến model. Dữ liệu của bạn được mã hóa, có chủ đích rõ ràng về thứ gì thực sự cần rời khỏi máy bạn và thứ gì không. Và công việc của bạn không bao giờ trở thành dữ liệu huấn luyện.

Đây chính là lý do chúng tôi xây dựng Grace AI theo cách như vậy. Agent chạy trên stack của riêng chúng tôi, từ trên xuống dưới, với một Vault giữ bí mật của bạn để model có thể hành động thông qua chúng mà không cần đọc chúng. Dữ liệu của bạn là của bạn. Nó không đi lang thang đâu cả.

Bạn có được một agent làm việc thật sự mà không liều lĩnh với những thứ bạn có trách nhiệm phải bảo vệ.

Mã hóa RSA, ranh giới cứng và Vault giờ quan trọng hơn bao giờ hết trong thời đại AI.

Đi thẳng vào model

"Đã xóa" không có nghĩa là đã xóa

Cái NDA mà bạn vừa vi phạm

Có một cách làm cẩn thận hơn

Đừng phải đi tìm tin của chúng tôi. Chúng tôi giao tận cửa.