OpenAI có được giới thiệu Nhà điều hành, một tác nhân hỗ trợ AI được thiết kế để hoàn thành các nhiệm vụ dựa trên web một cách tự động. Sử dụng trình duyệt tích hợp, Người vận hành có thể tương tác với các trang web bằng cách gõ, nhấp và cuộn, đơn giản hóa nhiều tác vụ lặp đi lặp lại cho người dùng.
Toán tử là gì?
Operator là một trong những “đại lý” đầu tiên của OpenAI, các công cụ AI có khả năng thực hiện các tác vụ một cách độc lập dựa trên hướng dẫn của người dùng. Hiện đang trong giai đoạn xem trước nghiên cứu, Toán tử được thiết kế để phát triển thông qua phản hồi của người dùng. Theo OpenAI, nó có thể xử lý các tác vụ như điền biểu mẫu, đặt hàng tạp hóa và thậm chí tạo meme.
OpenAI giải thích: “Người vận hành có thể sử dụng cùng các giao diện mà mọi người tương tác hàng ngày, giúp tiết kiệm thời gian và nâng cao cơ hội tương tác kỹ thuật số”.
Cách thức hoạt động của nhà điều hành
Nhà điều hành được hỗ trợ bởi một mô hình mới có tên là Tác nhân sử dụng máy tính (CUA), tích hợp khả năng thị giác của GPT-4 với khả năng suy luận nâng cao thông qua học tập tăng cường. CUA cho phép Người vận hành tương tác với giao diện đồ họa người dùng (GUI), chẳng hạn như nút, menu và trường văn bản, bằng cách phân tích ảnh chụp màn hình và thực hiện các hành động như người dùng.
Khi Người vận hành gặp thử thách, nó sẽ sử dụng lý luận để tự sửa chữa. Đối với các tình huống phức tạp hơn, nó sẽ trao lại quyền kiểm soát cho người dùng, mang lại trải nghiệm hợp tác. Nhà điều hành đã đạt được kết quả điểm chuẩn tiên tiến trong WebArena và WebVoyager, các bài kiểm tra chính về hiệu suất tác vụ dựa trên trình duyệt.
Các tính năng chính
- Tự động hóa tác vụ: Tự động hóa các tác vụ lặp đi lặp lại như đặt hàng tạp hóa, điền biểu mẫu và đặt dịch vụ.
- Đa tác vụ: Xử lý đồng thời nhiều tác vụ, chẳng hạn như đặt vé máy bay trong khi mua sắm trực tuyến.
- Tùy chỉnh: Thêm hướng dẫn được cá nhân hóa cho các trang web hoặc quy trình công việc cụ thể.
- Lưu lời nhắc: Lưu các lời nhắc được sử dụng thường xuyên để truy cập nhanh chóng và dễ dàng.
- Chế độ tiếp quản: Tạm dừng và chuyển quyền kiểm soát cho người dùng đối với các tác vụ nhạy cảm, chẳng hạn như nhập chi tiết thanh toán hoặc thông tin đăng nhập.
An toàn và quyền riêng tư
OpenAI đã ưu tiên sự an toàn và quyền riêng tư trong Nhà điều hành, triển khai nhiều biện pháp bảo vệ để đảm bảo việc sử dụng an toàn:
- Giám sát nhiệm vụ: Người vận hành yêu cầu xác nhận của người dùng trước khi hoàn thành các hành động quan trọng.
- Xử lý dữ liệu nhạy cảm: Người dùng được nhắc đảm nhận các tác vụ liên quan đến thông tin nhạy cảm, như mật khẩu hoặc chi tiết thanh toán.
- Quản lý quyền riêng tư dữ liệu: Dữ liệu duyệt web có thể bị xóa và cài đặt quyền riêng tư có thể được quản lý chỉ bằng một cú nhấp chuột.
- Phát hiện mối đe dọa: Người vận hành được trang bị để phát hiện và tránh các nỗ lực lừa đảo, mã độc và lời nhắc ẩn.
Mặc dù Operator được thiết kế với các biện pháp bảo vệ mạnh mẽ nhưng OpenAI thừa nhận đây vẫn là bản xem trước nghiên cứu và có thể gặp phải những hạn chế.
Hạn chế và kế hoạch tương lai
Nhà điều hành đang ở giai đoạn đầu và có thể phải đối mặt với những thách thức với các tác vụ liên quan đến giao diện phức tạp, chẳng hạn như tạo trình chiếu hoặc quản lý lịch. OpenAI đã vạch ra kế hoạch tương lai của mình:
- API mô hình CUA: OpenAI có kế hoạch phát hành mô hình CUA thông qua API, cho phép các nhà phát triển tạo tác nhân của riêng họ.
- Xử lý quy trình công việc nâng cao: Đang tiến hành cải tiến để cho phép Người vận hành quản lý các quy trình công việc phức tạp hơn.
- Tính khả dụng rộng hơn: Sau khi được tinh chỉnh, Nhà điều hành sẽ có sẵn cho người dùng Plus, Team và Enterprise, với các kế hoạch tích hợp hoàn toàn vào ChatGPT.
Hệ sinh thái và hợp tác
OpenAI đang hợp tác với các công ty như DoorDash, Instacart, OpenTable, Priceline và các công ty khác để tinh chỉnh Toán tử cho các ứng dụng trong thế giới thực. Nó cũng đang khám phá các trường hợp sử dụng trong khu vực công với các tổ chức như Thành phố Stockton để đơn giản hóa việc tiếp cận các dịch vụ của chính phủ.
Thông qua các mối quan hệ đối tác này, OpenAI nhằm mục đích đảm bảo rằng Nhà điều hành mang lại giá trị thiết thực cho các ngành khác nhau, đồng thời cải thiện chức năng dựa trên phản hồi của người dùng và doanh nghiệp.
Cách sử dụng và tính sẵn có
Nhà điều hành được cung cấp cho người dùng Pro ở Hoa Kỳ bắt đầu từ ngày 23 tháng 1 năm 2025 thông qua operator.chatgpt.com. Người dùng có thể bắt đầu nhiệm vụ bằng cách mô tả những gì họ cần và có thể nắm quyền kiểm soát bất cứ khi nào cần thiết.
OpenAI có kế hoạch triển khai dần dần Toán tử cho các cấp độ người dùng bổ sung, bao gồm Plus, Team và Enterprise, sau khi tính an toàn và khả năng sử dụng của nó được xác thực kỹ lưỡng.
Khám phá thêm từ Global Resources
Đăng ký để nhận các bài đăng mới nhất được gửi đến email của bạn.