
Openai đã giới thiệu một tính năng mới có tên Deep Research trong TATGPT, được thiết kế để giải quyết các nhiệm vụ nghiên cứu internet nhiều bước phức tạp. Khả năng nâng cao này cho phép Chatgpt hoàn thành trong hàng chục phút, những gì sẽ mất nhiều giờ, theo công ty.
Nghiên cứu sâu là gì?
Deep Research là một tác nhân tự trị có thể độc lập tìm kiếm, phân tích và tổng hợp hàng trăm nguồn trực tuyến để sản xuất các báo cáo cấp độ chi tiết, phân tích nghiên cứu.
Được cung cấp bởi một phiên bản của mô hình Openai O3 sắp tới, nó được tối ưu hóa để duyệt web và phân tích dữ liệu. Tính năng tận dụng lý luận nâng cao để giải thích và phân tích số lượng lớn văn bản, hình ảnh và tệp PDF trong khi điều chỉnh cách tiếp cận của nó dựa trên thông tin mà nó gặp.
Openai nhấn mạnh rằng khả năng tổng hợp kiến thức là một bước quan trọng trong sự phát triển của trí tuệ nhân tạo (AGI), mà họ hình dung là có khả năng sản xuất nghiên cứu khoa học mới.
Tại sao Openai xây dựng nghiên cứu sâu
Openai đã phát triển nghiên cứu sâu cho các chuyên gia trong các lĩnh vực như tài chính, khoa học, chính sách và kỹ thuật, những người cần nghiên cứu kỹ lưỡng, chính xác và đáng tin cậy. Nó cũng phục vụ người tiêu dùng tìm kiếm các khuyến nghị siêu cá nhân để mua hàng, chẳng hạn như ô tô, thiết bị và đồ nội thất.
Mỗi đầu ra được tạo ra bởi Deep Research đều được ghi lại đầy đủ, với các trích dẫn rõ ràng và tóm tắt lý do của nó, giúp nó dễ dàng xác minh. Công cụ này vượt trội khi phát hiện ra các thông tin thích hợp, không trực quan thường đòi hỏi phải duyệt mở rộng. Openai nhấn mạnh rằng nghiên cứu sâu giúp tiết kiệm thời gian quý giá bằng cách xử lý các nhiệm vụ nghiên cứu phức tạp, tốn thời gian với một truy vấn duy nhất.
Nghiên cứu sâu hoạt động như thế nào
Nghiên cứu sâu đã được đào tạo bằng cách sử dụng học tập củng cố đầu cuối về các nhiệm vụ duyệt và lý luận đầy thách thức trên nhiều lĩnh vực. Nó có thể lập kế hoạch và thực hiện các quỹ đạo nghiên cứu nhiều bước, điều chỉnh cách tiếp cận của nó khi cần thiết dựa trên thông tin mới.
Mô hình cũng có thể duyệt các tệp do người dùng tải, vẽ đồ thị bằng python và nhúng hình ảnh hoặc đồ thị được tạo từ các trang web vào các câu trả lời của nó. Hơn nữa, nó trích dẫn các câu hoặc đoạn cụ thể từ các nguồn của nó, đảm bảo tính minh bạch.
Trong bài kiểm tra cuối cùng của loài người, một bài kiểm tra đánh giá nghiêm ngặt về AI qua hơn 3.000 câu hỏi cấp độ chuyên gia trong hơn 100 đối tượng, mô hình đằng sau nghiên cứu sâu đã đạt được độ chính xác 26,6% ấn tượng. Điểm này vượt qua các mô hình khác, chẳng hạn như GPT-4O (3,3%) và O3-Mini của Openai (13%), đánh dấu những cải tiến đáng kể về các môn học như hóa học, nhân văn, khoa học xã hội và toán học.
Nó cũng đặt ra một điểm chuẩn mới trên bảng xếp hạng công khai GAIA để giải quyết vấn đề trong thế giới thực, xuất sắc trong lý luận, duyệt web và trình độ sử dụng công cụ.
Cách sử dụng nghiên cứu sâu
Để sử dụng nghiên cứu sâu trong TATGPT, chỉ cần chọn tùy chọn 'Nghiên cứu sâu' trong trình soạn thảo thông báo và nhập truy vấn của bạn. Người dùng có thể yêu cầu bất cứ điều gì từ phân tích cạnh tranh về các nền tảng phát trực tuyến đến một báo cáo được cá nhân hóa trên chiếc xe đạp đi lại tốt nhất. Bạn cũng có thể đính kèm các tệp hoặc bảng tính để thêm bối cảnh.
Khi quá trình bắt đầu, một thanh bên sẽ hiển thị một bản tóm tắt các bước được thực hiện và các nguồn được sử dụng. Nghiên cứu thường mất từ 5 đến 30 phút để hoàn thành, trong đó người dùng có thể tiếp tục các nhiệm vụ khác. Sau khi hoàn thành, báo cáo cuối cùng được gửi trong cuộc trò chuyện. Openai có kế hoạch thêm hình ảnh nhúng, trực quan hóa dữ liệu và các đầu ra phân tích khác trong vài tuần tới để tăng cường độ rõ ràng.
Nghiên cứu sâu so với GPT-4
Trong khi GPT-4 vượt trội trong các cuộc trò chuyện đa phương thức, thời gian thực, Deep Research phù hợp hơn với các yêu cầu đa diện, cụ thể về miền đòi hỏi độ sâu và chi tiết.
Ví dụ, khi được hỏi, tuổi nghỉ hưu trung bình của NFL Kickers là bao nhiêu ?, Nghiên cứu sâu cung cấp một phân tích kỹ lưỡng bao gồm bối cảnh thống kê, các ví dụ hỗ trợ và các yếu tố ảnh hưởng đến tuổi thọ của những người đá, thay vì chỉ đơn giản là đưa ra một số.
Hiệu suất trên điểm chuẩn
Trên Gaia, một điểm chuẩn công khai đánh giá AI về các câu hỏi trong thế giới thực, nghiên cứu sâu đã đạt được hiệu suất hiện đại (SOTA), đứng đầu bảng xếp hạng bên ngoài. Nó cũng chứng minh những cải tiến đáng kể trong các nhiệm vụ cấp chuyên gia, tự động hóa giờ nghiên cứu thủ công trên các lĩnh vực khác nhau.
Hạn chế của nghiên cứu sâu sắc
Mặc dù nghiên cứu sâu mở khóa khả năng ấn tượng, nhưng nó có một số hạn chế. Thỉnh thoảng, nó có thể ảo giác các sự kiện hoặc đưa ra các suy luận không chính xác, mặc dù tỷ lệ lỗi của nó thấp hơn so với các mô hình TATGPT hiện có.
Nó cũng có thể đấu tranh để phân biệt giữa các nguồn có thẩm quyền và thông tin không đáng tin cậy, và không phải lúc nào cũng truyền đạt chính xác sự không chắc chắn. Khi ra mắt, có thể có lỗi định dạng nhỏ trong các báo cáo và trích dẫn. Openai hy vọng những vấn đề này sẽ cải thiện theo thời gian và cách sử dụng.
Truy cập và tính khả dụng
Deep Research có sẵn trên phiên bản web của Chatgpt và sẽ được triển khai cho các ứng dụng di động và máy tính để bàn trong tháng. Do tính chất sử dụng nhiều tính toán của nó, Access hiện được giới hạn ở người dùng Pro, với tới 100 truy vấn mỗi tháng.
- Thêm vào đó và người dùng nhóm sẽ có quyền truy cập tiếp theo, tiếp theo là người dùng Enterprise. Openai cũng đang làm việc để mở rộng quyền truy cập cho người dùng ở Vương quốc Anh, Thụy Sĩ và Khu vực kinh tế châu Âu.
- Trong những tuần tới, OpenAI có kế hoạch phát hành phiên bản nghiên cứu sâu nhanh hơn, hiệu quả hơn được cung cấp bởi một mô hình nhỏ hơn, cung cấp các giới hạn truy vấn cao hơn cho tất cả người dùng được trả tiền.
Điều gì tiếp theo cho Openai
Nhìn về phía trước, Openai hình dung tích hợp nghiên cứu sâu với Nhà điều hànhmột tính năng cho phép các hành động trong thế giới thực. Sự kết hợp này sẽ cho phép TATGPT thực hiện các nhiệm vụ ngày càng tinh vi bằng cách pha trộn nghiên cứu trực tuyến không đồng bộ với thực thi trong thế giới thực.
Khám phá thêm từ Global Resources
Đăng ký để nhận các bài đăng mới nhất được gửi đến email của bạn.