
Microsoft vào thứ Tư đã giới thiệu Muse, mô hình AI đầu tiên của nó để tạo trò chơi video. Được phát triển bởi các nhóm Trí thông minh trò chơi nghiên cứu của Microsoft và các nhóm AI có thể dạy được (TAI X) với lý thuyết Ninja của Xbox Games Studios, Muse giới thiệu mô hình hành động thế giới và con người (WHAM).
Muse – Mô hình AI thế hệ cho trò chơi
AI này, được chi tiết trong một bài báo tự nhiên của Katja Hofmann, giám đốc nghiên cứu chính cao cấp và lãnh đạo nhóm trí thông minh trò chơi, có thể tạo ra hình ảnh trò chơi và các hành động điều khiển dựa trên sự hiểu biết 3D về thế giới trò chơi.
Muse, sử dụng wham-1,6b với 1,6 tỷ thông số, đã được đào tạo về hơn 1 tỷ hình ảnh và các hành động của bộ điều khiển, tương đương với hơn 7 năm chơi trò chơi của con người liên tục từ rìa chảy máu của Ninja.
Hợp tác và truy cập nguồn mở
Muse nổi lên từ sự hợp tác giữa Lý thuyết Ninja và Microsoft Research, cả hai đều có trụ sở tại Cambridge, UK. Được đào tạo trên Bleeding Edge, một trò chơi trực tuyến 4V4 từ năm 2020, mô hình sử dụng dữ liệu trò chơi được thu thập theo đạo đức (các hành động hình ảnh và bộ điều khiển ở độ phân giải 300 × 180 PX) với sự đồng ý của người chơi thông qua thỏa thuận cấp phép người dùng cuối.
Katja Hofmann lưu ý, tôi vô cùng tự hào về các đội của chúng tôi và cột mốc mà chúng tôi đã đạt được, làm nổi bật khả năng của Muse để học các cấu trúc trò chơi phong phú. Để hỗ trợ nghiên cứu sâu hơn, Microsoft là trọng lượng của Microsoft, dữ liệu mẫu và trình diễn WHAM, một giao diện trực quan để tương tác với các mô hình Wham có sẵn trên Azure AI Foundry.
Cách thức hoạt động của nàng thơ và những gì nó có thể làm
Muse vượt trội trong việc tạo ra các chuỗi trò chơi phức tạp kéo dài đến 2 phút. Trong các bản demo, nó được nhắc nhở với 10 khung hình (1 giây) của các hành động chơi trò chơi và bộ điều khiển của con người, sau đó dự đoán sự tiến hóa của trò chơi trong chế độ mô hình thế giới của Hồi giáo.
Càng nhiều đầu ra của nó phù hợp với động lực học cạnh, nó càng nắm bắt được trò chơi tốt hơn. Các ví dụ cho thấy sự đa dạng hành vi (ví dụ, dịch chuyển camera, lựa chọn đường dẫn) và tính đa dạng thị giác (ví dụ, các bảng điều khiển khác nhau).
Được đánh giá về tính nhất quán, đa dạng và sự kiên trì, Muse đảm bảo trò chơi tôn trọng vật lý, cung cấp sự đa dạng và điều chỉnh sự thay đổi của người dùng, giống như thêm một nhân vật vào một cảnh, sau đó nó tích hợp một cách tự nhiên.
Hành trình nghiên cứu đằng sau Muse
Dự án bắt đầu vào tháng 12 năm 2022, đã gây ra bởi phát hành của TNTGPT, đã truyền cảm hứng cho Hofmann khám phá các mô hình dựa trên máy biến áp để chơi game. Với nhiều năm dữ liệu cạnh chảy máu từ Lý thuyết Ninja, nhóm đã mở rộng quy mô đào tạo từ cụm V100 (100 GPU) đến H100s.
Các bản demo ban đầu, giống như một nhà nghiên cứu Tim Pearce, đã cho thấy Muse cải thiện hơn 10K, 100K và các bản cập nhật đào tạo 1M, từ việc nhận biết cơ bản để làm chủ các cơ chế như bay sau khi cập nhật 1M.
Gavin Costello, giám đốc kỹ thuật của Ninja Theory, cho biết, đã mở mắt khi thấy tiềm năng công nghệ này có, từ các đại lý của AI đến các chuỗi trò chơi mới.
Tác động tiềm năng của Muse đối với chơi game
Muse đẩy thiết kế trò chơi điều khiển AI về phía trước. Fatima Kardar, phó chủ tịch công ty của Gaming AI, cho biết, chúng tôi đã sử dụng Muse để phát triển một mô hình AI có thể chơi thời gian thực được đào tạo trên các trò chơi của đảng thứ nhất khác.
Nó có thể hồi sinh các trò chơi cổ điển gắn liền với phần cứng cũ, tối ưu hóa chúng cho bất kỳ thiết bị nào. Kardar nói thêm, điều này có thể thay đổi hoàn toàn cách chúng tôi bảo tồn và trải nghiệm các trò chơi cổ điển. Các nhà phát triển cũng có thể sử dụng Muse để các ý tưởng nguyên mẫu hoặc mở rộng các tiêu đề hiện có, với các bản trình diễn trò chơi AI ngắn sớm có sẵn trên Copilot Labs.
Định hình nàng thơ với những người sáng tạo trong tâm trí
Microsoft đã phỏng vấn 27 người sáng tạo trò chơi trên toàn cầu, từ những người Ấn Độ đến AAA Studios, để sắp xếp Muse với nhu cầu thực sự. Linda Wen, một nhà nghiên cứu thiết kế, nhấn mạnh bao gồm những tiếng nói không rõ ràng để đảm bảo lợi ích rộng lớn.
Trong một hackathon, các đội đã xây dựng người biểu tình Wham, cho phép người dùng nhắc nhở Muse với hình ảnh (ví dụ, hình ảnh quảng cáo cạnh chảy máu) và kết quả điều chỉnh bằng cách sử dụng bộ điều khiển.
Cecily Morrison, giám đốc nghiên cứu chính cao cấp, đã lưu ý, đó là một cơ hội tuyệt vời để định hình các khả năng mô hình để phù hợp với nhu cầu của các nhà sáng tạo ngay từ đầu.
Tầm nhìn AI của Xbox và các bước trong tương lai
Xbox từ lâu đã sử dụng AI và Kardar cho biết, hiện tại chúng ta đang thấy một sự tăng tốc của nghiên cứu AI tổng quát. Muse phản ánh một cách tiếp cận đầu tiên của người sáng tạo, với việc sử dụng được hướng dẫn bởi tầm nhìn của mỗi đội.
Nhìn về phía trước, Xbox nhằm mục đích giảm bớt Rào cản trong chơi game thông qua AI. Kardar giải thích, chúng tôi sẽ chia sẻ đổi mới sản phẩm AI của chúng tôi trước đó, người chơi mời người chơi và người sáng tạo đến các tính năng đồng xây dựng.
Được hướng dẫn bởi các nguyên tắc như sự công bằng và minh bạch, Xbox có kế hoạch nhiều hơn các bản cập nhật AI vào năm 2025 để tăng cường các công cụ và trải nghiệm trên các thiết bị.
Tính khả dụng và truy cập
Muse hiện có sẵn cho các nhà nghiên cứu và nhà phát triển. Trọng lượng mô hình của nó, dữ liệu mẫu và trình diễn WHAM có thể được truy cập Azure AI Foundry. Các bản demo trò chơi AI tương tác ngắn sẽ sớm có thể kiểm tra được trên các phòng thí nghiệm Copilot, với các bản cập nhật rộng hơn dự kiến vào năm 2025.
Khám phá thêm từ Global Resources
Đăng ký để nhận các bài đăng mới nhất được gửi đến email của bạn.