Image default
Game

Microsoft WHAMM và Quake II AI: Bước tiến mới trong game tạo sinh thời gian thực

Microsoft đang trình diễn mô hình WHAMM (World Human Action MaskGIT Model) mới của mình với phiên bản tạo sinh theo thời gian thực của tựa game kinh điển Quake II. Bạn có thể trải nghiệm trò chơi do AI tạo ra này ngay trên trình duyệt, mặc dù đây thực chất chỉ là một bản thử nghiệm concept chứ chưa thực sự mang lại trải nghiệm giải trí. Sự phát triển của các mô hình game tạo sinh đang tăng tốc chóng mặt, hứa hẹn mở ra kỷ nguyên mới cho ngành công nghiệp trò chơi.

Tương lai của ngành công nghiệp game có thể bị thay đổi hoàn toàn bởi game tạo sinh theo thời gian thực. Các nhà nghiên cứu đã tìm ra cách để chạy Doom bên trong mô hình học thần kinh GameNGen của Google, OASIS AI cho phép bạn chơi phiên bản Minecraft được tạo sinh điên rồ ngay trên trình duyệt. Vào tháng 2 năm 2025, Microsoft cũng đã giới thiệu hệ thống game tạo sinh WHAM độc đáo của mình, đặt nền móng cho những phát triển tiếp theo trong lĩnh vực này.

Mô hình WHAM-1.6B mà Microsoft giới thiệu sáu tuần trước đó tuy ấn tượng nhưng còn nhiều hạn chế. Nó chỉ tạo ra một khung hình mỗi giây với độ phân giải 300 x 180, và yêu cầu dữ liệu huấn luyện trong bảy năm để tạo ra một trò chơi “có thể chơi được”. Ngay sau khi ra mắt WHAM-1.6B, Microsoft đã bắt tay vào phát triển WHAMM (World Human Action MaskGIT Model) nâng cấp, và kết quả thực sự đáng kinh ngạc. WHAMM không chỉ hoạt động ở độ phân giải video 600 x 340 (gấp đôi WHAM-1.6B) mà còn xuất ra hình ảnh với tốc độ tối thiểu 10 khung hình/giây và có thể sao chép Quake II chỉ với một tuần dữ liệu huấn luyện.

Giao diện game Quake II được tạo ra bởi mô hình AI WHAMM của Microsoft, minh họa khả năng tạo sinh theo thời gian thực.Giao diện game Quake II được tạo ra bởi mô hình AI WHAMM của Microsoft, minh họa khả năng tạo sinh theo thời gian thực.

Những cải tiến đáng kể này có được nhờ một kiến trúc tinh chỉnh. Thay vì sử dụng hệ thống “giống LLM” (Large Language Model) tự hồi quy thông thường, nơi mô hình AI tạo ra từng token một, thiết lập MaskGIT của WHAMM có thể “tạo ra tất cả các token cho một hình ảnh trong bao nhiêu thế hệ tùy ý.” Nói cách khác, mô hình AI mới này sử dụng xử lý song song để tăng tốc độ đầu ra, cải thiện chất lượng hình ảnh và độ chính xác dự đoán.

Tuy nhiên, về mặt thực tế, các trò chơi do WHAMM tạo ra không thực sự thú vị để chơi. Hình ảnh thường mờ, nhòe và không sắc nét, tốc độ khung hình chưa lý tưởng (mặc dù không quá khác biệt so với trải nghiệm của game thủ năm 1997), và kẻ thù trong game hầu như không thể nhận dạng. Phiên bản demo cũng bị lag đáng kể, mặc dù Microsoft cho rằng “độ trễ đáng chú ý” này là do trình phát web chứ không phải do bản thân mô hình.

WHAMM cũng mắc phải vấn đề “trí nhớ ngắn hạn” mà chúng ta thường thấy ở các mô hình game tạo sinh khác. Là một mô hình dự đoán, WHAMM tạo ra các khung hình mới bằng cách nhìn vào các khung hình trước đó – điều này khiến nó gặp khó khăn trong việc theo dõi máu và đạn dược, kẻ thù có thể biến mất nếu bạn nhìn đi chỗ khác (hoặc xuất hiện ngẫu nhiên không lý do), và nếu bạn đẩy nhân vật vào tường hoặc nhìn xuống sàn, bạn có thể bị dịch chuyển đến một vị trí khác trên bản đồ.

Dù vậy, qua thử nghiệm, WHAMM dường như có ít vấn đề “trí nhớ ngắn hạn” hơn một số mô hình khác. Độ dài ngữ cảnh 0.9 giây của nó đủ tốt để ngăn chặn sự “điên rồ, gây ảo giác” mà người viết đã trải nghiệm khi chơi phiên bản Minecraft được tạo sinh, mặc dù độ dài ngữ cảnh rõ ràng là một thách thức lớn mà Microsoft cần phải vượt qua. Điều quan trọng cần lưu ý là WHAMM chỉ được huấn luyện trên màn chơi đầu tiên của Quake II. Nếu bạn đi lên thang máy ở cuối màn chơi, mô hình sẽ bị treo. Do đó, tuyên bố của Microsoft rằng WHAMM có thể được huấn luyện với dữ liệu video trong một tuần có phần gây hiểu lầm – mô hình yêu cầu ít dữ liệu huấn luyện hơn WHAM-1.6B, nhưng lượng dữ liệu cần thiết để tạo ra một trò chơi tương tác sẽ khác nhau tùy thuộc vào độ dài nội dung, độ phức tạp của trò chơi và các yếu tố khác.

Về cách công nghệ này sẽ được sử dụng trong tương lai, Microsoft nhận định rằng AI tạo sinh theo thời gian thực có thể sản xuất “những loại hình truyền thông tương tác mới”, nhưng họ vẫn đang trong quá trình khám phá loại hình truyền thông đó nên là gì.

Bạn có thể trải nghiệm phiên bản Quake II được tạo sinh theo thời gian thực tại trang web Copilot Labs. Các trò chơi được tính thời gian và sẽ đặt lại khi hết giờ. Một lần nữa, đây chỉ là một bản thử nghiệm concept, vì vậy đừng mong đợi quá nhiều từ nó.

Tài liệu tham khảo:

Related posts

5 Tựa Game “Bom Tấn” Sẽ Đổ Bộ Xbox Game Pass Mùa Hè Này (Và Hơn Thế Nữa)

Administrator

Nâng cấp màn hình 240Hz 1440p: Hối tiếc từ một game thủ Việt

Administrator

Giải Mã Connections NYT: Gợi Ý & Đáp Án Ngày 23/04 Cùng Mẹo Chơi Đỉnh Cao

Administrator