生成式人工智能(Generative AI)在創(chuàng)意領域的受歡迎度不斷上升,其有潛力通過支持人類的創(chuàng)意創(chuàng)意-新想法的產(chǎn)生來改造創(chuàng)意產(chǎn)業(yè)。然而,模型能力的限制提出了將這些技術更充分地集成到創(chuàng)造性實踐中的關鍵挑戰(zhàn)。迭代調(diào)整和發(fā)散性思維是利用技術實現(xiàn)創(chuàng)造力支持的關鍵,但這些實踐沒有得到最先進的生成式人工智能模型的充分支持。
電子游戲在娛樂產(chǎn)業(yè)中占據(jù)了最大份額,全球有數(shù)十億人玩和購買電子游戲。而生成式人工智能在電子游戲開發(fā)中的作用一直有待明確。
2025年2月19日,微軟研究院的研究人員在國際頂尖學術期刊 Nature 上發(fā)表了題為:World and Human Action Models towards gameplay ideation 的研究論文。
該研究以電子游戲開發(fā)為切入點,揭示了如何通過精準把握用戶需求來驅(qū)動生成式人工智能模型的開發(fā)與評估,使其與創(chuàng)意工作流深度契合。研究團隊研究開發(fā)了一個可協(xié)助電子游戲設計師迭代設計游戲的生成式人工智能模型——“世界與人類行動模型”(World and Human Action Model,WHAM),其生成的穩(wěn)健三維世界能遵循設計用于電子游戲的機制。
這項突破為構建真正智能化的創(chuàng)意增強系統(tǒng)奠定了技術基礎,預示著人機協(xié)同創(chuàng)作新時代的到來。
生式人工智能正通過賦能人類創(chuàng)意構思(新想法的生成過程)來重塑創(chuàng)意產(chǎn)業(yè)格局。然而,現(xiàn)有模型的能力局限為其深度融入創(chuàng)意實踐帶來了關鍵挑戰(zhàn)。
為了理解電子游戲開發(fā)者的需求,研究團隊采訪了創(chuàng)意團隊的 27 名電子游戲設計師。這些設計師認為當前用于打造電子游戲的 AI 方案缺乏生成許多不同創(chuàng)意(發(fā)散性思維)的能力。他們還強調(diào)了通過設計過程來持續(xù)微調(diào)游戲各方面(迭代實踐)的重要性。
也就是說,當前即使最先進的生成式人工智能模型(例如GPT-4、Stable Diffusion)在生成創(chuàng)意方面也存在著幾點挑戰(zhàn)——
迭代優(yōu)化支持不足:缺乏對"設計-測試-修正"循環(huán)工作流的系統(tǒng)性支持;
發(fā)散思維受限:在跨模態(tài)概念聯(lián)想(例如將敘事元素轉(zhuǎn)化為關卡機制)方面的表現(xiàn)顯著低于人類設計師水平;
修改持久化缺失:用戶對生成內(nèi)容的調(diào)整無法有效反饋至模型知識庫,導致重復勞動率高達 62%。
隨后,研究團隊開發(fā)了名為“世界與人類行動模型”(World and Human Action Model,WHAM)的生成式人工智能模型模型,該模型使用了 3D 多玩家戰(zhàn)斗模擬器《嗜血邊緣》(Bleeding Edge)中七年的人類玩家體驗進行訓練。
WHAM概述
研究團隊發(fā)現(xiàn),WHAM 或能設計出符合《嗜血邊緣》預存在機制的復雜 3D 電子游戲序列,其關卡設計具有明顯的多樣性,且創(chuàng)意人員可對輸出進行迭代調(diào)整。研究團隊還開發(fā)了 WHAM 示范器,作為供用戶操作和自定義 WHAM 輸出的一個可視化界面。
考慮到由于 WHAM 僅通過玩游戲的訓練就能學會生成序列,無需任何先前知識,這個工具或能輕松轉(zhuǎn)換用于生成來自其他電子游戲的關卡。
研究團隊指出,WHAM 一類的生成式人工智能工具可能無法作為設計過程的終點,而應該作為一個輔助人類游戲設計師的工具。對該方法的進一步研究或有助于分析創(chuàng)意團隊可以在設計流程的不同階段如何使用 WHAM。
總的來說,該研究我們開發(fā)的世界與人類行為模型(WHAM)實現(xiàn)了三大關鍵創(chuàng)新:
一致性:通過分層狀態(tài)機架構,確保生成的游戲玩法序列在物理規(guī)則和敘事邏輯兩個維度保持內(nèi)在一致性;
一致性結果
多樣性:采用潛在空間擾動技術,使關卡設計方案的創(chuàng)意發(fā)散度提升 3.2 倍;
多樣性結果
持久性:能夠在生成過程中持久化用戶的修改,通過建立動態(tài)知識圖譜系統(tǒng),可將用戶調(diào)整內(nèi)容的 83% 有效轉(zhuǎn)化為模型參數(shù)更新。
編輯流程與定性持久性結果
相較于需要人工定義領域結構的傳統(tǒng)創(chuàng)意支持工具(例如Procedural Content Generation算法),生成式人工智能通過數(shù)據(jù)驅(qū)動的結構學習展現(xiàn)出更廣泛的應用潛力。WHAM 模型在 3A 游戲原型開發(fā)中的實測表明,其可將概念設計階段耗時縮短 58%,同時提升跨部門協(xié)同效率 41%。這項突破為構建真正智能化的創(chuàng)意增強系統(tǒng)奠定了技術基礎,預示著人機協(xié)同創(chuàng)作新時代的到來。
論文鏈接:
https://www.nature.com/articles/s41586-025-08600-3
合作咨詢
肖女士
021-33392297
Kelly.Xiao@imsinoexpo.com