Google telah mengambil langkah baharu dalam serangannya kecerdasan buatan yang digunakan untuk permainan video dan alam maya Dengan pelancaran Project Genie, sebuah prototaip yang membolehkan pengguna menjana dan menavigasi persekitaran interaktif berdasarkan beberapa gesaan teks atau imej, syarikat itu mempersembahkan alat tersebut sebagai eksperimen yang masih dalam ujian. Walau bagaimanapun, demonstrasi awalnya telah mencetuskan keterujaan dan keraguan dalam industri.
Buat masa ini, akses terhad kepada pelanggan pelan Google AI Ultra di Amerika Syarikatdengan sesi pendek dan prestasi yang jelas ditandai dengan sifat eksperimen sistem. Walaupun begitu, projek ini menunjukkan masa depan di mana mana-mana pengguna boleh cipta "dunia kecil yang boleh dimainkan" dalam beberapa saat, tanpa perlu tahu cara memprogram atau mengendalikan enjin grafik.
Apakah Projek Genie dan teknologi apakah yang digabungkannya?

Projek Genie ialah prototaip penyelidikan yang dibangunkan oleh Google DeepMind dan Google AI yang berfungsi sebagai penjana dunia interaktif. Asas teknikalnya terletak pada tiga tonggak: model Genie 3, khusus dalam simulasi persekitaran dinamik; Nano Banana Pro, bertanggungjawab untuk aspek visual dan lakaran; dan Gemini, model multimodal yang mentafsir arahan pengguna dan bertindak sebagai pembantu semasa penciptaan.
Jantung sistem adalah Genie 3, model "dunia" yang mampu meramalkan bingkai demi bingkai apa yang berlaku di skrinTidak seperti teknologi sebelumnya yang hanya menghasilkan adegan 3D statik, pendekatan ini membolehkan persekitaran bertindak balas terhadap pergerakan pemain dalam masa nyata, dengan resolusi anggaran 720p dan beberapa minit koheren visual mengikut eksperimen dalaman DeepMind.
Ia disepadukan atas dasar itu Nano Banana Pro, bertanggungjawab untuk menghasilkan imej awal pentas Bermula dengan teks deskriptif atau imej rujukan, pandangan pertama ini berfungsi sebagai lakaran untuk menentukan gaya grafik, komposisi dunia dan rupa watak yang akan dikawal semasa penerokaan.
Akhirnya, Gemini bertindak sebagai lapisan orkestrasi dan pembantuIa mentafsir arahan dalam bahasa semula jadi, membantu melaraskan dunia dengan pantas dan memudahkan tugas seperti mengubah perspektif (orang pertama atau ketiga), menggabungkan semula persekitaran yang telah dicipta atau menggabungkan beberapa idea ke dalam satu senario yang boleh dimainkan.
Bagaimana dunia maya dicipta dan diterokai

Operasi Project Genie distrukturkan berdasarkan proses progresif dalam tiga fasa Google meringkaskannya sebagai melakar, meneroka dan mengadun dunia. Matlamatnya adalah untuk sesiapa sahaja dapat beralih daripada idea kepada pengalaman interaktif yang kecil tanpa alatan tambahan.
Pada peringkat pertama, pengguna menulis penerangan tentang dunia yang ingin mereka cipta atau memuat naik imej rujukan. Daripada input tersebut, Nano Banana Pro menjana pratonton statik Latar tempatnya boleh jadi hutan bergaya poli rendah, persekitaran bandar futuristik, landskap bersejarah atau apa sahaja yang diterangkan dalam teks. Jenis watak, mod kamera dan beberapa parameter pergerakan asas juga ditakrifkan dalam fasa ini.
Sebaik sahaja lakaran diterima, Genie 3 akan dimainkan untuk membolehkan pemain Terokai persekitaran dengan bebas, menggunakan kawalan PC biasa seperti kekunci W, A, S dan DModel tersebut menjana dengan pantas apa yang muncul di hadapan watak, meramalkan setiap bingkai berdasarkan bingkai sebelumnya dan mengekalkan konsistensi tertentu apabila kamera dihidupkan atau kembali ke kawasan yang telah dilawati.
Keupayaan utama yang ketiga ialah gabungan dan pengadunan semula duniaSistem ini membolehkan pengguna menyemak semula senario yang dijana sebelum ini, mengubah suainya dengan parameter baharu, menggabungkannya bersama atau menggunakan dunia yang dijana terlebih dahulu daripada Google sebagai asas untuk membina variasi. Selain itu, video sesi boleh dikongsi untuk ditonton atau digunakan oleh pengguna lain sebagai inspirasi.
Semua ini dijalankan daripada aplikasi web yang serupa dengan perkhidmatan Google AI yang lain, supaya Tiada program tambahan perlu dipasang, dan pengetahuan teknikal lanjutan juga tidak diperlukan.Hanya akses alat tersebut, masukkan arahan dan mula menguji kombinasi sehingga anda menemui hasil yang menarik.
Had teknikal: masa, prestasi dan realisme

Google berkeras untuk mentakrifkan Project Genie sebagai prototaip penyelidikan dengan ciri eksperimen yang ketaraLabel itu bukan sekadar formaliti: pengalaman semasa membentangkan beberapa batasan jelas yang menentukan penggunaan praktikal alat tersebut melangkaui rasa ingin tahu awal.
Yang paling jelas ialah Had 60 saat setiap penjanaan dan sesi penerokaanSelepas minit itu, dunia akan ditutup dan pengalaman baharu mesti bermula. Syarikat itu menjelaskan bahawa sekatan ini membolehkan pengagihan sumber pengkomputeran yang lebih baik, kerana setiap sesi menyimpan cip khusus untuk pengguna yang sedang bermain.
Dari segi prestasi, ujian awam menerangkan resolusi hampir 720p dan frekuensi antara 20 dan 24 bingkai sesaatCiri-ciri ini disertai dengan kelewatan input yang ketara semasa menggerakkan watak atau menukar kamera. Menurut beberapa penguji awal, pengalaman ini lebih terasa seperti video interaktif daripada permainan video tradisional yang lancar sepenuhnya.
Perlu juga dinyatakan bahawa Genie 3 Ia bukan enjin grafik klasik, tetapi model yang meramalkan bingkai seterusnya. Berdasarkan perkara di atas. Ini mengakibatkan tingkah laku pelik: laluan yang mengubah tekstur tanpa sebab yang jelas, elemen yang hilang, fizik yang tidak masuk akal atau animasi yang berubah bentuk secara rawak.
Google sendiri memberi amaran bahawa dunia yang dijana "Ia mungkin tidak kelihatan sepenuhnya nyata atau sentiasa mematuhi petunjuk atau hukum fizik."Dan kawalan wataknya mungkin tidak tepat. Dalam erti kata lain, teknologi ini menunjukkan potensi, tetapi ia masih jauh daripada menawarkan pengalaman permainan yang digilap dari segi permainan dan kestabilan visual.
Akses terhad dan pelan tindakan antarabangsa

Dalam fasa pertama ini, Project Genie hanya tersedia untuk Pelanggan Google AI Ultra di Amerika SyarikatPelan langganan paling canggih syarikat ini disasarkan kepada perniagaan dan pencipta yang memerlukan keupayaan AI berprestasi tinggi. Ia merupakan perkhidmatan premium yang mengehadkan bilangan pengguna yang mempunyai akses kepada eksperimen tersebut.
Keputusan untuk menyekat ujian dijelaskan oleh kedua-dua kos pengiraan setiap sesi Ini disebabkan oleh minat Google dalam mengumpulkan maklum balas terperinci sebelum pelancaran yang lebih luas. Pengarah Penyelidikan DeepMind, Shlomi Frutcher, menekankan bahawa adalah "menarik" untuk dapat membuka alat ini kepada lebih ramai orang bagi mengumpulkan pendapat penggunaan dunia sebenar, tetapi buat masa ini tiada tarikh khusus untuk ketibaannya di Eropah atau pasaran lain.
Dari perspektif pengguna dan kajian Sepanyol dan Eropah, ini diterjemahkan kepada fakta bahawa, sekurang-kurangnya dalam jangka pendek, Peranan yang paling realistik ialah sebagai pemerhati: ikuti ujian dengan teliti, analisis video yang telah beredar di media sosial dan nilaikan sejauh mana teknologi ini dapat diintegrasikan ke dalam aliran kerja untuk reka bentuk peringkat, prototaip pantas atau visualisasi idea.
Google telah menyatakan hasratnya untuk meluaskan akses secara beransur-ansur Dengan syarat prestasi, kos dan isu perundangan membenarkannya. Walau bagaimanapun, kadar pengembangan itu juga bergantung pada respons komuniti dan bagaimana perdebatan mengenai hak cipta dan penggunaan kandungan pihak ketiga yang bertanggungjawab berkembang.
Kebolehan meniru permainan terkenal dan perdebatan hak cipta
Salah satu perkara paling sensitif dalam Projek Genie ialah keupayaan untuk mencipta semula, dengan pelbagai tahap kejayaan, dunia yang jelas diilhamkan oleh permainan video sedia adaBeberapa wartawan khusus telah berjaya mencipta senario yang jelas menyerupai tajuk seperti Super Mario 64, Metroid Prime atau The Legend of Zelda: Breath of the Wild.
Dalam kes Zelda, mereka juga telah dilihat watak yang menggunakan paraglider semasa melompatGerak isyarat ini berkait rapat dengan permainan Nintendo. Kebetulan ini menunjukkan bahawa model tersebut telah dilatih menggunakan sebilangan besar video permainan yang tersedia secara umum, sekali gus menimbulkan persoalan tentang layanan harta intelek dalam latihan AI.
Selepas beberapa ujian di mana dunia yang diinspirasikan oleh francais yang sangat dikenali telah dicipta semula, Google telah mula menyekat penjanaan senario dan watak tertentuterutamanya apabila nama atau tanda dagangan tertentu disebut. Dalam beberapa kes, alat ini secara langsung menghalang penciptaan dunia berdasarkan saga tertentu, dengan memetik "kepentingan penyedia kandungan pihak ketiga".
Syarikat itu menjelaskan bahawa Project Genie adalah "dilatih terutamanya dengan data web yang tersedia secara umum"Tetapi ingat bahawa kandungan ini masih tertakluk kepada undang-undang hak cipta. Hasilnya ialah sistem moderasi yang masih dalam pembinaan, di mana beberapa percubaan untuk menghasilkan semula karya berhak cipta disekat secara eksplisit, sementara yang lain terlepas selagi rujukan yang terlalu langsung dielakkan.
Tingkah laku yang tidak normal ini mencetuskan perdebatan tentang Sejauh manakah AI boleh atau harus diinspirasikan oleh permainan sedia ada? Dan di manakah kita dapat membezakan antara penghormatan, peniruan dan penyalinan? Perdebatan ini dijangka akan menjadi relevan khususnya di rantau seperti Kesatuan Eropah, di mana rangka kerja kawal selia mengenai data latihan dan hak cipta dalam AI masih ditakrifkan.
Potensi impak terhadap industri permainan video
Di luar daya tarikan media untuk menonton dunia "seperti Mario" atau "seperti Zelda" dijana dalam beberapa saatProject Genie merupakan sebahagian daripada perlumbaan yang lebih luas dalam kalangan syarikat teknologi utama untuk mengaplikasikan AI generatif kepada pembangunan permainan. Microsoft, sebagai contoh, telah memperkenalkan projek seperti Muse untuk mengautomasikan bahagian proses reka bentuk dan pengeluaran, dan syarikat lain sedang meneroka penyelesaian serupa untuk mengurangkan kos dan mempercepatkan pembangunan.
Dalam konteks ini, cadangan Google bertujuan untuk menjadi alat prototaip dan eksperimen pantas Ini mungkin menarik minat studio bebas dan penerbit besar. Keupayaan untuk membina senario yang boleh dimainkan daripada lakaran atau perenggan teks boleh memudahkan pengesahan awal idea, penciptaan demo dalaman atau pengujian mekanik tanpa melaburkan masa berbulan-bulan.
Walau bagaimanapun, peningkatan jenis penyelesaian ini menimbulkan kebimbangan dalam kalangan sesetengah pihak dalam sektor ini. Di satu pihak, Terdapat kebimbangan tentang potensi kesan terhadap profil profesional tertentu. Jika sebahagian daripada kandungan dijana secara automatik. Sebaliknya, ramai pembangun berwaspada terhadap model perniagaan di mana AI dilatih pada karya yang telah diterbitkan tanpa pampasan yang jelas untuk penulis mereka.
Dalam pasaran Eropah dan Sepanyol, di mana perdebatan mengenai perlindungan ciptaan budaya amat sengit, adalah penting untuk melihat bagaimana alat seperti Project Genie sesuai dengan peraturan masa hadapan. Aspek seperti ketelusan mengenai data latihan, sistem pilihan keluar untuk pemegang hak dan atribusi kandungan yang dijana boleh membuat perbezaan antara penerimaan yang berhemat dan konflik berterusan dengan pembangun dan penerbit.
Buat masa ini, Projek Genie masih berada di peringkat awal di mana Ia berfungsi lebih sebagai makmal awam daripada sebagai produk siap.Evolusinya, dan bagaimana Google mengendalikan isu-isu perundangan dan etika yang berkaitan, akan menentukan sama ada ia akhirnya akan disepadukan ke dalam aliran kerja studio atau kekal sebagai eksperimen yang mencolok tetapi terhad.
Walau bagaimanapun, kemunculan prototaip ini menjelaskan bahawa syarikat teknologi utama melihat dalam Penjanaan automatik dunia interaktif rupa bumi strategik peringkat pertama. Walaupun penggunaannya yang sebenar hari ini terhad dan dibelenggu dengan ketidaksempurnaan teknikal, arah perjalanannya adalah jelas: model yang semakin berkemampuan untuk mengubah teks dan imej menjadi pengalaman yang boleh dimainkan, dan industri yang perlu memutuskan bagaimana ia mahu wujud bersama dengan alat baharu ini.