OpenAI telah mengambil satu lagi langkah dalam penyepaduan kecerdasan buatan dengan penggunaan komputer harian dengan mengubah sepenuhnya Codex, ejen kod desktopnya. Alat ini, yang sebelum ini dikenali terutamanya untuk bantuan pengaturcaraannya, kini menjadi pembantu yang mampu mengendalikan aplikasi, mengingati pilihan dan mengurus projek dengan hampir lancar.
Dengan kemas kini ini, syarikat yang diketuai oleh Sam Altman mendekatkan rancangannya untuk mewujudkan "Aplikasi super" desktop yang menyatukan ChatGPT, Codex dan pelayar Atlas andaLangkah ini bertujuan untuk memudahkan pengalaman pengguna, menumpukan sumber dalam satu ruang kerja dan menghadapi pesaing seperti Anthropic, terutamanya dalam persekitaran pembangunan perisian dan automasi canggih.
Codex belajar menggunakan komputer seperti pengguna lain
Salah satu perubahan yang paling ketara ialah Codex kini boleh kawal komputer di latar belakangEjen tersebut dapat melihat apa yang ada pada skrin, menggerakkan kursornya sendiri, mengklik, menaip teks dan bertindak balas terhadap apa yang berlaku dalam aplikasi yang dipasang, tanpa mengganggu apa yang pengguna lakukan dengan tetikus atau papan kekunci.
Keupayaan ini membolehkan pelbagai ejen Codex berfungsi bersama secara selari dalam pasukan yang samaIni melibatkan pelaksanaan ujian, perubahan konfigurasi atau pelaksanaan tugas berulang sementara orang itu meneruskan aktiviti biasa mereka. Ini membuka pintu untuk mengautomasikan aliran kerja yang sebelum ini memerlukan pengawasan berterusan, seperti menguji aplikasi selepas setiap perubahan kod atau tindakan antara muka yang berulang.
OpenAI mencadangkan fungsi ini sebagai cara untuk pembantu beroperasi dengan alat yang tidak mempunyai API atau integrasi langsung, sesuatu yang biasa dalam banyak program desktop. Codex, dengan "melihat" skrin dan mengawal kursor, boleh berinteraksi dengan aplikasi ini seperti pengguna manusia, walaupun buat masa ini secara terkawal dan dengan perhatian khusus terhadap keselamatan.
Menurut syarikat itu, penggunaan komputer pada mulanya tersedia dalam macOS melalui aplikasi desktop Codex, dipautkan ke akaun ChatGPT. Versi Windows akan tiba kemudian, setelah prestasi diuji dan ciri-cirinya disesuaikan dengan persekitaran Microsoft.
Dalam kes Eropah dan United Kingdom, OpenAI telah mengesahkan bahawa kawalan komputer, penyesuaian lanjutan, cadangan kontekstual dan memori Ia akan diaktifkan kemudian. Sebabnya adalah keperluan untuk melaraskan ciri-ciri ini kepada peraturan perlindungan data, satu keperluan yang amat mendesak di Kesatuan Eropah dan pasaran British.

Pelayar bersepadu dan kerja langsung pada halaman web
Kemas kini ini juga mengukuhkan hubungan Codex dengan web hasil daripada pelayar bersepadu dalam aplikasi itu sendiriDaripada hanya menerima arahan teks generik, ejen boleh menerima arahan terus pada elemen tertentu halaman.
Dalam pembangunan bahagian hadapan, sebagai contoh, pengguna boleh Pilih komponen web dan huraikan perubahan tersebut. Pengguna ingin melakukan sesuatu (seperti menukar warna, saiz teks atau susun atur blok), dan Codex memahami arahan dalam konteks visual tertentu itu. Ini mengelakkan daripada perlu menulis gesaan panjang lebar yang menjelaskan bahagian laman web yang perlu diubah.
Pelayar terbenam ini juga membenarkan Codex Menganalisis kandungan, mengumpul maklumat dan menggunakannya sebagai konteks Untuk tugasan lain, seperti mendokumentasikan kod, menyemak spesifikasi produk atau membandingkan dokumentasi teknikal, semuanya dilakukan dalam persekitaran yang sama, tanpa perlu bertukar antara berbilang tetingkap sistem pengendalian.
Menjana dan mengedit imej dengan gpt-image-1.5
Satu lagi tonggak versi baharu Codex ialah penyepaduan model gpt-image-1.5 untuk mencipta dan mengubah suai imej Dari dalam aplikasi desktop itu sendiri, ejen boleh menjana carta, gambar rajah, mockup atau lakaran visual daripada teks atau dengan menggabungkan arahan dengan tangkapan skrin dan coretan kod.
Keupayaan ini ditujukan terus kepada pasukan yang bekerja di reka bentuk produk, antara muka pengguna atau prototaip permainan videoContohnya, pembangun boleh merakam tangkapan skrin antara muka yang separuh siap, meminta Codex mencadangkan reka bentuk semula menu atau skema warna baharu dan mendapatkan imej yang dijana yang sesuai dengan konteks tersebut, tanpa menukar alat.
Dengan semuanya berpusat dalam Codex, ejen boleh rantaikan tugasan pengekodan dan reka bentuk: tulis logik fungsi, kemas kini bahagian hadapan yang sepadan dan jana mockup visual untuk dibentangkan kepada pasukan, tanpa meninggalkan aliran kerja atau perlu membuka aplikasi penyuntingan grafik luaran.
Memori, konteks dan automasi tugas jangka panjang
Selain kawalan komputer dan penjanaan imej, pertaruhan besar OpenAI dengan versi ini adalah untuk melengkapkan Codex dengan ingatan berterusan dan pengurusan konteks yang lebih luasAlat ini boleh menggunakan semula perbualan sebelumnya, menyimpan maklumat penting dan mendapatkannya semula apabila diperlukan untuk meneruskan projek.
Ciri memori, yang dikeluarkan dalam pratonton, membolehkan Codex ingat pilihan peribadi, pembetulan yang kerap atau data yang sukar dikumpulkanIni merangkumi segala-galanya daripada susunan teknologi tipikal pasukan hinggalah cara folder disusun, format laporan yang paling biasa digunakan dan tag yang biasanya digunakan pada GitHub untuk jenis isu tertentu.
Dengan konteks terkumpul itu, ejen boleh mencadangkan tugasan secara proaktifIni boleh digunakan untuk mencadangkan penyambungan semula projek yang belum selesai, mengesyorkan pemfaktoran semula yang belum selesai atau memaklumkan pengguna tentang permintaan tarik yang telah lama wujud. Sesetengah syarikat sudah pun menggunakannya untuk menjejak perbualan dalam Slack, Gmail atau Notion dan bertindak balas apabila peristiwa tertentu berlaku.
Kodeks juga boleh rancang kerja untuk masa depan dan aktifkan semula diri anda secara bebas untuk menyelesaikan tugasan jangka panjang. Contohnya, ia boleh mengurus barisan semakan kod selama berhari-hari atau berminggu-minggu, menangani komen dan mengemas kini dokumentasi tanpa pembangun perlu sentiasa memantaunya.
Lebih 90 alat tambah dan sokongan pembangun yang dipertingkatkan
Untuk melengkapkan perubahan tersebut, OpenAI telah menambah hampir 90 pemalam Codex baharuIni termasuk penyepaduan dengan Microsoft Suite, Isu GitLab, Neon oleh Databricks, Render dan Superpowers, serta sokongan untuk pelayan MCP (Model Context Protocol). Matlamatnya adalah untuk memberi ejen lebih banyak sumber konteks dan keupayaan operasi yang lebih besar.
Terima kasih kepada plugin ini, Codex boleh mengumpul maklumat daripada pelbagai perkhidmatan dan bertindak ke atasnya Dari satu ruang kerja, anda boleh menyemak isu dalam GitLab, membuat pertanyaan data dalam persekitaran Databricks, mengemas kini dokumen Office atau berinteraksi dengan perkhidmatan penggunaan, tanpa memaksa pengguna untuk beralih dari platform ke platform.
Pada tahap teknikal semata-mata, kemas kini ini mengukuhkan aliran kerja pembangun biasaKini Codex membantu anda menyemak permintaan tarik, mengurus berbilang tab terminal sekaligus, bersambung ke persekitaran pembangunan jauh melalui SSH dan membuka fail dengan pratonton yang kaya, sama ada PDF, hamparan, pembentangan atau dokumen dalam format lain.
Semua ini tertumpu dalam pengalaman terpadu yang, menurut OpenAI sendiri, membolehkan kemajuan yang lebih pantas dalam semua peringkat kitaran hayat perisianDaripada menulis kod awal hinggalah menguji, menggunakan, mendokumentasikan dan menyelenggaranya, dengan ejen AI yang sentiasa bekerjasama dalam persekitaran desktop yang sama.
Ketersediaan, tumpuan kepada pembangun dan situasi di Eropah
Versi baharu Codex telah pun digunakan dalam aplikasi desktop untuk macOS Bagi mereka yang log masuk dengan akaun ChatGPT. Tidak semua ciri memerlukan jenis langganan yang sama, dan beberapa ciri lanjutan mungkin bergantung pada pelan yang dibeli, seperti halnya dengan alat OpenAI yang lain.
Thibault Sottiaux, pengarah Codex, menjelaskan bahawa kemas kini ini Ia khususnya ditujukan kepada pembangunWalaupun niatnya adalah untuk mengembangkannya kepada khalayak yang lebih umum kemudian. Ideanya ialah pasukan teknikal akan menjadi yang pertama memanfaatkan ejen baharu dan aliran kerja automatik dan, dari semasa ke semasa, memindahkan model tersebut kepada tugas pejabat, pengurusan dokumen atau produktiviti peribadi.
OpenAI menekankan bahawa penggunaan kuasa pengkomputeran dan memori dilaksanakan dengan pendekatan pematuhan keselamatan dan peraturanIni amat relevan di Kesatuan Eropah dan United Kingdom. Atas sebab ini, ciri penyesuaian lanjutan, cadangan kontekstual, memori berterusan dan kawalan sistem pengendalian langsung akan mengambil masa yang lebih lama untuk tersedia di pasaran ini.
Walau apa pun, syarikat itu menegaskan bahawa evolusi Codex ini membuka pintu kepada aplikasi super desktop yang tertumpu pada automasi pintardi mana ejen AI bukan sahaja membantu menulis kod, tetapi juga menyelaras tugas, menyesuaikan diri dengan gaya kerja pengguna dan memastikan projek yang kompleks berjalan untuk tempoh yang lama. Bagi pembangun perisian di Eropah, mesejnya jelas: keupayaan baharu akan datang, tetapi dengan pelarasan yang diperlukan agar sesuai dengan rangka kerja kawal selia sedia ada.