OpenAI posodablja Codex z računalniškim in pomnilniškim nadzorom

  • Codex se integrira z računalnikom: nadzoruje namizne aplikacije, si ogleduje zaslon in uporablja svoj kazalec, ne da bi pri tem prekinjal uporabnika.
  • Agent uporablja nov pomnilnik, ponovno uporablja pogovore in avtomatizira dolgoročne naloge z več agenti, ki delajo vzporedno.
  • Vključuje integriran brskalnik, ustvarjanje slik z gpt-image-1.5 in izboljšano podporo za delovne procese razvijalcev.
  • Posodobitev bo najprej na voljo v sistemu macOS; v Evropi in Združenem kraljestvu so nekatere funkcije zaradi predpisov o podatkih odložene.

Posodobitev kodeksa z računalniškim nadzorom

OpenAI je naredil še en korak pri integraciji umetna inteligenca z vsakodnevno uporabo računalnika s popolno prenovo Codexa, svojega namiznega kodnega agenta. Orodje, ki je bilo prej znano predvsem po svoji programski pomoči, zdaj postaja pomočnik, ki je sposoben skoraj brezhibno upravljati aplikacije, si zapomniti nastavitve in upravljati projekte.

S to posodobitvijo podjetje, ki ga vodi Sam Altman, približuje svoj načrt za ustanovitev Namizna »super aplikacija«, ki združuje ChatGPT, Codex in vaš brskalnik AtlasNamen poteze je poenostaviti uporabniško izkušnjo, osredotočiti vire v enem samem delovnem prostoru in se kosati s tekmeci, kot je Anthropic, zlasti na področju razvoja programske opreme in napredne avtomatizacije.

Codex se nauči uporabljati računalnik kot kateri koli drug uporabnik

Ena najbolj presenetljivih sprememb je, da lahko Codex zdaj upravljajte računalnik v ozadjuAgent lahko vidi, kaj je na zaslonu, premika svoj kazalec, klika, tipka besedilo in se odziva na dogajanje v nameščenih aplikacijah, ne da bi pri tem prekinjal uporabnikovo delovanje z miško ali tipkovnico.

Ta zmožnost omogoča sodelovanje več agentov Codexa. vzporedno v isti ekipiTo vključuje izvajanje testov, spreminjanje konfiguracij ali izvajanje ponavljajočih se nalog, medtem ko oseba nadaljuje s svojimi običajnimi dejavnostmi. To odpira vrata avtomatizaciji delovnih procesov, ki so prej zahtevali stalen nadzor, kot je na primer testiranje aplikacije po vsaki spremembi kode ali ponavljanje dejanj vmesnika.

OpenAI predlaga to funkcijo kot način delovanja asistenta orodja, ki nimajo API-ja ali neposredne integracije, kar je običajno v mnogih namiznih programih. Codex lahko s tem, ko »vidi« zaslon in nadzoruje kazalec, komunicira s temi aplikacijami tako kot bi to storil človeški uporabnik, čeprav zaenkrat na nadzorovan način in s posebnim poudarkom na varnosti.

Po navedbah podjetja je uporaba računalnika sprva na voljo v macOS prek namizne aplikacije Codex, povezan z računom ChatGPT. Različica za Windows bo na voljo kasneje, ko bo preizkušena zmogljivost in funkcije prilagojene Microsoftovemu okolju.

V primeru Evrope in Združenega kraljestva je OpenAI potrdil, da računalniško upravljanje, napredno prilagajanje, kontekstualni predlogi in pomnilnik Aktivirane bodo pozneje. Razlog za to je potreba po prilagoditvi teh funkcij predpisom o varstvu podatkov, kar je še posebej zahtevna zahteva v Evropski uniji in na britanskem trgu.

Codex s pomnilnikom in upravljanjem prek aplikacije

Integriran brskalnik in neposredno delo na spletnih straneh

Posodobitev krepi tudi odnos Codexa s spletom zaradi ... brskalnik, integriran v samo aplikacijoNamesto preprostega prejemanja generičnih besedilnih navodil lahko agent prejema ukaze neposredno na določenih elementih strani.

Pri razvoju frontenda lahko na primer uporabnik Izberite spletno komponento in opišite spremembo. Uporabnik želi nekaj storiti (na primer spremeniti barvo, velikost besedila ali postavitev bloka), Codex pa razume navodilo znotraj tega specifičnega vizualnega konteksta. S tem se izognemo pisanju dolgih pozivov, ki pojasnjujejo, kateri del spletnega mesta je treba spremeniti.

Ta vgrajeni brskalnik omogoča tudi Codex Analizirajte vsebino, zberite informacije in jih uporabite kot kontekst Za druga opravila, kot so dokumentiranje kode, pregled specifikacij izdelkov ali primerjava tehnične dokumentacije, se vse izvaja v istem okolju, brez potrebe po preklapljanju med več okni operacijskega sistema.

Ustvarjanje in urejanje slik z gpt-image-1.5

Drug steber nove različice Codexa je integracija modela gpt-image-1.5 za ustvarjanje in spreminjanje slik Agent lahko v sami namizni aplikaciji ustvari grafikone, diagrame, makete ali vizualne skice iz besedila ali pa združevanjem navodil s posnetki zaslona in delčki kode.

Ta zmogljivost je namenjena neposredno ekipam, ki delajo v oblikovanje izdelkov, uporabniški vmesniki ali prototipi videoigerRazvijalec lahko na primer posname posnetek zaslona napol dokončanega vmesnika, prosi Codex, naj predlaga prenovo menija ali novo barvno shemo, in dobi ustvarjene slike, ki ustrezajo temu kontekstu, ne da bi moral spreminjati orodja.

Ker je vse v Codexu centralizirano, lahko agenti združevanje nalog kodiranja in oblikovanjaNapišite logiko funkcionalnosti, posodobite ustrezni vmesnik in ustvarite vizualni model za predstavitev ekipi, ne da bi zapustili delovni tok ali odprli zunanje aplikacije za urejanje grafike.

Spomin, kontekst in avtomatizacija dolgoročnih nalog

Poleg računalniškega nadzora in ustvarjanja slik je glavni cilj OpenAI s to različico opremiti Codex z ... vztrajni spomin in veliko širše upravljanje kontekstaOrodje lahko ponovno uporabi prejšnje pogovore, ohrani pomembne informacije in jih po potrebi prikliče za nadaljevanje projekta.

Funkcija pomnilnika, ki je na voljo v predogledni različici, omogoča Codexu zapomniti si osebne nastavitve, pogoste popravke ali podatke, ki jih je bilo težko zbratiTo vključuje vse od tipičnega tehnološkega sklada ekipe do organizacije map, najpogosteje uporabljenih oblik poročil in oznak, ki se običajno uporabljajo na GitHubu za določene vrste težav.

S tem zbranim kontekstom lahko agent proaktivno predlagati nalogeTo se lahko uporabi za predlaganje nadaljevanja nedokončanega projekta, priporočilo čakajočega preoblikovanja ali obveščanje uporabnikov o dolgotrajnih zahtevah za prevzem. Nekatera podjetja ga že uporabljajo za sledenje pogovorom v Slacku, Gmailu ali Notionu in za odzivanje na določene dogodke.

Kodeks lahko tudi načrtujte delo za prihodnost in se ponovno samostojno aktivirajte za dokončanje dolgoročnih nalog. Na primer, lahko upravlja čakalno vrsto pregledov kode več dni ali tednov, obravnava komentarje in posodablja dokumentacijo, ne da bi moral razvijalec to nenehno spremljati.

Več kot 90 dodatkov in izboljšana podpora za razvijalce

Za dokončanje spremembe je OpenAI dodal skoraj 90 novih vtičnikov CodexSem spadajo integracije z Microsoft Suite, GitLab Issues, Neon by Databricks, Render in Superpowers ter podpora za strežnike MCP (Model Context Protocol). Cilj je agentu zagotoviti več kontekstnih virov in večje operativne zmogljivosti.

Zahvaljujoč tem vtičnikom lahko Codex zbiranje informacij iz različnih služb in ukrepanje na podlagi njih Iz enega samega delovnega prostora lahko pregledujete težave v GitLabu, poizvedujete po podatkih v okolju Databricks, posodabljate dokumente Officea ali komunicirate s storitvami uvajanja, ne da bi uporabnika silili v preklapljanje med platformami.

Na povsem tehnični ravni posodobitev krepi tipični delovni tokovi razvijalcevZdaj vam Codex pomaga pregledovati zahteve za vlečenje, upravljati več zavihkov terminala hkrati, se povezovati z oddaljenimi razvojnimi okolji prek SSH in odpirati datoteke z bogatimi predogledi, pa naj gre za PDF-je, preglednice, predstavitve ali dokumente v drugih oblikah.

Vse to je skoncentrirano v enotni izkušnji, ki po besedah ​​samega OpenAI omogoča hitrejši napredek. v vseh fazah življenjskega cikla programske opremeOd pisanja začetne kode do testiranja, uvajanja, dokumentiranja in vzdrževanja, pri čemer agenti umetne inteligence nenehno sodelujejo v istem namiznem okolju.

Razpoložljivost, osredotočenost na razvijalce in razmere v Evropi

Nova različica Codexa se že uvaja v namizna aplikacija za macOS Za tiste, ki se prijavijo z računom ChatGPT. Vse funkcije ne zahtevajo iste vrste naročnine, nekatere napredne funkcije pa so lahko odvisne od kupljenega paketa, kot je to primer pri drugih orodjih OpenAI.

Thibault Sottiaux, direktor Codexa, je pojasnil, da je ta posodobitev Še posebej je namenjen razvijalcemČeprav je namen, da se kasneje razširi na širše občinstvo. Ideja je, da bodo tehnične ekipe prve izkoristile prednosti novih agentov in avtomatiziranih delovnih procesov ter sčasoma ta model prenesle na pisarniška opravila, upravljanje dokumentov ali osebno produktivnost.

OpenAI poudarja, da se uporaba računalniške moči in pomnilnika izvaja z pristop k varnosti in skladnosti s predpisiTo je še posebej pomembno v Evropski uniji in Združenem kraljestvu. Zaradi tega bodo napredne funkcije prilagajanja, kontekstualni predlogi, trajni pomnilnik in neposreden nadzor operacijskega sistema na teh trgih na voljo šele čez nekaj časa.

V vsakem primeru podjetje vztraja, da ta razvoj Codexa odpira vrata ... namizna superaplikacija, osredotočena na inteligentno avtomatizacijokjer agenti umetne inteligence ne pomagajo le pri pisanju kode, temveč tudi usklajujejo naloge, se prilagajajo uporabnikovemu slogu dela in ohranjajo kompleksne projekte v teku dlje časa. Za razvijalce programske opreme v Evropi je sporočilo jasno: prihajajo nove zmogljivosti, vendar s potrebnimi prilagoditvami, ki jih je treba prilagoditi obstoječemu regulativnemu okviru.