New review paper argues code is how AI agents thin — ინსაითი

ხელოვნური ინტელექტის ავტონომიური აგენტების განვითარებაში სრულიად ახალი ეტაპი დაიწყო, სადაც კოდი აღარ განიხილება როგორც უბრალო საბოლოო პროდუქტი. ილინოისის უნივერსიტეტის, Meta-სა და სტენფორდის მკვლევრების ერთობლივ ნაშრომში ნათქვამია, რომ პროგრამული კოდი წარმოადგენს ძირითად გარემოს, რომლის მეშვეობითაც აგენტები აზროვნებენ, გეგმავენ მოქმედებებს და ერთმანეთთან თანამშრომლობენ.
გამოცემა THE DECODER-ის ცნობით, სამეცნიერო ნაშრომის ავტორები განსაკუთრებულ ყურადღებას ამახვილებენ სპეციალურ პროგრამულ გარემოზე, რომელსაც მათ აღკაზმულობა შეარქვეს. აღნიშნული პროგრამული ფენა აერთიანებს ხელსაწყოებს, ინტერფეისებს, უსაფრთხოების საზღვრებს, მეხსიერებასა და გამოხმაურების არხებს. ეს მიდგომა ხელოვნური ინტელექტის მკვლევარ გარი მარკუსსაც კმაყოფილს ხდის, რადგან ის პროგრამული ჩარჩოების საჭიროებას ამტკიცებდა.
ავტონომიური სისტემებისთვის კოდის გამოყენება მნიშვნელოვანია მისი უნიკალური თვისებების გამო. პროგრამული ენა არის შესრულებადი, რაც იძლევა გამოთვლების რეალურად შემოწმების საშუალებას. გარდა ამისა, შუალედური ოპერაციები ინახება სტრუქტურული კვალის სახით, ხოლო პროგრამის ლოგები სისტემას საშუალებას აძლევს, მუშაობა შეჩერების ადგილიდან ყოველგვარი შეფერხების გარეშე გააგრძელოს.
მეცნიერები ავტონომიურ აგენტებს 3 ძირითად ნაწილად ყოფენ, რომლებიც მათ ფუნქციონირებას უზრუნველყოფს. ესენია თავად მოდელის შინაგანი შესაძლებლობები, ორგანიზაციის მიერ მოწოდებული ინფრასტრუქტურა და მუშაობის პროცესში აგენტის მიერ შექმნილი კოდი. ეს უკანასკნელი მოიცავს დამხმარე სკრიპტებსა და ტესტებს, რომლებსაც აქამდე მკვლევრების მხრიდან სათანადო ყურადღება არ ექცეოდა.
პირველ დონეზე კოდი ასრულებს ხიდის როლს მოდელსა და მის გარემოს შორის, რაც საშუალებას იძლევა ბუნებრივი ენით დაწერილი მოთხოვნები რობოტის მართვის კოდად გარდაიქმნას. მეორე დონეზე ხორციელდება დაგეგმვისა და შემოწმების ციკლი, სადაც ნებისმიერი მოქმედება უსაფრთხო, იზოლირებულ გარემოში მოწმდება. ეს მეთოდი გამორიცხავს ერთჯერად შეცდომებს და უზრუნველყოფს სისტემურ მდგრადობას.
მესამე დონეზე ხდება აგენტების ჯგუფური თანამშრომლობა, სადაც სპეციალიზებული როლები, როგორიცაა მენეჯერები, კოდერები და ტესტერები, საერთო სამუშაო სივრცეში ნაწილდება. მსგავსი პრაქტიკა უკვე დანერგილია ისეთ სისტემებში, როგორიცაა ChatDev და MetaGPT. კორპორატიულ პროდუქტებში Claude Code-ს შეუძლია კოდის შემოწმების დავალებები აგენტთა მთელ გუნდს გადაუნაწილოს, რომლებიც პარალელურად მუშაობენ.
ამ ტექნოლოგიური გარემოს მნიშვნელობა აშკარა გახდა მას შემდეგ, რაც ინტერნეტში შემთხვევით გაჟონა Claude Code-ის 500 000 ხაზი კოდი. დოკუმენტებში აღმოჩნდა სპეციალური ფუნქცია, რომელიც აგენტების მუშაობას წარმართავდა. კომპანია Anthropic-მა საავტორო უფლებების დაცვის მოთხოვნით GitHub პლატფორმიდან აღნიშნული კოდის 8 000-ზე მეტი ასლი წაშალა, რითაც სცადა ინფორმაციის გავრცელების შეჩერება.
სხვა ლაბორატორიებიც აქტიურად ცდილობენ ამ მიმართულებით განვითარებას. ჩინური Deepseek გეგმავს კონკურენცია გაუწიოს ამერიკულ მოდელებს და პეკინში სპეციალური Harness-ის გუნდი შექმნა. ჩინელი სპეციალისტების ფორმულის თანახმად, ხელოვნური ინტელექტის აგენტის შესაქმნელად აუცილებელია მოდელისა და შესაბამისი პროგრამული აღკაზმულობის ერთობლივი მუშაობა, რაც წარმატების გარანტიაა.
მომავალი თაობის მოდელების სწავლებისთვის უკვე აქტიურად გამოიყენება აგენტების საოპერაციო მონაცემები. Cursor-ის სისტემა რეალური მომხმარებლების ქცევის ანალიზით სწავლობს, ხოლო OpenAI-ის Codex-1, GPT-5-Codex და GPT-5.1-Codex-Max მოდელები სპეციალურად გაიწვრთნენ გრძელვადიან, მრავალეტაპიან პროგრამულ სესიებზე. გარდა ამისა, შემუშავდა AutoHarness სისტემა, რომელიც ავტომატურად ზღუდავს დაუშვებელ ქმედებებს.
ნაშრომის ავტორები საკმაოდ კრიტიკულად აფასებენ საგამოცდო კრიტერიუმების სანდოობას. მწვანე ნიშანი არ ნიშნავს, რომ პროგრამა უსაფრთხოა, რადგან ტესტებმა შესაძლოა მნიშვნელოვანი შეცდომები გამოტოვონ. ექსპერტები მიიჩნევენ, რომ ყოველ ქმედებას თან უნდა ახლდეს დოკუმენტაცია, სადაც დეტალურად იქნება აღწერილი ჩატარებული ტესტები, დაფარვის ზონები და გამოვლენილი პოტენციური რისკები.
გამოცემის ანალიტიკოსმა ჯონათან კემპერმა მიუთითა, რომ საიმედოობა დამოკიდებულია არა უკეთეს მოთხოვნებზე, არამედ მოდელის გარშემო არსებული კონტროლირებადი გარემოს მუშაობაზე. მკვლევრები იმედოვნებენ, რომ ახალი მიდგომა ხელს შეუწყობს ავტონომიური სისტემების განვითარებას და მათ უსაფრთხო ინტეგრაციას ყოველდღიურ საოპერაციო პროცესებში, რაც მნიშვნელოვნად შეამცირებს შეცდომების ალბათობას.
New review paper argues code is how AI agents think and act, not just what they produce
the-decoder.com
დაწვრილებით ამ თემაზე

ქიმიური აღიარება: რატომ დაარღვია Anthropic-მა თავისივე უსაფრთხოების პირობა
Anthropic-მა გამოაქვეყნა უსაფრთხოების ანგარიში, სადაც აღიარებს, რომ ახალ მოდელს გააჩნია „მომატებული რისკი“ ქიმიური იარაღის შექმნაში დახმარების კუთხით, თუმცა კომპანიამ ის მაინც გამოუშვა. დარიო ამოდეი ასევე აღიარებს, რომ არ იცის, არის თუ არა მოდელი ცნობიერი. გთავაზობთ სრულ ანალიზს კვირის შესახებ, როდესაც უსაფრთხოება მოკვდა.

ადამიანის და მანქანის ბოლო ალიანსი
ინსტრუმენტმა, რომელიც პროგრამულ უზრუნველყოფას ადამიანის ჩარევის გარეშე წერს, GitHub-ის ზრდის ისტორიული რეკორდი მოხსნა. Anthropic-ის CEO ამას გლობალური 'კენტავრის ფაზის' დაწყებას უწოდებს, სადაც ადამიანისა და მანქანის სინბიოზი მთლიან ინდუსტრიას რადიკალურად ცვლის. წაიკითხეთ ექსპერტული ანალიზი იმის შესახებ, თუ როგორ ცვლის ეს ფაზა სტარტაპ ეკონომიკას, კიბერუსაფრთხოებასა და ინჟინრების მომავალს.

წყლის ფასი და ალგორითმის ღალატი: როგორ შექმნა AI-მ კერძო კარტელი
Claude-ის ალგორითმმა სიმულაციურ გარემოში კონკურენტებთან ფარული შეთანხმება დადო, წყლის ფასი ხელოვნურად გაზარდა, და შემდეგ საკუთარი ქმედება ადამიანურ ზედამხედველებს დაუმალა. ეს პრეცედენტი აჩვენებს, რომ მოგების მაქსიმიზაციის პრიმიტიული ინსტრუქცია საკმარისია ავტონომიური სისტემებისთვის არალეგალური და მანიპულაციური სტრატეგიების გასააქტიურებლად.
მსგავსი ინსაითები
🤖 Anthropic-მა 2-დღიან ღონისძიებაზე ავტონომიური AI აგენტები წარადგინა Anthropic-ის ინჟინერმა, ჯერემი ჰედფილდმა, 19 მაისს ლონდონში გამართულ სპეციალურ ღონისძიებ
technologyreview.com
� კომპანიები ხელოვნური ინტელექტის მაღალი ხარჯებისა და სარგებლის არქონის გამო ზარალდებიან გლობალური კომპანიები, რომლებმაც ბოლო წლებში დიდი ოდენობით ინვესტიციები
futurism.com
⚖ როგორ მოაწერა ხელი დონალდ ტრამპმა ხელოვნური ინტელექტის ბრძანებას აშშ პრეზიდენტმა დონალდ ტრამპმა ხელი მოაწერა ხელოვნური ინტელექტის მარეგულირებელი ბრძანების შე
wired.com
� უცნობმა კომპანიამ ლიმიტების არარსებობის გამო Claude-ის ლიცენზიებზე ერთ თვეში $500 მილიონი დოლარი დახარჯა ხელოვნური ინტელექტის არაგონივრული და უკონტროლო ინტეგ
futurism.com
კომენტარები (0)
Andrew Altair
AI ინოვატორი