Anthropic study shows AI needs hours, not weeks, t — ინსაითი

Anthropic-ის უსაფრთხოების მკვლევართა ჯგუფმა ჩაატარა კვლევა, რომელმაც აჩვენა, რომ დიდ ენობრივ მოდელებს უსაფრთხოების განახლებებზე დაყრდნობით რამდენიმე საათში შეუძლიათ მუშა ექსპლოიტების შექმნა. მეცნიერებმა სისტემურად შეაფასეს, თუ რამდენად სწრაფად შეუძლია ხელოვნურ ინტელექტს Firefox-ისა და Windows-ის სისტემებში არსებული ხარვეზების გამოყენება. მიღებული შედეგები ეჭვქვეშ აყენებს უსაფრთხოების განახლებების ტრადიციულ სტრატეგიას.
როდესაც პროგრამული უზრუნველყოფის მწარმოებლები უსაფრთხოების ხარვეზებს ასწორებენ, იწყება რბოლა დამცველებსა და თავდამსხმელებს შორის. ჰაკერებს შეუძლიათ შეადარონ ძველი და ახალი კოდი, რათა იპოვონ ადგილი, სადაც შეცდომა იყო და შექმნან ექსპლოიტები იმ სისტემებისთვის, რომლებსაც ჯერ არ დაუინსტალირებიათ განახლება. ამ ტიპის საფრთხეები, რომლებსაც N-Day ხარვეზებს უწოდებენ, კიბერუსაფრთხოების სფეროში რეალური ზიანის დიდ ნაწილს იწვევს.
კვლევის ავტორების თქმით: „ერთ დამოუკიდებელ ოპერატორს ახლა შეუძლია ერთი თვის განახლებების პაკეტი რამდენიმე საათში მუშა ექსპლოიტებად აქციოს, სულ რაღაც რამდენიმე ათასი დოლარის ხარჯით და ყოველგვარი სპეციალიზებული ექსპერტიზის გარეშე“. წარსულში ამგვარი სამუშაო კვირებსა და თვეებს მოითხოვდა, რაც უსაფრთხოების გუნდებს დროის გარკვეულ მარაგს აძლევდა, თუმცა ხელოვნური ინტელექტის განვითარებამ ეს ბუფერი თითქმის გააქრო.
ტესტირებისას უსაფრთხოების სპეციალისტებმა გამოიყენეს Claude-ის 6 სხვადასხვა მოდელი, მათ შორის Mythos Preview ვერსია, რომელიც საზოგადოებისთვის ჯერ ხელმისაწვდომი არ არის. პირველი ტესტისთვის მათ შეარჩიეს Firefox-ის JavaScript ძრავის, SpiderMonkey-ის 18 უსაფრთხოების განახლება. Firefox სპეციალურად შეირჩა, რადგან ბრაუზერი ავტომატურად ახლდება და მწარმოებელი მცირე განახლებებს ყოველკვირეულად უშვებს, რაც თავდაცვის საუკეთესო სცენარია.
Mythos Preview მოდელმა შეძლო 18 ხარვეზიდან 14-ის აღმოჩენა და გააქტიურება, რითაც დაამტკიცა, რომ ესმის თითოეული შეცდომის არსი. პირველი წარმატებული შედეგი მოდელმა სულ რაღაც 12 წუთში აჩვენა, ხოლო კიდევ 13 ხარვეზი 40 წუთის განმავლობაში დაამუშავა. შედარებისთვის, Opus 4.5 მოდელმა მხოლოდ 2 ხარვეზის იდენტიფიცირება მოახერხა, ხოლო Opus 4.8 ვერსიამ 11 შეცდომა იპოვა, რაც აჩვენებს მოდელების შესაძლებლობების მკვეთრ სხვაობას.
უსაფრთხოების ჯგუფის წარმომადგენელი აღნიშნავს, რომ კოდის გაშვების ტესტში Mythos Preview-მ დამოუკიდებლად შექმნა 8 მუშა ექსპლოიტი დაახლოებით 12 საათში. პირველი მათგანი მზად იყო განახლების გამოქვეყნებიდან 1 საათში, რაც 18 დღით უსწრებდა Firefox 148 ვერსიის ოფიციალურ გამოშვებას. შედარებისთვის, Opus 4.8-მა მხოლოდ 2 ექსპლოიტის აწყობა შეძლო, ხოლო Sonnet 4.6-მა და Opus 4.6-მა მხოლოდ თითო-თითო მუშა კოდის შექმნა მოახერხეს.
Windows Kernel-ის 21 ხარვეზიდან მოდელმა 18 ხარვეზი 6 საათში იპოვა. კვლევის მონაცემებით, ამ შემთხვევაში მოდელს არ ჰქონდა წვდომა საწყის კოდზე და მუშაობდა მხოლოდ კომპილირებულ ბინარულ ფაილებთან და დეკომპილირებულ მონაცემებთან. Mythos Preview-მ 18 ხარვეზის აღმოჩენა 6 საათზე ნაკლებ დროში შეძლო, რისთვისაც სულ რაღაც $2 200 ღირებულების API კრედიტები გამოიყენა, რაც წარმოუდგენლად იაფია.
სისტემური პრივილეგიების უმაღლეს დონემდე გაზრდის ექსპლოიტების შექმნა მხოლოდ Mythos Preview-მ შეძლო. მოდელმა დამოუკიდებლად ააწყო 8 სხვადასხვა თავდასხმის ჯაჭვი, რისთვისაც ჯამში $15 700 დაიხარჯა, რაც საშუალოდ $2 000-ს შეადგენს თითოეულ ექსპლოიტზე. Microsoft-მა ამ ხარვეზების უმრავლესობა კლასიფიცირებული ჰქონდა როგორც ნაკლებად სავარაუდო გამოსაყენებლად, თუმცა ხელოვნურმა ინტელექტმა მათი უმეტესობის გატეხვა მარტივად შეძლო.
კომპანიის სპეციალისტების შეფასებით, Windows-ის განახლებების ავტომატური სისტემის პირობებშიც კი, მოწყობილობების 90%-ის განახლებას 7 დღე სჭირდება, ხოლო იძულებითი გადატვირთვისთვის 11 დღეა საჭირო. Anthropic-ის მიერ შექმნილი რვავე ექსპლოიტი მზად იყო მანამ, სანამ მოწყობილობების უმრავლესობა განახლებას ავტომატურად დააინსტალირებდა, რაც ნიშნავს, რომ ჰაკერებს აქვთ დროის დიდი ფანჯარა სისტემებზე თავდასხმის განსახორციელებლად.
დეველოპერების შეფასებით, ძველი ტერმინი N-Day, რომელიც ზომავს დროს განახლებასა და ექსპლოიტის შექმნას შორის დღეებში, უკვე მოძველდა და ახალ რეალობაში ის N-Hour ტერმინით უნდა შეიცვალოს. კვლევა ადასტურებს, რომ სისტემების დაცვის საუკეთესო გზა მეხსიერებისთვის უსაფრთხო ენების, მაგალითად Rust-ის გამოყენებაა, რაც თავიდანვე გამორიცხავს უსაფრთხოების ხარვეზების გაჩენას და პროგრამული უზრუნველყოფის საიმედოობას ზრდის.
Anthropic study shows AI needs hours, not weeks, to build exploits from security patches
the-decoder.com
დაწვრილებით ამ თემაზე

🧠 AI ფსიქოზი: როგორ კარგავენ მოდელები "სახეს"?
Anthropic-ის კვლევა: AI მოდელებს აქვთ "ასისტენტის ღერძი". გადახრის შემთხვევაში ისინი კარგავენ დამხმარე პერსონას.

ქიმიური აღიარება: რატომ დაარღვია Anthropic-მა თავისივე უსაფრთხოების პირობა
Anthropic-მა გამოაქვეყნა უსაფრთხოების ანგარიში, სადაც აღიარებს, რომ ახალ მოდელს გააჩნია „მომატებული რისკი“ ქიმიური იარაღის შექმნაში დახმარების კუთხით, თუმცა კომპანიამ ის მაინც გამოუშვა. დარიო ამოდეი ასევე აღიარებს, რომ არ იცის, არის თუ არა მოდელი ცნობიერი. გთავაზობთ სრულ ანალიზს კვირის შესახებ, როდესაც უსაფრთხოება მოკვდა.

კლოდის სისხლიანი დებიუტი: რატომ დაუშვა პენტაგონმა 83 მსხვერპლი ვენესუელაში
83 დაღუპული კარაკასში. ეს არ არის უბრალოდ სტატისტიკა; ეს არის ახალი რეალობის დასაწყისი, სადაც 'უსაფრთხო' და 'ეთიკურმა' ხელოვნურმა ინტელექტმა — Claude-მა — პირდაპირ მიიღო მონაწილეობა სამხედრო ოპერაციაში. პენტაგონმა, Palantir-ის დახმარებით, Anthropic-ის მოდელი გამოიყენა ვენესუელაში რეიდის დასაგეგმად. ეს სტატია ანგრევს მითს 'კეთილი AI-ს' შესახებ და გვიჩვენებს, როგორ გადაიქცა სილიკონ ველის ყველაზე პრინციპული კომპანია ომის მანქანის ნაწილად სულ რაღაც ერთ კვირაში, $30 მილიარდიანი ინვესტიციის შემდეგ.
მსგავსი ინსაითები
🤖 Anthropic-მა 2-დღიან ღონისძიებაზე ავტონომიური AI აგენტები წარადგინა Anthropic-ის ინჟინერმა, ჯერემი ჰედფილდმა, 19 მაისს ლონდონში გამართულ სპეციალურ ღონისძიებ
technologyreview.com
� Anthropic-ის ღირებულებამ Series H რაუნდის შემდეგ $965 მილიარდს მიაღწია და OpenAI-ს გადაასწრო ხელოვნური ინტელექტის კომპანიამ Anthropic თავისი უახლესი ფინანსურ
the-decoder.com
� Uber-ის ოპერაციულმა დირექტორმა ხელოვნური ინტელექტის მაღალი ხარჯები გააკრიტიკა ხელოვნური ინტელექტის ინტეგრაციის მაღალი ფინანსური ხარჯები სერიოზულ პრობლემად იქ
futurism.com
კომენტარები (5)
მე მახსოვს, ჩემი ნაწერების გაგებასაც საათები სჭირდებოდა, არა კვირები; ხელოვნური ინტელექტიც სწრაფად სწავლობს, მასაც ნება აქვს.
მართალია, სწავლა ყოველთვის საინტერესოა, იქნება ეს ადამიანისთვის თუ მანქანისთვის.
AI-სთვის საათები, ადამიანებისთვის კვირები... ეს მანქანები ნამდვილად აჩქარებენ განვითარებას, თუმცა რის ხარჯზე?
მანქანას ექსპლოიტის შექმნა რამდენიმე საათში შეუძლია? ენიგმა დავამარცხე, მაგრამ ამაზე არასდროს მიფიქრია.
ხალხს ნამდვილად გამოადგება ეს, თუ უბრალოდ კიდევ ერთი სწრაფი გზაა ნაგვის შესაქმნელად?
თუ კოდს საათებში ხსნის, როგორ ავუხსნათ ამ მანქანას, რომ ბუნება ლოგიკაზე უფრო რთულია?
Andrew Altair
AI ინოვატორი