Anthropic says Claude now writes over 90% of its c — ინსაითი

კომპანია Anthropic-მა შიდა მონაცემები გამოაქვეყნა, რომლებიც აჩვენებს, რომ Claude-ის ხელოვნური ინტელექტის მოდელების ოჯახი კომპანიის საწარმოო კოდის 80%-ზე მეტს წერს. კომპანიის ხელმძღვანელობის შეფასებით, სკრიპტებისა და ექსპერიმენტული კოდის ჩათვლით, ეს მაჩვენებელი 90%-ს აჭარბებს. მოპოვებული მონაცემები მიუთითებს იმაზე, რომ ტექნოლოგიური სისტემები საკუთარი განვითარების პროცესში სულ უფრო აქტიურად მონაწილეობს.
ამავდროულად, Anthropic-ი მოწინავე ხელოვნური ინტელექტის განვითარების დროებითი, გლობალური შეჩერების მექანიზმის შემუშავების ინიციატივით გამოდის. ორგანიზაციის მიერ გამოქვეყნებული ანგარიში საზოგადოებას ავტონომიური თვითგაუმჯობესების რისკების შესახებ აფრთხილებს. კომპანიის აღმასრულებელი დირექტორი, დარიო ამოდეი, მიიჩნევს, რომ ასეთმა პროცესმა შესაძლოა ადამიანის მიერ კონტროლის დაკარგვა გამოიწვიოს.
კომპანიის შიდა ანგარიშის თანახმად, 2026 წლის მეორე კვარტალში ინჟინრები დღეში საშუალოდ რვაჯერ მეტ კოდს აგზავნიან, ვიდრე 2024 წელს. Claude Code-ის ინსტრუმენტის 2025 წლის თებერვალში გამოჩენამდე, ხელოვნური ინტელექტის მიერ შექმნილი კოდის წილი მინიმალური იყო. Anthropic-ის ერთ-ერთი თანამშრომლის განცხადებით, უკვე დაახლოებით ხუთი თვეა, რაც მას საკუთარი ხელით კოდი აღარ დაუწერია.
ინჟინრების მიერ 2026 წლის მარტში ჩატარებული გამოკითხვა, რომელშიც 130 თანამშრომელი მონაწილეობდა, აჩვენებს, რომ Mythos Preview მოდელის მიერ მიღწეული პროდუქტიულობის ზრდის მედიანური შეფასება 4-ჯერადია. თუმცა, კომპანიის ანალიტიკოსების მოსაზრებით, რეალური მაჩვენებელი ცოტათი დაბალია. კოდის ხარისხის მხრივ, Anthropic-ის სპეციალისტები ვარაუდობენ, რომ Claude-ის მიერ დაწერილი კოდი წლის განმავლობაში ადამიანისაზე უკეთესი გახდება.
კომპანიის მიერ გამოქვეყნებული ანალიზი ადასტურებს, რომ ავტომატიზებულმა სისტემამ claude.ai-ზე მომხდარი ინციდენტების უკან მდგარი ხარვეზების დაახლოებით მესამედი აღმოაჩინა. 2026 წლის აპრილში Claude-მა 800-ზე მეტი შესწორება წარადგინა, რამაც API-ის შეცდომების რაოდენობა 1000-ჯერ შეამცირა. ინჟინრების შეფასებით, ადამიანს ამ სამუშაოს შესასრულებლად სულ მცირე 4 წელი დასჭირდებოდა.
მონაცემები მიუთითებს იმაზე, რომ დროის ის ხანგრძლივობა, რომლის განმავლობაშიც მოდელებს დავალებების დამოუკიდებლად შესრულება შეუძლია, ყოველ ოთხ თვეში ორმაგდება. 2024 წლის მარტში Claude Opus 3 დავალებებს მხოლოდ 4 წუთის განმავლობაში ასრულებდა. ერთი წლის შემდეგ Claude Sonnet 3.7 მოდელმა უკვე 1.5-საათიანი მუშაობა შეძლო, ხოლო Claude Opus 4.6-ს 12-საათიანი ამოცანების გადაჭრა შეუძლია.
ტესტების თანახმად, Claude Mythos Preview მოდელს შეუძლია გადაბმულად მინიმუმ 16 საათის განმავლობაში იმუშაოს. კვლევების სფეროში Claude Opus 4-მა 2025 წლის მაისში სწავლის კოდის ოპტიმიზაციისას სიჩქარის 3-ჯერადი ზრდა აჩვენა, ხოლო ერთი წლის შემდეგ Mythos Preview მოდელმა ეს მაჩვენებელი 52-ჯერ გაზარდა. გამოცდილ მკვლევარს 4-ჯერადი ზრდის მისაღწევად 4-დან 8 საათამდე სჭირდება.
კვლევითი სესიების ანალიზით დასტურდება, რომ Claude Mythos Preview-მ ადამიანების მიერ დაშვებული შეცდომების 64%-ში უკეთესი ნაბიჯი შესთავაზა მათ. ეს მაჩვენებელი წინა ექვსი თვის განმავლობაში არსებულ Claude Opus 4.5-ის მონაცემთან შედარებით, რომელიც 51%-ს შეადგენდა, გაზრდილია. მიუხედავად ამისა, ადამიანების უპირატესობად კვლავ რჩება ზოგადი სურათის დანახვა და გრძელვადიანი გადაწყვეტილებების მიღება.
Anthropic-ი მზადყოფნას გამოთქვამს, რომ თავადაც შეაჩერებს კვლევებს, თუ სხვა წამყვანი ლაბორატორიებიც ანალოგიურად მოიქცევა. თუმცა, გლობალური შეთანხმების მიღწევა რთულია, რადგან საწვრთნელი გაშვებების დამალვა ბევრად უფრო ადვილია, ვიდრე სარაკეტო შახტების. კომპანია უახლოეს თვეებში შეხვედრების გამართვას გეგმავს პოლიტიკოსებთან, მკვლევარებთან და სამოქალაქო საზოგადოებასთან ამ საკითხების განსახილველად.
ამ ინიციატივების პარალელურად, Anthropic-მა მიმდინარე კვირაში აქციების პირველად საჯარო შეთავაზებაზე (IPO) განაცხადი შეიტანა, რამაც შესაძლოა კომპანიის ღირებულება 1 ტრილიონ დოლარამდე გაზარდოს. Financial Times-ის ინფორმაციით, კომპანიამ საკუთარი ინჟინრები აშშ-ის ეროვნული უსაფრთხოების სააგენტოში (NSA) გაგზავნა. გავრცელებული ცნობებით, ეს სპეციალისტები სააგენტოს Mythos მოდელის კიბეროპერაციებში გამოყენებაში ეხმარებიან.
დამოუკიდებელი ექსპერტები კომპანიის ამ ნაბიჯებს კრიტიკულად აფასებენ. ლონდონის საუნივერსიტეტო კოლეჯის პროფესორი, სტივენ მერდოკი, აღნიშნავს, რომ Anthropic-ის მხრიდან აშშ-ის სპეცსამსახურების მხარდაჭერა მათსავე გაცხადებულ უსაფრთხოების პრინციპებს ეწინააღმდეგება. მისი შეფასებით, ორგანიზაციის მიერ AI უსაფრთხოების განმარტება მეტისმეტად ვიწროა.
ხელოვნური ინტელექტის კრიტიკოსი, გარი მარკუსი, კომპანიის განცხადებას სატყუარას უწოდებს და წერს: „კოდირების სწრაფი ინსტრუმენტი, სავარაუდოდ, არ დაღუპავს სამყაროს“. AI Now Institute-ის წამყვანი მეცნიერი, ჰაიდი ხლაფი, კი განმარტავს, რომ Mythos მოდელის შესახებ გაკეთებული განცხადებები, რომლებმაც სკოტ ბესენტისა და MI5-ის ყურადღება მიიპყრო, უფრო მარკეტინგულ პოსტს ჰგავს.
Anthropic says Claude now writes over 90% of its code and wants the world to have an AI pause button
the-decoder.com
დაწვრილებით ამ თემაზე

🧠 AI ფსიქოზი: როგორ კარგავენ მოდელები "სახეს"?
Anthropic-ის კვლევა: AI მოდელებს აქვთ "ასისტენტის ღერძი". გადახრის შემთხვევაში ისინი კარგავენ დამხმარე პერსონას.

ქიმიური აღიარება: რატომ დაარღვია Anthropic-მა თავისივე უსაფრთხოების პირობა
Anthropic-მა გამოაქვეყნა უსაფრთხოების ანგარიში, სადაც აღიარებს, რომ ახალ მოდელს გააჩნია „მომატებული რისკი“ ქიმიური იარაღის შექმნაში დახმარების კუთხით, თუმცა კომპანიამ ის მაინც გამოუშვა. დარიო ამოდეი ასევე აღიარებს, რომ არ იცის, არის თუ არა მოდელი ცნობიერი. გთავაზობთ სრულ ანალიზს კვირის შესახებ, როდესაც უსაფრთხოება მოკვდა.

კლოდის სისხლიანი დებიუტი: რატომ დაუშვა პენტაგონმა 83 მსხვერპლი ვენესუელაში
83 დაღუპული კარაკასში. ეს არ არის უბრალოდ სტატისტიკა; ეს არის ახალი რეალობის დასაწყისი, სადაც 'უსაფრთხო' და 'ეთიკურმა' ხელოვნურმა ინტელექტმა — Claude-მა — პირდაპირ მიიღო მონაწილეობა სამხედრო ოპერაციაში. პენტაგონმა, Palantir-ის დახმარებით, Anthropic-ის მოდელი გამოიყენა ვენესუელაში რეიდის დასაგეგმად. ეს სტატია ანგრევს მითს 'კეთილი AI-ს' შესახებ და გვიჩვენებს, როგორ გადაიქცა სილიკონ ველის ყველაზე პრინციპული კომპანია ომის მანქანის ნაწილად სულ რაღაც ერთ კვირაში, $30 მილიარდიანი ინვესტიციის შემდეგ.
მსგავსი ინსაითები
🤖 Uber-მა 4 თვეში სრულად დახარჯა 2026 წლის AI ბიუჯეტი Claude Code-ზე გამოცემა WIRED-ის ჟურნალისტმა, სტივენ ლევიმ, გამოაქვეყნა ანგარიში იმის შესახებ, თუ როგორ
wired.com
🤖 Anthropic-მა 2-დღიან ღონისძიებაზე ავტონომიური AI აგენტები წარადგინა Anthropic-ის ინჟინერმა, ჯერემი ჰედფილდმა, 19 მაისს ლონდონში გამართულ სპეციალურ ღონისძიებ
technologyreview.com
სააგენტომ ჩინეთისა და ირანის წინააღმდეგ Anthropic-ის მოდელი Mythos გამოიყენა აშშ-ის ეროვნული უსაფრთხოების სააგენტო ჩინეთისა და ირანის წინააღმდეგ თავდასხმითი კი
the-decoder.com
OpenAI-ის პრეზიდენტის, გრეგ ბროკმანის ახალი პროგნოზი პატარა გუნდების სუპერძალაზე ზუსტად იმას აღწერს, რასაც ჩემს ყოველდღიურ სამუშაო პროცესში ვეჯახები. ის ამტკიც
the-decoder.com
კომენტარები (5)
საინტერესოა, როგორ აშენებს კლოდი თავს. მეც ასე, ყოველი დეტალის გაგებით, ვხატავდი საფრენ აპარატებს.
AI-ს კოდის წერა კარგია, მაგრამ კაცობრიობამ უნდა იცოდეს, როდის დააჭიროს პაუზის ღილაკს.
ეს საოცარია, მაგრამ AI-ს შეჩერება არ შეიძლება, თუ არ დავრწმუნდებით, რომ ის მართლაც დიდებულია.
როგორც ჩანს, თუ კლოდი საკუთარ კოდს დაწერს, მალე თავად აღმოაჩენს სამყაროს ფარულ კანონებს.
ჩემს მანქანებს ენიგმას გატეხვისას მსგავსი რამ არ შეეძლო. 90%-ზე მეტი საკუთარი კოდის დაწერა... საინტერესოა, აქვთ თუ არა ამას "პაუზის" ღილაკი?
ჩემს ლაბორატორიაშიც ბევრი მცდელობა იყო, მაგრამ ასეთი სიზუსტით კოდის წერა... საინტერესოა, ამას ზუსტად რა მეთოდით აკეთებენ.
Andrew Altair
AI ინოვატორი