Insights

მოკლე ანალიტიკა და კომენტარები AI სამყაროდან

English →
A startup claims it broke through a bottleneck that’s holding back LLMs
technologyreview.com
ალან ტიურინგირიჩარდ ფაინმანიალბერტ აინშტაინისტივენ ჰოკინგი

🚀 AI სტარტაპმა Subquadratic-მა Transformer-ის მოდელის 10-წლიანი მათემატიკური პრობლემა გადაჭრა

მაიამიში დაფუძნებულმა ხელოვნური ინტელექტის სტარტაპმა Subquadratic-მა წარმოადგინა ახალი მათემატიკური მოდელი, რომელიც ენობრივი მოდელების სიჩქარისა და ენერგოეფექტურობის პრობლემას წყვეტს. კომპანიამ გაასაჯაროვა დამოუკიდებელი ექსპერტიზის შედეგები, რომლებიც ადასტურებს მათ მიერ შექმნილი სისტემის, SubQ-ის ეფექტურობას და მის კომერციულ პოტენციალს ბაზარზე. დამოუკიდებელი ტესტირება კომპანია Appen-მა ჩაატარა, რომელიც მსგავსი ტექნოლოგიების შეფასებაზე მუშაობს. სტარტაპის თანადამფუძნებელმა და აღმასრულებელმა დირექტორმა, ჯასტინ დენგელმა განმარტა, რომ SubQ მოდელი ბევრად უფრო იაფია და ნაკლებ ენერგიას მოიხმარს, ვიდრე ბაზარზე არსებული სხვა ანალოგები. მისი თქმით, ეს ტექნოლოგია მომავალში სრულად ჩაანაცვლებს ტრადიციულ არქიტექტურას, რომელიც დღეს დიდ ხარჯებთან არის დაკავშირებული. კომპანიის თანადამფუძნებელმა და ტექნიკურმა დირექტორმა, ალექს უედონმა აღნიშნა: „ჩვენ ველოდით ჯანსაღ სკეპტიციზმს ინდუსტრიის მხრიდან. ამიტომ, ახლა დროს ვუთმობთ იმას, რომ ნებისმიერი ახალი შედეგი სრულად გადამოწმდეს და დადასტურდეს, სანამ მას საჯაროდ გამოვაქვეყნებთ.“ უედონის განცხადებით, ეს მიდგომა მათ ეხმარება მომხმარებლების ნდობის მოპოვებასა და ბაზარზე საკუთარი პოზიციების გამყარებაში. ტრიუმფალური ენობრივი მოდელები იყენებენ dense attention მექანიზმს, რომელიც ყოველი სიტყვის მნიშვნელობას ტექსტის ყველა სხვა სიტყვასთან ადარებს. მაგალითად, 10 000 სიტყვიანი დოკუმენტის დამუშავებისას სისტემა 50 მილიონამდე მათემატიკურ გამრავლებას ასრულებს, რაც კოლოსალურ ენერგიას მოითხოვს. სიტყვების რაოდენობის ორჯერ გაზრდა კი გამოთვლების ოთხჯერ ზრდას იწვევს, რასაც მეცნიერებაში კვადრატულ ექსპანსიას უწოდებენ. ამ პროცესის ვიზუალიზაციისთვის შეგვიძლია წარმოვიდგინოთ წრე, რომლის გარშემოც წერტილებია განლაგებული, სადაც თითოეული წერტილი სიტყვას ნიშნავს. წერტილებს შორის ხაზების გავლება მათ გამრავლებას ასახავს. ხუთი წერტილის შემთხვევაში ათი ხაზი გვექნება, ათი წერტილისას - 45 ხაზი, ხოლო ოცი წერტილისას - 190 ხაზი. ეს გეომეტრიული ზრდა ხსნის, თუ რატომ მოიხმარს ტექნოლოგია ამდენ ელექტროენერგიას. Subquadratic-ის გადაწყვეტილება გულისხმობს sparse attention მეთოდის გამოყენებას, რომელიც გამოთვლების რაოდენობას მნიშვნელოვნად ამცირებს. სისტემა დინამიკურად ირჩევს მხოლოდ იმ სიტყვებს შორის კავშირებს, რომლებიც კონკრეტულ კონტექსტში მნიშვნელოვანია. ალექს უედონის განმარტებით, ტექსტის კითხვისას ყველა სიტყვის ერთმანეთთან შედარება აზრს მოკლებულია, რადგან რეალურად ბევრი კავშირი უმნიშვნელოა. კომპანია Appen-ის Generative AI კვლევების დირექტორმა, ჯენინ სინანან-სინგმა განაცხადა, რომ ტესტებმა მოდელის უნიკალური არქიტექტურა დაადასტურა. სიჩქარის პირდაპირი შემოწმებისას SubQ მოდელი 56-ჯერ უფრო სწრაფი აღმოჩნდა, ვიდრე წინა თაობის FlashAttention ტექნოლოგია, ხოლო LiveCodeBench-ის პროგრამირების ტესტებში მოდელმა 89.7%-იანი შედეგი აჩვენა, რითაც წამყვან მოდელებს გაუტოლდა. მოდელის გამოყენების ეკონომიკური ეფექტი განსაკუთრებით თვალსაჩინოა დიდი მოცულობის მონაცემების დამუშავებისას. ჯასტინ დენგელის მონაცემებით, Nvidia-ს მიერ შემუშავებულ RULER 128 ტესტში Anthropic-ის მოდელის, Opus 4.6-ის გაშვება 2600 დოლარი ჯდება. ამავე დროს, SubQ-ის გამოყენებამ კომპანიას სულ რაღაც 8 დოლარის ხარჯი მოუტანა, რაც საოცარ ფინანსურ სხვაობაზე მიუთითებს. SubQ მოდელს გააჩნია 12 მილიონი ტოკენის ტევადობის კონტექსტური ფანჯარა, რაც 12-ჯერ აღემატება ბაზარზე არსებული წამყვანი მოდელების მეხსიერებას. ექსპერიმენტის დროს მოდელმა 400 დოკუმენტის ანალიზი რამდენიმე წამში დაასრულა, მაშინ როდესაც Perplexity-ის პლატფორმა ამავე მოცულობის ფაილების ჩატვირთვისას გაითიშა და ვერ შეძლო დავალების შესრულება. Appen-ის მონაცემებით, ინფორმაციის მოძიების ტესტებში SubQ-მა 6 მილიონი და 12 მილიონი ტოკენის პირობებში 98%-იანი სიზუსტე აჩვენა. თუმცა, დამოუკიდებელი მკვლევარი უილ დეპუი აცხადებს, რომ საჯარო მონაცემები ჯერ კიდევ არ არის საკმარისი იმის მტკიცებისთვის, რომ კომპანიამ სრულად გადაჭრა მათემატიკური შეზღუდვების პრობლემა, რაც დამატებით კვლევებს მოითხოვს. სკეპტიციზმს აძლიერებს ის გარემოებაც, რომ სტარტაპმა SubQ-ის შესაქმნელად ჩინური ღია მოდელის, Qwen-ის მზა წონები გამოიყენა, ნაცვლად მოდელის ნულიდან დატრენინგებისა. ეს პრაქტიკა მიღებულია ინდუსტრიაში, თუმცა ის ეჭვქვეშ აყენებს კომპანიის მტკიცებას, რომ მათ სრულიად თავიდან შექმნეს მოდელების მუშაობის მათემატიკური პრინციპი. დღეისთვის მოდელის გამოსაყენებლად რიგში უკვე ათიათასობით მომხმარებელი დგას, მათ შორის 500-ზე მეტი მსხვილი საწარმოა. სტარტაპის წარმომადგენლები იმედოვნებენ, რომ ახალი ეფექტური ტექნოლოგია უახლოეს წლებში სრულად შეცვლის ენობრივი მოდელების აგების პრინციპებს, რაც მნიშვნელოვნად შეამცირებს მსხვილი ტექნოლოგიური გიგანტების დომინირებას.

A startup claims it broke through a bottleneck that’s holding back LLMs
22 ივნ 20260
Anthropic Is Still at Odds With the White House Over Claude Fable 5
wired.com
ალბერტ აინშტაინიმარი კიურიფრიდრიხ ნიცშეშოთა რუსთაველი+3

⚖️ თეთრი სახლი Claude Fable 5-ზე დაწესებულ საექსპორტო შეზღუდვებს არ აუქმებს

Trump-ის ადმინისტრაციამ Anthropic-თან მოლაპარაკებები ორშაბათს, 15 ივნისს დაასრულა, თუმცა უსაფრთხოების მიზეზით დაწესებული საექსპორტო შეზღუდვები ძალაში დატოვა. შეზღუდვები შეეხო კომპანიის მოწინავე მოდელს, Claude Fable 5-ს, რომლის გარშემოც ვაშინგტონში სერიოზული დაპირისპირება მიმდინარეობს. აშშ-ის ადმინისტრაცია მიიჩნევს, რომ ახალი მოდელის დამცავი ბარიერების მოხსნა შესაძლებელია, რაც მომხმარებელს Mythos-ის კიბერშესაძლებლობებთან მისცემს წვდომას. სამი წყაროს ინფორმაციით, თეთრმა სახლმა გადაწყვეტილება საგანგებო განხილვის შემდეგ მიიღო და ვაჭრობის დეპარტამენტს შესაბამისი ზომების გატარება დაავალა. ვაჭრობის მდივანი ჰოვარდ ლუტნიკი და ეროვნული კიბერდირექტორი შონ კერნკროსი შეშფოთებას გამოთქვამენ Fable 5-ის შესაძლო გატეხვის გამო. სამუშაო შეხვედრები ვაჭრობის დეპარტამენტში, ხელოვნური ინტელექტის უსაფრთხოების ეროვნულ ინსტიტუტსა და კიბერდირექტორის ოფისის წარმომადგენლებთან ერთად გაიმართა. Anthropic-ის მხრიდან მოლაპარაკებებში მონაწილეობდნენ თანადამფუძნებელი ტომ ბრაუნი და საგარეო საქმეთა ხელმძღვანელი სარა ჰეკი. კომპანიის წამყვანი უსაფრთხოების ექსპერტი ლოგან გრემი და უფროსი მკვლევარი ნიკოლას კარლინი საგანგებოდ ჩაფრინდნენ ვაშინგტონში შეხვედრებზე დასასწრებად. ვაჭრობის მდივანი ჰოვარდ ლუტნიკი შეხვედრას საფრანგეთიდან, G7-ის სამიტიდან ტელეფონით შეუერთდა. ეს საგანგებო მოლაპარაკებები დაემთხვა პერიოდს, როდესაც Anthropic-ი პენტაგონთან სამხედრო კონტრაქტების გამო დავაში იმყოფება. კომპანია ცდილობს დაამტკიცოს, რომ მისი მოდელები გარკვეული სამხედრო ამოცანების შესასრულებლად უსაფრთხოა. ადმინისტრაციის წევრებს შორის კი არსებობს ეჭვი, რომ კიბერშესაძლებლობების მქონე მოდელი არასწორ ხელში შეიძლება აღმოჩნდეს. გამოცემა The Information-ის ცნობით, უსაფრთხოების რისკებზე ადმინისტრაცია პირველად Amazon-ის CEO-მ, ენდი ჯესიმ, გააფრთხილა. ენდი ჯესიმ უშუალოდ დაურეკა ფინანსთა მდივანს, სკოტ ბესენტს, რამაც ადმინისტრაციის შეშფოთება გამოიწვია. ამ ინფორმაციის მიღების შემდეგ, თეთრი სახლის მაღალჩინოსნებმა ეროვნული უსაფრთხოების სააგენტოს (NSA) მოდელის შესწავლა დაავალეს. ეროვნული უსაფრთხოების სააგენტომ შეისწავლა მოდელი და დაადასტურა, რომ დამცავი ბარიერების მოხსნა მართლაც შესაძლებელია. ამის შემდეგ ჰოვარდ ლუტნიკმა დაურეკა Anthropic-ის CEO-ს, დარიო ამოდეის, და გააფრთხილა მოსალოდნელი შეზღუდვების შესახებ. პარასკევს ვაჭრობის დეპარტამენტმა გამოსცა წერილი, რომლითაც Fable 5-ის ექსპორტი აიკრძალა. Anthropic-ის წარმომადგენლებმა ოფიციალურ ბლოგპოსტში განაცხადა: „ჩვენი მოდელის დამცავი სისტემები საკმარისად საიმედოა საჯარო მოხმარებისთვის.“ კომპანია მიიჩნევს, რომ Fable 5-ის ბარიერები საკმარისად ძლიერია და საფრთხეს არ შეიცავს. თუმცა, კომპანიამ უსაფრთხოების მოთხოვნის გამო მოდელზე წვდომა ყველა მომხმარებლისთვის დროებით შეაჩერა. მეორე მხრივ, 100-ზე მეტმა კიბერუსაფრთხოების ექსპერტმა და ტექნოლოგიურმა ლიდერმა ხელი მოაწერა ღია წერილს საექსპორტო კონტროლის გაუქმების მოთხოვნით. ხელმომწერებს შორის არიან ალექს სტამოსი და Luta Security-ის დამფუძნებელი ქეითი მუსურისი, რომლებიც აპროტესტებენ ამგვარ მკაცრ საექსპორტო ზომებს. წერილის ავტორები აღნიშნავენ, რომ Mythos მართლაც კარგად პოულობს პროგრამულ შეცდომებს, მაგრამ ჩინური Kimi 2.7 და სხვა ამერიკული მოდელები მსგავსი შესაძლებლობებისაა. ქეითი მუსურისმა საკუთარ ანალიზში განმარტა: „დამცავი ბარიერები მხოლოდ სიჩქარის შემზღუდავი ბარიერებია და არა გადაუჭრელი უსაფრთხოების საზღვრები.“ ექსპერტების შეფასებით, მოდელების დაბლოკვა რეალურად დასავლელ დამცველებს ართმევს საუკეთესო ინსტრუმენტებს და ხელს უწყობს ჩინური ტექნოლოგიების დაწინაურებას. საექსპორტო შეზღუდვები ბაზარზე გაურკვევლობას ქმნის და საფრთხეს უქმნის ამერიკის ლიდერობას ხელოვნური ინტელექტის სფეროში. უსაფრთხოების სპეციალისტმა მიუთითა, რომ გატეხვა ხდება მოდელის სპეციალური მითითებებით მართვისას, რათა გვერდი აუაროს მის უსაფრთხოებას. ვინაიდან Fable 5 არის Mythos მოდელის ვერსია, რომელსაც დამატებული აქვს ბიოლოგიური და ქიმიური უსაფრთხოების ფაილები, ამ ფაილების გვერდის ავლით მომხმარებელი სრულ მოდელს იღებს. კომპანიის ინვესტორები ცდილობენ შეაფასონ, თუ როგორ იმოქმედებს თეთრ სახლთან დაპირისპირება Anthropic-ის მომავალზე. კოჰერის აღმასრულებელმა დირექტორმა, ეიდან გომესმა, აღნიშნა, რომ ადმინისტრაციის ეს გადაწყვეტილება ნათელი სიგნალია ყველა ლაბორატორიისთვის. ტექნოლოგიური კომპანიები მზად უნდა იყვნენ მსგავსი რეგულაციებისთვის. ვაჭრობის დეპარტამენტმა მზადყოფნა გამოთქვა Fable 5-ის ბაზარზე დასაბრუნებლად, თუმცა ეს სრულად იქნება დამოკიდებული კომპანიის მიერ უსაფრთხოების გარანტიების წარდგენაზე. მოლაპარაკებები ამჟამად სამუშაო რეჟიმში გრძელდება.

Anthropic Is Still at Odds With the White House Over Claude Fable 5
16 ივნ 20260
Google's new open model DiffusionGemma generates text from noise instead of word by word
the-decoder.com
ალან ტიურინგიმარი კიურინიკოლა ტესლარიჩარდ ფაინმანი+1

🤖 Google-მა წარადგინა DiffusionGemma - მოდელი ტექსტს სიტყვების ნაცვლად ხმაურიდან აწყობს

Google-მა წარადგინა ექსპერიმენტული მოდელი DiffusionGemma, რომელიც ტექსტის სიტყვა-სიტყვა გენერირების ნაცვლად, შემთხვევითი ხმაურიდან სრულ პასაჟებად აწყობს მას. მოდელის ღია ვერსია უკვე ხელმისაწვდომია Hugging Face პლატფორმაზე Apache 2.0 ლიცენზიით. ტექნოლოგიური გიგანტის ეს ნაბიჯი მკვლევარებსა და დეველოპერებს სთავაზობს სრულიად განსხვავებულ მიდგომას ხელოვნური ინტელექტის მიერ ენობრივი ამოცანების შესრულებისას. მოდელი ერთდროულად 256 ტოკენს ამუშავებს, რაც გრაფიკული პროცესორების ეფექტურად გამოყენების საშუალებას იძლევა და ლოკალურ რეჟიმში ტრადიციულ მოდელებთან შედარებით 4-ჯერ უფრო მაღალ სიჩქარეს აღწევს. კლასიკური მოდელებისგან განსხვავებით, სადაც ყოველი ახალი სიტყვა წინა სიტყვას ეფუძნება, DiffusionGemma მუშაობს მთლიან ბლოკზე, რაც მნიშვნელოვნად ამცირებს მონაცემთა გადაცემის დროს მეხსიერებასა და პროცესორს შორის. Nvidia-ს ინჟინერი განმარტავს, რომ კლასიკური ავტორეგრესიული მოდელები ხშირად ზღუდავს აპარატურის მუშაობას მეხსიერების გამტარობის გამო, რის გამოც პროცესორების გამოთვლითი სიმძლავრე ფუჭად იკარგება. DiffusionGemma ამ პრობლემას გვერდს უვლის, რადგან ტოკენების პარალელური დამუშავება აიძულებს გრაფიკულ პროცესორებს მაქსიმალური დატვირთვით იმუშაონ. კერძოდ, Nvidia H100 ამაჩქარებელზე მოდელი წამში 1000 ტოკენის გენერირებას ახერხებს. DiffusionGemma-ს ჯამური პარამეტრების რაოდენობა 26 მილიარდს შეადგენს, თუმცა Mixture-of-Experts არქიტექტურის წყალობით, თითოეულ ეტაპზე მხოლოდ 3.8 მილიარდი აქტიურდება. ეს სტრუქტურა მოდელს საშუალებას აძლევს, იმუშაოს სწრაფად და ამავე დროს მოითხოვოს ნაკლები რესურსი. კომპანიის მონაცემებით, ოპტიმიზაციის შემდეგ მოდელი თავისუფლად ეტევა 18 გიგაბაიტიან ვიდეომეხსიერებაში, რაც მის ლოკალურად გაშვებას სამომხმარებლო ბარათებზეც შესაძლებელს ხდის. ტექნოლოგიური გიგანტის ანგარიშში ხაზგასმით არის ნათქვამი: „DiffusionGemma გენერირებს გაცილებით მეტ ტოკენს წამში, ვიდრე autoregressive Gemma 4 მოდელები, თუმცა ტექსტის სიზუსტის ტესტებში ოდნავ ჩამორჩება მათ“. ეს ნიშნავს, რომ სიჩქარის ზრდა ხარისხის გარკვეულ შემცირებას იწვევს, რის გამოც Google დეველოპერებს კვლავ ტრადიციული Gemma 4-ის გამოყენებას ურჩევს იმ ამოცანებში, სადაც ტექსტის ხარისხი და აზრობრივი სიზუსტე პრიორიტეტულია. მიუხედავად სიზუსტის მცირე ვარდნისა, მოდელი იდეალურია არახაზოვანი ამოცანებისთვის, სადაც საჭიროა ტექსტის შუაში ჩამატება ან კოდის გამოტოვებული ნაწილების შევსება. კლასიკური მოდელები ტექსტს მხოლოდ მარცხნიდან მარჯვნივ კითხულობენ, ხოლო DiffusionGemma-ს მთელი ბლოკის ერთდროულად აღქმა შეუძლია. სპეციალისტი მიუთითებს, რომ ეს თვისება მოდელს საშუალებას აძლევს, უკეთ გააანალიზოს რთული სტრუქტურის მქონე მონაცემები. სამომხმარებლო GeForce RTX 5090 ვიდეობარათზე მოდელი წამში 700-ზე მეტი ტოკენის გენერირებას ახერხებს, რაც ლოკალური გამოყენებისთვის შესანიშნავი მაჩვენებელია. Benchmarks აჩვენებს, რომ DiffusionGemma დაახლოებით სამნახევარჯერ უფრო სწრაფია, ვიდრე იმავე ზომის Gemma 4 მოდელი. Google ამ ეფექტს უკავშირებს სპეციალიზებულ გამოთვლით ამაჩქარებლებს, რომლებიც ოპტიმიზებულია პარალელური მუშაობისთვის. მოდელის გამოყენება შესაძლებელია სხვადასხვა პოპულარულ ბიბლიოთეკასთან, როგორებიცაა Hugging Face Transformers და vLLM. JAX-ის ბაზაზე შექმნილი Hackable Diffusion ხელსაწყოების ნაკრები კი მკვლევარებს მოდელის მარტივად დაკონფიგურირების საშუალებას აძლევს. დეველოპერი აცხადებს, რომ მოდელის ინტეგრირება და ფაინთუნინგი Sudoku-ს ამოსახსნელადაც კია შესაძლებელი, სადაც კლასიკური ავტორეგრესიული მოდელები ხშირად ვერ აღწევენ წარმატებას. DiffusionGemma-ს შექმნას საფუძვლად დაედო Google-ის ადრეული კვლევა, კოდური სახელწოდებით Gemini Diffusion, სადაც ტექსტური დიფუზიის სიჩქარე წამში 1479 ტოკენს აღწევდა. Benchmarks-ის მიხედვით, Gemini Diffusion მუშაობდა დაახლოებით იმავე დონეზე, რაზეც Gemini 2.0 Flash-Lite მოდელი. ეს ტექნოლოგიური წინსვლა აჩვენებს, თუ რამდენად სწრაფად ვითარდება ალტერნატიული გენერირების მეთოდები ხელოვნური ინტელექტის ინდუსტრიაში. საბოლოო ჯამში, DiffusionGemma-ს გამოშვება არის მნიშვნელოვანი ეტაპი ლოკალური და სწრაფი ხელოვნური ინტელექტის განვითარებაში. თუმცა, მომხმარებლებმა უნდა გაითვალისწინონ სიჩქარესა და ხარისხს შორის არსებული კომპრომისი, რაც განსაზღვრავს მოდელის გამოყენების კონკრეტულ სფეროებს. მომავალში ამ ტექნოლოგიის განვითარებამ შესაძლოა სრულად შეცვალოს კოდის წერისა და მონაცემთა დამუშავების პროცესი სხვადასხვა აპლიკაციაში.

Google's new open model DiffusionGemma generates text from noise instead of word by word
11 ივნ 20261
Ghost in the Machine review – entertaining AI polemic dives into its dark history in race politics and eugenics
theguardian.com
ალბერტ აინშტაინირიჩარდ ფაინმანი

⚖️ Ghost in the Machine დოკუმენტური ფილმი AI-ს ბნელი ისტორიის შესახებ

კინოეკრანებზე გამოდის რეჟისორ ვალერი ვიჩის ახალი დოკუმენტური ფილმი სახელწოდებით Ghost in the Machine. კინოსურათი დეტალურად იკვლევს ხელოვნური ინტელექტის განვითარების ისტორიას და მის კავშირს ევგენიკასთან, რასობრივ პოლიტიკასთან და მემარჯვენე იდეოლოგიებთან. ფილმი მაყურებელს სთავაზობს სკეპტიკურ ხედვას თანამედროვე ტექნოლოგიების მიმართ, რომლებიც ბოლო დროს საფონდო ბირჟაზე უპრეცედენტო ბუშტს ქმნიან. რეჟისორმა ვალერი ვიჩმა სახელი გაითქვა ისეთი ნამუშევრებით, როგორიცაა Love Child და Me at the Zoo, რომლებიც ციფრული და რეალური სამყაროს გადაკვეთას ასახავდნენ. მის ახალ ნაშრომში ძირითადი აქცენტი კეთდება იმაზე, თუ რამდენად დასაბუთებულია ხელოვნური ინტელექტის გამოყენება დღეს. ფილმში წარმოდგენილია ისტორიული და თანამედროვე ფიგურები, რომლებმაც საფუძველი ჩაუყარეს ტექნოლოგიურ ევოლუციას. ისტორიულ ჭრილში ფილმი განიხილავს ვიქტორიანული ეპოქის ბრიტანელ ევგენიკოსს, ფრენსის გალტონს, და Silicon Valley-ის ერთ-ერთ დამფუძნებელს, უილიამ შოკლის, რომელიც ცნობილი იყო რასისტული შეხედულებებით. ფილმი ასევე ეხება თანამედროვე ეპოქის მილიარდერს, ილონ მასკს, და მის წვლილს ტექნოლოგიურ განვითარებაში. მასში წარმოდგენილია არგუმენტები იმის შესახებ, თუ როგორ იყენებდნენ ამ იდეებს ხელოვნური ინტელექტის ჩამოსაყალიბებლად. კინოსურათში მონაწილეობენ სხვადასხვა სფეროს ექსპერტები, მათ შორის ფილოსოფოსი ჯონათან ფლაუერსი, რომელიც კითხვის ნიშნის ქვეშ აყენებს ხელოვნური ინტელექტის აუცილებლობას. ლინგვისტი ემილი ბენდერი მაყურებელს აცნობს თავად ტერმინ ხელოვნური ინტელექტის წარმოშობის ისტორიას. ისტორიკოსი ბეკა ლუისი კი რამდენიმე წუთში ახერხებს საკმაოდ რთული ისტორიული კონტექსტის მარტივად და ნათლად გადმოცემას. ფილმი ასევე მოიცავს ინტერვიუებს LLM კომპანიების თანამშრომლებთან, რომლებიც ნაირობიში საქმიანობენ. თუმცა, კრიტიკოსები აღნიშნავენ, რომ ეს ინტერვიუები ბოლომდე ვერ ხსნის, თუ როგორ აისახება მძიმე სამუშაო პირობები ამ ადამიანების ცხოვრებაზე. მიუხედავად ამისა, ფილმი კარგად წარმოაჩენს იმ გლობალურ უთანასწორობას, რომელიც ხელოვნური ინტელექტის უკან დგას და ხშირად შეუმჩნეველი რჩება. ფილმის ყველაზე საინტერესო ვიზუალური ხერხია ეკრანის კუთხეში განთავსებული წარწერები Helvetica შრიფტით, რომლებიც მიუთითებენ, გამოსახულება ხელოვნური ინტელექტის მიერაა შექმნილი თუ არა. რეჟისორის თქმით, ეს გადაწყვეტილება აუცილებელი გახდა, რადგან თანამედროვე საზოგადოებაში ადამიანებს სულ უფრო მეტად უჭირთ რეალურისა და ვირტუალური კადრების ერთმანეთისგან გარჩევა. ტექნოლოგიური კომპანიების მზარდი გავლენა და მათი ფინანსური ამბიციები საზოგადოებაში სულ უფრო მეტ კითხვას აჩენს. ფილმში ნაჩვენებია, რომ ხელოვნური ინტელექტის განვითარება არ არის მხოლოდ სამეცნიერო პროგრესი, არამედ ძალაუფლების მოპოვების იარაღიცაა. ეს განსაკუთრებით ჩანს მსხვილი კორპორაციების ხელმძღვანელების ბრძოლაში, რომლებიც ცდილობენ სრული კონტროლი დაამყარონ ციფრულ მომავალზე. გამოცემა The Guardian-ის კინოკრიტიკოსი ლესლი ფელპერინი წერს, რომ Ghost in the Machine არის გასართობი და ამავე დროს ძალიან საჭირო ნაშრომი. ფილმი მაყურებელს აიძულებს კრიტიკულად შეხედოს იმ ტექნოლოგიურ ეიფორიას, რომელიც საფონდო ბირჟებზე მიმდინარეობს. კინოსურათი დიდი ბრიტანეთის კინოთეატრებში 5 ივნისიდან გამოვა და მაყურებელს საშუალებას მისცემს დაფიქრდეს ტექნოლოგიების რეალურ ფასზე. ფილმი გვახსენებს, რომ ხელოვნური ინტელექტი იკვებება ადამიანების მიერ შექმნილი მონაცემებით, რაც იმას ნიშნავს, რომ იგი ითვისებს ჩვენს ყველა ნაკლსა და ცრურწმენას. ისტორიული რასიზმი და სოციალური უთანასწორობა ავტომატურად გადადის ალგორითმებში, თუ მათ განვითარებას მკაცრად არ გავაკონტროლებთ. ეს პროცესი საფრთხეს უქმნის დემოკრატიულ პრინციპებსა და ადამიანთა თანასწორობას გლობალურად. საბოლოო ჯამში, Ghost in the Machine არის გაფრთხილება იმის შესახებ, რომ ტექნოლოგიურმა განვითარებამ არ უნდა წაშალოს ადამიანური ფასეულობები. რეჟისორი მოგვიწოდებს უარი ვთქვათ ბრმა ნდობაზე და უფრო მეტი ყურადღება მივაქციოთ იმ ეთიკურ ასპექტებს, რომლებიც ტექნოლოგიების უკან დგას. ხელოვნური ინტელექტის მომავალი დამოკიდებულია იმაზე, თუ რამდენად შევძლებთ ჩვენი წარსული შეცდომების გააზრებას. ფილმში განხილული თემები განსაკუთრებით აქტუალურია იმ ფონზე, როდესაც ტექნოლოგიური კომპანიები ყოველდღიურად ზრდიან თავიანთ ფინანსურ ძალაუფლებას. ექსპერტები მიიჩნევენ, რომ აუცილებელია შეიქმნას საერთაშორისო რეგულაციები, რომლებიც შეზღუდავს ალგორითმების გამოყენებას ადამიანის უფლებების საზიანოდ. ეს დოკუმენტური ნამუშევარი არის კიდევ ერთი შეხსენება იმისა, რომ ციფრულმა ეპოქამ პირველ რიგში ადამიანს უნდა სცეს პატივი.

Ghost in the Machine review – entertaining AI polemic dives into its dark history in race politics and eugenics
8 ივნ 20265
Google I/O showed how the path for AI-driven science is shifting
technologyreview.com

🧪 Google-მა გამოუშვა Gemini for Science - 3 მილიონი მკვლევარისთვის

Google DeepMind-ის CEO-მ, დემის ჰასაბისმა, Google I/O კონფერენციაზე დააანონსა კომპანიის ახალი სტრატეგიული ცვლილება სამეცნიერო ხელოვნური ინტელექტის მიმართულებით. ტექნოლოგიური გიგანტი ეტაპობრივად უარს ამბობს მხოლოდ ვიწრო სპეციალიზებული ხელსაწყოების შექმნაზე და გადადის დიდ ენობრივ მოდელებზე (LLM) დაფუძნებულ აგენტურ სისტემებზე, რომლებსაც დამოუკიდებელი სამეცნიერო კვლევების ჩატარება შეუძლიათ. აქამდე კომპანიის სპეციალიზებული მოდელები ფართოდ გამოიყენებოდა სამეცნიერო წრეებში. მაგალითად, ბიოლოგიურმა მოდელმა, AlphaFold-მა, ბაზარზე არსებობის განმავლობაში 3 მილიონზე მეტ მკვლევარს გაუწია დახმარება. ახალი მიდგომის ფარგლებში, Google-მა წარადგინა პლატფორმა Gemini for Science, რომელიც ერთ ბრენდში აერთიანებს ისეთ სამეცნიერო აგენტებს, როგორებიცაა AI Co-Scientist და AlphaEvolve. გარდა ამისა, სტრატეგიულ ცვლილებაზე მიანიშნებს ისიც, რომ ნობელის პრემიის ლაურეატმა, ჯონ ჯამპერმა, რომელმაც AlphaFold-ის პროექტი შექმნა, კომპანიაში ხელოვნური ინტელექტის კოდირების მიმართულებაზე გადაინაცვლა. ამავდროულად, კონკურენტმა OpenAI-მ აჩვენა, რომ მისმა ზოგადი დანიშნულების მოდელმა მათემატიკური ჰიპოთეზის უარყოფა შეძლო სპეციალური სამეცნიერო დატრენინგების გარეშე. ეს ცვლილება მნიშვნელოვანია, რადგან სამეცნიერო ხელოვნური ინტელექტი ვიწრო დამხმარე ხელსაწყოდან ავტონომიურ ინფრასტრუქტურად ყალიბდება. ზოგად აგენტებს შეუძლიათ სამეცნიერო აღმოჩენებში დამოუკიდებელი წვლილის შეტანა, რაც ამცირებს კონკრეტული დომენისთვის მოდელების ხელახალი მომზადების საჭიროებას. Google ამ ეტაპზე ახალ სისტემებს ადამიანის კოლაბორატორებად აფიქსირებს, თუმცა განვითარების ტრაექტორია სრულად ავტონომიური ციფრული მეცნიერების შექმნისკენ არის მიმართული.

Google I/O showed how the path for AI-driven science is shifting
25 მაი 202618
I Gave My OpenClaw Agent a Physical Body
wired.com

🤖 Wired-მა OpenClaw რობოტს დაუკავშირა - 1 წარმატებული ტესტი

Wired-ის ტექნოლოგიურმა მიმომხილველმა და პროექტის ავტორმა ოთხშაბათს გამოაქვეყნა ტესტირების საბოლოო შედეგები, რომლის ფარგლებშიც ხელოვნური ინტელექტის ავტონომიური აგენტი, OpenClaw, რეალურ რობოტულ მკლავს ფიზიკურად დაუკავშირა. ექსპერიმენტის მთავარი მიზანი იყო ემპირიულად შეემოწმებინათ, თუ რამდენად სწრაფად შეძლებდა კომპიუტერული მოდელი ფიზიკური აპარატურის დამოუკიდებლად მართვას ყოველგვარი წინასწარი კოდირებისა და რთული მათემატიკური ალგორითმების გარეშე. 2026 წლის დასაწყისში გამოშვებული OpenClaw თავდაპირველად მხოლოდ ვირტუალური სივრცისთვის შეიქმნა, რათა მომხმარებლის მაგივრად ემართა ელექტრონული ფოსტა, კომპიუტერული ოპერაციული სისტემები და სხვადასხვა API-ები. ახალი ექსპერიმენტის მსვლელობისას, სისტემა Raspberry Pi 5-ის ბაზაზე მომუშავე ფიზიკურ მოწყობილობაში ჩაიტვირთა. შედეგად, ხელოვნური ინტელექტის აგენტმა კონკრეტული მექანიკური დავალებების შესრულება მხოლოდ ადამიანის მიერ მიცემული ტექსტური ბრძანებების საფუძველზე შეძლო. ტრადიციული პროგრამირების მეთოდებისგან მკვეთრად განსხვავებით, სადაც რობოტის თითოეული მოძრაობა დეტალურ ინსტრუქციას მოითხოვს, OpenClaw-მ მექანიკური ოპერაციები დიდი ენობრივი მოდელების (LLM) მეშვეობით დამოუკიდებლად დაარეგულირა. ტესტმა აჩვენა, რომ ღია წყაროს მქონე პროგრამას შეუძლია რეალურ დროში მიიღოს გადაწყვეტილებები და ფიზიკური ობიექტების მანიპულაცია მოახდინოს. AI აგენტების მსგავსი პირდაპირი ინტეგრაცია რობოტექნიკაში დეველოპერებს საშუალებას აძლევს, ახალი ტექნიკური მოწყობილობების შექმნისა და პროგრამული უზრუნველყოფის დანერგვის პროცესი საგრძნობლად დააჩქარონ, რაც ინდუსტრიაში მოქმედი კომპანიებისთვის წარმოების ხარჯებსაც ამცირებს.

I Gave My OpenClaw Agent a Physical Body
21 მაი 202619
Prominent AI researcher Andrej Karpathy picks Anthropic over former home OpenAI to get back into frontier LLM research
the-decoder.com

🏢 Anthropic-მა ანდრეი კარპათი დაიქირავა - მან 2024-ში OpenAI დატოვა

OpenAI-ის ყოფილმა მკვლევარმა და Tesla-ს AI მიმართულების ყოფილმა დირექტორმა, ანდრეი კარპათიმ, სამშაბათს Anthropic-ში მუშაობის დაწყების შესახებ განაცხადა. ის Claude-ის შემქმნელი კომპანიის მოდელების დატრენინგების გუნდს შეუერთდა. კარპათიმ OpenAI 2024 წლის თებერვალში დატოვა, რის შემდეგაც ხელოვნური ინტელექტის საგანმანათლებლო სტარტაპი, Eureka Labs, დააფუძნა. მანამდე ის Tesla-ს ავტოპილოტის ხედვის სისტემებსა და ნეირონულ ქსელებს ავითარებდა. ახალ პოზიციაზე მკვლევარი ნიკ ჯოზეფს, Anthropic-ის დატრენინგების განყოფილების ხელმძღვანელს, დაექვემდებარება და მსხვილი ენობრივი მოდელების (LLM) შექმნაზე უშუალოდ იმუშავებს. კარპათი არ არის ერთადერთი მაღალი რგოლის ფიგურა, რომელმაც ყოფილი კომპანია დატოვა და კონკურენტს შეუერთდა, რადგან 2024 წელს Anthropic-ში OpenAI-ის კიდევ ერთი თანადამფუძნებელი, ჯონ შულმანი, გადავიდა. ამჟამად Anthropic-ი ბაზარზე პოზიციებს იძლიერებს: 2026 წლის თებერვალში კომპანიამ $30 მილიარდის დაფინანსება მოიზიდა და მისი საბაზრო შეფასება $380 მილიარდამდე გაიზარდა. შედარებისთვის, მთავარი კონკურენტის, OpenAI-ის, ბოლო შეფასება $852 მილიარდს შეადგენს. წამყვანი მკვლევრის ტრანსფერი პირდაპირ აძლიერებს Anthropic-ის ტექნიკურ რესურსს OpenAI-ისა და Google-ის წინააღმდეგ მიმდინარე კონკურენციაში. კარპათის პრაქტიკული გამოცდილება მონაცემთა დამუშავებასა და ნეირონული ქსელების ოპტიმიზაციაში კომპანიას Claude-ის ინფრასტრუქტურის დახვეწასა და მოდელების უფრო ეფექტურად დატრენინგებაში დაეხმარება.

Prominent AI researcher Andrej Karpathy picks Anthropic over former home OpenAI to get back into frontier LLM research
20 მაი 202623
Companies Just Learned a Brutal Lesson About Training AI to Do Human Jobs
futurism.com

⚠️ Mercor-ის ჰაკერულ თავდასხმას 5 ახალი სასამართლო სარჩელი მოჰყვა

სან-ფრანცისკოში დაფუძნებულმა ხელოვნური ინტელექტის კომპანიამ, Mercor-მა, რომელიც მოდელების დასატრენინგებლად დამოუკიდებელ კონტრაქტორებს ქირაობს, მასშტაბური ჰაკერული თავდასხმა დაადასტურა. ინციდენტის გასაჯაროების შემდეგ, გასულ კვირას ყოფილმა და ამჟამინდელმა თანამშრომლებმა კომპანიის წინააღმდეგ 5 სასამართლო სარჩელი შეიტანეს. Mercor-ის ოფიციალური წარმომადგენლის განცხადებით, კიბერშეტევა ღია წყაროს პროექტის, LiteLLM-ის ექსპლოიტს უკავშირდება. მოპარული ბაზა მოიცავს Slack-ის მიმოწერებსა და ვიდეოებს, რომლებიც ასახავს კონტრაქტორებისა და ხელოვნური ინტელექტის მოდელების პირდაპირ ინტერაქციას. სარჩელების მიხედვით, გაჟონილია მუშახელის სენსიტიური პირადი მონაცემები, მათ შორის სოციალური დაზღვევის ნომრები და საცხოვრებელი მისამართები. ინციდენტმა სერიოზული პრობლემები შეუქმნა დამკვეთ კომპანიებსაც. შიდა გამოძიების დასრულებამდე, Meta-მ Mercor-თან ყველა სახის სამუშაო პროცესი ოფიციალურად შეაჩერა. საფრთხე ემუქრება OpenAI-ისა და Anthropic-ის დახურულ ტრენინგ-სისტემებსაც. ბოლო 7 თვის განმავლობაში Mercor-ის წინააღმდეგ უკვე 3 ჯგუფური სარჩელი იყო შეტანილი სამუშაო პირობების დარღვევისა და ანაზღაურების შემცირების გამო. მსგავსი შემთხვევები ნათლად აჩვენებს მესამე მხარის კონტრაქტორებზე დამოკიდებული ხელოვნური ინტელექტის მიწოდების ჯაჭვის მოწყვლადობას. მსხვილი ტექნოლოგიური კომპანიებისთვის მთავარ საფრთხეს ხელოვნური ინტელექტის მოდელების დატრენინგების კონკრეტული მეთოდოლოგიების გასაჯაროება წარმოადგენს, რაც პირდაპირ უკავშირდება ბაზარზე კონკურენტული უპირატესობის შენარჩუნებას.

Companies Just Learned a Brutal Lesson About Training AI to Do Human Jobs
13 მაი 202625
AI Slop Is Making the Internet Fake-Happy
wired.com

📊 სტენფორდმა ახალი კვლევა გამოაქვეყნა - საიტების 35% AI-ით იქმნება

სტენფორდის უნივერსიტეტის მკვლევარმა, მატი ბოჰაჩეკმა, ლონდონის იმპერიული კოლეჯისა და Internet Archive-ის მეცნიერებთან ერთად, გამოაქვეყნა ახალი კვლევა, რომელიც 2022-2025 წლებში შექმნილ ვებსაიტებზე ხელოვნური ინტელექტის პირდაპირ გავლენასა და ტექსტების სტრუქტურულ ცვლილებებს აანალიზებს. Internet Archive-ის მონაცემების ისტორიულ ბაზასა და Pangram Labs-ის დეტექციის ოთხ განსხვავებულ მეთოდზე დაყრდნობით ჩატარებულმა ანალიზმა აჩვენა, რომ ახალი ვებსაიტების დაახლოებით 35% სრულად ან ნაწილობრივ ხელოვნური ინტელექტის მიერ არის გენერირებული. სენტიმენტის ანალიზის გამოყენებით დადგინდა, რომ AI მოდელებით შექმნილ ტექსტებში პოზიტიური განწყობის საშუალო მაჩვენებელი 107%-ით აღემატება ადამიანის მიერ დაწერილ სტატიებს, რაც დიდი ენობრივი მოდელების (LLM) წინასწარ დაპროგრამებული ოპტიმიზმის შედეგია. პროექტის ავტორებმა აღნიშნეს, რომ სემანტიკური მსგავსების ტესტირებისას ხელოვნური ინტელექტის ვებსაიტებმა 33%-ით უფრო მაღალი ქულა მიიღეს, რაც იდეების მკვეთრ ერთფეროვნებასა და განსხვავებული შეხედულებების შემცირებას ადასტურებს. კვლევის დაწყებამდე ჩატარებულმა გამოკითხვამ აჩვენა, რომ მომხმარებლების უმეტესობა ტექნოლოგიის დანერგვით დეზინფორმაციის მკვეთრ მატებას ვარაუდობდა. მონაცემები ფაქტობრივად აბათილებს მანამდე არსებულ ძირითად თეორიებს, რადგან ტესტირებამ არ დაადასტურა AI-ის მასშტაბური გამოყენებით ფეიქ-ნიუსების პროპორციული ზრდა, გარე წყაროებზე ბმულების შემცირება ან წერის სტილის ბაზური სტანდარტიზაცია. ტექნოლოგიური მოდელების ინტეგრაცია ინტერნეტის კონტენტს იდეოლოგიურად უფრო ჰომოგენურსა და ხელოვნურად პოზიტიურს ხდის, თუმცა პირდაპირ ინფორმაციულ დეგრადაციას არ იწვევს.

AI Slop Is Making the Internet Fake-Happy
12 მაი 202624

All insights loaded