
📊 სივეი ლიუს პროგნოზით 2026 წელს რეალურ დროში მოქმედი დიფფეიკები მასობრივად შეგვატყუებს
ბაფალოს უნივერსიტეტის კომპიუტერული მეცნიერების პროფესორმა და მედია ფოორენზიკის ლაბორატორიის დირექტორმა, სივეი ლიუმ გამოაქვეყნა კვლევა, რომლის მიხედვითაც 2026 წელი გახდება პერიოდი, როდესაც ადამიანები დიფფეიკებით მასობრივად მოტყუვდებიან. მისი თქმით, ხელოვნური ინტელექტის მიერ გენერირებული სახეები, ხმები და ვიდეოები უკვე გასცდა ექსპერტთა მოლოდინებს და ყოველდღიურ ცხოვრებაში იდეალურად ახერხებს უბრალო მომხმარებლების შეცდომაში შეყვანას. კიბერუსაფრთხოების წამყვანი კომპანიის, DeepStrike-ის მონაცემებით, ინტერნეტში განთავსებული დიფფეიკების რაოდენობა კატასტროფულად იზრდება. 2023 წელს ქსელში დაახლოებით 500 000 ციფრული ყალბი ფაილი ფიქსირდებოდა, ხოლო 2025 წლისთვის ამ მაჩვენებელმა 8 მილიონს მიაღწია. ეს ნიშნავს, რომ ყოველწლიური ზრდის ტემპი 900%-თან ახლოს არის, რაც უსაფრთხოების ექსპერტებისთვის საგანგაშო სიგნალს წარმოადგენს და დამატებით დაცვას მოითხოვს. პროფესორი სივეი ლიუ განმარტავს, რომ ხმის კლონირების ტექნოლოგიამ უკვე გადალახა ეგრეთ წოდებული „განურჩევლობის ზღვარი“. დღეს სულ რამდენიმე წამიანი აუდიოჩანაწერიც კმარა იმისათვის, რომ შეიქმნას ხმის სრულყოფილი კლონი. ხელოვნური ინტელექტი იდეალურად იმეორებს ადამიანის ბუნებრივ ინტონაციას, რიტმს, ემოციურ აქცენტებს, პაუზებს და სუნთქვის ხმასაც კი, რაც თაღლითებს მასშტაბური ფინანსური მანიპულაციებისთვის დიდ შესაძლებლობებს აძლევს. ამ უახლესი შესაძლებლობის გამოჩენა უკვე გახდა მასშტაბური თაღლითობის საფუძველი. ზოგიერთი მსხვილი საცალო მოვაჭრე აცხადებს, რომ დღეში 1000-ზე მეტ ხელოვნური ინტელექტის მიერ გენერირებულ ყალბ სატელეფონო ზარს იღებს. ხმის სპეციფიკური მახასიათებლები, რომლებიც ადრე ყალბი ხმების ამოცნობის საშუალებას იძლეოდა, პრაქტიკულად გაქრა, რამაც თაღლითობის გამოვლენა ჩვეულებრივი ადამიანებისთვის თითქმის შეუძლებელი გახადა. კვლევის თანახმად, ვიდეოების ხარისხობრივი გაუმჯობესება დაკავშირებულია სპეციალურ მოდელებთან, რომლებიც დროით თანმიმდევრულობას ინარჩუნებს. ეს მოდელები ქმნის კადრებს, რომლებშიც მოძრაობა ლოგიკურია, ხოლო პერსონაჟების იდენტობა კადრიდან კადრში არ იცვლება. ახალი ალგორითმები გამორიცხავს სახის ციმციმს ან დეფორმაციას თვალებისა და ყბის გარშო, რაც ადრე დიფფეიკის ამოსაცნობ ძირითად მტკიცებულებად ითვლებოდა. ამავდროულად, სამომხმარებლო ინსტრუმენტების განვითარებამ ტექნიკური ბარიერი ნულამდე დაიყვანა. OpenAI-ს Sora 2 და Google-ის Veo 3 მოდელების, ასევე არაერთი დამწყები სტარტაპის წყალობით, ნებისმიერ ადამიანს შეუძლია იდეის აღწერა და რამდენიმე წუთში მაღალი ხარისხის აუდიო-ვიზუალური მასალის მიღება. პროფესიონალური მედიის გენერირების შესაძლებლობა, რომელსაც საფუძვლად ChatGPT ან Gemini უდევს, დღეს უკვე სრულად დემოკრატიზებულია. ხელოვნური ინტელექტის მიერ შექმნილი ყალბი მასალების გავრცელებამ რეალურ სამყაროში უკვე გამოიწვია სერიოზული ზიანი. საუბარია ფართოდ გავრცელებულ დეზინფორმაციაზე, მიზანმიმართულ შევიწროებასა და ფინანსურ თაღლითობაზე, რაც საფრთხეს უქმნის როგორც ცალკეულ მოქალაქეებს, ისე სხვადასხვა ინსტიტუტებს. დიფფეიკები იმდენად სწრაფად ვრცელდება, რომ საზოგადოებასა და საინფორმაციო საშუალებებს მათი გადამოწმება და რეაგირება ფიზიკურად აღარ შეუძლიათ. ამ მზარდი საფრთხეების ფონზე, პროფესორი სივეი ლიუ მიუთითებს, რომ უსაფრთხოების მთავარი ხაზი ადამიანის სუბიექტური შეფასებიდან ინფრასტრუქტურულ დაცვაზე უნდა გადავიდეს. მისი თქმით, მნიშვნელოვანი ხდება კრიპტოგრაფიული ხელმოწერების გამოყენება და სპეციალური specs-ის დანერგვა. საუბარია C2PA (Coalition for Content Provenance and Authenticity) სპეციფიკაციებზე, რომლებიც უზრუნველყოფს მედიის ავთენტურობის დაცვას. გარდა ამისა, პროფესორის ლაბორატორიამ შეიმუშავა დამატებითი თავდაცვითი მექანიზმები, როგორიცაა მულტიმოდალური სასამართლო ექსპერტიზის ინსტრუმენტი Deepfake-o-Meter. ეს სისტემა აანალიზებს ფაილების სტრუქტურას და ეხმარება მკვლევარებს დიფფეიკების იდენტიფიცირებაში. თავის მოხსენებაში სივეი ლიუმ განაცხადა: „პიქსელებზე უფრო დაკვირვებით ყურება აღარ იქნება საკმარისი“, რაც ხაზს უსვამს ტექნოლოგიური დაცვის აუცილებლობას. დასკვნის სახით, მკვლევარი წერს, რომ 2026 წლისთვის დიფფეიკები სტატიკური რეალიზმიდან რეალურ დროში სინთეზირებაზე გადავა. მომავალში მოსალოდნელი ვიდეოზარების მონაწილეთა სრული სიმულაცია, სადაც ხელოვნური ინტელექტის მსახიობების სახე და ხმა მყისიერად მოერგება ნებისმიერ ბრძანებას. ეს კიბერუსაფრთხოების სფეროს სრულიად ახალი გამოწვევების წინაშე დააყენებს, რაც გლობალურ მზადყოფნასა და ახალ სტანდარტებს მოითხოვს.
2026 will be the year you get fooled by a deepfake, researcher says. Voice cloning has crossed the 'indistinguishable threshold' | Fortune