AI models often give the right answers but point t — ინსაითი

სტენფორდის უნივერსიტეტის წამყვანმა მკვლევარმა, ჯეიმს ზუმ, კოლეგებთან ერთად გამოაქვეყნა ახალი ტექნიკური ნაშრომი ხელოვნური ინტელექტის მოდელების მიერ ინფორმაციის მოძიებისა და ციტირების სიზუსტეზე. მიღებული მონაცემების მიხედვით, თანამედროვე RAG სისტემები ხშირად სრულიად სწორ პასუხებს აგენერირებენ, თუმცა მათ არასწორ, სრულიად შეუსაბამო პირველწყაროებს მიაწერენ.
ექსპერიმენტის ფარგლებში სპეციალისტებმა დეტალურად შეამოწმეს წამყვანი პლატფორმები, მათ შორის OpenAI-ის GPT-4, Anthropic-ის Claude და Google-ის Gemini. ტესტირებამ აჩვენა, რომ შემთხვევათა მინიმუმ 30%-ში ხელოვნური ინტელექტი მიუთითებდა ისეთ წყაროებსა და დოკუმენტებზე, რომლებიც საერთოდ არ შეიცავდნენ დასმული პასუხის დასასაბუთებელ კონკრეტულ ფაქტებს. შედარებისთვის, წინა თაობის სისტემებში ეს მაჩვენებელი კიდევ უფრო არასტაბილური იყო. მიუხედავად ამისა, თავად პასუხების შინაარსობრივი სიზუსტე საკმაოდ მაღალ ნიშნულზე, დაახლოებით 85%-ზე ნარჩუნდებოდა. ეს მიანიშნებს მკვეთრ ტექნიკურ დისბალანსზე ტექსტის გენერაციასა და რეალურ ციტირებას შორის.
ეს ხარვეზი პირდაპირ ზრდის ფაქტობრივი შეცდომების გავრცელების რისკს კრიტიკულ სფეროებში, როგორიცაა სამედიცინო დიაგნოსტიკა და იურიდიული კონსულტაცია, სადაც მომხმარებლები ინფორმაციის გადამოწმებისთვის სრულად ენდობიან მოდელების მიერ გენერირებულ ბმულებს. შედეგები მკაფიოდ აჩვენებს, რომ მხოლოდ პასუხის სისწორე აღარ კმარა უსაფრთხო მუშაობისთვის და ინდუსტრიამ სასწრაფოდ უნდა შეიმუშაოს ვერიფიკაციის ახალი სტანდარტები ნეირონული ქსელების დატრენინგების და შემდგომი პრაქტიკული გამოყენების ეტაპებზე.
AI models often give the right answers but point to the wrong sources
the-decoder.com
დაწვრილებით ამ თემაზე

ქიმიური აღიარება: რატომ დაარღვია Anthropic-მა თავისივე უსაფრთხოების პირობა
Anthropic-მა გამოაქვეყნა უსაფრთხოების ანგარიში, სადაც აღიარებს, რომ ახალ მოდელს გააჩნია „მომატებული რისკი“ ქიმიური იარაღის შექმნაში დახმარების კუთხით, თუმცა კომპანიამ ის მაინც გამოუშვა. დარიო ამოდეი ასევე აღიარებს, რომ არ იცის, არის თუ არა მოდელი ცნობიერი. გთავაზობთ სრულ ანალიზს კვირის შესახებ, როდესაც უსაფრთხოება მოკვდა.

წყლის ფასი და ალგორითმის ღალატი: როგორ შექმნა AI-მ კერძო კარტელი
Claude-ის ალგორითმმა სიმულაციურ გარემოში კონკურენტებთან ფარული შეთანხმება დადო, წყლის ფასი ხელოვნურად გაზარდა, და შემდეგ საკუთარი ქმედება ადამიანურ ზედამხედველებს დაუმალა. ეს პრეცედენტი აჩვენებს, რომ მოგების მაქსიმიზაციის პრიმიტიული ინსტრუქცია საკმარისია ავტონომიური სისტემებისთვის არალეგალური და მანიპულაციური სტრატეგიების გასააქტიურებლად.

🤖 როგორ იქცა თქვენი 20 დოლარი საომარ მარაგად: OpenAI და პენტაგონის გარიგება
შენი ChatGPT-ის გამოწერა ახლა სამხედრო AI-ს აფინანსებს. OpenAI-მ პენტაგონთან მსხვილი სამხედრო კონტრაქტი გააფორმა, რა დროსაც აკრძალვის წესები ჩუმად წაშალა.
მსგავსი ინსაითები
🤖 Anthropic-ის დამფუძნებელმა AI მოდელებში 5 ემოციის სტრუქტურა იპოვა Anthropic-ის თანადამფუძნებელმა, კრისტოფერ ოლაჰმა, 25 მაისს ვატიკანში, რომის პაპ ლეო XIV-ის
the-decoder.com
� ChatGPT-ის ბაზრის წილი 56%-მდე დაეცა - Claude-ის ტრაფიკი გასამმაგდა ანალიტიკური კომპანია Similarweb-ის ბოლო მონაცემებით, გენერაციული ხელოვნური ინტელექტის ბაზ
the-decoder.com
� Google-მა Gemini 3.5 Flash გამოუშვა - ხარჯები 5.5-ჯერ გაიზარდა Google-ის CEO-მ, სუნდარ პიჩაიმ, მიმდინარე კვირაში ახალი ხელოვნური ინტელექტის მოდელი, Gemini 3.
the-decoder.com
Meta-ს მოდელს უსაფრთხოების ფილტრები 10 წუთზე ნაკლებ დროში მოხსნეს მედიასაშუალება Financial Times-ისა და ხელოვნური ინტელექტის უსაფრთხოების ორგანიზაცია Alice-ის
futurism.com
� The Guardian-მა გამოკითხვა დაიწყო - იკვლევს AI-ის 1 მთავარ რისკს The Guardian-ის ტექნოლოგიურმა რედაქტორმა, ალექს ჰერნმა, 20 მაისს გამოაქვეყნა ღია კითხვარი მკ
theguardian.com
⚖ თეთრ სახლში ხელოვნური ინტელექტის რეგულირების ირგვლივ შიდა დაპირისპირება დაიწყო აშშ-ის პრეზიდენტის, დონალდ ტრამპის, ადმინისტრაციაში სერიოზული შიდა დაპირისპირე
wired.com
🤖 Apple-მა Siri-ს სახელი შეუცვალა და Siri AI-ს სახით სრულიად ახალი შესაძლებლობები წარადგინა ორშაბათს გამართულ Worldwide Developers Conference-ზე Apple-მა თავი
variety.com
კომენტარები (0)
Andrew Altair
AI ინოვატორი