ფიზიკური მონაცემების გლობალური დეფიციტი
ტექნოლოგიურმა გიგანტებმა ენობრივი მოდელები ინტერნეტში არსებული უფასო ტექსტებით გაწვრთნეს. ფიზიკური სამყაროს შემთხვევაში ეს მიდგომა უძლური აღმოჩნდა. ინტერნეტში არ არსებობს მონაცემთა ბაზა, რომელიც ზუსტად აღწერს სველი თეფშის ხახუნის კოეფიციენტს ან მაცივრის კარის გაღებისას საჭირო ძალის განაწილებას. ინჟინრები მიხვდნენ, რომ რობოტებს რეალური სამყაროს კინეტიკური კოდი სჭირდებათ.
Sunain-მა 1400 ადგილობრივი კონტრიბუტორი დაიქირავა ლოს-ანჯელესში ამ პრობლემის გადასაჭრელად. თითოეული მუშა ყოველდღიურ რუტინულ საქმეს ასრულებს სპეციალური სენსორული აღჭურვილობით. სტარტაპი ვიდეომასალას აგროვებს, აფასებს და რობოტიკის წამყვან კომპანიებზე ყიდის. ადამიანები საკუთარ ფიზიკურ გამოცდილებას, სივრცულ ინტუიციას და მოტორულ უნარებს უშუალოდ გასაყიდ პროდუქტად აქცევენ. ტექნოლოგიური პროგრესი ახლა უშუალოდ ადამიანის ოფლზეა დამოკიდებული.
Goldman Sachs-ის ოფიციალური პროგნოზით, ჰუმანოიდური რობოტების გლობალური ბაზარი 2035 წლისთვის 38 მილიარდ დოლარს მიაღწევს.
ფინანსური ინსტიტუტების ეს პროგნოზი სრულად ხსნის ინვესტორების აგრესიულ ქცევას. როდესაც ბაზრის პოტენციალი 38 მილიარდ დოლარს უტოლდება, მონაცემთა შეგროვების ნებისმიერი ხარჯი გამართლებულია. კომპანიები იხდიან არა უბრალოდ ვიდეოში, არამედ სივრცული ინტელექტის ნედლეულში. ეს ნედლეული განსაზღვრავს, რომელი კომპანია შექმნის პირველ უნივერსალურ საყოფაცხოვრებო ასისტენტს და რომელი დარჩება მხოლოდ ლაბორატორიულ ექსპერიმენტად.
მორავეკის პარადოქსი ამ ფენომენის ფუნდამენტური მეცნიერული ახსნაა. ლოგიკური აზროვნება, ჭადრაკის თამაში და კოდის წერა კომპიუტერისთვის მარტივი ამოცანებია. ელემენტარული სენსორული და მოტორული უნარები, როგორიცაა კიბეზე ასვლა ან მაისურის დაკეცვა, უდიდეს გამოთვლით რესურსს მოითხოვს. მილიონობით წლის ევოლუციამ ადამიანის ტვინში ეს უნარები ინსტინქტის დონეზე დაშიფრა. მანქანებს ამ ევოლუციური გზის გავლა ნულიდან, ციფრულ ფორმატში უწევთ.
სწორედ ამიტომ, მწარმოებლები უზარმაზარ თანხებს ხარჯავენ ადამიანური გამოცდილების დიგიტალიზაციაში. მათ სჭირდებათ ათობით მილიონი საათის ვიდეომასალა, რათა ალგორითმმა სიმძიმის, სივრცისა და ობიექტების ურთიერთქმედების კანონზომიერებები აღიქვას. ხელოვნური ინტელექტის სისტემები ახლა ფიზიკის გაკვეთილებს პირდაპირ ლოს-ანჯელესის სამზარეულოებიდან იღებენ.
კინეტიკური მოსავლის არქიტექტურა
პროცესი ბევრად უფრო კომპლექსურია, ვიდრე GoPro კამერით გადაღებული სამოყვარულო კადრები. პროფესიონალი კონტრიბუტორები იყენებენ რთულ ტელეოპერაციის სისტემებსა და ჰაპტიკურ ხელთათმანებს. სისტემა იწერს ვიზუალურ კადრს, ძალის ვექტორებს, კუთხურ აჩქარებას და სივრცულ კოორდინატებს მილიმეტრიანი სიზუსტით. როდესაც კონტრიბუტორი ჭიქას მაგიდიდან იღებს, კამერა აფიქსირებს ტრაექტორიას, ხოლო ხელთათმანი თითების დაწოლის ზუსტ ძალას ზომავს.
ეს არის ადამიანური ფიზიკური დნმ-ის პირდაპირი ტრანსლაცია ციფრულ არქიტექტურაში. ინჟინრები ამ კომპლექსურ პაკეტს იღებენ და ნეირონულ ქსელებს კვებავენ. ალგორითმი სწავლობს პირდაპირ კავშირს ვიზუალურ სტიმულსა და მოტორულ რეაქციას შორის, რასაც ინდუსტრიაში ვიზუალურ-მოტორული პოლიტიკა ეწოდება. რობოტი უყურებს უცხო ობიექტს და მის მეხსიერებაში არსებული ადამიანური გამოცდილების ბაზაზე დაყრდნობით გამოითვლის იდეალურ ტრაექტორიას.
მკვლევარებმა დიდი ხნის წინ სცადეს სინთეტიკური მონაცემების გამოყენება. მათ შექმნეს ვირტუალური სიმულაციები, სადაც ციფრული რობოტები ობიექტებთან ურთიერთქმედებას სწავლობდნენ. პრობლემა იმაში მდგომარეობს, რომ სიმულაცია ვერასდროს ასახავს რეალური სამყაროს უსასრულო ქაოსს. ფიზიკური ძრავები უშვებენ შეცდომებს ხახუნის გამოთვლისას, ვერ აღიქვამენ სინათლის კომპლექსურ გარდატეხას და უგულებელყოფენ მცირე დეტალებს. ამ მცირე დეფექტებს სიმულაციაში გლიჩები ეწოდება.
რეალური სამყარო არ შეიცავს გლიჩებს, ის შეიცავს მოულოდნელობებს. ლოს-ანჯელესის ბინებში არსებული უწესრიგობა, განსხვავებული განათება, იატაკზე დაგდებული სათამაშოები და მოულოდნელი დაბრკოლებები ზუსტად ის სასიცოცხლო მასალაა, რაც ალგორითმს მოქნილობას სძენს. რობოტმა უნდა ისწავლოს მუშაობა ქაოსში და არა მხოლოდ სტერილურ ლაბორატორიულ პირობებში. კალიფორნიული სტარტაპები ზუსტად ამ ქაოსის დიგიტალიზაციას ახდენენ.
ჩინეთის ინდუსტრიული პასუხი
დასავლური გიგ-ეკონომიკის მოდელის პარალელურად, სრულიად განსხვავებული სტრატეგია ვითარდება აზიაში. Rest of World-ის გამოძიებამ აჩვენა, რომ ჩინეთმა სახელმწიფო დაფინანსებით 40 სპეციალური დაწესებულება შექმნა. ეს არის გიგანტური, სტანდარტიზებული მონაცემთა ქარხნები. ათასობით მუშა ყოველდღიურად ასრულებს ერთსა და იმავე დავალებას მკაცრად კონტროლირებად გარემოში, რათა სენსორებმა მათი მოქმედების იდეალური პატერნები დააფიქსირონ.
ჩინური სახელმწიფო სტრატეგია ინდუსტრიულ მასშტაბსა და მაქსიმალურ სიზუსტეზეა ორიენტირებული. ისინი ქმნიან მონაცემთა უწყვეტ, ცენტრალიზებულ კონვეიერს ლოჯისტიკური და საწარმოო რობოტებისთვის. აქ არ არის ადგილი საყოფაცხოვრებო ქაოსისთვის. მუშები იმეორებენ კონკრეტულ ქმედებებს ათიათასჯერ, რათა ალგორითმმა აბსოლუტური პერფექციონიზმი გამოიმუშაოს. ეს არის სახელმწიფო აპარატის მიერ მართული კინეტიკური მოსავლის აღება.
ფიზიკური მოქმედებების მაღალი ხარისხის მონაცემთა ბაზები 21-ე საუკუნის ახალი სტრატეგიული რეზერვია. ის სახელმწიფო, რომელიც მეტ კინეტიკურ კოდს დააგროვებს, მომავლის ეკონომიკის არქიტექტორი გახდება.
კალიფორნიული და ჩინური მიდგომები ერთსა და იმავე ტექნოლოგიურ პრობლემას წყვეტს, თუმცა რადიკალურად განსხვავებული ფილოსოფიით. ამერიკული Google და OpenAI ეყრდნობიან დეცენტრალიზებულ ქსელებს, სადაც თითოეული მომხმარებელი უნიკალურ სიტუაციას აგენერირებს. ჩინური მოდელი ეყრდნობა ცენტრალიზებულ დისციპლინას, სადაც მთავარი მიზანი ინდუსტრიული პროცესების აბსოლუტური ოპტიმიზაციაა. ეს არის ორი განსხვავებული პარადიგმის ბრძოლა ფიზიკური სამყაროს დასაპყრობად.
ეკონომიკური პარადოქსი და შრომის მომავალი
მონაცემთა შეგროვების ეს ორი კონკურენტული მეთოდი პირდაპირ განსაზღვრავს მომავალი რობოტების შესაძლებლობებს და ბაზრის სეგმენტაციას. დასავლური ჰუმანოიდები, რომლებიც ლოს-ანჯელესის სახლებში შეგროვებული ვიდეოებით იწვრთნებიან, უპირობო ლიდერები გახდებიან საყოფაცხოვრებო და სერვისის სექტორში. ისინი მიეჩვევიან იატაკზე დაგდებულ ნივთებს, შინაურ ცხოველებს და არასტანდარტულ ავეჯთან მუშაობას. მათი მთავარი უპირატესობა ადაპტაციურობა იქნება.
ჩინეთის ინდუსტრიული მასშტაბის მონაცემთა შეგროვება მიანიშნებს, რომ მომავალი ათწლეულის განმავლობაში მათი რობოტები სრულ მონოპოლიას დაამყარებენ გლობალურ საწარმოო ხაზებსა და სასაწყობე ლოჯისტიკაში.
ჩინური რობოტები, რომლებიც ინდუსტრიულ გარემოში გაწვრთნილ ალგორითმებს ეყრდნობიან, წარმოებაში უალტერნატივო ძალა გახდებიან. მათი მოძრაობები იქნება უფრო ზუსტი, სწრაფი, ენერგოეფექტური და სტანდარტიზებული. რობოტიკის 38-მილიარდიანი ბაზარი მკვეთრად გაიყოფა ამ ორი სპეციალიზაციის მიხედვით. დასავლეთი გაყიდის მოქნილობას, ხოლო აღმოსავლეთი გაყიდის ინდუსტრიულ ეფექტურობას. თითოეული მოდელი საკუთარ უზარმაზარ ნიშას დაიკავებს გლობალურ ეკონომიკაში.
პარალელურად, ახალი პროფესიის გაჩენა პირდაპირ ცვლის შრომის ბაზრის დინამიკას. ათიათასობით ადამიანისთვის რობოტების ტრენერობა ძირითადი, ან მნიშვნელოვანი დამატებითი შემოსავლის წყარო ხდება. კონტრიბუტორები საკუთარ დროსა და ენერგიას ყიდიან, რათა მანქანებს ადამიანური ქცევა ასწავლონ. ისინი ფაქტობრივად საკუთარ ციფრულ შემცვლელებს ზრდიან და ამ პროცესს კაპიტალიზმის ერთ-ერთი ყველაზე დიდი პარადოქსი შეიძლება ვუწოდოთ.
როდესაც მონაცემთა ბაზები შეივსება და ალგორითმები საკმარისად დაიხვეწება, ადამიანის ფიზიკური გამოცდილების მასობრივი შესყიდვის საჭიროება ექსპონენციალურად შემცირდება. რობოტები დაიწყებენ სწავლას სხვა რობოტებისგან შეცდომების ანალიზით. ეკონომიკური ღირებულება სრულად გადავა მონაცემთა შემქმნელი გიგ-მუშაკებიდან ამ მონაცემების მფლობელ კორპორაციებზე. დღევანდელი ტრენერები ხვალ საკუთარივე გაწვრთნილი ტექნოლოგიის კონკურენტები აღმოჩნდებიან.
ეს პროცესი ასევე აჩვენებს ღირებულების ცვლის ტენდენციას აპარატურული უზრუნველყოფიდან პროგრამულ უზრუნველყოფისკენ. რობოტის სხეული, ლითონი და სერვომოტორები სწრაფად ხდება იაფი სასაქონლო პროდუქტი. ნამდვილი ღირებულება ინახება იმ ნეირონულ ქსელში, რომელმაც იცის, თუ როგორ უნდა მართოს ეს ლითონი. ტექნოლოგიური კომპანიების მთავარი აქტივი არის არა რობოტის დიზაინი, არამედ ის კინეტიკური კოდი, რომელიც მათ მილიონობით საათის ადამიანური შრომისგან შეაგროვეს.
ანალიტიკოსის პერსპექტივა: ადამიანური კოდის ფასი
რობოტების ინდუსტრიას საზოგადოება ხშირად აღიქვამს, როგორც წმინდად სინთეტიკურ ფენომენს, რომელიც სტერილურ ლაბორატორიებში იბადება და პროგრამისტების მიერ იმართება. რეალობა სრულიად განსხვავებული და გაცილებით უფრო ორგანულია. პირველი თაობის ფუნქციური ჰუმანოიდები ღრმად ადამიანური პროდუქტი იქნება. მათი თითოეული მოძრაობა, ჭიქის აღების მანერა, კარის გაღების კუთხე თუ დაბრკოლებისთვის გვერდის ავლის სტრატეგია იმ 25 000 რეალური ადამიანის კინეტიკური ჩანაწერის ზუსტი ასლია, რომლებიც დღეს ჩვენს ქუჩებში დადიან.
ავტორის კომენტარი
ყველაზე დიდი ირონია ის არის, რომ ფიზიკური შრომის სრულ ავტომატიზაციამდე მისასვლელად ტექნოლოგიურ გიგანტებს ისევ ყველაზე ტრადიციული და მოძველებული რესურსი — ადამიანის უშუალო ფიზიკური შრომა დასჭირდათ. ინდუსტრიული რევოლუციის ციკლი იკვრება.
ჩვენ ტექნოლოგიური ისტორიის უნიკალურ გარდამავალ ფაზაში ვიმყოფებით. კომპანიები იძულებულნი არიან, ფიზიკური შრომის საბოლოო ავტომატიზაციისთვის კვლავ ინტენსიური ადამიანური შრომა გამოიყენონ მედიატორად. მანქანები ჩვენს მოძრაობებს ითვისებენ უდიდესი სიზუსტით, რათა მომავალში ეს მოძრაობები ჩვენ მაგივრად შეასრულონ. სივრცული ინტელექტი ციფრულ ვაკუუმში ვერ გენერირდება. მას სჭირდება უშუალო, უხეში ფიზიკური კონტაქტი რეალურ სამყაროსთან და ინდუსტრია ამ კონტაქტს ახლა კონტრიბუტორებისგან ყიდულობს.
როდესაც ქუჩაში რობოტს დაინახავთ, რომელიც რთულ დავალებას ასრულებს, უნდა გახსოვდეთ ერთი ფაქტი. მან ეს არ ისწავლა კოდის წერით ან მათემატიკური ფორმულებით. მან ეს ისწავლა იმიტომ, რომ 2026 წელს ლოს-ანჯელესში ვიღაცამ 80 დოლარის სანაცვლოდ მკერდზე კამერა დაიმონტაჟა და ორი საათის განმავლობაში ჭურჭელი გარეცხა. ჩვენ ვქმნით ჩვენივე ფიზიკური არსებობის ღია კოდს და მას კორპორაციებს ვუთმობთ. ეს არის ტექნოლოგიური პროგრესის ყველაზე გულწრფელი და დაუნდობელი სახე.



