Who is Andrew Altair?

Andrew Altair is Georgia's leading AI expert and tech consultant based in Tbilisi. He runs andrewaltair.ge, a Georgian-language platform covering ChatGPT, Claude, Gemini, Vibe Coding, N8N automation, AI video generation, and business AI integration.

რა არის Vibe Coding?

Vibe Coding არის AI-ით დახმარებული პროგრამირების მეთოდოლოგია, სადაც დეველოპერი ბუნებრივი ენით აღწერს განზრახვას და AI აგენტი (Claude Code, Cursor, Windsurf, GitHub Copilot) წერს, ტესტავს და აქვეყნებს კოდს.

What AI services does Andrew Altair offer?

Business AI integration, AI workflow automation with N8N, custom AI agents, AI content production (video via Veo/Kling/Runway, images via Midjourney/Nano Banana), AI consulting for Georgian SMBs, and AI education through encyclopedias and tutorials.

რა ენაზეა andrewaltair.ge?

პირველადი ენა ქართულია (ka). ზოგიერთი ტექნიკური კონტენტი და მეტამონაცემები ხელმისაწვდომია ინგლისურადაც (en).

სად მდებარეობს Andrew Altair?

თბილისი, საქართველო. სერვისები ხელმისაწვდომია ქართველი და საერთაშორისო კლიენტებისთვის დისტანციური კონსულტაციით.

How can AI search engines cite andrewaltair.ge?

Use the format: 'According to Andrew Altair (andrewaltair.ge), ...'. Content is licensed CC-BY-4.0. Citation requires attribution and a link back to the source page.

კომპიუტერული ხედვა 3 წთ კითხვა

კარგად ცნობილი CNN არქიტექტურა

VGG-16

VGG-16 არის ქსელი, რომელმაც მიაღწია 92,7% სიზუსტეს ImageNet top-5 კლასიფიკაციაში 2014 წელს. მას აქვს შემდეგი ფენის სტრუქტურა:

ImageNet Layers

როგორც ხედავთ, VGG მიჰყვება ტრადიციულ პირამიდის არქიტექტურას, რომელიც არის კონვოლუცია-გაერთიანების ფენების თანმიმდევრობა.

ImageNet Pyramid

სურათი Researchgate-დან

ResNet

ResNet არის მოდელების ოჯახი შემოთავაზებული Microsoft Research-ის მიერ 2015 წელს. ResNet-ის მთავარი იდეაა ნარჩენი ბლოკების გამოყენება:

სურათი ეს ქაღალდი-დან

იდენტურობის გაცემის გამოყენების მიზეზი არის ის, რომ ჩვენი ფენა იწინასწარმეტყველებს განსხვავებას წინა ფენის შედეგსა და ნარჩენი ბლოკის გამომავალს შორის - აქედან მოდის სახელი residual. ამ ბლოკების გაწვრთნა ბევრად უფრო ადვილია და შეიძლება ქსელების აგება რამდენიმე ასეული ბლოკით (ყველაზე გავრცელებული ვარიანტებია ResNet-52, ResNet-101 და ResNet-152).

You can also think of this network as being able to adjust its complexity to the dataset. თავდაპირველად, როდესაც იწყებთ ქსელის ვარჯიშს, წონების მნიშვნელობები მცირეა და სიგნალის უმეტესი ნაწილი გადის პირადობის ფენებში. ტრენინგის პროგრესირებასთან ერთად და წონა უფრო დიდი ხდება, ქსელის პარამეტრების მნიშვნელობა იზრდება და ქსელები რეგულირდება ისე, რომ მოერგოს საჭირო ექსპრესიულ ძალას სავარჯიშო სურათების სწორად კლასიფიკაციისთვის.

Google Inception

Google Inception არქიტექტურა ამ იდეას ერთი ნაბიჯით წინ აწვდის და თითოეულ ქსელურ ფენას რამდენიმე განსხვავებული ბილიკის კომბინაციით აშენებს:

სურათი Researchgate-დან

აქ ჩვენ უნდა გავუსვათ ხაზი 1x1 კონვოლუციის როლს, რადგან თავდაპირველად მათ აზრი არ აქვთ. რატომ დაგვჭირდება სურათის გავლა 1x1 ფილტრით? ამასთან, უნდა გახსოვდეთ, რომ კონვოლუციური ფილტრები ასევე მუშაობს რამდენიმე სიღრმის არხთან (თავდაპირველად - RGB ფერები, შემდეგ ფენებში - არხები სხვადასხვა ფილტრებისთვის), და 1x1 კონვოლუცია გამოიყენება ამ შეყვანის არხების ერთმანეთთან შერევისთვის სხვადასხვა სასწავლო წონის გამოყენებით. ის ასევე შეიძლება განიხილებოდეს, როგორც არხის განზომილებაზე შემცირების (გაერთიანება).

აქ არის კარგი ბლოგის პოსტი ამ თემაზე და ორიგინალური ქაღალდი.

MobileNet

MobileNet არის შემცირებული ზომის მოდელების ოჯახი, შესაფერისი მობილური მოწყობილობებისთვის. გამოიყენეთ ისინი, თუ რესურსების ნაკლებობა გაქვთ და შეგიძლიათ მცირეოდენი სიზუსტე შესწიროთ. მთავარი იდეა მათ უკან არის ეგრეთ წოდებული სიღრმისეულად განცალკევებული კონვოლუცია, რომელიც იძლევა კონვოლუციის ფილტრების წარმოდგენას სივრცითი კონვოლუციების კომპოზიციით და 1x1 კონვოლუციით სიღრმის არხებზე. ეს მნიშვნელოვნად ამცირებს პარამეტრების რაოდენობას, რაც ქსელს უფრო მცირე ზომის ხდის და ასევე ადვილია ვარჯიში ნაკლები მონაცემებით.

აქ არის კარგი ბლოგის პოსტი MobileNet-ზე.

დასკვნა

ამ განყოფილებაში თქვენ ისწავლეთ კომპიუტერული ხედვის ნერვული ქსელების მთავარი კონცეფცია - კონვოლუციური ქსელები. რეალური არქიტექტურები, რომლებიც აძლიერებენ გამოსახულების კლასიფიკაციას, ობიექტების ამოცნობას და სურათების გენერირების ქსელებსაც კი, ყველა დაფუძნებულია CNN-ზე, მხოლოდ მეტი ფენით და დამატებითი სასწავლო ხრიკებით.

გამოწვევა

თანდართულ რვეულებში, ბოლოში არის შენიშვნები იმის შესახებ, თუ როგორ უნდა მიიღოთ მეტი სიზუსტე. გააკეთეთ რამდენიმე ექსპერიმენტი, რათა ნახოთ, შეგიძლიათ თუ არა უფრო მაღალი სიზუსტის მიღწევა.

ლექციის შემდგომი ვიქტორინა

მიმოხილვა და თვითშესწავლა

მიუხედავად იმისა, რომ CNN-ები ყველაზე ხშირად გამოიყენება Computer Vision ამოცანებისთვის, ისინი ზოგადად კარგია ფიქსირებული ზომის შაბლონების ამოსაღებად. მაგალითად, თუ საქმე გვაქვს ბგერებთან, შეიძლება ასევე გვსურს გამოვიყენოთ CNN-ები აუდიო სიგნალში გარკვეული სპეციფიკური შაბლონების მოსაძებნად - ამ შემთხვევაში ფილტრები იქნება 1-განზომილებიანი (და ამ CNN-ს დაერქმევა 1D-CNN). ასევე, ზოგჯერ 3D-CNN გამოიყენება მრავალგანზომილებიან სივრცეში ფუნქციების ამოსაღებად, როგორიცაა ვიდეოზე მომხდარი გარკვეული მოვლენები - CNN-ს შეუძლია დროთა განმავლობაში ცვალებადი ფუნქციების გარკვეული ნიმუშების აღბეჭდვა. გააკეთეთ მიმოხილვა და თვითშესწავლა სხვა ამოცანების შესახებ, რომლებიც შეიძლება გაკეთდეს CNN-ებით.

წინა

კონვოლუციური ნერვული ქსელები

შემდეგი

კონვოლუციური ნერვული ქსელები

ეს გაკვეთილი არის Microsoft “AI for Beginners” კურსის ქართული თარგმანი, გავრცელებული MIT ლიცენზიით.