ნეირონული ქსელები Jupyter ნოუთბუქი · Python

MNIST ციფრული კლასიფიკაცია ჩვენი საკუთარი ჩარჩოთი

ეს არის პრაქტიკული ნოუთბუქი. წაიკითხე კოდი და შედეგები აქ, ან გაუშვი ინტერაქტიულად Google Colab-ში ან Jupyter-ში.

ლაბორატორიული დავალება AI დამწყებთათვის სასწავლო პროგრამა-დან.

მონაცემთა ნაკრების კითხვა

ეს კოდი ჩამოტვირთავს მონაცემთა ბაზას საცავიდან ინტერნეტში. თქვენ ასევე შეგიძლიათ ხელით დააკოპიროთ მონაცემთა ნაკრები AI Curriculum-ის რეპოს /data დირექტორიადან.

იტვირთება…
გამოტანა
  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                 Dload  Upload   Total   Spent    Left  Speed

  0     0    0     0    0     0      0      0 --:--:-- --:--:-- --:--:--     0
100  9.9M  100  9.9M    0     0   9.9M      0  0:00:01 --:--:--  0:00:01 15.8M
იტვირთება…
იტვირთება…

ვნახოთ, როგორია მონაცემების ფორმა, რომელიც გვაქვს:

იტვირთება…
გამოტანა
(42000, 784)

მონაცემების გაყოფა

ჩვენ გამოვიყენებთ Scikit Learn-ს მონაცემების გასაყოფად ტრენინგსა და ტესტის მონაცემთა ბაზას შორის:

იტვირთება…
გამოტანა
Train samples: 33600, test samples: 8400

ინსტრუქცია

  1. აიღეთ ჩარჩო კოდი გაკვეთილიდან და ჩასვით ამ ნოუთბუქში, ან (უფრო უკეთესი) ცალკე პითონის მოდულში
  2. განსაზღვრეთ და ავარჯიშეთ ერთშრიანი პერცეტრონი, ვარჯიშისა და ვალიდაციის სიზუსტის დაკვირვებით ვარჯიშის დროს
  3. შეეცადეთ გაიგოთ, მოხდა თუ არა ზედმეტად მორგება და დაარეგულირეთ ფენის პარამეტრები სიზუსტის გასაუმჯობესებლად
  4. გაიმეორეთ წინა ნაბიჯები 2- და 3-ფენიანი პერცეტრონებისთვის. სცადეთ ექსპერიმენტი ჩაატაროთ სხვადასხვა აქტივაციის ფუნქციებით ფენებს შორის.
  5. შეეცადეთ უპასუხოთ შემდეგ კითხვებს:
    • მოქმედებს თუ არა ფენათაშორისი აქტივაციის ფუნქცია ქსელის მუშაობაზე?
    • ამ ამოცანისთვის გვჭირდება 2 ან 3 ფენიანი ქსელი?
    • ქსელის მომზადებაში რაიმე პრობლემა შეგექმნათ? მით უმეტეს, რომ ფენების რაოდენობა გაიზარდა.
    • როგორ იქცევა ქსელის წონები ვარჯიშის დროს? თქვენ შეგიძლიათ დახაზოთ წონების მაქსიმალური abs მნიშვნელობა ეპოქის წინააღმდეგ, რათა გაიგოთ ურთიერთობა.

ეს გაკვეთილი არის Microsoft “AI for Beginners” კურსის ქართული თარგმანი, გავრცელებული MIT ლიცენზიით.