ویدیو دوره علم داده ۱ - کد ششم

مدت: ۴۰ ساعت
زمان برگزاری: شنبه‌ها و یکشنبه‌ها ۱۹:۰۰ الی ۲۲:۰۰ (شروع از ۳۱ تیر ۱۴۰۲)
  • از طریق کامپیوتر شخصی، لپ تاپ، موبایل و تبلت می‌توانید در این کلاس شرکت کنید.
  • فیلم این کلاس ضبط می‌شود و صرفا روی یک دستگاه سیستم عامل ویندوز یا مک یا اندروید به تعداد دفعات نامتناهی قابل پخش است.
ثبت‌نام
  • هزینه‌ی ثبت نام
    ۱,۷۵۰,۰۰۰ ۱,۴۰۰,۰۰۰ تومان
برگزار شد
ثبت‌نام در کافه‌تدریس
عضویت در کافه تدریس به معنای پذیرفتن قوانین سایت می‌باشد
  • توضیحات
  • سوالات متداول

کلاس آنلاین علم داده ۱ کافه‌تدریس در ۴۰ ساعت تنظیم شده است. این دوره دو بخش ویدیوهای پیش‌مطالعه و کلاس آنلاین را دربرمی‌گیرد. در کلاس آنلاین علم داده ۱ استاد شکرزاد شما به‌صورت تعاملی و کاملاً پویا مفاهیم پایه و اساسی دیتا ساینس را می‌آموزید.

✔️ نحوه برگزاری کلاس آنلاین علم داده ۱

➕ ۱۲ ساعت ویدیوی پیش‌‌نیاز (برای متقاضیانی که از رشته‌های غیرمرتبط وارد این حوزه می‌شوند)
➕ ۱۶ ساعت کلاس نظری
➕ ۱۲ ساعت ورک‌شاپ برنامه‌نویسی
➕ انجام‌دادن تمرینات دوره‌ای به‌صورت تیم‌ورک

✔️ سرفصل‌های ویدیوی پیش‌مطالعه کلاس آنلاین علم داده ۱

سرفصل‌های ویدیوی پیش‌مطالعه کلاس آنلاین علم داده ۱ از این قرار است:

آمار و احتمال

◻️ احتمال و احتمال شرطی 
◻️ متغیرهای تصادفی گسسته و پیوسته مهم
◻️ آمار توصیفی (میانگین، واریانس و متغیر استاندارد)
◻️ رگرسیون خطی
◻️ قضیه حد مرکزی و قانون اعداد بزرگ

ریاضی

◻️ قاعده مشتق زنجیره‌ای
◻️ مشتق مراتب بالاتر
◻️ گرادیان
◻️ جبر خطی و ماتریس و جبر مجموعه‌ها

زبان برنامه‌نویسی پایتون برای علم داده

◻️ انواع محیط‌های برنامه‌نویسی پایتون
◻️ نصب و راه‌اندازی
◻️ انواع داده در پایتون
◻️ گزاره‌های شرطی در پایتون
◻️ پیاده‌سازی مفاهیم آمار توصیفی در پایتون
◻️ پیاده‌سازی بردارها و انواع عملیات روی آن‌ها در پایتون
◻️ پیاده‌سازی ماتریس‌ها و انواع عملیات روی آن‌ها در پایتون به همراه تصویرسازی
◻️ پیاده‌سازی مشتق و گرادیان در پایتون
◻️ پیاده‌سازی حلقه و تابع در پایتون

✔️ سرفصل‌های کلاس درس

سرفصل‌های کلاس درس علم داده ۱ استاد شکرزاد از این قرار است:

انواع یادگیری ماشین

• یادگیری نظارت‌شده   (Supervised Learning)
• یادگیری بدون ناظر  (Unsupervised Learning)
• یادگیری تقویتی  (Reinforcement Learning)

مفاهیم اساسی

• پیش پردازش داده  (Preprocessing)
• مهندسی ویژگی  (Feature Engineering)
• انتخاب مدل  (Model Selection)
• بیش‌برازش و کم‌برازش  (Over fitting and Under fitting)
• انواع دسته‌بندها ( Classifiers)
• گرادیان کاهشی  (Gradient Descent)
• تابع هزینه  (Loss Function)
• تنظیم (Regularization)
• آموزش، اعتبارسنجی و آزمودن مدل  (Train, Validation, and Test)
• آموزش مدل  (training The Model)
• اعتبارسنجی  (Validation)
• آزمودن مدل  (Test The Model)

انواع روش‌های یادگیری نظارت‌شد:

• رگرسیون خطی  (Linear Regression)
• رگرسیون لجستیک  (Logistic Regression)

مقدمه‌ای بر شبکه‌های عصبی

• پرسپترون چندلایه  (Multilayer Perceptron)
• شبکه عصبی مصنوعی  (Artificial Neural Networks)
• شبکه عصبی کلاسیک  (Fully-connected Neural Netwroks)
• تابع فعال‌ساز  (Activation Function)
• وزن‌ و بایاس  (Weight and Biase)
• تابع هزینه  (Loss Function)
• الگوریتم حرکت رو به جلو  (Forward Pass)
• الگوریتم پس‌انتشار خطا  (Backpropagation)
• انواع گرادیان کاهشی  (Gradient Descent Types)
• تابع بهینه‌ساز  (Optimizer)
• اندازه دسته داده‌ها  (Batch Size)
• مشکلات شبکه عصبی کلاسیک

شبکه‌های عصبی کانولوشنی

• شبکه‌ عصبی کانولوشنی  (Convolutional Neural Networks)
• فیلتر و انواع آن  (Kernel)
• پولینگ  (Pooling)
• دراپ‌اوت  (Dropout)
• عادی‌سازی دسته داده  (Batch Normalization)
• دایلیشن  (Dilation)

✔️ برنامه درسی کلاس آنلاین آموزش علم داده ۱ 

برنامه درسی کلاس آنلاین آموزش علم داده کافه‌تدریس، به‌ترتیب جلسه‌ها، از این قرار است:

1️⃣ جلسه اول کلاس آنلاین علم داده ۱

تعریف یادگیری ماشین به‌صورت مفهومی

▪️ کاربردهای  prediction، automation  وoptimization  ماشین لرنینگ
▪️ ماشین قرار است چه چیزی را یاد بگیرد؟
▪️ ماشین چطور در تکرار و با چه روش درون‌یابی می‌کند؟
▪️ نحوه توسعه الگوریتم‌های یادگیری ماشین چیست؟
▪️ بررسی تئوری مدل‌های ماشین لرنینگ در پایتون

فرایند پیاده‌سازی یادگیری ماشین (Machine learning Pipeline)

▪️ جمع‌آوری داده  (Data collection)
▪️ آنالیز و تحلیل آماری داده  (Exploratory Data Analysis)
▪️ پیش‌پردازش  (preprocessing)
▪️ آموزش مدل  (Training Phase)
▪️ ارزیابی مدل آموزش‌دیده  (Evaluation Phase)
▪️ تعبیه مدل و تبدیل‌کردن آن به محصول  (Deployment and Productionizing)

معرفی پیش‌نیازها و منابع

▪️ معرفی شبکه‌های کامپیوتری
▪️ معرفی پیش‌نیازهای ریاضی، آمار و برنامه‌نویسی
▪️ معرفی منابع

انواع داده و دسته‌بندی داده

2️⃣ جلسه دوم کلاس آنلاین علم داده ۱

▪️ بررسی انواع زبان‌های برنامه‌نویسی برای یادگیری ماشین
▪️ بررسی انواع کتابخانه‌های پایتون که در ماشین لرنینگ کاربرد دارند
▪️ کد پایتون برای نشان‌دادن تفاوت سرعت و میزان پیچیدگی پکیج‌های پایتون به‌همراه مفهوم Big O
▪️ انواع یادگیری در ماشین لرنینگ (با ناظر، بدون ناظر، تقویتی)
▪️ بررسی یک مورد خاص و مثال عملی

3️⃣ جلسه سوم کلاس آنلاین علم داده ۱

▪️ معرفی تسک رگرسیون خط
▪️ مفهوم تابع هزینه و اررور
▪️ انواع تابع هزینه مسئله رگرسیون شامل MSE  | RMSE | SSE | MAE | SAE
▪️ تفسیر هندسی تابع هزینه رگرسیون
▪️ کد پایتون برای ترسیم اشکال سه‌بعدی
▪️ انواع رگرسیون خطی
▪️ روش‌های بهینه‌سازی تابع هزینه شامل گرادیان کاهشی (Gradient Descent) و معادله نرمال  (Normal Equation)
▪️ تفسیر ریاضی روش گرادیان کاهشی
▪️ روش‌های عادی‌سازی و استانداردسازی

4️⃣ جلسه چهارم کلاس آنلاین علم داده ۱

▪️ ورک‌شاپ برنامه‌نویسی پایتون برای تسک رگرسیون
▪️ معرفی کامل حال‌تهای مختلف datasets در پکیج  sklearn
▪️ کد پایتون با استفاده از پکیج sklearn برای پیاده‌سازی تسک رگرسیون خطی
▪️ کد پایتون با استفاده از پکیج sklearn برای پیاده‌سازی تسک رگرسیون چندمتغیره
▪️ استانداردسازی به‌روش‌های z-score یا min-max-scaler

5️⃣ جلسه پنجم کلاس آنلاین علم داده ۱

▪️ معرفی روش kmeans برای مسئله clustering بدون نظارت
▪️ مثال عملی برای درک مفهوم پیچیدگی زمانی و حافظه
▪️ انواع مسائل کلاس‌بندی
▪️ معرفی تسک کلاس‌بندی دوکلاسی و  Logistic Regression
▪️ کد پیاده‌سازی تابع سیگموید در پایتون
▪️ روش حداکثر درست‌نمایی maximum likelihood برای ساختن تابع هزینه مسئله کلاس‌بندی
▪️ معرفی تابع هزینه کراس آنتروپی  (Cross Entropy)
▪️ بررسی دلیل fit_transform و transform برای داده‌های Train  و Test

6️⃣ جلسه شش کلاس آنلاین علم داده ۱

▪️ ورک‌شاپ پیاده‌سازی تسک‌های کلاس‌بندی
▪️ تفسیر هندسی مفهوم  logistic regression
▪️ کلاس‌بندی چندکلاسی با دو روش Multiple Cross Entropy  و  One vs Rest
▪️ تعریف مفهوم مرز تصمیم‌گیری  decision boundary
▪️ ارزیابی مدل کلاسیفایر یا کمک ماتریس درهم‌ریختگی
▪️ متریک‌های  accuracy | recall | precision | f1-score
▪️ پیش‌پردازش تبدیل داده کتگوریکال به داده نیومریکال با یکی از سه روش LabelEncoder | get_dummies | OneHotEncoder
▪️ کد پایتون برای کلاس‌بندی دوکلاسی، چندکلاسی با کمک پکیج و از  scratch
▪️ کد پایتون برای دیتاست‌هایcancer  و  titanic

7️⃣ جلسه هفتم کلاس آنلاین علم داده ۱

▪️ مفهوم بیش‌برازش یا  overfitting
▪️ بررسی و نحوه ارزیابی learning curve مرحله اموزش و ارزیابی
▪️ مفهوم  generalization
▪️ راهکارهای regularization که شامل L1 و L2 هستند
▪️ مفهوم نرم و اندازه بردار با انواع روش‌های میندوسکی Mindowsky شامل منهتن  Manhatan، اقلیدسی Euclidean  و چبیشف  Chebyshev
▪️ تابع هدف روش  Regularization
▪️ تعبیر هندسی روش  Regularization
▪️ روش کراس ولیدیشن برای ارزیابی مدل  Cross Validation

8️⃣ جلسه هشتم کلاس آنلاین علم داده ۱

▪️ پیاده‌سازی روش Regularization در کد با پایتون
▪️ مفهوم grid search به‌صورت دستی و در پکیج  sklearn
▪️ بررسی مفاهیم L1 و L2 به‌صورت جداگانه در کد پایتون
▪️ استفاده از cross validation برای انواع داده در کد پایتون

9️⃣ جلسه نهم و دهم کلاس آنلاین علم داده ۱

▪️ مرور کلی دوره به‌صورت تئوری و کد
▪️ مهندسی فیچر چیست و روش‌های آن
▪️ روش‌های هندل‌کردن null values در عمل
▪️ روش‌های پیداکردن و هندل‌کردن outliers یا داده‌های پرت
▪️ تحلیل منحنی‌های آموزش و ارزیابی
▪️ رابطه میان شبکه‌های عصبی و مدل‌های سنتی یادگیری ماشین
▪️ شبکه عصبی مصنوعی چیست؟
▪️ پردازش تصویر
▪️ شمارش تعداد پارامترها در شبکه‌های عصبی
▪️ معرفی تابع هزینه شبکه‌های عصبی
▪️ مشکل شبکه‌های dense یا همان fully connected و روش‌های جایگزین
▪️ شبکه عصبی ساده و کم‌عمق MLP یا  Multi Layer Perceptron
▪️ روش یادگیری انتقالی  Transfer Learning
▪️ شبکه عصبی کانولوشنی  convolutional neural networks (CNN)
▪️ مفاهیم اصلی درCNN ها، شامل فیلتر، گام، پدینگ، پولینگ، بیش‌برازش

✔️ سرفصل‌های ورک‌شاپ برنامه‌نویسی

سرفصل‌های ورک‌شاپ برنامه‌نویسی کلاس آنلاین علم داده ۱ از این قرار است:

مقدمات اساسی پایتون برای علم داده

▪️ آشنایی با کتابخانه  Matplotlib
▪️ آشنایی با کتابخانه  SKlearn
▪️ آشنایی با کتابخانه  Scipy
▪️ آشنایی با داده ست‌های مشهور

انواع پیش‌پردازش داده‌

▪️ داده‌ متنی
▪️ داده صوتی
▪️ داده تصویر

✔️ هدف کلاس آنلاین علم داده ۱ کافه‌تدریس

با شرکت در کلاس آنلاین علم داده ۱ کافه‌تدریس به این هدف‌ها دست می‌یابید:
◻️  آشنایی با مفاهیم اساسی کار با داده (شناخت ادبیات موضوع و مفاهیم اصلی)
◻️  درک مفاهیم علوم مرتبط با علم داده، شامل ریاضی، آمار و علوم کامپیوتر
◻️  آشنایی با ابزارها، زبان‌های برنامه‌نویسی، پلتفرم‌های موردنیاز حوزه
◻️  توانایی تشخیص انواع مسائل واقعی و نحوه مدل‌سازی آن‌ها
◻️  شناخت کامل الگوریتم‌ها و روش‌های اصلی یادگیری ماشین و یادگیری عمیق

✔️ ویدئو جلسه اول کلاس آنلاین علم داده مقدماتی

  • چه کسی می‌تواند علم داده و یادگیری ماشین را بیاموزد؟

    هر کسی که به تجزیه‌وتحلیل داده‌ها و حل مسئله علاقه دارد، صرف‌نظر از پیشینه تحصیلی‌اش، می‌تواند دیتا ساینس و ماشین لرنینگ را بیاموزد.

  • پیش‌نیازهای یادگیری علم داده و ماشین لرنینگ چیست؟

    مهارت‌های اولیه برنامه‌نویسی در زبان‌هایی مانند پایتون و آشنایی با مفاهیم ریاضی و آمار از پیش‌نیازهای اصلی هستند.

  • یادگیری علم داده و ماشین لرنینگ چقدر طول می‌کشد؟

    مدت زمان یادگیری این حوزه براساس دانش قبلی شما و میزان زمانی که قرار است برای یادگیری صرف کنید؛ همچنین اینکه چقدر می‌خواهید در این حوزه عمیق شوید متفاوت است. برخی از مهارت‌های اساسی را می‌توان در چند ماه یاد گرفت، درحالی‌که تسلط بر این رشته می‌تواند زمان بیشتری را ببرد.

  • آیا باید در ریاضیات متخصص باشم؟

    ریاضیات اساس این حوزه است، اما بسیاری از مفاهیم علم داده را می‌توان با ریاضی پایه درک کرد. به تخصص در ریاضیات نیازی نیست. در طول زمان و در صورت نیاز ممکن است موضوع‌های پیشرفته‌تری را هم بررسی کنید؛ ضمن آنکه ریاضیات پایه موردنیاز به‌شکل ویدیوی ضبط‌شده بعد از ثبت‌نام در دوره در اختیارتان قرار می‌گیرد.

  • آیا تجربه کدنویسی برای شرکت در دوره علم داده لازم است؟

    مهارت‌های اولیه کدنویسی، به‌ویژه در زبان‌های برنامه‌نویسی مانند پایتون یا R، مفید هستند. کلاس آنلاین علم داده ۱ برای مبتدیان طراحی شده است و درصورتی‌که کدنویسی ندانید هم می‌توانید در آن شرکت کنید. علاوه بر ویدیوی مقدمات پایتون که جزو پیش‌نیازهاست و در اختیارتان قرار می‌گیرد، در طول کلاس آنلاین علم داده ۱، رفته‌رفته کدنویسی پایتون برای ماشین لرنینگ و علم داده را یاد می‌گیرید.

  • دامنه فرصت‌های شغلی پس از اتمام کلاس آنلاین علم داده ۱ چیست؟

    تکمیل دوره فرصت‌های شغلی‌ در نقش‌های مختلف، ازجمله تحلیلگر داده، مهندس یادگیری ماشین، دانشمند داده و متخصص هوش مصنوعی، را برای‌تان فراهم می‌کند.

  • آیا شرکت در کلاس آنلاین علم داده ۱ برایم کافی است؟‌

    جواب این سؤال به نیاز شما بستگی دارد. اینکه هدف شما از یادگیری علم داده چیست بسیار تأثیرگذار است. ممکن است شما فقط به دنبال یادگیری الگوریتم‌های پایه‌ای یادگیری ماشین برای کار پایان‌نامه ارشد خود باشید؛ در این صورت می‌توان گفت این دوره کافی است. اگر به دنبال کار در این حوزه باشید، با کلاس آنلاین علم داده ۱ ممکن است بتوانید در موقعیت شغلی تحلیلگر داده فرصت‌هایی را داشته باشید. برای ایجاد فرصت‌های شغلی بیشتر لازم است مهارت‌های خود را کامل‌تر کنید و کلاس آنلاین علم داده ۲ می‌تواند این امکان را فراهم کند.

  • آیا لازم است در رشته علوم کامپیوتر تحصیل کرده باشم؟

    داشتن پیشینه علوم کامپیوتر اجباری نیست. این دوره به‌گونه‌ای طراحی شده است که افراد از رشته‌های مختلف را در خود جای دهد.

  • آیا این دوره برای مبتدیان مناسب است؟

    بله، دوره علم داده ۱ برای مبتدیان، از رشته‌های مختلف، طراحی شده است.

  • آیا می‌توانم با سرعت یادگیری خودم پیش بروم؟

    بله، کلاس‌های هر دوره ضبط می‌شوند و ویدیوها در دسترس شما قرار می‌گیرند؛ بنابراین علاوه بر فرصت حضور در کلاس آنلاین، می‌توانید سرعت یادگیری خود را با توجه به زمان و برنامه خود تنظیم کنید.

  • آیا می‌توانم در حین کار تمام وقت در این دوره شرکت کنم؟

    بله، درصورتی‌که امکان حضور در جلسه‌های کلاس آنلاین علم داده ۱ را نداشته باشید، شما می‌توانید با درنظر‌گرفتن زمان آزاد خود برای یادگیری، ویدیوهای ضبط‌شده دوره را تماشا کنید. بنابراین، حتی اگر شاغل باشید، می‌توانید در این دوره شرکت کنید.

  • آیا به سخت‌افزار یا نرم‌افزار خاصی نیاز دارم؟

    برای شروع یادگیری علم داده و ورود به دیتا ساینس سخت‌افزار اولیه مانند کامپیوتر و اتصال به اینترنت کافی است. این دوره ممکن است ابزارهای نرم‌افزاری را که معمولاً در این حوزه استفاده می‌شود توصیه کند.

رضا شکرزاد
دانش‌آموخته علوم داده از دانشگاه رادبود هلند و مهندسی صنایع از دانشگاه شریف