بوت کمپ مهندسی یادگیری ماشین
جلسات
# 1 | عنوان
جلسه اول
| تاریخ پنجشنبه, 04 اسفند 1401 | توضیحات _ | از ساعت 16:00 | تا ساعت 20:00 |
# 2 | عنوان
جلسه آخر
| تاریخ پنجشنبه, 16 شهریور 1402 | توضیحات _ | از ساعت 16:00 | تا ساعت 20:00 |
مهندسی یادگیری ماشین به سرعت به یکی از محبوبترین مشاغل حوزه فناوری تبدیل شده، زیرا سازمان و متخصصین به حوزههای مرتبط با علوم دادهها علاقهمند شدهاند. اساسا یک مهندس یادگیری ماشین وظیفه ساخت مدلهایی برای حل مشکلات واقعی را دارد.
یک مهندس یادگیری ماشین، برخی مواقع مدلهای یادگیری ماشینی که یک دانشمند علم دادهها با آن کار میکند را بهینهسازی میکند و در مواردی نقش معماری را بازی میکند که پیشنیازها و ملزومات موردنیاز سایر مشاغل دادهمحور را آماده میکند تا این مشاغل بتوانند با سهولت بیشتری از دادهها استفاده کنند.
در دوره مهندسی یادگیری ماشین هدف تربیت متخصصین این حوزه برای ورود به بازار کار میباشد.
این دوره مشتمل بر 5 درس مبانی آمار و جبرخطی، مبانی علم داده و یادگیری ماشین، پایتون در علم داده، سریهای زمانی در پایتون و متن کاوی و وب کاوی کاربردی در 100 ساعت، به صورت 25 جلسه 4 ساعته طرحریزی شده است.
مبانی آمار و جبرخطی:
16 ساعت
مدرس: امیررضا تجلی
مقدمه ای بر تجزیه و تحلیل آماری
آمار توصیفی و استنباطی
برآورد پارامترهای یک جامعه با استفاده از آمار نمونه
Data Wrangling and Data Manipulation
مقدمه ای بر روش های نمونه گیری دادهها
متغیرهای تصادفی، انتظار (میانگین) و واریانس
احتمالات و توزیع های آماری
توزیع نرمال
نرمال سازی و استانداردسازی داده ها
کوواریانس | همبستگی
Multicollinearity
آزمون فرضیه ها و confidence intervals
تست های تی، فیشر و ANOVA | تست کایدو
رگرسیون خطی
تجزیه و تحلیل دادههای اکتشافی
مبانی علم داده و یادگیری ماشین:
28 ساعت
مدرس: محمدرضا محتاط
مفاهیم پایه دادهکاوی
کاربردهای دادهکاوی
متدولوژی Crisp DM
آمادهسازی داده جهت دادهکاوی
تجمیع و یکپارچهسازی دادهپ
مدیریت داده نویزی
مدیریت داده پرت
مدیریت ناهنجاری
مدیریت داده مفقوده
مدیریت داده نامتوازن
کمی کردن دادههای کیفی
نرمالسازی و استانداردسازی
یادگیری ماشین
مدلهای طبقهبندی
الگوریتم نزدیکترین همسایه
الگوریتم درخت تصمیمگیری
الگوریتم مبتنی بر قاعده
الگوریتم ماشین پشتیبان بردار
الگوریتم تجمیعی
الگوریتم شبکه عصبی
الگوریتم رگرسیون خطی ساده
الگوریتم رگرسیون چندگانه
الگوریتم رگرسیون چندمتغیره
الگوریتم رگرسیون چندجملهای
مدلهای خوشهبندی
الگوریتم Kmeans
الگوریتم Kmedoids
الگوریتم DBscan
الگوریتم سلسله مراتبی
قوانین انجمنی
الگوریتم Apriori
الگوریتم FP Growth
ارزیابی مدلهای یادگیری ماشین
پیادهسازی مفاهیم در نرمافزار SPSS Modeler
شروع کار با IBM SPSS Modeler
توابع پایه نرمافزار
مصورسازی داده
خوشهبندی با الگوریتم Kmeans و سلسله مراتبی
شناسایی دادههای پرت
قواعد انجمنی با الگوریتم Apriori
طبقهبندی با الگوریتمهای بیزین، SVM، شبکه عصبی و...
سری زمانی با الگوریتم Arima
آنالیز RFM
پایتون در علم داده:
36 ساعت
مدرس: امیررضا تجلی
یازها و چالش های موقعیت های شغلی مختلف علم داده با توجه به یادگیری زبان پایتان
مرور اجمالی بر محیط های توسعه (IDE) و بیان نقاط ضعف و قوت هر کدام
راه اندازی پایتان، معرفی کلی زبان برنامه نویسی پایتان، معرفی انواع کابخانه ها و چگونگی طریقه ورود داده از منابع مختلف
ارائه مبانی ابتدایی در محیط برنامه نویسی پایتان
نصب و راه اندازی کتابخانه های Scikit-Learn جهت پیاده سازی الگوریتم های یادگیری ماشین
تفاوتVerification و Validation
تفاوت Data Gathering و Data Collecting
تفاوت های DataBase, DataSet, Data Frame
تفاوتData Analysis و Data Analytics
تفاوت داده های Train و Test و Validation
تفاوت مفاهیم Overfitting و Underfitting
داده کاوی و یادگیری باناظر و بدون ناظر در پایتان:
بررسی و تحلیل مسائل طبقه بندی (Classification) بر روی حوزه های مختلف من جمله سلامت، پتروشیمی و خودروسازی
پیاده سازی الگوریتم درخت تصمیم و جنگل های تصادفی Decision Tree & Random Forest
الگوریتم ماشین های بردار پشتیبان Support Vector Machine
الگوریتم نزدیک ترین همسایگی KNN
الگوریتم نایو-بیز Naïve Bayes
الگوریتم شبکه های عصبی Neural Networks
الگوریتم رگرسیون لجستیک Logistic Regression
پیاده سازی الگوریتمهای یادگیری تجمیعی (Ensemble Learning) شامل: Boosting و Bagging
بررسی و تحلیل مسائل رگرسیون (Regression)
پیاده سازی الگوریتم های رگرسیونی شامل رگرسیون خطی و چند متغیره
بررسی و تحلیل مسائل مسائل خوشه بندی (Clustering)
پیاده سازی الگوریتمهای K-Means , K mediods و DBscan
بررسی و تحلیل مسائل مسائل قواعد انجمنی (Association rules)با استفاده از تکنیک Apriori در پایتان
ارزیابی مدل- امتیاز دهی مدل و اعتبار سنجی (K Fold Cross Validation)
پیاده سازی روش های اعتبار سنجی و بهبود مدل
بهینهسازی الگوریتمها و توسعه مدل
سریهای زمانی در پایتون:
8 ساعت
مدرس: امیررضا تجلی
مقدمه ای بر سریهای زمانی
مصورسازی داده در سریهای زمانی
کشف الگو در سریهای زمانی
چالش دادههای مفقوده در سریهای زمانی
Cross Validation در سریهای زمانی
مانایی و نامانایی در سریهای زمانی
روشهای آماری در سریهای زمانی
تفاوت نویز و سریهای stationary
سریهای زمانی فصلی
خودهمبستگی
روشهای ACF and PACF
مدل Autoregressive
مدل Moving Average
مدل ARIMA & SARIMA
مدل ARCH & GARCH
الگوریتم Prophet
مقدمهای بر شبکههای عصبی در سری زمانی
معماری LSTM
متن کاوی و وب کاوی کاربردی:
12 ساعت
مدرس: محمدرضا محتاط
مقدمهای بر متنکاوی
آشنایی با کتابخانههای متنکاوی پایتون
ورود دادههای متنی در پایتون
پیشپردازش متن
ساخت بردار ویژگیها با استفاده از کلمات
طبقهبندی متن
خوشهبندی متن
مدلسازی موضوعی در متون
مدل شبکه عصبی Word2Vec
تحلیل احساسات
خلاصه سازی متن
خوشه بندی مت
خزش وب با پایتون
مفاهیم پایه تحلیل شبکه اجتماعی
سناریوی ایجاد شبکه
پارامترهای تحلیل شبکه
شناسایی اجتماعات در گراف