گالری

توضیحات رویداد

پردازش زبان طبیعی شاخه‌ای از هوش مصنوعی است که «فهم»، «تحلیل» و «تولید» متون طبیعی را توسط رایانه ممکن می‌کند. برای مثال وقتی با یک دستیار هوشمند مثل Siri و یا Alexa صحبت می‌کنیم، این ماژول‌های پردازش زبان طبیعی هستند که در کنار مبدل صوت به متن فهم جمله و پس از آن اجرای دستورات ما را برای دستیارهای هوشمند ممکن می‌کنند. پردازش زبان طبیعی در حال حاضر یکی از فعال‌ترین شاخه‌های هوش مصنوعی است.

در این کارگاه ما به همراه هم مفاهیم پایه‌ی پردازش زبان طبیعی و تسک‌های مهم آن را مرور می‌کنیم؛ به پیش‌پردازش و پس‌پردازش داده که در تمامی تسک‌ها لازم است می‌پردازیم؛ مدل‌های زبانی و تولید متن را واکاوی کرده و پس از آن شبکه‌های عصبی عمیق را معرفی می‌کنیم. وقتی با این مفاهیم آشنا شدیم، بردارهای تعبیه‌ی کلمات که از نتایج استفاده مؤثر از شبکه‌های عصبی برای انجام تسک‌های پردازش زبان طبیعی هستند را بررسی می‌کنیم و با مدل‌های زبانی ماسکه (مانند BERT) و ترجمه‌ی ماشینی بررسی تئوری پردازش زبان طبیعی را به پایان می‌بریم. هر چند اسم بخش اول کارگاه تئوری است، مدل‌های مهم روی کد معرفی و اجرا خواهند شد.

در بخش عملی کارگاه شما برنامه‌هایی خواهید نوشت که متون زبان طبیعی تولید کنند و ترجمه‌ی انگلیسی به فارسی انجام دهند. در حین این کار باید دست به آچار شوید و مدل ترانسفورمر که در بخش تئوری معرفی می‌شود را پیاده‌سازی کنید. مدل‌های ترانسفورمر هم برای مدل کردن زبان طبیعی، هم تولید متن و هم ترجمه‌ی ماشینی کاربردی هستند. برای پیاده‌سازی این مدل‌ها خوب است که کتابخانه‌ای در دسترس باشد که عملیات جبر ماتریسی را تسهیل کند و همچنین برای آموزش مدل بتواند بصورت خودکار مشتق توابعی که پیاده سازی میکنیم را محاسبه کند. کتابخانه‌ای که برای این منظور در نظر گرفته‌ایم PyTorch است که هدف ایجاد آن استفاده آسان در پایتون است؛ با این وجود اگر بخواهید می‌توانید با jax و یا TensorFlow هم کار پیاده‌سازی را انجام دهید. در تمامی این مسیر ما هم در کنار شما هستیم.

پیش‌نیازها:

  1. آشنایی کافی با برنامه‌نویسی پایتون
  2. آشنایی اولیه با جبر خطی
  3. آشنایی اولیه با یادگیری ماشین یا شبکه‌های عصبی

توجه: از آنجایی که یکی از پیش‌نیازهای این دوره آشنایی با یادگیری عمیق است، پیشنهاد می‌شود افرادی که از یادگیری عمیق دانش کمی دارند کارگاه یادگیری عمیق را نیز ثبت‌نام کنند که یک هفته قبل از این کارگاه برگزار می‌شود.

معرفی مدرسان دوره:

بهروز ودادیان: رییس هیات مدیره شرکت پردازش هوشمند ترگمان - متولد ۱۳۶۱ و فارغ‌التحصیل استعدادهای درخشان بجنورد در سال ۷۹. کارشناسی برق-الکترونیک را در دانشگاه صنعتی شریف بین سالهای ۷۹ تا ۸۴ گذرانده و پایان‌نامه‌ ایشان در رابطه با شناسایی گوینده از روی صوت (Speaker Identification) بوده است. دوره کارشناسی ارشد را از سال ۸۴ تا ۸۷ تحت راهنمایی دکتر حمیدرضا امین‌داور روی سیستم‌های مخابراتی کار کرد. بعد از آن ۵ سال در صنعت در شرکت هدی‌سیستم مشغول کار بوده و روی سیستم‌های OCR کار می‌کرده است. سال ۹۲ مجدد وارد دانشگاه شده و دکتری هوش مصنوعی را زیر نظر دکتر شهرام خدیوی و دکتر محمد رحمتی آغاز کرد. در حال حاضر بیش از ۸ سال است روی پردازش زبان طبیعی -- مخصوصاً ترجمه‌ی ماشینی -- تحقیق می‌کند.

سید محمد محمدزاده ضیابری: مدیرعامل شرکت پردازش هوشمند ترگمان - متولد ۱۳۵۸. دوره کارشناسی خود را در سال ۱۳۷۶ در رشته مهندسی نرم‌افزار در دانشگاه آزاد اسلامی واحد تهران مرکزی آغاز نمود. از همان سال اول دانشگاه فعالیت حرفه‌ای خود را در حوزه الکترونیک و طراحی دیجیتال آغاز نمود و از سال ۱۳۷۸ وارد حوزه رباتیک و هوش مصنوعی شد. پس از چند دوره حضور در مسابقات داخلی و بین‌المللی موفق به کسب عناوینی چون مقام دوم مسابقات جهانی روبوکاپ آلمان و مقام اول مسابقات کشوری جنگ ربات‌ها گردید و چندین دوره به عنوان داور مسابقات بین‌المللی روبوکاپ ایفای نقش کرد. ایشان از سال ۱۳۸۵ تا ۱۳۹۵ در شرکت دلتاگلبال در سمت‌ معاون فنی و سپس مهندس ارشد راهبری و توسعه چندین پروژه ملی در حوزه امنیت شبکه و پردازش وب را عهده‌دار بود و همزمان از سال ۱۳۹۰ توسعه و راهبری سامانه ترجمه‌ماشینی ترگمان را بر عهده داشت. وی کارشناسی ارشد خود در رشته هوش مصنوعی را دز سال ۱۳۹۳ از دانشگاه صنعتی  امیرکبیر و زیر نظر دکتر شهرام خدیوی اخذ نمود. و از سال ۱۳۹۴ عهده‌دار مدیریت شرکت پردازش هوشمند ترگمان به عنوان متولی موتور ملی ترجمه‌ماشینی بوده است.

محل برگزاری

این کارگاه به صورت آنلاین برگزار خواهد شد و جزئیات چگونگی شرکت در آن در زمان مناسب برای ثبت‌نام‌کنندگان ارسال خواهد شد.
  • آخرین مهلت ثبت نام در رویداد: 10 اردیبهشت 1401 ساعت 15:00:00

برنامه زمانی

سرفصل‌ها:

  1. معرفی پردازش زبان طبیعی
  2. پیش‌پردازش و پس‌پردازش
  3. مدل‌های زبانی و تولید متن
  4. یادگیری عمیق و پردازش زبانی طبیعی
  5. بردارهای تعبیه‌ی کلمات
  6. مدل‌های زبانی ماسکه
  7. ترجمه‌ی ماشینی
  8. بخش عملی کارگاه (مدل‌های تولید متن و ترجمه‌ی متن)

مدت زمان دوره:

سه ساعت بخش تئوری کارگاه

چهار ساعت بخش عملی (نوشتن و آموزش مدل‌های تولید متن و ترجمه‌ی متن)

تاریخ و زمان برگزاری:

پنج‌شنبه ۱۵ اردیبهشت ۱۴۰۱

جلسه اول: بخش اول تئوری، ساعت ۹:۳۰ تا ۱۱:۰۰

جلسه دوم: بخش دوم تئوری، ساعت ۱۱:۰۰ تا ۱۲:۳۰

جلسه سوم: بخش عملی، ساعت ۱۴:۳۰ تا ۱۸:۳۰

کمیته فنی

دکتر سعیده ممتازی

ناظر علمی - دانشگاه صنعتی امیرکبیر
دکتر بهروز ودادیان

مدرس کارگاه - شرکت پردازش هوشمند ترگمان
مهندس سید محمد محمدزاده ضیابری

مدرس کارگاه - شرکت پردازش هوشمند ترگمان

مسابقات مربوط به این رویداد