توضیحات رویداد
پردازش زبان طبیعی شاخهای از هوش مصنوعی است که «فهم»، «تحلیل» و «تولید» متون طبیعی را توسط رایانه ممکن میکند. برای مثال وقتی با یک دستیار هوشمند مثل Siri و یا Alexa صحبت میکنیم، این ماژولهای پردازش زبان طبیعی هستند که در کنار مبدل صوت به متن فهم جمله و پس از آن اجرای دستورات ما را برای دستیارهای هوشمند ممکن میکنند. پردازش زبان طبیعی در حال حاضر یکی از فعالترین شاخههای هوش مصنوعی است.
در این کارگاه ما به همراه هم مفاهیم پایهی پردازش زبان طبیعی و تسکهای مهم آن را مرور میکنیم؛ به پیشپردازش و پسپردازش داده که در تمامی تسکها لازم است میپردازیم؛ مدلهای زبانی و تولید متن را واکاوی کرده و پس از آن شبکههای عصبی عمیق را معرفی میکنیم. وقتی با این مفاهیم آشنا شدیم، بردارهای تعبیهی کلمات که از نتایج استفاده مؤثر از شبکههای عصبی برای انجام تسکهای پردازش زبان طبیعی هستند را بررسی میکنیم و با مدلهای زبانی ماسکه (مانند BERT) و ترجمهی ماشینی بررسی تئوری پردازش زبان طبیعی را به پایان میبریم. هر چند اسم بخش اول کارگاه تئوری است، مدلهای مهم روی کد معرفی و اجرا خواهند شد.
در بخش عملی کارگاه شما برنامههایی خواهید نوشت که متون زبان طبیعی تولید کنند و ترجمهی انگلیسی به فارسی انجام دهند. در حین این کار باید دست به آچار شوید و مدل ترانسفورمر که در بخش تئوری معرفی میشود را پیادهسازی کنید. مدلهای ترانسفورمر هم برای مدل کردن زبان طبیعی، هم تولید متن و هم ترجمهی ماشینی کاربردی هستند. برای پیادهسازی این مدلها خوب است که کتابخانهای در دسترس باشد که عملیات جبر ماتریسی را تسهیل کند و همچنین برای آموزش مدل بتواند بصورت خودکار مشتق توابعی که پیاده سازی میکنیم را محاسبه کند. کتابخانهای که برای این منظور در نظر گرفتهایم PyTorch است که هدف ایجاد آن استفاده آسان در پایتون است؛ با این وجود اگر بخواهید میتوانید با jax و یا TensorFlow هم کار پیادهسازی را انجام دهید. در تمامی این مسیر ما هم در کنار شما هستیم.
پیشنیازها:
- آشنایی کافی با برنامهنویسی پایتون
- آشنایی اولیه با جبر خطی
- آشنایی اولیه با یادگیری ماشین یا شبکههای عصبی
توجه: از آنجایی که یکی از پیشنیازهای این دوره آشنایی با یادگیری عمیق است، پیشنهاد میشود افرادی که از یادگیری عمیق دانش کمی دارند کارگاه یادگیری عمیق را نیز ثبتنام کنند که یک هفته قبل از این کارگاه برگزار میشود.
معرفی مدرسان دوره:
بهروز ودادیان: رییس هیات مدیره شرکت پردازش هوشمند ترگمان - متولد ۱۳۶۱ و فارغالتحصیل استعدادهای درخشان بجنورد در سال ۷۹. کارشناسی برق-الکترونیک را در دانشگاه صنعتی شریف بین سالهای ۷۹ تا ۸۴ گذرانده و پایاننامه ایشان در رابطه با شناسایی گوینده از روی صوت (Speaker Identification) بوده است. دوره کارشناسی ارشد را از سال ۸۴ تا ۸۷ تحت راهنمایی دکتر حمیدرضا امینداور روی سیستمهای مخابراتی کار کرد. بعد از آن ۵ سال در صنعت در شرکت هدیسیستم مشغول کار بوده و روی سیستمهای OCR کار میکرده است. سال ۹۲ مجدد وارد دانشگاه شده و دکتری هوش مصنوعی را زیر نظر دکتر شهرام خدیوی و دکتر محمد رحمتی آغاز کرد. در حال حاضر بیش از ۸ سال است روی پردازش زبان طبیعی -- مخصوصاً ترجمهی ماشینی -- تحقیق میکند.
سید محمد محمدزاده ضیابری: مدیرعامل شرکت پردازش هوشمند ترگمان - متولد ۱۳۵۸. دوره کارشناسی خود را در سال ۱۳۷۶ در رشته مهندسی نرمافزار در دانشگاه آزاد اسلامی واحد تهران مرکزی آغاز نمود. از همان سال اول دانشگاه فعالیت حرفهای خود را در حوزه الکترونیک و طراحی دیجیتال آغاز نمود و از سال ۱۳۷۸ وارد حوزه رباتیک و هوش مصنوعی شد. پس از چند دوره حضور در مسابقات داخلی و بینالمللی موفق به کسب عناوینی چون مقام دوم مسابقات جهانی روبوکاپ آلمان و مقام اول مسابقات کشوری جنگ رباتها گردید و چندین دوره به عنوان داور مسابقات بینالمللی روبوکاپ ایفای نقش کرد. ایشان از سال ۱۳۸۵ تا ۱۳۹۵ در شرکت دلتاگلبال در سمت معاون فنی و سپس مهندس ارشد راهبری و توسعه چندین پروژه ملی در حوزه امنیت شبکه و پردازش وب را عهدهدار بود و همزمان از سال ۱۳۹۰ توسعه و راهبری سامانه ترجمهماشینی ترگمان را بر عهده داشت. وی کارشناسی ارشد خود در رشته هوش مصنوعی را دز سال ۱۳۹۳ از دانشگاه صنعتی امیرکبیر و زیر نظر دکتر شهرام خدیوی اخذ نمود. و از سال ۱۳۹۴ عهدهدار مدیریت شرکت پردازش هوشمند ترگمان به عنوان متولی موتور ملی ترجمهماشینی بوده است.
محل برگزاری
این کارگاه به صورت آنلاین برگزار خواهد شد و جزئیات چگونگی شرکت در آن در زمان مناسب برای ثبتنامکنندگان ارسال خواهد شد.
- آخرین مهلت ثبت نام در رویداد: 10 اردیبهشت 1401 ساعت 15:00:00
برنامه زمانی
سرفصلها:
- معرفی پردازش زبان طبیعی
- پیشپردازش و پسپردازش
- مدلهای زبانی و تولید متن
- یادگیری عمیق و پردازش زبانی طبیعی
- بردارهای تعبیهی کلمات
- مدلهای زبانی ماسکه
- ترجمهی ماشینی
- بخش عملی کارگاه (مدلهای تولید متن و ترجمهی متن)
مدت زمان دوره:
سه ساعت بخش تئوری کارگاه
چهار ساعت بخش عملی (نوشتن و آموزش مدلهای تولید متن و ترجمهی متن)
تاریخ و زمان برگزاری:
پنجشنبه ۱۵ اردیبهشت ۱۴۰۱
جلسه اول: بخش اول تئوری، ساعت ۹:۳۰ تا ۱۱:۰۰
جلسه دوم: بخش دوم تئوری، ساعت ۱۱:۰۰ تا ۱۲:۳۰
جلسه سوم: بخش عملی، ساعت ۱۴:۳۰ تا ۱۸:۳۰
کمیته فنی

دکتر بهروز ودادیان
مدرس کارگاه - شرکت پردازش هوشمند ترگمان

مهندس سید محمد محمدزاده ضیابری
مدرس کارگاه - شرکت پردازش هوشمند ترگمان
