گالری

توضیحات رویداد

این کارگاه آموزشی با هدف آشنایی شما با مبانی پردازش گفتار فراهم گردیده است. در این رویداد سعی خواهد شد ابتدا مروری اجمالی بر مبانی پردازش گفتار و مراحل کلی استخراج ویژگی و بازنمایی داده‌های گفتاری انجام شده و در گام بعد مراحل آموزش یک مدل شبکه عصبی در بازشناسی گفتار (تبدیل گفتار به متن) توضیح داده‌ شود.

در انتهای رویداد انتظار می‌رود شرکت کنندگان آشنایی کافی در خصوص مراحل پردازش گفتار را به دست آورده و حداقل یکی از مدل‌های زبانی گفتاری و پیش‌آموزش دیده را شناخته باشند. همچنین توانایی لازم جهت پیاده‌سازی و آموزش یک مدل شبکه عصبی برای تولید متن از گفتار را کسب کرده باشند.

پیش‌نیاز‌ها

جهت بهره‌مندی از این کارگاه نیاز است که شرکت‌کننده‌ها با زبان پایتون آشنایی کافی را داشته باشند. همچنین برای بخش پایانی کارگاه که پیاده‌سازی مدل شبکه عصبی می‌باشد بهتر است شرکت‌کنندگان با چارچوب پایتورچ آشنا باشند.

معرفی مدرس

مهندس مجید ادیبیان فارغ التحصیل کارشناسی مهندسی کامپیوتر و کارشناسی ارشد هوش مصنوعی از دانشگاه صنعتی امیرکبیر است که در حال حاضر دانشجوی دکترای هوش مصنوعی در این دانشگاه است. ایشان دارای ۴ سال سابقه کار پژوهشی و ۳ سال سابقه کار صنعتی در هوش مصنوعی به خصوص در زمینه پردازش گفتار و متن و با تمرکز بر روی سامانه‌‌های متن به گفتار است. ایشان هم‌اینک محقق ارشد در تیم پردازش گفتار مرکز هوش مصنوعی شرکت شاتل است که سابقه تدریس «کارگاه مبانی برنامه‌نویسی» و درس «سیگنال‌ها و سیستم‌ها» در دانشگاه امیرکبیر نیز دارد.

هزینه کارگاه

با احتساب ۹۰ درصد تخفیف از طرف معاونت علمی ریاست جمهوری، هزینه این کارگاه ۲۰۰ هزار تومان است.

محل برگزاری

کارگاه به صورت حضوری در دانشگاه صنعتی امیرکبیر برگزار می‌شود.
  • آخرین مهلت ثبت نام در رویداد: 05 آذر 1403 ساعت 18:00:00

برنامه زمانی

این کارگاه در دو جلسه ۲ ساعته حضوری به شرح زیر برگزار می‌شود:

  1. جلسه اول: چهارشنبه ۷ آذر، ساعت ۱۰:۰۰ تا ۱۲:۰۰
  2. جلسه دوم: چهارشنبه ۷ آذر، شاعت ۱۳:۰۰ تا ۱۵:۰۰

 

سرفصل‌های دوره

ردیف

عنوان کلی

جزئیات

زمان تخمینی

۱

مفاهیم اولیه در داده‌های صوتی

  1. آشنایی با داده‌های صوتی
  2. نحوه خواندن و تشخیص خصوصیات داده‌های صوتی

۳۰ دقیقه

۲

مراحل اصلی در گفتار پردازی

  1. کار با داده‌های صوتی در حوزه زمان و فرکانس
  2. پیش‌پردازش‌های اصلی در داده‌های گفتاری
  3. اسخراج ویژگی‌های اولیه

۶۰ دقیقه

۳

آشنایی با یکی از مدل‌های زبانی گفتاری

  1. معرفی مختصر مدل
  2. نحوه پیش‌آموزش مدل
  3. نحوه استفاده در کاربرد خاص

۳۰ دقیقه

۴

توسعه مدل ساده در بازشناسی گفتار

  1. پیاده‌سازی کد پردازش داده‌های گفتاری
  2. پیاده‌سازی کد آموزش مدل
  3. پیاده‌سازی کد استنتاج و ارزیابی مدل

۹۰ دقیقه

مسابقات مربوط به این رویداد

آواتار

چالش تصدیق هویت گوینده وابسته به متن

رقابت متخصصین پردازش گفتار برای ارائه راهکارهای نوین برای موفقیت رمز گفتاری