زمان برگزاری کارگاه:
ساعت 13:30الی 15:00و 15:30الی 17:00
پردازش زبان طبیعی یکی از حوزههای مهم علوم رایانه، هوش مصنوعی و زبانشناسی است که مرتبط با تعاملات بین رایانه و زبان انسانی (طبیعی) است. یکی از رایجترین کاربردهای پردازش زبان طبیعی، ترجمه هوشمند متون است. هر چند که ترجمه جملات دامنههای مختلف با کیفیت مناسب بسیار دشوار است و ترجمه کاملا خودکار نمیتواند انجام شود، ولی راهحلهای مختلفی برای پیشبرد این کاربرد ارائه شده است.
در یک تقسیمبندی کلی، معماریهای مختلف مترجم ماشینی به چند بخش قاعدهمند، آماری، ترکیبی و مبتنی بر مثال تقسیمبندی شدهاند. شیوههای سنتی که عمدتا قاعدهمند هستند، اکنون جای خود را به شیوه های آماری و ترکیبی دادهاند.
در این کارگاه ابتدا به تاریخچه سیستمهای مترجم هوشمند و انواع معماریهای آن می پردازیم و سپس با مترجمهای آماری و معماری آن را آشنا میشویم. در انتها یک نمونه مترجم آماری، مترجم های آماری مبتنی بر عبارت، که امروزه به عنوان متداولترین روش در جامعه تحقیقاتی به شمار می آید، بصورت عملی اجرا می گردد.
داده های اموزشی و ارزیابی مورد نیاز توضیح داده میشود و در همان کارگاه یک سیستم مترجم ماشین انگلیسی به فارسی از ابتدا با انتها تهیه میگردد.
آقای دکتر هشام فیلی
عضو هیئت علمی دانشکده مهندسی برق و کامپیوتر، پردیس دانشکده های فنی، دانشگاه تهران، سرپرست آزمایشگاه پردازش هوشمند متن و زبان طبیعی
آقای سعید فرضی
دانشجوی دکتری، دانشکده مهندسی برق و کامپیوتر، پردیس دانشکده های فنی، دانشگاه تهران، عضو آزمایشگاه پردازش هوشمند متن و زبان طبیعی
ساعت برگزاری کارگاه :
ساعت 9:00 الی 10:30 و 11:00 الی 12:30
هدف از این کارگاه معرفی واژهستانشناسیها و واژگانهای معنایی و نقش آنها در پردازش معنایی متون است. از میان این منابع، تأکید عمدة کارگاه بر شبکههای واژگانی و بهخصوص وردنت فارسی یا فارسنت است و شرکتکنندگان در کارگاه با نحوة ساخت، ساختار و ویژگیها و کاربردهای این منبع زبانی آشنا خواهند شد. موضوعات تحت پوشش در این کارگاه سه ساعته شامل معرفی هستانشناسیها به طور عام و واژهستانشناسیها به طور خاص، معرفی شبکههای واژگانی و نحوة ساخت آنها، معرفی وردنت انگلیسی (پرینستون) و وردنت فارسی (فارس نت) و ساختار و ویژگیهای آنها و نحوة بهکارگیری این منابع در پردازش معنایی متون خواهد بود.
دکتر مهرنوش شمسفرد دارای مدرک کارشناسی و کارشناسی ارشد مهندسی کامپیوتر-نرمافزار از دانشگاه صنعتی شریف و دکترای مهندسی کامپیوتر- هوش مصنوعی از دانشگاه امیرکبیر است. وی در حال حاضر عضو هیئت علمی دانشگاه شهید بهشتی تهران و مؤسس و سرپرست آزمایشگاه پردازش زبان طبیعی آن دانشگاه است. زمینههای تحقیقاتی مورد علاقه دکتر شمسفرد شامل پردازش زبانهای طبیعی با تأکید بر زبان فارسی، معناشناسی رایانشی، مهندسی هستانشناسی و وب معنایی است. سرپرستی ساخت نخستین وردنت فارسی و ابزارهای متنوع دیگر برای پردازش زبان فارسی در کارنامة کاری ایشان دیده میشود.
آیا میتوان سیستمی مبتنی بر قوانین ارائه نمود که کلیه جملات یک زبان طبیعی را به درستی تولید کند؟ این سوالی است که از دیرباز فکر زبانشناسان را در حوزه دستور زبان به خود مشغول کرده است. بعد از ظهور رایانه و نیاز به ابزارهای پردازشی خودکار برای زبان طبیعی، ضرورت پاسخ دادن به سوال بالا حتی بیشتر از پیش احساس میشود.
در این کارگاه قرار است درباره دستگاههای صوری (Formal Systems) که تلاش میکنند دستور ساخت جملات یک زبان طبیعی را پیادهسازی کنند صحبت کنیم. معروفترین دستور صوری شاید همان دستور مستقل از متن باشد. اما اغلب زبانشناسان و محققان علوم رایانهای که با آن آشنایی دارند میدانند که این دستور زبان نمیتواند یک سامانه جامع و مانع برای تولید زبان طبیعی باشد. جملات بسیاری در زبانهای طبیعی گوناگون وجود دارد که با دستور زبان مستقل از متن قابل تولید نیست. واقعیت این است که دستور زبان مناسب برای زبانهای طبیعی باید قدرت بسیار بیشتری در ساخت سازهها داشته باشد. وابستگیهای بلندی که در جملات طبیعی وجود دارند از یک طرف و جلوگیری از فراتولید (Over Generation) جملات از طرف دیگر، محدودیتهایی هستند که یک دستور زبان صوری مناسب باید بتواند آنها را به خوبی مدیریت کند.
برای توضیحات بیشتر میتوانید از اینجا فایل مربوطه را دانلود نمایید.
خانم مهندس شهره طباطبایی:
پژوهشگر پژوهشکده پردازش هوشمند علائم
دانشجوی دکتری هوش مصنوعی دانشگاه صنعتی شریف
پژوهشگر سابق مؤسسه تحقیقاتی INRIA نانسی، فرانسه
آقای دکتر محمد ایزدی:
عضو هیئت علمی دانشکده مهندسی کامپیوتر، دانشگاه صنعتی شریف
دانشجوی دکتری هوش مصنوعی، دانشگاه صنعتی شریف
در رویکرد شناختگرا به زبان، معنی شناسی کانون زبان شناسی به شمار می آید. زیرا این رویکرد به زبان به مثابه سامانه ای برای مقوله بندی اطلاعات می نگرد؛ و از آنجا که مقوله بندی فرایندی ماهیاتاً معنایی است، معنی شناسی جایگاهی اصلی در زبان شناسی شناختی یافته است. در این مبحث قصد بر آن است تا روند تکوین معنی را از مقوله بندی تا سطح مفهوم سازی در حوزه های انتزاعی در رویکرد شناختگرا پیگیری کنیم.
و در نهایت مسیر های غالب پژوهش در معنی شناسی را در قرن بیست و یکم مورد بررسی قرار دهیم.
بر اساس آنچه گفته شد سوالهای اصلی که به دنبال یافتن پاسخ برای آنها هستیم به قرار زیراند:
- «معنی» در زبان شناسیِ شناختی چیست؟
- مفهوم سازی در حوزه های عینی چگونه صورت می پذیرد؟
- مفهوم سازی در حوزه های انتزاعی چگونه صورت می پذیرد؟
- ویژگی های پژوهش هایِ معنی شناسی با رویکرد شناختگرا در قرن بیست و یکم چیست؟
سرکار خانم دکتر آزیتا افراشی
دانشیار زبان شناسی
پژوهشگاه علوم انسانی و مطالعات فرهنگی