خبرگزاری حوزه | «پردازش زبان طبیعی» (Natural Language processing) یکی از شاخههای «هوش مصنوعی» است که در سامانه «مدرسه فقاهت» و برای «جستجو در متون حوزوی» به کار گرفته شده است.
اصطلاحهای حوزوی:
در دروس حوزوی، اصطلاحهایی وجود دارد که در قالب دو یا چند کلمه، یک «مفهوم فقهی» را بیان میکند و باید به طریقی از میان ۶۵ هزار جلسه متن نوشته شده در «مدرسه فقاهت» استخراج میشد تا در هنگام نوشتن کلمهای در کادر جستجو، مفاهیم مرکب از دو یا چند کلمه، نمایش داده شود تا محقق بداند که چه مفاهیمی در دروس «مدرسه فقاهت» وجود دارد و مطابق نیاز، «مفهوم مرکب» را انتخاب و جستجو کند.
وقتی محقق کلمهای را در «کادر جستجو» مینویسد، اگر «مفاهیم مرکب» در بانک اطلاعاتی وجود داشته باشد، مفهومهای مرکب و نزدیک به «کلمه نوشته شده» نشان داده میشود و کاربر یک مورد را انتخاب میکند.
برای رسیدن به این هدف، میتوان اصطلاحها را به صورت دستی، استخراج و در بانک اطلاعاتی وارد کرد؛ اما ممکن است اصطلاح وارد شده، در تقریرها وجود نداشته باشد یا به ذهن محقق نرسد و در بانک اطلاعاتی وارد نشود.
فهم اصطلاحهای حوزوی:
با استفاده از هوش مصنوعی میتوان مشکل را حل و با پردازش زبان طبیعی، اصطلاحها را استخراج و در بانک اطلاعاتی وارد کرد.
صدای بهار با به کارگیری «پردازش زبان طبیعی» (NLP) حدود ۶۵، ۰۰۰ جلسه تقریر را (که به زبان فارسی و عربی است) پردازش و اصطلاحات را استخراج نموده و با قرار دادن در بانک اطلاعاتی، امکان «پیشبینی» اصطلاح مرکب از دو یا چند کلمه را فراهم کرده است.
برای این کار لازم است «ویژگی کلماتی» که در درسهای مدرسه فقاهت به کار رفته شناسایی شود. مثلا باید تشخیص داد که هر کلمه موجود در تقریرها؛ اسم، فعل، حرف اضافه، حرف ربط یا چیزی دیگری است. تشخیص این موارد با استفاده از «پردازش زبان طبیعی» (NLP) انجام میشود.
بعد از این مرحله، با استفاده از قوانین زبانشناسی، اصطلاحهای دو یا چند کلمهای استخراج و در بانک اطلاعاتی وارد شد تا در هنگام جستجو، نزدیکترین پیشنهاد نشان داده و جستجو شود.
چند مثال:
مثلا وقتی محقق، کلمه «تقویم» را در کادر جستجو مینویسد، پیشنهاد «تقویم ارش» (به معنای قیمتگذاری مابه التفاوت جنس معیوب و سالم)، «تقویم عیب» (به معنای قیمتگذاری جنس معیوب)، «چگونگی تقویم ارش» و ... نشان داده میشود و محقق بر اساس نیاز یکی را انتخاب و درسهای مرتبط با آن اصطلاح را میبیند.
مثلا اگر جمله «آیا در باب تقویم ارش، خبر حسی همراه با تعدد و عدالت، شرط است؟» را به عنوان مثال در نظر بگیریم با استفاده از NLP میفهمیم که «تقویم» و «ارش» اسم هستند و وقتی دو اسم (با در نظر گرفتن سایر شرایط) پشت سر هم بیایند «مضاف و مضافالیه» و در مجموع یک اصطلاح فقهی هستند و اگر محقق کلمه «تقویم» را در کادر جستجو نوشت، عبارت «تقویم ارش» به عنوان پیشنهاد نشان داده شود.
به همین ترتیب با استفاده از NLP میفهمیم که «خبر حسی» نیز یک اصطلاح فقهی است و اگر کلمه «خبر» در کادر جستجو نوشته شود عبارت «خبر حسی» نیز پیشنهاد داده میشود.
مراحل آتی:
بهینه شدن «نتایج استخراج» نیازمند بهینهسازی «قوانین استخراج» است که در حال انجام است.
همچنین استخراج مفاهیمی که متشکل از ۳ کلمه یا بیشتر است نیز در حال تکمیل است تا پس از شناخت آنها، در «بانک اطلاعاتی» قرار گیرد و به جستجوی محققین، کمک کند.
مرحله بعدی، استفاده از هوش مصنوعی در «جستجوی ویکیفقه» است و امیدواریم تا بهمن ماه اجرایی شود.
استخراج «مفاهیم فقهی» از تقریرهای مدرسه فقاهت، با روش «تحلیل صرفی» (و با اتکاء بر هوش مصنوعی) انجام شده و پروژههایی در دست است که در آن از «تحلیل نحوی» استفاده خواهد شد.
جواد جوادی، مدیر مدرسه فقاهت