معرفی خلاصه سازهای آنلاین متن فارسی – کتابدار 2.0
خانه / آرشیو / دوره اول (1394) / شماره اول (مهر 1394) / معرفی خلاصه سازهای آنلاین متن فارسی
summarize

معرفی خلاصه سازهای آنلاین متن فارسی

با توجه به حجم انبوه اطلاعات، دسترسی به داده ها و اطلاعات مطلوب، گاهاً بسیار پیچیده و دشوار می شود. در این میان، خلاصه سازهای متن، سامانه های هستند که می توانید از آن برای سهولت دسترسی به اطلاعات موردنظر استفاده کنید. از هر خبر منتشر شده، بخشهای مهم آن خبر را پیدا کنید و دسته بندی کنید و یا نتایج موجود در تحقیق و یا مقاله ای را جمع بندی کنید. در نهایت شما قادر خواهید بود متنی را به عنوان ورودی به خلاصه سازها، ارائه دهید و آن را خلاصه کنید.

خلاصه سازی خودکار متن، یعنی روشی که یک متن طولانی توسط یک برنامه رایانه ای با حذف عبارات، کلمات و جملات اضافه کوتاه شود.به عبارت دیگر، “خلاصه سازی” متن به فرایندی اطلاق می شود که طی آن یک متن بزرگ (ضمن رعایت شرایط خاصی) به متن کوچکتر تبدیل می شود. تاکنون رویکردهای مختلفی برای خلاصه سازی خودکار متون ارائه شده است. 

اهمیت این گونه برنامه‌ها در حال حاضر با افزایش کاربرد برنامه‌های گوشی‌های تلفن هوشمند و پیامک افزایش یافته است. به طور مثال نوجوان ۱۷ ساله ای که اپلیکیشن اش را یاهو با ۳۰ میلیون دلار خرید، برنامه ای نوشته بود که متن خبرها را خلاصه می‌کرد. اگر چه نیاز به این گونه سیستم‌ها در کشورهای خارجی بسیار رایج است (لیست ۳۰ تایی از سیستم‌های خارجی را می‌توانید ببینید)، اما در ایران کمتر به آن پرداخته شده است. در این نوشته می خواهیم کمی‌در مورد نمونه‌هایی که در زبان فارسی خوب کار می‌کنند، بررسی‌هایی داشته باشیم.

ijaz

متن یا فایل خود را در سایت وارد کنید و تعداد کلمات را انتخاب کنید. سایت به شما یک متن خلاصه می دهد. البته گاهی جملات ناقص است.

 

noor

بر اساس جمله است و کلمه‌ها یا حروف را نمی‌شمارد. ابتدا باید متن را وارد کنید و سایت تصمیم می‌گیرد که کدام جمله‌ها را حذف کند. البته حدس بنده این است که جملاتی که کلمات مهم تر دارند را نگه می‌دارد.

 

matnak

از جمله ویژگی های متنک می توان به تشخیص وشناسایی متون،پردازش متن،حذف متن تکراری، و API برای استفاده در سایر سیستم ها اشاره کرد.

 

SweSum

که گویا ابتدا برای زبان سوئدی نوشته شده، ولی برای زبان‌های دیگر از جمله فارسی گسترش یافته است. مزیت این سیستم این است که می‌توانید نوع متن را انتخاب کنید که سبک روزنامه ای است، یا آکادمیک.

امیدوارم این ابزارها برایتان مفید واقع شوند…

منابع:

  1. ویکی پدیای فارسی
  2. http://ijaz.um.ac.ir
  3. http://textmining.noorsoft.org/FA/Summarization
  4. http://www.cvas.ir/summurizer
  5. http://www.matnak.com

  نویسنده: امیر رمضانی

Share

درباره ی امیر رمضانی

دانشجوی کارشناسی ارشد کتابداری و اطلاع رسانی پزشکی، دانشگاه علوم پزشکی ایران

پاسخ دهید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *