نکته: مقالات علمی – پژوهشی در مجله کتابدار ۲.۰ داوری نمی شود و با مسئولیت مترجم منتشر می گردد.
اگر از این ترجمه برای مقالات، پایان نامهها و دیگر مطالب منتشر شده توسط شما، استفاده می شود لطفا نام مترجم را در رفرنس خود ذکر کنید و به رفرنس اصلی(لاتین) ارجاع مستقیم ندهید. (این کار از نظر اخلاق علمی صحیح نیست.)
پژوهشی در باب خدمات شخصیسازی کتابخانه دیجیتال بر اساس دادهکاوی
نویسندگان: نن پنگ[۱]؛ فنگ ین[۲](کنفرانس ملی علومکامپیوتر و فناوری ۲۰۱۲)
مقدمه مترجم
امروزه علیرغم وجود حجم انبوهی از اطلاعات در سازمانها و مؤسسات عالی، همواره شاهد هستیم که کاربران علم اطلاعات با سردرگمی برای کشف منبع مورد نیاز خویش گام بر میدارند و در نهایت با تردید اقدام به تصمیمگیری برای انتخاب دادهها میکنند. برای رفع این مشکل، متخصصان علوم رایانه بر آن شدند تا متدولوژی دادهکاوی را طراحی کنند که بهنوعی میتوان گفت عبارت است از «استخراج اطلاعات مؤثر و کشف و بازسازی مجدد دادههای ارزشمند از مخازن بسیار انبوه جهت تسهیل دسترسی و انتخاب و تصمیمگیری بهتر کاربر». طبق تحقیقات متعدد صورت گرفته، دادهکاوی در کتابخانهها کاربردهای فراوانی دارد از آن جمله میتوان به پشتیبانی از بخشهای امانت، مرجع و مجموعهسازی اشاره کرد که در نهایت به سودمندی و کارایی هرچه بیشتر میانجامد.
چکیده
در سالهای اخیر همگام با گسترش فناوری اطلاعات، مردم با حجم عظیمی از منابع اطلاعاتی مواجه شدند. در این زمان تقاضای مردم برای اطلاعات فزونی گرفت. با وجود منابع ارزشمند در کتابخانههای دیجیتالی، چگونگی ارائه سطح عمیقتری از خدمات شخصیسازی به خوانندگان بهعنوان هدف جدیدی برای توسعه کتابخانههای دیجیتالی در نظر گرفته شد. دادهکاوی از طریق تکنیکهایی برای استخراج اطلاعات مفید از یک مجموعه اطلاعات پراکنده میسر شد. این مقاله تسهیلات حاصله از فناوری دادهکاوی و تأثیرات آن را در کتابخانههای دیجیتالی تجزیه و تحلیل میکند.
کلید واژهها: دادهکاوی؛ خدمات شخصیسازی؛ کتابخانه دیجیتال
I- مفهوم خدمات شخصیسازی در کتابخانه دیجیتال
امروزه رویکرد «بقای دیجیتال» بهتدریج مورد پذیرش عامه قرار گرفت، چرا که کتابخانه دیجیتال توجه خود را بیشتر به کمیت اطلاعات، اشغال فضای کمتر، روزآمدسازی سریع و بدون محدودیت زمانی معطوف داشته است. در حال حاضر، اکثر مردم از خدمات تسهیلاتی کتابخانه دیجیتال لذت میبرند، همچنین از منابع اطلاعاتی پراکنده، حجیم و گوناگون رنج میبرند. با توجه به ماهیت هدفگرایی، اطلاعات مشابه برای کاربران مختلف، ارزشهای متفاوتی دارد. در یک کتابخانه دیجیتالی امکان ندارد که همه منابع اطلاعاتی مورد نیاز کاربران خاص باشد و همچنین ارائه اطلاعات مشابه برای همه کاربران، جلب رضایت همگی آنان را در پی ندارد.
خدمات شخصیسازی راهحلی برای حل مسائل کاربران ارائه میدهد، این مفهوم حائز اهمیت است که کتابخانه را بر پایه نیازهای متنوع کاربران منطبق سازیم، همچنین اهمیت منابع اطلاعاتی متنوع کتابخانه با توجه به نیاز مخاطبان سنجیده شود. خدمات اطلاعاتی شخصیسازی شده در کتابخانههای دیجیتال، بر اساس رفتار اطلاعاتی کاربر، عادات، اولویتها، ویژگیها و نیازهای خاص کاربران شکل میگیرد. ابتدا قبل از هر چیز سیستم باید قادر به رفع نیازهای شخصی کاربران باشد، بر این اساس کاربر به صراحت نیاز اطلاعاتی خویش را از کتابخانه دیجیتال درخواست میکند و یا از طریق تجزیه و تحلیل عادتهای اطلاعاتی کاربر، نیاز اطلاعاتی کاربر تشخیص داده میشود. دوم اینکه در پیشرفت شخصی و هدایت تقاضای کاربر اثرگذار باشد؛ بدین ترتیب با دنبال کردن این روند در جهت ارتقای تنوع اجتماعی و غنای پیشرفتهای نوظهور بکوشد.
II- مروری بر دادهکاوی
A. مفهوم دادهکاوی
در حال حاضر، اطلاعات بسیار زیادی بهصورت فراگیر مردم را احاطه کرده و دسترسی به دانش مفید از انبوه اطلاعات در حال رشد، فرایند خیلی سختی است، این روند اطلاعاتی از نظر جان نسبرت[۳]، معضل «غنای اطلاعاتی و فقر اطلاعاتی»[۴] نامیده شد. با این اوصاف، برای حل این مشکل، فناوری جدیدی به نام دادهکاوی در اوایل سال ۱۹۹۰ قرن بیستم پدیدار شد.
واژه دادهکاوی از انبوه دادهها برگرفته شده است، بدین معنا که دادهکاوی میتواند از طریق فناوری دادهکاوی در بانکهای اطلاعاتی کشف شود. دادهکاوی هم دانش آموختن و هم پردازش دادهها است. فرایند دادهکاوی به سه مرحله تقسیم میشود: آمادهسازی دادهها، عملیات استخراج و تفسیر نتایج.
طی مرحله استخراج، در سراسر فرایند پالایش صورت میگیرد. دادهکاوی با آمار ریاضی، پایگاههای اطلاعاتی، هوش مصنوعی، یادگیریهای ماشینی، بصریسازی، محاسبات موازی، شبکه مصنوعی مرتبط است و اخیراً در موارد بینرشتهای در پایگاههای دادهای بینالمللی و حمایت از تصمیمگیری در حوزههای پژوهشی نیز نقش مؤثری را ایفا میکند. بدین ترتیب بسیاری از محققان داخلی و خارجی بر روی تحقیقات دادهکاوی تمرکز دارند و با استفاده از فناوریها و توسعه نرمافزارها پیشرفت قابل توجهی در این زمینه داشتهاند.
B. بررسی وضعیت میزان کاربرد دادهکاوی در کتابخانه
از سال ۱۹۹۰ مقالات بسیار زیادی راجع به نظریه دادهکاوی در امریکا و اروپا ارائه شد. دادهکاوی در کتابخانههای تخصصی و پژوهشی خیلی کاربرد دارد. دکتر اسکات نیلسون[۵] در مقالهاش تحت عنوان «به دست آوردن مزیت استراتژی از طریق کتابشناسی کاوی برای مدیریت تصمیمگیریها در شرکتها، کتابخانههای تخصصی، دیجیتال و سنتی» از کتابخانه دانشگاهی سیراکاس[۶]، به عنوان نمونهای یاد کرده که از پیشینه کاوی برای کمک به مدیریت کتابخانه سنتی کمک گرفته است.
چون در ایالات متحده و اروپا، دادهکاوی کاربرد گستردهای دارد، بنابراین مطالعات خارجی نسبت به مطالعات داخلی پختهتر و عملیتر به نظر میرسد. بسیاری از کتابخانههای خارجی، بهطور موفقیتآمیزی از فناوری دادهکاوی در عرصه کار و مدیریت استفاده میکنند. این کتابخانهها فقط مجموعهای از مؤسسات سنتی نیستند، بلکه نهادهای اطلاعاتی نیز هستند؛ کارکنان کتابخانه نیز دیگر بهعنوان کتابدار سنتی به چشم نمیآیند بلکه به مقام کارشناس اطلاعاتی ترفیع رتبه یافتهاند.
در داخل کشور، تحقیقات در حیطه دانشگاه و دانشگاهها، اساساً برای کادر پژوهشی-علمی صورت گرفته است. در کتابخانه، کاربرد دادهکاوی هنوز رونق نگرفته است، اما کتابخانه بسیار شبیه شیوه خدماتدهی اولیه انتقال اطلاعات است و بهعنوان الگوی بازاریابی بازار در درجه بالاتری قرار دارد. رفتار کاربر کتابخانه از طریق مجموعهای از اطلاعات مانند علائق، عادات اطلاعیابی وی مورد تجزیه و تحلیل قرار میگیرد، با این کار میتوان رفتار احتمالی شخص را هنگام امانت گرفتن منابع اطلاعاتی پیشبینی کنیم؛ در نتیجه یک کتابخانه تا حد زیادی میتواند کیفیت خدمات اطلاعاتی را افزایش دهد.
بهطور کلی در مورد فناوری دادهکاوی در کتابخانه پژوهشی فقط صحبتهایی صورت گرفته است و اساساً از جنبههای تئوری مانند مجموعهسازی به بلوغ کافی نرسیده است. بهعنوان مثال در داخل، کتابی در مورد برنامههای کاربرد دادهکاوی در کتابخانه وجود ندارد، فقط تعداد معدودی نسخه کپی شده در مورد مباحث دادهکاوی در کتابخانه دیجیتال وجود دارد. این امر نشان میدهد که همزمان با پیدایش کتابخانه دیجیتال، فرایند دادهکاوی نیز برای کتابخانه به ارمغان آورده شد؛ بنابراین پژوهشهای داخلی در این زمینه هنوز اندک است.
III- تحلیل امکان سنجی دادهکاوی در کتابخانه دیجیتال
با پیشرفت سریع و گسترده شبکهها و فناوری پایگاههای اطلاعاتی، کتابخانهها نیز در حال تغییر جهت به سمت دیجیتالی کردن اطلاعات هستند.
در سالهای اخیر، سرمایهگذاری در کتابخانهها افزایش یافته است، پایگاههای اطلاعاتی کتابخانه و وسایل ذخیرهسازی از گستردگی زیادی برخوردار شدهاند، شبکهها و سرورها همچنین ارتقاء و محبوبیت بیشتری یافتهاند. با توجه به این نوع محیطهای شبکهای خودکار، استفاده از فناوری دادهکاوی میتواند برای استفاده از منابع کتابخانه دیجیتال مفید مؤثر واقع شود.
استفاده از فناوری دادهکاوی در کتابخانه دیجیتال بهمنظور سازماندهی مجدد، مجموعهسازی، استخراج و پیشبینی به کار گرفته میشود و همچنین میتوان سریعتر و راحتتر دادهها را از طریق اینترنت انتقال داد، بنابراین فناوری دادهکاوی سبب تسهیل تصمیمگیری و ارائه خدمات بهتر به خوانندگان میشود.
A. پویایی فرایند تقاضای اطلاعات
در جامعهی اطلاعاتی، کتابخانه دیجیتال بهتر میتواند مفهوم بقای عمر، توسعه و کاربرد فناوریهای پیشرفته را در خود هضم نماید. با گذری به آخرین دوره از نظریه عملکرد کتابخانه، کتابخانه دیجیتال با استفاده از ابزار یدکی خویش یعنی فناوری کامپیوتر در پی رسیدن به اطلاعات است. فناوری اطلاعات همانطور که به شدت در پی ترویج و نوسازی کتابخانهها است، همچنین انفجار اطلاعات را نیز به دنبال دارد.
در عصر دانش و اقتصاد، مشکل ذخیرهسازی اطاعات انبوه، توسعه یافته و بهرهبرداری از آن حل شده است. بقا و توسعه مسائل عمده دیجیتال، تشخیص انبوه اطلاعات ذخیره شده و بهرهبرداری از آن با استفاده از فناوری پایگاه دادهای میسر شده است. با توسعه کتابخانه دیجیتال سطوح متفاوتی از خدمات تصمیمگیری شناسایی شد، دستاورد همکاری در زمینه صنعت اطلاعات کارآمد با توجه به تقاضاهای عمومی اطلاعات و در پی مکانیزم فشار بیرونی و داخلی توسعه کتابخانه دیجیتال اطلاعات شکل گرفت.
B. شکلگیری پایگاه مواد
از یک سو، سیستم کتابخانه کشور ما، طی سالهای متوالی از ساخت و ساز خودکار عبور کرد و هماکنون از شرایط فیزیکی بسیار مطلوبی برخوردار است و مردم قادر به جمعآوری انبوه اطلاعات هستند و از سویی دیگر، کتابخانه دیجیتال چین ساختار اطلاعاتی توسعه یافتهای دارد و محیط سیاسی و ضمانتهای اقتصادی خوبی برای پیادهسازی پایگاههای اطلاعاتی تخصصی و توسعه برنامههای دادهکاوی را فراهم کرده است.
C. تشخیص بلوغ فناوری
بانکهای اطلاعاتی پس از سالها توسعه، هماکنون سیستم فناوری نسبتاً جامعی را ساخته است. بهخصوص در طراحی بانکهای اطلاعاتی، استخراج داده و فناوری پردازش تحلیلی برخط، برنامههای رضایت بخشی داشته است. بهعلاوه فناوری پایگاههای اطلاعاتی، در بخشهایی از قبیل ارتباط از راه دور، خردهفروشی، مسائل مالی، زیرساختها و زمینههای دیگر تأثیر شگرفی داشته است و همه این موارد تنها نمونههایی از تجربیات موفق ما در این زمینه بوده است.
IV– کاربرد دادهکاوی در کتابخانه دیجیتال
A. خدمات شخصیسازی
ارائه خدمات شخصیسازی مولفه کلیدی در کتابخانه دیجیتال محسوب میشود. از خدمات منفعل گرفته تا ارائه اطلاعات ساده تولید اطلاعات را شامل میشود. خدمات شخصیسازی در کتابخانه دیجیتال بهطور عمده در دو سطح ارائه میشود: اول اینکه کتابخانه دیجیتال باید بر اساس نیازمندیهای کاربران برای سفارشی شدن اطلاعات گام بردارد، دوم اینکه کتابخانه دیجیتال باید مدل مورد علاقه کاربران را اجرا نماید و خدمات پویایی را ارائه کند و به یک تولیدکننده هوشمند اطلاعاتی فعال تبدیل شود.
B. بهبود سرعت دستیابی به اطلاعات
کمیت در یک کتابخانه دیجیتالی زیاد است، اطلاعات همانند یک شمع برفراز یک کوه، محتوی دانش مفیدی هستند که باید استخراج شوند. کاربران نگران برآورده ساختن نیازهای اطلاعاتی خویش هستند، بهطورکلی کتابخانه میبایست قادر به اکتشاف در دادههای اطلاعاتی باشند. برای تسریع در جهت ارائه خدمات کارآمدتر به کاربران باید مکانیزم جستجو خیلی خوب اجرا شود، فناوری دادهکاوی برای کتابخانه دیجیتال ابزارهای پیشرفتهای برای بازیابی اطلاعات به شیوه تئوری فراهم میکند و طرح سیستم هوشمندتر خواهد شد.
C. توسعه شکل خدمات
دادهکاوی میتواند باعث ترفیع کیفیت خدمات اطلاعاتی و پیشرفت در کسبوکار شود. استفاده از فناوری اطلاعات مدرن در کتابخانه دیجیتال، نهتنها سبب تغییر در رسانههای خدماتی و زمان و فضا شده، بلکه استفاده از فناوری دادهکاوی، ساختار و سطح خدمات و امکانات را نیز بهبود بخشیده است. خدمات بازیابی اطلاعات و تجزیهوتحلیل اطلاعات پیشرفت چشمگیری داشته است.
V- ساختوساز سیستم خدمات شخصیسازی در کتابخانه دیجیتال
A. بازسازی سیستم فرضی
کتابخانه دیجیتال همانند یک مجموعه از منابع اطلاعاتی و مرکز خدمات پژوهشی، منابع اطلاعاتی ارزشمندی را در خود انباشته است. با استفاده از دادهکاوی میتوان اطلاعات پنهان موجود در بانکهای عظیم اطلاعاتی را شناسایی و استخراج نمود. انبار دادهها و فضاهای اطلاعاتی شبکههای گسترده، بدین منظور به کاربران اطلاعاتی کمک میکند تا در جستجوی اطاعات پیوسته و بالقوه باشند و فاکتورهای نادیده گرفته را پیدا نمایند. ساختار سیستم فرضی باید شمار زیادی از انبوه دادههای واقعی در خود داشته باشد تا ما قادر به بازسازی بانکهای اطلاعاتی عمده باشیم.
- استخراج اطلاعات اصلی و جمعآوری اطلاعات هویتی کاربر
کاربرانی که به کتابخانه دیجیتال دسترسی پیدا میکنند، ویژگیها و خصیصههای رفتار اطلاعیابی آنان در سیستم ثبت میشود؛ اطلاعات کاربر شامل نام کاربر، جنس، سن، شغل، علائق، سطح تحصیلات و دسترسی به IP کاربر است، مثلاً با دسترسی به وبلاگ شخص میتوان به برخی از ویژگیهای رفتاری کاربر دست یافت مانند میزان بازدید در بخشهای مختلف وبلاگ، زمان جستجو در وبلاگ، بازدیدکننده، زمانهای دانلود، جستجوی کلمات کلیدی و مدل اطلاعات و اطلاعات ذهنی کاربر مانند بررسی شبکه، پیامهای BBS…اخذ ویژگیهای رفتاری کاربر در راستای فراهم آوردن نیازهای اطلاعاتی دقیق آنان شرط اولیه محسوب میشود. - پیشپردازش و تبدیل و تغییر دادهها
دادههای جمعآوری شده، پردازش و بافت آنها بازسازی میشوند؛ مانند بررسی جامعیت و پایایی دادهها، حذف دادههای نوفه (نویز) یا حذف دادههای نامعتبر، پر کردن دامنههای خالی، توالی زمانی و تغییر دادهها، تشخیص ویژگی دادهها به همراه تغییر ابعاد و شیوه تبدیل برای کاهش مؤثر اطلاعات متغیرها، نامتغیرها، بازسازی عناوین مرتبط با انبار دادهها و گام بعدی، فراهم کردن بسترهای نرمافزاری با استفاده از دادهکاوی - تعیین کردن اهداف دادهکاوی
اهداف دادهکاوی باید با شرایط واقعی ترکیب شود تا بهطور شفاف و روشن صورت گیرد. برای مثال، بر اساس تغییرات دائمی علائق کاربران، استفاده از فناوری دادهکاوی نیازهای اخیر کاربران را بر اساس میزان درجه علاقهمندی آنان شناسایی میکند، پروژههای مرتبط با آنان را توصیه میکند و رابطه بین ضابطههای شخصیسازی را فراهم میآورد. - دادهکاوی
بر اساس ویژگیهای مقصد و دادهها، الگوریتمهای تصفیهسازی و تبدیل مجموعه دادهها در دادهکاوی انتخاب میشود. در این مرحله یک الگوریتم دادهکاوی خاص برای جستجوی دادهها و یا توسعه یک مدل مورد علاقه و خاصی در اینجا انتخاب میشود؛ ما باید بر اساس تجزیه و تحلیل در رابطه با مدل دانش دادهکاوی گام برداریم. - تجزیه و تحلیل و کاربرد دانش
نتایج دادهکاوی بهطور پیشرفته مورد تفسیر و ارزیابی قرار میگیرند و دانش مورد اعتماد و تناقضهای احتمالی بررسی میشوند، انبار دادهها بهبود مییابد و به دانش قابل فهم برای کاربران تبدیل میشود و دانش بارگیری شده در سیستمهای عملیاتی واقعی تجزیه و تحلیل میشود. فرایند دادهکاوی یک فرایند تکراری است. دادهکاوی نیاز کاربران را دریافت میکند و طی مراحلی آن را آزمایش، پالایش (اصلاح) و مقایسه میکند تا به رضایت نهایی کاربر دست یابد.
B. ساختار سیستم
در این سیستم، ما از انبار داده، دادهکاوی و فناوری پردازش تحلیلی برخط (آنلاین) استفاده میکنیم تا منابع و دادههای مورد دلخواه خوانندگان را پیدا کنیم و خدمات شخصیسازی را برای خوانندگان گسترش دهیم. ساختار سیستم خدمات شخصیسازی در کتابخانه دیجیتال به شکل ذیل طراحی شده است.
در این طرح خدمات شخصیسازی در انبار دادهها قابل استفاده میشود،OLAP و فناوری دادهکاوی بر اساس تاریخچه اطلاعات و تجزیه و تحلیل دادههای اخیر صورت میگیرد و خدمات شخصیسازی را برای خوانندگان فراهم میآورد و بهطورکلی شامل جنبههای ذیل است:
- ادغام منابع و اسناد ناهمگن
با گذشت زمان، حجم منابع اطلاعاتی کتابخانه دیجیتال بهطور مداوم افزایش مییابد و برای خواننده این امکان وجود ندارد که به همه این اطلاعات دست یابد، چون همه منابع اطلاعاتی در یک طرح نرمافزاری و سختافزاری از محیط ناهمگون قرار گرفتهاند، بنابراین خوانندگان بستر نرمافزاری یکپارچهای را برای بازیابی اطلاعات نیاز دارند. - ایجاد انبار داده
در پردازش تحلیلی برخط (OLAP) و دادهکاوی (DM) قبل از هر چیز دادههای مختلف در انبار داده بر اساس تجزیه و تحلیل سازماندهی میشوند مانند اطلاعات خواننده، منابع اطلاعاتی تا بتوان به اطلاعات دست یافت. - ایجاد مدل مکعب داده
داده در انبار داده بر اساس ساختار ستاره به شکل مکعب سازماندهی میشود OLAP و DM - OLAP و DM عمدتاً بر اساس سازماندهی چند بعدی، بخش دادهها را به قسمتهای دیگر برش میدهند و تجزیه و تحلیل دادهها به شکل گروههای چندگانه در میآیند؛ بنابراین ما میتوانیم از یک گونه چند بعدی و قسمت چند مضربی، گونهای از اطلاعات ادغام شده را بهعنوان منابع اطلاعاتی خوانندگان گرد هم آوریم. بر اساس مکعب دادههای چند بعدی، نحوه دسترسی و منابع مرتبط در کتابخانه بر اساس علاقهمندیهای خوانندگان فراهم میشود.
- خدمات شخصیسازی وب
ماژول بهطور مستقیم با خوانندگان ارتباط دارد و به منابع اطلاعاتی ناهمگن اشاره دارد که در یک مرحله از طریق خدمات شبکه، شخصیسازی میشود. بر اساس علاقهمندی خوانندگان و رابطههای متفاوت بین پیشینهها و پیوستگی بین این قاعدههای منظم مدلی برای ارائه خدمات منابع اطلاعاتی برای خوانندگان بهطور منظم در قالب یک الگو شکل میگیرد. انبار دادهها برای یکپارچگی دادهها از طریق OLAP و DM برای خوانندگان طبقهبندی میشود و منابع اطلاعاتی مرتبط شناسایی میشود؛ این مدل از طریق توجه به اولویت علاقهمندیها و تقاضاهای اطلاعاتی دائمی و انبوه خوانندگان ساخته میشود و خدمات شخصیسازی مطابق با این مدل ارائه میشود.
پانویس:
[۱] . Nan Pang, Library of HeBei United University Tang Shan, China, 13483512520, my063000@163.com
[۲] . Feng Yan, Research Department of XingTai University, Xing Tai, China,15612925882, kycyf@126.com
[۳] . John Nethbert
[۴] . “information-rich and knowledge-poor” dilemma
[۵] . Scott Nieholson
[۶] .Syracuse University Library
منبع:
این نوشته ترجمه مطلبی با این عنوان است: The Research on Personalized Service of Digital Library Based on Data Mining
مترجم: سمیه پناهی
مشخصات استناددهی به این مقاله | |
نویسنده(ها): | سمیه پناهی |
عنوان مقاله: | پژوهشی در باب خدمات شخصیسازی کتابخانه دیجیتال بر اساس دادهکاوی |
عنوان مجله: | کتابدار ۲.۰ – (عنوان لاتین: Kitābdār-i 2.0) |
دوره مجله(Vol): | ۳ |
شماره مجله(Issue): | ۱ |
سال(Year): | ۱۳۹۶ |
شناسه دیجیتال(DOI): | |
لینک کوتاه: | http://lib2mag.ir/8139 |