خانه / آرشیو / دوره دوم (1395) / کلان‎داده و کتابخانه‎های عمومی

کلان‎داده و کتابخانه‎های عمومی

      داده‎های بزرگ[۱] یا کلان‎داده ترجمۀ اصطلاح Big Data هستند و معمولاً به مجموعه‎ای از داده‎ها گفته می‎شوند که اندازۀ آنها فراتر از حدی است که با نرم افزارهای معمول بتوان آنها را در یک زمان مناسب دریافت، مدیریت و پردازش کرد. مفهوم «اندازه» در داده‎های بزرگ به طور مستمر در حال تغییر است و به مرور بزرگتر می‎شود. داده‎های حجیم (Big Data) مجموعه‎ای از روش‎ها و ابزارهایی هستند که برای آشکار کردن اطلاعات بزرگی که در مجموعه‎های بزرگ، وسیع، پیچیده و متنوع داده پنهان شده اند، نیازمند شکل جدیدی از یکپارچگی هستند. در ادامه دو نمونه از کاربردهای کلان‎داده در کتابخانه‎های عمومی را که به صورت دو مقاله (خارجی) چاپ شده اند، توضیح خواهیم داد.

Java Printing

۱- چهرۀ شما به عنوان کلان داده!

      در آیندۀ نزدیک مردی که کتابی با تأخیر در مراجعه دارد قدم‎زنان وارد یک کتابخانه می شود. کتابدار پشت میز یک پیغام روی موبایل یا تبلت و یا صفحۀ نمایش کامپیوتر دریافت می‎کند. بعد از چند لحظه مرد به پیشخوان نزدیک می‎شود و قبل از اینکه حرفی بزند، کتابدار می‎پرسد: ببخشید آقای اسمیت؟ سیستم ما نشان می‎دهد که شما یک کتاب تأخیری دارید. آیا اتفاقی افتاده که کتاب را دیر آورده‎اید؟ آیا این امر از طریق اسکن پیچیدۀ بدن انسان ممکن است و یا از طریق اسکن و خواندن کارت کتابخانۀ جیب ممکن می شود؟ خیر. یک برنامۀ کامپیوتری ساده، صورت هر فردی را که از در ورودی وارد می شود شناسایی کرده و آن را با پایگاه دادۀ کتابخانه مطابقت می‎دهد. چقدر این آینده دور است؟ بسیار نزدیک است، درست همین الان.

      کلان داده، حجم عظیمی از اطلاعات به منظور تحلیل و آنالیز بسیار وسیع توسط کامپیوترهای استاندارد است که این نیاز روز به روز برای صنعت حیاتی‎تر می‎شود.

efr-electronic-Facial-Recognition

      بیشتر این داده‎ها توسط کاربران شبکه های اجتماعی، اینترنت، موبایل ها و هر اپلیکشنی که مبتنی بر مکان باشد، ایجاد می شود.حتی کاخ سفید با ایجاد اداره ای به نام “علم اطلاعات” درگیر این قضیه شده است.

      چهره‎های ما بخشی از کلان داده‎ها هستند. طبق مقاله ای در آتلانتیک با عنوان “چه کسی مالک چهرۀ شما است؟” FBI یک دیتابیس تشخیص چهره[۲] با ۵۲ میلیون چهره (بیش از یک سوم آمریکایی‎ها) را در اختیار دارد.

facialrecognition

      با توجه به برخی گزارش‎های ارائه شدۀ مربوط به اعضای کتابخانه به پلیس، در رابطه با جریمه، سناریوی بالا بیشتر به کتابخانه‎ها نزدیک می‎شود. از طرف دیگر اگر نرم‎افزار تشخیص چهره در کتابخانه وجود داشته باشد، کتابدار می‎تواند فرد خطرناکی را که وارد کتابخانه می‎شود، شناسایی کند و این امر باعث ایجاد محیطی امن‎تر خواهد شد. اما مسئله رضایت حقوقی و نگرانی‎های اخلاقی وجود دارد.

رضایت حقوقی[۳]

      آیا شما اجازۀ تشخیص چهرۀ یک فرد خاص را دارید؟ بر طبق اغلب قوانین مرتبط با امنیت، این کار مستلزم رضایت حقوقی است. اما در کجا؟ آیا سیستم باید در جای خاصی از کتابخانه نصب شود؟ آیا صرفاً نوشتن جمله‎ای در رابطه با تشخیص چهره، کافی خواهد بود؟

نگرانی‎های اخلاقی

      به طور کلی تشخیص چهره بخشی از اخلاق ‎داده در مبحث کلان‎داده است و دستورالعمل‎های ساده‎ای  برای آن درنظر گرفته شده‎است:

  • جمع آوری حداقل داده‎ها: صرفاً جمع‎آوری داده‎های کاملاً ضروری.
  • تراکم داده‎ها: جمع‎آوری داده‎هایی از اشخاص به صورت نوار (حتی اگر تا کنون استفاده نشده ‎است).
  • شناسایی و جداکردن داده‎های حساس: بدانید چگونه به مقابلۀ داده‎های شخصی حساس بروید.
  • اجازه به کابران برای انتخاب: اجازه دهید کاربران داده‎هایی را که تمایل به جمع‎آوری آن توسط شما ندارند، انتخاب کنند.

دقت[۴]:

      تا چه اندازه برنامۀ تشخیص چهره، دقت و کارایی دارد؟ این امر بسیار نگران کننده و شگفت آور است.  برنامۀ سادۀ تشخیص چهره به ‎نام “FindFace” و شبکۀ اجتماعی روسی به‎ نام “VK” بین ۶۰ تا ۷۰ درصد از افراد با ردۀ سنی ۱۸ تا ۳۵ سال را به درستی تشخیص داده است. برای افراد مسن‎تر این درصد و کارایی کمتر بوده است. شاید یکی از دلایلش حضور کمرنگ این گروه سنی در شبکه های اجتماعی بوده است.

      طبق پژوهشی که پروفسور آلسندارو آکویستی انجام داد، حدود یک سوم از افرادی که در محوطۀ دانشگاه راه می‎رفتند صرفاً از طریق عکس پروفایل فیسبوکشان شناسایی شده اند. به عبارت دیگر ۳۳ درصد از مردمی که در هر خیابان راه می‎روند، از طریق یک وبکم، فیسبوک و سیستم جستجوی معکوس گوگل قابل شناسایی و تشخیص هستند.

      همان طور که کلان‎داده بزرگتر می شود پایگاه دادۀ تشخیص چهره هم کامل‎تر می‎شود و جستجو و تحلیل آنها نیز بهتر انجام خواهد‎گرفت. استفاده از این تکنولوژی گسترش خواهد ‎یافت و این کتابخانه‎ها هستند که باید انتخاب کنند که چگونه و کجا از این تکنولوژی استفاده خواهند کرد.

۲-استفاده از کلان داده برای نیاز‎های محلی کتابخانه

      کارمندان کتابخانه دائماً به ‎دنبال راه‎حل هایی هستند که بتوانند بهتر به جوامع محلی خدمت کنند و خدمات ارائه دهند. از تحقیقات پس-رویداد تا کتابداری تعبیه شده برای جمع آوری اطلاعات چرخشی، کتابخانه ها استراتژی‎های متفاوتی برای دستیابی به اطلاعات و سنجش میزان موفقیت خدمات خودشان دارند. بخش‎بندی بازار و داده‎های بزرگ، دو اصطلاح محبوب برای شرکت‎های بزرگ دنیا هستند که می توانند به کتابخانه‎ها در اتخاذ تصمیمات آگاهانه دربارۀ جمع آوری اطلاعات و خدمات، کمک کنند.

      “CIVICTechnologies” شرکتی است که راه‎حل‎های نرم‎افزاری تحت‎ وب مبتنی ‎بر مکان را برای کتابخانه‎ها فراهم می‎کند. این شرکت اولین مطالعۀ دادۀ ‎بزرگ بر روی سرویس‎های کتابخانه را در مارس ۲۰۱۶ چاپ کرده است. عنوان مطالعه “اطلاعات مبتنی بر مخاطب: دستیابی، جهندگی[۵] و ارتباط کتابخانه‎های عمومی” است و به بررسی عادت‎های مخاطبان اصلی در ۱۰ سیستم کتابخانه در ایالات متحده می پردازد. هدف اصلی از این مطالعه، کمک به کتابخانه ها برای حفظ مخاطبان اصلی و جذب مخاطبان جدید است.

جمعآوری اطلاعات مخاطبان اصلی

      در این گزارش از “مخاطبان اصلی” به عنوان ۲۰ درصد دارندگان کارت فعال سیستم کتابخانه که آیتم‎های فیزیکی را استفاده کرده‎اند، یاد می‎شود. ده سیستم کتابخانه در این گزارش انتخاب شده‎اند زیرا در حال حاضر آنها از تکنولوژی با نام  “CIVICT” استفاده می‎کنند. این تکنولوژی اپلیکشنی با نام “CommunityConnect” است که داده‎های جمعیتی کتابخانه‎ها را تجمیع می‎کند. در مجموع ۱۰ کتابخانه به ۷.۸ میلیون نفر خدمات می دهد. گزارش نشان می دهد که ۴ میلیون نفری که دارای کارت عضویت فعال بوده اند، در سال ۲۰۱۴ از ۶.۷ میلیون کتاب و یا رسانۀ فیزیکی استفاده کرده اند (البته حفظ حریم خصوصی افراد رعایت شده است).

      هر مخاطب کتابخانه و داده های وارسی شده با بلاک داده‎های سرشماری متناظر می شوند و یک شرکت خارج از مجموعه، آنالیز داده‎ها را انجام می‎دهد. گزارش مورد‎ نظر انواع مخاطبان را نیز تعریف می‎کند، تاکتیک کلیدی در بخش‎بندی بازار، مانند “زمین سبز” (خانواده های روستایی مرفه متأهل) و “ساکنان جدید” (طبقه متوسط شهری) برخی از تعاریفی هستند که سیستم از انواع مخاطبان ارائه می‎دهد.

مواردی که در گزارش یافت شده است:

      همانطور که انتظار می‎رفت ویژگی‎های مخاطبان اصلی و رفتارهای آنها از یک کتابخانه به کتابخانۀ دیگر پیچیده و منحصر‎به‎فرد هستند. در گزارش تنوع و گوناگونی در ۲۰ درصد اعضای فعال مشهود است. برای مثال برخی مخاطبان مناطق شهری مانند لاس وگاس رفتارهای جدا از هم و متفاوت داشته اند. باتوجه به این تنوع در تمام سیستم، گزارش این نتیجه را نشان می‎دهد که “کسب‎و‎کار کتابخانه‎های عمومی فرا محلی است”؛ به عبارت دیگر یک سایز و اندازۀ مناسب برای تمامی مدل‎های ویژگی‎های مخاطبان وجود ندارد. این گزارش پیشنهاد می‎کند که کتابخانه‎ها از اطلاعات مخاطبان اصلی بدین ترتیب استفاده کند؛

دستیابی

      این گزارش نشان داد که کتابخانه‎ها مخاطبان اصلی دارند که بخشی از بازار بزرگ جوامع هستند. داده‎ها می‎توانند به کتابخانه ها کمک کنند تا  معیارهای مؤثری را برای دستیابی به اهداف خود داشته باشند. منظور ازاهداف، جذب مخاطبان است.

ارتباط

      بر اساس یافته ها، کتابخانه‎ها با بخش‎های مختلفی از مخاطبان در ارتباط هستند. کتابخانه‎ها می توانند قدرت ارتباط خود را با جوامع، محک و  اندازه‎گیری کنند.

جهندگی

      داده ها ابزارهایی برای انعطاف‎پذیری و سازگاری در محیط های پیچیده و محیط های تجاری را به کتابخانه‎ها ارائه می‎دهند.

      گام‎های بعدی این گزارش ممکن است به ایجاد یک ابزار یا راهنما برای کاوش مجموعۀ داده کلان و گزارش برای کتابخانه های عمومی کمک کند. این گزارش چهارچوب‎های بسیار خوبی را برای شروع به کار فراهم کرده است اما کارمندان کتابخانه ای که در این مطالعه شرکت داده نشده‎اند ممکن است تعجب کنند که چگونه می‎توانند از این تاکتیک‎ها استفاده کنند. با برخی راهنمایی‎ها، سیستم‎های کتابخانه می‎توانند در تصمیم گیری در مورد داده‎ها مشارکت کرده و صاحب اختیار و قدرت باشند.

نفوذ عمیق تر به دادههای کتابخانه

      در حالی که این گزارش تنها ده سیستم کتابخانه را تحت پوشش قرار می‎دهد، این بحث همچنان وجود دارد که کتابخانه‎ها چگونه می‎توانند استراتژی‎های فروش و بازاریابی را وام گرفته و در جوامع خودشان اعمال کنند. کتابخانۀ عمومی آنلاین “Kristen Whitehair” در مطلبی می‎نویسد: “ظرفیت بزرگی برای ارتباط بین حوزۀ علم اطلاعات و کتابخانه وجود دارد”.

      ادامه این پژوهش و گسترش آن در آیتم‎های دیجیتالی مانند کتاب‌های الکترونیکی یا کتاب صوتی بسیار جالب خواهد بود و می توان در آنها از دیتابیس آنلاین کتابخانه یا حتی برنامه نویسی استفاده کرد.

 

پانویس:

[۱] Big Data

[۲] facial recognition

[۳] Legal consent

[۴] Accuracy

[۵] Resilience

 

 

منبع:

     Troy Lambert, “Facing Privacy Issues: Your Face as Big Data“, Public Libraries Online, May 19, 2016
Ginny Mies,” Using Big Data to Address Local Needs“, Public Libraries Online, May 24, 2016
 

نویسنده: عباس محمودی

Share

درباره ی عباس محمودی

کارشناسی نرم افزار کامپیوتر - کارشناسی ارشد هوش مصنوعی و رباتیک - کتابدار کتابخانه عمومی شهید مدنی کازرون

پاسخ دهید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *