نکته: مقالههای علمی – پژوهشی در مجله کتابدار ۲.۰ داوری نمیشود و با مسئولیت نویسنده/مترجم منتشر می گردد.
اگر از این مقاله برای مقالهها، پایان نامهها و دیگر مطالب منتشر شده توسط شما، استفاده میشود لطفا نام نویسنده/مترجم را در رفرنس خود ذکر کنید و به رفرنس اصلی(لاتین) ارجاع مستقیم ندهید. (این کار از نظر اخلاق علمی صحیح نیست.)
چکیده: وبمعنایی و جستجوی معنایی یکی از مهمترین تحولات در حوزه شبکه اینترنت، سازماندهی و بازنمایی اطلاعات است که اخیراً بر اهمیت، دامنه و توسعه آن افزوده شده است. همزمان با ظهور و پیشرفت وب معنایی، موتورهای جستجوی معنایی برای بازیابی معنایی تر و مرتبطتر با نیاز اطلاعاتی کاربران در حال توسعه است. با توجه به شهرت گوگل به عنوان یکی از برترین موتورهای جستجو، مطالعه و بررسی توانایی جستجوی معنایی آن میتواند به ارزیابی عملکرد گوگل و بررسی جایگاه آن در بین موتورهای جستجوی معنایی کمک کند. این مقاله، ضمن مرور و بررسی مفاهیم وب معنایی و جستجوی معنایی، به بررسی قابلیتهای مختلف گوگل در تعامل و هم راستا با توسعه وب معنایی پرداخته و تکنیکهای مورد استفاده در بازیابی اطلاعات توسط گوگل را مورد توجه قرار داده است. نتایج حاکی از آن است که گوگل تنها تکنولوژیهای معنایی را استفاده میکند اما هنوز یک موتور جستجوی معنایی کامل نیست. با این حال اطمینان، شهرت و به دنبال آن صلاحیت و شایستگی از جمله مواردی است که در جستجوی معنایی به آن نیاز است و گوگل هر سه این موارد را به خوبی فراهم کرده است.
کلیدواژهها: جستجوی معنایی، گوگل، وبمعنایی، موتور جستجو، گراف دانش
Abstract: Semantic Web and Semantic Search are the most important developments in the area of the Internet network for the organization and representation of information that has recently been added to its importance, scope and development. As the semantic web emerges and develops, semantic search engines for more meaningful and relevant of retrieving information fit with user needs has been developing. Considering Google’s reputation as one of the top search engines, the study of its semantic search capabilities can help evaluate Google’s performance and its status within semantic search engines. This article, while reviewing and exploring semantic web semantic concepts, examines Google’s capabilities in interacting with the development of semantic web and addresses the techniques used to retrieve information by Google. The results indicate that Google only uses semantic technologies, but is still not a complete semantic search engine. However, credibility, reputation and subsequent qualification are among the things that are needed in search of meaning, and Google has provided all three of these.
Keywords: semantic search, Google, Semantic web, Search engine, Knowledge graph
مقدمه
حجم روزافزون اطلاعات در وب نیاز به موتورهای جستجو را افزایش داده است بهگونهای که امروزه بیش از ۸۰ درصد از کاربران اینترنت برای دستیابی به اطلاعات مورد نیاز خود از بین این حجم وسیع از اطلاعات از موتورهای جستجو استفاده میکنند (Kumar, 2010, 87-97). اکثر کاربران نیز نیازهای خود را از طریق موتورهای جستجوی پرکاربردی همچون گوگل برآورده میکنند اما با وجود برخورداری این سیستمها از فناوریهای مناسب برای جستجوی وب هنوز معایب و مشکلاتی دارند که مهمترین آن بازیابی نتایج غیر مرتبط با نیاز کاربران است به طوری که هر کاربر میبایست زمان زیادی را به بازیابی و مرور نتایج بپردازد تا مطالب مرتبط و موردنظر خود را از بین کل موارد بازیابی شده بیابد. علت اصلی این نقیصه نیز به خاطر عدم درک معانی اصطلاحات و عبارتهای موجود در صفحات وب و روابط بین آنها است؛ به عبارت دیگر عمده مکانیسم بازیابی منابع در این موتورهای جستجو طبق الگوی تطبیق کلیدواژه و عبارت موجود در پرسش کاربر و منابع وب صورت میگیرد. وجود مقدار زیاد اطلاعات در وب و مشکلاتی که در رابطه با جستجوی اطلاعات مطرح شد، محققان را بر آن داشت تا برای همگام شدن با تغییرات جدید و رفع مشکل بازیابی اطلاعات به سمت شکل جدیدی از تکنولوژی وب روی آورند؛ بنابراین وب معنایی توسعه داده شد (. Andago, Phoebe, Bassam & Thanoun,2010). در توضیح وب معنایی باید گفت که گسترش جدیدی از وب است که در آن با تعریف معانی اطلاعات و سرویسها، امکان استفاده از محتوای وب برای انسان و ماشین فراهم میشود (شادگار، عصاره و هراتیان نژاد، ۱۳۸۹). به موازات روی کار آمدن این فناوری جدید برنامههای کاربردی متعددی به منظور استفاده از فناوری معنایی توسعه داده شد که یکی از مهمترین آنها موتورهای جستجوی معنایی است. در واقع موتورهای جستجوی معنایی یک راهحل مفید برای غلبه بر مشکلات و نقایص موتورهای جستجوی سنتی است و بر خلاف یک موتور جستجوی سنتی که جستجو را بر اساس کلیدواژه انجام میدهد، خواسته کاربران را تجزیهوتحلیل کرده و با استفاده از استدلال منطقی، نتایج دقیقیتری را بازیابی میکند (دری، ۱۳۸۶).
هدف جستجوی معنایی این است که فراتر از فرهنگ لغت ایستا برای کلمه یا عبارت برای درک منظور جستجوگر عمل کرده و مفهوم جستجوی وی را دریابد (Patel, 2017). در واقع در جستجوی معنایی، معنای واقعی و نهفته در پرسش کاربر تشخیص داده شده و با توجه به آن، نتایج مرتبطتری ارائه میشود و در نتیجه مواردی نظیر ریزش کاذب، بازیابی اطلاعات ناخواسته، اسپم و پیوندهای مرده در آن کمتر به چشم میخورد (دری، ۱۳۸۶). در سالهای اخیر، موتورهای جستجوی معنایی زیادی روی کار آمدند و همچنین موتورهای جستجوی معنایی معروف و متداولی چون گوگل نیز روشها و فناوریهایی را برای جستجوی معنایی مطرح کردهاند. البته گوگل یک موتور جستجوی معنایی نیست (Rashid, WasifNisar, 2016) ولی بسیاری از تکنیکهای جستجوی معنایی را در فرایند جستجوی خود اعمال میکند و به عبارتی همانطور که در ادامه اشاره خواهد شد یکی از پیشگامان توسعه جستجوی معنایی است. در این مقاله ما به بررسی این فناوریها که باعث شده جستجوهای گوگل معنایی تر از گذشته صورت گیرد میپردازیم.
جستجوی معنایی
جستجوی معنایی، همانطور که در اصطلاح فعلی استفاده میشود، اساساً مفهوم استفاده یا بهرهبرداری از فرادادهها برای بهبود جستجو در اسناد است. جستجوی معنایی از وب معنایی پدید آمده است. وب معنایی نیز بر اساس هستیشناسی یا آنتولوژی ساخته شده است. پس باید گفت که به منظور درک جستجوی معنایی، مفاهیم مرتبط با وب معنایی و آنچه موتورهای جستجوی مهمی همچون گوگل برای وفق یافتن با این محیط وب جدید انجام دادند، باید پرداخت. در واقع باید نشانههای اولیه ظهور وب معنایی را نیز با شکل گرفتن هستیشناسیها و واژگان استفاده شده و نحو تعریف شده در ابرداده ها در صفحات ساختار یافته جستجو کرد. در حوزه علم اطلاعات و رایانه، هستیشناسی اساساً چارچوبی برای حقایق و اطلاعات است که تشکیل دهنده دانش است. اصطلاح هستیشناسی اغلب به درک معنایی و یا چارچوب مفهومی دانشی که میان اعضای یک حوزه معین مشترک است اطلاق میشود و دستهبندی از موضوعات یا عناصر موجود در یک حوزه خاص را بررسی میکند و بر همین اساس، فهرستی از موضوعات را ارائه میدهد(Jacob, 2002).
بهعبارتدیگر هستیشناسیها امکان تجزیهوتحلیل ورودی خاص یا مجموعهای از ورودیها را بر اساس شبکهای از عوامل مرتبط فراهم میکند. تصویر زیر نمونه سادهای از یک هستیشناسی است(Patel, 2017)
شکل ۱. نمونهای از یک هستیشناسی(Patel, 2017)
وبمعنایی از تعامل مجموعهها، خواص و روابط استفاده میکند تا مقادیر اطلاعاتی موجود در وب را مرتب نماید. کنسرسیوم جهانی وب پیشگام وب معنایی، وب معنایی را چنین تعریف میکند؛ وب معنایی یک چارچوب مشترک فراهم میکند که اجازه میدهد دادهها به اشتراک گذاشته شود و در سراسر برنامههای کاربردی، شرکتها و غیره مورد استفاده مجدد قرار گیرد. وب معنایی با زبان برنامهنویسی مرتبط است. کامپیوترها از معانی خاص یک زبان برنامهنویسی پیروی کرده و روند خاصی را دنبال میکنند و مطابق با دستورات خاص عمل میکنند. در واقع نمود ویژگی معنایی در یک صفحه وب چیزی شبیه تگهای فراداده است. با توسعه وب معنایی چیزی فراتر از فراداده در موتورهای جستجو وجود دارد. تقریباً هر چیزی که با یک پرسوجو یا دریک وبسایت انجام میشود میتواند بخشی از دامنه معنایی مربوط به نتایج جستجو باشد. جستجوی معنایی تا حد زیادی به نشانهگذاری معنایی محتوای سایتها و مقدار زیادی اطلاعات معنایی بستگی دارد(Patel, 2017).
نظریه جستجوی معنایی به سال ۲۰۰۳ و در نتیجه مقاله نوشته شده توسط گوها و همکارانش[۱] در دانشگاه استنفورد بر میگردد. آنها در مقاله خود نشان دادند که چگونه جستجوی معنایی عمل میکند. زمانی که این مقاله از نظریه به عمل رسید، یعنی ده سال بعد، ما شاهد اولین موفقیت در پیادهسازی جستجوی معنایی توسط انسان بودیم که در نتیجه طراحی الگوریتم هامینگ بیرد (مرغ مگسخوار) برای عملکرد سریع و دقیق جستجوی معنایی توسط شرکت گوگل صورت گرفت. در واقع هامینگ برد آخرین و احتمالاً بزرگترین الگوریتم گوگل بود که از ماه اوت ۲۰۱۳ به صورت نسبتاً پنهانی فعالیت خود را آغاز کرد غالب بهینه سازهای جستجو (SEO) میدانند که هامینگ بیرد «جستجوی محاورهای[۲]» را به فرایند جستجو الحاق کرد که در ادامه به عنوان یکی از قابلیتهای جستجوی معنایی گوگل به آن اشاره خواهد شد (Google Humming… 2017).
اما قابلیت این الگوریتم (هامینگ بیرد) چیزی فراتر از جستجوی مکالمهای بود. هامینگ بیرد به هر کلمه در کوئری توجه داشته و تمام اجزای کوئری را در تحلیل پرسش استفاده میکرد تا به نتیجه بهتر دست یابد. هدف این بود که صفحات بازیابی شده از نظر معنایی مطابقت زیادی با پرسش کاربر داشته باشند؛ به عبارت دیگر هامینگ برد کوئری های موتور جستجو را به روش جدید و هوشمندانهای هدفگذاری کرده و با تلفیق فناوریهای جدید و ویژگیهای قدیمی الگوریتمهای پیشین رویکرد بهینهتری مطرح کرد. لغت هامینگ برد نیز بنا بر سرعت و دقت بسیار بالای پرنده کوچکی به همین نام انتخاب شده است. هامینگبرد کوئری های موتور جستجو را در قالب کلمات کلیدی طولانی دریافت و سعی میکرد به جای بررسی تکتک کلمات موجود در سؤال، محتوای کلی کوئری را تشخیص دهد. هامینگ برد به کمک گراف دانش خود، پاسخ سؤال را در قالب کارت اطلاعات میگنجاند و آن را در بخش بالا یا سمت راست صفحه نتایج نمایش میدهد (Google Humming… 2017)؛ بنابراین هدف اصلی این است که نتایجی در اختیار کاربر قرار داده شوند که بیشترین ارتباط را به مقصود وی داشته باشند.
آنچه به عنوان نمود جستجوی معنایی در صفحات بازیابی موتورهای جستجو میتوان مشاهده کرد، نمایشهای پیشرفته از نتایج است.
گوگل و جستجوی معنایی
گوگل پروژه تحقیقاتی بود که در ژانویه ۱۹۹۶ توسط لری پیج و سرگئی برین دو دانشجوی دکترای دانشگاه استنفورد در کالیفرنیا رقم خورد. هدف آنها از این پروژه دستیابی به اطلاعات مرتبط به هم از میان انبوهی از اطلاعات موجود در کامپیوتر بود. گوگل به مدت ۱۵ سال مشغول فعالیت بوده و در تمام این مدت سعی در توسعه بزرگترین بانک اطلاعات دانش را داشت و با وجود چنین گراف دانش عظیمی و طراحی الگوریتم هوشمند هامینگ برد در سال ۲۰۱۳ وارد مرحله جدیدی از جستجو و بازیابی اطلاعات شد که با دنیای وب معنایی مطابقت داشته و فرآیند جستجوی معنایی را میسر نمود. آنچه مسلم است گوگل موتور جستجوی معنایی خالصی نیست اما در الگوریتمهای عملکردی خود امکان جستجوی معنایی را میسر نموده است که به ارائه نتایج مرتبطتر و مفیدتر منجر میشود (John,2012). در واقع گوگل از زمان عرضه نخستین الگوریتم خود، به کاربران وعده داده بود سؤالاتشان را به بهترین نحو ممکن پاسخ دهد ولی مشکل این بود که گوگل تنها کاربر را به وبسایتهایی که ممکن بود شامل پاسخ سؤال باشد هدایت کند؛ اما با طراحی الگوریتم هامینگبرد سعی بر این قرار گرفت که سؤال را به صورت کامل درک و هضم کند و پاسخ اصلی سؤال را در اختیار کاربر قرار دهد. اینکه شرکت گوگل با ترکیب چه فناوری و استراتژی درصدد توسعه جستجوی معنایی است مخفی نگه داشته شده است اما میتوان بر اساس وضعیت و توانایی گوگل در جستجوی معنایی مفروضاتی را در نظر گرفت (Ysasi,2016). چندین قرارداد وجود دارد که گوگل از گذشته تاکنون در فرآیند جستجوی خود به کار گرفته و دال بر نقش معنا در پردازش سؤالات جستجوی آن است. بعضی از این قراردادها و اطلاعات مرتبط با آن عبارتاند از:
- تعیین موجودیت اصلی در یک جستجو: گوگل موجودیت موجود در یک جستجو را تشخیص داده و مقوله و اصطلاحات مرتبط با آن موجودیت را نیز شناسایی میکند. این تکنیک به ایجاد پایگاه داده معنایی موجودیتها و ارتباط اصطلاحات مرتبط با آن کمک میکند.
- الگوها یا قالبهای تکمیل پرس و جوی تعاملی: این تکنیک به ما کمک میکند تا نقش قالبهای تکمیل پرسوجو را در هنگام پردازش سؤال شناسایی کنیم. این به کاربر کمک میکند تا سؤال کامل را بهوسیله تشخیص طبقه اطلاعات مرتبط با کلمات جستجوی جزئی شناسایی کند و سؤال کامل را بر اساس سؤال جزئی وارد شده توسط کاربر نمایش دهد.
- شناسایی مترادف بر اساس اصطلاحات همجوار: این تکنیک مفاهیم پنهان استفاده از مترادفات منتخب را با توجه به سؤال کاربر آشکار میکند. گوگل ممکن است سؤال کاربر را با نزدیکترین اصطلاح مترادف همخوان با سؤال جایگزین کند.
- گراف دانش بر اساس سیستم جستجو: این تکنیک مدلهای گراف دانش و نقش آن در بازیابی نتایج جستجو بر اساس تشخیص معنایی موجودیتها و ارتباط آنها را بحث میکند.
- خودآموزی موتور جستجوی معنایی: این تکنیک امکانات مرتبط با توسعه و ساخت نمایه معنایی و استفاده از آن برای برگشت پاسخ به سؤال کاربر را بحث میکند. نمایه بهطور مرتب روز آمد شده تا نتایج معنایی تری را به همراه داشته باشد.
- شناسایی بخشهای جستجو از طریق سؤالات: گوگل به طبقهبندی اصطلاحات چندگانه موجود در پرسش کاربر میپردازد. این واحد معنایی دستهای از نتایج مرتبط را بر اساس واحد معنایی بالقوه شناسایی میکند.
- استفاده از شبکه معنایی برای توسعه شبکه اجتماعی: یک سیستم اجتماعی با استفاده از شبکههای رایج و علایقِ کاربران ایجاد میشود. شبکههای اجتماعی مرتبط از نظر معنایی ممکن است برای شناسایی علایق رایج کاربران و برای تولید نتایج جستجوی مرتبط استفاده شود (Bhattacharya, ۲۰۱۴).
نقش گراف دانش گوگل
تمام سؤالات مرتبط با یک موجودیت نیاز به دانش خاصی جهت پردازش دارد. به همین دلیل گوگل از مدتها قبل سیستمی برای پردازش موجودیتها به کار گرفته که گراف دانش نامیده میشود. شرکت گوگل از سال ۲۰۱۲ گراف دانش خود را بر اساس ۳.۵ میلیارد داده مرتبط با ۵۰۰ میلیون موجودیت را ایجاد کرد. قبل از توسعه گراف دانش و ارتباط الگوریتم هامینگ برد با آن، گوگل بر اساس تحلیلهای آماری و متنی سؤالات جستجو را پردازش نموده و با دنیای واقعی موجودیتها ارتباط آنها با یکدیگر کاری نداشت. گراف دانش به سازماندهی دادههای مرتبط با موجودیتها میپردازد که این موجودیت میتواند مکان، سازمان، ورزش، تیم، شخص و. باشد. منظور از گراف دانش گوگل نیز نمایش گرافیکی اطلاعات مرتبط با یک موجودیت یا سؤال است که در قالب یک کارت اطلاعات در ابتدای نتایج جستجو نمایش داده میشود. در واقع وقتی موتور جستجوی گوگل سؤالی دریافت میکند که در پایگاه دانش ان موجود است، پانلی در سمت راست نتایج جستجو که حاوی کلیه اطلاعات مرتبط با پرسش کاربر است از قبیل، تصویر، حقایق مهم و جستجوهای مرتبط و لینکهایی برای جستجوی بیشتر موضوع را نمایش میدهد (Saini,2012).
پردازش معنایی سؤال جستجو توسط گوگل
نقش کلیدواژههای در پرسش کاربر بعد از ابداع الگوریتم هامینگ برد به پایان رسید. بهعبارتیدیگر مثل گذشته کلیدواژههای پرسش کاربر نقش پراهمیتی در پردازش جستجو ندارد. سؤال وارد شده توسط کاربر به کمک متغیرهای معنایی و الگوریتم هامینگ برد مورد پردازش قرار میگیرد و نه بر اساس تطابق کلیدواژههای ظاهر شده در صفحات وب. پردازش پرسش کاربر در محیط هامینگ برد چندین لایه از فیلتر دادهها را شامل میشود تا پرسش به درستی غربال شده و صحیحترین نتیجه ممکن به کاربر ارائه شود. امروزه گوگل به مطابقت مفهوم پرسش و معنای واقعی آن با محتوای صفحات وب میپردازد و همین امر دقت بازیابی صفحات مرتبط را افزایش میدهد و صفحاتی بازیابی میشود که اگر چه دقیقاً حاوی کلید واژهای موجود در سؤال کاربر نیست اما از نظر مفهومی کاملاً مرتبط است.
با گسترش سؤالات محاورهای کاربران مشتاق پرسش از گوگل هستند و انتظار دریافت پاسخ سریع دارند. به همین دلیل گوگل به توسعه سیستمی برای شناسایی آدرس محلی کاربران و یا تاریخچه جستجوهای گذشته کاربران برای ارائه نتایج مرتبطتر پرداخته است و حتی پاسخها را با توجه به پروفایل کاربر در گوگل پلاس به صورت اختصاصیتر ارائه میدهد. دادههایی که گوگل برای محاسبه و ارائه نتایج مرتبط با سؤال کاربر استفاده میکند فوقالعاده زیاد است. ابتدا لازم است که گوگل به شناسایی منابعی بپردازد که معتبر است و سپس به پردازش سؤالات قبلی پرداخته تا پاسخ دقیق به پرسش کاربر ارائه دهد. گوگل از اعتماد کاربران به نتایجی که ارائه میدهد به خوبی آگاه است و به همین خاطر باید قبل از ارائه نتایج صد در صد از صحت نتایج قبل از ارائه به کاربر مطمئن شود. در محیط جستجوی معنایی گوگل موجودیتها، ارتباطات، هم استنادی، امتیاز به صحت مطالب و شخصیسازی مدنظر قرار داده میشود. بعضی از مهمترین فاکتورهایی که گوگل در پردازش معنایی سؤالات کاربر مدنظر قرار میگیرند عبارتاند از:
- ردیابی آدرس IP کاربران: گوگل در واقع آی پی تکتک کاربران خود را ردیابی نموده تا مرتبطترین نتایج را بر اساس محل زندگی آنها ارائه دهد.
- بازسازی پرسش به منظور پالایش و شفافسازی آن: گوگل در شفافسازی و پالایش سؤال کاربر بسیار قدرتمند است. گوگل با اضافه کردن مترادفات، حذف کلیدواژههای ممنوع، جایگزین کردن کلمات با غلط املایی و. به خوبی پرسش کاربر را پالایش میکند.
- شناسایی موجودیتها: گوگل موجودیتهای ارائه شده در سؤال کاربر را با توجه به گراف دانش متناظر با آن شناسایی میکند. بهعنوانمثال در سؤال «پایتخت کشور هند کجاست؟»، گوگل به راحتی موجودیت اصلی این پرسش که «هند» است را با توجه به گراف دانش متناظر تشخیص میدهد.
- تشخیص الگوها و مطابقت دادن آنها با هم: در پرسش مطرح شده مثال قبل، گوگل الگویی که منجر به تشخیص دهلی به عنوان پایتخت هند است را تشخیص میدهد و گراف دانش آن دهلی را به عنوان پاسخ پرسش ارائه میدهد و همین الگو برای پاسخ سریع به سؤالات مشابه استفاده میکند.
- جمعآوری داده از تاریخچه جستجو: گوگل دادههایی را از تاریخچه جستجوی کاربر به دست میآورد که برای قضاوت در مورد صحت نتایج به کار میگیرد.
- پیدا کردن منابع معتبر و مطمئن: گوگل معمولاً بر منابع مطمئن مثل ویکیپدیا برای ارائه نتایج خود تکیه دارد.
- نمایش نتایج نهایی: گوگل نتایج نهایی را که غالباً پاسخ مستقیم به پرسش است در قالب کارت اطلاعات و به همراه مجموعهای از نتایج ارائه میدهد ((Bhattacharya, ۲۰۱۴.
بعضی از مظاهر جستجوهای معنایی گوگل که توسط کاربر قابل مشاهده است عبارتاند از:
- جستجوی محاورهای و نتایج آن
همانطور که گفته شد یکی از ویژگیهای جستجوی معنایی گوگل، جستجوی محاوره است که با استفاده از آیکون میکروفون کوچکی که در گوشه سمت راست کادر جستجوی گوگل تعبیه شده، امکانپذیر است. در صورتی که کاربر بر روی میکروفون کلیک کند، میتواند سؤال خود را به جای تایپ با صدای بلند بپرسد. بدین ترتیب سؤال موردنظر به همراه نتایج آن بر روی صفحهنمایش نقش میبندد (شکل دو)
شکل ۲. جستجوی محاورهای گوگل
چنانچه پاسخ سؤال درون گراف دانش گوگل موجود باشد، کارت اطلاعات (information card) مخصوصی با دادههای مرتبط به سؤال، به همراه لیستی از سایتهای حاوی اطلاعات تکمیلی و یا پاسخ اصلی سؤال، نمایش داده میشوند.
گوگل به کمک الگوریتم هامینگبرد و گراف دانش خود، پاسخ سؤال را در قالب کارت اطلاعات میگنجاند و آن را در بخش بالا یا سمت راست صفحه نتایج نمایش میدهد.(شکل ۳)
شکل ۳. نمایش نتایج جستجو گوگل در قالب کارت اطلاعات
گوگل از بیش از ۲۰۰ فاکتور رتبهبندی استفاده میکند و از عوامل بسیاری برای به دست آوردن بهترین نتیجه استفاده میکند. آخرین پیشرفتها در یادگیری ماشینی نیز به توسعه جستجوی معنایی کمک زیادی کرده است و باعث شده که اساساً بهصورت مستقل عمل کند و مرتب به بهبود نتایج کمک نماید. بهعنوانمثال جستجویی با این عنوان «قطعات چمنزنی» در موتور جستجوی گوگل صورت میگیرد. طبق جستجوی غیر معنایی یا همان جستجوی سنتی، نتایج این جستجو شامل صفحهای از نتایج است که تنها حاوی این کلمات است بدون توجه به مفهوم اصلی و منظور واقعی جستجوگر (Rashid, WasifNisar, 2016).
اما در نتایج حاصل از جستجوی معنایی، نمایش و نتایج بهگونهای دیگر است. بهینهساز موتورهای جستجوی معنایی نتایج را بر اساس تمام فاکتورها و یا عوامل ممکن نمایش میدهند و نه تنها بر اساس سه کلیدواژه موجود در عبارت جستجو. آنچه در موتور جستجوی معنایی گوگل هنگام وارد کردن جستجو رخ میدهد(Patel, 2017):
- بررسی میلیونها جستجو با همین عبارت
- بررسی یادگیری ماشینی گوگل
- بررسی روند فصلی تأثیرگذار بر جستجو
- بررسی رفتار جستجوگر
- بررسی روند جستجو که مخصوص به محل زندگی جستجوگراست؟ اگر از منطقهای این جستجو صورت میگرفت که مردم آن تنها میتوانستند دستگاه چمنزنی خود را تعمیر کنند، نتیجه متفاوتی دریافت میشد؟!
- بررسی تاریخچه جستجوی کاربر: گوگل متوجه خواهد شد که جستجوگر در گذشته دستگاه چمنزنی خود را تعمیر کرده است و در نتیجه جستجو بهگونهای متفاوت صورت خواهد گرفت
تمام موارد بالا در جستجوی معنایی گوگل مورد توجه است. در واقع برای مثال ذکر شده باید گفت، گوگل بالغ بر ۱۰ سال دادههای مربوط به جستجوی «قطعات چمنزنی» را جمعآوری کرده است. بر همین اساس گوگل میداند که علاقه به این پرسش طبق فصول مختلف سال در نوسان است و به میزان بارش و شروع فصول مختلف مرتبط است (شکل ۴).
شکل ۴. تحلیل زمانی گوگل از پرسش کاربران
همچنین گوگل طبق دادههای جمعآوری شده در این مدت میداند که در کشورهای امریکا، ایرلند و کانادا این پرسش بیشتر از سایر کشورها صورت گرفته است (شکل ۵).
شکل ۵. تحلیل مکانی گوگل از پرسش کاربران
همچنین گوگل میداند که مردم به دنبال برندهایی از دستگاه چمنزنی هستند که مربوط به دستگاه شخصی خودشان است (شکل ۶).
شکل ۶. تحلیلهای مرتبط دیگر با پرسش کاربر
همچنین گوگل میداند که میزان جستجوی عبارت «تعمیر دستگاه چمنزنی» کمتر از عبارت «قطعات چمنزنی» است. همچنین گوگل میداند که از سال ۲۰۰۵ تعداد جستجو برای کلمه «تعمیر» نسبت به کلمه «قطعات» افزایش یافته است. در واقع مردم اخیراً بیشتر کلمه «تعمیر» را جستجو میکنند (شکل ۷).
شکل ۷. تحلیل گوگل از کلیدواژههای جستجوی کاربر در طی زمان
و به این ترتیب هر بایت داده به طریقی ردیابی میشود که قبلاً نمایه شده و بر همین اساس بهترین پاسخ را ارائه دهد؛ و در آخر باید گفت که قدرت جستجوی معنایی در این واقعیت نهفته است که به جای جمعآوری وبسایتهای مرتبط با کلیدواژههای جستجوگر، بهترین وبسایتها که بیشتری ارتباط معنایی را با شرایط جستجوگر دارد ارائه دهد.
بحث و نتیجهگیری
در جستجوی معنایی منظور نظر کاربر و دادههای وی هر دو در جستجو مورد توجه قرار میگیرد. در جستجوی معنایی، بهترین پاسخ و نتیجه جستجو گزینههایی نیست که شامل تعداد زیادی کلیدواژه مطابق با سؤال جستجوگر است، بلکه بهترین و مرتبطترین نتیجه، وبسایتی است که با منظور جستجوگر مطابق است و این نکاتی است که گوگل در فرآیند جستجوی خود اعمال میکند. تغییرات الگوریتمی گوگل در ۱۰ سال اخیر، جستجوی آن را معنایی تر نموده است (Amerland,2013). با این حال باید گفت که گوگل تنها تکنولوژیهای معنایی را استفاده میکند اما هنوز یک موتور جستجوی معنایی کامل نیست (Midwinter,2007). درحالیکه موتورهای جستجوی معنایی با استفاده از معنا شناختی یا علم معنایی در زبان برای تولید نتایج جستجوی بسیار مرتبط عمل میکنند گوگل از الگوریتم رتبهبندی مثل پیج رنک[۳] برای پیشبینی ربط استفاده میکند.
گوگل از پردازش زبان طبیعی استفاده نمیکند اما این مانعی برای تولید بعضی از تکنولوژیهای تغییر وب نیست. البته پردازش زبان طبیعی از مظاهر وب ۴ است درحالیکه معنا و جستجوی معنایی در وب ۳ مطرح است. با تمام این احوال فهم معنای واقعی عبارت جستجو، درک بافتی که کلمات در آن استفاده میشوند و ارتباط بین آنها، وعدهای است که فناوری مبتنی بر وب معنایی نوید آن را داده است و گوگل این امر مهم را به نحو احسن انجام میدهد (دری، ۱۳۸۶). گفته میشود که اطمینان منجر به شهرت میشود و به دنبال آن صلاحیت و شایستگی را به همراه دارد. این سه در ایجاد اعتبار یک برند نقش اساسی دارند. جستجوی معنایی نیز به هر سه این موارد نیاز دارد تا به درستی عمل کند. گوگل و مکانیسم آن به گونه است که هر سه این موارد را به خوبی فراهم نموده است (Amerland,2013).
پانویس:
[۱] Guha & et al
[۲] Conversational search
[۳] Page rank
References
- Kumar, B. T. S., & Pavitha, S.M.(2010). Evaluating the searching capabilities of the search engines and meta search engine: A comparative study. Annals of Library and information studies, 57, 87-97.
- Andago, M., Phoebe, P.L., Bassam A.M & Thanoun (2010). Evaluation of semantic search engine against a keyword search engine using first 20 precisions. International Journal for the advancement of science & Art, 1(2), 55-63
- Shadgar B, Asare A, Haratian Nejad A(1389). Semantic web: concepts and technique. Tehran: Armaghan. 14 P. [In Persian]
- Dori R(1386). Comparison and Assess semantic motor engine. Research and Information Processing and Management, 30(2), 467-487[In Persian]
- Patel N(2017). Everything you need to know about semantic search and what it means for your website. Retrieved July 2017. Retrieved from: https://www.crazyegg.com/blog/everything-about-semantic-search
- Rashid.J, WasifNisar, M.(2016). A study on semantic searching, semantic search engines and technologies used for semantic search engines. Information technology and computer science, 10, 82-89. Retrieved from: https://www.researchgate.net/publication/308800002_A_Study_on_Semantic_Searching_Semantic_Search_Engines_and_Technologies_Used_for_Semantic_Search_Engines
- Jacob A.(2002) Ontology and semantic web. Translated by Sheikh Shoai F. Book Quarterly. 64. 189-194
- Google`s Hummingbird Algorithm: The Entity search Revolution(2017). Retrieved from: http://www.searchmetrics.com/knowledge-base/hummingbird/
- John.T(2012).What is Semnatic search and how it works with google search. Retrieved from: http://www.techulator.com/resources/5933-What-Semantic-Search.aspx
- Ysasi,E(2016).What is Google`s semantic search. Retrieved from: https://www.theleverageway.com/blog/google-semantic-search/
- Bhattacharya. J (2014). How Google processes queries in a semantic web environment. Retrieved from: https://ahrefs.com/blog/google-processes-queries-semantic-web-environment/
- Amerland, D (2013). Google semantic Search, 50-52. Retrieved from: ptgmedia.pearsoncmg.com/images/9780789751348/samplepages/0789751348.pd
- Midwinter P(2007). Is google a semantic search engine? Retrieved from: https://readwrite.com/2007/03/26/is_google_a_semantic_search_engine/
- Saini, Sushil Kumar(2012). Role of Knowledge Graph and Artificial intelligence in future Robotics and Google’s Semantic search. Retrieved from : http://www.techulator.com/resources/6132-Role-Knowledge-Graph-Artificial.aspx
مترجم: فاطمه زرمهر
مشخصات استناددهی به این مقاله | |
نویسنده(ها): | فاطمه زرمهر |
عنوان مقاله: | گوگل و جستجوی معنایی: آیا گوگل یک موتور جستجوی معنایی است؟ |
عنوان مجله: | کتابدار ۲.۰ – (عنوان لاتین: Kitābdār-i 2.0) |
دوره مجله(Vol): | ۷ |
شماره مجله(Issue): | ۱ |
سال(Year): | ۱۴۰۰ |
شناسه دیجیتال(DOI): | |
لینک کوتاه: | http://lib2mag.ir/12357 |