خانه / آرشیو / دوره هفتم (1400) / گوگل و جستجوی معنایی: آیا گوگل یک موتور جستجوی معنایی است؟

گوگل و جستجوی معنایی: آیا گوگل یک موتور جستجوی معنایی است؟

نکته: مقاله‌های علمی – پژوهشی در مجله کتابدار ۲.۰ داوری نمی‌شود و با مسئولیت نویسنده/مترجم منتشر می گردد.
اگر از این مقاله برای مقاله‌ها، پایان نامه‌ها و دیگر مطالب منتشر شده توسط شما، استفاده می‌شود لطفا نام نویسنده/مترجم را در رفرنس خود ذکر کنید و به رفرنس اصلی(لاتین) ارجاع مستقیم ندهید. (این کار از نظر اخلاق علمی صحیح نیست.)

چکیده: وب‌معنایی و جستجوی معنایی یکی از مهم‌ترین تحولات در حوزه شبکه اینترنت، سازمان‌دهی و بازنمایی اطلاعات است که اخیراً بر اهمیت، دامنه و توسعه آن افزوده شده است. هم‌زمان با ظهور و پیشرفت وب معنایی، موتورهای جستجوی معنایی برای بازیابی معنایی تر و مرتبط‌تر با نیاز اطلاعاتی کاربران در حال توسعه است. با توجه به شهرت گوگل به عنوان یکی از برترین موتورهای جستجو، مطالعه و بررسی توانایی جستجوی معنایی آن می‌تواند به ارزیابی عملکرد گوگل و بررسی جایگاه آن در بین موتورهای جستجوی معنایی کمک کند. این مقاله، ضمن مرور و بررسی مفاهیم وب معنایی و جستجوی معنایی، به بررسی قابلیت‌های مختلف گوگل در تعامل و هم راستا با توسعه وب معنایی پرداخته و تکنیک‌های مورد استفاده در بازیابی اطلاعات توسط گوگل را مورد توجه قرار داده است. نتایج حاکی از آن است که گوگل تنها تکنولوژی‌های معنایی را استفاده می‌کند اما هنوز یک موتور جستجوی معنایی کامل نیست. با این حال اطمینان، شهرت و به دنبال آن صلاحیت و شایستگی از جمله مواردی است که در جستجوی معنایی به آن نیاز است و گوگل هر سه این موارد را به خوبی فراهم کرده است.

کلیدواژه‌ها: جستجوی معنایی، گوگل، وب‌معنایی، موتور جستجو، گراف دانش

Abstract: Semantic Web and Semantic Search are the most important developments in the area of the Internet network for the organization and representation of information that has recently been added to its importance, scope and development. As the semantic web emerges and develops, semantic search engines for more meaningful and relevant of retrieving information fit with user needs has been developing. Considering Google’s reputation as one of the top search engines, the study of its semantic search capabilities can help evaluate Google’s performance and its status within semantic search engines. This article, while reviewing and exploring semantic web semantic concepts, examines Google’s capabilities in interacting with the development of semantic web and addresses the techniques used to retrieve information by Google. The results indicate that Google only uses semantic technologies, but is still not a complete semantic search engine. However, credibility, reputation and subsequent qualification are among the things that are needed in search of meaning, and Google has provided all three of these.

Keywords: semantic search, Google, Semantic web, Search engine, Knowledge graph

مقدمه

حجم روزافزون اطلاعات در وب نیاز به موتورهای جستجو را افزایش داده است به‌گونه‌ای که امروزه بیش از ۸۰ درصد از کاربران اینترنت برای دستیابی به اطلاعات مورد نیاز خود از بین این حجم وسیع از اطلاعات از موتورهای جستجو استفاده می‌کنند (Kumar, 2010, 87-97). اکثر کاربران نیز نیازهای خود را از طریق موتورهای جستجوی پرکاربردی همچون گوگل برآورده می‌کنند اما با وجود برخورداری این سیستم‌ها از فناوری‌های مناسب برای جستجوی وب هنوز معایب و مشکلاتی دارند که مهم‌ترین آن بازیابی نتایج غیر مرتبط با نیاز کاربران است به طوری که هر کاربر می‌بایست زمان زیادی را به بازیابی و مرور نتایج بپردازد تا مطالب مرتبط و موردنظر خود را از بین کل موارد بازیابی شده بیابد. علت اصلی این نقیصه نیز به خاطر عدم درک معانی اصطلاحات و عبارت‌های موجود در صفحات وب و روابط بین آن‌ها است؛ به عبارت دیگر عمده مکانیسم بازیابی منابع در این موتورهای جستجو طبق الگوی تطبیق کلیدواژه و عبارت موجود در پرسش کاربر و منابع وب صورت می‌گیرد. وجود مقدار زیاد اطلاعات در وب و مشکلاتی که در رابطه با جستجوی اطلاعات مطرح شد، محققان را بر آن داشت تا برای همگام شدن با تغییرات جدید و رفع مشکل بازیابی اطلاعات به سمت شکل جدیدی از تکنولوژی وب روی آورند؛ بنابراین وب معنایی توسعه داده شد (. Andago, Phoebe, Bassam & Thanoun,2010). در توضیح وب معنایی باید گفت که گسترش جدیدی از وب است که در آن با تعریف معانی اطلاعات و سرویس‌ها، امکان استفاده از محتوای وب برای انسان و ماشین فراهم می‌شود (شادگار، عصاره و هراتیان نژاد، ۱۳۸۹). به موازات روی کار آمدن این فناوری جدید برنامه‌های کاربردی متعددی به منظور استفاده از فناوری معنایی توسعه داده شد که یکی از مهم‌ترین آن‌ها موتورهای جستجوی معنایی است. در واقع موتورهای جستجوی معنایی یک راه‌حل مفید برای غلبه بر مشکلات و نقایص موتورهای جستجوی سنتی است و بر خلاف یک موتور جستجوی سنتی که جستجو را بر اساس کلیدواژه انجام می‌دهد، خواسته کاربران را تجزیه‌وتحلیل کرده و با استفاده از استدلال منطقی، نتایج دقیقی‌تری را بازیابی می‌کند (دری، ۱۳۸۶).

هدف جستجوی معنایی این است که فراتر از فرهنگ لغت ایستا برای کلمه یا عبارت برای درک منظور جستجوگر عمل کرده و مفهوم جستجوی وی را دریابد (Patel, 2017). در واقع در جستجوی معنایی، معنای واقعی و نهفته در پرسش کاربر تشخیص داده شده و با توجه به آن، نتایج مرتبط‌تری ارائه می‌شود و در نتیجه مواردی نظیر ریزش کاذب، بازیابی اطلاعات ناخواسته، اسپم و پیوندهای مرده در آن کمتر به چشم می‌خورد (دری، ۱۳۸۶). در سال‌های اخیر، موتورهای جستجوی معنایی زیادی روی کار آمدند و همچنین موتورهای جستجوی معنایی معروف و متداولی چون گوگل نیز روش‌ها و فناوری‌هایی را برای جستجوی معنایی مطرح کرده‌اند. البته گوگل یک موتور جستجوی معنایی نیست (Rashid, WasifNisar, 2016) ولی بسیاری از تکنیک‌های جستجوی معنایی را در فرایند جستجوی خود اعمال می‌کند و به عبارتی همان‌طور که در ادامه اشاره خواهد شد یکی از پیشگامان توسعه جستجوی معنایی است. در این مقاله ما به بررسی این فناوری‌ها که باعث شده جستجوهای گوگل معنایی تر از گذشته صورت گیرد می‌پردازیم.

جستجوی معنایی

جستجوی معنایی، همان‌طور که در اصطلاح فعلی استفاده می‌شود، اساساً مفهوم استفاده یا بهره‌برداری از فراداده‌ها برای بهبود جستجو در اسناد است. جستجوی معنایی از وب معنایی پدید آمده است. وب معنایی نیز بر اساس هستی‌شناسی یا آنتولوژی ساخته شده است. پس باید گفت که به منظور درک جستجوی معنایی، مفاهیم مرتبط با وب معنایی و آنچه موتورهای جستجوی مهمی همچون گوگل برای وفق یافتن با این محیط وب جدید انجام دادند، باید پرداخت. در واقع باید نشانه‌های اولیه ظهور وب معنایی را نیز با شکل گرفتن هستی‌شناسی‌ها و واژگان استفاده شده و نحو تعریف شده در ابرداده ها در صفحات ساختار یافته جستجو کرد. در حوزه علم اطلاعات و رایانه، هستی‌شناسی اساساً چارچوبی برای حقایق و اطلاعات است که تشکیل دهنده دانش است. اصطلاح هستی‌شناسی اغلب به درک معنایی و یا چارچوب مفهومی دانشی که میان اعضای یک حوزه معین مشترک است اطلاق می‌شود و دسته‌بندی از موضوعات یا عناصر موجود در یک حوزه خاص را بررسی می‌کند و بر همین اساس، فهرستی از موضوعات را ارائه می‌دهد(Jacob, 2002).

 به‌عبارت‌دیگر هستی‌شناسی‌ها امکان تجزیه‌وتحلیل ورودی خاص یا مجموعه‌ای از ورودی‌ها را بر اساس شبکه‌ای از عوامل مرتبط فراهم می‌کند. تصویر زیر نمونه ساده‌ای از یک هستی‌شناسی است(Patel, 2017)

شکل ۱. نمونه‌ای از یک هستی‌شناسی(Patel, 2017)

وب‌معنایی از تعامل مجموعه‌ها، خواص و روابط استفاده می‌کند تا مقادیر اطلاعاتی موجود در وب را مرتب نماید. کنسرسیوم جهانی وب پیشگام وب معنایی، وب معنایی را چنین تعریف می‌کند؛ وب معنایی یک چارچوب مشترک فراهم می‌کند که اجازه می‌دهد داده‌ها به اشتراک گذاشته شود و در سراسر برنامه‌های کاربردی، شرکت‌ها و غیره مورد استفاده مجدد قرار گیرد. وب معنایی با زبان برنامه‌نویسی مرتبط است. کامپیوترها از معانی خاص یک زبان برنامه‌نویسی پیروی کرده و روند خاصی را دنبال می‌کنند و مطابق با دستورات خاص عمل می‌کنند. در واقع نمود ویژگی معنایی در یک صفحه وب چیزی شبیه تگ‌های فراداده است. با توسعه وب معنایی چیزی فراتر از فراداده در موتورهای جستجو وجود دارد. تقریباً هر چیزی که با یک پرس‌وجو یا دریک وب‌سایت انجام می‌شود می‌تواند بخشی از دامنه معنایی مربوط به نتایج جستجو باشد. جستجوی معنایی تا حد زیادی به نشانه‌گذاری معنایی محتوای سایت‌ها و مقدار زیادی اطلاعات معنایی بستگی دارد(Patel, 2017).

نظریه جستجوی معنایی به سال ۲۰۰۳ و در نتیجه مقاله نوشته شده توسط گوها و همکارانش[۱] در دانشگاه استنفورد بر می‌گردد. آن‌ها در مقاله خود نشان دادند که چگونه جستجوی معنایی عمل می‌کند. زمانی که این مقاله از نظریه به عمل رسید، یعنی ده سال بعد، ما شاهد اولین موفقیت در پیاده‌سازی جستجوی معنایی توسط انسان بودیم که در نتیجه طراحی الگوریتم هامینگ بیرد (مرغ مگس‌خوار) برای عملکرد سریع و دقیق جستجوی معنایی توسط شرکت گوگل صورت گرفت. در واقع هامینگ برد آخرین و احتمالاً بزرگ‌ترین الگوریتم گوگل بود که از ماه اوت ۲۰۱۳ به صورت نسبتاً پنهانی فعالیت خود را آغاز کرد غالب بهینه سازهای جستجو (SEO) می‌دانند که هامینگ بیرد «جستجوی محاوره‌ای[۲]» را به فرایند جستجو الحاق کرد که در ادامه به عنوان یکی از قابلیت‌های جستجوی معنایی گوگل به آن اشاره خواهد شد (Google Humming… 2017).

اما قابلیت این الگوریتم (هامینگ بیرد) چیزی فراتر از جستجوی مکالمه‌ای بود. هامینگ بیرد به هر کلمه در کوئری توجه داشته و تمام اجزای کوئری را در تحلیل پرسش استفاده می‌کرد تا به نتیجه بهتر دست یابد. هدف این بود که صفحات بازیابی شده از نظر معنایی مطابقت زیادی با پرسش کاربر داشته باشند؛ به عبارت دیگر هامینگ برد کوئری های موتور جستجو را به روش جدید و هوشمندانه‌ای هدف‌گذاری کرده و با تلفیق فناوری‌های جدید و ویژگی‌های قدیمی الگوریتم‌های پیشین رویکرد بهینه‌تری مطرح کرد. لغت هامینگ برد نیز بنا بر سرعت و دقت بسیار بالای پرنده کوچکی به همین نام انتخاب شده است. هامینگبرد کوئری های موتور جستجو را در قالب کلمات کلیدی طولانی دریافت و سعی می‌کرد به جای بررسی تک‌تک کلمات موجود در سؤال، محتوای کلی کوئری را تشخیص دهد. هامینگ برد به کمک گراف دانش خود، پاسخ سؤال را در قالب کارت اطلاعات می‌گنجاند و آن را در بخش بالا یا سمت راست صفحه نتایج نمایش می‌دهد (Google Humming… 2017)؛ بنابراین هدف اصلی این است که نتایجی در اختیار کاربر قرار داده شوند که بیشترین ارتباط را به مقصود وی داشته باشند.

 آنچه به عنوان نمود جستجوی معنایی در صفحات بازیابی موتورهای جستجو می‌توان مشاهده کرد، نمایش‌های پیشرفته از نتایج است.

گوگل و جستجوی معنایی

گوگل پروژه تحقیقاتی بود که در ژانویه ۱۹۹۶ توسط لری پیج و سرگئی برین دو دانشجوی دکترای دانشگاه استنفورد در کالیفرنیا رقم خورد. هدف آن‌ها از این پروژه دستیابی به اطلاعات مرتبط به هم از میان انبوهی از اطلاعات موجود در کامپیوتر بود. گوگل به مدت ۱۵ سال مشغول فعالیت بوده و در تمام این مدت سعی در توسعه بزرگ‌ترین بانک اطلاعات دانش را داشت و با وجود چنین گراف دانش عظیمی و طراحی الگوریتم هوشمند هامینگ برد در سال ۲۰۱۳ وارد مرحله جدیدی از جستجو و بازیابی اطلاعات شد که با دنیای وب معنایی مطابقت داشته و فرآیند جستجوی معنایی را میسر نمود. آنچه مسلم است گوگل موتور جستجوی معنایی خالصی نیست اما در الگوریتم‌های عملکردی خود امکان جستجوی معنایی را میسر نموده است که به ارائه نتایج مرتبط‌تر و مفیدتر منجر می‌شود (John,2012). در واقع گوگل از زمان عرضه نخستین الگوریتم خود، به کاربران وعده داده بود سؤالاتشان را به بهترین نحو ممکن پاسخ دهد ولی مشکل این بود که گوگل تنها کاربر را به وب‌سایت‌هایی که ممکن بود شامل پاسخ سؤال باشد هدایت کند؛ اما با طراحی الگوریتم هامینگبرد سعی بر این قرار گرفت که سؤال را به صورت کامل درک و هضم کند و پاسخ اصلی سؤال را در اختیار کاربر قرار دهد. این‌که شرکت گوگل با ترکیب چه فناوری و استراتژی درصدد توسعه جستجوی معنایی است مخفی نگه داشته شده است اما می‌توان بر اساس وضعیت و توانایی گوگل در جستجوی معنایی مفروضاتی را در نظر گرفت (Ysasi,2016). چندین قرارداد وجود دارد که گوگل از گذشته تاکنون در فرآیند جستجوی خود به کار گرفته و دال بر نقش معنا در پردازش سؤالات جستجوی آن است. بعضی از این قراردادها و اطلاعات مرتبط با آن عبارت‌اند از:

  1. تعیین موجودیت اصلی در یک جستجو: گوگل موجودیت موجود در یک جستجو را تشخیص داده و مقوله و اصطلاحات مرتبط با آن موجودیت را نیز شناسایی می‌کند. این تکنیک به ایجاد پایگاه داده معنایی موجودیت‌ها و ارتباط اصطلاحات مرتبط با آن کمک می‌کند.

  1. الگوها یا قالب‌های تکمیل پرس و جوی تعاملی: این تکنیک به ما کمک می‌کند تا نقش قالب‌های تکمیل پرس‌وجو را در هنگام پردازش سؤال شناسایی کنیم. این به کاربر کمک می‌کند تا سؤال کامل را به‌وسیله تشخیص طبقه اطلاعات مرتبط با کلمات جستجوی جزئی شناسایی کند و سؤال کامل را بر اساس سؤال جزئی وارد شده توسط کاربر نمایش دهد.
  2. شناسایی مترادف بر اساس اصطلاحات هم‌جوار: این تکنیک مفاهیم پنهان استفاده از مترادفات منتخب را با توجه به سؤال کاربر آشکار می‌کند. گوگل ممکن است سؤال کاربر را با نزدیک‌ترین اصطلاح مترادف همخوان با سؤال جایگزین کند.
  3. گراف دانش بر اساس سیستم جستجو: این تکنیک مدل‌های گراف دانش و نقش آن در بازیابی نتایج جستجو بر اساس تشخیص معنایی موجودیت‌ها و ارتباط آن‌ها را بحث می‌کند.
  4. خودآموزی موتور جستجوی معنایی: این تکنیک امکانات مرتبط با توسعه و ساخت نمایه معنایی و استفاده از آن برای برگشت پاسخ به سؤال کاربر را بحث می‌کند. نمایه به‌طور مرتب روز آمد شده تا نتایج معنایی تری را به همراه داشته باشد.
  5. شناسایی بخش‌های جستجو از طریق سؤالات: گوگل به طبقه‌بندی اصطلاحات چندگانه موجود در پرسش کاربر می‌پردازد. این واحد معنایی دسته‌ای از نتایج مرتبط را بر اساس واحد معنایی بالقوه شناسایی می‌کند.
  6. استفاده از شبکه معنایی برای توسعه شبکه اجتماعی: یک سیستم اجتماعی با استفاده از شبکه‌های رایج و علایقِ کاربران ایجاد می‌شود. شبکه‌های اجتماعی مرتبط از نظر معنایی ممکن است برای شناسایی علایق رایج کاربران و برای تولید نتایج جستجوی مرتبط استفاده شود (Bhattacharya, ۲۰۱۴).

نقش گراف دانش گوگل

 تمام سؤالات مرتبط با یک موجودیت نیاز به دانش خاصی جهت پردازش دارد. به همین دلیل گوگل از مدت‌ها قبل سیستمی برای پردازش موجودیت‌ها به کار گرفته که گراف دانش نامیده می‌شود. شرکت گوگل از سال ۲۰۱۲ گراف دانش خود را بر اساس ۳.۵ میلیارد داده مرتبط با ۵۰۰ میلیون موجودیت را ایجاد کرد. قبل از توسعه گراف دانش و ارتباط الگوریتم هامینگ برد با آن، گوگل بر اساس تحلیل‌های آماری و متنی سؤالات جستجو را پردازش نموده و با دنیای واقعی موجودیت‌ها ارتباط آن‌ها با یکدیگر کاری نداشت. گراف دانش به سازمان‌دهی داده‌های مرتبط با موجودیت‌ها می‌پردازد که این موجودیت می‌تواند مکان، سازمان، ورزش، تیم، شخص و. باشد. منظور از گراف دانش گوگل نیز نمایش گرافیکی اطلاعات مرتبط با یک موجودیت یا سؤال است که در قالب یک کارت اطلاعات در ابتدای نتایج جستجو نمایش داده می‌شود. در واقع وقتی موتور جستجوی گوگل سؤالی دریافت می‌کند که در پایگاه دانش ان موجود است، پانلی در سمت راست نتایج جستجو که حاوی کلیه اطلاعات مرتبط با پرسش کاربر است از قبیل، تصویر، حقایق مهم و جستجوهای مرتبط و لینک‌هایی برای جستجوی بیشتر موضوع را نمایش می‌دهد (Saini,2012).

پردازش معنایی سؤال جستجو توسط گوگل

نقش کلیدواژه‌های در پرسش کاربر بعد از ابداع الگوریتم هامینگ برد به پایان رسید. به‌عبارتی‌دیگر مثل گذشته کلیدواژه‌های پرسش کاربر نقش پراهمیتی در پردازش جستجو ندارد. سؤال وارد شده توسط کاربر به کمک متغیرهای معنایی و الگوریتم هامینگ برد مورد پردازش قرار می‌گیرد و نه بر اساس تطابق کلیدواژه‌های ظاهر شده در صفحات وب. پردازش پرسش کاربر در محیط هامینگ برد چندین لایه از فیلتر داده‌ها را شامل می‌شود تا پرسش به درستی غربال شده و صحیح‌ترین نتیجه ممکن به کاربر ارائه شود. امروزه گوگل به مطابقت مفهوم پرسش و معنای واقعی آن با محتوای صفحات وب می‌پردازد و همین امر دقت بازیابی صفحات مرتبط را افزایش می‌دهد و صفحاتی بازیابی می‌شود که اگر چه دقیقاً حاوی کلید واژهای موجود در سؤال کاربر نیست اما از نظر مفهومی کاملاً مرتبط است.

با گسترش سؤالات محاوره‌ای کاربران مشتاق پرسش از گوگل هستند و انتظار دریافت پاسخ سریع دارند. به همین دلیل گوگل به توسعه سیستمی برای شناسایی آدرس محلی کاربران و یا تاریخچه جستجوهای گذشته کاربران برای ارائه نتایج مرتبط‌تر پرداخته است و حتی پاسخ‌ها را با توجه به پروفایل کاربر در گوگل پلاس به صورت اختصاصی‌تر ارائه می‌دهد. داده‌هایی که گوگل برای محاسبه و ارائه نتایج مرتبط با سؤال کاربر استفاده می‌کند فوق‌العاده زیاد است. ابتدا لازم است که گوگل به شناسایی منابعی بپردازد که معتبر است و سپس به پردازش سؤالات قبلی پرداخته تا پاسخ دقیق به پرسش کاربر ارائه دهد. گوگل از اعتماد کاربران به نتایجی که ارائه می‌دهد به خوبی آگاه است و به همین خاطر باید قبل از ارائه نتایج صد در صد از صحت نتایج قبل از ارائه به کاربر مطمئن شود. در محیط جستجوی معنایی گوگل موجودیت‌ها، ارتباطات، هم استنادی، امتیاز به صحت مطالب و شخصی‌سازی مدنظر قرار داده می‌شود. بعضی از مهم‌ترین فاکتورهایی که گوگل در پردازش معنایی سؤالات کاربر مدنظر قرار می‌گیرند عبارت‌اند از:

  1. ردیابی آدرس IP کاربران: گوگل در واقع آی پی تک‌تک کاربران خود را ردیابی نموده تا مرتبط‌ترین نتایج را بر اساس محل زندگی آن‌ها ارائه دهد.
  2. بازسازی پرسش به منظور پالایش و شفاف‌سازی آن: گوگل در شفاف‌سازی و پالایش سؤال کاربر بسیار قدرتمند است. گوگل با اضافه کردن مترادفات، حذف کلیدواژه‌های ممنوع، جایگزین کردن کلمات با غلط املایی و. به خوبی پرسش کاربر را پالایش می‌کند.
  3. شناسایی موجودیت‌ها: گوگل موجودیت‌های ارائه شده در سؤال کاربر را با توجه به گراف دانش متناظر با آن شناسایی می‌کند. به‌عنوان‌مثال در سؤال «پایتخت کشور هند کجاست؟»، گوگل به راحتی موجودیت اصلی این پرسش که «هند» است را با توجه به گراف دانش متناظر تشخیص می‌دهد.
  4. تشخیص الگوها و مطابقت دادن آن‌ها با هم: در پرسش مطرح شده مثال قبل، گوگل الگویی که منجر به تشخیص دهلی به عنوان پایتخت هند است را تشخیص می‌دهد و گراف دانش آن دهلی را به عنوان پاسخ پرسش ارائه می‌دهد و همین الگو برای پاسخ سریع به سؤالات مشابه استفاده می‌کند.
  5. جمع‌آوری داده از تاریخچه جستجو: گوگل داده‌هایی را از تاریخچه جستجوی کاربر به دست می‌آورد که برای قضاوت در مورد صحت نتایج به کار می‌گیرد.
  6. پیدا کردن منابع معتبر و مطمئن: گوگل معمولاً بر منابع مطمئن مثل ویکی‌پدیا برای ارائه نتایج خود تکیه دارد.
  7. نمایش نتایج نهایی: گوگل نتایج نهایی را که غالباً پاسخ مستقیم به پرسش است در قالب کارت اطلاعات و به همراه مجموعه‌ای از نتایج ارائه می‌دهد ((Bhattacharya, ۲۰۱۴.

بعضی از مظاهر جستجوهای معنایی گوگل که توسط کاربر قابل مشاهده است عبارت‌اند از:

  1. جستجوی محاوره‌ای و نتایج آن

همان‌طور که گفته شد یکی از ویژگی‌های جستجوی معنایی گوگل، جستجوی محاوره است که با استفاده از آیکون میکروفون کوچکی که در گوشه سمت راست کادر جستجوی گوگل تعبیه شده، امکان‌پذیر است. در صورتی که کاربر بر روی میکروفون کلیک کند، می‌تواند سؤال خود را به جای تایپ با صدای بلند بپرسد. بدین ترتیب سؤال موردنظر به همراه نتایج آن بر روی صفحه‌نمایش نقش می‌بندد (شکل دو)

شکل ۲. جستجوی محاوره‌ای گوگل

چنانچه پاسخ سؤال درون گراف دانش گوگل موجود باشد، کارت اطلاعات (information card) مخصوصی با داده‌های مرتبط به سؤال، به همراه لیستی از سایت‌های حاوی اطلاعات تکمیلی و یا پاسخ اصلی سؤال، نمایش داده می‌شوند.

  1. تصحیح خودکار غلط املایی
  2. اطلاعات نمایش داده شده در قالب تصویر و یا کارت اطلاعاتی

گوگل به کمک الگوریتم هامینگبرد و گراف دانش خود، پاسخ سؤال را در قالب کارت اطلاعات می‌گنجاند و آن را در بخش بالا یا سمت راست صفحه نتایج نمایش می‌دهد.(شکل ۳)

شکل ۳. نمایش نتایج جستجو گوگل در قالب کارت اطلاعات

گوگل از بیش از ۲۰۰ فاکتور رتبه‌بندی استفاده می‌کند و از عوامل بسیاری برای به دست آوردن بهترین نتیجه استفاده می‌کند. آخرین پیشرفت‌ها در یادگیری ماشینی نیز به توسعه جستجوی معنایی کمک زیادی کرده است و باعث شده که اساساً به‌صورت مستقل عمل کند و مرتب به بهبود نتایج کمک نماید. به‌عنوان‌مثال جستجویی با این عنوان «قطعات چمن‌زنی» در موتور جستجوی گوگل صورت می‌گیرد. طبق جستجوی غیر معنایی یا همان جستجوی سنتی، نتایج این جستجو شامل صفحه‌ای از نتایج است که تنها حاوی این کلمات است بدون توجه به مفهوم اصلی و منظور واقعی جستجوگر (Rashid, WasifNisar, 2016).

اما در نتایج حاصل از جستجوی معنایی، نمایش و نتایج به‌گونه‌ای دیگر است. بهینه‌ساز موتورهای جستجوی معنایی نتایج را بر اساس تمام فاکتورها و یا عوامل ممکن نمایش می‌دهند و نه تنها بر اساس سه کلیدواژه موجود در عبارت جستجو. آنچه در موتور جستجوی معنایی گوگل هنگام وارد کردن جستجو رخ می‌دهد(Patel, 2017):

  • بررسی میلیون‌ها جستجو با همین عبارت
  • بررسی یادگیری ماشینی گوگل
  • بررسی روند فصلی تأثیرگذار بر جستجو
  • بررسی رفتار جستجوگر
  • بررسی روند جستجو که مخصوص به محل زندگی جستجوگراست؟ اگر از منطقه‌ای این جستجو صورت می‌گرفت که مردم آن تنها می‌توانستند دستگاه چمن‌زنی خود را تعمیر کنند، نتیجه متفاوتی دریافت می‌شد؟!
  • بررسی تاریخچه جستجوی کاربر: گوگل متوجه خواهد شد که جستجوگر در گذشته دستگاه چمن‌زنی خود را تعمیر کرده است و در نتیجه جستجو به‌گونه‌ای متفاوت صورت خواهد گرفت

تمام موارد بالا در جستجوی معنایی گوگل مورد توجه است. در واقع برای مثال ذکر شده باید گفت، گوگل بالغ بر ۱۰ سال داده‌های مربوط به جستجوی «قطعات چمن‌زنی» را جمع‌آوری کرده است. بر همین اساس گوگل می‌داند که علاقه به این پرسش طبق فصول مختلف سال در نوسان است و به میزان بارش و شروع فصول مختلف مرتبط است (شکل ۴).

شکل ۴. تحلیل زمانی گوگل از پرسش کاربران

همچنین گوگل طبق داده‌های جمع‌آوری شده در این مدت می‌داند که در کشورهای امریکا، ایرلند و کانادا این پرسش بیشتر از سایر کشورها صورت گرفته است (شکل ۵).

شکل ۵. تحلیل مکانی گوگل از پرسش کاربران

همچنین گوگل می‌داند که مردم به دنبال برندهایی از دستگاه چمن‌زنی هستند که مربوط به دستگاه شخصی خودشان است (شکل ۶).

شکل ۶. تحلیل‌های مرتبط دیگر با پرسش کاربر

همچنین گوگل می‌داند که میزان جستجوی عبارت «تعمیر دستگاه چمن‌زنی» کمتر از عبارت «قطعات چمن‌زنی» است. همچنین گوگل می‌داند که از سال ۲۰۰۵ تعداد جستجو برای کلمه «تعمیر» نسبت به کلمه «قطعات» افزایش یافته است. در واقع مردم اخیراً بیشتر کلمه «تعمیر» را جستجو می‌کنند (شکل ۷).

شکل ۷. تحلیل گوگل از کلیدواژه‌های جستجوی کاربر در طی زمان

و به این ترتیب هر بایت داده به طریقی ردیابی می‌شود که قبلاً نمایه شده و بر همین اساس بهترین پاسخ را ارائه دهد؛ و در آخر باید گفت که قدرت جستجوی معنایی در این واقعیت نهفته است که به جای جمع‌آوری وب‌سایت‌های مرتبط با کلیدواژه‌های جستجوگر، بهترین وب‌سایت‌ها که بیشتری ارتباط معنایی را با شرایط جستجوگر دارد ارائه دهد.

بحث و نتیجه‌گیری

در جستجوی معنایی منظور نظر کاربر و داده‌های وی هر دو در جستجو مورد توجه قرار می‌گیرد. در جستجوی معنایی، بهترین پاسخ و نتیجه جستجو گزینه‌هایی نیست که شامل تعداد زیادی کلیدواژه مطابق با سؤال جستجوگر است، بلکه بهترین و مرتبط‌ترین نتیجه، وب‌سایتی است که با منظور جستجوگر مطابق است و این نکاتی است که گوگل در فرآیند جستجوی خود اعمال می‌کند. تغییرات الگوریتمی گوگل در ۱۰ سال اخیر، جستجوی آن را معنایی تر نموده است (Amerland,2013). با این حال باید گفت که گوگل تنها تکنولوژی‌های معنایی را استفاده می‌کند اما هنوز یک موتور جستجوی معنایی کامل نیست (Midwinter,2007). درحالی‌که موتورهای جستجوی معنایی با استفاده از معنا شناختی یا علم معنایی در زبان برای تولید نتایج جستجوی بسیار مرتبط عمل می‌کنند گوگل از الگوریتم رتبه‌بندی مثل پیج رنک[۳] برای پیش‌بینی ربط استفاده می‌کند.

گوگل از پردازش زبان طبیعی استفاده نمی‌کند اما این مانعی برای تولید بعضی از تکنولوژی‌های تغییر وب نیست. البته پردازش زبان طبیعی از مظاهر وب ۴ است درحالی‌که معنا و جستجوی معنایی در وب ۳ مطرح است. با تمام این احوال فهم معنای واقعی عبارت جستجو، درک بافتی که کلمات در آن استفاده می‌شوند و ارتباط بین آن‌ها، وعده‌ای است که فناوری مبتنی بر وب معنایی نوید آن را داده است و گوگل این امر مهم را به نحو احسن انجام می‌دهد (دری، ۱۳۸۶). گفته می‌شود که اطمینان منجر به شهرت می‌شود و به دنبال آن صلاحیت و شایستگی را به همراه دارد. این سه در ایجاد اعتبار یک برند نقش اساسی دارند. جستجوی معنایی نیز به هر سه این موارد نیاز دارد تا به درستی عمل کند. گوگل و مکانیسم آن به گونه است که هر سه این موارد را به خوبی فراهم نموده است (Amerland,2013).

پانویس:
[۱] Guha & et al
[۲] Conversational search
[۳] Page rank

References

  1. Kumar, B. T. S., & Pavitha, S.M.(2010). Evaluating the searching capabilities of the search engines and meta search engine: A comparative study. Annals of Library and information studies, 57, 87-97.
  2. Andago, M., Phoebe, P.L., Bassam A.M & Thanoun (2010). Evaluation of semantic search engine against a keyword search engine using first 20 precisions. International Journal for the advancement of science & Art, 1(2), 55-63
  3. Shadgar B, Asare A, Haratian Nejad A(1389). Semantic web: concepts and technique. Tehran: Armaghan. 14 P. [In Persian]
  4. Dori R(1386). Comparison and Assess semantic motor engine. Research and Information Processing and Management, 30(2), 467-487[In Persian]
  5. Patel N(2017). Everything you need to know about semantic search and what it means for your website. Retrieved July 2017. Retrieved from: https://www.crazyegg.com/blog/everything-about-semantic-search
  6. Rashid.J, WasifNisar, M.(2016). A study on semantic searching, semantic search engines and technologies used for semantic search engines. Information technology and computer science, 10, 82-89. Retrieved from: https://www.researchgate.net/publication/308800002_A_Study_on_Semantic_Searching_Semantic_Search_Engines_and_Technologies_Used_for_Semantic_Search_Engines
  7. Jacob A.(2002) Ontology and semantic web. Translated by Sheikh Shoai F. Book Quarterly. 64. 189-194
  8. Google`s Hummingbird Algorithm: The Entity search Revolution(2017). Retrieved from: http://www.searchmetrics.com/knowledge-base/hummingbird/
  9. John.T(2012).What is Semnatic search and how it works with google search. Retrieved from: http://www.techulator.com/resources/5933-What-Semantic-Search.aspx
  10. Ysasi,E(2016).What is Google`s semantic search. Retrieved from: https://www.theleverageway.com/blog/google-semantic-search/
  11. Bhattacharya. J (2014). How Google processes queries in a semantic web environment. Retrieved from: https://ahrefs.com/blog/google-processes-queries-semantic-web-environment/
  12. Amerland, D (2013). Google semantic Search, 50-52. Retrieved from: ptgmedia.pearsoncmg.com/images/9780789751348/samplepages/0789751348.pd
  13. Midwinter P(2007). Is google a semantic search engine? Retrieved from: https://readwrite.com/2007/03/26/is_google_a_semantic_search_engine/
  14. Saini, Sushil Kumar(2012). Role of Knowledge Graph and Artificial intelligence in future Robotics and Google’s Semantic search. Retrieved from : http://www.techulator.com/resources/6132-Role-Knowledge-Graph-Artificial.aspx

مترجم: فاطمه زرمهر

مشخصات استناددهی به این مقاله
نویسنده‌(ها): فاطمه زرمهر
عنوان مقاله: گوگل و جستجوی معنایی: آیا گوگل یک موتور جستجوی معنایی است؟
عنوان مجله: کتابدار ۲.۰ – (عنوان لاتین: Kitābdār-i 2.0)
دوره مجله(Vol): ۷
شماره مجله(Issue): ۱
سال(Year): ۱۴۰۰
شناسه دیجیتال(DOI):
لینک کوتاه: http://lib2mag.ir/12357
Download PDF

درباره ی فاطمه زرمهر

دانشجوی دکتری علم اطلاعات و دانش شناسی دانشگاه اصفهان

پاسخ دهید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *