تا قبل از اینکه از الگوریتم کافئین گوگل رونمایی شود، سرعت ایندکس صفحات وب بسیار کند بود؛ تا جایی که ایندکس برخی از سایتها با فاصلهی چند هفته یا چند ماه یکبار انجام میشد. این مسئله هم برای کاربران و هم وبسایتها مشکلساز بود. چون مثلاً اگر امروز اتفاقی رخ داده و منابع خبری آن را پوشش میدادند، ممکن بود تا چند روز یا چند هفته کاربران نتوانند از طریق گوگل به این منابع دسترسی داشته باشند.
گوگل در سال ۲۰۱۰ با انتشار پستی اعلام کرد که زینپس برای ایندکس صفحات وب از الگوریتم کافئین گوگل استفاده میکند. این الگوریتم صفحات وب را بهصورت موازی و در بخشهای کوچکی ایندکس صفحات را انجام میداد؛ به همین خاطر گوگل میتوانست در هر ثانیه صدها هزار صفحه را پردازش و ایندکس کند. این کار باعث شد تا سهم صفحات و مقالههای جدید در نتایج جستجو تا ۵۰ درصد بیشتر شود. این مقدمهای برای معرفی Google Caffeine algorithm بود. در ادامه با جزئیات بیشتری به بررسی تاثیر سرعت ایندکس گوگل با کافئین صحبت میکنیم.
الگوریتم کافئین گوگل چیست؟
موتور جستجوی گوگل شبیه یک کتابخانهی بزرگ است که اسناد وب را دستهبندی میکند. وقتی شما چیزی را جستجو میکنید، رباتهای خزندهی گوگل وارد دیتابیس خود (همان کتابخانهی بزرگ وب) میشوند و بهترین صفحاتی که متناسب با جستجوی شما باشند را به نمایش در میآورند.
این موتور جستجو برای دستهبندی اسناد وب تا قبل از سال ۲۰۱۰ از یک الگوریتم لایهای استفاده میکرد. در این الگوریتم گوگل فهرستی از سایتهای را دستهبندی کرده بود و برحسب اولویت و به شکل دورهای منابع آنها را بهروزرسانی میکرد. سایتهایی که در لایهی اصلی (بالایی) قرار داشتند، تقریباً هر چند هفته یکبار بهروزرسانی میشدند؛ اما مدتزمان بهروزرسانی مابقی لایهها گاهی بیشتر از یکی دو ماه بود.
این شکل از بهروز کردن منابع وب باعث میشد تا کاربران نتوانند به اطلاعات جدیدتر بلافاصله دسترسی پیدا کنند؛ برای مثال خیلی وقتها اخباری که منتشر میشد، زمانی به دست کاربر میرسید که دیگر بیات شده بود. گوگل برای حل کردن این مشکل سراغ الگوریتم کافئین (Caffeine algorithm) رفت و از این الگوریتم در تاریخ ۹ ژوئن ۲۰۱۰ رونمایی کرد. متن زیر را به نقل از وبلاگ developers.google بخوانید تا بیشتر با این الگوریتم آشنا شوید.
“With Caffeine, we analyze the web in small portions and update our search index on a continuous basis, globally. As we find new pages, or new information on existing pages, we can add these straight to the index. That means you can find fresher information than ever before—no matter when or where it was published.
Caffeine lets us index web pages on an enormous scale. In fact, every second Caffeine processes hundreds of thousands of pages in parallel.”
«در الگوریتم کافئین، ما وب را به بخشهای کوچکی تقسیم کرده و بهصورت مداوم و در سطح جهانی آن را تحلیل و ایندکس میکنیم. در نتیجه بهمحض یافتن صفحات جدید، یا اطلاعات تازه در صفحات موجود، میتوانیم آنها را مستقیماً به فهرست جستجو اضافه کنیم. این یعنی شما میتوانید به اطلاعاتی بهروزتر از همیشه دسترسی داشته باشید. (بدون توجه به زمان یا مکان انتشار آنها.)
الگوریتم کافئین به ما اجازه میدهد تا صفحات وب را در مقیاسی بسیار بزرگ فهرست کنیم. در واقع، این سیستم در هر ثانیه صدها هزار صفحه را بهصورت همزمان پردازش میکند.»
آشنایی با تاریخچه الگوریتم کافئین
گوگل تا قبل از کافئین از الگوریتمها و ساختارهای متفاوتی برای ایندکس کردن و کاوش در فضای وب استفاده میکرد. این الگوریتم درواقع نتیجهی یکی از بزرگترین بازطراحیهای زیرساختهای گوگل از سال ۱۹۹۸ بود. این کمپانی ابتدا در آگوست سال ۲۰۰۹ از نسخهی آزمایشی الگوریتم کافئین با نام Caffeine Preview رونمایی کرد؛ سپس از وبمسترها و سئوکارها خواست تا این نسخهی آزمایشی را تست کرده و به کارشناسان گوگل بازخورد بدهند.
تقریباً ۹ ماه بعد از رونمایی نسخهی اولیه، در ژوئن ۲۰۱۰ گوگل با انتشار پستی در صفحه googleblog به طور رسمی از انتشار این الگوریتم خبر داد. به گفتهی این مقاله، کافئین تقریباً ۱۰۰ میلیون گیگابایت فضای ذخیرهسازی را در یک پایگاه داده اشغال میکند و میتواند اطلاعات وب را با سرعت صدها هزار گیگ در روز پایش و ذخیره نماید.
همچنین طبق ادعای گوگل، الگوریتم Caffeine باعث شده تا سهم مقالههای جدید از صفحهی نتایج بیشتر از ۵۰ درصد باشد. به همین خاطر میتوان این الگوریتم را جزء مهمترین الگوریتمهای گوگل محسوب کرد.
چرا گوگل الگوریتم کافئین را معرفی کرد؟
کارشناسان گوگل در سال ۲۰۰۹ بهدرستی متوجه شده بودند که فضای اینترنت نسبت به سال ۱۹۹۸ تغییرات زیادی کرده است. طبق آمارها در زمانی که گوگل نخستین سیستم ایندکس خودش را راهانداز کرد، حدود ۲.۴ میلیون وبسایت وجود داشت و تعداد کاربران وب هم نهایتاً به ۱۸۸ میلیون نفر میرسید.
اما در سال ۲۰۰۹ سایتهای موجود در وب نزدیک به ۲۳۸ میلیون بودند! چیزی حدود ۱۰۰ برابر بیشتر نسبت به روزهای شروع. همچنین تعداد کاربران وب هم به ۱.۸ میلیارد نفر رسیده بود. با این سرعت رشد به نظر میرسید که الگوریتمهای قبلی برای پایش کردن صفحات وب دیگر کاربرد ندارند و باید سراغ یک سیستم ایندکس جدید رفت. اینجا بود که الگوریتم کافئین متولد شد.
گوگل به کمک Caffeine algorithm میتوانست هر روز نزدیک به ۱۰۰ها هزار گیگ اطلاعات را پایش کند. در نتیجه دیگر مهم نبود صفحات جدید در یک وبسایت منتشر میشوند؛ یا مربوط به وبلاگی ساده و یا حتی یک انجمن اینترنتی باشند. در هر صورت گوگل میتوانست بهسرعت این صفحات را ایندکس کرده و در دسترس مخاطبان قرار دهد.
به عقیدهی کارشناسان اگر گوگل سراغ الگوریتم جدیدی نمیرفت، خیلی زود قافیه را به سایر موتورهای جستجو میباخت و امروز سهم ۹۲ درصدی خودش از بازار موتورهای جستجو را نداشت.
الگوریتم کافئین گوگل چگونه کار میکند؟
همینطور که بالاتر هم اشاره کردیم، Google Caffeine algorithm یک سیستم فهرستگذاری یا همان indexing system است که بهصورت پیوسته و موازی کار میکند. این الگوریتم محتوای وب را به بخشهای کوچکتری تقسیم کرده و هر بخش را بهصورت مستقل و موازی با دیگر بخشها فهرستگذاری مینماید. در نتیجه به جای اینکه نیاز باشد ایندکس وبسایتها را به سبک قدیم و به شکل دورهای انجام دهد، میتواند هر بخش را بهمحض تغییر پردازش و ایندکس کند.
الگوریتم کافئین بیشترین سازگاری را با سایتهای پویا دارد. برای مثال مراکز خبری، شبکههای اجتماعی و انجمنهای اینترنتی از جمله وبسایتها و پلتفرمهایی بودند که نیاز به چنین الگوریتمی داشتند. این الگوریتم به گوگل اجازه میدهد تا نتایج جستجو را بسیار سریعتر، دقیقتر و تازهتر در اختیار کاربران قرار دهد.
الگوریتم Google Caffeine چه تاثیری روی رتبهبندی سایتها داشت؟
الگوریتم کافئین برخلاف سایر الگوریتمهای گوگل، مثل هیلتاپ، پیج رنک، پنگوئن و… یک الگوریتم بهینهسازی صفحهی نتایج نبود؛ گوگل فقط به این دلیل سراغ Google Caffeine رفت که الگوریتم فهرستگذاری خودش را بهروز کند. به همین خاطر وقتی این الگوریتم شروع به کار کرد، چندان تاثیری روی رتبهبندی سایتها نداشت.
البته سئوکارها و وبمسترها معتقدند این الگوریتم به طور غیرمستقیم روی صفحهی نتایج اثراتش را گذاشته است. به گفتهی وبلاگ گوگل هم این الگوریتم باعث شده تا بیش از ۵۰ درصد نتایج صفحه جستجو سهم صفحات جدید باشد. شاید به نظر برسد که این اتفاق باید روی ترافیک سایتهای قدیمی اثر منفی بگذارد؛ اما در واقع تمامی وبسایتها از این اتفاق سود میبرند. چون صفحاتشان زودتر ایندکس شده و در نتیجه سریعتر و بهتر دیده میشود.
الگوریتم کافئین همچنین به نفع کاربران هم بوده است. کاربران تا قبل از این الگوریتم، نمیتوانستند از طریق گوگل خبرهای روز دنیا را دنبال کنند؛ یا اگر محتوایی بهتازگی منتشر شده بود، هفتهها یا حتی ماهها زمان میبرد تا به دست کاربران برسد. الگوریتم کافئین اما باعث شد تا سرعت ایندکس شدن صفحات وب بالاتر برود و خبرها و پستهای جدید وبسایتها بهراحتی در دسترس کاربران قرار بگیرد.
مزایای الگوریتم کافئین چیست؟
حالا که تا اینجا آمدهایم، بد نیست دربارهی مزایای الگوریتم کافئین گوگل هم صحبت کنیم. مزایای زیر از جمله مهمترین مواردی هستند که میتوانیم به آنها اشاره کنیم:
- فهرستگذاری سریعتر و مداوم صفحات وب: تا قبل از این الگوریتم، گوگل وبسایتها را بهصورت دورهای و براساس اهمیت و اعتباری که داشتند ایندکس میکرد. با الگوریتم کافئین اما سرعت فهرستگذاری گوگل بسیار بالاتر رفت.
- دسترسی کاربران به خبرها و پستهای تازه: مزیت الگوریتم کافئین برای کاربران امکان دسترسی به جدیدترین محتواها بود. این مورد خصوصاً برای دسترسی به خبرهای روز اهمیت زیادی داشت.
- بهبود تجربه کاربری: نمایش نتایج بهروزتر باعث شد تا صفحهی SERP گوگل محتواهای دقیقتر، مرتبطتر و جدیدتری را به کاربران نشان دهد. تاثیر این اتفاق را میتوانید در سهم ۹۲ درصدی گوگل از بازار موتورهای جستجوگر ببینید.
- مقیاسپذیری بالا: طبق ادعای گوگل الگوریتم کافئین میتواند در هر ثانیه بیش از ۱۰۰ ها هزار صفحه را بهصورت موازی پردازش و ایندکس کند. فضای ذخیرهسازی این الگوریتم ۱۰۰ میلیون گیگابایت است.
- بهینهشده برای محتواهای پویا و بهروز: الگوریتم کافئین باعث شده تا سایتهای خبری، شبکههای اجتماعی، ویدئوها و پستهای وبلاگی بهتر و بیشتر دیده شوند.
- ایجاد زیرساخت برای توسعه: الگوریتم Caffeine بهنوعی یک زیرساخت مهم هم محسوب میشد. پس از آن بود که گوگل سراغ توسعهی سایر الگوریتمها رفت.
فاکتورهای موثر برای الگوریتم کافئین گوگل چیست؟
الگوریتم کافئین بر افزایش سرعت ایندکس شدن صفحات وب تمرکز دارد و به کیفیت محتوا و مواردی که به این بحث مربوط است، توجهی نمیکند. نکته اینجاست که سئوکارها و وبمسترها نیز میتوانند با آمادهسازی وبسایت، سرعت ایندکس شدن صفحاتشان را بالاتر ببرند. برای این کال لازم است با فاکتورهای موثر بر Google Caffeine algorithm آشنا باشید. از جمله این فاکتورها میتوان به موارد زیر اشاره کرد:
۱)تازگی محتوا
یکی از اهداف مهم در الگوریتم کافئین، سرعتبخشی به فرایند ایندکس شدن محتواهای جدید و بهروز شده است. پس اگر میخواهید توسط این الگوریتم بیشتر دیده شوید، بهتر است تمرکزتان را روی تولید محتوای جدید، آپدیت محتواهای قدیمی و هرس محتوا بگذارید. کافئین به نحوی طراحی شده که تمامی تغییرات محتوایی را رصد کرده و عمل فهرستگذاری خود را انجام دهد.
۲)سرعت بارگذاری صفحات وب
برای اینکه به خزندههای گوگل برای ایندکس کردن صفحات کمک کنید، باید روی افزایش سرعت بارگذاری صفحات تمرکز داشته باشید. این موضوع خصوصاً برای نسخههای موبایلی وب اهمیت بیشتری دارد.
۳)ساختار فنی مناسب وبسایت
سئوی تکنیکال یا همان سئوی فنی، روی سرعت ایندکس شدن صفحات وب تاثیر زیادی دارد و از فاکتورهایی است که روی الگوریتم کافئین هم اثرش را میگذارد. استفاده درست از تگها، تهیه سایت مپ، اصلاح URL صفحات، بهینهسازی فایل robots.txt و مواردی از این دست بخشی از سئوی تکنیکال هستند و روی سرعت ایندکس شدن صفحات تاثیر میگذارند. قبلاً در مقالهی «سئوی تکنیکال چیست؟» به طور مفصل دربارهی این موضوع صحبت کردهایم.
۴)لینکسازی داخلی و خارجی
داشتن استراتژی مشخص برای لینکسازی داخلی صفحات و تعیین تکلیف برای صفحات یتیم، میتواند سرعت ایندکس شدن وبسایتتان را بالاتر ببرد؛ چون رباتهای خزندهی گوگل از طریق لینکهای داخلی صفحات جدید را شناسایی کرده و ایندکس میکنند.
لینکسازی خارجی هم روی دیده شدن بهتر سایتتان تاثیر میگذارد. اگر لینکهای مرتبط و باکیفیتی کسب کنید، گوگل راحتتر به وبسایتتان اعتماد میکند؛ در نتیجه سرعت ایندکس کردن صفحاتتان را بالاتر میبرد.
۵)نرخ بهروزرسانی صفحات سایت
افزایش سرعت انتشار محتواهای جدید، بهمرور باعث افزایش بودجهی خزش وبسایتها میشود. البته مهمتر از افزایش سرعت انتشار، داشتن یک نظم و تقویم محتوایی مشخص است. این کار به رباتهای خزنده کمک میکند تا سریعتر و راحتتر صفحات جدید سایتتان را ایندکس کنند.
سخن آخر
گوگل از سال ۲۰۱۰ برای افزایش سرعت ایندکس کردن صفحات سراغ الگوریتم کافئین رفت. این الگوریتم به طور مستقیم روی رتبهبندی صفحات و سئوی سایت تاثیر نمیگذارد؛ اما یکی از الگوریتمهای مهم گوگل است. به همین دلیل اگر میخواهید سئوی سایتتان را شروع کنید، لازم است با فاکتورهای تاثیرگذار روی کافئین گوگل و سازوکارش آشنا باشید. اگر سوال دیگری دربارهی این الگوریتم دارید، در کامنتها پاسخگوی شما هستیم.