یکی از مشکلات اصلی موتورهای جستجو، نحوهی برخورد با سایتهایی است که محتوای دیگران را کپی کرده و بدون اجازه منتشر میکنند. برای مثال سایتهایی که با Torrent اجازهی دانلود غیرقانونی فیلم و سریالها را میدهند؛ یا سایتهایی محتواهای موسیقی و تصاویر مختلف را بدون اجازه منتشر میکنند، در این دستهبندی قرار میگیرند. گوگل برای مقابله با سایتهایی که حق کپیرایت را رعایت نمیکنند، از الگوریتم دزد دریایی (Google Pirate Algorithm) کمک میگیرد. این الگوریتم میتواند محتواهای کپی شده را شناسایی کرده و از فهرست نتایج حذف کند. در ادامه بیشتر دربارهی الگوریتم دزد دریایی گوگل صحبت میکنیم.
الگوریتم دزد دریایی گوگل چیست؟
یکی از مشکلات جدی موتورهای جستجو سایتهایی هستند که بدون رعایت حق کپیرایت اقدام به انتشار فیلمها، موسیقیها تصاویر و حتی محتوای متنی دیگران میکنند. برای مثال احتمال نام نرمافزار تورنت را شنیده باشید. تورنت یک نرمافزار کاربردی برای اشتراکگذاری و دانلود فایلها بهصورت همتا به همتا (P2P) است؛ اما برخی از سایتهای متخلف از این نرمافزار برای انتشار غیرمجاز فیلم و سریالها در بستر اینترنت استفاده میکنند.
گوگل برای اینکه در فهرست نتایج خود سایتهای لینکدهندهی تورنتی را نشان ندهد و همچنین با سایر وبسایتهای کپیکنندهی محتوا هم مقابله کند، سراغ الگوریتم Pirate رفته است. این الگوریتم بر پایه گزارشهای نقض قانون کپیرایت DMCA به گوگل کار میکند.
DMCA مخفف عبارت Digital Millennium Copyright Act بوده که با نام قانون حق چاپ هزاره دیجیتال در امریکا شناخته میشود. طبق این قانون صاحبان محتواهای دیجیتال، اگر محتوای تولیدی آنها توسط سایتها یا پلتفرمهای دیگر بدون اجازه کپی و منتشر شد، میتوانند به گوگل یا سایر پلتفرمها اطلاع دهند تا این محتوا را از بستر خود حذف کنند.
گوگل بر اساس همین گزارشهای DMCA الگوریتم دزد دریایی را طراحی کرده است. اگر وبسایت یا صفحهای چندین گزارش DMCA دریافت کند، گوگل به طور پیشفرض این سایت را بهعنوان متخلف شناسایی کرده و جریمه میکند. سطح این جریمهها البته برای سایتهای مختلف متفاوت است.
در کمترین حالت ممکن است گوگل محتوای سایتهای متخلف را به صفحات آخر گوگل تبعید کرده یا در بدترین حالت کل صفحات وبسایت و دامنهی آن را از سیستم رتبهبندی حذف کند.
الگوریتم دزد دریایی چرا و چطور ایجاد شد؟
قبل از اینکه گوگل از الگوریتم دزد دریایی رونمایی کند هم قانون DMCA وجود داشت. مطابق این قانون اگر سایت یا پلتفرمی برای صفحاتش اخطار DMCA دریافت میکرد، مجبور بود این صفحات را حذف کند؛ اما این مورد به تنهایی کافی نبود. همین مسئله باعث شد تا بسیاری از تولیدکنندگان فیلم در هالیوود و صنعتهای دیگر به موتورهای جستجو اعتراض کنند. برای مثال Ari Emanuel، مدیر شرکت سرگرمی و تبلیغات Endeavor یکی از آنها بود. متن زیر بخشی از اعتراض رسمی آری امانوئل به گوگل و سایر موتورهای جستجو در این رابطه است:
“I don’t want them to censor results, but they have a bunch of smart guys there that can figure this stuff out ….
Look, Google can filter and does filter for child pornography. They do that already. So stealing is a bad thing, and child pornography is a bad thing.”
«من نمیخواهم آنها نتایج را سانسور کنند، اما آنجا افراد باهوش زیادی دارند که میتوانند راهحلی برای این مسئله پیدا کنند… ببینید! گوگل همین حالا هم برای محتوای جنسی کودکان فیلتر میکند. دزدی کار بدی است و محتوای جنسی کودکان هم کار بدی است.»
در واقع بدون الگوریتم دزد دریایی، اگر وبسایتی اقدام به انتشار محتواهای کپی شده میکرد، پس از دریافت چندین اخطار DMCA صرفاً مجبور میشد یکی دو صفحهی سایتش را حذف کند؛ اما خود سایت همچنان باقی میماند و میتوانست باز هم سراغ محتواهای دیگری برود و با وعدهی رایگان بودن محتوا در گوگل یا سایر موتورهای جستجو رتبه بگیرد.
درنتیجه برای تولیدکنندههای محتوا (مثل فیلمسازها یا آهنگسازها) کار سختی بود که هر روز در فضای وب به دنبال صفحات کپیکننده باشند و گزارش DMCA برای آنها رد کنند. اینجا بود که گوگل به کمک تولیدکنندههای محتوا رفت و از الگوریتم Pirate رونمایی کرد.
آشنایی با تاریخچه الگوریتم دزد دریایی گوگل
گوگل اولین نسخهی الگوریتم Pirate را در سال ۲۰۱۲ رونمایی کرد. در آگوست ۲۰۱۲ گوگل اعلام کرد که میخواهد زینپس تعداد درخواستهای معتبر DMCA را بهعنوان یک فاکتور در الگوریتم خود لحاظ کند. هدف گوگل از این کار مقابله با سایتهایی بود که بارها گزارشهای نقض قانون کپیرایت دریافت کرده بودند؛ اما همچنان داشتند به فعالیت خودشان ادامه میدادند.
دومین نسخهی این الگوریتم در اکتبر ۲۰۱۴ و با نام Pirate 2.0 به طور رسمی منتشر شد. گوگل اعلام کرد که این نسخه عملکرد سختگیرانهتری خواهد داشت. پس از انتشار این نسخهی جدید سایتهایی مثل The Pirate Bay، IsoHunt، 1337x و Torrentz با کاهش شدید ترافیک روبرو شدند؛ این چهار سایت فیلمها، سریالها، کتابهای الکترونیک، موسیقیها و… را بهصورت لینکهای تورنت و بدون رعایت حق کپیرایت به اشتراک میگذاشتند و از معروفترین سایتهای تورنت در دنیا بودند.
از سال ۲۰۱۴ به بعد گوگل تا امروز دیگر الگوریتم دزد دریایی را آپدیت نکرده است؛ اما این الگوریتم همچنان فعال بوده و براساس گزارش تخلفهای دریافتی کارش را پیش میبرد. نکتهی مهم اینکه الگوریتم Pirate برخلاف سایر الگوریتمهای دیگر مثل الگوریتم پاندا یا پنگوئن یک الگوریتم «Real-time» نیست؛ اما بهصورت دورهای تخلفات DMCA وبسایتها ثبت شده و در سیستم رتبهبندی گوگل تاثیر میگذارند.
هدف از طراحی الگوریتم دزد دریایی توسط گوگل چه بود؟
گوگل به گفتهی خودش برای مقابله با سایتهایی که بارها تخلف DMCA برای آنها ثبت میشد سراغ استفاده از الگوریتم دزد دریایی رفت. توضیح زیر از وبلاگ خود گوگل کمی بیشتر دربارهی این الگوریتم و هدف شکلگیری آن توضیح میدهد:
“Has someone filed a large number of DMCA “takedown” requests against your site? If so, look out. There’s a new penalty that may cause you to rank lower in Google’s search results. It joins other penalties (also called “filters” or “updates”) such as “Panda” and “Penguin.” We’re dubbing this one the “Pirate Update” as it’s aimed at copyright piracy.”
«اگر تعداد زیادی درخواست حذف DMCA برای سایت شما ثبت شده باشد، ممکن است با جریمهای جدید روبهرو شوید؛ که باعث کاهش رتبه سایت در نتایج جستجوی گوگل میشود. این جریمه به جمع فیلترهایی مانند «پاندا» و «پنگوئن» اضافه شده و ما آن را «بهروزرسانی دزد دریایی» مینامیم؛ چون هدف آن مقابله با نقض قانون کپیرایت است.»
این توضیح نشان میدهد که هدف گوگل در درجهی اول مقابله با نقض قانون کپیرایت یا همان قانون حق چاپ هزار دیجیتال بوده است. اگر بخواهیم ریزتر به لیست اهداف گوگل بپردازیم، میتوانیم به موارد زیر هم اشاره کنیم:
- حذف یا کاهش رتبهی سایتهایی که به طور مکرر گزارشهای DMCA دریافت میکردند.
- پاسخ بهتر به شکایات DMCA دریافتی توسط تولیدکنندگان محتوا.
- حمایت از تولیدکنندگان محتوا در سطح وب با جلوگیری از انتشار و دیده شدن محتواهای کپی شده.
- جلوگیری از تکرار جستجوهایی که باعث بیشتر دیده شدن سایتهای غیرقانونی میشدند.
اگرچه گوگل همواره حامی کاربران بوده است، اما در الگوریتم دزد دریایی سعی کرده تا خودش را سمت تولیدکنندگان محتوا قرار دهد و از آنها حمایت کند؛ چون فضای وب بدون حضور تولیدکنندگان محتوا فاقد ارزش است و بهمرور در سراشیبی سقوط قرار میگیرد.
تاثیر الگوریتم دزد دریایی در سئو چه بود؟
برای اینکه تاثیر جریمه الگوریتم دزد دریایی روی سئو سایت را ببینید، باید سری به صفحهی گزارش شفافیت گوگل بزنید. در این صفحه گوگل لیست گزارشهای دریافتی برای حذف محتواهای کپی شده را نشان میدهد. طبق آمار این فهرست گوگل تا امروز بیش از ۱۲ میلیارد گزارش DMCA دریافت کرده است؛ تعداد دامنههایی که گزارش دریافت کردهاند هم به عدد ۵ میلیون و ۶۱۵ هزار دامنه میرسد.
البته این آمار به معنای حذف یا جریمه شدن تمامی دامنههای لیست شده نیست؛ اما نشان میدهد که بحث کپی شدن محتوا در فضای وب چقدر گسترده است. به همین دلیل گوگل در سال ۲۰۱۲ تصمیم گرفت از الگوریتم مجزایی برای فیلتر کردن این نتایج استفاده کند.
طبق آمار منتشر شده، رونمایی گوگل از دومین نسخهی الگوریتم دزد دریایی باعث شد تا ترافیک برخی از سایتهای کپیکننده بیش از ۹۸ درصد کاهش پیدا کند. برای مثال سایتهای تورنت بخش زیادی از ترافیکهای خودشان را از دست دادند. همین مسئله هم باعث شد تا کسبوکار این سایتها تقریباً از بین برود.
اگر برای سایتی گزارش DCMA اشتباه رد شود، چه اتفاقی میافتد؟
نگرانی خیلی از صاحبان کسبوکار این است که گزارشهای حق کپیرایت اشتباه برای آنها رد شود و الگوریتم دزد دریایی آنها را به مشکل بیندازد؛ اما توجه داشته باشید که گوگل در توضیحات خود اعلام کرده فقط گزارشهای «معتبر» را مورد پذیرش قرار میدهد. این یعنی گوگل برای بررسی محتواهای کپی شده سازوکار مشخصی دارد. در نتیجه حتی اگر برای صفحات سایتتان گزارشی هم ارسال شود، شخص گزارشدهنده باید مدارک مناسبی برای اثبات حرف خودش داشته باشد؛ در غیر این صورت به این گزارشهای ترتیب اثر داده نخواهد شد.
نکتهی دیگر اینکه خود گوگل در توضیحات این الگوریتم اعلام کرده هیچ صفحهای را بدون بررسی حذف نخواهد کرد؛ همچنین فقط صفحاتی حذف خواهند شد که درخواست حذف آنها توسط صاحبان و ناشران رسمی محتوا ارائه شده باشد.
مورد بعدی اینکه گوگل برای سایتهایی که صفحات آنها حذف شده یا جریمه میشوند هم حق اعتراض را قائل شده است. درنتیجه اگر اخطار DMCA دریافت کردید، میتوانید به آن اعتراض کنید. گوگل هم تا زمان رسیدگی شدن به این اعتراض صفحهی شما را دوباره به فهرست ایندکسهای خود برمیگرداند.
اخطارهای DMCA گوگل در سرچ کنسول برای صاحبان وبسایتها ارسال میشود. همچنین یک لینک هم به سایت Lumen داده میشود که در آن میتوانید متن کامل اخطار را خوانده و به اطلاعات مربوط به شاکی هم دسترسی داشته باشید. سپس اگر احساس میکنید سایتتان به اشتباه هدف شکایت DMCA قرار گرفته، میتوانید به طور متقابل وارد عمل شوید و به این اخطار اعتراض کنید.
راهکارهای جلوگیری از جریمه الگوریتم دزد دریایی چیست؟
سادهترین راه برای جلوگیری از جریمه دزد دریایی رعایت قوانین حق کپیرایت در فضای وب است. اگر میخواهید دیده شوید، به جای کپی کردن محتوای دیگران، خودتان محتوا تولید کنید. هرچقدر محتوایتان یونیک بوده و طبق خواستههای کاربر باشد، شانس دیده شدنتان هم بیشتر میشود.
نکتهی مهم اینکه الگوریتم pirate تمرکز بیشتری روی محتواهای ویدیویی، تصویری، نرمافزاری، صوتی و فایلهای قابل دانلود دارد. پس حواستان باشد که از انتشار بدون اجازهی این موارد خودداری کنید.
نکتهی بعدی اینکه اگر سرچ کنسول دارید، میتوانید گزارشهای دریافتی DMCA علیه سایتان را ببینید. اگر اخطاری از گوگل دریافت کردید، نسبت به آن بیتفاوت نباشید. مشکل را بررسی کنید و در صورت نیاز شما هم درخواست اعتراضتان را برای گوگل بفرستید. یا اگر احساس میکنید مشکل از سمت خودتان است، در اسرع وقت صفحهای که اخطار دریافت کرده را حذف یا اصلاح کنید.
مورد بعدی اینکه اگر سایتتان امکان درج و انتشار محتوا توسط کاربران را دارد، نسبت به بازبینی محتوای کاربران حساستر باشید و محتواهای ناقض قانون را حذف کنید.
و در پایان اینکه از انتشار لینکهای دانلود غیرقانونی پرهیز کنید. اگرچه قانون کپیرایت در ایران چندان رعایت نمیشود، اما گوگل با کسی شوخی ندارد. حتی اگر خودتان فایلی را آپلود نکرده باشید، باز هم ممکن است الگوریتم دزد دریایی شما را جریمه کند.
سخن آخر
الگوریتم دزد دریایی گوگل با هدف مقابله با محتواهای کپی شده و غیرمجاز فعالیت میکند. این الگوریتم میتواند صفحات و سایتهایی که اقدام به انتشار محتواهای غیرقانونی میکنند را شناسایی کرده و آنها را از صفحهی نتایج جستجو حذف کند. اگر نمیخواهید توسط الگوریتم pirate جریمه شوید، بهتر است نسبت به انتشار محتواهای خود محتاطتر باشید. اگر سوال دیگری دربارهی این الگوریتم و جزئیات آن دارید، در کامنتها پاسخگوی شما هستیم.