در ماه اکتبر سال ۲۰۱۹، گوگل یک بار دیگر الگوریتم جدیدی به نام BERT را معرفی کرد. این الگوریتم جدید جزء راهبردهای نوین گوگل محسوب میشود و میتوان آن را تا حدی مشابه با الگوریتم رنک برین در نظر گرفت.
برای توضیح مختصر درباره رنک برین، بگوییم که این الگوریتم توجه به تلاش مخاطب را دارد و با در نظر گرفتن محل زندگی، سوابق جستجوهای قبلی و سایر فاکتورها، نتایج نهایی را به کاربر ارائه میدهد. اما الگوریتم BERT با استفاده از هوش مصنوعی بهبودهایی در این زمینه ایجاد کرده است و میتوان آن را به عنوان یک تکمیل کننده موثر برای الگوریتم رنک برین در نظر گرفت.
رسالت الگوریتم برت (Bert)
اگر بخواهیم به زبان ساده الگوریتم BERT را توضیح دهیم، میتوان گفت که این الگوریتم یک مدل زبان محاورهای و روزمره است که به سایر الگوریتمهای گوگل کمک میکند تا حتی جزئیات کوچکتر زبان محاوره، مانند حروف اضافه، را مانند یک انسان به خوبی درک کنند.
تعریف آکادمیک الگوریتم برت (Bert)
الگوریتم BERT، یک مدل پردازش زبان طبیعی (NLP) است که گوگل را در درک بهتر زبان انسانی و ارائه نتایج دقیقتر و متناسبتر با هدف کاربران یاری میکند.
در چند سال اخیر، گوگل بر روی یک پروژه متن باز به نام BERT کار کرده است. این پروژه، یک الگوریتم جدید با همین نام را به وجود آورده است. نام BERT مخفف عبارت Bidirectional Encoder Representations from Transformer میباشد، اما توجه به این معنا در حوزه کاری عمومی کمک زیادی نمیکند. بهتر است بر روی درک نحوه عملکرد این الگوریتم تمرکز کنیم.
گوگل همواره در تلاش بوده است تا معانی جملات جستجوی کاربران را به دقت درک کند، اما این کار با چالشهایی مواجه بوده است. مکالمات بین انسانها به دلیل استفاده متفاوت از حروف اضافه، فعل، فاعل، و لهجههای گوناگون بسیار پیچیده است. در مقابل، الگوریتمها و ماشینها مشکلات زیادی دارند تا معنای کلی جملات را درک کنند.
تا قبل از معرفی BERT، گوگل تلاش میکرد با تجزیه و تحلیل کلمات جداگانه در جواب جستجو، نتایج نزدیک به هدف کاربران را نمایش دهد. اما با معرفی BERT، توانایی درک متن به صورت مفهومی و کلی بهبود یافته است.
در نهایت، BERT به گوگل این امکان را میدهد که با بهبود در درک زبان ما، کوئریهای کاربران را با دقت بیشتری تحلیل کند و نتایج مناسبتری ارائه دهد. این الگوریتم مبتنی بر شبکه عصبی بوده و در زمینه پردازش زبان طبیعی (NLP) کاربرد دارد.
پردازش زبان طبیعی (NLP)
پردازش زبان طبیعی یکی از حوزههای هوش مصنوعی است که به بررسی تعاملات بین رایانه و انسان از طریق زبان طبیعی میپردازد. هدف اصلی این حوزه، خواندن، رمزگشایی، فهم و درک زبان انسان با استفاده از روشهای پیشرفته است. اکثر روشهای پردازش زبان طبیعی بر اساس تکنیکهای یادگیری ماشین مبتنی هستند.
کامپیوترها با استفاده از پردازش زبان طبیعی میتوانند با انسانها به زبان خودشان ارتباط برقرار کنند، حرف آنها را فهم، تحلیل و قسمتهای مهم آن را مشخص نمایند. امروزه، ماشینها قادرند حجم زیادی از دادههای متنی را در زمان کمتری نسبت به انسان تحلیل کنند. علاوه بر این، رایانهها از اشتباهات و دیدگاههای متعصبانه دور هستند. تصاویرهای پردازش زیادی که روزانه در شبکههای اجتماعی تولید میشوند، موجب نیاز به استفاده از پردازش زبان طبیعی شده است.
چالش زبان طبیعی
فهم چگونگی تطابق کلمات با ساختار و معنا، به یک زمینه مطالعاتی در حوزه زبانشناسی اطلاق میشود. درک زبان طبیعی یا به اختصار NLP (Natural Language Processing)، به مقاله اصلی تورینگ که بیش از ۶۰ سال پیش نگاشته شد و تعریف اصطلاحات مرتبط با هوش مصنوعی و شاید حتی قبل از آن، بازمیگردد.
این زمینه جذاب با چالشهایی روبروست که بسیاری از آنها به ماهیت مبهم زبان، به ویژه ابهام واژگانی، مرتبط هستند. تقریباً هر کلمه در زبان انگلیسی میتواند معانی متعددی داشته باشد. این چالشها به طور طبیعی در زمینههای مختلف اطلاعاتی گسترش مییابد، زیرا موتورهای جستجو تلاش میکنند تا در پرسشهای نوشتاری و گفتاری کاربران، هدف مورد نظر را با توجه به نیازهای اطلاعاتی آنها تفسیر کنند.
ابهام واژگانی
در زبانشناسی، ابهام به مراتب فراتر از سطح کلمه در یک جمله واقع میشود. کلماتی که دارای چندین معنی هستند، فهم جملات و عبارات مبهم را باعث پیچیدگی بیشتر میکنند. “ابهام بزرگترین موانع در حوزه دانش محاسباتی است و این مسئله تهدیدی جدی برای همه پردازشهای زبان طبیعی به حساب میآید.” به عنوان مثال، برخی کلمات در زبان فارسی دارای دو معنی هستند که در زبان انگلیسی نیز همین موضوع صدق میکند. همچنین واژههایی که املای یکسان دارند اما معانی متفاوتی دارند، یا در انگلیسی به شیوههای مختلف هجی میشوند اما هم صدا هستند، این ابهامات را تشدید میکنند.
بهینه سازی سایت برای الگوریتم برت (Bert)
برت یک الگوریتم هوش مصنوعی است که به طور مداوم در حال یادگیری میباشد. تنها کاری که شما میتوانید انجام دهید، واقعاً برای کاربر نهایی مطلبی بنویسید. برای موفقیت در بهینهسازی، شما باید دیدگاه خود را نسبت به کلمات و عبارات کلیدی تغییر دهید. زمین بازی دیگر تغییر یافته است و استفاده از تکنیکهای قدیمی بیفایده است.
در روش قدیمی سئو، کارها برای بهینهسازی سایت به این شکل انجام میشد:
- پیدا کردن کلمات کلیدی
- تکرار آنها در عنوانها و متن
اما حالا باید به مفهومی که کاربر به دنبال آن است توجه کنید. هرچه دقیقتر به دنبال جستجوهای کاربر باشید، موفقتر خواهید شد. خوشبختانه، این موضوع باعث کاهش استفاده بیش از حد از کلمات کلیدی یا همان “keyword stuffing” میشود.
یکی از ویژگیهایی که الگوریتم برت به خوبی انجام میدهد، پیشبینی هدف جستجوی کاربر با درصد خطای کم است. این یعنی اگر شما یکی از کلمات عبارتی را اشتباه تایپ کنید اما بقیه کلمات یک مفهوم را نشان دهند، گوگل به درستی منظور شما را درک میکند و در نتایج نشان میدهد. به عنوان مثال، زمانی که کیبورد شما انگلیسی است و شما میخواهید به زبان فارسی سرچ کنید ولی به اشتباه انگلیسی تایپ کنید، گوگل به درستی درک میکند و نتیجه سرچ شما را به شما نشان میدهد، همانطور که در ذهن شما بوده است!
علت خاص بودن الگوریتم برت (Bert)
برت دارای چند ویژگی خاص است که آن را برای جستجو و وظایف پردازش زبان طبیعی منحصر به فرد میکند و جهان را به عنوان یک پایگاه تحقیقاتی برای این حوزه بزرگ کرده است. این ویژگیها عبارتند از:
۱. دوجهته بودن:
برت اولین مدل زبان طبیعی کاملاً دوجهته است، به این معنا که یک کلمه میتواند با توسعه جمله به معنای واقعی کلمه تغییر کند. این ویژگی به نحوی است که شما میتوانید همزمان تمام کلمات یک جمله را ببینید و درک کنید چگونه همه کلمات تأثیر متقابلی بر یکدیگر دارند. برت توانایی دارد همزمان به هر دو جهت یک کلمه مورد نظر و تمام جمله را بررسی کند، به گونهای که میتواند کل جمله را، هم چپ و هم راست از یک کلمه هدف، در نظر بگیرد.
۲. رمزگذار:
برت با استفاده از یک رمزگذار قدرتمند، اطلاعات را به یک فضای برداری تبدیل میکند که این امر به بهترین شکل از ویژگیهای مهم متن برای مدل بهرهمند میشود.
۳. نمایش:
برت توانایی نمایش متن را با استفاده از ویژگیهای خاص و حساس به مفاهیم بهبود داده است.
۴. تبدیلکنندهها:
برت از تبدیلکنندههای مختلفی استفاده میکند که ویژگیهای متن را به فرمتهای مناسب تر برای مدل تبدیل میکنند.
چگونه موتورهای جستجو زبان را یاد می گیرند؟
چگونه موتورهای جستجو میتوانند این زبانها را درک و متوجه شوند و هدف کاربران را نمایش دهند؟ در زبانشناسی محاسباتی، این ایده را که کلمات با معانی مشابه یا وابستگی به یکدیگر دارند، همزمانی نامیده میشود. به عبارت دیگر، آنها تمایل دارند که در جملات، پاراگرافها یا متون مجاور به یکدیگر قرار بگیرند، که این مسئله به نام “زبانشناسی فرثی” شناخته میشود.
زبانشناسی فرثی به مطالعه روابط و همزمانی واژهها میپردازد و ریشههای آن معمولاً به دهه ۱۹۵۰ با زبانشناس جان فرث بازمیگردد. در این زمینه، کلمات و مفاهیمی که در فضاهای مجاور متن با هم زندگی میکنند، مشابه یا به هم مرتبط هستند، مورد مطالعه قرار میگیرند. به عنوان مثال، کلمات “اتوبوس” و “ماشین” که در خانواده وسایل نقلیه قرار دارند.
هرچند که موتورهای جستجو و زبانشناسان محاسباتی پیشرفتهای زیادی داشتهاند، رویکردهای بدون نظارت و نیمه نظارتی مانند Word2Vec و Google Pygmalion هنوز محدودیتهایی دارند که اجازه کامل برای درک مقیاس زبان انسان را نمیدهند.
مقایسه الگوریتم برت (BERT) با الگوریتم مام (MUM)
الگوریتم BERT برای درک مقصود کاربر با استفاده از کلمات یک عبارت معرفی شده است. اما نمیتواند از کوئریهای قبلی گوگل که توسط کاربران جستجو شده، کمک بگیرد. برت در کنار تمام مزایایی که دارا بود، بسیاری از عوامل مهم را در جستجو نادیده میگرفت و باعث ایجاد موانع زبانی، عدم شناسایی محتوای مبتنی بر تصویر، ویدیو و بسیاری از مسائل دیگر شد. این در حالی است که MUM برای دریافت پاسخ سوالات پیچیده با جستجوهای کمتر طراحی شده است. این الگوریتم میتواند تصاویر، فایلهای صوتی و تصویری را درک کند.
برای آشنایی بیشتر و درک عمیق تری از الگوریتم مام (MUM) می توانید به مقاله آن مراجعه کنید.
سوالاتی درباره الگوریتم برت (Bert)
آیا الگوریتم برت (Bert) تأثیری در سئو دارد؟
این سوال به صورت قطعی قابل پاسخ نیست؛ اما توصیه میشود بر روی ایجاد محتوای متناسب با جستجوهای کاربران تمرکز کنید تا در نتیجه جستجوهای گوگل بهتر دیده شوید.
آیا الگوریتم برت (Bert) همان اپدیت رنک برین است؟
با وجود تفاوتهای ماهیت هوش مصنوعی بین برت و رنک برین، مقایسه زیادی انجام میشود. هرچند BERT به عنوان یک پیشرفت در زمینه هوش مصنوعی توسط گوگل معرفی شده است، اما ارتباط مستقیمی با رنک برین ندارد. بهترین رویکرد این است که این دو الگوریتم را به عنوان مکمل به یکدیگر در نظر بگیریم.
آیا این الگوریتم تغییری در مفهوم بازاریابی محتوا ایجاد میکند؟
با پیشرفت در درک گوگل از زبان، ما میتوانیم محتوای ارزشمندتری برای کاربران ایجاد کنیم. این به این معناست که با تولید محتوا برای کاربران و در زبان آنها، نگرانی از اینکه گوگل حرکت ما را درک نکند، نخواهیم داشت.
الگوریتم برت (Bert) برای چه زبانهایی فعال است؟
گوگل ابتدا اعلام کرده که این مدل تنها برای کوئریهای زبان انگلیسی فعال است، اما در آینده قرار است برای تمامی زبانهای دنیا، از جمله زبان فارسی، قابل استفاده باشد.
جمع بندی
اگر بخواهیم به یک خلاصه کلی از الگوریتم برت برسیم، باید توجه داشته باشیم که با توجه به الگوریتمهای جدید گوگل، تلاش کنیم تا محتوایی که به کاربران میآید، دارای کیفیت و مطابق با کلمات کلیدی متناسب با جستجوهای آنان باشد. امتیاز بیشتر در گوگل به معنای ضرورتاً داشتن محتوای طولانی نیست، بلکه محتوایی که تمام نکات سئو و الگوریتمها را رعایت کند، میتواند امتیاز بیشتری از گوگل دریافت کند. بنابراین، نیازی به ادامه روند گذشته که در آن به دنبال محتوای طولانی، استفاده اضافی از کلمات کلیدی، یا تلاش برای به حداقل رساندن سبز شدن چراغ افزونه باشیم، وجود ندارد.
بهتر است تمرکز خود را بر روی تولید محتوایی که به کاربران مفید و جذاب باشد، قرار دهیم. تمامی الگوریتمهای گوگل، از جمله الگوریتم برت، به منظور بهبود درک هدف کاربر و سادهتر شدن دسترسی به اطلاعات آماده شدهاند. بنابراین با رعایت این نکات، میتوانیم محتوای خود را به بهترین شکل در دسترس همهی کاربران جهان قرار دهیم.