آیا ChatGPT جایگزین جستجوی Google خواهد شد؟

نسرین نیک‌نژاد

دسته‌بندی نشده. ۱۴۰۱/۱۱/۲۲ .12 دقیقه مطالعه

احتمالاً شما هم با شروع سال ۲۰۲۳، در مورد ChatGPT شنیده‌اید، چت ربات مجهز به GPT-3 (از لحاظ فنی ۳.۵) که به طرز وحشتناکی قادر به شبیه‌سازی پاسخ‌های شبیه به انسان است. به‌عنوان‌مثال، این پرسش‌وپاسخ ایجاد شده توسط GPT-3 را در نظر بگیرید:

برای اطلاعات بیشتر می‌توانید مقاله «ChatGPT چیست و چرا یادگیری آن لازم است؟» را مطالعه نمایید.

آیا ChatGPT مثل موتور جستجو عمل می‌کند؟
خیر،ChatGPT یک موتور جستجو نیست. بلکه یک چت‌بات هوش مصنوعی است که از پردازش زبان طبیعی برای درک و پاسخ به ورودی کاربر استفاده می‌کند.

همان‌طور که می‌بینید، این جواب چندان هم بد نیست، و به نظر می‌رسد چیزی شبیه به جواب یک انسان واقعی باشد.

GPT یک سیستم یادگیری عمیق (Generative Pre-training Transformer) است که متنی را بر اساس پیش‌بینی الگوهای زبان پس از آموزش با مجموعه‌ای از اسناد تولید می‌کند. به طور مثال، این مقاله، با کمک Playground OpenAI و مدل «GPT-3 text-davinci-003» استفاده شده است که می‌تواند برای تولید پاسخ‌های کوتاه‌تر نیز برنامه‌ریزی شود و از ChatGPT بتا قابل‌اعتمادتر است.

مدل‌های فعلی واقعاً چشمگیر هستند، از جمله تجزیه سؤالات پیچیده:

چگونه ChatGPT را برای یک کودک ۵ساله توضیح می‌دهید؟
ChatGPT مانند یک دوست روباتی است که می‌تواند با شما صحبت کند و به سؤالات شما پاسخ دهد. مانند داشتن دوستی که در مورد چیزهای مختلف، اطلاعات زیادی دارد و می‌تواند به شما در یادگیری موضوع‌های جدید کمک کند.

GPT حتی می‌تواند خلاقیت انسان را تقلید کند و ما را وادار کند استعدادهای خود را زیر سؤال ببریم:

شعاری برای رستورانی با مضمون مریخ که توسط مارمولک‌ها اداره می‌شود، به سبک ادگار آلن‌ بنویس.

مارمولک‌های مریخ، اینجا با لذت غذا بخورید، جایی که در رؤیاها به روی شما باز می‌شوند و خوشی‌ها به نمایش در می‌آیند!

تاکنون، احتمالاً ده‌ها نمونه از این موارد را دیده‌اید، بنابراین همه این‌ها چه ربطی به جستجوی Google و مشاغل ما به‌عنوان بازاریاب جستجو دارد؟

گوگل و عصر زبان طبیعی

در روزهای اولیه سرچ کردن‌ها، موتورهای جستجو برای فهرست‌کردن کلمات و عبارات کوتاه ساخته شده بودند و توانایی پردازش زبان طبیعی را نداشتند. اگر به دنبال یک لپ‌تاپ جدید هستید، ممکن است چیزی مانند «لپ‌تاپ» یا «خرید لپ‌تاپ» را جستجو کنید. شاید کمی خنده‌دار به نظر برسد؛ اما اگر وارد مجتمع تجاری شوید و فقط شروع به فریادزدن «لپ‌تاپ» کنید، احتمالاً توسط نیروهای امنیتی بازداشت می‌شود.

همه ما با پیچیده‌تر شدن جستجو، یاد گرفتیم که می‌توانیم از جستارهای پیچیده‌تر نیز استفاده کنیم، و به‌ویژه با ظهور جستجوی صوتی، چیزی نزدیک‌تر به زبان طبیعی را آزمایش کردیم. همان‌طور که گوگل تطبیق پیدا کرد، اتفاق جالبی افتاد: سؤالات ما به شکل دیگری گرفت و گوگل متوجه شد که گاهی اوقات ما لینکی به یک منبع نمی‌خواهیم؛ بلکه تنها پاسخ می‌خواهیم.

گوگل به‌عنوان «موتور پاسخ» بسیار تکامل‌یافته است، از جمله ایجاد نمودار دانش و نمایش نتایج وب به‌عنوان پاسخ‌های مستقیم به نام Featured Snippets. برای مثال، اگر «جستجوی Google چگونه کار می‌کند؟» را جستجو کنید، ممکن است یک جواب ویژه مانند متن زیر را دریافت کنید:

این مثال خاص کمی بد است، اما نحوه عملکرد الگوریتم را نشان می‌دهد. گوگل به دنبال اسناد و مدارکی است که ممکن است به این سؤال پاسخ دهد. در این مورد، بدیهی است که متن استخراج شده واقعاً پاسخ کاملی نیست.

اکنون، همان سؤال مطرح شده در مورد GPT-3 را در نظر بگیرید:

جستجوی گوگل چگونه کار می‌کند؟

جستجوی گوگل با خزیدن در وب و نمایه‌سازی وب‌سایت‌ها کار می‌کند. وقتی کاربر چیزی را جستجو می‌کند، گوگل فهرست آن را بررسی می‌کند و مرتبط‌ترین نتایج را برمی‌گرداند. از ترکیبی از الگوریتم‌ها و تکنیک‌های دیگر برای تعیین ارتباط نتایج استفاده می‌کند. این الگوریتم‌ها عواملی مانند کلمات استفاده شده در پرس‌وجو، تازگی محتوا، محبوبیت وب سایت و موقعیت مکانی کاربر را در نظر می‌گیرند.

ما می‌توانیم این پاسخ را دقیق‌تر دریافت کنیم، درواقع پاسخ بسیار کامل‌تری از گزیده‌ای از یک وب‌سایت. موتور GPT-3 اساساً چندین منبع را خلاصه کرده است.

به‌راحتی می‌توان فهمید که چگونه می‌توان باعث عصبی شدن گوگل شود.

اعتماد و مشکل انتساب در موتورهای جستجو

در ظاهر، GPT-3 و به‌خصوص ChatGPT می‌تواند پاسخ‌های بسیار شبیه به انسان را ارائه دهد. با کنارگذاشتن سؤالات اخلاقی (از جمله سرقت ادبی)، مشکلات عملی جدی وجود دارد.

پاسخ گوگل یک مزیت مهم دارد: انتساب. به‌راحتی می‌توانیم به صفحه منبع برویم. این موضوع نه‌تنها اطلاعات بیشتری را در اختیار ما قرار می‌دهد، بلکه زمینه بیشتری از جمله جزئیات مربوط به خود منبع را فراهم می‌کند. این جزئیات می‌تواند به ما کمک کند به پاسخ اعتماد کنیم (یا در برخی موارد، بی‌اعتماد شویم).

برای مثال، پاسخ دیگری را در نظر بگیرید که GPT-3 برای سال بالا جواب داده است:

جستجوی گوگل چگونه کار می‌کند؟

جستجوی گوگل با استفاده از ترکیبی از الگوریتم‌ها و برنامه‌ها برای تجزیه‌وتحلیل محتوای صفحات وب و سایر محتوای آنلاین برای تعیین ارتباط آن با عبارت جستجوی کاربر کار می‌کند. الگوریتم‌های جستجوی گوگل به دنبال عوامل مختلفی هستند، از جمله تراکم کلمه کلیدی، تازگی و تعداد سایت‌های دیگری که به صفحه لینک می‌دهند. گوگل همچنین از هوش مصنوعی و یادگیری ماشینی برای بهبود نتایج جستجوی خود استفاده می‌کند.

این پاسخ نیز محتمل به نظر می‌رسد، با این تفاوت که اکثر سئوکاران با ذکر چگالی کلمات کلیدی که به طور گسترده یک افسانه در نظر گرفته می‌شود، متعجب می‌شوند. کاملاً ممکن است که این بخش از اطلاعات از منبع کاملاً متفاوتی آمده باشد، اما بدون ذکر منبع، نمی‌توانیم آن را تأیید کنیم.

درحالی‌که این یک مشکل پیچیده است (متن تولید شده توسط ماشین از منابع به همان روشی که انسان استفاده می‌کند استفاده نمی‌کند، یا ممکن است از ده‌ها یا صدها منبع استفاده کند)، در واقع با این روش تعداد منابع را کاهش می‌دهد و انتساب هرکدام را ارائه می‌دهد.

این پاسخ از Neeva، یک موتور جستجوی جایگزین و متمرکز بر حریم خصوصی است «آیا باید یک ماگ بلند با لاته بگیرم یا یک قهوه گراند؟» را در نظر بگیرید:

درحالی‌که این عملکرد در نسخه بتا است و واضح است که در مقیاس Google عمل نمی‌کند، Neeva تلاش می‌کند منابع اولیه را ارائه دهد. ما عمداً یک مثال خنده‌دار انتخاب کرده‌ایم، زیرا ریسک‌ آن کم است. سؤالی را دقیقاً در آنچه Google قلمرو YMYL (پول شما، زندگی شما) می‌نامد، تصور کنید، مانند «آیا بیت‌کوین بهتر است یا دوج‌کوین؟»

این سؤالی است که می‌تواند آینده مالی ما را به‌طورجدی تحت‌تأثیر قرار دهد و دانستن اینکه پاسخ از کجا می‌آید تفاوت بزرگی ایجاد می‌کند و به ما این امکان را می‌دهد تا عمیق‌تر بگردیم و یا اعتماد کنیم و یا آن منابع را رد کنیم.

موضوع اعتماد به یک موضوع عمیق‌تر از این حرف‌هاست، در واقع آیا متن تولید شده توسط ماشین نوعی سرقت ادبی است یا خیر. درحالی‌که سرقت ادبی سنتی به‌طورکلی نیاز به هدف و کپی‌کردن تکه‌های قابل‌توجهی از متن دارد، متن تولید شده توسط ماشین از نوشته‌های نویسندگان و سازندگان محتوا ساخته می‌شود، بدون اینکه حداقل در مورد ChatGPT هیچ‌گونه انتساب واضحی وجود نداشته باشد. در مورد Google، استفاده بیش از حد از متن تولید شده توسط ماشین، می‌تواند تولیدکنندگان محتوا را دلسرد کند و ما را به این سؤال وادار کند که آیا می‌خواهیم تلاش‌های خود را برای شخص دیگری انجام دهیم یا خیر.

توهمات و رؤیاهای ماشینی

بدون محدودیت‌های دقیق، سیستم‌های یادگیری ماشینی مستعد متوهم شدن هستند. در مورد ChatGPT، این اساساً به این معنی است که این سیستم می‌تواند پاسخ‌هایی تولید کند که ریشه در واقعیت ندارند. به زبان ساده، ChatGPT چیزی را که می‌گوید نمی‌فهمد؛ بلکه بر اساس الگوهای جدیدی بر اساس زبان انسان ایجاد می‌کند. سؤال زیر را که برای GPT-3 مطرح کردیم در نظر بگیرید:

Mozart’s 1976 hit “The Fast and the Furious: Tokyo Drift درباره چیست؟
Mozart’s 1976 hit “The Fast and the Furious: Tokyo Drift به فیلمی به همین نام در سال ۲۰۰۶ مربوط نمی‌شود. این قطعه‌ای ساز است که انرژی دیوانه‌کننده خیابان‌های توکیو در شب را به تصویر می‌کشد. این آهنگ حول یک خط پیانوی جذاب و هماهنگ و یک ریتم رانندگی و شاداب ساخته شده است.

درحالی‌که این جواب جذاب است، اما چنین قطعه‌ای وجود ندارد. ما یک سؤال مزخرف پرسیده‌ایم و GPT-3 به ما پاسخی بیهوده داده است.

باید اشاره کنیم که ChatGPT در حال حاضر دارای محدودیت‌هایی است که مشکلاتی ازاین‌قبیل را برطرف می‌کند و مدل‌های پیچیده از جمله رابط GPT-3 OpenAI به شما این امکان را می‌دهند محدودیت‌های کمتری داشته باشید، اما مشکل اصلی جای دیگری است .

باز هم یک سؤال مالی با ریسک بالاتر را در نظر بگیرید:

کدام پول دیجیتالی محبوب‌تر است: Dogecoin، Bassetcoin یا Norwegianlundehundcoin؟
دوج‌کوین باارزش بازار فعلی بیش از ۹ میلیارد دلار محبوب‌ترین در بین این سه پول دیجیتالی است Bassetcoin و Norwegianlundehundcoin سکه‌های بسیار کوچک‌تری هستند که ارزش بازار هرکدام تنها چند صدهزار دلار است.

ارزش بازار چند صدهزار دلاری هرکدام برای دو ارز دیجیتال (تا لحظه نگارش این مقاله) وجود ندارند. متأسفیم که می‌گوییم این مثال را با Labradoodlecoin شروع کردیم، فقط برای اینکه کشف کنیم که Labradoodlecoin واقعاً وجود دارد.

ما موتور جستجو را برای اثبات یک نکته در اینجا فشار می‌دهیم و متن‌های تولید شده توسط ماشین نسبت به جواب‌های قبلی، کمتر پاسخ توهمی می‌دهند. بااین‌حال، هرزمان که چندین منبع را بدون توجه به صحت یا کامل‌بودن آنها ترکیب کنید، این خطر واقعی وجود دارد که نتیجه نهایی مزخرف اما به نظر منطقی باشد.

مقیاس و اینترنت بلادرنگ

این موضوع کاملاً ساده است: آنچه در مقیاس بتا کار می‌کند ممکن است در مقیاس Google کار نکند. همان‌طور که مرحوم بیل اسلاوسکی اشاره کرد، فقط به این دلیل که گوگل یک ایده دارد یا حتی یک ایده را ثبت اختراع می‌کند، به این معنی نیست که آنها آن ایده را در موتور جستجو پیاده‌سازی می‌کنند.

موضوع دیگر سرعت اینترنت است. ChatGPT بر روی یک پیکره ثابت آموزش داده می‌شود. یک‌لحظه در زمان. گوگل خیلی سریع اینترنت را کرال و ایندکس می‌کند و می‌تواند اطلاعاتی را که اخیراً، بومی‌سازی شده و حتی شخصی‌سازی‌شده‌اند را برگرداند.

شایان‌ذکر است که گوگل مبالغ هنگفتی را برای یادگیری ماشین سرمایه‌گذاری کرده است. LaMDA گوگل (مدل زبانی برای برنامه‌های گفتگو) قادر به تولید متن پیچیده و شبیه انسان است. گوگل به‌خوبی از محدودیت‌ها و هزینه‌های این مدل‌ها آگاه است.

درحالی‌که موضوع سوگیری بسیار فراتر از محدوده این مقاله است، مقیاس نیز به مسائل سوگیری کمک می‌کند. هنگامی که از یک پیکره ایستا و کنترل‌شده عبور می‌کنید و مدل‌های یادگیری ماشین را به کل دنیای محتوای بلادرنگ باز می‌کنید، تعصبات انسانی به‌سرعت وارد می‌شوند (از جمله نژادپرستی، جنسیت گرایی، همجنس‌گراهراسی، و سایر سوگیری‌های مخرب). در مقیاس گوگل، کاهش سوگیری مشکلی است که نیاز به دخالت و منابع انسانی زیادی دارد.

کد قرمز و تهدیدات آینده

هیچ‌کدام از اینها به این معنی نیست که Google GPT از جمله ChatGPT را جدی نمی‌گیرد. گویا گوگل پس از ویروسی شدن ChatGPT یک «کد قرمز» صادر کرد. درحالی‌که گوگل به طور قابل‌درک در مورد واکنش‌های داخلی خود ساکت است، تقریباً مطمئن است که تحولات اخیر باعث تسریع بحث‌ها و تحولات در Mountain View شده است.

تهدید واضح دیگر این است که مایکروسافت یک سرمایه‌گذار (به میزان ۱ میلیارد دلار) در OpenAI و همراه با آن ChatGPT است و شایعاتی مبنی بر اینکه ممکن است میلیاردها دلار بیشتر سرمایه‌گذاری کنند را منتشر می‌کند. مایکروسافت همچنین اعلام کرده است که قبل از پایان ماه مارس، ChatGPT را در جستجوی Bing آغاز خواهد کرد، اگرچه مشخص نیست که از این عرضه اولیه چه‌قدر طول خواهد کشید.

یکی از بزرگ‌ترین تأثیرات بلندمدت مدل‌هایی مانند ChatGPT و LaMDA در جستجوی مکالمه (، جستجوی صوتی) خواهد بود. مکالمه زیر را با ChatGPT در نظر بگیرید:

پنج SUV سه ردیفه برتر کدام‌اند؟
دشوار است که بگوییم پنج شاسی‌بلند سه ردیفه برتر کدام‌اند زیرا می‌تواند ذهنی باشد و به عواملی مانند ترجیحات شخصی، بودجه و مکان بستگی دارد. بااین‌حال، برخی از SUVهای سه ردیفه که اغلب جزو بهترین‌های ردیف خود محسوب می‌شوند عبارت‌اند از:
Honda Pilot
Toyota Highlander
Kia Telluride
Hyundai Palisade
Subaru Ascent

کدام یک از آنها ارزان‌تر است؟
از بین پنج خودروی شاسی‌بلندی که نام بردیم، Subaru Ascent با قیمت اولیه حدود ۳۲۲۹۵ دلار ارزان‌ترین قیمت را دارد. سایر شاسی‌بلندهایی که به آنها اشاره کردیم قیمت اولیه حدود ۳۲۰۰۰ تا ۳۸۰۰۰ دلار دارند. بااین‌حال، مهم است که توجه داشته باشید که قیمت نهایی بسته به سطح تمیز بودن و گزینه‌هایی که انتخاب می‌شود می‌تواند متفاوت باشد.

آیا سوبارو قابل‌اعتمادتر است؟
سوبارو عموماً به‌عنوان یک خودرو قابل‌اعتماد در نظر گرفته می‌شود و بسیاری از مدل‌های آن از نظر قابلیت اطمینان، نمره بالایی دریافت کرده‌اند. به‌ویژه Subaru Ascent به‌عنوان یک وسیله نقلیه قابل‌اعتماد با فضای داخلی راحت و مصرف سوخت خوب، شهرت دارد. طبق گزارش Consumer Reports، Ascent امتیاز قابلیت اطمینان بالاتر از حد متوسط را دریافت می‌کند.

با عرض پوزش، ChatGPT قطعاً می‌تواند چت شود (و این نسخه ویرایش شده است). به سؤالات بعدی توجه کنید و اینکه چگونه نیازی به تکرار اطلاعات نداشتیم ChatGPT متوجه شد که ما می‌خواهیم از پاسخ‌های قبلی استفاده کنیم.
درحالی‌که این مدل همه موارد استفاده از جستجو را ارائه نمی‌کند، قطعاً موقعیت‌هایی وجود دارد که توانایی اصلاح آسان و مکالمه یک پرس‌وجو می‌تواند چالش‌برانگیز باشد، به‌خصوص برای سؤالات پیچیده، و البته، خریدهای پیچیده! تصور کنید گوگل بتواند در هر مرحله از این سفر به سمت خرید، تبلیغات مختلفی را ارائه دهد.
متأسفانه، بزرگ‌ترین تهدید کوتاه‌مدت این فناوری برای گوگل است که مردم و شرکت‌ها احتمالاً از ChatGPT برای تولید محتوای بی‌کیفیت استفاده می‌کنند و این برای گوگل هزینه و زمان می‌برد و احتمالاً منجر به به‌روزرسانی‌های الگوریتم‌های واکنشی می‌شود. علاوه بر این، این موضوع یک دردسر جدی برای بازاریابان جستجو خواهد بود که باید به این به‌روزرسانی‌ها واکنش نشان دهند.
چیزی که در سال ۲۰۲۳ حتمی است این است که محبوبیت ChatGPT و دسترسی به آن برای عموم مردم باعث انفجار سرمایه‌گذاری و سرعت‌بخشیدن به توسعه آن می‌شود. درحالی‌که گوگل به جایی نمی‌رسد، می‌توانیم انتظار داشته باشیم که چشم‌انداز جستجو به روش‌های غیرمنتظره (و گهگاهی ناخواسته) در سال آینده تغییر کند.

منبع :