آیا ChatGPT جایگزین جستجوی Google خواهد شد؟
احتمالاً شما هم با شروع سال ۲۰۲۳، در مورد ChatGPT شنیدهاید، چت ربات مجهز به GPT-3 (از لحاظ فنی ۳.۵) که به طرز وحشتناکی قادر به شبیهسازی پاسخهای شبیه به انسان است. بهعنوانمثال، این پرسشوپاسخ ایجاد شده توسط GPT-3 را در نظر بگیرید:
برای اطلاعات بیشتر میتوانید مقاله «ChatGPT چیست و چرا یادگیری آن لازم است؟» را مطالعه نمایید.
آیا ChatGPT مثل موتور جستجو عمل میکند؟
خیر،ChatGPT یک موتور جستجو نیست. بلکه یک چتبات هوش مصنوعی است که از پردازش زبان طبیعی برای درک و پاسخ به ورودی کاربر استفاده میکند.
همانطور که میبینید، این جواب چندان هم بد نیست، و به نظر میرسد چیزی شبیه به جواب یک انسان واقعی باشد.
GPT یک سیستم یادگیری عمیق (Generative Pre-training Transformer) است که متنی را بر اساس پیشبینی الگوهای زبان پس از آموزش با مجموعهای از اسناد تولید میکند. به طور مثال، این مقاله، با کمک Playground OpenAI و مدل «GPT-3 text-davinci-003» استفاده شده است که میتواند برای تولید پاسخهای کوتاهتر نیز برنامهریزی شود و از ChatGPT بتا قابلاعتمادتر است.
مدلهای فعلی واقعاً چشمگیر هستند، از جمله تجزیه سؤالات پیچیده:
چگونه ChatGPT را برای یک کودک ۵ساله توضیح میدهید؟
ChatGPT مانند یک دوست روباتی است که میتواند با شما صحبت کند و به سؤالات شما پاسخ دهد. مانند داشتن دوستی که در مورد چیزهای مختلف، اطلاعات زیادی دارد و میتواند به شما در یادگیری موضوعهای جدید کمک کند.
GPT حتی میتواند خلاقیت انسان را تقلید کند و ما را وادار کند استعدادهای خود را زیر سؤال ببریم:
شعاری برای رستورانی با مضمون مریخ که توسط مارمولکها اداره میشود، به سبک ادگار آلن بنویس.
مارمولکهای مریخ، اینجا با لذت غذا بخورید، جایی که در رؤیاها به روی شما باز میشوند و خوشیها به نمایش در میآیند!
تاکنون، احتمالاً دهها نمونه از این موارد را دیدهاید، بنابراین همه اینها چه ربطی به جستجوی Google و مشاغل ما بهعنوان بازاریاب جستجو دارد؟
گوگل و عصر زبان طبیعی
در روزهای اولیه سرچ کردنها، موتورهای جستجو برای فهرستکردن کلمات و عبارات کوتاه ساخته شده بودند و توانایی پردازش زبان طبیعی را نداشتند. اگر به دنبال یک لپتاپ جدید هستید، ممکن است چیزی مانند «لپتاپ» یا «خرید لپتاپ» را جستجو کنید. شاید کمی خندهدار به نظر برسد؛ اما اگر وارد مجتمع تجاری شوید و فقط شروع به فریادزدن «لپتاپ» کنید، احتمالاً توسط نیروهای امنیتی بازداشت میشود.
همه ما با پیچیدهتر شدن جستجو، یاد گرفتیم که میتوانیم از جستارهای پیچیدهتر نیز استفاده کنیم، و بهویژه با ظهور جستجوی صوتی، چیزی نزدیکتر به زبان طبیعی را آزمایش کردیم. همانطور که گوگل تطبیق پیدا کرد، اتفاق جالبی افتاد: سؤالات ما به شکل دیگری گرفت و گوگل متوجه شد که گاهی اوقات ما لینکی به یک منبع نمیخواهیم؛ بلکه تنها پاسخ میخواهیم.
گوگل بهعنوان «موتور پاسخ» بسیار تکاملیافته است، از جمله ایجاد نمودار دانش و نمایش نتایج وب بهعنوان پاسخهای مستقیم به نام Featured Snippets. برای مثال، اگر «جستجوی Google چگونه کار میکند؟» را جستجو کنید، ممکن است یک جواب ویژه مانند متن زیر را دریافت کنید:
این مثال خاص کمی بد است، اما نحوه عملکرد الگوریتم را نشان میدهد. گوگل به دنبال اسناد و مدارکی است که ممکن است به این سؤال پاسخ دهد. در این مورد، بدیهی است که متن استخراج شده واقعاً پاسخ کاملی نیست.
اکنون، همان سؤال مطرح شده در مورد GPT-3 را در نظر بگیرید:
جستجوی گوگل چگونه کار میکند؟
جستجوی گوگل با خزیدن در وب و نمایهسازی وبسایتها کار میکند. وقتی کاربر چیزی را جستجو میکند، گوگل فهرست آن را بررسی میکند و مرتبطترین نتایج را برمیگرداند. از ترکیبی از الگوریتمها و تکنیکهای دیگر برای تعیین ارتباط نتایج استفاده میکند. این الگوریتمها عواملی مانند کلمات استفاده شده در پرسوجو، تازگی محتوا، محبوبیت وب سایت و موقعیت مکانی کاربر را در نظر میگیرند.
ما میتوانیم این پاسخ را دقیقتر دریافت کنیم، درواقع پاسخ بسیار کاملتری از گزیدهای از یک وبسایت. موتور GPT-3 اساساً چندین منبع را خلاصه کرده است.
بهراحتی میتوان فهمید که چگونه میتوان باعث عصبی شدن گوگل شود.
اعتماد و مشکل انتساب در موتورهای جستجو
در ظاهر، GPT-3 و بهخصوص ChatGPT میتواند پاسخهای بسیار شبیه به انسان را ارائه دهد. با کنارگذاشتن سؤالات اخلاقی (از جمله سرقت ادبی)، مشکلات عملی جدی وجود دارد.
پاسخ گوگل یک مزیت مهم دارد: انتساب. بهراحتی میتوانیم به صفحه منبع برویم. این موضوع نهتنها اطلاعات بیشتری را در اختیار ما قرار میدهد، بلکه زمینه بیشتری از جمله جزئیات مربوط به خود منبع را فراهم میکند. این جزئیات میتواند به ما کمک کند به پاسخ اعتماد کنیم (یا در برخی موارد، بیاعتماد شویم).
برای مثال، پاسخ دیگری را در نظر بگیرید که GPT-3 برای سال بالا جواب داده است:
جستجوی گوگل چگونه کار میکند؟
جستجوی گوگل با استفاده از ترکیبی از الگوریتمها و برنامهها برای تجزیهوتحلیل محتوای صفحات وب و سایر محتوای آنلاین برای تعیین ارتباط آن با عبارت جستجوی کاربر کار میکند. الگوریتمهای جستجوی گوگل به دنبال عوامل مختلفی هستند، از جمله تراکم کلمه کلیدی، تازگی و تعداد سایتهای دیگری که به صفحه لینک میدهند. گوگل همچنین از هوش مصنوعی و یادگیری ماشینی برای بهبود نتایج جستجوی خود استفاده میکند.
این پاسخ نیز محتمل به نظر میرسد، با این تفاوت که اکثر سئوکاران با ذکر چگالی کلمات کلیدی که به طور گسترده یک افسانه در نظر گرفته میشود، متعجب میشوند. کاملاً ممکن است که این بخش از اطلاعات از منبع کاملاً متفاوتی آمده باشد، اما بدون ذکر منبع، نمیتوانیم آن را تأیید کنیم.
درحالیکه این یک مشکل پیچیده است (متن تولید شده توسط ماشین از منابع به همان روشی که انسان استفاده میکند استفاده نمیکند، یا ممکن است از دهها یا صدها منبع استفاده کند)، در واقع با این روش تعداد منابع را کاهش میدهد و انتساب هرکدام را ارائه میدهد.
این پاسخ از Neeva، یک موتور جستجوی جایگزین و متمرکز بر حریم خصوصی است «آیا باید یک ماگ بلند با لاته بگیرم یا یک قهوه گراند؟» را در نظر بگیرید:
درحالیکه این عملکرد در نسخه بتا است و واضح است که در مقیاس Google عمل نمیکند، Neeva تلاش میکند منابع اولیه را ارائه دهد. ما عمداً یک مثال خندهدار انتخاب کردهایم، زیرا ریسک آن کم است. سؤالی را دقیقاً در آنچه Google قلمرو YMYL (پول شما، زندگی شما) مینامد، تصور کنید، مانند «آیا بیتکوین بهتر است یا دوجکوین؟»
این سؤالی است که میتواند آینده مالی ما را بهطورجدی تحتتأثیر قرار دهد و دانستن اینکه پاسخ از کجا میآید تفاوت بزرگی ایجاد میکند و به ما این امکان را میدهد تا عمیقتر بگردیم و یا اعتماد کنیم و یا آن منابع را رد کنیم.
موضوع اعتماد به یک موضوع عمیقتر از این حرفهاست، در واقع آیا متن تولید شده توسط ماشین نوعی سرقت ادبی است یا خیر. درحالیکه سرقت ادبی سنتی بهطورکلی نیاز به هدف و کپیکردن تکههای قابلتوجهی از متن دارد، متن تولید شده توسط ماشین از نوشتههای نویسندگان و سازندگان محتوا ساخته میشود، بدون اینکه حداقل در مورد ChatGPT هیچگونه انتساب واضحی وجود نداشته باشد. در مورد Google، استفاده بیش از حد از متن تولید شده توسط ماشین، میتواند تولیدکنندگان محتوا را دلسرد کند و ما را به این سؤال وادار کند که آیا میخواهیم تلاشهای خود را برای شخص دیگری انجام دهیم یا خیر.
توهمات و رؤیاهای ماشینی
بدون محدودیتهای دقیق، سیستمهای یادگیری ماشینی مستعد متوهم شدن هستند. در مورد ChatGPT، این اساساً به این معنی است که این سیستم میتواند پاسخهایی تولید کند که ریشه در واقعیت ندارند. به زبان ساده، ChatGPT چیزی را که میگوید نمیفهمد؛ بلکه بر اساس الگوهای جدیدی بر اساس زبان انسان ایجاد میکند. سؤال زیر را که برای GPT-3 مطرح کردیم در نظر بگیرید:
Mozart’s 1976 hit “The Fast and the Furious: Tokyo Drift درباره چیست؟
Mozart’s 1976 hit “The Fast and the Furious: Tokyo Drift به فیلمی به همین نام در سال ۲۰۰۶ مربوط نمیشود. این قطعهای ساز است که انرژی دیوانهکننده خیابانهای توکیو در شب را به تصویر میکشد. این آهنگ حول یک خط پیانوی جذاب و هماهنگ و یک ریتم رانندگی و شاداب ساخته شده است.
درحالیکه این جواب جذاب است، اما چنین قطعهای وجود ندارد. ما یک سؤال مزخرف پرسیدهایم و GPT-3 به ما پاسخی بیهوده داده است.
باید اشاره کنیم که ChatGPT در حال حاضر دارای محدودیتهایی است که مشکلاتی ازاینقبیل را برطرف میکند و مدلهای پیچیده از جمله رابط GPT-3 OpenAI به شما این امکان را میدهند محدودیتهای کمتری داشته باشید، اما مشکل اصلی جای دیگری است .
باز هم یک سؤال مالی با ریسک بالاتر را در نظر بگیرید:
کدام پول دیجیتالی محبوبتر است: Dogecoin، Bassetcoin یا Norwegianlundehundcoin؟
دوجکوین باارزش بازار فعلی بیش از ۹ میلیارد دلار محبوبترین در بین این سه پول دیجیتالی است Bassetcoin و Norwegianlundehundcoin سکههای بسیار کوچکتری هستند که ارزش بازار هرکدام تنها چند صدهزار دلار است.
ارزش بازار چند صدهزار دلاری هرکدام برای دو ارز دیجیتال (تا لحظه نگارش این مقاله) وجود ندارند. متأسفیم که میگوییم این مثال را با Labradoodlecoin شروع کردیم، فقط برای اینکه کشف کنیم که Labradoodlecoin واقعاً وجود دارد.
ما موتور جستجو را برای اثبات یک نکته در اینجا فشار میدهیم و متنهای تولید شده توسط ماشین نسبت به جوابهای قبلی، کمتر پاسخ توهمی میدهند. بااینحال، هرزمان که چندین منبع را بدون توجه به صحت یا کاملبودن آنها ترکیب کنید، این خطر واقعی وجود دارد که نتیجه نهایی مزخرف اما به نظر منطقی باشد.
مقیاس و اینترنت بلادرنگ
این موضوع کاملاً ساده است: آنچه در مقیاس بتا کار میکند ممکن است در مقیاس Google کار نکند. همانطور که مرحوم بیل اسلاوسکی اشاره کرد، فقط به این دلیل که گوگل یک ایده دارد یا حتی یک ایده را ثبت اختراع میکند، به این معنی نیست که آنها آن ایده را در موتور جستجو پیادهسازی میکنند.
موضوع دیگر سرعت اینترنت است. ChatGPT بر روی یک پیکره ثابت آموزش داده میشود. یکلحظه در زمان. گوگل خیلی سریع اینترنت را کرال و ایندکس میکند و میتواند اطلاعاتی را که اخیراً، بومیسازی شده و حتی شخصیسازیشدهاند را برگرداند.
شایانذکر است که گوگل مبالغ هنگفتی را برای یادگیری ماشین سرمایهگذاری کرده است. LaMDA گوگل (مدل زبانی برای برنامههای گفتگو) قادر به تولید متن پیچیده و شبیه انسان است. گوگل بهخوبی از محدودیتها و هزینههای این مدلها آگاه است.
درحالیکه موضوع سوگیری بسیار فراتر از محدوده این مقاله است، مقیاس نیز به مسائل سوگیری کمک میکند. هنگامی که از یک پیکره ایستا و کنترلشده عبور میکنید و مدلهای یادگیری ماشین را به کل دنیای محتوای بلادرنگ باز میکنید، تعصبات انسانی بهسرعت وارد میشوند (از جمله نژادپرستی، جنسیت گرایی، همجنسگراهراسی، و سایر سوگیریهای مخرب). در مقیاس گوگل، کاهش سوگیری مشکلی است که نیاز به دخالت و منابع انسانی زیادی دارد.
کد قرمز و تهدیدات آینده
هیچکدام از اینها به این معنی نیست که Google GPT از جمله ChatGPT را جدی نمیگیرد. گویا گوگل پس از ویروسی شدن ChatGPT یک «کد قرمز» صادر کرد. درحالیکه گوگل به طور قابلدرک در مورد واکنشهای داخلی خود ساکت است، تقریباً مطمئن است که تحولات اخیر باعث تسریع بحثها و تحولات در Mountain View شده است.
تهدید واضح دیگر این است که مایکروسافت یک سرمایهگذار (به میزان ۱ میلیارد دلار) در OpenAI و همراه با آن ChatGPT است و شایعاتی مبنی بر اینکه ممکن است میلیاردها دلار بیشتر سرمایهگذاری کنند را منتشر میکند. مایکروسافت همچنین اعلام کرده است که قبل از پایان ماه مارس، ChatGPT را در جستجوی Bing آغاز خواهد کرد، اگرچه مشخص نیست که از این عرضه اولیه چهقدر طول خواهد کشید.
یکی از بزرگترین تأثیرات بلندمدت مدلهایی مانند ChatGPT و LaMDA در جستجوی مکالمه (، جستجوی صوتی) خواهد بود. مکالمه زیر را با ChatGPT در نظر بگیرید:
پنج SUV سه ردیفه برتر کداماند؟
دشوار است که بگوییم پنج شاسیبلند سه ردیفه برتر کداماند زیرا میتواند ذهنی باشد و به عواملی مانند ترجیحات شخصی، بودجه و مکان بستگی دارد. بااینحال، برخی از SUVهای سه ردیفه که اغلب جزو بهترینهای ردیف خود محسوب میشوند عبارتاند از:
Honda Pilot
Toyota Highlander
Kia Telluride
Hyundai Palisade
Subaru Ascent
کدام یک از آنها ارزانتر است؟
از بین پنج خودروی شاسیبلندی که نام بردیم، Subaru Ascent با قیمت اولیه حدود ۳۲۲۹۵ دلار ارزانترین قیمت را دارد. سایر شاسیبلندهایی که به آنها اشاره کردیم قیمت اولیه حدود ۳۲۰۰۰ تا ۳۸۰۰۰ دلار دارند. بااینحال، مهم است که توجه داشته باشید که قیمت نهایی بسته به سطح تمیز بودن و گزینههایی که انتخاب میشود میتواند متفاوت باشد.
آیا سوبارو قابلاعتمادتر است؟
سوبارو عموماً بهعنوان یک خودرو قابلاعتماد در نظر گرفته میشود و بسیاری از مدلهای آن از نظر قابلیت اطمینان، نمره بالایی دریافت کردهاند. بهویژه Subaru Ascent بهعنوان یک وسیله نقلیه قابلاعتماد با فضای داخلی راحت و مصرف سوخت خوب، شهرت دارد. طبق گزارش Consumer Reports، Ascent امتیاز قابلیت اطمینان بالاتر از حد متوسط را دریافت میکند.
با عرض پوزش، ChatGPT قطعاً میتواند چت شود (و این نسخه ویرایش شده است). به سؤالات بعدی توجه کنید و اینکه چگونه نیازی به تکرار اطلاعات نداشتیم ChatGPT متوجه شد که ما میخواهیم از پاسخهای قبلی استفاده کنیم.
درحالیکه این مدل همه موارد استفاده از جستجو را ارائه نمیکند، قطعاً موقعیتهایی وجود دارد که توانایی اصلاح آسان و مکالمه یک پرسوجو میتواند چالشبرانگیز باشد، بهخصوص برای سؤالات پیچیده، و البته، خریدهای پیچیده! تصور کنید گوگل بتواند در هر مرحله از این سفر به سمت خرید، تبلیغات مختلفی را ارائه دهد.
متأسفانه، بزرگترین تهدید کوتاهمدت این فناوری برای گوگل است که مردم و شرکتها احتمالاً از ChatGPT برای تولید محتوای بیکیفیت استفاده میکنند و این برای گوگل هزینه و زمان میبرد و احتمالاً منجر به بهروزرسانیهای الگوریتمهای واکنشی میشود. علاوه بر این، این موضوع یک دردسر جدی برای بازاریابان جستجو خواهد بود که باید به این بهروزرسانیها واکنش نشان دهند.
چیزی که در سال ۲۰۲۳ حتمی است این است که محبوبیت ChatGPT و دسترسی به آن برای عموم مردم باعث انفجار سرمایهگذاری و سرعتبخشیدن به توسعه آن میشود. درحالیکه گوگل به جایی نمیرسد، میتوانیم انتظار داشته باشیم که چشمانداز جستجو به روشهای غیرمنتظره (و گهگاهی ناخواسته) در سال آینده تغییر کند.
0 دیدگاه