استفاده از هوش مصنوعی در تحقیقات بازار

 

استفاده از هوش مصنوعی در تحقیقات بازار

 

جدیدترین مقاله هاروارد

by James BrandAyelet Israeli and Donald Ngwe

 

در مراحل ابتدایی نوآوری، شرکت‌ها با یک معضل آشنا روبرو هستند: کدام ایده‌ها ارزش سرمایه‌گذاری بیشتر را دارند؟ راه‌حل سنتی، یعنی تحقیقات بازار مبتنی بر انسان، می‌تواند بینش‌های ارزشمندی ارائه دهد—اما اغلب کند، پرهزینه و محدود از نظر دامنه است. اکنون، هوش مصنوعی زایشی (Generative AI) ابزار جدید و جالبی را ارائه می‌دهد: مشتریان مصنوعی.

مدل‌های زبانی بزرگ (LLMs) مانند ChatGPT و Gemini به‌خاطر توانایی‌شان در تولید محتوا و ایده‌ها توجه زیادی را جلب کرده‌اند. اما یکی از حوزه‌های کمتر کاوش‌شده، توانایی آن‌ها در شبیه‌سازی واکنش مشتریان به محصولات و ویژگی‌های جدید است. تحقیقات ما نشان می‌دهد که مدل‌های زبانی بزرگ، اگر با دقت به‌کار گرفته شوند، می‌توانند به‌عنوان گروه‌های تمرکز مصنوعی عمل کرده و در مدت زمان و هزینه‌ای بسیار کمتر از مطالعات انسانی، بینش‌های اولیه‌ای درباره ترجیحات مشتریان ارائه دهند.

مدل‌های زبانی تنها برای ایده‌پردازی محصول مفید نیستند؛ بلکه می‌توان از آن‌ها برای آزمودن محصولات نیز بهره برد. با ارائه پیکربندی‌های مختلف محصول به این مدل‌ها به‌صورت ساختاریافته، می‌توان آمادگی پرداخت “مصنوعی” مشتریان (WTP)، مقایسه میان گزینه‌ها و حتی شناسایی ایده‌های احتمالا شکست‌خورده را برآورد کرد—همه این‌ها بدون نیاز به یک پاسخ‌دهنده انسانی. در چندین مطالعه به سبک «تحلیل ترکیبی» (conjoint) در دسته‌هایی مانند خمیردندان، لپ‌تاپ و تبلت، دریافتیم که مدل‌های زبانی، به‌ویژه زمانی که با داده‌های اختصاصی آموزش داده شوند، تخمین‌هایی بسیار نزدیک به ترجیحات واقعی مصرف‌کنندگان ارائه می‌دهند.

 

از تولید متن تا شبیه‌سازی بازار

 

مدل‌های زبانی بر اساس داده‌های عظیمی آموزش دیده‌اند که شامل نقد محصولات، بحث‌ها و الگوهای رفتاری بیان‌شده در زبان طبیعی هستند. این موضوع باعث شده آن‌ها در پاسخ به سؤالات انتخاب‌محور درباره محصولات، عملکردی شگفت‌انگیز داشته باشند.

در مطالعات ما، برنامه‌ای طراحی کردیم که به‌طور مستقیم مدل‌ها را با مقایسه‌های محصولی مشابه نظرسنجی‌های تحقیقات بازار انسان‌ها، هدف قرار می‌داد. برای مثال: «آیا خمیردندان فلورایددار Colgate با قیمت ۲.۹۹ دلار را می‌خرید یا نسخه بدون فلوراید با قیمت ۱.۹۹ دلار را؟» با تکرار این پرسش‌ها در صدها پیکربندی تصادفی محصول، توزیع‌هایی از واکنش‌های شبیه‌سازی‌شده مشتریان تولید کردیم. (توجه: از برنامه‌ای استفاده کردیم که مستقیماً پرسش‌ها را به مدل می‌فرستاد، نه از رابط چت.)

با استفاده از روش‌های استاندارد تحلیل ترکیبی، WTP برای ویژگی‌های مختلف محصول را برآورد کردیم.

برای ارزیابی پاسخ‌های مدل زبانی، همین مطالعات را با نمونه‌های انسانی نیز انجام دادیم. نتیجه؟ مدل‌ها ترجیحات واقعی و جهت‌گیری‌های دقیقی برای بسیاری از ویژگی‌های آشنا ارائه دادند. به‌عنوان نمونه، مشتریان مصنوعی برای فلوراید در خمیردندان و RAM اضافی در لپ‌تاپ‌ها ارزشی مشابه انسان‌ها قائل بودند. همچنین، توزیع پاسخ‌های شبیه‌سازی‌شده، مبادلات مهم بین قیمت و ویژگی‌ها را به‌خوبی منعکس کرد.

نکته مهم این است که این موارد، نمونه‌های انتخابی نبودند. در دسته‌بندی‌های مختلف، مدل‌های زبانی به‌طور پیوسته رتبه‌بندی ترجیحاتی ایجاد کردند که با نتایج انسان‌ها هم‌راستا بود. به‌عنوان ابزاری برای آزمون اولیه، پتانسیل آن واضح است: LLMها می‌توانند ایده‌های ضعیف را زودتر شناسایی و مسیرهای امیدوارکننده را پیش از شروع تحقیقات رسمی اولویت‌بندی کنند.

اما محدودیت‌هایی وجود دارد — و اهمیت دارند.

با وجود نتایج امیدوارکننده، مدل‌های زبانی آماده‌ی مصرف (off-the-shelf) شبیه‌سازهای کاملی نیستند. آن‌ها تمایل دارند که علاقه به ویژگی‌های جدید یا عجیب را بیش از حد برآورد کنند. مثلاً وقتی طعم‌های جدیدی از خمیردندان مانند «پنکیک» یا «خیار» را آزمودیم، مشتریان مصنوعی اشتیاقی به‌مراتب بیشتر از انسان‌ها نشان دادند.استفاده از هوش مصنوعی در تحقیقات بازار ، بدون پایه‌گذاری واقعی بر تجربه مصرف‌کننده،  میبینیم که هوش مصنوعی زایشی تمایل دارد مشتریان را کنجکاو و مشتاق تصور کند—ویژگی‌هایی که لزوماً به فروش تبدیل نمی‌شوند.

 

از سوی دیگر، مدل‌های زبانی در بخش‌بندی مشتریان دچار مشکل هستند. وقتی با ویژگی‌های جمعیتی خاصی مانند «شما یک خریدار با درآمد پایین هستید» یا «شما جمهوری‌خواه هستید» به آن‌ها داده شد، پاسخ‌ها تغییر کرد، اما اغلب به‌صورت ناسازگار یا اغراق‌آمیز. حتی پس از تنظیم دقیق، مدل نتوانست تفاوت‌های ظریف در ترجیحات گروه‌های مختلف جمعیتی را همانند مطالعات انسانی بازتولید کند.

برای مثال، هنگام برآورد WTP برای مک‌بوک در برابر سرفیس، مدل تفاوت بین گروه‌های درآمدی را بیش از حد بزرگ جلوه داد. درست است که نشان داد جمهوری‌خواهان کمتر از دموکرات‌ها برای برند Apple حاضر به پرداخت هستند، اما میزان این تفاوت را ۶۲۵ دلار تخمین زد، در حالی که این تفاوت در نمونه انسانی فقط ۷۲ دلار بود. همچنین، زمانی که مدل با داده‌های شرکتی تنظیم شد، تمایل داشت «میانگین‌گیری» کند و تفاوت‌های مهم (مثلاً ترجیحات حزبی) را از بین ببرد.

علاوه بر این، چون LLMها از پیش آموزش دیده‌اند، بدون داده‌های تازه یا دسترسی به اینترنت، ممکن است ترجیحات ایستا را نشان دهند و به شرایط فعلی بازار واکنشی نشان ندهند—در نتیجه اطلاعاتی غیرمرتبط ارائه دهند.

همچنین، چرخه‌های توسعه سریع و معرفی مداوم مدل‌های جدید LLM، نیازمند ارزیابی مکرر پاسخ‌های پایه‌ای هر نسخه هستند، که این امر استفاده از آن‌ها را در فرایند توسعه محصول دشوار می‌کند.

خلاصه اینکه: با روش‌های فعلی، مدل‌های زبانی می‌توانند سیگنال‌های متوسط بازار را شبیه‌سازی کنند، اما نه بینش‌های خاص برای بخش‌های جمعیتی. برای هر چیزی فراتر از کشف روندهای کلی در مراحل اولیه، همچنان تحقیقات انسانی ضروری است.

 

قدرت داده‌های اختصاصی

یکی از مهم‌ترین یافته‌های ما، عملکرد بسیار بهتر مدل‌ها هنگام تنظیم با داده‌های تاریخی مشتریان شرکت است.

ما از نظرسنجی‌های قبلی مشتریان برای آموزش دقیق مدل استفاده کردیم. تنظیم دقیق شامل اصلاح پارامترهای مدل بر اساس پاسخ‌های گذشته است. این فرایند، توانایی مدل را در شبیه‌سازی ترجیحات انسانی حتی برای ویژگی‌های جدید افزایش می‌دهد.

برای مثال، مدل را با پاسخ‌های مطالعه خمیردندان با طعم‌های استاندارد (نعناع، دارچین، توت‌فرنگی) تنظیم کردیم. سپس از آن خواستیم ترجیحات طعم‌های جدید (پنکیک، خیار) را تخمین بزند. مدل تنظیم‌شده، شور و شوق قبلی خود را معکوس کرد و تخمین‌هایی مطابق با پاسخ‌های انسانی ارائه داد—از جمله اینکه اکثر مردم طعم «خمیردندان پنکیکی» را دوست ندارند.

 

این الگو در حوزه فناوری نیز تکرار شد. پس از آموزش مدل با داده‌های لپ‌تاپ (مانند اندازه صفحه و RAM)، تخمین‌های بسیار دقیق‌تری برای ویژگی جدیدی مانند ویدئو پروژکتور داخلی ارائه کرد.

اما این روش تنها در همان دسته محصول مؤثر بود. وقتی مدلی که با نظرسنجی‌های لپ‌تاپ تنظیم شده بود را درباره تبلت‌ها—که دسته‌ای نزدیک ولی متمایز است—پرسش کردیم، عملکرد آن بدتر از نسخه بدون تنظیم بود.

نکته کلیدی: شرکت‌هایی که مدل‌های زبانی اختصاصی خود را با داده‌های تاریخی مشتریان تنظیم می‌کنند، می‌توانند به بینش‌های دقیق‌تری در مراحل اولیه دست یابند. این امر نوعی مزیت رقابتی مبتنی بر داده ایجاد می‌کند: دو شرکت با استفاده از یک مدل پایه LLM نتایج متفاوتی خواهند داشت اگر یکی از آن‌ها مدل را با ترجیحات مشتریان خود آموزش داده باشد.

 

هزینه، سرعت و گسترش قیف نوآوری

 

مطالعات سنتی تحلیل ترکیبی می‌توانند ده‌ها هزار دلار هزینه داشته باشند و هفته‌ها زمان ببرند. مطالعات مبتنی بر مدل‌های زبانی ما در عرض چند ساعت و با هزینه‌ای بسیار کمتر انجام شدند. ما توانستیم هزاران پاسخ شبیه‌سازی‌شده تولید و به‌سرعت تکرار کنیم.

این سرعت، نوعی فرآیند نوآوری متفاوت را ممکن می‌سازد. به‌جای توسعه چند ایده برای آزمایش، تیم‌ها می‌توانند ده‌ها یا حتی صدها ایده اولیه را بررسی کنند—با استفاده از مشتریان مصنوعی به‌عنوان فیلتر. این کار «دهانه‌ی بالایی» قیف نوآوری را گسترش می‌دهد و هم‌زمان «انتهای پایینی» را با داده‌های دقیق‌تر محدود می‌کند.

برای مثال، یک شرکت محصولات مصرفی می‌تواند ۴۰ تنوع جدید محصول را به‌صورت مصنوعی آزمون کند و سپس برای ۵ مورد برتر، نظرسنجی انسانی انجام دهد. این کار اتلاف را کاهش داده و توجه انسانی را به مهم‌ترین موارد معطوف می‌کند.

 

مکمل، نه جایگزین

 

وسوسه‌انگیز است که آینده‌ای را تصور کنیم که در آن مشتریان مصنوعی جایگزین کامل تحقیقات انسانی شوند. اما آن آینده هنوز نرسیده—و شاید هرگز نرسد.

در حالی که مدل‌های زبانی می‌توانند بینش‌های اولیه معتبری ارائه دهند، همچنان فاقد ظرافت، هوش هیجانی و تنوع واقعی افراد هستند. مهم‌تر اینکه آن‌ها رفتار و داده‌های موجود را بازتاب می‌دهند و بنابراین همه تعصبات و نقاط کور آن‌ها را به ارث می‌برند.

اگر به‌درستی استفاده شوند، مدل‌های زبانی باید مکمل، نه جایگزین تحقیقات بازار باشند. مطالعات ما نشان می‌دهد که آن‌ها می‌توانند در مراحل ابتدایی توسعه محصول، زمانی که هدف کشف و اولویت‌بندی است، به‌خوبی به‌کار گرفته شوند—نه برای اعتبارسنجی یا بخش‌بندی بازار.

همچنین، بازاریابان باید در جمع‌آوری و مدیریت داده‌های داخلی سرمایه‌گذاری کنند تا از ارزش این ابزارها حداکثر بهره را ببرند. مدلی که با سال‌ها داده ساختاریافته آموزش دیده، بسیار سودمندتر از مدلی است که تنها بر آموزش اینترنتی تکیه دارد.

 

آینده تحقیقات بازار؟

هوش مصنوعی زایشی یا همان GENERATIVE AI در حال بازآفرینی نحوه طراحی، آزمون و عرضه محصولات جدید توسط کسب‌وکارهاست. مشتریان مصنوعی جایگزین مشتریان واقعی نیستند—اما می‌توانند دریچه‌ای قدرتمند برای بینش‌های اولیه باشند.

با ترکیب LLMها با روش‌های پژوهشی دقیق، شرکت‌ها می‌توانند سریع‌تر نوآوری کنند، ایده‌ها را مؤثرتر فیلتر کرده و ریسک اشتباهات پرهزینه را کاهش دهند. موضوع «انسان در برابر ماشین» نیست—بلکه استفاده از ماشین برای شنیدن مؤثرتر است، تا انسان‌ها تصمیمات بهتری بگیرند.

با رشد این حوزه، یک چیز روشن است: شرکت‌هایی که یاد بگیرند بینش‌های انسانی و مصنوعی را تلفیق کنند، پیشتاز موج بعدی نوآوری‌های مشتری‌محور خواهند بود. با کوچسو همراه باشید تا از جدیدترین مقالات و موضوعات حوزه کسب و کار مطلع شوید.