استفاده از هوش مصنوعی در تحقیقات بازار
جدیدترین مقاله هاروارد
by James Brand, Ayelet Israeli and Donald Ngwe
در مراحل ابتدایی نوآوری، شرکتها با یک معضل آشنا روبرو هستند: کدام ایدهها ارزش سرمایهگذاری بیشتر را دارند؟ راهحل سنتی، یعنی تحقیقات بازار مبتنی بر انسان، میتواند بینشهای ارزشمندی ارائه دهد—اما اغلب کند، پرهزینه و محدود از نظر دامنه است. اکنون، هوش مصنوعی زایشی (Generative AI) ابزار جدید و جالبی را ارائه میدهد: مشتریان مصنوعی.
مدلهای زبانی بزرگ (LLMs) مانند ChatGPT و Gemini بهخاطر تواناییشان در تولید محتوا و ایدهها توجه زیادی را جلب کردهاند. اما یکی از حوزههای کمتر کاوششده، توانایی آنها در شبیهسازی واکنش مشتریان به محصولات و ویژگیهای جدید است. تحقیقات ما نشان میدهد که مدلهای زبانی بزرگ، اگر با دقت بهکار گرفته شوند، میتوانند بهعنوان گروههای تمرکز مصنوعی عمل کرده و در مدت زمان و هزینهای بسیار کمتر از مطالعات انسانی، بینشهای اولیهای درباره ترجیحات مشتریان ارائه دهند.
مدلهای زبانی تنها برای ایدهپردازی محصول مفید نیستند؛ بلکه میتوان از آنها برای آزمودن محصولات نیز بهره برد. با ارائه پیکربندیهای مختلف محصول به این مدلها بهصورت ساختاریافته، میتوان آمادگی پرداخت “مصنوعی” مشتریان (WTP)، مقایسه میان گزینهها و حتی شناسایی ایدههای احتمالا شکستخورده را برآورد کرد—همه اینها بدون نیاز به یک پاسخدهنده انسانی. در چندین مطالعه به سبک «تحلیل ترکیبی» (conjoint) در دستههایی مانند خمیردندان، لپتاپ و تبلت، دریافتیم که مدلهای زبانی، بهویژه زمانی که با دادههای اختصاصی آموزش داده شوند، تخمینهایی بسیار نزدیک به ترجیحات واقعی مصرفکنندگان ارائه میدهند.
از تولید متن تا شبیهسازی بازار
مدلهای زبانی بر اساس دادههای عظیمی آموزش دیدهاند که شامل نقد محصولات، بحثها و الگوهای رفتاری بیانشده در زبان طبیعی هستند. این موضوع باعث شده آنها در پاسخ به سؤالات انتخابمحور درباره محصولات، عملکردی شگفتانگیز داشته باشند.
در مطالعات ما، برنامهای طراحی کردیم که بهطور مستقیم مدلها را با مقایسههای محصولی مشابه نظرسنجیهای تحقیقات بازار انسانها، هدف قرار میداد. برای مثال: «آیا خمیردندان فلورایددار Colgate با قیمت ۲.۹۹ دلار را میخرید یا نسخه بدون فلوراید با قیمت ۱.۹۹ دلار را؟» با تکرار این پرسشها در صدها پیکربندی تصادفی محصول، توزیعهایی از واکنشهای شبیهسازیشده مشتریان تولید کردیم. (توجه: از برنامهای استفاده کردیم که مستقیماً پرسشها را به مدل میفرستاد، نه از رابط چت.)
با استفاده از روشهای استاندارد تحلیل ترکیبی، WTP برای ویژگیهای مختلف محصول را برآورد کردیم.
برای ارزیابی پاسخهای مدل زبانی، همین مطالعات را با نمونههای انسانی نیز انجام دادیم. نتیجه؟ مدلها ترجیحات واقعی و جهتگیریهای دقیقی برای بسیاری از ویژگیهای آشنا ارائه دادند. بهعنوان نمونه، مشتریان مصنوعی برای فلوراید در خمیردندان و RAM اضافی در لپتاپها ارزشی مشابه انسانها قائل بودند. همچنین، توزیع پاسخهای شبیهسازیشده، مبادلات مهم بین قیمت و ویژگیها را بهخوبی منعکس کرد.
نکته مهم این است که این موارد، نمونههای انتخابی نبودند. در دستهبندیهای مختلف، مدلهای زبانی بهطور پیوسته رتبهبندی ترجیحاتی ایجاد کردند که با نتایج انسانها همراستا بود. بهعنوان ابزاری برای آزمون اولیه، پتانسیل آن واضح است: LLMها میتوانند ایدههای ضعیف را زودتر شناسایی و مسیرهای امیدوارکننده را پیش از شروع تحقیقات رسمی اولویتبندی کنند.
اما محدودیتهایی وجود دارد — و اهمیت دارند.
با وجود نتایج امیدوارکننده، مدلهای زبانی آمادهی مصرف (off-the-shelf) شبیهسازهای کاملی نیستند. آنها تمایل دارند که علاقه به ویژگیهای جدید یا عجیب را بیش از حد برآورد کنند. مثلاً وقتی طعمهای جدیدی از خمیردندان مانند «پنکیک» یا «خیار» را آزمودیم، مشتریان مصنوعی اشتیاقی بهمراتب بیشتر از انسانها نشان دادند.استفاده از هوش مصنوعی در تحقیقات بازار ، بدون پایهگذاری واقعی بر تجربه مصرفکننده، میبینیم که هوش مصنوعی زایشی تمایل دارد مشتریان را کنجکاو و مشتاق تصور کند—ویژگیهایی که لزوماً به فروش تبدیل نمیشوند.
از سوی دیگر، مدلهای زبانی در بخشبندی مشتریان دچار مشکل هستند. وقتی با ویژگیهای جمعیتی خاصی مانند «شما یک خریدار با درآمد پایین هستید» یا «شما جمهوریخواه هستید» به آنها داده شد، پاسخها تغییر کرد، اما اغلب بهصورت ناسازگار یا اغراقآمیز. حتی پس از تنظیم دقیق، مدل نتوانست تفاوتهای ظریف در ترجیحات گروههای مختلف جمعیتی را همانند مطالعات انسانی بازتولید کند.
برای مثال، هنگام برآورد WTP برای مکبوک در برابر سرفیس، مدل تفاوت بین گروههای درآمدی را بیش از حد بزرگ جلوه داد. درست است که نشان داد جمهوریخواهان کمتر از دموکراتها برای برند Apple حاضر به پرداخت هستند، اما میزان این تفاوت را ۶۲۵ دلار تخمین زد، در حالی که این تفاوت در نمونه انسانی فقط ۷۲ دلار بود. همچنین، زمانی که مدل با دادههای شرکتی تنظیم شد، تمایل داشت «میانگینگیری» کند و تفاوتهای مهم (مثلاً ترجیحات حزبی) را از بین ببرد.
علاوه بر این، چون LLMها از پیش آموزش دیدهاند، بدون دادههای تازه یا دسترسی به اینترنت، ممکن است ترجیحات ایستا را نشان دهند و به شرایط فعلی بازار واکنشی نشان ندهند—در نتیجه اطلاعاتی غیرمرتبط ارائه دهند.
همچنین، چرخههای توسعه سریع و معرفی مداوم مدلهای جدید LLM، نیازمند ارزیابی مکرر پاسخهای پایهای هر نسخه هستند، که این امر استفاده از آنها را در فرایند توسعه محصول دشوار میکند.
خلاصه اینکه: با روشهای فعلی، مدلهای زبانی میتوانند سیگنالهای متوسط بازار را شبیهسازی کنند، اما نه بینشهای خاص برای بخشهای جمعیتی. برای هر چیزی فراتر از کشف روندهای کلی در مراحل اولیه، همچنان تحقیقات انسانی ضروری است.
قدرت دادههای اختصاصی
یکی از مهمترین یافتههای ما، عملکرد بسیار بهتر مدلها هنگام تنظیم با دادههای تاریخی مشتریان شرکت است.
ما از نظرسنجیهای قبلی مشتریان برای آموزش دقیق مدل استفاده کردیم. تنظیم دقیق شامل اصلاح پارامترهای مدل بر اساس پاسخهای گذشته است. این فرایند، توانایی مدل را در شبیهسازی ترجیحات انسانی حتی برای ویژگیهای جدید افزایش میدهد.
برای مثال، مدل را با پاسخهای مطالعه خمیردندان با طعمهای استاندارد (نعناع، دارچین، توتفرنگی) تنظیم کردیم. سپس از آن خواستیم ترجیحات طعمهای جدید (پنکیک، خیار) را تخمین بزند. مدل تنظیمشده، شور و شوق قبلی خود را معکوس کرد و تخمینهایی مطابق با پاسخهای انسانی ارائه داد—از جمله اینکه اکثر مردم طعم «خمیردندان پنکیکی» را دوست ندارند.
این الگو در حوزه فناوری نیز تکرار شد. پس از آموزش مدل با دادههای لپتاپ (مانند اندازه صفحه و RAM)، تخمینهای بسیار دقیقتری برای ویژگی جدیدی مانند ویدئو پروژکتور داخلی ارائه کرد.
اما این روش تنها در همان دسته محصول مؤثر بود. وقتی مدلی که با نظرسنجیهای لپتاپ تنظیم شده بود را درباره تبلتها—که دستهای نزدیک ولی متمایز است—پرسش کردیم، عملکرد آن بدتر از نسخه بدون تنظیم بود.
نکته کلیدی: شرکتهایی که مدلهای زبانی اختصاصی خود را با دادههای تاریخی مشتریان تنظیم میکنند، میتوانند به بینشهای دقیقتری در مراحل اولیه دست یابند. این امر نوعی مزیت رقابتی مبتنی بر داده ایجاد میکند: دو شرکت با استفاده از یک مدل پایه LLM نتایج متفاوتی خواهند داشت اگر یکی از آنها مدل را با ترجیحات مشتریان خود آموزش داده باشد.
هزینه، سرعت و گسترش قیف نوآوری
مطالعات سنتی تحلیل ترکیبی میتوانند دهها هزار دلار هزینه داشته باشند و هفتهها زمان ببرند. مطالعات مبتنی بر مدلهای زبانی ما در عرض چند ساعت و با هزینهای بسیار کمتر انجام شدند. ما توانستیم هزاران پاسخ شبیهسازیشده تولید و بهسرعت تکرار کنیم.
این سرعت، نوعی فرآیند نوآوری متفاوت را ممکن میسازد. بهجای توسعه چند ایده برای آزمایش، تیمها میتوانند دهها یا حتی صدها ایده اولیه را بررسی کنند—با استفاده از مشتریان مصنوعی بهعنوان فیلتر. این کار «دهانهی بالایی» قیف نوآوری را گسترش میدهد و همزمان «انتهای پایینی» را با دادههای دقیقتر محدود میکند.
برای مثال، یک شرکت محصولات مصرفی میتواند ۴۰ تنوع جدید محصول را بهصورت مصنوعی آزمون کند و سپس برای ۵ مورد برتر، نظرسنجی انسانی انجام دهد. این کار اتلاف را کاهش داده و توجه انسانی را به مهمترین موارد معطوف میکند.
مکمل، نه جایگزین
وسوسهانگیز است که آیندهای را تصور کنیم که در آن مشتریان مصنوعی جایگزین کامل تحقیقات انسانی شوند. اما آن آینده هنوز نرسیده—و شاید هرگز نرسد.
در حالی که مدلهای زبانی میتوانند بینشهای اولیه معتبری ارائه دهند، همچنان فاقد ظرافت، هوش هیجانی و تنوع واقعی افراد هستند. مهمتر اینکه آنها رفتار و دادههای موجود را بازتاب میدهند و بنابراین همه تعصبات و نقاط کور آنها را به ارث میبرند.
اگر بهدرستی استفاده شوند، مدلهای زبانی باید مکمل، نه جایگزین تحقیقات بازار باشند. مطالعات ما نشان میدهد که آنها میتوانند در مراحل ابتدایی توسعه محصول، زمانی که هدف کشف و اولویتبندی است، بهخوبی بهکار گرفته شوند—نه برای اعتبارسنجی یا بخشبندی بازار.
همچنین، بازاریابان باید در جمعآوری و مدیریت دادههای داخلی سرمایهگذاری کنند تا از ارزش این ابزارها حداکثر بهره را ببرند. مدلی که با سالها داده ساختاریافته آموزش دیده، بسیار سودمندتر از مدلی است که تنها بر آموزش اینترنتی تکیه دارد.
آینده تحقیقات بازار؟
هوش مصنوعی زایشی یا همان GENERATIVE AI در حال بازآفرینی نحوه طراحی، آزمون و عرضه محصولات جدید توسط کسبوکارهاست. مشتریان مصنوعی جایگزین مشتریان واقعی نیستند—اما میتوانند دریچهای قدرتمند برای بینشهای اولیه باشند.
با ترکیب LLMها با روشهای پژوهشی دقیق، شرکتها میتوانند سریعتر نوآوری کنند، ایدهها را مؤثرتر فیلتر کرده و ریسک اشتباهات پرهزینه را کاهش دهند. موضوع «انسان در برابر ماشین» نیست—بلکه استفاده از ماشین برای شنیدن مؤثرتر است، تا انسانها تصمیمات بهتری بگیرند.
با رشد این حوزه، یک چیز روشن است: شرکتهایی که یاد بگیرند بینشهای انسانی و مصنوعی را تلفیق کنند، پیشتاز موج بعدی نوآوریهای مشتریمحور خواهند بود. با کوچسو همراه باشید تا از جدیدترین مقالات و موضوعات حوزه کسب و کار مطلع شوید.