نظرسنجی یا داده‌کاوی؛ کدامیک افکار عمومی در انتخابات را بهتر منعکس کردند؟

در بخش نخست میزگرد تخصصی اداره کل پژوهش‌های ایرنا در خصوص «نقش مراکز داده‌کاوی در پیش‌بینی انتخابات ریاست جمهوری»، درباره اینکه اصولا می‌توان فضای مجازی را آینه جامعه واقعی دانست یا نه و همچنین ظرفیت داده‌کاوی در پیش‌بینی انتخابات، بحث شد.

مهمان‌های برنامه که از دو شرکت اصلی داده‌کاوی کشور دعوت شده بودند، درباره فعالیت‌های بات‌ها در مجازی و همچنین مهم‌ترین چالش‌های‌ داده‌کاوی در ایران و بحث ضریب پراکندگی اینترنت به عنوان یکی از مشکلات کشور در حوزه داده‌کاوی اظهار نظر کردند.

در ادامه، سخنان «حمیدرضا کشاورز» مدیرعامل شرکت لایف وب و «امیرحسین عسگری» مدیرعامل شرکت دیتاک درباره ارتباط مقابل داده‌کاوی و نظرسنجی و همچنین نقش این دو ابزار در تعیین و رصد افکارعمومی بحث و تحلیل شده است.

لایف وب با بررسی محتوای گروه‌های تلگرامی میزان آرای پزشکیان در دور دوم را با اختلاف ناچیزی ۵۴ درصد برآورد کرد این در حالی است که شرکت دیتاک به برآورد کلی مشارکت پرداخت و آن را در دور اول با اختلاف ۵ درصد و در دور دوم با اختلاف ۱.۵ درصد تخمین زد

شرکت لایف وب با بررسی محتوای گروه‌های تلگرامی میزان آرای مسعود پزشکیان در دور دوم را با اختلاف ناچیزی ۵۴ درصد برآورد کرد این در حالی است که شرکت دیتاک به برآورد کلی مشارکت پرداخت و آن را در دور اول با اختلاف ۵ درصد و در دور دوم با اختلاف ۱.۵ درصد تخمین زد که اتفاقی مهم در تحلیل و پیش‌بینی انتخابات بر اساس داده‌کاوی فضای مجازی محسوب می‌شود.

نظرسنجی یا داده‌کاوی؛ کدامیک بهتر افکار عمومی را منعکس میکنند؟

ایرنا: ارتباط میان نظرسنجی و داه‌کاوی و نحوه تعامل آن با افکار عمومی، یکی از پرسش‌های همیشگی در علوم اجتماعی است. از نظر شما جایگاه این دو در برداشت و رصد افکار عمومی چگونه است؟ چه مزیت‌هایی در داده‌کاوی هست که نظرسنجی ندارد و بالعکس؟ و بالاخره اینکه برای انعکاس افکارعمومی باید از نظرسنجی استفاده کرد یا داده‌کاوی؟

عسگری: بحث نظرسنجی برای مدیریت و حکمرانی جامعه، تاریخی طولانی دارد. این‌که کسی بخواهد یک جامعه را مدیریت کند، باید بداند که نظر آن جامعه چیست. هر چقدر به زمان گذشته می‌رویم، فنآوری کمتر می‌شود. بنابراین مساله و راه حل‌های متناسب با اقتضائات آن فضا تغییر می‌کند.

آن چیزی که اکنون می‌توان از آن به عنوان روش نظرسنجی سنتی‌تر یاد کرد، دو روش حضوری و تلفنی است. روش تلفنی به نسبت روش حضوری جدیدتر است و تقریبا عمرش ۷۰-۶۰ سال بعد از نظرسنجی حضوری است. تقریبا همان روندی که برای نظرسنجی تلفنی پیش آمد برای داده‌کاوی هم در این سال‌ها رخ داد ، اما اکنون مرحله گذار را پشت سر گذاشته است.

نسبت نظرسنجی تلفنی و نظرسنجی حضوری، همانند نسبت داده‌کاوی و نظرسنجی تلفنی است

زمانی که نظرسنجی تلفنی در کنار نظرسنجی حضوری استفاده شد، بسیاری براین باور بودند که اصلا این روش علمی نیست، برخی مخالفان می‌گفتند به هیچ عنوان نمی‌توان به این روش اعتماد کرد، زیرا متغیرها در این روش مورد توجه قرار نمی‌گیرد و فقط به یک شماره تلفن اکتفا می‌شود.
اما وقتی این روش مورد استفاده جدی قرار گرفت و آزمونش را پس داد، بسیاری که تاکید داشتند، این روش غیر علمی است، تغییر نظر داده و با تولید مقاله اعلام کردند که نظرسنجی تلفنی روش مفید و پاسخگوی نیازهای جامعه است.
همین روند برای داده‌کاوی نیز رخ داده است. یعنی مفهوم سر جایش است اما شیوه یا نوع جمع‌آوری داده‌ها تغییر کرده است.
در مورد داده‌کاوی به طور مثال ۱۰تا ۱۲ سال پیش، گروهی از مدیران و سیاست‌گذاران معتقد بودند که این روش پاسخگوی نیازها نیست. اما از انتخابات ۱۳۹۲ تاکنون در هر انتخابات تاکید داشته‌ایم که رصد افکار عمومی جامعه در فضای مجازی با روش داده‌کاوی کاملا امکان‌پذیر است.

انتخابات، بهترین بزنگاه ورود داده‌کاوی برای رصد افکار عمومی جامعه است

این سوال مطرح است که چرا در هر انتخابات، داده‌کاوی مهم می‌شود؟ به دلیل ساختار سیاسی که داریم و توزیع قدرتی که در این ساختار وجود دارد، حرف مردم در انتخابات برای ما خیلی اهمیت پیدا می‌کند و باید با آن مواجه بشویم یعنی همه آن‌هایی که ذینفع هستند، می‌دانند که مردم حرف آخر و نظر اصلی را می‌زنند.
در بسیاری جاهای دیگر اینطور نیست، نظر مردم ممکن است حاشیه‌ای باشد یا حتی اصلا توجهی هم به آن نشود، بنابراین اتفاقی برای آن ذینفع رقم نمی‌خورد.

نمی‌توان داده‌کاوی فضای مجازی داشت و زیست آنلاین آن را به رسمیت نشناخت

مدیرعامل دیتاک: نکته حایز اهمیت اینجا این است که اگر بخواهیم داده‌کاوی بر اساس فضای مجازی انجام دهیم باید زیست آنلاین آن را به رسمیت بشناسیم

نکته حایز اهمیت این است که اگر بخواهیم داده‌کاوی بر اساس فضای مجازی انجام دهیم باید زیست آنلاین، را هم به رسمیت بشناسیم.
بپذیریم که زیست دیگری آن طرف رقم می‌خورد که روی زیست این طرف اثر می‌گذارد. اگر این موضوع را به رسمیت نشناسیم همه چیز به ایراد می‌خورد. آنهایی که این بحث را مطرح می‌کنند اول باید به این موضوع جواب دهند که بالاخره فضای مجازی، آیا فضایی در حد یک زیست موازی آفلاین است که اثرش حتی در جاهایی از پارامترهای زیست آفلاین هم بیشتر است؟ بنابراین باید متغیرهای فضای آنلاین را مورد توجه قرار داد نه متغیرهای فضای آفلاین.

در فضای آنلاین، اگر بخواهیم ببینیم نظرات چیست، در نظرات به نردبان کاربری برمی‌خوریم. این موضوع به این معناست که همه که تولید محتوا و استوری را ندارند، برخی در قالب کامنت نظر می‌دهند.بررسی این موارد لایه‌های تکنیکال پیچیده‌ای دارد.

نظرسنجی و داده‌کاوی مکمل‌هم هستند نه جایگزین هم

اکنون آیا نظرسنجی و داده‌کاوی جایگزین هم باید بشوند؟ خیر. مکمل هم هستند. اصلی‌ترین نقطه ضعفی که در نظرسنجی وجود دارد این است که نظرات خیلی ساده، عیان، شفاف گفته نمی‌شود و در بسیاری موارد نمی‌توانید نظر را بگیرید.

مدیرعامل دیتاک: اصلی‌ترین چالشی که در داده‌کاوی وجود دارد این است که که برخی موقعیت‌ها دیتا وجود ندارد و جامعه در فضای آنلاین نظر نمی‌دهد

اصلی‌ترین چالشی که در داده‌کاوی وجود دارد این است که در برخی موقعیت‌ها دیتا وجود ندارد و جامعه در فضای آنلاین نظر نمی‌دهد. البته اگر حجم دیتا در موضوعی بالا باشد، خیالمان راحت است و اگر روش تحقیق درست و کارشناس مسلط باشد، کار انجام می‌شود اما وقتی داده وجود ندارد، شما نمی‌توانید با داده‌کاوی به نتیجه برسید.

از محدودیت نمونه آماری در نظرسنجی تا جامعیت نمونه در داده کاوی

یک نکته دیگر در حوزه داده‌کاوی این است که در نظرسنجی‌ها نمی‌توانیم متمرکز شویم و رزولوشن را بالا ببریم و ببینیم چه اتفاقی می‌افتد و براساس متغیرهای محدودی، نظرسنجی انجام می‌شود. اما در داده‌کاوی آرشیو فعالیت کاربران وجود دار. به طور مثال اینکه کاربران در انتخابات ۱۴۰۰ چه رفتاری داشته‌اند یا در مورد موضوعات چه نظری داده‌اند، پاسخ این‌ موارد را می‌توان از طریق داده‌کاوی به دست آود تا بر جزئیات تسلط داشته باشیم.

مهندس امیرحسین عسگری مدیرعامل شرکت دیتاک

ایرنا: شما کاربرها را طیف‌بندی می‌کنید؟

عسگری: می‌توان کاربران را طیف‌بندی کرد؛ به طور مثال واکنش‌های آن‌ها در موضوعات مختلف و شبکه پیرامونی موضوع، در داده‌کاوی قابلیت رصد دارد. در واقع در روش داده‌کاوی فضای مجازی به طور مستمر امکان رسیدن به جزئیات وجود دارد و بهتر می‌توان فهمید چه اتفاقی در حال وقوع است. مانند نقشه‌های قدیمی و نقشه‌های جدید؛ در نمونه‌های جدید امکان رسیدن به جزئیات جدید حتی پلاک خانه نیز وجود دارد.

ایرنا: ارجحیت داده‌کاوی به نظرسنجی چیست؟

کشاورز: این موضوع را با پاسخ به این سوال یادآور می‌شوم که چرا از گذشته در علوم انسانی و علوم اجتماعی سراغ نمونه‌گیری می‌رفتند؟ زیرا امکان دسترسی به همه یا بخش بزرگی از جامعه خیلی آسان و سریع وجود نداشته و بنابراین در سنجش‌ها از روش نمونه‌گیری استفاده شده است.
اما اکنون نکته‌ مهم این است که در عصر کلان داده‌ها، امکان بزرگی برای علوم اجتماعی، روانشناسی، علوم سیاسی و به‌طور کلی علوم انسانی فراهم شده که آن هم دسترسی فراگیر، سریع، آسان‌تر و ارزان‌ به نظرات مردم و رویکردهایشان در حوزه‌های مختلف است.

این موضوع درواقع انقلابی را درعلوم انسانی در ۸ سال اخیر به وجود آورده و ظرفیتی را در اختیار ما قرار داده است که ذیل حوزه مطالعاتی و پژوهشی «علوم اجتماعی محاسباتی یا رایانشی» دیده می شود. این‌که اکنون، صحبت‌هایی درباره مرگ نظریه‌ها مطرح می‌شود که مربوط به بهره گیری از الگوریتم‌ها است به همین حوزه روش شناسی و معرفت شناسی مربوط می‌شود.

در نتایج نظرسنجی که ایسپا در ۶ تیرماه منتشر کرد تعداد نمونه‌هایش را ۳۵۸۹ اعلام کرد این تعداد نمونه افرادی بودند که از جامعه آماری ایسپا با آن‌ها مصاحبه و پرسشی صورت گرفته است. ما در انتخابات در توئیتر ۱۳ میلیون محتوا از ۲۴۰ هزار کاربر بررسی کردیم. ۳ هزار نفر آن‌جا در مقابل ۲۴۰ هزار کاربر منحصر به فرد.

ایرنا: درباره انتخابات؟ و چه بازه زمانی؟

بله. از روز ۲۰ خرداد که درواقع اعلام نتایج نهایی احراز صلاحیت‌ها بود تا ۱۶ تیرماه یعنی فردای روز انتخابات. ببینید سه هزار نفر، دویست و چهل هزار نفر توی توئیتر، توی گروه‌های تلگرامی، از کانال‌های تلگرامی صحبت نمی‌کنم چون آن‌جا با رسانه مواجه هستیم و آن‌جا با بررسی بازدیدها می‌شود تحلیل‌هایی داشته باشیم. من صحبت از کنش‌گری کاربرها در گروههای تلگرامی می‌کنم، آن‌جا ما دیگر با فرد مواجهیم. ۱۴ ملیون محتوا از ۷۴۰ هزار کاربر. ۷۴۰ هزار کاربر، ۳ هزار تا فردی که ایسپا با آنها مصاحبه کردند.

ما داده‌های ۷۴۰ هزار نفر را به طور منحصر به فرد بررسی کردیم. نکته‌ای که وجود دارد این است که چه زمانی چنین فرصت و چنین امکانی در گذشته‌ها وجود داشته است که ما رجوع کنیم به نظرات این حجم از کاربرها؟ خود ما در گذشته به بسترهای مختلف و مولفه‌های مختلف در آن بسترها استناد می‌کردیم، مثلا شما فرض کنید درجه محبوبیت‌های لایک در اینستاگرام یک وزنی دارد در توئیتر یک وزنی دارد و در بسترهای دیگر یک وزن دیگری دارد. ۳۰ الی ۴۰ مولفه را ترکیب می‌کردیم و برآوردش را ارائه می‌دادیم.

شبکه‌های اجتماعی دیگر خیلی اجتماعی نیستند

در دور اول انتخابات به این نتیجه رسیدیم که اگر می‌خواستیم به طور مجزا بسترها را بررسی کنیم، گروه‌های تلگرامی خیلی به واقعیت نزدیک‌تر بود. یک عقبه نظری هم داشت، در همین ماه‌های اخیر هفته‌نامه اکونومیست یک یادداشتی منتشر کرد با این محور که مثل این‌که شبکه‌های اجتماعی دیگر خیلی اجتماعی نیستند و به این اشاره می‌کرد که یک بخش زیادی از کاربرها فعالیتشان منتقل شده است به گروه‌ها در پلتفرم‌های مختلف و موضوعی که تاکید می‌کرد این بود که شبکه‌های اجتماعی خیلی فضایشان دستکاری می‌شود و تحت تاثیر رفتارهای افراطی دیگران قرار می‌گیرد.

مدیرعامل لایف وب: براساس پژوهش‌های ما، بررسی محتوای گروه‌های تلگرامی نزدیک‌ترین تخمین را به نتیجه واقعی داشته چنان‌که درصد آرای آقای پزشکیان را در دور دوم با اختلاف بسیار کم ۵۴ درصد برآورد کردیم

من همچنان نظر آقای عسگری را تایید می‌کنم که برای ما تشخیص رفتار رباتیک، شبه رباتیک و جریان سازمان‌یافته میسر است و چیز عجیب و غریبی برای ما نیست و در بررسی‌هایمان تحت‌تاثیر آن قرار نمی‌گیریم. اگر بخواهم از نظر مصداقی بگویم این‌که محتوای منفی پیرامون آقای پزشکیان و محتوای مثبت درباره آقای جلیلی به شکل شبه رباتیک نشر و بازنشر می‌شد. اتفاقا در دور دوم ما همان ۵۴ درصد آقای پزشکیان را با استفاده از داده گروه‌ها با درصد دقیق پیش‌بینی کردیم.

نظرسنجی یا داده‌کاوی؛ کدامیک افکار عمومی در انتخابات را بهتر منعکس کردند؟
دکتر حمیدرضا کشاورز مدیرعامل شرکت لایف وب

ایرنا: بحث مرجعیت مجازی مساله مهم دیگری است که بارها در مقالات و پژوهش‌ها بدان اشاره شده است. از نظر شما، مرجعیت مجازی را چطور می‌توان پیدا کرد؟

مدیرعامل لایف وب: سال ۹۹، کمپینی راه افتاد تحت عنوان «اعدام نکنید» که به عنوان بزرگ‌ترین راهپیمایی مجازی ایرانیان مطرح شد که سخنگوی وقت قوه‌قضائیه اعلام کردند که رباتیک است اما اصلا رباتیک نبود

کشاورز: سال ۱۳۹۹، کمپین مجازی راه افتاد که به عنوان بزرگ‌ترین راهپیمایی مجازی مطرح شد اما بعد آن را اقدامی رباتیک توصیف کردند در حالی که حدود ۷۰ درصدش فعالیت رباتیک و شبه رباتیک نبود.
در ماجرای مهسا امینی نیز یک سوال اساسی مطرح بود که آیا آنچه که بعد از این ماجرا اتفاق افتاد رباتیک بود یا خیر؟ پاسخ به این سوال می‌توانست در بسیاری از تصمیم‌گیری‌های کلان حاکمیتی اثرگذار باشد. ببینید آن‌چه که در روزهای اول اتفاق افتاد ، ما شاهد این بودیم که حول و حوش ۷۲ درصد از کاربرهای توئیتر، حداقل یک عدد محتوا درباره مهسا امینی داشتند. این نشان می‌داد که این موضوع به شکل وسیعی جامعه را درگیر کرده است. اما از روزهای اول که عبور کردیم ، آن موج احساسی و هیجانی فروکش کرد.

این مربوط به تجمیع داده‌های سه‌ماه بعد از ماجرای مهسا امینی است عدد خیلی قابل توجهی است: تا قبل از اتفاقات این ماجرا ، روزانه بین ۴۰۰ تا ۶۰۰ کاربر در توئیتر عضو می‌شد، در هفته بعد از این رخداد، رقم به حدود ۱۰ هزار کاربر رسید. روزی ۴۰۰ تا ۶۰۰ و حتی ۱۰ هزارتا. این به چه معنی است؟ این که یک بخش قابل توجهی از مردم توئیتر را میدانی دیدند برای کنش‌گری و ظهور و بروز.

هرچه فضای آفلاین کف خیابان رادیکال‌تر می‌شد، کاربران نیز بیشتر در فضای مجازی تمایل داشتند نظر و اعتراضشان را ابراز کنند، در شبکه‌های اجتماعی و آنجا شاهد بودیم که خیلی‌ها عضو توئیتر شدند تا بتوانند نظرات و حرف‌هایشان را مطرح کنند اما خیلی جالب است که نزدیک به ۸۰ درصد از آن محتواها که گفته می‌شد که رسید به ۴۰۰ تا ۶۰۰ میلیون محتوا، ۸۰ درصد از آن محتواها کار ۵ درصد از کاربرها بود. ۵ درصد از کاربران نزدیک ۸۰ درصد از محتوا را منتشر می‌کردند.

فضاسازی مجازی با عقیده‌کاوی کاربران واقعی متفاوت است

در واقع، فضایی برای مردم تصویر می‌شود چه در انتخابات، چه در بزنگاه‌های مختلف اجتماعی سیاسی، اندازه‌گیری و بررسی و تحلیل آن فضا با عقیده‌کاوی مردم متفاوت است.
در انتخابات ۱۴۰۰، هنوز نتایج احراز صلاحیت‌ها نیامده بود و مشخص نشده بود و فردی ثبت‌نام کرده بود که بعدا رد صلاحیت شد، آن موقع اگر تنها میزان و کیفیت محتواها را می‌دیدید، وی باید با یک اختلاف آرای زیاد پیروز انتخابات معرفی می‌شد اما برای ما روشن بود چه بخشی از این سبد رفتار شبه رباتیک، سازمان‌یافته و جریانی است.

در شبکه‌های اجتماعی شاهد رواج نسبی‌گرایی هستیم

در انتخابات ۲۰۲۲ فرانسه، انتخابات ۲۰۲۳ ترکیه و در انتخابات ۱۳۹۶، ۱۴۰۰و ۱۴۰۳ ایران به دلایل مختلفی که یک بخشی از آن تحت‌تاثیر ظهور و بروز شبکه‌های اجتماعی است، می‌شود گفت تا حدود زیادی دوره پیروزی‌های قاطع و با اختلاف زیاد گذشته است. حتی همان انقلاب مصر که به عنوان انقلاب فیسبوکی از آن یاد می‌شود، حسنی مبارک با احمد شفیق رقابت کرد با یک اختلاف خیلی ناچیز کمتر از ۲ درصد پیروز شد.

در عصر شبکه‌های اجتماعی نکته‌ قابل تمایز، این است که نسبیت و نسبی‌گرایی خیلی رواج پیدا کرده است و دیگر به این شکل نیست که خرده روایت‌ها به سادگی تجمیع شده و تبدیل به یک روایت واحد و فراگیر شود و این عصری است که ما به شدت با عدم قطعیت‌ها مواجه هستیم.

در مجموع با توجه به ا ینکه در ایران به‌خاطر آن زمینه‌های سیاسی- فرهنگی که وجود دارد و فضا اساسا برای مردم مبهم است، چه در شرکتشان در انتخابات، چه در موضع‌گیری‌هایشان، چه در واقع کدام سمت حرکت کنند فضا اساسا مبهم است، چه برسد به این که ما بخواهیم ردپای دیجیتال مردم را بررسی کنیم.

ادامه دارد…


منبع

درباره ی nasimerooyesh

مطلب پیشنهادی

استراتژی امنیت سایبری ایالات متحده؛ جاسوسی از پنج چشم

سال‌های متمادی است که حکومت ایالات متحده آمریکا تجهیزات اطلاعاتی و ارتباطی متحدان خود، به‌ویژه …