تحلیل دیتا گوگل ترندز درباره کرونا

لوگو گوگل کرونا

دیدار اتفاقی یک دوست حدود دو هفته پیش، که بزودی مشخص شد «کرونا مثبت» است، باعث شد به این فکر کنم که «نکند من هم کرونا گرفته‌ام؟» و یکی از اولین کارها،‌ رفتن به سراغ گوگل بود. اما لحظاتی بعد از چند جستجوی اولیه، به این فکر کردم که روند جستجوی بقیه مردم درباره موضوعات کرونایی چطور بوده؟ – ایده نگارش این متن از همین‌جا آمد.

کمی که بررسی کردم، فکر کردم می‌توان با سوالی متفاوت به داستان نگاه کرد. اینکه می‌شود از روند جستجوها، به الگو و مفهومی رسید؟ مگر نه اینکه همه دروغ می‌گویند، بجز گوگل؟ (1)

پس در اینجا، اول نگاهی به دیتای گوگل ترندز می‌اندازیم تا روند سرچ درباره کرونا را در طول زمان ببینیم. بعد سعی می‌کنیم ببینیم آیا می‌شود از دل تحلیل این دیتا، معنا و مفهومی بیرون آورد یا نه؛ و در انتها گریزی به نظرات و تجربیات بین‌المللی زده و به این سوال نسبتا جذاب می‌رسیم که:

آیا می‌شود از تحلیل بیگ دیتای گوگل ترندز، موج‌های کرونا را پیش‌بینی کرد؟

یک پرانتز کوتاه قبل از شروع: حال من خوب است؛ و شما باور کنید.

قبل از شروع این را بگویم که بجز چند روز سردرد خفیف، علایم دیگری – خوشبختانه – در من بروز نکرد. اطلاع نسبتا زود از احتمال مبتلا بودن و رعایت زیاد، شاید در وخیم نشدن حالم موثر بوده یا شاید هم آن علایم خفیف اصلا کرونا نبوده. به هر حال، الان که این مطلب را می‌نویسم، چندین روز هم از آن سردردها گذشته است. – پرانتز بسته!

شیوع عبارات مرتبط با کرونا در گوگل

ساده‌ترین بخش، همان ایده‌ی اولیه نوشتن این متن است: مردم چه چیزهایی را درباره کرونا گوگل می‌کنند؟ تحلیل گوگل ترندز می‌گوید که اینها از پرتکرارترین جستجوها بوده:

  • واکسن کرونا
  • علایم کرونا
  • آمار کرونا یا اخبار کرونا
  • داروی کرونا یا درمان کرونا
  • و حتی عبارات دیگری مثل وام کرونا یا بیمه کرونا.

البته طبیعتا همه این موارد همزمان در گوگل داغ نشده‌اند و حوادث جامعه و اخبار سیاسی و اقتصادی، در جستجوی آنها توسط کاربران موثر بوده. مثلا در اولین قرنطینه سراسری در نوروز ۹۹، ایده حمایت از کسب‌وکارهای آسیب‌دیده از کرونا بیشتر مورد توجه قرار گرفت و در ماه‌های اخیر، موضوع واکسن داغ شد.

اما بیایید چند روند جستجو را که برایم جالب‌تر بوده، با هم ببینیم.

اولین کلمه کلیدی که درباره کرونا می‌توانیم بررسی کنیم، خود عنوان این بیماری یعنی «کرونا» است (نمودار قرمز)؛ و برای مقایسه، آن را با یک عبارت که تقریبا همیشه میزان سرچ ثابتی دارد یکجا ببینیم: «دانلود فیلم» (نمودار آبی).

مقایسه تحلیل دیتای کرونا در گوگل ترندز با دانلود فیلم

مقایسه روند جستجو در گوگل برای دو عبارت کرونا (قرمز) و دانلود فیلم (آبی)

آن قله بزرگ نمودار قرمز رنگ (کرونا) حجم جستجو در هفته‌ بعد از انتخابات مجلس در اسفندماه ۹۸ بوده. پیک نمودار آبی (دانلود فیلم) هم به چند روز بعد یعنی حوالی ۲۰ اسفند تا ۱۰ فروردین برمی‌گردد که همان اولین قرنطینه سراسری کرونا در ایران بود.

شاید برایتان جالب باشد که بیشترین جستجو برای دانلود فیلم در تاریخ وب فارسی هم با اختلاف زیاد، همین بازه بوده و نسبت به رکورد قبلی سرچ کاربران، بیش‌تر از  ۴۰٪ بیشتر شده است! می‌توان گفت که گروه بزرگی از مردم در قرنطینه اول بیشتر از همیشه فیلم دیدند.

روند جستجو موضوعات کرونایی در گوگل

اگر از کلیدواژه «کرونا» بگذریم که یک کلیدواژه عمومی است، موضوعات درباره کرونا می‌توانند جالب باشند. بیایید یک سناریو محتمل را حدس بزنیم.

حدس اینکه وقتی کسی احساس بیماری کرد، اول علایم بیماری را سرچ می‌کند تا ببیند آیا بیمار شده یا نه. کمی بعد با ادامه علایم، به دنبال مواد خوراکی مفید برای کرونا می‌گردد و در روزهای آتی، تعداد کمتری از همین افراد با وخیم شدن حال‌شان به دنبال بیمارستان برای کرونا خواهند بود.

در ادامه نمودارهای را با هم بررسی کنیم. اما همین‌جا بر یک فرض که در پاراگراف قبل بطور تلویحی مطرح شد تاکید می‌کنم:

فرض اینکه می‌توان از روی جستجوهای کاربران در گوگل، زمان و میزان شلوغی بیمارستان‌ها را پیش‌بینی کرد.

نمودارها را با هم ببینیم. با این توضیح که برای دیدن بهتر جزئیات، نمودارهای بعدی بر روی یکسال اخیر یعنی از شهریور 99 تا شهریور 1400 هستند و در این مدت ایران سه موج ابتلا به کرونا را پشت سر گذاشته: در پاییز 99 (موج سوم)، در بهار 1400 (موج چهارم) و در تابستان 1400 (موج پنجم).

در نمودار زیر علایم کرونا را با رنگ آبی و [خوراکی‌های] مفید برای کرونا را با رنگ قرمز می‌بینید.

مقایسه روند جستجو در گوگل برای دو عبارت مفید برای کرونا (قرمز) و علایم کرونا (آبی)

به نظر می‌رسد در اینجا قله‌ها در نمودار آبی توانسته تا حدی قله نمودار قرمز رنگ را پیش‌بینی کند. یعنی افزایش و به اوج رسیدن جستجوی کاربران درباره «[خوراکی‌های] مفید برای کرونا» حدودا یک هفته بعد از به اوج رسیدن جستجو درباره علایم کرونا بوده است.

اما نمودار مهم‌تر، درباره جستجو برای بیمارستان‌های کروناست که در نمودار زیر با رنگ قرمز آمده است (علایم کرونا مثل قبل، رنگ آبی است).

تحلیل دیتای بیمارستان کرونا و علایم / تحلیل دیتا گوگل ترندز کرونا

مقایسه روند جستجو در گوگل برای دو عبارت بیمارستان کرونا (قرمز) و علایم کرونا (آبی)

در این نمودار ارتباطات کمی پنهان‌تر شده، ولی در موج‌های چهارم و پنجم کرونا، در دو نقطه مشخصا نمودار آبی (علایم)،‌ پیش‌بینی‌کننده نمودار قرمز (بیمارستان) بوده است. همچنین کاهش نمودار آبی (علایم)، توانسته تا حد خوبی نوید بخش کاهش نمودار قرمز (بیمارستان) در یک یا دو هفته آینده باشد (2).

آیا دیتای گوگل ترندز می‌تواند پیش‌بینی‌کننده شلوغی بیمارستان‌ها باشد؟

شاید با خودتان فکر کنید که این دو نمودار نشان می‌دهد فرض بالاتر گفته شده، ثابت شده است. اما کمی صبر کنید.

یک نمودار دیگر هم هست که شاید شما هم به یاد آن افتاده باشید: روند ابتلای روزانه به کرونا. این نمودار با یک گوگل ساده در دسترس هست (عکس: +).

اگر دو روند «جستجوی کاربران درباره علایم کرونا» و «تعداد ابتلای روزانه» را با هم مقایسه کنیم، در همان نگاه نخست به یک نکته عجیب می‌رسیم. اینکه تعداد ابتلای روزانه در موج پنجم کرونا خیلی بیشتر از موج چهارم بوده، و در موج چهارم هم به نحو محسوسی بیشتر از موج سوم. اما چرا میزان جستجو درباره علایم کرونا چنین روندی را دنبال نکرده است؟

ممکن است بگویید خب کسانی که در موج‌های قبلی به دنبال علایم کرونا بودند، دیگر علایم را بلدند و وقتی مبتلا شدند دیگر آن را در گوگل سرچ نکردند. اما اگر اینطور باشد یک تردید جدی به روش حل مسئله وارد می‌شود. یعنی تعداد مبتلایان جدید، در آینده هم کمتر و کمتر با تعداد افرادی که علایم کرونا را گوگل می‌کنند، همبستگی خواهد داشت – که با روش حل مسئله تناقض دارد (چون ما در ابتدا فرض کردیم هر کسی که علایم کرونا داشت، آن را در گوگل سرچ می‌کند).

البته ممکن هم هست بگویید: آمار در موج چهارم دقیق نبوده. یا کلا درست نیست. که البته با توجه به بعضی گزارش‌های رسمی، چندان بیراه نیست.

نکته اینجاست که احتمالا رفتار ویروس هم در طول زمان ثابت نبوده.

و نکته مهم‌تر، تاثیرپذیری زیاد روند جستجوها از اخبار و وقایع محیطی است. فرضا وقتی در خبرها می‌بینیم که یک جهش جدید در کرونا شناسایی شده، و این خبر وایرال می‌شود، احتمالا تعداد زیادی می‌خواهند ببینند که علایم ویروس جدید چیست؟ کاربرانی که لزوما آن علایم را ندارند.

مطمین هستم اگر شما هم فکر کنید می‌توانید مثال‌هایی از این جنس پیدا کنید.

اما هنوز برای نتیجه‌گیری کمی زود است. بیایید نگاهی به چند بررسی بیاندازیم.

بررسی چند مقاله

در ابتدا به زبان فارسی در وب جستجو کردم. مقالات سایت‌های داخلی، عموما حکم‌هایی شفاف داده بودند. مثلا ایسنا که تیتر زده بود که «گوگل نقاط شیوع ویروس کرونا را پیش بینی می‌کند» (+).

محققین داخلی هم بیکار ننشسته‌اند و با نگارش یک مقاله در جهاد دانشگاهی، با عنوان «پیش بینی اپیدمی کووید 19 با استفاده از روند جستجوی گوگل» (+) نهایتا نتیجه گرفته بودند که چون «در هر سه موج کووید-19، به اوج رسیدن جستجو در گوگل، 10 تا 20 روز زودتر از به اوج رسیدن تعداد فوتی ها روی داده» پس «از گوگل ترندز می‌توان به عنوان مکمل نظام سلامت بهره برد.» (این مقاله یک اشتباه کاملا فاحش و غیرقابل دفاع داشت که گفته بود ابزار گوگل ترندز حجم سرچ را با کل جستجوی کاربران در وب مقایسه می‌کند که کاملا غلط است / عکس).

از این دو منبع که بگذریم، دو منبع انگلیسی زبان با زبانی علمی‌تر به این موضوع پرداخته‌اند.

یاهو در بخش اخبار خود مقاله‌ای درباره این موضوع نوشته و در عنوان مقاله آورده «بررسی جستجوی کاربران درباره‌ی علایم گوارشی به پیش‌بینی موج کرونا در بعضی ایالت‌ها کمک کرده» و بلافاصله در همان تیتر تاکید می‌کند که «اما کارشناسان درباره استفاده از گوگل ترندز برای پیش‌بینی همه‌گیری کرونا هشدار می‌دهند» (+).

دقت کلامی تیتر واقعا لذت‌بخش است. در متن گزارش هم به جنبه‌های پنهان چنین تحلیلی پرداخته شده و اینکه یک سوال مهم و مجهول این است که واقعا نمی‌دانیم این ابزار در پیش‌بینی چقدر دقیق خواهد بود (و چقدر می‌تواند خطا ایجاد کند).

واشنگتن پست هم توییت یک کاربر درباره همخوانی نمودار «میزان ابتلای روزانه» و روند جستجوی «از دست رفتن حس چشایی» را بهانه‌ای قرار داده و در یک مقاله نسبتا طولانی، موضوع را بررسی کرده است.

این مقاله که چند ایالت امریکا را بررسی کرده، با این مقدمه شروع می‌شود که ما خیلی وقت‌ها دو چیز را که با هم کم و زیاد می‌شوند، به اشتباه به هم وابسته می‌بینیم (مثال معروف افزایش همزمان مصرف بستنی و دعوا در شهرهاست. که هر دو به گرمای هوا بستگی دارند و نه به هم!).

مقاله با بررسی دقیق دیتا در ایالت‌های مختلف ادامه پیدا می‌کند و در انتها نتیجه‌گیری می‌کند که طبق تحلیل اطلاعات، «بارها شاهد افزایش جستجوها در مورد از دست دادن حس چشایی یا بویایی، کمی قبل از افزایش موارد جدید اعلام شده کرونا در ایالات‌های مختلف بوده‌ایم» و البته بلافاصله تاکید می‌کند «البته این موضوع الزاما یک رابطه علیت نیست، هر چند سخت هست باور کنیم نباشد».

فکر می‌کنم به پاسخ سوال اصلی این متن نزدیک شده‌ایم.

به نظر می‌رسد حل مسئله‌های پیچیده با عوامل تاثیرگذار متعدد، مثل پیش‌بینی اوج‌گیری کرونا در یک منطقه یا کشور، با راهکارهای ساده چندان منطقی نباشد. اما به هر حال، دیدن تغییرات جستجو می‌تواند نشانه‌هایی در خود داشته باشد و به قول مقاله آورده شده در یاهو، به عنوان یکی از چندین شاخص، گاهی مورد استفاده قرار بگیرد.

پی‌نوشت‌ها:

(1) اشاره به کتاب همه دروغ می‌گویند (معرفی کتاب در متمم)

(2) در بررسی نمودارها لازم است از ابزارهای دقیق آماری برای پیدا کردن همبستگی استفاده کنیم. اما در اینجا هدف یک متن علمی نبوده و به یک روایت ساده‌سازی شده بسنده کرده‌ام.

پاسخی بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *