دیدار اتفاقی یک دوست حدود دو هفته پیش، که بزودی مشخص شد «کرونا مثبت» است، باعث شد به این فکر کنم که «نکند من هم کرونا گرفتهام؟» و یکی از اولین کارها، رفتن به سراغ گوگل بود. اما لحظاتی بعد از چند جستجوی اولیه، به این فکر کردم که روند جستجوی بقیه مردم درباره موضوعات کرونایی چطور بوده؟ – ایده نگارش این متن از همینجا آمد.
کمی که بررسی کردم، فکر کردم میتوان با سوالی متفاوت به داستان نگاه کرد. اینکه میشود از روند جستجوها، به الگو و مفهومی رسید؟ مگر نه اینکه همه دروغ میگویند، بجز گوگل؟ (1)
پس در اینجا، اول نگاهی به دیتای گوگل ترندز میاندازیم تا روند سرچ درباره کرونا را در طول زمان ببینیم. بعد سعی میکنیم ببینیم آیا میشود از دل تحلیل این دیتا، معنا و مفهومی بیرون آورد یا نه؛ و در انتها گریزی به نظرات و تجربیات بینالمللی زده و به این سوال نسبتا جذاب میرسیم که:
آیا میشود از تحلیل بیگ دیتای گوگل ترندز، موجهای کرونا را پیشبینی کرد؟
قبل از شروع این را بگویم که بجز چند روز سردرد خفیف، علایم دیگری – خوشبختانه – در من بروز نکرد. اطلاع نسبتا زود از احتمال مبتلا بودن و رعایت زیاد، شاید در وخیم نشدن حالم موثر بوده یا شاید هم آن علایم خفیف اصلا کرونا نبوده. به هر حال، الان که این مطلب را مینویسم، چندین روز هم از آن سردردها گذشته است. – پرانتز بسته!
سادهترین بخش، همان ایدهی اولیه نوشتن این متن است: مردم چه چیزهایی را درباره کرونا گوگل میکنند؟ تحلیل گوگل ترندز میگوید که اینها از پرتکرارترین جستجوها بوده:
البته طبیعتا همه این موارد همزمان در گوگل داغ نشدهاند و حوادث جامعه و اخبار سیاسی و اقتصادی، در جستجوی آنها توسط کاربران موثر بوده. مثلا در اولین قرنطینه سراسری در نوروز ۹۹، ایده حمایت از کسبوکارهای آسیبدیده از کرونا بیشتر مورد توجه قرار گرفت و در ماههای اخیر، موضوع واکسن داغ شد.
اما بیایید چند روند جستجو را که برایم جالبتر بوده، با هم ببینیم.
اولین کلمه کلیدی که درباره کرونا میتوانیم بررسی کنیم، خود عنوان این بیماری یعنی «کرونا» است (نمودار قرمز)؛ و برای مقایسه، آن را با یک عبارت که تقریبا همیشه میزان سرچ ثابتی دارد یکجا ببینیم: «دانلود فیلم» (نمودار آبی).
آن قله بزرگ نمودار قرمز رنگ (کرونا) حجم جستجو در هفته بعد از انتخابات مجلس در اسفندماه ۹۸ بوده. پیک نمودار آبی (دانلود فیلم) هم به چند روز بعد یعنی حوالی ۲۰ اسفند تا ۱۰ فروردین برمیگردد که همان اولین قرنطینه سراسری کرونا در ایران بود.
شاید برایتان جالب باشد که بیشترین جستجو برای دانلود فیلم در تاریخ وب فارسی هم با اختلاف زیاد، همین بازه بوده و نسبت به رکورد قبلی سرچ کاربران، بیشتر از ۴۰٪ بیشتر شده است! میتوان گفت که گروه بزرگی از مردم در قرنطینه اول بیشتر از همیشه فیلم دیدند.
اگر از کلیدواژه «کرونا» بگذریم که یک کلیدواژه عمومی است، موضوعات درباره کرونا میتوانند جالب باشند. بیایید یک سناریو محتمل را حدس بزنیم.
حدس اینکه وقتی کسی احساس بیماری کرد، اول علایم بیماری را سرچ میکند تا ببیند آیا بیمار شده یا نه. کمی بعد با ادامه علایم، به دنبال مواد خوراکی مفید برای کرونا میگردد و در روزهای آتی، تعداد کمتری از همین افراد با وخیم شدن حالشان به دنبال بیمارستان برای کرونا خواهند بود.
در ادامه نمودارهای را با هم بررسی کنیم. اما همینجا بر یک فرض که در پاراگراف قبل بطور تلویحی مطرح شد تاکید میکنم:
فرض اینکه میتوان از روی جستجوهای کاربران در گوگل، زمان و میزان شلوغی بیمارستانها را پیشبینی کرد.
نمودارها را با هم ببینیم. با این توضیح که برای دیدن بهتر جزئیات، نمودارهای بعدی بر روی یکسال اخیر یعنی از شهریور 99 تا شهریور 1400 هستند و در این مدت ایران سه موج ابتلا به کرونا را پشت سر گذاشته: در پاییز 99 (موج سوم)، در بهار 1400 (موج چهارم) و در تابستان 1400 (موج پنجم).
در نمودار زیر علایم کرونا را با رنگ آبی و [خوراکیهای] مفید برای کرونا را با رنگ قرمز میبینید.
به نظر میرسد در اینجا قلهها در نمودار آبی توانسته تا حدی قله نمودار قرمز رنگ را پیشبینی کند. یعنی افزایش و به اوج رسیدن جستجوی کاربران درباره «[خوراکیهای] مفید برای کرونا» حدودا یک هفته بعد از به اوج رسیدن جستجو درباره علایم کرونا بوده است.
اما نمودار مهمتر، درباره جستجو برای بیمارستانهای کروناست که در نمودار زیر با رنگ قرمز آمده است (علایم کرونا مثل قبل، رنگ آبی است).
در این نمودار ارتباطات کمی پنهانتر شده، ولی در موجهای چهارم و پنجم کرونا، در دو نقطه مشخصا نمودار آبی (علایم)، پیشبینیکننده نمودار قرمز (بیمارستان) بوده است. همچنین کاهش نمودار آبی (علایم)، توانسته تا حد خوبی نوید بخش کاهش نمودار قرمز (بیمارستان) در یک یا دو هفته آینده باشد (2).
شاید با خودتان فکر کنید که این دو نمودار نشان میدهد فرض بالاتر گفته شده، ثابت شده است. اما کمی صبر کنید.
یک نمودار دیگر هم هست که شاید شما هم به یاد آن افتاده باشید: روند ابتلای روزانه به کرونا. این نمودار با یک گوگل ساده در دسترس هست (عکس: +).
اگر دو روند «جستجوی کاربران درباره علایم کرونا» و «تعداد ابتلای روزانه» را با هم مقایسه کنیم، در همان نگاه نخست به یک نکته عجیب میرسیم. اینکه تعداد ابتلای روزانه در موج پنجم کرونا خیلی بیشتر از موج چهارم بوده، و در موج چهارم هم به نحو محسوسی بیشتر از موج سوم. اما چرا میزان جستجو درباره علایم کرونا چنین روندی را دنبال نکرده است؟
ممکن است بگویید خب کسانی که در موجهای قبلی به دنبال علایم کرونا بودند، دیگر علایم را بلدند و وقتی مبتلا شدند دیگر آن را در گوگل سرچ نکردند. اما اگر اینطور باشد یک تردید جدی به روش حل مسئله وارد میشود. یعنی تعداد مبتلایان جدید، در آینده هم کمتر و کمتر با تعداد افرادی که علایم کرونا را گوگل میکنند، همبستگی خواهد داشت – که با روش حل مسئله تناقض دارد (چون ما در ابتدا فرض کردیم هر کسی که علایم کرونا داشت، آن را در گوگل سرچ میکند).
البته ممکن هم هست بگویید: آمار در موج چهارم دقیق نبوده. یا کلا درست نیست. که البته با توجه به بعضی گزارشهای رسمی، چندان بیراه نیست.
نکته اینجاست که احتمالا رفتار ویروس هم در طول زمان ثابت نبوده.
و نکته مهمتر، تاثیرپذیری زیاد روند جستجوها از اخبار و وقایع محیطی است. فرضا وقتی در خبرها میبینیم که یک جهش جدید در کرونا شناسایی شده، و این خبر وایرال میشود، احتمالا تعداد زیادی میخواهند ببینند که علایم ویروس جدید چیست؟ کاربرانی که لزوما آن علایم را ندارند.
مطمین هستم اگر شما هم فکر کنید میتوانید مثالهایی از این جنس پیدا کنید.
اما هنوز برای نتیجهگیری کمی زود است. بیایید نگاهی به چند بررسی بیاندازیم.
در ابتدا به زبان فارسی در وب جستجو کردم. مقالات سایتهای داخلی، عموما حکمهایی شفاف داده بودند. مثلا ایسنا که تیتر زده بود که «گوگل نقاط شیوع ویروس کرونا را پیش بینی میکند» (+).
محققین داخلی هم بیکار ننشستهاند و با نگارش یک مقاله در جهاد دانشگاهی، با عنوان «پیش بینی اپیدمی کووید 19 با استفاده از روند جستجوی گوگل» (+) نهایتا نتیجه گرفته بودند که چون «در هر سه موج کووید-19، به اوج رسیدن جستجو در گوگل، 10 تا 20 روز زودتر از به اوج رسیدن تعداد فوتی ها روی داده» پس «از گوگل ترندز میتوان به عنوان مکمل نظام سلامت بهره برد.» (این مقاله یک اشتباه کاملا فاحش و غیرقابل دفاع داشت که گفته بود ابزار گوگل ترندز حجم سرچ را با کل جستجوی کاربران در وب مقایسه میکند که کاملا غلط است / عکس).
از این دو منبع که بگذریم، دو منبع انگلیسی زبان با زبانی علمیتر به این موضوع پرداختهاند.
یاهو در بخش اخبار خود مقالهای درباره این موضوع نوشته و در عنوان مقاله آورده «بررسی جستجوی کاربران دربارهی علایم گوارشی به پیشبینی موج کرونا در بعضی ایالتها کمک کرده» و بلافاصله در همان تیتر تاکید میکند که «اما کارشناسان درباره استفاده از گوگل ترندز برای پیشبینی همهگیری کرونا هشدار میدهند» (+).
دقت کلامی تیتر واقعا لذتبخش است. در متن گزارش هم به جنبههای پنهان چنین تحلیلی پرداخته شده و اینکه یک سوال مهم و مجهول این است که واقعا نمیدانیم این ابزار در پیشبینی چقدر دقیق خواهد بود (و چقدر میتواند خطا ایجاد کند).
واشنگتن پست هم توییت یک کاربر درباره همخوانی نمودار «میزان ابتلای روزانه» و روند جستجوی «از دست رفتن حس چشایی» را بهانهای قرار داده و در یک مقاله نسبتا طولانی، موضوع را بررسی کرده است.
این مقاله که چند ایالت امریکا را بررسی کرده، با این مقدمه شروع میشود که ما خیلی وقتها دو چیز را که با هم کم و زیاد میشوند، به اشتباه به هم وابسته میبینیم (مثال معروف افزایش همزمان مصرف بستنی و دعوا در شهرهاست. که هر دو به گرمای هوا بستگی دارند و نه به هم!).
مقاله با بررسی دقیق دیتا در ایالتهای مختلف ادامه پیدا میکند و در انتها نتیجهگیری میکند که طبق تحلیل اطلاعات، «بارها شاهد افزایش جستجوها در مورد از دست دادن حس چشایی یا بویایی، کمی قبل از افزایش موارد جدید اعلام شده کرونا در ایالاتهای مختلف بودهایم» و البته بلافاصله تاکید میکند «البته این موضوع الزاما یک رابطه علیت نیست، هر چند سخت هست باور کنیم نباشد».
فکر میکنم به پاسخ سوال اصلی این متن نزدیک شدهایم.
به نظر میرسد حل مسئلههای پیچیده با عوامل تاثیرگذار متعدد، مثل پیشبینی اوجگیری کرونا در یک منطقه یا کشور، با راهکارهای ساده چندان منطقی نباشد. اما به هر حال، دیدن تغییرات جستجو میتواند نشانههایی در خود داشته باشد و به قول مقاله آورده شده در یاهو، به عنوان یکی از چندین شاخص، گاهی مورد استفاده قرار بگیرد.
پینوشتها:
(1) اشاره به کتاب همه دروغ میگویند (معرفی کتاب در متمم)
(2) در بررسی نمودارها لازم است از ابزارهای دقیق آماری برای پیدا کردن همبستگی استفاده کنیم. اما در اینجا هدف یک متن علمی نبوده و به یک روایت سادهسازی شده بسنده کردهام.