پارادوکس سیمپسون: وقتی واقعیتها، همه واقعیت نیستند!
پارادوکس سیمپسون زمانی پیش میآید که روندی که در سطح گروهها دیده میشود، با تجمیع دادهها ناپدید و یا کاملاً برعکس میشود. یکی از پر ارجاعترین مقالات در این حوزه، به مقالهای مربوط میشود که مسئله تبعیض جنسیتی در دانشگاه کالیفرنیا در برکلی را تحلیل و بررسی میکند. در سال ۱۹۷۱، از این دانشگاه شکایتی شد مبنی بر اینکه در پذیرش دانشجوی تحصیلات تکمیلی تبعیض جنسیتی بر ضد زنان قائل میشود. درصد پذیرش در بین زنان و مردان به نظر تبعیضآمیز میآمد؛ ۴۴ درصد متقاضیان مرد از این دانشگاه پذیرش گرفته بودند، درحالیکه این عدد برای زنان ۳۵ درصد بود. بهاینترتیب به نظر میآمد مردان با احتمال بیشتری شانس پذیرش داشتند. وقتی محققان شروع به بررسی شواهد بیشتری کردند، نکته غافلگیرکنندهای را متوجه شدند: وقتی دادهها در سطح هر دپارتمان تحلیل میشد، اثر چنین تبعیضی از بین میرفت. حتی تحلیلها نشان میداد ازنظر معنیداری آماری کمی سوگیری به سمت زنان وجود داشت. پارادوکس سیمپسون (Simpson’s Paradox) در حالتی میتواند رخ دهد که حداقل سه متغیر در مسئله درگیر باشند: متغیری که توضیح داده میشود (یا متغیر وابسته)، متغیری که توضیحدهنده است و متغیر سومی که اگرچه مؤثر است، اثر آن مورد غفلت واقع میشود. پارادوکس سیمپسون زمانی حاصل میشود که اثر متغیر توضیحدهنده بر روی متغیر وابسته با در نظر گرفتن متغیر سوم برعکس میشود. این پدیده وقتی ادوارد سیمپسون (Edward H. Simpson) در مقاله خود در سال ۱۹۵۱ به آن اشاره کرد، موردتوجه قرار گرفت. گرچه پیش از او نیز آماردانان دیگری به آن اشاره کرده بودند.
همانطور که در مثالهای بالا دیده میشود، در صورت بروز پارادوکس سیمپسون در دادهها، تصویر دوگانهای پیش روی تصمیمگیر قرار میگیرد. یک مثال واقعی مربوط به یک مطالعه پزشکی برای سنجش میزان موفقیت دو روش درمان سنگ کلیه بوده است. آگاهی تصمیمگیر از امکان بروز پارادوکس سیمپسون وقتی وی به دنبال ارزیابی عملکرد گزینههاست اهمیت پیدا میکند. شناسایی پارادوکس سیمپسون درحالیکه شما هم به دادههای کلان و هم دادههای زیرگروهها دسترسی دارید، نسبتاً آسان است. ولی پارادوکس سیمپسون وقتی اهمیت بیشتری پیدا میکند که شما بنا به هر دلیلی تصویر کاملی از مسئله نداشته باشید. یک مدیر توانمند و باهوش بلافاصله با دیدن اطلاعات اولیه، حتی اگر تأییدکننده نظرش باشد، نتیجهگیری نمیکند. او همواره این احتمال را در نظر دارد که عواملی که خارج از دید هستند، ممکن است نتایج را مخدوش کنند. او میداند واقعیتهایی که میبیند، ممکن است همه واقعیت نباشند.
@EmadibaygiGleam