پارادوکس سیمپسون زمانی پیش می‌آید که روندی که در سطح گروه‌ها دیده می‌شود، با تجمیع داده‌ها ناپدید و یا کاملاً برعکس می‌شود. یکی از پر ارجاع‌ترین مقالات در این حوزه، به مقاله‌ای مربوط می‌شود که مسئله تبعیض جنسیتی در دانشگاه کالیفرنیا در برکلی را تحلیل و بررسی می‌کند. در سال ۱۹۷۱، از این دانشگاه شکایتی شد مبنی بر اینکه در پذیرش دانشجوی تحصیلات تکمیلی تبعیض جنسیتی بر ضد زنان قائل می‌شود. درصد پذیرش در بین زنان و مردان به نظر تبعیض‌آمیز می‌آمد؛ ۴۴ درصد متقاضیان مرد از این دانشگاه پذیرش گرفته بودند، درحالی‌که این عدد برای زنان ۳۵ درصد بود. به‌این‌ترتیب به نظر می‌آمد مردان با احتمال بیشتری شانس پذیرش داشتند. وقتی محققان شروع به بررسی شواهد بیشتری کردند، نکته غافلگیرکننده‌ای را متوجه شدند: وقتی داده‌ها در سطح هر دپارتمان تحلیل می‌شد، اثر چنین تبعیضی از بین می‌رفت. حتی تحلیل‌ها نشان می‌داد ازنظر معنی‌داری آماری کمی سوگیری به سمت زنان وجود داشت. پارادوکس سیمپسون (Simpson’s Paradox) در حالتی می‌تواند رخ دهد که حداقل سه متغیر در مسئله درگیر باشند: متغیری که توضیح داده می‌شود (یا متغیر وابسته)، متغیری که توضیح‌دهنده است و متغیر سومی که اگرچه مؤثر است، اثر آن مورد غفلت واقع می‌شود. پارادوکس سیمپسون زمانی حاصل می‌شود که اثر متغیر توضیح‌دهنده بر روی متغیر وابسته با در نظر گرفتن متغیر سوم برعکس می‌شود. این پدیده وقتی ادوارد سیمپسون (Edward H. Simpson) در مقاله خود در سال ۱۹۵۱ به آن اشاره کرد، موردتوجه قرار گرفت. گرچه پیش از او نیز آماردانان دیگری به آن اشاره کرده بودند.
همان‌طور که در مثال‌های بالا دیده می‌شود، در صورت بروز پارادوکس سیمپسون در داده‌ها، تصویر دوگانه‌ای پیش روی تصمیم‌گیر قرار می‌گیرد. یک مثال واقعی مربوط به یک مطالعه پزشکی برای سنجش میزان موفقیت دو روش درمان سنگ کلیه بوده است. آگاهی تصمیم‌گیر از امکان بروز پارادوکس سیمپسون وقتی وی به دنبال ارزیابی عملکرد گزینه‌هاست اهمیت پیدا می‌کند. شناسایی پارادوکس سیمپسون درحالی‌که شما هم به داده‌های کلان و هم داده‌های زیرگروه‌ها دسترسی دارید، نسبتاً آسان است. ولی پارادوکس سیمپسون وقتی اهمیت بیشتری پیدا می‌کند که شما بنا به هر دلیلی تصویر کاملی از مسئله نداشته باشید.  یک مدیر توانمند و باهوش بلافاصله با دیدن اطلاعات اولیه، حتی اگر تأییدکننده نظرش باشد، نتیجه‌گیری نمی‌کند. او همواره این احتمال را در نظر دارد که عواملی که خارج از دید هستند، ممکن است نتایج را مخدوش کنند. او می‌داند واقعیت‌هایی که می‌بیند، ممکن است همه واقعیت نباشند.
@EmadibaygiGleam

پارادوکس سیمپسون: وقتی واقعیت‌ها، همه واقعیت نیستند