خبرگزاري انتخاب :صحبت از تقلب در انتخابات تنها یک موضوع مختص به ایران و حتی کشورهای در حال توسعه نظیر ونزوئلا، مکزیک، و زیمباوه نیست و در سال 2000 شاهد بودیم که بحث تقلب در انتخابات ریاست جمهوری در ایالت فلوریدا به موضوع داغ آنروزها بدل شده بود. به هر حال آنچه مسلم است آنکه اهمیت سیاست و موضوع تقلب در انتخابات سبب شده که دانشمندان علم آمار با استفاده از کمترین داده های موجود از انتخابات روشهای آماری را طراحی کنند که با کمک آن بتوان با صراحت در مورد سلامت انتخابات اظهار نظر نمایند.
خبرگزاری انتخاب:
توضیح انتخاب: این مطلب اختصاصا در انتخاب برای آگاهی شورای محترم نگهبان و نامزدهای دهمین دوره انتخابات ریاست جمهوری درج می گردد و مستنداتی ارائه می دهد که قابل پیگیری در علم آمار است.
طی چند روز گذشته بحثهای فراوانی در خصوص امکان و احتمال تقلب در انتخابات ایران بعمل آمده است. با توجه به اینکه بازشماری آراء کاری پرزحمت برای دستگاه اجرایی و نظارتی انتخابات خواهد بود باید، کاندیدا های معترض شواهد و مستندات قابل قبولی را به این مراجعه اعلام نمایند تا دستکاری در نتایج انتخابات را آشکارا نشان دهد. گرچه اشاره به فرایندهای پرمسئله انتخابات مثل عدم استفاده برابر از امکانات ملی ، مداخله نیروهای نظامی در انتخابات، دستکاری در آراء شهروندان با روشهای مختلف ، همه و همه مستندات خوبی برای نشان دادن میزان تخلفات در انتخابات است اما به نظر میرسد راههای علمی زیادی وجود دارد که با استفاده از آمارهای اعلام شده توسط وزارت کشور این دستکاری ها در صورت وجود به نمایش گذاشته شود.
صحبت از تقلب در انتخابات تنها یک موضوع مختص به ایران و حتی کشورهای در حال توسعه نظیر ونزوئلا، مکزیک، و زیمباوه نیست و در سال 2000 شاهد بودیم که بحث تقلب در انتخابات ریاست جمهوری در ایالت فلوریدا به موضوع داغ آنروزها بدل شده بود. به هر حال آنچه مسلم است آنکه اهمیت سیاست و موضوع تقلب در انتخابات سبب شده که دانشمندان علم آمار با استفاده از کمترین داده های موجود از انتخابات روشهای آماری را طراحی کنند که با کمک آن بتوان با صراحت در مورد سلامت انتخابات اظهار نظر نمایند. یکی از معمول ترین این روشها روشی است که از قانون بن فورد (Benford’s Law) پیروی میکند (علاقه مندان به مطالعه بیشتر در این خصوص را به دایره المعارف Wikipedia ارجاع میدهم و از دوستان آمار شناس و محققین علوم سیاسی را به مراجع انتهای مقاله ارجاع میدهم). بطور خیلی مختصر و قابل درک برای همه عزیزان این قانون به آن اشاره دارد که رقمهای مربوط به یک عدد (خواه یک رقمی یا بیش از یک رقمی) حاصل از شمارش یک پدیده در جهان خارج (جهان واقعی) از توزیع نرمال (Normal distribution) یا توزیع یک فرم (Uniform distribution) پیروی نمیکند بلکه از توزیعی شبیه توزیع Chi Square پیروی میکند. آقای بن فورد احتمال این اعداد را برای حوادثی چون انتخابات محاسبه کرده است. قابل ذکر است که اعداد ذکر شده در قانون بن فورد همانند قوانین نیوتن یک واقعیت علمی است و در حال حاضر علاوه بر مسئله انتخابات، برای رسیدگی به احتمال تقلب در سود سهام شرکتها و مسائل مالیاتی نیز از همین روش استفاده میشود.
اجازه بدهید چند خط از این مقاله را به توضیح ساده این قانون بپرادزم. در این قانون احتمال اینکه آخرین عدد سمت راست یک عدد (فرض کنید تعداد آراء اخذ شده به نفع یک کاندیدا) که میتواند یکی از اعداد 1 تا 9 باشد با هم برابر نیست. بلکه احتمال آنکه رقم سمت راست یک عدد، 1 باشد حدود 30% است در حالی که این احتمال برای عدد 9 در حدود 4.5%. همچنین است احتمال وجود عدد 0 تا 9 برای دومین رقم سمت راست تعداد آراء اخذ شده به نفع یک کاندیدا. بسیاری از منابع علمی دومین رقم سمت راست تعداد آراء اخذ شده به نفع یک کاندیدا در یک شهرستان را بعنوان معیار اندازه گیری تقلب در انتخابات تعیین میکنند و به آن 2nd digit Benford’s Law می گویند و دلیل آن این است که اگر تقلب بوسیله نرم افزارهای شبیه سازی انجام شده است امکان دارد که رقم اول با قانون بن فورد همخوانی داشته باشد اما امکان دستکاری آرا و هماهنگ کردن آن با دومین رقم سمت راست فراهم نیست شما در شکل 1 احتمال اعداد را بر اساس قانون بن فورد میبینید.
ال که وزارت کشور جمهوری اسلامی ایران آمار تفکیکی شهرستان ها را اعلام نموده است کافی است ببینیم که فراوانی اعداد 0 تا 9 موجود (Observed) در دومین رقم سمت راست اعلام شده برای هر کاندیدا(تعداد موجود برای هر عدد 0 تا 9) چقدر است و سپس فراوانی اعداد 0 تا 9 را برای حالت مورد انتظار(ٍExpected) که اعداد بر حسب قانون بن فورد توزیع میشوند( تعداد مورد انتظار برای هر عدد 0 تا 9) نیز محاسبه کنیم. و در آخرین قدم با استفاده از فرمول Calculated Chi Square میزان اختلاف بین تعداد موجود و تعداد مورد انتظار را بررسی میکنیم تا ببینیم این اختلاف یک اختلاف معنی دار است یا خیر. اگر Chi square Calculated بیش از 1.69 باشد(P value >0.05) یعنی به احتمال 95% اعداد دستکاری شده است و در آمار این درصد به معنی قطعیت یک امر شناخته میشود. هرچقدر این عدد بزرگتر باشد نشاندهنده آنست که احتمال دستکاری از 95% بیشتر است.
برای روشن شدن منظور از دومین عدد سمت راست آرای اخذ شده به نفع هر یک از کاندیدا ها یک مثال آورده میشود. در داده های وزارت کشور بعنوان مثال تعداد آرا اخذ شده به نفع آقای احمدی نژاد، رضایی، کروبی، و موسوی در شهر تهران به ترتیب 1809855، 95211، 43073، و 2166245 بوده است و دومین رقم سمت راست این اعداد به ترتیب 8، 5، 3 و 1 خواهد بود.
حال اجازه دهید تا مراحلی را که مورد بحث قرار گرفت را یک به یک اجرا کنیم:
1. قدم اول فراوانی اعداد 0 تا 9 موجود (Observed) در دومین رقم سمت راست آرا اخذ شده به نفع هر یک از کاندیدا ها برای 366 شهر اعلام شده توسط وزارت کشور. تصویر کامل جدول شماره یک
خبرگزاری انتخاب:
توضیح انتخاب: این مطلب اختصاصا در انتخاب برای آگاهی شورای محترم نگهبان و نامزدهای دهمین دوره انتخابات ریاست جمهوری درج می گردد و مستنداتی ارائه می دهد که قابل پیگیری در علم آمار است.
طی چند روز گذشته بحثهای فراوانی در خصوص امکان و احتمال تقلب در انتخابات ایران بعمل آمده است. با توجه به اینکه بازشماری آراء کاری پرزحمت برای دستگاه اجرایی و نظارتی انتخابات خواهد بود باید، کاندیدا های معترض شواهد و مستندات قابل قبولی را به این مراجعه اعلام نمایند تا دستکاری در نتایج انتخابات را آشکارا نشان دهد. گرچه اشاره به فرایندهای پرمسئله انتخابات مثل عدم استفاده برابر از امکانات ملی ، مداخله نیروهای نظامی در انتخابات، دستکاری در آراء شهروندان با روشهای مختلف ، همه و همه مستندات خوبی برای نشان دادن میزان تخلفات در انتخابات است اما به نظر میرسد راههای علمی زیادی وجود دارد که با استفاده از آمارهای اعلام شده توسط وزارت کشور این دستکاری ها در صورت وجود به نمایش گذاشته شود.
صحبت از تقلب در انتخابات تنها یک موضوع مختص به ایران و حتی کشورهای در حال توسعه نظیر ونزوئلا، مکزیک، و زیمباوه نیست و در سال 2000 شاهد بودیم که بحث تقلب در انتخابات ریاست جمهوری در ایالت فلوریدا به موضوع داغ آنروزها بدل شده بود. به هر حال آنچه مسلم است آنکه اهمیت سیاست و موضوع تقلب در انتخابات سبب شده که دانشمندان علم آمار با استفاده از کمترین داده های موجود از انتخابات روشهای آماری را طراحی کنند که با کمک آن بتوان با صراحت در مورد سلامت انتخابات اظهار نظر نمایند. یکی از معمول ترین این روشها روشی است که از قانون بن فورد (Benford’s Law) پیروی میکند (علاقه مندان به مطالعه بیشتر در این خصوص را به دایره المعارف Wikipedia ارجاع میدهم و از دوستان آمار شناس و محققین علوم سیاسی را به مراجع انتهای مقاله ارجاع میدهم). بطور خیلی مختصر و قابل درک برای همه عزیزان این قانون به آن اشاره دارد که رقمهای مربوط به یک عدد (خواه یک رقمی یا بیش از یک رقمی) حاصل از شمارش یک پدیده در جهان خارج (جهان واقعی) از توزیع نرمال (Normal distribution) یا توزیع یک فرم (Uniform distribution) پیروی نمیکند بلکه از توزیعی شبیه توزیع Chi Square پیروی میکند. آقای بن فورد احتمال این اعداد را برای حوادثی چون انتخابات محاسبه کرده است. قابل ذکر است که اعداد ذکر شده در قانون بن فورد همانند قوانین نیوتن یک واقعیت علمی است و در حال حاضر علاوه بر مسئله انتخابات، برای رسیدگی به احتمال تقلب در سود سهام شرکتها و مسائل مالیاتی نیز از همین روش استفاده میشود.
اجازه بدهید چند خط از این مقاله را به توضیح ساده این قانون بپرادزم. در این قانون احتمال اینکه آخرین عدد سمت راست یک عدد (فرض کنید تعداد آراء اخذ شده به نفع یک کاندیدا) که میتواند یکی از اعداد 1 تا 9 باشد با هم برابر نیست. بلکه احتمال آنکه رقم سمت راست یک عدد، 1 باشد حدود 30% است در حالی که این احتمال برای عدد 9 در حدود 4.5%. همچنین است احتمال وجود عدد 0 تا 9 برای دومین رقم سمت راست تعداد آراء اخذ شده به نفع یک کاندیدا. بسیاری از منابع علمی دومین رقم سمت راست تعداد آراء اخذ شده به نفع یک کاندیدا در یک شهرستان را بعنوان معیار اندازه گیری تقلب در انتخابات تعیین میکنند و به آن 2nd digit Benford’s Law می گویند و دلیل آن این است که اگر تقلب بوسیله نرم افزارهای شبیه سازی انجام شده است امکان دارد که رقم اول با قانون بن فورد همخوانی داشته باشد اما امکان دستکاری آرا و هماهنگ کردن آن با دومین رقم سمت راست فراهم نیست شما در شکل 1 احتمال اعداد را بر اساس قانون بن فورد میبینید.
ال که وزارت کشور جمهوری اسلامی ایران آمار تفکیکی شهرستان ها را اعلام نموده است کافی است ببینیم که فراوانی اعداد 0 تا 9 موجود (Observed) در دومین رقم سمت راست اعلام شده برای هر کاندیدا(تعداد موجود برای هر عدد 0 تا 9) چقدر است و سپس فراوانی اعداد 0 تا 9 را برای حالت مورد انتظار(ٍExpected) که اعداد بر حسب قانون بن فورد توزیع میشوند( تعداد مورد انتظار برای هر عدد 0 تا 9) نیز محاسبه کنیم. و در آخرین قدم با استفاده از فرمول Calculated Chi Square میزان اختلاف بین تعداد موجود و تعداد مورد انتظار را بررسی میکنیم تا ببینیم این اختلاف یک اختلاف معنی دار است یا خیر. اگر Chi square Calculated بیش از 1.69 باشد(P value >0.05) یعنی به احتمال 95% اعداد دستکاری شده است و در آمار این درصد به معنی قطعیت یک امر شناخته میشود. هرچقدر این عدد بزرگتر باشد نشاندهنده آنست که احتمال دستکاری از 95% بیشتر است.
برای روشن شدن منظور از دومین عدد سمت راست آرای اخذ شده به نفع هر یک از کاندیدا ها یک مثال آورده میشود. در داده های وزارت کشور بعنوان مثال تعداد آرا اخذ شده به نفع آقای احمدی نژاد، رضایی، کروبی، و موسوی در شهر تهران به ترتیب 1809855، 95211، 43073، و 2166245 بوده است و دومین رقم سمت راست این اعداد به ترتیب 8، 5، 3 و 1 خواهد بود.
حال اجازه دهید تا مراحلی را که مورد بحث قرار گرفت را یک به یک اجرا کنیم:
1. قدم اول فراوانی اعداد 0 تا 9 موجود (Observed) در دومین رقم سمت راست آرا اخذ شده به نفع هر یک از کاندیدا ها برای 366 شهر اعلام شده توسط وزارت کشور. تصویر کامل جدول شماره یک
Last edited by پـارسـیـــان on 22/6/2009, 18:43; edited 2 times in total