در این مقاله قصد دارم یکسری تحلیل آماری بر روی شماره پلاک خودرو های ایران انجام بدم که صرفا حالت فان داره و کاربرد خاصی نداره. این رو همین اول گفتم که انتظار یه چیز خارق العاده نداشته باشید. صرفا یه بازی با اعداده!!خیلی سریع میرم سراغ اصل مطلب. در تصویر زیر نمونهای از یک پلاک خودرو را مشاهده میکنید :
همونطور که میبینید به ترتیب از چپ به راست یک عدد ۲ رقمی، یکی از حروف الفبا، یک عدد ۳ رقمی و در نهایت یک عدد ۲ رقمی دیگه رو داریم. اول بیاید ببینیم کلا چند تا حالت برای شماره پلاک خودرو میتونیم داشته باشیم؟ برای انجام این کار از جایگشت استفاده میکنیم.برای ۲ رقم اول ما میتونیم ۹۰ حالت مختلف رو داشته باشیم :
چه جوری اینجوری شد؟ کلا ۱۰ تا رقم داریم. در جایگاه اول نمیتونه صفر قرار بگیره. پس ۹ حالت رو داریم. اما در جایگاه دوم همه اعداد میتونن قرار بگیرن. به همین ترتیب، برای دو رقم آخر هم میتونیم ۹۰ حالت مختلف رو داشته باشیم. برای ۳ رقم بعدی هم به همین شکل میتونیم تعداد تمام حالت های ممکن رو پیدا کنیم :
تعداد حروف الفبای فارسی ۳۲ تاست. اما برای شماره پلاک خودرو ها از تمام این ۳۲ حرف استفاده نمیشه. حروفی که برای شماره پلاک خودرو ها استفاده میشه در جدول زیر نشون داده شده :
تعداد کل حروفی که در جدول بالا قرار داده شده ۲۶ تاست که ۲ تا از اونها حروف انگلیسی هستند.حالا میخوایم ببینم با این اوصاف کلا چند تا شماره پلاک میتونیم داشته باشیم؟ اگر تمام ۲۶ حرف الفبا رو در نظر بگیرم میتونیم ۱۸۹,۵۴۰,۰۰۰ پلاک مختلف داشته باشیم :
اگر حروف انگلیسی رو حذف کنیم، میتونیم ۱۷۴,۹۶۰,۰۰۰ شماره پلاک مختلف داشته باشیم :
اگر تمام حروف الفبای فارسی (۳۲ حرف) رو در نظر بگیریم، میتونیم ۲۳۳,۲۸۰,۰۰۰ شماره پلاک مختلف داشته باشیم :
نکته ای که در اینجا وجود داره اینه که به ازای هر یک از حروف الفبا، ما میتونیم ۷,۲۹۰,۰۰۰ شماره پلاک داشته باشیم :
اما در واقعیت ما واقعا ۷ میلیون ماشین پلیس، ارتش، دولتی و … نداریم. از طرفی، این پلاک ها چیزایی نیستند که مردم عادی بتونن بگیرن. پس من میام پلاک های خاص رو حذف میکنم. بنابراین اگر فقط پلاک های شخصی رو در نظر بگیریم، میتونیم ۹۴,۷۷۰,۰۰۰ شماره پلاک شخصی داشته باشیم :
حالا به کمک جدول زیر میخوام بررسی کنم که ظرفیت پلاک هر استان چقدره؟
تعداد شماره پلاک هایی به ازای هر کد منطقه میتونیم داشته باشیم ۱,۰۵۳,۰۰۰ عدد است :
پس اگر یه استانی ۴ تا کد منطقه داشته باشه، یعنی میتونیم ۴,۲۱۲,۰۰۰ شماره پلاک در اون استان داشته باشیم. نمودار زیر تعداد ظرفیت شماره پلاک هر استان را نشان میدهد :
اگر جمعیت هر استان را به ظرفیت شماره پلاک اون استان تقسیم کنیم و نمودار آن را رسم کنیم نتیجه به صورت زیر خواهد بود :
مثلا جمعیت استان خراسان رضوی ۶,۴۳۴,۵۰۱ نفر است. ظرفیت شماره پلاک این استان هم ۵,۲۶۵,۰۰۰ عدد است. اگر ۶,۴۳۴,۵۰۱ را بر ۵,۲۶۵,۰۰۰ تقسیم کنیم، نتیجه ۱.۲ میشود.حالا میخوام بررسی کنم آیا رابطهای بین جمعیت استان و تعداد پلاک اختصاص یافته به اون وجود داره یا نه؟ برای این کار از روش OLS رگرسیون خطی استفاده میکنم. در رگرسیون ما یک متغیر وابسته و یک متغیر مستقل داریم. در نقل قول زیر که از این لینک گرفته شده است تفاوت متغیر وابسته و مستقل بیان شده است :به عنوان مثال در حوادث مربوط به رانندگی در جادهها، عوامل وضعیت هوا، کیفیت جاده، وضعیت راننده، استحکام خودرو و زمان تصادف که متغیرهای پیشگو (مستقل) هستند، بر میزان خسارت که متغیر پاسخ (وابسته) است تاثیر میگذارند. نتیجه رگرسیون، معادلهای است که بهترین پیشگویی یک متغیر وابسته را از روی چند متغیر مستقل نشان میدهد.در این مسئله، جمعیت استان ها را متغیر مستقل و تعداد شماره پلاک ها را متغیر وابسته در نظر گرفتم. برای پیادهسازی روش OLS از کتابخانه statsmodels در پایتون استفاده کردم که نتایج آن به صورت زیر است :
برای اینکه درک بهتری داشته باشیم، نمودار Scatter آن را هم رسم کردم که در تصویر زیر نشان داده شده است:
معادله خط بالا به صورت زیر است :
y = 0.8175*x + 813400
که y متغیر وابسته (تعداد شماره پلاک ها) و x متغیر مستقل (جمعیت استان ها) است. برای مثال اگر جمعیت یه ۱۰۰ میلیون نفر برسد، این رابطه پیشبینی میکند که ۸۲,۵۶۳,۴۰۰ شماره پلاک خواهیم داشت.حالا سوالی که اینجا پیش میاد اینه که چند سال طول میکشه که این تعداد شماره پلاک تخصیص داده بشه؟ اول باید ببینیم آمار سالانه تولید خودرو چقدره؟ بر اساس جداولی که در این لینک وجود داره، میشه گفت که به صورت میانگین، روزانه ۲۵۰۰ خودرو در کل کشور تولید میشه. نمودار زیر نشون میده بر اساس ظرفیت شماره پلاک هر استان، چند سال طول میکشه تا تمام ظرفیت تخصیص داده بشه :
برای مثال، اگر روزانه ۲۵۰۰ خودرو پلاک بشه، ۱۳ سال طول میکشه تا ظرفیت شماره پلاک های استان تهران به اتمام برسه. البته نکته ای که در اینجا وجود داره اینه که این ۲۵۰۰ خودرو که در روز تولید میشه برای یک استان نیست و برای کل کشوره. پس برای اینکه نمودار دقیق تری داشته باشیم، این ۲۵۰۰ تا رو بین استان های مختلف تقسیم میکنم. مثلا اگر تهران ۱۷ درصد جمعیت کشور رو تشکیل میده، من میام فقط ۱۷ درصد ۲۵۰۰ (که میشه ۴۲۵) رو برای تهران در نظر میگیرم :
مثلا اگر روزانه ۴۲۵ خودرو در تهران تولید بشه، ۸۱ سال طول میکشه ظرفیت شماره پلاک هاش تموم بشه.این داستان ادامه دارد …