قطعا میدونید عدد π چیه؟! نمیدونید؟3.1415926535897932384626433832795028841971693993751058209749445923078164062862089986280348253421170679821480865132823066470938446095505822317253594081284811174502841027019385211055596446229489549303819644288109756659334461284756482337867831652712019091456485669234603486104543266482133936072602491412737245870066063155881748815209209628292540917153643678925903600113305305488204665213841469519415116094330572703657595919530921861173819326117931051185480744623799627495673518857527248912279381830119491یادتون اومد؟ نه؟!!!

از نظر تئوری، احتمال یافتن هر رشته عددی (حداقل در طول‌های کوتاه) در میان ارقام عدد پی و هر عدد متعالی دیگر، غیر صفر است. مثلا تاریخ تولد میلادی، خورشیدی یا قمری همه ما در میان ارقام عدد پی، قابل یافت است. همین طور، شماره موبایل و شماره ملی [https://vrgl.ir/xgoJ1]یکی از مواردی که نظر من رو به خودش جلب کرد پیدا کردم اسامی/کلمات در عدد پی بود. مثلا با استفاده از این سایت می‌تونید کلمات مختلف انگلیسی رو در عدد پی پیدا کنید. صبر کنید! چی شد؟! کلمه؟! عدد پی؟! چطور ممکنه؟خیلی ساده! میان و عدد پی رو در مبنای ۲۶ (تعداد حروف انگلیسی) نشون میدن! تبدیل مبنا ها چه جوری انجام میشه؟ برای اینکه یک عدد در مبنای ۱۰ رو به مبنای ۲۶ ببریم، باید مرتبا عدد مبنای ۱۰ خودمون رو بر ۲۶ تقسیم کنیم. این کار رو انقدر ادامه میدیم تا خارج قسمت صفر بشه. وقتی خارج قسمت صفر شد، باقیمانده ها رو از چپ به راست (پایین به بالا) مینویسم. مثلا عدد ۵۲۲ رو در نظر بگیرید.

522÷26   خارج قسمت : 20    -    باقیمانده: 2
20÷26     خارج قسمت : 0    -    باقیمانده: 20

معادل هر کدوم از حروف الفبای انگلیسی به صورت زیره :

A=0, B=1, C=2, D=3, ..., T=19, U=20, V=21, W=22, X=23, Y=24,Z=25

پس عدد ما در مبنای ۲۶ میشه U2اگر این کار رو برای عدد پی انجام بدیم نتیجه به صورت زیر میشه :D.DRSQLOLYRTRODNLHNQTGKUDQGTUIRXNEQBCKBSZIVQQVGDMELMUEXRO IQIY ALVUZVEB MIJPQQXLKPLRNCP WJPBY!1GGOHJMMQIS MS …مقاله اصلی در این زمینه رو میتونید از این لینک بخونید.حالا من با خودم گفتم چرا همین کار رو با حروف الفبای فارسی انجام ندیم؟! فقط کافیه عدد رو به مبنای ۳۲ ببریم. فقط کافیه یک نگاشت از باقیمانده ها (۰ تا ۳۱) حروف الفبای فارسی (الف تا ی) انجام بدم :

الف=۰، ب=۱، ...، ه=۲۹،  ی=۳۰

من عملیات جستجو رو فقط روی ۱ میلیون رقم اول عدد پی انجام میدم. چون طول های بزرگتر خیییلی طول میکشه. این ۱ میلیون رقم رو از این لینک دانلود کردم و با روش بالا به مبنای ۳۲ بردم که نتیجه به صورت زیر شد:

ت.ثصیفغپثجعزثژچثکگضخقاچنتظخططاطسبپجچشظتعاخجمودضمپسژطثعذذببنکنژاثمققگذچژظگعوثچچگصجزجچمنطیپصمعیکد

حالا باید یک لیست از کلمات فارسی داشته باشیم که من از این لیست استفاده میکنم که شامل ۷۵۰ هزار کلمه است. با توجه به اینکه تمام حروف به هم چسبیده هستند، بنابراین تمام فاصله ها و نیم‌فاصله ها در کلمات رو حذف کردم. کلمات تکراری رو هم حذف کردم که در نتیجه لیست ما الان ۴۲۱,۵۴۷ کلمه داره.حالا بریم سراغ تحلیل کلمات! همونطور که در تصویر زیر هم می‌بینید توزیع حروف الفبای فارسی تقریبا به صورت یکنواخت بوده :

نمودار تعداد تکرار حروف الفبای فارسی در عدد پی

نمودار زیر تعداد تکرار کلمات n حرفی (n از ۱ تا ۶) رو نشون میده :

تعداد تکرار کلمات ۸ حرفی به بالا صفر بود! اون ۵ کلمه ۷ حرفی موارد زیر بودند :

  • وتقریبا
  • گستردست
  • جانانیم
  • الماسست
  • سخن‌گستر

به جز کلمه سخن‌گستر بقیه خیلی کلمات جالب و معنی داری نیستند! لیست کامل تمام کلمات به همراه تعداد تکرارشون رو در لینک زیر قرار دادم :

https://gist.github.com/vahidbaghi/26c0cdf825bc01edc41c295661054248

حالا میخوام بررسی کنم تعداد تکرار هر کدوم از اسم های ایرانی در عدد پی به چه صورتی بوده؟! ابتدا باید لیست نام های ایرانی رو داشته باشیم که من این اسامی رو از سایت ثبت احوال قبلا استخراج کرده بودم :

https://gist.github.com/vahidbaghi/31070ed61318cd828442e99a83bc73d1

ابر کلماتشون به صورت زیر میشه :

لیست کامل رو در لینک زیر قرار دادم :

https://gist.github.com/vahidbaghi/9ceafd7aa807a055254e6ddf523c1f3c