مفاهیم مقدماتی آمار و توزیع نرمال
در نخستین مقاله از سری مقالات مرتبط با آمار و ریاضی به شرح و بررسی «مفاهیم مقدماتی آمار و توزیع نرمال» میپردازیم.
– – –
آمار
مفاهیم آماری در بررسی و آنالیز بازار سهام، بورس، آتی سکه، بازارهای جهانی و ارز بسیار پرکاربرد هستند. دادهها به خودی خود چیزی بیشتر از اعداد نیستند، اما با استفاده از مفاهیم و روش آماری میتوانیم این دادههای خام را درک کنیم و از آنها بهرهی مورد نیاز را ببریم. در مقاله پیش رو به معرفی مفاهیم مقدماتی آمار خواهیم پرداخت و در مقالات بعدی به تفصیل روشهای متعدد آماری و کاربردهای متنوع آن در بازار را توضیح خواهیم داد.
آمار توصیفی
آمار توصیفی روشی برای توضیح مشخصات دادهها است. رسم نمودارهای توصیفی مانند انواع هیستوگرامها و نمودارهای دایرهای، محاسبه مقادیری مانند میانگین، واریانس میانه، مد و …. که حاکی از مشخصات کلی جامعه است ابزارهایی است که در آمار توصیفی مورداستفاده قرار میگیرد. در آمار توصیفی هیچگونه تجزیهوتحلیلی بر رویداده صورت نمیپذیرد و تلاش بر آن است تا با نمایش ویژگیهای دادهها شناخت مناسبی نسبت به آن پیدا کنیم.
آمار استنباطی
چنانچه به جای مطالعه و بررسی کل جامعه که معمولاً غیرقابل دسترس است، به بررسی و تجزیهوتحلیل نمونهای از جامعه بپردازیم آنگاه آمار استنباطی به ما کمک خواهد کرد.
در اغلب مواقع جوامع آنقدر وسیع هستند که دسترسی به تمامی اطلاعات جامعه امکانپذیر نیست و یا هزینه بسیار زیادی برای جمعآوری اطلاعات باید در نظر گرفت، به همین دلیل با استفاده از روشهای موجود در آمار استنباطی و بررسی بخشی از جامعه به شناخت جامعه میپردازیم. برای مثال ما نمیتوانیم میانگین وزن جامعه را در اختیار داشته باشیم زیرا که این امر مستلزم توزین تمامی افراد جامعه است، اما میتوانیم با استفاده از روشهای موجود در آمار استنباطی و بررسی بخشی از جامعه (نمونه)، با درصد خطای قابل قبولی، میانگین جامعه را شناسایی کنیم.
جامعه و نمونه
وقتی در مورد جامعه آماری صحبت میکنیم منظور ما تمامی عناصر موجود در جامعه است. برای مثال جامعه ساکنین شهر تهران یعنی تکتک افراد ساکن در شهر تهران، اما وقتی در مورد نمونهای از جامعه صحبت میکنیم یعنی اینکه به بخشی از جامعه که با روشی مشخص انتخابشده است اشاره میکنیم. زمانی از نمونهگیری استفاده میکنیم که دسترسی بهتمامی عناصر جامعه امکانپذیر نبوده و یا پرهزینه باشد.
برای مثال وقتی به بررسی دادههای بورس میپردازیم اطلاعات ما محدود به چهار مقدار قیمت باز شدن، قیمت بسته شدن ، بالاترین قیمت و پایینترین قیمت خواهد بود و از اطلاعات دیگر بهرهمند نیستیم، بنابراین در بررسی بازار ناچاریم از نمونهای که در اختیار داریم استفاده کنیم.
در واقع بنیان بخش اعظم سیستمهای معاملاتی، سیستمهای مدیریت سرمایه و الگوریتمهای بهینهیابی همین دادههای آماری ست. با فرص حصول یک سیستم مدیریت سرمایه مناسب با استفاده از مبانی آموزش تحلیل تکنیکال و تحلیل فاندامنتال آن چه که برای کسب بهترین نتیجه در معاملات ضروری است تسلط بر مبانی آموزش مدیریت سرمایه گذاری و ریسک و آموزش بهینه یابی است.
پارامترها و آمارههای نمونه
یک پارامتر ابزاری برای اندازهگیری مقادیری است که در آمار توصیفی استفاده میگردد. برای مثال میانگین یک پارامتر است وقتی که در جامعه استفاده میگردد. پارامترهای متعددی در آمار توصیفی وجود دارند: میانگین، واریانس، مد و میانه که همه اینها مقادیری هستند که برای شناخت و ارائه توضیح درباره جامعه یا نمونه مورد استفاده قرار میگیرند. یک پارامتر تمامی خصوصیات جامعه را توضیح میدهد.
وقتی از یک پارامتر برای اندازهگیری مقادیر موردنظر در نمونه استفاده میکنیم در حقیقت ما در حال ایجاد یک آماره هستیم زیرا مقادیر محاسبهشده در نمونه، مختص نمونه است و برای شناخت جامعه ملزم هستیم که از روشهای موجود در استنباط آماری استفاده کنیم.
انواع دادهها
دادههای اسمی
همانطور که از نامگذاری آن مشخص است این نوع دادهها در مورد اسم، صفت یا ویژگی دادهها هستند و نمیتوان آنها را بهصورت عدد در نظر گرفت و یا عملیات ریاضی بر روی آنها انجام داد. برای مثال یک عدد بنز + یک عدد پیکان معنی خاصی نخواهد داشت.
دادههای رتبهای
مقیاس رتبهای یا ترتیبی نسبت به مقیاسهای اسمی پیشرفتهتر هستند و در آنها میتوان شدت و ضعف یک ویژگی را بررسی کرد. این نوع از متغیرها مربوط به دادههایی هستند که در یک نظام سلسله مراتبی، رتبه ویژگی مورد بررسی را نشان میدهند اما اندازه دقیقی از ویژگی را نمایش نمیدهند.
دادههای فاصلهای
این نوع مقیاس از انواع پیشین که در بالا بدان اشاره شد پیشرفتهتر است و در آنها میتوان علاوه بر دارا بودن ویژگی موردنظر مقادیر کمی یا کیفی آن را نیز مشاهده کرد. برای مثال نمرات دانشجویی از این نوع هستند. نمره 17 از 20 کمتر است و فاصله آنها باهم 3 نمره است.
دادههای نسبی
این نوع از دادهها دقیقترین و بهترین دادهها هستند و علاوه بر سطوح مقادیر تعیین سطوح و مقادیر یک متغیر و فاصله بین مقادیر موجود میتوان از شاخصهای دیگری مانند میانگین هندسی و ضریب پراکنش نیز استفاده کرد. دادههایی مانند میزان پول، قد، وزن و …. از این نوع هستند.
توزیع فراوانی
توزیع فراوانی در آمار، اقتصاد، علوم مهندسی و همچنین در بازار خلاصهسازی پرسودی از دادهها است. با استفاده از توزیع فراوانی میتوانیم تمام ویژگیها و خصوصیات یک جامعه را به خوبی تعریف کنیم و همواره بتوانیم با شناخت کامل دادهها رفتار آنها را بررسی و پیشبینی کنیم. توزیع فراوانی مشاهدات و عناصر موجود را طبقهبندی نموده و فراوانی مشاهدات را برحسب هر طبقه توضیح میدهد. در توزیع این کار بهصورت درصد یا عدد نمایش داده میشود. برای اینکه با توزیع بیشتر آشنا شویم یک مثال از توزیع میزنیم:
توزیع نرمال
یکی از مهمترین و اساسیترین توزیعها در آمار، توزیع نرمال است. این توزیع از دسته توزیعهای پیوسته است. بهطورکلی بسیاری از اتفاقات طبیعی مانند باران را میتوان با توزیع نرمال توضیح داد.
پارامترهای توزیع نرمال را در بالا مشاهده میکنید. توزیع نرمال دارای میانگین و واریانس مشخص است و معروفترین توزیع نرمال که در آزمونهای آماری مورداستفاده قرار میگیرد توزیع نرمال استاندارد با میانگین صفر و واریانس یک است.
نمودار توزیع نرمال به شکل زیر است:
نمودارهای بالا مربوط به چهار توزیع نرمال با میانگینها و واریانسهای مختلف است. خط قرمز رنگ نمایانگر توزیع نرمال استاندارد است.
در توزیع نرمال انتظار داریم که بیشتر دادهها در اطراف میانگین قرار بگیرند و هرچه از میانگین فاصله میگیریم تعداد دادهها کمتر باشد. تقریباً 68 درصد کل اعدادی که از یک توزیع نرمال گرفته میشوند در فاصله برابر یا کمتر از یک انحراف معیار از میانگین قرار دارند. در فاصله دو انحراف معیار از میانگین 95 درصد دادهها قرار میگیرند.
با همین استدلال است که اندیکاتور باند بولینگر ساخته میشود.
– – –
در مقالهی بعدی به بررسی «دریافت پیام صحیح یک اندیکاتور» میپردازیم.
لینک یک دورهی ویدیویی کوتاه انگلیسی برای آشنایی با مفاهیم پایهای آمار
میتوانید از محصولات مجموعهی جهانبورس درحوزهی بهینهیابی(Optimize) دیدن فرمایید.
دیدگاهتان را بنویسید
برای نوشتن دیدگاه باید وارد بشوید.