چگونه داده هایمان را تحلیل کنیم؟
اگر برای پیشبرد کارتان نیاز به یادگیری تحلیل داده ها دارید. به کمک این مقاله با روش های پایه تحلیل داده آشنا شوید.
معرفی :
بعد از جمعآوری دادههای دقیق و قابل اعتماد با استفاده از روش مناسب مرحله بعدی که چگونگی استخراج اطلاعات مربوط و مفید فرا میرسد که در دادهها به صورت دفن شده وجود دارند تا برای دستکاری و تفسیر بیشتر استفاده شوند.
فرآیند انجام محاسبات و ارزیابی تخصصی به منظور استخراج اطلاعات مربوط از دادهها، تحلیل داده نامیده میشود. تحلیل داده ممکن است چند مرحله به طول بی انجامد تا به نتیجههای مشخصی برسد. دادههای ساده میتوانند به راحتی سازماندهی شوند، در حالی که دادههای پیچیده نیازمند پردازش بیشتری هستند. واژه “پردازش” به معنای بازسازی و کنارهگیری با دادهها به منظور آمادهسازی آنها برای تحلیل است.
واژه تحلیل به عملیاتی مرتبط اشاره دارد که به منظور خلاصهسازی دادههای جمعآوری شده و سازماندهی به گونهای است که پاسخهایی را در اختیار بگذارد. به طور ساده، این به معنای مطالعه دادهها برای تعیین حقایق درونی است.
سلتیز و جوهودا میگویند که اصطلاح تحلیل به چنین فرآیندی اشاره دارد که دادهها را برای عملیاتی آماده میکند که طراحی شدهاند تا به نتیجهگیری برای تصمیم گیری کمک کند. تحلیل داده شامل سازماندهی صحیح دادهها است. مسئله تحلیل داده در هر علمی متفاوت است.
چندین مرحله در “عملیات یکپارچه” که به آن تحلیل داده میگویند، وجود دارد. این مراحل عبارتند از:
طبقهبندی و جدولبندی
نمایش گرافیکی
معیار مکان
استنتاج آماری
جدول و طبقه بندی :
طبقهبندی دادهها فرآیندی است که تحلیل گر بر اساس شباهت یا ویژگیهای مشترک ، دادهها را در کلاسهای مرتبط مرتب میکند.. به طبقهبندی همچنین دستهبندی دادهها نیز گفته میشود.
طبقهبندی میتواند بر اساس کیفیت یا ویژگیهایی مانند جنسیت، رنگ، سواد، زیبایی و هوش انجام شود. این نوع طبقهبندی را طبقهبندی کیفی مینامند. نوع دوم طبقهبندی طبقهبندی کمی است که بر اساس متغیرهایی مانند قد و وزن انجام میشود. نوع سوم طبقهبندی، طبقهبندی جغرافیایی است مانند روستا، محله، شهر، شهری، روستایی. نوع چهارم طبقهبندی طبقهبندی زمانی است که بر اساس زمان به صورت هفتگی، ماهانه و سالانه انجام میشود. بعد از انجام طبقهبندی، فراوانی هر دسته میتواند به نسبت یا درصد تبدیل شود.
تکنیک ارائه دادههای کمی مانند قد، وزن، فشار خون، دما و سایر ویژگیهای زیستی که بر اساس مقیاس فیزیکی اندازه گیری میشوند، به صورت سطرها و ستونها، جدولبندی نامیده میشود.
جدولبندی همچنین به عنوان توزیع فراوانی متغیر شناخته میشود. هدف اصلی جدولبندی فشرده کردن دادهها و تسهیل مقایسه است. در شکل جدولی دادهها، تفسیر مورد نیاز به راحتی قابل دسترس است. دادهها بسیار واضح به نظر میرسند. تهیه جدول هنری است و نیاز به کنترل تخصصی داده دارد. تهیه جدول بستگی به اندازه و خصوصیات دادهها دارد.
نمایش گرافیکی داده ها :
دادهها میتوانند با استفاده از تصاویر گرافیکی و نمودار به جای طبقهبندی جدولی نمایش داده شوند. برای ترسیم نمودارها، دلایل بسیاری وجود دارد. اصلی ترین دلیل این است که یک نمودار ساده بیشتر از بیست صفحه متن میگوید. نمودارها خلاصهای از دادهها را ارائه میدهند. به طور معمول توصیه میشود که قبل از شروع محاسبات آماری رسم نمودارهای توصیفی را ملاحظه کنید. نمودارها نمایش بصری دادهها را به ما ارائه میدهند. نمودارها در انطباق مدل دادهها مفید هستند. با نگاه به نمودارها، میتوان به راحتی دادهها را درک کرد.
معیار مکان :
ترسیم گرافیکی دادهها فقط تصویر مؤقتی از دادهها را به ما نشان میدهد و نمیتواند ذهنیت دقیقی از توزیع دادهها ارائه دهد و مقدار را تخمین بزند یا پیشبینی کند. ویژگی مهمی که به ما امکان توصیف دادهها به شکل عددی یا کمی میدهد، اندازه مکان یا میانگین مرکزی است. شایعترین اندازههای میانگین مرکزی عبارتند از میانگین حسابی، میانه و مد. اندازه میانگین مرکزی دادهها را با یک مقدار تکی خلاصه میکند که به طور معمول در مرکز توزیع قرار دارد. اندازههای فوق بر اساس شرایط و دادههایی که توسط پژوهشگر جمعآوری شده است، استفاده میشوند. میانگین حسابی زمانی مفید است که دادهها نسبتاً یکنواخت هستند، میانه زمانی استفاده میشود که دادهها یا ارزشها نسبتاً متنوع هستند و مد زمانی مفید است که یک مقدار بیشترین فراوانی را دارد و زمانی که وزن نسبی ارزشها یکسان است، از میانگین وزنی استفاده میشود.
استنتاج آماری:
گاهی اوقات باید میان گزینه های مختلف بهترین آن را انتخاب کنیم، اگر کسی دانش کافی در مورد دو مسئله نداشته باشد، پاسخ دادن به این سؤال سخت است. استنتاج آماری به عنوان علمی به نام تصمیمگیری و استنتاج درباره جمعیت براساس اطلاعات نمونه شناخته میشود. دستهبندیهای استنتاج آماری عبارت است از :
• برآورد کردن : فرآیند برآورد کردن پارامتر های ناشناخته
• آزمون فرضیه : برای تایید یا رد کردن فرضیه
• تصمیم گیری: انتخاب راه و یا گزینه درست
منبع : : https://www.researchgate.net/publication/283269432