پرش به محتوا

چگونه داده هایمان را تحلیل کنیم؟

اگر برای پیشبرد کارتان نیاز به یادگیری تحلیل داده ها دارید. به کمک این مقاله با روش های پایه تحلیل داده آشنا شوید.
معرفی :
بعد از جمع‌آوری داده‌های دقیق و قابل اعتماد با استفاده از روش مناسب مرحله بعدی که  چگونگی استخراج اطلاعات مربوط و مفید فرا میرسد که در داده‌ها به صورت دفن شده وجود دارند تا برای دستکاری و تفسیر بیشتر استفاده شوند.
فرآیند انجام محاسبات و ارزیابی تخصصی به منظور استخراج اطلاعات مربوط از داده‌ها، تحلیل داده نامیده می‌شود. تحلیل داده ممکن است چند مرحله به طول بی انجامد تا به نتیجه‌های مشخصی برسد. داده‌های ساده می‌توانند به راحتی سازماندهی شوند، در حالی که داده‌های پیچیده نیازمند پردازش بیشتری هستند. واژه “پردازش” به معنای بازسازی و کناره‌گیری با داده‌ها به منظور آماده‌سازی آنها برای تحلیل است.
واژه تحلیل به عملیاتی مرتبط اشاره دارد که به منظور خلاصه‌سازی داده‌های جمع‌آوری شده و سازماندهی به گونه‌ای است که پاسخ‌هایی را در اختیار بگذارد. به طور ساده، این به معنای مطالعه داده‌ها برای تعیین حقایق درونی است.
سلتیز و جوهودا می‌گویند که اصطلاح تحلیل به چنین فرآیندی اشاره دارد که داده‌ها را برای عملیاتی آماده می‌کند که طراحی شده‌اند تا به نتیجه‌گیری برای تصمیم گیری کمک کند. تحلیل داده شامل سازماندهی صحیح داده‌ها است. مسئله تحلیل داده در هر علمی متفاوت است.
چندین مرحله در “عملیات یکپارچه” که به آن تحلیل داده می‌گویند، وجود دارد. این مراحل عبارتند از:

طبقه‌بندی و جدول‌بندی
نمایش گرافیکی
معیار مکان
استنتاج آماری

جدول و طبقه بندی :
طبقه‌بندی داده‌ها فرآیندی است که تحلیل گر  بر اساس شباهت یا ویژگی‌های مشترک ، داده‌ها را در کلاس‌های مرتبط مرتب می‌کند.. به طبقه‌بندی همچنین دسته‌بندی داده‌ها نیز گفته می‌شود.
طبقه‌بندی می‌تواند بر اساس کیفیت یا ویژگی‌هایی مانند جنسیت، رنگ، سواد، زیبایی و هوش انجام شود. این نوع طبقه‌بندی را طبقه‌بندی کیفی می‌نامند.  نوع دوم طبقه‌بندی طبقه‌بندی کمی است که بر اساس متغیرهایی مانند قد و وزن انجام می‌شود. نوع سوم طبقه‌بندی، طبقه‌بندی جغرافیایی است مانند روستا، محله، شهر، شهری، روستایی. نوع چهارم طبقه‌بندی طبقه‌بندی زمانی است که بر اساس زمان به صورت هفتگی، ماهانه و سالانه انجام می‌شود. بعد از انجام طبقه‌بندی، فراوانی هر دسته می‌تواند به نسبت یا درصد تبدیل شود.
تکنیک ارائه داده‌های کمی مانند قد، وزن، فشار خون، دما و سایر ویژگی‌های زیستی که بر اساس مقیاس فیزیکی اندازه گیری می‌شوند، به صورت سطرها و ستون‌ها، جدول‌بندی نامیده می‌شود.
جدول‌بندی همچنین به عنوان توزیع فراوانی متغیر شناخته می‌شود. هدف اصلی جدول‌بندی فشرده کردن داده‌ها و تسهیل مقایسه است. در شکل جدولی داده‌ها، تفسیر مورد نیاز به راحتی قابل دسترس است. داده‌ها بسیار واضح به نظر می‌رسند. تهیه جدول هنری است و نیاز به کنترل تخصصی داده دارد. تهیه جدول بستگی به اندازه و خصوصیات داده‌ها دارد.
نمایش گرافیکی داده ها :
داده‌ها می‌توانند با استفاده از تصاویر گرافیکی و نمودار به جای طبقه‌بندی جدولی نمایش داده شوند. برای ترسیم نمودارها، دلایل بسیاری وجود دارد. اصلی ترین دلیل این است که یک نمودار ساده بیشتر از بیست صفحه متن می‌گوید. نمودارها خلاصه‌ای از داده‌ها را  ارائه می‌دهند. به طور معمول توصیه می‌شود که قبل از شروع محاسبات آماری رسم نمودارهای توصیفی را ملاحظه کنید. نمودارها نمایش بصری داده‌ها را به ما ارائه می‌دهند. نمودارها در انطباق مدل داده‌ها مفید هستند. با نگاه به نمودارها، می‌توان به راحتی داده‌ها را درک کرد.
معیار مکان :
ترسیم گرافیکی داده‌ها فقط تصویر مؤقتی از داده‌ها را به ما نشان می‌دهد و نمی‌تواند ذهنیت دقیقی از توزیع داده‌ها ارائه دهد و مقدار را تخمین بزند یا پیش‌بینی کند. ویژگی مهمی که به ما امکان توصیف داده‌ها به شکل عددی یا کمی می‌دهد، اندازه مکان یا میانگین مرکزی است. شایع‌ترین اندازه‌های میانگین مرکزی عبارتند از میانگین حسابی، میانه و مد. اندازه میانگین مرکزی داده‌ها را با یک مقدار تکی خلاصه می‌کند که به طور معمول در مرکز توزیع قرار دارد. اندازه‌های فوق بر اساس شرایط و داده‌هایی که توسط پژوهشگر جمع‌آوری شده است، استفاده می‌شوند. میانگین حسابی زمانی مفید است که داده‌ها نسبتاً یکنواخت هستند، میانه زمانی استفاده می‌شود که داده‌ها یا ارزش‌ها نسبتاً متنوع هستند و مد زمانی مفید است که یک مقدار بیشترین فراوانی را دارد و زمانی که وزن نسبی ارزش‌ها یکسان است، از میانگین وزنی استفاده می‌شود.
استنتاج آماری:
گاهی اوقات باید میان گزینه های مختلف بهترین آن را انتخاب کنیم، اگر کسی دانش کافی در مورد دو مسئله نداشته باشد، پاسخ دادن به این سؤال سخت است. استنتاج آماری به عنوان علمی به نام تصمیم‌گیری و استنتاج درباره جمعیت براساس اطلاعات نمونه شناخته می‌شود. دسته‌بندی‌های استنتاج آماری عبارت است از :
•    برآورد کردن : فرآیند برآورد کردن پارامتر های ناشناخته
•    آزمون فرضیه : برای تایید یا رد کردن فرضیه
•    تصمیم گیری: انتخاب راه و یا گزینه درست

منبع : : https://www.researchgate.net/publication/283269432