داده چیست؟ تحلیل داده چه می‌کند، به زبان ساده

چه نمره ای به این مطلب می دهید ؟
5/5
داده چیست؟ تحلیل داده؛ یعنی چه؟ و چرا برای تمام کسب‌وکارها مهم است. در این مقاله پاسخ این پرسش‌ها را پیدا می‌کنید
تجزیه و تحلیل داده ها

فهرست مطالب

 

داده و تحلیل داده موضوعی است که در چند سال گذشته به‌شدت موردتوجه قرار گرفته است. شرکت‌های بین‌المللی داده را به‌عنوان یکی از مهم‌ترین دارایی‌های خود در کنار منابع مالی و انسانی لحاظ می‌کنند.

 

این اهمیت تا جایی پیش رفته است که داده “نفت خام جدید” لقب گرفته است. اما داده از نفت هم ارزشمند‌تر است؛ در اثر استفاده تمام نمی‌شود! و هر لحظه داده‌های جدید تولید و ذخیره می‌شوند.

 

شغل دانشمند داده  (Data Scientist) یکی از جذاب‌ترین مشاغل در قرن جدید است؛ اما تحلیل داده و سر درآوردن از اطلاعات فقط مختص دانشمند داده نیست. تحلیل‌گران کسب‌وکار (business analyst)، تحلیل‌گران داده (data analyst)، متخصصان هوش تجاری و بیش از همه آنها مدیران اجرایی و ارشد با داده و اطلاعات سروکار دارند.

 

داده باارزش است اگر از آن برای بهبود عملکرد و پیشرفت شرکت خود استفاده کنید در غیر این صورت مثل نفت خامی که زیرزمین مانده و استخراج نشده ارزشی برای شما خلق نخواهد کرد.

 

در این مقاله داده و انواع آن، تفاوت داده با اطلاعات، تحلیل داده و روش‌های تحلیل را به‌صورت مختصر معرفی می‌کنیم تا  به دید بهتری از اهمیت آن برای کسب‌وکارها و نقش آن در هوش تجاری دست پیدا کنیم.

 

داده (DATA)  چیست ؟

همه چیز، تمام چیزهایی که اطراف شما وجود دارد (چه دیده شود چه نشود) می‌تواند حامل داده باشد. داده مجموعه‌ای از مقادیر مجزا است که اطلاعات یا معنایی را منتقل می‌کند. داده‌ها شامل حقایق (facts)،آمار،کمیت یا کیفیت چیزی هستند.

 

? چند ثانیه چشم از صفحه مانیتور یا گوشی تلفن همراه خودتان بردارید، چه می‌بینید؟

 

اگر این متن را در دفتر کار خود می‌خوانید اشیای زیادی در اطراف شماست. میز و صندلی که بر روی آن می‌نشینید، فنجانی که در آن چای و قهوه می‌نوشید، کامپیوتر، کیبورد …

 

از پنجره به بیرون نگاه کنید، آدم‌ها، درخت‌، ساختمان، آسمان، و هرآنچه که می‌بینید خصوصیاتی دارد که قابل توصیف، شمارش یا اندازه‌گیری است. این خصوصیات را می‌توانید به‌صورت کمی یا کیفی بیان کنید.

 

مثلاً رنگ آسمان آبی است یا قند داخل قندان شیرین است و شیرینی یک کیفیت قابل توصیف است. می‌توانید تعداد قندهای داخل قندان را بشمارید! و آن را با یک عدد صحیح  بیان کنید. یعنی به‌صورت کمی می‌توان آن را نشان داد.

 

 

چند نوع داده داریم؟

 

 

انواع داده

 

 

داده را به دودسته کمی و کیفی تقسیم می‌کنند. داده کیفی چیزی را توصیف می‌کند که به شکل عدد و رقم قابل بیان یا اندازه‌گیری نیست. (مثل رنگ، طعم، سایز) این نوع داده برای دسته‌بندی و طبقه‌بندی‌کردن سایر چیزها استفاده می‌شود.

یک کالا مثل پیراهن را در نظر بگیرید. برای دسته‌بندی  پیراهن‌ها را به سه اندازه کوچک، متوسط، و بزرگ تقسیم می‌کنیم. وقتی می‌گوییم یک پیراهن سایز متوسط است اطلاعاتی را درباره آن کالا منتقل کرده‌ایم.

 

داده کمی معیار یا ارزشی است که  به‌صورت عدد و رقم بیان می‌شود. داده‌های کمی معمولاً به سؤالاتی مثل چند عدد یا چه مقدار از یک چیز وجود دارد؟ پاسخ می‌دهند. هر چیز قابل‌اندازه‌گیری یا شمارش یک مقدار عددی به ما می‌دهد که داده‌ای کمی است.مثلاً وزن یک کالا را با عدد و واحد گرم بیان می‌کنند که نشان می‌دهد چه مقدار از آن کالا در اختیار ما است.

 

انواع داده مرتبط با یک کالا

 

داده گسسته و پیوسته

داده‌های کمی به دو نوع گسسته و پیوسته تقسیم می‌شود.

 

  • داده گسسته: معمولاً داده گسسته حاصل شمارش چیزی است؛ یعنی یک عدد صحیح که تعداد چیزهایی را نشان می‌دهد که قابل تقسیم شدن نیستند. در مثال قبلی ما می‌توانیم 1 یا 1000 عدد پیراهن داشته باشیم؛ اما هیچ‌کس نمی‌تواند بگویید 2.5 عدد پیراهن دارد!

 

  • داده پیوسته: معمولاً وقتی چیزی را که اندازه‌گیری می‌کنیم یک داده پیوسته داریم. داده پیوسته می‌تواند هر عددی (اعشاری) در یک بازه (رنج) باشد. دما، ارتفاع و وزن دادهای کمی پیوسته هستند. دمای هوا می‌تواند 27.8  درجه و وزن یک کالا 205.5 گرم باشد.

 

داده ساختاریافته و ساختار نیافته:

داده را بر اساس ساختار  و شیوه ذخیره کردن آن به 3 دسته ساختاریافته (نظام‌مند)، بدون ساختار،  و نیمه‌ساختاریافته تقسیم می‌کنند. تقسیم‌بندی ذکر شده برای هوش تجاری و تحلیل داده مهم است و هرکدام از این نوع داده‌ها روش خاص خود را برای گردآوری و تحلیل دارند.

 

انواع مختلف داده

 

  • داده‌ ساختاریافته: داده‌ها بر اساس یک الگو و مدل دسته‌بندی و منظم شده‌اند و معمولاً به‌صورت جدول ذخیره می‌شوند. پایگاه‌داده نرم‌افزارهای عملیاتی (Relational Databas) از این نوع هستند. در استفاده از هوش تجاری با این نوع از داده‌ها زیاد سروکار داریم.

 

  • نیمه‌ساختاریافته: داده‌هایی که داخل جداول داده ثبت نشده‌اند؛ اما درون خودشان روشی برای منظم‌کردن و دسته‌بندی اطلاعات دارند. فایل‌های‌ XML مثالی از داده‌های نیمه‌ساختاریافته هستند.

 

  • ساختار نیافته: داده‌هایی که یا منظم نشده‌اند یا روشی برای منظم‌کردن آنها وجود ندارد. تقریباً 80 درصد داده‌های موجود در اینترنت از همین نوع هستند. ویدئو‌ها، فایل‌های صوتی، متن‌ها و اطلاعات منتشر شده روی شبکه‌های اجتماعی مثالی از داده‌ ساختار نیافته هستند.

 

بیشترین چالش در تحلیل داده در نوع ساختار ‌نیافته آن وجود دارد.

 

 

چرا باید تفاوت انواع داده را بدانیم؟

بسته به کاری که می‌خواهیم انجام بدهیم (پیداکردن جوال سؤالات و الگوها یا توضیح دادن مطلبی به دیگران) ممکن است با انواع متفاوتی از داده سروکار داشته باشیم. برای استفاده از هوش تجاری و تحلیل داده بهتر است با انواع داده‌ها و کاربرد آنها تا حدودی آشنا باشیم.

 

به این سؤال توجه کنید.

 

  • چند عدد پیراهن سفید در یک ماه گذشته فروخته شده است؟

 

پرسش بالا سه نوع داده متفاوت را شامل می‌شود. بعد ( dimension) زمان که بازه‌ای یک‌ماهه است (داده کمی)، بعد رنگ که یک داده کیفی است و  داده سوم (معیار سنجش – داده کمی) که مبلغ فروخته شده از این کالای خاص است.

داده‌هایی که برای پاسخ‌دادن به سؤال بالا نیاز داریم داخل نرم‌افزار حسابداری یافت می‌شوند (داده ساختاریافته)

 

برای  پیداکردن جواب پرسش‌هایی که داریم یا تبدیل داده‌ها به نمودار (تصویرسازی) باید بدانیم با چه نوعی از داده‌ها سروکار داریم.

 

چطور می‌توانیم از داده‌ها‌ استفاده می‌کنیم؟

تا اینجا متوجه شدیم انواع مختلفی از داده وجود دارد؛ اما کاربرد آن برای یک کسب‌وکار چیست؟

 

داده در شکل خام مقداری عدد و رقم است که کمکی به ما نمی‌کند! اما می‌توان برای دو هدف مهم از آن‌ها استفاده کرد

 

 

  • به سؤالات ما درباره یک اتفاق یا فعالیت جواب بدهد (‌جستجو در داده‌ها، پیداکردن الگوها، پیش‌بینی آینده)

 

  • به‌وسیله داده منظور و مقصود خودمان را به دیگران منتقل کنیم (داستان‌‌گویی با داده)

 

 

اجازه بدهید یک مثال را با هم بررسی کنیم.

 

? فرض کنید شما مدیر یک فروشگاه (خرده‌فروشی) هستید؛ بنابراین فعالیت اصلی شما “فروش” است. چه داده‌هایی در فروشگاه ذخیره و ثبت می‌شود؟

 

کالاهای فروخته شده، قیمت واحد آنها، زمان فروش (ساعت، روز، هفته) و تخفیف اعمال شده روی هر کالا، اگر از این داده‌ها  استفاده کنید و آنها را به اطلاعات تبدیل کنید می‌تواند به سؤالات زیر پاسخ دهد.

 

 

  • مبلغ فروش در هر روز چقدر است؟
  • مبلغ فروش کل در هفته چقدر بوده؟
  • چه کالاهایی بیشترین فروش را داشته‌اند؟
  • چه کالاهایی که کمترین فروش را داشته‌اند؟
  • چه کالایی بیشترین سودآوری را داشته است؟
  • درصد فروش آن کالا نسبت به کل فروش چقدر بوده است؟
  • آیا تخفیف‌ها تأثیری مشخصی بر افزایش فروش داشته‌اند؟

 

تمام موارد بالا اطلاعات بدرد بخوری هستند که به یک مدیر کمک می‌کنند بهترین تصمیم را برای موفقیت کسب‌وکار تحت مدیریتش بگیرد.

 

حال فرض کنید قرار است عملکرد فروشگاه تحت مدیریت خود را به‌صورت گزارش در یک جلسه ارائه کنید. باز هم با داده سروکار دارید و بهتر است بدانید چطور از داده‌ها برای رساندن مقصود خود استفاده کنید. (داستان‌گویی با داده)

 

تفاوت داده و اطلاعات (Information) در چیست؟

داده و اطلاعات ممکن است به یک معنی به کار بروند و در جای یکدیگر استفاده شوند؛ اما تفاوت‌های مهمی بین داده (data) و اطلاعات (Information) وجود دارد.

 

به تصویر زیر نگاه کنید اعداد نمایش‌داده‌شده در قسمت یک چه چیزی را به شما می‌گویند. ازآنجاکه هیچ پیش‌زمینه‌ای درباره این اعداد نداریم نمی‌دانیم درباره چه هستند. به قیمت چیزی اشاره دارند؟ بودجه سازمانی را نشان می‌دهند؟

 

حال به قسمت دوم نگاه کنید چه چیزی را متوجه می‌شوید؟ همان اعداد را مشاهده می‌کنید که درباره فروش یک شرکت در فصل بهار به شما اطلاعاتی می‌دهد. اطلاعات ما را نسبت چیزی که قبلاً نمی‌دانسته‌ایم مطلع می‌کند.

 

 

تفاوت داده و اطلاعات

 

 

 

 

داده خام: دسته‌بندی نشده، پردازش نشده، تفسیر نشده، و نامرتبط است.

 

 اطلاعات: حاصل پردازش داده‌ها است. اطلاعات داده‌های پردازش شده است که صحیح، قابل‌فهم، مرتبط، دارای چهارچوب و زمان‌بندی هستند.

 

بنابراین، اطلاعات داده‌هایی است که:

  • پردازش شده است
  • دسته‌بندی و مرتب شده است
  • به فرمی تبدیل شده که یک معنا و مفهوم را برساند

 

تجزیه‌وتحلیل داده؛ یعنی چه؟

شرکت‌ها معمولاً داده‌های زیادی را ذخیره می‌کنند اما داده در همان حالت خام باقی می‌ماند و استفاده‌‌ مؤثری از آن نمی‌شود. تجزیه‌وتحلیل داده فرایندی است که داده خام را پردازش می‌کند تا از داخل آن اطلاعات معناداری استخراج کند. اطلاعاتی که باتوجه‌به آن، بتوان تصمیمی را گرفت یا عملی را انجام داد.

 

تحلیل داده تبدیل داده‌های غیرقابل‌درک به اطلاعات منسجم و قابل‌فهم برای مدیران و تصمیم گیرندگان یک سازمان یا شرکت است.

 

تحلیل داده کمک می‌کند تا اتفاقات گذشته را به‌درستی متوجه شویم و اتفاقات آینده را پیش‌بینی کنیم.

 

تحلیلگر داده (data analyst) چه کاری می‌کند؟

  • داده‌های خام را جمع‌آوری می‌کند
  • داده‌ها را دسته‌بندی می‌کند
  • آنها را به اطلاعات قابل‌فهم تبدیل می‌کند (تجزیه‌وتحلیل)

 

تحلیل‌گر داده یافته‌های خود را به‌صورت گزارش و یا داشبورد در اختیار افرادی که به آن اطلاعات نیاز دارند قرار می‌دهد.

 

تحلیلگر کسب‌وکار (business analyst) چه می‌کند؟

وظایف تحلیلگر  کسب‌وکار همپوشانی زیادی با تحلیلگر داده دارد. اما علاوه بر توانایی کار با داده و پیداکردن الگو در داده‌ها، تحلیلگر کسب‌وکار باید درک عمیقی از حوزه کاری یک شرکت و سازمان داشته باشد. تحلیلگر کسب‌وکار  روی موضوع یا مشکلات خاص در یک شرکت کار می‌کند. پس از تجزیه‌وتحلیل داده پیشنهاد‌ها و گام‌هایی که برای بهبود تجارت باید برداشته شود را به مدیران و ذی‌نفعان یک شرکت ارائه می‌کند. در واقع کار تحلیلگر کسب‌وکار پیداکردن مشکلات یک شرکت از درون داده‌ها و یافتن راهی برای  حل آنها است.

 

 انواع تحلیل داده و کاربرد آنها در کسب و کار

حالا که بهتر با داده و اطلاعات و تجزیه‌وتحلیل آشنا شدیم به سراغ انواع تحلیل روی داده‌ها می‌رویم.

 

چند نوع تحلیل داده داریم؟

 

 

انواع مختلف تجزیه و تحلیل داده

 

تجزیه و تحلیل توصیفی (Descriptive analytics ) :

تحلیل توصیفی پله اول در مراحل بلوغ تحلیلی یک سازمان است. تحلیل توصیف‌کننده به ما می‌گوید چه اتفاقی درگذشته افتاده است. تجمیع داده و داده‌کاوی دو تکنیک اصلی در تحلیل توصیفی هستند تحلیلگر ابتدا داده‌ها را جمع‌آوری می‌کند و به شکل خلاصه شده آنها را ارائه می‌کند تا بعد داده‌ها را برای پیداکردن الگو‌ها کاوش کند.

 

پس از طی این مراحل داده به صورتی که برای مخاطبان قابل‌درک باشد تصویرسازی می‌شود. باید توجه کرد تحلیل توصیفی تلاشی برای توضیح دادن داده‌ها یا مشخص‌کردن روابط علت و معلولی نمی‌کند. در این مرحله صرفاً تحلیل می‌گوید “چه چیزی” اتفاق افتاده است.

 

تجزیه و تحلیل تشخیصی (Diagnostic analytics) :

تحلیل توصیفی می‌گوید چه چیزی اتفاق افتاده، تحلیل تشخیصی می‌گوید چرا اتفاق افتاده است.

 

معمولاً تحلیلگر داده ابتدا سعی می‌کند ناهنجاری‌های داخل داده را پیدا کند (هر چیزی که نمی توان باتوجه‌به داده توضیح داد) مثلاً اگر داده نشان دهد که افزایش یا کاهش ناگهانی فروش در دی‌ماه اتفاق افتاده است تحلیلگر داده باید آن را بررسی کند. برای این کار تحلیلگر مرحله “کشف” را شروع می‌کند؛ یعنی به دنبال سایر منابعی می‌گردد که ممکن است علت ناهنجاری‌ را به او بگویید.

 

 

نمودار پیک فروش نیمسال

 

 

 

در نهایت تحلیلگر سعی می‌کند روابط سببی که منجر به ناهنجاری شده اند را کشف کند، مثلاً  بررسی هر رویدادی که ممکن است با افزایش و کاهش فروش همبستگی یا مطابقت داشته باشد. (مثلاً تغییرات بازار، نوع فروش، تخفیف و …) در این مرحله تحلیلگر داده از تحلیل رگرسیون، تئوری احتمال، فیلترکردن و تحلیل سری‌های زمانی استفاده کند.

 

تجزیه‌وتحلیل در لحظه (Real Time analytics) :

تجزیه‌وتحلیل داده به‌محض ثبت و ذخیره شدن داده اتفاق می‌ا‌فتد. به عبارتی کاربران می‌توانند بلافاصله پس از ثبت داده در سیستم از آن برای نتیجه‌گیری و درک شرایطی که در حال رخ دادن در آن لحظه است استفاده ‌کنند.

 

تحلیل لحظه‌ای به شرکت‌ها اجازه می‌دهد تا بدون تأخیر به اتفاقات واکنش نشان دهند، فرصت‌ها را جذب و مشکلات را پیش از شکل‌گرفتن رفع کنند.

 

تجزیه تحلیل پیش‌بینی‌کننده (Predictive analytics) :

همان‌طور که از اسمش پیداست سعی می‌کند آنچه که احتمالاً در آینده اتفاق می‌افتد را پیش‌بینی کند. در این مرحله است که تحلیلگر داده راه‌حل‌های عملی و داده‌محور را در اختیار شرکت می‌گذارد تا قدم‌های بعدی را با آگاهی بردارند.

 

تحلیل پیش‌بینی‌کننده احتمال وقوع اتفاقات آینده را بر اساس داده‌های قبلی و تئوری احتمالات می‌سنجد. با این‌که پیش‌بینی هیچ‌وقت کاملاً قطعی نیست؛ اما میزان اطمینان به تصمیمات را بالا برده و حدس و گمان‌‌ قبل از تصمیم‌ گرفتن را تا حد زیادی از بین می‌برد.این نوع از تحلیل برای پیش‌بینی اتفاقات متنوع و متفاوتی استفاده  می‌شود؛ مثلاً چه محصولی بیشترین تقاضا را در سه ماه آینده خواهد داشت یا شش ماه آینده درآمد شرکت چقدر افزایش یا کاهش پیدا می‌کند.

 

تحلیل پیش‌بینی کننده شانس شرکت‌ها برای رسیدن به نتیجه دلخواه را به‌شدت افزایش می‌دهد.

 

تحلیل تجویزی (Prescriptive analytics) :

در ادامه تحلیل پیش‌بینی‌کننده قرار دارد، آن را تکمیل می‌کند و کارها و اقداماتی که باید انجام شوند را به ما توصیه می‌کند. به‌عبارت‌دیگر به ما نشان می‌دهد چطور از نتایج پیش‌بینی شده استفاده کنیم.تحلیلگر برای انجام این نوع از تجزیه‌وتحلیل تمام سناریو‌های احتمالی را در نظر می‌گیرد سپس کارهایی که شرکت امکان انجام آنها را دارد بررسی و ارزیابی می‌کند.

 

تحلیل تجویزی یکی از پیچیده‌ترین انواع تجزیه‌وتحلیل است و معمولاً  به استفاده از الگوریتم‌ها، یادگیری ماشین، و مدل‌سازی محاسباتی نیاز دارد.

 

3 روش اصلی تأثیرگذاری داده بر موفقیت کسب‌وکارها

داده‌ها از روش‌های مختلف روی موفقیت یک کسب‌وکار تأثیر می‌گذارند؛ اما بیشترین استفاده شرکت‌های پیشرو در سه مورد زیر خلاصه می‌شود

ارتقا و بهبود فرایند تصمیم‌گیری:

اولین استفاده مهم شرکت‌ها از تحلیل داده، تأثیرگذاری آن در روش تصمیم‌گیری مدیران و بهبود فرایند تصمیم‌گیری در شرکت است. تحلیل داده می‌تواند پاسخ سؤالات شما را بدهد تا در نهایت بهترین تصمیم را برای کسب‌وکار خود بگیرید.

 

ابتدا سؤالات بی‌پاسخ درباره کسب‌وکار خود را مشخص کنید سپس ببینید چه داده‌ای را باید تحلیل کنید تا به جواب آن سؤال‌ها برسید.

 

بازسازی و اصلاح فرایندهای عملیاتی:

هر فرایند تجاری که به تولید داده منجر می‌شود (اطلاعات سفارش‌ مشتری‌ها یا داده‌های خط تولید کارخانه) را می‌توان بهینه‌سازی کرد.

 

بهره‌وری در خطوط تولید، زنجیره تأمین، انبارداری، و منابع انسانی با بهبود در کارهایی که روزانه تکرار می‌شوند افزایش می‌یابد. تحلیل داده به درک ما را از فرایندهای روزانه کمک کرده و بهینه‌کردن آنها را ممکن می‌کند.

 

ایجاد مسیرهای درآمدی جدید:

هر چه حجم و پیچیدگی داده‌ای که در شرکت ذخیره می‌شود بیشتر باشد جذابیت آن به‌عنوان یک منبع تجاری بالاتر می‌رود. فروش و به اشتراک گذاشتن این داده‌ها می‌تواند یک منبع جدید درآمدی باشد. شرکت‌های زیادی در جهان به دلیل در اختیار داشتن داده‌های خاص توانسته‌اند به بازیگر اصلی صنعت خود تبدیل شوند.

 

 

جمع‌بندی پایانی:

 

  • داده و اطلاعات یکی از دارایی‌های مهم کسب‌وکارها در جهان امروز است

 

  • داده هر چیزی است که قابل‌شمارش، اندازه‌گیری یا توصیف باشد

 

  • داده کیفی برای دسته‌بندی سایر چیزها به کار می‌رود

 

  • داده کمی یک عدد صحیح یا اعشاری است که برای شمارش و اندازه‌گیری چیزها استفاده می‌شود

 

  • داده ساختاریافته در پایگاه‌های داده استفاده می‌شود و در هوش تجاری کاربرد زیادی دارد.

 

  • با دانستن تفاوت انواع داده از می‌توانیم از آنها بهتر استفاده کنیم

 

  • با تبدیل داده به اطلاعات می‌توانیم از آن برای پاسخ به سؤالات خود استفاده کنیم

 

  • داده عدد و رقم خام و پردازش نشده است، اطلاعات داده پردازش شده، دسته‌بندی‌شده است که به شکل قابل‌فهم ارائه می‌شود

 

  • تحلیل داده؛ یعنی تبدیل کردن داده‌های غیرقابل‌درک به اطلاعات منسجم و قابل‌فهم

 

  • تجزیه‌وتحلیل توصیف‌کننده به ما می‌گوید چه اتفاقی درگذشته رخ‌داده است

 

  • تجزیه‌وتحلیل تشخیصی علت اتفاقات رخ‌داده را مشخص می‌کند

 

  • تجزیه‌وتحلیل در لحظه اتفاقاتی که در حال رخ‌دادن است را تحلیل می‌کند

 

  • تجزیه‌وتحلیل پیش‌بینی‌کننده احتمال وقع یک اتفاق در آینده را بررسی می‌کند

 

  • تجزیه‌وتحلیل تجویز کنند به ما می‌گوید چه گونه از نتایج پیش‌بینی‌شده استفاده کنیم
دسته بندی مطالب وبلاگ
مقالات جدید
محبوبترین مقالات

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

اشتراک گذاری در whatsapp
اشتراک گذاری در twitter
اشتراک گذاری در linkedin