داده و تحلیل داده موضوعی است که در چند سال گذشته بهشدت موردتوجه قرار گرفته است. شرکتهای بینالمللی داده را بهعنوان یکی از مهمترین داراییهای خود در کنار منابع مالی و انسانی لحاظ میکنند.
این اهمیت تا جایی پیش رفته است که داده “نفت خام جدید” لقب گرفته است. اما داده از نفت هم ارزشمندتر است؛ در اثر استفاده تمام نمیشود! و هر لحظه دادههای جدید تولید و ذخیره میشوند.
شغل دانشمند داده (Data Scientist) یکی از جذابترین مشاغل در قرن جدید است؛ اما تحلیل داده و سر درآوردن از اطلاعات فقط مختص دانشمند داده نیست. تحلیلگران کسبوکار (business analyst)، تحلیلگران داده (data analyst)، متخصصان هوش تجاری و بیش از همه آنها مدیران اجرایی و ارشد با داده و اطلاعات سروکار دارند.
داده باارزش است اگر از آن برای بهبود عملکرد و پیشرفت شرکت خود استفاده کنید در غیر این صورت مثل نفت خامی که زیرزمین مانده و استخراج نشده ارزشی برای شما خلق نخواهد کرد.
در این مقاله داده و انواع آن، تفاوت داده با اطلاعات، تحلیل داده و روشهای تحلیل را بهصورت مختصر معرفی میکنیم تا به دید بهتری از اهمیت آن برای کسبوکارها و نقش آن در هوش تجاری دست پیدا کنیم.
داده (DATA) چیست ؟
همه چیز، تمام چیزهایی که اطراف شما وجود دارد (چه دیده شود چه نشود) میتواند حامل داده باشد. داده مجموعهای از مقادیر مجزا است که اطلاعات یا معنایی را منتقل میکند. دادهها شامل حقایق (facts)،آمار،کمیت یا کیفیت چیزی هستند.
? چند ثانیه چشم از صفحه مانیتور یا گوشی تلفن همراه خودتان بردارید، چه میبینید؟
اگر این متن را در دفتر کار خود میخوانید اشیای زیادی در اطراف شماست. میز و صندلی که بر روی آن مینشینید، فنجانی که در آن چای و قهوه مینوشید، کامپیوتر، کیبورد …
از پنجره به بیرون نگاه کنید، آدمها، درخت، ساختمان، آسمان، و هرآنچه که میبینید خصوصیاتی دارد که قابل توصیف، شمارش یا اندازهگیری است. این خصوصیات را میتوانید بهصورت کمی یا کیفی بیان کنید.
مثلاً رنگ آسمان آبی است یا قند داخل قندان شیرین است و شیرینی یک کیفیت قابل توصیف است. میتوانید تعداد قندهای داخل قندان را بشمارید! و آن را با یک عدد صحیح بیان کنید. یعنی بهصورت کمی میتوان آن را نشان داد.
چند نوع داده داریم؟
داده را به دودسته کمی و کیفی تقسیم میکنند. داده کیفی چیزی را توصیف میکند که به شکل عدد و رقم قابل بیان یا اندازهگیری نیست. (مثل رنگ، طعم، سایز) این نوع داده برای دستهبندی و طبقهبندیکردن سایر چیزها استفاده میشود.
یک کالا مثل پیراهن را در نظر بگیرید. برای دستهبندی پیراهنها را به سه اندازه کوچک، متوسط، و بزرگ تقسیم میکنیم. وقتی میگوییم یک پیراهن سایز متوسط است اطلاعاتی را درباره آن کالا منتقل کردهایم.
داده کمی معیار یا ارزشی است که بهصورت عدد و رقم بیان میشود. دادههای کمی معمولاً به سؤالاتی مثل چند عدد یا چه مقدار از یک چیز وجود دارد؟ پاسخ میدهند. هر چیز قابلاندازهگیری یا شمارش یک مقدار عددی به ما میدهد که دادهای کمی است.مثلاً وزن یک کالا را با عدد و واحد گرم بیان میکنند که نشان میدهد چه مقدار از آن کالا در اختیار ما است.
داده گسسته و پیوسته
دادههای کمی به دو نوع گسسته و پیوسته تقسیم میشود.
- داده گسسته: معمولاً داده گسسته حاصل شمارش چیزی است؛ یعنی یک عدد صحیح که تعداد چیزهایی را نشان میدهد که قابل تقسیم شدن نیستند. در مثال قبلی ما میتوانیم 1 یا 1000 عدد پیراهن داشته باشیم؛ اما هیچکس نمیتواند بگویید 2.5 عدد پیراهن دارد!
- داده پیوسته: معمولاً وقتی چیزی را که اندازهگیری میکنیم یک داده پیوسته داریم. داده پیوسته میتواند هر عددی (اعشاری) در یک بازه (رنج) باشد. دما، ارتفاع و وزن دادهای کمی پیوسته هستند. دمای هوا میتواند 27.8 درجه و وزن یک کالا 205.5 گرم باشد.
داده ساختاریافته و ساختار نیافته:
داده را بر اساس ساختار و شیوه ذخیره کردن آن به 3 دسته ساختاریافته (نظاممند)، بدون ساختار، و نیمهساختاریافته تقسیم میکنند. تقسیمبندی ذکر شده برای هوش تجاری و تحلیل داده مهم است و هرکدام از این نوع دادهها روش خاص خود را برای گردآوری و تحلیل دارند.
- داده ساختاریافته: دادهها بر اساس یک الگو و مدل دستهبندی و منظم شدهاند و معمولاً بهصورت جدول ذخیره میشوند. پایگاهداده نرمافزارهای عملیاتی (Relational Databas) از این نوع هستند. در استفاده از هوش تجاری با این نوع از دادهها زیاد سروکار داریم.
- نیمهساختاریافته: دادههایی که داخل جداول داده ثبت نشدهاند؛ اما درون خودشان روشی برای منظمکردن و دستهبندی اطلاعات دارند. فایلهای XML مثالی از دادههای نیمهساختاریافته هستند.
- ساختار نیافته: دادههایی که یا منظم نشدهاند یا روشی برای منظمکردن آنها وجود ندارد. تقریباً 80 درصد دادههای موجود در اینترنت از همین نوع هستند. ویدئوها، فایلهای صوتی، متنها و اطلاعات منتشر شده روی شبکههای اجتماعی مثالی از داده ساختار نیافته هستند.
بیشترین چالش در تحلیل داده در نوع ساختار نیافته آن وجود دارد.
چرا باید تفاوت انواع داده را بدانیم؟
بسته به کاری که میخواهیم انجام بدهیم (پیداکردن جوال سؤالات و الگوها یا توضیح دادن مطلبی به دیگران) ممکن است با انواع متفاوتی از داده سروکار داشته باشیم. برای استفاده از هوش تجاری و تحلیل داده بهتر است با انواع دادهها و کاربرد آنها تا حدودی آشنا باشیم.
به این سؤال توجه کنید.
- چند عدد پیراهن سفید در یک ماه گذشته فروخته شده است؟
پرسش بالا سه نوع داده متفاوت را شامل میشود. بعد ( dimension) زمان که بازهای یکماهه است (داده کمی)، بعد رنگ که یک داده کیفی است و داده سوم (معیار سنجش – داده کمی) که مبلغ فروخته شده از این کالای خاص است.
دادههایی که برای پاسخدادن به سؤال بالا نیاز داریم داخل نرمافزار حسابداری یافت میشوند (داده ساختاریافته)
برای پیداکردن جواب پرسشهایی که داریم یا تبدیل دادهها به نمودار (تصویرسازی) باید بدانیم با چه نوعی از دادهها سروکار داریم.
چطور میتوانیم از دادهها استفاده میکنیم؟
تا اینجا متوجه شدیم انواع مختلفی از داده وجود دارد؛ اما کاربرد آن برای یک کسبوکار چیست؟
داده در شکل خام مقداری عدد و رقم است که کمکی به ما نمیکند! اما میتوان برای دو هدف مهم از آنها استفاده کرد
- به سؤالات ما درباره یک اتفاق یا فعالیت جواب بدهد (جستجو در دادهها، پیداکردن الگوها، پیشبینی آینده)
- بهوسیله داده منظور و مقصود خودمان را به دیگران منتقل کنیم (داستانگویی با داده)
اجازه بدهید یک مثال را با هم بررسی کنیم.
? فرض کنید شما مدیر یک فروشگاه (خردهفروشی) هستید؛ بنابراین فعالیت اصلی شما “فروش” است. چه دادههایی در فروشگاه ذخیره و ثبت میشود؟
کالاهای فروخته شده، قیمت واحد آنها، زمان فروش (ساعت، روز، هفته) و تخفیف اعمال شده روی هر کالا، اگر از این دادهها استفاده کنید و آنها را به اطلاعات تبدیل کنید میتواند به سؤالات زیر پاسخ دهد.
- مبلغ فروش در هر روز چقدر است؟
- مبلغ فروش کل در هفته چقدر بوده؟
- چه کالاهایی بیشترین فروش را داشتهاند؟
- چه کالاهایی که کمترین فروش را داشتهاند؟
- چه کالایی بیشترین سودآوری را داشته است؟
- درصد فروش آن کالا نسبت به کل فروش چقدر بوده است؟
- آیا تخفیفها تأثیری مشخصی بر افزایش فروش داشتهاند؟
تمام موارد بالا اطلاعات بدرد بخوری هستند که به یک مدیر کمک میکنند بهترین تصمیم را برای موفقیت کسبوکار تحت مدیریتش بگیرد.
حال فرض کنید قرار است عملکرد فروشگاه تحت مدیریت خود را بهصورت گزارش در یک جلسه ارائه کنید. باز هم با داده سروکار دارید و بهتر است بدانید چطور از دادهها برای رساندن مقصود خود استفاده کنید. (داستانگویی با داده)
تفاوت داده و اطلاعات (Information) در چیست؟
داده و اطلاعات ممکن است به یک معنی به کار بروند و در جای یکدیگر استفاده شوند؛ اما تفاوتهای مهمی بین داده (data) و اطلاعات (Information) وجود دارد.
به تصویر زیر نگاه کنید اعداد نمایشدادهشده در قسمت یک چه چیزی را به شما میگویند. ازآنجاکه هیچ پیشزمینهای درباره این اعداد نداریم نمیدانیم درباره چه هستند. به قیمت چیزی اشاره دارند؟ بودجه سازمانی را نشان میدهند؟
حال به قسمت دوم نگاه کنید چه چیزی را متوجه میشوید؟ همان اعداد را مشاهده میکنید که درباره فروش یک شرکت در فصل بهار به شما اطلاعاتی میدهد. اطلاعات ما را نسبت چیزی که قبلاً نمیدانستهایم مطلع میکند.
داده خام: دستهبندی نشده، پردازش نشده، تفسیر نشده، و نامرتبط است.
اطلاعات: حاصل پردازش دادهها است. اطلاعات دادههای پردازش شده است که صحیح، قابلفهم، مرتبط، دارای چهارچوب و زمانبندی هستند.
بنابراین، اطلاعات دادههایی است که:
- پردازش شده است
- دستهبندی و مرتب شده است
- به فرمی تبدیل شده که یک معنا و مفهوم را برساند
تجزیهوتحلیل داده؛ یعنی چه؟
شرکتها معمولاً دادههای زیادی را ذخیره میکنند اما داده در همان حالت خام باقی میماند و استفاده مؤثری از آن نمیشود. تجزیهوتحلیل داده فرایندی است که داده خام را پردازش میکند تا از داخل آن اطلاعات معناداری استخراج کند. اطلاعاتی که باتوجهبه آن، بتوان تصمیمی را گرفت یا عملی را انجام داد.
تحلیل داده تبدیل دادههای غیرقابلدرک به اطلاعات منسجم و قابلفهم برای مدیران و تصمیم گیرندگان یک سازمان یا شرکت است.
تحلیل داده کمک میکند تا اتفاقات گذشته را بهدرستی متوجه شویم و اتفاقات آینده را پیشبینی کنیم.
تحلیلگر داده (data analyst) چه کاری میکند؟
- دادههای خام را جمعآوری میکند
- دادهها را دستهبندی میکند
- آنها را به اطلاعات قابلفهم تبدیل میکند (تجزیهوتحلیل)
تحلیلگر داده یافتههای خود را بهصورت گزارش و یا داشبورد در اختیار افرادی که به آن اطلاعات نیاز دارند قرار میدهد.
تحلیلگر کسبوکار (business analyst) چه میکند؟
وظایف تحلیلگر کسبوکار همپوشانی زیادی با تحلیلگر داده دارد. اما علاوه بر توانایی کار با داده و پیداکردن الگو در دادهها، تحلیلگر کسبوکار باید درک عمیقی از حوزه کاری یک شرکت و سازمان داشته باشد. تحلیلگر کسبوکار روی موضوع یا مشکلات خاص در یک شرکت کار میکند. پس از تجزیهوتحلیل داده پیشنهادها و گامهایی که برای بهبود تجارت باید برداشته شود را به مدیران و ذینفعان یک شرکت ارائه میکند. در واقع کار تحلیلگر کسبوکار پیداکردن مشکلات یک شرکت از درون دادهها و یافتن راهی برای حل آنها است.
انواع تحلیل داده و کاربرد آنها در کسب و کار
حالا که بهتر با داده و اطلاعات و تجزیهوتحلیل آشنا شدیم به سراغ انواع تحلیل روی دادهها میرویم.
چند نوع تحلیل داده داریم؟
تجزیه و تحلیل توصیفی (Descriptive analytics ) :
تحلیل توصیفی پله اول در مراحل بلوغ تحلیلی یک سازمان است. تحلیل توصیفکننده به ما میگوید چه اتفاقی درگذشته افتاده است. تجمیع داده و دادهکاوی دو تکنیک اصلی در تحلیل توصیفی هستند تحلیلگر ابتدا دادهها را جمعآوری میکند و به شکل خلاصه شده آنها را ارائه میکند تا بعد دادهها را برای پیداکردن الگوها کاوش کند.
پس از طی این مراحل داده به صورتی که برای مخاطبان قابلدرک باشد تصویرسازی میشود. باید توجه کرد تحلیل توصیفی تلاشی برای توضیح دادن دادهها یا مشخصکردن روابط علت و معلولی نمیکند. در این مرحله صرفاً تحلیل میگوید “چه چیزی” اتفاق افتاده است.
تجزیه و تحلیل تشخیصی (Diagnostic analytics) :
تحلیل توصیفی میگوید چه چیزی اتفاق افتاده، تحلیل تشخیصی میگوید چرا اتفاق افتاده است.
معمولاً تحلیلگر داده ابتدا سعی میکند ناهنجاریهای داخل داده را پیدا کند (هر چیزی که نمی توان باتوجهبه داده توضیح داد) مثلاً اگر داده نشان دهد که افزایش یا کاهش ناگهانی فروش در دیماه اتفاق افتاده است تحلیلگر داده باید آن را بررسی کند. برای این کار تحلیلگر مرحله “کشف” را شروع میکند؛ یعنی به دنبال سایر منابعی میگردد که ممکن است علت ناهنجاری را به او بگویید.
در نهایت تحلیلگر سعی میکند روابط سببی که منجر به ناهنجاری شده اند را کشف کند، مثلاً بررسی هر رویدادی که ممکن است با افزایش و کاهش فروش همبستگی یا مطابقت داشته باشد. (مثلاً تغییرات بازار، نوع فروش، تخفیف و …) در این مرحله تحلیلگر داده از تحلیل رگرسیون، تئوری احتمال، فیلترکردن و تحلیل سریهای زمانی استفاده کند.
تجزیهوتحلیل در لحظه (Real Time analytics) :
تجزیهوتحلیل داده بهمحض ثبت و ذخیره شدن داده اتفاق میافتد. به عبارتی کاربران میتوانند بلافاصله پس از ثبت داده در سیستم از آن برای نتیجهگیری و درک شرایطی که در حال رخ دادن در آن لحظه است استفاده کنند.
تحلیل لحظهای به شرکتها اجازه میدهد تا بدون تأخیر به اتفاقات واکنش نشان دهند، فرصتها را جذب و مشکلات را پیش از شکلگرفتن رفع کنند.
تجزیه تحلیل پیشبینیکننده (Predictive analytics) :
همانطور که از اسمش پیداست سعی میکند آنچه که احتمالاً در آینده اتفاق میافتد را پیشبینی کند. در این مرحله است که تحلیلگر داده راهحلهای عملی و دادهمحور را در اختیار شرکت میگذارد تا قدمهای بعدی را با آگاهی بردارند.
تحلیل پیشبینیکننده احتمال وقوع اتفاقات آینده را بر اساس دادههای قبلی و تئوری احتمالات میسنجد. با اینکه پیشبینی هیچوقت کاملاً قطعی نیست؛ اما میزان اطمینان به تصمیمات را بالا برده و حدس و گمان قبل از تصمیم گرفتن را تا حد زیادی از بین میبرد.این نوع از تحلیل برای پیشبینی اتفاقات متنوع و متفاوتی استفاده میشود؛ مثلاً چه محصولی بیشترین تقاضا را در سه ماه آینده خواهد داشت یا شش ماه آینده درآمد شرکت چقدر افزایش یا کاهش پیدا میکند.
تحلیل پیشبینی کننده شانس شرکتها برای رسیدن به نتیجه دلخواه را بهشدت افزایش میدهد.
تحلیل تجویزی (Prescriptive analytics) :
در ادامه تحلیل پیشبینیکننده قرار دارد، آن را تکمیل میکند و کارها و اقداماتی که باید انجام شوند را به ما توصیه میکند. بهعبارتدیگر به ما نشان میدهد چطور از نتایج پیشبینی شده استفاده کنیم.تحلیلگر برای انجام این نوع از تجزیهوتحلیل تمام سناریوهای احتمالی را در نظر میگیرد سپس کارهایی که شرکت امکان انجام آنها را دارد بررسی و ارزیابی میکند.
تحلیل تجویزی یکی از پیچیدهترین انواع تجزیهوتحلیل است و معمولاً به استفاده از الگوریتمها، یادگیری ماشین، و مدلسازی محاسباتی نیاز دارد.
3 روش اصلی تأثیرگذاری داده بر موفقیت کسبوکارها
دادهها از روشهای مختلف روی موفقیت یک کسبوکار تأثیر میگذارند؛ اما بیشترین استفاده شرکتهای پیشرو در سه مورد زیر خلاصه میشود
ارتقا و بهبود فرایند تصمیمگیری:
اولین استفاده مهم شرکتها از تحلیل داده، تأثیرگذاری آن در روش تصمیمگیری مدیران و بهبود فرایند تصمیمگیری در شرکت است. تحلیل داده میتواند پاسخ سؤالات شما را بدهد تا در نهایت بهترین تصمیم را برای کسبوکار خود بگیرید.
ابتدا سؤالات بیپاسخ درباره کسبوکار خود را مشخص کنید سپس ببینید چه دادهای را باید تحلیل کنید تا به جواب آن سؤالها برسید.
بازسازی و اصلاح فرایندهای عملیاتی:
هر فرایند تجاری که به تولید داده منجر میشود (اطلاعات سفارش مشتریها یا دادههای خط تولید کارخانه) را میتوان بهینهسازی کرد.
بهرهوری در خطوط تولید، زنجیره تأمین، انبارداری، و منابع انسانی با بهبود در کارهایی که روزانه تکرار میشوند افزایش مییابد. تحلیل داده به درک ما را از فرایندهای روزانه کمک کرده و بهینهکردن آنها را ممکن میکند.
ایجاد مسیرهای درآمدی جدید:
هر چه حجم و پیچیدگی دادهای که در شرکت ذخیره میشود بیشتر باشد جذابیت آن بهعنوان یک منبع تجاری بالاتر میرود. فروش و به اشتراک گذاشتن این دادهها میتواند یک منبع جدید درآمدی باشد. شرکتهای زیادی در جهان به دلیل در اختیار داشتن دادههای خاص توانستهاند به بازیگر اصلی صنعت خود تبدیل شوند.
جمعبندی پایانی:
- داده و اطلاعات یکی از داراییهای مهم کسبوکارها در جهان امروز است
- داده هر چیزی است که قابلشمارش، اندازهگیری یا توصیف باشد
- داده کیفی برای دستهبندی سایر چیزها به کار میرود
- داده کمی یک عدد صحیح یا اعشاری است که برای شمارش و اندازهگیری چیزها استفاده میشود
- داده ساختاریافته در پایگاههای داده استفاده میشود و در هوش تجاری کاربرد زیادی دارد.
- با دانستن تفاوت انواع داده از میتوانیم از آنها بهتر استفاده کنیم
- با تبدیل داده به اطلاعات میتوانیم از آن برای پاسخ به سؤالات خود استفاده کنیم
- داده عدد و رقم خام و پردازش نشده است، اطلاعات داده پردازش شده، دستهبندیشده است که به شکل قابلفهم ارائه میشود
- تحلیل داده؛ یعنی تبدیل کردن دادههای غیرقابلدرک به اطلاعات منسجم و قابلفهم
- تجزیهوتحلیل توصیفکننده به ما میگوید چه اتفاقی درگذشته رخداده است
- تجزیهوتحلیل تشخیصی علت اتفاقات رخداده را مشخص میکند
- تجزیهوتحلیل در لحظه اتفاقاتی که در حال رخدادن است را تحلیل میکند
- تجزیهوتحلیل پیشبینیکننده احتمال وقع یک اتفاق در آینده را بررسی میکند
- تجزیهوتحلیل تجویز کنند به ما میگوید چه گونه از نتایج پیشبینیشده استفاده کنیم
2 پاسخ
سلام
بسیار عالی نوشتید. شکل بیان مطلب عامه فهم بود
سلام
خوشحالیم که مطلب مورد توجه شما قرار گرفته، هدف مقالات وبلاگ دیکام معرفی هوش تجاری و تحلیل داده به صورت ساده و به دور از اصطلاحات فنی است.
سپاس از کامنت شما