بسیاری از ما با «سازمانهای مبتنی بر دادهها» آشنایی داریم. چنین سازمانیهایی با جمعآوری خودکار فرادادههایی در خصوص این که دادهها چه چیز را توصیف میکنند، از کجا آمدهاند، چه کسی از آنها استفاده میکند و چگونه مورد استفاده قرار میگیرند، دانش حاصل از دادههای خود را متمرکز مینمایند. این امر امکان جستجوی سریع و همکاری متقابل را برای تحلیلگران، مسئولان دادهها، کاربران دادهها و کارمندان بخش IT فراهم میکند و به آنها این اجازه را میدهد که دانش خود را به اشتراک بگذارند، ایدههایشان را تبادل کنند و پاسخهای مورد نظر خود را سریعتر بیابند. در چند سال گذشته، ما متوجه شدیم که بین مبتنی بر داده بودن سازمانها با اندازه یا محل جغرافیایی آنها ارتباط بسیار اندکی وجود دارد و فعالیت خاص سازمانها نیز با مبتنی بر داده بودن آنها تنها یک ارتباط جزئی دارد. در حقیقت، سازمانهای مبتنی بر دادهها، طیف وسیعی از شرکتهای کوچک خدمات بهداشتی و درمانی تا بانکهای بزرگ و حتی سازمانهای عامالمنفعه و بشردوستانه را شامل میشوند. در حالی که با استفاده از شیوههای مرسوم طبقهبندی، نمیتوان سازمانهای مبتنی بر دادهها را طبقهبندی نمود، چند مشخصهی مشترک در میان این سازمانها مشاهده شده است. در این نوشتار، با بهرهگیری از پژوهش شرکت «Experian Data Quality»، گزارشهای «eWEEK» و بینش ساتین سانگانی، مدیرعامل شرکت Alation، در صنعت تعداد زیادی از مشخصههایی که در تعریف سازمانهای مبتنی بر دادهها استفاده میشوند، تعیین گردیدهاند.
تصور نکنید که همه از زمان تولد با علم دادهها آشنایی داشتهاند بیشتر سازمانهای مبتنی بر دادهها به طور مستمر تحلیلگران و دیگر کارکنان خود را برای استفادهی درست از دادهها آموزش میدهند. بازه آموزش دادهها از فهم چگونگی محاسبه سنجههای کلیدی تا فهم الزامات تنظیم مقررات برای استفاده کردن از دادهها گسترده است. با این حال، حتی پیشرفتهترین شرکتها اذعان داشتهاند که این کار با توجه به رشد و تغییر مداوم سیستمها و کسبوکارها و همچنین بیثباتی نقشها، نبرد بسیار دشواری است.
دادههایی که برای یک نفر مورد استفاده نیست، ممکن است برای دیگران مفید باشند امروزه، در سازمانها تنها در حدود ۱۲ درصد از دادهها مورد تحلیل قرار میگیرند. ۸۸ درصد از دادهها، هرچند که ممکن است حاوی نکات مفیدی باشند، دست نخورده باقی میمانند. دلیل این امر قرار داشتن تیمهای ذخیرهکننده دادهها و گروههایی که به این دادهها نیاز دارند، در قسمتهای متفاوت سازمان است. برخی از مجموعه دادههایی که مورد استفاده قرار میگیرند ممکن است منقضی شده باشند، بیش از حد نویز داشته باشند یا اشتباه محاسبه شده باشند که در این صورت نباید از آنها استفاده کرد. سازمانهای مبتنی بر دادهها موانع دسترسی به سیلوهای داده را درهم شکستند و به کاربران اجازه دسترسی به دادههای مفیدی را که در بخشهای مجزا قرار دارند، فراهم کردند. در عین حال، این سازمانها دادههایی را که هیچ کاربردی نداشتند، شناسایی کردند و از بین بردند.
دادهها باید به صورت تمیز و مرتب نگهداری شوند در نگهداری دادهها، کیفیت بسیار اهمیت دارد. سازمانهای ITمحور غالباً به کمک دانشمندان علم دادهها و با استفاده از آپاچی هادوپ، به بررسی ترابایتها و پتابایتهای دادهها میپردازند تا بتواند برای خود مزیت رقابتی کسب نمایند. واقعیت این است که تعداد زیادی از آنها از سندروم رایجِ ورود و خروج مکرر دادههای غیرمفید رنج میبرند. نه تنها این سازمانها از نظر پیچیدگی و حجم با دادههای بزرگ سروکار ندارند، بلکه عملاً بیشتر دادههای آنها بسیار ساده است. بدون شک، این موضوع به کسب و کارشان صدمه میزند و کمکی به آنها نخواهد کرد. طبق پژوهش Experian Data Quality، دادههای نادرست به صورت مستقیم بر روی ۸۸ درصد درآمد کلی سازمانها تأثیر میگذارد و تا حد ۱۲ درصد نیز بر سود سازمانها تأثیر خواهد داشت.
ورود و خروج مکرر دادههای غیرمفید کار را دشوارتر میکند در حال حاضر بیشتر سازمانها میدانند که کیفیت دادهها به اندازه خود دادهها اهمیت دارند. اگر شما دادههای درستی داشته باشید، ولی نیمی از آنها از بین رفته باشند یا بدتر از آن، نادرست باشند، احتمالاً این دادهها برای شما غیر قابل استفاده خواهند بود. علاوه بر این، حتی اگر دادههای شما کاملاً تمیز و دقیق باشند، استفاده از محاسبات یا تعاریف اشتباه میتواند به تولید سنجههایی کاملاً گمراهکننده بینجامد. بزگترین مشکل این است که دادهها یا گزارشها، صحت این اطلاعات را نشان نمیدهند و کاربر مجبور است که برای تأیید درست یا نادرست بودن دادهها به خرد جمعی سازمان مراجعه کند.
پیچیدگی دادهها از ابعاد آنها مهمتر است ممکن است تصور کنید که سازمانهای مبتنی بر دادهها، چندین اگزابایت داده دارند. اما اندازه، فقط یکی از عوامل مهم در مبتنی بر دادهها بودن سازمان است. در واقع، مهمترین عامل تنوع دادهها است. تنوع دادهها به این معنی است که آیا افراد در مورد کارکردهای مختلف کسبوکار، سؤال میپرسند و آیا آنها هزینه و کیفیت خدمات، تجهیز کمپینهای بازاریابی یا توجه به حفظ یک عضو در تیم را مورد بررسی قرار میدهند. اگر گزارش شما در مورد هزینهها و سود حاصله فقط مربوط به یک ماه گذشته باشد، شاید نتوان سازمان شما را مبتنی بر دادهها نامید.
در دسترس بودن دادهها به معنی حفاظت نکردن از آنها نیست هیچ چیز مانند رخنه به اطلاعات شفافیت را از بین نمیبرد. شرکتهای مبتنی بر دادهها سرسختانه از دادههای خود در مقابل تهدیدهای خارجی مراقبت میکنند. در همین حال، در داخل سازمان سیاستهایی اتخاذ میکنند که دسترسی به دادههای حساس را محدود کنند و در مقابل، دسترسیهایی به دادههای مورد نیاز برای تحلیلگران و تصمیمگیران ایجاد نمایند. تعادل مسئلهی مهمی است.
دادهها در همه جا حضور دارند ممکن است تصور شود که دادهها باید همان طور که در یک کتابخانه هر کتاب در جای خود قرار میگیرد، سازماندهی و نگهداری شوند. ولی در عمل، بیشتر سازمانهای مبتنی بر دادهها کاملاً برعکس رفتار میکنند. در این سازمانها، دادهها در بخشهای مختلف سازمان از جمله روی پایگاههای داده، داخل ابزارهای هوشمندی کسبوکار، روی سرورهای فایل و روی گزارشهای موجود در رایانههای شخصی افراد، یافت میشوند. مهم این است که بدانیم دادهها در کجا قرار دارند، نه این که آنها را متمرکز و محدود کنیم.
انتخاب آزادانه تکنولوژی به ظهور سریع بینشها میانجامد دغدغه اصلی افراد در کسبوکارهای مبتنی بر دادهها، معمولاً به توانایی کسب سریع بینشها معطوف میشود. مقید کردن تحلیلگران به یادگیری و استفاده از مدلهای از پیش تعریفشده توسط بخش IT و ابزارهای از پیش تعیینشده باعث میشود تا سرعت کار تحلیلگران کاهش یابد. در نتیجه، جذب و حفظ آنها در سازمان نیز سختتر خواهد شد. در اکثر سازمانهای مبتنی بر دادهها، تحلیلگران از ابزارهایی استفاده میکنند که خود آنها را انتخاب کردهاند.
دادهها در داخل سازمان، به تمام بخشها راه مییابند دادهها باید کارمندان تازه کار را در تصمیمگیریها توانمندتر سازند. مدیران غالباً برای برقراری ارتباط منطقی در پشت تصمیمهایشان و ایجاد انگیزه در فعالیتها از دادهها بهره میبرند. دادهها باید تمام افراد را قادر سازند تا بدون نیاز به مشورت با مدیران سطوح بالاتر، خود به تنهایی تصمیمگیری نمایند. برای مثال، با بررسی نرخ ریزش مشتریان میتوان تصمیم گرفت که باید بر روی خدمات پس از فروش سرمایهگذاری کرد یا فرایندهای بازاریابی. مقایسه درآمد سازمان با دیگر رقبا نیز میتواند برای توضیح افزایش سرمایهگذاری بر روی فرایندهای فروش به کار رود.