یکی از مزایای مهم استخراج فرآیند این است که با داده هایی که از قبل در آنجا وجود دارد شروع می شود و معمولاً بسیار ساده شروع می شود. نیازی به تنظیم اولین چارچوب جمع آوری داده نیست. در عوض می توانید از داده هایی که به عنوان محصول جانبی افزایش اتوماسیون و دیجیتالی شدن فرآیندهای تجاری خود جمع می شود ، استفاده کنید. این داده ها در حال حاضر توسط سیستم های مختلف فناوری اطلاعات که قبلاً برای پشتیبانی از تجارت خود وجود دارد ، جمع آوری می شود.
بعضی اوقات مردم نگران این هستند که داده های مناسبی ندارند ، اما در عمل به ندرت اینگونه است. بسیاری از سیستم های گردش کار ، سیستم های CRM ، سیستم های ERP ، یادداشت های تحویل ، درخواست ، شکایت ، بلیط یا سیستم سفارش و غیره وجود دارد - بنابراین بیشتر سازمان ها داده های زیادی دارند.
نقطه شروع برای معدن فرآیند ، به اصطلاح گزارش رویداد است. اما یک گزارش رویداد دقیقاً چیست؟گزارش های رویداد از کجا آمده است؟و چگونه می دانید که آیا داده های شما الزامات لازم برای استفاده از معدن فرآیند را برآورده می کند؟این همان چیزی است که این فصل مقدماتی در مورد آن است.
آنچه یاد خواهید گرفت:
- چه نوع داده ای برای انجام تجزیه و تحلیل فرایند معدن لازم است.
- سه مورد اصلی برای یک گزارش رویداد.
- چه مقدار داده نیاز دارید.
- گرفتن داده برای معدن فرآیند چقدر دشوار است.
مدل ذهنی برای معدن فرآیند
ایده اصلی استخراج فرآیند تجزیه و تحلیل داده ها از دیدگاه فرآیند است. شما می خواهید به سؤالاتی مانند "در حال حاضر به نظر می رسد که روند من چیست؟" ، "آیا زباله ها و اقدامات غیر ضروری وجود دارد که می تواند از بین برود؟" ، "تنگناها کجا هستند؟" و "آیا انحراف از آن وجود داردقوانین و فرآیندهای تجویز شده؟ "
برای اینکه بتوانید این کار را انجام دهید ، معدن فرآیند داده ها را با یک مدل ذهنی که داده ها را به نمای فرایند ترسیم می کند ، نزدیک می شود.
برای درک این معنی ، ابتدا بگذارید به یک مدل ذهنی دیگر نگاهی بیندازیم: مدل ذهنی برای تکنیک های طبقه بندی در داده کاوی.
تصور کنید که یک کارخانه ویجت دارید و می خواهید بفهمید کدام نوع از مشتریان در حال خرید ویجت های شما هستند. در سمت چپ در شکل 1 ، یک نمونه بسیار ساده از یک مجموعه داده را مشاهده می کنید. ستون هایی برای نام ویژگی ها ، حقوق ، جنس ، سن و خرید ویجت وجود دارد. هر ردیف یک نمونه در مجموعه داده ها تشکیل می دهد. نمونه نمونه ای از یادگیری است که می تواند برای یادگیری قوانین طبقه بندی استفاده شود.
شکل 1: مثال داده کاوی: کلاس هدف طبقه بندی باید پیکربندی شود.
قبل از شروع الگوریتم طبقه بندی ، باید مشخص شود که کدام یک از ستون ها کلاس هدف است. از آنجا که ما می خواهیم دریابیم که چه کسی ویجت ها را خریداری می کند ، ما ستون ویجت خرید را هدف طبقه بندی قرار می دهیم. سپس یک ابزار داده کاوی قادر به ساختن یک درخت تصمیم گیری مانند تصویر سمت راست در شکل 1 خواهد بود.
نتیجه نشان می دهد که فقط مردان با حقوق بالا در حال خرید ابزارک هستند. اگر می خواهیم قوانینی را برای یک ویژگی دیگر به دست آوریم ، به عنوان مثال ، پیش بینی می کنیم مشتریانی که ویجت های ما را خریداری می کنند چقدر قدیمی هستند ، ستون سنی هدف طبقه بندی خواهد بود.
برای استخراج فرآیند ، ما یک مدل ذهنی کمی متفاوت داریم ، زیرا ما از دیدگاه فرآیند به داده ها نگاه می کنیم.
در شکل 2 ، یک مجموعه داده نمونه ساده را از یک فرآیند مرکز تماس مشاهده می کنید. بر خلاف مثال داده کاوی در بالا ، یک ردیف فردی یک نمونه فرآیند کامل را نشان نمی دهد ، بلکه فقط یک رویداد است. از آنجا که یک مجموعه داده که برای معدن فرآیند استفاده می شود از رویدادها تشکیل شده است ، این نوع داده ها اغلب به عنوان ورود به سیستم از آن یاد می شوند. در یک گزارش رویداد:
- هر رویداد با فعالیتی که در این فرآیند اجرا شده است مطابقت دارد.
- چندین رویداد در یک نمونه یا مورد فرآیند به هم پیوند می خورند.
- از نظر منطقی ، هر مورد دنباله ای از وقایع را تشکیل می دهد که توسط زمانبندی آنها تنظیم شده است.
از نمونه داده ها در شکل 2 ، می بینید که چرا حتی انجام تجزیه و تحلیل های ساده مربوط به فرآیند ، مانند اندازه گیری فرکانس انواع جریان فرآیند یا زمان بین فعالیت ها ، با استفاده از ابزارهای استاندارد مانند اکسل غیرممکن است. نمونه های فرآیند بیش از چند ردیف در یک صفحه گسترده پراکنده می شوند (لزوماً مرتب نشده اند!) و فقط با اتخاذ یک مدل متا فرآیند گرا می توانند در ارتباط باشند.
شکل 2: داده های ورودی معدن فرآیند: شناسه مورد ، فعالیت و زمان بندی باید مشخص شود.
به عنوان مثال ، اگر به ردیف های برجسته 6-9 در شکل 2 نگاه کنید ، می توانید یک نمونه فرآیند (Case9705) را مشاهده کنید که از وضعیت ثبت شده در 20 اکتبر 2009 شروع می شود ، به متخصص و در حال انجام می رود و به پایان می رسد. وضعیت در 19 نوامبر 2009 به پایان رسید.
اساس استخراج فرآیند این است که به داده های فرآیند تاریخی دقیقاً با چنین "لنز فرآیند" نگاه کنیم. مفهوم اصلی در واقع بسیار ساده است و یکی از مزایای بزرگی است که معدن فرآیند به فناوری خاص اتوماسیون یا سیستم های خاص بستگی ندارد. این یک فناوری سیستم منبع-آگنوستیک است ، دقیقاً به این دلیل که در حدود مدل ذهنی فرآیند گرا که در بالا توضیح داده شده است متمرکز شده است. به این ترتیب ، می توان آن را برای طیف گسترده ای از فرآیندها اعمال کرد ، از جمله اما محدود به فرآیندهای خدمات به مشتری ، نظارت بر سیستم ، مراقبت های بهداشتی ، خدمات فناوری اطلاعات ، شرکت یا فرآیندهای مالی.
حداقل نیازهای مربوط به یک رویداد رویداد
مطابق مدل ذهنی که قبلاً شرح داده شده است ، شما باید حداقل سه عنصر زیر را شناسایی کنید: شناسه مورد ، فعالیت و Timestamp (شکل 3 را ببینید). این سه عنصر به شما امکان می دهد دیدگاه فرآیند را در مورد داده ها در نظر بگیرید.
شکل 3: سه مورد حداقل برای معدن فرآیند: شناسه مورد ، نام فعالیت و حداقل یک ستون Timestamp.
در بقیه این بخش ، این مواد اصلی با جزئیات بیشتر توضیح داده شده است.
شناسه مورد
یک مورد نمونه خاصی از روند شما است. آنچه دقیقاً معنای یک مورد در وضعیت شما است به روند شما بستگی دارد. مثلا:
- در یک فرآیند خرید ، رسیدگی به یک سفارش خرید یک مورد است.
- در بیمارستان ، این بیمار می تواند یک روند تشخیص و درمان را انجام دهد.
- در یک فرآیند مرکز تماس ، یک پرونده به شماره درخواست خدمات خاص مربوط می شود.
برای هر رویدادی ، شما باید بدانید که به کدام مورد اشاره دارد ، به این ترتیب که ابزار معدن فرآیند می تواند چندین اجرای این روند را با یکدیگر مقایسه کند. بنابراین ، شما باید یک یا چند ستون داشته باشید که به طور منحصر به فرد یک اجرای واحد فرآیند خود را مشخص می کنند. آنها یک شناسه مورد (شناسه مورد) را تشکیل می دهند.
شناسه مورد دامنه روند را تعیین می کند.
آگاه باشید که شناسه مورد بر دامنه فرآیند شما تأثیر می گذارد. این تعیین می کند که روند شما از کجا شروع می شود و از کجا به پایان می رسد. در واقع ، ممکن است بیش از یک راه برای تنظیم شناسه پرونده شما وجود داشته باشد.
به عنوان مثال ، در یک فرآیند خدمات مشتری می توانید شناسه پرونده را به دو روش مختلف تنظیم کنید. اول از همه ، شما ممکن است پردازش یک درخواست خدمات خاص (SR) را به عنوان فرایندی که می خواهید تجزیه و تحلیل کنید ، مشاهده کنید. سپس شماره SR شناسه پرونده شماست (شکل 4 را ببینید).
شکل 4: هر شماره درخواست خدمات (SR1 و SR2) به عنوان یک مورد جداگانه تعبیر می شود (توجه داشته باشید که چگونه فرکانس های شروع و پایان در خطوط متراکم نشان می دهد که دو مورد وجود دارد).
در همان زمان، ممکن است بخواهید فرآیند کلی یک مشتری را بهعنوان محدوده فرآیند خود ببینید - ممکن است همان مشتری در طول زمان چندین درخواست خدمات را انجام داده باشد. سپس شناسه مشتری شناسه پرونده شماست (شکل 5 را ببینید).
شکل 5: اگر شناسه مشتری به عنوان یک مورد استفاده شود، تمام پنج مرحله در مجموعه داده نمونه به یک مورد منفرد نگاشت می شوند.
هر دو گزینه منطقی هستند و بسته به اهداف تحلیل شما می توانند منطقی باشند. در پروژه خود می توانید دیدگاه های متفاوتی در مورد فرآیند داشته باشید و آن را از دیدگاه های مختلف تجزیه و تحلیل کنید (همچنین نگاه کنید به دیدگاه های مختلف در مورد فرآیند شما). بخش مهم در حال حاضر این است که شما حداقل یک ستون دارید که می توان از آن برای تشخیص نمونه های فرآیند خود استفاده کرد و به عنوان شناسه موردی استفاده کرد.
فعالیت¶
یک فعالیت یک مرحله از فرآیند شما را تشکیل می دهد. به عنوان مثال، فرآیند نگارش سند ممکن است شامل مراحل «ایجاد»، «بهروزرسانی»، «ارسال»، «تأیید»، «درخواست دوباره کاری»، «تجدیدنظر»، «انتشار»، «رد کردن» (که توسط افراد مختلف انجام میشود، مانندبه عنوان نویسنده و ویراستار). برخی از این مراحل ممکن است بیش از یک بار برای یک مورد اتفاق بیفتند در حالی که لازم نیست همه آنها هر بار انجام شوند.
باید نام هایی برای مراحل مختلف فرآیند یا تغییرات وضعیتی که در فرآیند انجام شده است وجود داشته باشد. اگر برای هر مورد فقط یک ورودی (یک ردیف) دارید، پس اطلاعات شما به اندازه کافی دقیق نیست. داده های شما باید در سطح تراکنش باشد (شما باید به تاریخچه هر مورد دسترسی داشته باشید) و نباید در سطح مورد جمع شوند.
رویدادها گاهی اوقات می توانند نه تنها فعالیت هایی را که برای شما مهم هستند، بلکه اطلاعات فنی کمتر جالبی را نیز ثبت کنند. به دنبال رویدادهایی باشید که فعالیتهای جالب فرآیند شما را از منظر تجاری توصیف میکنند. در حالی که میتوانید رویدادهای کمتر مرتبط را بعداً در تجزیه و تحلیل فیلتر کنید، مهم است که مطمئن شوید که مراحل فرآیند مربوطه در دادههای شما ثبت شده است.
نامهای فعالیت، مراحل نقشه فرآیند شما و جزئیات آنها را تعیین میکنند.
توجه داشته باشید که فعالیت انتخاب شده بر سطح ریزه کاری که با آن به فرآیند خود نگاه می کنید تأثیر می گذارد. مجدداً، ممکن است چندین ستون وجود داشته باشد که بتوان آنها را با هم ترکیب کرد تا نام فعالیت را تشکیل دهد، و ممکن است چندین دیدگاه جایگزین در مورد آنچه که یک فعالیت را تشکیل می دهد وجود داشته باشد.
به عنوان مثال ، در فرآیند تألیف سند در بالا ، ممکن است در یک ستون اضافی در مورد سطح کار مورد نیاز (عمده در مقابل جزئی) در مرحله "درخواست مجدد" اطلاعات اضافی داشته باشید. اگر فقط از ستون مرحله فرآیند معمولی به عنوان فعالیت خود استفاده می کنید ، "درخواست مجدد" به عنوان یک گره فعالیت در نقشه فرآیند خود ظاهر می شود (شکل 6 را ببینید).
شکل 6: فقط با استفاده از نام مرحله فرایند ، نمای سطح بالایی از فرآیند را به شما می دهد.
با این حال ، اگر تصمیم دارید سطح کار (عمده یا جزئی) را در نام فعالیت درج کنید ، دو مرحله فرآیند مختلف "درخواست مجدد - عمده" و "درخواست مجدد - جزئی" در نقشه فرآیند ظاهر می شوند (شکل 7 را ببینید).
شکل 7: از جمله نوع بازپرداخت در نام فعالیت ، نمای ریز و درشت تری از فرآیند ایجاد می کند.
مانند گذشته ، هر دو گزینه می توانند معنی داشته باشند. در طول تحلیل خود می توانید برای پاسخ به سؤالات مختلف ، نظرات مختلفی را در نظر بگیرید (همچنین به دیدگاه های مختلف در مورد روند خود مراجعه کنید). برای شروع ، مهم است که حداقل یک ستون داشته باشید که می تواند برای تشخیص مراحل فرآیند شما استفاده شود و به عنوان یک نام فعالیت استفاده شود.
Timestamp¶
سومین پیش نیاز مهم برای معدن فرآیند ، حداقل یک ستون Timestamp است که نشان می دهد چه زمانی هر یک از فعالیت ها انجام شده است. این نه تنها برای تجزیه و تحلیل رفتار زمان بندی فرآیند بلکه برای تعیین ترتیب فعالیت ها در ورود به سیستم شما مهم است.
اگر پرونده ورود به سیستم پی در پی ندارید ، برای تعیین ترتیب فعالیت در فرآیند خود به زمان بندی نیاز دارید.
بعضی اوقات ، شما یک شروع و یک زمان بندی کامل برای هر فعالیت در این فرآیند دارید. این خوبه. این امکان را به شما می دهد تا زمان پردازش یک فعالیت را تجزیه و تحلیل کنید (زمانی که کسی به طور فعال برای انجام آن کار صرف کرده است) ، همچنین به نام زمان اجرای یا زمان کار با فعالیت نامیده می شود. برای یادگیری نحوه درج چندین جدول زمانی در دیسکو ، به چندین ستون Timestamp مراجعه کنید.
اگر فقط یک Timestamp دارید ، می توانید زمان بین دو مرحله فرآیند را تجزیه و تحلیل کنید ، اما نمی توانید ببینید که هر یک از فعالیت ها چه مدت طول می کشد (به نظر می رسد زمان پردازش فوری است). نگران نباشید که این مورد برای مجموعه داده های شما باشد. در حقیقت ، بسیاری از سیستم ها فقط یک Timestamp را ضبط می کنند و شما قادر خواهید بود بیشتر تحلیل هایی را که می خواهید انجام دهید انجام دهید.
اگر به هیچ وجه هیچ وقت ندارید ، این شانس خوب است که هنوز هم می توانید یک تجزیه و تحلیل معدن فرآیند را انجام دهید: بررسی کنید که آیا ترتیب وقایع موجود در پرونده شما با ترتیب انجام مراحل مطابقت دارد (یا اینکه آیا شمامی توانید یک شماره دنباله ای پیدا کنید که می توانید از آنها استفاده کنید تا آنها را به ترتیب مناسب بیاورید). Timestamp تنها یکی از سه موردی است که می توانید هنگام وارد کردن داده های خود از آن خارج شوید. Disco به سادگی از ترتیب ردیف ها در پرونده داده خود استفاده می کند تا توالی مراحل هر مورد را تعیین کند.
سرانجام ، نگران قالب زمان بندی نباشید. Disco می تواند با الگوی Timestamp شما سازگار باشد و نیازی به قرار دادن جدول زمانی شما در قالب ثابت نیست (برای جزئیات بیشتر به پیکربندی الگوهای Timestamp مراجعه کنید).
ستون های دیگر
ستون های اضافی ممکن است برای فرآیند شما در دسترس باشد و توصیه می کنیم آنها را درج کنید. چنین ویژگی های اضافی زمینه را فراهم می کند و می تواند در تجزیه و تحلیل نیز استفاده شود. به عنوان مثال ، ممکن است ویژگی هایی وجود داشته باشد که اطلاعات مهمی را برای پاسخ به سؤالاتی که در مورد فرآیند خود دارید ، ارائه می دهد.
کدام ویژگی ها برای شما مرتبط است به دامنه و مورد استفاده شما بستگی دارد. برخی از ویژگی های اضافی معمولی عبارتند از:
- درخواست خدمات در مرکز تماس در مورد چه نوع محصولی (یا سفارش در یک فرآیند فروش یا تعمیر) بود. اگر می خواهید عملکرد را برای دسته بندی محصولات مختلف مقایسه کنید ، این ویژگی را درج کنید.
- ممکن است دسته های فرآیند وجود داشته باشد که قبلاً تعریف شده اند. به عنوان مثال ، در خدمات فناوری اطلاعات فرآیندهای مختلفی برای مدیریت حوادث ، تغییر سفارشات و تحقق یا خدمات میدانی وجود دارد. با استفاده از نوع فرآیند می توانید داده ها را جدا کرده و فرآیندهای مربوطه را در انزوا تجزیه و تحلیل کنید.
- کانال که از طریق آن یک سرب وارد شد (ایمیل یا تبلیغات تبلیغاتی ، کوپن و غیره) اغلب برای فرآیندهای فروش مرتبط است. به همین ترتیب ، برای خدمات تعمیر درخواست های جدید ممکن است از طریق نمایندگی ، مرکز تماس یا پورتال وب وارد شود.
- فرایندها می توانند برای شرکای مختلف متفاوت باشند. به عنوان مثال ، شما ممکن است بخواهید روند کار را در فرآیند خدمات مختلف در مراحل خدمات مقایسه کنید.
- خصوصیات خاص دامنه در حال تأثیرگذاری بر فرآیندهای تأثیرگذار است: در یک سرویس تعمیر ، الزامات مختلفی برای گارانتی در مقابل تعمیرات خارج از ضمانت وجود دارد. در بیمارستان ، بیماری یک بیمار تشخیص دقیق و روند درمانی و غیره را تعیین می کند.
- توسط کدام شخص یا بخش فعالیت انجام می شد. این اطلاعات برای تجزیه و تحلیل انتقال سازمانی مورد نیاز است ، که ممکن است الگوهای ارتباطی و ناکارآمدی در نقاط دستکاری بین واحدهای سازمانی را نشان دهد.
- اگر در حال تجزیه و تحلیل داده های یک شرکت چند ملیتی هستید و می خواهید فرآیندهای موجود در کشورهای مختلف را مقایسه کنید ، باید اطلاعات کشور نیز از داده های منبع خارج شود.
- ارزش سفارش برای بسیاری از فرآیندهای خرید مرتبط است ، زیرا بسته به میزان پولی که شامل قوانین مختلف ضد کلاهبرداری است اعمال می شود.
اینها فقط نمونه هایی هستند. شامل تمام ویژگی هایی که به نظر می رسد مربوط می شود زیرا آنها می توانند اهمیت و ارزش تحلیل شما را بهبود بخشند.
به چه مقدار داده نیاز دارید؟
هنگامی که می دانید به چه نوع داده ای نیاز دارید ، اغلب تعجب می کنید که چه مقدار داده باید برای تجزیه و تحلیل معدن فرآیند خود استخراج کنید. برخلاف تکنیک های معمولی کاوی و آمار ، هیچ حداقل مقدار واقعی داده وجود ندارد که برای بدست آوردن نتیجه معدن فرآیند لازم باشد. حتی اگر فقط پنج مورد داشته باشید ، می توانید این نمونه داده های کوچک را در ابزار معدن فرآیند قرار دهید و این به شما نشان می دهد که این پنج مورد از چه مسیری عبور کرده است.
نگرانی اصلی این است که یک نمونه نماینده از داده ها برای فرآیند خود دریافت کنید. میزان داده هایی که باید استخراج کنید نیز به سؤالاتی که می خواهید به آنها پاسخ دهید بستگی دارد. به عنوان مثال ، اگر می خواهید روند معمولی را درک کنید ، در یک نقطه خاص ، اضافه کردن داده های بیشتر بینش جدیدی به شما نمی دهد. با این حال ، اگر به دنبال استثنائات یا بی نظمی هستید که از زاویه انطباق مهم هستند ، احتمالاً می خواهید داده های کل سال حسابرسی را بررسی کنید تا همه چیز را که در دوره حسابرسی اشتباه پیش آمده است ، بدست آورید.
دو روش اصلی برای استخراج داده ها برای معدن فرآیند وجود دارد که در ادامه به آنها خواهیم پرداخت.
تمام داده ها در یک بازه زمانی خاص
بهترین راه برای استخراج داده ها برای معدن فرآیند ، به دست آوردن کلیه فعالیتهای ضبط شده در یک دوره زمانی خاص است که در شکل 8 نشان داده شده است.
شکل 8: استخراج تمام داده های ثبت شده در یک دوره زمانی خاص (در اینجا 3 ماه).
پس از وارد کردن داده ها ، متوجه خواهید شد که برخی موارد ناقص هستند. این بدان معنی است که یا آغاز یا پایان پرونده از دست رفته است (به دلیل بازه زمانی انتخاب شده). به عنوان مثال ، پرونده 1 و پرونده 10 در آغاز و پرونده 5 و پرونده 10 در پایان برخی از فعالیت ها را از دست نمی دهند. با این حال ، شما می توانید به سادگی از فیلتر نقاط پایانی در دیسکو استفاده کنید تا موارد ناقص را حذف کرده و روی فرآیند کامل تمرکز کنید.
دریافت تمام داده ها در یک بازه زمانی خاص ، روش ارجح برای استخراج داده ها برای معدن فرآیند است ، زیرا این تصویر را در مورد هر آنچه در دوره زمانی انتخاب شده می گذرد ، به شما می دهد.
اگر می خواهید از این روش استفاده کنید ، سؤال این است که مدت زمان باید چه مدت باشد؟
نگرانی اصلی شما باید این باشد که مواردی از مواردی را که کاملاً در مدت زمان ضبط شده قرار می گیرند ، بدست آورید. به عنوان یک قانون شست ، توصیه می شود حداقل 3 ماه داده را بدست آورید. بسته به زمان اجرای یک نمونه فرآیند واحد ممکن است بهتر باشد تا یک سال (یا بیشتر) داده ها را بدست آورید. به عنوان مثال ، اگر روند شما معمولاً 5-6 ماه برای تکمیل نیاز دارد (به یک پرونده حقوقی در دادگاه یا یک روند مجوز ساختمان عمومی فکر کنید) ، پس یک نمونه 3 ماهه حتی یک نمونه کامل فرآیند را به شما نمی دهد.
بنابراین ، واقعاً بستگی به این دارد که یک مورد در روند شما به طور معمول در حال اجرا است. شما می خواهید مجموعه ای از موارد نماینده را بدست آورید و برای گرفتن موارد معمول و طولانی مدت نیز باید اتاق را حفظ کنید.
اگر هنوز مطمئن نیستید که چه مقدار داده هایی برای استخراج نیاز دارید ، از فرمول زیر بر اساس زمان بازده مورد انتظار برای فرآیند خود استفاده کنید:
مبنای اولیه زمان تکمیل فرآیند مورد انتظار برای یک مورد معمولی است. X 4 تضمین می کند که شما به همان اندازه داده هایی دارید که می توانید چهار مورد را مشاهده کنید که بعد از یکدیگر شروع و تکمیل شده اند (البته افراد دیگری نیز در این بین وجود خواهند داشت). X 5 موارد گاه به گاه طولانی مدت (قانون 20/80) را به خود اختصاص می دهد و اطمینان می دهد که مواردی را مشاهده می کنید که در پنجره زمانی استخراج شده تا پنج برابر بیشتر طول می کشد.
به عنوان مثال ، اگر زمان تکمیل مورد انتظار یک مورد معمولی در فرآیند شما 5 روز باشد ، فرمول 100 روز = 5 روز x 4 x 5 را باز می کند ، که تقریباً 3 ماه داده است. با این حال ، اگر یک فرآیند معمولی فقط در چند دقیقه به پایان برسد ، ممکن است استخراج چند ساعت داده کافی باشد.
این فرمول فقط یک نقطه شروع است. هرچه بیشتر در مورد روند خود بدانید ، بهتر می توانید در مورد میزان داده هایی که باید استخراج کنید قضاوت کنید.
همه پرونده ها در یک بازه زمانی مشخص شروع یا تکمیل شده اند¶
در بسیاری از موقعیت ها امکان دریافت تمام داده ها در یک بازه زمانی زیاد وجود ندارد. یک دلیل می تواند این باشد که به دلیل طولانی بودن زمان اجرای فرآیند، بازه زمانی بسیار بزرگ است. دلیل دیگر می تواند این باشد که شما باید پرونده های خود را از طریق مکان های مختلف در یک پایگاه داده دنبال کنید (همچنین به دریافت داده ها برای فرآیند کاوی چقدر دشوار است؟ مراجعه کنید؟) و استخراج همه چیز به سادگی امکان پذیر نیست.
در این حالت می توانید به بهترین وجه تمام مواردی را که در یک بازه زمانی مشخص شروع شده یا تکمیل شده اند انتخاب کنید.
شکل 9 سناریوی استخراج کلیه پرونده هایی را که در بازه زمانی یک ماهه آغاز شده اند را نشان می دهد. نقطه شروع پرونده، که مهر زمانی اولین فعالیت در فرآیند است، تعیین می کند که آیا پرونده انتخاب شده است یا خیر.
اگر علاقه مند به تجزیه و تحلیل "افتادن" در فرآیند خود هستید، این مناسب ترین روش است. به عنوان مثال، در فرآیند رسیدگی به سفارش شما به احتمال زیاد علاقه مند هستید که ببینید کدام سفارشات مشتری، یا علایق خرید، واقعاً تکمیل شده اند (به جای اینکه متوقف شوند). بنابراین، شما می توانید تمام سفارش هایی را که در یک بازه زمانی خاص ایجاد شده اند استخراج کنید.
شکل 9: استخراج تمام مواردی که در یک بازه زمانی مشخص (اینجا 1 ماه) شروع شده اند.
شکل 10 سناریوی استخراج کلیه پرونده هایی را که در بازه زمانی یک ماهه تکمیل شده اند را نشان می دهد. نقطه پایان پرونده، که مهر زمانی آخرین فعالیت در فرآیند است، تعیین می کند که آیا پرونده انتخاب شده است یا خیر.
اگر علاقه مند به تجزیه و تحلیل سوالات انطباق در فرآیند خود هستید، این مناسب ترین روش است. به عنوان مثال، در یک فرآیند خرید، ممکن است بخواهید بدانید که آیا تمام فاکتورهایی که در یک ماه خاص پرداخت شده اند، مراحل تأیید مورد نیاز را طی کرده اند یا خیر. بنابراین، شما می توانید تمام فعالیت های مربوط به فاکتورهایی را که در یک بازه زمانی خاص پرداخت شده اند استخراج کنید.[1]
شکل 10: استخراج تمام مواردی که در یک بازه زمانی مشخص (در اینجا 1 ماه) تکمیل شده اند.
مزیت انتخاب موارد بر اساس نقطه شروع یا پایان این است که شما تمام فعالیت هایی را که برای موارد انتخاب شده رخ داده است استخراج می کنید. به عنوان مثال، توجه داشته باشید که مورد 5 به طور کامل در سناریوی شکل 9 گنجانده شده است. در مقابل، فعالیت های مورد 5 که خارج از چارچوب زمانی انتخاب شده در سناریوی استخراج در شکل 8 رخ داده است "قطع شده است". به طور مشابه، مورد 1 به طور کامل در سناریوی شکل 10 گنجانده شده است، در حالی که فعالیت هایی که قبل از بازه زمانی انتخاب شده رخ داده اند در سناریوی شکل 8 حذف شده اند.
با این حال ، در حالت ایده آل می توانید یک بازه زمانی بزرگ را مطابق سناریوی شکل 8 انتخاب کنید که این موارد مرزی ناچیز است. مزیت استخراج کلیه فعالیت ها در یک بازه زمانی خاص این است که این روش امکان تجزیه و تحلیل کامل را برای شما حفظ می کند. شما هنوز هم می توانید با جدا کردن مواردی که در یک بازه زمانی خاص (Sub) با فیلتر بازه زمانی در دیسکو شروع یا تکمیل شده اند ، هر دو سؤال از سقوط و انطباق را تجزیه و تحلیل کنید.
از هر روش انتخاب داده استفاده شده است ، باید بدانید که چگونه داده ها استخراج شده اند ، زیرا هنگام تفسیر نتایج باید آن اطلاعات را در نظر بگیرید. به عنوان مثال ، اگر فقط موارد در یک بازه زمانی خاص شروع یا تکمیل شده باشد ، باید توجه داشته باشید که فعالیت های مربوط به موارد دیگر ممکن است در بازه زمانی که شما تجزیه و تحلیل می کنید انجام شود. با این حال ، شما این فعالیت ها را در مجموعه داده های خود مشاهده نخواهید کرد. بنابراین ، هر تجزیه و تحلیل مربوط به بار کار و استفاده از منابع تحریف می شود.
دریافت داده برای استخراج فرآیند چقدر دشوار است؟
قابل درک است که یکی از اولین سؤالاتی که یک فرآیند جدید ماینر دارد این است که "چقدر تلاش برای تهیه داده برای معدن فرآیند خواهد بود؟"متأسفانه ، هیچ پاسخ ساده ای برای این سوال وجود ندارد. بستگی دارد
شکل 11: برخی از سیستم ها سابقه ای را ارائه می دهند که می تواند به طور مستقیم برای معدن فرآیند مورد استفاده قرار گیرد ، در حالی که برای برخی دیگر برای اولین بار باید ورود به سیستم رویداد خود را از نمایش داده های سفارشی ایجاد کنید.
در اصل ، دو نوع سیستم وجود دارد (همچنین به شکل 11 مراجعه کنید):
- سیستمهایی که تاریخ را ارائه می دهند. در انتهای آسان تر طیف سیستم هایی وجود دارند که تاریخچه مورد را ضبط می کنند. به عنوان مثال ، ارتباط مشتری (CRM) ، مدیریت خدمات فناوری اطلاعات (ITSM) ، مدیریت سفارش و سیستم گردش کار به طور معمول در این گروه قرار می گیرد.
غالباً ، این سیستم ها دارای یک دنباله حسابرسی ، جدول تاریخ یا سیاهههای تاریخ در یک شکل یا شکل دیگر هستند. به عنوان مثال ، در یک سیستم ISM هر مورد دارای شماره بلیط است و تغییرات وضعیت برای هر حادثه ثبت می شود ، درخواست تغییر یا بلیط مشکلی که مربوط به آن است.
در بسیاری از مواقع ، این جداول تاریخ را می توان به راحتی به عنوان یک فایل CSV صادر کرد و مستقیماً در ابزار معدن فرآیند و بدون هیچ پردازشی وارد می شود.
- سیستم هایی که باید تاریخچه را برای آنها بسازید. در انتهای دشوارتر طیف، سیستم های پایگاه داده محور مانند سیستم های برنامه ریزی منابع سازمانی (ERP) و برخی از انواع سیستم های قدیمی را خواهید یافت. در این سیستم ها، تاریخچه پرونده به راحتی در دسترس نیست. شما باید داده های مربوطه را در جداول پایگاه داده کسب و کار پیدا کنید و گزارش رویداد خود را برای تجزیه و تحلیل ایجاد کنید.
با این حال، میتوانید ساده را به روش زیر شروع کنید: از صاحب فرآیند بخواهید یک نقشه فرآیند ساده را روی تخته سفید ترسیم کند که فقط شامل مهمترین 5-10 فعالیت در فرآیند است. سپس میتوانید به بخش فناوری اطلاعات بروید و از آنها بخواهید که به دنبال مُهرهای زمانی مرتبط با این فعالیتها در پایگاه داده کسبوکار باشند. مسئله این است که شما معمولاً به دنبال ثبتهای فنی نیستید، بلکه میخواهید فرآیند را از منظر تجاری تجزیه و تحلیل کنید. و تقریباً تمام نقاط عطف فرآیند مهم به نوعی در داده های تجاری ثبت می شود. به عنوان مثال، در یک فرآیند فروش، تاریخی که یک پیشنهاد فروش برای مشتری بالقوه ارسال شد، در جایی ثبت می شود. از آنها بخواهید تا مُهرهای زمانی این فعالیتها را همراه با اطلاعات پرونده استخراج کنند و گزارش رویداد خود را برای فرآیند کاوی آماده کنید.
خود را فقط به سیستم هایی محدود نکنید که به راحتی تاریخچه ای را برای صادرات ارائه می دهند، یا آن را تا زمانی که سیستم های مدرنی داشته باشید که داده های کاملی را ثبت می کنند، موکول نکنید. زیبایی فرآیند کاوی این است که برای هر سیستم فناوری اطلاعات از طریق مدل متا ساده (شناسه مورد، نام فعالیت و مهر زمانی) که در بالا مورد بحث قرار گرفت، کار میکند. به خصوص برای سیستمهای قدیمیتر، بینشها میتواند حتی بیشتر باشد، زیرا فرآیندها صریح نیستند و گردشهای کاری در برنامه به صورت سخت کدگذاری شدهاند. ما تحلیلهای شگفتانگیز فرآیند کاوی سیستمهای قدیمی از دهه ۸۰ را دیدهایم که مطمئناً برای پشتیبانی از فرآیند کاوی ساخته نشدهاند.
چالش دیگری که ممکن است با آن روبرو شوید این است که این فرآیند توسط چندین سیستم فناوری اطلاعات پشتیبانی می شود. در این وضعیت، داده ها نیز بر روی این سیستم های مختلف توزیع می شوند. برای مثال، دادههای مربوط به فرآیند خرید در آموزش عملی فقط از یک سیستم به دست آمده است. با این حال، می توانید به راحتی شرایطی را تصور کنید که در آن درخواست های خرید در سیستم ERP رسیدگی می شود و فاکتورها از طریق یک سیستم مالی جداگانه مدیریت می شوند.
اگر می خواهید داده ها را از دو سیستم (یا بیشتر) ترکیب کنید ، مهمترین چیزی که باید به دنبال آن باشید این است که چگونه می توانید یک پرونده را در این سیستم های مختلف دنبال کنید. به عنوان مثال ، اگر سیستم ERP برای هر مورد از شماره سفارش خرید استفاده می کند و سیستم مالی برای هر مورد از شماره فاکتور استفاده می کند ، پس باید در فاکتوری که سفارش خرید آن به آن اشاره دارد ، یک مرجع برگشتی پیدا کنید. همچنین در اینجا می توانید ساده را شروع کنید: برای اولین آزمایش فقط با یک سیستم شروع کنید (دانستن اینکه برخی از قسمت های این روند هنوز نمی توانند نشان داده شوند). به این ترتیب ، می توانید به سرعت شروع به کسب اطلاعات بیشتر در مورد معدن فرآیند ، نشان دادن آنچه ممکن است ، و داده های بیشتری را در تکرار بعدی درج کنید.
توجه داشته باشید که به خصوص برای سیستم های ERP ، شما اغلب باید پرونده خود را از طریق مراجعه متقابل بین انواع مختلف اسناد (مانند ، سفارش خرید ، تحویل ، فاکتور و غیره) دنبال کنید ، حتی اگر داده ها را از یک سیستم واحد استخراج می کنید. نگاهی به ارائه اردوگاه معدن فرآیند 2015 توسط Mieke Jans ، که نحوه ایجاد یک رویداد رویداد از هر سیستم ERP را در ده مرحله توصیف می کند [2].
توجه داشته باشید که تهیه داده ها برای معدن فرآیند اغلب شامل انتخاب ها است (همچنین به چه مقدار داده نیاز دارید؟). به عنوان مثال ، شما ممکن است موقعیت هایی پیدا کنید ، جایی که روابط بسیاری از آن بین ، به عنوان مثال ، سفارشات فروش و تحویل وجود دارد. رابطه بسیاری به بسیاری از این بدان معناست که بین یک سفارش فروش و یک تحویل نقشه 1 به 1 وجود ندارد. در عوض ، چندین سفارش را می توان در یک تحویل ترکیب کرد یا یک سفارش واحد ممکن است در تحویل های متعدد تقسیم شود. در چنین شرایطی باید بسته به نوع تجزیه و تحلیل استخراج معادن فرآیند ، در مورد چگونگی تهیه داده ها تصمیم گیری کنید. حتی ممکن است برای ایجاد دیدگاه های مختلف و پاسخ به سوالات مختلف مجبور به ایجاد مجموعه داده های مختلف باشید. بنابراین ، حتی اگر خودتان داده ها را استخراج نکرده باشید ، درک نحوه استخراج داده ها (و انتخاب هایی که انجام شده است) بسیار مهم است.
از این همه چالش نترسید. اغلب، مردم در ابتدا بسیار نگران دادهها هستند، اما سپس متوجه میشوند که دادههای بسیار بیشتری از آنچه در ابتدا تصور میکردند در دسترس است. مراقب انبارهای داده در سازمان خود باشید که برای خدمت به تیم های تجزیه و تحلیل داده در زمینه دیگری راه اندازی شده اند. اگر هیچ کاری درست نشد، با ثبت دستی 10-20 مورد از سیستم عملیاتی به روش زیر شروع کنید: تاریخچه هر مورد جداگانه را از طریق رابط کاربری سیستمی که افرادی که در این فرآیند کار می کنند از آن استفاده می کنند، جستجو کنید و فعالیت ها را بنویسید ومهرهای زمانی آنها در یک برگه اکسل با دست.
نیازی به دریافت اطلاعات کامل از همان ابتدا نیست. به خصوص، زمانی که هنوز در مورد فرآیند کاوی یاد میگیرید، بهتر است سعی کنید ابتدا نمونهای از دادهها را به سرعت دریافت کنید، ببینید کدام بینش را میتوانید از آن به دست آورید، و چه محدودیتهایی دارد. سپس تکرار کنید و در مرحله بعد داده های بیشتر یا بهتر را دریافت کنید.
برای شروع، نگاهی به چک لیست استخراج داده در فصل بعدی بیندازید (به چک لیست مراجعه کنید: استخراج داده های خود را آماده کنید).