Iran ITIL - ITSM - OTRS Center

پایگاه مرکزی کتابخانه زیربنایی فن‌آوری اطلاعات و مدیریت سرویس فن‌آوری اطلاعات ایران

جزئیات ساختار ITIL v2 - بخش دوم « پشتیبانی سرویس -2- مدیریت رخداد »

جزئیات ساختار ITIL v2 - بخش اول « پشتیبانی سرویس -1- مدیریت درخواست سرویس »

2. مدیریت رخداد - IcM - Incident Management

هدف مدیریت رخداد ، بازگرداندن عملیات سرویس دهی به شکل معمول و نرمال ، در کمترین زمان ممکن و به حداقل رساندن اثرگذاری مضرات ( ناسازگاری ها )‌در عملیات تجاری است . بنابراین تضمین می شود که بهترین سطوح کیفیت سرویس و در دسترس بودنِ ( Availability ) ممکن ، ‌برقرار می باشد . ٰ عملیات معمول سرویس ( Normal Service Operation  ) ٰ در اینجا به عنوان یک عملیات سرویس در محدودیت های توافق‌نامه سطح سرویس ( SLA  ) تعریف می شود .

 به زبان دیگر مدیریت رخداد ( IcM ) یک بخش فرآیند  از مدیریت سرویس فن‌آوری اطلاعات ( ITSM - IT Service Management  ) است . هدف اول این فرآیند ،  بازگرداندن عملیات به شکل سرویس دهی طبیعی و نرمال در کمترین زمان ممکن و به حداقل رسانیدن تاثیرات منفی آن (‌عدم سرویس دهی ) در عملیات تجاری است . بنابراین بهترین کیفیت عملیات سرویس ممکن و موجودی‌ها را تضمین می کند .  ٰ سرویس دهی نرمال ٰ به شکل یک بند از عملیات سرویس در توافق‌نامه سطح سرویس ( SLA ) بیان می شود .

مشکل رخدادهایی که توسط برنامه سریعا رفع نمی شوند ، به یک گروه پشتیبانی مخصوص، جهت رفع مشکل ، نسبت داده می شود . به منظور بازگرداندن سریع سرویس دهی نرمال ، مشکل باید سریعا توسط این گروه برطرف شود .

تعریف

فرهنگ لغات ITIL رخداد ( Incident ) را به این شکل تعریف می کند :

                    هر رخدادی که جزیی از یک عملیات استاندارد سرویس نیست و به بروز وقفه یا کاهش کیفیت سرویس دهی منجر شده یا می شود.

هدف ITIL رسیدن به عملیات عادی و طبیعی در کمترین و کوتاه ترین زمان ممکن ، با کمترین میزان تاثیر در تجارت یا کاربر ، با صرف یک هزینه مقرون به صرفه است . رخدادها ممکن است به دلایل مشخص و یا نامشخصی به وقوع بپیوندند ونهایتا به منظور کنترل کردن مدیریت مشکلات ( problem management ) در Known Error Database - KeDB ثبت می‌شوند.

در جایی که محیط ‍پیرامون کارِ از پ‍یش تعریف شده , توسعه پیدا کرده است , پیشنهاد می‌شود که  service desk یک محیط سریع را برای برطرف کردن مشکل, در اولین مرحله فراهم کند .

در جایی که یک رخداد نتیجه یک مشکل شناخته شده و یا خطای شناخته شده نباشد, می‌تواند یک محیط ایزوله شده یا یک پیش آمد منحصر بفرد یا ممکن است که مشکل ریشه ای مشخص شده باشد , نیاز است که مدیریت مشکلات درگیر شود , در صورت امکان باید یک مشکل جدید, با مشخصات رخداد ایجاد شود.

رخدادها و تغییرات

رخدادها نتایج مشکلات و خطاهای زیربناهای فن‌آوری اطلاعات هستند. علت بروز رخداد ممکن است پیدا و روشن باشد و نیازی به سرمایه گذاری ( از نظر زمانی و هزینه‌ای ) برای شناسایی علت بروز رخداد نباشد و منجر به درخواست برای یک تعمیر , یک حضور فیزیکی در محل یا یک درخواست تغییر برای حذف خطا باشد .

جایی که یک رخداد مطرح می‌شود تا بصورت جدی و قاطعانه پیگیری شود, و یا چند پیشامد مشابه یک رخداد مشاهده می‌شود , یک مشکل می‌تواند به عنوان پاسخی برای حل همه موارد در سیستم ثبت شود ( همچنین ممکن است تا چند مشکل مشابه گزارش نشد, اصلا مشکلی هم ثبت نشود ). مدیریت یک مشکل از فرآیند مدیریت یک رخداد ( می تواند ) متفاوت است و معمولا توسط کارمندان متفاوت انجام می‌شود و به همین دلیل توسط فرآیند مدیریت مشکلات کنترل می‌شود. وقتی که یک مشکل شناسایی می‌شود و محیط مشکل پیدا می‌شود , مشکل یک ‍ ٰمشکل شناخته شدهٰ می شود. هنگامیکه ریشه و علت بروز رخداد شناسایی می شود تبدیل به یک ٰخطای شناسایی شدهٰ می شود و نهایتا یک درخواست تغییر ( Request For Change - RFC ) ممکن است برای تغییر ( اصلاح ) سیستم با رفع خطای شناسایی شده ایجاد شود. این فرآیند توسط فرایند مدیریت تغییرات ( Change Management ) تحت پوشش قرار گرفته است.

توجه داشته باشید که درخواست یک سرویس اضافی به عنوان یک رخداد شناخته نمی شود و آن را یک درخواست تغییر ( RFC ) می نامند .

فرآیند مدیریت رخداد

فرآیندهای اصلی مدیریت رخداد در زیر آورده شده‌اند :

  •      شناسایی و ثبت رخداد - Incident detection and recording
  •      طبقه بندی و پشتیبانی اولیه - Classification and initial support
  •      تحقیق و تشخیص - Investigation and diagnosis
  •      رفع مشکل و بازیابی - Resolution and recovery
  •      بستن رخداد - Incident closure
  •      مالکیت رخداد , بازدید, پیگیری و ارتباطات -  Incident ownership, monitoring, tracking and communication

مثال و نمونه

رخدادها باید طبقه بندی بشوند همانطور که ثبت می شوند, نمونه های برای طبقه بندی رخدادها در زیر آورده شده است :

  • Application
    • service not available
    • application bug
    • disk-usage threshold exceeded
  • Hardware
    • system-down
    • automatic alert
    • printer not printing

منابع :‌