جزئیات ساختار ITIL v2 - بخش دوم « پشتیبانی سرویس -2- مدیریت رخداد »

جزئیات ساختار ITIL v2 - بخش اول « پشتیبانی سرویس -1- مدیریت درخواست سرویس »
2. مدیریت رخداد - IcM - Incident Management

هدف مدیریت رخداد ، بازگرداندن عملیات سرویس دهی به شکل معمول و نرمال ، در کمترین زمان ممکن و به حداقل رساندن اثرگذاری مضرات ( ناسازگاری ها )‌در عملیات تجاری است . بنابراین تضمین می شود که بهترین سطوح کیفیت سرویس و در دسترس بودنِ ( Availability ) ممکن ، ‌برقرار می باشد . ٰ عملیات معمول سرویس ( Normal Service Operation  ) ٰ در اینجا به عنوان یک عملیات سرویس در محدودیت های توافق‌نامه سطح سرویس ( SLA  ) تعریف می شود .

 به زبان دیگر مدیریت رخداد ( IcM ) یک بخش فرآیند  از مدیریت سرویس فن‌آوری اطلاعات ( ITSM - IT Service Management  ) است . هدف اول این فرآیند ،  بازگرداندن عملیات به شکل سرویس دهی طبیعی و نرمال در کمترین زمان ممکن و به حداقل رسانیدن تاثیرات منفی آن (‌عدم سرویس دهی ) در عملیات تجاری است . بنابراین بهترین کیفیت عملیات سرویس ممکن و موجودی‌ها را تضمین می کند .  ٰ سرویس دهی نرمال ٰ به شکل یک بند از عملیات سرویس در توافق‌نامه سطح سرویس ( SLA ) بیان می شود .

مشکل رخدادهایی که توسط برنامه سریعا رفع نمی شوند ، به یک گروه پشتیبانی مخصوص، جهت رفع مشکل ، نسبت داده می شود . به منظور بازگرداندن سریع سرویس دهی نرمال ، مشکل باید سریعا توسط این گروه برطرف شود .

تعریف

فرهنگ لغات ITIL رخداد ( Incident ) را به این شکل تعریف می کند :

                    هر رخدادی که جزیی از یک عملیات استاندارد سرویس نیست و به بروز وقفه یا کاهش کیفیت سرویس دهی منجر شده یا می شود.

هدف ITIL رسیدن به عملیات عادی و طبیعی در کمترین و کوتاه ترین زمان ممکن ، با کمترین میزان تاثیر در تجارت یا کاربر ، با صرف یک هزینه مقرون به صرفه است . رخدادها ممکن است به دلایل مشخص و یا نامشخصی به وقوع بپیوندند ونهایتا به منظور کنترل کردن مدیریت مشکلات ( problem management ) در Known Error Database - KeDB ثبت می‌شوند.

در جایی که محیط ‍پیرامون کارِ از پ‍یش تعریف شده , توسعه پیدا کرده است , پیشنهاد می‌شود که  service desk یک محیط سریع را برای برطرف کردن مشکل, در اولین مرحله فراهم کند .

در جایی که یک رخداد نتیجه یک مشکل شناخته شده و یا خطای شناخته شده نباشد, می‌تواند یک محیط ایزوله شده یا یک پیش آمد منحصر بفرد یا ممکن است که مشکل ریشه ای مشخص شده باشد , نیاز است که مدیریت مشکلات درگیر شود , در صورت امکان باید یک مشکل جدید, با مشخصات رخداد ایجاد شود.

رخدادها و تغییرات

رخدادها نتایج مشکلات و خطاهای زیربناهای فن‌آوری اطلاعات هستند. علت بروز رخداد ممکن است پیدا و روشن باشد و نیازی به سرمایه گذاری ( از نظر زمانی و هزینه‌ای ) برای شناسایی علت بروز رخداد نباشد و منجر به درخواست برای یک تعمیر , یک حضور فیزیکی در محل یا یک درخواست تغییر برای حذف خطا باشد .

جایی که یک رخداد مطرح می‌شود تا بصورت جدی و قاطعانه پیگیری شود, و یا چند پیشامد مشابه یک رخداد مشاهده می‌شود , یک مشکل می‌تواند به عنوان پاسخی برای حل همه موارد در سیستم ثبت شود ( همچنین ممکن است تا چند مشکل مشابه گزارش نشد, اصلا مشکلی هم ثبت نشود ). مدیریت یک مشکل از فرآیند مدیریت یک رخداد ( می تواند ) متفاوت است و معمولا توسط کارمندان متفاوت انجام می‌شود و به همین دلیل توسط فرآیند مدیریت مشکلات کنترل می‌شود. وقتی که یک مشکل شناسایی می‌شود و محیط مشکل پیدا می‌شود , مشکل یک ‍ ٰمشکل شناخته شدهٰ می شود. هنگامیکه ریشه و علت بروز رخداد شناسایی می شود تبدیل به یک ٰخطای شناسایی شدهٰ می شود و نهایتا یک درخواست تغییر ( Request For Change - RFC ) ممکن است برای تغییر ( اصلاح ) سیستم با رفع خطای شناسایی شده ایجاد شود. این فرآیند توسط فرایند مدیریت تغییرات ( Change Management ) تحت پوشش قرار گرفته است.

توجه داشته باشید که درخواست یک سرویس اضافی به عنوان یک رخداد شناخته نمی شود و آن را یک درخواست تغییر ( RFC ) می نامند .

فرآیند مدیریت رخداد

فرآیندهای اصلی مدیریت رخداد در زیر آورده شده‌اند :

  •      شناسایی و ثبت رخداد - Incident detection and recording
  •      طبقه بندی و پشتیبانی اولیه - Classification and initial support
  •      تحقیق و تشخیص - Investigation and diagnosis
  •      رفع مشکل و بازیابی - Resolution and recovery
  •      بستن رخداد - Incident closure
  •      مالکیت رخداد , بازدید, پیگیری و ارتباطات -  Incident ownership, monitoring, tracking and communication

مثال و نمونه

رخدادها باید طبقه بندی بشوند همانطور که ثبت می شوند, نمونه های برای طبقه بندی رخدادها در زیر آورده شده است :

  • Application
    • service not available
    • application bug
    • disk-usage threshold exceeded
  • Hardware
    • system-down
    • automatic alert
    • printer not printing

منابع :‌

/ 2 نظر / 36 بازدید
آبرا

آن چه انسان هرگز نخواهد فهمید این است که چگونه در مقابل کسی که ما را آفریده و همه چیز ما از اوست مسوول خواهیم شد و او از ما بازخواستخواهد کرد ؟!؟!؟ . موريس مترلينگ[گل]

شهرام

سلام من از سایت iranitil.wordpress.com اينجا رو پيدا كردم. جز وبلاگ هاي تخصصي حساب مي شين. كلا تشكر مي كنم خيلي جالب بود واسم كه يه روزه اين همه مطلب اونم به فارسي خوندم. مرسي از هر دوي شما