Gestión de Incidencias

Paso a mostrarles lo que nos trajo ITIL V3 y su Gestión de Incidentes, actualmente ya se usa ITIL 2011 solo que entre estas dos la V3 se sigue usando y por muchas buenas razones que se pasan a detallar, este contenido esta también publicado en la web de Osiatis ITIL V3.

Visión general

La Gestión de Incidencias tiene como objetivo resolver, de la manera más rápida y eficaz posible, cualquier incidente que cause una interrupción en el servicio.

La Gestión de Incidencias no debe confundirse con la Gestión de Problemas, pues a diferencia de esta última, no se preocupa de encontrar y analizar las causas subyacentes a un determinado incidente sino exclusivamente a restaurar el servicio. Sin embargo, es obvio, que existe una fuerte interrelación entre ambas.

Por otro lado, también es importante diferenciar la Gestión de Incidencias de la Gestión de Peticiones, que se ocupa de las diversas solicitudes que los usuarios plantean para mejorar el servicio, no cuando éste falla.

Introducción y Objetivos

Los objetivos principales de la Gestión de Incidencias son:

  • Detectar cualquier alteración en los servicios TI.
  • Registrar y clasificar estas alteraciones.
  • Asignar el personal encargado de restaurar el servicio según se define en el SLA correspondiente.

Esta actividad requiere un estrecho contacto con los usuarios, por lo que el Centro de Servicios debe jugar un papel esencial en el mismo.

El siguiente diagrama resume el proceso de Gestión de Incidencias:

proceso_gestion_incidentes

Proceso de la Gestión de Incidencias

Aunque el concepto de incidencia se asocia naturalmente con cualquier malfuncionamiento de los sistemas de hardware y software, según el libro de Soporte del Servicio de ITIL® una incidencia es:

“Cualquier evento que no forma parte de la operación estándar de un servicio y que causa, o puede causar, una interrupción o una reducción de calidad del mismo”.

Por lo que casi cualquier llamada al Centro de Servicios puede clasificarse como un incidente, a excepción las Peticiones de Servicio tales como concesión de nuevas licencias, cambio de información de acceso, etc.

Cualquier cambio que requiera una modificación de la infraestructura no se considera un servicio estándar y requiere el inicio de una Petición de Cambio (RFC) que debe ser tratada según los principios de la Gestión de Cambios.

Los principales beneficios de una correcta Gestión de Incidencias incluyen:

  • Mejorar la productividad de los usuarios.
  • Cumplimiento de los niveles de servicio acordados en el SLA.
  • Mayor control de los procesos y monitorización del servicio.
  • Optimización de los recursos disponibles.
  • Una CMDB más precisa, pues se registran los incidentes en relación con los elementos de configuración.
  • Y principalmente: mejora la satisfacción general de clientes y usuarios.

Por otro lado una incorrecta Gestión de Incidencias puede acarrear efectos adversos tales como:

  • Reducción de los niveles de servicio.
  • Se dilapidan valiosos recursos: demasiada gente o gente del nivel inadecuado trabajando concurrentemente en la resolución de la incidencia.
  • Se pierde valiosa información sobre las causas y efectos de las incidencias para futuras reestructuraciones y evoluciones.
  • Se crean clientes y usuarios insatisfechos por la mala y/o lenta gestión de sus incidencias.

Las principales dificultades a la hora de implementar la Gestión de Incidencias se resumen en:

  • No se siguen los procedimientos previstos y se resuelven las incidencias sin registrarlas o se escalan innecesariamente y/o omitiendo los protocolos preestablecidos.
  • No existe un margen operativo que permita gestionar los “picos” de incidencias, por lo que éstas no se registran adecuadamente e impiden la correcta operación de los protocolos de clasificación y escalado.
Clasificación y Registro

Es frecuente que existan múltiples incidencias concurrentes, por lo que es necesario determinar un nivel de prioridad para la resolución de las mismas.

La priorización se basa esencialmente en dos parámetros:

  • Impacto: determina la importancia de la incidencia dependiendo de cómo ésta afecta a los procesos de negocio y/o del número de usuarios afectados.
  • Urgencia: depende del tiempo máximo de demora que acepte el cliente para la resolución de la incidencia y/o el nivel de servicio acordado en el SLA.

También se deben tener en cuenta factores auxiliares tales como el tiempo de resolución esperado y los recursos necesarios: los incidentes “sencillos” se tramitarán cuanto antes.

Dependiendo de la prioridad, se asignarán los recursos necesarios para la resolución de la incidencia.

La prioridad del incidente puede cambiar durante su ciclo de vida. Por ejemplo, se pueden encontrar soluciones temporales que restauren aceptablemente los niveles de servicio y que permitan retrasar el cierre del incidente sin graves repercusiones.

Es conveniente establecer un protocolo para determinar, en primera instancia, la prioridad del incidente. El siguiente diagrama nos muestra un posible “diagrama de prioridades” en función de la urgencia e impacto del incidente:

urgencia_impacto

Escalado y Soporte

Es frecuente que el Centro de Servicios no se vea capaz de resolver en primera instancia un incidente y para ello deba recurrir a un especialista o a algún superior que pueda tomar decisiones que se escapan de su responsabilidad. A este proceso se le denomina escalado.

Básicamente hay dos tipos de escalado:

  • Escalado funcional: Se requiere el apoyo de un especialista de más alto nivel para resolver la incidencia.
  • Escalado jerárquico: Debemos acudir a un responsable de mayor autoridad para tomar decisiones que se escapan de las atribuciones asignadas a ese nivel, como, por ejemplo, asignar más recursos para la resolución de un incidente específico.

El proceso de escalado puede resumirse gráficamente* como sigue:

escalado_incidentes

El escalado puede incluir más niveles en grandes organizaciones, o por el contrario, en el caso de PYMES, integrar diferentes niveles.

Proceso

El siguiente diagrama muestra los procesos implicados en la correcta Gestión de Incidencias:

Proceso Incidencias

Registro y Clasificación

Registro

La admisión y registro de la incidencia es el primer y necesario paso para una correcta gestión del mismo.

Las incidencias pueden provenir de diversas fuentes tales como usuarios, gestión de aplicaciones, el mismo Centro de Servicios o el soporte técnico, entre otros.

El proceso de registro debe realizarse inmediatamente, pues resulta mucho más costoso hacerlo posteriormente y se corre el riesgo de que la aparición de nuevas incidencias demore indefinidamente el proceso.

  • La admisión a trámite del incidente: el Centro de Servicios debe de ser capaz de evaluar en primera instancia si el servicio requerido se incluye en el SLA del cliente y en caso contrario reenviarlo a una autoridad competente.
  • Comprobación de que ese incidente aún no ha sido registrado: es muy habitual que más de un usuario notifique la misma incidencia y por lo tanto han de evitarse duplicaciones innecesarias.
  • Asignación de referencia: al incidente se le asignará una referencia que le identificará unívocamente, tanto en los procesos internos como en las comunicaciones con el cliente.
  • Registro inicial: se ha de introducir en la base de datos asociada la información básica necesaria para el procesamiento del incidente (hora, descripción del incidente, sistemas afectados…).
  • Información de apoyo: se incluirá cualquier información relevante para la resolución del incidente que puede ser solicitada al cliente a través de un formulario específico, o que puede ser obtenida de la propia CMDB (hardware interrelacionado), etc.
  • Notificación del incidente: en los casos en que el incidente pueda afectar a otros usuarios, éstos deben ser notificados para que conozcan cómo esta incidencia puede afectar su flujo habitual de trabajo.
Clasificación

La clasificación de un incidente tiene como objetivo principal el recopilar toda la información que pueda ser utilizada para la resolución del mismo.

El proceso de clasificación debe implementar, al menos, los siguientes pasos:

  • Categorización: se asigna una categoría (que puede estar a su vez subdividida en más niveles) dependiendo del tipo de incidente o del grupo de trabajo responsable de su resolución. Se identifican los servicios afectados por el incidente.
  • Establecimiento del nivel de prioridad: dependiendo del impacto y la urgencia se determina, según criterios preestablecidos, un nivel de prioridad.
  • Asignación de recursos: si el Centro de Servicios no puede resolver el incidente en primera instancia, designará al personal de soporte técnico responsable de su resolución (segundo nivel).
  • Monitorización del estado y tiempo de respuesta esperado: se asocia un estado al incidente (por ejemplo: registrado, activo, suspendido, resuelto, cerrado) y se estima el tiempo de resolución del incidente en base al SLA correspondiente y la prioridad.

Análisis, Resolución y Cierre

En primera instancia, se examina el incidente con ayuda de la KB para determinar si se puede identificar con alguna incidencia ya resuelta y aplicar el procedimiento asignado.

Si la resolución del incidente se escapa de las posibilidades del Centro de Servicios éste redirecciona el mismo a un nivel superior para su investigación por los expertos asignados. Si estos expertos no son capaces de resolver el incidente, se seguirán los protocolos de escalado predeterminados.

Durante todo el ciclo de vida del incidente se debe actualizar la información almacenada en las correspondientes bases de datos para que los agentes implicados dispongan de cumplida información sobre el estado del mismo.

Si fuera necesario, paralelamente a la resolución de la incidencia se puede emitir una Petición de Cambio (RFC) que se enviaría a la Gestión de Peticiones. Por otro lado, si la incidencia fuera recurrente y no se encontrase una solución definitiva, se deberá informar a la Gestión de Problemas para el estudio detallado de las causas subyacentes.

Cuando se haya solucionado el incidente se:

  • Confirma con los usuarios la solución satisfactoria del mismo.
  • Incorpora el proceso de resolución al SKMS.
  • Reclasifica el incidente si fuera necesario.
  • Actualiza la información en la CMDB sobre los elementos de configuración (CIs) implicados en el incidente.
  • Cierra el incidente.

Control proceso

La correcta elaboración de informes forma parte esencial en el proceso de Gestión de Incidencias.

Estos informes deben aportar información esencial para, por ejemplo:

  • La Gestión de Niveles de Servicio: es esencial que los clientes dispongan de información puntual sobre los niveles de cumplimiento de los SLAs y que se adopten medidas correctivas en caso de incumplimiento.
  • Monitorizar el rendimiento del Centro de Servicios: conocer el grado de satisfacción del cliente por el servicio prestado y supervisar el correcto funcionamiento de la primera línea de soporte y atención al cliente.
  • Optimizar la asignación de recursos: los gestores deben conocer si el proceso de escalado ha sido fiel a los protocolos preestablecidos y si se han evitado duplicidades en el proceso de gestión.
  • Identificar errores: puede ocurrir que los protocolos especificados no se adecuen a la estructura de la organización o las necesidades del cliente, por lo que se deberán tomar medidas correctivas.
  • Disponer de Información Estadística: que puede ser utilizada para hacer proyecciones futuras sobre asignación de recursos, costes asociados al servicio, etc.

Por otro lado una correcta Gestión de Incidencias requiere de una infraestructura que facilite su correcta implementación. Entre ellos cabe destacar:

  • Un correcto sistema automatizado de registro de incidentes y relación con los clientes
  • Un SKMS que permita comparar nuevos incidentes con incidentes ya registrados y resueltos. Un SKMS actualizado permite:
    • Evitar escalados innecesarios.
    • Convertir el know how de los técnicos en un activo duradero de la empresa.
    • Poner directamente a disposición del cliente parte o la totalidad de estos datos (a la manera de FAQs) en una extranet, lo que puede permitir que a veces el usuario no necesite siquiera notificar la incidencia.
  • Una CMDB que permita conocer todas las configuraciones actuales y el impacto que éstas puedan tener en la resolución del incidente.

Para el correcto seguimiento de todo el proceso, es indispensable la utilización de métricas que permitan evaluar de la forma más objetiva posible el funcionamiento del servicio. Algunos de los aspectos clave a considerar son:

  • Número de incidentes clasificados temporalmente y por prioridades.
  • Tiempos de resolución clasificados en función del impacto y la urgencia de los incidentes.
  • Nivel de cumplimiento del SLA.
  • Costes asociados.
  • Uso de los recursos disponibles en el Centro de Servicios.
  • Porcentaje de incidentes, clasificados por prioridades, resueltos en primera instancia por el Centro de Servicios.
  • Grado de satisfacción del cliente.

Fuente: ITIL V3

Anuncios

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s