¿Cómo implementar Gestión de Incidentes Usando ITIL?

Guía para hacer tu proceso de Gestión de Incidentes alineado a ITIL

El proceso ITSM de gestión de incidentes, es un conjunto de actividades que garantiza que todos los problemas de IT (llamados “incidentes” por ITIL, marco de referencias de las mejores prácticas de ITSM) se registren y progresen de manera eficaz y coherente hasta la resolución. Esto sucede mientras se asegura de que nada se pierda, se ignore u olvide.

ITIL define la gestión de incidentes como el proceso responsable de  administrar el ciclo de vida de todos los incidentes para asegurar que la operativa normal del servicio se restablezca lo más rápidamente posible y que el impacto en las operaciones de negocio sea mínimo. En otras palabras, los gerentes de la gestión de incidentes son los superhéroes del mundo ITSM, que hacen hasta lo imposible para salvar el día y hacer que el negocio vuelva a funcionar cuando las cosas salieron mal. En este blog veremos cómo la gestión de incidentes puede agregar valor a tu organización, junto con algunos consejos sobre cómo hacer que esto funcione eficazmente en la vida real.

 

El proceso de gestión de incidencias debe estar incluido y actualizado en el Manual de Procesos de tu organización, de tal forma que todos los componentes de nuestro equipo y los participantes en el proceso tengan acceso al mismo y lo conozcan.

Hay que evitar por todos los medios que las incidencias se canalicen a través de la buena voluntad de los componentes del equipo y de canales no normalizados (ejemplo: Grupo de WhatsApp). La ineficiencia e ineficacia en la resolución de estas situaciones produce efectos adversos en la confianza de nuestro cliente, generando inseguridad, sensación de falta de control e insatisfacción.

A continuación te proporcionaremos una guía práctica para implementar gestión de incidentes en tu departamento de IT:

1.- Identificación del incidente

Asigne un número único para cada incidente y recoja datos de ubicación y/o localización. Puede ser interesante establecer una tipología y codificación de incidencias para facilitar su análisis cualitativo y cuantitativo posterior así como generación de indicadores clave. Trate de hacer una valoración para priorizar su gestión (bajo, medio, alto). No debe faltar un campo de texto para poder describir con cierto detalle la incidencia y, por supuesto, la fecha.

La importancia de llevar un proceso en ITIL es fundamental.

Consejo clave: Separar los incidentes de las solicitudes de servicio para permitir una mejor priorización de las tareas y mejores reportes sobre el rendimiento operativo.Usualmente tienen diferentes niveles de servicio.

2.- Registro.

Deje constancia de la incidencia en un registro para que quede documentada y disponible para ser tratada de acuerdo con el procedimiento normalizado.

Con estos dos sencillos pasos documentamos la incidencia y comenzamos a trabajar en su resolución. En ITIL lo que no registramos no podemos medirlo.

Consejo clave: recuerda que si bien registrar incidentes es importante para la gestión operativa, la gestión del conocimiento y la mejora del servicio, la prioridad es ayudar al usuario final a que pueda volver a trabajar rápidamente. No haga plantillas sumamente detalladas de registro.

 

3.-Categorización y Priorización

Categorización y priorización son los pasos necesarios para garantizar que los equipos de resolución tengan las mejores chances de solucionar los incidentes en el primer punto de contacto.

El primer nivel de categorización debe ser realmente simple, a fin de que los usuarios finales registren sus incidentes de la manera más fácil que sea posible, especialmente cuando estamos hablando de un entorno de autoservicio. Por ejemplo, el primer nivel de categorización podría ser el siguiente:

  •   Hardware
  •   Software
  •   Network
  •   Voice

Siempre se puede agregar más complejidad a otros niveles, pero mantener el nivel inicial simple hará que sea más fácil para los usuarios finales y los analistas de la mesa de ayuda registrar incidentes con la categoría correcta y asignarlos al equipo de resolución adecuado.

La priorización es la parte del proceso que ayuda al equipo de resolución a manejar su carga de trabajo. Al establecer las prioridades de los incidentes, la mejor práctica recomienda que estés atento a:

  •   Impacto: el grado en que la prestación de servicios se interrumpió dentro de la organización y el efecto que esta interrupción tiene en otras áreas de la infraestructura.
  •   Urgencia: la velocidad con que el incidente debe ser resuelto.

Una priorización efectiva es clave para asegurarse que se está viendo y solucionando primero los incidentes que así lo requieren. Si tu herramienta de ITSM tiene incorporada una matriz de prioridad, úsala, si no, ten a mano una serie de preguntas estándar o construye tu propia matriz de manera que puedas asignar de modo sensible una prioridad a cada incidente, en lugar de ir por el lado de “si tienes alguna duda, marca la opción del medio”.

Consejo clave: Evita los términos de prioridad alta / media / baja al momento en que el usuario final registra su incidente ya que es muy probable que para él siempre sea de suma urgencia. Una situación en la que todo es urgente provocará que se genere una cola de incidentes de alta prioridad y un equipo de soporte que no sabe qué arreglar primero. En ITIL la prioridad se clasifica de acuerdo al impacto y la urgencia.

4.-Diagnóstico inicial (matcheo de incidentes)

Esta es la parte donde decides si el incidente puede ser solucionado en la primer línea o necesita ser escalado a otros miembros de soporte o a un equipo en particular. El diagnóstico inicial es como ingresar a la sala de urgencias de un hospital -lo habrás observado si alguna vez has tenido el infortunio de ir al departamento de emergencias- la primer persona que te recibe, luego de pasar por la recepción, es la enfermera que evalúa si puedes ser atendido y “remendado” allí o si necesitarás tratamiento adicional.

En un entorno de mesa de ayuda, el primer analista evalúa si se puede corregir de inmediato el incidente que se está reportando o si es necesario escalarlo al soporte de segundo nivel. Los scripts, las bases de datos de errores conocidos (KEDBs) y las bases de conocimientos, pueden ayudar a mejorar la tasa de resolución en la primer respuesta, otros procesos de ITIL nos ayudarán con esto.

Un modo fácil de mejorar la tasa de resolución del soporte de primer nivel es hacer que otros equipos de soporte participen en la reunión semanal de service desk, para que den sus mejores sugerencias para solucionar los problemas en el primer contacto con el usuario final. Las ventajas de este enfoque son dos: los agentes de la mesa de ayuda están preparados, capacitados y más comprometidos; y si hay más incidentes en la línea de frente, los equipos de segunda y tercera línea de soporte son libres de concentrarse en las cosas más difíciles.

Consejo Clave: Tener un alto nivel de resolución de primer contacto se considera la mejor práctica de la industria, pero cuidado, las métricas dirigen comportamientos. Deberás estar atento a las que generen un comportamiento erróneo, en el que brindar una solución en la primer respuesta parece ser más importante  que la respuesta en sí.  Lo que el usuario quiere  es encontrar una solución adecuada, aún cuando esto no ocurra en el primer contacto. La calidad del servicio ante todo.

5.-Escalamiento

Si un incidente no puede ser resuelto en el primer punto de contacto (en una llamada o cuando el usuario final carga el ticket) entonces es necesario que sea escalado en pos de restaurar el servicio. Existen dos tipos de escalamiento en una mesa de ayuda típicamente configurada:

  1. Funcional
  2. Jerárquico

Consejo clave: Los escalamientos podrán ser algo atípico en la organización de IT pero eso no significa que no debas tener un plan para cuando se necesite realizarlas. Dedícale tiempo a entender los posibles escenarios de escalamiento  y quién necesitará hacer qué, cuándo. Con el tiempo, esto puede y debe ser ajustado,  a medida que las necesidades y el personal cambien.

6.- Investigación y Diagnóstico

La realidad es que la investigación y el diagnóstico ocurren durante cada etapa del ciclo de vida del incidente junto con la monitorización, las actualizaciones y la comunicación. Tan pronto como se registra el incidente, el agente de la mesa de ayuda comienza a evaluar la llamada (o el ticket que cargó el usuario final) y a recopilar información. Esto puede tener como resultado, una solución de primera respuesta, o el incidente puede escalarse al soporte de segundo nivel, y más allá, donde la investigación y el diagnóstico continuarán hasta que el problema haya sido resuelto y el servicio normal haya sido restaurado.
La documentación y el apoyo, en formato de wikis, bases de conocimiento o sitios de capacitación, puede hacer una verdadera diferencia en esta etapa del incidente. Al compartir mejor el conocimiento y brindar buenos consejos, mejorarás disruptivamente las tasas de resolución de incidentes, pasando de bueno a excelente.

Consejo clave: Una parte central de una eficaz gestión del conocimiento, es poder ver cómo se solucionó un incidente previo similar, así como los pasos que funcionaron y también los que no. Por lo tanto, al resolver un problema para el que no hay ningún artículo formal de conocimiento, asegúrate de capturar todo lo que fuiste haciendo para poder utilizarlo en beneficio de la siguiente persona. Aquí es cuando empiezan otros procesos de ITIL a relacionarse cómo Gestión del Conocimiento.

7.- Resolución y restablecimiento del servicio

Días felices, ¡todo está solucionado! Pero antes de empezar a hacer tu baile de la victoria, prueba y vuelve a probar. En ITIL siempre buscamos un enfoque de mejora continua, nunca hay que quedarnos estáticos

Consejo clave: es genial que, desde tu perspectiva, el incidente esté solucionado; pero también es necesario comprobar que las cosas se han resuelto para el usuario final o el propietario del servicio. Es por eso que la mejor práctica sugiere un segundo elemento de cierre de incidentes: la confirmación del cliente.

8.- El cierre del incidente

Esto realmente se reduce a dos pasos: la confirmación del cliente y el cierre del incidente en tu herramienta ITSM / de mesa de ayuda.Siempre que sea posible, ponte en contacto con el usuario final / cliente para confirmar que todo esté bien y que estén conformes con que su incidente se cierre.

La segunda etapa es actualizar el registro de incidentes con lo que pasó y lo que hiciste para solucionarlo antes de cerrarlo.¿Recuerdas lo que dijimos antes sobre el conocimiento compartido? Esto es parte de ello.

Consejo clave: Asegúrate de que tus agentes de mesa de ayuda comprendan la importancia de  tomar registros de los incidentes a lo largo del ciclo de vida del mismo. Desde quién es el usuario final y los detalles tecnológicos, hasta la actualización del progreso, la documentación completa de las causas y la resolución definitiva. No hacerlo le costará caro al equipo ya que los incidentes reaparecen con el tiempo.

 

En conclusión, la gestión de incidentes es uno de los procesos ITSM más importantes que usarás porque afecta a todos. Y seamos realistas, casi todas las empresas necesitan algún tipo de soporte de TI, ya sea propio o externalizado.

El área de soporte de TI y de gestión de incidentes son una parte muy visible de TI. Se podría argumentar que son su rostro visible. Por lo tanto, si tu proceso de gestión de incidentes no es efectivo, afectará a la percepción de todo TI de manera negativa.

Asegúrate que tu proceso de gestión de incidentes funciona bien, que los problemas son capturados consistentemente, que el servicio es restaurado tan pronto como sea posible, y nada se pierda, se ignore o se olvide.

Ejemplo de Diagrama de procesos basado en ITIL para implementarse en una herramienta de IT Service Management (ITSM)

¿Te gustaría aprender más acerca de ITIL desde nivel fundamentos?

¡Conoce nuestros cursos presenciales en la CDMX con examen de certificación!

O bien

¡Conoce nuestros cursos Online 24×7 para todo México y Latinoamérica!

Comentarios

About The Author

Fernando Jiménez
Fernando Jiménez
Es un profesionista en TI con más de 8 años de experiencia en la industria, cuenta con una Maestría en Dirección de Negocios  y un diplomado en administración de proyectos, está certificado como ITIL Expert, las certificaciones de SCRUM SFC,SDC,SMC, SPOC, SAMC y COBIT , actualmente se desempeña como Account Service Manager en una importante empresa global de tecnología así como instructor , consultor y coach para diversas empresas en marcos de trabajo de gestión de proyectos, IT service management y agile.

No Comments

Deja un comentario

WhatsApp chat
X
A %d blogueros les gusta esto: