Un poco de historia
Si echamos la vista atrás, no hace tanto tiempo desde que la operación y mantenimiento (OYM) de las grandes redes, como pueden ser las de un proveedor de servicios de comunicaciones (CSP), se hacía de forma monolítica. En un principio, los problemas de red se detectaban cuando ya era demasiado tarde. El operador de turno intuía qué sistemas estaban relacionados con el problema e iba uno por uno analizando los logs de cada uno de los elementos hasta encontrar el origen del problema. Esto dificultaba enormemente el trabajo del operador e incrementaba drásticamente el MTTR (Mean Time To Repair).
Posteriormente, aparecieron los EMS (Element Management System) y NMS (Network Management System). Los EMS, específicos de cada fabricante, se encargan de gestionar una planta de equipos relacionados con una tecnología, son los encargados de recopilar alarmas, inventario, datos de rendimiento e información de configuración y de realizar la provisión sobre los elementos de red que gestionan. Los NMS, llamados comúnmente herramientas de monitorización, proporcionan tanto a OYM como a Planificación y Optimización una visión segmentada, dado que los NMS no realizan todas las funciones del marco de referencia FCAPS (Fault, Configuration, Account, Performance, Security), con lo que nos encontramos con una gran variedad de herramientas, cada una de ellas enfocada en una función concreta.
Con la llegada de tecnologías como Acceso Móvil, Core Móvil, SDH, PON, FTTH, Packet Microwave, IP/MPLS, etc. el número de EMS creció. Ante la gran variedad de NMS y EMS existentes en el mercado, cada uno dedicado o especializado en una determinada tecnología o capa de red, aparecieron herramientas “paraguas”, encargadas de integrarse con el resto de NMS, EMS y centralizar la información en una única consola para facilitar el trabajo del operador y aportar una visión de servicio. Permitiendo la correlación entre las distintas capas de red y la capacidad de relacionar un problema final con el origen (RCA o Root Cause Analysis), aun cuando son elementos de diferentes tecnologías. Esto proporcionó una gran visibilidad a los CSPs pudiendo reducir el MTTR ante fallos y caídas de red, mejorando la experiencia de usuario, minimizando el famoso “churn” e indirectamente incrementando los beneficios. Además, algunos fabricantes de herramientas de monitorización comenzaron a incorporar mecanismos para disparar automatismos sobre los equipos tras la aparición de una alarma, permitiendo resolver el problema de forma automática y reduciendo aún más el MTTR.
El siguiente diagrama nos ayuda a entender cómo interactúan las distintas capas en la provisión y calidad del servicio:
Ilustración 1. Diagrama de relación BSS/OSS
Podemos ver los sistemas de soporte a las operaciones (OSS) como la capa que aporta visión de servicio al conjunto de elementos EMS y NMS. Por encima, la capa de soporte a los sistemas de negocio (BSS), desde la que se gestionan las diferentes órdenes. La provisión (Fulfillment) se realiza a través de los sistemas BSS y atraviesa cada una de las capas hasta llegar a los elementos de red (NE o Network Elements). De manera inversa, se asegura la calidad del servicio (Assurance), empezando por la monitorización de los recursos de red y subiendo cada una de las capas hasta obtener una visión de servicio. En la figura se hace referencia entre paréntesis a las diferentes capas definidas por el Internation Telecommunication Union (ITU-T) en el modelo TMN (Telecom Management Network): BML (Business Management Layer), SML (Service Management Layer), NML (Network Management Layer), EML (Element Management Layer) y NEL (Network Element Layer).
Volviendo a la evolución de las redes, la automatización con entornos de contenedores, redes SDN (Software Defined Networks) y la virtualización de las funciones de red (NFV, Network Function Virtualization) han ido ganando importancia, tanto en la arquitectura, como en la automatización del despliegue. Esto es una pieza clave a la hora de abarcar el siguiente paso, que consiste en intentar adelantarse a una posible situación de problema o congestión de la red y resolverlo de forma automática mediante la orquestación.
El Futuro
¿OSS a la nube?
Según un estudio de TMForum, parece que por el momento el futuro de OSS no estará por completo en la nube. Muchos CSPs quieren mantener las operaciones de red en sus propios centros de datos (on-premise) o en su nube privada debido a la preocupación por la latencia y seguridad que proporcionan las aplicaciones que corren en nubes públicas. Dicho de otra manera, la información contenida en OSS es tan crítica que las compañías creen que deben mantener el control del HW sobre el que corre el SW.
Ilustración 2. Encuesta sobre la migración de OSS a la nube en CSPs
En la figura anterior, se aprecia como un 60% no movería o movería solo una parte de sus sistemas OSS a la nube y un 28% está indeciso, mientras que el resto sí lo tiene claro.
La unión de BSS y OSS
A pesar de que vemos CSPs que pretenden transformar los sistemas de soporte a las operaciones (OSS) para que estos estén orientados a datos y a la automatización, a menudo dichas transformaciones impactan en procesos de BSS generalmente orientados a cliente.
Por ejemplo, en un entorno orientado a datos, los sistemas OSS que sean capaces de identificar degradación de los servicios se deberán conectar a bases de datos de clientes para identificar a quienes impacta dicha degradación. Esta unión, en muchos casos no se está realizando al nivel que se debería.
Los CSPs tendrán que entregar y asegurar en tiempo real los servicios que prestan a sus clientes de grandes cuentas y estos esperarán poder tener visibilidad en tiempo de real de dichos servicios. De manera similar, una foto en tiempo real de la red también permite al equipo de ventas de los CSPs poner precio y diseñar servicios para clientes.
En definitiva, la focalización en el cliente es una estrategia necesaria, pero no se puede realizar sin tener una mejor integración entre los sistemas OSS y BSS.
También te puede interesar: Soluciones avanzadas de seguridad: Network Detection & Response y el ‘Fast data’ en la era del ‘big data’
👈
Automatización
Las operadoras, además de necesitar soluciones flexibles, abiertas y de bajo coste, también quieren que soporten la automatización, de forma que se consigan los denominados procesos Close-Loop Fulfillment, Close-Loop Assurance y Close-Loop Optimization.
En un principio, estos procesos podrían conllevar la eliminación de los puestos de trabajo de algunos operadores, pero a la larga y con la llegada del 5G, se verá cómo es completamente necesario este apoyo para seguir el ritmo, velocidad y volumen de dichas redes.
Los procesos Close-Loop serán completamente necesarios para el despliegue de servicios 5G para clientes de grandes cuentas, que se realiza mediante network slicing (rebanadas de red), en el que se despliegan, de forma orquestada, los servicios E2E (End-to-End) para los clientes que impactan en la provisión de los elementos que componen las redes de Acceso Móvil (RAN), Transporte, y Core mediante la virtualización de funciones de red (NFV).
IA aplicado a las operaciones IT
Durante los últimos años hemos visto como los CSPs han estado invirtiendo en el análisis de datos y ahora quieren dar un paso más añadiendo inteligencia artificial para mejorar la experiencia de usuario, aumentar la agilidad, mejorar la eficiencia y fiabilidad.
Hasta hoy, la monitorización de red en su conjunto estaba enfocada en proporcionar visibilidad, pero tras décadas de avance en el campo de la inteligencia artificial, nos encontramos ante el reto de elegir y aplicar los distintos algoritmos de aprendizaje máquina (machine learning) sobre los datos de OSS y ser capaces de detectar posibles fallos antes de que ocurran. Para ello, estos sistemas se deben integrar con diversas fuentes de información: meteorológica, alarmas, KPIs, logs, incidencias registradas en herramientas de ticketing, etc. y entrenar los algoritmos con estos datos para luego detectar anomalías.
Esta unión de los tres mundos: BSS/OSS, inteligencia artificial y automatización da lugar al marco de referencia AIOps (Artificial Intelligence for IT Operations).
¿Qué es AIOps?
AIOps es la aplicación de la inteligencia artificial a las operaciones IT, mediante el uso de analíticas y aprendizaje máquina sobre grandes volúmenes de datos recopilados por herramientas y dispositivos, para la detección y reacción automática en tiempo real.
Según Gartner, AIOps consiste en dos componentes principales, Big Data e IA y requiere una correlación de los datos de OSS junto con datos de BSS (CRM o Trouble Ticketing). Juntando todo esto, lo que se pretende es detectar anomalías y actuar en consecuencia a través de una automatización. Se puede pensar en AIOps como integración e implementación continua (CI/CD) para las funciones de IT principales.
También te puede interesar: Inventario de recursos de red
Ilustración 3. Visualización de Gartner de la plataforma AIOPS
AIOps une tres disciplinas de IT diferentes para lograr los objetivos de mejora continua: gestión de servicios, gestión del rendimiento y automatización.
Mas sobre la tecnología Massive MIMO en redes 5G 🏅
¿Qué fuerzas están conduciendo a AIOps?
Con AI se pretende mejorar, agilizar y “escalar” el trabajo realizado por un humano. El enfoque de AIOps se centra en los siguientes puntos a la hora de abordar los desafíos de agilidad, escala y complejidad de la transformación digital:
- La dificultad que tienen las operaciones IT para gestionar manualmente su infraestructura.
- La cantidad de datos que las operaciones IT necesitan retener está aumentando exponencialmente.
- El tiempo de respuesta ante problemas de infraestructura deben ser cada vez menores.
- Más potencia de cálculo se está moviendo a los bordes de la red (edge computing).
Las capas que componen AIOps
AIOps consta de las siguientes capas, que se muestran en la siguiente figura:
Ilustración 4. Las capas que conforman una plataforma AIOps
- Amplias y diversas fuentes de datos de IT (eventos, métricas, registros, trabajos programados, tickets, monitorización, etc.).
- Plataformas modernas de Big Data que permiten el procesamiento en tiempo real de datos de IT.
- La aplicación de reglas y detección de anomalías sobre los datos almacenados.
- Algoritmos de dominio que aprovechan la experiencia en el entorno de IT.
- Aprendizaje automático basado en la propia salida y los nuevos datos introducidos en el sistema.
- Inteligencia artificial que puede adaptarse a los nuevos y desconocidos patrones en un entorno.
- Automatización, que utiliza los resultados generados por el aprendizaje automático o la IA para crear y aplicar automáticamente una respuesta o mejora para los problemas y situaciones identificados.
La adopción de la inteligencia artificial en AIOps es incipiente en comparación con el aprendizaje máquina. En este momento, los casos de uso más urgentes se abordan mejor con una automatización simple o una combinación de ML y automatización. Queda por ver cómo evolucionará la IA y qué nuevos casos de uso permitirá. En cualquier caso, debe establecerse una base sólida de AIOps en Operaciones de IT tal como existe ahora antes de que podamos comenzar a modelar el comportamiento humano para su uso en él.
¿Dónde estamos nosotros?
SATEC lleva muchos años trabajando en el mundo del OSS, gracias a lo cual hemos adquirido una gran experiencia, tanto en torno a las necesidades de los clientes, como en herramientas específicas del mercado. Todo esto, unido a nuestras capacidades de desarrollo de aplicaciones, particularmente con herramientas en el mundo del procesamiento y gestión de datos (Big Data, AI/ML), nos ha permitido construir una propuesta con soluciones propias en el ámbito de los sistemas OSS de nueva generación.
Nuestras soluciones son capaces de integrar cualquier tipo de fuente, haciendo uso de un conjunto de potentes y modernas piezas focalizadas en la gestión y almacenamiento de datos, que de forma integrada ofrecen gran flexibilidad y funcionalidades avanzadas. A todo ello añadimos capacidades de analítica de datos y el aprendizaje máquina, para permitir, por ejemplo, la detección de anomalías (tanto para modelos supervisados como no supervisados), o el lanzamiento de acciones para solucionar problemas detectados de forma automática, consiguiendo el denominado proceso Close-Loop.
Finalmente, a los que llevamos varios años trabajando en el área BSS/OSS, se nos presenta una oportunidad para renovarnos y elevar nuestros conocimientos. Hasta ahora nuestra función era la de proporcionar visibilidad, pero con la llegada de AIOps, podremos aplicar algoritmos de aprendizaje máquina junto con la inteligencia artificial y en respuesta, lanzar automatizaciones tanto para el despliegue automático, como para la resolución de problemas. Conceptos que hasta ahora estaban fuera de nuestro ámbito, pero que ahora cobran mucha importancia. Después de todo, quién no sueña con tener su propio Skynet.