Al utilizar una gran cantidad de variables en un proceso de aprendizaje inductivo, existe la posibilidad de que algunas de ellas no aporten suficiente información útil para el proceso. Por ello, desde la década de los sesenta, las investigaciones relacionadas con la selección de variables (feature selection) intentan reducir el espacio de hipótesis en un intento de encontrar subconjuntos de variables que den lugar a un mejor rendimiento de los algoritmos de inducción.
El propósito fundamental que se busca al reducir variables es mejorar la velocidad de aprendizaje, la capacidad de generalización y/o la simplicidad de la representación, para así comprender mejor los resultados obtenidos, disminuir el volumen de almacenamiento, reducir ruidos generados por aquellas variables que no aportan información y eliminar conocimiento inútil para la solución del problema.
Se pretende trabajar en el desarrollo de un meta-algoritmo de selección de variables (MASA). La idea subyacente consiste en coordinar varios algoritmos de selección bajo diferentes criterios de evaluación (entropía, consistencia, precisión, etc) de tal manera que se obtenga un mejor rendimiento que si se aplicase cada algoritmo de forma separada e independiente.
Hibridaciones de métodos y técnicas de Soft Computing
Dentro del soft computing existen diferentes disciplinas, técnicas, metodologías que por separado han demostrado sus buenas cualidades en mucho dominios de aplicación. Cada una tiene, por supuesto, ventajas e inconvenientes. El cruce de ideas y técnicas puede por tanto producir metodologías que manteniendo las ventajas comunes, reduzca los inconvenientes, al verse mutuamente reforzadas. Esto es de gran interés teórico y práctico.
En este proyecto se propone trabajar en las siguientes hibridaciones:
La semejanza de las arquitecturas de una SVM y una FNN permite combinar las diferentes estrategias de aprendizaje de ambos modelos. En particular, la idea de vector soporte para maximizar el margen en SVMs permite minimizar funciones de coste de FNNs basadas en el error cuadrático en las que se observase el mismo comportamiento. La mayor flexibilidad del modelo de FNNs puede dar lugar a mejores rendimientos.
Si se considera información difusa en algunas de las entradas a una red neuronal, nos encontramos en las denominadas redes neuronales difusas. Éstas son redes que usan métodos difusos para mejorar o extender las capacidades de aprendizaje o para aprender mejor en un sentido genérico, y donde el objetivo primordial es perfeccionar la red neuronal. La propia red y sus algoritmos de aprendizaje se obtienen como las versiones difusas de los convencionales. Estas redes ofrecen un número de ventajas de entre las cuales destacan la posibilidad de procesar directamente información imprecisa y de aproximar funciones difusas. El objetivo es la concepción, estudio teórico y diseño de una nueva clase de red neuronal difusa, dentro del marco conceptual de las redes neuronales heterogéneas. Se pretende además concebir mecanismos de control del error de generalización (el criterio más importante en una aplicación práctica de redes neuronales).
Los sistemas neuro-difusos surgen de la necesidad de combinar el modelado empírico y el cualitativo. Estas técnicas permiten tanto las descripciones lingüísticas de los sistemas como la utilización de los datos para ajustar el modelo (entre los que se encuentran los parámetros de las funciones de pertenencia que conforman las variables de entrada) durante la fase de identificación. Contrariamente, la metodología FIR no permite una adaptación de las funciones de pertenencia durante el proceso de identificación del modelo. En este caso, se realiza una discretización inicial que se mantiene fija durante todo el proceso de aprendizaje.
El objetivo es la adaptación en FIR de la distribución de los datos entre las diferentes clases de manera automática durante la fase de identificación del modelo mediante algoritmos de entrenamiento comúnmente usados por las redes neuronales. Este método híbrido permitiría refinar los landmarks entre clases y la forma de las funciones de pertenencia.
El utilizar todos los datos de entrenamiento de que se dispone en un sistema automático de aprendizaje puede resultar en ocasiones contraproducente en términos de eficiencia o de eficacia en la posterior capacidad de generalización. Por ello, es un objetivo disponer de técnicas que permitan seleccionar aquellos datos más relevantes (como centroides o puntos frontera) para obtener un buen rendimiento del sistema. Estas técnicas deben adaptarse a las características propias de cada metodología inductiva, en nuestro caso, FIR y redes neuronales.
Cuando la tarea que se desea aprender está representada por una función que tiene una forma diferente en regiones distintas del espacio de entradas, es de esperar que la cooperación de expertos locales (p.ej. redes neuronales o modelos estadísticos), cada uno encargado de una región diferente, resulte en una mejora del rendimiento con respecto a un modelo global para toda la función. Es un objetivo descomponer automáticamente el espacio de entradas en regiones, inferir los modelos para cada región y determinar la forma de cooperación entre ellos para tomar decisiones.
Las redes neuronales LSTM son las redes recurrentes que han obtenido mejores resultados de predicción y clasificación de secuencias en tareas benchmark, pero como en otros tipos de redes existe el problema de fijar a priori su tamaño y su topología exacta. El objetivo es adaptar la metodología SAOCIF de construcción incremental de redes feed-forward a redes recurrentes LSTM usando algoritmos evolutivos como método de búsqueda de los pesos óptimos de la red.
La composición característica de las aguas residuales (elevada presencia de microorganismos patógenos, actividad microbiana, etc.) supone que su vertimiento directo a un medio acuático pueda producir consecuencias nocivas para la vida en el entorno. Se requieren diversas operaciones y procesos químicos, físicos y biológicos para tratar adecuadamente este tipo de aguas, siguiendo una secuencia relativamente compleja desde el punto de vista de funcionamiento global de la estación.
El buen funcionamiento de una estación depuradora de aguas residuales urbanas viene condicionado, en gran medida, por la estabilidad de las diferentes etapas especialmente de la etapa biológica donde se lleva a cabo la eliminación de la materia orgánica. Cualquier cambio en las condiciones de operación puede provocar el desequilibrio de la comunidad microbiana y la proliferación no deseada de bacterias que comporten problemas operacionales de la estación. En este sentido, la detección de posibles anomalías en cualquiera de los procesos que conforman la planta o estación y la predicción de posibles fallos o desequilibrios con anterioridad a que sucedan resultan de gran utilidad para evitar riesgos ambientales en el entorno y problemas en la estación global.
HIBRID METHODOLOGIES OF SOFT COMPUTING AND ITS APLICATION TO FAULT DETECTION IN WASTEWATER TREATMENT PLANTS
From 1st of December 2002 to 30th November 2005
Ángela Nebot Castells
Large-scale dynamical systems; time series: analysis and forecasting; fuzzy inductive reasoning; heterogeneous neural networks; delta neural networks; fault monitoring systems; water distribution network.
Starting from the work done in the previous project (TAP1999-0474), the objective of this project is the deepening into the development of hybrid methodologies of soft computing for fault detection and identification in complex dynamical systems. In the previous project some methodologies based on fuzzy and connectionist techniques were refined (fuzzy inductive reasoning, feed-forward, recurrent, delta and heterogeneous neural networks), and a comparative study was performed in order to identify the strong points of every methodology. In this project the research of possible hybridizations of these techniques is proposed, together with their combination by means of cooperation methods, in order to predict the future behaviour of real systems and detect possible faults in their work. The results will be validated on standard benchmarks, laboratory models, and finally will be applied to a wastewater treatment plant