Proyecto

Resumen

El proyecto FuSA se trata de una iniciativa desarrollada por Laboratorio de Acústica Ambiental LABACAM del Instituto de Acústica de la Universidad Austral de Chile, que plantea la implementación de un sistema de análisis de audio sumado al uso de tecnologías de la información y ciencia de datos para la detección y clasificación automática de fuentes sonoras de ruido ambiental.

El objetivo del proyecto es crear un sistema de información acústica que permita detectar y clasificar fuentes sonoras e información acústica utilizando redes neuronales y aprendizaje profundo. El sistema se basa en una taxonomía de fuentes sonoras relevantes que respondan a las necesidades particulares de distintos usuarios.

En una lógica de colaboración público-privada, se ha establecido un trabajo conjunto comprendido desde la obtención de grandes volúmenes de datos de origen sonoro, desarrollo de una arquitectura de software capaz de integrar la diversidad de fuentes de datos, e implementación de interfaces de visualización que podrán ser utilizadas por distintos tipos de usuarios: personas naturales, instituciones (Municipios, Ministerios, etc.) y privados (empresas tecnológicas con problemáticas de sonido y acústica ambiental), poniendo a disposición los avances tecnológicos en inteligencia artificial al servicio de la acústica ambiental para contribuir al reconocimiento del problema del ruido en las ciudades, generar soluciones dirigidas al control y fiscalización de fuentes sonoras, brindar herramientas para la planificación y diseño de políticas públicas, impulsar el interés por la ciencia ciudadana y fomentar el acceso a la educación ambiental.

Para lograr esto, el método del sistema FuSA ha sido dividido en tres procesos:

  1. Detección y clasificación de fuentes sonoras ambientales mediante algoritmos y redes neuronales profundas.
  2. Recopilación, enrutamiento y almacenamiento de grandes volúmenes de datos registrados desde equipamiento heterogéneo mediante una arquitectura de software escalable.
  3. Visualización de datos para distintos escenarios de uso real, enfocado en instituciones públicas, empresas y ciudadanos.

¿Por qué analizar fuentes sonoras ambientales?

La exposición al ruido ambiental representa peligros para la salud humana con amplio estudio y evidencia científica, aumentando el riesgo de padecer trastornos cardiovasculares, endocrinos, gástricos y respiratorios, además de generar deterioros en la salud mental tales como trastorno del sueño, estrés, depresión, irritabilidad, frustración y molestia. Todo esto se traduce finalmente en aumentos de la tasa de mortalidad asociadas a dichas enfermedades.

Por ello, la Organización Mundial de la Salud ha establecido recomendaciones respecto a los niveles de exposición al ruido de tránsito vehicular, considerada actualmente la principal fuente de ruido ambiental en las ciudades, estableciendo los siguientes límites:

      • 53 dBA para el período día-tarde-noche.
      • 45 dBA para período nocturno.

Nota: dBA hace relación al nivel sonoro ajustado a la sensibilidad de la audición humana.

En la Comunidad Europea, desde el año 2002 es obligatorio el diagnóstico de las condiciones acústicas en las ciudades para elaborar e implementar medidas de control de ruido ambiental. Esto se ha realizado mediante la elaboración, publicación y actualización de mapas de ruido, que permiten identificar las zonas con mayores niveles de ruido ambiental y aquellas con ambientes sonoros más tranquilos.

En Chile, de acuerdo con cifras del Ministerio de Medio Ambiente se estima que más de 1.2 millones de habitantes están expuestos a niveles críticos de ruido ambiental sólo en el Gran Santiago. La Superintendencia de Medio Ambiente reconoce que el 40% de las denuncias recibidas corresponden al contaminante ruido ambiental. Por ello, ambas instituciones han explorado la instalación de redes de monitoreo continuo de ruido en ciudades como Iquique, Santiago, Valparaíso y Concepción, asociados a iniciativas propias de ciudades inteligentes o SmartCities.

Objetivos

i. Objetivo General:

Desarrollar un sistema que integre mediciones acústicas de fuentes sonoras ambientales con análisis de detección y clasificación por taxonomía, a través de redes neuronales profundas.

ii. Objetivos Específicos:

OE1: Proponer, implementar, entrenar y evaluar modelos basados en redes neuronales profundas para la detección y la clasificación de fuentes sonoras ambientales a partir de bases de datos diversas. 

OE2: Diseñar, implementar y desplegar una arquitectura de software escalable, evolutiva y portable que organiza la recopilación de flujos de datos de origen sonoro (medición acústica y audio) desde equipos de registro heterogéneos, el enrutamiento de los datos hacia módulos de pre-procesamientos y de análisis de fuentes sonoras y el almacenamiento oportuno de los resultados obtenidos.

OE3: Diseñar, probar y validar escenarios de uso del sistema de información acústica FuSA, basados en la detección y clasificación de fuentes sonoras e información acústica, especificando una taxonomía de fuentes sonoras relevantes que respondan a las necesidades particulares de distintos actores: institucionales, privados y personas naturales, proponiendo una interfaz de visualización funcional.

Valor del proyecto

El proyecto FuSA presenta grandes oportunidades para enfrentar nuevos desafíos ambientales, pues incorpora la detección y clasificación de fuentes sonoras, la integración de datos sonoros provenientes de diversas empresas latinoamericanas, servicios de medición acústica, equipos de monitoreo y soluciones tecnológicas para control de ruido ambiental.

La identificación de fuentes sonoras facilita una fiscalización más eficiente y dirigida de fuentes sonoras y actividades normadas por la ley, e incluso permite identificar la presencia de trabajos no autorizados por la ley como la tala o pesca ilegal. Por otra parte, la validación de un esquema innovador de mediciones acústicas basadas en criterios e indicadores generados a través de inteligencia artificial, permiten profundizar el conocimiento del entorno acústico y su composición, favoreciendo la puesta en valor del paisaje sonoro y protección de zonas verdes urbanas.

A través del proyecto, se ha diseñado un modelo robusto para la detección y clasificación de fuentes sonoras, cuya investigación e implementación ha consistido en:

    1. Proponer e implementar nuevas arquitecturas de redes profundas que exploten las características intrínsecas de las señales de audio. En particular, enfocado en los desafíos asociados a la presencia de eventos sonoros simultáneos, la incorporación de distintas fuentes de información y la definición de vecindades locales en tiempo y frecuencia.

    1. Estudiar estrategias de transferencia de aprendizaje aprovechando conjuntos de entrenamiento disponibles, como Google AudioSet para pre-entrenar modelos y transferirlos a la aplicación de fuente sonora ambiental. Las empresas participantes han provisto de un conjunto representativo de datos etiquetados correspondiente a sus ambientes acústicos de operación. La estimación de incerteza ha sido llevada a cabo bajo un enfoque bayesiano.

El sistema FuSA ha implementado una arquitectura de software común, capaz de integrar grandes volúmenes de datos de orígenes sonoros y el desarrollo de interfaces de visualización que facilitan la toma de decisiones, como la elaboración de mapas de ruido, indicadores y visualizaciones que podrán ser utilizadas por las instituciones para la planificación y desarrollo de políticas públicas.

Gestión y visualización de datos al servicio del bienestar ciudadano

Los mapas de ruido son un activo clave en la elaboración de políticas de mitigación del ruido urbano. Sin embargo, aquellos basados en simulación están sujetos a grandes incertidumbres. En la actualidad existen métodos que combinan simulación con mediciones, mediante datos objetivos obtenidos por sonómetros o estaciones de monitoreo, con datos acústicos o datos de flujo vehicular. Sin embargo, recientes estudios destacan la importancia de la respuesta subjetiva al ruido en la acústica ambiental, mostrando que la superación de un límite de ruido no implica necesariamente que tal fuente sea la más molesta para los habitantes, sugiriendo que es el tipo de fuente sonora, la repetición del ruido u otros factores subjetivos, los que pueden provocar molestias al ruido ambiental.

Una validación de escenarios de uso para instituciones públicas, empresas y ciudadanos

El objetivo del proyecto es crear un sistema de información acústica que permita detectar y clasificar fuentes sonoras e información acústica. Para ello, el sistema se basa en una taxonomía de fuentes sonoras relevantes que respondan a las necesidades particulares de distintos usuarios. Estos usuarios pueden ser institucionales (Ministerio de Medio Ambiente, municipios, etc.), privados (empresas tecnológicas con problemática de sonido y acústica ambiental) y personas naturales o investigadores.

Redes neuronales profundas para la detección y clasificación de fuentes sonoras ambientales

Las redes neuronales, enmarcadas en el paradigma del Aprendizaje Profundo (DL por Deep Learning), han dominado en diversos problemas de reconocimiento de patrones, siendo su mayor ventaja la capacidad de extraer características de forma automática a partir de los datos, sobre todo en el caso de datos no-estructurados, como imágenes, texto y series de tiempo. La contraparte está situada en su alta complejidad, que requiere grandes volúmenes de datos etiquetados, para entrenar la gran cantidad de parámetros que las redes poseen. La mayoría de las soluciones desarrolladas bajo el paradigma de aprendizaje profundo se basan en modelos desarrollados para reconocimiento de imágenes.

El proyecto FuSA se ha enfocado en el problema de detección y clasificación de eventos sonoros, reconociendo uno o más tipos particulares de sonido. Hoy en día los algoritmos de aprendizaje profundo más utilizados están basados en el uso de redes neuronales convolucionales, empleando dos posibles estrategias: obteniendo previamente un espectrograma, transformado o no en escala Mel, o aplicando directamente las redes convolucionales sobre las muestras de audio.

Una arquitectura de software portable, adaptable y usable para organizar la recopilación y el análisis de datos de origen sonora

Desde celulares a instrumentos de medición profesionales podrán enviar flujos de datos JSON a una API web. Los datos pueden ser mediciones acústicas, registros de señales de audio, etc, los cuales contendrán metadatos mínimos (hora, fecha y lugar de registro). El sistema segmenta y analiza los datos, almacenando aquellos con ruido relevante, y los suministra a los componentes de deep learning. Finalmente, el sistema FuSA consistirá en una interfaz web/móvil con funcionalidades para usuarios comunes y usuarios particulares.

At vero eos et accusamus et iusto odio digni goikussimos ducimus qui to bonfo blanditiis praese. Ntium voluum deleniti atque.

Melbourne, Australia
(Sat - Thursday)
(10am - 05 pm)