Algoritmos como DQN (Deep Q-Network) permiten a un agente aprender políticas óptimas mediante interacción prueba-error. La contribución de IAp es la regularización de exploración : limitar acciones peligrosas mediante máscaras de seguridad (safety shields) derivadas de lógica difusa.
Se propone la siguiente arquitectura en tres capas:
La Inteligencia Aplicada no es una mera subdisciplina de la IA, sino un enfoque de ingeniería que prioriza la sobre la fidelidad biológica. La arquitectura ARQ-IAp, basada en un híbrido de aprendizaje por refuerzo profundo y lógica difusa, demuestra mejoras significativas en robótica móvil. Se recomienda su adopción en sistemas embebidos de tiempo real donde la seguridad y la latencia son críticas. Inteligencia Aplicada Pdf
Dr. A. Fernández Affiliation: Instituto de Estudios en Inteligencia Computacional Date: April 2026
| Capa | Componente | Función | Tecnología | |------|------------|---------|-------------| | | Fusión sensorial | Reducción de dimensionalidad y filtrado | CNN liviana (MobileNet) + Filtro Kalman | | Deliberativa | Motor de decisión | Selección de acción basada en estado | Fuzzy-DQN (Q-learning con función de recompensa difusa) | | Ejecutora | Actuación segura | Mapeo de acción a comando físico | Reglas difusas de seguridad (hard constraints) | Algoritmos como DQN (Deep Q-Network) permiten a un
El sistema propuesto mejora la tasa de éxito en entornos dinámicos en un frente al baseline y un 7% frente a DQN estándar, con una latencia un 33% menor que DQN puro y un consumo energético cercano al sistema determinista.
La lógica difusa (Zadeh, 1965) permite la representación de reglas lingüísticas del tipo SI (temperatura es ALTA Y presión es MEDIA) ENTONCES (acción = REDUCIR_FLUJO) . Su aplicación en IAp se centra en sistemas de control que requieren robustez frente a ruido de sensores. La arquitectura ARQ-IAp, basada en un híbrido de
Las CNNs transforman datos sensoriales (imagen, lidar, espectrogramas) en representaciones latentes. En IAp, se utilizan no para clasificación genérica de imágenes (ImageNet), sino para tareas específicas como detección de anomalías en líneas de producción o segmentación semántica de trayectorias.
Donde μ = grado de pertenencia del estado actual a una región segura predefinida. Esto penaliza implícitamente las acciones que acercan al agente a estados no deseados.