IA-UNISON · GeoSal17 · Jan 21, 2025 · Jan 21, 2025 · Jan 21, 2025 · Jan 22, 2025
diff --git a/entornos_o.py b/entornos_o.py
@@ -10,6 +10,8 @@
 
 __author__ = 'juliowaissman'
 
+import copy
+
 class Entorno:
     """
     Clase abstracta para entornos
@@ -96,7 +98,7 @@ def simulador(entorno, agente, pasos=10, verbose=True):
         entorno.transicion(a)
 
         historial_costo.append(entorno.costo)
-        historial_estados.append(entorno.x[:])
+        historial_estados.append(copy.deepcopy(entorno.x)) # Editado para que imprimiera bien
         historial_acciones.append(a)
 
     historial_acciones.append(None)

diff --git a/tarea_1.py b/tarea_1.py
@@ -7,12 +7,224 @@
 Revisa el archivo README.md con las instrucciones de la tarea.
 
 """
-__author__ = 'escribe_tu_nombre'
+__author__ = 'georginasalcido'
 
-import entornos_f
 import entornos_o
+import random
+from random import choice
 
-# Requiere el modulo entornos_f.py o entornos_o.py
-# Usa el modulo doscuartos_f.py para reutilizar código
-# Agrega los modulos que requieras de python
+class NueveCuartos(entornos_o.Entorno):
+    # Lista de listas para acomodar los cuartos y ponerlos todos sucios
+    def __init__(self, x0=[0, 0, [["sucio"] * 3 for _ in range(3)]]):
+        self.x = x0[:]
+        self.costo = 0
 
+    def accion_legal(self, accion):
+        return accion in ("ir_Derecha", "ir_Izquierda", "subir", "bajar", "limpiar", "nada")
+
+    def transicion(self, accion):
+        if not self.acción_legal(accion):
+            raise ValueError("La acción no es legal para este estado")
+
+        piso, cuarto, estado = self.x
+
+        if accion == "limpiar":
+            self.costo += 1
+            estado[piso][cuarto] = "limpio"
+        elif accion == "ir_Derecha":
+            self.costo += 2
+            if cuarto < 2:
+                self.x[1] += 1
+        elif accion == "ir_Izquierda":
+            self.costo += 2
+            if cuarto > 0:
+                self.x[1] -= 1
+        elif accion == "subir":
+            self.costo += 3
+            if cuarto == 2 and piso < 2:
+                self.x[0] += 1
+        elif accion == "bajar":
+            self.costo += 3
+            if cuarto == 0 and piso > 0:
+                self.x[0] -= 1
+        elif accion == "nada":
+            if estado[piso][cuarto] == "sucio":
+                self.costo += 1
+
+    def percepcion(self):
+        piso, cuarto, estado = self.x
+        return piso, cuarto, estado[piso][cuarto]
+
+class AgenteAleatorio(entornos_o.Agente):
+    def __init__(self, acciones):
+        self.acciones = acciones
+
+    def programa(self, _):
+        return choice(self.acciones)
+
+# NO GUARDA LOS ESTADOS DE LOS DEMÁS CUARTOS, SOLO CONOCE EL ESTADO DEL CUARTO DONDE ESTÁ
+class AgenteReactivoNuevecuartos(entornos_o.Agente):
+    def programa(self, percepcion):
+        piso, cuarto, situacion = percepcion
+        return ('limpiar' if situacion == 'sucio' else
+                'ir_Derecha' if cuarto < 2 else 
+                'subir' if cuarto == 2 and piso < 2 else
+                'ir_Izquierda' if cuarto > 0 else
+                'bajar' if cuarto == 0 and piso > 0 else
+                'nada' )
+
+class AgenteReactivoModeloNueveCuartos(entornos_o.Agente):
+    def __init__(self):
+        self.modelo = [0, 0, [["sucio"] * 3 for _ in range(3)]]
+
+    def programa(self, percepcion):
+        piso, cuarto, situacion = percepcion
+
+        self.modelo[0] = piso
+        self.modelo[1] = cuarto
+        self.modelo[2][piso][cuarto] = situacion
+
+        return ('limpiar' if situacion == 'sucio' else
+                'ir_Derecha' if cuarto < 2 and 'sucio' in self.modelo[2][piso][cuarto+1:] else
+                'subir' if cuarto == 2 and piso < 2 and 'sucio' in self.modelo[2][piso+1] else
+                'ir_Izquierda' if cuarto > 0 and 'sucio' in self.modelo[2][piso][:cuarto] else
+                'bajar' if cuarto == 0 and piso > 0 else
+                'nada')
+
+    """and 'sucio' in self.modelo[2][:piso]"""
+
+class NueveCuartosCiego(NueveCuartos):
+    def percepcion(self):
+        return self.x[0], self.x[1]
+
+class AgenteRacionalCiego(entornos_o.Agente):
+    def __init__(self):
+        self.modelo = [0, 0, [["sucio"] * 3 for _ in range(3)]]
+
+    def programa(self, percepcion):
+        piso, cuarto = percepcion
+
+        self.modelo[0] = piso
+        self.modelo[1] = cuarto
+        #self.modelo[2][piso][cuarto] = "limpio"
+
+        if self.modelo[2][piso][cuarto] == 'sucio':
+            self.modelo[2][piso][cuarto] = "limpio"
+            return 'limpiar'
+        if piso < 2 and cuarto == 2: # and any("sucio" in piso_cuartos for piso_cuartos in self.modelo[2][piso:]):
+            return 'subir'
+        elif piso > 0 and cuarto == 0:# and any("sucio" in piso_cuartos for piso_cuartos in self.modelo[2][:piso]):
+            return 'bajar'
+        if "sucio" in self.modelo[2][piso]:
+            if cuarto < 2 and any('sucio' in cuartos for cuartos in self.modelo[2][piso][cuarto:]):
+                return 'ir_Derecha'
+            elif cuarto > 0:
+                return 'ir_Izquierda'
+        return 'nada'
+
+    """and 'sucio' in self.modelo[2][piso][cuarto+1:]"""
+    """and 'limpio' in self.modelo[2][piso][cuarto+1:]"""
+
+class NueveCuartosEstocastico(NueveCuartos):
+    def transicion(self, accion):
+        if not self.acción_legal(accion):
+            raise ValueError("La acción no es legal para este estado")
+
+        piso, cuarto, estado = self.x
+
+        if accion == "limpiar":
+            self.costo += 1
+            if random.random() <= 0.8:
+                estado[piso][cuarto] = "limpio"
+        elif accion == "subir":
+            self.costo += 3
+            if cuarto == 2 and piso < 2:
+                self.x[0] += 1
+        elif accion == "bajar":
+            self.costo += 3
+            if cuarto == 0 and piso > 0:
+                self.x[0] -= 1
+        elif accion in ("ir_Derecha", "ir_Izquierda"):
+            self.costo += 2
+            probabilidad = random.random()
+            if probabilidad <= 0.8:
+                super().transicion(accion) 
+            elif probabilidad <= 0.9:
+                pass
+            else:
+                acciones = ["ir_Derecha", "ir_Izquierda", "subir", "bajar", "limpiar", "nada"]
+                accion_random = choice(acciones)
+                super().transicion(accion_random)
+
+class AgenteRacionalEstocastico(entornos_o.Agente):
+    def __init__(self):
+        self.modelo = [0, 0, [["sucio"] * 3 for _ in range(3)]]
+
+    def programa(self, percepcion):
+        piso, cuarto, situacion = percepcion
+
+        self.modelo[0] = piso
+        self.modelo[1] = cuarto
+        self.modelo[2][piso][cuarto] = situacion
+
+        return ('limpiar' if situacion == 'sucio' else
+                'ir_Derecha' if cuarto < 2 and 'sucio' in self.modelo[2][piso][cuarto+1:] else
+                'subir' if cuarto == 2 and piso < 2 and 'sucio' in self.modelo[2][piso+1] else
+                'ir_Izquierda' if cuarto > 0 and 'sucio' in self.modelo[2][piso][:cuarto] else
+                'bajar' if cuarto == 0 and piso > 0 else
+                'nada')
+
+# Correr uno por uno porque la función simulador no funciona bien jeje
+def test():
+    x0=[0, 0, [["sucio"] * 3 for _ in range(3)]]
+
+    print("Prueba del entorno con un agente aleatorio")
+    entornos_o.simulador(NueveCuartos(x0),
+                         AgenteAleatorio(['ir_Derecha', 'ir_Izquierda', 'subir', 'bajar', 'limpiar', 'nada']),
+                         300)
+
+    print("Prueba del entorno con un agente reactivo con modelo")
+    entornos_o.simulador(NueveCuartos(x0), 
+                         AgenteReactivoModeloNueveCuartos(), 
+                         200)
+
+    print("Prueba del entorno con un agente racional ciego")
+    entornos_o.simulador(NueveCuartosCiego(x0), 
+                         AgenteRacionalCiego(), 
+                         200)
+
+    print("Prueba del entorno con un agente racional estocastico")
+    entornos_o.simulador(NueveCuartosEstocastico(x0), 
+                         AgenteRacionalEstocastico(), 
+                         200)
+
+if __name__ == "__main__":
+    test()
+
+"""
+NOTAS:
+
+Agente Reactivo con Modelo vs Agente Aleatorio:
+    - El agente reactivo es más eficiente, limpia todo en 17 pasos en el peor caso y 
+        tiene un costo de 28 aproximadamente. 
+
+Agente Aleatorio:
+    - El agente aleatorio no termina de limpiar los 9 cuartos en tan solo 200 pasos,
+        debido a que tiene demasiadas opciones y las limitaciones de subir y bajar por un
+        lado exclusivamente, le dificulta completar la tarea sin seguir ningún orden.
+        Necesitaria aparoximadamente 230 pasos y un costo de 440 para poder limpiar todos
+        los cuartos.
+
+Agente Racional Ciego:
+    - A comparación con el Reactivo con Modelo, el agente racional ciego hace la misma 
+        cantidad de pasos y tiene el mismo costo que el agente reactivo con modelo en el 
+        peor caso, sin embargo, ese es el menor costo que puede tener, ya que al no conocer 
+        ningún estado, le toca hacer la ruta completa.
+
+Agente Racional Estocástico:
+    - El agente racional estocástico tiene un comportamiento similar al agente reactivo, la
+        diferencia es que al tener ciertos fallos, su costo y la cantidad de pasos requeridos
+        es mayor que el reactivo con modelo y el ciego. Sin embargo, termina la tarea dentro
+        los 200 pasos a diferencia del agente racional ciego. Este ocupa en promedio 25 pasos
+        y tiene un costo de 47 aproximadamente.
+"""