ACRÓNIMO DE PARÍS PARA SU OLIMPIADA 2024. Por JAVIER SOLIS NOYOLA
Exposición Cap. 4 (Cont)
1. BÚSQUEDA HEURÍSTICA CON MEMORIA ACOTADA FUNDAMENTOS DE INTELIGENCIA ARTIFICIAL SANTIAGO MEDINA
2. búsqueda recursiva del primero mejor (BRPM) Es un algoritmo sencillo recursivo que intenta imitar la operación de la búsqueda primero el mejor estándar, pero utilizando sólo un espacio lineal. Su estructura es similar a la búsqueda primero en profundidad recursiva. Mantiene la pista del f-valor del mejor camino alternativo disponible desde cualquier antepasado del nodo actual.
3. La recursividad vuelve atrás, la BRPM sustituye los f-valores de cada nodo a lo largo del camino con el mejor f-valor de su hijo. La BRPM recuerda el f-valor de la mejor hoja en el subárbol olvidado y por lo tanto puede decidir si merece la pena expandir el subárbol más tarde. La BRPM es algo más eficiente que A*PI, pero todavía sufre de la regeneración excesiva de nodos
4.
5. A*PI y BRPM sufren de utilizar muy poca memoria: A*PI conserva solo un número: el coste actual, y; BRPM mantiene solo una cantidad de información limitada en memoria que incluso si hubiera mas memoria disponible no la utilizaría.
6. Existen dos algoritmos: A*M (A*con memoria acotada) A*MS (A*M simplificada) A*MS avanza expandiendo la mejor hoja hasta que la memoria este llena. En este punto, no se puede añadir un nuevo nodo al árbol de búsqueda sin retirar uno viejo
7. Como en la BRPM, A*MS devuelve hacia atrás, a su padre, el valor del nodo olvidado. De este modo, el antepasado de un subárbol olvidado sabe la calidad del mejor camino en el subárbol A*MS bien podría ser el mejor algoritmo de uso general para encontrar soluciones óptimas, en particular cuando el espacio de estados es un grafo, los costos no son uniformes, y la generación de un nodo es costosa.
8. Aprender a buscar mejor ¿Podría un agente aprender a buscar mejor? El método se apoya sobre un concepto importante llamado el espacio de estados metanivel. Cada estado en un espacio de estados metanivel captura el estado interno (computacional) de un programa que busca en un espacio de estados a nivel de objeto.
9. El objetivo del aprendizaje es reducir al mínimo el coste total de resolver el problema. compensar el costo computacional y el coste del camino.