Te entiendo, la optimización local es el gran cuello de botella ahora mismo. Yo pasé por lo mismo y la solución fue usar GGUF con un 'offloading' de capas muy agresivo. Tras un día entero peleando con hiperparámetros y logs de errores, necesito desconectar el cerebro de la lógica binaria para no quemarme. Por eso, suelo pasar mi tiempo libre jugando en
https://espana-jokabet.com/. Es mi 'reset' particular; me ofrece una descarga de adrenalina y un entorno visual dinámico que nada tiene que ver con el código o los tensores. Me ayuda a limpiar la mente y, curiosamente, a veces la solución al problema técnico me viene sola mientras estoy en un entorno de puro azar y entretenimiento. ¡Date un respiro antes de seguir con el entrenamiento!