¿Producir sistemas de machine learning libres? Un camino difícil, pero no imposible
Aceptada
Muchos de los conceptos que usamos para definir “libre” en el campo del software con resultados determinísticos resultan de difícil aplicación para resultados estocásticos. Enfrentamos problemas muy críticos para producir sistema de machine learning libre. Trataremos de explorar los caminos posibles e ilustrarlo desarrollando un ejemplo.
Tipo: Talk / Charla
Nivel: Medio
Disertantes: Enrique Chaparro
Biografiá del Disertante: Matemático (FCEN/UBA, UWaterloo, Royal Holloway/U of London) con poco de ejercicio de la profesión y mucho del oficio de obrero de seguridad de la información. Viejo (en todos los sentidos) usuario y activista del software libre y del acceso universal al conocimiento. Programador mediocre pero tozudo. Talibán de la seguridad y la privacidad. Consultor de los que te dicen qué hay que hacer, pero el cómo es tu problema. Aprendiz eterno. Militante por los derechos humanos en el campo donde estos se cruzan con las tecnologías digitales. Miembro, expresidente y ahora secretario, de Fundación Vía Libre.
Horario: 10:00 - 11:00 - 26/04/2025
Sala: Aula 1
Etiquetas/Tags: machine learning limitaciones modelos base
Descripción completa
Muchos de los conceptos que usamos para definir “libre” en el campo del software con resultados determinísticos (o que esperamos que lo sean) resultan de difícil aplicación para resultados estocásticos. El primer problema es el de definir qué sería un sistema de ML “libre”, agravado por la confusión alrededor de los sistemas con pesos publicados. Enfrentamos además problemas muy críticos para producir sistema de machine learning libre; ello incluye tanto cuestiones de disponibilidad y capacidad de replicar, cuanto la magnitud de los recursos involucrados para desarrollarlos. Esencialmente: ¿cómo convertimos cajas negras en juegos de bloques transparentes? ¿Es posible? Estamos ante nuevos desafíos acerca de cómo producir sistemas digitales de información: ¿podremos hacerlos, o nos limitaremos a operar en su periferia? Trataremos de explorar los caminos posibles, e ilustrarlo desarrollando un ejemplo. Nuestro sistema de ejemplo es DeepSeek R1 y su derivación en DeepCoder-14B. Se espera que el público asistente tenga una idea somera de cómo funciona un modelo de ‘reasoning’.