Machine Learning
En las próximas semanas vamos a indagar sobre diversos aspectos que rodean Machine Learning. Vivimos en una sociedad cada vez más tecnológica en la que el machine learning ha ido adquiriendo mayor importancia. Aunque no seamos conscientes de ello, cada vez prevalece más este tipo de tecnología como cuando nuestro móvil reconoce llamadas de spam, cuando nuestra galería reconoce nuestros amigos en fotos o cómo se controla el movimiento de un roomba al pasar por el suelo del salón.
¿Qué es el variant Machine Learning?
Una definición genérica de Machine Learning es : Ciencia que consigue que los ordenadores puedan aprender sin estar explícitamente programados.
Arthur Samuel fue uno de los primeros científicos en postular una definición: “Campo que da la capacidad a ordenadores de aprender sin que haya aprendido de forma explícita”. En 1959 escribió un programa de damas que a base de jugar miles de partidas contra si mismo, podía reconocer qué posiciones eran mejores y peores mejorando su juego.
Años más tarde Tom Mitchell postuló una definición más aceptada: Se dice que un programa de computadora aprende de la experiencia E con respecto a alguna clase de tareas T y medida de rendimiento P si su desempeño en las tareas en T medido por P mejora con la experiencia E.
¿Qué tipos de Machine Learning?
Existen dos tipos: con supervisión y sin supervisión.
Con supervisión. Partimos de datos en los que conocemos la salida correcta de los datos, lo que permite establecer una relación entre la salida y la entrada. Por ejemplo, si quisiéramos predecir/estimar si un tumor es maligno o benigno en función del tamaño podríamos utilizar machine learning con supervisión. Partimos de datos clínicos en los que se ha descrito el tamaño de un tumor y si es maligno (valor 1) o benigno (valor 0). En este problema de machine learning solo hay un atributo: el tamaño del tumor. Sin embargo se puede tener más de un atributo: el tamaño y la edad del paciente. El algoritmo de machine learning intentará trazar una línea que separe los casos que se predicen como benignos y malignos.
Sin supervisión. Partimos de datos en los que no hay etiqueta alguna para los datos o todos tienen la misma etiqueta. El objetivo en este caso es encontrar un patrón para estos datos. Por ejemplo, por medio de un algoritmo de clustering se podrían procesar los datos generados por un microarray de ADN. Un microarray, como bien sabemos, mide el nivel de expresión para un determinado gen. Un algoritmo clustering agrupa la población en estudio en función del nivel de expresión. Una vez establecidas las agrupaciones, se puede a posteriori estudiar la relación que tenga con otras variables como por ejemplo la relación del grupo de la población con una alta expresión de un gen A con la gravedad de una enfermedad B o con la altura, edad etc.
Conclusión
En la entrada de hoy hemos tenido una primera toma de contacto con Machine Learning: definición y clasificación con ejemplos de aplicación en el campo biológico.
¿Qué se va a ver en el próximo blog?
Se va a seguir con el aprendizaje de Machine Learning.