Buscar
  • Streamline

¿Cómo se benefician del Machine Learning el día de hoy?

Actualizado: 14 de ene de 2019

Machine Learning, conceptos básicos y áreas donde la inteligencia artificial está teniendo un impacto significativo.

En esta publicación, revisaremos los conceptos básicos y los ejemplos del Machine Learning (ML) y exploraremos algunas de las áreas que quizás no conozca en las que ML tiene un impacto significativo.

Machine Learning - los fundamentos

"Evolucionado a partir del estudio del reconocimiento de patrones y la teoría del aprendizaje computacional en inteligencia artificial, el Machine Learning explora el estudio y la construcción de algoritmos que pueden aprender y hacer predicciones sobre datos". (Wikipedia)

El objetivo de ML es bastante simple: enseñar a los sistemas informáticos a realizar una tarea. El sistema informático gana experiencia al observar patrones de ejemplos en lugar de ser programado con instrucciones o reglas explícitas.

Hay dos tipos de aprendizaje automático: supervisado y no supervisado. En ML supervisada, le da a la computadora un conjunto de ejemplos con las etiquetas o respuestas correspondientes. Estos son los datos de entrenamiento. De estos, aprende a predecir nuevas respuestas basadas en los patrones.

En el ML sin supervisión, usted proporciona los datos sin respuestas ni etiquetas. El algoritmo dirige a la computadora para buscar estructuras o patrones interesantes. El ML sin supervisión es muy útil cuando no estás seguro de lo que buscas; Es una herramienta de descubrimiento. El siguiente gráfico ilustra la distinción.

El aprendizaje automático es matemático, y gran parte de lo que obtiene el crédito por el desempeño de ML son sus algoritmos. Pero un modelo de aprendizaje automático es tan bueno como los datos utilizados para entrenarlo. Agregar más datos de entrenamiento es casi siempre mejor que ajustar los algoritmos.

Lo que sigue son tres ejemplos de aprendizaje automático en la vida cotidiana.

Name That Tune

Name That Tune fue un programa de juegos, una variación del cual se emitió en la televisión estadounidense desde 1952 hasta 1981. Enfrentó a dos participantes para probar su conocimiento de las canciones interpretadas por una orquesta en vivo. En el momento en que finalizó la edición de Name That Tune, el ganador ganó $ 100,000.


Bueno, tenemos una versión actualizada de Name That Tune y se llama Beat Shazam (sí, el mismo Shazam que probablemente esté en tu teléfono y que Apple haya adquirido recientemente). Los equipos de concursantes juegan entre sí y el equipo ganador juega contra ... un algoritmo de aprendizaje automático que puede nombrar virtualmente cualquier canción en segundos, o menos. ¿El premio? Un millón de dólares.

Es posible "vencer a Shazam". Pero no es fácil. El primer equipo que lo hizo pasó tres meses abarrotando. Shazam nunca rompe a sudar.

Hay un blog completo dedicado al back-end de Shazam. Es una inmersión profunda en las complejidades y complejidades del aprendizaje automático con publicaciones como "Optimización de la estructura de back-end de Shazam a través de algoritmos genéticos".

El algoritmo genético es un método para resolver problemas de optimización restringidos y no restringidos que se basa en la selección natural, el proceso que impulsa la evolución biológica. El algoritmo genético modifica repetidamente una población de soluciones individuales.


Shazam también usa ML para analizar los datos de las redes sociales que recopila para rastrear el sentimiento del usuario y evaluar el rendimiento del producto, como cuando la aplicación falla.


¿Qué quieres ver esta noche?


Si ves Netflix, el aprendizaje automático ofrece recomendaciones cada vez que inicias sesión. Cuando se lanzó Netflix, los suscriptores completaron encuestas sobre los gustos y disgustos de sus películas. Resulta que muchos de nosotros mentimos. Decimos que nos gustan las películas y documentales extranjeros. Pero nuestro comportamiento visual nos cuenta una historia diferente.


Una vez que Netflix lanzó su servicio de transmisión, tenía una tonelada de datos que podía usar para entrenar algoritmos de aprendizaje automático para su motor de recomendaciones. Netflix sabe lo que vio, o abandonó, lo que buscó, cómo lo calificó, la hora y la fecha que vio y el dispositivo utilizado.

En un momento, Netflix empleó a 800 ingenieros en el grupo responsable de crear y ajustar los algoritmos que ahora controlan su motor de recomendaciones.


Matemáticas Versus Malware

Casi todos tienen algún tipo de protección contra virus y malware en su computadora. Si no, suelen lamentarlo.

El Informe de seguridad de Symantec de 2015 señaló que había 431 millones de formas únicas de malware. En comparación con los 300 millones del año anterior, otros 100 millones más que el año anterior. Eso es alrededor de mil millones de piezas de malware en tres años. ¿Qué te parece ahora? Es seguro decir que, es más.

La protección AV / malware tradicional está basada en firmas. Es necesario escribir una firma para cada pieza de malware, de modo que un motor de exploración de firmas pueda comparar una amenaza con la base de datos de firmas. Imagina una base de datos DAT de mil millones de firmas. El escaneo que exigiría un enorme rendimiento de la red afectaría a una organización. Esa es una de las razones por las que los principales proveedores de AV no tienen archivos DAT tan grandes. Están más en el rango de millones de dos dígitos. Pero eso deja una gran cantidad de malware no contabilizado.

Una empresa llamada Cylance toma un enfoque diferente. En lugar de firmas de virus, utiliza un algoritmo de aprendizaje automático para identificar amenazas potenciales. Cylance entrena su algoritmo con 250 millones de archivos buenos y 250 millones de archivos malos. El algoritmo aprende a atrapar amenazas basadas en características.

Cylance impidió que se ejecutara la amenaza de malware de día cero RTF (CVE-2014-1761) de Microsoft Word antes de que se observara en la naturaleza. Su software descubrió y puso en cuarentena esta amenaza en marzo de 2014, a pesar de que no apareció en malwr.com hasta abril, e incluso en ese momento, solo 4 de los 51 motores antivirus lo detectaron.


De la investigación esotérica a la aplicación comercial

Gran parte del conocimiento sobre aprendizaje automático que impulsa a Beat Shazam, Netflix y Cylance comenzó en el mundo académico y en instituciones privadas de investigación. Con el tiempo, la investigación se filtra a las aplicaciones comerciales.

Antes, la I + D corporativa se centraba casi exclusivamente en mejorar los productos o la metodología de una empresa. Pero ahora más empresas están invirtiendo en investigación original.

Las empresas están hablando y publicando sus investigaciones. Y hay muchas herramientas de código abierto, herramientas que empresas como Google dedicaron a la construcción de muchas horas por persona, que se pueden descargar y utilizar de forma gratuita.

Es un momento emocionante en la investigación tecnológica. Se remonta a los días de los Bell Labs originales, cuyos investigadores cuentan con muchos avances científicos, incluido el desarrollo de la radioastronomía, el transistor, el láser y el sistema operativo UNIX. Ocho premios Nobel han sido otorgados por el trabajo completado en los Laboratorios Bell.


0 vistas

Streamline