Por Fabiola Montero, profesora de la Facultad de Informática, Electrónica y Comunicación de la Universidad de Panamá.
Actualmente, las personas, organizaciones y diversos dispositivos están compartiendo datos de manera constante y continúa debido a procesos de digitalización, lo que ha generado grandes volúmenes de datos. En este sentido, ha surgido la Ciencia de Datos, como una respuesta a la necesidad de utilizar estos datos para producir conocimiento que facilite la toma de decisiones en diversos ámbitos.
La Ciencia de Datos se basa en el estudio de datos e implica la aplicación de diversas disciplinas como Informática, Matemática, Estadística, Inteligencia Artificial, entre otras y que sigue una secuencia de procesos que inicia con la recopilación de datos, luego estos datos se preparan para su posterior análisis, visualización y modelado con el objetivo de extraer información significativa que permita comprender problemas complejos de una manera más sencilla, que si se realiza con un análisis estadístico tradicional de datos.
En proyectos de Ciencia de Datos, uno de los métodos más empleados y que está evolucionando rápidamente al ritmo en que crece la necesidad de que las máquinas tomen decisiones de forma autónoma, más que todo en aquellas actividades que pueden ser repetitivas o en aquellas que exijan atención constante de un humano, es el Aprendizaje Automático, también conocido como Aprendizaje de Máquina o Machine Learning, es una tecnología de Inteligencia Artificial que por medio de algoritmos entrena a una computadora para que tenga la capacidad que encontrar patrones en los datos y analizarlos, tal como lo hacemos los humanos.
El proceso de Aprendizaje Automático involucra varias etapas que implica el uso de estadísticas aplicadas al desarrollo de algoritmos, la utilización de herramientas que permiten analizar los datos recolectados, prepararlos, crear modelos que se ajusten a realidades funcionales y que son comprobados mediante una evaluación y posteriormente puestos en producción.
El Aprendizaje Automático utiliza diferentes familias de algoritmos supervisados y no supervisados. Entre los principales supervisados se encuentran algoritmos de predicción como regresión lineal (simple o múltiple) y serie de tiempo; algoritmos de clasificación como árboles de decisión, bosques aleatorios, redes neuronales, algoritmo de k vecinos más cercanos o KNN, entre otros. Y entre los no supervisados se ubican algoritmos de agrupación como Kmeans y algoritmos de asociación como Apriori, entre otros.
Entre las aplicaciones del Aprendizaje Automático en la Ciencia de Datos que han implementado diferentes organizaciones se destacan las siguientes: algoritmos de predicción y de clasificación que generan recomendaciones personalizadas de series o películas de acuerdo con los gustos de los usuarios, tal como lo ha implementado Netflix y de la misma manera, Amazon que analiza las compras realizadas por sus clientes para recomendarles artículos que han comprado otros clientes en selecciones y gastos similares, como estrategia para aumentar las ventas. Otro ejemplo es, Spotify que lo ha implementado para ayudar a sus oyentes a descubrir contenido generando listas de reproducciones basadas en sus preferencias.
Adicionalmente, el Aprendizaje Automático se ha aplicado en motores de búsqueda como Google y en redes sociales, para arrojar resultados más acordes con los intereses del usuario y también, se ha aprovechado en el campo de la medicina para la detección temprana de enfermedades terminales como el cáncer, lo que está aumentando las posibilidades de cura.
El Aprendizaje Automático o Machine Learning es una herramienta poderosa que ha impactado significativamente el desarrollo de la Ciencia de Datos, puesto que ha hecho posible el análisis de enormes cantidades de datos de forma más rápida y eficaz, identificando patrones y tendencias, que han permitido a las empresas y organizaciones hacer predicciones más precisas que influyen en la toma de decisiones acertadas, lo que se ha traducido en una reducción de costos y en mejorar la eficiencia en diversos campos. Razón por la cual, el Aprendizaje Automático en la Ciencia de Datos promete una evolución constante y mayores aplicaciones en los próximos años, por lo que su impacto seguirá creciendo en el futuro.
Comments