El surgimiento de la ciencia de datos como un área de estudio y su aplicación práctica ha dado lugar a tecnologías como el deep learning, el procesamiento de lenguaje natural y la visión artificial. 

Más aún, la ciencia de datos permitió la aparición del aprendizaje automático, o Machine Learning, como una forma de enfocar la extracción de datos hacia el análisis predictivo y la Inteligencia Artificial, ramas del sector tecnológico que están en constante crecimiento y que han cambiado la manera en que aprendemos, trabajamos y socializamos. 

Si consideramos que el aprendizaje automático es una disciplina indispensable para crear sistemas capaces de identificar patrones en los datos, la ciencia de datos es lo que permite determinar estos patrones a través de procesos que utilizan métodos analíticos y sistemas tecnológicos para hacer predicciones. Algunos ejemplos son las plataformas de streaming Netflix o Spotify, o los asistentes virtuales de Google, Apple y Amazon.

En definitiva, los conocimientos que obtenemos a partir de los datos han demostrado mejorar el rendimiento empresarial, lo que nos ha llevado a cuestionarnos, ¿cuál es el futuro de las tecnologías avanzadas y qué tendencias están marcando un impacto en la industria de los datos? A continuación te mencionamos las cinco mayores tendencias en la ciencia de datos que se espera tengan un gran impacto en el 2023

#1 - Small Data y Tiny Machine Learning

La cantidad de datos digitales que se generan todos los días en el mundo digital es enorme; su rápido crecimiento, así como su recopilación y análisis se conoce como Big Data. Sin embargo, no sólo el volumen de datos generados ocupa espacio en la red, sino los algoritmos de Machine Learning que utilizamos para procesarlos. Por ejemplo, GPT-4, el sistema más grande y complicado capaz de modelar el lenguaje humano, se compone de alrededor de 175 billones de parámetros. 

Estos números no afectan la capacidad si se trabaja con sistemas basados en la nube con banda ancha ilimitada. Pero eso no cubre todos los casos donde el aprendizaje automático es capaz de agregar valor. 

El concepto de ‘datos pequeños’ o Small Data surge como un paradigma para facilitar el análisis cognitivo de los datos más vitales en situaciones donde el tiempo, el ancho de banda o el ahorro de energía son esenciales. 

Esto se relaciona estrechamente con el concepto de edge computing. Los automóviles autónomos, por ejemplo, no pueden fiarse de su capacidad de enviar y recibir datos desde un servidor centralizado cuando tienen poco tiempo para evitar una colisión con otro vehículo. El Tiny Machine Learning o ‘aprendizaje automático pequeño’ se refiere a algoritmos de aprendizaje automático diseñados para ocupar el menor espacio posible para que puedan ejecutarse en hardware de baja potencia, cerca de donde ocurre la acción. 

A partir del 2023 lo veremos aparecer en un número creciente de sistemas integrados—desde dispositivos portátiles, hasta electrodomésticos, automóviles, equipos industriales, maquinaria agrícola, entre muchos otros, haciéndolos más inteligentes y útiles. 

#2 - Data-Driven Customer Experience

El Data-Driven Customer Experience, o experiencia de cliente enfocada en datos, se trata de la labor de las empresas de tomar nuestros datos y utilizarlos para proporcionar experiencias cada vez más agradables y de gran valor. Esto conlleva a reducir los problemas en el comercio electrónico, y la posibilidad de crear interfaces más amigables y fáciles de usar

Dado que nuestras interacciones con las empresas son cada vez más de manera digital, cada aspecto de nuestro compromiso es medible y puede analizarse para obtener información sobre cómo pueden mejorarse los procesos. Esta tendencia también ha impulsado la creación de mayores niveles de personalización de los bienes y servicios que nos ofrecen las empresas. 

Si bien la pandemia desencadenó una ola de inversión e innovación en tecnología para ventas en línea, encontrar nuevos métodos y estrategias para aprovechar los datos de los clientes para ofrecer un mejor servicio o nuevas experiencias será, sin lugar a dudas, un enfoque para muchas empresas y startups este 2023. 

#3 - DeepFakes e Inteligencia Artificial Generativa

Este año muchos de nosotros caímos en el engaño de que artistas como Tom Cruise, Keanu Reeves o Kristen Stewart habían comenzado a publicar videos en TikTok. En realidad, lo que sucedió fue que los videos deepfake se volvieron virales. ¿Y qué es esto del ‘deepfake’?

Se conoce como deepfake al desarrollo de imágenes sintéticas en las que el software analiza el material de origen y extrae parte de él, para luego insertarlo y adaptarlo en otro video. Los llamados intercambios de caras o deep video portraits son la forma más común de este tipo de contenido. 

El nombre viene del Deep Learning, o aprendizaje profundo, el cual es una corriente de la Inteligencia Artificial. En estos casos, este aprendizaje con inteligencia artificial se utiliza con la intención de crear contenido falso. De hecho, a la tecnología que está detrás de esto se le conoce como IA generativa, ya que tiene como objetivo generar o crear algo que no existe en realidad

La IA generativa se ha incrustado rápidamente en la industria de las artes y el entretenimiento. Recordemos a Robert DeNiro en la película El irlandés, o a Mark Hamill en la serie de televisión The Mandalorian. Es por esto que muchos expertos esperan ver estallar esta tendencia en esta y muchas otras industrias el próximo año; especialmente porque se considera que esta tecnología tiene un gran potencial cuando se trata de crear datos sintéticos para el entrenamiento de otros algoritmos de aprendizaje automático. Podremos crear rostros sintéticos de personas que nunca han existido para entrenar algoritmos de reconocimiento facial, evitando las preocupaciones de privacidad relacionadas con el uso de rostros de personas reales. 

#4 - Convergencia 

Si consideramos a la Inteligencia Artificial, el internet de las cosas (IoT), la computación en nube y las redes de alta velocidad como las piedras angulares de la transformación digital, entonces los datos funcionan como el combustible para crear resultados. Todas estas tecnologías funcionan y son capaces de ofrecer resultados por separado; pero, cuando operan en conjunto, permiten que los dispositivos actúen de forma inteligente, interactuando entre sí, sin necesidad de que exista interferencia humana. 

Esta tendencia ha impulsado una ola de automatización y la creación de hogares, fábricas y ciudades inteligentes. El 5G y las redes ultrarrápidas no sólo logran que los datos se transmitan a velocidades más altas, sino que permiten que nuevos tipos de transferencias de datos se conviertan en una realidad cotidiana, y que los algoritmos de IA creados por científicos de datos sean una pieza clave para enrutar el tráfico y garantizar velocidades de transferencia óptimas. En 2023 se espera una cantidad cada vez mayor de estas tecnologías transformadoras.

#5 - Auto Machine Learning

El ‘aprendizaje automático automatizado’, por su nombre en español, es una tendencia que está impulsando cada vez más la democratización de los datos. Los desarrolladores de soluciones AutoML tienen como objetivo crear herramientas y plataformas que puedan ser utilizadas por cualquier persona para crear sus propias aplicaciones de Machine Learning

Particularmente, está dirigido a expertos en la materia cuya experiencia y conocimientos les hace ideales para desarrollar soluciones a los problemas más apremiantes en sus áreas de estudio, pero que a menudo carecen del conocimiento de codificación necesario para aplicar la Inteligencia Artificial a esos problemas. 

Un científico de datos suele ocupar gran parte de su tiempo de trabajo en la limpieza y preparación de datos—es decir, tareas que requieren habilidades de datos pero que normalmente son repetitivas y superficiales. En su forma más básica, el AutoML implica automatizar esas tareas de modo que se pueda emplear ese tiempo en construir modelos, así como crear algoritmos y redes neuronales

Además, otro de los objetivos es que dentro de muy poco cualquiera que necesite resolver un problema, o bien que quiera probar una aplicación, pueda aplicar el aprendizaje automático a través de interfaces simples y fáciles de usar que mantienen el funcionamiento interno del ML fuera de la vista, lo que ayuda a que la persona se centre en las soluciones. Por ello, es probable que el 2023 sea un año que nos vea avanzar hacia esta realidad cotidiana. 

Fuentes: “The 5 Biggest Data Science Trends in 2022”, Forbes.