Contenidos contratados por la marca que se menciona

+info

Así funcionan los algoritmos que saben qué música te gusta antes que tú

Así funcionan los algoritmos que saben qué música te gusta antes que tú
5 comentarios Facebook Twitter Flipboard E-mail

En los últimos años los hábitos de consumo de música de la población están cambiando. Si antes preferíamos comprar discos en las tiendas o desde tiendas digitales, el nuevo negocio está en los servicios de streaming de música. Pero una forma de fidelizar a los usuarios y aumentar su satisfacción con el servicio es sugerirles nueva música de la que puedan disfrutar sin que tengan que mirar el extenso catálogo que poseen.

Este es el campo de aplicación de los sistemas de recomendación, que engloban distintas herramientas y técnicas que permiten establecer qué canciones pueden gustar a un usuario concreto de acuerdo a los gustos de otros usuarios o canciones similares. Para ello necesitan conocer primeramente las preferencias del usuario al que le van a sugerir contenido.

Cuando vamos a una tienda de discos, el dependiente nos preguntará qué tipo de música nos gusta, o algún grupo que nos encante, y dar de forma general su opinión de otros discos que nos puedan gustar. Las sugerencias de los dependientes acertarán en un alto porcentaje, pero debido a que no conoce nada más del cliente, fallará con relativa facilidad.

Sin embargo, los actuales servicios de música pueden recopilar la información de cómo utilizamos su web o aplicación para nuestro teléfono, qué artistas y discos hemos visto, cómo los hemos valorado, y qué canciones o artistas escuchamos más frecuentemente. Le da al sistema más información sobre nosotros o sobre los usuarios que escuchan las canciones.

En un sistema con cientos de miles o millones de usuarios, la cantidad de información almacenada es abrumadora, y su tratamiento entra dentro del terreno del big data o ingentes cantidades de información en bruto sin tratar. La clasificación de esta información en relevante para un usuario concreto la realizan distintos algoritmos cuya función en última instancia será la de predecir con el menor margen de error posible qué música nos gusta incluso antes de que nosotros mismos sepamos que nos gusta.

Taylor

De datos inconexos a la predicción de nuestros gustos

Los sistemas de recomendación cuentan con tres tipos de entidades básicas: los usuarios, los productos (los objetos que van a ser recomendados, como artistas o canciones determinadas) y las relaciones entre los usuarios y los productos.

Las relaciones suelen ser establecidas como un valor numérico, como el clásico sistema de puntaje de 1 a 5 estrellas, pero también de otras formas como por ejemplo si ha comprado un disco o una canción que ha visto, o el número de veces que ha mirado el álbum antes de comprarlo.

Con toda esta información los motores de recomendación tendrán que predecir qué productos deben ser recomendados a un usuario estableciendo un ránking ponderado de productos. Según el enfoque que se aplique a la hora de filtrar los productos que van a ser de interés al usuario de los que no son relevantes, los motores de recomendación pueden ser de varios tipos, pero habitualmente son sobre todo colaborativos (se buscan similitudes entre usuarios), basados en contenido (se buscan similitudes entre canciones), basados en la comunidad o redes de confianza (se sugieren canciones que gustan a los amigos del usuario), o bien híbridos.

En el terreno del streaming de música es más común utilizar motores de recomendación colaborativos. Si a un usuario le gusta cuatro artistas y a otro usuario le gusta tres de ellos, hay muchas posibilidades de que también le guste el cuarto y por lo tanto se le sugerirá. El acercamiento de los motores basados en contenido suelen dar mejores resultados en tiendas de venta online y servicios de streaming de vídeo.

cinco reproductores para hacer deporte

Organizando la información: entrando en materia

En este apartado ya entramos de lleno a lo que son los algoritmos que están detrás de los sistemas de recomendación y que son en última instancia los que deben aportar un valor numérico que cuantifique la similitud de dos productos o usuarios distintos que accedan al servicio de música. Estos algoritmos suelen tener una fuerte base matemática para establecer un modelo a aplicar a todos los usuarios y productos.

En los filtros colaborativos, un algoritmo básico para calcular la similitud entre dos usuarios consistiría en considerarlos a ambos como dos vectores con componentes positivas para los productos que califican favorablemente, y negativas para aquellas que lo hacen desfavorablemente. Una vez se tienen caracterizados los usuarios como vectores se puede calcular el coseno del ángulo entre ambos para estimar lo “cercanos” que están ambos en cuanto a gustos.

Una vez que se estima que el usuario A tiene gustos similares al usuario B, se escogen distintos productos de los calificados por el usuario B para recomendárselos al usuario A. Las componentes de cada vector no se limitan a la calificación de una canción, si no que también se pueden incluir las veces que ha escuchado una canción o las veces que ha vistado la página de un artista. A cada tipo de componente se le asignará un peso específico para que influyan más o menos en el cálculo de la similitud de dos usuarios.

Lo descrito anteriormente es una generalización de cómo funcionan los algoritmos de los sistemas de recomendación, y las formas concretas realmente sólo las conocen los servicios que las implementan. Hay gran cantidad de papers, documentos científicos de investigación, que los explican con más o menos profundidad, por lo que el avance en su precisión suele tener cierta componente de colaboración e intercambio de información entre grupos de investigación.

Hace unos pocos años se comenzó a aplicar un algoritmo matemático que lleva usándose de toda la vida para resolver problemas como el de los sistemas de recomendación que ha permitido perfeccionar los modelos matemáticos. Se trata de la “descomposición en valores singulares”, sacado directamente del álgebra lineal, y es una técnica de factorización de matrices. Las valoraciones de un usuario se introducirían en una matriz con celdas de valor desconocido, y aplicando diversas transformaciones, se va reduciendo hasta obtener una matriz sencilla a la que aplicar, en tiempo real, algoritmos de búsqueda de semejanzas entre usuarios.

La mayor parte de los cálculos de los algoritmos de recomendación se hacen de manera offline, o dicho de otro, por máquinas dedicadas exclusivamente a calcular el vector de los usuarios y la similitud entre ellos. Son algoritmos que tienen una fuerte componente de cálculos, por lo que sería inviable calcular el vector de millones de usuarios en el momento en que hay que mostrarle alguna sugerencia. Así pues, cuando un usuario acceder a una web y hay que sugerirle una nueva canción que le podría gustar, el sistema sólo tiene que coger el valor del usuario, seleccionar otro con un valor similar, y mostrar alguno de los productos que también le interesan.

Steam Music

Los sistemas de recomendación también tienen sus problemas

Las predicciones de los sistemas de recomendación, como bien sabemos los usuarios, pueden llegar a ser inexactos. No tienen en cuenta las excentricidades de los usuarios que pueden hacer que ciertos grupos, que en principio no nos deberían gustar según los datos generados por el algoritmo, nos gusten y mucho.

Los algoritmos también deben ser capaces de detectar a los usuarios que mienten deliberadamente cuando califican canciones, álbumes y artistas simplemente por que en un momento dado no tienen nada mejor que hacer o simplemente están enfadados con el mundo y les parece una buena forma de desestresarse en ese momento calificando canciones con una estrella. Quizás hayan empezado la semana con mal pie, y todo lo que puntúen posteriormente lo hagan a la baja, con un efecto de inercia o variabilidad temporal que se debería tener en cuenta.

Esto lleva también a un problema destacado en los sistemas de recomendación al que se denomina Arranque en frío, y que afecta a cualquier sistema de organización de información. Por ejemplo, cuando llega un nuevo grupo musical anteriormente desconocido con canciones totalmente nuevas (no son versiones de otras), el sistema no tiene información sobre a qué usuarios les puede gustar, por lo que se puede recurrir a concederlas una puntuación temporal basada en la categoría a la que pertenece el disco (rock, pop, etc). De esta forma se evita que desaparezcan del sistema de recomendación, pero tienen un alto índice de error que se corregirá en cuanto los usuarios comiencen a puntuarlas.

Por regla general los datos demográficos no suelen tener una influencia directa en la predicción de nuestros gustos. Esto incluye datos como nuestra edad, el país del que procedemos o en lo que trabajamos. Si tenemos cincuenta años, tendremos las mismas posibilidades de que nos gusten dos grupos de pop de moda que una veinteañera siempre y cuando el resto de los grupos que nos gustan a ambos también coincidan.

La aplicación de ciertos modelos y técnicas matemáticas son fundamentales, como la descomposición en valores singulares, que revolucionó hace unos años la forma en que catalogan los sistemas de recomendación a los usuarios y productos, para que las predicciones de los sistemas tengan el mínimo margen de error posible. Algo difícil por el momento puesto que hay muchos factores que no se tienen en cuenta, como las excentricidades de la gente real (¿cómo se pueden saber para introducirlas en los algoritmos?), y que asumen por lo general que los gustos de cada individuo son estáticos e inmutables en el tiempo (¿cómo saber que el usuario ha sufrido un cambio de gustos?).

Xbox Music Multiplataforma

Sistemas en constante evolución

Los sistemas de recomendación no son perfectos, pero poco a poco se van refinando de tal forma que cumplen con varios objetivos: hacer que el usuario descubra nueva música, que puede hacer que se implique más a la hora de valorar las canciones que escucha, y esto hace que mejore el sistema de recomendación de manera directa. Pero también mejoran nuestra satisfacción con el servicio de streaming o de venta de discos, con lo que habrá más probabilidades de que en el futuro gastemos nuestro dinero en él. De esta forma su objetivo es, en última instancia, saber qué es lo que nos gusta incluso antes de que nosotros mismos lo sepamos.

En Espacio Lumia:

Comentarios cerrados
Inicio