Leandro da Silva Carvalho

Título

UMA NOVA ABORDAGEM PARA A CRIAÇÃO DE PERFIS DE CLIENTES RENTÁVEIS UTILIZANDO MACHINE LEARNING EM AMBIENTE DE CLOUD COMPUTING

Orientador(es)

Nelson Francisco Favilla Ebecken

Resumo

Este trabalho tem por objetivo apresentar a criação de um novo modelo, denominado RFMP (Recency – Frequency – Monetary – Profitability), como alternativa ao tradicional modelo RFM. O propósito é avaliar se a inclusão de um novo parâmetro P (da palavra inglesa Profitability), associado à lucratividade dos consumidores, trará algum impacto na segmentação de uma base de clientes de um site de e-commerce. Adicionalmente, uma nova metodologia de classificação foi proposta – em substituição à forma tradicional utilizada – para aumentar o grau de confiança dos modelos gerados e melhorar a assertividade entre os clusters e seus respectivos conteúdos. Além disso, foi recomendada também a criação de três novos índices de mensuração para suprir a ausência de indicadores capazes de determinar a consistência e a qualidade dos clusters e modelos produzidos. Tudo isso foi realizado através de um estudo empírico, feito com o uso de uma plataforma de aprendizado de máquina a partir de um ambiente computacional em nuvem. Por fim, com os resultados obtidos, foi possível evidenciar que houve um impacto direto na formação dos clusters gerados, pois os grupos de clientes foram diferenciados não só pelo valor monetário, mas como também a partir das suas respectivas rentabilidades, o que permitiu constatar que nem sempre os clientes com os maiores valores monetários eram de fato os mais lucrativos.

 

Abstract

This work aims to present the creation of a new model, called RFMP (Recency – Frequency – Monetary – Profitability), as an alternative to the traditional RFM model to evaluate whether the inclusion of a new parameter P – associated with customer profitability – will have any impact on targeting a client database from an e-commerce site. Additionally, a new classification methodology was proposed to increase the confidence level of the generated models and improve the assertiveness between the clusters and their respective contents, instead of the traditional form used. Besides, it was also recommended to create three new measurement indices in order to overcome the lack of existing indicators capable of determining the consistency and quality of the clusters and models produced. All of this was accomplished through an empirical study, done using a machine learning platform from a cloud computing environment. Finally, with the results obtained, it was possible to demonstrate that there was a direct impact on the formation of the clusters produced, since the customer groups were differentiated not only by the monetary value, but also from their respective profitability, which allowed to determine that customers with the highest monetary values were not always the most profitable.

Print