Detección de fraudes contra el seguro obligatorio SOAT por medio de modelos en Machine Learning

El proyecto se centró en abordar el desafío de detectar fraudes en el seguro obligatorio de accidentes de tránsito (SOAT) mediante el uso de técnicas de aprendizaje supervisado. La variable de respuesta la cual tomaba valores de fraude o no fraude presentaba un desequilibrio significativo, por lo cu...

Full description

Saved in:
Bibliographic Details
Institution:Escuela Colombiana de Ingeniería
Main Authors: Villarraga Palomino, Jesus Antonio, Julio Niño, Andrés Felipe, Gómez Lamus, Ana María
Format: Trabajo de grado - Maestría
Language:Español
Published: Escuela Colombian de Ingeniería 2023
Subjects:
Online Access:https://repositorio.escuelaing.edu.co/handle/001/2722
Tags: Add Tag
No Tags, Be the first to tag this record!
id oai:repositorio.escuelaing.edu.co:001-2722
recordtype dspace
spelling Julio Niño, Andrés Felipe
Gómez Lamus, Ana María
Villarraga Palomino, Jesus Antonio
2023-11-10T16:37:15Z
2023-11-10T16:37:15Z
2023
https://repositorio.escuelaing.edu.co/handle/001/2722
https://catalogo.escuelaing.edu.co/cgi-bin/koha/opac-detail.pl?biblionumber=23601
El proyecto se centró en abordar el desafío de detectar fraudes en el seguro obligatorio de accidentes de tránsito (SOAT) mediante el uso de técnicas de aprendizaje supervisado. La variable de respuesta la cual tomaba valores de fraude o no fraude presentaba un desequilibrio significativo, por lo cual se plantearon soluciones como ajuste de pesos y técnicas de remuetreo. Se implementaron tres modelos de aprendizaje supervisado: bosque aleatorio, regresión logística y XGBoost. La evaluación de los modelos se basó en diversas métricas, como precisión, recall, puntaje F1 y la matriz de confusión. Estas métricas proporcionaron información valiosa sobre la capacidad de los modelos para identificar correctamente los casos de fraude. Además, se utilizó la curva ROC para visualizar el rendimiento de los modelos y encontrar el equilibrio óptimo entre la tasa de verdaderos positivos y la tasa de falsos positivos. Por último, se planteó un tablero de control en Power BI, con el objetivo de brindar un panorama completa de los siniestros vehiculares, permitiéndonos identificar patrones, tendencias y posibles casos de fraude, así como monitorear el rendimiento del modelo por medio de la matriz de confusión.
The project focused on addressing the challenge of detecting fraud in the Compulsory Traffic Accident Insurance (SOAT) using supervised learning techniques. The response variable, which took values of fraud or non-fraud, presented a significant imbalance, prompting solutions such as weight adjustment and resampling techniques. Three supervised learning models were implemented: Random Forest, Logistic Regression, and XGBoost. The evaluation of the models was based on various metrics, such as accuracy, recall, F1 score, and the confusion matrix. These metrics provided valuable information about the models' ability to correctly identify fraud cases. Additionally, the ROC curve was used to visualize the models' performance and find the optimal balance between true positive rate and false positive rate. Finally, a Power BI dashboard was created to provide a comprehensive overview of vehicle accidents, allowing us to identify patterns, trends, and potential fraud cases, as well as monitor the model's performance through the confusion matrix.
Maestría
Magíster en Ciencia de Datos
78 páginas
application/pdf
spa
Escuela Colombian de Ingeniería
Bogotá
Maestría en Ciencia de Datos
Detección de fraudes contra el seguro obligatorio SOAT por medio de modelos en Machine Learning
Trabajo de grado - Maestría
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/resource_type/c_bdcc
Text
info:eu-repo/semantics/masterThesis
https://purl.org/redcol/resource_type/TM
N/A
info:eu-repo/semantics/closedAccess
Aprendizaje supervisado (Aprendizaje automático)
Fraude
Seguro obligatorio de accidentes de tránsito (SOAT)
Aprendizaje supervisado (Aprendizaje automático)
Fraude
Seguro obligatorio de accidentes de tránsito (SOAT)
Supervised Learning (Machine Learning)
Fraud
Mandatory traffic accident insurance (SOAT)
http://purl.org/coar/access_right/c_14cb
http://purl.org/coar/version/c_970fb48d4fbd8a85
institution Escuela Colombiana de Ingeniería
collection d_repositorio.escuelaing.edu.co-DSPACE
title Detección de fraudes contra el seguro obligatorio SOAT por medio de modelos en Machine Learning
spellingShingle Detección de fraudes contra el seguro obligatorio SOAT por medio de modelos en Machine Learning
Villarraga Palomino, Jesus Antonio
Julio Niño, Andrés Felipe
Gómez Lamus, Ana María
Villarraga Palomino, Jesus Antonio
Aprendizaje supervisado (Aprendizaje automático)
Fraude
Seguro obligatorio de accidentes de tránsito (SOAT)
Aprendizaje supervisado (Aprendizaje automático)
Fraude
Seguro obligatorio de accidentes de tránsito (SOAT)
Supervised Learning (Machine Learning)
Fraud
Mandatory traffic accident insurance (SOAT)
title_short Detección de fraudes contra el seguro obligatorio SOAT por medio de modelos en Machine Learning
title_full Detección de fraudes contra el seguro obligatorio SOAT por medio de modelos en Machine Learning
title_fullStr Detección de fraudes contra el seguro obligatorio SOAT por medio de modelos en Machine Learning
title_full_unstemmed Detección de fraudes contra el seguro obligatorio SOAT por medio de modelos en Machine Learning
title_sort detección de fraudes contra el seguro obligatorio soat por medio de modelos en machine learning
author Villarraga Palomino, Jesus Antonio
Julio Niño, Andrés Felipe
Gómez Lamus, Ana María
Villarraga Palomino, Jesus Antonio
author_facet Villarraga Palomino, Jesus Antonio
Julio Niño, Andrés Felipe
Gómez Lamus, Ana María
Villarraga Palomino, Jesus Antonio
building Repositorio digital
topic Aprendizaje supervisado (Aprendizaje automático)
Fraude
Seguro obligatorio de accidentes de tránsito (SOAT)
Aprendizaje supervisado (Aprendizaje automático)
Fraude
Seguro obligatorio de accidentes de tránsito (SOAT)
Supervised Learning (Machine Learning)
Fraud
Mandatory traffic accident insurance (SOAT)
topic_facet Aprendizaje supervisado (Aprendizaje automático)
Fraude
Seguro obligatorio de accidentes de tránsito (SOAT)
Aprendizaje supervisado (Aprendizaje automático)
Fraude
Seguro obligatorio de accidentes de tránsito (SOAT)
Supervised Learning (Machine Learning)
Fraud
Mandatory traffic accident insurance (SOAT)
publishDate 2023
language Español
publisher Escuela Colombian de Ingeniería
physical 78 páginas
format Trabajo de grado - Maestría
description El proyecto se centró en abordar el desafío de detectar fraudes en el seguro obligatorio de accidentes de tránsito (SOAT) mediante el uso de técnicas de aprendizaje supervisado. La variable de respuesta la cual tomaba valores de fraude o no fraude presentaba un desequilibrio significativo, por lo cual se plantearon soluciones como ajuste de pesos y técnicas de remuetreo. Se implementaron tres modelos de aprendizaje supervisado: bosque aleatorio, regresión logística y XGBoost. La evaluación de los modelos se basó en diversas métricas, como precisión, recall, puntaje F1 y la matriz de confusión. Estas métricas proporcionaron información valiosa sobre la capacidad de los modelos para identificar correctamente los casos de fraude. Además, se utilizó la curva ROC para visualizar el rendimiento de los modelos y encontrar el equilibrio óptimo entre la tasa de verdaderos positivos y la tasa de falsos positivos. Por último, se planteó un tablero de control en Power BI, con el objetivo de brindar un panorama completa de los siniestros vehiculares, permitiéndonos identificar patrones, tendencias y posibles casos de fraude, así como monitorear el rendimiento del modelo por medio de la matriz de confusión. The project focused on addressing the challenge of detecting fraud in the Compulsory Traffic Accident Insurance (SOAT) using supervised learning techniques. The response variable, which took values of fraud or non-fraud, presented a significant imbalance, prompting solutions such as weight adjustment and resampling techniques. Three supervised learning models were implemented: Random Forest, Logistic Regression, and XGBoost. The evaluation of the models was based on various metrics, such as accuracy, recall, F1 score, and the confusion matrix. These metrics provided valuable information about the models' ability to correctly identify fraud cases. Additionally, the ROC curve was used to visualize the models' performance and find the optimal balance between true positive rate and false positive rate. Finally, a Power BI dashboard was created to provide a comprehensive overview of vehicle accidents, allowing us to identify patterns, trends, and potential fraud cases, as well as monitor the model's performance through the confusion matrix.
url https://repositorio.escuelaing.edu.co/handle/001/2722
url_str_mv https://repositorio.escuelaing.edu.co/handle/001/2722
_version_ 1795843271831846912
score 11.2563715