Detección de fraudes contra el seguro obligatorio SOAT por medio de modelos en Machine Learning
El proyecto se centró en abordar el desafío de detectar fraudes en el seguro obligatorio de accidentes de tránsito (SOAT) mediante el uso de técnicas de aprendizaje supervisado. La variable de respuesta la cual tomaba valores de fraude o no fraude presentaba un desequilibrio significativo, por lo cu...
Saved in:
Institution: | Escuela Colombiana de Ingeniería |
---|---|
Main Authors: | , , |
Format: | Trabajo de grado - Maestría |
Language: | Español |
Published: |
Escuela Colombian de Ingeniería
2023
|
Subjects: | |
Online Access: | https://repositorio.escuelaing.edu.co/handle/001/2722 |
Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
id |
oai:repositorio.escuelaing.edu.co:001-2722 |
---|---|
recordtype |
dspace |
spelling |
Julio Niño, Andrés Felipe Gómez Lamus, Ana María Villarraga Palomino, Jesus Antonio 2023-11-10T16:37:15Z 2023-11-10T16:37:15Z 2023 https://repositorio.escuelaing.edu.co/handle/001/2722 https://catalogo.escuelaing.edu.co/cgi-bin/koha/opac-detail.pl?biblionumber=23601 El proyecto se centró en abordar el desafío de detectar fraudes en el seguro obligatorio de accidentes de tránsito (SOAT) mediante el uso de técnicas de aprendizaje supervisado. La variable de respuesta la cual tomaba valores de fraude o no fraude presentaba un desequilibrio significativo, por lo cual se plantearon soluciones como ajuste de pesos y técnicas de remuetreo. Se implementaron tres modelos de aprendizaje supervisado: bosque aleatorio, regresión logística y XGBoost. La evaluación de los modelos se basó en diversas métricas, como precisión, recall, puntaje F1 y la matriz de confusión. Estas métricas proporcionaron información valiosa sobre la capacidad de los modelos para identificar correctamente los casos de fraude. Además, se utilizó la curva ROC para visualizar el rendimiento de los modelos y encontrar el equilibrio óptimo entre la tasa de verdaderos positivos y la tasa de falsos positivos. Por último, se planteó un tablero de control en Power BI, con el objetivo de brindar un panorama completa de los siniestros vehiculares, permitiéndonos identificar patrones, tendencias y posibles casos de fraude, así como monitorear el rendimiento del modelo por medio de la matriz de confusión. The project focused on addressing the challenge of detecting fraud in the Compulsory Traffic Accident Insurance (SOAT) using supervised learning techniques. The response variable, which took values of fraud or non-fraud, presented a significant imbalance, prompting solutions such as weight adjustment and resampling techniques. Three supervised learning models were implemented: Random Forest, Logistic Regression, and XGBoost. The evaluation of the models was based on various metrics, such as accuracy, recall, F1 score, and the confusion matrix. These metrics provided valuable information about the models' ability to correctly identify fraud cases. Additionally, the ROC curve was used to visualize the models' performance and find the optimal balance between true positive rate and false positive rate. Finally, a Power BI dashboard was created to provide a comprehensive overview of vehicle accidents, allowing us to identify patterns, trends, and potential fraud cases, as well as monitor the model's performance through the confusion matrix. Maestría Magíster en Ciencia de Datos 78 páginas application/pdf spa Escuela Colombian de Ingeniería Bogotá Maestría en Ciencia de Datos Detección de fraudes contra el seguro obligatorio SOAT por medio de modelos en Machine Learning Trabajo de grado - Maestría info:eu-repo/semantics/publishedVersion http://purl.org/coar/resource_type/c_bdcc Text info:eu-repo/semantics/masterThesis https://purl.org/redcol/resource_type/TM N/A info:eu-repo/semantics/closedAccess Aprendizaje supervisado (Aprendizaje automático) Fraude Seguro obligatorio de accidentes de tránsito (SOAT) Aprendizaje supervisado (Aprendizaje automático) Fraude Seguro obligatorio de accidentes de tránsito (SOAT) Supervised Learning (Machine Learning) Fraud Mandatory traffic accident insurance (SOAT) http://purl.org/coar/access_right/c_14cb http://purl.org/coar/version/c_970fb48d4fbd8a85 |
institution |
Escuela Colombiana de Ingeniería |
collection |
d_repositorio.escuelaing.edu.co-DSPACE |
title |
Detección de fraudes contra el seguro obligatorio SOAT por medio de modelos en Machine Learning |
spellingShingle |
Detección de fraudes contra el seguro obligatorio SOAT por medio de modelos en Machine Learning Villarraga Palomino, Jesus Antonio Julio Niño, Andrés Felipe Gómez Lamus, Ana María Villarraga Palomino, Jesus Antonio Aprendizaje supervisado (Aprendizaje automático) Fraude Seguro obligatorio de accidentes de tránsito (SOAT) Aprendizaje supervisado (Aprendizaje automático) Fraude Seguro obligatorio de accidentes de tránsito (SOAT) Supervised Learning (Machine Learning) Fraud Mandatory traffic accident insurance (SOAT) |
title_short |
Detección de fraudes contra el seguro obligatorio SOAT por medio de modelos en Machine Learning |
title_full |
Detección de fraudes contra el seguro obligatorio SOAT por medio de modelos en Machine Learning |
title_fullStr |
Detección de fraudes contra el seguro obligatorio SOAT por medio de modelos en Machine Learning |
title_full_unstemmed |
Detección de fraudes contra el seguro obligatorio SOAT por medio de modelos en Machine Learning |
title_sort |
detección de fraudes contra el seguro obligatorio soat por medio de modelos en machine learning |
author |
Villarraga Palomino, Jesus Antonio Julio Niño, Andrés Felipe Gómez Lamus, Ana María Villarraga Palomino, Jesus Antonio |
author_facet |
Villarraga Palomino, Jesus Antonio Julio Niño, Andrés Felipe Gómez Lamus, Ana María Villarraga Palomino, Jesus Antonio |
building |
Repositorio digital |
topic |
Aprendizaje supervisado (Aprendizaje automático) Fraude Seguro obligatorio de accidentes de tránsito (SOAT) Aprendizaje supervisado (Aprendizaje automático) Fraude Seguro obligatorio de accidentes de tránsito (SOAT) Supervised Learning (Machine Learning) Fraud Mandatory traffic accident insurance (SOAT) |
topic_facet |
Aprendizaje supervisado (Aprendizaje automático) Fraude Seguro obligatorio de accidentes de tránsito (SOAT) Aprendizaje supervisado (Aprendizaje automático) Fraude Seguro obligatorio de accidentes de tránsito (SOAT) Supervised Learning (Machine Learning) Fraud Mandatory traffic accident insurance (SOAT) |
publishDate |
2023 |
language |
Español |
publisher |
Escuela Colombian de Ingeniería |
physical |
78 páginas |
format |
Trabajo de grado - Maestría |
description |
El proyecto se centró en abordar el desafío de detectar fraudes en el seguro obligatorio de accidentes de tránsito (SOAT) mediante el uso de técnicas de aprendizaje supervisado. La variable de respuesta la cual tomaba valores de fraude o no fraude presentaba un desequilibrio significativo, por lo cual se plantearon soluciones como ajuste de pesos y técnicas de remuetreo. Se implementaron tres modelos de aprendizaje supervisado: bosque aleatorio, regresión logística y XGBoost.
La evaluación de los modelos se basó en diversas métricas, como precisión, recall, puntaje F1 y la matriz de confusión. Estas métricas proporcionaron información valiosa sobre la capacidad de los modelos para identificar correctamente los casos de fraude. Además, se utilizó la curva ROC para visualizar el rendimiento de los modelos y encontrar el equilibrio óptimo entre la tasa de verdaderos positivos y la tasa de falsos positivos.
Por último, se planteó un tablero de control en Power BI, con el objetivo de brindar un panorama completa de los siniestros vehiculares, permitiéndonos identificar patrones, tendencias y posibles casos de fraude, así como monitorear el rendimiento del modelo por medio de la matriz de confusión.
The project focused on addressing the challenge of detecting fraud in the Compulsory Traffic Accident Insurance (SOAT) using supervised learning techniques. The response variable, which took values of fraud or non-fraud, presented a significant imbalance, prompting solutions such as weight adjustment and resampling techniques. Three supervised learning models were implemented: Random Forest, Logistic Regression, and XGBoost.
The evaluation of the models was based on various metrics, such as accuracy, recall, F1 score, and the confusion matrix. These metrics provided valuable information about the models' ability to correctly identify fraud cases. Additionally, the ROC curve was used to visualize the models' performance and find the optimal balance between true positive rate and false positive rate.
Finally, a Power BI dashboard was created to provide a comprehensive overview of vehicle accidents, allowing us to identify patterns, trends, and potential fraud cases, as well as monitor the model's performance through the confusion matrix.
|
url |
https://repositorio.escuelaing.edu.co/handle/001/2722 |
url_str_mv |
https://repositorio.escuelaing.edu.co/handle/001/2722 |
_version_ |
1795843271831846912 |
score |
11.2563715 |