Se desea abordar la detección de fraudes en transacciones bancarias utilizando AWS Bedrock y Amazon SageMaker.
- Se les proporcionará un dataset (
credir_risk_reto.csv
) para generar descripciones relacionadas (description
) con el riesgo crediticio mediante modelos generativos de AWS Bedrock como GPT o Llama. - Clasificar las descripciones generadas con Bedrock, asignando etiquetas de riesgo (
target
): “bad risk” o “good risk”. - Entrenar un modelo de clasificación en Amazon SageMaker usando las etiquetas generadas, optimizando los hiperparámetros para obtener el mejor rendimiento.
- Se deberá desplegar el modelo en SageMaker para procesar nuevas transacciones y monitorear su desempeño.
Nota: El sistema debe ser eficiente, escalable y capaz de adaptarse a nueva data para mantener su precisión y efectividad.
-
Scripts funcionales para todo el flujo:
- a. Generación de descripciones con Bedrock
- b. Clasificación inicial con Bedrock
- c. Entrenamiento del modelo supervisado en SageMaker
- d. Despliegue del modelo y pruebas de inferencia
- e. El código debería estar alojado en un repositorio con instrucciones claras (deseable)
-
Informe corto:
- a. Descripción del flujo de trabajo
- b. Explicación de decisiones técnicas
- c. Métricas de desempeño del modelo
- d. Screenshots o logs de Bedrock y SageMaker
-
Enlace del endpoint desplegado en SageMaker o evidencia funcional (video o capturas de pantalla).
-
Script o instrucciones para realizar consultas al modelo.
-
Dataset modificado con las nuevas columnas (
description
ytarget
). -
Incluir un video presentando sus hallazgos y/o prototipo.
El dataset contiene 1000 entradas con 9 columnas categóricas/numéricas. Cada entrada representa a una persona como buen o mal riesgo crediticio de acuerdo con el set de características. Cada columna representa lo siguiente:
- Age: Edad de la persona
- Sex: Sexo de la persona
- Job:
- 0: unskilled and non-resident
- 1: unskilled and resident
- 2: skilled
- 3: highly skilled
- Housing: Tipo de alojamiento
- Saving accounts: Tipo de cuenta de ahorro
- Checking account: Tipo de cuenta corriente
- Credit amount: Monto de crédito
- Duration (meses): Tiempo de préstamo
- Purpose: Motivo del préstamo
Enviar un correo con la url de la solución del ejercicio en tu repo a [email protected] Usa el asunto Ejercicio Challenge AI.