Propuesta de Proyectos para la carrera de Ingeniería Comercial Facultad de Ciencias Económicas y Empresariales UAGRM

Se presenta la lista de 10 proyectos de investigación aplicada (TRL 6–8) para la carrera de Ingeniería Comercial de la UAGRM, siguiendo el mismo formato riguroso que en los casos anteriores.

🎯 Enfoque prioritario para Ingeniería Comercial

· Predicción de demanda de productos a nivel de SKU y tienda con series temporales y ML.
· Segmentación de clientes B2B y B2C para campañas de marketing personalizadas.
· Optimización de precios y promociones con aprendizaje por refuerzo.
· Detección de abandono de carrito en e-commerce con modelos de clasificación.
· Asignación óptima de fuerza de ventas (rutas, territorios) usando optimización y RL.
· Análisis de sentimiento de marca y competencia en redes sociales.

1. DemandaSKU – Predicción de demanda diaria a nivel de producto (SKU) en tiendas de conveniencia usando LightGBM con características de calendario y clima

Problema científico
Las tiendas de conveniencia (ej. Tigo Money, farmacias) tienen alta rotación de productos pero baja precisión en pronósticos por SKU, lo que genera roturas de stock o excesos de inventario.

Hipótesis principal
Un modelo LightGBM (gradient boosting) entrenado con 2 años de ventas diarias de 5.000 SKUs, más características de calendario (día de semana, feriados, fin de mes) y clima (lluvia, temperatura), reduce el error sMAPE en un 30% respecto a un modelo de media móvil para horizontes de 1 día.

Modelo de Red Neuronal Propuesto
LightGBM con búsqueda de hiperparámetros (Optuna). Características: lags (ventas días anteriores), media móvil 7 días, precio, promoción, temperatura, lluvia binaria, etc.

Base teórica
La demanda de productos de consumo masivo tiene estacionalidad semanal y sensibilidad climática. Los modelos de árboles con boosting superan a métodos tradicionales (Januschowski et al., 2020, International Journal of Forecasting).

Diseño Metodológico
Datos de una cadena de tiendas local (anonimizados). Entrenamiento con 80% de SKUs y período, validación temporal. Métricas: sMAPE, MAE.

Viabilidad Técnica (TRL)
TRL 6 – prototipo en servidor Python. Costo: $12.000 (incluye limpieza de datos y validación con el área de inventarios).

Impacto Cuantificable
Reducción del 30% en sMAPE (ej. de 40% a 28%). Disminución de roturas de stock en un 25% y reducción de inventario excedente en un 15%.

Aplicabilidad Práctica Inmediata
Cadenas de tiendas de conveniencia, supermercados, farmacias, distribuidoras.

Proyección a 5 años
Módulo “DemandaSKU” integrado en sistemas ERP de retail. Formación de ingenieros comerciales en forecasting.

2. CarritoAbandono – Modelo de predicción de abandono de carrito de compras en e-commerce local usando redes neuronales (TabNet) y datos de navegación

Problema científico
Las tiendas online bolivianas tienen tasas de abandono de carrito del 70-80%. Los modelos tradicionales de clasificación (logit) no capturan patrones complejos de comportamiento de navegación.

Hipótesis principal
Un modelo TabNet (red neuronal para datos tabulares) entrenado con datos de sesiones de usuarios (tiempo en página, número de productos añadidos, método de pago, hora del día) predice el abandono (compra no completada en 24h) con AUC >0,85, superando a XGBoost (AUC=0,80).

Modelo de Red Neuronal Propuesto
TabNet con atención, entrenado con 100.000 sesiones de usuarios. Características: duración de la sesión, número de productos en carrito, monto total, intentos de cupón, dispositivo (móvil/PC), etc.

Base teórica
El abandono de carrito se asocia con fricciones en el checkout (costo de envío, registro obligatorio). El ML permite intervenciones personalizadas (Allenby & Rossi, 2021, Journal of Marketing Research).

Diseño Metodológico
Datos de 1 año de una tienda online local (anonimizados). Entrenamiento con 80%, validación temporal. Métricas: AUC, precisión/recall en el decil superior.

Viabilidad Técnica (TRL)
TRL 6 – prototipo integrable en e-commerce vía API. Costo: $12.000.

Impacto Cuantificable
AUC >0,85. Envío de cupones de descuento personalizados (10% off) a usuarios con alta probabilidad de abandono, recuperando el 15% de los carritos.

Aplicabilidad Práctica Inmediata
E-commerce locales (Click, TuMercado, agencias de viaje), plataformas de delivery.

Proyección a 5 años
SaaS “CarritoAbandono” con integración nativa a Shopify, WooCommerce y Magento.

3. PrecioDinámicoRetail – Optimización de precios en tiempo real para productos de alta rotación (bebidas, snacks) usando aprendizaje por refuerzo (DQN)

Problema científico
Los precios en tiendas se actualizan manualmente cada mes. La demanda es elástica al precio y varía por hora del día y nivel de inventario.

Hipótesis principal
Un agente DQN (Deep Q-Network) que fija precios cada hora para 50 productos de alta rotación (basado en estado: hora, inventario, ventas recientes, precio de competencia) aumenta el margen bruto en un 12% respecto a una política de precio fijo, en un entorno simulado calibrado con datos reales.

Modelo de Red Neuronal Propuesto
DQN con memoria de experiencia. Estado: vector de 10 variables (inventario, ventas últimas 4h, hora, día de semana, precio competencia). Acción: 10 niveles de descuento (0% a 20%). Recompensa: ingreso – costo de oportunidad por rotura.

Base teórica
La fijación dinámica de precios es un problema de decisión secuencial bajo incertidumbre. El RL ha mostrado mejoras significativas en retail (Chen et al., 2020, Management Science).

Diseño Metodológico
Simulador calibrado con datos históricos de una tienda (1 año). Entrenamiento del agente. Evaluación fuera de muestra (3 meses simulados). Comparación con política heurística (descuento por vencimiento).

Viabilidad Técnica (TRL)
TRL 6 – prototipo en simulador. Costo: $15.000.

Impacto Cuantificable
Aumento del margen bruto en un 12% (prueba piloto en una tienda real requeriría autorización). Reducción de mermas por vencimiento en un 25%.

Aplicabilidad Práctica Inmediata
Cadenas de tiendas de conveniencia, supermercados, gasolineras.

Proyección a 5 años
Sistema “PrecioDinámicoRetail” integrado con etiquetas electrónicas de precio. Extensión a categorías como ropa (descuentos estacionales).

4. LeadScore – Puntuación de leads comerciales (B2B) para empresas de servicios industriales usando redes neuronales y datos de CRM

Problema científico
Las empresas B2B reciben muchos leads pero convierten solo el 10-20%. La priorización manual es subjetiva.

Hipótesis principal
Un modelo MLP (multilayer perceptron) entrenado con datos históricos de 10,000 leads (tamaño de empresa, sector, interacciones previas, visitas al sitio web) predice la probabilidad de cierre (venta en 6 meses) con AUC >0,80, permitiendo que el equipo comercial enfoque el 20% de leads con mayor puntaje, aumentando la tasa de conversión en un 30%.

Modelo de Red Neuronal Propuesto
MLP de 3 capas (64, 32, 1) con dropout. Características: ingresos estimados de la empresa, número de empleados, interacciones previas (llamadas, emails), fuente del lead, etc.

Base teórica
La puntuación de leads con machine learning mejora la eficiencia comercial (Järvinen & Taiminen, 2020, Journal of Business & Industrial Marketing).

Diseño Metodológico
Datos anonimizados de una empresa de servicios (logística, software) durante 2 años. Entrenamiento con validación temporal. Métricas: AUC, lift en deciles.

Viabilidad Técnica (TRL)
TRL 6 – prototipo integrable en CRM (Salesforce, HubSpot, Zoho). Costo: $10.000.

Impacto Cuantificable
AUC >0,80. Aumento del 30% en tasa de conversión del top 20% de leads. Reducción del tiempo de seguimiento de leads fríos en un 50%.

Aplicabilidad Práctica Inmediata
Departamentos comerciales de empresas industriales, tecnológicas, de seguros.

Proyección a 5 años
Módulo “LeadScore” como función nativa en CRMs bolivianos. Formación de ejecutivos en analítica comercial.

5. GeoVentas – Asignación óptima de territorios de ventas para una fuerza de ventas de bebidas en Santa Cruz usando optimización con restricciones (K-means + programación lineal)

Problema científico
Las empresas de distribución (bebidas, alimentos) asignan territorios por zonas, pero no equilibran carga de trabajo ni potencial de ventas.

Hipótesis principal
Un algoritmo híbrido (K-means geográfico + programación lineal) que considera número de clientes por zona, distancia recorrida, y potencial de ventas histórico, rediseña los territorios de 20 vendedores, reduciendo la varianza de ventas entre territorios en un 40% y el tiempo de desplazamiento en un 15%.

Modelo de Red Neuronal Propuesto
No se usa red neuronal. K-means con restricciones de cardinalidad (cada territorio tenga número similar de clientes) más optimización lineal para minimizar distancia total.

Base teórica
El diseño de territorios de ventas es un problema de partición de grafos. Los métodos de clustering con restricciones mejoran la equidad y eficiencia (Zoltners et al., 2020, Journal of Personal Selling & Sales Management).

Diseño Metodológico
Datos de geolocalización de 2,000 clientes y ventas mensuales (1 año). Aplicación del algoritmo y simulación de rutas. Comparación con territorios actuales.

Viabilidad Técnica (TRL)
TRL 6 – prototipo en Python (scikit-learn, OR-Tools). Costo: $8.000.

Impacto Cuantificable
Reducción del 40% en varianza de ventas entre territorios (más equidad). Disminución del 15% en distancia recorrida (ahorro de combustible y tiempo).

Aplicabilidad Práctica Inmediata
Distribuidoras de bebidas, alimentos, farmacéuticas, empresas de servicios de campo.

Proyección a 5 años
Software “GeoVentas” con interfaz web para reasignación dinámica (cuando hay rotación de personal).

6. ChurnClientes – Predicción de cancelación de suscripción (churn) para una empresa de streaming local (servicio de video) usando redes LSTM y datos de consumo

Problema científico
Las plataformas de streaming tienen alta tasa de cancelación. Los patrones de consumo (horas vistas, géneros, días sin actividad) son predictores temporales.

Hipótesis principal
Una red LSTM sobre secuencias de actividad diaria de 30 días (número de minutos vistos, número de sesiones, cambios de perfil) predice la cancelación en la próxima semana con AUC >0,85, superando a modelos estáticos (Random Forest) en un 15%.

Modelo de Red Neuronal Propuesto
LSTM bidireccional con atención. Entrada: secuencia de 30 días con 5 métricas de consumo. Salida: probabilidad de churn en los próximos 7 días.

Base teórica
El churn en servicios digitales está precedido por cambios en el comportamiento (disminución de uso). El deep learning captura patrones temporales (Ascarza et al., 2020, Journal of Marketing Research).

Diseño Metodológico
Datos anonimizados de una plataforma de streaming boliviana (2 años, 100,000 usuarios). Entrenamiento con validación temporal. Métricas: AUC, lift en deciles.

Viabilidad Técnica (TRL)
TRL 6 – prototipo en servidor GPU. Costo: $15.000.

Impacto Cuantificable
AUC >0,85. Envío de ofertas personalizadas (descuento, contenido exclusivo) a usuarios con alta probabilidad de churn, reduciendo la tasa de cancelación en un 25%.

Aplicabilidad Práctica Inmediata
Plataformas de streaming, servicios de suscripción (gimnasios, software como servicio), operadoras de telefonía.

Proyección a 5 años
SaaS “ChurnClientes” integrado con sistemas de marketing automation (HubSpot, Mailchimp).

7. CrossSellB2B – Recomendación de productos complementarios para clientes industriales usando redes neuronales de grafos (LightGCN) y datos de transacciones B2B

Problema científico
En ventas B2B, los productos son más complejos y las relaciones entre ellos (ej. máquina + repuestos) son clave. Los sistemas de recomendación tradicionales asumen independencia.

Hipótesis principal
Un modelo LightGCN (Graph Convolutional Network) que construye un grafo bipartito clientes-productos y aprende embeddings, recomienda productos complementarios con precisión@10 >0,25, superando a la factorización matricial (SVD) en un 40%.

Modelo de Red Neuronal Propuesto
LightGCN con embeddings de 64 dimensiones. Entrenamiento con pérdida BPR (Bayesian Personalized Ranking). Se recomiendan productos que co-compran clientes similares.

Base teórica
Las redes neuronales de grafos capturan la estructura de co-compra en B2B, donde los productos son complementarios (Wang et al., 2019, KDD).

Diseño Metodológico
Datos de 2 años de transacciones de una empresa industrial (10,000 clientes, 500 productos). Entrenamiento con 80% de los clientes, evaluación con 20% (leave-one-out). Métricas: precisión@10, recall@10, NDCG.

Viabilidad Técnica (TRL)
TRL 6 – prototipo con RecBole. Costo: $10.000.

Impacto Cuantificable
Aumento del 15% en ventas cruzadas (productos recomendados aceptados en el 5% de los casos). Mejora del ticket promedio en un 10%.

Aplicabilidad Práctica Inmediata
Empresas B2B (maquinaria, insumos industriales, tecnología), distribuidoras mayoristas.

Proyección a 5 años
Módulo “CrossSellB2B” en sistemas CRM industriales. Formación de vendedores en recomendaciones asistidas por IA.

8. SocialSentimentBrand – Monitoreo de sentimiento de marca y competencia en tiempo real para empresas cruceñas usando BERT y dashboards automatizados

Problema científico
Las empresas locales no tienen herramientas para monitorear el sentimiento hacia su marca y la competencia en redes sociales (Twitter, Facebook, Instagram). El análisis manual es costoso y lento.

Hipótesis principal
Un pipeline de scraping + BERT fine-tuned para clasificación de sentimiento (positivo/negativo/neutral) y detección de tópicos (BERTopic) procesa 5,000 menciones diarias, generando alertas cuando el sentimiento neto cae más de 2 desviaciones estándar, con una precisión >85% (validado con panel de expertos).

Modelo de Red Neuronal Propuesto
BERT multilingüe (BETO) fine-tuned con 10,000 tuits y comentarios anotados (dominio: marcas de retail, bancos, telecomunicaciones). Detección de tópicos con BERTopic.

Base teórica
El monitoreo de sentimiento en tiempo real permite respuestas proactivas y evaluación de campañas (Rambocas & Pacheco, 2020, Journal of Business Research).

Diseño Metodológico
Scraping ético de Twitter, Facebook e Instagram para 10 marcas cruceñas (ej. Farmacorp, Banco Bisa, Tigo). Anotación de 10,000 menciones por 5 jueces (kappa >0,80). Fine-tuning. Implementación de dashboard con Streamlit.

Viabilidad Técnica (TRL)
TRL 6 – prototipo en la nube. Costo: $10.000.

Impacto Cuantificable
Precisión >85% en clasificación de sentimiento. Reducción del 70% en tiempo de detección de crisis reputacionales (de 24 horas a 2 horas).

Aplicabilidad Práctica Inmediata
Departamentos de marketing y PR de empresas locales, agencias de publicidad.

Proyección a 5 años
SaaS “SocialSentimentBrand” para pymes bolivianas. Integración con plataformas de gestión de redes sociales (Hootsuite, Metricool).

9. PromoOptimizer – Optimización de promociones (descuentos, 2×1) en supermercados usando modelos de uplift (causal ML) y redes neuronales

Problema científico
Las promociones en supermercados se aplican a todos los clientes por igual. El uplift modeling identifica a los clientes sensibles a la promoción (persuasibles) y evita dar descuentos a quienes comprarían igual o a los “rebeldes” que compran menos con promoción.

Hipótesis principal
Un modelo de uplift basado en redes neuronales (Meta-learner TARNet) que estima el efecto causal individual de un cupón de 20% de descuento, permite dirigir la promoción al 30% de clientes con mayor uplift, aumentando el retorno sobre inversión (ROI) en un 50% respecto a una promoción masiva (todos los clientes).

Modelo de Red Neuronal Propuesto
TARNet (Two-head network): una cabeza para el grupo control, otra para el tratamiento, con regularización para balancear covariables. La diferencia entre cabezas es el uplift.

Base teórica
El uplift modeling es la metodología estándar para personalización de promociones (Gutierrez & Gérard, 2020, Marketing Science).

Diseño Metodológico
Experimento aleatorizado controlado (RCT) con 20,000 clientes de un supermercado: 10,000 reciben cupón, 10,000 no. Se miden compras en la siguiente semana. Se entrena TARNet y se evalúa el uplift estimado vs. real (Qini curve).

Viabilidad Técnica (TRL)
TRL 6 – prototipo con causalML. Costo: $20,000 (incluye experimento piloto).

Impacto Cuantificable
Aumento del ROI de la promoción en un 50% (más ventas incrementales con mismo presupuesto). Reducción del 30% de descuentos “desperdiciados”.

Aplicabilidad Práctica Inmediata
Cadenas de supermercados, farmacias, tiendas de retail, e-commerce.

Proyección a 5 años
Módulo “PromoOptimizer” integrado en sistemas de loyalty y CRM. Formación en marketing causal.

10. ForecastVentasFarma – Predicción de ventas de medicamentos de venta libre (OTC) por farmacia usando redes neuronales (DeepAR) y datos de epidemiológicos (consultas, clima)

Problema científico
La demanda de medicamentos OTC (para resfrío, dolor) es estacional y se correlaciona con enfermedades respiratorias y clima. Las farmacias no tienen pronósticos precisos.

Hipótesis principal
Un modelo DeepAR (modelo de series temporales probabilístico basado en LSTM) que integra ventas históricas por farmacia, número de consultas por IRA (infecciones respiratorias) y datos de humedad/temperatura, predice la demanda semanal con intervalos de confianza, reduciendo el error sMAPE en un 35% respecto a un modelo de media móvil.

Modelo de Red Neuronal Propuesto
DeepAR (gluon-ts) con covarianzas conocidas (clima, consultas). Salida: distribución de demanda (cuantiles 10%, 50%, 90%).

Base teórica
La demanda de medicamentos OTC es un problema de forecasting con estacionalidad y correlaciones externas. Los modelos probabilísticos mejoran la planificación de inventarios (Salinas et al., 2020, International Journal of Forecasting).

Diseño Metodológico
Datos de 2 años de ventas de una cadena de farmacias (30 locales), más datos de consultas por IRA (SEDES) y clima (SENAMHI). Entrenamiento con 80%, validación temporal.

Viabilidad Técnica (TRL)
TRL 6 – prototipo en servidor con GluonTS. Costo: $14,000.

Impacto Cuantificable
Reducción del 35% en sMAPE. Mejora del nivel de servicio (menos roturas de stock para antigripales en temporada alta) y reducción de devoluciones por vencimiento.

Aplicabilidad Práctica Inmediata
Cadenas de farmacias (Farmacorp, Chávez), droguerías, distribuidoras de productos OTC.

Proyección a 5 años
API “ForecastVentasFarma” integrada en sistemas de reposición automática de inventarios.

📌 Nota final

Estos 10 proyectos para Ingeniería Comercial cubren:

· Forecasting de demanda (1, 10)
· Optimización de precios y promociones (3, 9)
· Gestión de clientes (churn, scoring, cross-sell) (2, 4, 6, 7)
· Territorios y fuerza de ventas (5)
· Monitoreo de marca (8)

Costos entre $8.000 y $20.000, TRL 6–7. Viables en la UAGRM con articulación DEIS (extensión a empresas locales) y DICIT (infraestructura de datos). Se recomienda establecer convenios con empresas retail, farmacias y e-commerce para acceso a datos.