Análisis de Datos Agropecuarios

Exploración estadística, probabilidad y visualización aplicada a datos reales

Reconocimiento

Vista previa del dataset crudo

"Departamento","Municipio","Cultivo","Estado","Topografia","Drenaje","Riego","Fertilizantes aplicados","Secuencial"
"CUNDINAMARCA","FUNZA","Maíz","Por establecer","Plano","Buen drenaje","Aspersión","15-15-15","306"
"CUNDINAMARCA","FUNZA","Ajo","Por establecer","Plano","Buen drenaje","Aspersión","UREA","677"
"CUNDINAMARCA","FUNZA","Ajo","Por establecer","Plano","Buen drenaje","Aspersión","UREA","678"
"CUNDINAMARCA","FUNZA","Ajo","Por establecer","Plano","No indica","No indica","No indica","1.047"
"CUNDINAMARCA","FUNZA","Ajo","Por establecer","Plano","No indica","No indica","No indica","1.048"
"CUNDINAMARCA","FUNZA","Ajo","Por establecer","Plano","No indica","No indica","No indica","1.049"
"CUNDINAMARCA","FUNZA","Calas","Establecido","Plano","Buen drenaje","Aspersión","No indica","4.533"
"CUNDINAMARCA","FUNZA","Calas","Establecido","Plano","Buen drenaje","Aspersión","No indica","4.583"
"CUNDINAMARCA","FUNZA","Calas","Establecido","Plano","Buen drenaje","Aspersión","No indica","4.761"
"CUNDINAMARCA","FUNZA","Ajo","Por establecer","Plano","Buen drenaje","Aspersión","No indica","7.144"
"CUNDINAMARCA","FUNZA","Maracuyá","Por establecer","Ondulado","Buen drenaje","Goteo","No indica","7.395"
"CUNDINAMARCA","FUNZA","Granadilla","Establecido","Plano","Buen drenaje","No indica","No indica","7.837"
"CUNDINAMARCA","FUNZA","Maíz","Por establecer","Plano","Buen drenaje","Aspersión","BIOCOMPOST
"CUNDINAMARCA","FUNZA","Gulupa","Por establecer","Plano","Buen drenaje","No indica","No indica","18.242"
...

Este es nuestro dataset de análisis

El conjunto de datos corresponde a registros agrícolas levantados a nivel municipal (Funza, Cundinamarca), con información sobre cultivos, condiciones del terreno y prácticas de manejo.

Cada registro representa un lote agrícola con sus características.

En esta sección se presenta una vista preliminar del dataset crudo, previo a cualquier proceso de limpieza o transformación.

Columna Tipo Comentario
Departamento Categórica nominal No tiene orden
Municipio Categórica nominal No tiene orden
Cultivo Categórica nominal No tiene orden
Estado Categórica nominal No tiene orden
Topografia Categórica ordinal Tiene orden implícito

Tipos de variables

La mayoría de las variables son categóricas (nominales u ordinales), lo que limita los tipos de análisis estadísticos que podemos realizar.

El enfoque será exploratorio y descriptivo, centrado en distribuciones, frecuencias y asociaciones entre categorías.

Municipio de Funza

Estadísticas descriptivas

Características iniciales

  • El dataset tiene 88 filas y 9 columnas
  • Todas las columnas principales son de tipo category
  • No hay valores nulos en los registros
  • La cardinalidad varía entre 1 (Departamento) y 88 (id de los lotes)
  • Cultivo tiene la mayor diversidad con 27 valores únicos

Cardinalidad y valores únicos

Algunos valores poseen diferencias sutiles pero significativas a nivel de categorización debido a mayúsculas, tildes, espacios y variaciones semánticas de igual significado que crean categorías nuevas que deben normalizarse.

Por ejemplo, en la columna Riego, se detectaron inconsistencias que se agruparon bajo un mismo concepto:

❌ Sin normalizar

Cardinalidad: 9

  • - Aspersión
  • - Cañon
  • - Goteo
  • - GOTEO
  • - Manguera
  • - No Indica
  • - No indica
  • - No Tiene
  • - no

✅ Normalizado

Cardinalidad: 6

  • - Aspersión
  • - Cañon
  • - Goteo
  • - Manguera
  • - No indica
  • - No tiene

Valores únicos después de la normalización

A continuación se presentan todas las categorías y sus valores únicos después del proceso de limpieza y normalización.

Departamento

Cardinalidad: 1

CUNDINAMARCA

Municipio

Cardinalidad: 1

FUNZA

Cultivo

Cardinalidad: 27

Ajo Alfalfa Caducifolios Café Calas Clavel Fresa Granadilla Guisantes Gulupa Hipérico Hortalizas Varias Lechuga Maracuyá Maíz No Indica Papa de año Pasto Pasto Kikuyo Pasto KinGrass Pastos Quinua Ruscus Tomate Tomate de Arbol Uchuva Zanahoria

Estado

Cardinalidad: 3

Establecido No Indica Por Establecer

Topografia

Cardinalidad: 7

Moderadamente ondulado No indica Ondulado Pendiente Pendiente fuerte Pendiente moderada Plano

Drenaje

Cardinalidad: 4

Buen drenaje Mal drenaje No indica Regular drenaje

Riego

Cardinalidad: 6

Aspersión Cañon Goteo Manguera No Tiene No indica

Fertilizantes aplicados

Cardinalidad: 15

15-15-15 biocompost 13-26-6 calfos abono fosforico compos-triple 15 compostaje y gallinaza foliar ninguno no indica quimico si triple 15-quimicos urea

Distribución por Categoría

Cultivo Probabilidad
Uchuva0.159091
Lechuga0.125000
Ajo0.079545
Pasto Kikuyo0.079545
No Indica0.079545
Pastos0.068182
Gulupa0.045455
Hortalizas Varias0.045455
Calas0.034091
Tomate0.034091
Quinua0.034091
Fresa0.022727
Maíz0.022727
Hipérico0.022727
Maracuyá0.011364
Guisantes0.011364
Granadilla0.011364
Tomate de Arbol0.011364
Zanahoria0.011364
Ruscus0.011364
Papa de año0.011364
Clavel0.011364
Caducifolios0.011364
Pasto KinGrass0.011364
Pasto0.011364
Café0.011364
Alfalfa0.011364

PMF de Cultivo (P(Cultivo))

Se calcula la distribución de cultivos para identificar cuáles aparecen con mayor frecuencia en el conjunto de datos.

Esta PMF no representa la probabilidad real de siembra en la región, sino la probabilidad empírica dentro del dataset observado.

Gráfica de barras de la PMF de cultivos (top 12 por frecuencia) en la unidad territorial

Gráfica PMF de Cultivo

La PMF graficada permite comparar rápidamente la representatividad relativa de cada cultivo.

Para facilitar la lectura, se priorizan los 12 cultivos con mayor frecuencia y se interpretan como patrón dominante dentro del dataset.

Riego Probabilidad
No indica0.420455
Aspersión0.375000
Goteo0.068182
No Tiene0.068182
Cañon0.045455
Manguera0.022727

PMF de Riego (P(Riego))

Se calcula la distribución de sistemas de riego para evaluar concentración de registros y posibles sesgos por falta de información.

“No indica” domina la distribución, lo cual limita el análisis de adopción real de tecnologías de riego dentro del dataset.

Gráfica de barras de la PMF de sistemas de riego en la unidad territorial

Gráfica PMF de Riego

El riego por aspersión es el sistema más frecuente entre los registros informados.

El riego por goteo presenta participación menor, lo que sugiere oportunidades de mejora o, alternativamente, sesgo por subregistro.

Drenaje Probabilidad
Buen drenaje0.727273
No indica0.181818
Regular drenaje0.079545
Mal drenaje0.011364

PMF de Drenaje (P(Drenaje))

Se calcula la distribución del drenaje para identificar condiciones predominantes de manejo de exceso de agua en los predios registrados.

La proporción de “No indica” introduce incertidumbre, especialmente en cultivos sensibles al encharcamiento.

Gráfica de barras de la PMF de tipos de drenaje en la unidad territorial

Gráfica PMF de Drenaje

Predomina “Buen drenaje”, lo que sugiere condiciones favorables en la mayoría de registros observados.

La categoría “No indica” debe tratarse como un riesgo para la interpretación: no se puede asumir buen (o mal) drenaje cuando no existe registro.

Topografia Probabilidad
Plano0.647727
Ondulado0.159091
No indica0.090909
Moderadamente ondulado0.034091
Pendiente moderada0.034091
Pendiente0.022727
Pendiente fuerte0.011364

PMF de Topografía (P(Topografia))

Se calcula la distribución de topografía para entender qué condiciones físicas predominan en la unidad territorial registrada.

El predominio de terrenos planos puede favorecer mecanización y manejo homogéneo; pendientes son minoritarias pero relevantes para riesgos y prácticas de conservación.

Gráfica de barras de la PMF de topografía en la unidad territorial

Gráfica PMF de Topografía

Las categorías onduladas y con pendiente, aunque menos frecuentes, son críticas para evaluar a futuro manejo de escorrentía, erosión y viabilidad de ciertos sistemas de riego.

La presencia de “No indica” reduce la precisión de inferencias para algunos cultivos y debe considerarse explícitamente en recomendaciones.

Relación entre Variables Categóricas y Conclusión

Tabla de contingencia normalizada: P(Riego | Cultivo) (top 12 cultivos)
Cultivo Aspersión Cañon Goteo Manguera
Uchuva0000
Lechuga9000
Ajo3000
No Indica2000
Pasto Kikuyo0400
Pastos2000
Hortalizas Varias3000
Gulupa1000
Quinua3000
Tomate0021
Calas3000
Maíz2000
Total28421

Tabla de contingencia P(Riego | Cultivo)

Se seleccionan los 12 cultivos más frecuentes según la PMF de Cultivo, se ordena por frecuencia total (descendente) y se excluyen categorías menos informativas para el objetivo de análisis (“No Tiene” y “No indica”).

El objetivo es observar patrones prácticos de asociación entre cultivo y sistema de riego reportado, con enfoque exploratorio.

Tabla de contingencia: P(Topografía | Cultivo) (Calas, Quinua, Hortalizas Varias, Gulupa)
Cultivo Moderadamente ondulado No indica Ondulado Pendiente Pendiente fuerte Pendiente moderada Plano
Calas0000003
Gulupa0001102
Hortalizas Varias0000004
Quinua0000003

Tabla de contingencia P(Topografía | Cultivo)

Se valida la incidencia de la topografía para cultivos seleccionados, con el fin de contextualizar decisiones de riego y manejo agronómico.

La lectura se hace desde el patrón: qué topografías aparecen asociadas a cada cultivo, y qué tan consistente es la información registrada.

Tabla de contingencia: P(Drenaje | Cultivo) (Calas, Quinua, Hortalizas Varias, Gulupa)
Cultivo Buen drenaje Mal drenaje No indica Regular drenaje
Calas3000
Gulupa2011
Hortalizas Varias4000
Quinua3000

Tabla de contingencia P(Drenaje | Cultivo)

Se evalúa el drenaje como variable crítica para riesgo de encharcamiento y sanidad del cultivo, particularmente en especies sensibles.

La presencia de “No indica” debe considerarse como incertidumbre explícita y no como evidencia de drenaje adecuado.

Análisis del sistema de riego por cultivo

El análisis de la tabla de contingencia muestra que el sistema de riego más común en los registros analizados es el riego por aspersión, con una clara dominancia frente a otros métodos como goteo, cañón o manguera.

En el caso de la lechuga, un cultivo hortícola cuyo principal valor comercial es la hoja, resulta llamativo que el sistema de riego predominante sea la aspersión. Este método puede incrementar el riesgo de enfermedades bacterianas y fúngicas al mojar el follaje, además de aumentar la suciedad en las hojas. Desde un punto de vista técnico, sería esperable una mayor presencia del riego por goteo, dado que este mejora la eficiencia en el uso del agua, reduce el contacto del follaje con la humedad, permite fertiriego y una mejor sanidad del cultivo. Sin embargo, en los registros analizados no se observa ningún caso de riego por goteo para este cultivo.

Una situación similar se presenta en el ajo. Aunque el tamaño muestral es reducido, todos los registros corresponden a riego por aspersión. Esto contrasta con las recomendaciones técnicas, ya que el riego por goteo es generalmente preferido en este cultivo por dirigir el agua directamente a la base de la planta, mejorar la eficiencia hídrica, permitir la fertirrigación y evitar sobre riego, por tanto, reducir el riesgo de enfermedades asociadas al exceso de humedad y al encharcamiento del suelo, que puede provocar pudrición de los bulbos.

El pasto Kikuyo (Pennisetum clandestinum), utilizado principalmente como forraje en ganadería en climas fríos y zonas altas, presenta un patrón diferente. En este caso, el sistema de riego registrado es exclusivamente el riego por cañón, lo cual resulta coherente con la necesidad de aplicar riegos profundos y cubrir grandes áreas. En el caso de 'Otros pastos' y 'Maiz', aparecen asociados al riego por aspersión, un sistema viable cuando se realizan riegos más frecuentes y controlados (nota: no se especifica tipo de pastizal).

El tomate es el único cultivo que muestra variabilidad en los sistemas de riego, con registros de goteo y manguera. Esta diversidad sugiere prácticas de manejo menos estandarizadas o adaptadas a condiciones específicas del predio, como disponibilidad de infraestructura, escala de producción o topografía.

En general, el resto de los cultivos registrados presenta una marcada predominancia del riego por aspersión. Sin embargo, en algunos casos —como hortalizas, quinua, lechuga y cala— podría esperarse una mayor adopción de sistemas de riego por goteo, dadas sus ventajas en eficiencia hídrica y manejo fitosanitario.

Y esque al considerar conjuntamente variables como la topografía y el drenaje para estos cultivos, los registros disponibles sugieren que, desde un punto de vista topografico y del drenaje del terreno, la implementación de riego por goteo podría ser viable en varios de estos cultivos. No obstante, sin profundizar en las condiciones agronómicas óptimas de cada especie y dado el tamaño reducido del conjunto de datos, estas observaciones deben interpretarse más como indicios (exploratorios).

Finalmente, aunque la uchuva es el cultivo más frecuente en el dataset, lamentablemente no presenta información válida sobre el sistema de riego tras el proceso de limpieza de datos. Esta ausencia limita cualquier interpretación técnica sobre su manejo hídrico.

Contexto territorial (Funza)

Imágenes de referencia del municipio.

Fuente imagenes: Agrosavia - C.I.tibaitatá

Fotografía de referencia del territorio rural de Funza para contextualizar el análisis agrícola Fotografía de referencia de infraestructura o paisaje agrícola de Funza para contextualizar decisiones de riego Fotografía de referencia de predios agrícolas en Funza para apoyar el contexto territorial del análisis