Ir al contenido principal

Distribución binomial: guía completa con ejemplos

Descubre cómo la distribución binomial modela múltiples resultados binarios y se aplica en finanzas, salud y machine learning.
Actualizado 17 abr 2026  · 10 min leer

Las distribuciones binomiales son fundamentales en teoría de probabilidades y análisis estadístico. Tienen un papel clave en todo, desde el análisis de encuestas hasta el control de calidad y la modelización financiera. Esta guía busca ayudarte a entender con claridad qué son las distribuciones binomiales, sus propiedades y cómo se aplican en ciencia de datos y estadística.

Si necesitas una base previa, te recomendamos nuestro tutorial Bernoulli Distribution: A Complete Guide with Examples como punto de partida. Y si quieres aplicar estos conceptos estadísticos directamente en proyectos de machine learning, Machine Learning in Production in Python ofrece consejos prácticos para integrar modelos estadísticos en aplicaciones reales.

Desarrolla habilidades de aprendizaje automático

Eleva tus habilidades de aprendizaje automático al nivel de producción.
Empieza a aprender gratis

¿Qué es una distribución binomial?

Una distribución binomial es una distribución de probabilidad discreta que modela el número de éxitos en un conjunto de ensayos independientes. Cada ensayo solo tiene dos posibles resultados, a menudo etiquetados como "éxito" y "fracaso", con una probabilidad de éxito constante en todos los ensayos.

Sus rasgos clave incluyen:

  • Un número fijo de ensayos n
  • Ensayos independientes
  • Probabilidad de éxito constante p en cada ensayo
  • Resultados binarios por ensayo (éxito/fracaso)

La importancia de la distribución binomial en estadística radica en su capacidad para modelar situaciones reales en las que nos interesa la frecuencia con la que ocurre un evento concreto en un número definido de intentos. 

Propiedades de las distribuciones binomiales

Conocer bien sus propiedades es clave para utilizarlas con eficacia en análisis estadístico. Veamos algunas características esenciales:

Número fijo de ensayos

Dos parámetros definen una distribución binomial:

  1. n: número de ensayos independientes
  2. p: probabilidad de éxito en cada ensayo

Estos parámetros determinan la forma y rasgos de la distribución. El conteo fijo de ensayos distingue a la binomial de conceptos relacionados como la distribución de Poisson, donde el número de eventos puede fluctuar.

En modelización estadística, estos parámetros tienen implicaciones importantes. El n fijo permite cálculos de probabilidad precisos en escenarios con un número conocido de intentos, como inspecciones de calidad o ensayos clínicos. La p constante habilita el modelado de procesos estables, aunque puede limitar su uso cuando la probabilidad de éxito varía.

Media y varianza

Para una distribución binomial, la media (μ) y la varianza (σ²) se calculan como:

  • Media = np
  • Varianza = np(1-p)

La media representa el número esperado de éxitos en n ensayos. Por ejemplo, si lanzas una moneda equilibrada 100 veces (n = 100, p = 0,5), esperarás 50 caras de media.

La varianza cuantifica la dispersión de la distribución alrededor de la media. Una varianza mayor indica más variabilidad en el número de éxitos de un conjunto de ensayos a otro. Esta medida resulta útil para evaluar la fiabilidad de las estimaciones y construir intervalos de confianza.

Simetría y asimetría

Los parámetros de una distribución binomial influyen en su forma:

Gráfico de barras con la PMF de una distribución binomial con 20 ensayos y probabilidad de éxito 0,3.PMF de distribución binomial - n=20, p=0,3. Imagen del autor.

Gráfico de barras con la PMF de una distribución binomial con 20 ensayos y probabilidad de éxito 0,5.PMF de distribución binomial - n=20, p=0,5. Imagen del autor.

Gráfico de barras con la PMF de una distribución binomial con 20 ensayos y probabilidad de éxito 0,7.PMF de distribución binomial - n=20, p=0,7. Imagen del autor.

Las figuras anteriores ilustran cómo la probabilidad de éxito p afecta a la forma de una distribución binomial cuando el número de ensayos n es fijo.

  • Cuando p = 0,5, la distribución es simétrica.
  • Cuando p < 0,5, la distribución presenta asimetría positiva.
  • Cuando p > 0,5, la distribución muestra asimetría negativa.

El número de ensayos, denotado por n, también influye en la forma. A medida que n aumenta, la distribución adopta progresivamente una forma más acampanada, independientemente de la probabilidad de éxito p. Al mismo tiempo, la dispersión relativa (coeficiente de variación) disminuye y la asimetría se reduce, ganando simetría.

Consulta la siguiente figura para ver cómo aumentar n influye en la forma de la binomial en distintos ensayos:

Comparaciones de PMF binomial para p=0,5 con valores de n variablesComparaciones de PMF binomial para p=0,5 con valores de n variables. Imagen del autor.

Esta transición hacia mayor simetría y una curva acampanada concuerda con el teorema central del límite (TCL). Según el TCL, a medida que n crece sin límite, la distribución binomial se aproxima cada vez más a una normal. Esta aproximación es especialmente válida cuando el producto del número de ensayos por la probabilidad de éxito (np) y el producto del número de ensayos por la probabilidad de fracaso (n(1−p)) son suficientemente grandes.

Aplicaciones prácticas de las distribuciones binomiales

La versatilidad de las distribuciones binomiales las hace aplicables en muchos ámbitos, especialmente en escenarios con resultados binarios.

Control de calidad y pruebas de fiabilidad

En fabricación y aseguramiento de la calidad, las distribuciones binomiales ayudan a modelar el número de artículos defectuosos en lotes de producción. Por ejemplo, dada la probabilidad de defecto y una cantidad específica de inspecciones, la binomial permite calcular la probabilidad de encontrar un determinado número de unidades defectuosas. Esto ayuda a tomar decisiones informadas sobre mejoras de procesos y medidas de control de calidad.

Muestreo en encuestas

En investigación, se emplean distribuciones binomiales para modelar el número de encuestados con características específicas. Es especialmente útil en preguntas sí/no o al clasificar respuestas en dos grupos. Ayuda a estimar y analizar proporciones poblacionales a partir de muestras.

Modelización financiera

Las distribuciones binomiales son parte integral de ciertos modelos de valoración de opciones en finanzas. El modelo binomial utiliza un marco de tiempo discreto para valuar opciones, donde el activo subyacente puede subir o bajar con probabilidades específicas en cada paso temporal. Este modelo ofrece un método sencillo y eficaz para estimar precios futuros potenciales de opciones en base a escenarios probabilísticos. Nuestro curso Financial Modeling in Excel es un gran recurso para explorar conceptos similares de modelización financiera. 

Consideraciones de rendimiento

Las distribuciones binomiales se usan habitualmente en análisis de datos, pero conllevan consideraciones de rendimiento, sobre todo cuando se trabaja con valores grandes de n (número de ensayos) o probabilidades extremas p. Entender estos factores te ayudará a aplicarlas e interpretar resultados con eficacia.

Desafíos computacionales con n grandes

A medida que aumenta el número de ensayos n en una distribución binomial, pueden surgir varios retos computacionales:

  1. Problemas de precisión: Calcular probabilidades exactas para n grandes puede generar errores de precisión por las limitaciones de la aritmética de coma flotante.
  2. Alta carga computacional: El cálculo directo con la función de masa de probabilidad binomial se vuelve costoso para n grandes.
  3. Limitaciones de memoria: Almacenar todos los posibles resultados para n grandes puede exceder la memoria disponible, sobre todo en entornos con recursos limitados.

Para gestionar estos retos, pueden aplicarse varias estrategias:

  1. Aproximación normal: Para n grandes, la distribución binomial puede aproximarse por una normal, especialmente cuando p no está demasiado cerca de 0 o 1 para evitar fuerte asimetría. Se considera razonable cuando tanto np como n(1−p) son mayores que 5, con estimaciones más conservadoras usando 10.
  2. Aproximación de Poisson: Cuando n es grande y p es pequeña pero np se mantiene moderado (típicamente hasta ~10), la distribución de Poisson ofrece una buena aproximación. Es menos costosa computacionalmente y muy eficaz para eventos raros.
  3. Métodos recursivos: Para cálculos exactos, los algoritmos recursivos pueden ser más eficientes que el cómputo directo de combinaciones. Aprovechan la relación entre términos sucesivos de la PMF binomial. Por ejemplo, la probabilidad de k+1 éxitos puede derivarse de la de k éxitos con un factor multiplicativo, reduciendo notablemente el tiempo de cómputo con n grandes.
  4. Transformaciones logarítmicas: Trabajar con logaritmos de probabilidades ayuda a evitar problemas de underflow/overflow, especialmente con n muy grandes o valores extremos de p. En vez de multiplicar probabilidades, se suman logaritmos, preservando la precisión numérica. Es especialmente útil al calcular cocientes de verosimilitud o productos de probabilidades.

Cómo tratar probabilidades pequeñas

Cuando la probabilidad de éxito es muy pequeña (p), surgen varias implicaciones:

  1. Asimetría: La binomial se vuelve muy sesgada a la derecha, complicando la interpretación con medidas simétricas estándar.
  2. Dispersión: La varianza se hace muy pequeña respecto a la media, lo que puede generar inestabilidad numérica en algunos cálculos.
  3. Modelado de eventos raros: Las probabilidades pequeñas suelen corresponder a eventos raros, difíciles de modelar con precisión.

Algunas técnicas útiles son:

  1. Aproximación de Poisson: Como se indicó, cuando p es pequeña y n es grande.
  2. Modelado binomial negativo: En lugar de modelar éxitos en un número fijo de ensayos, puede ser más adecuado modelar el número de ensayos hasta lograr un número fijo de éxitos.
  3. Transformaciones logarítmicas: Trabajar en escala logarítmica ayuda a manejar los retos numéricos asociados a probabilidades muy pequeñas.
  4. Muestreo por importancia: En simulación, técnicas como el muestreo por importancia permiten estimar con más eficiencia probabilidades de eventos raros.

Conceptos erróneos habituales

Para usar bien las distribuciones binomiales, conviene aclarar algunos malentendidos frecuentes:

Diferenciarla de la distribución de Bernoulli

Aunque relacionadas, las distribuciones de Bernoulli y binomial son distintas. Una Bernoulli modela un único ensayo con dos posibles resultados, mientras que la binomial contabiliza éxitos a lo largo de múltiples ensayos. Una binomial con n=1 equivale a una Bernoulli.

Interpretar el número de ensayos

Es esencial recordar que en una distribución binomial el número de ensayos n debe ser fijo y conocido de antemano. Si el número de ensayos puede variar, pueden ser más adecuadas alternativas como la distribución binomial negativa.

Alternativas a las distribuciones binomiales

Aunque la binomial es versátil y muy utilizada, hay situaciones en las que conviene recurrir a otras distribuciones. Conocer estas alternativas amplía el repertorio de modelos para distintos escenarios.

Distribución de Poisson

La distribución de Poisson es una distribución discreta que expresa la probabilidad de que ocurran ciertos eventos en un intervalo fijo de tiempo o espacio, asumiendo una tasa media constante y que los eventos son independientes entre sí.

Características clave de Poisson:

  • Modela el número de eventos en un intervalo fijo.
  • Asume independencia entre eventos.
  • Se define por un único parámetro λ, que es a la vez la media y la varianza.

Poisson es una alternativa eficaz a la binomial cuando:

  • El número de ensayos n es grande.
  • La probabilidad de éxito p es pequeña.
  • El producto np es moderado (normalmente menor que 10).

Algunos casos donde Poisson podría encajar mejor que la binomial:

  • Control de calidad: vigilancia del número de defectos en un proceso productivo masivo donde cada artículo individual tiene baja probabilidad de ser defectuoso.
  • Análisis de afluencia de clientes: estimación del número de clientes que visitan una tienda cada hora, asumiendo visitas independientes.
  • Monitoreo ambiental: conteo de la frecuencia de ciertos fenómenos naturales, como emisiones radiactivas en un periodo dado, con ocurrencias discretas e independientes.

En estos casos, Poisson ofrece una herramienta potente de análisis, especialmente cuando los cálculos con binomial se vuelven engorrosos o menos precisos. 

Distribución binomial negativa

La distribución binomial negativa es otra distribución discreta que ofrece un enfoque alternativo al de la binomial en ciertos escenarios.

Características clave de la binomial negativa:

  • Modela el número de fracasos antes de que ocurra un número especificado de éxitos.
  • Se define por dos parámetros: el número de éxitos requeridos r y la probabilidad de éxito en cada ensayo p.

La binomial negativa difiere de la binomial en algo fundamental:

  • Binomial: modela el número de éxitos en un número fijo de ensayos.
  • Binomial negativa: modela el número de ensayos necesarios para alcanzar un número fijo de éxitos.

Es especialmente útil cuando:

  • El proceso continúa hasta alcanzar un número predeterminado de éxitos.
  • El número de ensayos no está fijado de antemano.
  • Es necesario modelar datos de conteo sobredispersos (la varianza observada supera la esperada bajo un modelo, normalmente, binomial).

Algunos ejemplos donde la binomial negativa puede encajar mejor que la binomial:

  • Modelado del proceso de ventas: p. ej., el número de llamadas necesarias para lograr un objetivo de ventas, donde el proceso continúa hasta alcanzarlo.
  • Evaluación de riesgo en seguros: análisis del número de siniestros registrados antes de que ocurra un cierto número de siniestros grandes, clave para tarificación y gestión del riesgo.
  • Estudios ecológicos: escenarios de captura-recaptura en fauna, donde se sigue muestreando hasta recapturar un número predeterminado de animales marcados.

En estos casos, la binomial negativa ofrece una herramienta flexible, sobre todo cuando el punto final viene definido por un número de éxitos más que por un número fijo de ensayos.

Conclusión

Recuerda que, aunque la distribución binomial es un concepto fundamental, es solo una de muchas herramientas estadísticas disponibles. Explora también conceptos relacionados como las distribuciones de Poisson y binomial negativa para ampliar tus capacidades analíticas.

Para profundizar en distribuciones binomiales y conceptos afines, te sugerimos estos recursos:

Si sigues fortaleciendo tus conocimientos y habilidades estadísticas, estarás preparado para abordar retos complejos de análisis de datos en distintos ámbitos. Y, para terminar, haz clic abajo y conviértete hoy en machine learning scientist.

Conviértete en un Científico ML

Mejora tus conocimientos de Python para convertirte en un científico del aprendizaje automático.

Vinod Chugani's photo
Author
Vinod Chugani
LinkedIn

Como profesional experto en Ciencia de Datos, Aprendizaje Automático e IA Generativa, Vinod se dedica a compartir conocimientos y a capacitar a los aspirantes a científicos de datos para que tengan éxito en este dinámico campo.

Preguntas frecuentes

¿Qué es una distribución binomial?

Una distribución binomial modela el número de éxitos en un número fijo de ensayos independientes, cada uno con la misma probabilidad de éxito. Es muy utilizada en análisis estadístico para calcular probabilidades en escenarios con dos posibles resultados por ensayo, como lanzar una moneda o realizar pruebas de control de calidad.

¿Cómo se calculan la media y la varianza de una distribución binomial?

La media (μ) de una distribución binomial se calcula como np y la varianza (σ²) como np(1−p), donde n es el número de ensayos y p es la probabilidad de éxito. Estas medidas ayudan a entender los resultados esperados y su variabilidad.

¿Puede una distribución binomial usarse para modelar datos continuos?

No. La distribución binomial es discreta y solo puede modelar datos de conteo. Para datos continuos, debes usar distribuciones continuas como la normal, beta o gamma.

¿Qué papel juega el teorema central del límite en el uso de distribuciones binomiales?

El teorema central del límite establece que la suma de un gran número de variables independientes e idénticamente distribuidas se aproxima a una distribución normal, independientemente de la distribución original. Por eso puede usarse la aproximación normal en binomiales cuando el número de ensayos es grande.

¿Cómo se aplica la distribución binomial en machine learning?

En machine learning, las distribuciones binomiales se usan a menudo en tareas de clasificación con variable de salida binaria. Por ejemplo, pueden modelar la probabilidad de que un cliente compre o no un producto, lo que ayuda a entrenar clasificadores binarios como la regresión logística.

¿Cuáles son las limitaciones de las distribuciones binomiales en aplicaciones reales?

Aunque son versátiles, las binomiales asumen probabilidad de éxito constante y ensayos independientes, algo que no siempre se cumple en situaciones reales donde las probabilidades cambian o los resultados están interconectados.

Temas
Relacionado

blog

Clasificación en machine learning: Introducción

Aprende sobre la clasificación en machine learning viendo qué es, cómo se utiliza y algunos ejemplos de algoritmos de clasificación.
Zoumana Keita 's photo

Zoumana Keita

14 min

blog

8 modelos de machine learning explicados en 20 minutos

Descubre todo lo que necesitas saber sobre los tipos de modelos de machine learning, incluyendo para qué se utilizan y ejemplos de cómo ponerlos en práctica.
Natassha Selvaraj's photo

Natassha Selvaraj

15 min

Tutorial

Guía completa para calcular distribuciones de frecuencias en Excel

Sigue nuestra guía paso a paso para crear distribuciones de frecuencias en Excel utilizando la función FRECUENCIA() con sólo dos argumentos: matriz_datos y matriz_bins.
Arunn Thevapalan's photo

Arunn Thevapalan

multiple linear regression

Tutorial

Regresión lineal múltiple en R: tutorial con ejemplos

Una visión completa para entender las regresiones lineales múltiples en R a través de ejemplos.
Zoumana Keita 's photo

Zoumana Keita

Tutorial

Matriz de correlaciones en Excel: Guía completa para crear e interpretar

Aprende el concepto estadístico de correlación, y sigue el cálculo e interpretación de correlaciones para un conjunto de datos de muestra, en un tutorial paso a paso.
Arunn Thevapalan's photo

Arunn Thevapalan

Tutorial

Prueba Chi-cuadrado en hojas de cálculo

En este tutorial, aprenderás a realizar la prueba chi-cuadrado en hojas de cálculo.
Avinash Navlani's photo

Avinash Navlani

Ver másVer más