En un país en el que las personas solo quieren varones, todas las familias siguen teniendo hijos hasta que tienen un niño. Si tienen una niña, tienen otro hijo. Si tienen un niño, se detienen. ¿Cuál es la proporción de niños a niñas en el país?

Algo contrario a la intuición, a medida que aumenta el número de familias, la proporción esperada de niños a niños totales tenderá exactamente a la mitad, aunque la expectativa nunca será exactamente 1/2 en muestras finitas. (Siempre es un poco por encima de 1/2.)

La respuesta oficial dada por Google (citada en http://mathoverflow.net/question…) – que la proporción esperada es exactamente 1/2 – es incorrecta, al igual que su razonamiento para la respuesta [1]. Sin embargo, 1/2 es básicamente una respuesta razonable. Primero daré una explicación de esa respuesta que se basa esencialmente en todas las interpretaciones de la pregunta, y luego explicaré por qué no es la respuesta exacta en poblaciones finitas a la pregunta formulada anteriormente. (Me disculpo por el carácter un tanto descuidado de esta respuesta. Hay muchas perspectivas sobre el problema que quiero mencionar, pero su organización aquí está lejos de ser óptima).

La distribución que describe cuántos hijos tiene hasta el primer macho (inclusive) es la distribución geométrica con el parámetro p = 1/2 (http://en.wikipedia.org/wiki/Geo…) [2]. La media de esta distribución es 2 (y la varianza es igual a 2). Por lo tanto, el número medio de hijos por familia es 2. Según el Teorema del límite central, sabemos que a medida que el número total de familias n aumenta, el número total de niños será muy cercano a 2 n , el doble del número de familias . (El error en esta estimación será de orden [math] \ sqrt {n} [/ math], que es insignificante en relación con el número total de personas cuando n es grande). Por ejemplo, si tenemos 10,000 familias, entonces el error es del orden de unos pocos cientos, y el número total de niños sería entre 19.500 y 20.500 con alta probabilidad (más del 95%).

Cada familia tendrá exactamente un niño, para un total de n varones (con 10,000 familias, tenemos 10,000 varones). La división de 10,000 por aproximadamente 20,000 produce algo cercano a 1/2. Esto puede hacerse riguroso, y lo hago debajo del pliegue.

Sin embargo, la expectativa de la relación no es exactamente 1/2. Se espera que la proporción sea un poco más de 1/2. Para un cálculo exacto y más detalles sobre este efecto, consulte la maravillosa respuesta principal en http://mathoverflow.net/question…). Para ver la intuición básica, supongamos que la población tiene una sola familia. Con probabilidad 1/2, el porcentaje de niños en la población es del 100%. Con probabilidad 1/4, el porcentaje es del 50%. Con probabilidad 1/8 el porcentaje es del 33%. Y así. Sumando esto, se obtiene un 69% de niños en la familia, más del 50%. Esto muestra que para una población (muy) pequeña que consiste en una familia, el porcentaje esperado de niños es superior al 50%. Esto es cierto para todas las poblaciones con un número limitado de familias.

==
Detalles:

La controversia a la que se hace referencia en el enlace en los Detalles de la pregunta se produce porque el resultado en poblaciones pequeñas es diferente de la respuesta limitante a medida que el número de familias crece mucho. Todo se reduce a lo siguiente. Podemos definir una variable aleatoria X ( n ) para que sea el número total exacto de niños en la población con n familias completas (es decir, cada familia que ha producido su último hijo, un niño). La proporción de niños en esa población es la variable aleatoria [matemáticas] Y (n) = n / X (n) [/ matemáticas]. La expectativa de esta variable aleatoria (la proporción esperada de niños) definitivamente no es
[math] \ frac {n} {E [X (n)]} = \ frac {n} {2n} [/ math],
porque el operador de expectativa no conmuta con la división . El valor promedio de [math] 2n / X [/ math] no es el mismo que 2 n dividido por el valor promedio de X.

De hecho, debido a la convexidad de la función [math] f (x) = 1 / x [/ math], la desigualdad de Jensen promete que [math] E [Y (n)]> \ frac {n} {E [X ( n)]} = 1/2 [/ math], donde la desigualdad es estricta porque la distribución de Y ( n ) claramente no es degenerada. Así que el número esperado de niños no es exactamente 1/2; Es más. Si solo hay una familia, de modo que n = 1, entonces la fracción esperada de niños en la población (es decir, la familia) es de aproximadamente el 69% (http://mathoverflow.net/question…).

Sin embargo, al corregir cualquier [math] \ epsilon> 0 [/ math], cuando n es grande, el Teorema del límite central (http://en.wikipedia.org/wiki/Cen…) garantiza que la variable aleatoria X ( n ) está dentro de [math] n ^ {1/2 + \ epsilon} [/ math] de 2 n con probabilidad al menos [math] 1- \ epsilon [/ math]. Por lo tanto, la fracción esperada de niños será muy, muy cercana a 1/2 en grandes poblaciones. En particular, con probabilidad al menos [math] 1- \ epsilon [/ math], tendremos los límites

[math] \ frac {n} {2n + n ^ {1/2 + \ epsilon}} \ leq Y (n) \ leq \ frac {n} {2n-n ^ {1/2 + \ epsilon}}. [/mates]

Para n lo suficientemente grande, estas desigualdades implican que con probabilidad al menos [math] 1- \ epsilon [/ math].

[math] \ frac {1- \ epsilon} {2} \ leq Y (n) \ leq \ frac {1+ \ epsilon} {2} [/ math]

Por lo tanto, en realidad, la proporción realizada (aleatoria) de niños estará dentro de [math] \ epsilon [/ math] de 1/2 con probabilidad al menos [math] 1- \ epsilon [/ math]. Es un ejercicio fácil de derivar (usando el hecho de que Y ( n ) ha limitado el apoyo) que la expectativa también está dentro de [math] 2 \ epsilon [/ math] de 1/2 para n lo suficientemente grande.

La distribución exacta de Y ( n ) para muestras finitas se puede calcular fácilmente en una computadora, o analíticamente, y se puede ver que su expectativa converge rápidamente a 1/2 a medida que n crece. Sin embargo, Landsburg ganará su apuesta porque en su ejemplo (comenzar con cuatro familias y tener un hijo por año por familia durante treinta años), incluso la n final es bastante pequeña. Si empezáramos con 400 familias, Landsburg perdería su apuesta.

==

Para una gran discusión que contiene cálculos precisos de muestras finitas, que muestran que la proporción esperada de niños es mayor que 1/2 para cada n finita, consulte http://mathoverflow.net/question….

¿Cuál es la razón esencial detrás de la diferencia entre el cálculo de la muestra finita y el resultado asintótico? La observación clave es que la fracción esperada de niños en una familia es de aproximadamente el 69% . Y, de hecho, cuando reunimos a cualquier número de familias, el porcentaje esperado de niños estará por encima del 50%.

Para ver por qué la fracción esperada de niños en una familia es más del 50% , lo que es suficiente para ver la intuición clave, es útil considerar el siguiente experimento mental. Supongamos que llevamos un millón de familias. Haga una mesa alta, con una línea para cada familia. En la línea de cada familia, escriba el porcentaje de niños en la familia y el número de niños en la familia. Considera dos ejercicios.

(1) Sume los porcentajes y divídalos por un millón. Esto da el porcentaje promedio de niños en una familia.

(2) Multiplique cada porcentaje por el tamaño de la familia, sume los resultados y divídalo por la suma de los tamaños de la familia. Esto da el porcentaje de niños en la población.

Sabemos por lo anterior que la respuesta a (2) debería ser muy cercana al 50% porque la población es enorme. Tenga en cuenta que en el ejercicio (2), las familias con una mayoría de niños ganan menos peso en el promedio (porque son las más pequeñas). Si igualamos los pesos, que es exactamente lo que se hace en el ejercicio (1), entonces la respuesta llega a ser mayor al 50%.

==

[1] Al menos, su respuesta es incorrecta, suponiendo que el número total de hijos es una variable aleatoria no degenerada. Algunos argumentan que hay formas de interpretar la pregunta para que 1/2 sea la respuesta correcta. Vea los comentarios a continuación por Sridhar Ramesh y Jameson Quinn, así como la respuesta del usuario Quora. En mi opinión, las formalizaciones bajo las cuales 1/2 es la respuesta correcta (a la pregunta de cuál es la proporción esperada de niños en la población) no son naturales. De hecho, estoy bastante seguro de que (bajo interpretaciones razonables de todo) siempre que el tamaño total de la población sea aleatorio, 1/2 será incorrecto. El argumento de la desigualdad de Jensen en mi respuesta proporciona una razón para esto cuando el número de niños (el numerador) es determinista dado el tamaño de la población, pero creo que esto puede ser generalizado, aunque no sea trivial.

[2] Me refiero a la distribución geométrica que toma valores en el conjunto {1,2,3, …}. Esto supone que cada recién nacido es igualmente probable que sea un niño o una niña, y que el género es independiente en todos los nacimientos. Estoy ignorando a gemelos, trillizos, parejas sin hijos, etc. También estoy ignorando las dinámicas del ciclo de vida hablando como si todos los hijos de una familia aparecieran a la vez, tan pronto como existe la familia (esto equivale a ignorar a las familias que no lo son. Terminado con su maternidad). En poblaciones grandes, estos detalles se desvanecerán, por lo que no voy a atascar la respuesta con ellos. Pero es un buen ejercicio para comprobar eso.

Escribí la respuesta en Mathoverflow a la que se refiere Ben Golub. Aunque mi respuesta recibió un gran número de votos en MathOverflow, todavía hay mucha gente confundida sobre este problema. Por lo tanto, voy a añadir algunos comentarios. Algunos de estos también se incluyeron en una columna que escribí sobre este fenómeno para GammonVillage.

No hay un acuerdo universal sobre cómo formalizar la expresión “proporción esperada de niños a niñas”. Para un matemático, la proporción esperada significa que usted toma el promedio ponderado de las proporciones en todos los resultados posibles, ponderado por las probabilidades. Si elige interpretar “proporción esperada de niños a niñas” como “proporción de niños esperados a mujeres esperadas”, tendrá un problema mucho más simple y menos interesante. No diría que la interpretación es necesariamente un error fuera de las matemáticas, pero sería un error si no se da cuenta de que está cambiando el orden de las palabras, que asume que el interrogador no quiso decir lo que él o ella dijo. literalmente dicho.

Segundo, un promedio de números tiene sentido, al igual que un promedio de vectores. Sin embargo, ¿cuál es el promedio de proporciones? No tiene que significar nada: el promedio de las 4:00 AM, 8:00 PM y 12:00 del mediodía no significa nada para mí. Sin embargo, una interpretación razonable es que la proporción B: G significa la fracción B / (B + G). Esto tiene la ventaja de que la proporción invertida G: B tiene el valor complementario G / (B + G) = 1- (B / (B + G)). Con esta definición, podemos interpretar “la proporción esperada de niños a niñas” como el valor promedio de B / (B + G). Esto es lo que sucede si expresas una proporción como porcentaje; di que si hay 3 niños y 2 niñas, entonces la población tiene 60% de niños.

Supongamos que hay 100 familias siguiendo esta regla. Entonces, el número promedio de niños será de 100, y el número promedio de niñas de 100. Sin embargo, esto no significa que el valor promedio del porcentaje de niños sea de 50%, y no lo es.

Supongamos que solo hay dos posibilidades de una regla diferente: 100 niños y 80 niñas, o 100 niños y 120 niñas, y esto ocurre con la misma probabilidad de que el número promedio de niñas sea de 100. En el primer caso, la proporción de niños es de 100. / 180 = 55.56%. En el segundo caso la proporción de niños es 100/220 = 45.45%. La proporción esperada es (1/2) (5/9 + 5/11) = 50/99 = 50.51% que no es 50%. De modo que el número promedio de niñas igual al número promedio de niños no significa que la proporción esperada sea del 50%.

Si hay n familias que siguen esta regla, el número de niños B será n con probabilidad 1. El número de niñas G tendrá un valor promedio n. La desigualdad de Jensen nos dice que si tiene una función como [math] f (x) = \ frac {n} {n + x} [/ math] que es convexa (curvada hacia arriba), entonces [math] E [f (G )] \ ge f (E (G)) [/ math], con igualdad solo si la variable aleatoria G es constante. El número de chicas no es constante. Entonces, si evalúa [math] \ frac {n} {n + E [G]} = \ frac {1} {2} [/ math], obtendrá un valor más bajo que [math] E [\ frac {n } {n + G}] [/ math]. Para cualquier n, la proporción esperada [math] E [\ frac {n} {n + G}] [/ math] es mayor que [math] \ frac {1} {2} [/ math].

Es contradictorio para muchas personas que el valor esperado no sea exactamente 1/2. Entonces, la gente busca partes del modelo que no son realistas para culpar. Ajá, asumimos que las personas podrían tener miles de niñas si no tienen un niño, y eso no es realista. Sin embargo, el valor esperado de B / (B + G) aún no es 1/2, incluso si las familias se detienen después, digamos, del primer niño o la tercera niña. Esto tiene una aplicación para grabar en torneos, y eso podría ser más intuitivo para las personas.

Supongamos que perteneces a un club de backgammon. Cada semana, tienes un torneo de eliminación simple. Los 8 miembros del club se presentan cada vez, y cada uno tiene una oportunidad de 1/2 de ganar contra todos los demás jugadores. Suponga que mantiene registros y calcula la tasa promedio de victorias para cada jugador. Es bastante común que el promedio sobre los jugadores de esta tasa de victorias sea inferior al 50%, a pesar de que están jugando unos contra otros, y cuando alguien en el club gana, otro miembro del club pierde.

Por ejemplo, después del primer torneo, hay 4 jugadores que fueron eliminados en la primera ronda, con 1 derrota y 0 victorias, con una tasa de ganancia del 0%. Hay 2 semifinalistas con 1 derrota y 1 victoria, 50%. Hay un finalista perdedor con 1 derrota y 2 victorias, 67%. Hay un ganador, con 0 derrotas y 3 victorias, 100% victorias. El promedio ponderado es 4/8 * 0 + 2/8 * 50% + 1/8 * 67% + 1/8 * 100% = 33%. Las pérdidas de la primera ronda se ponderan más que las victorias de la primera ronda. Las pérdidas de la primera ronda son todos el récord de alguien. Las victorias de la primera ronda son 1/2 o 1/3 del récord de alguien.

Si recopila los resultados en varios torneos, la tasa de ganancias esperada aumentará. Sin embargo, no será igual a 1/2 después de un número finito de torneos. La correspondencia es que jugar n torneos de 3 rondas es equivalente a un país con n familias que paran después del primer niño o 3 niñas.

De manera similar, cuando ganas un doble como 6-6 en backgammon, es más probable que termines el juego rápidamente. Si tiene dados perfectamente justos, y calcula la proporción promedio de 6-6s a tiradas totales en un juego, no obtendrá 1/36 6-6s. Este efecto disminuye si se combinan varios juegos, pero aún así, los rollos que acortan los juegos se ponderan más que los rollos que prolongan los juegos. Es común que las personas prueben los dados mirando las estadísticas en juegos completos, pero es mejor mirar una muestra de un tamaño fijo.

La desviación de la proporción esperada de 1/2 en un país grande es insignificante, pero el fenómeno general de que los estimadores pueden estar sesgados es importante. La proporción de tus victorias en torneos y pérdidas está sesgada cuando juegas en torneos de eliminación simple. La proporción de niños: niñas en una familia o país puede estar sesgada. La calificación Elo actual de un jugador puede estar sesgada ya que los jugadores que sienten que sus calificaciones son altas tienden a jugar menos que aquellos que sienten que sus calificaciones son bajas. Cuando decide el punto de parada para una actividad, puede afectar la ponderación de los eventos que pueden sesgar el promedio, incluso si no hay control sobre el sexo del siguiente niño, o la siguiente tirada de dados, y no hay cambios en el probabilidad de ganar el siguiente partido. Creer que la respuesta debe ser 1/2, que no hay forma de sesgar una estadística controlando el punto de parada, es un grave error conceptual.

La respuesta de Ben Golub es excelente, pero tal vez un poco atemorizante para los estudiantes que no son matemáticos. Aquí hay una forma alternativa de verlo.

Puede calcular el número esperado de niñas en cada familia. Sabemos que cada familia tendrá exactamente un niño (porque después de eso, se detienen).

¿Cuál es la probabilidad de que una familia no tenga niñas? Bueno, es lo mismo que preguntar cuál es la probabilidad de que una familia tenga un niño de inmediato. 1/2.

¿Cuál es la probabilidad de 1 niña? Es 1/2 que inmediatamente obtienes una niña, y 1/2 que obtienes un niño después, así que 1/4.

¿Cuál es la probabilidad de 2 chicas? 1/2 * 1/2 * 1/2 = 1/8.

Estoy seguro de que ves el patrón aquí: tienes una oportunidad [math] 1 / n ^ 2 [/ math] para obtener [math] n – 1 [/ math] girls.

Entonces, el número esperado de chicas es solo la suma del número de chicas por la probabilidad de que obtengas tantas:

[math] (1/2) * 0 + (1/4) * 1 + (1/8) * 2 +… [/ math]

O

[math] (0/2) + (1/4) + (2/8) +… [/ math]

Aunque estoy seguro de que la comunidad matemática me rechazará por esto, la forma más fácil de demostrarte que esto es 1 es usar wolfram alpha: http://www.wolframalpha.com/input/?i = + (0/2) ++% 2B + (1/4) +% 2B + (2/8) +% 2B + …

(Si desea probarlo para usted mismo, establezca la suma en [math] S [/ math]:

[math] (0/2) + (1/4) + (2/8) +… = S [/ math]

Luego resta 2S de S:

[math] (0/2) + (1/4) + (2/8) +… – (0/1) – (1/2) – (2/4) – (3/8)… = S – 2S [/ math]

Reorganizar inteligentemente los términos:

[math] – (0/1) + (0/2) – (1/2) + (1/4) – (2/4) + (2/8) – (3/8) + …… = – S [/ math]

Reducir y notar el patrón:

[math] – (1/2) + – (1/4) + – (1/8) +… = -S [/ math]

Esa suma es bien conocida para converger en 1.

Para cualquier país de tamaño razonable, es decir, cientos de ciudadanos o más, la proporción de nacimientos en un período determinado debe ser estadísticamente indistinguible de la proporción de probabilidad. En realidad, hay un pequeño exceso de proporción de niños esperados; pero sería imposible detectar eso, incluso si tuviera una muestra de decenas de miles de países. La proporción de niños en exceso en un país muestreado en un tiempo aleatorio será solo una pequeña fracción de la proporción promedio de medio hijo por persona pronosticada por la respuesta de Ben Golub, que toma muestras solo después del nacimiento de niños.

Para ver por qué hay una proporción de exceso de niños, imagine una situación más simple. Un distrito escolar grande decide que todos los alumnos de primer grado realizarán un experimento en probabilidad: divididos en pares, uno invertirá un centavo por un minuto y el otro anotará los resultados. Ellos encuentran que el porcentaje promedio de cabezas para cada par es significativamente superior al 50%, pero el porcentaje total de cabezas es estadísticamente idéntico al 50%. ¿Que pasó? Investigando más a fondo, encuentran que todos los elementos en las secuencias, contando desde el principio, son 50/50; pero que el último artículo, donde sea que venga, es 60% probable que sea “H”. También encuentran que por cada “T”, hay un promedio de 1/3 más tiradas de monedas totales que por cada “H”. Se dan cuenta de que para sus alumnos de primer grado, lleva más tiempo escribir una “H” que una “T”, debido a la línea adicional involucrada, por ejemplo, 3 segundos en lugar de 2 segundos. Así que, en general, los equipos cuya secuencia termina con cabezas tienen menos tirones, y por lo tanto un porcentaje más sesgado, que aquellos cuya secuencia termina con colas; y esto equilibra exactamente el 60% “H” en la última posición.

(Pero si, al final del minuto, los niños escribieron la última letra que escribieron, entonces la proporción promedio sería de 50/50 nuevamente. Busque en los “casos limitantes” una demostración de este principio .)

Esto ayuda a comprender por qué la respuesta al problema original (proporción de niños y niños) no es necesariamente del 50%. La “moneda” (niño o niña) es justa, la secuencia (nacimientos en los últimos 80 años) es contigua, pero si la brecha después de que nace un niño es en promedio más larga que la brecha después de que nace una niña, entonces la La proporción medida en un momento dado será sesgada hacia los niños.

Entonces, ¿la brecha será más larga después del parto? Sí, pero apenas así. Después del nacimiento de un niño, hay una familia menos fértil de la que habría habido si hubiera sido un parto de niña. Por lo tanto, teóricamente hay un exceso de niños, pero en una cantidad indetectablemente pequeña.

(Anteriormente, escribí esta respuesta, incluido el siguiente cálculo, como si la brecha fuera solo más larga si no hubiera familias activamente fértiles, pero eso no es cierto. Los números a continuación son los números corregidos).

Para obtener números aproximados: para una población de tamaño n, habrá aproximadamente 1 / 2p extra varones, donde p es el número de mujeres que normalmente están “embarazadas o planeando” en cualquier momento. ** Si permite que se formen parejas de no miembros – nacimientos adyacentes, esa fracción extra se reduce aún más. Considere un pequeño país de alrededor (no exactamente) de 200 personas que viven a 80 y espacian a sus bebés por 2 años. La fertilidad activa, por lo tanto, dura un promedio de 4 años, 1/20 de la vida de la mitad de las personas que son mujeres, por lo que p es 1/40 de la población, 5 personas. El modelo de familias completas que Ben Golub explicó en su respuesta espera que el 50,25% de los niños, estadísticamente detectables en una muestra de unos pocos cientos de esos países (o censos decenales del mismo país). Mi modelo de estado estacionario espera aproximadamente 1/5 de esa desviación: 50,05% de niños. Eso es 25 veces (p al cuadrado) más difícil de detectar: ​​se necesitarían alrededor de diez mil censos independientes de esos países para distinguirlo del 50%.

** De acuerdo, en lugar de usar E [p], debes usar 1 / E [1 / (p + q)], donde q es un factor de fudge de alrededor de 1/2 para las parejas que pronto serán fértiles . Y tienes que corregir los numeradores para que eso no quede dominado por el escenario p = q = 0 no-new-mothers-Population-crash; o simplemente descontar ese escenario si es insignificante. Esto hace que los muchachos adicionales sean un poco más altos de lo calculado anteriormente. Una consideración similar es en lo que me había enfocado en mi versión anterior de esta respuesta, y calculé que agregó un 0.01% en el país de 200 personas discutido. Entonces tal vez debería estimar 50.06% de niños para mi modelo. Este factor de corrección pronto se volverá insignificante para poblaciones más grandes.

La controversia se deriva de la redacción descuidada (o la reinterpretación de las frases) de la pregunta prevista sin darse cuenta de que la redacción cambia la respuesta.

Las personas que creen que la respuesta es exactamente la mitad probablemente estén interpretando el problema de la siguiente manera: “¿Cuál es la proporción del número esperado de niños en relación con el número total esperado de niños (suponiendo una generación y el género de cada niño, a diferencia de realidad, es IID con p = 0.5)? ” La respuesta en este caso es exactamente la mitad.

Una frase alternativa, y la que se enumera en esta pregunta, es la siguiente: “¿Cuál es la proporción esperada del número de niños en relación con el número total de niños?” La respuesta a esto converge a la mitad para una población grande, pero es significativamente mayor que la mitad para las poblaciones pequeñas (esto es fácil de ver en el caso de una familia, que tiene una proporción esperada de 1 * 1/2 + 1 / 2 * 1/4 + 1/3 * 1/8 +… que es claramente mayor que 1/2).

La razón de la discrepancia es que cuando hay menos niñas, cada niño cuenta con una mayor proporción de la población, y este efecto se magnifica en poblaciones pequeñas.

Puede sonar raro, pero es aproximadamente 1: 1!

Supongamos que hay 100 parejas en el país.
Ahora, la probabilidad de que un niño sea niño o niña es 50:50.
Por lo tanto, de los primeros 100 niños, hay 50 niños y niñas cada uno. 50B, 50G.
Las 50 familias con una niña tendrán otro hijo, es decir, 25 niños y niñas cada uno. Cuenta: 75B, 75G.
Las 25 familias tendrán 13B y 12G (redondeadas por simplicidad). Cuenta: 88B, 87G.
A continuación, 6B y 6G. Cuenta: 94B, 93G.
A partir de entonces, 3B y 3G. Cuenta: 97B, 96G.
Segunda ronda: 2B, 1G. Cuenta: 99B, 97G.
La última familia también tendrá un niño entonces. Cuenta: 100B, 97G.


Probabilidad total = robProbabilidad del evento = 1/2 +1/4 +1/8 +… = 1

Ahora,
Se espera que ninguno de los chicos sea
= Σ Probabilidad del evento x Número de niños en ese evento
= 1/2 x1 + 1/4 x1 + 1/8 x 1 +….
= 1/2 + 1/4 + 1/8 + 1/16 +…
= 1
Se espera que ninguna de las chicas sea
= Σ Probabilidad del evento x Número de niñas en ese evento
= 1/2 x0 + 1/4 x1 + 1/8 x 2 + 1/16 x 3…. (Ver diagrama de árbol)
= 1/4 + 2/8 + 3/16 + 4/32…
= Sn
Sn = 1/4 + 2/8 + 3/16 + 4/32 +…
1 / 2x Sn = 1/8 + 2/16 + 3/32 + 4/64 +… (cambiando todos los términos a la derecha)
————————————————————-
Sn / 2 = 1/4 + 1/8 + 1/16 + 1/32 +… (Restar)

Sn / 2 = 1/4 x 2
Sn = 1/4 x 2 x 2 = 1

Se espera que ninguna de las chicas sea = 1.

Por lo tanto
Relación de no de Boys a Girls =
Se esperaba no de Boys = 1 = 1
No se espera de las chicas 1

Mi conclusión LÓGICA: Esa pregunta estaba directamente relacionada con la tradición india actual. Gracias por hacer esa pregunta . Todas las parejas no pueden tener dos hijos, un niño y otra niña. Creo que fue el esquema para mantener la proporción de sexos.
PERO pensamos que los niños son superiores a las niñas, por lo que una pareja tratará de tener al menos un niño. Ahora el aborto y toda esa mierda lo arruinó por completo.

La respuesta del usuario de Quora es probablemente la más limpia y convincente. También hay una respuesta “astuta” que es un poco más difícil de convencer de que es correcta, pero que en última instancia es más satisfactoria.

Cada vez que alguien tiene un hijo, la probabilidad de que sea niño o niña es [math] \ frac {1} {2} [/ math]. No importa quién está teniendo el niño.

Ahora, la expectativa de una suma de variables aleatorias es igual a la suma de las expectativas (nota: no importa si son independientes o no). Por lo tanto, el número total esperado de niños es [math] \ frac {N} {2} [/ math], donde [math] N [/ math] es el número total de hijos.

Tenga en cuenta que ninguna regla sobre cuándo comenzar o dejar de tener hijos cambiará esto, ya que la probabilidad de que un niño sea niño es [math] \ frac {1} {2} [/ math] sin importar quién dé a luz a ese niño . Obviamente la situación cambia si permitimos el infanticidio o algo así.

Incluso en una población infinita, la proporción no será del 50%.

Asumamos. ese

  • La proporción esperada de niñas: varones por nacimiento es 50:50.
  • Cada familia continuará teniendo hijos hasta que tenga un niño (creo que esta suposición puede ser relajada pero no lo he probado)

Defina [math] \ theta_i [/ ​​math] = probabilidad de que family [math] i [/ math] tenga un niño por cada nacimiento.

Defina [math] k [/ math] = número de familias.

[math] \ theta_i \ sim D [/ math] donde D es una distribución arbitraria.

El número esperado de hijos por familia será [math] C = E \ left [\ frac {1} {\ theta} \ right] [/ math]

El número de niños será [math] B = k [/ math]

Por lo tanto, el número de niñas será [math] G = k * \ left (C – 1 \ right) [/ math]

La proporción de chicas: niños será [math] E \ left [\ frac {1} {\ theta} \ right] – 1 [/ math]

[math] E \ left [\ frac {1} {\ theta} \ right] \ geqslant \ frac {1} {E \ left [\ theta \ right]} [/ math] debido a la desigualdad de Jensen y los dos son iguales iff [math] var \ left (\ theta \ right) = 0 [/ math]. Por lo tanto, la relación será mayor que uno casi con seguridad.

Voy a resumir algunas suposiciones antes de comenzar;
-Cada familia tiene una probabilidad de 0.5 de producir un niño, y una probabilidad de 0.5 de producir una niña con cada nacimiento, es decir, el sexo de cada niño es independiente del historial de nacimiento de esa familia (y de todas las demás familias de la población)
-Los niños son inmortales
-Cada familia ha terminado este proceso, es decir, ahora todos tienen el hijo que querían (esta suposición es innecesaria, pero simplifica un poco el problema)
Y, para simplificar, solo contaré a los niños nacidos de este proceso en mis cálculos de proporción Niño: Niña.

Claramente, el número esperado de niños en una familia es 1, escribamos E (b) = 1
Ahora simplemente viendo;
-El niño primogénito de una familia es un niño o una niña, con 0.5 probabilidad cada uno
-Que después de tener una niña, la familia repetirá el algoritmo como si no hubieran tenido a la niña.

Vemos eso:
E (g) = 0.5 * 0 + 0.5 * (1 + E (g))
Por lo tanto, E (g) = 1

Así que el número esperado de niñas y niños en una familia es el mismo.

Recuerdo esto de una prueba de matemáticas como estudiante universitario. La proporción es 1: 1 (asumiendo que P (niño) = .5, que no es muy preciso en la vida real).

Hay muchas maneras de pensar acerca de este problema, pero la más intuitiva para mí es comparar el número esperado de niños y niñas por familia.

EV (niño) = 1 (como se indica en la definición del problema)
EV (niña) = P (niña) + P (niña) ^ 2 + P (niña) ^ 3 …
= 1/2 + 1/4 + 1/8 +…
= 1

1: 1.

Específicamente,

(1/2 + 1/4 + 1/8 +…): (1/4 + 2/8 + 3/16 +…)

Desde que obtenemos (donde G = niña y B = niño):

B con probabilidad 1/2

GB con 1/4

GGB con 1/8, etc.

Al multiplicar el número de Bs por la probabilidad y la suma, se obtiene el LHS y de manera similar para los Gs se obtiene el RHS

Estoy haciendo las siguientes suposiciones:

1. La regla se sigue estrictamente.
2. Suponiendo que no hay infertilidad / los padres son fértiles para siempre.
3. Suponiendo que P (niño) = P (g) = 1/2 para una concepción aleatoria:
4. Suponiendo que los hijos solo nacen en una familia tradicional.

Para una familia determinada:

Número esperado de niños en un niño dado = 1 niño * 0.5 + 0 niños * 0.5 = 0.5 niños

Número esperado de niños hasta que nazca 1 niño = 2 (para cada niño tiene un promedio de 0.5 niños nacidos)

Dada esta regla, wxpected # of children = Expected # of boys + Expected # of girls

2 = 1 + Número esperado de niñas (ya que cada familia se detiene en 1 niño)

1 = Número esperado de niñas, que es el mismo # esperado para niños.

Así, la proporción de niños a niñas en la población será de 1: 1.

La probabilidad de tener un niño es igual que la probabilidad de tener una niña. Independientemente de la planificación familiar (es decir, tener un hijo hasta que tenga un hijo), el número de niños siempre será igual al número de mujeres.
La proporción esperada será 1: 1 . No veo ningún punto de cálculo aquí, ya que cuando uno planea dejar de tener hijos no cambiará la probabilidad de tener una niña o un niño.

Digamos que nos topamos a ciegas con un niño, ¿cuál es la probabilidad de que el niño sea un niño?

Es decir, encontrar P (Boy).

El tamaño de la familia del niño es importante; podría estar en una familia de niños (FQ) de tamaño 1, 2 o incluso 1000, así que …

P (Boy) = P (Boy of CF size 1) + P (Boy of CF size 2) + P (Boy of CF size 3) +…

= SUMA (1 a inf) [P (Niño de tamaño de CF i)]

¿Cómo calcular P (Boy of CF size i)?

Lo cambiamos: primero preguntamos “¿Es el niño de tamaño de FQ i?” y ENTONCES “Dado el tamaño i, ¿cuál es la probabilidad de que el niño sea el niño?”.

Es decir,

P (Chico de tamaño de CF i) = P (CF de tamaño i) * P (Chico, dado CF de tamaño i)

Subconsulta 1: ¿Qué es P (CF de tamaño i)?

P (CF> n) = P (los primeros n niños son niñas) = ​​(1/2) ^ n

P (CF = i) = P (CF> i – 1) – P (CF> i)
= (1/2) ^ (i – 1) – (1/2) ^ i
= (1/2) ^ (i – 1) * (1 – 1/2)
= (1/2) ^ i

Subconsulta 2: ¿qué es P (Boy, dado CF de tamaño i)?

Bueno, hay 1 hijos y 1 niño, entonces la respuesta es 1 / i.

Bueno, dónde estábamos.

P (Boy) = SUMA (1 a inf) [((1/2) ^ i) * (1 / i)]

Ok, entonces esto es bastante peludo. Pero un estudiante astuto de Calc 2 puede calcular esto. El valor de esta serie infinita es ln (2).

Es decir,

P (Niño) ~ 69.3%.

NOTAS
Para esta respuesta asumí que #children CF ~ Geo (1/2). En este supuesto, no me he tomado el tiempo como factor (descuidando la posibilidad de que las familias todavía estén teniendo hijos pero no hayan tenido un hijo). Si alguien distribuyera de otra manera la FQ, el proceso de pensamiento aún sería el mismo:

P (Chico)
= SUMA (1 a inf) [P (CF de tamaño i) * P (Niño, dado CF de tamaño i)]
= SUMA (1 a inf) [(1 / i) * P (CF = i)]
= E [1 / CF]

Las respuestas anteriores parecen hacer las cosas increíblemente complejas.
Si asumimos que todos los nacimientos son independientes entre sí, y que la probabilidad de que un bebé dado sea un niño es X% … entonces la proporción de niños en la población será de X%.

No importa si un bebé dado es un primer hijo, un segundo hijo o un undécimo hijo … las posibilidades siguen siendo X%.

Es solo si hay ‘marcadores genéticos’ en la población, por ejemplo, que hacen que algunas parejas tengan una probabilidad desproporcionada de tener niñas y otras con mayor probabilidad de tener niños, que la secuencia -> Stop Thing entra en juego.

Este rompecabezas es un buen ejemplo de cómo puede engañarse y pensar que los sistemas de apuestas cambiarán las probabilidades subyacentes. La probabilidad subyacente es que hay aproximadamente una probabilidad de 50/50 de que un bebé sea de cualquier sexo.
Si consideramos a los hijos primogénitos, la mitad son niños y la mitad niñas. Si consideramos a los segundos hijos, la mitad son niños y la mitad son niñas. El proceso de decisión de los padres sobre por qué deben tener un segundo hijo es irrelevante para el resultado. Lo mismo para 3er, 4to y nto.

Aunque un mundo de la vida real tendría muertes y nacimientos múltiples, siempre habría una cierta fracción de padres que tendrían una racha de partos femeninos que excedería cualquier límite dado. Como el ser humano no puede reproducirse para siempre, habría más niños que niñas.

Siempre se puede calcular matemáticamente la respuesta como 1: 1, pero aquí hay una explicación más intuitiva.
Llamemos al nacimiento de cualquier niño en el país un evento. La probabilidad de que el niño sea un niño es 0.5. Dado que cada evento es independiente de cualquier otro evento, la proporción de niños y niñas siempre será de 1: 1, sin importar la regla que se le ocurra. No importa si la familia quiere tener 1 o 2 o cualquier número de niños antes de que se detengan, la proporción siempre es 1: 1.
La única forma en que la proporción puede cambiar es si la probabilidad inherente de que el niño sea un niño al nacer es diferente de .5. Si esa probabilidad es p, entonces la relación se convierte en p: (1-p).
Así que, básicamente, podría llegar a una regla extremadamente complicada, que se vuelve difícil de resolver analíticamente. Con este enfoque puede concluir instantáneamente que la respuesta será p: (1-p).

Si asumimos que la probabilidad de que cualquiera de los dos sexos sea igual, entonces hay un 50% de probabilidad de que se detengan después de 1 niño, el 25% se detenga después de 2, el 12.5% ​​después de 3, etc., habrá un promedio de
[math] N = \ sum_ {n = 1} ^ {\ infty} \ left (\ frac {1} {2} \ right) ^ n \ cdot n = 2 [/ math]
Niños por familia. Como sabemos que solo hay un niño en cada familia, la proporción de niños y niñas es de 1: 1.