Sobre los límites del razonamiento lógico
Preludio
La Parte IV del libro es, con mucho, la más teórica, ya que se centra sobre la teoría de la inferencia estadística. Durante los próximos tres capítulos mi El objetivo es brindarle una [Introducción a la probabilidad] teoría, muestreo y estimación en el capítulo sobre [Estimación de cantidades desconocidas de una muestra] y estadística [Prueba de hipótesis]. Sin embargo, antes de comenzar, quiero para decir algo sobre el panorama general. La inferencia estadística es principalmente sobre el aprendizaje de los datos. El objetivo ya no es simplemente describir nuestros datos, sino utilizar los datos para sacar conclusiones sobre el mundo. Para motivar la discusión quiero pasar un poco de tiempo hablando sobre un rompecabezas filosófico conocido como el acertijo de la inducción, porque habla de un problema que aparecerá una y otra vez a lo largo el libro: la inferencia estadística se basa en suposiciones. esto suena como una cosa mala. En la vida cotidiana, la gente dice cosas como y las clases de psicología a menudo hablan de suposiciones. y sesgos como cosas malas que debemos tratar de evitar. de amargo experiencia personal he aprendido a nunca decir tales cosas alrededor filósofos!
Todo el arte de la guerra consiste en llegar a lo que está del otro lado de la colina, o, en otras palabras, en aprender lo que no sabemos de lo que hacemos. - Arthur Wellesley, primer duque de Wellington
Me dijeron que la cita anterior surgió como consecuencia de un carruaje cabalga por el campo.1 Él y su compañero, J. W. Croker, estaban jugando un juego de adivinanzas, cada uno tratando de predecir qué estaría al otro lado de cada colina. En todos los casos resultó que Wellesley tenía razón y Croker estaba equivocado. Muchos años después cuando Cuando se le preguntó a Wellesley sobre el juego, explicó que. De hecho, la guerra no es especial a este respecto. Toda la vida es una adivinanza juego de una forma u otra, y sobrellevar el día a día requiere que hagamos buenas conjeturas. Así que digamos que W se refiere a una victoria de Wellesley y C se refiere a una victoria de Croker. Después de tres colinas, nuestro conjunto de datos parece como esto:
\(WWW\)
Nuestra conversación es así:
tu: tres seguidos no es un poco de un jugador. Es informativo y no veo razón para preferir Wellesleys. Puedo organizar los datos en bloques de tres para que puedas ver qué lote corresponde a las observaciones que teníamos disponibles en cada paso en nuestro pequeño juego secundario. Después de ver este nuevo lote, nuestra conversación continúa:
tú: Seis victorias seguidas para Duke Wellesley. Esto está empezando a sentirse un un poco sospechoso Va a ganar el siguiente también.
yo: Supongo que no veo ninguna razón lógica por la que eso significa que está bien con mi elección.
Por segunda vez tuviste razón, y por segunda vez yo me equivoqué. Wellesley gana las siguientes tres colinas, extendiendo su récord de victorias contra Croker a 9-0. El conjunto de datos disponible para nosotros ahora es este: \(WWW\) \(WWW\) \(WWW\) Y nuestra conversación es así:
tu: Bien, esto es bastante obvio. Wellesley es mucho mejor en este juego. Ambos coincidimos en que habría dicho que todas eran igualmente probables. yo Asume que tú también lo habrías hecho, ¿verdad? Quiero decir, que no tienes idea?
tu:supongo que si
yo: pues entonces el observaciones que hemos encontrado hasta ahora, ares cambiado ¿después? Al comienzo de nuestro juego, te has encontrado con discriminado entre estas dos posibilidades. Por lo tanto, estos dos posibilidades siguen siendo igualmente plausibles y no veo ninguna razón lógica para prefieren uno sobre el otro. Así que sí, aunque estoy de acuerdo contigo en que Wellesleyt pensar en un buena razón para pensar que todavía está dispuesto a correr el riesgo. Su racha ganadora continúa durante las próximas tres colinas. El puntaje en el juego Wellesley-Croker ahora es 12-0, y el puntaje en nuestro juego ahora es 3-0. A medida que nos acercamos a la cuarta ronda de nuestro juego, nuestro conjunto de datos es este: \(WWW\) \(WWW\) \(WWW\) \(WWW\) y la conversación continúa:
tu: ah si! Tres victorias más para Wellesley y otra victoria para mí. ¡Admítelo, tenía razón sobre él! Supongo que mojado sé qué pensar. me siento como húmedo ya descartado, \(WWW\) \(WWW\) \(WWW\) \(WWW\) \(C\) y \(WWW\) \(WWW\) \(WWW\) \(WWW\) \(W\). ¿Son estos dos? igualmente sensato dado que nuestras observaciones aportan la evidencia lógica de que la racha continuará?
tu: creo que eres el experto en estadisticas y estás perdiendo. Estoy ganando. Tal vez tú debería cambiar de estrategia.
yo: Hmm, ese es un buen punto y no me temo que no he observado que es una serie de tres victorias para ti. Sus datos se verían así: \(YYY\). Lógicamente, yo no pareces mucho evidencia, y no veo ninguna razón para pensar que su estrategia está funcionando nada mejor que el mío. Si no fuera mejor en ¿nuestro?
tú: Bien, ahora creo que ves la evidencia lógica de eso.
Aprender sin hacer suposiciones es un mito
Hay muchas maneras diferentes en las que podríamos diseccionar este diálogo, pero dado que este es un libro de estadísticas dirigido a psicólogos y no una introducción a la filosofía y psicología del razonamiento, Lo que he descrito anteriormente se refiere a veces a como el enigma de la inducción. Parece totalmente razonable pensar que un El récord de victorias de 12-0 de Wellesley es una evidencia bastante sólida de que lo hará. ganar el juego 13, pero no es fácil proporcionar una lógica adecuada justificación de esta creencia. Por el contrario, a pesar de la obviedad de la respuesta, no tiene ninguna justificación lógica de.
El enigma de la inducción está más asociado con el trabajo filosófico de David Hume y, más recientemente, de Nelson Goodman, pero puedes encontrar ejemplos del problema que surge en campos tan diversos como la literatura (Lewis Carroll) y aprendizaje automático (el teorema). Realmente hay algo raro en tratar de. El punto crítico es que las suposiciones y los sesgos son inevitables si quieres aprender algo sobre el mundo. No hay escape de esto, y es tan cierto para la estadística inferencia como lo es para el razonamiento humano. En el diálogo yo apuntaba en sus inferencias perfectamente sensibles como un ser humano, pero el común sentido de razonamiento en el que confiaste no es diferente a lo que un hubiera hecho un estadístico. Tu mitad del diálogo se basó en una suposición implícita de que existe alguna diferencia en habilidad entre Wellesley y Croker, y lo que estabas haciendo era intentar para averiguar cuál sería esa diferencia en el nivel de habilidad. My rechaza esa suposición por completo. Todo lo que estaba dispuesto a aceptar es que hay secuencias de victorias y derrotas y eso no lo sabia qué secuencias se observarían. A lo largo del diálogo mantuve insistiendo en que todos los conjuntos de datos lógicamente posibles eran igualmente plausibles al comienzo del juego Wellesely-Croker, y la única forma en que puedo alguna vez revisé mis creencias fue eliminar esas posibilidades que eran objetivamente inconsistente con las observaciones.
Eso suena perfectamente sensato en sus propios términos. De hecho, incluso suena como el sello distintivo del buen razonamiento deductivo. Como Sherlock Holmes, mi enfoque era descartar lo que es imposible con la esperanza de que lo que quedaría es la verdad. Sin embargo, como vimos, descartando lo imposible nunca me llevó a hacer una predicción. En sus propios términos todo lo que dije en mi mitad del diálogo fue completamente correcta. Una incapacidad para hacer cualquier predicciones es la consecuencia lógica de hacer. En al final perdí nuestro juego porque hiciste algunas suposiciones y esas las suposiciones resultaron ser correctas. La habilidad es una cosa real, y porque creíste en la existencia de la habilidad fuiste capaz de aprender que Wellesley tenía más que Croker. ¿Había confiado usted en un menos sensato suposición para impulsar su aprendizaje, es posible que no haya ganado el juego.
En última instancia, hay dos cosas que debes quitar de esto. Primero, como a menudo señalaré las suposiciones que sustentan una técnica estadística particular, y cómo se puede verificar si esos las suposiciones son sensatas.