Teoría de Numeros
Teoría de Numeros
Este libro ha sido escrito para estudiantes de tercer y cuarto año de matemáticas; esta destinado
como un texto básico para cursos de un semestre en teoría de conjuntos o de fundamentos de
matemáticas.
Existe una vasta literatura de libros de texto elementales en la que la teoría de conjuntos es
tratada desde un punto de vista intuitivo. Esto puede ser excusado, e incluso puede ser deseable,
en el nivel de secundaria; pero no hay justificación para la enseñanza de una teoría que se sabe
es inconsistente a nivel universitario. La teoría de conjuntos se debe presentar en el marco de un
sistema axiomático; sin embargo, ya que cada profesor que ha impartido este curso sabe, que es
difícil elegir una axiomatización de la teoría de conjuntos que sea a la vez simple y fácil de motivar
para estudiantes de pregrado. La principal desventaja de la teoría de Zermelo-Fraenkel es que las
principales dificultades conceptuales aparecen al principio, cuando el estudiante es menos capaz de
hacer frente a ellas. Por ejemplo, se necesita demostrar que la unión y el producto cartesiano de
dos conjuntos cualesquiera existen, que existen el dominio y el rango de una función arbitraria, y
así sucesivamente. Por otro lado, aunque las axiomatizaciones del tipo Von Neumann-Gödel son
más sutiles y abstractas, se pueden hacer ver bastante natural para el principiante (si se maneja
con cuidado) y, lo más importante de todo, las principales dificultades conceptuales pueden ser
postergadas para muy tarde en el curso.
El presente texto se inicia con una breve reseña del crecimiento de la teoría de conjuntos, con
especial énfasis en los problemas que llevaron al desarrollo de los distintos sistemas de la teoría
axiomática de conjuntos. Estos sistemas se comparan, y sus principales ventajas y desventajas se
ii
iii
estudian. En el capítulo siguiente, se introducen las nociones indefinidas y los axiomas elementales
de la teoría de conjuntos. La axiomatización que se utiliza aquí es una adaptación del sistema de
Von Neumann-Bernays-Gödel. Todos los objetos de la teoría se denominan clases; el estudiante es
instruido para pensar en una clase como una “colección de objetos” en el sentido usual. Sin embargo,
por razones que se explican cuidadosamente en la Introducción, se debe hacer una distinción entre
las clases y los conjuntos: todo conjunto es una clase, pero no todas las clases son conjuntos. En
particular, se aconseja al lector a pensar en conjuntos como colecciones que no son tan amplias como
para dar lugar a las “paradojas.” Las propiedades particulares de conjuntos no son enfatizadas hasta
más tarde en el libro; y como resultado, el Capítulo 1 contiene un desarrollo del álgebra de clases
que es difícilmente distinguible del desarrollo intuitivo del álgebra de conjunto que se encuentra en
un texto elemental. Los tres capítulos siguientes, sobre funciones, relaciones, y clases parcialmente
ordenadas, respectivamente, dan un tratamiento relativamente ortodoxo de estos temas; el hecho de
que llamamos a nuestros objetos clases en lugar de conjuntos no nos obliga a alterar en modo alguno
el desarrollo estándar de estas ideas.
Para recapitular, entonces, el sistema axiomático utilizado en este libro permite presentar las
propiedades elementales de las clases, funciones, relaciones y orden de una manera que no difiere
sustancialmente del tratamiento intuitivo común de estos temas. Después de esto, la diferencia entre
las clases y los conjuntos se reafirma, y se le recuerda al lector las cosas que se pueden hacer con los
conjuntos pero que no se puede hacer con las clases excepto en el riesgo de producir “paradojas”. A
partir de ahora, el libro trata principalmente con conjuntos. El Axioma de Elección es introducido,
y se demuestra que es equivalente al Lema de Zorn y al teorema del buen orden. Los números
naturales se presentan, seguido por un capítulo dedicado a las propiedades de los conjuntos infinitos
y numerables. A continuación se introducen los cardinales transfinitos y los números ordinales.
Es bastante habitual, hoy en día, presentar la aritmética transfinita a los estudiantes de cursos
superiores de una manera “abstracta”, más o menos de la siguiente manera: se construye la clase
de los números ordinales, seguido por una prueba del teorema de recursión transfinita; se definen
operaciones sobre los ordinales a través de recursión transfinita y las propiedades de estas operaciones
son entonces demostradas inductivamente; por último, los números cardinales se introducen como
ordinales iniciales. Si bien este enfoque es elegante y, de hecho, eminentemente correcto, es en muchas
maneras pedagógicamente erróneo, especialmente en un curso para estudiantes de pregrado. En
efecto, el concepto de números cardinales y ordinales es concreto, tangible y fácil de motivar; parece
una gran pena ocultar la simplicidad subyacente de estos objetos en un sistema formal donde ellos
son tratados, en esencia, como símbolos abstractos.
En el presente texto, los números cardinales se introducen antes de los números ordinales. El
concepto de número cardinal se explica de la siguiente manera: los números naturales, en su condición
de cardinales, sirven como un conjunto de normas para medir el “tamaño” de cada conjunto finito.
Una extensión natural de esta idea, la clase CD de todos los números cardinales sirve como un
conjunto de normas para medir el “tamaño” de cada conjunto. En el Capítulo 8, la clase CD de los
cardenales se define como una clase con la siguiente propiedad: para cada conjunto A, existen un
único elemento a ∈ CD y una función biyectiva de A en a. La existencia de la clase de todos los
cardinales se asegura por medio de un axioma provisional (a retirar después) llamado Axioma de
Cardinalidad. La aritmética de los cardinales es entonces presentada usando las propiedades de las
iv
funciones biyectivas.
Los números ordinales se tratan de una manera similar. Se presentan como una extensión natural
del concepto simple de ordinalidad finita. Se le explica al lector que la clase OR de todos los números
ordinales sirve como un conjunto de normas para designar la “posición” de cualquier elemento en
cualquier conjunto bien ordenado. Al inicio del Capítulo 9 la clase OR se define como una clase con
la siguiente propiedad: si A es cualquier conjunto bien ordenado, existe una única α ∈ OR tal que
A es semejante a α; la existencia de la clase OR se garantiza por medio de un axioma provisional
llamado el Axioma de Ordinalidad. La aritmética de los ordinales se presenta entonces, usando las
propiedades de semejanza de los conjuntos bien ordenados.
En la última sección del capítulo 9, —una sección que puede ser omitida por estudiantes que
no están suficientemente avanzados— la clase OR de los números ordinales se construye utilizando,
esencialmente, el método bien conocido debido a Von Neumann. Se muestra que la clase de los or-
dinales iniciales puede ser usada como la clase CD de los cardinales. Por último, en el Capítulo 10,
el cual puede ser totalmente omitido por los estudiantes más lentos, se demuestra el teorema de
recursión transfinita, y se muestra que cada una de las operaciones sobre los ordinales tiene una defi-
nición equivalente usando recursión transfinita. A continuación se presentan varios temas avanzados,
terminando con una discusión de ordinales y cardinales inaccesibles.
Estoy en deuda con varios revisores anónimos por sus valiosas sugerencias, que he incorporado
a mi manuscrito. Agradezco a Addison-Wesley para su experta edición y por su paciencia y ayuda
para tener este manuscrito listo para producción.
Lewisburg, Pennsylvania
November 1970
Índice general
Prefacio ii
1. Introducción Histórica 1
2. Clases y Conjuntos 20
2.5. Gráficas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.7. Conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3. Funciones 39
3.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
v
vi Índice general
Introducción Histórica
El paso más audaz que Cantor había dado —a los ojos de sus contemporáneos— fue el uso de
conjuntos infinitos, que él consideraba como algo no menos natural que el uso de conjuntos finitos.
La cuestión del infinito había sido durante mucho tiempo uno de los problemas más sensibles de las
matemáticas. Indudablemente, el lector esta familiarizado con la famosa paradoja de Zenón, en la que
un segmento de recta de longitud uno se divide en subintervalos por los puntos 1/2, 1/4, 1/8, 1/16,
etc. Cada subintervalo —no importa cuán pequeño sea— tiene una longitud definida distinta de
cero, y hay un número infinito de subintervalos; entonces, la conclusión aparentemente paradójica
de que un número infinito de longitudes, diferentes de cero, se pueden sumar para producir una
longitud finita. Para evitar este tipo de trampas, los matemáticos clásicos hicieron una distinción
entre el infinito real —en la que un número infinito de objetos son concebidos como existentes al
mismo tiempo— y el infinito virtual, que es simplemente el riesgo de sobrepasar cualquier cantidad
1
2 Capítulo 1. Introducción Histórica
finita dada. El infinito virtual fue considerado como seguro, por lo tanto, admisible, mientras que el
infinito real era tabú.
No es de extrañar entonces, que la teoría de Cantor —con su uso desinhibido de los conjuntos
infinitos (la noción de infinito fue obviamente entendida aquí en el sentido “real”)— no fue inme-
diatamente aceptada por sus contemporáneos. Fue recibido al principio con escepticismo, algunas
veces incluso con abierta hostilidad. Sin embargo, por la década de 1890 las partes más “sabrosas”
de la teoría de Cantor fueron ampliamente utilizadas, ya que proporcionan un marco elegante para
una gran variedad de teorías matemáticas. Y antes del cambio de siglo, hasta los aspectos más re-
volucionarios de la teoría de conjuntos habían sido aceptados por un gran número de matemáticos
—principalmente debido a que resultaron ser herramientas muy valiosas, particularmente en análisis.
Fue en este momento crucial en la evolución de las ideas sobre los fundamentos de las matemáticas
que Dedekind, en su pequeño libro Was sind und was sollen die Zahlen (1888), reveló que el concepto
de los números naturales puede ser derivado de los principios básicos de la teoría de conjuntos. Una
manera moderna para mostrar esto es la siguiente: Sea “0” el conjunto vacío (es decir, el conjunto
que no tiene elementos, denotado por el símbolo ∅); “1” se define como el conjunto {∅}, es decir, el
conjunto (de conjuntos) que contiene el elemento ∅. Entonces, “2” se define como el conjunto {0, 1},
“3” se define como {0, 1, 2}, y así sucesivamente. Todas las propiedades de los números naturales se
pueden probar usando estas definiciones y teoría de conjuntos elemental.
A finales del siglo, entonces, la teoría de conjuntos no sólo había sido aceptada como una herra-
mienta indispensable por gran parte de la comunidad matemática, sino que además, se convirtió en
una seria contendiente por la posición de primacía entre las ciencias matemáticas.
Irónicamente, en el mismo momento en que las ideas de Cantor parecían finalmente haber ganado
aceptación, la primera de ciertas “paradojas” fue anunciada, lo cual eventualmente emitió serias dudas
en cuanto a la solidez de la teoría de conjuntos en su forma “Cantoriana”. Estas paradojas tuvieron
tan amplia repercusión que vale la pena mirar con cierto detalle.
1.2. Las Paradojas 3
Entre 1895 y 1910 una serie de contradicciones se descubrieron en varias partes de la teoría de
conjuntos. Al principio, los matemáticos prestaron poca atención a ellas; estas contradicciones fueron
llamadas “paradojas” y consideradas como poco más que curiosidades matemáticas. La primera de
las paradojas fue publicada en 1897 por Burali-Forti, pero esta ya había sido descubierta, dos años
antes, por el propio Cantor. Dado que la paradoja de Burali-Forti apareció en una parte bastante
técnica de la teoría de conjuntos, se esperaba, en primer lugar, que una ligera alteración de las
definiciones básicas sería suficiente para corregirla. Sin embargo, en 1902, Bertrand Russell dio una
versión de la paradoja la cual involucró los aspectos más elementales de la teoría de conjuntos, y
por tanto no podría ser ignorada. Durante los años siguientes se descubrieron otras contradicciones,
que parecían desafiar muchas de las nociones más “seguras” de las matemáticas.
Las “paradojas” de la teoría de conjuntos son de dos tipos diferentes, unas llamadas paradojas
lógicas, las otras llamadas paradojas semánticas. La razón de los nombres “lógicas” y “semánticas”
será clara para nosotros cuando hayamos visto algunos ejemplos de estas paradojas; básicamente,
las paradojas “lógicas” surgen de la lógica defectuosa mientras que las paradojas “semánticas” se
derivan de la utilización inadecuada del lenguaje.
Vamos a dedicar el resto de esta sección a la presentación de dos de las paradojas más célebres,
las cuales involucran sólo conceptos elementales de teoría de conjunto. La primera es una paradoja
“lógica”, la segunda es una paradoja “semántica”; ambas pueden ser consideradas como típicas de
su clase. La más simple de las paradojas lógicas es la paradoja de Russell, que puede describirse de
la siguiente manera:
Si A es un conjunto, sus elementos pueden ser ellos mismos conjuntos; esta situación se produce
con frecuencia en las matemáticas, por ejemplo, A puede ser un conjunto de líneas, donde cada línea
se considera como un conjunto de puntos. Ahora surge la posibilidad de que A puede ser un elemento
de sí mismo; por ejemplo, el conjunto de todos los conjuntos tiene esta propiedad. Sea S el conjunto
de todos los conjuntos que no son elementos de sí mismos. ¿Es S un elemento de sí mismo? Bueno,
si S es un elemento de S, entonces —por la definición misma de S— S no es un elemento de S. Si S
no es un elemento de S, entonces (de nuevo, debido a la forma en que se define S) S es un elemento
de S. Por lo tanto, hemos demostrado que S es un elemento de S si y sólo si S no es un elemento
de S —una contradicción del tipo más fundamental.
Por lo general, en las matemáticas, al llegar a una contradicción de este tipo, nos vemos obligados
a admitir que una de nuestras hipótesis era errónea. En este caso, nos lleva a la conclusión de que
o bien no tiene sentido hablar de un conjunto como elemento de sí mismo, o que no existe una cosa
tal como el “conjunto de todos los conjuntos que no son elementos de sí mismos”. Volveremos a esta
cuestión luego; y mientras tanto, vamos a decir algunas palabras acerca de las paradojas semánticas.
La típica de las paradojas semánticas es la paradoja de Berry:
Para efectos de argumentación, vamos a admitir que todas las palabras del idioma Español están
listadas en algún diccionario estándar. Sea T el conjunto de todos los números naturales que se
pueden describir en menos de veinte palabras del idioma Español. Puesto que hay sólo un número
4 Capítulo 1. Introducción Histórica
finito de palabras en Español, sólo hay un número finito de combinaciones de menos de veinte de
tales palabras —esto es, T es un conjunto finito. Obviamente, entonces, hay números naturales que
son mayores que todos los elementos de T ; por tanto, existe un menor número natural que no puede
ser descrito en menos de veinte palabras del idioma Español. Por definición, este número no está en
T , sin embargo, lo hemos descrito en dieciséis palabras, por lo tanto está en T .
Una vez más, nos encontramos con una contradicción evidente; ya que el argumento anterior
sería intachable si admitimos la existencia del conjunto T , nos lleva irrevocablemente a la conclusión
de que el conjunto T simplemente no puede existir.
Antes de las paradojas, la cuestión de la existencia de conjuntos nunca se había planteado. Cantor
“definió” un conjunto como “una colección de objetos definidos, distinguibles de nuestra percepción
que puede ser concebida como un todo”. Más específicamente, Cantor y sus primeros seguidores
aceptaron la noción de “sentido común” de que si podemos describir una propiedad de los objetos
y que también podemos hablar de un conjunto de objetos que poseen esa propiedad. Las paradojas
tuvieron el mérito singular de probar que esta concepción ingenua de conjuntos es inaceptable —
aunque sólo sea porque ciertas “propiedades” conducen a conjuntos paradójicos.
En los diversos movimientos que surgieron, a principios de 1900, con el propósito de la revisión
de los fundamentos de la teoría de conjuntos, el tema de preocupación central era la existencia
de conjuntos. ¿Qué propiedades definen a los conjuntos legítimamente? Bajo qué condiciones esas
propiedades definen a los conjuntos en absoluto? ¿Cómo se pueden formar nuevos conjuntos de los
ya existentes?
La aparición de las paradojas marcó el inicio de una crisis en los fundamentos de las matemáticas
la cual no ha sido completamente resuelta hasta nuestros días. Quedó muy claro que la concepción
intuitiva de un conjunto, plasmada en la “definición” de Cantor, no proporciona una base adecuada
para la teoría de conjuntos —mucho menos para las matemáticas en su totalidad. Intentos meno-
res para eliminar las paradojas excluyendo determinados tipos de conceptos y definiciones fueron
condenados al fracaso; se necesitaba nada menos que un enfoque completamente nuevo. Alrededor
de 1905, se propusieron varias formas de lidiar con el problema, las cuales fueron desarrolladas por
sus adeptos; la mayoría de ellos se pueden clasificar en tres grupos principales, llamados la escuela
“axiomática,” la escuela “logicista,” y la escuela “intuicionista.” El resto de este capítulo está dedi-
cado a la presentación de estas tres formas de pensamiento. Primero, sin embargo, vamos a repasar
brevemente el desarrollo del método axiomático.
El método axiomático en las matemáticas surgió en una forma altamente desarrollada, alrededor
del año 300 a. C., con la aparición de los Elementos de Euclides. Aunque el método popularizado
por Euclides se ha convertido en un rasgo característico de todas las ramas de las matemáticas hoy
en día, sólo en años relativamente recientes ha sido aplicado fuera de la geometría. Por esta razón,
nuestra comprensión moderna de los sistemas axiomáticos y del razonamiento deductivo en general,
ha salido, en gran parte, de los estudios en el campo de la geometría. Vale la pena examinar algunos
1.3. El Método Axiomático 5
de las principales desarrollos en la geometría que influyeron en el crecimiento del método axiomático.
Para Euclides y su época, los axiomas y postulados representan “verdades” cuya validez es incues-
tionable. Por ejemplo, fue esta creencia en la verdad absoluta de las proposiciones geométricas la que
condujo a la milenaria controversia sobre el “postulado de las paralelas” de Euclides. Este postulado
afirma que si dos rectas, A y B, intersectan a una tercera recta C, y si los ángulos interiores que A y
B forman con C (en un lado determinado de C) suman menos que dos ángulos rectos, entonces A y
B necesariamente se intersectan. Debido a que esta afirmación parecía ser “obviamente cierta” —sin
embargo le falta la simplicidad concisa de los otros axiomas y postulados— los geómetras desde
Euclides hasta la década de 1700 intentaron en vano demostrarlo a partir de los supuestos restantes.
Sólo en la segunda mitad del siglo XIX la cuestión fue resuelta cuando Bolyai y Lobachevski, cada
uno, reemplazando el postulado de las paralelas por un supuesto que lo contradecía, desarrollaron
“geometrías no Euclidianas.” Las geometrías no Euclidianas mostraron ser no menos consistente que
la geometría Euclidiana, ya que ellas podrían dar interpretaciones euclidianas (es decir, mediante la
reinterpretación adecuada de “punto,” “línea,” “ángulo,” y así sucesivamente, los postulados de Bolyai
o Lobachevski pueden hacerse para mantener la geometría Euclidiana). Por lo tanto, el postulado
de las paralelas no solamente es independiente de los otros axiomas y postulados del sistema de Eu-
clides, sino que se pueden fundar geometrías alternativas, igualmente consistentes, que no describan
el espacio de nuestra experiencia cotidiana. Con esto vino el reconocimiento de que los axiomas no
son “verdades universales,” sino que son afirmaciones de lo que deseamos utilizar como premisas de
un argumento.
Quizás el mayor defecto de los elementos es el número de supuestos tácitos hechos por Euclides —
supuestos no otorgados por los postulados. Por ejemplo, en una determinada demostración se supone
que dos círculos, cada uno pasando por el centro del otro, tienen un par de puntos en común —sin
embargo, los postulados no establecen la existencia de estos puntos. Por otra parte, Euclides habla
de un punto que está entre otros dos, sin embargo, no define “estar entre” ni postula alguna de sus
propiedades. Otros argumentos en los elementos involucran el concepto de movimiento rígido —un
concepto que no está definido o mencionado en los postulados. Así, a lo largo de Euclides, la cadena
ordenada de las inferencias lógicas se rompe con frecuencia por las apelaciones tácitas a pruebas
visuales. Con el descubrimiento de estas lagunas, sobre todo en el siglo XIX, creció el entendimiento
de que un argumento matemático debe ser capaz de seguir adelante sin la mediación de la intuición
espacial o de otra intuición; que ciertos objetos y relaciones (tales como “punto,” “recta,” “estar entre”)
deben ser consideradas como nociones no definidas y sus propiedades totalmente especificadas; y que
la deducción es, de una manera muy esencial, independientemente del significado de los conceptos.
En 1882, M. Pasch publicó la primera formulación de la geometría en la que la exclusión de cualquier
apelación a la intuición se expresa claramente como un objetivo y realizada sistemáticamente.
A finales del siglo XIX, entonces, una concepción moderna del método axiomático comenzó a
emerger. En sus líneas generales, no fue diferente de las ideas sostenidas por Euclides: una teoría
matemática es “axiomática” si ciertas afirmaciones se seleccionan para ser “axiomas,” y todas las
demás proposiciones de la teoría se derivan de los axiomas por inferencias lógicas. Sin embargo,
hubo un nuevo entendimiento de la naturaleza formal de la demostración matemática. En la medida
de lo posible, los axiomas deben ser lo suficientemente detallados, y las reglas de deducción lógica
lo suficientemente explícitas, que ni la intuición, ni la inteligencia sean necesarias para seguir los
6 Capítulo 1. Introducción Histórica
pasos de una demostración. Idealmente, debería ser posible para una computadora verificar si una
demostración es correcta o no.
Mientras las matemáticas se formulan en los idiomas comunes, tales como Inglés, la comprensión
humana es indispensable para la interpretación de afirmaciones y la búsqueda de la estructura de
oraciones complejas. Por lo tanto, si la intuición debe ser eliminada por completo de la demostración
matemática, una condición esencial es el desarrollo de un lenguaje matemático formal : las “reglas” de
este lenguaje deben ser estrictamente codificadas, de modo que cada afirmación no sea ambigua y que
su estructura sea clara. La creación de lenguajes simbólicos, formales fue uno de los acontecimientos
más importantes de la matemática moderna, he aquí como luce dicho lenguaje.
“X es paralelo a Y ,”
“y esta entre x y z,”
“X es un conjunto abierto,” etc.
Son afirmaciones acerca de un objeto, un par de objetos, o más generalmente, sobre una n-tupla
ordenada de objetos. Estas afirmaciones se denominan predicados elementales, y las letras X, Y, x, y, z
son llamadas sus variables.
Es conveniente denotar un predicado por una sola letra seguida por la lista de sus variables. Así,
“X es paralelo a Y ” se puede escribir A(X, Y ), “y esta entre x y z” puede ser escrito B(x, y, z), y
así sucesivamente. Ahora el estudiante maduro es consciente del hecho de que el “significado” de un
predicado es irrelevante en el proceso del razonamiento matemático. Por ejemplo, el “significado” de
la palabra paralelo no influye en el curso de una discusión geométrica; lo único que importa es la
relación entre la afirmación “X es paralelo a Y ” y otras afirmaciones como “X intersecta a V ” y “Y
es perpendicular a Z.” Por esta razón, los predicados elementales también son llamados fórmulas
atómicas; dichas fórmulas atómicas son integrales, “indivisibles,” para no seguir analizando, ellas son
sólo para distinguirse la una de la otra.
Es un hecho notable que cada rama conocida de las matemáticas requiere sólo un número finito
(por lo general un número muy pequeño) de distintos predicados elementales. Por ejemplo, toda
afirmación de la geometría Euclidiana plana puede ser expresada en términos de los siguientes
predicados básicos:
P (x) : x es un punto.
L(x) : x es una recta.
B(x, y, z) : y está entre x y z.
E(x, y) : x es igual a y. (1.1)
I(x, y) : x pertenece a y.
C(u, v, x, y) : el segmento uv es congruente con el semento xy.
D(u, v, w, x, y, z) : el ángulo uvw es congruente con el ángulo xyz.
La teoría de conjuntos, como veremos, puede ser formulada en su totalidad en términos del predicado
x ∈ A (x es un elemento de A).
1.3. El Método Axiomático 7
Los predicados por sí solos no son suficientes para expresar todas las afirmaciones de las ma-
temáticas, al igual que los nombres por sí solos serían insuficientes para escribir las oraciones en
Español. Por ejemplo, tal vez queramos decir que si “x es paralelo a y” e “y es perpendicular a z,”
entonces “x es perpendicular a z.” Dichas afirmaciones se componen de predicados unidos mediante
conectivos lógicos. Por lo tanto, si P y Q son afirmaciones en nuestro idioma, también lo son las
siguientes:
¬P : no P .
P ∧ Q : P y Q.
P ∨ Q : P o Q.
P ⇒ Q : P implica Q.
P ⇔ Q : P si y sólo si Q.
Por último, tal vez queramos decir, por ejemplo, que si “x es un punto” e “y es un punto,” entonces
existe un punto z tal que “z está entre x e y.” Esto requiere el uso de cuantificadores. Por lo tanto,
si P (x) es una afirmación de una variable x, entonces las siguientes también son afirmaciones:
Esto completa nuestro lenguaje matemático formal. Todas las matemáticas conocidas pueden ser
expresadas en términos de predicados elementales, conectivos lógicas y cuantificadores. Para ilustrar
cómo se utiliza este lenguaje, vamos a tomar un ejemplo sencillo. La sentencia
Uno de los muchos beneficios que se derivan de la utilización de un lenguaje formal es que
es posible describir con precisión y de forma explícita los proceso de deducción en este idioma.
Unas pocas reglas claras e inequívocas, deciden cuándo una afirmación T se puede deducir de una
afirmación S. Unas pocas de tales reglas son las siguientes:
Regla A : de P y P → Q podemos inferir Q
Regla B : de P y Q podemos inferir P ∧ Q.
(1.3)
Regla C : de ¬(¬P ) podemos inferir P .
Regla D : de P (c) podemos inferir ∃x 3 P (x).
Estas y algunas otras leyes,* se llaman “reglas de inferencia” en nuestro lenguaje. Un argumento
formal, a partir de premisas dadas, es una sucesión de expresiones del lenguaje formal, donde cada
*
Las cuatro reglas dadas en (1.3), junto con siete reglas adicionales, conforman el sistema de deducción natural
descrito en Slupecki y Borkowski; estas once reglas son suficientes para todo argumento lógico válido. Otros sistemas
son descritos en Quine y Suppes.
8 Capítulo 1. Introducción Histórica
expresión es o bien una premisa, o se deriva de una expresión anterior (o expresiones) mediante la
aplicación de una de las reglas de inferencia.
Ejemplo. Considere un lenguaje formal con un predicado L(x, y); pongámonos de acuerdo para
escribir x < y para L(x, y). El siguiente es un argumento formal muy simple en este lenguaje.
Premisas
(i) a < b.
(ii) b < c.
Demostración.
El lector debe tener en cuenta que las reglas de inferencia se aplican a las expresiones de una
manera perfectamente mecánica. Para todos los fines y propósitos, las expresiones pueden ser con-
siderados como arreglos de símbolos sin sentido; el hecho de que ellas tengan un significado para
nosotros es irrelevante para la tarea de llevar a cabo la demostración. Así, la intuición está total-
mente ausente en una demostración matemática formal.
Una teoría axiomática se dice que se formaliza si sus axiomas se transcriben en el lenguaje formal
(por ejemplo, la fórmula (1.2) en la pág. 7 es un axioma de la geometría plana de Hilbert), y todas sus
pruebas son pruebas formales. Si bien es comúnmente aceptado como el ideal, hoy en día, que toda
teoría axiomática se desarrolle formalmente, sería demasiado tedioso, en la práctica, hacerlo. Los
enunciados simbólicos son difíciles de descifrar y las pruebas formales tienden a ser excesivamente
largas. Así, los matemáticos por lo general se contentan con asegurarse de que una teoría axiomática
puede ser formalizada, y luego proceden a desarrollarla de una manera informal. Este será nuestro
procedimiento en este libro.
1.4. Teoría Axiomática de Conjuntos 9
Para un gran número de matemáticos en el 1900, la respuesta al problema planteado por las
paradojas era proveer a la teoría de conjuntos de una base axiomática. El término “conjunto” y
la relación “es un elemento de” serían las nociones indefinidas de tal teoría, así como “punto” y
recta” son nociones no definidas en la geometría; su “significado” sería irrelevante, y sus propiedades
estarían dadas formalmente por los axiomas. En particular, se escogerían los axiomas de tal manera
que todos los resultados útiles de la teoría de Cantor puedan ser probados, mientras que las paradojas
no.
La primera axiomatización de la teoría de conjuntos fue dada en 1908 por Zermelo. El sistema
de Zermelo, con ciertas modificaciones hechas por Skolem y Fraenkel, es ampliamente utilizado
hasta el día de hoy. Zermelo escribió su obra antes de la época en que los métodos formales fueron
ampliamente comprendidos y aceptados, por lo que su teoría de conjuntos no está escrita en un
lenguaje formal, sino se acerca más al estilo de los antiguos tratamientos axiomáticos de la geometría.
En el sistema de Zermelo hay una relación primitiva, denotada por el símbolo ∈; la expresión
x ∈ Y debe leerse “x es un elemento de Y .” Las variables x, y, z, X, Y , etc., que ponemos a la derecha
o a la izquierda del símbolo ∈, representan objetos que acordamos llamar “conjuntos.”
El lector puede sentir que debe haber dos tipos de objetos, a saber conjuntos y elementos. En
realidad, esta distinción es innecesaria: Porque, por un lado, la relación entre elemento y conjunto
es relativa en lugar de absoluta (de hecho, la relación elemento-conjunto es precisamente la relación
∈). Por otra parte, casi todo conjunto en matemáticas es un conjunto de conjuntos. Por ejemplo, en
la geometría analítica plana, una recta es un conjunto de puntos; un punto es un par de números
reales (sus coordenadas); un número real es considerado como una sucesión (es decir, un conjunto)
de números racionales; etc. Así, una simplificación útil que se hace en la teoría axiomática de con-
juntos es considerar los elementos de cada conjunto como conjuntos mismos, en otras palabras, todo
conjunto es considerado como un conjunto de conjuntos. Esta simplificación no tiene efectos nocivos,
y tiene el mérito de reducir el número de conceptos y axiomas primitivos de la teoría de conjuntos.
Esto sugiere un comentario sobre la notación. A pesar de que se acostumbra a utilizar letras
minúsculas y mayúsculas como en x ∈ Y , no es de ninguna manera necesario. De hecho, a veces
vamos a escribir cosas como x ∈ y y X ∈ Y . Todas las variables en estas expresiones denotan
conjuntos.
Casi todo conjunto que surge en nuestro pensamiento es un conjunto formado por todos los
objetos de un tipo específico, —es decir, que consta de todos los objetos que satisfacen una condición
dada. Esta es la forma más natural en la que se presentan los conjuntos: podemos describir una
condición sobre x, —simbolicemos esta condición con S(x)— y nos lleva a hablar del conjunto de
todos los objetos x que satisfacen S(x).
Ejemplos
(en términos generales, el conjunto de todos los números irracionales entre 0 y 1).
El conjunto de todos los objetos x que puede ser descrito por la frase “x es un hombre” (En términos
generales, el conjunto de todos los hombres).
Dado que esta es la manera más natural en la que presentan los conjuntos, es claramente conve-
niente disponer de un principio en la teoría de conjuntos que haga posible —dada cualquier condición
S(x)— formar el conjunto de todos los objetos x que satisfacen S(x). Sin embargo, como hemos
señalado en la Sección 2, si ese principio se adopta sin ninguna restricción, nos lleva a las paradojas
(por ejemplo, podemos formar el conjunto de todos los conjuntos que no son elementos de sí mismos).
Por lo tanto, debemos idear tales restricciones a este principio con objeto de eliminar las paradojas.
Zermelo concibió la siguiente restricción: Sea S(x) una condición sobre x, no podemos formar el
conjunto de todas las x que satisfacen S(x), pero, si A es un conjunto dado, podemos formar el
conjunto de todas las x en A que satisfacen S(x). Por lo tanto, en términos generales, una propiedad
de los objetos no puede ser utilizada para formar un “nuevo” conjunto, sino sólo para “seleccionar,”
a partir de un conjunto A cuya existencia ya este dada, todos los elementos que satisfacen dicha
propiedad.
Zermelo introdujo este principio como un axioma en su sistema. Como su papel es “seleccionar”
elementos en conjuntos, lo llamó el axioma de selección y lo expresó como sigue:
Sea A un conjunto, y sea S(x) una afirmación sobre x la cual tiene sentido para cada objeto x
en A. Existe un conjunto que consiste exactamente de los elementos x de A que satisfacen S(x).
El conjunto cuya existencia está determinada por el axioma de la selección se suele denotar por:
{x ∈ A | S(x)}
[ Léase: “el conjunto de todas las x en A tal que S(x)” ]. Así, el lector debe tener en cuenta que
el sistema de Zermelo no nos permite formar {x | S(x)}, [el “conjunto de todas las x que satisfacen
S(x)” ]; pero, para cualquier conjunto A, podemos formar {x ∈ A | S(x)}.
¿Cómo funciona el axioma de la selección evitar las paradojas? En primer lugar, veamos que pasa
con la paradoja de Russell: el conjunto crucial en el argumento de Russell es el “conjunto de todos
los conjuntos que no son elementos de sí mismos,” el cual puede ser simbolizado como {x | x ∈ / x}.
Como ya hemos señalado, este conjunto no se puede formar en el sistema de Zermelo; lo mejor que
podemos hacer es producir {x ∈ A | x ∈ / x}, donde A es un conjunto cuya existencia se puede
demostrar. Si sustituimos {x ∈ A | x ∈/ x} por {x | x ∈/ x} en el argumento de Russell, el resultado
cambia por completo. De hecho, vayamos a través de los pasos del argumento, con S denotando
{x ∈ A | x ∈
/ x}:
Las otras paradojas lógicas desaparecen de manera similar. Los conjuntos cruciales en todas las
paradojas lógicas tienen un rasgo común: son excesivamente amplios, —es decir, son “demasiado
grandes,” incluyen mucho. En la paradoja de Russell es el “conjunto de todos los conjuntos que no
son elementos de sí mismos”; en la paradoja de Cantor (que está estrechamente relacionada con la
de Russell) es el “conjunto de todos los conjuntos.” El axioma de selección no puede contribuir a
la formación de estos conjuntos “excesivamente grandes,” ya que sólo se puede utilizar para formar
subconjuntos de conjuntos existentes.
El problema de evitar las paradojas semánticas es mucho más difícil. Los conjuntos cruciales
en paradojas tales como la de Berry no son “demasiado grandes.” El problema parece, más bien,
ser inherente a la condición S(x) que determina el conjunto; incluso la restricción impuesta por el
axioma de selección no es una barrera efectiva. Así, si S(x) designa la oración “x puede ser descrito
en menos de veinte palabras del idioma Español,” entonces el conjunto infractor en la paradoja de
Berry es {x ∈ N | S(x)}, donde N denota el conjunto de los números naturales. Este conjunto se
puede formar en el sistema de Zermelo, si admitimos S(x) como una condición aceptable sobre x.
Por lo tanto, para evitar las paradojas semánticas, hay que poner restricciones en el tipo de
“condiciones” S(x), que son admisibles para la determinación de los conjuntos. Zermelo intentó
hacerlo al estipular, en el axioma de selección, que {x ∈ A | S(x)} puede formarse solamente si S(x)
tiene sentido para cada elemento x en A. Sin embargo, al hacerlo, sólo planteó nuevas preguntas:
¿Cómo debemos entender “tener sentido”? ¿Cómo podemos determinar si S(x) tiene sentido?
Nos vemos obligados, por fin, para hacer frente a una pregunta que el lector atento ya haya
preguntado: ¿Qué se entiende por una “condición” S(x), por una “afirmación sobre un objeto x ”?
No podemos conformarnos con considerar el concepto de una “afirmación sobre x ”como se conoce
intuitivamente, ya que nuestro propósito ahora es axiomatizar la teoría de conjuntos, es decir, para
liberarla de toda dependencia de la intuición. Zermelo no pudo dar una respuesta satisfactoria a
esta pregunta, porque no quería enmarcar su sistema en un lenguaje formal. Sin embargo, en 1921
Skolem y Fraenkel, ambos trabajando en axiomatizaciones formales de la teoría de conjuntos, vieron
la salida natural del dilema: una “afirmación sobre x” es simplemente una afirmación en el lenguaje
formal con una variable “libre” x. (Decimos que x es libre en S(x) si x no está gobernada por un
cuantificador ∃x o ∀x; así, en ∃y 3 (x < y), x es libre, mientras que y no lo es).
En el sistema de Zermelo sólo hay un predicado elemental, denotado por el símbolo ∈. Por lo
tanto una afirmación en el lenguaje formal es una expresión que se puede escribir usando sólo los
predicados x ∈ Y , u ∈ V , etc., conectivos lógicos y cuantificadores.
Si limitamos las “afirmaciones” S(x) que se pueden utilizar en el axioma de selección a aquellas que
son expresables en el lenguaje formal, eliminamos inmediatamente todas las paradojas semánticas.
Por ejemplo, no hay manera de escribir la frase “x puede ser descrito en menos de veinte palabras
del idioma Español” en términos del lenguaje formal. Esta solución —esta manera de evitar las
paradojas semánticas— es aceptable desde el punto de vista matemático, a pesar de que difícilmente
es una solución ideal, filosóficamente hablando. Matemáticamente, todavía podemos formar todos
los conjuntos esenciales de las matemáticas; desde un punto de vista más amplio, sin embargo, no
podemos formar algo como el “conjunto de todos los hombres,” el “conjunto de todos los verbos
12 Capítulo 1. Introducción Histórica
latinos,” etc. Ninguna mejor solución ha sido diseñada hasta el día de hoy.
Hemos visto cómo el sistema de Zermelo, con las modificaciones hechas por Skolem y Fraenkel,
consiguen evitar las paradojas. El resto de los axiomas del sistema de Zermelo son similares a los que
se desarrollarán en el capítulo siguiente. Esencialmente, ellos establecen la existencia del conjunto de
todos los números naturales (desde el cual podemos construir el resto de los sistemas numéricos en
matemáticas), y garantizan la existencia de uniones, intersecciones y productos de conjuntos. Antes
de continuar, vamos a revisar brevemente otra forma de axiomatizar la teoría de conjuntos, la cual
es de interés creciente en nuestros días; las ideas esenciales se deben a Von Neumann.
Von Neumann señaló que dos hechos se combinan para producir las paradojas lógicas: en primer
lugar, como hemos visto, los conjuntos cruciales (por ejemplo, el conjunto S en la paradoja de Russell)
son “demasiado grandes;” en segundo lugar, estos conjuntos “grandes” se les permite ser elementos
de conjuntos (por ejemplo, se admite que el conjunto S de Russell pueda ser un elemento de sí
mismo). De estos dos hechos, Zermelo utilizó el primero; él evito las paradojas haciendo imposible
la formación de conjuntos “grandes”. Von Neumann propuso utilizar el segundo de estos hechos: él
permitiría la existencia de conjuntos excesivamente grandes, pero no permitiría que fueran elementos
de conjuntos.
Si S(x) es una afirmación acerca de un objeto x, existe una clase que consta de todos los elementos
x que satisfacen S(x).
En otras palabras, si S(x) es una afirmación cualquiera sobre x, podemos formar la clase
{x | x es un elemento y S(x)}.
Para verificar que la paradoja de Russell no “funciona” en este sistema, vayamos a través de los pasos
del razonamiento de Russell, con S denotando {x | x es un elemento y x ∈ / x}.
Por lo tanto el argumento de Russell demuestra simplemente que la clase S, definida anterior-
mente, no es un elemento.
Variantes del sistema de Von Neumann han sido desarrollados por Gödel y Bernays. Ellos tienen
una ventaja sobre el sistema de Zermelo en que el axioma de clase está más cerca del espíritu de
1.5. Objeciones al Enfoque Axiomático. Otras Propuestas 13
la teoría intuitiva de conjuntos que el axioma de selección. En efecto, si S(x) es una afirmación
cualquiera sobre x, el axioma de clase garantiza la existencia de una clase que contiene todos los
elementos x que satisfacen S(x). En matemáticas, los sistemas de tipo Von Neumann nos dan la
oportunidad de poder hablar de la “clase de todos los elementos” y ser capaces operar con clases que
no sean elementos. (Tales clases tienden a ocurrir en varios puntos de las matemáticas superiores; que
se pueden evitar, pero sólo a un precio.) La principal desventaja de estos sistemas es que la distinción
entre las clases que son elementos y las clases que no son elementos —una desventaja altamente
artificial— siempre hay que tenerla en cuenta; sin embargo, esta desventaja es indudablemente
compensada por la mayor flexibilidad y naturalidad de los sistemas de tipo Von Neumann. En este
texto vamos a utilizar una forma ligeramente modificada del sistema de axiomas de Von Neumann.
¿Cuáles son los principales objetivos de la teoría axiomática de conjuntos, y en qué medida
estos objetivos han sido alcanzados con éxito? Para responder a esta pregunta debemos recordar
las circunstancias que llevaron a los matemáticos, en los primeros años del siglo XX, a buscar una
base axiomática para la teoría de conjuntos. Las ideas de Cantor ya habían penetrado a fondo la
estructura de la matemática moderna, y se habían convertido en herramientas indispensables del
trabajo matemático. El álgebra y el análisis fueron formulados en el marco de la teoría de conjuntos,
y algunos de los más elegantes y poderosos nuevos resultados en estos campos fueron establecidos
mediante el uso de los métodos introducidos por Cantor y sus seguidores. Por lo tanto, cuando
se descubrieron las paradojas y surgieron dudas sobre la validez básica del sistema de Cantor, la
mayoría de los matemáticos estaban comprensiblemente reacios a renunciar a ella; confiaban en que
encontraría alguna manera de eludir las contradicciones y preservar, si no todos, al menos la mayoría
de los resultados de Cantor. Hilbert escribió una vez al respecto: “No vamos a ser expulsados del
paraíso al que Cantor nos ha conducido.”
Con el descubrimiento de nuevas paradojas, y el fracaso de todos los intentos iniciales para evi-
tarlas, se hizo cada vez más claro que no sería posible preservar la teoría de conjuntos intuitiva en su
totalidad. Algo —posiblemente mucho— tendría que ser abandonado. Lo mejor que se podía esperar
era mantener tanto de la teoría intuitiva de conjuntos como era necesario, para salvar los nuevos
resultados de las matemáticas modernas y proporcionar un marco adecuado para las matemáticas
clásicas.
En resumen, entonces, la teoría axiomática de conjuntos fue creada para lograr un objetivo
limitado: tenía que ofrecer una base sólida para un sistema de teoría de conjuntos, que, si bien no
tiene por qué ser tan amplio como la teoría intuitiva de conjuntos, debe incluir todos los resultados
básicos de Cantor, así como las construcciones (tales como los sistemas númericos, funciones y
relaciones) necesarias para las matemáticas clásicas.
Los sistemas tanto de Zermelo como de Von Neumann tuvieron éxito en el logro de este objetivo
limitado. Pero la cantidad de teoría intuitiva de conjuntos que tuvieron que sacrificar fue consi-
derable. Por ejemplo, en el sistema de Zermelo, como ya hemos visto, la forma intuitiva de hacer
14 Capítulo 1. Introducción Histórica
conjuntos —al nombrar a una propiedad de los objetos y formar el conjunto de todos los objetos
que tienen esa propiedad— no tiene lugar en absoluto. Se sustituye por el axioma de selección, en
el que se permiten propiedades sólo para determinar subconjuntos de conjuntos dados. Además, las
únicas “propiedades” admisibles son aquellas que se pueden expresar enteramente en términos de los
siete símbolos ∈, ∨, ∧, ¬, ⇒, ∀, ∃ y las variables x, y, z, . . .. Como resultado, muchas de las cosas
que normalmente pensamos como conjuntos —por ejemplo, el “conjunto de todas las manzanas,”
el “conjunto de todos los átomos en el universo” no son admisibles como “conjuntos” en la teoría
axiomática de conjuntos. De hecho, los únicos “conjuntos” que los axiomas prevén son, en primer
lugar, el conjunto vacío ∅, y luego construcciones tales como {∅}, {∅, {∅}}, etc., que se pueden
construir a partir del conjunto vacío. Es un hecho notable que todas las matemáticas pueden basarse
en un concepto tan pobre de conjunto.
Aunque los distintos sistemas axiomáticos de teoría de conjuntos salvaron a las matemáticas de su
peligro inmediato, no pudieron satisfacer a un gran número de personas. En particular, muchos de los
que eran sensibles a la elegancia y la universalidad de las matemáticas se apresuraron a señalar que
las creaciones de Zermelo y Von Neumann debían considerarse como soluciones provisionales —como
recursos para resolver un problema temporal; tarde o temprano tendrían que ser remplazadas, por
una teoría matemática de mayor alcance, que trate el concepto de “conjunto” en toda su generalidad
intuitiva.
Este argumento contra la teoría axiomática de conjuntos —que trata de una versión amputada de
nuestra concepción intuitiva de un conjunto— tiene importantes ramificaciones filosóficas; es parte
de un debate mucho más amplio, sobre la naturaleza de la “verdad” matemática. El debate se centra
alrededor de la siguiente pregunta: ¿Son los conceptos matemáticos creaciones (es decir, invenciones)
de la mente humana, o existen independientemente de nosotros en un reino “platónico”de conceptos,
sólo para ser descubierto por el matemático? La última opinión se refiere a menudo como “realismo
platónico” y es el punto de vista dominante de la matemática clásica. Ilustramos estos dos puntos
de vista opuestos mostrando cómo se aplican a un concepto particular —la noción de números
naturales. Desde el punto de vista del realismo platónico, los conceptos de “uno,” “dos,” “tres,” y
así sucesivamente, existen en la naturaleza y existían antes de que el primer hombre empezó a
contar. Si existen seres inteligentes en otros lugares del universo, entonces, no importa lo diferentes
que sean de nosotros, sin duda han descubierto los números naturales y encontraron que tienen
las mismas propiedades que tienen para nosotros. Por otra parte, de acuerdo con el punto de vista
opuesto, mientras existen tres vacas, tres piedras, o tres árboles en la naturaleza, el número natural
tres es una creación de nuestra mente; hemos inventado un procedimiento para la construcción
de los números naturales (a partir de cero y mediante la adición de 1 cada vez, se producen así
sucesivamente 1, 2, 3, etc.) y hemos de esta manera formado un instrumento conceptual de nuestra
propia creación.
¿De qué manera el realismo platónico afecta al estado de la teoría axiomática de conjuntos?
Desde el punto de vista del realismo platónico, los objetos matemáticos se nos dan ya hechos, con
todas sus características y todas sus propiedades. Se sigue que decir que un teorema matemático
es verdadero significa que expresa una afirmación correcta sobre los objetos matemáticos relevantes.
(Por ejemplo, la proposición 2 + 2 = 4 no es simplemente una afirmación formal demostrable en
la aritmética; afirma un hecho real acerca de los números.) Ahora —si admitimos que los objetos
1.5. Objeciones al Enfoque Axiomático. Otras Propuestas 15
matemáticos son dados a nosotros con todas sus propiedades, se deduce, en particular, que la noción
de conjunto es un concepto fijo, bien definido, que no somos libres de cambiar para nuestra propia
conveniencia. Por lo tanto no existen los “conjuntos” creadas por Zermelo y Von Neumann, y los
teoremas que pretenden describir estos objetos no existentes ¡son falsos! En conclusión, si tuviéramos
que aceptar una interpretación estricta del realismo platónico, nos veríamos obligados a rechazar los
sistemas de Zermelo y Von Neumann como no válidos matemáticamente.
Afortunadamente, la tendencia, desde hace algún tiempo, ha estado lejos del platonismo y más
cercana a una actitud más flexible, más “agnóstica” hacia la “verdad” matemática. Por un lado, la
evolución de las matemáticas ha sido cada vez menos conforme al patrón dictado por la filosofía
platónica. Por otro lado, el requisito primordial del platonismo —que cada objeto matemático co-
rresponde a un objeto definido y distinto de nuestra intuición (tales como “punto” y “recta” se refieren
a objetos bien definidos de nuestra intuición espacial)— llegó a ser una carga prácticamente insopor-
table sobre la labor de los matemáticos creativos del siglo XIX. Ellos estaban tratando con una serie
de nuevos conceptos (tales como, números complejos, leyes de composición abstractas y la noción
general de función) que no se prestan para una interpretación sencilla en términos concretos. El caso
de los números complejos es un buen ejemplo de lo que estaba sucediendo. Las matemáticas clási-
cas nunca se sintieron a gusto con los números complejos, porque carecían de una “interpretación”
adecuada de ellos, y como resultado hubo persistentes dudas en cuanto a si estas cosas realmente
“existían.” Los números reales pueden ser interpretados como longitudes o cantidades, pero la raíz
cuadrada de un número real negativo —no parece corresponder a nada en el mundo real o en nuestra
intuición de número. Sin embargo, el sistema de los números complejos surge de una manera más
natural —como el sistema numérico más pequeño que contiene a los números reales e incluye las
raíces de toda ecuación algebraica con coeficientes reales; si los números complejos tienen o no una
contraparte física o psicológica parece irrelevante.
El caso de los números complejos logra un paralelo con el problema de la teoría axiomática de
conjuntos. Los “conjuntos” creados por Zermelo y Von Neumann surgen naturalmente en un contexto
matemático. Ellos nos dan la idea más simple de conjunto que es adecuada para las matemáticas
y producen una teoría axiomática consistente. Si podemos o no interpretarlos intuitivamente puede
ser relativamente insignificante.
Sea como sea, en el 1900 muchos matemáticos estaban reacios a hacer una ruptura tan fuerte
con la tradición como la teoría axiomática de conjuntos parecía exigir. Además, sentían, por razones
estéticas, que una teoría matemática de conjuntos debería describir todas las cosas —y sólo las
cosas— que nuestra intuición reconoce como conjuntos. Entre ellos se encontraba Bertrand Russell;
en sus esfuerzos para restablecer la teoría intuitiva de conjuntos, Russell fue guiado hacia la idea de
que los conjuntos podían ser ordenados en una jerarquía de “niveles,” donde si A y B son conjuntos
y A es un elemento de B, entonces B está “un nivel más alto” que A. Por ejemplo, en geometría
plana, un círculo (considerado como un conjunto de puntos) está un nivel por debajo de una familia
de círculos, que, a su vez, está un nivel por debajo de un conjunto de familias de círculos. Esta idea
básica fue construida por Russell en una teoría llamada la teoría de tipos, que se puede describir, en
esencia, de la siguiente manera.
Cada conjunto tiene un número natural asignado, llamado nivel. Los conjuntos más simples, los
16 Capítulo 1. Introducción Histórica
de nivel 0, se llaman individuos —no tienen elementos. Una colección de individuos es un conjunto
de nivel 1; una colección de conjuntos de nivel 1 es un conjunto de nivel 2; y así sucesivamente. En
la teoría de tipos la expresión a ∈ B sólo tiene sentido si, por algún número n, a es un conjunto de
nivel n y B es un conjunto de nivel que n + 1. De ello se desprende que la proposición x ∈ x no tiene
ningún significado en la teoría de tipos, y como resultado, la paradoja de Russell se desvanece por
la sencilla razón de que no puede ni siquiera ser formulada.
La teoría de tipos de Russell se basa en una idea muy simple. Desafortunadamente, con el fin
de hacer que “funcionara,” Russell se vio obligado a añadir una serie de nuevas hipótesis, hasta que
finalmente la teoría resultante se hizo demasiado engorrosa para trabajar y demasiado complicada
para ser realmente agradable. Por un lado, en lo correspondiente a la jerarquía de “niveles” de
conjuntos, era necesario disponer de una jerarquía de “niveles” de predicados lógicos. Entonces —
como una forma de evitar las paradojas semánticas— los conjuntos en un mismo nivel, fueron
rápidamente divididos en “órdenes.” Finalmente, Russell tuvo que admitir el llamado Axioma de
Reducibilidad el cual era tanto arbitrario, como sin fundamentos en la intuición, como cualquiera de
las ad hoc hipótesis realizadas por Zermelo. Como resultado de estas deficiencias, la teoría de tipos
no ha ganado una amplia aceptación entre los matemáticos, aunque todavía es un área interesante
(y tal vez prometedora) de investigación.
Un enfoque mucho más radical fue tomado por un grupo de matemáticos que se hacen llamar
intuicionistas. Para los intuicionistas, gran parte de las matemáticas modernas, incluyendo casi toda
la teoría de conjuntos de Cantor, se basa en el uso acrítico de las reglas de la lógica, que a su juicio
no es válido. Por tanto, la actitud intuicionista hacia la teoría de conjuntos se puede resumir muy
fácilmente: es una de rechazo casi total.
Para comprender adecuadamente la filosofía del intuicionismo, primero debemos obtener una
comprensión de su actitud hacia la lógica. Al parecer de los intuicionistas, las reglas de la lógica
utilizadas por los matemáticos tienen un carácter empírico. Ciertos métodos de prueba llegaron a ser
de uso común por los matemáticos, y, con los años, se codificaron en un conjunto de normas. Estas
normas eran visiblemente correctas en su contexto original, pero —después de que se codificaron—
llegaron a ser utilizadas de forma acrítica en contextos totalmente diferentes en los cuales ya no
se aplican. Seamos más específicos: en la geometría Euclidiana, que es la fuente de la mayoría de
las matemáticas antes del siglo XV, todo teorema involucra sólo un número finito de objetos, y
cada uno de estos objetos (figuras geométricas) viene dado por una construcción explícita. Dicen
los intuicionistas que las reglas de la lógica utilizadas por Euclides son perfectamente válidas en ese
contexto; es sólo cuando se transponen a problemas que involucran un dominio infinito de objetos, o
en el que los objetos no están dados por una construcción explícita, que las normas son incorrectas.
Como un ejemplo, tomemos la ley del tercero excluido. Esta es la regla que dice que si S es una
proposición cualquiera, entonces o S es verdadera o la negación de S es verdadera. En particular,
sea A un conjunto y sea P (x) una proposición que tiene sentido para cada elemento x en A. Por
la ley del tercero excluido, o bien existe un x en A tal que P (x) es verdadera, o para cada x en
A, P (x) es falsa. Ahora los intuicionistas aceptarán esta regla si A es un conjunto finito y si cada
uno de sus elementos pueden ser probados para determinar si P (x) es verdadera o falsa. De hecho,
dicen los intuicionistas, que aquí es donde se originó la regla —nuestra experiencia nos dice que si
1.5. Objeciones al Enfoque Axiomático. Otras Propuestas 17
se examina cada elemento x en A para determinar si P (x) es o no verdadera (para hacerlo, A tiene
que ser un conjunto finito), puede haber sólo dos resultados posibles: o bien hemos encontrado una
x para la cual P (x) es verdadera, o de lo contrario, para cada x en A hemos encontrado que P (x)
es falsa. Nuestra experiencia, entonces, confirma la ley del tercero excluido en el caso de conjuntos
finitos. Pero, dicen los intuicionistas, que asumir que esto es verdadero en el caso de los conjuntos
infinitos —en una zona donde no tenemos experiencia y la experiencia es imposible— es totalmente
carente de fundamento. Por razones como éstas, los intuicionistas niegan la ley del tercero excluido.
Otras reglas de la lógica tradicional son igualmente rechazadas, porque van más allá del ámbito de
nuestra experiencia.
Los intuicionistas señalan que las matemáticas se originaron como un estudio de ciertas construc-
ciones mentales —principalmente figuras geométricas y construcciones simples con números enteros.
Los teoremas de las matemáticas antiguas eran esencialmente proposiciones en el sentido de que si
algunas construcciones se llevan a cabo, se lograran algunos resultados. Por ejemplo, considere el
siguiente teorema de la geometría: Dados dos triángulos, si dos lados de uno de triángulo y el ángulo
entre ellos son iguales, respectivamente, a los dos lados del otro triángulo y el ángulo entre ellos,
entonces los dos triángulos son congruentes. Lo expresado aquí es el hecho de que si construimos
dos triángulos, con dos lados y un ángulo entre ellos iguales como se ha dicho, vamos a ser capaces
de verificar (por ejemplo, mediante el uso de una compás) que el lado restante de un triángulo es
igual a al lado restante del otro triángulo. Las demostraciones de la geometría Euclidiana, y de las
matemáticas antiguas generalmente, tienen un carácter constructivo. Por ejemplo, el teorema de
Pitágoras se demuestra mediante la construcción de una figura en la que las partes correspondientes
son congruentes, por lo tanto, tienen la misma área. Una vez que la construcción se ha completado,
sólo queda señalar las partes congruentes y con ello llegar a la conclusión deseada. Así, dicen los
intuicionistas, que las reglas de la lógica estaban originalmente destinadas para describir situaciones
que surgieron en el contexto de este tipo de construcciones y determinaciones. Por ejemplo, la regla
del tercero excluido se destinado simplemente a señalar el hecho de que si se nos da un conjunto
de objetos (finito) y un método (por ejemplo, utilizando una regla y un compás) para probar cada
objeto por alguna propiedad P , entonces, si realizamos la prueba en cada objeto, o bien, uno de los
objetos cumplirá con los requisitos de la prueba, o bien todos los objetos fallarán en los requisitos.
Para resumir, entonces, el intuicionista sostiene que un teorema matemático no es más que una
proposición fáctica en el sentido de que una construcción mental dada conducirá a un resultado
determinado. Cada prueba debe ser constructiva. Si decimos que existe un objeto matemático, hay
que demostrarlo al dar un método para construir el objeto realmente. Si afirmamos que una relación
se mantiene entre pares de objetos dados, nuestra prueba debe incluir un método para probar cada
par de objetos en cuestión. Las “reglas de la lógica” no son más que simples observaciones sobre
el proceso de realización de construcciones matemáticas; no tenemos motivos para creer que estas
reglas se aplican fuera del contexto de las matemáticas constructivas —de hecho, no tiene sentido
aplicarlas fuera de este contexto. Para las matemáticas, la lógica es incidental, no esencial.
Es evidente que la noción del intuicionista sobre conjunto debe ser muy diferente de la nuestra.
Consideremos, por ejemplo, el principio de Cantor, que si podemos nombrar una propiedad de los
objetos, entonces existe un conjunto de todos los objetos que tienen esa propiedad. Ahora bien, este
principio —así como las versiones limitadas de este aceptadas por Zermelo y Von Neumann— es un
18 Capítulo 1. Introducción Histórica
anatema para los intuicionistas. Un objeto existe sólo si se puede construir; por lo tanto un conjunto
existe sólo si somos capaces de describir un procedimiento para la construcción de éste.
Una discusión completa de la teoría de conjuntos intuicionistas está fuera del alcance de este
libro; sin embargo, vale la pena mencionar un tipo particular de conjunto que es importante en las
matemáticas intuicionistas: este se llama una propagación. Una propagación se identifica con una
regla para la producción de todos sus elementos. Así, una propagación no es considerada como una
totalidad “ya formada”, sino más bien como un “proceso de formación”; cada uno de sus elementos
se pueden formar si aplicamos la regla el tiempo suficiente.
Durante la primera parte del siglo XX, como hemos visto, fueron propuestas y desarrolladas
por varias “escuelas” de los matemáticos, diversas formas de construir una teoría de conjuntos no
contradictoria. Hemos revisado los principios básicos de la teoría axiomática de conjuntos, teoría
de tipos de Russell y el enfoque intuicionista (o “constructivista”) de conjuntos. Además de éstas,
se han propuesto otra gran cantidad de ideas, demasiadas como para ser descritas en esta breve
introducción.
De todas las formas de tratar con conjuntos, el método axiomático parecía adaptarse mejor a
las necesidades de las matemáticas modernas. La noción de “conjunto” incorporada en los sistemas
de Zermelo y Von Neumann, es lo suficientemente amplia para los fines de las matemáticas, y por
lo tanto, en un contexto matemático es prácticamente indistinguible de la noción Cantoriana de
conjunto. Los métodos de demostración, el simbolismo, el rigor —todos ellos corresponden al uso
matemático actual. Lo más importante de todo, la teoría axiomática de conjuntos parece “natural”
para la mayoría de los matemáticos profesionales.
Los que rechazan la teoría axiomática de conjuntos, lo hacen sobre la base de algún sesgo filosófico.
Esas posiciones filosóficas, no obstante, no sólo se niegan a aceptar la teoría axiomática de conjuntos,
sino que también, niegan la validez de gran parte de la matemática moderna. Por ejemplo, la escuela
intuicionista rechaza la mayor parte del análisis contemporáneo, porque se funda en principios no
constructivistas. Mientras que los argumentos de estos críticos presentan un desafío, y desde luego
nos dan elementos de reflexión, no son lo suficientemente potentes como para destruir los logros de
tres generaciones de matemáticos brillantes
A lo largo de los últimos setenta años más o menos, la teoría de conjuntos ha llegado a ser am-
pliamente reconocida como la rama “unificadora”fundamental de las matemáticas. Ya hemos visto
cómo se pueden construir los números naturales, y sus propiedades derivadas, en el marco de la
teoría de conjuntos; a partir de ahí, es fácil desarrollar los números racionales, los números reales y
complejos, así como sistemas extraordinarios tales como los “cardinales transfinitos” de Cantor. Las
1.6. Observaciones Finales 19
Es probable que, en el análisis final, cualquier otra verificación de la consistencia de las matemá-
ticas tenga que basarse en una combinación de la intuición básica y la evidencia empírica.
Capítulo 2
Clases y Conjuntos
Antes de introducir las nociones básica de la teoría de conjuntos, será útil hacer ciertas observa-
ciones sobre el uso del lenguaje.
Con una proposición nos referimos a un enunciado que, en un contexto dado, es inequívocamente
verdadero o falso. Así
son ejemplos de proposiciones. Usaremos las letras P, Q, R, S etc., para denotar proposiciones; usado
en este sentido, P , por ejemplo, se entenderá como “P es verdadera”.
Las proposiciones se pueden combinar de diversas maneras para formar proposiciones mas com-
plejas. Muchas veces la verdad o falsedad de una proposición compuesta es completamente deter-
minada por la verdad o falsedad de sus partes componentes. Así, si P es una proposición, una
proposición simple formada por P es la negación de P , denotada por ¬P (para ser leído “no P ”),
que es entendido como “P es falsa”. Ahora si P es verdadera, entonces, claramente, ¬P es falsa; y si
P es falsa ¬P es verdadera. Es conveniente para mostrar la relación entre ¬P y P la siguiente tabla
de verdad,
P ¬P
v f (2.1)
f v
donde v y f son “valores de verdad”, verdadero y falso.
20
2.1. Construcción de proposiciones 21
Teorema 2.1. Para toda proposición P y Q las siguientes proposiciones son verdaderas.
(i) P ⇒ P ∨ Q.
(ii) Q ⇒ P ∨ Q.
(iii) P ∧ Q ⇒ P .
(iv) P ∧ Q ⇒ Q
Demostración.
P Q P ∨Q P ⇒P ∨Q
v v v v
v f v v
f v v v
f f f v
La idea básica de hacer una tabla de verdad es esta: en la linea 1, P y Q toman el valor v; así,
por (2.3), P ∨ Q toma el valor v; ahora, P tiene el valor v y P ∨ Q toma el valor v, entonces,
por (2.4), P ⇒ P ∨ Q toma el valor v. Hacemos lo mismo para cada linea, y encontramos que
en todas las líneas (que es, para todo posible valor de verdad asignado a P y Q) P ⇒ P ∨ Q
tiene el valor v (verdadero). Esto es lo que nos habíamos propuesto demostrar.
(iii) Con el fin de probar que P ∧ Q ⇒ P para toda proposición P y Q, construimos una tabla de
verdad para P ∧ Q ⇒ P .
P Q P ∧Q P ∧Q⇒P
v v v v
v f f v
f v f v
f f f v
En todas las líneas (que es, para todo los posible valor de verdad asignado a P y Q), P ∧Q ⇒ P
toma el valor v; así, P ∧ Q ⇒ P es verdadera independientemente de la verdad o falsedad de
las proposiciones componentes P y Q.
y verificar que esta proposición toma el valor de verdad v en todas las líneas de la tabla.
(i) P ∨ Q ⇒ P ∨ R es verdadera, y
(ii) P ∧ Q ⇒ P ∧ R es verdadera.
(i) P ∨ Q ⇔ Q ∨ P
(ii) P ∨ (Q ∨ R) ⇔ (P ∨ Q) ∨ R
(iii) P ∧ (Q ∨ R) ⇔ (P ∧ Q) ∨ (P ∧ R)
(iv) P ∨ P ⇔ P
24 Capítulo 2. Clases y Conjuntos
(v) P ∧ Q ⇔ Q ∧ P
(vi) P ∧ (Q ∧ R) ⇔ (P ∧ Q) ∧ R
(vii) P ∨ (Q ∧ R) ⇔ (P ∨ Q) ∧ (P ∨ R)
(viii) P ∧ P ⇔ P .
En este y en los capítulos subsecuentes ⇒ sera usado como una abreviación para implicar, ⇔ sera
usado como una abreviación para si y sólo si (Algunas veces escribiremos “sii ” en lugar de ⇔), ∧
sera usado como una abreviación para y ,y ∨ sera usado como una abreviación para o. Si P, Q, R, . . .
son cualesquiera proposiciones, una expresión de la forma P ⇒ Q ⇒ R ⇒ · · · debería ser entendida
para significar que P ⇒ Q, Q ⇒ R, y así sucesivamente; análogamente, P ⇔ Q ⇔ R ⇔ · · · debería
ser entendido para significar que P ⇔ Q, Q ⇔ R,y así sucesivamente.
Como es costumbre, ∃ sera leído como existe, ∀ sera leído como para todo, y 3 sera leído como tal
que
Ejercicio 2.1.
2. Pruebe que las siguientes proposiciones son verdad para todas las P y Q (leyes de DeMorgan)
a) ¬(P ∨ Q) ⇔ ¬P ∧ ¬Q
b) ¬(P ∧ Q) ⇔ ¬P ∨ ¬Q
3. Pruebe que las siguientes proposiciones son verdad , para toda proposición P
a) ¬¬P ⇒ P
b) P ⇒ ¬¬P
4. Pruebe que las siguientes proposiciones son verdad para todas las P y Q
a) (P ⇒ Q) ⇔ (¬Q ⇒ ¬P )
b) (P ⇒ Q) ⇔ (¬P ∨ Q)
c) (P ⇒ Q) ⇔ ¬(P ∧ ¬Q)
d) [P ∧ (P ⇒ Q)] ⇒ Q
e) [(P ∨ Q) ∧ ¬P ] ⇒ Q
5. Pruebe que las siguientes proposiciones son verdad para todas las P , Q y R
a) [(P ⇒ Q) ∧ (Q ⇒ R)] ⇒ (P ⇒ R)
b) [(P ⇒ Q) ∧ (R ⇒ Q)] ⇔ [(P ∨ R) ⇒ Q]
c) [(P ⇒ Q) ∧ (P ⇒ R)] ⇔ [P ⇒ (Q ∧ R)]
2.2. Construcción de clases 25
6. Pruebe que par todas las proposiciones P ,Q y R, si Q ⇔ R es verdad , entonces las siguientes
proposiciones son verdad
a) P ∨ Q ⇔ P ∨ R
b) P ∧ Q ⇔ P ∧ R
c) (P ⇒ Q) ⇔ (P ⇒ R)
a) P ∨ R ⇒ Q ∨ S
b) P ∧ R ⇒ Q ∧ S
Cada sistema axiomático, como hemos visto, debe comenzar con un cierto número de conceptos no
definidos. Por ejemplo, en la geometría, las palabras “punto” y “recta” y la relación de “incidencia” se
toman generalmente como conceptos no definidos. Si bien somos libres en nuestras propias mentes
para fijar un “significado,” en la forma de una imagen mental, a cada una de estos conceptos,
matemáticamente debemos proceder “como si” no supiéramos lo que significaban. Ahora un concepto
“no definido” no tiene propiedades excepto aquellas que le asignen explícitamente; por lo tanto,
debemos establecer como axiomas todas las propiedades elementales que esperamos tengan nuestros
conceptos no definidos.
Vamos a comentar brevemente sobre el “significado” que le intentamos dar a dichas nociones. En
la interpretación pretendida de nuestro sistema axiomático, la palabra clase se entiende que refiere
a cualquier colección de objetos. Sin embargo, como señalamos en la Sección 1.2 del Capítulo1,
ciertas colecciones “excesivamente grandes” se pueden formar en la teoría intuitiva de conjuntos (por
ejemplo, la recolección de todas x tal que x ∈/ x ), y si no tenemos precaución especial conducen a
contradicciones tales como la paradoja de Russell. El término clase propia se entiende que se refiere
a estas colecciones “excesivamente grandes”; todas las demás colecciones son conjuntos.
A partir de ahora vamos a utilizar la siguiente notación convencional: las letras minúsculas
a, b, c, x, y, . . . serán usadas sólo para designar elementos. Por lo tanto, una letra mayúscula,
26 Capítulo 2. Clases y Conjuntos
tal como A, puede denotar o bien un elemento o una clase que no es un elemento, pero una letra
minúscula, tal como x, puede denotar sólo un elemento.
Definición 2.1. Sean A y B clases; definimos A = B para significar que cada elemento de A es un
elemento de B y viceversa. En símbolos,
A = B sii x ∈ A ⇒ x ∈ B y x ∈ B ⇒ x ∈ A.
Hemos definido que dos clases son iguales si y sólo si tienen los mismos elementos. La igualdad
de clases tienen otra propiedad: si x e y son iguales y x es un elemento de A, sin duda esperamos
que y sea un elemento de A. Esta propiedad se establece como nuestro primer axioma:
A1. Si x = y y x ∈ A, entonces y ∈ A.
Definición 2.2. Sean A y B clases; definimos A ⊆ B para significar que todo elemento de A es un
elemento de B. En símbolos,
A ⊆ B sii x ∈ A ⇒ x ∈ B.
(i) A = A.
(ii) A = B ⇒ B = A.
(iii) A = B y B = C ⇒ A = C.
(iv) A ⊆ B y B ⊆ A ⇒ A = B.
(v) A ⊆ B y B ⊆ C ⇒ A ⊆ C.
x ∈ A ⇒ x ∈ B,
x ∈ B ⇒ x ∈ A,
x ∈ B ⇒ x ∈ C,
x ∈ C ⇒ x ∈ B.
Hemos visto de manera intuitiva que hacer clases es nombrar una propiedad de los objetos y
formar la clase de todos los objetos que tienen esa propiedad. Nuestro segundo axioma nos permite
hacer las clases de esta manera.
A2. Supongamos que P (x) designa una propiedad de x que se pueden expresar totalmente en
términos de los símbolos ∈, ∨, ∧, ¬, ⇒, ∃, ∀, paréntesis, y variables x, y, z, A, B, . . . Entonces existe
una clase C, que consiste de todos los elementos x que satisface P (x).
El lector debe notar que en Axioma A2 nos permite formar la clase de todos los elementos x que
satisfacen P (x), pero no la clase de todas las clases x que satisfacen P (x), como ya comentamos
en la página 12, esta distinción es suficiente para eliminar las paradojas lógicas. Las paradojas
semánticas se han evitado al admitir, en el Axioma A2, sólo las propiedades P (x) que se puedan
escribir completamente en términos de los símbolos ∈, ∨, ∧, ¬, ⇒, ∃, ∀, paréntesis y variables.
La clase C cuya existencia está afirmada por Axioma A2 se designará por el símbolo
C = {x | P (x)}.
Ahora usaremos el axioma de construcción de clase para formar nuevas clases a partir de clases
dadas.
Definición 2.3. Sean A y B clases, la unión de A y B se define como el conjunto de todos los
elementos que pertenecen a A, o a B, o A y B. En símbolos,
A ∪ B = {x | x ∈ A o x ∈ B}.
Definición 2.4. Sean A y B clases; la intersección de A y B se define como la clase de todos los
elementos que pertenecen tanto a A como a B. En símbolos,
A ∩ B = {x | x ∈ A y x ∈ B}.
Definición 2.5. Por la clase universal U nos referimos a la clase de todos los elementos. La
existencia de la clase universal es una consecuencia del axioma de construcción de clase, pues si
tomamos P (x) como la proposición x = x, entonces A2 garantiza la existencia de una clase que
consiste de todos los elementos que satisfacen x = x; por Teorema 2.11 (i), cada elemento está en
esta clase.
Definición 2.6. Por la clase vacía ∅ nos referimos a la clase que no tiene elementos. La existencia
de la clase vacía es una consecuencia del axioma de construcción de clases; ya que A2 garantiza la
existencia de una clase que consiste de todos los elementos que satisfacen x 6= x; por el Teorema
2.11(i), esta clase no tiene elementos.
(i) ∅ ⊆ A.
(ii) A ⊆ U.
Definición 2.7. Si dos clases no tienen elementos en común, se dice que son disjuntas. En sím-
bolos,
A y B son disjuntas sii A ∩ B = ∅.
Definición 2.8. El complemento de una clase A es la clase de todos los elementos que no perte-
necen a A. En símbolos,
A0 = {x | x ∈
/ A}.
Las relaciones entre las clases pueden ser representadas gráficamente por medio de un dispositivo
útil conocido como el diagrama de Venn. Una clase es representada por una simple área plana
(circular o de forma ovalada); y si se desea mostrar el complemento de una clase, entonces el círculo
u óvalo se dibujan dentro de un rectángulo que representa la clase universal. Por lo tanto, A ∪ B se
representa por el área sombreada de la Fig. 1, A ∩ B por el área sombreada de la Fig. 2, y A0 por el
área sombreada de la Fig. 3. El lector encontrará que los diagramas de Venn son útiles para guiar
2.3. Álgebra de clases 29
su razonamiento acerca de clases, y que dan más sentido a las fórmulas de la teoría de conjuntos,
haciéndolas más concretas. Por ejemplo, en la Sección 3 de este capítulo probaremos la fórmula
A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C).
Esta fórmula es ilustrada en la Fig. 4, donde el área sombreada representa A ∩ (B ∪ C); uno nota
inmediatamente que esta misma área sombreada representa (A ∩ B) ∪ (A ∩ C).
Ejercicio 2.2.
a) (A ∪ C) ⊆ (B ∩ D)
b) (A ∩ C) ⊆ (B ∩ D).
[Indicación: usar el resultado del Ejercicio 7, conjuntos de Ejercicios 2.1].
a) A ∪ C = B ∪ D
b) A ∩ C = B ∩ D.
[Indicación: usar el resultado del ejercicio anterior].
8. Sea S = {x | x ∈
/ x}; usar el argumento de Russell para probar que S no es un elemento
10. Explique por qué la paradoja de Russel y la paradoja de Berry no pueden ser producidas
mediante el uso del Axioma A2
Uno de los hechos más interesantes y útiles sobre las clases es que bajo las operaciones de unión,
intersección y complementación satisfacen ciertas leyes algebraicas de las que podemos desarrollar
un álgebra de clases. Veremos más adelante (Capítulo 4) que el álgebra de clases no es más que un
ejemplo de una estructura conocida como Booleana álgebra; otro ejemplo es el álgebra de lógica,
donde ∨, ∧, ¬ son consideradas como operaciones sobre las proposiciones.
30 Capítulo 2. Clases y Conjuntos
Nuestro objetivo en esta sección es desarrollar las leyes básicas del álgebra de clases. Recordamos
al lector que la palabra clase debe entenderse en el sentido de cualquier colección de objetos; así, las
leyes que estamos a punto de presentar se deben pensar como aplicables a todas las colecciones de
objetos, en particular, aplicables a todos los conjuntos.
i) A ⊆ A ∪ B y B ⊆ A ∪ B,
ii) A ∩ B ⊆ A y A ∩ B ⊆ B.
i) A ⊆ B si y sólo si A ∪ B = B,
ii) A ⊆ B si y sólo si A ∩ B = A.
i) A ∪ (A ∩ B) = A,
ii) A ∩ (A ∪ B) = A.
i) (A ∪ B)0 = A0 ∩ B 0 ,
ii) (A ∩ B)0 = A0 ∪ B 0 .
i) A ∪ B = B ∪ A,
ii) A ∪ B = B ∪ A,
iii) A ∪ A = A,
iv) A ∩ A = A,
v) A ∪ (B ∪ C) = (A ∪ B) ∪ C,
vi) A ∩ (B ∩ C) = (A ∩ B) ∩ C,
vii) A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C),
viii) A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C).
2.3. Álgebra de clases 31
La clase vacía y la clase universal son los elementos identidad para la unión e intersección,
respectivamente, ellas satisfacen las siguientes reglas sencillas:
i) A ∪ ∅ = A,
ii) A ∩ ∅ = ∅,
iii) A ∪ U = U,
iv) A ∩ U = A,
v) U 0 = ∅,
vi) ∅0 = U,
vii) A ∪ A0 = U,
viii) A ∩ A0 = ∅.
Mediante el uso de las leyes del álgebra de clases que hemos desarrollado anteriormente, podemos
probar todas las propiedades elementales de clases sin referirnos a las definiciones de los símbolos
∪, ∩, 0 , y ⊆. El siguiente es un ejemplo de cómo se llevan a cabo tales demostraciones.
A − B = A ∩ B0.
Conviene notar que con la ayuda del Teorema 2.8, las relaciones que involucran la inclusión (⊆),
y no sólo la igualdad, pueden demostrarse utilizando el álgebra de clases.
Ejercicio 2.3.
a) (A ∩ B) ∪ C = (A ∪ C) ∩ (B ∪ C)
32 Capítulo 2. Clases y Conjuntos
b) (A ∪ B) ∩ C = (A ∩ C) ∪ (B ∩ C).
a) Si A ∩ C = ∅, entonces A ∩ (B ∪ C) = A ∩ B.
b) Si A ∩ B = ∅, entonces A − B = A.
c) Si A ∩ B = ∅ y A ∪ B = C, entonces A = C − B.
a) A ∩ (B − C) = (A ∩ B) − C.
b) (A ∪ B) − C = (A − C) ∪ (B − C).
c) A − (B ∪ C) = (A − B) ∩ (A − C).
d ) A − (B ∩ C) = (A − B) ∪ (A − C).
A + B = (A − B) ∪ (B − A)
a) A + B = B + A.
b) A + (B + C) = (A + B) + C.
c) A ∩ (B + C) = (A ∩ B) = (A ∩ B) + (A ∩ C).
d ) A + A = ∅.
e) A + ∅ = A.
a) A ∪ B = ∅ ⇒ A = ∅ y B = ∅.
b) A ∩ B 0 = ∅ si y sólo si A ⊂ B.
c) A + B = ∅ si y sólo si A = B.
a) A ∪ C = B ∪ C si y sólo si A + B ⊆ C.
b) (A ∪ C) + (B ∪ C) = (A + B) − C.
{a} = {x | x = a}.
Es fácil ver que {a} contiene un solo elemento, a saber, el elemento a. Una clase que contiene un
solo elemento se llama un singleton.
Si a y b son elementos, podemos usar el axioma de construcción de clases para formar la clase
{a, b} = {x | x = a o x = b}.
Claramente {a, b} contiene dos elementos, a saber, los elementos a y b. Una clase que contiene
exactamente dos elementos se llama un par no ordenado, o, más simplemente, un dobleton.
De la misma manera, podemos formar las clases {a, b, c}, {a, b, c, d}, y así sucesivamente.
Teorema 2.14. Si {x, y} = {u, v}, entonces
[x = u y y = v] o [x = v y y = u].
Nos gustaría definir pares ordenados de tal forma que se evite la introducción de un nuevo
concepto indefinido de “orden”. Es un hecho interesante que esto pueda, en efecto, ser realizado; se
procede de la siguiente manera.
Definición 2.9. Sean a y b elementos; el par ordenado (a, b) se define como la clase
Por lo tanto hay una clara distinción entre los dos posibles “órdenes” (a, b) y (b, a): son clases
distintas. Queda por demostrar que los pares ordenados, como los acabamos de definir, tienen la
Propiedad 2.1.
Teorema 2.15. Si (a, b) = (c, d), entonces a = c y b = d.
Definición 2.10. El producto Cartesiano de dos clases a y B es la clase de todos los pares
ordenados (x, y) donde x ∈ A y y ∈ B. En símbolos,
A × B = {(x, y) | x ∈ A y y ∈ B}.
34 Capítulo 2. Clases y Conjuntos
i) A × (B ∩ C) = (A × B) ∩ (A × C),
ii) A × (B ∪ C) = (A × B) ∪ (A × C),
iii) (A × B) ∩ (C × D) = (A ∩ C) × (B ∩ D).
Así como nos pareció instructivo representar las relaciones entre clases por medio de diagramas de
Venn, es a menudo conveniente ilustrar las relaciones entre los productos de clases mediante el uso de
un mecanismo gráfico conocido como un diagrama de coordenadas. Un diagrama de coordenadas es
análogo al conocido plano de coordenadas Cartesianas; hay dos ejes — uno vertical y uno horizontal—
pero consideramos sólo un “cuadrante”. Si queremos representar una clase A×B, entonces marcamos
un segmento del eje horizontal para representar a A y marcamos un segmento del eje vertical para
representar a B; A × B es el rectángulo determinado por estos dos segmentos (Fig. 5). Como un
ejemplo del uso de los diagramas de coordenadas, se ilustra el Teorema 1.32(iii) en la Fig. 6.
Ejercicio 2.4.
3. Probar que A × (B − D) = (A × B) − (A × D)
4. Probar que (A × B) ∩ (C × D) = (A × D) ∩ (C × B)
a) (A × A) ∩ (B × C) = (A ∩ B) × (A ∩ C)
b) (A × B) − (C × C) = [(A − C) × B] ∪ [A × (B − C)]
c) (A × A) − (B × C) = [(A − B) × A] ∪ [A × (A − C)].
a) A × B y A0 × C son disjuntos
b) B × A y C × A0 son disjuntos.
a) si a = {b}, entonces b ∈ a
b) x = y si y sólo si {x} = {y}
c) x ∈ a si y sólo si {x} ⊆ a
d ) {a, b} = {a} si y sólo si a = b.
(a, b) = (c, d) ⇒ a = c y b = d.
2.5. Gráficas
Una clase de pares ordenados se llama una gráfica. En otras palabras, es una subclase arbitraria
de U × U.
i) (G ◦ H) ◦ J = G ◦ (H ◦ J).
Definición 2.13. Sea G una gráfica. Por el dominio de G nos referimos a la clase
En otras palabras, el dominio de G es la clase de todas las “primeras componentes” de los elementos
de G, y el rango es la clase de todas las “segunda componentes” de los elementos de G.
Ejercicio 2.5.
Considere la clase {A1 , A2 , . . . , An }; sus elementos están indexados por los números 1, 2, . . . , n.
Dicha clase a menudo se llama una familia indexada de clases; los números 1, 2, . . . , n se llaman
índices y la clase {1, 2, . . . , n} es llamada la clase de índices.
En general, con frecuencia somos guiados a pensar en una clase I cuyos elementos i, j, k, . . . sirven
como índices para designar los elementos de una clase {Ai , Aj , Ak , . . .}. La clase {Ai , Aj , Ak , . . .} es
llamada una familia indexada de clases, I es llamada su clase de índice, y los elementos de I son
llamados índices. Una notación compacta que a menudo se usa para designar la clase {Ai , Aj , Ak , . . .}
es
{Ai }i∈I .
Así, hablando informalmente, {Ai }i∈I es la clase de todas las clases Ai , con i variando en I.
Observación 2. La definición de una familia indexada de clases que acabamos de dar es, sin duda,
intuitiva, se basa en la noción intuitiva de indexación. Esta definición intuitiva es adecuada en
este momento; sin embargo, para referencias futuras, damos ahora una definición formal del mismo
concepto:
2.6. Unión e intersección generalizadas 37
Por una familia indexada de clases, {Ai }i∈I , nos referimos a una gráfica G cuyo dominio es I;
para cada i ∈ I definimos Ai por
Ai = {x | (i, x) ∈ G}.
Por ejemplo, considere {Ai }i∈I donde I = {1, 2}, A1 = {a, b} y A2 = {c, d}. Entonces, formalmente,
{Ai }i∈I es la gráfica
G = {(1, a), (1, b), (2, c), (2, d)}.
Si {Ai }i∈I es una familia indexada de clases tal que para cada i ∈ I, Ai es un elemento, entonces
{Ai | i ∈ I} designará la clase cuyos elementos son todos los Ai , esto es, {Ai | i ∈ I} = {x | x =
Ai para algún i ∈ I}. Sin embargo, seguiremos el uso matemático actual y emplearemos las dos
expresiones, {Ai }i∈I y {Ai | i ∈ I}, indistintamente.
Definición 2.14. Sea {Ai }i∈I una familia indexada de clases. La unión de las clases Ai consiste
de todos los elementos que pertenecen al menos a una clase Ai de la familia. En símbolos,
[
Ai = {x | ∃j ∈ I 3 x ∈ Aj }.
i∈I
La intersección de las clases Ai consiste de todos los elementos que pertenecen a toda clase Ai
de la familia. En símbolos, \
Ai = {x | ∀i ∈ I, x ∈ Ai }.
i∈I
Las siguientes son algunas propiedades básicas de las familias indexadas de clases.
S
i) Si Ai ⊆ B para cada i ∈ I, entonces Ai ⊆ B.
i∈I
T
ii) Si B ⊆ Ai para cada i ∈ I, entonces B ⊆ i∈I Ai .
38 Capítulo 2. Clases y Conjuntos
2.7. Conjuntos
Indudablemente, todo lo que hemos dicho en las paginas anteriores es muy familiar al lector.
Aunque dijimos clase donde el lector esta mas acostumbrado a oír conjunto, es obvio que la “unión”
e ïntersección"que hemos definido son precisamente las familiares unión e intersección de conjuntos, el
"producto Cartesiano.es exactamente el producto Cartesiano usual de conjuntos y similarmente para
los otros conceptos introducidos. En este punto, parece como si todo lo que estamos acostumbrados
a hacer con conjuntos se puede hacer con clases. Así, el lector muy bien prodria preguntar, ï,por que
molestarse en distinguir entre clases y conjuntos? i,Por que no desarrollar toda la matemática en
términos de clases?"Ya que, como hemos dicho, una clase significa çualquier colección de elementos",
que no simplemente le llamamos a una clase un conjunto, y acabamos de una vez? La respuesta a
esta pregunta es de gran importancia, el principal propósito de esta sección es explicar por que
queremos distinguir entre clases y conjuntos. Primero, notemos que el axioma de construcción de
clases (Axioma A2) nos permite formar la clase de todos los elementos que satisfacen una propiedad
dada; pero no nos permite formar la clase de todas las clases que satisfacen una propiedad dada. La
razón de esta limitación es obvia: si pudiéramos formar la clase de todas las clases que satisfacen
cualquier propiedad dada, entonces podríamos formar la çlase de Russell"de todas las clases que no
son elementos de si mismas, esto nos daría la paradoja de Russell.
Funciones
3.1. Introducción
39