100% encontró este documento útil (1 voto)
578 vistas263 páginas

Álgebra Clásica: Segunda Edición

Este documento presenta un resumen de tres capítulos del libro "Álgebra Clásica" de José Antonio Vargas Mendoza. El capítulo 1 introduce conceptos básicos de teoría de grupos como definiciones, subgrupos, morfismos, acciones de grupos y teoremas importantes. El capítulo 2 cubre temas básicos de teoría de anillos como definiciones, ideales, anillos conmutativos y localización. El capítulo 3 presenta conceptos fundamentales de teoría de Galois como extensiones de campos, normalidad, separ

Cargado por

Luis
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
100% encontró este documento útil (1 voto)
578 vistas263 páginas

Álgebra Clásica: Segunda Edición

Este documento presenta un resumen de tres capítulos del libro "Álgebra Clásica" de José Antonio Vargas Mendoza. El capítulo 1 introduce conceptos básicos de teoría de grupos como definiciones, subgrupos, morfismos, acciones de grupos y teoremas importantes. El capítulo 2 cubre temas básicos de teoría de anillos como definiciones, ideales, anillos conmutativos y localización. El capítulo 3 presenta conceptos fundamentales de teoría de Galois como extensiones de campos, normalidad, separ

Cargado por

Luis
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 263

Publicaciones Electrónicas

Sociedad Matemática Mexicana

Álgebra Clásica
Segunda Edición

José Antonio Vargas Mendoza

www.sociedadmatematicamexicana.org.mx

Serie: Textos. Vol. 7 (2006)


ISBN: 968-9161-17-2
Segunda edición
ii

ISBN 968-9161-17-2 en línea


ISBN 968-9161-18-0 en papel
ISBN 968-9161-19-9 en CD
iii

Prólogo

Al iniciarse el siglo XXI, es cada vez mayor la cantidad y calidad de


material que deben dominar los estudiantes de Matemáticas a nivel de
licenciatura, independientemente de sus planes a futuro. Esto es particu-
larmente cierto en lo que respecta al álgebra.
El presente libro intenta cubrir ese material agrupado en cinco capı́tulos
correspondientes a grupos, anillos, teorı́a de Galois, álgebra lineal y temas
complementarios. La situación ideal para quien aspire a adquirir una sólida
base algebraica, para después completar estudios de postgrado, es que
dedique un semestre a cada uno de los primeros cuatro capı́tulos del libro,
de manera que tenga tiempo de adquirir el lenguaje, digerir los métodos y
resultados aquı́ presentados; ası́ como de interactuar con los problemas
enunciados. También es posible diseñar cursos para un año de álgebra
basándose en este libro; tal vez omitiendo algunas secciones.
El quinto capı́tulo puede ser usado como fuente para exposiciones de los
alumnos o para lecturas adicionales.
Este es un proyecto ambicioso, que requiere de bastante trabajo tanto
del alumno como del profesor. Por otro lado, cada vez hay más alumnos y
profesores competentes capaces de cubrir el material aquı́ incluido.
El autor confiesa su mala intención de poner directamente en manos de
alumnos destacados, ideas y retos que sus profesores de licenciatura tal vez
no quieran darles.
El nombre del libro, Algebra Clásica, concuerda con el criterio usado para
la elección de los temas a tratar y de su profundidad. El mayor prerequisito
para su comprensión, es el interés por el tema, junto con un curso previo
de álgebra lineal elemental.
Para esta segunda edición, se corrigieron múltiples errores, se agregaron
ejercicios al capı́tulo 5 y se escribió una nueva demostración del Teorema
de Frobenius que clasifica los anillos de división reales.

José Antonio Vargas M.


CIIDIR-Oaxaca, IPN
Oaxaca, Oax. México
Noviembre, 2009
iv
Contenido

1 Grupos 1
1.1 Preliminares . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Definiciones y Primeros Resultados . . . . . . . . . . . . . . 3
1.3 Subgrupos Normales . . . . . . . . . . . . . . . . . . . . . . 9
1.4 Morfismos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.5 Conjugación y Automorfismos . . . . . . . . . . . . . . . . . 13
1.6 Acciones de Grupos . . . . . . . . . . . . . . . . . . . . . . 14
1.7 El Grupo Simétrico . . . . . . . . . . . . . . . . . . . . . . . 18
1.8 Productos Directos y Semidirectos . . . . . . . . . . . . . . 25
1.9 Solubilidad y Nilpotencia . . . . . . . . . . . . . . . . . . . 28
1.10 Teoremas de Sylow . . . . . . . . . . . . . . . . . . . . . . . 31
1.11 Series de Composición . . . . . . . . . . . . . . . . . . . . . 36
1.12 Generadores y Relaciones . . . . . . . . . . . . . . . . . . . 39
1.13 Grupos Abelianos Finitamente Generados . . . . . . . . . . 41
1.14 Ejercicios Generales . . . . . . . . . . . . . . . . . . . . . . 47

2 Anillos 49
2.1 Definiciones y Primeros Resultados . . . . . . . . . . . . . . 49
2.2 Funciones Aritméticas . . . . . . . . . . . . . . . . . . . . . 52
2.3 Morfismos e Ideales . . . . . . . . . . . . . . . . . . . . . . . 54
2.4 Anillos Conmutativos . . . . . . . . . . . . . . . . . . . . . 56
2.5 Localización . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
2.6 Anillos Euclideanos, Principales y de Factorización Única . 64
2.7 Polinomios . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
2.8 Polinomios Simétricos, Resultante y Discriminante . . . . . 79
2.9 Módulos y Anillos Noetherianos . . . . . . . . . . . . . . . . 84
2.10 Series Formales de Potencias . . . . . . . . . . . . . . . . . 88
2.11 Ejercicios Generales . . . . . . . . . . . . . . . . . . . . . . 91
Contenido v

3 Campos y Teorı́a de Galois 93


3.1 Extensiones de Campos . . . . . . . . . . . . . . . . . . . . 93
3.2 Cerradura Algebraica . . . . . . . . . . . . . . . . . . . . . 98
3.3 Normalidad . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
3.4 Separabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . 104
3.5 Teorı́a de Galois . . . . . . . . . . . . . . . . . . . . . . . . 109
3.6 Campos Reales . . . . . . . . . . . . . . . . . . . . . . . . . 117
3.7 Campos Finitos . . . . . . . . . . . . . . . . . . . . . . . . . 125
3.8 Extensiones Ciclotómicas . . . . . . . . . . . . . . . . . . . 128
3.9 Extensiones Cı́clicas . . . . . . . . . . . . . . . . . . . . . . 133
3.10 Solubilidad con Radicales . . . . . . . . . . . . . . . . . . . 138
3.11 Constructibilidad con Regla y Compás . . . . . . . . . . . . 144
3.12 Grupos de Galois sobre Q . . . . . . . . . . . . . . . . . . . 148
3.13 Ejercicios Generales . . . . . . . . . . . . . . . . . . . . . . 151

4 Algebra Lineal 153


4.1 Módulos Libres . . . . . . . . . . . . . . . . . . . . . . . . . 153
4.2 Algebras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
4.3 Determinantes . . . . . . . . . . . . . . . . . . . . . . . . . 168
4.4 Matrices sobre Dominios Principales . . . . . . . . . . . . . 177
4.5 Módulos sobre Dominios Principales . . . . . . . . . . . . . 181
4.6 Similaridad de Matrices sobre Campos . . . . . . . . . . . . 185
4.7 La Descomposición de Jordan-Chevalley . . . . . . . . . . . 193
4.8 Conmutatividad de Matrices . . . . . . . . . . . . . . . . . 199
4.9 Formas Bilineales y Cuadráticas . . . . . . . . . . . . . . . 203
4.10 Formas Alternas . . . . . . . . . . . . . . . . . . . . . . . . 210
4.11 Formas Hermitianas . . . . . . . . . . . . . . . . . . . . . . 214
4.12 Ejercicios Generales . . . . . . . . . . . . . . . . . . . . . . 221

5 Temas Complementarios 223


5.1 Teorema de la Base Normal . . . . . . . . . . . . . . . . . . 223
5.2 Formas Bilineales sobre Campos Finitos . . . . . . . . . . . 226
5.3 La Densidad de Jacobson y sus Consecuencias . . . . . . . . 228
5.4 Semisimplicidad . . . . . . . . . . . . . . . . . . . . . . . . . 231
5.5 Algebras de Clifford . . . . . . . . . . . . . . . . . . . . . . 234
5.6 Teoremas de Frobenius y de Hurwitz . . . . . . . . . . . . . 241
5.7 Ejercicios Generales . . . . . . . . . . . . . . . . . . . . . . 244
5.8 Enunciados . . . . . . . . . . . . . . . . . . . . . . . . . . . 245

6 Errata de la versión anterior 246

Bibliografı́a 249

Indice Alfabético 251


Capı́tulo 1
Grupos

1.1 Preliminares
En esta sección enunciamos ciertas propiedades de los enteros Z y de los
enteros módulo n que se necesitarán inmediatamente.
Dados a, b ∈ Z con b 6= 0, existen q, r ∈ Z con a = bq + r de manera que
0 ≤ r < |b|. Este es el algoritmo euclideano.
Un número entero p > 1 es primo cuando solamente es divisible por ±1
y por ±p.
Todo entero positivo distinto de 1 puede escribirse como producto de
potencias positivas de primos. Esta expresión es única, en el sentido de que

n = pa1 1 · · · par r = q1b1 · · · qsbs ,

donde p1 , ..., pr son primos distintos; y q1 , ..., qs también son primos distin-
tos con ai , bj > 0 para todas i, j, implica que r = s y para cada 1 ≤ i ≤ r
existe 1 ≤ j ≤ s tal que j es único, pi = qj y ai = bj .
Se dice que c > 0 es el máximo común divisor de m y n, escrito
c = m.c.d.{m, n} cuando c divide a m (escrito c|m), c|n y (d|m, d|n ⇒ d|c).
Cuando m = pa1 1 · · · par r y n = pb11 · · · pbrr con ai , bj ≥ 0, entonces

m.c.d.{m, n} = pc11 · · · pcrr ,

donde ci = mı́n {ai , bi }, para todo i. Observamos que siempre es posible


escribir dos números positivos m y n en esta forma, permitiendo que algunos
exponentes sean cero.
Se dice que s > 0 es el mı́nimo común múltiplo de m y n, cuando
m|s, n|s y (m|r, n|r ⇒ s|r). Esto se escribe ası́: s = m.c.m.{m, n}.
Cuando m = pa1 1 · · · par r y n = pb11 · · · pbrr con ai , bj ≥ 0, entonces

m.c.m.{m, n} = pk11 · · · pkr r ,

donde ki = máx {ai , bi }, para todo i.


Por lo anterior, (m.c.d.{m, n})(m.c.m.{m, n}) = mn.
Dos enteros a y b son primos relativos cuando m.c.d.{a, b} = 1.
2 1. Grupos

Los números naturales N = {0, 1, 2, ...} están bien ordenados; lo que


quiere decir que satisfacen la siguiente condición:

Axioma 1.1 Todo subconjunto no vacı́o de N tiene un elemento mı́nimo.

Usando esta propiedad, tenemos la siguiente caracterización del m.c.d.


de dos números:

Proposición 1.2 El máximo común divisor de m y n, ambos no iguales a


cero, es el mı́nimo elemento positivo del conjunto A = {am+bn | a, b ∈ Z}.

Demostración: A es claramente no vacı́o pues contiene a 0. Además,


también contiene elementos positivos. Sea c el mı́nimo de ellos, de manera
que existen a, b ∈ Z tales que am + bn = c.
Por el algoritmo euclideano, existen q, r ∈ Z tales que m = cq + r,
satisfaciendo 0 ≤ r < c; pero r = m − cq = (1 − qa)m + (−qb)n ∈ A.
Siendo c mı́nimo positivo, se obtiene que r = 0, es decir, que c|m. Simi-
larmente, c|n. Por último, d|m, d|n ⇒ d|(am + bn) = c.
Pasamos ahora a definir los enteros módulo n:
Fijamos 0 < n ∈ Z y definimos una relación ∼ en Z ası́:

a ∼ b ⇔ n|(a − b).

Es inmediato que

• ∼ es reflexiva, esto es, que a ∼ a para toda a ∈ Z;

• ∼ es simétrica: a ∼ b ⇔ b ∼ a;

• ∼ es transitiva: a ∼ b, b ∼ c ⇒ a ∼ c.

Esto significa que ∼ es una relación de equivalencia, por lo que Z es


la unión disjunta de las clases de equivalencia, es decir, de los conjuntos
{m ∈ Z | m ∼ a} = {a + rn | r ∈ Z}, que abreviamos ası́: a.
Es común escribir a ≡ b (mod n) cuando a ∼ b.
Definimos operaciones en el conjunto de n elementos {0, 1, ..., n − 1} ası́:

a + b = a + b, a × b = ab,

que están bien definidas como es fácil ver. En esta forma, este conjunto con
esas operaciones son los enteros módulo n, escritos Z/nZ.

Ejercicios
1. Dados a, b ∈ Z con b 6= 0, demuestre que los números q, r tales que
a = bq + r con 0 ≤ r < |b|, cuya existencia garantiza el algoritmo
euclideano, son únicos.
1.2 Definiciones y Primeros Resultados 3

2. Sea T un subconjunto no vacı́o de Z tal que si a, b ∈ T , entonces


(a + b), (a − b) ∈ T . Demuestre que T consiste de los múltiplos de
algún entero m.

3. Demuestre que todo entero positivo se puede escribir de manera única


como una suma de distintas potencias no negativas de 2.

1.2 Definiciones y Primeros Resultados


Un grupo G es un conjunto equipado con una operación (aquı́ escrita como
multiplicación) tal que:

1. a, b ∈ G ⇒ ab ∈ G.

2. a(bc) = (ab)c para todos a, b, c ∈ G.


Esta propiedad se llama asociatividad.

3. Existe un elemento 1 ∈ G tal que a1 = 1a = a para toda a ∈ G.

4. Para toda a ∈ G, existe b ∈ G tal que ab = ba = 1.

Es inmediato que el elemento cuya existencia garantiza la condición 3 es


único, pues si 10 satisface la condición 3, se tiene que

1 = 110 = 10 .

Este elemento es la identidad de G.


En vista de esta observación, la condición 4 tiene sentido; y además, dado
a, se tiene que el elemento b de esa condición es único, pues si c también
la satisface, entonces

ab = ac = 1 ⇒ b(ab) = b(ac) ⇒ (ba)b = (ba)c ⇒ b = c.

En esta situación, se escribe b = a−1 y se dice que b es el inverso de a.


Es claro que (a−1 )−1 = a y que (ab)−1 = b−1 a−1 para todos a, b ∈ G.
Cuando C es un conjunto finito, ◦(C) denota el número de elementos de
C y se llama el orden de C.
Se dice que un grupo G es abeliano cuando ab = ba para todos a, b ∈ G.
Ejemplos. Como ejemplos de grupos tenemos los siguientes, para los que
fijamos nuestra notación.

1. Los números enteros Z ante la suma.

2. Los números racionales Q ante la suma.

3. Los números reales R ante la suma.


4 1. Grupos

4. Los números complejos C ante la suma.


5. Los enteros módulo n ante la suma, Z/nZ. Cuando eliminamos la
multiplicación de este conjunto, escribimos Zn y decimos que es el
grupo cı́clico de orden n.
6. Dado un conjunto arbitrario X, la colección de todas las biyecciones
f : X → X forma un grupo ante la operación de composición de fun-
ciones, el grupo simétrico SX . En caso de que ◦(X) = n, escribimos
Sn . Los elementos de estos grupos se llam an permutaciones.
7. El conjunto de todas las matrices n×n con coeficientes en Q, resp. en
R ó en C y determinante 6= 0 forma un grupo ante la multiplicación de
matrices, el grupo general lineal GLn (Q), resp. GLn (R) ó GLn (C).
8. El conjunto de todas las matrices n×n con coeficientes en Q, resp. en
R ó en C y determinante 1 forma un grupo ante la multiplicación de
matrices, el grupo especial lineal SLn (Q), resp. SLn (R) ó SLn (C).
9. Por otra parte, los números naturales N no son un grupo ni ante la
suma ni ante la multiplicación.
Dados un grupo G y un subconjunto H ⊆ G, se dice que H es un
subgrupo de G cuando H es un grupo ante la misma operación de G.
Esto lo escribimos ası́: H < G.
Ejemplo. SLn < GLn sobre cualquier campo como Q, R ó C.
Para subconjuntos arbitrarios A, B ⊆ G, definimos los conjuntos
A−1 = {a−1 | a ∈ A} y AB = {ab | a ∈ A, b ∈ B}.
Proposición 1.3 Si ∅ 6= H ⊆ G, entonces las siguientes condiciones son
equivalentes:
a) H < G.
b) HH ⊆ H y H −1 ⊆ H.
c) HH −1 ⊆ H.
Demostración: a) ⇒ b) y b) ⇒ c) son claras. Veamos que c) ⇒ a):
Como existe h ∈ H, se tiene que 1 = hh−1 ∈ H y que por lo tanto
a ∈ H ⇒ a−1 = 1a−1 ∈ H. Finalmente, tenemos que a, b ∈ H ⇒ ab =
a(b−1 )−1 ∈ H.
Observación. Si H es finito, entonces la condición H −1 ⊆ H de b) es
redundante, es decir, HH ⊆ H ⇒ H −1 ⊆ H, pues dado h ∈ H se tiene que
hH ⊆ H y también ◦(hH) = ◦(H) ⇒ hH = H. Por tanto existe k ∈ H con
hk = h, ası́ k = 1 y también existe j ∈ H con hj = 1; pero h−1 = j ∈ H
en ese caso.
Teorema 1.4 (Lagrange) Si G es un grupo finito y H es un subgrupo,
entonces ◦(H) | ◦ (G).
1.2 Definiciones y Primeros Resultados 5

Demostración: Toda clase lateral derecha xH de H tiene ◦(H) elemen-


tos. Si xh1 = yh2 ∈ xH ∩ yH con h1 , h2 ∈ H, entonces y −1 x = h2 h−1
1 ∈ H,
por lo que xH = y(y −1 x)H = yH. Se ve entonces que las clases laterales
distintas son disjuntas. Si hay n de ellas, se tiene que n(◦(H)) = ◦(G).

El ı́ndice de H en G, escrito [G : H] es el número de clases laterales


de H en G. Cuando G es finito, [G : H] = ◦(G)/ ◦ (H), ver el Ejercicio 2,
página 8.
Si {HTi } es una colección de subgrupos de G para i ∈ I, entonces clara-
mente ( i∈I Hi ) < G. Mientras que dado un subconjunto A ⊆ G, se tiene
que la intersección de todas las H tales que A ⊆ H < G es un subgrupo de
G, escrito hAi y llamado el subgrupo generado por A.
Se dice que un grupo G es cı́clico cuando existe un elemento a ∈ G tal
que G = hai. Es claro que Zn es cı́clico y de orden n. Usando la asociativi-
dad, también es claro que todo grupo cı́clico es abeliano.

Corolario 1.5 Si G es un grupo finito de orden n, entonces an = 1 para


toda a ∈ G.

Demostración: Dado 1 6= a ∈ G, sea H = hai. Claramente se ve que


H = {1, a, a2 , ..., am−1 }, donde m es el mı́nimo entero positivo tal que
am = 1. Ası́, ◦(H) = m, m|n por el Teorema de Lagrange y an = 1.

Definimos el orden de un elemento a ∈ G como el orden de hai, escrito


◦(a).
La función ϕ : N → N de Euler queda definida por ϕ(1) = 1 y para
n > 1 por ϕ(n) = número de enteros positivos menores que n y primos
relativos a n. Por ejemplo, si p es primo, ϕ(pm ) = pm − pm−1 .

Corolario 1.6 (Euler) Si a y n son primos relativos, con n positivo, en-


tonces aϕ(n) ≡ 1 (mod n).

Demostración: Observemos primero que si a y n son enteros primos rela-


tivos, entonces a + kn y n también lo son, para todo k ∈ Z. De manera que
tiene sentido considerar a los elementos de Z/nZ = {0, 1, ..., n − 1} que son
primos con respecto a n. Este conjunto H forma un grupo multiplicativo
de orden ϕ(n), pues HH ⊆ H y entonces H −1 ⊆ H (vea la Observación
previa). Como a pertenece a este grupo, se tiene que aϕ(n) ≡ 1 (mod n).
Corolario 1.7 (Fermat) Si p es un número primo y a es un entero, en-
tonces ap ≡ a (mod p).
Demostración: Como ϕ(p) = p−1, se tiene que ap−1 ≡ 1 (mod p) siempre
que p - a. En todo caso, ap ≡ a (mod p).
Corolario 1.8 Si a > 1, n ≥ 1 son enteros, entonces n | ϕ(an − 1).
6 1. Grupos

Demostración: Sea G el grupo multiplicativo de los enteros (mod an − 1)


primos con respecto a an − 1. Entonces ◦(G) = ϕ(an − 1). Es claro que
a ∈ G y que ◦(a) = n, por lo que n | ϕ(an − 1).
Si A, B, C son conjuntos finitos, es fácil ver que

◦(A ∪ B) = ◦(A) + ◦(B) − ◦(A ∩ B),

◦(A ∪ B ∪ C) = ◦(A) + ◦(B) + ◦(C) − ◦(A ∩ B) − ◦(B ∩ C) − ◦(A ∩ C)


+ ◦ (A ∩ B ∩ C).
Esto se generaliza como sigue.

Proposición 1.9 (Principio de inclusión y exclusión) Si A1 , ..., An


son conjuntos finitos, entonces
[ X X \
◦( Ai ) = ◦(Ai ) − ◦(Ai ∩ Aj ) + · · · + (−1)n−1 ◦ ( Ai ).
i i i<j i

Demostración: Cada a ∈ ∪i Ai está contenido en exactamente un número


1 ≤ t ≤ n de conjuntos Ai . Por eso, fijando t, el elemento a da origen en el
lado derecho de nuestro enunciado a una contribución de
µ ¶ µ ¶ µ¶ µ ¶
t t t t
− + · · · + (−1)t−1 = = 1,
1 2 t 0
pues µ ¶ µ ¶ µ ¶ µ¶
t t t t
− + − · · · + (−1)t = (1 − 1)t = 0.
0 1 2 t

Ahora aplicamos este resultado al cálculo de la función ϕ de Euler.

Corolario 1.10 Si p1 , ..., pm son los distintos primos que dividen a un


entero positivo n, entonces

Ym
n n n n 1
ϕ(n) = n − − ··· − + + ··· + − · · · = n (1 − ).
p1 pm p1 p2 pm−1 pm i=1
pi

Demostración: ϕ(n) enumera los elementos que quedan del conjunto B =


{1, 2, ..., n}, al omitir aquellos que tienen un factor común no trivial con n.
Si Ai es el subconjunto de B formado por los números divisibles por pi ,
tendremos que ϕ(n) = ◦(B r ∪i Ai ).
La conclusión se sigue de la Proposición 1.9 y de que
n
◦(Ai1 ∩ · · · ∩ Aik ) = .
pi1 · · · pik

Observación. Si m.c.d.{a, b} = 1, entonces ϕ(ab) = ϕ(a)ϕ(b).


1.2 Definiciones y Primeros Resultados 7

Teorema 1.11 Sea G = hgi un grupo cı́clico de orden n. Entonces:


a) Todo subgrupo de G es cı́clico.
b) El orden de un elemento g m es n/ m.c.d.{m, n}.
c) El número de elementos x ∈ G tales que G = hxi es ϕ(n).
d) Para cada entero positivo r tal que r|n, existe un único subgrupo de
orden r.

Demostración: a) Sea H < G. Definimos T = {i ∈ Z | g i ∈ H}. El


conjunto T es cerrado ante la suma y la resta de sus elementos; ası́ como
ante la multiplicación por cualquier entero, por lo que existe s ∈ N tal que
T consiste de los múltiplos de s. Ası́, H = hg s i.
b) El orden de un elemento g m es el mı́nimo entero t tal que n | mt. Este
número es n/ m.c.d.{m, n}.
c) En vista de b), un elemento g i con 1 ≤ i < n genera a G si y sólo
si m.c.d.{n, i} = 1, es decir, si y sólo si i es primo con respecto a n. El
número de posibilidades para i es entonces ϕ(n).
d) También en vista de b), un elemento g i es de orden r si y sólo si
m.c.d.{n, i} = n/r. De esta manera, H = hg n/r i es de orden r y H contiene
a todo elemento de G de orden r.

Lema 1.12 Si H, K < G, entonces las siguientes condiciones son equiva-


lentes:
a) HK < G.
b) HK ⊆ KH.
c) HK = KH.

Demostración: c) ⇒ b) es claro.
Veamos que b) ⇒ a) verificando que se satisface la condición c) de la
Proposición 1.3 para HK:

(HK)(HK)−1 = H(KK −1 )H −1 ⊆ HKH −1 = HK −1 H −1 ;

pero HK ⊆ KH ⇒ K −1 H −1 ⊆ H −1 K −1 de manera que

HK −1 H −1 ⊆ HH −1 K −1 ⊆ HK −1 = HK.

Ası́ podemos concluir que (HK)(HK)−1 ⊆ HK y que HK < G.


Finalmente, a) ⇒ c), porque HK = (HK)−1 = K −1 H −1 = KH.
Corolario 1.13 Si G es un grupo abeliano y H, K < G, entonces también
HK < G.

Lema 1.14 Si H, K son subgrupos finitos de G, entonces

◦(H) ◦ (K)
◦(HK) = .
◦(H ∩ K)
8 1. Grupos

Demostración: Esto es consecuencia de observar que h1 k1 = h2 k2 ⇔


h−1 −1
2 h1 = k2 k1 ∈ H ∩ K, para todas hi ∈ H, ki ∈ K.

Proposición 1.15 (Poincaré) Si H, K son subgrupos de ı́ndice finito en


un grupo G, entonces H ∩ K también tiene ı́ndice finito.
Demostración: Para cualquier x ∈ G arbitrario, es claro que se tiene
x(H ∩ K) = (xH) ∩ (xK), por lo que solamente hay un número finito de
posibilidades para clases laterales de (H ∩ K).

Ejercicios
1. Un monoide es un conjunto con una operación que satisface las
primeras tres condiciones para ser grupo. Dé 3 ejemplos de monoides
que no sean grupos.
2. Sean G un grupo y H un subgrupo. Construya una biyección del
conjunto de las clases laterales izquierdas de H en G al conjunto de
las clases laterales derechas de H en G.
3. Sean H y K subgrupos finitos de un grupo G. Demuestre que el
número de elementos de una clase lateral doble, definida como
HxK = {hxk | h ∈ H, k ∈ K} es igual a ◦(H)[K : (x−1 Hx ∩ K)].
4. Sean m, n ∈ N con r = m.c.d.{m, n}. Demuestre que
r
ϕ(mn) = ϕ(m)ϕ(n) .
ϕ(r)

5. Para cierto entero positivo h, se tiene que el número 2h + 1 = p es


primo.
a) Demuestre que el orden de 2 en el grupo multiplicativo de Z/pZ
es 2h.
b) Demuestre que 2h | (p − 1) = 2h .
c) Demuestre que h es una potencia de 2.
6. a) Sean d y n enteros positivos tales que d|n. Demuestre que el número
de enteros i tales que 0 < i ≤ n y m.c.d.{i, n} = d, es ϕ(n/d).
P
b) Demuestre que d|n ϕ(n/d) = n.

7. Sean A y B conjuntos finitos con ◦(A) = m, ◦(B) = n y m ≥ n.


a) Calcule el número de funciones f : A → B.
b) Demuestre que el número de funciones suprayectivas f : A → B es
n
X µ ¶
n
(−1)i (n − i)m .
i=0
i
1.3 Subgrupos Normales 9

1.3 Subgrupos Normales


Se dice que un subgrupo N de G es normal cuando xN x−1 ⊆ N para toda
x ∈ G. Esto es claramente equivalente a xN x−1 = N para toda x ∈ G y se
escribe N C G.

Proposición 1.16 Para N < G, las siguientes condiciones son equiva-


lentes:
a) N C G.
b) Toda clase lateral izquierda de N es una clase lateral derecha de N (o
recı́procamente). Más precisamente, N x = xN para toda x ∈ G.
c) El producto de dos clases laterales izquierdas (resp. derechas) de N es
una clase lateral izquierda (resp. derecha) de N .

Demostración: a) ⇒ b): Se tiene que xN x−1 = N para toda x ∈ G. Por


tanto, xN = N x para toda x ∈ G.
b) ⇒ c): (N a)(N b) = N (aN )b = N (N a)b = N ab para todas a, b ∈ G.
c) ⇒ a): Para toda x ∈ G, N xN x−1 es una clase lateral izquierda de N
que contiene a 1; por tanto N xN x−1 = N y ası́ xN x−1 ⊆ N .
Observaciones. Las siguientes afirmaciones son todas fáciles de verificar.

1. Todo subgrupo de ı́ndice 2 es normal. Esto es consecuencia de la


equivalencia a) ⇔ b) de la Proposición 1.16.

2. Si G es abeliano, entonces todo subgrupo de G es normal.

3. Toda intersección de subgrupos normales es un subgrupo normal.

4. Si N C G y H < G, entonces (N ∩ H) C H.

5. Si N C G y H < G, entonces N H < G y N C N H.

Ejemplo. Sea H = {±1, ±i, ±j, ±k} el conjunto de 8 elementos con mul-
tiplicación dada por i2 = j 2 = k 2 = −1, ij = k = −ji, jk = i = −kj, ki =
j = −ik, (−1)2 = 1, (−1)(±i) = ∓i, (−1)(±j) = ∓j, (−1)(±k) = ∓k; este
es el grupo de cuaternios. Todos los subgrupos de H son normales y H
no es abeliano, por lo que el recı́proco de la Observación 2 es falso.

Teorema 1.17 Si N C G, entonces el conjunto G/N de las clases laterales


izquierdas de N en G es un grupo.

Demostración: Esto es claro porque (N a)(N b) = N ab y (N a)−1 = N a−1


para todas a, b ∈ G, ante la multiplicación de bloques, que es asociativa
con identidad N.

Se dice que un grupo G es simple cuando sus únicos subgrupos normales


son {1} y G.
10 1. Grupos

Para a, b ∈ G definimos su conmutador como (a, b) = aba−1 b−1 . Como


a y b conmutan si y sólo si (a, b) = 1, se puede interpretar al conmutador
de ellos como una medida de su falta de conmutatividad.
Definimos al grupo derivado G0 de un grupo G como

G0 = h(a, b) | a, b ∈ Gi.

Proposición 1.18 Si N C G, entonces G/N es abeliano ⇔ G0 ⊆ N .


Demostración: N ab = N ba ⇔ N aba−1 b−1 = N ⇔ aba−1 b−1 ∈ N .

Proposición 1.19 Si H < G y G0 ⊆ H, entonces H C G.


Demostración: Dados h ∈ H y g ∈ G arbitrarios, ghg −1 h−1 ∈ G0 ⊆ H;
por consiguiente ghg −1 ∈ H.

Proposición 1.20 Si M, N C G y M ∩ N = {1}, entonces mn = nm para


todos m ∈ M y n ∈ N .
Demostración: (m, n) = (mnm−1 )n−1 = m(nm−1 n−1 ) ∈ M ∩ N . Por
tanto, (m, n) = 1.

Ejercicios
1. Sean G un grupo finito y H < G. Demuestre que (H es normal) ⇔
(todas las clases laterales dobles HaH tienen el mismo número de
elementos).
2. Para a, b ∈ R, sea Ta,b : R → R la transformación dada por Ta,b (x) =
ax + b para todo x ∈ R.
a) Demuestre que G = {Ta,b | a 6= 0} es un grupo ante la composición
de funciones.
b) Demuestre que U = {T1,b } es un subgrupo normal de G.
3. Sean G un grupo abeliano infinito y T la colección de todos los ele-
mentos de G de orden finito. Demuestre que T C G.

1.4 Morfismos
Un homomorfismo o simplemente un morfismo de grupos es una función
f : G → H, donde G y H son grupos, tal que f (ab) = f (a)f (b) para todos
a, b ∈ G.

Ejemplos. Las siguientes funciones son morfismos de grupos:


1.4 Morfismos 11

1. Para todo grupo G, la función identidad id : G → G, donde id(g) = g


para todo g ∈ G.

2. Para todo grupo G, la función constante 1 : G → {1}, donde 1(g) = 1


para todo g ∈ G.

3. El determinante det : GLn (Q) → Q? , donde Q? es el grupo multi-


plicativo de los elementos distintos de cero de Q.

4. Si N C G, entonces ϕ : G → G/N dado por ϕ(g) = N g es un


morfismo llamado natural. Este morfismo es suprayectivo.

El núcleo de un morfismo f : G → H es el conjunto {x ∈ G | f (x) = 1},


se escribe ker f . Un isomorfismo es un morfismo ϕ : G → H tal que admite
un morfismo inverso, esto es, ψ : H → G de manera que ψ ◦ ϕ = idG y
también ϕ ◦ ψ = idH .
Dos grupos G y H son isomorfos cuando existe un isomorfismo entre
ellos f : G → H. Esto se escribe G ∼ = H.
El núcleo de “ det ” del ejemplo 3 es SLn (Q), mientras que el núcleo del
ejemplo 4 es N .

Observaciones. Las siguientes afirmaciones para un morfismo f : G → H


son fáciles de verificar:

1. f (1) = 1 y f (x−1 ) = f (x)−1 para todo x ∈ G.

2. Im f < H.

3. ker f C G.

4. Si f (a) = b, entonces f −1 (b) = Ka, donde K = ker f .

5. f es un isomorfismo ⇔ f es suprayectivo y ker f = {1}.

Como consecuencia de 2 y 3, tenemos que dados un grupo G y un sub-


grupo normal N , entonces existen un grupo E y un morfismo suprayectivo
f : G → E con núcleo N .

Teorema 1.21 Sea f : G → H un morfismo suprayectivo con núcleo K.


Entonces K C G y G/K ∼
= H.

Demostración: Sea ϕ : G/K → H la función dada por ϕ(Kx) = f (x). Es


fácil ver que ϕ está bien definida y que es un isomorfismo.

Teorema 1.22 Sean H < G y N C G. Entonces

(H ∩ N ) C H y H/(H ∩ N ) ∼
= (HN/N ).
12 1. Grupos

Demostración: Sean f : G → G/N el morfismo natural y g la restricción


de f a H. Observamos que Im g = HN/N y que ker g = H ∩ N . La
conclusión es consecuencia del teorema anterior.

Teorema 1.23 Sean N ⊆ H ⊆ G tres grupos con N y H normales en G.


Entonces (H/N ) C (G/N ) y (G/N )/(H/N ) ∼
= (G/H).

Demostración: Sea f : G/N → G/H la función dada por f (N a) = Ha


para toda a ∈ G. Es fácil verificar que f es un morfismo suprayectivo con
núcleo H/N . Para terminar aplicamos el Teorema 1.21.

Teorema 1.24 Sean G y E grupos y sea f : G → E un morfismo suprayec-


tivo con núcleo N . La acción de f en subconjuntos de G da origen a
una biyección de {los subgrupos de G que contienen a N } a {los subgru-
pos de E}. Esta biyección preserva inclusiones y normalidad. Además, si
N ⊆ A < B < G y A0 = f (A), B 0 = f (B), entonces [B : A] = [B 0 : A0 ] y
A C B ⇔ A0 C B 0 , en cuyo caso B/A ∼ = B 0 /A0 .

Demostración: Si H < G es tal que N ⊆ H, entonces f (H) < E, por lo


que se puede definir ϕ : {subgrupos de G que contienen a N } → {subgrupos
de E} ası́: ϕ(H) = {f (h) | h ∈ H}; también es claro que ϕ preserva
inclusiones y que es suprayectiva: T < E ⇒ f −1 (T ) < G con N ⊆ f −1 (T );
y como f es suprayectiva, f f −1 (T ) = T .
Veamos que ϕ es una función inyectiva: Sean H1 , H2 < G tales que
N ⊆ H1 , H2 y ϕ(H1 ) = ϕ(H2 ). Si a ∈ H1 , entonces existe b ∈ H2 tal que
ϕ(a) = ϕ(b); por tanto ab−1 ∈ N ⊆ H2 y ası́ a = (ab−1 )b ∈ H2 b = H2 . Esto
demuestra que H1 ⊆ H2 . La otra inclusión se obtiene de manera análoga.
Es claro que si se tiene que N ⊆ A < B < G y que A C B, entonces
A0 C B 0 . Recı́procamente, si A0 C B 0 y b ∈ B, entonces bAb−1 ⊆ AN ⊆ A.
Además, B 0 /A0 ∼= (B/N )/(A/N ) ∼= B/A, por el Teorema 1.23.
Finalmente, N ⊆ A < B < G ⇒ [B : A] = [B 0 : A0 ], porque f envı́a
las clases laterales de A en B a las clases laterales de A0 en B 0 de manera
biyectiva.

Ejercicios

1. Sea ϕ un morfismo de grupos. Demuestre que ϕ es un isomorfismo si


y sólo si ϕ es biyectivo.

2. Sea ϕ : G → H un morfismo de grupos finitos con núcleo K. Sean


A < B subgrupos de G y A0 < B 0 sus imágenes. Demuestre que

[B : A] = [B 0 : A0 ][(B ∩ K) : (A ∩ K)].
1.5 Conjugación y Automorfismos 13

1.5 Conjugación y Automorfismos


Un endomorfismo de grupos es un morfismo f : G → G de un grupo
G en sı́ mismo. Un automorfismo de G es un isomorfismo de G en G.
El conjunto de los automorfismos de un grupo G forma un grupo ante la
composición de funciones; que se escribe Aut G.
Dados un grupo G y un elemento arbitrario a ∈ G, definimos una
función ia : G → G, llamada conjugación con a, ası́: ia (x) = axa−1 .
Como ia (xy) = ia (x)ia (y) y también ia (x−1 ) = [ia (x)]−1 , tenemos que
ia ∈ Aut G.
Definimos Int G = {ia |a ∈ G}, el conjunto de los automorfismos in-
ternos de G.
Como ia ib (x) = (ab)x(ab)−1 = iab (x) es cierto para toda x ∈ G, tenemos
que ia ◦ ib = iab . Similarmente, ia−1 = i−1
a , de manera que Int G < Aut G.

Proposición 1.25 Int G C Aut G.

Demostración: Sean α ∈ Aut G, x ∈ G arbitrarios, entonces es válido


que (αix α−1 )(g) = α(xα−1 (g)x−1 ) = α(x)gα(x)−1 para toda g ∈ G, por
lo que αix α−1 = iα(x) , que demuestra el enunciado.
Se dice que dos elementos a y b de un grupo G son conjugados en G
cuando existe x ∈ G tal que b = xax−1 . Evidentemente, conjugación es
una relación de equivalencia; sus clases de equivalencia se llaman clases
de conjugación.
Se dice que un subgrupo H de un grupo G es caracterı́stico cuando
f (H) ⊆ H para toda f ∈ Aut G.
Dados un grupo G y un subconjunto A ⊆ G, se definen el centralizador
de A en G, escrito ZG (A), como {x ∈ G | xa = ax para toda a ∈ A} y el
normalizador de A en G, escrito NG (A), como {x ∈ G | xA = Ax}.
El subgrupo ZG (G) se llama el centro de G y se escribe Z.

Observaciones. Las siguientes afirmaciones son fáciles de demostrar:

1. Todo subgrupo caracterı́stico es normal.

2. Todo subgrupo normal es una unión de clases de conjugación.

3. ZG (A), NG (A) < G para cualquier subconjunto A ⊆ G.

4. ZG (A) C NG (A) para cualquier subconjunto A ⊆ G.

5. Z es un subgrupo caracterı́stico de G.

Teorema 1.26 G/Z ∼


= Int G.
Demostración: Sea f : G → Int G la función dada por f (a) = ia para
toda a ∈ G. Este es un morfismo suprayectivo con núcleo Z.
14 1. Grupos

Ejercicios
1. Sea G un grupo con Z = {1}. Demuestre que ZAut G (Int G) = {1}.

2. Sea Z el centro de G. Demuestre que G/Z cı́clico ⇒ G abeliano.

3. Sea G un grupo finito con f ∈ Aut G tal que

• f 2 = 1,
• f (x) = x ⇒ x = 1.

Demuestre que G es abeliano.

4. Describa Aut Zn , donde n es un entero positivo.

5. Sea G un grupo con exactamente un elemento a de orden 2. Demuestre


que a es central.

6. Sea G un grupo con exactamente dos clases de conjugación, y que


contiene un elemento de orden n > 1. Demuestre que ◦(G) = 2.

7. Sean G un grupo finito y N C G tal que ◦(N ) = n, [G : N ] = m con


m.c.d.{m, n} = 1. Demuestre que N es un subgrupo caracterı́stico.

1.6 Acciones de Grupos


Se dice que un grupo G actúa en un conjunto X cuando se tiene un mor-
fismo f : G → SX . Esto es equivalente a tener una función

ϕ : G × X → X,

tal que al escribir ϕ(g, x) = g · x, se cumplan las condiciones:

• (gh) · (x) = g · (h · x), para todos g, h ∈ G, x ∈ X.

• 1 · x = x para toda x ∈ X.

En estas condiciones, definimos los siguientes conceptos: Para cada ele-


mento x ∈ X, el estabilizador de x es Gx = {g ∈ G | g · x = x}, que es
claramente un subgrupo de G. La órbita de x es G · x = {g · x | g ∈ G}.
Una acción es transitiva cuando el número de órbitas es 1, es decir,
cuando existe x ∈ X tal que G · x = X. Se dice que x ∈ X es un punto
fijo cuando Gx = G. El conjunto de los puntos fijos de X se escribe X G .
Un ejemplo de acción del grupo G sobre el conjunto G es conjugación,
donde f (g) = ig para toda g ∈ G. Aquı́ las órbitas son las clases de con-
jugación, el estabilizador de un elemento x es su centralizador Z(x); y un
elemento es un punto fijo cuando pertenece al centro del grupo.
1.6 Acciones de Grupos 15

Teorema 1.27 Si el grupo G actúa en el conjunto X, entonces X es la


unión disjunta de las órbitas. Existe una biyección de {los elementos de la
órbita de x} a {las clases laterales de Gx en G}. En particular, ◦(G · x) =
[G : Gx ].

Demostración: La condición “a, b pertenecen a una órbita” define una


relación de equivalencia, por lo que la primera afirmación es clara.
Definimos ϕ : G/Gx → G · x ası́: ϕ(aGx ) = a · x. Claramente ϕ es
una función suprayectiva, ϕ(aGx ) = ϕ(bGx ) ⇒ b−1 a ∈ Gx ⇒ bGx =
b(b−1 a)Gx = aGx , por lo que ϕ es una biyección. La tercera afirmación es
inmediata.
En el caso de conjugación, escribimos la órbita de x como C(x), esta es
la clase de conjugación de x. Aquı́ tenemos ◦(C(x)) = [G : Z(x)]; y para
grupos finitos, la ecuación de clase
X ◦(G)
◦(G) = , (1.1)
◦(Z(a))
C(a)

donde la suma se toma sobre las distintas clases de conjugación de G.

Teorema 1.28 Si G es un grupo, ◦(G) = pn con p un número primo y


n ≥ 1, entonces Z =
6 {1}.

Demostración: En la ecuación de clase


X ◦(G)
◦(G) = ◦(Z) + ,
◦(Z(a))
C(a)6={a}

donde la suma se toma sobre clases de conjugación de elementos no cen-


trales, se tiene que
◦(G)
p| ,
◦(Z(a))
siempre, por lo que p | ◦ (Z) y ası́ ◦(Z) > 1.

Corolario 1.29 Si G es un grupo y ◦(G) = p2 con p un número primo,


entonces G es abeliano.

Demostración: Como ◦(Z) = p ó p2 , es suficiente ver que ◦(Z) 6= p.


Supongamos que ◦(Z) = p y que a ∈/ Z, entonces Z ⊂ Z(a) < G.
Por el Teorema de Lagrange, Z(a) = G y entonces a ∈ Z, que es una
contradicción.
El siguiente teorema garantiza que dado un grupo G, siempre existen un
conjunto X y una acción inyectiva f : G → SX .

Teorema 1.30 (Cayley) Todo grupo G es isomorfo a un grupo de per-


mutaciones.
16 1. Grupos

Demostración: Definimos una función f : G → SG ası́: f (a) = fa es


multiplicación izquierda por a, es decir, fa (x) = ax para toda x ∈ G.
De esta manera, fa ∈ SG y también (fa ◦ fb )(x) = a(bx) = abx = fab (x)
para toda x ∈ G, por lo que fa ◦ fb = fab y entonces f es un morfismo,
cuyo núcleo {a ∈ G | ax = x para toda x ∈ G} es {1}. La conclusión es
que G ∼ = Im f .
De esta manera, vemos que cualquier grupo está contenido en un grupo
simétrico. El siguiente resultado es una generalización.
Teorema 1.31 Sean G un grupo, H un subgrupo y A = G/H el conjunto
de las clases laterales derechas de H en G. Entonces existe una acción
f : G → SA cuyo núcleo es el máximo subgrupo normal de G contenido en
H.
Demostración: Definimos una función f : G → SA como en el teorema
anterior: f (a) = fa es multiplicación izquierda por a, es decir, fa (xH) =
axH para toda x ∈ G.
Claramente, f es un morfismo. Sea K su núcleo.
Como k ∈ K ⇒ kH = H, se ve que k ∈ H y que K ⊆ H.
Sabemos que K C G. Sea N C G tal que N ⊆ H.
Entonces, n ∈ N ⇒ g −1 ng ∈ N ⊆ H para todas g ∈ G y n ∈ N ;
ası́ g −1 ngH = H, es decir, ngH = gH para todas g ∈ G y n ∈ N . La
conclusión es que N ⊆ K.
Corolario 1.32 Si G es un grupo y H es un subgrupo de G distinto de G
tal que ◦(G) - [G : H] !, entonces H contiene un subgrupo normal no trivial
de G. En particular, G no es simple.
Demostración: Sea f : G → SA como en el teorema anterior, con núcleo
K. Sabemos que K C G y que K ⊆ H. Si K = {1}, entonces f es inyectivo
y ◦(G) = ◦(Im f ) | [G : H] !
Teorema 1.33 (Cauchy-Frobenius) Si p es un número primo y p |◦(G),
entonces el número de soluciones en G de la ecuación xp = 1 es un múltiplo
de p. En particular, existe al menos un elemento de G de orden p.
Demostración: Sea A = {(x1 , ..., xp ) ∈ Gp | x1 · · · xp = 1}.
Entonces ◦(A) = ◦(G)p−1 , pues x1 , ..., xp−1 pueden elegirse entre los
elementos de G arbitrariamente, mientras que xp = (x1 · · · xp−1 )−1 ; por
tanto, p | ◦ (A).
El conjunto A es la unión disjunta de las clases de equivalencia

(x1 , ..., xp ) ∼ (x2 , ..., xp , x1 ) ∼ · · · ∼ (xp , x1 , ..., xp−1 ),

provenientes de la relación donde son equivalentes las colecciones ordenadas


de p elementos de G que se obtienen por rotación.
Cada una de estas clases de equivalencia tiene o bien un único elemento
en el caso de que x1 = x2 = · · · = xp , ó bien p elementos en cualquier
1.6 Acciones de Grupos 17

otro caso. Esto es debido a que podemos considerar nuestros ı́ndices como
elementos de Z/pZ, donde la igualdad de dos elementos de una clase de
equivalencia implica
xi = xi+j = xi+2j = · · · ,
para todo i con 1 ≤ i ≤ p; y algún j con 1 ≤ j ≤ p − 1. Ası́ tenemos que
x1 = x2 = · · · = xp , pues

Z/pZ = {i, i + j, i + 2j, ...}.

De lo anterior se obtiene que el número de elementos x ∈ G tales que


xp = 1 es un múltiplo de p y como x = 1 es uno de ellos, existe al menos
otro, es decir, un elemento de orden p.
Este teorema es un recı́proco parcial del Teorema de Lagrange, al afirmar
que existe un subgrupo H de orden p del grupo G suponiendo que p | ◦ (G)
y que p es primo.

Ejercicios
1. Sea G un grupo de orden impar. Demuestre que el número de clases
de conjugación es impar.

2. El grupo G actúa transitivamente en el conjunto no vacı́o X.


a) Demuestre que los estabilizadores de los distintos puntos de X son
conjugados.
b) Sea Tran(x, y) = {g ∈ G | g · x = y}. Demuestre que Tran(x, y) es
una clase lateral de Gx .

3. Sean H y K subgrupos de G. Demuestre que el número de conjugados


de H con elementos de K es [K : NG (H) ∩ K].

4. Sean G un grupo infinito y H un subgrupo propio de ı́ndice finito.


Demuestre que G contiene un subgrupo normal propio de ı́ndice finito.

5. Sean G un grupo finito y H un subgrupo de ı́ndice 2. Demuestre que


el número de conjugados de x ∈ H en H es n ó n/2, si n es el número
de conjugados de x en G.

6. Demuestre el siguiente Teorema de Burnside: Si un grupo finito


G actúa en un conjunto finito X, entonces el número de órbitas es

1 X
◦(X g ),
◦(G)
g∈G

donde X g = {x ∈ X | g · x = x} para cada g ∈ G.


18 1. Grupos

1.7 El Grupo Simétrico


Sabemos que para todo conjunto X, las biyecciones de X forman el grupo
llamado simétrico SX . Cuando X es finito, con n elementos, escribimos Sn
e identificamos X = {1, 2, ..., n}.
Es un ejercicio fácil demostrar que ◦(Sn ) = n!.
Si σ ∈ Sn , entonces el grupo hσi actúa naturalmente en {1, 2, ..., n} y
descompone a este conjunto en órbitas que son también llamadas órbitas
de σ.
Una notación eficiente para las permutaciones consiste en escribir una
tras otra las órbitas de cada permutación, como

σ = (1, σ(1), σ 2 (1), ...) · · ·

Ası́ por ejemplo, σ ∈ S3 tal que σ(1) = 3, σ(3) = 2, σ(2) = 1 se escribe


σ = (132). Cada órbita ası́ escrita se llama ciclo y por ejemplo (132) es un
3-ciclo. Los puntos fijos no se escriben.
Otro ejemplo es τ ∈ S4 tal que τ (1) = 3, τ (2) = 4, τ (3) = 1, τ (4) = 2.
Aquı́, τ = (13)(24).
Estos ejemplos se generalizan ası́:

Proposición 1.34 Toda permutación es un producto de ciclos disjuntos:


sus órbitas.

Observaciones. Es conveniente mencionar que:

1. El producto de permutaciones αβ representa la biyección que resulta


de aplicar primero β y después α. Esta es la composición de funciones
normalmente escrita α ◦ β.

2. En la Proposición 1.34, las órbitas de una permutación dada son


únicas; la escritura de un ciclo no es única, pues depende del número
inicial. Se tiene unicidad en la escritura de un ciclo si exigimos que
su número inicial sea mı́nimo.

3. Los ciclos disjuntos conmutan entre sı́.

4. Los ciclos de una permutación admiten un orden total de acuerdo con


sus elementos mı́nimos.

5. Se tiene unicidad en las expresiones de la Proposición 1.34 si exigimos


que sus ciclos se escriban en orden (interno y externo).

Consideremos al conjunto Q[X1 , ..., Xn ] de los polinomoios en n variables


con coeficientes en Q. El grupo Sn actúa en este conjunto de manera natural
al decretar para todas a ∈ Q; 1 ≤ i ≤ n; σ ∈ Sn ; f, g ∈ Q[X1 , ..., Xn ] que:

1. σ(a) = a.
1.7 El Grupo Simétrico 19

2. σ(Xi ) = Xσ(i) .

3. σ(f + g) = σ(f ) + σ(g).

4. σ(f g) = σ(f )σ(g).

El polinomio h = Πi<j (Xi − Xj ) tiene la propiedad especial de que ante


esta acción, σ(h) = ±h, por lo que si n ≥ 2, la órbita de h tiene 2 elementos
{±h}, ya que (12)h = −h.
Sea An el estabilizador de h. Entonces An C Sn , por ser de ı́ndice 2. El
grupo An se llama alternante y sus elementos permutaciones pares.
La acción de Sn en {±h} da origen a un morfismo suprayectivo de gru-
pos, llamado signo, sgn : Sn → {±1}, cuyo núcleo es An . Un poco más
generalmente, si tenemos H < Sn tal que H * An , “ sgn ” se restringe a
H y sigue siendo suprayectivo, por lo que también el núcleo de la restric-
ción es de ı́ndice 2. En otras palabras, [H : (H ∩ An )] = 2, es decir, que
en cualquier grupo de permutaciones tal que no todos sus elementos son
pares, exactamente la mitad lo son.

Proposición 1.35 Las clases de conjugación de Sn son los conjuntos de


permutaciones con la misma descomposición cı́clica. El número de clases
de conjugación de Sn es el número de particiones de n, es decir, el número
de maneras en que n se puede escribir como n = n1 + · · · + nm , con cada
ni un entero positivo.

Demostración: Todo es consecuencia de la observación de que si α =


(i1 i2 · · · im ) · · · es la descomposición en ciclos disjuntos de α, entonces para
toda σ ∈ Sn se tiene que

σασ −1 = (σ(i1 )σ(i2 ) · · · σ(im )) · · ·

Las transposiciones son los conjugados de (12).

Proposición 1.36 Toda permutación es un producto de transposiciones,


es decir, las transposiciones generan Sn . Mejor aún, las transposiciones de
la forma (1a) con a arbitrario generan Sn .

Demostración: Es suficiente observar que son válidas las identidades


(i1 i2 · · · im ) = (i1 im ) · · · (i1 i3 )(i1 i2 ) y (ab) = (1b)(1a)(1b), si a, b 6= 1.
Observaciones. Las siguientes afirmaciones son inmediatas:

1. El signo de toda transposición es −1.

2. El signo de un m-ciclo es (−1)m−1 . (Ver la última demostración).

3. El orden de un m-ciclo es m.

4. (12 · · · m)−1 = (m · · · 21).


20 1. Grupos

5. Si α = (a1 · · · an1 ) · · · (r1 · · · rns ) es la descomposición cı́clica de α,


entonces ◦(α) = m.c.m.{n1 , ..., ns }.

Proposición 1.37 Si n ≥ 3, el conjunto de todos los 3-ciclos genera An .

Demostración: Sabemos que todo 3-ciclo es par y que toda permutación


par se puede escribir como el producto de un número par de transposi-
ciones. La demostración se termina al observar que (abc) = (ac)(ab) y que
(ab)(cd) = (ab)(bc)(bc)(cd) = (bca)(cdb) si a, b, c y d son todos distintos.

Si en la descomposición de σ aparecen zi i-ciclos disjuntos, esta vez es-


cribiendo también los 1-ciclos, entonces

n!
◦(C(σ)) = , (1.2)
1z1 z1 !2z2 z2 ! · · ·

como es fácil ver contando permutaciones con la misma descomposición


cı́clica. De ahı́ que
◦(Z(σ)) = 1z1 z1 !2z2 z2 ! · · · (1.3)

Ejemplos.

1. El número de transposiciones en Sn es

n! n(n − 1)
= .
(n − 2)!2 2

2. El número de r-ciclos en Sn es

n!
.
(n − r)!r

3. En particular, el número de n-ciclos en Sn es (n − 1)! y cada n-ciclo


conmuta exactamente con sus potencias.

4. El número de productos de k transposiciones disjuntas en Sn es

n!
.
2k k!(n − 2k)!

5. En S6 hay (6 × 5)/2 = 15 transposiciones.

6. El número de conjugados de (12)(34)(56) en S6 es 6!/(23 3!) = 15.

Proposición 1.38 Si n ≥ 3, entonces el centro de Sn es trivial. En par-


ticular, Int Sn ∼
= Sn para n ≥ 3.
1.7 El Grupo Simétrico 21

Demostración: Si σ ∈ Sn tiene un ciclo de longitud ≥ 3, entonces tenemos


que σ = (123 · · ·) · · · 6∈ Z porque σ no conmuta con (12). Aquı́ y más
adelante podemos reemplazar a σ por un conjugado suyo.
Si σ no tiene ciclos de longitud ≥ 3, entonces σ = (12) · · · 6∈ Z porque
no conmuta con (13).

Proposición 1.39 Si n ≥ 4, entonces el centro de An es trivial y también


Int An ∼
= An .

Demostración: Dado 1 6= σ ∈ An , ó bien σ = (123 · · ·) · · ·, que no con-


muta con (12)(34) ó bien σ = (12)(34) · · ·, que no conmuta con (123).

Lema 1.40 Sea σ ∈ An , entonces ZSn (σ) ⊆ An ⇔ la descomposición


cı́clica de σ, con zi i-ciclos, satisface z2 = z4 = · · · = 0; z1 , z3 , ... ≤ 1.

Demostración: ⇒: Aquı́ suponemos que σ conmuta solamente con per-


mutaciones pares; pero σ conmuta con cada uno de sus ciclos, por lo que
estos son pares, es decir, de longitud impar. Si σ tiene 2 ciclos de la misma
longitud impar i, entonces σ conmuta con el producto impar de i transposi-
ciones que conjuga uno de esos i-ciclos en el otro. Esta es una contradicción.
⇐: Recı́procamente, si la descomposición cı́clica de σ es como en el enun-
ciado y τ ∈ ZSn (σ), entonces τ necesariamente conmuta con cada ciclo α
de σ y esto implica que τ actúa como potencia de α en los elementos que
α mueve. Ası́, τ es par.

Teorema 1.41 La clase de conjugación en Sn de un elemento par σ es una


clase de conjugación en An o bien es la unión de dos clases de conjugación
en An con igual número de elementos. Esto último sucede exactamente
cuando ZSn (σ) ⊆ An .

Demostración: Sean Z(σ) el centralizador de σ en Sn y C(σ) la clase de


conjugación de σ en Sn . Entonces

◦(CAn (σ)) = [An : ZAn (σ)] = [Sn : Z(σ)] = ◦(C(σ)),

cuando Z(σ) * An . Mientras que

1 1
◦(CAn (σ)) = [An : ZAn (σ)] = [Sn : Z(σ)] = ◦ (C(σ)),
2 2

cuando Z(σ) ⊆ An .

Corolario 1.42 Si n ≥ 5, entonces el conjunto de todos los 3-ciclos es


una clase de conjugación en An .
22 1. Grupos

Observación. Si n ≥ 5, entonces todo subgrupo normal N C An con


N 6= {1} que contenga un 3-ciclo será An , pues N contendrá toda la clase
de conjugación de los 3-ciclos, que generan An .
Ejemplos. Calculamos los órdenes de las clases de conjugación de S5 y de
A5 en la siguiente tabla:

S5 A5
Número de Número de
Partición Paridad Elementos Partición Elementos

5!
5 par 5 = 4! = 24 5+ 12

5!
4+1 impar 4 = 30 5− 12

5!
3+2 impar 2·3 = 20 3+1+1 20

5!
3+1+1 par 2!·3 = 20 2+2+1 15

5!
2+2+1 par 2!22 = 15 1+1+1+1+1 1

5!
2+1+1+1 impar 3!·2 = 10

1+1+1+1+1 par 1
De aquı́ se obtienen las siguientes conclusiones:

1. p(5) = 7, el número de particiones de 5 es 7.

2. Si N es un subgrupo normal no trivial de S5 , entonces N es una unión


de clases de conjugación de S5 ; por tanto ◦(N ) = 1 + 10x + 20y +
15z + 24w + 30t con x, z, w, t ∈ {0, 1}, y ∈ {0, 1, 2}. Como N 6= S5 , se
tiene que x = 0. Como ◦(N ) | 120, es fácil ver que la única posibilidad
es: ◦(N ) = 1 + 15 + 20 + 24 = 60, que corresponde a N = A5 .

3. De manera similar se puede ver que A5 es simple.

Ejemplo. A6 es simple.
Demostración: Supogamos que existe {1} 6= N C A6 . Entonces existe
1 6= σ ∈ N . Si σ tiene un punto fijo i, entonces σ ∈ N ∩ H, donde H =
{α ∈ A6 | α(i) = i} ∼ = A5 . Aquı́, (N ∩ H) C H con H simple, por lo que
(N ∩H) = H y entonces N ⊇ H y N contiene un 3-ciclo. Ya que los 3-ciclos
generan A6 , se sigue que N = A6 .
Si σ no tiene puntos fijos, entonces podemos escribir σ = (12)(3456) ó
bien σ = (123)(456), pues (12)(34)(56) y (123456) son impares. En todo
6! 6!
caso, el número de conjugados de σ en A6 es 2·4 = 90 ó bien es 2!·3 2 = 40.
1.7 El Grupo Simétrico 23

Se concluye que si N no contiene elementos con puntos fijos, entonces


◦(N ) = 1+90a+40b, con a, b ∈ {0, 1} y a+b 6= 0. Como además, ◦(N )|360,
se obtiene una contradicción.

Teorema 1.43 Si n ≥ 5, entonces An es simple.

Demostración: Sean {1} 6= N C An y 1 6= α ∈ N . Como An no tiene


centro, existe un 3-ciclo β que no conmuta con α. Entonces el elemento
γ = (αβα−1 )β −1 6= 1, que está en N , es un producto de dos 3-ciclos.
Se concluye que N intersecta de manera no trivial a un subgrupo H de
An isomorfo con A6 (pues γ mueve cuando más seis puntos), entonces
(N ∩ H) C H, por tanto (N ∩ H) = H y N contiene un 3-ciclo. Finalmente,
N = An .

Corolario 1.44 Si n ≥ 5, entonces Sn tiene un único subgrupo normal


propio que es An .

Demostración: Si {1} 6= N C Sn , entonces (N ∩ An ) C An . Por tanto,


N = Sn ó bien N = An ó bien ◦(N ) = 2. Pero no existe N C Sn con 2
elementos, porque estos serı́an centrales.

Teorema 1.45 Si n 6= 6, entonces Aut(Sn ) = Int(Sn ). Si además n ≥ 3,


entonces Aut(Sn ) ∼
= Sn .

Demostración: En vista de la Proposición 1.38, solamente se requiere


demostrar la primera afirmación.
Si α ∈ Aut(Sn ), entonces α envı́a clases de conjugación a clases de conju-
gación y preserva el orden de los elementos. Por tanto, α envı́a el conjunto
de las transposiciones al conjunto de los productos de k transposiciones
disjuntas para algún k.
Como el número de transposiciones es n(n−1)/2 mientras que el número
de productos de k transposiciones disjuntas es n!/[2k k!(n − 2k)!], estos
números son distintos, excepto cuando k = 1 ó bien n = 6 y k = 3.
Ya que estamos suponiendo n 6= 6, se tiene que k = 1, por lo que α envı́a
transposiciones a transposiciones.
Escribamos α(1r) = (ar br ). Si r 6= 2, entonces (1r)(12) = (12r) tiene
orden 3, por lo que α(12r) = (ar br )(a2 b2 ) también tiene orden 3. Esto
implica que (ar br ) y (a2 b2 ) tienen un número en común, es decir, que
a2 = ar ó bien b2 = br . Este razonamiento puede repetirse reemplazando r
por s 6= 1, 2, r.
Queremos ver que a medida que r recorre al conjunto {2, 3, ..., n}, todas
las transposiciones (ar br ) tienen un número en común.
Consideremos la posibilidad de que a2 = ar y b2 = bs . Entonces α(12r) =
(a2 br )(a2 b2 ) = (a2 b2 br ), mientras que α(12s) = (as b2 )(a2 b2 ) = (a2 as b2 ),
por lo que α(12s)α(12r) = (a2 as b2 )(a2 b2 br ) = (b2 br as ), un elemento de
orden 3, hecho que contradice al orden 2 de (12s)(12r) = (1s)(2r).
24 1. Grupos

Como las transposiciones (ar br ) tienen un número en común, podemos


escribir α(1r) = (a2 br ) para toda r ∈ {2, 3, ..., n}. Esto demuestra que
α = iσ con σ dada por σ(1) = a2 y σ(r) = br para r 6= 1.

Teorema 1.46 (Wilson) Si p es un número primo, entonces

(p − 1)! ≡ −1 (mod p).

Demostración: En el grupo de permutaciones en p sı́mbolos Sp , los ele-


mentos de orden p son los p-ciclos. El número de p-ciclos es (p − 1)!
Por el Teorema de Cauchy-Frobenius sabemos que p divide al número de
elementos α tales que αp = 1, que son los elementos de orden p junto con
la identidad. Por tanto, p | [(p − 1)! + 1], que es la conclusión.

Ejercicios

1. Construya un morfismo inyectivo f : Sn → An+2 .

2. Demuestre que Sn = h(12), (12...n)i = h(12), (23), ..., (n − 1, n)i.

3. Demuestre que el grupo A4 no tiene subgrupos de orden 6.

4. Sea H < Sn tal que H contiene una transposición y un (n − 1)-ciclo.


Demuestre que si H es transitivo, entonces H = Sn .

5. Sean G un grupo finito y X un conjunto (finito) en el que G actúa


transitivamente. La acción de G en X induce otra acción en la clase de
los subconjuntos de X. Decimos que la acción de G en X es primitiva
cuando no existen más particiones {Ai } de X que las triviales (un
sólo subconjunto o subconjuntos todos de orden 1) tales que para
todo g ∈ G se tenga gAi = Ai ó bien gAi = Aj .
a) Demuestre que si se tiene una acción imprimitiva y x ∈ Ai con Ai
elemento de una partición de imprimitividad, entonces el conjunto
H = {g ∈ G | gAi = Ai } es un subgrupo propio de G tal que
Gx ⊂ H.
b) Recı́procamente, demuestre que si existe un subgrupo H < G
tal que Gx ⊂ H ⊂ G, para algún x ∈ X, entonces la acción es
imprimitiva con A = {hx | h ∈ H} elemento de una partición de
imprimitividad.
c) Demuestre que en la situación de a) ó b), se tiene que el número
de subconjuntos en una partición de imprimitividad es [G : H]; y que
un elemento A de una partición de imprimitividad satisface ◦(A) =
[H : Gx ].
1.8 Productos Directos y Semidirectos 25

1.8 Productos Directos y Semidirectos


Si G1 , ..., Gn son grupos, definimos el producto directo G1 × · · · × Gn
como el conjunto {(g1 , ..., gn ) | gi ∈ Gi } con multiplicación

(g1 , ..., gn )(g10 , ..., gn0 ) = (g1 g10 , ..., gn gn0 ).

Se verifica inmediatamente que esto es un grupo.


Observaciones. Las siguientes afirmaciones son claras.

1. G1 × G2 ∼
= G2 × G1 .

2. (G1 ×G2 )×G3 ∼


= G1 ×(G2 ×G3 ) ∼
= G1 ×G2 ×G3 y sus generalizaciones.

3. En H × K, se tiene que (h, 1)(1, k) = (h, k) = (1, k)(h, 1) para todas


h ∈ H, k ∈ K.

4. H × {1} y {1} × K son subgrupos normales de H × K que generan


al producto directo.

5. Si a ∈ Gi e identificamos a Gi como subgrupo de G = G1 × · · · × Gn ,


entonces ZG (a) = {(g1 , ..., gn ) ∈ G | gi ∈ ZGi (a)}. En particular,
Z(G) = ZG1 × · · · × ZGn .

Teorema 1.47 Si G es un grupo abeliano, ϕ : H → G y ψ : K → G


son morfismos, entonces existe un morfismo único η : H × K → G tal que
η(h, 1) = ϕ(h) y η(1, k) = ψ(k), para todas h ∈ H, k ∈ K.

Demostración: Es fácil verificar que η : H × K → G tal que η(h, k) =


ϕ(h)ψ(k) es un morfismo, necesariamente único porque H y K generan a
H × K.
En la situación del teorema anterior, como se tienen las dos proyecciones
p : H ×K → H y q : H ×K → K, el resultado se expresa como la existencia
y unicidad de η, dado el resto del siguiente diagrama conmutativo:

H
w; @@@
www p @@ϕ
www @@
ww @Ã
H ×K η /G
GG
GG ~~>
GG ~
q GG ~~
G# ~~~ ψ
K

Teorema 1.48 Sean H, K C G tales que HK = G y H ∩ K = {1}.


Entonces G ∼
= H × K.
26 1. Grupos

Demostración: Definimos ϕ : H × K → G ası́: ϕ(h, k) = hk. Entonces ϕ


es un morfismo porque los elementos de H conmutan con los de K por la
Proposición 1.20. Además, ϕ es suprayectivo por hipótesis.
Tenemos que ker ϕ = {(h, k) | hk = 1, h ∈ H, k ∈ K}; y por lo tanto
(h, k) ∈ ker ϕ ⇒ h = k −1 ∈ H ∩ K = {1}. Ası́, ker ϕ = {1} y ϕ es un
isomorfismo.
Teorema 1.49 Si G = G1 × G2 , H C G1 y K C G2 , entonces H × K C G
y G/(H × K) ∼
= (G1 /H) × (G2 /K).
Demostración: Sean ϕ : G1 → G1 /H y ψ : G2 → G2 /K los morfismos
naturales. Definimos η : G → (G1 /H) × (G2 /K) ası́: η(a, b) = (ϕ(a), ψ(b)).
Se ve que η es un morfismo suprayectivo con núcleo H × K.
Observamos en particular que (G1 × G2 )/G1 ∼ = G2 .
Sean G y N dos grupos tales que G actúa en N . Esto quiere decir que
tenemos un morfismo ψ : G → Aut N . Escribimos g · n en lugar de ψ(g)(n)
para g ∈ G, n ∈ N .
Construimos un grupo H = N o G, el producto semidirecto de N y
G ante la acción dada ası́: H es como conjunto el producto cartesiano de
N y G. La multiplicación en H es como sigue:

(x1 , y1 )(x2 , y2 ) = (x1 (y1 · x2 ), y1 y2 ), para xi ∈ N, yi ∈ G.

Aquı́ (1, 1) es la identidad. Verifiquemos la asociatividad:

(x1 (y1 · x2 ), y1 y2 )(x3 , y3 ) = (x1 (y1 · x2 )(y1 y2 · x3 ), y1 y2 y3 ),


mientras que

(x1 , y1 )(x2 (y2 · x3 ), y2 y3 ) = (x1 {y1 · [x2 (y2 · x3 )]}, y1 y2 y3 );

pero estas expresiones son iguales porque ψ es un morfismo.


Aquı́, (x, y)−1 = (y −1 ·x−1 , y −1 ), pues por un lado (x, y)(y −1 ·x−1 , y −1 ) =
(xy · [y −1 x−1 ], yy −1 ) = (xx−1 , yy −1 ) = (1, 1); mientras que por el otro,
(y −1 · x−1 , y −1 )(x, y) = ([y −1 · x−1 ][y −1 · x], y −1 y) = (y −1 · [x−1 x], y −1 y) =
(1, 1).
Ejemplo. Sean N = Zn = hai cı́clico de orden n y G = Z2 = hbi cı́clico
de orden 2. Definimos una acción de G en N ası́: b · ai = a−i para toda
i ∈ N. El producto semidirecto H = N o G es de orden 2n, se llama grupo
diédrico y se escribe Dn .
Ejemplo. Sea k un campo. Escribimos k+ para referirnos al grupo aditivo
de k y k ? para referirnos al grupo multiplicativo k r {0}. Tenemos que k ?
actúa en k+ por multiplicación izquierda. El producto semidirecto k+ o k ?
es el grupo afı́n A2 . Este grupo también puede ser descrito como el grupo
de las transformaciones afines T : k → k de la forma T (x) = ax + b con
a 6= 0 ante la composición de funciones.
1.8 Productos Directos y Semidirectos 27

Ejemplo. Cuando la acción de G en N es trivial, es decir, g · n = n para


todas g ∈ G, n ∈ N , entonces N o G = N × G, el producto directo.
Para todo producto semidirecto N oG, siempre se tiene que la proyección
π : N o G → G es un morfismo suprayectivo con núcleo N o {1} ∼ = N , de
manera que N o G está generado por N y ({1} o G) ∼
= G con N ∩ G = {1}.
Además se tiene N C (N oG), de manera que la acción que se obtiene de
conjugar N dentro del producto semidirecto con elementos de G coincide
con la acción que dio origen al mismo producto:

(1, g)(n, 1)(1, g)−1 = (g · n, g)(1, g −1 ) = ((g · n)(g · 1), 1) = (g · n, 1).

Recı́procamente, si G es un grupo tal que G = AB con A C G, B < G


y A ∩ B = {1}, entonces G ∼ = (A o B), con el producto definido por la
acción de conjugación en A con elementos de B: En A o B tenemos que
(a1 , b1 )(a2 , b2 ) = (a1 (b1 a2 b−1
1 ), b1 b2 ), por lo que f : A o B → G dado por
f (a, b) = ab es un isomorfismo.

Ejercicios
1. Sean G1 , ..., Gn grupos y σ ∈ Sn . Demuestre que G1 × · · · × Gn ∼
=
Gσ(1) × · · · × Gσ(n) .

2. Sean G = G1 × G2 y H C G tal que H ∩ G1 = {1} = H ∩ G2 .


Demuestre que H es abeliano.

3. Verifique que las dos descripciones dadas del grupo afı́n A2 dan origen
a grupos isomorfos.

4. Sean C un cuadrado con centro en el origen y con lados paralelos


a los ejes de coordenadas, R la rotación de 90 grados en sentido
contrario a las manecillas del reloj, H la reflección respecto al eje
de las x, V la reflección respecto al eje de las y, D la reflección
respecto al eje y = x y D0 la reflección respecto al eje y = −x; y
sea G = {1, R, R2 , R−1 , H, V, D, D0 }.
a) Demuestre que G es un grupo ante la composición de funciones.
b) Demuestre que cualquier función f : {a, b} → GL2 que satisfaga
f (a) = R y f (b) ∈ {H, V, D, D0 } = B, admite una extensión única a
un isomorfismo ϕ : D4 → G tal que ϕ(ab) ∈ B.

5. Demuestre que el grupo de cuaternios H y el grupo diédrico D4 no


son isomorfos.

6. a) Demuestre que Aut(D4 ) ∼


= D4 .
b) Exhiba un automorfismo α 6= 1 del grupo D4 tal que el conjunto
{x ∈ D4 | α(x) = x−1 } sea de orden 6 = (3/4)(◦(D4 )).
28 1. Grupos

1.9 Solubilidad y Nilpotencia


Dado un grupo G, definimos el grupo derivado ó conmutador de G,
escrito DG, D1 G, G0 ó bien (G, G) como el subgrupo de G generado por
todos los conmutadores aba−1 b−1 de elementos de G.
Más generalmente, para A, B < G, definimos

(A, B) = haba−1 b−1 | a ∈ A, b ∈ Bi.

Después definimos inductivamente dos sucesiones de subgrupos de G

G = D0 G ⊇ D1 G ⊇ D2 G ⊇ · · · , (1.4)

G = L0 G ⊇ L1 G ⊇ L2 G ⊇ · · · , (1.5)
0 i+1 i i
ası́: D G = L0 G = G, D G = (D G, D G) y Li+1 G = (G, Li G) para
i ≥ 0.
Aquı́, (1.4) es la serie derivada de G, mientras que (1.5) es la serie
central descendente de G.
Es claro que todos los Di G y todos los Li G son subgrupos caracterı́sticos
de G y que Di G < Li G para toda i.
Se dice que G es soluble cuando existe n tal que Dn G = {1} y que G
es nilpotente cuando existe n tal que Ln G = {1}.
Observaciones. Las siguientes afirmaciones son claras:

1. G abeliano ⇒ G nilpotente ⇒ G soluble.

2. Todo grupo Dn G/Dn+1 G es abeliano.

3. Todo grupo Ln G/Ln+1 G es central en G/Ln+1 G.

Proposición 1.50 Todo subgrupo y toda imagen homomorfa de un grupo


soluble (nilpotente) es soluble (nilpotente).

Demostración: Si H < G, entonces es claro que Dn H ⊆ Dn G y que


Ln H ⊆ Ln G para toda n ≥ 0; por lo que H es soluble (nilpotente) si G lo
es.
La otra afirmación es consecuencia de que si f : G → H es un morfismo
suprayectivo de grupos, entonces f (Dn G) = Dn H y f (Ln G) = Ln H para
toda n ≥ 0.

Proposición 1.51 Si N C G tal que N y G/N son solubles, entonces G


es soluble.

Demostración: Como G/N es soluble, Dk G ⊆ N para alguna k; pero N


es soluble, por tanto existe j tal que Dk+j G ⊆ Dj N = {1}.
1.9 Solubilidad y Nilpotencia 29

Teorema 1.52 a) Si A1 , ..., An son grupos solubles, entonces A1 ×· · ·×An


es soluble.
b) Si A1 , ..., An son nilpotentes, entonces A1 × · · · × An es nilpotente.

Demostración: a) es consecuencia inmediata del teorema anterior, o bien


de las inclusiones Di (A1 × · · · × An ) ⊆ (Di A1 ) × · · · × (Di An ), válidas para
todo i.
b) se sigue de las inclusiones Li (A1 × · · · × An ) ⊆ (Li A1 ) × · · · × (Li An ),
válidas para todo i.

Proposición 1.53 Si G es un grupo con centro Z tal que G/Z es nilpo-


tente, entonces G es nilpotente.

Demostración: Como G/Z es nilpotente, existe j tal que Lj G ⊆ Z; por


tanto Lj+1 G = {1}.

Proposición 1.54 a) Si G es soluble, entonces G contiene un subgrupo


normal abeliano distinto de {1}.
b) Si G es nilpotente, entonces Z 6= {1}.

Demostración: a) Si Dn G 6= {1}, pero Dn+1 G = {1}; entonces Dn G es


normal y abeliano.
b) Si Ln G 6= {1}, pero Ln+1 G = {1}; entonces Ln G ⊆ Z.

Teorema 1.55 Si n ≥ 5, entonces Sn no es soluble.

Demostración: Por un lado, Sn soluble ⇒ An soluble ⇒ DAn C An con


DAn 6= An . Por otro lado, An simple ⇒ DAn = {1} ⇒ An abeliano, que
es absurdo.

Teorema 1.56 Si G es un grupo de orden pn con p primo, entonces G es


nilpotente.

Demostración: Procedemos por inducción en n observando que los casos


n = 0, 1 son ciertos. Como Z 6= {1}, se tiene ◦(G/Z) < ◦(G), por lo que
G/Z es nilpotente y también G lo es.

Proposición 1.57 Si G es un grupo nilpotente y H 6= G es un subgrupo,


entonces NG (H) 6= H.

Demostración: Distinguimos dos casos: Z * H y Z ⊆ H.


Si Z * H, entonces ZH < G tal que ZH 6= H y ZH ⊆ NG (H).
Si Z ⊆ H, entonces procedemos por inducción en k mı́nimo tal que
Lk G = {1}. En primer lugar, Lk−1 (G/Z) = {1}, también H/Z 6= G/Z y
ası́ NG/Z (H/Z) 6= H/Z. Por lo tanto, NG (H) 6= H.
30 1. Grupos

Definimos la serie central ascendente de G

Z0 (G) ⊆ Z1 (G) ⊆ · · · , (1.6)

inductivamente: Z0 (G) = {1} y para i ≥ 0, Zi+1 (G) es la imagen inversa


en G del centro de G/Zi (G). Ası́, es claro que Z1 (G) = Z es el centro de
G y que todo Zi (G) es un subgrupo caracterı́stico de G.

Teorema 1.58 G es nilpotente ⇔ Zk = G, para alguna k. Más precisa-


mente, para cualquier grupo G, si n es el mı́nimo entero tal que Ln = {1},
entonces n es también el mı́nimo entero tal que Zn = G y recı́procamente.

Demostración: Suponiendo que Ln = {1}, demostraremos por inducción


en r que Ln−r ⊆ Zr . El caso r = 0 es claro. Para el paso inductivo, partimos
de Ln−i ⊆ Zi sabiendo que Ln−(i+1) /Ln−i ⊆ Z(G/Ln−i ); como G/Zi es
imagen homomorfa de G/Ln−i , se tiene que Ln−(i+1) Zi /Zi ⊆ Z(G/Zi ).
Esto implica que Ln−(i+1) Zi ⊆ Zi+1 y que Ln−(i+1) ⊆ Zi+1 .
En particular, se tiene que G = L0 ⊆ Zn .
Recı́procamente, suponiendo Zs = G demostraremos por inducción en
r que Lr ⊆ Zs−r . Inicialmente, L0 = G = Zs , por lo que suponemos
Li ⊆ Zs−i . Como Li+1 = (G, Li ), se tiene que Li+1 ⊆ (G, Zs−i ). Por otro
lado, Zs−i /Zs−(i+1) ⊆ Z(G/Zs−(i+1) ), por tanto (G, Zs−i ) ⊆ Zs−(i+1) . De
esta manera, Li+1 ⊆ Zs−(i+1) .
En particular, Ls ⊆ Z0 = {1}.

Ejercicios

1. De un contraejemplo para cada una de las implicaciones recı́procas


de las siguientes implicaciones válidas para un grupo G:
G cı́clico ⇒ G abeliano ⇒ G nilpotente ⇒ G soluble.

2. Demuestre que el grupo S4 es soluble, mientras que A5 no lo es.

3. Sean k un campo arbitrario y G = GLn (k) el grupo multiplicativo


de las matrices invertibles n × n con coeficientes en k. Definimos al
grupo B = {[aij ] ∈ G | aij = 0 cuando i > j}, ası́ como al grupo
U = {[aij ] ∈ B | aii = 1 para toda i}. Demuestre que:
a) U C B < G.
b) U = (B, B), suponiendo que n ≥ 2 y que ◦(k) ≥ 4.
c) U es nilpotente.
d) B es soluble.
e) B ∼
= U n T.
1.10 Teoremas de Sylow 31

1.10 Teoremas de Sylow


Lema 1.59 Sean p, n, r ∈ N con p primo, entonces
µ r ¶
p n
≡ n (mod pn).
pr

Demostración:
µ r ¶ µ r ¶
p n (pr n)! pr n (pr n − 1)! p n−1
= r r = r =n ; pero
pr p !(p n − pr )! p (pr − 1)!(pr n − pr )! pr − 1

µ r ¶ r
pY −1 r
p n−1 pr n − 1 pr n − 2 pr n − pr + 1 p n−k
= r ··· =
pr − 1 p − 1 pr − 2 1 k
k=1

r
−1³ r
pY ´
p n r m
= − 1 = (−1)p −1 + p , con m, t ∈ Z, tales que p - t.
k t
k=1

Esto es porque una mayor potencia de p divide al numerador que al


denominador en cada fracción del producto. Como además pm/t ∈ Z, se
obtiene que t | m y ası́
µ ¶ µ r ¶
pr n − 1 p n
r
≡ 1 (mod p), de donde es claro que ≡ n (mod pn).
p −1 pr

Teorema 1.60 (Sylow) Sea G un grupo de orden pr m con p primo tal


que p - m y r ≥ 1. Si 1 ≤ s ≤ r, entonces el número n de subgrupos de
orden ps satisface n ≡ 1 (mod p). En particular, tales subgrupos existen.

Demostración: Sea C la colección de todos los subconjuntos de G con ps


elementos. G actúa en C por translación izquierda: g · X = {gx | x ∈ X}
para todos g ∈ G, X ∈ C.
Escribiendo q = pr−s m, tenemos que
µ s ¶
p q
◦(C) = ≡ q (mod pq), (1.7)
ps

por el lema. Ası́, pr−s+1 - ◦(C), por lo que es claro que existe al menos una
órbita O tal que pr−s+1 - ◦(O). Al respecto, hacemos dos afirmaciones:

1. Cada órbita contiene cuando más un subgrupo de G.

2. La órbita O contiene un subgrupo de G si y sólo si pr−s+1 - ◦(O),


en cuyo caso H ∈ O, H < G ⇒ H es su propio estabilizador.
32 1. Grupos

Como cosecuencia de estas afirmaciones se tiene que n es el número de


órbitas O que satisfacen pr−s+1 - ◦(O). Sean O1 , ..., On tales órbitas.
Además, si Hi ∈ Oi es un subgrupo, entonces ◦(Oi ) = [G : Hi ] = pr−s m,
de manera que ◦(C) ≡ npr−s m ≡ pr−s m (mod pr−s+1 ), usando (1.7). De
esta última congruencia se deduce que n ≡ 1 (mod p).
Para terminar, pasamos a demostrar las dos afirmaciones.

1. Si X, g · X ∈ O son ambos subgrupos, entonces 1 ∈ g · X ⇒ g −1 ∈ X


⇒ g ∈ X ⇒ g · X = X.

2. Para X ∈ O, escribimos GX = {g ∈ G | g · X = X}, el estabilizador


de X, que es un subgrupo de G. Si X < G, entonces claramente
GX = X; pero como ◦(G) = ◦(O) ◦ (X), se tiene que pr−s+1 - ◦(O).
Recı́procamente, si O es una órbita tal que pr−s+1 - ◦(O) y X ∈ O
es tal que 1 ∈ X, entonces GX ⊆ X y además ◦(G) = ◦(O) ◦ (GX ).
Ası́ tenemos que ◦(GX ) ≤ ◦(X) = ps con ps | ◦ (GX ). Concluimos
que GX = X es un subgrupo de G.

Cuando ◦(G) = pn m con p primo y p - m, un p-subgrupo de Sylow


es un subgrupo de orden pn . El teorema anterior garantiza la existencia de
tales subgrupos.

Lema 1.61 Si G es de orden pn con p primo y G actúa en un conjunto


finito X tal que p - ◦(X), entonces X tiene un punto fijo.

Demostración: X es unión disjunta de órbitas O. Para cada O, ó bien


p | ◦ (O) ó bien ◦(O) = 1. Como p - ◦(X), existe al menos una órbita O
tal que p - ◦(O), es decir, ◦(O) = 1. Este es un punto fijo.

Teorema 1.62 (Sylow) Sean G un grupo de orden pr m con p primo tal


que p - m, P un p-subgrupo de Sylow y H un subgrupo de G de orden ps .
Entonces existe x ∈ G tal que H ⊆ xP x−1 . En particular, los p-subgrupos
de Sylow son conjugados.

Demostración: H actúa en G/P por multiplicación izquierda y además


p - ◦(G/P ). El lema garantiza que existe un punto fijo xP , es decir, que
HxP = xP ; esto es equivalente con x−1 Hx ⊆ P y con H ⊆ xP x−1 .
Frecuentemente es útil saber el número n de p-subgrupos de Sylow de un
grupo G. Para calcular este número, contamos con dos datos: n ≡ 1 (mod p)
y n = [G : N (P )], si P es uno de ellos, como consecuencia de que estos
subgrupos son conjugados.
Ya que P ⊆ N (P ), el segundo dato implica que n | [G : P ]. Esta infor-
mación es suficiente en muchos casos.
Aplicaciones. A continuación veremos 6 aplicaciones de los Teoremas de
Sylow y de los métodos usados en sus demostraciones.
1.10 Teoremas de Sylow 33

Proposición 1.63 Si ◦(G) = pn con p primo, entonces existe una cadena

G = G0 ⊇ G1 ⊇ · · · ⊇ Gn = {1},

tal que Gi C Gi−1 con Gi−1 /Gi cı́clico de orden p para toda i.
Demostración: Para todo 1 ≤ m ≤ n existe H < G con ◦(H) = pm , por
lo que también existe una cadena

G = G0 ⊇ G1 ⊇ · · · ⊇ Gn = {1},

tal que ◦(Gi ) = pn−i para toda i. Como G nilpotente ⇒ N (Gi ) 6= Gi ,


vemos que [Gi−1 : Gi ] = p ⇒ Gi C Gi−1 con Gi−1 /Gi siempre cı́clico.

Proposición 1.64 Si P es un subgrupo de Sylow de G, N = NG (P ) y


H < G tal que N ⊆ H, entonces H = NG (H).
Demostración: Si x ∈ G normaliza a H, entonces xP x−1 ⊆ H, ası́ existe
h ∈ H tal que hxP x−1 h−1 = P . Entonces, hx ∈ N ⊆ H y x ∈ H.
Proposición 1.65 Si ◦(G) = pn con p primo y {1} 6= N C G, entonces
N ∩ Z 6= {1}.
Demostración: G actúa en N por conjugación. El número de elementos
de cada órbita es 1 ó un múltiplo de p. Como p | ◦(N ), el número de puntos
fijos de esta acción es un múltiplo de p. Los puntos fijos son los elementos
de N ∩ Z.
Proposición 1.66 Si G es un grupo finito y H < G es de ı́ndice igual al
mı́nimo primo p que divide a ◦(G), entonces H C G.
Demostración: H actúa en G/H por multiplicación izquierda. Esta acción
no es transitiva porque H es un punto fijo. Si decimos que la acción está
dada a través del morfismo f : H → Sp , entonces es claro que ◦(Im f ) | p!
y que ◦(Im f ) | ◦ (H), lo que implica que ◦(Im f ) = 1 ó p.
Si ◦(Im f ) = p, entonces Im f es un grupo generado por un p-ciclo, en
cuyo caso la acción es transitiva. La conclusión es que Im f es trivial y que
todos los puntos aH son puntos fijos, es decir, que HaH = aH para toda
a ∈ G, o lo que es lo mismo, a−1 Ha ⊆ H para toda a ∈ G.

Proposición 1.67 Sea G un grupo de orden pq con p, q primos tales que


p < q, p - (q − 1). Entonces G es cı́clico.
Demostración: Sabemos que existen H, K < G con ◦(H) = p, ◦(K) = q.
Sean m el número de conjugados de H y n el de K. Entonces m ≡ 1 (mod p)
y m | q. Esto implica que m = 1 ó q. La igualdad m = q nos conduce a
p | (q − 1), contrario a la hipótesis, por lo que m = 1 y H C G.
De manera similar, n ≡ 1 (mod q), n | p y p < q implican n = 1 y K C G.
34 1. Grupos

Dado que H ∩ K = {1}, se tiene HK = G y entonces G ∼ = H × K; pero


si a genera a H y b genera a K, el producto ab es de orden pq y genera a
H × K. Ası́ G es cı́clico.

Teorema 1.68 Int S6 es de ı́ndice 2 en Aut S6 .

Demostración: Si α y β son automorfismos externos de S6 , entonces α y


β intercambian la clase de conjugación de (12) con la de (12)(34)(56), por
lo que αβ fija a ambas clases de conjugación. Esto implica que αβ ∈ Int S6
como en la demostración del Teorema 1.45, por lo que [Aut S6 : Int S6 ] ≤ 2.
Para terminar, construiremos un automorfismo externo de S6 .
Con este fin, calculamos el número n de 5-subgrupos de Sylow de S5 : Por
un lado, n ≡ 1 (mod 5), por otra parte, n | 24 = (5!/5); de donde se sigue
que n = 1 ó 6. Si n = 1, entonces habrı́a un único 5-subgrupo de Sylow,
normal y conteniendo a los 24 5-ciclos. Esto es absurdo. Por tanto, n = 6.
Ahora bien, S5 actúa transitivamente en el conjunto, de orden 6, de sus
5-subgrupos de Sylow. Sea ϕ : S5 → S6 esta acción. Entonces tenemos que
ker ϕ = ∩N (P ), la intersección de los normalizadores de los 5-subgrupos
de Sylow, es un subgrupo normal de S5 de ı́ndice ≥ 6. La simplicidad de
A5 implica que ker ϕ = {1}.
Sea K = Im ϕ. Entonces K ∼ = S5 y K es un subgrupo transitivo de S6 .
Sea H = {σ ∈ S6 |σ(6) = 6}. Este es un subgrupo no transitivo de S6
isomorfo con S5 .
Tenemos pues H ∼ =K ∼ = S5 . Si logramos exhibir un automorfismo ψ :
S6 → S6 tal que ψ(H) = K, entonces tendremos un automorfismo externo,
pues H y K no son conjugados: K = τ Hτ −1 ⇒ τ (6) es un punto fijo de
K, que contradice la transitividad de K.
El grupo G = S6 actúa por translación izquierda tanto en G/H como en
G/K. Sean ρ : G → SG/H y ξ : G → SG/K esas acciones. Observamos que
\
ker ρ = {x ∈ G | xyH = yH para toda y ∈ G} = yHy −1 = {1},
y∈G

porque este núcleo es un subgrupo normal de S6 con ı́ndice > 2, en vista


del Corolario 1.44. De manera análoga, se tiene que ker ξ = {1}.
Sea χ : SG/H → SG/K el morfismo inducido por una biyección arbitraria
η : G/H → G/K tal que η(H) = K. Entonces existe un único automorfismo
ψ que hace conmutativo al siguiente diagrama:

ρ
S6 −→ SG/H
ψ↓ ↓χ , (ψ = ξ −1 ◦ χ ◦ ρ).
ξ
S6 −→ SG/K

Se concluye que ψ es externo porque ψ(H) = K.


1.10 Teoremas de Sylow 35

Ejercicios
1. Sean G un grupo finito, P un subgrupo de Sylow y a, b dos elementos
del centro de P tales que exista x ∈ G con b = xax−1 . Demuestre
que existe y ∈ NG (P ) tal que b = yay −1 .

2. Sean G un grupo finito, H C G y P un p-subgrupo de Sylow de H.


Demuestre que G = HNG (P ).

3. Sean G un grupo finito, N C G y P un p-subgrupo de Sylow de G.


Demuestre que N ∩ P es un p-subgrupo de Sylow de N .

4. Sean G un grupo finito, p el mı́nimo primo que divide a ◦(G) y P un


p-subgrupo de Sylow de G. Demuestre que NG (P ) = ZG (P ), en caso
de que P sea cı́clico.

5. Sean p > q números primos. Demuestre que todo grupo de orden pn q


es soluble.

6. Sean p < q < r números primos y G un grupo de orden pqr.


a) Demuestre que un q-subgrupo de Sylow o un r-subgrupo de Sylow
de G es normal; pero que en todo caso G contiene un subgrupo normal
H de orden qr.
b) Demuestre que un r-subgrupo de Sylow de H es caracterı́stico y
que un r-subgrupo de Sylow de G es normal.
c) Si q - (r − 1), entonces un q-subgrupo de Sylow de G también es
normal.

7. Demuestre que un grupo finito G es nilpotente si y sólo si G es el


producto directo de sus subgrupos de Sylow. También demuestre que
G es nilpotente si y sólo si todo subgrupo de Sylow de G es normal.

8. a) Demuestre que el orden de los p-subgrupos de Sylow de Sn es


pνp (n!) con · ¸ · ¸ · ¸
n n n
νp (n!) = + 2 + 3 + ···,
p p p
donde [x] significa “el mayor entero contenido en x”.
b) Demuestre que si se escribe

n = a0 + a1 p + a2 p2 + · · · + ar pr

con 0 ≤ ai < p para todo i, entonces


r
X
νp (n!) = ai (1 + p + · · · + pi−1 ).
i=1
36 1. Grupos

1.11 Series de Composición


Una serie subnormal de un grupo G es una cadena de subgrupos

G = G0 ⊇ G1 ⊇ · · · ⊇ Gn = {1}. (1.8)

tal que Gi+1 C Gi para toda i. Cuando todas las inclusiones son estrictas,
la longitud de la serie es el número de ellas.
Un refinamiento de una serie subnormal es otra serie que contiene a la
primera. Se dice que una serie subnormal es una serie de composición
cuando no admite refinamientos de estrictamente mayor longitud.
Dos series subnormales

G = G0 ⊇ G1 ⊇ · · · ⊇ Gn = {1},

G = H0 ⊇ H1 ⊇ · · · ⊇ Hn = {1},
son equivalentes cuando existe una biyección ϕ del conjunto de los fac-
tores Gi /Gi+1 de una serie al conjunto de los factores Hj /Hj+1 de la otra,
de manera que si ϕ(i) = j, entonces Gi /Gi+1 ∼ = Hj /Hj+1 .
Los factores de una serie de composición se llaman factores de com-
posición del grupo. Los factores de composición de un grupo dado, son
una colección de invariantes del grupo:
Teorema 1.69 (Jordan-Hölder) Dos series de composición del mismo
grupo son equivalentes.
Este teorema es consecuencia inmediata del siguiente, por lo que es sufi-
ciente demostrar este último.
Teorema 1.70 (Schreier) Dos series subnormales
a) G = G0 ⊇ G1 ⊇ · · · ⊇ Gr = {1},
b) G = H0 ⊇ H1 ⊇ · · · ⊇ Hs = {1},
de un grupo arbitrario G poseen refinamientos equivalentes.
Demostración: Procedemos por inducción en s, observando que la con-
clusión es clara si r = 1 ó s = 1.
Primero demostraremos el caso s = 2 por inducción en r:
Aquı́, la segunda serie es G ⊇ H ⊇ {1}. Sean A = G1 H y B = G1 ∩ H,
de manera que A, B C G.
Como las series G1 ⊇ G2 ⊇ · · · ⊇ Gr = {1} y G1 ⊇ B ⊇ {1} son de
longitudes r − 1 y 2, la hipótesis inductiva garantiza que estas series tienen
refinamientos equivalentes:

G1 ⊇ · · · ⊇ G2 ⊇ · · · ⊇ {1} À G1 ⊇ · · · ⊇ B ⊇ · · · ⊇ {1}. (1.9)

Como A/H ∼
= G1 /B y A/G1 ∼
= H/B, se tiene la equivalencia siguiente:

A ⊇ H ⊇ B ⊇ {1} À A ⊇ G1 ⊇ B ⊇ {1}. (1.10)


1.11 Series de Composición 37

La serie de la derecha de (1.9) da lugar a un refinamiento de la serie de la


derecha de (1.10), para el cual hay un refinamiento equivalente de la serie
de la izquierda de (1.10):

A ⊇ · · · ⊇ H ⊇ B ⊇ · · · ⊇ {1} À A ⊇ G1 ⊇ · · · ⊇ B ⊇ · · · ⊇ {1}. (1.11)

De (1.9) y de (1.11) se obtiene la equivalencia

G ⊇ A ⊇ G1 ⊇ · · · ⊇ G2 ⊇ · · · ⊇ {1} À

G ⊇ A ⊇ · · · ⊇ H ⊇ B ⊇ · · · ⊇ {1},
que demuestra el caso s = 2.
En el caso general de s arbitrario, primero obtenemos un refinamiento
de a) equivalente a un refinamiento de G ⊇ H1 ⊇ {1}:

G ⊇ · · · ⊇ G1 ⊇ · · · ⊇ G2 ⊇ · · · ⊇ Gr = {1} À

G ⊇ · · · ⊇ H1 ⊇ · · · ⊇ {1}. (1.12)
Por la hipótesis inductiva, la serie H1 ⊇ H2 ⊇ · · · ⊇ Hs = {1} y la sub-
serie H1 ⊇ · · · ⊇ {1} de la serie de la derecha de (1.12) tienen refinamientos
equivalentes:

H1 ⊇ · · · ⊇ H2 ⊇ · · · ⊇ {1} À H1 ⊇ · · · ⊇ {1}. (1.13)

En estas condiciones, el lado derecho de (1.13) produce un refinamiento


del lado derecho de (1.12), para el cual existe un refinamiento equivalente
de su lado izquierdo:

G ⊇ · · · ⊇ G1 ⊇ · · · ⊇ G2 ⊇ · · · ⊇ Gr = {1} À G ⊇ · · · ⊇ H1 ⊇ · · · ⊇ {1}

À G ⊇ · · · ⊇ H1 ⊇ · · · ⊇ H2 ⊇ · · · ⊇ {1},
lo cual concluye la demostración.
Corolario 1.71 Si G tiene una serie de composición, entonces toda serie
subnormal de G se puede refinar a una serie de composición de G. En
particular, todo subgrupo normal de G es parte de una serie de composición.
Teorema 1.72 Si G es un grupo soluble finito, entonces G admite una
serie de composición G = G0 ⊇ G1 ⊇ · · · ⊇ Gn = {1} tal que todo factor
de composición Gi /Gi+1 es cı́clico de orden primo.
Demostración: Si existe una serie subnormal como en el enunciado, en-
tonces es claro que se trata de una serie de composición, pues no es posible
refinarla.
Recı́procamente, la serie G = D0 G ⊇ D1 G ⊇ · · · ⊇ Dr G = {1} con cada
D G/Di+1 G abeliano provee un punto de partida que nos permite suponer
i

que G es abeliano.
38 1. Grupos

El Teorema de Cauchy garantiza la existencia de un subgrupo H < G de


orden primo. Como H C G y ◦(G/H) < ◦(G), la demostración concluye
por inducción en ◦(G).
El Teorema de Jordan-Hölder afirma que los factores de composición de
un grupo dado, son invariantes del grupo. Si nos restringimos a la colección
de grupos abelianos, este resultado sigue siendo válido y tenemos la sim-
plificación de que todas las series subnormales son normales. Dada esta
restricción, podemos pasar a la colección de los espacios vectoriales sobre
un campo fijo k, al restringirnos a los grupos abelianos que admiten sobre
ellos una acción del campo que los convierte en espacios vectoriales.
Es fácil verificar que en ese caso, se cumplen los teoremas de isomor-
fismo análogos a los de grupos, que fueron los ingredientes usados en la
demostración del Teorema de Schreier. De manera que si k es un campo y
V es un espacio vectorial con bases {u1 , ..., un } y {v1 , ..., vm }, entonces
V = hu1 , ..., un i ⊇ hu1 , ..., un−1 i ⊇ · · · ⊇ hu1 i ⊇ (0),
V = hv1 , ..., vm i ⊇ hv1 , ..., vm−1 i ⊇ · · · ⊇ hv1 i ⊇ (0),
son series de composición. El Teorema de Jordan-Hölder afirma que n = m.

Ejercicios
1. Exhiba una serie de composición para Sn con n arbitrario.
2. Usando el Teorema de Jordan-Hölder, demuestre que en los enteros
se tiene factorización única.
3. a) Demuestre que todo grupo finito tiene una serie de composición.
b) Demuestre que todo grupo abeliano que admite una serie de com-
posición, es finito.
4. Complete los pasos indicados para construir una demostración del
Teorema de Jordan-Hölder para grupos finitos, independiente del Teo-
rema de Schreier:
Dos series de composición dadas, de un grupo finito G, inician ası́:
G = G0 ⊇ G1 ⊇ · · · y G = G0 ⊇ G∗1 ⊇ · · · ,
Procedemos por inducción en ◦(G).
a) Si G1 = G∗1 , se tiene la conclusión.
b) Si G1 6= G∗1 , se tiene que G1 G∗1 = G; y que
G/G1 ∼
= G∗1 /(G1 ∩ G∗1 ) y G/G∗1 ∼
= G1 /(G1 ∩ G∗1 ).

c) Use una serie de composición de G1 ∩ G∗1 para completar a las


series G = G0 ⊇ G1 ⊇ G1 ∩ G∗1 y G = G0 ⊇ G∗1 ⊇ G1 ∩ G∗1 hasta
tener dos series de composición equivalentes para G.
d) Concluya que las series originalmente dadas son equivalentes.
1.12 Generadores y Relaciones 39

1.12 Generadores y Relaciones


Sean X un conjunto no vacı́o y F un grupo. Se dice que F es el grupo
libre en X cuando existe una función inyectiva i : X → F tal que para
toda función f : X → G, donde G sea un grupo, exista un único morfismo
de grupos g : F → G haciendo conmutativo al siguiente diagrama :
i
/F
X@
@@
@@ g
f @@
à ²
G
Para todo conjunto no vacı́o X, siempre existe un grupo libre
F en X, que es único, pues si F 0 fuera otro, entonces existirı́an funciones
inyectivas i : X → F, i0 : X → F 0 y morfismos únicos ϕ : F → F 0 y
ψ : F 0 → F haciendo conmutativos a los diagramas :
i /F i /F
XA XA O
AA AA
AA AA
A ϕ A ψ
i0 AAÃ ² i0 AAÃ
F0 F0

Ası́, i0 = ϕ ◦ i, i = ψ ◦ i0 ; y entonces ψ ◦ ϕ hace conmutativo al diagrama


i /F
X@
@@
@@ ψ◦ϕ
i @@
à ²
F
El único morfismo con tal propiedad es la identidad en F . Esto implica
que ψ ◦ ϕ es la identidad en F . De manera similar, ϕ ◦ ψ es la identidad en
F 0 , por lo que ϕ : F → F 0 es un isomorfismo.
La existencia del grupo libre F en X se puede demostrar construyéndolo:
Para tal fin se crea un alfabeto con tantas “letras” a como elementos tenga
X, junto con nuevos sı́mbolos a−1 para cada a ∈ X, más el sı́mbolo 1. El
grupo F consistirá de todas las palabras con (un número finito de) letras
del alfabeto descrito. La multiplicación en F es yuxtaposición de palabras y
se permiten cancelaciones del sı́mbolo 1 y de las parejas aa−1 y a−1 a donde
quiera que ocurran. La palabra vacı́a es el elemento identidad 1. Falta por
verificar la asociatividad de F ; y se propone como ejercicio.
Proposición 1.73 Todo grupo es cociente de un grupo libre.
Demostración: Si G es un grupo y A ⊆ G es tal que hAi = G, entonces
la inclusión j : A → G se puede extender de manera única a un morfismo
suprayectivo η : F → G con F grupo libre en A.
40 1. Grupos

En las condiciones de la proposición escribimos R = ker η, para tener


G∼ = F/R. Decimos que R es el grupo de relaciones de G.
Decimos que A es un sistema de generadores de G, mientras que un
conjunto B de generadores de R es un sistema de relaciones de G. La
información anterior es una presentación de G.
Ejemplo. El grupo cı́clico Zn admite un generador a y un sistema de
relaciones generadas por an . Esto se escribe ası́: Zn = ha | an = 1i.
Observaciones. Un grupo puede admitir más de una presentación, como
es el caso de Zpq = ha | apq = 1i = ha, b | ap = 1, bq = 1, aba−1 b−1 = 1i,
cuando p, q son números primos tales que p < q, p - (q − 1), como se vió en
la Proposición 1.67.
El grupo libre en un generador es el grupo aditivo Z.
Si F es un grupo libre en X, entonces consideramos al grupo derivado
R = haba−1 b−1 | a, b ∈ F i. El cociente G = F/R es el grupo libre
abeliano en X. Para el grupo G, existe una función inyectiva i : X → G tal
que dada una función f : X → H, donde H sea un grupo abeliano, siempre
existe un único morfismo de grupos ρ : G → H que hace conmutativo al
siguiente diagrama :
i /G
XA
AA
AA ρ
f AA
à ²
H
Esta propiedad la podemos usar para caracterizar al grupo libre abeliano
en X o usarla como definición. En todo caso, el grupo libre abeliano en un
conjunto X resulta ser isomorfo al producto directo de copias del grupo
aditivo Z, requiriéndose tantas copias de Z como elementos tenga X.
Teorema 1.74 El grupo simétrico Sn admite la presentación
hs1 , ..., sn−1 | s2i = 1, para 1 ≤ i ≤ n − 1, (si si+1 )3 = 1, para
1 ≤ i ≤ n − 2; y (si sj )2 = 1, para 1 ≤ i ≤ n − 3 con j > i + 1i.
Demostración: Por el ejercicio 1.7.2, Sn = hti = (i, i + 1), 1 ≤ i < ni;
de manera que si L es el grupo libre en los generadores si con 1 ≤ i < n,
entonces el morfismo η : L → Sn tal que η(si ) = ti es suprayectivo. El
núcleo de η contiene al subgrupo normal R de L generado por s2i = 1, para
1 ≤ i ≤ n − 1, (si si+1 )3 = 1, para 1 ≤ i ≤ n − 2; y (si sj )2 = 1, para
1 ≤ i ≤ n − 3 con j > i + 1. Sea G = L/R. Tenemos que η induce un
morfismo suprayectivo κ : G → Sn .
Es suficiente ver que κ es inyectivo. El siguiente razonamiento demuestra
por inducción en n que ◦(G) ≤ n!:
Sea H = hs1 , ..., sn−2 i < G y sea A el conjunto de las siguientes clases
laterales:
H, Hsn−1 , Hsn−1 sn−2 , ..., Hsn−1 sn−2 · · · s1 .
1.13 Grupos Abelianos Finitamente Generados 41

Claramente, ◦(A) ≤ n, por ser un conjunto de clases laterales.


Afirmamos que A es estable ante translación derecha por G. Esto im-
plicará que G está contenido en la unión de las clases laterales en A y por
tanto que ◦(G) ≤ n ◦ (H). Pero en el caso n = 2, se ve que ◦(H) = 1; por
lo que inductivamente se obtendrá ◦(G) ≤ n!.
Para verificar la afirmación pendiente, veamos la multiplicación derecha
por el generador sj . En primer lugar, esta operación intercambia a la clase
lateral Hsn−1 · · · sj con Hsn−1 · · · sj+1 .
Si i > j + 1, entonces (Hsn−1 · · · si )sj = Hsn−1 · · · si , pues sj conmuta
con toda sk entre H y sj , debido a las relaciones (sj sk )2 = 1, válidas para
toda k > j + 1.
Observemos que sj sj−1 sj = sj−1 sj sj−1 , por lo que i < j implica

(Hsn−1 · · · si )sj = (Hsn−1 · · · sj sj−1 )sj (sj−2 · · · si ) =

(Hsn−1 · · · sj−1 sj )sj−1 (sj−2 · · · si ) = (Hsn−1 · · · sj )sj−1 (sj−2 · · · si ).

Ejercicios

1. Demuestre que el grupo diédrico Dn admite la presentación

hs, t | sn = 1, t2 = 1, tst−1 = s−1 i.

2. Demuestre que el grupo de cuaternios H tiene presentación

ha, b | a4 = 1, a2 = b2 , bab−1 = a−1 i.

1.13 Grupos Abelianos Finitamente Generados


Todos los grupos que aparecen en esta sección se suponen abelianos. Adop-
tamos la notación aditiva, de manera que por ejemplo, el elemento identidad
es 0.
Estudiaremos primero la estructura y clasificación de los grupos abelianos
finitos para después extender los resultados al caso de los grupos abelianos
finitamente generados.
Si A es un grupo abeliano finito y p es un número primo, Ap es el p-
subgrupo de Sylow de A, el cual es único y normal, también es carac-
terı́stico. El subgrupo Ap consiste de los elementos de A cuyo orden es una
potencia de p. Se tiene que Ap 6= (0) ⇔ p | ◦ (A).

Teorema 1.75 Si A es un grupo abeliano finito y p1 , ..., pr son los primos


que dividen al orden de A, entonces A = Ap1 × · · · × Apr .
42 1. Grupos

Demostración: Sabemos que Api C A para toda i. Si los subgrupos


Ap1 , ..., Apr forman producto directo, entonces Ap1 × · · · × Apr será un
subgrupo de A del mismo orden que A, por tanto igual con A.
Ası́ que es suficiente verificar que Ap1 ∩Ap2 = (0), (Ap1 ×Ap2 )∩Ap3 = (0),
etc. Esto es porque m.c.d.{q1 , q2 } = 1, m.c.d.{q1 q2 , q3 } = 1, etc., donde
qi = ◦(Api ).
Se dice que un grupo G es finitamente generado cuando admite a
un conjunto finito como sistema de generadores. Un grupo abeliano finita-
mente generado es finito si y sólo si todos los elementos de un sistema de
generadores son de orden finito.
Observación. Dada una colección de subgrupos cı́clicos Ai = hai i de un
grupo abeliano A con 1 ≤ i ≤ m, el grupo A es producto directo de sus
subgrupos Ai cuando se satisfacen las dos condiciones siguientes:

• Para todo a ∈ A, existen ni ∈ Z tales que a = n1 a1 + · · · + nm am .

• n1 a1 + · · · + nm am = 0 con ni ∈ Z implica ni ai = 0 para todo i.

Lema 1.76 Sea A = hg1 , ..., gr i un grupo abeliano; y sean c1 , ..., cr ∈ N


tales que m.c.d.{c1 , ..., cr } = 1. Entonces existen h1 , ..., hr ∈ A tales que
A = hh1 , ..., hr i y además h1 = c1 g1 + · · · + cr gr .

Demostración: Procedemos por inducción en n = c1 + · · · + cr . Siendo


claro el caso n = 1, suponemos que n > 1 para tener que al menos dos de
los números ci son positivos. Escribimos c1 ≥ c2 > 0, de manera que

m.c.d.{c1 − c2 , c2 , ..., cr } = 1 y (c1 − c2 ) + c2 + · · · + cr < c1 + c2 + · · · + cr .

Dado que A = hg1 , g1 + g2 , g3 , ..., gr i, la hipótesis inductiva garantiza que


existen elementos h1 , ..., hr ∈ A tales que A = hh1 , ..., hr i, donde además
h1 = (c1 − c2 )g1 + c2 (g1 + g2 ) + · · · + cr gr = c1 g1 + · · · + cr gr .

Teorema 1.77 Sea A un grupo abeliano tal que admita un sistema de


generadores con r elementos. Entonces A es el producto directo de r grupos
cı́clicos.

Demostración: Sea {g1 , ..., gr } un sistema de generadores de A tal que


(◦(g1 ), ..., ◦(gr )) sea mı́nimo en el orden lexicográfico entre todos los sis-
temas de generadores de A con r elementos. Se afirma que

A = hg1 i × · · · × hgr i.

Para ver esto, supongamos que existen a1 , ..., ar ∈ Z tales que

a1 g1 + · · · + ar gr = 0 sin que ai gi = 0 para todo i.

También digamos que 0 ≤ ai < ◦(gi ) para todo i.


1.13 Grupos Abelianos Finitamente Generados 43

Sea s el mı́nimo ı́ndice i tal que ai 6= 0 y sea d = m.c.d.{as , ..., ar }.


Escribiendo ai = dbi para toda i se tiene que m.c.d.{bs , ..., br } = 1, por
lo que el lema garantiza la existencia de un sistema de generadores de
hgs , gs+1 , ..., gr i ası́: hs , hs+1 , ..., hr con hs = bs gs + · · · + br gr . De este
modo, dhs = 0 y también A = hg1 , .., gs−1 , hs , ..., hr i con la contradicción
de que ◦(hs ) ≤ d ≤ as < ◦(gs ).

Observación. Si en el teorema anterior suponemos que ◦(A) > 1 y que


el sistema de generadores dado tiene un número mı́nimo de elementos,
entonces obtendremos factores directos no triviales.

El siguiente teorema nos da la estructura y clasificación de los grupos


abelianos finitos, ahı́ usamos la siguiente notación: Dado un entero n, es-
cribimos ](n) para indicar el número de particiones de n, es decir, el número
de maneras en que n se puede expresar como suma de enteros positivos.
Por ejemplo ](4) = 5 porque 4 = 3 + 1 = 2 + 2 = 2 + 1 + 1 = 1 + 1 + 1 + 1.

Teorema 1.78 a) Todo grupo abeliano finito A es un producto directo de


grupos cı́clicos de órdenes potencias de primos.
b) Los órdenes de los factores directos son únicos.
c) Si m = pn1 1 · · · pnr r con p1 , ..., pr primos distintos con ni > 0 para
1 ≤ i ≤ r, entonces el número de grupos abelianos de orden m no isomorfos
entre sı́ es ](n1 ) · · · ](nr ).

Demostración: El Teorema 1.75 dice que A es el producto directo de


sus subgrupos de Sylow, aplicamos el Teorema 1.77 a cada uno de estos
subgrupos para obtener a).
Como c) es consecuencia inmediata de b), es suficiente ver que los órdenes
de los factores directos de un grupo abeliano A son únicos, suponiendo que
◦(A) = pn , con p primo.
Sea ϕ : Zpk → Zpk el morfismo dado por ϕ(a) = pa para toda a en el
grupo cı́clico Zpk . Es inmediato que ϕ(Zpk ) ∼ = Zpk−1 . Más generalmente,
si G es un grupo abeliano de orden una potencia de p y ϕ : G → G
es multiplicación por p, entonces ϕ es un morfismo de grupos tal que
◦(ϕ(G)) = ◦(G)/ps , donde s es el número de factores cı́clicos de G.
El orden de ϕ(A) no depende de la descomposición de A. Por ello, vemos
que dos descomposiciones cualesquiera de A deben tener el mismo número
de factores.
Generalizando este razonamiento para ϕi (A), primero vemos que el orden
de cada factor de ϕi (A) es p veces el orden de un factor correspondiente de
ϕi+1 (A), para después darnos cuenta de que podemos deducir los órdenes
de los factores cı́clicos de A a partir de los distintos números ◦(ϕi (A)).
44 1. Grupos

Ejemplo. Consideremos A = Zp4 × Zp2 con p primo.

grupo descomposición orden

A Zp4 × Zp2 p6

ϕ(A) Zp 3 × Zp p4

ϕ2 (A) Zp2 p2

ϕ3 (A) Zp p

ϕ4 (A) {1} 1

En la tabla anterior, la columna central se obtuvo de abajo hacia arriba


a partir de las columnas externas ası́:
Como ◦(ϕ3 (A)) = p, es claro que ϕ3 (A) = Zp .
A partir de que ◦(ϕ2 (A))/ ◦ (ϕ3 (A)) = p se tiene que ϕ2 (A) = Zp2 .
De ◦(ϕ(A))/◦(ϕ2 (A)) = p2 , se deduce que ϕ(A) tiene 2 factores directos,
cuyos órdenes deben ser p3 y p.
Finalmente, ◦(A)/ ◦ (ϕ(A)) = p2 nos indica que A tiene dos factores
directos cı́clicos de órdenes p4 y p2 respectivamente.
Los órdenes de los factores directos de A en el teorema anterior se llaman
divisores elementales de A.
El siguiente teorema es una versión alternativa de la estructura y clasifi-
cación de los grupos abelianos finitos. Primero observemos que si A = hai
y B = hbi son grupos cı́clicos de órdenes m y n respectivamente, con
m.c.d.{m, n} = 1, entonces A × B también es cı́clico, generado por ab, pues

(ab)j = 1 ⇒ aj = 1 = bj ⇒ m | j y n | j, de manera que mn | j.

Teorema 1.79 Si A es un grupo abeliano finito, entonces A ∼ = A1 ×· · ·×Ar


con cada Ai cı́clico de orden mi , donde m1 | m2 | · · · | mr .
Los números m1 , ..., mr son únicos.
Demostración: El Teorema 1.78 dice que A es un producto directo de
grupos cı́clicos de órdenes potencias de primos. Para cada primo p que
divida al orden de A, hay al menos un factor directo Bp de A, de orden
una máxima potencia de p. El producto directo de los distintos Bp al variar
p, es un grupo cı́clico B, cuyo orden es el mı́ nimo común múltiplo de los
divisores elementales de A. Además, A es el producto directo de B y de
los restantes grupos cı́clicos de órdenes potencias de primos, cuyo mı́nimo
común múltiplo divide a ◦(B).
1.13 Grupos Abelianos Finitamente Generados 45

Por inducción en ◦(A), se obtiene una descomposición de A como en el


enunciado. Nos falta demostrar la unicidad de los órdenes de los factores
de tal descomposición.
Supongamos que A ∼ = C1 × · · · × Cr , con cada Ci cı́clico de orden mi ,
donde m1 | m2 | · · · | mr , entonces cada Ci es el producto directo de
sus subgrupos de Sylow; y estos son cı́clicos. Aplicando la unicidad del
teorema anterior, tenemos que los órdenes de estos subgrupos de Sylow son
únicos. Ahora bien, mr es el m.c.d. de estos órdenes, mr−1 es el m.c.d.
de los órdenes que quedan después de eliminar exactamente una potencia
máxima de p para cada primo p que divida a mr ; y ası́ sucesivamente. De
esta manera concluimos que los números m1 , m2 , ..., mr son únicos.
Los órdenes de los factores directos de A en este último teorema, se llam
an factores invariantes de A.

Corolario 1.80 Sea G un grupo abeliano finito tal que toda ecuación de
forma dx = 0 con 0 < d ∈ N tenga cuando más d soluciones. Entonces G
es cı́clico.

Demostración: Como G ∼ = G1 × · · · × Gr , con cada Gi cı́clico de orden


ni con n1 | n2 | · · · | nr , se ve que todo elemento de G es solución de la
ecuación nr x = 0, por lo que G = Gr es cı́clico.
En el siguiente corolario usamos la notación multiplicativa para el grupo
abeliano que ahı́ aparece.

Corolario 1.81 El grupo multiplicativo de todo campo finito es cı́clico.

Demostración: Sean K un campo finito y K ? el grupo multiplicativo de


los elementos distintos de cero de K. Entonces toda ecuación xd = 1 tiene
cuando más d soluciones, ver §2.7; por lo que se satisfacen las hipótesis del
corolario anterior; ası́ K ? es cı́clico.
Regresamos a la notación aditiva para los grupos abelianos.
Suponiendo que A es un grupo abeliano finitamente generado, decimos
que el elemento a ∈ A es de torsión cuando a tiene orden finito. Definimos
la torsión de A como tor A = {a ∈ A | a es de torsión}. Es claro que si a y
b son de orden finito, entonces −a y a + b también lo son. Esto implica que
tor A es un subgrupo (caracterı́stico) de A. Se dice que A es de torsión
cuando A = tor A; y que A es libre de torsión cuando tor A = {0}.
Observación. Si G es un grupo abeliano, entonces ϕ : G → G dado por
ϕ(a) = a + a para toda a ∈ G, es un morfismo cuya imagen escribimos 2G.
En la sección anterior vimos que un grupo libre abeliano G es un producto
directo de copias de Z. El número de factores de esa descomposición es el
rango de G. A continuación veremos que este concepto está bien definido.
Escribimos Zn para denotar el producto directo de n copias de Z.

Teorema 1.82 Si Zm ∼
= Zn con n, m ∈ N, entonces m = n.
46 1. Grupos

Demostración: Como Zm ∼ = Zn , se tiene que Zm /2Zm ∼


= Zn /2Zn . Apli-
cando el Teorema 1.49 , obtenemos ◦(Z /2Z ) = 2 y ◦(Zn /2Zn ) = 2n ;
m m m

y de ahı́, 2m = 2n , por lo que m = n.


Teorema 1.83 Sea G un grupo abeliano finitamente generado. Entonces
G es el producto directo de su torsión, tor G, y de un grupo abeliano libre,
cuyo rango es un invariante de G.
Demostración: Si G ∼ = (tor G)×B, con B libre abeliano, entonces el grupo
G/ tor G ∼
= B es libre abeliano; y su rango es un invariante de G/ tor G, y
por tanto de G. Ahora es suficiente ver que tal descomposición existe.
Aplicando el Teorema 1.77, sabemos que G ∼ = ha1 i × · · · × has i, donde
podemos suponer que a1 , ..., am tienen orden infinito, mientras que los ele-
mentos am+1 , ..., as tienen orden finito.
Escribiendo B = ha1 i×· · ·×ham i y C = ham+1 i×· · ·×has i, tenemos que
G∼ = B × C con B libre de rango m y con C de torsión. Ası́, es inmediato
que C ⊆ tor G. Se afirma que C = tor G.
Supongamos que a = n1 a1 +· · ·+ns as ∈ tor G. Entonces existe 0 < n ∈ N
tal que na = nn1 a1 + · · · + nns as = 0; pero entonces nn1 = · · · = nnm = 0,
por lo que n1 = · · · = nm = 0, de manera que a ∈ C; demostrando la
igualdad afirmada.
El siguiente corolario es inmediato.

Corolario 1.84 Sea G un grupo abeliano finitamente generado. Entonces


G es libre si y sólo si G es libre de torsión.

Observación. Si G es un grupo abeliano finitamente generado, entonces


tor G también lo es, por lo que tor G es un grupo finito abeliano, cuya es-
tructura queda descrita por el Teorema 1.78 o bien por el Teorema 1.79.
Como consecuencia de esto, tenemos que el Teorema 1.83 completa el es-
tudio de la estructura y clasificación de los grupos abelianos finitamente
generados.

Ejercicios
1. Describa Hom(Zpn , Zpm ), donde p es un primo.

2. Sea G el producto directo de r copias de Zp con p primo. Demuestre


que ◦(Aut G) = (pr − 1)(pr − p) · · · (pr − pr−1 ).

3. Sea A un grupo abeliano finito de orden n y sea m un entero positivo


tal que m | n. Demuestre que A contiene un subgrupo de orden m.

4. Investigue si los grupos Z8 × Z6 × Z10 y Z4 × Z4 × Z30 son isomorfos.

5. Sea A un grupo abeliano para el que existe n ∈ N tal que nA = (0).


Sea m ∈ N tal que m.c.d.{m, n} = 1. Demuestre que para toda a ∈ A,
existe b ∈ A tal que a = mb.
1.14 Ejercicios Generales 47

6. Sean A y B grupos abelianos tales que mA = nB = (0) con m y n


primos relativos. Describa Hom(A, B).

7. Encuentre los factores invariantes de Zm × Zn , si m y n son enteros


positivos.

8. Sea G un grupo abeliano con subgrupos A y B de órdenes a y b


respectivamente. Demuestre que G contiene un subgrupo de orden
m.c.d.{a, b}.

9. Demuestre que el grupo aditivo de los racionales Q no se puede ex-


presar como producto directo de dos subgrupos propios.

1.14 Ejercicios Generales


1. Encuentre tres grupos H, K, G tales que H C K, K C G, sin que H
sea normal en G.

2. Sean G un grupo finito y H un subgrupo propio. Demuestre que


[
aHa−1 6= G.
a∈G

3. Sea G un grupo de orden 2n con n > 1 impar. Demuestre que G no


es simple.

4. Sea G un grupo finito tal que 3 - ◦(G) y que (ab)3 = a3 b3 para todos
a, b ∈ G. Demuestre que G es abeliano.

5. Sean G un grupo y a ∈ G. Definimos la “translación izquierda” aL y


la “translación derecha” aR con a como aL (x) = ax y aR (x) = xa,
para toda x ∈ G. De manera que aL , aR : G → G.
También definimos GL = {aL | a ∈ G} y GR = {aR | a ∈ G}. Estos
son subconjuntos de SG al ser biyecciones todas las aL , aR .
a) Demuestre que GL · Aut G es un subgrupo de SG que contiene a
GR . Este grupo llamado holomorfo se escribe Hol G.
b) Demuestre que si G es finito, entonces ◦(Hol G) = ◦(G) ◦ (Aut G).
c) Demuestre que Hol(Z3 ) ∼= S3 y que Hol(Z4 ) ∼
= D4 .

6. Sea G un grupo finito provisto de un automorfimo f tal que el con-


junto {x ∈ G | f (x) = x−1 } contiene a más de (3/4) ◦ (G) elementos.
Demuestre que G es abeliano.
48 1. Grupos

7. Demuestre que
X 1
i = nϕ(n).
2
m.c.d.{i,n}=1
1≤i≤n

8. Determine con demostración todos los grupos G tales que G es iso-


morfo a todo subgrupo de G distinto de la identidad.
9. Sea G un grupo abeliano con un número finito de subgrupos. De-
muestre que G es finito.
10. Sea G un grupo finito de orden n con k clases de conjugación. De-
muestre que la probabilidad de que 2 elementos de G escogidos al
azar (pero posiblemente iguales) conmuten entre sı́ es

k+1
.
n+1

11. a) Sean H y K subgrupos solubles de un grupo G con K C G.


Demuestre que HK es soluble.
b) Observe que en a) no es suficiente que HK < G con H y K
solubles, viendo el caso en que G = A5 , H = A4 y K ∼
= Z5 .
c) Demuestre que si H y K son subgupos normales de G con G/H y
G/K solubles, entonces el grupo G/(H ∩ K) es soluble.

12. Sea p un número primo y sea


a
H={ ∈ Q | m.c.d.{a, b} = 1, b es una potencia de p}.
b
Considere el morfismo natural ϕ : Q → Q/Z; y sea Z(p∞ ) = ϕ(H).
Demuestre que Z(p∞ ) es isomorfo a cada uno de sus cocientes distin-
tos de cero; y que todos sus subgrupos propios son finitos.
13. El subgrupo de Frattini Φ(G) de un grupo G es la intersección
de sus subgrupos propios máximos. Se dice que g ∈ G es un no
generador cuando para todo subconjunto A ⊆ G tal que G = hA, gi,
se tenga G = hAi. Demuestre que Φ(G) es el conjunto de los no
generadores.
Capı́tulo 2
Anillos

2.1 Definiciones y Primeros Resultados


Se dice que R es un anillo asociativo con 1 cuando R es un conjunto
equipado con dos operaciones: suma y multiplicación, de manera que ante
la suma, R es un grupo abeliano; que además satisface las siguientes condi-
ciones:
1. a, b ∈ R ⇒ ab ∈ R.
2. a(bc) = (ab)c para todos a, b, c ∈ R.
3. a(b + c) = ab + ac, (b + c)a = ba + ca para todos a, b, c ∈ R. Estas
propiedades se llaman distributividad a la izquierda y a la derecha
respectivamente.
4. Existe un elemento 1 ∈ R tal que 1 6= 0 y a1 = 1a = a para toda
a ∈ R.
Por brevedad, diremos anillo en lugar de anillo asociativo con 1. En caso
de que ab = ba para todos a, b ∈ R, diremos que R es conmutativo.
Ejemplos. Como ejemplos de anillos tenemos los siguientes:
1. Los números enteros Z.
2. Los enteros módulo n : Z/nZ.
3. Los números racionales Q.
4. Los números reales R.
5. Los números complejos C.
6. El anillo de polinomios R[X1 , ..., Xn ] en n variables con coeficientes
en el anillo R.
7. El conjunto Mn (R) de las matrices n × n ante la suma y la multipli-
cación de matrices, con coeficientes en el anillo R.
50 2. Anillos

8. Los enteros Gaussianos Z[i] = {a + bi | a, b ∈ Z} ⊆ C, con i2 = −1.

9. Los cuaternios reales H = {a + bi + cj + dk | a, b, c, d ∈ R}, donde

• (a1 + b1 i + c1 j + d1 k) + (a2 + b2 i + c2 j + d2 k) =
(a1 + a2 ) + (b1 + b2 )i + (c1 + c2 )j + (d1 + d2 )k
• i2 = j 2 = k 2 = −1, ij = −ji = k, jk = −kj = i, ki = −ik = j
y la multiplicación es bilineal.

Un dominio es un anillo conmutativo donde vale la ley de cancelación:

ab = ac, a 6= 0 ⇒ b = c.

Los ejemplos 1,3,4,5 y 8 son dominios.


Un anillo de división es un anillo R tal que para toda 0 6= a ∈ R, existe
b ∈ R tal que ab = ba = 1. Un campo es un anillo de división conmutativo.
Se pide demostrar en el problema 1 que los cuaternios reales son un anillo
de división. Los ejemplos 3,4 y 5 son campos.
Decimos que un elemento a de un anillo conmutativo R es divisor de
cero cuando a 6= 0 y existe 0 6= b ∈ R tal que ab = 0. Ası́, un dominio es
un anillo conmutativo sin divisores de cero.
Un elemento a ∈ R es unidad cuando existe b ∈ R tal que ab = ba = 1.
Las unidades de R forman un grupo multiplicativo escrito R? .
Observaciones. En todo anillo R se cumplen las siguientes afirmaciones
de fácil verificación:

1. 0a = a0 = 0 para toda a ∈ R.

2. a(−b) = (−a)b = −ab para todas a, b ∈ R.

3. (−a)(−b) = ab para todas a, b ∈ R.

4. (−1)a = −a para toda a ∈ R.

5. (−1)(−1) = 1.

Se dice que T es un subanillo de R cuando T es un subconjunto de R


que forma un anillo ante las mismas operaciones de R, tal que 1 ∈ T , donde
1 es la identidad multiplicativa de R.

Teorema 2.1 Todo dominio finito D es un campo.

Demostración: Aquı́, 0 6= a ∈ D ⇒ aD ⊆ D y ◦(aD) = ◦(D). Por tanto,


aD = D y existe b ∈ D tal que ab = 1.
Teorema 2.2 Si p es un número primo, entonces Z/pZ es un campo.
2.1 Definiciones y Primeros Resultados 51

Demostración: Por el teorema anterior, es suficiente ver que Z/pZ es un


dominio; pero esto es consecuencia de que para elementos a, b ∈ Z, se tiene
que p - a, p - b ⇒ p - ab.
Para un anillo dado R, definimos el centro Z de R ası́:

Z = {a ∈ R | ab = ba, ∀b ∈ R}.

El centro de un anillo es siempre un subanillo conmutativo. El centro de


un anillo de división es un campo.
Teorema 2.3 (Brauer-Cartan-Hua) Sean D un anillo de división, Z
su centro y K un subanillo de división de D tal que xKx−1 ⊆ K para todo
0 6= x ∈ D. Entonces o bien K ⊆ Z ó bien K = D.
Demostración: Supongamos que K 6= D. Sean a ∈ K, x ∈ D, x ∈ / K.
Entonces existe a1 ∈ K tal que xa = a1 x. Similarmente, existe a2 ∈ K tal
que (1 + x)a = a2 (1 + x).
Por tanto, a = a2 +(a2 −a1 )x; lo que implica x ∈ K a menos que a1 = a2 .
Entonces a1 = a2 , (1 + x)a = a1 (1 + x) = a1 + xa, de donde se obtiene que
a = a1 .
Acabamos de ver que todo elemento de K conmuta con todo elemento
del complemento de K.
Se afirma ahora que K ⊆ Z. En efecto, sean a, k ∈ K arbitrarios; y
h∈/ K. Entonces a conmuta con h y con h + k porque h + k ∈ / K. Esto
implica que a conmuta con k. Ası́, a ∈ Z.

Ejercicios
1. Para α = a + bi + cj + dk ∈ H con a, b, c, d ∈ R, definimos

α = a − bi − cj − dk y N (α) = αα.

a) Demuestre que αβ = βα, para todos α, β ∈ H.


b) Demuestre que N (α) = a2 +b2 +c2 +d2 y que N (αβ) = N (α)N (β),
siempre que α, β ∈ H.
c) Encuentre el centro de H.
d) Demuestre que H es un anillo de división.
2. Sean R un anillo conmutativo y A una matriz n × n sobre R. De-
muestre que A ∈ Mn (R)? si y sólo si det A ∈ R? .
3. Demuestre que en Z/nZ, todo elemento distinto de cero es o bien una
unidad o bien un divisor de cero.
4. Sean k un campo y R el anillo de las matrices 2×2 sobre k. Demuestre
que (AB − BA)2 está en el centro de R para todas A, B ∈ R.
52 2. Anillos

2.2 Funciones Aritméticas


Las funciones aritméticas son aquellas definidas en los números natu-
rales N con valores en un campo, como los números reales R.
Ejemplos. Algunos ejemplos importantes son:

1. La función ² dada por:

• ²(1) = 1,
• ²(n) = 0, si n 6= 1.

2. 1(n) = 1 para toda n.

3. id(n) = n para toda n.

4. σ(n) = suma de los divisores de n.

5. σk (n) = suma de las k potencias de los divisores de n.

6. d(n) = número de divisores de n.

7. ϕ(n), la función de Euler.

8. µ(n), la función de Möbius definida como sigue:

• µ(1) = 1,
• µ(p2 q) = 0, si p es primo y q ∈ N,
• µ(p1 · · · pr ) = (−1)r ; si p1 , ..., pr son primos distintos.

Observaciones. Es fácil ver que si n = pm mr


1 · · · pr
1
es una descomposición
prima, entonces
d(n) = (m1 + 1) · · · (mr + 1),
r
Y k(m +1)
p i −1
σk (n) = (1 + pk1 + · · · + pkm
1
1
) · · · (1 + pkr + · · · + pkm
r
r
)= i
.
i=1
pki − 1

Lema 2.4 X
µ(d) = ²(n).
d|n

Demostración: Para n > 1, sean p1 , ..., pr los distintos primos que dividen
a n. Consideremos la identidad

(1 − p1 ) · · · (1 − pr ) = 1 − p1 − · · · − pr + p1 p2 + · · · ;
P
y substituyamos 1 en lugar de cada pi para obtener d|n µ(d) = 0.
2.2 Funciones Aritméticas 53

En el conjunto de las funciones aritméticas definimos la convolución


de Dirichlet ası́: µ ¶
X n
(f ∗ g)(n) = f (d)g .
d
d|n

Es fácil verificar que el conjunto de las funciones aritméticas provisto de las


operaciones suma de funciones y convolución de Dirichlet forma un anillo
conmutativo con identidad multiplicativa ².
Con esta notación, 1∗1 = d; mientras que el Lema 2.4 afirma que 1∗µ = ².
Teorema
P 2.5 (Fórmula de inversión de Möbius) Si g está dada por
g(n) = d|n f (d), entonces
X µ ¶
n
f (n) = g(d)µ .
d
d|n

Demostración: La hipótesis dice que g = f ∗1; pero sabiendo que 1∗µ = ²


es claro que las funciones 1 y µ son inversas la una de la otra, por lo que
f = g ∗ µ, que es la conclusión.
P
Proposición 2.6 d|n ϕ(d) = n, es decir, ϕ ∗ 1 = id.

Demostración: El grupo cı́clico Zn tiene un único subgrupo de orden d


isomorfo a Zd para cada d|n. Sea Ad = {a ∈ Zn | ◦ (a) = d}. De manera
que Ad es el conjunto de generadores de Zd ; por tanto, P
◦(Ad ) = ϕ(d). Como
Zn = ∪d|n Ad es una unión disjunta, se tiene que n = d|n ϕ(d).

Ejercicios
1. Demuestre que en el anillo de las funciones aritméticas A con valores
en un campo, f ∈ A? ⇔ f (1) 6= 0.
2. Demuestre que
X µn¶
ϕ(n) = µ d,
d
d|n

donde ϕ es la función de Euler y µ es la función de Möbius.


3. Sea n un entero par. Demuestre que
X
µ(d)ϕ(d) = 0.
d|n

4. Suponiendo que para todo 0 < n ∈ N, se tiene que


X µ ¶
n
f (n) = µ(d)g ;
d
d|n
P
demuestre que g(n) = d|n f (d), también para todo 0 < n ∈ N.
54 2. Anillos

2.3 Morfismos e Ideales


Un morfismo de anillos es una función ϕ : R → S tal que ϕ(1) = 1,
ϕ(a + b) = ϕ(a) + ϕ(b), ϕ(ab) = ϕ(a)ϕ(b), para todas a, b ∈ R.
El núcleo de ϕ, escrito ker ϕ, es {x ∈ R | ϕ(x) = 0}. Como ϕ es en
particular un morfismo de grupos abelianos aditivos, sabemos que ϕ es
inyectivo si y sólo si ker ϕ = 0. Además, tenemos que si ϕ(a) = b, entonces
ϕ−1 (b) = a + ker ϕ.
Un ideal izquierdo de R es un subgrupo aditivo J tal que RJ ⊆ J,
donde RJ = {ab | a ∈ R, b ∈ J}. Un ideal derecho se define análogamente.
Un ideal bilateral o simplemente ideal es simultaneamente un ideal dere-
cho e izquierdo de R. Excluimos entre los posibles ideales izquierdos, dere-
chos o bilaterales al propio R.
Un anillo es simple cuando su único ideal (bilateral) es {0}.
Es fácil ver que toda intersección de ideales (resp. izquierdos, derechos o
bilaterales) es un ideal (resp. izq., der., o bilateral). Ası́, dado un conjunto
A ⊆ R, si existe un ideal (resp. izq., der., o bilateral) que lo contiene,
entonces la intersección de todos los ideales (resp. izq., der., o bilaterales)
que contienen a A es un ideal (resp. izq., der., o bilateral); este es el ideal
(resp. izq., der., o bilateral) generado por A, escrito (A) ó bien (a1 , ..., an )
en caso de que A = {a1 , ..., an }.
Un ideal que admite a un solo elemento como generador se llama prin-
cipal.

Teorema 2.7 En el anillo Z todo ideal es principal.

Demostración: Sea I un ideal de Z. Podemos suponer que I 6= {0}.


Entonces I contiene elementos positivos. Sea a el mı́nimo elemento positivo
de I.
Entonces es claro que (a) ⊆ I. Afirmamos que esta inclusión es una
igualdad. En efecto, si b ∈ I, entonces el algoritmo euclideano garantiza
que existen q, r ∈ Z tales que b = aq + r con 0 ≤ r < a; pero r ∈ I ⇒ r = 0,
de manera que b ∈ (a).
Observación. Si ϕ : R → S es un morfismo de anillos, entonces ker ϕ es
un ideal de R.
Dado un anillo R, existe un único morfismo f : Z → R, pues f (1) = 1.
La caracterı́stica de R es aquel n ∈ N tal que ker f = (n). De manera
que si n 6= 0, entonces n es el mı́nimo entero positivo tal que toda suma
a + · · · + a con n términos vale cero para todo a ∈ R.
Si a es un ideal del anillo R y r ∈ R, entonces r + a es una clase lateral
de a. Estas clases laterales forman una partición de R. El conjunto de ellas
se escribe R/a.
En R/a definimos las operaciones de bloque

(r + a) + (s + a) = (r + s) + a, (r + a)(s + a) = rs + a.
2.3 Morfismos e Ideales 55

Teorema 2.8 Si a es un ideal de R, entonces R/a es un anillo ante las


operaciones de bloque y es también una imagen homomorfa de R.
Demostración: Para saber que R/a es un anillo, es suficiente obsevar que
las operaciones de bloque están bien definidas y que coinciden con las ope-
raciones A + B = {a + b | a ∈ A, b ∈ B}, AB = {ab | a ∈ A, b ∈ B}
para subconjuntos de R. Entonces es claro que ϕ : R → R/a dado por
ϕ(r) = r + a es un morfismo suprayectivo de anillos.
El morfismo ϕ : R → R/a dado por ϕ(r) = r + a se llama natural.
Tenemos las siguientes operaciones para ideales a y b de un anillo:
• a ∩ b, su intersección como conjuntos.
• a + b = {a + b | a ∈ a, b ∈ b}. Este es el ideal generado por a ∪ b.
• ab = {a1 b1 + · · · + an bn | ai ∈ a, bi ∈ b}. Este es el ideal generado por
{ab | a ∈ a, b ∈ b}.
El siguiente resultado es tan similar a su análogo para grupos que dejamos
su demostración al lector como ejercicio.
Teorema 2.9 Sea ϕ : R → S un morfismo suprayectivo de anillos con
núcleo I. Entonces S ∼= R/I. Además, existe una biyección del conjunto de
los ideales de R que contienen a I al conjunto de los ideales de S, donde al
ideal b de S le corresponde el ideal a = ϕ−1 (b) de R. En estas condiciones,
R/a ∼ = S/b.
Si R1 , ..., Rn son anillos, podemos construir su producto directo ası́:
n
Y
Ri = R1 × · · · × Rn
i=1

es el producto directo de grupos abelianos con multiplicación definida por


componentes:

(a1 , ..., an )(b1 , ..., bn ) = (a1 b1 , ..., an bn ),

para (a1 , ..., an ), (b1 , ..., bn ) ∈ R1 × · · · × Rn .


Observaciones. Las siguientes afirmaciones son claras:
1. La identidad aditiva del producto es (0, ..., 0).
2. La identidad multiplicativa del producto es (1, ..., 1).
3. Si a1 , ..., an son ideales de un anillo R, entonces tenemos el morfismo
n
Y
f :R→ R/ai ,
i=1

dado por f (r) = (r + a1 , ..., r + an ), cuyo núcleo es ∩i ai .


56 2. Anillos

Ejercicios
1. Sea R un anillo simple. Demuestre que la caracterı́stica de R es o
bien cero o bien un número primo.

2. Sean R un anillo simple y Z su centro. Demuestre que Z es un campo.

3. Sea R un anillo con p elementos donde p es un número primo. De-


muestre que R ∼
= Z/pZ.

4. Sea R un anillo tal que a2 = a para toda a ∈ R. (Tales anillos se


llaman Booleanos). Demuestre que a + a = 0 para toda a ∈ R; y
que R es conmutativo.

5. Sean k un campo y Mn (k) el anillo de las matrices n × n sobre k.


Demuestre que Mn (k) es simple.

6. Sea f : H → M2 (C) la función dada por


µ ¶
a + bi c + di
f (a + bi + cj + dk) = .
−c + di a − bi

Demuestre que f es un morfismo inyectivo de anillos.

7. Sean R un anillo y e1 , ..., en elementos del centro de R tales que


ei ej = δij ei , e1 + · · · + en = 1. Demuestre que R es un producto
directo de n anillos.

2.4 Anillos Conmutativos


En esta sección siempre suponemos que tratamos con anillos conmutativos.

Teorema 2.10 Un anillo conmutativo R es un campo si y sólo si su único


ideal es (0).

Demostración: Si R es un campo y 0 6= a es un ideal, entonces existe


0 6= r ∈ a por lo que 1 = rr−1 ∈ a, que es una contradicción.
Recı́procamente, si (0) es el único ideal de R, entonces dado 0 6= r ∈ R,
el “ideal” (r) coincide con R, por lo que existe s ∈ R tal que rs = 1.
Se dice que un ideal p es primo cuando ab ∈ p; a, b ∈ R ⇒ a ∈ p ó b ∈ p.
Esto es equivalente a decir que R/p es un dominio.
Se dice que un ideal m es máximo cuando para todo ideal J tal que
m ⊆ J, se tenga m = J. Esto es equivalente a decir que R/m es un campo.
Observación. Es inmediato que todo ideal máximo es primo.
La terminologı́a anterior está de acuerdo con la situación general:
2.4 Anillos Conmutativos 57

Si un conjunto X está provisto de una relación de orden parcial ≤, se


dice que a ∈ X es máximo cuando a ≤ b, b ∈ X ⇒ a = b. Una cadena
es un subconjunto Y ⊆ X tal que c, d ∈ Y ⇒ c ≤ d ó d ≤ c. Un elemento
k ∈ X es una cota superior para un subconjunto A ⊆ X cuando a ≤ k
para todo a ∈ A.

Axioma 2.11 (Lema de Zorn) Si X es un conjunto no vacı́o ordenado


parcialmente, tal que toda cadena de X tiene una cota superior en X,
entonces existe un elemento máximo en X.

Teorema 2.12 Todo anillo conmutativo R contiene al menos un ideal


máximo.

Demostración: Aplicamos el Lema de Zorn al conjunto C de los ideales de


R ordenados ante ⊆. Esto es posible porque si a1 ⊆ a2 ⊆ · · · es una cadena
de ideales, entonces ∪i ai es un ideal, pues 1 ∈
/ ∪i ai , (1 ∈ ∪i ai ⇒ 1 ∈ ai
para algún i); y es también una cota superior de la cadena. Se concluye
que en C hay al menos un elemento máximo.

Corolario 2.13 En todo anillo conmutativo, todo ideal está contenido en


al menos un ideal máximo. En particular, todo elemento que no es unidad
está contenido en al menos un ideal máximo.

Demostración: La misma demostración se aplica al conjunto de los ideales


que contienen al ideal dado o al elemento no unidad dado.
Para un anillo R, su nilradical N es la intersección de todos los ideales
primos. El radical de Jacobson J es la intersección de todos los ideales
máximos. Es inmediato que N ⊆ J .
Un elemento a ∈ R es nilpotente cuado existe n ∈ N tal que an = 0.
Usamos este concepto para formular una caracterización del nilradical de
un anillo. También ofrecemos una caracterización del radical de Jacobson.

Teorema 2.14 a) El nilradical N de un anillo R es el conjunto de los


elementos nilpotentes de R.
b) J = {a ∈ R | (1 − ab) ∈ R? para toda b ∈ R}.

Demostración: a) Si a es nilpotente y p es un ideal primo de R, entonces


0 = an ∈ p, para algún entero positivo n. Por tanto, a ∈ p. Ası́, a ∈ N .
Recı́procamente, sean a ∈ R no nilpotente y C la familia de los ideales I
de R tales que an ∈/ I para todo n ∈ N. Como (0) ∈ C, es claro que C 6= ∅.
Por el Lema de Zorn, C tiene un elemento máximo p. Para concluir la
demostración, es suficiente ver que p es un ideal primo:
Sean r, s ∈ R tales que r, s ∈
/ p. Entonces, gracias a la maximalidad de
p, existen m, n ∈ N tales que am ∈ (p, r) y an ∈ (p, s). De manera que
podemos escribir am = p + rx y an = q + sy con p, q ∈ p; x, y ∈ R; y
entonces am+n ∈ (p, rs), lo que implica rs ∈/ p, por lo que p es primo.
58 2. Anillos

b) Si a ∈ J mientras que (1 − ab) ∈ / R? para algún elemento b ∈ R,


entonces (1 − ab) ∈ m para algún ideal máximo m, de donde se obtiene la
contradicción 1 ∈ m.
Recı́procamente, si a ∈
/ J , entonces existe un ideal máximo m tal que
a∈/ m; pero entonces (m, a) = R y existen b ∈ R, c ∈ m con 1 = c + ab. Ası́,
/ R? .
c = 1 − ab ∈
A continuación reenunciamos y redemostramos el Corolario 1.81.

Teorema 2.15 El grupo multiplicativo de todo campo finito es cı́clico.

Demostración: Sea G el grupo multiplicativo de un campo finito. Supon-


gamos que ◦(G) = n; y observemos que para todo d | n se tiene que la
ecuación xd = 1 tiene cuando más d soluciones en G, ver §2.7.
Fijemos un divisor d del orden n. Si existe a ∈ G de orden d, entonces
el grupo cı́clico hai es el conjunto de soluciones de xd = 1, por lo que todo
elemento de G de orden d está en hai. Ahora bien, en ese caso, hai tiene
exactamente ϕ(d) elementos de orden d.
Hemos demostrado que para cada d | n, el número de elementos de orden
d es cero ó ϕ(d). Ası́, ◦(G) es igual a la suma de ciertos números de la forma
ϕ(d) para losPque existen elementos de orden d en G. Pero la Proposición
2.6 dice que d|n ϕ(d) = n. Esto garantiza que existen elementos de orden
d para todo divisor de n. En particular, hay elementos de orden n, por lo
que G es cı́clico.
Se dice que dos ideales a y b son primos relativos cuando a + b = R.

Teorema 2.16 Si a1 , ..., an es una colección de ideales primos relativos


por parejas, entonces
n
\ n
Y n−1
\
ai = ai y an + ai = R.
i=1 i=1 i=1
Q
Demostración: La inclusión
Q i ai ⊆ ∩i ai es clara.
Veamos que ∩i ai ⊆ i ai por inducción en n:
Si n = 2, entonces existen a1 ∈ a1 y a2 ∈ a2 tales que a1 + a2 = 1, por
lo que b ∈ a1 ∩ a2 ⇒ b = ba1 + ba2 ∈ a1 a2 .
Supongamos que n > 2 y que
n−1
\ n−1
Y
b= ai = ai .
i=1 i=1

Como existen xi ∈ ai , yi ∈ an tales que xi +yi = 1 para 1 ≤ i ≤ n−1, se ve


que x1 · · · xn−1 = (1 − y1 ) · · · (1 − yn−1 ) ≡ 1 (mod an ) y que Q
x1 · · · xn−1 ∈ b;
n
por tanto b + an = R y entonces ∩ni=1 ai = an ∩ b = an b = i=1 ai .
2.4 Anillos Conmutativos 59

Teorema Q2.17 (Chino del Residuo) Sean a1 , ..., an ideales del anillo R,
n
ϕ : R → i=1 (R/ai ) el morfismo dado por ϕ(r) = (r + a1 , ..., r + an ).
El morfismo ϕ es suprayectivo ⇔ los ideales a1 , ..., an son primos
Tn rela-
tivos por parejas. En este caso, ϕ induce un isomorfismo ( R / ∼
Qn i=1 i ) =
a
i=1 (R/ai ).

Demostración: Suponiendo ϕ suprayectiva, existe b ∈ R tal que ϕ(b) =


(1, 0, ..., 0), es decir, tal que b ∈ a2 ∩ · · · ∩ an con b − 1 ∈ a1 , por lo que
a1 + ai = R para toda i > 1. De manera similar puede demostrarse que
ai + aj = R para toda i 6= j.
Recı́procamente, ϕ es suprayectiva si existen b1 , ..., bn ∈ R tales que
ϕ(bi ) = (0, ..., 0, 1, 0, ..., 0), donde el 1 está en la posición i. Veamos por
ejemplo que existe bn :
Como an + a1 ∩ · · · ∩ an−1 = R, existen u ∈ an y bn ∈ a1 ∩ · · · ∩ an−1 con
u + bn = 1. Entonces ϕ(bn ) = (0, ..., 0, 1).
Como ker ϕ = ∩i ai , se tiene el isomorfismo enunciado.

Teorema 2.18 Si p > 2 es un número primo y 1 ≤ n ∈ N, entonces el


grupo (Z/pn Z)? es cı́clico.

Demostración: Si a ∈ Z, escribimos a0 para la clase de a (mod p), mientras


que a es la clase de a (mod pn ). Sea ψ : (Z/pn Z)? → (Z/pZ)? el morfismo
dado por ψ(a) = a0 . Claramente, ψ es suprayectivo, con núcleo K de orden
pn−1 .
Para demostrar el teorema, podemos suponer que n ≥ 2. Afirmamos
que K es cı́clico y que K = h1 + pi. Veremos por inducción en n, que
n−2
(1 + p)p 6≡ 1 (mod pn ). Lo cual es cierto para n = 2. Ası́, suponemos
n−3
que n ≥ 3. A partir de (1 + p)p 6≡ 1 (mod pn−1 ), tenemos que existe
n−3
p
s 6≡ 0 (mod p) tal que (1 + p) = 1 + spn−2 ; y por tanto
µ ¶ µ ¶
n−2 p p 2 2(n−2)
(1+p)p = 1+ spn−2 + s p +· · ·+sp pp(n−2) = 1+spn−1 +tpn
1 2
n−2
De manera que (1 + p)p 6≡ 1 (mod pn ).
p−1
Sea ahora H = {a | a = 1}. Tenemos que H < (Z/pn Z)? es tal
que H ∩ K = {1}. Ası́, H y K forman producto directo con ◦(H) ≤
ϕ(pn )/pn−1 = p − 1.
n−1
Ahora bien, para todo a ∈ (Z/pn Z)? , se tiene que ap ∈ H con los
pn−1 pn−1 n−1
elementos 1 ,2 , ..., (p − 1)p todos diferentes, pues sus imágenes
ante ψ son: 1 , 2 , ..., (p − 1)0 , por el Teorema de Fermat. Esto implica que
0 0

◦(H) = p − 1 y que (Z/pn Z)? = H × K.


El grupo H es cı́clico porque su imagen homomorfa ψ(H) = (Z/pZ)? es
un grupo cı́clico de orden ◦(H). Siendo H y K cı́clicos de órdenes primos
relativos, se deduce que H × K = (Z/pn Z)? también es cı́clico.
60 2. Anillos

Teorema 2.19 a) Los grupos (Z/2Z)? y (Z/4Z)? son cı́clicos.


b) Si 3 ≤ n ∈ N, entonces (Z/2n Z)? ∼
= Z2 × Z2n−2 .
Demostración: Solamente b) requiere de una demostración. Ası́, supone-
mos que n ≥ 3. Si a ∈ Z, escribimos a0 para la clase de a(mod 4); y a
para la clase de a(mod 2n ). Sea ψ : (Z/2n Z)? → (Z/4Z)? el morfismo dado
por ψ(a) = a0 . Claramente, ψ es suprayectivo, cuyo núcleo es el conjunto
K = {a | a ≡ 1(mod 4)} de orden 2n−2 . Resulta que K = h5i, porque
n−3 n−3
52 = (1 + 4)2 ≡ 1 + 4 · 2n−3 6≡ 1(mod 2n ).
La función ξ : (Z/2n Z)? → {±1} × K, dada por
ξ(a) = ((−1)(a−1)/2 , (−1)(a−1)/2 a)
resulta ser un morfismo de grupos, pues (−1)(a−1)/2 = 1 ⇔ a ≡ 1(mod 4),
mientras que (−1)(a−1)/2 = −1 ⇔ a ≡ −1(mod 4). El morfismo ξ es clara-
mente inyectivo; y por tanto, biyectivo.

Ejercicios
1. Demuestre que en todo anillo conmutativo R vale el Teorema del
Binomio para todos n ∈ N; a, b ∈ R:
Xn µ ¶ µ ¶
n n−i i n n!
(a + b)n = a b con = .
i=0
i i i!(n − i)!

2. Demuestre que en todo anillo conmutativo existen primos mı́nimos.


3. Sean A un anillo conmutativo y a ∈ A un elemento nilpotente. De-
muestre que 1 + a es invertible.
4. Sean a, b, p ideales de un anillo conmutativo con p primo y tales que
ab ⊆ p. Demuestre que a ⊆ p ó b ⊆ p.
5. Sea A un anillo conmutativo tal que para todo a ∈ A, exista un
entero n > 1 tal que an = a. Demuestre que todo ideal primo de A
es máximo.
6. Sean A un anillo conmutativo y p un ideal máximo entre los de forma
an(a) = {b ∈ A | ba = 0} para 0 =
6 a ∈ A. Demuestre que p es primo.
7. Exprese R[X]/(X 3 + X) como producto directo de campos.
8. a) Demuestre que hay un número infinito de primos en Z.
b) Sea n un entero positivo. Demuestre que hay n enteros consecutivos
tales que cada uno de ellos es divisible por el cuadrado de un entero
mayor que uno.
9. Demuestre que (Z/nZ)? es cı́clico si y sólo si n = 2, 4, pm , 2pm ; donde
p es un primo impar y m ≥ 1.
2.5 Localización 61

2.5 Localización
En esta sección seguimos tratando con anillos conmutativos.
Se dice que un anillo R es local cuando tiene un único ideal máximo m.
En esta situación, los elementos de R que no están en m son unidades.
Recı́procamente, si R es un anillo con un ideal I tal que R r I = R? ,
entonces R es local con ideal máximo I.
Se dice que S ⊂ R es un conjunto multiplicativo cuando se cumplen
las condiciones:
• 1 ∈ S.
• 0∈
/ S.
• a, b ∈ S ⇒ ab ∈ S.
El propósito principal de considerar un conjunto multiplicativo S es crear
un nuevo anillo de fracciones S −1 R a partir de R, donde S es el conjunto
de denominadores del nuevo anillo.
Dado un conjunto multiplicativo S de un anillo R, definimos al conjunto
S −1 R como {(a, s) | a ∈ R, s ∈ S} módulo una relación de equivalencia ∼
definida ası́:

(a, s) ∼ (a0 , s0 ) ⇔ existe s1 ∈ S tal que s1 (s0 a − sa0 ) = 0. (2.1)

La clase de equivalencia de (a, s) se escribe a/s.


El conjunto S −1 R adquiere estructura de anillo ante las operaciones
a a0 s0 a + sa0 a a0 aa0
+ 0 = 0
, 0
= 0. (2.2)
s s ss ss ss
No es difı́cil ver que estas operaciones están bien definidas y que cumplen
las condiciones para formar un anillo. A continuación verificamos que las
operaciones están bien definidas:
Si a0 /s0 = a00 /s00 , es porque existe s1 ∈ S tal que s1 (s00 a0 − s0 a00 ) = 0 y
entonces s1 (s00 saa0 − s0 saa00 ) = 0, por lo que
aa0 aa00
0
= 00 ;
ss ss
y la multiplicación está bien definida.
La suma también está bien definida, pues si a0 /s0 = a00 /s00 , y existe s1 ∈ S
tal que s1 (s00 a0 − s0 a00 ) = 0, entonces se tiene 0 = s1 (s00 ssa0 − s0 ssa00 ) =
s1 [ss00 (sa0 + s0 a) − ss0 (sa00 + s00 a)], lo que garantiza que
sa0 + s0 a sa00 + s00 a
= .
ss0 ss00
Un ejemplo muy importante de todo lo anterior se da cuando se tienen
un anillo conmutativo R y un ideal primo p, pues entonces S = R r p es
62 2. Anillos

un conjunto multiplicativo; en ese caso S −1 R se escribe Rp y se llama el


anillo localizado de R en p.
Si S es un conjunto multiplicativo de R, entonces ϕ : R → S −1 R dado por
ϕ(a) = a/1 para toda a ∈ R es un morfismo de anillos, llamado natural.
Este morfismo satisface ϕ(S) ⊆ (S −1 R)? .
Además, ker ϕ = {a ∈ R | existe s ∈ S tal que sa = 0}. De manera que
si R es un dominio, entonces ϕ es inyectivo.
Cuando R es un dominio y S = R r (0), entonces S −1 R es un campo,
llamado campo de fracciones de R. De esta manera, todo dominio puede
ser extendido a un campo. Más generalmente, si R es un anillo conmutativo
y S es el conjunto de los no divisores de cero de R, entonces S −1 R es el
anillo total de fracciones de R con ϕ : R → S −1 R inyectivo.
Ejemplo. Cuando R = Z y S = Z r (0), entonces S −1 R = Q y ϕ : Z → Q
es la inclusión usual.
Dados un anillo R, un ideal I y un subconjunto A de R, definimos el
transportador (I : A) = {r ∈ R | rA ⊆ I}, esto es un ideal de R que
contiene a I.
Si I es un ideal de R, S es un conjunto multiplicativo y ϕ : R → S −1 R
es el morfismo natural, entonces S −1 I denota al ideal de S −1 R generado
por ϕ(I).

Proposición 2.20 Si f : R → R0 es un morfismo de anillos y q es un


ideal primo de R0 , entonces p = f −1 (q) es un ideal primo de R.

Demostración: Todo es consecuencia de que el morfismo f induce un


morfismo inyectivo f : R/p ,→ R0 /q.
Observación. El resultado anterior es falso para ideales máximos, como
puede verse para el caso de (0) en la inclusión Z ⊆ Q.

Teorema 2.21 Sean S un conjunto multiplicativo del anillo conmutativo


R y ϕ : R → S −1 R el morfismo natural. Entonces:
a) Todo ideal b de S −1 R es de la forma S −1 a, donde a = ϕ−1 (b) es un
ideal de R.
b) Para todo ideal a de R, se tiene que
[
ϕ−1 (S −1 a) = (a : s).
s∈S

En particular, S −1 a = S −1 R ⇔ S ∩ a 6= ∅.
c) Los ideales primos S −1 p de S −1 R están en correspondencia biunı́voca
p ↔ S −1 p con los ideales primos p de R que son disjuntos de S.

Demostración: a) Sean b un ideal de S −1 R y a = ϕ−1 (b). Entonces es


claro que a es un ideal de R y que S −1 a ⊆ b. Recı́procamente, si x/s ∈ b,
entonces x/1 ∈ b y por tanto x ∈ a. Ası́, x/s ∈ S −1 a, por lo que b ⊆ S −1 a.
2.5 Localización 63

b) La segunda afirmación es consecuencia inmediata de la primera, que


es la que demostramos en seguida.
Si x ∈ ∪s∈S (a : s), es porque existen s ∈ S, a ∈ a tales que xs = a,
por lo que (a/s) = (x/1), de manera que x ∈ ϕ−1 (S −1 a). Recı́procamente,
suponiendo que x ∈ ϕ−1 (S −1 a), se tiene (x/1) = (a/s) con s ∈ S, a ∈ a,
por lo que existe t ∈ S tal que t(sx − a) = 0, de manera que (ts)x ∈ a; y
ası́ x ∈ ∪s∈S (a : s).
c) Ya sabemos, Proposición 2.20, que si q es un ideal primo de S −1 R,
entonces p = ϕ−1 (q) es un ideal primo de R. Acabamos de ver en el inciso
a), que q = S −1 p, por lo que p ∩ S = ∅, debido al inciso b).
Recı́procamente, sea p un ideal primo de R tal que p ∩ S = ∅. Entonces
ϕ−1 (S −1 p) = p, pues (p : s) = p para todo s ∈ S.
Si (a/s), (b/t) ∈ S −1 R son tales que (ab/st) ∈ S −1 p, es porque existen
elementos c ∈ p, s0 ∈ S con (ab/st) = (c/s0 ), de manera que existe t0 ∈ S
con t0 (s0 ab − stc) = 0, lo que implica que ab ∈ p. Finalmente, (a/s) ∈ S −1 p
ó bien (b/t) ∈ S −1 p. Ası́, S −1 p es primo.
Como aplicación inmediata de lo anterior, tenemos que si p es un ideal
primo de un anillo R, entonces Rp es un anillo local con ideal máximo pRp .
Los conjuntos multiplicativos también pueden ser utilizados para pro-
ducir ideales primos, como veremos a continuación.
Decimos que un ideal J de un anillo R es máximo respecto a exclusión
de un conjunto C ⊆ R cuando J es máximo entre los ideales I de R tales
que I ∩ C = ∅.
Proposición 2.22 Sea S un conjunto multiplicativo del anillo R. Entonces
todo ideal p máximo con respecto a exclusión de S es primo.
Demostración: El Lema de Zorn garantiza la existencia de tales ideales.
Si a, b ∈ R satisfacen a, b ∈ / p, entonces la maximalidad de p implica
que (p, a) ∩ S 6= ∅ y que (p, b) ∩ S 6= ∅, por lo que existen elementos
p, q ∈ p; s1 , s2 ∈ S; x, y ∈ R tales que s1 = p + xa y s2 = q + yb, de manera
que s1 s2 ∈ (p, ab), y por tanto ab ∈ / p.
Corolario 2.23 En todo anillo conmutativo, el conjunto de los divisores
de cero es una unión de ideales primos.
Demostración: Sean C el conjunto de los divisores de cero y S = R r C
el conjunto de los no divisores de cero.
Entonces S es un conjunto multiplicativo y ∪p ⊆ C, al tomar la unión
de los ideales máximos respecto a exclusión de S, que son primos.
Si a ∈ C, entonces el ideal (a) contiene solamente a cero y a divisores de
cero y está contenido en algún ideal p de la unión, por el Lema de Zorn,
por lo que C ⊆ ∪p.

Ejercicios
1. Describa los subanillos de Q.
64 2. Anillos

2. Sea R un anillo conmutativo con un único ideal primo p.


a) Demuestre que todo divisor de cero de R es nilpotente.
b) Demuestre que la caracterı́stica de R es cero o bien una potencia
de un primo.
3. Demuestre que toda imagen homomorfa de un anillo local es un anillo
local.
4. Lema de Nakayama. Sean R un anillo local con ideal máximo m
y sea a = (a1 , ..., an ) un ideal tal que ma = a. Entonces a = 0.
Demuestre este resultado completando los siguientes pasos:
a) Proceda por inducción en el mı́nimo número n de generadores
a1 , ..., an de a.
b) Escriba an = c1 a1 + · · · + cn an , con c1 , ..., cn ∈ m.
c) Concluya que an es redundante.

2.6 Anillos Euclideanos, Principales y de


Factorización Única
Se dice que un dominio R es un anillo euclideano cuando existe una
función δ : R r {0} → N que satisface las siguientes condiciones:
1. a | b ⇒ δ(a) ≤ δ(b).
2. Dados a, b ∈ R r {0}, existen q, r ∈ R tales que a = bq + r con r = 0
ó bien δ(r) < δ(b).
Un dominio R se llama principal cuando todos sus ideales I son prin-
cipales, es decir, de la forma I = (a) para algún a ∈ R.
Teorema 2.24 Todo anillo euclideano es principal.
Demostración: Sean I 6= (0) un ideal y 0 6= a ∈ I tal que δ(a) =
min{δ(b) | b ∈ I}. Se afirma que I = (a). Para c ∈ I arbitrario, exis-
ten q, r ∈ R tales que c = aq + r, donde r = 0 ó bien δ(r) < δ(a). Como
r = c − aq ∈ I, se tiene que r = 0; y ası́ c ∈ (a). Ası́, I = (a).

Observación. Si b no es una unidad en el anillo euclideano D, entonces


para toda a ∈ D, se tiene que δ(a) < δ(ab), pues δ(a) = δ(ab) ⇒ (a) = (ab)
por un argumento similar al de esta última demostración.
Dos elementos a, b de un anillo conmutativo son asociados cuando existe
una unidad u tal que a = ub. En un dominio, un elemento p es irreducible
cuando no es unidad; pero p = ab implica que a es unidad ó b es unidad.
En un dominio, d es un máximo común divisor de r y s cuando
2.6 Anillos Euclideanos, Principales y de Factorización Única 65

• d | r, d | s.

• (c | r, c | s) ⇒ c | d.

Es inmediato que si d y d0 son máximos comunes divisores de r y s,


entonces d y d0 son asociados, por lo que se tiene la igualdad de ideales
(d) = (d0 ). Convenimos que el máximo común divisor de r y s es cualquier
generador de este ideal; y esto lo escribimos ası́: (r, s) = d. Los elementos
r y s son primos relativos cuando (r, s) = 1.
Observación. En un anillo principal R, dos elementos dados a y b siempre
tienen un máximo común divisor: Existe d ∈ R tal que vale la igualdad de
ideales (d) = (a, b), de manera que claramente d | a, d | b; además existen
λ, µ ∈ R tales que d = λa + µb, por lo que (c | a, c | b) ⇒ c | d.

Lema 2.25 Sea R principal. Si p | ab y (p, a) = 1, entonces p | b.

Demostración: Como existen λ, µ ∈ R con 1 = λp + µa, se tiene que


b = λpb + µab. Ası́, p | b.
Un dominio D es de factorización única cuando todo elemento a ∈ D
que no es unidad, se puede escribir como a = p1 · · · pr , con todo pi irre-
ducible; y además si a = q1 · · · qs es otra expresión con todo qj irreducible,
entonces r = s y existen u1 , ..., ur unidades y una permutación σ ∈ Sr tales
que qi = ui pσ(i) para toda 1 ≤ i ≤ r. Aquı́, u1 · · · ur = 1.

Lema 2.26 Sea R un dominio principal. Si p es irreducible con p | ab,


entonces p | a ó p | b.

Demostración: Supongamos que p - a. Por el lema anterior, es suficiente


ver que (p, a) = 1; pero (p, a) es un divisor de p no asociado de p. Ası́, (p, a)
es una unidad.

Teorema 2.27 Todo dominio principal R es de factorización única.

Demostración: Veamos primero que toda no unidad de R r {0} admite


una factorización como producto de irreducibles.
Sea Σ el conjunto de ideales I = (a) 6= (0) de R tales que a no es un
producto de irreducibles. Supongamos que Σ 6= ∅. Si (a1 ) ⊆ (a2 ) ⊆ · · ·
es una cadena de ideales en Σ, entonces ∪(ai ) es un ideal; y existe b ∈ R
con ∪(ai ) = (b). También existe n ∈ N tal que b ∈ (an ), y por tanto,
∪(ai ) = (an ) = (an+1 ) = · · ·. Ası́, (an ) es una cota superior de la cadena.
Aplicando el Lema de Zorn, se obtiene un elemento (r) máximo de Σ.
En estas condiciones r no es irreducible y existen s, t ∈ R no unidades con
r = st. El ideal (r) está contenido propiamente en cada uno de los ideales
(s) y (t), que por ello, no están en Σ. Esto implica que s y t son productos
de irreducibles y entonces r también lo es. Esta contradicción demuestra la
existencia de factorizaciones.
66 2. Anillos

Para ver la unicidad, supongamos que p1 · · · pr = q1 · · · qs con todos pi , qj


irreducibles. Usando varias veces el lema anterior, se ve que p1 divide a qj
para alguna j. Digamos que p1 | q1 , para obtener q1 = u1 p1 , p2 · · · pr =
(u1 q2 ) · · · qs , donde u1 es una unidad. La demostración concluye por in-
ducción (en r ó en s).

Corolario 2.28 Todo anillo euclideano es un dominio de factorización


única.

Proposición 2.29 En un dominio principal R, un ideal (a) es máximo si


y sólo si el elemento a es irreducible.

Demostración: Si a es irreducible, y (a) ⊆ (b) 6= R, entonces a = bc con


c ∈ R. Por tanto, c es una unidad y (a) = (b).
Recı́procamente, si (a) es un ideal máximo, entonces (a) es primo. Si
a = bc, queremos ver que b ó c es unidad. Como (a) es primo, b ∈ (a) ó
bien c ∈ (a). En el primer caso, b = as y también a = a(sc), por lo que c
es unidad. El otro caso es análogo.

Ejemplos.

1. Z es un anillo euclideano con δ(n) = |n|, el valor absoluto de n.

2. El anillo de polinomios k[X] en una variable, con coeficientes en un


campo k, es un anillo euclideano con δ(f (X)) = grado de f .

3. El anillo de polinomios Q[X, Y ] es un dominio de factorización única,


como veremos en la siguiente sección; pero no es principal: El ideal
(X, Y ) no es principal, pues si existiera f ∈ Q[X, Y ] con (X, Y ) = (f ),
entonces tendrı́amos f |X, f |Y y ası́ f = ±1, que implica la absurda
igualdad (X, Y ) = Q[X, Y ].
√ √
4. Sea R = Z[ −5] = {a + b −5 ∈ C | a, b ∈ Z}. Claramente, R es un
dominio. Aquı́ mismo veremos que R no es de factorización única.

5. Los enteros Gaussianos Z[i] ⊆ C, donde i2 = −1, forman un anillo


euclideano con δ(a + bi) = a2 + b2 para a + bi ∈ Z[i] con a, b ∈ Z, lo
que veremos en esta misma sección.

6. El anillo R = {a + b(1 + −19)/2 | a, b ∈ Z} es principal sin ser
euclideano, como veremos aquı́ mismo.

Proposición 2.30 El anillo R del Ejemplo 4 no es de factorización única.


2.6 Anillos Euclideanos, Principales y de Factorización Única 67
√ √
Demostración: Para x = a + b −5 ∈ R, definimos x = a − b −5 y la
norma de x como N (x) = xx = a2 + 5b2 ∈ Z.
Es fácil ver que N (xy) = N (x)N (y) para todos x, y ∈ R.
Afirmamos que R? = {x ∈ R | N (x) = 1} = {±1}, las unidades de R.
Si N (x) = xx = 1, es claro que x−1 = x ∈ R; y entonces x ∈ R? .
Recı́procamente, si xz = 1, entonces N (x)N (z) = N (xz) = N (1) = 1.
Esto implica que N (x) = ±1; pero −1 no se puede escribir como a2 + 5b2
con a, b ∈ Z. Ası́, N (x) = 1.
Ahora bien, a2 + 5b2 = 1 ⇒ a = ±1, b = 0.
En R, el número 3 es irreducible, pues 3 = ab con a, b ∈ R implica que
9 = N (3) = N (a)N (b); y entonces N (a) = 1, 3 ó 9; pero también tenemos
que N (a) = 1 ⇒ a ∈ R? , mientras que N (a) = 9 ⇒ N (b) = 1 ⇒ b ∈ R? .
2 2
Por otra parte, 3 no se puede escribir como
√ c + 5d con c, d ∈ Z.
De manera similar puede verse que 2 + −5 es irreducible; y claramente
no es asociado de 3. √ √
La igualdad 9 = 32 = (2 + −5)(2 − −5) pone de manifiesto la falta
de unicidad de factorizaciones en R.
Observación. En todo anillo conmutativo es válida la identidad

(a2 + b2 )(c2 + d2 ) = (ac − bd)2 + (ad + bc)2 ;

que puede verificarse directamente. En el caso de los enteros, es natural


considerar a los enteros Gaussianos Z[i]:
Escribiendo α = a + bi con a, b ∈ Z; tenemos la conjugación compleja
α = a − bi, de manera que δ(α) = αα = a2 + b2 ; y si β = c + di con c, d ∈ Z,
entonces δ(β) = c2 + d2 . Resulta que αβ = (ac − bd) + (ad + bc)i; mientras
que nuestra identidad dice que δ(αβ) = δ(α)δ(β).

Lema 2.31 Z[i]? = {±1, ±i}.

Demostración: Como (a + bi)−1 = (a2 + b2 )−1 (a − bi) ∈ C, el elemento


a + bi ∈ Z[i] es unidad si y sólo si δ(a + bi) = a2 + b2 = 1; y esto ocurre si
y sólo si a + bi ∈ {±1, ±i}.
Un anillo relacionado con los enteros Gaussianos y que usaremos, es
Q[i] = {a + bi ∈ C | a, b ∈ Q}, el cual es un campo, pues si x = a + bi 6= 0,
entonces x−1 = (a2 + b2 )−1 (a − bi) ∈ Q[i].

Teorema 2.32 Z[i] es un anillo euclideano con δ(a + bi) = a2 + b2 .

Demostración: Dados α, β ∈ Z[i] con β 6= 0, se tiene que αβ −1 = m + ni


con m, n ∈ Q.
Tenemos que existen u, v ∈ Z tales que

1 1
|m − u| ≤ , |n − v| ≤ .
2 2
68 2. Anillos

Sean c = m − u y d = n − v. Si escribimos q = u + vi y r = β(c + di),


tendremos que α = βq + r, de manera que r = α − βq ∈ Z[i]. Por otro lado,

1 1 1
δ(r) = δ(β)δ(c + di) ≤ δ(β)( + ) = δ(β).
4 4 2
Ası́, δ(r) < δ(β).

Lema 2.33 Sea p un número primo tal que existan enteros x, y, z satis-
faciendo x2 + y 2 = zp y también (z, p) = 1. Entonces existen enteros a, b
tales que a2 + b2 = p.

Demostración: Primero afirmamos que p no es irreducible en Z[i]: Si


suponemos p primo en Z[i], se tiene que p | (x2 + y 2 ) = (x + yi)(x − yi), lo
cual implica que p | (x + yi) ó bien que p | (x − yi); por lo que en todo caso
p divide a ambos. Entonces p2 | (x2 + y 2 ) = zp, que es una contradicción.
Ası́, p = (a + bi)(c + di) con a, b, c, d ∈ Z, a2 + b2 6= 1 y c2 + d2 6= 1.
Entonces p2 = δ(p) = (a2 + b2 )(c2 + d2 ), por lo que p = a2 + b2 .

Lema 2.34 Sea p un número primo tal que p ≡ 1 (mod 4). Entonces existe
un entero a tal que a2 ≡ −1 (mod p).

Demostración: Sea
p−1 p−1
a = 1 · 2 · 3··· = (−1) · (−2) · (−3) · · · (− ), entonces
2 2

p−1 p−1
a2 = 1·2·3 · · · ·(− ) · · · (−3)·(−2)·(−1) ≡ (p−1)! ≡ −1 (mod p).
2 2
Esta última congruencia es el Teorema de Wilson.

Teorema 2.35 Sea p un número primo.


a) Si p ≡ 1 (mod 4), entonces existen enteros a, b tales que p = a2 + b2 .
b) Si p ≡ 3 (mod 4), no existen enteros a, b con p = a2 + b2 .

Demostración: a) Por el Lema 2.34, existen a, z tales que a2 +1 = zp; pero


si suponemos que |a| < (p/2), tendremos (z, p) = 1, pues (p2 /4) + 1 < p2 .
La conclusión se obtiene aplicando el Lema 2.33.
b) Para todo entero n, se tiene que (2n)2 ≡ 0 (mod 4); mientras que
(2n + 1)2 ≡ 1 (mod 4). De manera que si a, b ∈ Z, es claro que se tiene
a2 + b2 ≡ 0, 1, 2 (mod 4). Ası́, p 6= a2 + b2 .

Si a es un entero y p es un número primo, decimos que a es un residuo


cuadrático (mod p) cuando la congruencia x2 ≡ a(mod p) tiene solución.
En caso contrario, a es un residuo no cuadrático.
2.6 Anillos Euclideanos, Principales y de Factorización Única 69

Definimos el sı́mbolo de Legendre como sigue:


µ ¶ ½
a 1, cuando a es un residuo cuadrático,
=
p −1, cuando a es un residuo no cuadrático.
¡ ¢
Lo anterior para p - a; mientras que ap = 0, si p | a.

Teorema 2.36 (Criterio de Euler) Sean a, b ∈ Z y p 6= 2 un número


primo. Entonces
µ ¶ µ ¶µ ¶ µ ¶
ab a b a
= y ≡ a(p−1)/2 (mod p).
p p p p
Demostración: (Z/pZ)? es cı́clico por el Teorema 2.15. Supongamos que
el entero r representa a un generador de este grupo. Entonces existe un
entero t tal que a ≡ rt (mod p); y a es un residuo cuadrático si y sólo si t
es par. De aquı́ se obtiene la igualdad
µ ¶ µ ¶µ ¶
ab a b
= .
p p p
Por otro lado, (Z/pZ)? tiene un único subgrupo de orden 2 y por tanto un
único elemento de orden 2, que es −1; de manera que tenemos la igualdad
r(p−1)/2 ≡ −1 (mod p). ¡ ¢
Como r es un residuo no cuadrático, se tiene pr ≡ −1 (mod p).
La otra identidad deseada se obtiene de los siguientes cálculos:
µ ¶ µ t¶
a r
≡ ≡ (−1)t ≡ (r(p−1)/2 )t ≡ (rt )(p−1)/2 ≡ a(p−1)/2 (mod p).
p p
Teorema 2.37 (Fermat) Un entero positivo n es la suma de dos cuadra-
dos enteros si y sólo si para todo primo p tal que p | n y que p ≡ 3 (mod 4),
el exponente de la máxima potencia de p que divida a n sea par.
Demostración: La implicación ⇐ es debida a 2 = 12 + 12 , a la identidad
(a2 + b2 )(c2 + d2 ) = (ac − bd)2 + (ad + bc)2 ; y al Teorema 2.35 a).
Recı́procamente, suponiendo que n = a2 + b2 con a, b ∈ Z; y que p es
un primo tal que p ≡ 3 (mod 4), n = p2k+1 m y p - m, exhibiremos una
contradicción.
Sean (a, b) = d, a = da1 y b = db1 , de manera que (a1 , b1 ) = 1. Escribi-
mos n = d2 n1 , para tener n1 = a21 + b21 con p | n1 sin que p divida a los
dos números a1 , b1 . Si es el caso de que p - a1 , entonces existe c tal que
a1 c ≡ b1 (mod p) y se tiene n1 = a21 (1 + c2 ) ≡ 0 (mod p). Esto implica la
contradicción c2 ≡ −1 (mod p). El caso p - b1 es similar.
Proposición 2.38 a) Todo factor primo de un entero de la forma 4m2 + 1
es de la forma 4n + 1.
b) El número de primos p con p ≡ 1 (mod 4) es infinito.
70 2. Anillos

¡Demostración:
¢ a) 2 - (4m2 +1). Si p ≡ 3 (mod 4) y p | (4m2 +1), entonces
−1
p = 1, que es falso.
b) Supongamos que {p1 , ..., pn } es la lista completa de los primos pi tales
que pi ≡ 1 (mod 4), entonces pi - (4p21 · · · p2n + 1) para 1 ≤ i ≤ n, por lo que
el inciso anterior garantiza la existencia de otro primo q ≡ 1 (mod 4) tal
que q | (4p21 · · · p2n + 1). Esta contradicción concluye la demostración.

Definiciones. (Motzkin) En un dominio D, definimos:


a) Un subconjunto P es un ideal producto cuando P (D r {0}) ⊆ P .
b) Dado un subconjunto S de D, definimos su conjunto derivado total
como B = {b ∈ D | existe a ∈ D con a + bD ⊆ S}.
c) Dado un subconjunto S de D, su conjunto derivado es S 0 = B ∩ S.

Observaciones. Las siguientes afirmaciones son claras:


a) Si S es un ideal producto, entonces S 0 también lo es.
b) (S1 ⊆ S) ⇒ (S10 ⊆ S 0 ).

Teorema 2.39 (Motzkin) a) Si (D, δ) es un anillo euclideano y Pi =


{a ∈ D | δ(a) ≥ i} para i ∈ N, entonces cada Pi es un ideal producto,
∩Pi = ∅; y se satisfacen las relaciones Pi0 ⊆ Pi+1 para todo i ∈ N.
b) Recı́procamente, dados un dominio D y una sucesión

D r {0} = P0 ⊇ P1 ⊇ · · · (2.3)

de ideales producto con intersección vacı́a tales que Pi0 ⊆ Pi+1 para todo
i ∈ N, entonces la función δ dada por δ(b) = i si b ∈ (Pi rPi+1 ) transforma
a D en un anillo euclideano.

Demostración: a) Si D es euclideano, claramente todo Pi es un ideal


producto y ∩Pi = ∅.
Sea b ∈ Pi0 . Esto es debido a que existe a ∈ D tal que para todo q ∈ D
se tiene que (a − bq) ∈ Pi , es decir, δ(a − bq) ≥ i. Como D es euclideano,
esto implica que δ(b) ≥ i + 1. Ası́, Pi0 ⊆ Pi+1 .
b) Esto es claro.

Corolario 2.40 Dado un dominio D, hay una equivalencia entre algorit-


mos euclideanos en D y sucesiones (2.3) de ideales producto Pi con inter-
sección vacı́a tales que Pi0 ⊆ Pi+1 para todo i ∈ N.

Si para un dominio D, tenemos dos algoritmos euclideanos dados por


sucesiones Pi y P i tales que Pi ⊆ P i para todo i, decimos que el algoritmo
correspondiente a Pi es más rápido.

Corolario 2.41 Dado un anillo euclideano D, siempre existe un algoritmo


más rápido, que corresponde a la sucesión D r {0} = P0 ⊇ P00 ⊇ P000 ⊇ · · ·.
2.6 Anillos Euclideanos, Principales y de Factorización Única 71

Corolario 2.42 Un dominio D admite un algoritmo euclideano si y sólo


si la sucesión D r {0} = P0 ⊇ P00 ⊇ P000 ⊇ · · · tiene intersección vacı́a.
Por el resto de la sección adoptamos la notación P0 = D r {0}.

Proposición 2.43 Sea D = {a + b(1 + −19)/2 | a, b ∈ Z}.
a) D? = {±1}.
b) P00 = P0 r D? .
c) P000 = P00 .
d) D no es un anillo euclideano.

Demostración: a) Usando la norma N de Q[ −19] se ve que
b √
N (a + (1 + −19)) = a2 + ab + 5b2 = 1 ⇒ a = ±1, b = 0.
2
b) Si u ∈ D? con uv = 1 y b ∈ D, entonces b + u(−vb) = 0; que no está
en P0 , por lo que u ∈ / P00 .
?
Si b ∈
/ D , escribimos a = 1 para tener a + bx 6= 0 para todo x ∈ D; lo
cual demuestra que si b ∈ / D? , entonces b ∈ P00 .
c) A partir de la definición de “conjunto derivado total”, vemos que al
pasar de P00 a P000 , solamente se excluyen aquellos elementos b ∈ P00 tales
que para todo a ∈ D se tenga que b | a ó bien b | (a + u) con u ∈ D? ; pero
no hay tales elementos:√
Tomamos a = 2, (1+ −19)/2 y buscamos√ b que√divida simultáneamente
a uno de {1, 2, 3} y a uno de {(±1+ −19)/2, (3+ −19)/2}; pero entonces
N (b) tiene que dividir a uno de {1, 4, 9} y también a uno de {5, 7}, que son
los conjuntos de las normas permitidas. Esto implica que N (b) = 1, es
decir, que b es una unidad, fuera de P00 .
d) Acabamos de ver que la cadena D r {0} = P0 ⊇ P00 ⊇ P000 ⊇ · · ·, se
detiene en P000 6= ∅. La conclusión se obtiene del Corolario 2.42.
Un anillo euclideano generalizado es un dominio R provisto de una
función δ : R r {0} → N que satisface la siguiente condición:
Dados a, b ∈ Rr{0}, tales que b - a, existen c, d ∈ R con δ(ca−db) < δ(b)
y ca − db 6= 0.
Proposición 2.44 Sea R un anillo euclideano generalizado, entonces R
es principal.
Demostración: Sean I 6= (0) un ideal de R y a ∈ I un elemento con δ(a)
mı́nimo. Veamos que I = (a):
Si b ∈ I, entonces a | b ó bien existen c, d ∈ R tales que δ(ca − db) < δ(a);
esto último es imposible porque ca − db ∈ I. Ası́, a | b.
Si en un anillo euclideano generalizado R se cumple δ(ab) = δ(a)δ(b) para
todos a, b ∈ R r {0}, entonces podemos extender δ al campo de fracciones
Q de R; y la condición que define a los anillos euclideanos generalizados
puede ser reemplazada por la siguiente:
Para todo e ∈ Q r R, existen c, d ∈ R tales que ce − d 6= 0, δ(ce − d) < 1.
72 2. Anillos

Observación. Si D = {a + b(1 + −19)/2 | a, b ∈ Z}, entonces
√ √
Q = Q[ −19] ( = {a + b −19 | a, b ∈ Q} ).

Esto es porque claramente se tiene la inclusión ⊇; y porque Q[ −19] es
un campo:
√ 1 √
a2 + b2 6= 0 ⇒ (a + b −19)−1 = (a − b −19).
a2 + 19b2


Proposición 2.45 D = {a + b(1 + −19)/2 | a, b ∈ Z} es un anillo
euclideano generalizado.

Demostración: Dado e ∈ Q r R, escribimos e = (a + b −19)/f con
a, b, f ∈ Z y (a, b, f ) = 1. Supongamos que f ≥ 5.
Existen enteros x, y, z, q, r tales que xa + yb + zf = 1, ay − 19bx =
f q + r, |r| ≤ f /2. √ √
Escribimos c = y + x −19, d = q − z −19, para tener
√ √ √
(y + x −19)(a + b −19) √ r + −19
ce − d = − (q − z −19) = .
f f
Este número tiene norma 0 6= (r2 + 19)/f 2 < 1, porque |r| ≤ f /2 y f ≥ 5.
Dejamos como ejercicio verificar los casos f = 2, 3, 4.

Corolario 2.46 D = {a + b(1 + −19)/2 | a, b ∈ Z} es un dominio prin-
cipal que no admite estructura de anillo euclideano.
Demostración: Esto es debido a las Proposiciones 2.43, 2.44 y 2.45.

Ejercicios
1. Sea m > 1 un entero. Demuestre que todo entero positivo n se puede
expresar de manera única como n = cs ms + · · · + c1 m + c0 , donde
0 ≤ ci < m para toda 0 ≤ i ≤ s y cs > 0.
2. Determine los elementos irreducibles de Z[i].
3. Demuestre que existe un número infinito de primos p ∈ Z tales que
p ≡ 3 (mod 4).
4. Sea R un dominio principal. Demuestre que todo ideal primo de R
distinto de (0) es máximo.
5. Sean R un dominio principal y a 6= (0) un ideal. Demuestre que R/a
tiene un número finito de ideales.
6. Sean a y b enteros positivos tales que a2 = b4 + b3 + b2 + b + 1.
Demuestre que b = 3.
7. Verifique los casos f = 2, 3, 4 de la Proposición 2.45.
2.7 Polinomios 73

2.7 Polinomios
Sean A un anillo conmutativo y T un sı́mbolo nuevo, el anillo de poli-
nomios en una variable T , escrito A[T ], consiste de todas las expresiones
de la forma a0 + a1 T + · · · + an T n , donde n ∈ N, ai ∈ A para todo i.
Cuando an 6= 0, se dice que el polinomio es de grado n.
Las operaciones que le dan estructura de anillo conmutativo a A[T ] son:

(a0 + · · · + an T n ) + (b0 + · · · + bn T n ) = (a0 + b0 ) + · · · + (an + bn )T n .


X
(a0 +· · ·+an T n )(b0 +· · ·+bm T m ) = c0 +· · ·+cn+m T n+m con cr = ai bj
i+j=r

Una consecuencia inmediata de la definición de multiplicación de poli-


nomios es que si A es un dominio, entonces A[T ] también lo es:

an , bm 6= 0 ⇒ cn+m = an bm 6= 0 ⇒ (a0 + · · · + an T n )(b0 + · · · + bm T m ) 6= 0.

Si g(T ) = bn T n + · · · + b0 con bn 6= 0, se dice que bn es el coeficiente


lı́der de g(T ). Si bn = 1, se dice que g(T ) es mónico.
Dados f (T ) = an T n + · · · + a0 y g(T ) = bm T m + · · · + b0 con g(T )
mónico; si m ≤ n, entonces f − an T n−m g es un polinomio de grado menor
al de f . Este proceso puede continuar hasta obtener polinomios q, r tales
que f − qg = r, donde r = 0 ó bien (grado r) < (grado g). Este es el
algoritmo euclideano.
Cuando k es un campo, el anillo k[T ] es euclideano con función δ = grado,
pues bm 6= 0 ⇒ bm es unidad, por lo que el primer paso del algoritmo es
f − b−1m an T
n−m
g; y los pasos sucesivos también son posibles. Ası́, k[T ] es
un dominio principal y de factorización única.
Definimos inductivamente A[X1 , ...., Xn ] = A[X1 , ...., Xn−1 ][Xn ].
El grado del monomio X1m1 · · · Xnmn es m1 + · · · + mn . El grado de
un polinomio f ∈ A[X1 , ...., Xn ] es el máximo grado de sus monomios.
Un polinomio es homogéneo cuando todos sus monomios son del mismo
grado.
Si A[X1 , ...., Xn ]d es el conjunto de los polinomios homogéneos de grado
d junto con cero, entonces
M
A[X1 , ...., Xn ] = A[X1 , ...., Xn ]d
d≥0

es una suma directa de grupos abelianos aditivos.


Inductivamente, es claro que si A es un dominio, entonces A[X1 , ...., Xn ]
también lo es; y que gr(f g) = gr(f ) + gr(g) para f, g ∈ A[X1 , ...., Xn ].
De ahı́ se desprende que A[X1 , ...., Xn ]? = A? . De manera que f y g son
asociados si y sólo si existe u ∈ A? tal que g = uf .
Cada f ∈ A[X1 , ...., Xn ] da origen a una función f : An → A dada por
(a1 , ..., an ) 7→ f (a1 , ..., an ), resultado de substituir ai en lugar de Xi .
74 2. Anillos

Lema 2.47 Sean k un campo, a ∈ k y f (X) ∈ k[X]. Entonces

(X − a) | f (X) ⇔ f (a) = 0.

Demostración: Por el algoritmo euclideano, existen q(X), r(X) ∈ k[X]


tales que f (X) − (X − a)q(X) = r(X), donde r(X) es cero o de grado cero.
Como f (a) = r(a) = r(X), se tiene la conclusión.
Decimos que a ∈ k es raı́z de f (X) de multiplicidad m cuando

(X − a)m | f (X), (X − a)m+1 - f (X).

Observación. Como k[X] es de factorización única, es claro que f (X) de


grado n tiene cuando más n raı́ces, aún contando multiplicidades.

Teorema 2.48 (Fórmula de Interpolación de Lagrange) Si a1 , ..., an


son n elementos distintos de un campo k mientras que b1 , ..., bn ∈ k son ar-
bitrarios, entonces existe exactamente un polinomio f (X) ∈ k[X] de grado
no mayor que n − 1 tal que f (ai ) = bi para 1 ≤ i ≤ n.

Demostración: El polinomio
n Q
X i6=j (X − ai )
f (X) = bj Q
j=1 i6=j (aj − ai )

satisface los requisitos pedidos. Si g(X) es otro polinomio que también los
satisface, entonces f (X) − g(X) es un polinomio de grado no mayor que
n − 1 con n raı́ces. Por tanto, f (X) = g(X).
Sea f (X) = an X n + · · · + a1 X + a0 ∈ A[X], donde A es un dominio de
factorización única. Definimos el contenido de f (X) como

c(f ) = m.c.d.{a0 , a1 , ..., an }.

Claramente, c(f ) ∈ A/A? ; pero normalmente elegimos un representante en


A. Decimos que f (X) es primitivo cuando c(f ) = 1.

Lema 2.49 (Gauss) Sea A un dominio de factorización única. Dos poli-


nomios f (X) y g(X) son primitivos ⇔ f (X)g(X) es primitivo.
n m
Demostración: Si f (X)P = ain X + · · · +
Pa0 y g(X) = bm X + · · · + b0 ,
se tiene f (X)g(X) = i ci X con cr = i+j=r ai bj , de donde se ve que
tanto c(f ) como c(g) dividen a c(f g).
Recı́procamente, si f (X)g(X) no es primitivo, entonces existe un ele-
mento irreducible p ∈ A que divide a todos los coeficientes de f (X)g(X).
En el dominio (A/(p))[X] se tiene f g = f g = 0. Esto implica que f = 0
o que g = 0. Ası́, p divide a todos los coeficientes de f (X) o a todos los
coeficientes de g(X).
2.7 Polinomios 75

Lema 2.50 Sean A un dominio de factorización única, k su campo de


fracciones y 0 6= f (X) ∈ k[X]. Entonces podemos escribir f (X) = cg(X)
con c ∈ k y g(X) ∈ A[X] primitivo. Además, si f (X) = c0 h(X) con c0 ∈ k y
h(X) ∈ A[X] primitivo, entonces existen unidades u, v ∈ A? satisfaciendo
c = uc0 , g(X) = vh(X) y uv = 1.
Demostración: Supongamos que f (X) = en X n + · · · + e1 X + e0 . Como
todo ei ∈ k, existen ai , bi ∈ A para 0 ≤ i ≤ n tales que bi 6= 0 y ei = ai /bi .
Sea b = b0 · · · bn , entonces bf (X) ∈ A[X] y existe a ∈ A tal que bf (X) =
ag(X) con g(X) ∈ A[X] primitivo; de manera que f (X) = cg(X) con
c = a/b ∈ k.
Si además, f (X) = c0 h(X) con c0 = a0 /b0 ∈ k y h(X) ∈ A[X] primitivo,
entonces (a/b)g(X) = (a0 /b0 )h(X); y por tanto, b0 ag(X) = ba0 h(X); pero
entonces c(b0 ag(X)) = c(ba0 h(X)). Esto significa que existe u ∈ A? tal que
b0 a = uba0 , es decir, c = uc0 .
La igualdad (a/b)g(X) = (a0 /b0 )h(X) implica que también existe v ∈ A?
tal que g(X) = vh(X) y uv = 1.
Observación. En las condiciones del lema, si f (X), g(X) ∈ A[X] son
primitivos y existe 0 6= a ∈ k tal que f (X) = ag(X), entonces la unicidad
demostrada implica que a ∈ A? .
Proposición 2.51 Sea A un dominio de factorización única con campo
de fracciones k y sea p(X) ∈ A[X] primitivo. Entonces p(X) se factoriza
de manera única como producto de elementos irreducibles de A[X], cuyos
grados son los mismos que los provenientes de una factorización en k[X].
Demostración: Sea k el campo de fracciones de A. Entonces podemos
escribir p(X) = f1 (X) · · · fr (X) con cada fi (X) irreducible en k[X].
El lema afirma que para cada i existen ai , bi ∈ A; pi (X) ∈ A[X] tales
que ai bi 6= 0, con pi (X) primitivo y con
ai
fi (X) = pi (X).
bi
Claramente, cada pi (X) es irreducible en A[X].
De la igualdad
a1 · · · ar
p(X) = f1 (X) · · · fr (X) = p1 (X) · · · pr (X),
b1 · · · br
obtenemos b1 · · · br p(X) = a1 · · · ar p1 (X) · · · pr (X). Por el Lema de Gauss
se concluye que a1 · · · ar = c(a1 · · · ar p1 · · · pr ) y b1 · · · br = c(b1 · · · br p) son
asociados; y de ahı́ que

p(X) = p1 (X) · · · pr (X),

tal vez modificando un factor pi (X) multiplicativamente con una unidad


de A, lo que demuestra la existencia de la factorización enunciada.
76 2. Anillos

Para ver la unicidad, supongamos que p(X) = h1 (X) · · · hs (X) con cada
hj (X) irreducible en A[X], entonces el Lema de Gauss garantiza que todo
hj (X) es primitivo; y después el razonamiento que acabamos de ver demues-
tra que todo hj (X) es irreducible en k[X]. La unicidad de la factorización
en A[X] es consecuencia de la unicidad en k[X] y del Lema 2.50.
Corolario 2.52 Si A es un dominio de factorización única, k su campo
de fracciones y f (X) ∈ A[X] es primitivo e irreducible, entonces también
es irreducible en k[X].

Corolario 2.53 Si f (X) ∈ Z[X] es mónico y admite factores de grado


positivo en Q[X], entonces también los admite en Z[X].

Teorema 2.54 Si A es un dominio de factorización única, entonces A[X]


también lo es.

Demostración: Dado f (X) ∈ A[X], escribimos f (X) = cg(X) con c =


c(f ) ∈ A y g(X) ∈ A[X] primitivo. La existencia y unicidad de la factori-
zación de f (X) en A[X] se obtienen de las de c en A y g(X) en A[X].
Corolario 2.55 Sea A es un dominio de factorización única; entonces
A[X1 , ..., Xn ] también lo es. En particular, para todo campo k y todo n ∈ N,
se tiene que k[X1 , ..., Xn ] es un dominio de factorización única.
r
Lema 2.56
¡m¢Si f (X) = ar X + · · · + a1 X + a0 ∈ Z[X] y m, n ∈ Z son tales
que (X − n ) | f (X) en Q[X] con (m, n) = 1, entonces m | a0 y n | ar .
¡ ¢
Demostración: Multiplicamos la igualdad f m r
n = 0 por n para tener

ar mr + ar−1 mr−1 n + · · · + a1 mnr−1 + a0 nr = 0,

de donde se obtiene la conclusión.


Usando el resultado anterior, se ve que los polinomios X 2 − 2, 2
√ X √− 3
3
y X − 2 son irreducibles en Z[X] y en Q[X]. Esto implica que 2, 3 y

3
2 son irracionales.

Teorema 2.57 (Criterio de Irreducibilidad de Eisenstein) Dado un


polinomio f (X) = an X n + · · · + a1 X + a0 ∈ Z[X] tal que existe un número
primo p que satisface

• p | a0 , p | a1 , ..., p | an−1 ,

• p - an ,

• p2 - a0 ,

se tiene que f (X) es irreducible en Q[X].


2.7 Polinomios 77

Demostración: Dividiendo entre c(f ), se ve que es suficiente considerar


el caso en que f (X) es primitivo, lo que desde ahora suponemos.
Supongamos que f (X) = g(X)h(X) con factores g(X), h(X) ∈ Z[X] no
constantes. Si obtenemos una contradicción, habremos terminado en vista
del Corolario 2.53.
Sea ϕ : Z[X] → (Z/pZ)[X] el morfismo natural, resultado de considerar
los coeficientes de los polinomios (mod p). Aplicándolo a f (X) tenemos que
ϕ(f (X)) = f (X) = an X n = g(X)h(X).
Como (Z/pZ)[X] es de factorización única, se ve que g(X) = bm X m y
que h(X) = cs X s , con m + s = n y con bm , cs ∈ Z.
Si alguno de los números m ó s es cero, ya terminamos; si no, p divide
a los términos constantes de g y h; pero entonces p2 | a0 , que es una
contradicción.
Corolario 2.58 Si p es un número primo, entonces X p−1 + · · · + X + 1
es irreducible en Q[X].
Demostración: Con la substitución X = Y + 1 se tiene que

Xp − 1 (Y + 1)p − 1
X p−1 + · · · + X + 1 = =
X −1 Y
µ ¶ µ ¶
p p
= Y p−1 + Y p−2 + · · · +
1 p−1
¡p¢
es irreducible
¡ p ¢ por el teorema, ya que p | i para 1 ≤ i ≤ p − 1, mientras
2
que p - p−1 = p.
Ejemplo. El polinomio f (X) = X 4 + 8X 3 + X 2 + 2X + 5 es irreducible
en Q[X].

1. Como f (X) es primitivo, es suficiente demostrar su irreducibilidad


en Z[X].

2. f ≡ X 4 + X 2 + 1(mod 2), que no tiene raı́ces en Z/2Z; y por tanto


no admite factores lineales en (Z/2Z)[X].

3. f ≡ X(X 3 + 3X 2 + X + 2)(mod 5). El polinomio X 3 + 3X 2 + X + 2


es irreducible en (Z/5Z)[X] al no tener raı́ces en Z/5Z.

4. De la incompatibilidad de las factorizaciones anteriores se obtiene la


irreducibilidad de f (X) en Z[X].

Si A es un anillo conmutativo y A[X] es un anillo de polinomios en una


variable, entonces existe una única función A-lineal D : A[X] → A[X] tal
que D(X n ) = nX n−1 para todo n ∈ N. Decimos que D(f ) = f 0 es la
derivada de f .
Como se verifica inmediatamente que (X r X s )0 = (r + s)X r+s−1 =
(X r )0 X s + X r (X s )0 , tenemos que (f g)0 = f 0 g + f g 0 para todos f, g ∈ A[X].
78 2. Anillos

Proposición 2.59 Sean k un campo, f (X) ∈ k[X], a ∈ k. Entonces a es


raı́z múltiple de f (X) si y sólo si f (a) = f 0 (a) = 0.

Demostración: Si f (X) = (X − a)2 g(X), entonces

f 0 (X) = (X − a)2 g 0 (X) + 2(X − a)g(X),

por lo que f 0 (a) = 0.


Recı́procamente, si f (X) = (X − a)g(X) con g(a) 6= 0, entonces f 0 (X) =
(X − a)g 0 (X) + g(X), por lo que f 0 (a) = g(a) 6= 0.

Ejercicios
1. Sea D un dominio tal que D[X] es principal. Demuestre que D es un
campo.

2. Encuentre el número de monomios en n variables de grado d.

3. Sean R un anillo conmutativo y f (X) ∈ R[X] un divisor de cero.


Demuestre que existe 0 6= a ∈ R tal que af (X) = 0.

4. Demuestre que X 4 + 1, X 5 − X 2 + 1 son irreducibles en Q[X].

5. Sean R un anillo conmutativo y f (X) = an X n +· · ·+a1 X+a0 ∈ R[X].


Demuestre que f (X) ∈ R[X]? ⇔ (a0 ∈ R? y ai es nilpotente para
1 ≤ i ≤ n).

6. Sean k un campo y A el subanillo de k[X] de los polinomios de la


forma a0 + a2 X 2 + · · · + an X n , es decir, sin término lineal. Exhiba
un ideal no principal de A y demuestre que A no es de factorización
única.

7. Sea f (X) = a2n+1 X 2n+1 + · · · + a1 X + a0 ∈ Z[X] primitivo tal que


existe un número primo p con

• p3 - a0 ,
• p2 | a0 , p2 | a1 , ..., p2 | an ,
• p | an+1 , ..., p | a2n ,
• p - a2n+1 ,

Demuestre que f (X) es irreducible.

8. Sean Fp el campo de los enteros módulo p y f : Fp → Fp una función.


Demuestre que f es polinomial.

9. Demuestre que para 0 6= p(X1 , ..., Xn ) ∈ k[X1 , ..., Xn ], con k un


campo infinito, siempre existen a1 , ..., an ∈ k con p(a1 , ..., an ) 6= 0.
2.8 Polinomios Simétricos, Resultante y Discriminante 79

2.8 Polinomios Simétricos, Resultante y


Discriminante
Sea R un anillo conmutativo. Escribimos AutR (R[X1 , ..., Xn ]) para repre-
sentar al grupo de automorfismos σ del anillo de polinomios R[X1 , ..., Xn ]
tales que σ(a) = a para todo a ∈ R.
Sea Sn el grupo simétrico. Este grupo actúa de manera natural en el
anillo R[X1 , ..., Xn ], es decir, existe un morfismo de grupos
ψ : Sn → AutR (R[X1 , ..., Xn ])
tal que ψ(α)(Xi ) = Xα(i) para todos 1 ≤ i ≤ n, α ∈ Sn . Por brevedad,
escribiremos α en lugar de ψ(α).
Consistentemente con la notación usada en Teorı́a de Grupos, escribi-
mos R[X1 , ..., Xn ]Sn = {f ∈ R[X1 , ..., Xn ] | α(f ) = f, ∀ α ∈ Sn }. Este
es un subanillo de R[X1 , ..., Xn ], cuyos elementos se llaman polinomios
simétricos.
Los polinomios simétricos elementales son los siguientes:
X X
σ1 = X i , σ2 = Xi Xj , ..., σn = X1 · · · Xn .
i i<j

Observemos que cada σi es homogéneo de grado i.


Sean A un subanillo de B y {b1 , ..., bn } ⊆ B. Entonces:
• Al anillo generado por A ∪ {b1 , ..., bn } lo escribimos A[b1 , ..., bn ].
• El conjunto {b1 , ..., bn } es algebraicamente independiente sobre
A cuando no existe 0 6= f ∈ A[X1 , ..., Xn ] tal que f (b1 , ..., bn ) = 0.
• Existe un morfismo de anillos θ : A[X1 , ..., Xn ] → A[b1 , ..., bn ] tal que
θ(a) = a para todo a ∈ A y θ(Xi ) = bi para todo 1 ≤ i ≤ n. Decir que
{b1 , ..., bn } es algebraicamente independiente sobre A es equivalente
a decir que ker θ = (0).
Teorema 2.60 Sean A un anillo conmutativo y σ1 , ..., σn ∈ A[X1 , ..., Xn ]
los polinomios simétricos elementales. Entonces:
a) A[σ1 , ..., σn ] = A[X1 , ..., Xn ]Sn , es decir, todo polinomio simétrico se
puede expresar como un polinomio en los polinomios simétricos elemen-
tales.
b) {σ1 , ..., σn } es algebraicamente independiente sobre A, es decir, toda
expresión en a) es única.
Demostración: La inclusión A[σ1 , ..., σn ] ⊆ A[X1 , ..., Xn ]Sn es clara. Para
ver la recı́proca procedemos como sigue.
Ordenamos los monomios de A[X1 , ..., Xn ] lexicográficamente, es decir,
escribimos X1a1 · · · Xnan > X1b1 · · · Xnbn cuando exista 1 ≤ i ≤ n tal que
a1 = b1 , ..., ai−1 = bi−1 , ai > bi .
80 2. Anillos

Si f (X) es un polinomio simétrico, entonces cada una de sus componentes


homogéneas también lo es; por lo que suponemos que f (X) es homogéneo
de grado d.
Junto con cada monomio M = aX1m1 · · · Xnmn que aparezca en f (X),
aparecen también todos los monomios en su órbita, es decir, los que se
obtienen a partir de M al permutar los exponentes, por lo que podemos
suponer que tenemos un monomio que satisface m1 ≥ · · · ≥ mn . Esto
significa que M es máximo entre los que pertenecen a su órbita.
Supongamos que aX1r1 · · · Xnrn es el monomio máximo de f . Acabamos
de ver que r1 ≥ · · · ≥ rn . Observemos que aσ1r1 −r2 σ2r2 −r3 · · · σnrn es un
monomio en las σi , cuyo grado en las Xi es (r1 −r2 )+2(r2 −r3 )+· · ·+nrn =
r1 +r2 +· · ·+rn ; y que además es homogéneo en las Xi . Más aún, el monomio
máximo en las Xi de aσ1r1 −r2 σ2r2 −r3 · · · σnrn es aX1r1 · · · Xnrn .
La conclusión es que f − aσ1r1 −r2 σ2r2 −r3 · · · σnrn es simétrico; y si no es
cero, es homogéneo de grado d con monomio máximo menor que el de f .
Obtenemos a) por inducción en el orden lexicográfico al observar que el
número de monomios en n variables de grado d es finito.
b) Sea 0 6= p(T1 , ..., Tn ) ∈ A[T1 , ..., Tn ] un polinomio, entonces dado un
monomio M1 de p(T1 , ..., Tn ), siempre es posible escribirlo como M1 =
aT1r1 −r2 T2r2 −r3 · · · Tnrn con ri ∈ N y r1 ≥ · · · ≥ rn .
Consideremos al conjunto de los vectores (r1 , ..., rn ) ∈ Nn ası́ obtenidos;
y tomemos al máximo de ellos en el orden lexicográfico: (s1 , ..., sn ). Resulta
que el monomio máximo de p(σ1 , ..., σn ) en las Xi es aX1s1 · · · Xnsn , que no
se cancela con ningún otro. Se tiene pues que p(σ1 , ..., σn ) 6= 0.
Consideremos ahora el siguiente problema natural: Dados dos polinomios
f y g en k[X] con k un campo, ¿existe algún criterio para determinar si estos
polinomios tienen un factor común no constante? El siguiente resultado es
una respuesta positiva.

Teorema 2.61 (Sylvester) Sean k un campo, f (X) = a0 X m + · · · + am


y g(X) = b0 X n + · · · + bn polinomios en k[X] con a0 6= 0 6= b0 y R(f, g) el
siguiente determinante (m + n) × (m + n):

a0 a1 ··· am
a0 a1 ··· am
.. ..
. .
a0 a1 ··· am
b0 b1 ··· bn
b0 b1 ··· bn
.. ..
. .
b0 b1 ··· bn

Entonces f y g tienen un factor común no constante si y sólo si R(f, g) = 0.


2.8 Polinomios Simétricos, Resultante y Discriminante 81

Demostración: Primero afirmamos que f y g tienen un factor común no


constante p si y sólo si existen polinomios h y q tales que f h = gq, con
h 6= 0 6= q, gr h < gr g = n, gr q < gr f = m.
Si f = pα, g = pβ con gr p ≥ 1, entonces f β = pαβ = gα, por lo que
h = β y q = α funcionan. El recı́proco es claro porque k[X] es un dominio
de factorización única.
Escribimos los polinomios h(X) = c0 X n−1 + c1 X n−2 + · · · + cn−1 y
−q(X) = d0 X m−1 + d1 X m−2 + · · · + dm−1 ; y tratamos de resolver f h = gq
para ci , dj ∈ k.
Comparando los coeficientes de las distintas X i en f h y en gq, tenemos
que nuestro problema se reduce a resolver el siguiente sistema de ecuaciones
lineales en las incógnitas ci y dj :
a0 c0 = − b0 d0
a1 c0 + a0 c1 = − b1 d0 − b0 d1
a2 c0 + a1 c1 + a0 c2 = − b2 d0 − b1 d1 − b0 d2
··· = ···
am cn−1 = −bn dm−1
Este sistema puede escribirse como
 
c0
 .. 
 . 
 
c 
M  n−1  = 0,
 d0 
 . 
 .. 
dm−1

donde M es una matriz (m + n) × (m + n) tal que al determinante de su


transpuesta le llamamos R(f, g).
En las condiciones del teorema, el determinante R(f, g) es el resultante
de f y g.
Sean k un campo y A = k[X1 , ..., Xm , Y1 , ..., Yn ] el anillo de polinomios
en las m + n variables indicadas. Consideremos los polinomios en A[T ]:
m
Y
f (T ) = a0 (T − Xi ) = a0 T m + a1 T m−1 + · · · + am ,
i=1

n
Y
g(T ) = b0 (T − Yi ) = b0 T n + b1 T n−1 + · · · + bn ;
i=1
?
donde a0 , b0 ∈ k . Escribimos
X X
σi = Xr1 · · · Xri , τj = Ys1 · · · Ysj ;
r1 <···<ri s1 <···<sj
82 2. Anillos

de manera que ai , bj , σi , τj ∈ A para 0 ≤ i ≤ m y 0 ≤ j ≤ n con


ai = (−1)i a0 σi , bj = (−1)j b0 τj , para 1 ≤ i ≤ m, 1 ≤ j ≤ n. (2.4)
El resultante genérico R(f, g) de f y g es el siguiente determinante
(m + n) × (m + n):
a0 a1 ··· am
a0 a1 ··· am
.. ..
. .
a0 a1 ··· am
b0 b1 ··· bn
b0 b1 ··· bn
.. ..
. .
b0 b1 ··· bn
mientras que el discriminante genérico de f es el polinomio
Y
D= (Xi − Xj )2 .
i<j

Aplicando dos veces el Teorema 2.60 a) para la acción natural del grupo
G = Sm × Sn ; y considerando la ecuación (2.4), tenemos que
AG = k[σ1 , ..., σm , τ1 , ..., τn ] = k[a1 , ..., am , b1 , ..., bn ].

Observación. Notemos que R(f, g) ∈ AG ; y que AG es un anillo de poli-


nomios en las variables σi , τj .
Q
Teorema 2.62 R(f, g) = an0 bm 0 i,j (Xi − Yj ).

Demostración: Usando las expresiones 2.4, vemos que R(f, g) es el pro-


ducto de an0 bm
0 por un polinomio en σi , τj .
Fijamos i, j y llamamos K al campo de fracciones de A. Aplicando el
Teorema de Sylvester a f (T ), g(T ) ∈ K[T ], obtenemos lo siguiente: Al
considerar a R(f, g) como polinomio en Xi y evaluarlo en Yj , el resultado
es cero, ya que en esas condiciones f y g tienen un factor común no trivial.
Como Xi − Yj es mónico, existen q, r ∈ A tales que Xi no aparece en r
y R(f, g) = (Xi − Yj )q + r. El párrafo anterior garantiza que r = 0, por lo
que obtenemos (Xi − Yj ) |QR(f, g) en A.
Escribiendo S = an0 bm 0 i,j (Xi − Yj ), tenemos que S | R(f, g) en A,
porque todo Xi − Yj es irreducible; pero S, R(f, g) ∈ AG . Esto implica que
S | R(f, g) en AG .
Por un lado, el término de grado máximo en τn que aparece en R(f, g)
es (−1)mn an0 bm m
0 τn . Por el otro lado, observando que
m
Y Y
g(Xi ) = bm
0 (Xi − Yj ),
i=1 i,j
2.8 Polinomios Simétricos, Resultante y Discriminante 83

se tiene que
m
Y m
Y
S = an0 g(Xi ) = an0 (b0 Xin + b1 Xin−1 + · · · + bn ); (2.5)
i=1 i=1

donde se ve que el término de grado máximo en τn que aparece en S es


(−1)mn an0 bm m
0 τn . Concluimos que R(f, g) Qn= S.
El caso g(T ) = f 0 (T ) con f (T ) = a0 i=1 (T − Xi ) da lugar al siguiente
resultado:
Teorema 2.63 R(f, f 0 ) = (−1)n(n−1)/2 a2n−1
0 D.
Qn
Demostración: A partir de f (T ) = a0 i=1 (T − Xi ), tenemos que
n
X
f 0 (T ) = a0 (T − X1 ) · · · (T\
− Xi ) · · · (T − Xn ); y también
i=1
0
f (Xi ) = a0 (Xi − X1 ) · · · (Xi − Xi−1 )(Xi − Xi+1 ) · · · (Xi − Xn ).
De la proposición anterior y de (2.5) se obtiene
n
Y
R(f, f 0 ) = an−1
0 f 0 (Xi ) =
i=1
Y
(−1)n(n−1)/2 a2n−1
0 (Xi − Xj )2 = (−1)n(n−1)/2 a2n−1
0 D.
i<j
Qn
Si k es un campo y f (T ) = i=1 (T −ri ) ∈ k[X] con todo ri ∈ k, entonces
el discriminante de f es Y
(ri − rj )2 .
i<j

Observación. Un polinomio f (T ) ∈ k[X] tiene raı́ces múltiples si y sólo


si su discriminante se anula; y esto ocurre si y sólo si f (T ) y f 0 (T ) tienen
un factor común de grado positivo.

Ejercicios
1. Calcule el discriminante de X 2 + bX + c y el de X 3 + pX + q.
2. Exprese X12 +X22 +X32 y X13 +X23 +X33 como polinomios en σ1 , σ2 , σ3 .
3. Demuestre que el resultante de a0 X 2 + a1 X + a2 y b0 X 2 + b1 X + b2
es a22 b20 − a1 a2 b0 b1 + a0 a2 b21 + a21 b0 b2 − 2a0 a2 b0 b2 − a0 a1 b1 b2 + a20 b22 .
4. Demuestre que el discriminante de X 5 + pX + q es 28 p5 + 55 q 4 ; y que
el de X 7 + pX + q es −26 36 p7 − 77 q 6 .
5. Demuestre que el discriminante del polinomio X 3 − a1 X 2 + a2 X − a3
es −4a31 a3 + a21 a22 + 18a1 a2 a3 − 4a32 − 27a23 .
84 2. Anillos

2.9 Módulos y Anillos Noetherianos


Dado un anillo R, se dice que M es un R-módulo (izquierdo) cuando M
es un grupo abeliano ante una operación + que posee además una multi-
plicación R × M → M dada por (r, m) 7→ rm tal que

• 1m = m para todo m ∈ M .

• (a + b)m = am + bm para todos a, b ∈ R, m ∈ M .

• (ab)m = a(bm) para todos a, b ∈ R, m ∈ M .

• a(m + n) = am + an para todos a ∈ R, m, n ∈ M .

Proponemos como ejercicio informal, definir los conceptos de submódulo


y de morfismo de R-módulos; ası́ como el de R-módulo derecho.
Ejemplos. Algunos R-módulos importantes son:

1. Cuando R es un campo, un R-módulo es lo mismo que un espacio


vectorial.

2. Todo grupo abeliano A es un Z-módulo de manera natural: na sig-


nifica a + · · · + a, con n sumandos para n ∈ N y a ∈ A. También
(−1)a = −a.

3. Todo ideal izquierdo de R es un R-módulo izquierdo.

4. Si a es un ideal izquierdo de R, entonces R/a también es un R-módulo


izquierdo ante r(x + a) = rx + a, para r, x ∈ R.

5. Si M es un R-módulo izquierdo y N es un submódulo, entonces M/N


también es un R-módulo izquierdo ante r(x + N ) = rx + N , para
r ∈ R, x ∈ M .

Por brevedad, diremos R-módulo en lugar de R-módulo izquierdo.


Un R-módulo M es irreducible cuando sus únicos submódulos son (0)
y M . Para todo R-módulo M , el conjunto EndR M de endomorfismos de
M admite una estructura de anillo ante la suma de funciones y la multi-
plicación dada por composición de funciones.

Teorema 2.64 (Lema de Schur) Sea M un R-módulo irreducible. En-


tonces EndR M es un anillo de división.

Demostración: Sea ψ : M → M un morfismo no trivial. Entonces su


imagen es M por tener que ser un submódulo de M . Por otro lado, su
núcleo es (0), por la misma razón. Sabemos que la función inversa ψ −1 es
un morfismo de grupos abelianos; y es fácil ver que también es un morfismo
de R-módulos.
2.9 Módulos y Anillos Noetherianos 85

Proposición 2.65 Sea M un R-módulo. Las siguientes condiciones son


equivalentes:

1. Todo submódulo es finitamente generado.

2. Toda cadena de submódulos estrictamente ascendente es finita.

3. Toda colección no vacı́a de submódulos tiene un máximo

Demostración: 1) ⇒ 2): Si M1 ⊂ M2 ⊂ · · · ; escribimos N = ∪i Mi , que


está finitamente generado, por lo que existe n tal que Mn contiene a esos
generadores; y entonces la cadena termina en n.
2) ⇒ 3): Si Σ 6= ∅ es una colección no vacı́a de submódulos en la que no
existen máximos, entonces cualquier N1 ∈ Σ no es máximo y existe N2 ∈ Σ
con N1 ⊂ N2 . Procedemos inductivamente a partir de N1 ⊂ N2 ⊂ · · · ⊂ Ni ,
ya que Ni no es máximo, existe Ni+1 ∈ Σ con Ni ⊂ Ni+1 . Ası́, es posible
construir una cadena ascendente infinita.
3) ⇒ 1): Dado N submódulo de M , sea Σ la colección de los submódulos
de N que son finitamente generados. Si (m1 , ..., mr ) es un elemento máximo
de Σ, entonces claramente N = (m1 , ..., mr ).
Un módulo es Noetheriano cuando satisface las condiciones de la propo-
sición anterior. Un anillo R es Noetheriano cuando lo es como R-módulo.

Proposición 2.66 Sea M un R-módulo Noetheriano. Entonces toda ima-


gen homomorfa y todo submódulo de M son Noetherianos.

Demostración: La afirmación sobre submódulos es clara. Para ver la otra,


supongamos que M 1 ⊂ M 2 ⊂ · · · es una cadena ascendente de submódulos
de M/N ; y que Mi = f −1 (M i ) para cada i, donde f : M → M/N es el
morfismo natural. Entonces la cadena ascendente M1 ⊂ M2 ⊂ · · · es finita,
por lo que M 1 ⊂ M 2 ⊂ · · · también lo es.

Proposición 2.67 Sean M un R-módulo y N un submódulo tales que N


y M/N son Noetherianos. Entonces M es Noetheriano.

Demostración: Observemos que si L1 ⊆ L2 son submódulos de M tales


que (L1 ∩ N ) = (L2 ∩ N ) y (L1 + N )/N = (L2 + N )/N , entonces L1 = L2 :
Pues m ∈ L2 ⇒ existen u, v ∈ N, m0 ∈ L1 tales que m0 + u = m + v,
de manera que m − m0 = u − v ∈ (L2 ∩ N ) = (L1 ∩ N ); y por tanto
m = m0 + (u − v) ∈ L1 .
Si ahora M1 ⊆ M2 ⊆ · · · es una cadena ascendente de submódulos de
M , entonces las cadenas ascendentes (M1 ∩ N ) ⊆ (M2 ∩ N ) ⊆ · · · y (M1 +
N )/N ⊆ (M2 + N )/N ⊆ · · · se estabilizan en algún punto. La observación
previa implica que la cadena M1 ⊆ M2 ⊆ · · · también se estabiliza en ese
punto.
86 2. Anillos

Si M1 , ..., Mn son R-módulos, definimos la suma directa de módulos


M = M1 ⊕ · · · ⊕ Mn como la suma directa de grupos abelianos con multi-
plicación r(m1 , ..., mn ) = (rm1 , ..., rmn ) para todos r ∈ R, mi ∈ Mi .
Observaciones. Las siguientes afirmaciones son inmediatas:
1. Si M1 , ..., Mn son submódulos de M , entonces M = M1 ⊕ · · · ⊕ Mn
si y sólo si M = M1 + · · · + Mn y para todo 1 ≤ i ≤ n se tiene que
(M1 + · · · + Mi−1 ) ∩ Mi = (0).
2. Un R-módulo M es finitamente generado si y sólo si existe un mor-
fismo suprayectivo de R-módulos ψ : R ⊕ · · · ⊕ R → M .

Proposición 2.68 a) Toda suma directa finita de módulos Noetherianos


es Noetheriana.
b) Toda suma finita de módulos Noetherianos es Noetheriana.
c) Sean R un anillo Noetheriano y M un R-módulo finitamente generado,
entonces M es Noetheriano.
Demostración: a) Sea M = M1 ⊕ · · · ⊕ Mn con todo Mi Noetheriano.
Procedemos por inducción en n: Tenemos que M/Mn ∼ = M1 ⊕ · · · ⊕ Mn−1
con Mn y M1 ⊕ · · · ⊕ Mn−1 Noetherianos. La conclusión se obtiene de la
proposición anterior.
b) Si ahora M = M1 + · · · + Mn con todo Mi Noetheriano, entonces M
es imagen homomorfa de M1 ⊕ · · · ⊕ Mn .
c) Aquı́, M es imagen homomorfa de R ⊕ · · · ⊕ R.
Proposición 2.69 Sea f : A → B un morfismo suprayectivo de anillos
con A Noetheriano. Entonces B es Noetheriano.
Demostración: Si b1 ⊂ b2 ⊂ · · · es una sucesión estrictamente ascendente
de ideales de B y a1 ⊂ a2 ⊂ · · · es la sucesión también estrictamente
ascendente de ideales de A dada por ai = f −1 (bi ) para toda i, entonces
a1 ⊂ a2 ⊂ · · · es finita, por lo que b1 ⊂ b2 ⊂ · · · también lo es.
Teorema 2.70 (de la base de Hilbert) Sea A un anillo Noetheriano.
Entonces A[X] también lo es.
Demostración: Sea I un ideal de A[X]. Veremos que I es finitamente
generado. Para cada i ∈ N, sea

ai = {a ∈ A | existe f (X) = aX i + · · · + a1 X + a0 ∈ I}.

Es claro que cada ai es un ideal de A y que a1 ⊆ a2 ⊆ · · ·, por lo que existe


n ∈ N tal que an = an+1 = · · ·. Como cada ideal ai es finitamente generado,
podemos escribir ai = (ai1 , ..., aim(i) ), de manera que exista fij ∈ I de grado
i con coeficiente lı́der aij . Se afirma que I = (fij | 1 ≤ i ≤ n, 1 ≤ j ≤ m(i)).
Veremos por inducción en d = gr f , que f ∈ I ⇒ f ∈ (fij ).
2.9 Módulos y Anillos Noetherianos 87

Si d > n, entonces existen c1 , ..., cm(n) ∈ A tales que el grado de f es


mayor que el grado de f − c1 X d−n fn1 − · · · − cm(n) X d−n fnm(n) ∈ I. Si
d ≤ n, entonces existen c01 , ..., c0m(d) ∈ A tales que el grado de f es mayor
que el grado de f − c01 fd1 − · · · − c0m(d) fdm(d) ∈ I.
Un ideal a es irreducible cuando (a = b ∩ c) ⇒ (a = b ó a = c). Un
ideal q de un anillo conmutativo R es primario cuando todo divisor de cero
de R/q es nilpotente. Supondremos que nuestros anillos son conmutativos.

Proposición 2.71 Sea R un anillo Noetheriano. Entonces todo ideal se


puede expresar como una intersección finita de ideales irreducibles.

Demostración: Supongamos que Σ 6= ∅ es el conjunto de ideales que


no admiten tal descomposición. Entonces Σ tiene un elemento máximo a,
para el que existen ideales b y c tales que a = b ∩ c con a ⊂ b y a ⊂ c.
Pero entonces tanto b como c admiten tal descomposición, implicando que
a también se descompone ası́.

Proposición 2.72 Todo ideal irreducible de un anillo Noetheriano es pri-


mario.

Demostración: Es suficiente ver que si el ideal (0) es irreducible, entonces


es primario: Supongamos que ab = 0 con b 6= 0. Consideremos la cadena
de ideales an(a) ⊆ an(a2 ) ⊆ · · ·, que se estabiliza, digamos que an(an ) =
an(an+1 ).
Afirmamos que (an ) ∩ (b) = (0): Esto es porque x ∈ (b) ⇒ xa = 0, por
lo que si además x ∈ (an ), entonces x = yan , de manera que yan+1 = 0, y
ası́ y ∈ an(an+1 ) = an(an ). Entonces yan = 0, teniéndose x = 0.
Como (0) es irreducible y (b) 6= 0, se obtiene (an ) = 0, que demuestra
que (0) es primario.

Corolario 2.73 Sea R un anillo Noetheriano. Entonces todo ideal se puede


expresar como una intersección finita de ideales primarios.

Ejercicios
1. Dé un ejemplo de un anillo Noetheriano que no sea principal.

2. Determine si el Z-módulo Q es Noetheriano.

3. Demuestre que el anillo Mn (R) de las matrices n × n sobre un anillo


Noetheriano R es Noetheriano.

4. Dé un ejemplo de un anillo conmutativo que no sea Noetheriano.

5. Sean A un anillo Noetheriano y f : A → A un morfismo suprayectivo


de anillos. Demuestre que f es inyectivo. (Sugerencia: Considere la
cadena ker f ⊆ ker f 2 ⊆ · · · ).
88 2. Anillos

2.10 Series Formales de Potencias


Sea A un anillo conmutativo con 1. El anillo de series formales de po-
tencias R = A[[X]] es el conjunto de las sucesiones (a0 , a1 , a2 , ...), donde
ai ∈ A para todo i ∈ N, con operaciones suma y multiplicación dadas por
(a0 , ..., an , ...) + (b0 , ..., bn , ...) = (a0 + b0 , ..., an X
+ bn , ...).
(a0 , ..., an , ...) × (b0 , ..., bn , ...) = (c0 , ..., cn , ...), con cn = ai bj .
i+j=n

Se verifica inmediatamente que R es un anillo conmutativo; en el que 1 =


(1, 0, 0, ...). Escribimos X = (0, 1, 0, 0, ...), de manera que tenemos X 2 =
(0, 0, 1, 0, 0, ...), etc. Se dice que α = (a0 , a1 , a2 , ...) es de orden i cuando
a0 = · · · = ai−1 = 0, ai 6= 0, escrito ◦(α) = i. No definimos el orden de 0.
Observaciones. Es inmediato que:
a) ◦ (α + β) ≥ min{◦(α), ◦(β)}, siempre que α, β, α + β 6= 0.
b) ◦ (αβ) ≥ ◦(α) + ◦(β), siempre que α, β, αβ 6= 0.
c) Si A es un dominio, entonces ◦(αβ) = ◦(α) + ◦(β).
d) Si A es un dominio,
Pentonces R también lo es.
Convenimos escribir i≥0 ai X i en lugar de (a0 , a1 , a2 , ...), entendiendo
que esta no es una suma, aunque A[X] es un subanillo de A[[X]].
Teorema 2.74 Si A es un anillo Noetheriano, entonces el anillo de series
formales R = A[[X]] también es Noetheriano.
Demostración: Sea I un ideal de R. Para cada i ∈ N, definimos
ai = {a ∈ A | existe α ∈ I, α = aX i + (términos de orden mayor)} ∪ {0}.
Como A es Noetheriano, la cadena de ideales de A : a0 ⊆ a1 ⊆ a2 ⊆ · · ·
se estabiliza en algún punto, digamos que an = an+1 , supongamos que
ai = (ai1 , ..., aim(i) ) para 1 ≤ i ≤ n; y que

fij = aij X i + (términos de orden mayor) ∈ I.


Afirmamos que I = (fij | 1 ≤ i ≤ n, 1 ≤ j ≤ m(i)). Si d ≤ n y
f = bX d + (términos de orden mayor) ∈ I con b 6= 0, entonces existen
cd1 , ..., cdm(d) ∈ A tales que f − cd1 fd1 − · · · − cdm(d) fdm(d) ∈ I es de orden
mayor a d.
Si d > n, entonces también podemos encontrar cd1 , ..., cdm(n) ∈ A tales
que f − cd1 X d−n fn1 − · · · − cdm(n) X d−n fnm(n) ∈ I es de orden mayor a d.
En todo caso, podemos suponer que d > n para escribir
X X
f = fn1 ck1 X k−n + · · · + fnm(n) ckm(n) X k−n ∈ (fij ).
k>n k>n

Como todo ideal de R es finitamente generado, se tiene que el anillo R


es Noetheriano.
2.10 Series Formales de Potencias 89

Teorema
P 2.75 i Sean? k un campo y R = k[[X]]. Entonces:
a) i≥0 ai X ∈ R ⇔ a0 6= 0.
b) Si 0 6= α ∈ R, entonces existe u ∈ R? único tal que α = uX ◦(α) .
c) R es un dominio local con ideal máximo m = (X) y campo cociente
R/m ∼ = k.
d) R es un dominio principal.
e) El campo de fracciones de R, escrito k((X)), consiste de los elementos
de la forma uX j con u ∈ R? y j ∈ Z. Además, sus operaciones son:
X X X
ai X i + bi X i = (ai + bi )X i ,
i≥r i≥r i≥r

X X X
ai X i × bj X j = ct X t ,
i≥r j≥s t≥r+s
P
donde ct = ai bj y r, s ∈ Z.
i+j=t
P P
Demostración: a) Si i≥0 ai X i ∈ R? , entonces existe i≥0 bi X i tal que
X X
( ai X i )( bi X i ) = 1;
i≥0 i≥0

pero entonces a0 b0 = 1 ⇒ a0 6= 0. P
Recı́procamente, supongamos que α = i≥0 ai X i con a0 6= 0. Buscamos
P
β = i≥0 bi X i tal que αβ = 1. Esta última igualdad es equivalente a la
colección de ecuaciones:
a0 b0 = 1
a0 b1 + a1 b0 = 0
··· = ···
a0 bn + a1 bn−1 + · · · + an b0 = 0
··· = ···
Este es un sistema de ecuaciones en las incógnitas bi , que admite una
solución única, pues b0 se determina de la primera ecuación, b1 de la segunda
ecuación, etc. Todo esto gracias a que a0 6= 0.
b) Esta es una consecuencia inmediata de a).
c) Esta también es una consecuencia inmediata de a).
d) Si 0 6= α ∈ R, entonces tenemos la igualdad de ideales (α) = (X ◦(α) ).
Como R es Noetheriano, es suficiente observar que (α1 , ..., αr ) = (X s ),
donde s = min{◦(αi ) | αi 6= 0}, suponiendo que algún αi 6= 0.
e) Si α = uX ◦(α) y 0 6= β = vX ◦(β) con u, v ∈ R? , entonces
α
= uv −1 X ◦(α)−◦(β) ,
β

de donde se obtiene la primera afirmación de e). Es fácil verificar que las


operaciones de k((X)) son las enunciadas.
90 2. Anillos

Observaciones. Las siguientes afirmaciones son generalizaciones sencillas


de lo anterior:

• k[[X]] es un dominio de factorización única cuyo único irreducible es


X junto con sus asociados:
X
( ai X i es irreducible) ⇔ (a0 = 0, a1 6= 0).
i≥0

• Si A es un anillo conmutativo, entonces


X
ai X i ∈ A[[X]]? ⇔ a0 ∈ A? .
i≥0

Sean k un campo y K = k(X1 , ..., Xn ) el campo de funciones racionales


sobre k en n variables. Para cada i ∈ N r {0}, definimos el polinomio
simétrico ρi = X1i + · · · + Xni .
Sean σ1 , ..., σn los polinomios simétricos elementales. Consideremos al
polinomio
n
Y
f (T ) = (T − Xi ) = T n − σ1 T n−1 + · · · + (−1)n σn (2.6)
i=1

como elemento de K((T −1 )). Esto es posible, porque siendo un polinomio


en T involucra solamente un número finito de potencias positivas de T .

Lema 2.76 Sean k un campo y a ∈ k, entonces en k((T −1 )) tenemos que

(T − a)−1 = T −1 + aT −2 + a2 T −3 + · · ·

Demostración: Es suficiente observar que

(T − a)(T −1 + aT −2 + a2 T −3 + · · ·) = 1

en k((T −1 )), según la multiplicación del Teorema 2.75 e).

Teorema 2.77 (Newton) Las siguientes identidades son válidas:

ρr − ρr−1 σ1 + · · · + (−1)r−1 ρ1 σr−1 + (−1)r rσr = 0, si r ≤ n. (2.7)

ρr −ρr−1 σ1 +· · ·+(−1)n−1 ρr−n+1 σn−1 +(−1)n ρr−n σn = 0, si r > n. (2.8)

Demostración: A partir de la ecuación (2.6), se tiene que


n n
f 0 (T ) X 1 X
= = (T −1 +Xi T −2 +· · ·) = nT −1 +ρ1 T −2 +ρ2 T −3 +· · ·
f (T ) i=1
T − Xi i=1
2.11 Ejercicios Generales 91

Para obtener la segunda igualdad usamos el lema precedente. Multipli-


camos la identidad obtenida por

f (T )T 1−n = T (1 − σ1 T −1 + · · · + (−1)n σn T −n ),

para obtener

f 0 (T )T 1−n = (1 − σ1 T −1 + · · · + (−1)n σn T −n )(n + ρ1 T −1 + · · ·). (2.9)

Un cálculo directo, desde la ecuación (2.6), produce

f 0 (T )T 1−n = n − (n − 1)σ1 T −1 + · · · + (−1)n−1 σn−1 T −(n−1) . (2.10)

Comparando los coeficientes de las distintas potencias de T en (2.9) y


(2.10), obtenemos las identidades (2.7) y (2.8) deseadas.

Ejercicios

1. Sean k un campo y R = k[[X]]. Demuestre que R es un dominio


Euclideano.

2. Sean k un campo, A = P k[[X]] y B el subconjunto de A formado por


las series de forma 1 + n≥1 an X n . Demuestre que dados un entero
positivo r tal que caract k - r y α ∈ B, existe un único β ∈ B tal
que β r = α.

3. Sea k un campo. Defina al anillo de series R = k[[X1 , ..., Xn ]]; y


demuestre que R es un dominio Noetheriano local.

2.11 Ejercicios Generales


1. Sean k un campo, f (X) = a0 X m + a1 X m−1 + · · · + am un polinomio
sobre k de grado menor o igual a m; y g(X) = b0 X n +b1 X n−1 +· · ·+bn
otro polinomio sobre k de grado menor o igual a n. Considere su
resultante Rm,n (f, g), dado por el determinante (m + n) × (m + n):

a0 ··· am
.. ..
. .
a0 ··· am
b0 ··· bn
.. ..
. .
b0 ··· bn
92 2. Anillos

Identificamos el espacio vectorial de los polinomios de grado menor o


igual a m con k m+1 a través del isomorfismo
a0 X m + a1 X m−1 + · · · + am ←→ (a0 , a1 , ..., am ).
Demuestre que Rm,n : k m+1 × k n+1 → k es la única función que
satisface:
a) Rm,n (f, g) = (−1)mn Rn,m (g, f ).
b) Rm,n (λf, µg) = λn µm Rm,n (f, g) para todos λ, µ ∈ k.
c) R0,n (a0 , g) = an0 , independientemente de g(X), para m = 0.
d) Cuando m = 1 y n = 1 se tiene que
µ ¶
a b
R1,1 (aX + b, cX + d) = det = ad − bc.
c d

e) Cuando m = 1 se tiene que R1,n (X − ρ, g) = g(ρ).


f ) Se tiene bimultiplicatividad:
Rm1 +m2 ,n (f1 f2 , g) = Rm1 ,n (f1 , g)Rm2 ,n (f2 , g).
Rm,n1 +n2 (f, g1 g2 ) = Rm,n1 (f, g1 )Rm,n2 (f, g2 ).
Qn
2. Sean k un campo y f (X) = i=1 (X − αi ) ∈ k[X].
a) Evalúe el determinante de Vandermonde:
1 1 ··· 1
α1 α2 ··· αn Y
.. .. .. = (αi − αj ).
. . ··· . i>j
α1n−1 α2n−1 ··· αnn−1
Pn
b) Escribiendo bj = i=1 αij y D = discr f (X), demuestre que

n b1 ··· bn−1
b1 b2 ··· bn Y
.. .. .. = (αi − αj )2 = D.
. . ··· . i>j
bn−1 bn ··· b2n−2
c) Use el resultado anterior para demostrar que el discriminante de
X 3 − a1 X 2 + a2 X − a3 es −4a31 a3 + a21 a22 + 18a1 a2 a3 − 4a32 − 27a23 .
3. Sea R un anillo conmutativo y sea Spec R el conjunto de los ideales
primos de R. Para C ⊆ R, definimos Z(C) = {p ∈ Spec R | p ⊇ C}.
Demuestre que
a) Z(0) = Spec R y Z(1) = ∅.
b) Z(a ∩ b) = Z(ab) = Z(a) ∪ Z(b), para ideales a y b.
c) Z(∪i Ci ) = ∩i Z(Ci ) , para subconjuntos Ci .
Capı́tulo 3
Campos y Teorı́a de Galois

3.1 Extensiones de Campos


Para un campo k, existe un único morfismo de anillos f : Z → k con
f (1) = 1. Si ker f = (n), entonces la caracterı́stica de k es n.
Como Z/nZ ,→ k, vemos que n es cero o bien es un número primo p. En
el primer caso, k contiene una copia de Z y una copia de Q. En el segundo
caso, k contiene una copia de Z/pZ.
El campo primo de k es el subcampo generado por 1. Esto es, Q cuando
caract k = 0, ó bien Z/pZ cuando caract k = p.
Cuando k es un subcampo de K, se dice que K es una extensión de k;
y se escribe K/k. En estas condiciones, K es un espacio vectorial sobre k.
El grado de la extensión, escrito [K : k], es la dimensión de este espacio
vectorial. Se dice que la extensión es finita o infinita, según lo sea su
grado.
Sea f (X) ∈ k[X] irreducible y de grado positivo. Entonces, existe una
raı́z de f (X) en k si y sólo si gr f = 1. Para cualquier grado positivo de
f (X), se tiene que k[X]/(f (X)) es un campo K que contiene una copia de
k y que está generado por la imagen α de X en el cociente. Esto se escribe
ası́: K = k(α); y se dice que K se obtiene a partir de k adjuntándole α,
raı́z del polinomio f (X).
Dada una extensión F/k, se dice que un elemento α ∈ F es algebraico
sobre k cuando existen elementos b0 , b1 , ..., bn ∈ k no todos cero tales que

bn αn + · · · + b1 α + b0 = 0.

Esto equivale a decir que el morfismo de anillos ψ : k[X] → F tal que


ψ(X) = α y que coincide con la identidad en k, tiene núcleo I 6= (0). En
esta situación, el núcleo tiene que ser de la forma I = (p(X)) con p(X)
irreducible. Si además p(X) es mónico, decimos que p(X) es el polinomio
mı́nimo de α sobre k, escrito Polmin(α, k). Cuando I = (0), se dice que
α ∈ F es trascendente sobre k; esto es equivalente a tener k[X] ∼ = k[α].
La extensión F/k es algebraica cuando todo elemento α ∈ F es alge-
braico sobre k. En caso contrario, la extensión es trascendente.
94 3. Campos y Teorı́a de Galois

Dados una extensión F/k y un subconjunto S ⊆ F , el anillo generado


por k y S se escribe k[S], mientras que el campo generado por k y S se
escribe k(S). Cuando S consiste de un solo elemento, la situación es la
siguiente:

Proposición 3.1 Sean F/k una extensión de campos y α ∈ F , entonces


las siguientes condiciones son equivalentes:
a) α es algebraico sobre k.
b) k[α] = k(α).
c) k(α)/k es finita.
Cuando se satisfacen estas condiciones, se tiene la igualdad

[k(α) : k] = gr Polmin(α, k).

Demostración: a) ⇒ b) : Si α es algebraico sobre k, entonces k[α] ∼ =


k[X]/I con (0) 6= I = (p(X)) ideal primo de k[X]. Esto implica que I es
máximo, que k[α] es un campo; y que k[α] = k(α).
b) ⇒ c) : Si k[α] = k(α), entonces el anillo k[α] no es un anillo de
polinomios, por lo que α es algebraico sobre k. Supongamos que n es el
grado de p(X) = Polmin(α, k). Afirmamos que A = {1, α, α2 , ..., αn−1 } es
una base sobre k del espacio vectorial k[α] = k(α):
Una relación de dependencia lineal de A es una ecuación polinomial de
grado menor a n que α satisface, por lo que no existe.
Si f (α) es un polinomio en α con coeficientes en k, entonces por el
algoritmo Euclideano, existen polinomios q(X), r(X) ∈ k[X] tales que
f (X) = q(X)p(X) + r(X) con r(X) = 0 ó con gr r < n = gr p. Ası́,
como p(α) = 0, se tiene que f (α) = r(α) ∈ espacio generado por A.
c) ⇒ a) : Si k(α)/k es finita, entonces {1, α, α2 , ...} es linealmente depen-
diente sobre k; y α es algebraico. La implicación c) ⇒ a) tiene como
consecuencia inmediata el siguiente resultado:
Corolario 3.2 Toda extensión finita es algebraica.
Observación. Pronto veremos que el recı́proco de este corolario es falso.
Teorema 3.3 Sean k ⊆ F ⊆ K campos, {αi }i∈I una base de F/k y
{βj }j∈J una base de K/F , entonces {αi βj }(i,j)∈I×J es una base de K/k.
En particular, [K : k] = [K : F ][F : k].
Demostración: Esta última igualdad la entendemos ası́: La extensión K/k
es finita si y sólo si K/F y F/k son finitas, en cuyo caso vale la igualdad
escrita. Todo esto es consecuencia inmediata de la primera afirmación, que
demostramos a continuación.
Dado γ ∈ K, existen cj ∈ F casi todos
P cero (= todos cero con un número
finito de excepciones) tales que
P γ = cj βj . Para cada cj , existen
P bij ∈ k
casi todos cero tales que cj = bij αi . Ası́ se tiene que γ = i,j bij αi βj ; y
que {αi βj } genera a K sobre k.
3.1 Extensiones de Campos 95
P
Finalmente, si i,j aij Pαi βj = 0, con aij ∈ k casi todos cero, entonces
para cada j se tiene que i,j aij αi = 0, pues las βj son linealmente inde-
pendientes sobre F . Esto implica que todo aij es cero; y que {αi βj } es una
base de K/k.
Los dos resultados siguientes proveen de ejemplos pertinentes.

Proposición 3.4 Sean {p1 , ..., pn , q1 , ..., qm } un conjunto con n+m primos
√ √ √
distintos y K = Q( p1 , ..., pn ). Entonces q1 · · · qm ∈ / K.

Demostración: Procedemos por inducción en n. Cuando n = 0, se tiene


que K = Q; y entonces X 2 −q1 · · · qm es irreducible en Q[X] por Eisenstein.

Esto es, q1 · · · qm ∈/ K.
√ √ √
Si F = Q( p1 , ..., pn−1 ), entonces pn ∈ / F por la hipótesis inductiva;

y ası́ [K : F ] = 2. Si suponemos que q1 · · · qm ∈ K, entonces existen
√ √ √
a, b ∈ F con q1 · · · qm = a + b pn ; y ası́ q1 · · · qm = a2 + 2ab pn + b2 pn .
Pero
√ q1 · · · qm − a2 − b2 pn
ab 6= 0 ⇒ pn = ∈ F,
2ab
que es una contradicción. Los casos b = 0 y a = 0 implican respectivamente
√ √ √
que q1 · · · qm = a ∈ F ó que q1 · · · qm = b pn . En el último caso, se tiene

q1 · · · qm pn = bpn ∈ F . Estas contradicciones terminan la demostración.

De lo anterior, obtenemos inmediatamente


Corolario 3.5 Si {p1 , ..., pn } es una lista de√n primos
√ √ distintos,
√ √ entonces
√ √
[Q( p1 , ..., pn ) : Q] = 2n . La extensión Q( 2, 3, 5, 7, 11, ...)/Q es
infinita.

Teorema 3.6 Sea F = k(α1 , ..., αn ) con cada αi algebraico sobre k. En-
tonces F/k es una extensión finita. Toda extensión generada por elementos
algebraicos es algebraica.

Demostración: k ⊆ k(α1 ) ⊆ k(α1 , α2 ) ⊆ · · · ⊆ k(α1 , ..., αn ) = F es una


cadena de extensiones finitas. El Teorema 3.3 garantiza que F/k es una
extensión finita; mientras que el Corolario 3.2 garantiza que es algebraica.
Si E/k es una extensión generada por elementos algebraicos y α ∈ E,
entonces existen α1 , ..., αn ∈ E algebraicos tales que α ∈ k(α1 , ..., αn ).
Concluimos que α es algebraico sobre k.

Corolario 3.7 Si α y β son elementos algebraicos sobre el campo k, en-


tonces también son algebraicos α ± β y αβ; ası́ como α/β cuando β 6= 0.

√ √ √
Ejemplo. Sea K = Q( 2, 3, 5, ...). Aplicando los resultados previos,
vemos que K/Q es una extensión algebraica infinita. Ası́, el recı́proco del
Corolario 3.2 es falso.
96 3. Campos y Teorı́a de Galois

Una extensión F/k es finitamente generada cuando existen elementos


α1 , ..., αn ∈ F tales que F = k(α1 , ..., αn ). En el caso en que n = 1, la
extensión es simple y α1 es un elemento primitivo.
Si una extensión es finita, entonces es finitamente generada, porque una
base es un conjunto de generadores. El recı́proco es falso, pues si X es
trascendente, entonces k(X)/k es una extensión simple infinita.
Si E/k y F/k son extensiones para las que existe un campo K conte-
niendo tanto a E como a F , entonces el subcampo de K generado por E ∪F
se escribe EF . La extensión EF/F es la translación de E/k a F/k:

EF C
{{ CC
{ { C
{ |CC
{{ CC
{
EC F
CC { {
C {{
|CC
CC {{{
{
k
Sea A una familia de extesiones de campos. Diremos que A satisface la
condición T , por translación, cuando para E y F contenidos en un campo
se tenga E/k ∈ A ⇒ EF/F ∈ A.
Similarmente, A satisface la condición C, por cadena, cuando para toda
cadena k ⊆ E ⊆ F se tenga que F/k ∈ A ⇔ (F/E ∈ A y E/k ∈ A).
Si A es una familia de extesiones que satisface T y C, entonces dadas dos
extesiones E/k, F/k ∈ A tales que E y F estén contenidos en un campo,
se tendrá EF/k ∈ A.
Proposición 3.8 Las extensiones finitas, ası́ como las extensiones alge-
braicas satisfacen T y C.
Demostración: En el caso de las extensiones finitas, C se cumple por el
Teorema 3.3.
Si E/k es una extensión finita y F/k es una extensión tal que E y F están
contenidos en un campo, entonces existen α1 , ..., αn ∈ E tales que E =
k(α1 , ..., αn ) con todo αi algebraico sobre k. Las cadenas de extensiones
simples y finitas k ⊆ k(α1 ) ⊆ k(α1 , α2 ) ⊆ · · · ⊆ k(α1 , ..., αn ) = E y
F ⊆ F (α1 ) ⊆ F (α1 , α2 ) ⊆ · · · ⊆ F (α1 , ..., αn ) = EF demuestran que es
suficiente considerar el caso simple y finito: Aquı́, [F (α) : F ] ≤ [k(α) : k]
porque α es raı́z de Polmin(α, k) ∈ F [X].
En cuanto a las extensiones algebraicas, es obvio que T se cumple. Dada
una cadena k ⊆ E ⊆ F , la implicación F/k algebraica ⇒ (F/E algebraica
y E/k algebraica) es clara. Recı́procamente, sean F/E, E/k extensiones
algebraicas y α ∈ F , entonces existen bm , ..., b1 , b0 ∈ E algebraicos sobre k
3.1 Extensiones de Campos 97

no todos cero tales que bm αm +· · ·+b1 α+b0 = 0, por lo que α es algebraico


sobre k(b0 , b1 , ..., bm ). Ası́, [k(b0 , b1 , ..., bm , α) : k] es finito, por lo que α es
algebraico sobre k y C se cumple.
Como consecuencia inmediata tenemos:
Corolario 3.9 Si E/k es una extensión finita y F/k es una extensión tal
que E y F están contenidos en un campo, entonces [EF : F ] ≤ [E : k].

Observaciones.

1. Para la familia de las extensiones finitamente generadas, es claro que


T se satisface. Aunque la condición C también se cumple; este resul-
tado no lo demostramos ni lo utilizamos.

2. Si F y K son campos y ϕ : F → K es un morfismo (de anillos),


entonces ϕ(1) = 1 y ker ϕ es un ideal de F , por tanto ker ϕ = (0).
Ası́, todos los morfismos de campos son inyectivos.

3. El estudio de morfismos de campos se reduce al estudio de inclusiones


de un campo dentro de otro campo.

Si F y K son extensiones de un campo k y ϕ : F → K es un morfismo


tal que restringido a k es la identidad, decimos que ϕ es un k-morfismo.
Proposición 3.10 Sean F/k extensión algebraica y ϕ : F → F un k-
morfismo, entonces ϕ es biyectivo.
Demostración: Ya sabemos que ϕ es inyectivo. Sean α ∈ F arbitrario,
p(X) = Polmin(α, k) y sea E el subcampo de F generado por las raı́ces de
p(X). Es suficiente ver que α ∈ Im ϕ.
La extensión E/k es finita y ϕ(E) ⊆ E. Como ϕ|E es una transformación
k-lineal e inyectiva del espacio vectorial E sobre sı́ mismo, se tiene que ϕ|E
es suprayectivo; y que α ∈ Im ϕ.

Ejercicios
√ √
1. Demuestre que los campos Q( 2) y Q( 3 3) no son isomorfos.

2. Sean a, b ∈ K algebraicos sobre k, de grados m y n respectivamente,


con (m, n) = 1. Demuestre que [k(a, b) : k] = mn.
√ √ √ √
3. Encuentre un elemento β ∈ Q( 2, 3 3) tal que Q(β) = Q( 2, 3 3).

4. Sean F/k una extensión algebraica y D un dominio con k ⊆ D ⊆ F .


Demuestre que D es un campo.

5. Sea K/k una extensión finita de campos tal que si E y F son campos
intermedios, se tiene E ⊆ F ó bien F ⊆ E. Demuestre que K/k es
simple.
98 3. Campos y Teorı́a de Galois

6. Sea k(α)/k una extensión de grado 5. Demuestre que k(α) = k(α3 ).


7. Sea k un campo de caracterı́stica cero. Demuestre que el número de
polinomios mónicos irreducibles de grado 2 en k[X] es cero o infinito.
8. Sean f (X) un polinomio irreducible sobre un campo
√ k y a ∈ k. De-
muestre que f (X) permanece irreducible sobre k( a) ó bien se des-
compone como el producto de dos factores del mismo grado.

3.2 Cerradura Algebraica


Proposición 3.11 Las siguientes condiciones en un campo k son equiva-
lentes:
a) Si F/k es una extensión algebraica, entonces F = k.
b) Si F/k es una extensión finita, entonces F = k.
c) Todo polinomio irreducible en k[X] es de grado uno.
d) Todo polinomio de k[X] de grado positivo es un producto de polinomios
lineales en k[X].
e) Todo polinomio de k[X] de grado positivo tiene una raı́z en k.
La demostración de este resultado se deja como ejercicio. Se dice que un
campo k es algebraicamente cerrado cuando satisface las condiciones
de la proposición.
Proposición 3.12 Todo campo algebraicamente cerrado es infinito.
Demostración: Si k es un campo cuyos elementos son a1 , ..., an , entonces
(X − a1 ) · · · (X − an ) + 1 no tiene raı́ces en k.
Pronto veremos que C es algebraicamente cerrado. A continuación nos
proponemos construir campos algebraicamente cerrados a partir de un
campo dado.
Teorema 3.13 Dado un campo k, existe una extensión F/k con F alge-
braicamente cerrado.
Demostración: Primero construiremos una extensión F1 /k tal que todo
polinomio en k[X] de grado positivo tenga una raı́z en F1 .
A cada f (X) ∈ k[X] de grado positivo le asociamos una variable Xf ; y
llamamos S al conjunto de dichas variables.
Afirmamos que en el anillo de polinomios k[S], el conjunto {f (Xf )} ge-
nera un ideal a, es decir, que a 6= k[S]. De no ser ası́, existirı́an elementos
g1 , ..., gn ∈ k[S] tales que g1 f1 + · · · + gn fn = 1, donde cada fi = fi (Xi )
es uno de nuestros generadores, cambiando ligeramente la notación. Ahora
bien, cada gi involucra un número finito de variables, ası́ existe N tal que
X
1= gi (X1 , ..., XN )fi (Xi ). (3.1)
i
3.2 Cerradura Algebraica 99

Esto es absurdo: Si K es una extensión de k conteniendo αi raı́z de fi


para cada i, procedemos a evaluar (3.1) en K para llegar a 1 = 0.
Dado que a 6= k[S], existe un ideal máximo m de k[S] tal que a ⊆ m.
Escribimos F1 = k[S]/m, para tener que F1 /k es una extensión de k tal
que todo polinomio f (Xf ) ∈ k[X] de grado positivo tiene una raı́z en F1 :
la imagen de Xf en el cociente.
Continuamos de la misma manera con F1 , etc. para obtener una cadena
de campos F1 ⊆ F2 ⊆ · · · Definimos F = ∪i Fi . Es fácil ver que F es un
campo algebraicamente cerrado.
Se dice que K es una cerradura algebraica de k cuando K/k es una
extensión algebraica tal que K es algebraicamente cerrado.

Corolario 3.14 Todo campo k, admite una cerradura algebraica.

Demostración: Sabemos que existe F/k con F algebraicamente cerrado.


Definimos K = {α ∈ F | α es algebraico sobre k}. Entonces K es un campo
por el Corolario 3.7, la extensión K/k es algebraica por el Teorema 3.6; y
K es algebraicamente cerrado también por el Teorema 3.6.

A continuación iniciamos un estudio del siguiente problema: Dados un


morfismo de campos ϕ : k → K con K algebraicamente cerrado y una
extensión algebraica F/k, ¿es posible extender ϕ a F ? ¿cuántas extensiones
existen?

Proposición 3.15 Sean ϕ : k → K un morfismo de campos con K alge-


braicamente cerrado, F = k(α) una extensión simple algebraica y f (X) =
Polmin(α, k). Entonces las extensiones de ϕ a F corresponden a las distin-
tas raı́ces de ϕf (X) en K. Siempre existe al menos una extensión; y hay
cuando más gr f (X) extensiones.

Demostración: En primer lugar, f (α) = 0 ⇒ ϕf (α) = 0 para cualquier


extensión ϕ de ϕ, por lo que α tiene que ir a alguna raı́z de ϕf (X) en K.
Recı́procamente, el morfismo ϕ puede extenderse a un morfismo de anillos
ϕ0 : k[X] → K al escribir ϕ0 (X) = β para cualquier β ∈ K.

k[X] O
OOO 0
OOOϕ
OOO
OOO
O'
k(α) ∼
= k[X]/(f (X)) ϕ oo/7 K
oo
ooooo
ooo ϕ
ooo
k
Si β es raı́z del polinomio ϕf (X) ∈ K[X], entonces ϕ0 se factoriza a
través de ϕ como en el diagrama. Las demás conclusiones son claras.
100 3. Campos y Teorı́a de Galois

Teorema 3.16 Sean ϕ : k → K un morfismo de campos con K alge-


braicamente cerrado y F/k una extensión algebraica. Entonces ϕ se puede
extender a F . Si además, F y K son cerraduras algebraicas de k, entonces
F y K son isomorfos ante cualquiera de estas extensiones.

Demostración: Sea C la clase de las parejas (E, ψ) tales que E es un


campo con k ⊆ E ⊆ F y ψ : E → K es una extensión de ϕ. Definimos un
orden parcial en C ası́: (E, ψ) ≤ (E 0 , ψ 0 ) cuando E ⊆ E 0 y ψ 0 |E = ψ.
Por el Lema de Zorn, existe una pareja máxima (E, ψ). Si E 6= F , en-
tonces existe α ∈ F con α ∈ / E, de manera que ψ se puede extender a E(α).
Esta contradicción demuestra que E = F .
Cuando además F y K son cerraduras algebraicas de k, se tiene que K
es algebraico sobre el campo algebraicamente cerrado ϕ(F ). Se concluye
que K = ϕ(F ).

Escribimos k para expresar la cerradura algebraica del campo k. El


campo de los números algebraicos es Q.

Ejercicio
1. Demuestre que Q es numerable, que Q 6= C; y que Q/Q es una ex-
tensión algebraica infinita.

3.3 Normalidad
Sean k un campo y f (X) ∈ k[X] de grado positivo. Se dice que F es un
campo de descomposición
Qn de f (X) sobre k cuando existe una factori-
zación f (X) = c i=1 (X − αi ) en F [X] y además F = k(α1 , ..., αn ).

Teorema 3.17 Si K y F son dos campos de descomposición de f (X) sobre


k, entonces existe un k-isomorfismo ϕ : F → K.

Demostración: La inclusión k ,→ K admite una extensión al morfismo


ϕ : F → K. Es suficiente ver que Im ϕ = K.
Podemos suponer que fQ (X) es mónico, que K = k(α1 , ..., αnQ
), que F =
k(β1 , ..., βn ), que f (X) = i (X − αi ) en K[X]; y que f (X) = i (X − βi )
en F [X].
El resultado de aplicar ϕ a f (X) es
n
Y n
Y
[X − ϕ(βi )] = ϕf (X) = f (X) = (X − αi ).
i=1 i=1

La factorización única del anillo K[X] implica la igualdad de conjuntos


{α1 , ..., αn } = {ϕ(β1 ), ..., ϕ(βn )}, por lo que ϕ(F ) = K.
3.3 Normalidad 101

Si {fi (X)}i∈I ⊆ k[X] es una colección de polinomios de grado positivo,


se dice que F es un campo de descomposición de esta colección sobre k
cuando existe una factorización de cada fi (X) como producto de polinomios
lineales en F [X]; y además F está generado sobre k por las raı́ces de los
fi (X).

Corolario 3.18 Si K y F son campos de descomposición sobre k de una


misma colección de polinomios, entonces hay un k-isomorfismo ϕ : F → K.

Demostración: Para cada i hay un único campo de descomposición Fi de


fi en F y otro Ki en K.
Como F/k es una extensión algebraica, existe un k-morfismo ϕ : F → K
que satisface ϕ(Fi ) = Ki para toda i. Observando que F está generado por
∪i Fi , mientras que K lo está por ∪i Ki , tenemos que ϕ(F ) = K.

Teorema 3.19 Para una extensión algebraica F/k, las siguientes condi-
ciones son equivalentes:
a) Todo elemento irreducible de k[X] con una raı́z en F , se factoriza
como producto de polinomios lineales en F [X].
b) F es el campo de descomposición de una colección de polinomios de
k[X].
c) Si suponemos que F ⊆ k, entonces todo k-morfismo ϕ : F → k, se
restringe a un automorfismo de F .

Demostración: a) ⇒ b): F es el campo de descomposición de la colección


de los polinomios mı́nimos sobre k de todos los elementos de F .
b) ⇒ c): Si F es el campo de descomposición de {fi (X)}i∈I sobre k,
entonces F contiene un único subcampo de descomposición Fi de fi (X);
y F está generado por ∪i∈I Fi . Si ϕ es un k-morfismo de F en k, entonces
ϕ(Fi ) = Fi para toda i; y ası́ ϕ(F ) = F .
c) ⇒ a): Sea g(X) ∈ k[X] irreducible, con una raı́z α ∈ F . Para otra raı́z
β ∈ k de g(X), existe un k-morfismo ϕ : k(α) → k, tal que ϕ(α) = β. Este
morfismo admite una extensión a F . La hipótesis implica que β ∈ F .

Una extensión algebraica F/k es normal cuando satisface las condiciones


del teorema anterior.

Ejemplo. Sean X 2 − 2, X 4 − 2 ∈ Q[X], α una raı́z de X 2 − 2 y β una raı́z


de X 4 − 2 con β 2 = α.
Los polinomios son irreducibles en Q[X] por el criterio de Eisenstein.
Escribimos K = Q(α) y F = Q(β), para tener [K : Q] = 2, [F : Q] = 4; y
por tanto, [F : K] = 2.
102 3. Campos y Teorı́a de Galois

F = Q(β)
2

K = Q(α)
2

K es un campo de descomposición de X 2 − 2 sobre Q, por lo que K/Q es


una extensión normal. Análogamente, F/K es normal porque F es campo
de descomposición de X 2 − α sobre K. Sin embargo, la extensión F/Q no
es normal, como veremos a continuación.
Supongamos que F/Q es normal. El polinomio f (X) = X 4 − 2 tiene una
raı́z en F , por tanto se factoriza totalmente en F [X]. Como f 0 (X) = 4X 3
no tiene raı́ces comunes con f (X), concluimos que X 4 − 2 tiene cuatro
raı́ces distintas β = β1 , β2 , β3 , β4 en F .
Sea ζi = βi /β1 para 1 ≤ i ≤ 4. Es inmediato que ζi4 = 1 para cada i. Por
esto, ζ1 , ζ2 , ζ3 , ζ4 son cuatro raı́ces distintas de X 4 − 1 = (X 2 + 1)(X 2 − 1).
Ahora afirmamos que X 2 + 1 es irreducible en F [X]. Esta contradicción
demostrará que F/Q no es normal. En efecto, si c1 + c2 β es raı́z de X 2 + 1
con c1 , c2 ∈ K, entonces (c1 + c2 β)2 = (c21 + c22 β 2 ) + 2c1 c2 β = −1, y de ahı́
que c21 + c22 α = −1 y 2c1 c2 = 0. Por tanto, c1 = 0 ó bien c2 = 0.
Por un lado, c1 = 0 ⇒ c22 α = −1, mientras que c2 = 0 ⇒ c21 = −1.
Veamos que ambas conclusiones son imposibles.
Escribiendo c1 = a1 + a2 α con a1 , a2 ∈ Q, la ecuación c21 = −1 se
transforma en (a21 + 2a22 ) + 2a1 a2 α = −1, por lo que (a21 + 2a22 ) = −1, que
no tiene soluciones en Q.
Escribiendo c2 = b1 + b2 α con b1 , b2 ∈ Q, obtenemos de c22 α = −1 la
ecuación 4b1 b2 + (b21 + 2b22 )α = −1, y de ahı́, b21 + 2b22 = 0 y 4b1 b2 = −1,
que no admiten soluciones en Q.
Este ejemplo demuestra que la familia de extensiones normales no satis-
face C, los siguientes resultados nos dan propiedades de esta familia.

Proposición 3.20 La familia de las extensiones normales satisface T . Si


k ⊆ K ⊆ F con F/k normal, entonces F/K es normal. Si E1 y E2 son
extensiones normales de k contenidas en algún campo, entonces E1 E2 /k y
(E1 ∩ E2 )/k también son normales.

Demostración: Supongamos que F1 y F2 son extensiones de k contenidas


en un campo; y que F1 /k es normal. Entonces F1 es campo de descom-
posición sobre k de una colección de polinomios; y F1 F2 también es campo
de descomposición sobre F2 de la misma colección de polinomios. Ası́,
F1 F2 /F2 es normal y T se cumple.
3.3 Normalidad 103

Si ahora F/k es normal y k ⊆ K ⊆ F , entonces F es campo de descom-


posición sobre k y también sobre K de una colección de polinomios en
k[X] ⊆ K[X].
Si E1 y E2 son extensiones normales de k contenidas en un campo,
entonces E1 es campo de descomposición de {fi } ⊆ k[X], E2 lo es de
{gj } ⊆ k[X], por lo que E1 E2 es campo de descomposición de {fi , gj }.
Ası́, E1 E2 /k es normal. Si h(X) ∈ k[X] es irreducible y tiene una raı́z en
E1 ∩ E2 , entonces se factoriza totalmente en E1 y en E2 , y por ello, en
E1 ∩ E2 . Se concluye que (E1 ∩ E2 )/k es normal.
Proposición 3.21 Sean F/k una extensión normal y f (X) un elemento
irreducible de k[X] con factores mónicos irreducibles g(X), h(X) ∈ F [X].
Entonces existe un k-automorfismo ϕ de F tal que ϕ(g(X)) = h(X).
Demostración: Podemos suponer que F ⊆ k. Sean α una raı́z de g(X) y β
una raı́z de h(X). Entonces g(X) = Polmin(α, F ), h(X) = Polmin(β, F ).
Como α y β son raı́ces de f (X) que es irreducible sobre k, existe un
k-morfismo ϕ : k(α) → k(β) tal que ϕ(α) = β.
Este morfismo puede extenderse a ϕ : F → k, que a su vez admite una
restricción a un automorfismo de F por ser F/k normal; y que al actuar en
los coeficientes de g(X), se tiene que ϕ(g(X)) = h(X), pues ϕ(α) = β.
Dada una extensión algebraica F/k con F ⊆ k, definimos la cerradura
normal de F/k en k, como la extensión K de F que satisface las siguientes
condiciones claramente equivalentes:
a) K es la intersección de todas las extensiones E ⊆ k de F con E/k
normal.
b) K es el campo generado por ∪σ σ(F ), donde σ varı́a sobre la colección
de todos los k-morfismos de F en k.
c) K es el campo de descomposición de los polinomios mı́nimos de un
conjunto de generadores de F/k.
Observemos que si F/k es finita, entonces la cerradura normal K/k
también lo es, gracias a la condición c).

Ejercicios

1. Construya un campo de descomposición K para X 5 − 2 sobre Q.


Calcule [K : Q].

2. Construya un campo de descomposición F para X 6 − 1 sobre Q.


Calcule [F : Q].

3. Construya una extensión normal K/Q con [K : Q] = 3.

4. Sea α una raı́z de 13X 4 − 29X 2 + 13 ∈ Q[X]. Demuestre que Q(α)/Q


es normal.
104 3. Campos y Teorı́a de Galois

3.4 Separabilidad
Dada una extensión finita de campos F/k, definimos el grado de se-
parabilidad de F/k, escrito [F : k]s , como el número de k-morfismos
ϕ : F → k, donde k es una cerradura algebraica de k. Este número no
depende de la cerradura algebraica elegida, pues si k 0 fuera otra, entonces
existirı́a un k-isomorfismo ψ : k → k 0 que nos permitirı́a construir una
biyección Ψ : Homk (F, k) → Homk (F, k 0 ) del conjunto Homk (F, k) de k-
morfismos de F en k al conjunto Homk (F, k 0 ) de k-morfismos de F en k 0
ası́: Ψ(ϕ) = σ = ψ ◦ ϕ.

ψ
k ^== / k0
¡ ?
== ¡¡
= ¡
ϕ === ¡¡ σ=ψ◦ϕ
¡¡
k
Proposición 3.22 Sea F/k una extensión finita de campos. Entonces:
a) [F : k]s ≥ 1.
b) Si F = k(α), entonces [F : k]s ≤ gr Polmin(α, k). Además, [F : k]s es
el número de raı́ces distintas de Polmin(α, k) en k.
c) [F : k]s = [F : K]s [K : k]s para cualquier campo intermedio K.
d) [F : k]s ≤ [F : k].
Demostración: a) y b) son reenunciados de la Proposición 3.15.
c) resulta de observar que todo k-morfismo ϕ : F → k admite una
restricción a K.
Sabemos que d) vale para el caso de extensiones simples. Como F/k
es una extensión finita, existen α1 , ..., αn tales que F = k(α1 , ..., αn ). La
conclusión se obtiene de observar que [k(α1 , ..., αi+1 ) : k(α1 , ..., αi )]s ≤
[k(α1 , ..., αi+1 ) : k(α1 , ..., αi )]; y que ambos grados son multiplicativos.

La extensión finita F/k se dice separable cuando [F : k]s = [F : k].


Dados una extensión arbitraria de campos K/k y un elemento α ∈ K alge-
braico sobre k, decimos que α es separable sobre k cuando la extensión
(finita) k(α)/k lo es.
Un polinomio en k[X] se llama separable cuando no tiene raı́ces múlti-
ples en k. Por tanto, un elemento α, algebraico sobre k, es separable sobre
k si y sólo si su polinomio mı́nimo lo es.

Proposición 3.23 Sea F/k una extensión finita. Entonces F/k es sepa-
rable si y sólo si todo elemento de F es separable sobre k.
Demostración: Si F/k es separable y α ∈ F , consideramos la cadena
k ⊆ k(α) ⊆ F . La multiplicatividad de los grados implica que [k(α) : k]s =
[k(α) : k], esto es, que α es separable sobre k.
3.4 Separabilidad 105

Recı́procamente, existen α1 , ..., αn ∈ F tales que F = k(α1 , ..., αn ),


con cada αi separable sobre k. Por esto, todo Polmin(αi , k) y su factor
Polmin(αi , k(α1 , ..., αi−1 )) son separables. Ası́,

[k(α1 , ..., αi ) : k(α1 , ..., αi−1 )]s = [k(α1 , ..., αi ) : k(α1 , ..., αi−1 )] para toda i,

obteniéndose [F : k]s = [F : k] de la multiplicatividad de los grados.

Este resultado nos permite definir “separabilidad” con mayor generali-


dad: Una extensión algebraica (no necesariamente finita) K/k es separable
si y sólo si todo elemento de K es separable sobre k. La nueva definición
generaliza a la anterior. Esta es la mayor generalidad para la que definimos
“separabilidad”.

Proposición 3.24 Sea k un campo de caracterı́stica cero. Todo polinomio


irreducible en k[X] es separable. En particular, toda extensión algebraica
de k es separable.
Demostración: Sean 0 6= f (X) ∈ k[X] irreducible de grado positivo y
α ∈ k raı́z de f (X). Sabemos que (α es raı́z múltiple) ⇔ f 0 (α) = 0.
Como f 0 (X) es de grado menor que el de f (X), tenemos que (α raı́z
múltiple) ⇒ f 0 (α) = 0 ⇒ f 0 (X) = 0, lo cual es absurdo porque la carac-
terı́stica es cero.
El resultado anterior dice claramente que los problemas de falta de sepa-
rabilidad se dan solamente en caracterı́stica positiva. Esta es la razón por
la que muchos autores consideran solamente campos de caracterı́stica cero.
Por el contrario, supondremos hasta nuevo aviso, que la caracterı́stica de
los campos que se mencionen es p > 0.
Proposición 3.25 Si el polinomio irreducible f (X) ∈ k[X] no es separa-
ble, entonces f (X) es un polinomio en X p (con coeficientes en k).
Demostración: En la demostración anterior vimos que la hipótesis implica
que f 0 (X) = 0. Como (aX n )0 = naX n−1 = 0 con a 6= 0 es posible solamente
con p | n, se obtiene la conclusión.

Sea k un campo de caracterı́stica p. Recordemos que


µ ¶
p
p| para 1 ≤ i ≤ p − 1.
i
De manera que (a + b)p = ap + bp para todos a, b ∈ k. Como (ab)p = ap bp
también vale para todos a, b ∈ k, tenemos que la función σ : k → k dada
por σ(a) = ap para todo a ∈ k, es un morfismo de anillos, el llamado
morfismo de Frobenius. Escribimos k p = Im σ.
Decimos que una extensión algebraica F/k, no necesariamente finita,
es inseparable pura cuando [F : k]s = 1, es decir, cuando para toda
106 3. Campos y Teorı́a de Galois

cerradura algebraica k de k, existe un único k-morfismo ϕ : F → k. Un


elemento α ∈ F es inseparable puro sobre k cuando [k(α) : k]s = 1. Es
claro que una extensión algebraica F/k es inseparable pura si y sólo si todo
elemento α ∈ F es inseparable puro sobre k.

Proposición 3.26 Dada F/k una extensión algebraica, escribimos A =


{α ∈ F | α separable sobre k} y B = {β ∈ F | β inseparable puro sobre k}.
Entonces A y B son campos y A ∩ B = k.

Demostración: Sean a, b ∈ A con b 6= 0. Entonces b es separable sobre


k(a); y en la cadena k ⊆ k(a) ⊆ k(a, b) se tiene que [k(a) : k]s = [k(a) : k]
y que [k(a, b) : k(a)]s = [k(a, b) : k(a)]. Ası́, k(a, b)/k es separable. En
particular, a ± b, ab, a/b son todos separables sobre k; y A es un campo.
De manera análoga se ve que B es un campo.
Finalmente, c ∈ A ∩ B ⇒ [k(c) : k] = [k(c) : k]s = 1 ⇒ c ∈ k.
En las condiciones de la proposición anterior, decimos que A es la cerra-
dura separable de k en F ; y que B es la cerradura inseparable pura
de k en F . Es claro que todo elemento de F separable sobre A está en A;
y que todo elemento de F inseparable puro sobre B está en B.

Proposición 3.27 Sea α un elemento algebraico sobre k. Las siguientes


condiciones en α son equivalentes:
a) α inseparable puro sobre k.
r
b) El polinomio mı́nimo de α sobre k es de la forma X p − b.
t
c) α es raı́z de un polinomio de la forma X p − c ∈ k[X].

Demostración: La implicación b) ⇒ c) es clara.


t t
Veamos que c) ⇒ a): Si α es raı́z de X p − c, entonces αp = c y ası́
t t t t
(X − α)p = X p − αp = X p − c, por lo que α es raı́z de un polinomio en
k[X] con una sola raı́z. Ası́, [k(α) : k]s = 1.
Para ver a) ⇒ b), digamos que f (X) = Polmin(α, k). Si gr f (X) ≥ 1,
entonces f (X) no es separable y la Proposición 3.25 garantiza que existe
g(Y ) ∈ k[Y ] tal que f (X) = g(X p ). Claramente, g(Y ) es irreducible y
podemos repetir el proceso si g(Y ) no es separable. En algún momento
llegamos a obtener un polinomio h(Y ) ∈ k[Y ] separable e irreducible tal
r r
que f (X) = h(X p ). Sea β = αp , de manera que β es separable sobre k
al ser raı́z de h(Y ). De la cadena k ⊆ k(β) ⊆ k(α) y de [k(α) : k]s = 1, se
r
obtiene que β ∈ k, es decir, que h(Y ) es lineal; y que f (X) = X p − b.

Teorema 3.28 Las extensiones algebraicas separables y las inseparables


puras satisfacen T y C.

Demostración: Supongamos que k ⊆ F ⊆ K y que K/k es una extensión


algebraica separable, entonces todo elemento de K es separable sobre F y
3.4 Separabilidad 107

todo elemento de F es separable sobre k, de manera que K/F y F/k son


separables.
Recı́procamente, si K/F y F/k son separables, sea E la cerradura sepa-
rable de k en K. Es claro que F ⊆ E; y que K es separable sobre E. Por
tanto, K = E. Por otra parte, [K : k]s = 1 ⇔ [K : F ]s = [F : k]s = 1, por
lo que C se satisface en ambos casos.
Para verificar la condición T , supongamos que F1 /k y F2 /k son exten-
siones tales que F1 ⊆ E y F2 ⊆ E para algún campo E.
Supongamos primero que F1 /k es separable y que K es la cerradura sepa-
rable de F2 en F1 F2 . Entonces F2 ⊆ K y todo elemento de F1 es separable
sobre k y sobre F2 , por lo que F1 ⊆ K. Ası́, K = F1 F2 .
Ahora supongamos que [F1 : k]s = 1. Si ϕ : F1 F2 → k = F2 es un
F2 -morfismo, entonces ϕ es también un k-morfismo cuya restricción a F1
es única. Se concluye que ϕ es el único F2 -morfismo de F1 F2 a F2 . Ası́,
[F1 F2 : F2 ]s = 1.

Corolario 3.29 Una extensión algebraica generada por elementos separa-


bles (inseparables puros) es separable (inseparable pura).

Proposición 3.30 Para un campo k de caracterı́stica p las siguientes con-


diciones son equivalentes:
a) k = k p .
b) El morfismo de Frobenius es suprayectivo.
c) Toda extensión algebraica de k es separable.
d) Todo elemento algebraico sobre k es separable.

Demostración: Claramente tenemos que a) ⇔ b) y que c) ⇔ d). Veamos


que a) ⇒ d): Sea α algebraico sobre k con polinomio mı́nimo f (X), que es
entonces mónico e irreducible en k[X]. Si f (X) no es separable, entonces la
Proposición 3.25 garantiza que f (X) = a0 + a1 X p + a2 X 2p + · · · + ar X rp .
Como k = k p , para cada i existe bi ∈ k con ai = bpi ; y entonces el polinomio
f (X) = (b0 +b1 X +b2 X 2 +· · ·+br X r )p no es irreducible. Esta contradicción
demuestra que α es separable.
Finalmente, veamos que d) ⇒ a): Si a ∈ k es tal que a ∈ / k p , entonces
p
existe b ∈ k tal que b ∈ / k y b = a; pero la Proposición 3.27 dice que
entonces b es inseparable puro sobre k. Esta es una contradicción.
Decimos que un campo k es perfecto cuando la caracterı́stica de k es
cero, o bien k satisface las condiciones de la proposición anterior. Dejamos
de suponer que la caracterı́stica de k es p.

Corolario 3.31 Toda extensión algebraica de un campo perfecto es per-


fecta.

Demostración: Si F/k es una extensión algebraica y k es un campo per-


fecto, entonces tendremos para toda extensión algebraica K/F , que K/k
es algebraica y separable. Se concluye que K/F es separable.
108 3. Campos y Teorı́a de Galois

Teorema 3.32 Sea F/k una extensión algebraica con cerradura separable
A y cerradura inseparable pura B. Entonces:
a) F/A es inseparable pura.
b) F/B es separable si F/k es normal.
c) F = AB si F/k es normal.

Demostración: a): Sean α ∈ F y f (X) = Polmin(α, k). Gracias a la


Proposición 3.25, existe un polinomio separable e irreducible h(Y ) ∈ k[Y ]
r r
tal que f (X) = h(X p ). Esto implica que αp ∈ A, es decir, que α es
inseparable puro sobre A. Por tanto, F/A es inseparable pura.
b): Sean α ∈ F, f (X) = Polmin(α, k) y C = {σ(α) | σ es un k −
automorfismo de F }. Como C ⊆ {raı́ces de f (X)}, vemos que C es finito.
Además, α ∈ C.
Si ϕ : F → k es un k-morfismo, entonces ϕ se restringe a un automorfismo
de F porque F/k es normal. Además, ϕ(C) ⊆ C. Como ϕ|C es inyectivo,
tenemos que ϕ|C Qes una biyección.
Sea g(X) = β∈C (X − β). Entonces g(α) = 0 y ψ(g) = g para todo
k-morfismo ψ : F → k. Esto significa que los coeficientes de g quedan fijos
ante todo ψ, por lo que g(X) ∈ B[X]. Esto demuestra que α es separable
sobre B. Por tanto, F/B es separable.
c): Con F/k es normal y γ ∈ F , tenemos que γ es separable e inseparable
puro sobre AB. Ası́, γ ∈ AB.

Ejercicios

1. Sean k un campo de caracterı́stica p > 0 y F/k una extensión finita.


Definimos el grado de inseparabilidad de F/k como [F : k]i =
[F : k]/[F : k]s . Demuestre que:
a) k ⊆ F ⊆ K ⇒ [K : k]i = [K : F ]i [F : k]i ;
b) [F : k]i es una potencia de p.
c) Si α es algebraico sobre k, entonces [k(α) : k]i es la multiplicidad
de α en su polinomio mı́nimo.

2. Sean F/k una extensión finita y F un campo perfecto. Demuestre


que k es perfecto.

3. Sea α algebraico sobre un campo k de caracterı́stica p > 0. Demuestre


que α es separable sobre k si y sólo si k(α) = k(αp ).

4. Dé un ejemplo de una extensión finita de campos que no sea separable


ni inseparable pura.
3.5 Teorı́a de Galois 109

3.5 Teorı́a de Galois


Se dice que una extensión de campos F/k es de Galois cuando es normal
y separable. Como F/k es normal, esto implica que F/k es algebraica.
Dada una extensión arbitraria de campos F/k, definimos su grupo de
Galois, escrito Gal(F/k), como el grupo de los k-automorfismos de F . Si
suponemos que F/k es de Galois y que F ⊆ k, entonces podremos identificar
Gal(F/k) con {ϕ : F → k | ϕ es un k − morfismo}.
Iniciamos con un lema importante:

Lema 3.33 (Artin) Sea G un grupo finito de automorfismos de un campo


F y sea k = F G = {α ∈ F | σ(α) = α para todo σ ∈ G}. Entonces
[F : k] ≤ ◦(G).

Demostración: Digamos que G = {σ1 = 1, σ2 , ..., σn } y supongamos que


A = {β1 , ..., βn+1 } ⊆ F . Veamos que A es linealmente dependiente sobre k.
Consideremos el sistema de n ecuaciones lineales en n + 1 incógnitas
x1 , ..., xn+1 :

σ1 (β1 )x1 + · · · + σ1 (βn+1 )xn+1 = 0


σ2 (β1 )x1 + · · · + σ2 (βn+1 )xn+1 = 0
···
σn (β1 )x1 + · · · + σn (βn+1 )xn+1 = 0 (3.2)

Este sistema admite una solución (0, ..., 0) 6= (a1 , ..., an+1 ) ∈ F n+1 . Des-
pués de reordenar los ı́ndices podemos suponer que

a1 = 1, a2 6= 0, ..., ar 6= 0, ar+1 = 0, ..., an+1 = 0;

y que r es mı́nimo con esta propiedad.


La primera ecuación puede escribirse como a1 β1 + · · · + ar βr = 0.
Afirmamos que ai ∈ k para todo i, lo que demostrará que A es linealmen-
te dependiente sobre k. Supongamos que esto es falso; y que por ejemplo
a2 ∈
/ k. Entonces existe τ ∈ G tal que τ (a2 ) 6= a2 . Aplicamos τ al sistema
(3.2) para obtener
n+1
X
τ σi (βj )τ (aj ) = 0 para 1 ≤ i ≤ n. (3.3)
j=1

Esto dice que 1 = a1 = τ (a1 ), ..., τ (ar ), 0, ..., 0 es otra solución de (3.2),
pues {τ σi } = {σi }. De ambas soluciones obtenemos por diferencia la solu-
ción 0, a2 − τ (a2 ) 6= 0, ..., ar − τ (ar ), 0, ..., 0 con menos términos distintos
de cero. Esta contradicción demuestra que [F : k] ≤ ◦(G).
Decimos que E es un campo intermedio de la extensión F/k cuando
k ⊆ E ⊆ F.
110 3. Campos y Teorı́a de Galois

Teorema 3.34 (Fundamental de la Teorı́a de Galois) Sea F/k una


extensión finita de Galois con G = Gal(F/k). Entonces:
a) La función que a un campo intermedio E le asocia el grupo H de
los E-automorfismos de F , es una biyección del conjunto de los campos
intermedios al conjunto de los subgrupos de G, cuyo inverso envı́a cada
subgrupo de G al conjunto de sus puntos fijos.
b) La extensión F/E es de Galois para todo campo intermedio E.
c) La extensión E/k es de Galois si y sólo si el subgrupo asociado a E es
normal en G. Cuando esto sucede, ϕ : G → Gal(E/k) dado por ϕ(σ) = σ|E
es un morfismo suprayectivo de grupos con núcleo Gal(F/E), de manera
que Gal(E/k) ∼ = G/ Gal(F/E).
d) Si el campo intermedio E está asociado al subgrupo H de G y σ ∈ G,
entonces σE es un campo intermedio asociado al subgrupo σHσ −1 de G.
e) [F : k] = ◦(G).
Demostración: e) Como F/k es separable, [F : k] = [F : k]s . Este último
número es el orden de {k − morfismos ψ : F → k}, que a su vez coincide
con ◦(G) porque F/k es normal y todo k-morfismo ψ se restringe a un
k-automorfismo de F .
b) F/E es normal por la Proposición 3.20; y es separable por el Teorema
3.28.
a) Sean E un campo intermedio y H = {E − automorfismos de F }. Es
claro que H < G. Digamos que
E 0 = F H = {a ∈ F | σ(a) = a, para todo σ ∈ H}.
Entonces es inmediato que E 0 es un campo y que E ⊆ E 0 ⊆ F .
[E 0 : E]s = 1 porque si ψ : E 0 → E = k es un E-morfismo, entonces ψ se
extiende a un E-automorfismo de F , que entonces fija a los elementos de
E 0 ; y es por tanto único. Como E 0 /E es separable, se tiene que E 0 = E.
Hemos demostrado que la función de campos intermedios a subgrupos
de G es inyectiva. Veamos ahora que es suprayectiva.
Si G es un grupo finito de automorfismos de F , entonces F G es un campo.
Si además G ⊆ G, entonces k ⊆ F G . Ahora es suficiente ver que G =
Gal(F/F G ).
Ahora bien, G ⊆ Gal(F/F G ) es una tautologı́a, de manera que se tiene
◦(G) ≤ ◦(Gal F/F G ) = [F : F G ], esto último en vista de e). La desigualdad
[F : F G ] ≤ ◦(G) del Lema 3.33 completa la demostración de a).
d) Si E es un campo intermedio y σ ∈ G, entonces es claro que σE es
otro campo intermedio y que
(H = estabilizador de E) ⇒ (σHσ −1 ⊆ estabilizador de σE).
La igualdad se obtiene por simetrı́a.
c) En vista de d), tenemos que H C G ⇔ σE = E para todo σ ∈ G. Pero
esto último es equivalente a decir que la extensión E/k es normal, que a su
vez es equivalente con E/k de Galois, dado que E/k es separable.
3.5 Teorı́a de Galois 111

En estas condiciones, todo ϕ se puede restringir a E, de manera que


ϕ 7→ ϕ|E es un morfismo suprayectivo de grupos G → Gal(E/k), cuyo
núcleo es claramente Gal(F/E).
Observaciones. Las siguientes afirmaciones son más o menos inmediatas,
en ellas usamos la notación del teorema.

1. La correspondencia del teorema voltea inclusiones. Al campo F le


corresponde el subgrupo {1}; mientras que al campo k le corresponde
el subgrupo G.

2. Si en la correspondencia del teorema, E1 ←→ H1 y E2 ←→ H2 ,


entonces E1 E2 ←→ H1 ∩ H2 y E1 ∩ E2 ←→ hH1 , H2 i. Esto se puede
verificar directamente o deducir de la observación anterior.

3. Una extensión finita de Galois admite un número finito de campos


intermedios. Esto es porque un grupo finito tiene un número finito
de subgrupos.

4. Una extensión separable finita E/k admite un número finito de cam-


pos intermedios. Esto es porque al tomar una cerradura normal F ,
obtenemos la extensión finita de Galois F/k, que admite un número
finito de campos intermedios.

Teorema 3.35 (Steinitz) Una extensión finita F/k es simple si y sólo si


el número de campos intermedios es finito.

Demostración: Supongamos que F = k(α) es simple y que f (X) =


Polmin(α, k). Si E es un campo intermedio, entonces consideramos a g(X) =
Polmin(α, E) y llamamos K al campo generado por los coeficientes de g(X)
sobre k.

E
k

k
Tenemos que F = K(α) y que [F : K] ≤ gr g(X) = [F : E]. De aquı́
se obtiene que E = K está determinado por los coeficientes de g(X). El
número de posibilidades para campos intermedios es finito, debido a que
g(X) | f (X).
Recı́procamente, supongamos que el número de campos intermedios es
finito y consideremos dos casos:
Cuando k es finito, F también lo es; y entonces F ? es cı́clico. Todo ge-
nerador de F ? genera a F sobre k .
112 3. Campos y Teorı́a de Galois

Cuando k es infinito, consideramos solamente el caso F = k(u, v), al


cual llegamos por inducción, al ser F finitamente generado sobre k. Como
k es infinito mientras que la colección de campos intermedios es finita, se
obtienen elementos distintos b, c ∈ k tales que k(u + bv) = k(u + cv); y
entonces
(u + bv) − (u + cv)
v= ∈ k(u + bv) y también u ∈ k(u + bv).
b−c
Esto implica que k(u, v) = k(u + bv).
Teorema 3.36 (del Elemento Primitivo) Toda extensión separable y
finita es simple.
Demostración: Se sigue del Teorema 3.35 y de la Observación 4.
Teorema 3.37 (Artin) Sea G un grupo finito de automorfismos de un
campo F y sea k = F G . Entonces F/k es una extensión finita de Galois
con Gal(F/k) = G.
Demostración: Dado α ∈ F , existe un subconjunto máximo {σ1 , . . . , σn }
de G tal que σi (α) 6= σj (α) si 6= j. Escribimos σi (α) = αi , con α = α1 .
El polinomio f (X) = (X − α1 ) · · · (X − αn ) es separable, se anula en α,
se factoriza totalmente en F [X] y es de grado n ≤ ◦(G).
Debido a la maximalidad de {σ1 , . . . , σn }, el polinomio f (X) queda fijo
ante la acción de G: Para γ ∈ G, el conjunto {γσi (α)} no puede contener
nada nuevo. Ası́, f (X) ∈ k[X] y F/k es una extensión algebraica separable.
Vemos que F es el campo de descomposición de los polinomios mı́nimos
sobre k de todos sus elementos. Ası́, F/k es normal y de Galois.
Por el Lema 3.33, tenemos que [F : k] ≤ ◦(G); pero [F : k] = ◦(Gal(F/k))
y G ⊆ Gal(F/k) implican que G = Gal(F/k) y que F/k es una extensión
finita.
Teorema 3.38 Sean E y F extensiones de k contenidas en un campo con
E/k finita de Galois. Entonces EF/F y E/(E ∩ F ) también son finitas de
Galois, con grupos de Galois isomorfos.
Demostración: Las extensiones EF/F y E/(E ∩ F ) son finitas y de
Galois gracias a las Proposiciones 3.8 y 3.20; y al Teorema 3.28. Dado
σ ∈ Gal(EF/F ), tenemos que σ|k = 1 y que E/k normal ⇒ σ(E) = E.
Esto nos permite definir una función f : Gal(EF/F ) → Gal(E/E ∩ F ) ası́:
f (σ) = σ|E .
Es claro que f es un morfismo de grupos. Supongamos que σ ∈ ker f .
Entonces σ|E = 1. Como σ|F = 1, tenemos que σ = 1 en EF , de manera
que f es inyectivo.
Sea G = Im f , entonces a ∈ E G ⇔ a ∈ E ∩ F . Por tanto, el campo
intermedio de E G es E ∩ F . Del Teorema Fundamental se obtiene que
G = Gal(E/E ∩ F ), por lo que f es suprayectivo.
3.5 Teorı́a de Galois 113

Teorema 3.39 a) Si F es una extensión finita de Galois de k con grupo


de Galois G ∼ = G1 × G2 , entonces los campos E1 = F G1 y E2 = F G2
satisfacen F = E1 E2 y k = E1 ∩ E2 . Además, las extensiones E1 /k y E2 /k
son finitas de Galois.
b) Recı́procamente, si E1 /k y E2 /k son extensiones finitas de Galois
con E1 y E2 contenidos en un campo, k = E1 ∩ E2 , H = Gal(E1 /k) y
K = Gal(E2 /k), entonces la extensión E1 E2 /k es finita de Galois con
grupo G ∼= H × K.

Demostración: a) Como G1 , G2 C G, tenemos que las extensiones E1 /k


y E2 /k son normales; y por tanto, finitas y de Galois.
El subgrupo de G asociado a E1 E2 es G1 ∩ G2 = {1}, ası́ E1 E2 = F .
Similarmente, E1 ∩E2 corresponde a G1 G2 = G; y por tanto, E1 ∩E2 = k.

F
k

E1 E2I
G1 uuu II G2
II
uuu II
u
E1 I E2
II uu
II u
II uu
H uu K
E1 ∩ E2
k

b) El Teorema 3.38 implica que Gal(E1 E2 /E2 ) ∼


= Gal(E1 /E1 ∩ E2 ) = H
y que Gal(E1 E2 /E1 ) ∼
= Gal(E2 /E1 ∩ E2 ) = K. Además, las extensiones
E1 y E2 de k son normales. Por tanto, E1 E2 /k es una extensión finita de
Galois; y también H, K C G = Gal(E1 E2 /k) .
Ahora bien, HK corresponde a E1 ∩ E2 = k y por eso, HK = G.
Finalmente, H ∩ K está asociado con E1 E2 , por lo que H ∩ K = {1}, que
termina la demostración.

Sean k un campo y f (X) ∈ k[X] un polinomio separable de grado posi-


tivo. Existe un campo de descomposición F de f (X) sobre k, de manera
que la extensión F/k es finita de Galois.
Definimos el grupo de Galois de f (X) sobre k, escrito Gal(f /k) como
Gal(F/k). Observamos que el isomorfismo de campos de descomposición de
un polinomio dado, implica que la definición es correcta, al no depender
del campo F .
Cada elemento de Gal(f /k) queda determinado por su acción en el con-
junto de las raı́ces de f (X). Si gr f (X) = n, entonces obtenemos un mor-
fismo inyectivo ψ : Gal(f /k) ,→ Sn .
114 3. Campos y Teorı́a de Galois

Ejemplos.
2
1. Sean k un campo
√ con caract k 6= 2 y f (X) = aX + bX + c ∈ k[X].
2
Aquı́, F = k( b − 4ac) es un campo de descomposición para f (X)
sobre k. Tenemos que f (X) es irreducible en k[X] ⇔ F 6= k ⇔

/ k ⇔ [F : k] = 2 ⇔ Gal(F/k) ∼
b2 − 4ac ∈ = S2 ∼
= Z2 .
2. Sean k un campo con caract k 6= 2 y f (X) ∈ k[X] un polinomio
separable de grado n con raı́ces r1 , ..., rn ∈ k, F = k(r1 , ..., rn ) y
G = Gal(F/k), de manera que G ,→ Sn .
Q
Definimos ∆ = i<j (ri − rj ), para tener
G ∩ An = {σ ∈ G | σ(∆) = ∆}, (3.4)
donde An es el grupo alternante.
3. Sean k un campo con caract k 6= 2, 3 y f (X) = X 3 + pX + q ∈ k[X]
un polinomio separable e irreducible en k[X] con raı́ces r1 , r2 , r3 ; de
manera que F = k(r1 , r2 , r3 ) es un campo de descomposición de f (X)
sobre k.
Entonces G = Gal(f /k) = Gal(F/k) ,→ S3 actúa transitivamente
en {r1 , r2 , r3 }, por lo que 3 | ◦ (G); y una de dos : G ∼= A3 ó bien
G∼ = S3 . Es fácil decidir cual de las dos alternativas ocurre usando el
ejemplo anterior y escribiendo D = ∆2 : En el Ejercicio 2.8.1 se pidió
demostrar que D = −4p3 − 27q 2 , por lo que G ∼ = A3 ⇔ G ∩ A3 =
G ⇔ σ(∆) = ∆ para todo σ ∈ G ⇔ ∆ ∈ k ⇔ D ∈ k 2 .
El Ejercicio 2.8.5 permite resolver el mismo problema para el caso en
que f (X) = X 3 − a1 X 2 + a2 X − a3 .
4. Sean k un campo, R = k[T1 , ..., Tn ] el anillo de polinomios en n
variables sobre k y F = k(T1 , ..., Tn ) el campo de fracciones de R.
Escribimos los polinomios simétricos elementales ası́:
s1 = T1 + · · · + Tn , s2 = T1 T2 + · · · , ..., sn = T1 · · · Tn .

Sea K = k(s1 , ..., sn ). Aquı́, F es un campo de descomposición sobre


K del polinomio separable
n
Y
f (X) = (X − Ti ) = X n − s1 X n−1 + · · · + (−1)n sn .
i=1

La extensión finita de Galois F/K tiene un grupo de Galois G que


deseamos calcular. Sabemos que G ,→ Sn .
Dada una permutación σ ∈ Sn , tenemos una acción natural de σ
como k-automorfismo de F ası́:
g(T1 , ..., Tn ) g(Tσ(1) , ..., Tσ(n) )
σ = , donde g(T ), h(T ) ∈ R.
h(T1 , ..., Tn ) h(Tσ(1) , ..., Tσ(n) )
3.5 Teorı́a de Galois 115

Como σ|K es la identidad, obtenemos un morfismo Sn ,→ G que nos


da G = Sn .
Consideremos la cadena K = K0 ⊆ K1 ⊆ · · · ⊆ Kn−1 = F, donde
Ki = Ki−1 (Ti ), de manera que Ki /Ki−1 es simple con elemento pri-
mitivo Ti , que es raı́z del polinomio

f (X)
fi (X) = ∈ Ki−1 [X],
(X − T1 ) · · · (X − Ti−1 )

que es de grado n − i + 1. Esto implica que [Ki : Ki−1 ] ≤ n − i + 1,


para 1 ≤ i ≤ n − 1. Observe que fi (X) ∈ k[s1 , ..., sn , T1 , ..., Ti−1 ][X].
Como
n−1
Y
(n − i + 1) = n(n − 1) · · · 2 = n! = ◦(Sn ) = [F : K],
i=1

se ve que [Ki : Ki−1 ] = n − i + 1, para 1 ≤ i ≤ n − 1; y que


fi (X) = Polmin(Ti , Ki−1 ).
Dado un polinomio arbitrario p(T1 , ..., Tn ) ∈ R, podemos usar la
relación Tn = s1 − T1 − · · · − Tn−1 , para eliminar Tn en favor de
las otras Ti y de s1 . Después usamos fn−1 (X), que es de grado dos,
2
para eliminar a Tn−1 , expresándolo como polinomio en Tn−1 de grado
≤ 1 con coeficientes en k[s1 , ..., sn , T1 , ..., Tn−2 ]. Continuamos este
proceso hasta expresar a p(T1 , ..., Tn ) como combinación lineal de
los n! monomios T1r1 T2r2 · · · Tnrn , con ri ≤ n − i, para 1 ≤ i ≤ n,
con coeficientes en k[s1 , ..., sn ]. Además, para cada i, el conjunto
{1, Ti , ..., Tin−i } es una base de Ki sobre Ki−1 , por lo que los n!
monomios mencionados forman una base de F sobre K. Esto im-
plica que la expresión de p(T1 , ..., Tn ) indicada, es única. Observe que
en ninguno de estos monomios aparece Tn , por lo que si p(T1 , ..., Tn )
es simétrico, entonces solamente aparece el término constante.

Como consecuencia: Todo polinomio simétrico con coeficientes


en un campo, es un polinomio único en los polinomios simé-
tricos elementales. Compare este resultado con el Teorema 2.60.

5. Sea G un grupo finito arbitrario. Sabemos que G ⊆ Sn para algún


entero n. Usando la notación del ejemplo anterior, sea E = F G . Te-
nemos la cadena de campos K ⊆ E ⊆ F , donde G = Gal(F/E). Ası́,
vemos que todo grupo finito es el grupo de Galois de una extensión
finita de campos. Un caso
Q particular es el del grupo alternante, donde
E = K(∆), con ∆ = i<j (Ti − Tj ), suponiendo que caract 6= 2.
116 3. Campos y Teorı́a de Galois

6. Sean k un campo con caract k = 0 y k(T ) el campo de las funciones


racionales en una variable sobre k. Supongamos que existe 1 6= ω ∈ k
tal que ω 3 = 1. Consideremos dos k-automorfismos α y β de k(T )
definidos ası́: α(T ) = ωT y β(T ) = T −1 . Sea G = hα, βi. Nos pro-
ponemos estudiar G y k(T )G .
Observamos que α es de orden tres, mientras que β es de orden
dos; y que βαβ −1 = α2 . De manera que G admite la presentación
hα, β | α3 = β 2 = 1, βαβ −1 = α2 i, en la que reconocemos a S3 , o
bien descubrimos que existe un isomorfismo de grupos f : G → S3
tal que f (α) = (123) y f (β) = (12).
Una inspección del escenario nos permite descubrir al elemento u =
T 3 +T −3 ∈ k(T )G . La ecuación T 3 u = T 6 +1 implica que la extensión
k(T )/k(u) es algebraica con [k(T ) : k(u)] ≤ 6.
El Teorema de Artin afirma que k(T )/k(T )G es una extensión de
Galois de grado 6 con grupo de Galois G, por lo que tenemos el
siguiente diagrama:

k(T )
HH
HH6
HH
H
≤6 k(T )G
vv
v
vv
vv
k(u)

De lo anterior se concluye que k(T )G = k(u) y que [k(T ) : k(u)] = 6.

7. Sean p un número primo y f (X) ∈ Q[X] un polinomio irreducible


con p − 2 raı́ces reales y dos raı́ces complejas conjugadas. Afirmamos
que G = Gal(f /Q) ∼ = Sp .
Sabemos que G ,→ Sp ; y que G actúa transitivamente en el conjunto
de las p raı́ces de f (X). Esto implica que p | ◦ (G) y que G contiene
un p-ciclo.
Conjugación compleja estabiliza al conjunto de las raı́ces de f (X); y
por tanto, al campo de descomposición de f (X). Ası́ obtenemos una
transposición en G. Como una transposición y un p-ciclo generan a
Sp , Ejercicio 1.7.2, se concluye que G ∼
= Sp .

8. Calcularemos Gal(f /Q) con f (X) = (X 2 −3)(X 2 −7)(X 2 −17). Sean


F el campo de descomposición de f (X) sobre Q; y sean E1 , E2 , E3 los
campos de descomposición de X 2 −3, X 2 −7, X 2 −17 respectivamente,
también sobre Q.
3.6 Campos Reales 117

A partir de la Proposición 3.4, tenemos que E1 ∩ E2 = Q y que


E1 E2 ∩ E3 = Q. Como para 1 ≤ i ≤ 3, tenemos que Gal(Ei /Q) ∼= Z2 ,
el Teorema 3.39 nos permite concluir que Gal(f /Q) ∼
= Z2 × Z2 × Z2 .

Ejercicios

1. Describa al grupo Aut Q( 3 3).
2. Calcule el grupo Gal(X 3 − 4X + 2/Q).
3. Calcule el grupo Gal(X 6 − 2/Q).
4. Dada la cadena de campos k ⊂ F ⊆ k(X), demuestre que la extensión
k(X)/F es algebraica.
5. Sean p un número primo y α, β, γ ∈ C tales que
α + β + γ = αβ + αγ + βγ = αβγ = p.
Demuestre que Q(α, β, γ) tiene un automorfismo σ tal que
σ(α) = β, σ(β) = γ, σ(γ) = α.

6. Sean F/k una extensión finita de Galois con G = Gal(F/k) y


K = {u ∈ F | στ (u) = τ σ(u), ∀ σ, τ ∈ G}.
Demuestre K es un campo, que la extensión K/k es normal y que
Gal(K/k) es abeliano.

3.6 Campos Reales


Se dice que un campo K es un campo ordenado cuando está provisto de
un subconjunto K+ tal que:
1. Dado a ∈ K, se tiene exactamente una de las tres posibilidades:
a ∈ K+ , a = 0, −a ∈ K+ .
2. a, b ∈ K+ ⇒ a + b, ab ∈ K+ .
Los elementos de K+ se llaman positivos.
En todo campo ordenado K, se tiene que 1 ∈ K+ , pues
−1 ∈ K+ ⇒ (−1)(−1) ∈ K+ .
Además, 1 + · · · + 1 ∈ K+ para cualquier número de sumandos, por lo que
caract K = 0.
En un campo ordenado K, se tiene una relación de orden definida ası́:
a<b ⇔ b − a ∈ K+ .
Se dice que un campo ordenado R es real cerrado cuando cumple:
118 3. Campos y Teorı́a de Galois

1. a ∈ K+ ⇒ existe b ∈ R tal que b2 = a.

2. Todo polinomio en R[X] de grado impar tiene una raı́z en R.

Ejemplos. Como prototipos de campos reales cerrados tenemos a R y a


la cerradura algebraica de Q en R. Un punto de vista a veces conveniente,
consiste en pensar que los resultados demostrados en esta sección son para
R; y que el enfoque es algebraico, por lo que las propiedades de R que se
usan son las que definen a un campo real cerrado.


Teorema 3.40 Sean R un campo real cerrado y C = R( −1), entonces
C es algebraicamente cerrado.

Demostración:(Gauss-Artin)
√ Como −1 no es un cuadrado en R, el
2
campo C = R( −1) = √ R[X]/(X + 1) es una extensión de R de grado
dos. Escribiendo i = −1, tenemos que {1, i} es una base de C como
espacio vectorial sobre R.
Afirmamos que todo elemento de C admite una raı́z cuadrada en C. Si
a + bi ∈ C con a, b ∈ R, entonces

√ √
a2 + b2 + a a2 + b2 − a
, ≥0
2 2

garantizan la existencia de c, d ∈ R tales que

√ √
2 a2 + b2 + a 2 a2 + b2 − a
c = ,d = .
2 2

En estas condiciones, (c + di)2 = a + bi, al escoger los signos de c, d ade-


cuadamente.
El Ejemplo 1 de la sección anterior garantiza que C no admite extensiones
de grado dos. Veremos ahora que C no admite extensiones finitas propias.
Supongamos que E/C es una extensión finita, entonces también lo son
E/R, F/C y F/R, al tomar una cerradura normal F de E/C.
La extensión F/R es entonces finita de Galois. Sean G = Gal(F/R), H
un 2-subgrupo de Sylow de G y K = F H .
Por el Teorema 3.34, tenemos que [K : R] = ◦(G) / ◦ (H) es un número
impar. Como la extensión K/R es separable; y por tanto, simple, existe
α ∈ K, raı́z de un polinomio en R[X] irreducible de grado impar, tal que
K = R(α). La hipótesis de que R es real cerrado implica que R = K.
3.6 Campos Reales 119

F0
00
00
0 n
E 0020
00
0
C K
}
}}}}}
}
}}}}}
R
De lo anterior, concluimos que G es un 2-grupo; y lo mismo es cierto
de su subgrupo Gal(F/C), que de no ser trivial, admitirı́a un subgrupo de
ı́ndice dos, cuyo campo de puntos fijos vendrı́a a ser una extensión de C de
grado dos. Ası́, F = C.
Corolario 3.41 (Teorema Fundamental del Algebra) El campo C es
algebraicamente cerrado.
Teorema 3.42 (del Valor Intermedio) Sean R un campo real cerrado
y f (X) ∈ R[X]. Si α < β ∈ R son tales que f (α)f (β) < 0, entonces existe
γ ∈ R con α < γ < β y f (γ) = 0.
Demostración: Supongamos que f (X) es mónico. El Teorema 3.40 nos
permite saber que la factorización irreducible del polinomio es
Y
f (X) = (X − ri )(X 2 + bj X + cj ),
i,j

donde b2j − 4cj < 0 para todo j, por lo que para cualesquiera γ y j se tiene

bj 2 b2j
(γ 2 + bj γ + cj ) = (γ + ) + (cj − ) > 0.
2 4
Ası́, β > α > ri para toda i implica que
Y
f (α)f (β) = (α − ri )(β − ri )(α2 + bj α + cj )(β 2 + bj β + cj ) > 0.
i,j

Similarmente, α < β < ri para toda i, implica que f (α)f (β) > 0. Se
concluye que para algún i, se cumple α ≤ ri ≤ β.
Ejemplo. Sean p un número primo, f (X) = X 4 − p ∈ Q[X] y G =
Gal(f /Q). El polinomio f (X) es irreducible sobre Q por el Criterio de
Eisenstein. Sea α una raı́z de f (X), entonces [Q(α) : Q] = 4.
El conjunto de las raı́ces de f (X) es {±α, ±iα}, por ser {±1, ±i} el
conjunto de las raı́ces de X 4 − 1, donde i2 = −1. Como X 2 + 1 es irre-
ducible, tenemos que [Q(i) : Q] = 2. La extensión Q(i)/Q es de Galois con
Gal(Q(i)/Q) ∼= Z2 .
120 3. Campos y Teorı́a de Galois

Vemos que Q(α, i) es un campo de descomposición de f (X). Podemos


suponer que α es real, de manera que i ∈
/ Q(α), por lo que Q(α)∩Q(i) = Q.
Ası́, el Teorema 3.38 nos permite saber que Gal(Q(α, i)/Q(α)) ∼ = Z2 .
Además, este grupo está generado por σ, restricción a Q(α, i) de conju-
gación compleja.

Q(α, i)
v HH
2 vvv HH
v HH
vv HH
vv H
Q(α) Q(i)
II v
II vv
II vv2
4 III vv
I vv
Q

Tenemos que ◦(G) = [Q(α, i) : Q] = 8; y que G actúa transitivamente en


el conjunto de las raı́ces de f (X), por lo que existe τ ∈ G tal que τ (α) = iα.
- ¿Como actúa τ en i?
- Siendo τ un Q-automorfismo, τ (X 2 +1) = X 2 +1; y entonces τ (i) = ±i.
En todo caso, τ ó bien στ fija al elemento i.
Existe pues µ ∈ {τ, στ } ⊆ G tal que µ(i) = i, µ(α) = ±iα.
El orden de µ es cuatro, G = hµ, σi; y G queda descrito por la pre-
sentación hµ, σ | µ4 = σ 2 = 1, σµσ −1 = µ−1 i, por lo que G ∼ = D4 . Ver el
Ejercicio 1.12.1.
Si a1 , a2 , ..., an es una sucesión de elementos distintos de cero en un
campo ordenado R, definimos el número de cambios de signo de la
sucesión como el número de ı́ndices i tales que ai ai+1 < 0. El número de
cambios de signo de una sucesión arbitraria es el de la subsucesión obtenida
al omitir toda ocurrencia de 0.
Existe otra posibilidad para contar el número de cambios de signo de una
sucesión a1 , a2 , ..., an que contiene ceros, que es diametralmente opuesta a
la anterior, le llamaremos el número aumentado de cambios de signo
de la sucesión, para definirlo supongamos que ak+1 = · · · = ak+r−1 = 0;
pero que ak , ak+r 6= 0. Nuestro valor será el número de cambios de signo
de la sucesión obtenida de la sucesion original al reemplazar cada ak+j por
(−1)j ak para 1 ≤ j ≤ r − 1. Notemos que este proceso produce el máximo
número de cambios de signo posible, para sucesiones obtenidas a partir de la
sucesion original, reemplazando las ocurrencias de cero por otros números.

Teorema 3.43 (Budan) Sean R un campo real cerrado y f (X) ∈ R[X]


con gr f (X) = n. Escribimos Vc el número de cambios de signo de la
sucesión f (c), f 0 (c), ..., f (n) (c); y Vc0 el número aumentado de cambios de
signo de la misma sucesión. Si a, b ∈ R son tales que a < b, f (a)f (b) 6= 0
y A es el número de raı́ces de f (X) en el intervalo abierto (a, b), entonces
Va − Vb0 − A es un entero par no negativo.
3.6 Campos Reales 121

Demostración: Por simplicidad, razonaremos como si R = R.


Estudiaremos el comportamiento de Vx para la sucesión
f (x), f 0 (x), ..., f (n) (x) (3.5)
a medida que x crece. Este valor permanece constante en cualquier intervalo
que no incluya raı́ces de los polinomios en (3.5).
Estudiemos primero el caso en que α es raı́z de f (X) de multiplicidad k,
es decir, f (α) = f 0 (α) = · · · = f (k−1) (α) = 0; pero f (j) (α) 6= 0 para j ≥ k.
Existe ² > 0 tal que el intervalo (α − 2², α + 2²) no contiene más raı́ces de
polinomios en (3.5) que α.
Afirmamos que en la sucesión f (α − ²), f 0 (α − ²), ..., f (k) (α − ²), dos
números consecutivos siempre tienen signos opuestos. Esto es ası́ porque
si alguno de ellos (exceptuando al último) es positivo, el polinomio corres-
pondiente decrece; mientras que si es negativo, el polinomio crece.
Por otra parte, en la sucesión f (α + ²), f 0 (α + ²), ..., f (k) (α + ²), dos
números consecutivos siempre tienen signos iguales, pues si alguno de ellos
(exceptuando al último) es positivo, el polinomio correspondiente crece;
mientras que si es negativo, el polinomio decrece.
Se concluye que el paso de x por α produce una pérdida de k cambios
de signo en (3.5).
Consideremos ahora el caso en que α es raı́z de f (r) (X) de multiplicidad
k, con r ≥ 1, es decir, f (r) (α) = f (r+1) (α) = · · · = f (r+k−1) (α) = 0; pero
f (r+j) (α) 6= 0 para j ≥ k.
Aquı́, el paso de x por α produce una pérdida de k cambios de signo en
f (r) (x), f (r+1) (x), ..., f (r+k) (x); pero tal vez se recupere un cambio de signo
en f (r−1) (x), f (r) (x). El efecto total es una pérdida de un número par de
cambios de signo en (3.5), pues f (r−1) (x) y f (r+k) (x) preservan su signo.
Tenemos demostrado el teorema si a y b no son raı́ces de f (X), ni de sus
derivadas, pues los casos anteriores cubren todas las posibilidades.
Cuando alguno de los números a y b es raı́z de alguna derivada de f (X);
pero f (a)f (b) 6= 0, existe ² > 0 tal que el intervalo (a−2², a+2²) no contiene
más raı́ces de f (X) ó sus derivadas que a; y el intervalo (b − 2², b + 2²)
tampoco contiene más raı́ces de f (X) o sus derivadas que b. Aquı́, Va =
Va+² y Vb0 = Vb−² ; mientras que las raı́ces de f (X) en (a, b) son las mismas
que las contenidas en (a + ², b − ²).
Corolario 3.44 (Regla de los Signos de Descartes) Sean R un campo
real cerrado y f (X) = an X n + an−1 X n−1 + · · · + an−s X n−s ∈ R[X] con
an an−s 6= 0. Sean A el número de raı́ces positivas de f (X) y B el número
de cambios de signo en {an , an−1 , ..., an−s }. Entonces B − A es un entero
par no negativo.
Demostración: Dividiendo f (X) entre X n−s , excluimos las raı́ces iguales
a cero, por lo que podemos suponer que n − s = 0.
Tomamos a = 0 y un número 0 < b ∈ R lo suficientemenete grande,
mayor que todas las raı́ces tanto de f (X) como de sus derivadas, hasta
122 3. Campos y Teorı́a de Galois

garantizar que Vb = Vb0 = 0, donde Vb0 es el número aumentado de cambios


de signo en f (b), f 0 (b), ..., f (n) (b). Por otro lado, Va , que es el número de
cambios de signo en a0 , a1 , ..., an , también lo es para an , an−1 , ..., a0 . La
conclusión es inmediata, usando el Teorema de Budan.
Estudiaremos a continuación el número de raı́ces contenidas en un in-
tervalo (a, b) de un campo real cerrado R, para el caso de un polinomio
separable f (X) ∈ R[X] .
Sea f (X) ∈ R[X] un polinomio separable. Diremos que una sucesión
finita f (X) = f0 (X), ..., fs (X) de polinomios distintos de cero en R[X] es
una sucesión de Sturm cuando se cumplan las siguientes condiciones:
1. Dos polinomios consecutivos cualesquiera de la sucesión, no tienen
raı́ces comunes.
2. fs (X) no tiene raı́ces en R.
3. Si f (α) = 0, entonces el producto f (x)f1 (x) cambia de signo: de
negativo a positivo, al paso ascendente de x por α.
4. Si fj (α) = 0, con 1 ≤ j < s, entonces fj−1 (α)fj+1 (α) < 0.
Proposición 3.45 Dado un polinomio separable f (X) ∈ R[X], con R real
cerrado, la siguiente es una sucesión de Sturm: f0 (X) = f (X), f1 (X) =
f 0 (X), ..., fs (X), donde fj+1 (X) = −r(X) para j ≥ 1, en caso de que
fj−1 (X) = q(X)fj (X) + r(X) exprese el algoritmo euclideano y r(X) 6= 0.
Demostración: De la igualdad de ideales
(f0 (X), f1 (X)) = (f1 (X), f2 (X)) = · · · = (fs (X)),
se obtiene que fs (X) = m.c.d.{f (X), f 0 (X)} 6= 0 es constante; y que la
sucesión cumple las condiciones 1 y 2.
A partir de la definición fj−1 (X) = q(X)fj (X) − fj+1 (X), se tiene para
cualquier raı́z α de fj (X), que fj−1 (α) = −fj+1 (α); y la condición 4 se
cumple.
Finalmente, si f (α) = 0 con f 0 (α) > 0, entonces f (X) = (X − α)g(X),
donde g(α) 6= 0 y además f 0 (X) = (X − α)g 0 (X) + g(X), por lo que
f 0 (α) = g(α) > 0. De manera que existe ² > 0 tal que f 0 (X)g(X) 6= 0 en
(α − ², α + ²) y entonces f (X)f 0 (X) = (X − α)g(X)f 0 (X) cambia de signo:
de negativo a positivo, al paso ascendente de x por α.
La sucesión de la proposición se llama sucesión de Sturm standard.
Teorema 3.46 (Sturm) Sean f (X) ∈ R[X] separable de grado positivo,
R real cerrado y
f (X) = f0 (X), f1 (X), ..., fs (X) (3.6)
una sucesión de Sturm. Para dos elementos a, b ∈ R tales que f (a)f (b) 6= 0,
el número de raı́ces de f (X) en el intervalo (a, b) es Va − Vb , donde Vc es
el número de cambios de signo en f0 (c), f1 (c), ..., fs (c).
3.6 Campos Reales 123

Demostración: Estudiemos el comportamiento de Vx a medida que x


crece: El valor de Vx es constante en cualquier intervalo que no contenga
raı́ces de polinomios en la sucesión de Sturm.
Supongamos que fj (r) = 0, con 1 ≤ j < s. Entonces fj−1 (r)fj+1 (r) < 0;
y además existe ² > 0 tal que el intervalo (r − 2², r + 2²) no contiene raı́ces
de fj−1 (X) ni de fj+1 (X), ni tampoco más raı́ces de fj (X) que r. De esta
manera, tanto fj−1 (X) como fj+1 (X) preservan sus signos (opuestos) en
(r − 2², r + 2²), por lo que las sucesiones

fj−1 (r − ²), fj (r − ²), fj+1 (r − ²) y fj−1 (r + ²), fj (r + ²), fj+1 (r + ²)

tienen el mismo número de cambios de signo. Ası́, Vx permanece constante


al paso ascendente de x por r.
Supongamos ahora que r es raı́z del mismı́simo f (X), entonces f1 (r) 6= 0;
y existe ² > 0 tal que el intervalo (r −2², r +2²) no contiene raı́ces de f1 (X),
que por tanto mantiene su signo. Si f1 (r) > 0, entonces la condición 3
implica que f (r − ²) < 0, f (r + ²) > 0. Ası́, las sucesiones f (r − ²), f1 (r − ²)
y f (r + ²), f1 (r + ²) tienen signos −+ y ++ respectivamente, perdiéndose
un cambio de signo al paso ascendente de x por r.
Un estudio similar cuando f1 (r) < 0, también conduce a la pérdida de
un cambio de signo al paso ascendente de x por r.
La conclusión es que Vx solamenta cambia al paso ascendente de x por
cada raı́z de f (X), descendiendo cada vez en una unidad.
Ejemplo. Si definimos los siguientes polinomios:

f0 (X) = X 3 + pX + q,
f1 (X) = 3X 2 + p,
f2 (X) = −2pX − 3q,
f3 (X) = −4p3 − 27q 2 , (3.7)

con p, q ∈ k y p 6= 0, entonces tendremos que


1 1
f0 (X) = Xf1 (X) − f2 (X),
3 3
3 9q 1
f1 (X) = −( X + 2 )f2 (X) − 2 f3 (X), (3.8)
2p 4p 4p
por lo que f0 (X), f1 (X), f2 (X), f3 (X) es una sucesión de Sturm.
A partir de un número suficientemenete grande, los signos de la sucesión
de Sturm se estabilizan, también son estables estos signos para valores
menores a cierto número. Supongamos que −4p3 −27q 2 > 0. Entonces p < 0
y “f0 (−∞), f1 (−∞), f2 (−∞), f3 (−∞)” tiene signos − + −+, mientras que
“f0 (∞), f1 (∞), f2 (∞), f3 (∞)” tiene signos + + ++. Ası́, X 3 + pX + q tiene
sus tres raı́ces en k.
Si −4p3 − 27q 2 < 0, entonces “f0 (−∞), f1 (−∞), f2 (−∞), f3 (−∞)” tiene
signos − + ±−, mientras que “f0 (∞), f1 (∞), f2 (∞), f3 (∞)” tiene signos
+ + ±−. Ası́, X 3 + pX + q tiene exactamente una raı́z en k.
124 3. Campos y Teorı́a de Galois

3 2
Supongamos ahora
p que −4p − 27q > 0 y que R = R. Aquı́, p < 0 y la
substitución X = −4p/3 Y produce
r r
8 −p 3 −p
3
X + pX + q = (−p) Y + 2p Y + q = A(4Y 3 − 3Y − c),
3 3 3
r
2 −p q 3q
con A = − p y c=− = p .
3 3 A 2p −p/3
Nos concentramos en resolver la ecuación 4Y 3 − 3Y = c. Como se tiene que

27q 2
c2 = − < 1 ⇔ −27q 2 > 4p3 ⇔ −4p3 − 27q 2 > 0,
4p3

existe un ángulo β tal que cos β = c; y la identidad 4cos3 α − 3 cos α =


cos 3α, nos permite resolver trigonométricamente nuestra ecuación cúbica:

β β + 2π β + 4π
Y = cos( ), cos( ), cos( ), para cualquier β con cos β = c.
3 3 3

Ejercicios
1. Describa al grupo Aut R.

2. Sea K un campo ordenado. Demuestre que K+ no está bien ordenado.

3. Sean f (X) = X n + an−1 X n−1 + · · · + a0 ∈ K[X], con K un campo


ordenado; y α una raı́z de f (X) en K. Demuestre que α está en el
intervalo (−M, M ), donde M = 1 + |an−1 | + · · · + |a0 |.

4. Un campo ordenado k es completo cuando todo subconjunto de k


acotado superiormente admita una mı́nima cota superior. Demuestre
que todo campo ordenado y completo es real cerrado.

5. Dé una demostración directa, por inducción, de la Regla de los Signos


de Descartes.
(Sugerencia: Partiendo de f (X) ∈ R[X], suponga que α1 , ..., αs son
las raı́ces positivas de f (X). Entonces f (X) = (X − α1 ) · · · (X −
αs )g(X), donde g(X) ∈ R[X] no tiene raı́ces positivas en R. El Teo-
rema del Valor Intermedio y el Ejercicio 3.6.3 garantizan que los coe-
ficientes extremos de g(X) tienen el mismo signo. Esto implica que el
número de cambios de signo en la sucesión de coeficientes de g(X) es
par. Use este razonamiento para reducir el problema al caso en que
f (X) = (X − α)h(X), donde α ∈ R+ y h(X) ∈ R[X] satisface la
Regla)
3.7 Campos Finitos 125

3.7 Campos Finitos


Sea K un campo finito. Entonces sabemos que caract K = p es un número
primo; y que el campo primo de K es Z/pZ.

Proposición 3.47 El orden de todo campo finito es una potencia de su


caracterı́stica.

Demostración: Si K es un campo con ◦(K) = q y caract K = p, entonces


la dimensión de K como espacio vectorial sobre Z/pZ es un entero n. Por
tanto, q = pn .
Si F es un campo con caract F = p, entonces la función σ : F → F
dada por σ(x) = xp , es un morfismo de anillos, el llamado morfismo de
Frobenius. Como σ(1) = 1 y ker σ es un ideal de F , se tiene que σ es
inyectivo; y por tanto, biyectivo en los importantes casos en que F es finito
o F es algebraicamente cerrado. En resumen, σ ∈ Aut F en esos casos.

Observación. Como consecuencia inmediata de que el morfismo de Frobe-


nius es un automorfismo, se tiene que todo campo finito es perfecto.

Teorema 3.48 Sean p un número primo y n un entero positivo. Escri-


biendo q = pn , existe un único subcampo K de Z/pZ de orden q, que es
el campo de descomposición de X q − X sobre Z/pZ y que es también el
conjunto de las raı́ces de este polinomio. Todo campo con q elementos es
isomorfo a K.

Demostración: Sea f (X) = X q − X, entonces f 0 (X) = qX q−1 − 1 = −1,


por lo que f (X) y f 0 (X) no tienen factores comunes; y f (X) es separable.
El morfismo de Frobenius σ es un automorfismo del campo Z/pZ. Sea K
el campo de los puntos fijos de σ n . Ası́ tenemos que
n
a ∈ K ⇔ ap = a ⇔ a es raı́z de f (X).

Si E ⊆ Z/pZ es otro campo con q elementos, entonces el Teorema de


Lagrange aplicado al grupo E ? implica que para todo 0 6= b ∈ E, se tiene
bq−1 = 1. Como 0 también es raı́z de X q − X, vemos que E = K.
Finalmente, todo campo F con q elementos, es una extensión finita de
Z/pZ, por lo que existe una copia isomorfa de F dentro de Z/pZ. Esa copia
es K.
En base a este teorema, Fq representará al campo con q elementos.

Teorema 3.49 Sea q = pn , con p primo y n un entero positivo. Entonces:


a) La extensión Fq /Fp es finita de Galois.
b) G = Gal(Fq /Fp ) es cı́clico, generado por el morfismo de Frobenius.
c) G = Aut(Fq ).
126 3. Campos y Teorı́a de Galois

Demostración: a) La extensión es separable porque Fp es perfecto; y es


normal porque Fq es un campo de descomposición.
c) Todo automorfismo de Fq fija a los elementos del campo primo Fp .
b) ◦ (G) = n, porque [Fq : Fp ] = n. Claramente, σ ∈ G; y σ r = 1 ⇔ todo
r
elemento de Fq es raı́z de X p − X. Ası́, el orden de σ en G es n.
Se dice que una extensión de Galois es cı́clica, resp. Abeliana, según
lo sea su grupo de Galois.

Teorema 3.50 a) Toda extensión de campos finitos es cı́clica de Galois.


b) Si E/k y F/k son extensiones de campos finitos con [E : k] = a y
[F : k] = b, entonces E ⊆ F ⇔ a | b.
c) Sean k un campo finito y f (X) ∈ k[X] un polinomio separable con
factorización f (X) = f1 (X) · · · fr (X), donde cada fi (X) es irreducible de
grado ni . Entonces Gal(f (X)/k) es cı́clico de orden m.c.m.{n1 , ..., nr } ge-
nerado por (1, 2, ..., n1 ) · · · (n1 + · · · + nr−1 + 1, ..., n1 + · · · + nr−1 + nr ), al
ordenar las raı́ces de f (X) adecuadamente.

Demostración: a) Si F ⊇ k son campos finitos de caracterı́stica p, en-


tonces Fp ⊆ k, mientras que F/Fp es una extensión cı́clica de Galois, por
el Teorema 3.49. Como Gal(F/k) < Gal(F/Fp ), tenemos que la extensión
F/k es cı́clica, además de ser claramente de Galois.
b) Tenemos que E, F ⊆ k; y que E ⊆ F ⇒ a | b, por el Teorema
3.3. Recı́procamente, si a | b, entonces escribimos ◦(k) = q; y observamos
a b
que (q a − 1) | (q b − 1), por lo que (X q −1 − 1) | (X q −1 − 1) y entonces
a b
(X q − X) | (X q − X). Esto último garantiza que E ⊆ F , en vista del
Teorema 3.48.
c) Como Gal(f (X)/k) es cı́clico, podemos elegir un generador τ . Las
órbitas de τ son los conjuntos de las raı́ces de los distintos fi (X), por lo
que ordenándolas adecuadamente, podemos representar a τ como la per-
mutación (1, 2, ..., n1 ) · · · (n1 + · · · + nr−1 + 1, ..., n1 + · · · + nr−1 + nr ), cuyo
orden es claramente m.c.m.{n1 , ..., nr }.

Teorema 3.51 Sea q = pn , con p primo y n un entero positivo.


a) Si p = 2, entonces todo elemento de Fq es un cuadrado.
b) Si p > 2, entonces los cuadrados de F?q forman un subgrupo de ı́ndice
dos, que es el núcleo del morfismo de grupos λ : F?q → {±1}, dado por
λ(a) = a(q−1)/2 .
c) Si p > 2, entonces a ∈ Z es un cuadrado módulo p si y sólo si
a(p−1)/2 ≡ 1 (mod p).

Demostración: a) Esto es claro, porque el automorfismo de Frobenius


está dado por σ(a) = a2 .
b) Dado a ∈ F?q , existe b ∈ Fq tal que b2 = a. Como a(q−1)/2 = bq−1 y
(a(q−1)/2 )2 = 1, vemos que a(q−1)/2 = bq−1 = ±1. Por otra parte, tenemos
que b ∈ Fq ⇔ bq−1 = 1. La función λ es claramente un morfismo de grupos,
3.7 Campos Finitos 127

λ es suprayectivo porque X (q−1)/2 − 1 no tiene q − 1 raı́ces; por tanto, el


núcleo de λ consiste de los cuadrados de F?q .
c) es consecuencia inmediata de b), al tomar n = 1.

Observación. El teorema anterior generaliza y simplifica lo estudiado en


la Sección 2.6. En particular, la parte c) es el Criterio de Euler (Teorema
2.36).

Teorema 3.52 Sea q = pm , con p primo y m un entero positivo.


a) En Fq [X] se tiene la factorización
n Y
Xq − X = fd (X),
d|n

donde cada fd (X) es mónico de grado d, irreducible en Fq [X]; y el producto


se toma sobre todos esos polinomios.
b) Sea uq (d) el número de polinomios mónicos e irreducibles de grado d
en Fq [X]. Entonces
X
qn = duq (d).
d|n

c) Si µ es la función de Möbius, se tiene que


X
nuq (n) = µ(d)q n/d .
d|n

Demostración: a) Fijemos un polinomio fd (X) mónico de grado d e irre-


ducible en Fq [X]. Tenemos que d | n ⇔ Fqd ⊆ Fqn ⇔ toda raı́z de fd (X)
pertenece a Fqn , porque toda extensión de campos finitos es normal. Ası́,
n n
fd (X) | (X q − X) ⇔ d | n. Como X q − X es separable, se obtiene la
conclusión.
b) Se obtiene comparando los grados de los polinomios en la igualdad a).
c) La igualdad b) afirma que expq = (id × uq ) ∗ 1, donde expq es la
función exponencial con base q, id es la función identidad; y 1 es la función
constante con valor 1. Como 1 ∗ µ = ²; y ² actúa como identidad para
el producto convolución, se tiene que expq ∗µ = id × uq , que es nuestra
conclusión.

Ejercicios
1. Sean p un número primo, a y b enteros positivos con a | b, E y
F campos con ◦(E) = pa y ◦(F ) = pb . Exhiba explı́citamente un
generador de Gal(F/E).

2. Demuestre que en cualquier campo finito, todo elemento es una suma


de dos cuadrados.
128 3. Campos y Teorı́a de Galois

3. Sean {a1 , ..., aq } los elementos de Fq , con q > 3. Demuestre que


X q
X
ai aj = 0; y que a2i = 0.
i<j i=1

4. Sea p un número primo. Demuestre que 3 es un cuadrado en todo


campo con p2 elementos.
n n−1
5. Demuestre que las raı́ces de an X p + an−1 X p + · · · + a0 X ∈ Fp [X]
forman un espacio vectorial sobre Fp , donde p es primo.
6. Sean K = Fp (X), el campo de funciones racionales sobre Fp y G
el grupo de Fp -automorfismos de K generado por η, donde η(X) =
X + 1. Encuentre K G y [K : K G ].

3.8 Extensiones Ciclotómicas


En esta sección, estudiaremos al polinomio f (X) = X n − 1 ∈ k[X], sobre
un campo k. Como f 0 (X) = nX n−1 , vemos que X n − 1 es separable en los
importantes casos de caracterı́stica cero o caracterı́stica p con p - n.
Las soluciones de X n = 1 forman un subgrupo multiplicativo finito de
?
k , que es por tanto, cı́clico. Se dice que ζ es una raı́z n-ésima primitiva
de la unidad cuando ζ es un generador de este grupo. Las extensiones de
la forma k(ζ)/k se llaman ciclotómicas.
Teorema 3.53 Sea K un campo de caracterı́stica cero ó p con p - n; y sea
ζ una raı́z n-ésima primitiva de la unidad. Entonces:
a) La extensión K(ζ)/K es finita de Galois.
b) ζ es raı́z del polinomio
Y
Φn (X) = (X − z).
z n =1
z primitiva

c) Φn (X) ∈ k[X], donde k es el campo primo; y es mónico.


d) [K(ζ) : K] ≤ ϕ(n), donde ϕ es la función de Euler.
e) Existe un morfismo inyectivo de grupos ψ : Gal(K(ζ)/K) → (Z/nZ)? .
f ) Gal(K(ζ)/K) es Abeliano.
Demostración: a) Claramente esta extensión es finita y separable. Como
las raı́ces de X n − 1 son potencias de ζ, vemos que K(ζ) es el campo de
descomposición de X n − 1, de manera que K(ζ)/K es normal y de Galois.
b) es claro.
c) Escribiendo G = Gal(K(ζ)/K), vemos que z primitiva ⇒ σ(z) es una
raı́z primitiva, para todo σ ∈ G. Ası́, es claro que σΦn (X) = Φn (X) para
todo σ ∈ G; y que Φn (X) ∈ K[X].
3.8 Extensiones Ciclotómicas 129

Procediendo inductivamente, a partir de Φ1 (X) = X − 1 ∈ k[X] y de


(X n − 1)
Φn (X) = Q ,
d|n Φd (X)
d6=n

efectuamos la división. El algoritmo Euclideano produce un cociente y un


residuo únicos; el cociente es Φn (X); y el residuo es cero. Como el divisor
es mónico y está en k[X], obtenemos nuestra conclusión.
d) Toda raı́z primitiva es de la forma ζ m con (m, n) = 1, por lo que
gr Φn (X) = ϕ(n).
e) Definimos ψ como sigue: ψ(σ) = m, si σ(ζ) = ζ m . Este es claramente
un morfismo inyectivo.
f ) es inmediato.
Teorema 3.54 Sea k = Q, entonces:
a) Φn (X) ∈ Z[X].
b) El polinomio Φn (X) es irreducible en Q[X].
c) [Q(ζ) : Q] = ϕ(n), donde ϕ es la función de Euler.
d) Gal(Q(ζ)/Q) ∼ = (Z/nZ)? .
Demostración: a) El razonamiento para c) del teorema anterior también
se aplica aquı́.
b) Supongamos que Φn (X) = g(X)h(X) en Z[X]; con g(X) mónico,
irreducible y de grado positivo.
Para todo primo p tal que p - n, se tiene que si z es una raı́z n-ésima
primitiva de la unidad, entonces z p también lo es. Toda raı́z primitiva se
puede obtener a partir de z, después de un número finito de pasos de esta
forma. De manera que g(z) = 0 ⇒ g(z p ) = 0 para todo p con p - n
implicarı́a Φn (X) = g(X).
Supongamos ahora que g(z p ) 6= 0 para algún p, entonces h(z p ) = 0.
Siendo g(X) = Polmin(z, Q), se infiere que g(X) | h(X p ). Reducción mod p,
conduce a h(X p ) = h(X)p ; y a g(X) | h(X)p , en contradicción a la sepa-
rabilidad de Φn (X) en Fp [X].
c) Es consecuencia inmediata de b).
d) El morfismo inyectivo ψ de e) en el teorema anterior es un isomorfismo,
porque los grupos son del mismo orden.
Teorema 3.55 (Wedderburn) Todo anillo de división finito es un campo.
Demostración: Sean F un anillo de división finito y k su centro. Entonces
k es un campo finito de orden q; y F es un espacio vectorial sobre k de
dimensión n. Tenemos que ◦(k ? ) = q − 1; y que ◦(F ? ) = q n − 1.
Nos proponemos escribir la ecuación de clase del grupo F ? , para lo
cual observamos que el centralizador Z(a) de un elemento a ∈ F ? es un
subálgebra de F , que es también un subanillo de división de F . Por tanto,
◦(Z(a)? ) = q d −1, donde d = dimk Z(a). Además, F es un espacio vectorial
sobre Z(a) de dimensión d0 ; por lo que n = dd0 .
130 3. Campos y Teorı́a de Galois

La ecuación de clase es entonces


X qn − 1
q n − 1 = (q − 1) + , (3.9)
qd − 1
d|n
d<n

donde la suma se toma sobre las clases de conjugación no triviales de F ? .


Lo que estamos tratando de demostrar es que n = 1. Supongamos lo
contrario, y obtendremos una contradicción usando (3.9).
En primer lugar, [(X n − 1)/(X d − 1)] ∈ Z[X] siempre que d | n y que
d < n. Además, Φn (X) | [(X n − 1)/(X d − 1)].
Esto implica que Φn (q) | (q n − 1)/(q d − 1) en Z, para d | n con d < n,
por lo que Φn (q) | (q − 1).
Esto es absurdo, pues
Y
|Φn (q)| = |q − ζ| > |q − 1|,
ζ primitiva
ζ n =1

como se ilustra en la figura.

ζ
× p
0 1 q
|q − ζ| > |q − 1|, 1 para toda ζ

Sea p > 2 un número primo. Recordemos que existe un morfismo de


grupos λ : F?p → {±1} que define al sı́mbolo de Legendre para todo a ∈ F?p ,
o bien para todo entero a (mod p):
µ ¶
a
λ(a) = = a(p−1)/2 .
p
Pp−1 ¡ ¢
Definimos la suma de Gauss como S = a=1 ap ζ a , donde ζ es una raı́z
primitiva p-ésima de la unidad. Esta suma tiene sentido sobre Q, o bien
sobre un campo finito Fq tal que p - q.

Teorema 3.56 La suma de Gauss S definida sobre Q o sobre un campo


finito Fq con p - q satisface:
µ ¶
−1
S2 = p.
p
3.8 Extensiones Ciclotómicas 131

Demostración: Procedemos a calcular:


p−1 µ ¶
X p−1 µ 2 ¶
X
2 ab a+b a c a(1+c)
S = ζ = ζ ,
p a,c=1
p
a,b=1

al substituir b = ac. También tenemos que


p−1 µ ¶ X
X p−1 p−1 µ ¶ X
X p−1
c c
S2 = ζ a(1+c) = ζ a(1+c) ,
c=1
p a=1 c=1
p a=0

Pp−1 ¡ ¢
porque c=1 pc = 0, ya que exactamente la mitad de los elementos de F?p
son cuadrados. Finalmente, llegamos a
µ ¶ p−1 p−2 µ ¶ (1+c)p µ ¶
2 −1 X X c ζ −1 −1
S = 1+ 1+c
= p,
p a=0 c=1
p ζ −1 p

pues ζ p = 1.

Para el caso p = 2, tenemos que (Z/8Z)? = {±1, ±3}; y el homomorfismo


λ : (Z/8Z)? → {±1} dado por λ(±1) = 1 y λ(±3) = −1, que nos permite
definir la suma de Gauss modificada S0 = ζ − ζ 3 − ζ 5 + ζ 7 , donde ζ es
una raı́z primitiva octava de la unidad. Como

X8 − 1 X8 − 1
Φ8 (X) = = = X 4 + 1,
(X − 1)(X + 1)(X 2 + 1) X4 − 1

tenemos que 1 + ζ 4 = 0 = ζ 2 + ζ 6 ; y entonces

ζ 3 + ζ 5 = ζ(ζ 2 + ζ 4 ) = ζ(−ζ 6 − 1) = −ζ − ζ 7 .

Por tanto, S0 = 2(ζ + ζ 7 ), que implica S02 = 4(ζ 2 + 2 + ζ 6 ) = 8.

Teorema 3.57 Toda extensión cuadrática de Q es subciclotómica.

Demostración: Si K/Q es una extensión de grado dos, entonces K =



Q( ²p1 · · · pr ), donde ² = ±1 y los pi son primos distintos.
Aquı́, ζ4 = ±i, con i2 = −1, mientras que S02 = 8, por lo que tenemos
K ⊆ Q(ζ4 , ζ8 , ζq1 , ..., ζqs ), donde los qj son los pi distintos de dos.
A continuación, tenemos la Ley de la Reciprocidad Cuadrática:

Teorema 3.58 (Gauss) Si p y q son primos impares distintos, entonces


µ ¶µ ¶
p q
= (−1)(p−1)(q−1)/4 .
q p
132 3. Campos y Teorı́a de Galois

Demostración: Sea ζ es una raı́z primitiva p-ésima de la unidad sobre Fq .


Tenemos que
p−1 µ ¶
X a a
S= ζ satisface S 2 = (−1)(p−1)/2 p,
a=1
p

por lo que calculando en Fq , se tiene que


µ ¶ µ ¶
q−1 (p−1)/2 (q−1)/2 (−1)(p−1)/2 p (p−1)(q−1)/4 p
S = [(−1) p] = = (−1) ,
q q

por el Criterio de Euler. Por otro lado,


p−1 µ ¶
X µ ¶ µ ¶
q a aq q q−1 q
S = ζ = S⇒S = .
a=1
p p p

Comparando las dos expresiones para S q−1 , obtenemos


µ ¶µ ¶
p q
= (−1)(p−1)(q−1)/4 .
q p

Ejercicios
1. Calcule Gal(X 6 + X 3 + 1/Q).

2. Sean m y n enteros primos relativos, ζm una raı́z m-ésima primitiva


de la unidad y ζn una raı́z n-ésima primitiva de la unidad. Demuestre
que (Q(ζm ) ∩ Q(ζn )) = Q; y que Q(ζm , ζn ) = Q(ζmn ).

3. a) Sea µ la función de Möbius. Demuestre que


Y
Φn (X) = (X n/d − 1)µ(d) .
d|n

b) Encuentre Φ100 (X), Φ360 (X) ∈ Q[X].

4. Demuestre que para todo primo impar p, se tiene


µ ¶
2 2
= (−1)(p −1)/8 .
p

(Sugerencia: Considere β = ζ + ζ −1 , donde ζ ∈ Fp es una raı́z pri-


mitiva octava de la unidad).
3.9 Extensiones Cı́clicas 133

3.9 Extensiones Cı́clicas


Sean G un grupo y K un campo. Un carácter χ de G en K es un morfismo
de grupos χ : G → K ? . Las funciones de G en K forman un espacio vectorial
sobre K que incluye a los caracteres.
Teorema 3.59 (Dedekind) Toda colección de caracteres distintos de un
grupo G en un campo K es linealmente independiente sobre K.
Demostración: Sea A = {χ1 , ..., χn } una colección de caracteres distin-
tos. Supondremos que A es linealmente dependiente y encontraremos una
contradicción. Sea
c1 χ1 + c2 χ2 + · · · + cr χr = 0 (3.10)
una relación de dependencia con un número mı́nimo de sumandos, donde
los ı́ndices se rearreglan, en caso necesario. Aquı́, r ≤ n, todo ci ∈ K ? ; y
claramente r > 1.
Como χ1 6= χ2 , existe h ∈ G tal que χ1 (h) 6= χ2 (h). Todo elemento de
G se puede escribir como hg con g ∈ G. Por tanto, de (3.10) obtenemos:

c1 χ1 (hg) + c2 χ2 (hg) + · · · + cr χr (hg) = 0;

y de ahı́
c1 χ1 (h)χ1 + c2 χ2 (h)χ2 + · · · + cr χr (h)χr = 0. (3.11)
Multiplicando (3.10) por χ1 (h), se tiene

c1 χ1 (h)χ1 + c2 χ1 (h)χ2 + · · · + cr χ1 (h)χr = 0. (3.12)

Restando (3.12) de (3.11), llegamos a

c2 [χ2 (h) − χ1 (h)]χ2 + · · · + cr [χr (h) − χ1 (h)]χr = 0,

que es una relación de dependencia no trivial pues c2 [χ2 (h) − χ1 (h)] 6= 0;


y de longitud menor que la mı́nima. Esta contradicción nos da el resultado
deseado.
Sea F/k una extensión separable finita, donde {σ1 , ..., σn } es el conjunto
de k-morfismos de F en k, de manera que [F : k] = [F : k]s = n. Definimos
dos funciones, la norma NkF : F → k y la traza T rkF : F → k ası́:
n
Y n
X
NkF (α) = σi (α) y T rkF (α) = σi (α).
i=1 i=1

Observaciones. Las siguientes afirmaciones son claras:


1. Como cada σi deja fijos a los elementos NkF (α), T rkF (α), tenemos
que [NkF (α) : k]s = [T rkF (α) : k]s = 1 ⇒ NkF (α), T rkF (α) ∈ k. De
manera que las funciones norma y traza están bien definidas.
134 3. Campos y Teorı́a de Galois

2. Si se tiene una cadena de extensiones separables finitas K ⊇ F ⊇ k; y


{σ1 , ..., σn } es el conjunto de k-morfismos de F en k, los extendemos
a morfismos de K en k e identificamos σ1 F ⊂ k. Sea {τ1 , ..., τm } el
conjunto de morfismos de K en k que extienden a σ1 . Dado un k-
morfismo ρ : K → k, existe i tal que σi−1 ρ|F = σ1 . Entonces σi−1 ρ =
τj para algún j, por lo que {σi τj } es el conjunto de k-morfismos de
K en k. Ası́, NkF ◦ NFK = NkK y también T rkF ◦ T rFK = T rkK .

3. En el caso de una extensión finita de Galois F/k con G = Gal(F/k),


identificamos a G con el conjunto de k-morfismos de F en k. Aquı́,
NkF (α), T rkF (α) ∈ F G = k.

4. α ∈ k ⇒ NkF (α) = αn , T rkF (α) = nα.

5. N (αβ) = N (α)N (β), para todos α, β ∈ F , por lo que NkF : F ? → k ?


es un morfismo de grupos.

6. T r(αβ) = T r(α) + T r(β), para todos α, β ∈ F ; y T rkF : F+ → k+ es


un morfismo de grupos aditivos.

Sean A un grupo abeliano con operación +; y G un grupo multiplicativo


que actúa en A. Un 1-cociclo x es una función x : G → A, σ 7→ xσ tal que
xστ = xσ + σxτ , para todos σ, τ ∈ G. Esto es casi un morfismo de grupos.
Una 1-cofrontera y es una función y : G → A, σ 7→ yσ tal que existe
a ∈ A con yσ = a − σ(a) para todo σ ∈ G.

Proposición 3.60 a) Los 1-cociclos forman un grupo abeliano Z 1 (G, A)


ante la suma de funciones.
b) Toda 1-cofrontera es un 1-cociclo.
c) Las 1-cofronteras son un subgrupo B 1 (G, A) de Z 1 (G, A).

Demostración: a) Si x, y son 1-cociclos, entonces (x + y)στ = xστ + yστ =


xσ + σxτ + yσ + σyτ = (x + y)σ + σ[(x + y)τ ], es decir, x + y es un 1-cociclo.
b) Si x es una 1-cofrontera con xσ = a − σ(a) para todo σ ∈ G, entonces
xσ + σxτ = a − σ(a) + σ[a − τ (a)] = a − στ (a) = xστ , por lo que x es un
1-cociclo.
c) Si xσ = a − σ(a) y yσ = b − σ(b) para todo σ ∈ G, entonces (x + y)σ =
xσ + yσ = a − σ(a) + b − σ(b) = (a + b) − σ(a + b), por lo que x + y es una
1-cofrontera.
El cociente H 1 (G, A) = Z 1 (G, A)/B 1 (G, A) es el primer grupo de
cohomologı́a de G en A.

Teorema 3.61 Sea F/k una extensión finita de Galois con grupo de Galois
G. Para la acción de G en F ? y en F+ , se tiene que
a) H 1 (G, F ? ) = {1}.
b) H 1 (G, F+ ) = (0).
3.9 Extensiones Cı́clicas 135

Demostración:
P a) Sea x un 1-cociclo (multiplicativo). Tenemos que la
función τ ∈G xτ τ no es P
cero por la independencia lineal de caracteres τ .
Sea b ∈ F tal que a = τ ∈G xτ τ (b) 6= 0. Entonces
X X
σ(a) = σ(xτ )στ (b) = x−1 −1
σ xστ στ (b) = xσ a.
τ ∈G τ ∈G

Por esto, xσ = aσ(a)−1 , es decir, x es una 1-cofrontera.


b) Debido a la independencia lineal de caracteres, existe b ∈ F tal que
X
a= σ(b) 6= 0.
σ∈G

Reemplazando a b por b/a, obtenemos


X
T r(b) = σ(b) = 1.
σ∈G
P
Sean x un 1-cociclo (aditivo) y c = τ ∈G xτ τ (b) con b como arriba,
entonces para todo σ ∈ G se tiene
X X
σ(c) = σ(xτ )στ (b) = (−xσ + xστ )στ (b) = −xσ + c.
τ ∈G τ ∈G

Esto dice que xσ = c − σ(c), es decir, que x es una 1-cofrontera.


Observación. Este es buen momento para notar que si F/k es una ex-
tensión finita de Galois, entonces todo elemento de k está en la imagen de
T r: Si c ∈ k y α ∈ F es tal que T r(α) = 1, entonces T r(cα) = c.
Teorema 3.62 (Teorema 90 de Hilbert) Sea F/k una extensión finita
de Galois con grupo de Galois G = hσi de orden n. Entonces
a) β ∈ F ? tiene norma 1 ⇔ β = α/σ(α) para algún α ∈ F ? .
b) β ∈ F tiene traza 0 ⇔ β = α − σ(α) para algún α ∈ F .
Demostración: a) Iniciamos con el cálculo
µ ¶
α α σ(α) σ n−1 (α)
N = 2
··· n = 1.
σ(α) σ(α) σ (α) σ (α)

Recı́procamente, supongamos que N (β) = 1, es decir, que

βσ(β)σ 2 (β) · · · σ n−1 (β) = 1.

Esto nos permite definir un 1-cociclo ası́:

xσ = β, xσ2 = βσ(β), ..., xσi = βσ(β) · · · σ i−1 (β), ...,

xσn = βσ(β)σ 2 (β) · · · σ n−1 (β) = 1.


136 3. Campos y Teorı́a de Galois

Para ver que x es realmente un 1-cociclo, supongamos que τ = σ i y que


ρ = σ j , entonces
xτ ρ = βσ(β) · · · σ i+j−1 (β) =
βσ(β) · · · σ i−1 (β)σ i [βσ(β) · · · σ j−1 (β)] = xτ τ (xρ ).
Como H 1 (G, F ? ) = {1}, sabemos que existe α ∈ F ? tal que xτ = ατ (α)−1
para todo τ ∈ G. En particular,

β = xσ = ασ(α)−1 .

b) T r[α−σ(α)] = [α−σ(α)]+[σ(α)−σ 2 (α)]+· · ·+[σ n−1 (α)−σ n (α)] = 0.


Recı́procamente, si T r(β) = 0, definimos un 1-cociclo y : G → F+ ası́:

y1 = 0, yσ = β, yσ2 = β + σ(β), ..., yσn−1 = β + σ(β) + · · · + σ n−2 (β).

Ahora bien, H 1 (G, F+ ) = (0) ⇒ existe α ∈ F con yσi = α − σ i (α). En


particular,
β = yσ = α − σ(α).
Teorema 3.63 Sean k un campo y p 6= caract k un número primo. Supon-
gamos que k contiene una raı́z p-ésima primitiva de la unidad ζ.
a) Si F/k es una extensión finita y cı́clica de Galois de grado p, entonces
F = k(α) con α raı́z de un polinomio X p − a ∈ k[X].
b) Si a ∈ k, entonces o bien X p − a tiene una raı́z en k, en cuyo caso se
descompone totalmente en k[X], o bien X p − a es irreducible en k[X]; y si
α es una raı́z, entonces k(α) es un campo de descomposición y Gal(k(α)/k)
es cı́clico de orden p.
Demostración: a) Sea G = hσi. Como N (ζ) = 1, existe α ∈ F ? tal que
ζ = ασ(α)−1 ; pero entonces α, σ(α) = ζ −1 α, σ 2 (α) = ζ −2 α, ..., σ p−1 (α) =
ζ −p+1 α son p conjugados distintos de α. Por tanto, [k(α) : k] = p; y también
F = k(α).
Sea a = αp , entonces σ(a) = σ(αp ) = σ(α)p = (ζ −1 α)p = αp = a, por lo
que a ∈ k.
b) Si α ∈ k es una raı́z de X p − a ∈ k[X], entonces el conjunto completo
de las raı́ces es {α, ζα, ..., ζ p−1 α} ⊆ k.
Si X p − a no tiene raı́ces en k y α es una raı́z en alguna extensión de k,
entonces α tiene al menos un conjugado que escribimos ηα con η 6= 1. Es
claro que η p = 1, por lo que η es una raı́z primitiva p-ésima de la unidad;
y entonces η ∈ k. Esto implica que k(α) es un campo de descomposición
de X p − a sobre k.
Sea G = Gal(k(α)/k). Existe σ ∈ G tal que σ(α) = ηα; y es inmediato
que σ es de orden p, de manera que G = hσi y X p − a es irreducible.
Para estudiar el caso en que p = caract k, consideramos al polinomio
X p − X. En virtud de la igualdad (X − 1)p − (X − 1) = X p − X, se tiene
que si α es una raı́z, entonces también lo es α − 1. Ası́, el conjunto de raı́ces
de este polinomio es de la forma α, α + 1, α + 2, ..., α + (p − 1).
3.9 Extensiones Cı́clicas 137

Teorema 3.64 (Artin-Schreier) Sean k un campo y p = caract k.


a) Si F/k es una extensión finita y cı́clica de Galois de grado p, entonces
F = k(α) con α raı́z de un polinomio X p − X − a ∈ k[X].
b) Si a ∈ k, entonces o bien X p − X − a tiene una raı́z en k, en cuyo
caso se descompone totalmente en k[X], o bien X p − X − a es irreducible
en k[X]; y si α es una raı́z, entonces k(α) es un campo de descomposición
y Gal(k(α)/k) es cı́clico de orden p.

Demostración: a) Sea G = hσi. Como T r(1) = 0, el Teorema 90 de


Hilbert produce un elemento α ∈ F tal que 1 = α − σ(α); y entonces
{σ(α) = α − 1, σ 2 (α) = α − 2, ..., σ p (α) = α} tiene p elementos. Por tanto,
[k(α) : k] = p; y también F = k(α). Además,

a = α(α − 1) · · · [α − (p − 1)] ∈ F σ = k.

Como αp − α = a, vemos que α es raı́z de X p − X − a ∈ k[X].


b) se puede demostrar como en el teorema anterior.
Se usa la notación ℘(α) = αp − α; de manera que en el caso del teorema,
℘−1 (a) = α.

Ejercicios

1. Sea F/k una extensión finita y separable, tal que F = k(α) con
Polmin(α, k) = X n + cn−1 X n−1 + · · · + c1 X + c0 . Demuestre que
NkF (α) = (−1)n c0 y que T rkF (α) = −cn−1 .

2. Sea F/k una extensión de campos finitos. Demuestre que la norma


NkF : F ? → k ? es suprayectiva.

3. Demuestre que 0 √ 6= a ∈ Q con a = b/c, (b, c) = 1 está en la imagen


Q( −1)
de la norma NQ ⇔ (si la máxima potencia de p que divide ó
bien a b ó bien a c es impar, entonces p ≡ 1 (mod 4)).

4. Un grupo G es de exponente d cuando todo elemento a ∈ G satisface


ad = 1. Sea F el campo de descomposición del conjunto de polinomios
{X n − a1 , X n − a2 , ..., X n − am } sobre k, donde k contiene a las raı́ces
n-ésimas de la unidad y caract k - n. Demuestre que Gal(F/k) es un
grupo abeliano de exponente n.

5. Sea F/k una extensión finita de Galois tal que k contiene a las raı́ces
n-ésimas de la unidad, caract k - n y Gal(F/k) es un grupo abeliano
de exponente n. Demuestre que F el campo de descomposición de un
conjunto de polinomios {X n − a1 , X n − a2 , ..., X n − am } sobre k.
138 3. Campos y Teorı́a de Galois

3.10 Solubilidad con Radicales


Se dice que una extensión separable finita de campos F/k es soluble con
radicales cuando existe una extensión finita de Galois E/k tal que F ⊆ E;
y E se obtiene a partir de k por medio de una sucesión finita de extensiones
de los siguientes tipos:
1. Adjuntando raı́ces de ecuaciones de la forma X n − 1 con p - n, donde
p = caract k.
2. Adjuntando raı́ces de ecuaciones de la forma X p − a con p primo,
donde p 6= caract k, cuando ya se tienen las raı́ces p-ésimas de la
unidad.
3. Adjuntando raı́ces de ecuaciones de la forma X p − X − a, donde
p = caract k.
Teorema 3.65 Sean F/k una extensión finita de Galois y G = Gal(F/k).
Entonces F/k es soluble con radicales si y sólo si G es soluble.
Demostración: Las extensiones de los tipos 2) ó 3), son cı́clicas de orden
p por los Teoremas 3.63 y 3.64, en presencia de las raı́ces de la unidad
adecuadas. Toda extensión de tipo 1) tiene grupo de Galois abeliano por
el Teorema 3.53 f). Esto implica que si H = Gal(E/k) con E obtenido a
partir de k a través de extensiones de estos tipos, entonces H admite una
sucesión de subgrupos subnormales H = H0 ⊇ H1 ⊇ · · · ⊇ Hr = {1}, tal
que todo cociente Hi /Hi+1 es abeliano. Ası́, H es soluble. Supongamos que
F/k es soluble con radicales, con E y H como en la definición de solubilidad
con radicales. Entonces G es soluble al ser imagen homomorfa de H.
Recı́procamente, si G es soluble (y finito), existe una sucesión de sub-
grupos subnormales G = G0 ⊇ G1 ⊇ · · · ⊇ Gs = {1}, tal que cada cociente
Gi /Gi+1 es cı́clico de orden primo pi .
La cadena de campos correspondiente: k = F0 ⊆ F1 ⊆ · · · ⊆ Fs = F , es
tal que cada extensión Fi+1 /Fi es de Galois con grupo cı́clico de orden pi ,
por lo que F1 /k es de tipo 1), 2) ó 3). El tipo 2) sólo puede ocurrir cuando
k contenga a las raı́ces p1 -ésimas de la unidad; y la demostración concluye
por inducción. En caso contrario, adjuntamos
Q una raı́z m-ésima primitiva
de la unidad ζ al campo k, donde m = pi 6=caract pi .
Esta situación está representada en el diagrama

F (ζ)
y BB
H yyy BB
y BB
y BB
yy
k(ζ) F
FF {{
FF {{
FF {
FF {{
F {{
k
3.10 Solubilidad con Radicales 139

Aquı́ , k(ζ)/k es una extensión abeliana por el Teorema 3.53 f), mientras
que H = Gal(F (ζ)/k(ζ)) < G, gracias al Teorema 3.38 , por lo que H
es soluble. En la cadena k ⊆ k(ζ) ⊆ F (ζ) se ve que F (ζ) es soluble con
radicales, por lo que F también lo es.
Se dice que el polinomio separable f (X) con coeficientes en el campo k,
es soluble con radicales cuando el campo de descomposición de f (X) es
una extensión de k soluble con radicales.

Corolario 3.66 (Abel) La ecuación general de grado n es soluble con


radicales si y sólo si n ≤ 4.

Demostración: En el Ejemplo 4 de la Sección 3.5, vimos que el grupo


de Galois de un polinomio genérico de grado n es Sn , que es soluble exac-
tamenete para n ≤ 4.

La ecuación cuadrática general. Si Y 2 + bY + c ∈ k[Y ], caract k 6= 2,


entonces la substitución
µ 2 ¶
b b
Y = X − produce X 2 − −c .
2 4

Si caract k = 2, entonces la substitución Y = bX produce


µ ¶ µ ¶
c c
b2 X 2 + b2 X + c = b2 X 2 + X + 2 = b2 X 2 − X − 2 ,
b b

que se resuelve ası́: x1 = ℘−1 (c/b2 ), x2 = x1 + 1.

La ecuación cúbica general. Según el Ejemplo 3 de la Sección 3.5, el


polinomio f (Y ) = Y 3 + aY 2 + bY + c ∈ k(a, b, c)[Y ] tiene grupo de Galois
S3 , donde k(a, b, c) es el campo de funciones racionales en las variables
a, b, c sobre el campo k. Por tanto, la ecuación f (Y ) = 0 es soluble con
radicales. Esto implica que sus raı́ces pertenecen a un campo que proviene
de k(a, b, c) por medio de extensiones de tipos 1), 2) y 3).
Suponemos que caract k 6= 2, 3 y adjuntamos a k una raı́z cúbica primi-
tiva de la unidad ω para tener que las raı́ces de f (Y ) están en un campo
que proviene de k(a, b, c, ω) por medio de extensiones de tipo 2).
Es conveniente efectuar la substitución Y = X − 31 a para simplificar:
Y + aY 2 + bY + c = X 3 + pX + q, donde p = − 31 a2 + b y también
3

q = 27 a − 31 ab + c. Escribimos K = k(p, q, ω).


2 3

A la cadena de grupos S3 ⊃ A3 ⊃ {1} le √ corresponde la cadena de


campos K ⊂ K(∆) ⊂ K(∆, α), donde ∆ = D, con D = −4p3 − 27q 2 ,
que es el discriminante de X 3 + pX + q; y donde α3 ∈ K(∆).
Resolver la ecuación X 3 + pX + q = 0 significa expresar concretamente
sus raı́ces x1 , x2 , x3 como elementos de K(∆, α), donde α3 también debe
escribirse como elemento de K(∆).
140 3. Campos y Teorı́a de Galois

Como existe un generador σ de Gal(K(∆, α)/K(∆)) ∼ = A3 , que satisface


σ(x1 ) = x2 , σ(x2 ) = x3 , σ(x3 ) = x1 , proponemos α = x1 + ωx2 + ω 2 x3 , la
resolvente de Lagrange, basados en que σ(α) = ω −1 α; y calculamos:

α3 = x31 + x32 + x33 + 3ω(x21 x2 + x22 x3 + x23 x1 )


+3ω 2 (x1 x22 + x2 x23 + x3 x21 ) + 6x1 x2 x3 . (3.13)

Por otra parte, x1 + x2 + x3 = 0 implica

0 = x31 + x32 + x33 + 3(x21 x2 + x22 x3 + x23 x1 )


+3(x1 x22 + x2 x23 + x3 x21 ) + 6x1 x2 x3 . (3.14)

Restando (3.14) de (3.13), se tiene

α3 = (3ω − 3)(x21 x2 + x22 x3 + x23 x1 ) + (3ω 2 − 3)(x1 x22 + x2 x23 + x3 x21 ).

Para simplificar estas expresiones usamos las igualdades

(x21 x2 + x22 x3 + x23 x1 ) − (x1 x22 + xp 2 2


2 x3 + x3 x1 ) =
(x1 − x2 )(x2 − x3 )(x1 − x3 ) = ∆ = −4p − 27q 2 ,3

(x21 x2 + x22 x3 + x23 x1 ) + (x1 x22 + x2 x23 + x3 x21 ) =


(x1 + x2 + x3 )(x1 x2 + x2 x3 + x1 x3 ) − 3x1 x2 x3 = 3q.

Ası́, llegamos a ver que

3ω − 3 √ 3ω 2 − 3 √
α3 = (3q + D) + (3q − D) =
2 2
27 3√
− q+ −3D,
2 2

para lo que usamos las igualdades ω 2 +ω 2
√ +1 = 0 y ω −ω = −3. También
decidimos desplazar a ω en favor de −3.
Ahora definimos β = x1 +ω 2 x2 +ωx3 , que es otra resolvente de Lagrange;
y que proviene de α al intercambiar ω con ω 2 , por lo que es inmediato que
27 3√
β3 = − q− −3D.
2 2
En resumen, tenemos el siguiente sistema de ecuaciones lineales

x1 + x2 + x3 = 0r
27 3√
x1 + ωx2 + ω 2 x3 =
3
− q+ −3D
r 2 2
2 3 27 3√
x1 + ω x2 + ωx3 = − q − −3D
2 2
Este sistema se resuelve, pues el determinante de los coeficientes no es
cero, donde la extracción de una raı́z cúbica introduce cierta ambigüedad
3.10 Solubilidad con Radicales 141

menor; pero la presencia de dos raı́ces cúbicas simultáneas presenta una


ambigüedad mayor, que para desaparecer requiere de la condición: αβ =
(x1 +x2 +x3 )2 −3(x1 x2 +x2 x3 +x1 x3 ) = −3p, que también puede escribirse
r r
3 27 3√ 3 27 3√
− q+ −3D − q− −3D = −3p. (3.15)
2 2 2 2

En cuanto a las raı́ces de X 3 + pX + q = 0, estas vienen dadas por las


fórmulas de Tartaglia-Cardano:
·r r ¸
1 3 27 3√ 3 27 3√
x1 = − q+ −3D + − q − −3D
3 2 2 r2 2
· r ¸
1 2 3 27 3√ 3 27 3√
x2 = ω − q+ −3D + ω − q − −3D
3 r
·
2 2 r 2 2
¸
1 3 27 3√ 27 3√
−3D + ω 2 − q −
3
x3 = ω − q + −3D (3.16)
3 2 2 2 2

sujetas a la condición (3.15).

Proposición 3.67 Sea f (X) ∈ Q[X] un polinomio cúbico e irreducible


con tres raı́ces reales. Entonces la ecuación f (X) = 0 no se puede resolver
por medio de una sucesión de extensiones reales simples.

Demostración: Supongamos que la afirmación es falsa, que F es el campo


de descomposición de f (X), que Q = K0 ⊆ K1 ⊆ · · · Kr−1 ⊆ Kr ⊆ R
es una cadena de extensiones
√ reales simples con todo [Ki+1 : Ki ] primo,
F ⊆ Kr , que K1 = K0 ( D); y que F * Kr−1 .
En estas condiciones, Gal(f (X)/Kr−1 ) ∼ = A3 , por lo que f (X) es irre-

ducible en Kr−1 ; pero se factoriza totalmente en Kr . Ası́, Kr = Kr−1 ( p a)
con p primo; pero 3 | p ⇒ p = 3. Además, √ Kr es√un campo de descom-
posición de f (X) sobre Kr−1 ; pero entonces 3 a, ω 3 a ∈ Kr ⇒ ω ∈ Kr , en
contradicción con ω ∈/ R.

Un ejemplo de Teorı́a de Grupos. Aquı́ demostraremos para p primo,


que un subgrupo transitivo G de Sp es soluble si y sólo si todo elemento de
G r {1} tiene cuando más un punto fijo.
Sea G un subgrupo transitivo de Sp , donde p es un número primo.
Paso 1 Todo subgrupo normal N no trivial de G es transitivo.
Demostración: Consideremos la acción de N en P = {1, 2, ..., p}. La
órbita de q0 tiene [N : S(q0 )] elementos, donde S(q0 ) es el estabilizador en
N de q0 . Para cualquier otro punto q1 ∈ P , existe x ∈ G tal que xq0 = q1 ,
por lo que S(q1 ) = xS(q0 )x−1 ∩ N = xS(q0 )x−1 , dada la normalidad de N .
Ası́, todas las órbitas de N tienen el mismo número de elementos, número
que divide a p; y por tanto coincide con p, al no ser N trivial.
142 3. Campos y Teorı́a de Galois

Identifiquemos al conjunto P con Fp y digamos que σ ∈ Sp es afı́n cuando


existan b ∈ Fp y a ∈ F?p tales que σ(x) = ax + b para todo x ∈ P . Las
translaciones son las transformaciones afines con a = 1.
Paso 2 Las translaciones 6= 1 no tienen puntos fijos. Las transformaciones
afines restantes tienen exactamente un punto fijo.
Demostración: La ecuación ax + b = x tiene cuando más la solución
x = −(a − 1)−1 b, para lo que se requiere que a 6= 1; exceptuando el caso
en que a = 1 y b = 0, que corresponde a la función identidad.

Paso 3 Si además, G es soluble, existe una sucesión de subgrupos

G = G0 ⊃ G1 ⊃ · · · ⊃ Gr ⊃ Gr+1 = {1}, (3.17)


donde cada subrupo es normal en el que le precede, cada cociente es
abeliano no trivial y Gr es cı́clico de orden p.
Demostración: Tal sucesión subnormal existe por la solubilidad de G, con
Gr abeliano; pero se puede conseguir Gr cı́clico de orden p, porque todos
los subgrupos en ella son transitivos; y por tanto de orden divisible por p,
gracias al Paso 1.
Reordenamos los elementos de P para poder escribir Gr = hσi, con
σ = (12 · · · p).

Paso 4 Para G soluble, todo p-ciclo de G está en Gr ; y todo elemento de


G fuera de Gr tiene exactamente un punto fijo.
Demostración: Veremos por inducción, al ascender en la sucesión 3.17
desde {1}, que todo elemento de G es afı́n y que todo p-ciclo de G está en
Gr .
Supongamos que ambas afirmaciones son ciertas para Gr−m .
Sea τ ∈ Gr−m−1 , τ ∈ / Gr . Entonces τ στ −1 ∈ Gr−m es un p-ciclo, por lo
que τ στ −1 ∈ Gr y ası́ τ στ −1 = σ a para algún 1 6= a ∈ F?p , pues cualquier
p-ciclo en Sp conmuta solamente con sus potencias.
Supongamos que τ (i) = j; y calculemos:

τ στ −1 (j) = σ a (j) = j + a ⇒ τ (i + 1) = τ σ(i) = τ (i) + a.

Escribiendo τ (0) = b, obtenemos

τ (1) = a + b, τ (2) = 2a + b, ..., τ (i) = ia + b, ...

por lo que τ es afı́n. Finalmente, todo p-ciclo de Gr−m−1 , siendo afı́n y sin
puntos fijos, es una translación, que está en Gr .

Paso 5 Si G es soluble y transitivo, entonces cada elemento de G r {1}


tiene cuando más un punto fijo.
3.10 Solubilidad con Radicales 143

Paso 6 Si G es transitivo y todo elemento de G r {1} tiene cuando más


un punto fijo, entonces G tiene un subgrupo normal de orden p.

Demostración: Claramente, p | ◦ (G). Sea T un subgrupo de G de orden


p. La transitividad también implica que al calcular el número de órbitas de
G según Burnside, se tiene
X
◦(G) = Fg , (3.18)
g∈G

donde Fg es el número de puntos fijos de g. En la ecuación (3.18), F1 = p,


mientras que Fg = 0 para todo 1 6= g ∈ T . Como Fg ≤ 1 para todo g ∈ G,
se infiere que Fg = 1 para todo g ∈/ T . Ası́, g ∈
/ T ⇒ g no es un p-ciclo; y
T contiene a todos los p-ciclos de G. Esto garantiza que T es normal.

Paso 7 Si G es transitivo y todo elemento de G r {1} tiene cuando más


un punto fijo, entonces G es soluble.

Demostración: Sea T = hσi C G de orden p. La acción obtenida por


conjugación de T con los elementos de G da origen a un morfismo ψ : G →
F?p definido ası́: Si xσx−1 = σ n , escribimos ψ(x) = n. Aquı́, ker ψ = T ,
pues los p-ciclos conmutan solamente con sus potencias.
El morfismo ψ induce otro morfismo inyectivo G/T ,→ F?p , que implica
la solubilidad de G/T , de manera que G también es soluble.

Ejercicios

1. Sea k un campo con caracterı́stica distinta de 2 y de 3. Demuestre


que el polinomio X 3 +pX +q ∈ k(p, q)[X]
p con raı́ces x1 , x2 , x3 admite
como campo de descomposición a k( −4p3 − 27q 2 , x1 ).

2. Sea X p − a ∈ Q[X] irreducible con p primo. Demuestre que entonces


Gal(X p − a/Q) es isomorfo con el grupo A2 (Fp ) de transformaciones
de Fp de la forma y 7→ αy + β, donde α, β ∈ Fp y α 6= 0.

3. (Galois) Sean k un campo de caracterı́stica cero, f (X) ∈ k[X] irre-


ducible de grado primo p, F un campo de descomposición de f (X)
sobre k y G = Gal(f (X)/k). Demuestre que G es soluble si y sólo
si F está generado sobre k por cualquier pareja de raı́ces de f (X).
(Sugerencia: Use el Ejemplo de Grupos).

4. Sean k un subcampo de R, f (X) ∈ k[X] irreducible y soluble de


grado primo. Demuestre que o bien f (X) tiene exactamente una raı́z
real, o bien todas sus raı́ces son reales.
144 3. Campos y Teorı́a de Galois

3.11 Constructibilidad con Regla y Compás


Hay toda una serie de problemas geométricos clásicos que tratan de deter-
minar las construcciones que pueden lograrse con una regla y un compás.
Aquı́ suponemos que una regla no tiene marcadas subdivisiones; y que so-
lamente sirve para trazar la recta que pase por dos puntos distintos dados.
El punto de partida es una longitud identificada con la unidad. Las lon-
gitudes que se pueden lograr se llaman constructibles, las cuales forman
un campo:
Es claro como obtener α + β y α − β a partir de α y de β. Recordemos
como encontrar αβ, y también 1/β para β 6= 0.
Dados α y β, construimos un triángulo (rectángulo) 4OAB, en el que
OA = α y OB = 1. Prolongamos OB hasta OC = β; y trazamos CD
paralela a AB. Por la similaridad de los triángulos, se tiene
OA OD OA × OC
= , es decir OD = = αβ.
OB OC OB

C
B

O A D

Repetimos la construcción a partir de OA = 1 = OC y de OB = β para


tener OD = 1/β. √
Es posible construir d para d > 0 dado. Esto se hace ası́:
Trazamos la recta AB de longitud d + 1 con AE = d y EB = 1, después
construimos un cı́rculo de diámetro AB.

A × B
O E

Trazamos CE ⊥ AB, entonces ]ACB es recto, por lo que ]EAC =


]ECB. De esta manera, 4EAC y 4ECB son similares; y tenemos que
AE EC 2 √
= , es decir, EC = AE × EB = d, ó bien, EC = d.
EC EB
3.11 Constructibilidad con Regla y Compás 145

Hemos visto que las longitudes o números reales constructibles forman un


subcampo de R que contiene al campo primo Q y a todos aquellos números
β ∈ R para los que exista una sucesión a1 , ..., an de números reales tales
que a21 ∈ Q, a22 ∈ Q(a1 ), ..., a2n ∈ Q(a1 , ..., an−1 ) con β ∈ Q(a1 , ..., an ).
Teorema 3.68 Una longitud β ∈ R es constructible si y sólo si existe una
sucesión a1 , ..., an ∈ R con a21 ∈ Q, a22 ∈ Q(a1 ), ..., a2n ∈ Q(a1 , ..., an−1 ) tal
que β ∈ Q(a1 , ..., an ).
Demostración: Ya tenemos demostrada la implicación ⇐. Para ver el
recı́proco, adaptemos un sistema cartesiano de coordenadas al plano R2 de
manera que la longitud unitaria quede dada por los puntos (0, 0) y (1, 0).
Digamos ahora que un punto (a, b) es constructible si y sólo si sus coor-
denadas lo son. Esto es razonable, pues con regla y compás se puede trazar
una perpendicular a una recta dada desde un punto también dado, en la
recta o fuera de ella.
El procedimiento para obtener nuevos puntos a partir de los ya cons-
truidos, consiste en intersectar rectas que pasen por puntos construidos,
intersectar circunferencias con centros y radios construidos entre sı́ o bien
con rectas construidas. Algebraicamente, esto equivale a resolver sistemas
de dos ecuaciones, donde cada ecuación es de una de las formas

Ax + By + C = 0 (1)

x2 + y 2 + ax + by + c = 0 (2)
Cuando se resuelve un sistema de dos ecuaciones de tipo (1), se hace
dentro del campo de los coeficientes del sistema. Es fácil ver que un sistema
de dos ecuaciones de tipo (2) es equivalente a otro sistema con una ecuación
de cada tipo.
Si en la ecuación lineal, B 6= 0, despejamos y para usarlo en la ecuación
cuadrática, obtenemos
µ ¶2 µ ¶
C A C A
x2 + + x + ax − b + x + c = 0.
B B B B

De manera que de existir soluciones reales, éstas pertenecerán al campo de


los coeficientes o a una extensión cuadrática del mismo.
Corolario 3.69 Un número real α es constructible si y sólo si [Q(α) : Q]
es una potencia de dos.
Identificamos geométricamente a R2 con C de la manera usual y con-
sideramos a β = a + bi ∈ C con a, b ∈ R. Decimos que β es constructible
cuando a y b lo son.
Teorema 3.70 Las siguientes condiciones en β ∈ C son equivalentes:
a) β es constructible.
146 3. Campos y Teorı́a de Galois

b) Existe una sucesión a1 , ..., an ∈ C tal que

a21 ∈ Q, a22 ∈ Q(a1 ), ..., a2n ∈ Q(a1 , ..., an−1 ) con β ∈ Q(a1 , ..., an ).

c) β es algebraico; y la cerradura normal de Q(β) tiene grado sobre Q


que es una potencia de dos.

Demostración: a) ⇒ b) Si β = a + bi es constructible, con a, b ∈ R, es


porque existen sucesiones a1 , ..., ar y b1 , ..., bs como en el enunciado con

a ∈ Q(a1 , ..., ar ) y b ∈ Q(b1 , ..., bs );

pero entonces la sucesión a1 , ..., ar , b1 , ..., bs , i también es como en el enun-


ciado; y satisface
β ∈ Q(a1 , ..., ar , b1 , ..., bs , i).
b) ⇒ c) Sean F la cerradura normal de Q(β)/Q y G = Gal(F/Q). Para
cada σ ∈ G, existe una sucesión σ(a1 ), ..., σ(ar ) como en el enunciado, con
σ(β) ∈ Q(σ(a1 ), ..., σ(ar )). Aquı́ vemos que

σ1 (a1 ), ..., σ1 (ar ), σ2 (a1 ), ..., σ2 (ar ), ..., σn (a1 ), ..., σn (ar )

es como en el enunciado con β y todos sus conjugados contenidos en


Q(σi (aj ))i,j . Esto implica que β es algebraico y que [F : Q] es una po-
tencia de dos.
c) ⇒ a) Si la cerradura normal F de Q(β)/Q es de grado 2t , entonces
G = Gal(F/Q) es un 2-grupo, por tanto nilpotente; y existe una cadena
finita de subgrupos de G ası́:

G = G0 ⊃ G1 ⊃ · · · ⊃ Gt = {1},

donde Gi+1 C Gi para todo i, con cada cociente Gi /Gi+1 de orden dos.
Por el Teorema Fundamental de la Teorı́a de Galois, existe una cadena
de campos correspondiente:

Q = K0 ⊂ K1 ⊂ · · · ⊂ Kt = F,

con [Ki+1 : Ki ] = 2 para todo i.


Como β ∈ F , para saber que β es constructible, es suficiente ver por
inducción en i, que todo elemento de Ki lo es. Esto es cierto para K0 = Q. Si
Ki+1 = Ki (η), con η = b1 + b2 i, η 2 = c1 + c2 i ∈ Ki , donde b1 , b2 , c1 , c2 ∈ R,
entonces suponiendo que c1 y c2 son constructibles, se tiene que b1 y b2
satisfacen p p
2 c21 + c22 + c1 2 c21 + c22 − c1
b1 = y b2 = .
2 2
Ası́, es claro que η es constructible, como lo es todo elemento de Ki+1 .
3.11 Constructibilidad con Regla y Compás 147

La duplicación del cubo. Aquı́ el problema es construir un cubo de


volumen 2, es decir, la arista de tal cubo. Esto es imposible porque X 3 − 2
es irreducible en Q[X].
Trisección de ángulos Dado un ángulo θ, ¿es posible construir θ/3 ?
La respuesta es negativa, √por ejemplo en el caso de θ = 60◦ . En efecto,
cos 60◦ = 1/2 y sen 60◦ = 3/2, por lo que un ángulo de 60◦ es construc-
tible. Sin embargo, la constructibilidad de un ángulo de 20◦ es equivalente
a la de cos 20◦ .
La identidad trigonométrica cos 3ϕ = 4 cos3 ϕ − 3 cos ϕ, produce para
ϕ = 20◦ y cos ϕ = α, la igualdad 4α3 − 3α − 1/2 = 0; pero el polinomio
4X 3 − 3X − 1/2 es irreducible en Q[X], como se ve al substituir X = Y /2
y obtener (1/2)(Y 3 − 3Y − 1). Ası́, cos 20◦ es de grado tres sobre Q; y no
es constructible.
La cuadratura del cı́rculo. ¿Es posible construir un cı́rculo de área
uno? Como el área de un cı́rculo de radio r es πr2 , la respuesta es negativa
porque π es trascendente.
Polı́gonos regulares constructibles. Un polı́gono regular de n lados
es constructible si sólo si lo es una raı́z n-ésima primitiva de la unidad. El
siguiente resultado nos da la respuesta a este problema:

Teorema 3.71 Una raı́z n-ésima primitiva de la unidad ζ es constructible


si sólo si n = 2r p1 · · · ps con r ∈ N y con p1 , ..., ps primos de la forma 2t + 1
distintos entre sı́.

Demostración: Para n = 2r pr11 · · · prss con p1 , ..., ps primos impares dis-


tintos y r ≥ 0; r1 , ..., rs ≥ 1, el Teorema 3.54 c) afirma que el grado de ζ
sobre Q es
½ r−1
2 (p1 − 1)pr11 −1 · · · (ps − 1)prss −1 , si r ≥ 1
ϕ(n) =
(p1 − 1)pr11 −1 · · · (ps − 1)prss −1 , si r = 0

Como Q(ζ)/Q es normal y ϕ(n) es una potencia de 2 exactamente cuando


n es como en el enunciado, obtenemos nuestra conclusión.
Los números primos de la forma 2t + 1 se llaman primos de Fermat.
Como ejemplos tenemos a 3, 5, 17, 257, 65537. No se sabe si el número de
estos primos es finito.

Ejercicios
1
1. Demuestre que Polmin(cos(2π/5), Q) = X 2 + 21 X − 4 = 0.

2. Demuestre que el polinomio mı́nimo de cos(2π/17) sobre Q es

1 7 3 15 5 5 1 1
X8 + X7 − X6 − X5 + X4 + X3 − X2 − X + = 0.
2 4 4 16 16 32 32 256
148 3. Campos y Teorı́a de Galois

3.12 Grupos de Galois sobre Q


Sean k un campo, f (T ) un polinomio separable de grado n sobre k, F su
campo de descomposición y G = Gal(F/k). Consideramos un conjunto de
variables X1 , ..., Xn ; y los campos de funciones racionales F = F (X1 , ..., Xn )
y k = k(X1 , ..., Xn ).
Claramente, F/k es una extensión finita de Galois. Como normalidad y
separabilidad se preservan ante translación, F/k también es finita de Galois;
y F es campo de descomposición de f (X) sobre k. Sea G = Gal(F/k).

F>
ÄÄ >> G
ÄÄ >>
ÄÄ >
F? k
?? ¡¡
?? ¡¡
G ? ¡¡
k
Proposición 3.72 El morfismo de grupos ψ : G → G dado por ψ(σ) = σ|F
es un isomorfismo.
Demostración: Como σ|k = 1k , tenemos que σ envı́a cada raı́z de f (T ) a
otra raı́z de f (T ). Ası́, ψ está bien definido.
La biyectividad de ψ es consecuencia de que todo k-automorfismo de F
se extiende de manera única a un k-automorfismo de F.

Supongamos que f (T ) tiene raı́ces r1 , ..., rn ; de manera que tengamos


morfismos G ,→ Sn y G ,→ Sn . Para σ ∈ Sn , definimos
n
X n
X
uσ = rσ(i) Xi = ri Xσ−1 (i) .
i=1 i=1

Observación. Si σ 6= τ , entonces uσ 6= uτ .

Proposición 3.73 a) F = k(uσ ), para cualquier σ ∈ Sn .


b) Polmin(uσ , k) = gσ (T ), donde
Y n
X
gσ (T ) = (T − rτ σ(i) Xi ).
τ ∈G i=1

Demostración: Aquı́, τ gσ (T ) = gσ (T ), para todos τ ∈ G, σ ∈ Sn , por lo


que gσ (T ) ∈ k[T ] para todo σ ∈ Sn . Además, gσ (T ) tiene como raı́z a uσ ;
y es de grado ◦(G). Para obtener a) y b), es suficiente saber que todo uσ
es de grado ≥ ◦(G) sobre k; pero esto es consecuencia inmediata de que la
órbita de uσ ante la acción de G tiene ◦(G) elementos, gracias a la última
observación.
3.12 Grupos de Galois sobre Q 149

Proposición 3.74 G = {τ ∈ Sn | τ gσ (T ) = gσ (T ) para todo σ ∈ Sn }.


Demostración: Si escribimos
Y Y
g(T ) = (T − uσ ) = gσ (T ),
σ∈Sn σ∈Sn /G

entonces tendremos que gσ (T ) ∈ k[X1 , ..., Xn , T ], para todo σ ∈ Sn ; y cada


gσ (T ) es irreducible en k[X1 , ..., Xn , T ].
El grupo Sn actúa de manera natural en k[X1 , ..., Xn , T ] permutando las
variables Xi . Esta da origen a una colección de k[T ]-automorfismos. Ante
esta acción, el subgrupo G fija a cada factor gσ (T ).
Recı́procamente, si τ ∈ Sn fija a g1 (T ), entonces τ ∈ G.

Sean ahora k = Q y f (T ) ∈ Z[T ] mónico y separable. Estamos en posición


de obtener información valiosa acerca del grupo de Galois de f (T ), usando
los resultados anteriores, al reducir al polinomio (mod p) para primos p
convenientes: Extendemos el morfismo natural η : Z → Fp a los anillos de
polinomios η 0 : Z[X1 , ..., Xn , T ] → Fp [X1 , ..., Xn , T ]; y escribimos f (T ) en
lugar de η 0 f (T ).

Proposición 3.75 Si f (T ) es separable y tiene raı́ces z1 , ..., zn , entonces


Y n
X
g(T ) ∈ Z[X1 , ..., Xn , T ] y g(T ) = (T − zσ(i) Xi ).
σ∈Sn i=1

Demostración: Aquı́, g(T ) ∈ Z[X1 , ..., Xn , T ] por el Teorema 2.60. Como


f (T ) es separable, podemos extender η 0 a Z[r1 , ..., rn , X1 , ..., Xn , T ]; y ası́
obtener la segunda expresión, definiendo η 0 (ri ) = zi para toda i.
Teorema 3.76 (Dedekind) Si f (T ) ∈ Z[T ] es mónico y f (T ) ∈ Fp [T ] es
separable, entonces

Gal(f (T )/Fp ) < G = Gal(f (T )/Q).

Demostración: Como G es el estabilizador de los factores irreducibles de


g(T ) en el anillo Z[X1 , ..., Xn , T ], mientras que el grupo Gal(f (T )/Fp ) lo
es para los factores irreducibles de g(T ) en Fp [X1 , ..., Xn , T ], la conclusión
es clara.
Ejemplo. El Teorema 3.50 c) nos permite calcular el grupo de Galois G
de f (X) = X 4 + 2X 2 + X + 3 sobre Q:
f (X) ≡ X 4 + X + 1 (mod 2), que es irreducible, pues no tiene raı́ces y
X +X +1 6= (X 2 +X +1)2 , sabiendo que X 2 +X +1 es el único polinomio
4

cuadrático irreducible (mod 2). Ası́, G contiene un 4-ciclo.


f (X) ≡ X(X 3 + 2X + 1) (mod 3), con X 3 + 2X + 1 irreducible (mod 3).
Ası́, G contiene un 3-ciclo.
150 3. Campos y Teorı́a de Galois

Tenemos que G es un grupo tal que contiene un 3-ciclo y un 4-ciclo,


además 12 | ◦ (G). Entonces G es un subgrupo normal de S4 de orden 12
ó 24; al contener un 3-ciclo, los contiene a todos y a A4 . Al contener a un
4-ciclo, que es impar, G 6= A4 implica que G = S4 .

A continuación consideraremos el problema inverso de la teorı́a de Galois:


dado un grupo G, exhibir una extensión de Galois de Q, o bien un polinomio
en Q[X] cuyo grupo de Galois sea G. Obtendremos soluciones para los casos
del grupo simétrico Sn y de grupos abelianos finitos arbitrarios.

Lema 3.77 Sea G un subgrupo transitivo de Sn que contiene una trans-


posición y un (n − 1)-ciclo, entonces G = Sn .

Demostración: Digamos que α = (23 · · · n) ∈ G; y que G también con-


tiene la transposición (ab). Sabiendo que G es transitivo, existe σ ∈ G tal
que σ(a) = 1; pero entonces también existe m tal que 1 < m ≤ n con
σ(ab)σ −1 = (1m).
Al conjugar (1m) con las distintas potencias de α, tenemos que (1m) ∈ G
para todo m con 1 < m ≤ n; pero h (1m) | 1 < m ≤ ni = Sn , por la
Proposición 1.36. Concluimos que G = Sn .

Teorema 3.78 Para todo entero positivo n, existe un polinomio separable


f (X) ∈ Q[X], de grado n, tal que G = Gal(f (X)/Q) = Sn .

Demostración: Podemos suponer que n ≥ 3. Gracias a los Teoremas


3.48 y 3.36 que afirman que existen extensiones de Fp de cualquier grado
para cualquier primo p; y que estas son simples, puede verse que existen
f1 (X) ∈ F2 [X] mónico, irreducible de grado n, g2 (X) ∈ F3 [X] mónico,
irreducible de grado n − 1; ası́ como f3 (X) ∈ F5 [X] mónico, de grado n,
con factorización irreducible consistente en un polinomio cuadrático, junto
con uno o dos factores de grado impar. Definimos f2 (X) = Xg2 (X) y
observamos que es posible tener todo fi (X) separable.
Por el Teorema Chino del Resı́duo, existe f (X) ∈ Z[X] tal que

f (X) ≡ f1 (X) (mod 2), f (X) ≡ f2 (X) (mod 3), f (X) ≡ f3 (X) (mod 5).

El Teorema 3.76 garantiza que G contiene un n-ciclo, un (n − 1)-ciclo y


una permutación β con descomposición cı́clica (2, n − 2) ó bien (2, a, b), con
n − 2 impar ó bien a y b impares. De esta manera, β n−2 ó bien β ab es una
transposición en G. El lema implica que G = Sn .

Lema 3.79 Sean p, n, a enteros con p primo, p - n y tales que p | Φn (a),


donde Φn (X) es el n-ésimo polinomio ciclotómico. Entonces p ≡ 1 (mod n).
3.13 Ejercicios Generales 151

Demostración: Aquı́, a es una raı́z n-ésima primitiva de la unidad sobre


Fp . Como ap−1 = 1, es inmediato que n | (p − 1).

El siguiente resultado es un caso sencillo de un teorema de Dirichlet.

Proposición 3.80 Sea n un entero positivo. Existe un número infinito de


primos de la forma mn + 1, con m ∈ N.

Demostración: El término constante de Φn (X) ∈ Z[X] tiene valor abso-


luto que es el de la norma de una raı́z de la unidad, por lo que se tiene
Φn (X) = X ϕ(n) + · · · + (±1) ∈ Z[X]. Supongamos que p1 , ..., pr es la lista
completa de primos p ≡ 1 (mod n). Para todo entero positivo i, tenemos

Φn (ni p1 · · · pr ) ≡ ±1 (mod n, p1 , ..., pr ).

Escogiendo i adecuadamente, podemos asegurar que

m = Φn (ni p1 · · · pr ) 6= ±1.

Sea p un primo que divida a m, entonces p - n. Por el lema, p ≡ 1 (mod n),


en contradicción con p 6= pj , para todo j.

Teorema 3.81 Todo grupo abeliano finito G es el grupo de Galois sobre


Q de una extensión subciclotómica.

Demostración: G es el producto directo de grupos cı́clicos de órdenes


n1 , ..., nr . Sean p1 , ..., pr primos distintos tales que pi ≡ 1 (mod ni ), para
todo i. Escribamos m = p1 · · · pr .
Sea ζ una raı́z m-ésima primitiva de la unidad sobre Q. Entonces Q(ζ)/Q
es una extensión finita de Galois con grupo isomorfo a Zp1 −1 × · · · × Zpr −1 .
Existen subgrupos Hi < Zpi −1 de ı́ndice ni , para todo i.
Sea H = H1 × · · · × Hr < Gal(Q(ζ)/Q). Tenemos que Q(ζ)H /Q es una
extensión finita de Galois de Q, cuyo grupo es isomorfo con G.

Ejercicio
1. Encuentre un polinomio cuyo grupo de Galois sobre Q sea S5 .

3.13 Ejercicios Generales


1. Sean p > 2 un número primo y ζ una raı́z p-ésima primitiva de la
unidad. Demuestre que existe un único campo E tal que

Q ⊂ E ⊆ Q(ζ) y [E : Q] = 2.

Además, E ⊆ R ⇔ p ≡ 1 (mod 4).


152 3. Campos y Teorı́a de Galois

2. Sea p número primo impar.


a) Si ω es una raı́z p-ésima primitiva de la unidad, demuestre que
p−1
Y
(1 − ω i ) = p.
i=1

b) Demuestre que el discriminante de X p − 1 es (−1)(p−1)/2 pp .


c) Demuestre que el discriminante de Φp (X) es (−1)(p−1)/2 pp−2 .
3. Demuestre que el discriminante de X n − 1 es (−1)(n−1)/2 nn , si n es
impar; o bien (−1)(n/2)−1 nn , si n es par.
4. Sean p número primo impar y 1 ≤ r ∈ N.
a) Demuestre que
r
−pr−1 r
−2pr−1 r−1
Φpr (X) = X p + Xp + · · · + Xp + 1.

b) Demuestre que Y
(1 − ω) = p.
ω primitiva
ω pr =1

r−1
c) Demuestre que si ζ es raı́z de X p − 1, entonces
Y
(ζ − ω) = p.
ω primitiva
ω pr =1

d) Demuestre que
Y r−1
(ζ − ω)2 = p2p .
r−1
ζp =1
ω pr =1, ω primitiva

e) Demuestre que el discriminante de Φpr (X) es


r−1
(−1)(p−1)/2 p(p )(pr−r−1)
.

5. Escribiendo dr = discr(X r − 1), demuestre que

Y Y µn¶2rµ(n/r)
discr(Φn (X)) = dµ(n/r)
r .
r
r|n r|n
r6=1
Capı́tulo 4
Algebra Lineal

4.1 Módulos Libres


En esta sección suponemos que k es un anillo conmutativo con 1 y que M
es un k-módulo izquierdo. En estas condiciones, tenemos que:
1. Toda intersección de submódulos de M es otro submódulo.
2. Dado un subconjunto A de M , el submódulo generado por A, es-
crito (A), es la intersección de los submódulos de M que contienen al
conjunto A.
3. Si M1 , ..., Mr son submódulos de M , entonces (M1 ∪ · · · ∪ Mr ) =
M1 + · · · + Mr .
Se dice que M es finitamente generado cuando admite a un conjunto
finito como generador. Se dice que M es suma directa de sus submódulos
M1 , ..., Mr cuando M1 + · · · + Mr = M y también (M1 + · · · + Mi−1 ) ∩ Mi =
(0) para todo 1 < i ≤ r. Esto se escribe ası́: M = M1 ⊕ · · · ⊕ Mr .
Un morfismo de k-módulos f : M → N , o función lineal, es una
función tal que f (am+bn) = af (m)+bf (n) siempre que a, b ∈ k; m, n ∈ M .
Una función f : M1 × · · · × Mr → N es multilineal cuando todas las
funciones fi : Mi → N dadas por fi (x) = f (m1 , ..., mi−1 , x, mi+1 , ..., mr )
son lineales para todos mj ∈ Mj , 1 ≤ i, j ≤ r, j 6= i.
Se dice que un k-módulo finitamente generado M es libre cuando M es
la suma directa de (un número finito de) copias de k; si el número de copias
de k es n, escribimos M = k (n) .
PUnr
conjunto {u1 , ..., ur } ⊆ M es linealmente independiente cuando
i=1 i ui = 0 ⇒ ai = 0, para todos ai ∈ k, 1 ≤ i ≤ r.
a
Un subconjunto A = {u1 , ..., ur } ⊆ M es una base de M cuando es
linealmente independiente y genera a M . Esto es equivalente a exigir que
todo elemento v ∈ M se pueda expresar de manera única comoP combinación
r
lineal de A, es decir, que existan ci ∈ k únicos tales que v = i=1 ci ui .

Observación. En el caso en que k es un campo, todo módulo es libre, al


ser un espacio vectorial.
154 4. Algebra Lineal

Teorema 4.1 a) Un k-módulo M es libre si y sólo si tiene una base.


b) Dos bases de un mismo módulo (libre) tienen el mismo número de
elementos.

Demostración: a) k (n) admite como base al conjunto {²1 , ..., ²n }, donde


²1 = (1, 0, ..., 0), ²2 = (0, 1, 0, ..., 0), etc.
Si M admite a {u1 , ..., un } como base, entonces la función f : k (n) → M
dada por f (a1 , ..., an ) = a1 u1 + · · · + an un es un isomorfismo de k-módulos.
b) Aquı́ podemos adaptar una versión del Teorema de Jordan-Hölder, o
bien reducimos el problema al caso ya conocido para campos:
Existe un ideal máximo m de k, de manera que F = k/m es un campo.
Escribimos u la imagen de u ∈ M en M/mM . Dada una base {u1 , ..., ur }
de M , tenemos que B = {u1 , ..., ur } genera a M/mM como k/m-módulo, es
decir, como espacio vectorial. Veamos que B es linealmente independiente:
r
X r
X
ai ui = 0, con ai ∈ F y ai ∈ k ⇒ ai ui ∈ mM ⇒
i=1 i=1
ai ∈ m para todo 1 ≤ i ≤ r, es decir, ai = 0 para todo 1 ≤ i ≤ r.

Ası́, M/mM es un espacio vectorial sobre F de dimensión r, de donde se


obtiene la unicidad de r.
Decimos que un módulo libre tiene rango n cuando admite una base con
n elementos. Acabamos de ver que esto ocurre si y sólo si M ∼
= k (n) .

Observación. El objeto de estudio del Algebra Lineal son los módulos


libres y sus morfismos, comunmente restringidos al caso en que k es un
campo. El rango de un módulo libre sobre un campo es su dimensión como
espacio vectorial.

Sea f : M → N un morfismo de módulos libres con rango M = m y


rango N = n. Elegimos una base {u1 , ..., um } de M y una base {v1 , ..., vn }
de N . Esta elección de bases nos permite asociarle una matriz A de tamaño
m × n al morfismo f ası́:
n
X
A = (aij ), donde f (ui ) = aij vj , para 1 ≤ i ≤ m.
j=1

Pm Pn
En estas condiciones, si x = i=1 xi ui con y = f (x) = j=1 yi vi ; de
manera que x ∈ M tiene coordenadas x1 , ..., xm , mientras que las de y ∈ N
son y1 , ..., yn , se cumple la identidad matricial (x1 , ..., xm )A = (y1 , ..., yn ),
como puede verificarse en los casos x = ui .
Obtenemos el morfismo Ψ : Homk (M, N ) → Mm×n (k), donde Mm×n (k)
es el conjunto de matrices m × n con coeficientes en k y Homk (M, N ) es el
k-módulo de funciones lineales M → N .
4.1 Módulos Libres 155

Aquı́, Ψ(f ) = A en la situación anterior; y vemos que Ψ es un isomorfismo


de k-módulos, pues se puede obtener toda matriz A ∈ Mm×n (k) como
imagen de algún morfismo f : M → N , mientras que ker Ψ = (0).
Cuando M = N , elegimos solamente una base de M , entonces resulta
que Ψ : Endk (M ) = Homk (M, M ) → Mn (k) es un antiisomorfismo de
anillos:
Ψ(g ◦ f ) = Ψ(f )Ψ(g), para f, g ∈ End(M ).
k

Proposición 4.2 Si f ∈ Endk (M ) es tal que envı́a una base de M a otra


base de M , entonces f es un automorfismo de M .
Demostración: Sean {u1 , ..., un } y {v1 , ..., vn } dos bases de M tales que
f (ui ) = vi para
Ptodo 1 ≤ i ≤Pn, entonces ImPfn = (v1 , ..., vn ) = M , mientras
n n
que ker f = { i=1 ai ui | f ( i=1 ai ui ) = i=1 ai vi = 0} = (0). Ası́, f es
biyectivo. Es fácil ver que f −1 es lineal.
Teorema 4.3 Si al morfismo de k-módulos libres f : M → N , donde
rango M = m y rango N = n, le corresponde la matriz A = (aij ) con
respecto a las bases {u1 , ..., um } de M y {v1 , ..., vn } de N , entonces también
le corresponde la matriz P AQ−1 , conPrespecto a las bases 0 0
Pn{u1 , ..., um } de
0 0 0 m 0
M y {v1 , ..., vn } de N dadas por ui = j=1 pij uj y vr = r=1 qrs vs , donde
P = (pij ) es de tamaño m × m y Q = (qrs ) es de tamaño n × n.
Demostración: Como las matrices P y Q están asociadas a cambios de
base, el resultado anterior garantiza quePson invertibles. Ası́ podemos es-
n
cribir Q−1 = (trs ); y también vr = 0
s=1 trs vs , para 1 ≤ r ≤ n. La
demostración concluye con el cálculo siguiente:
Xm m
X X X
f (u0i ) = f ( pij uj ) = pij f (uj ) = pij ajr vr = pij ajr trs vs0 .
j=1 j=1 j,r j,r,s

Se dice que dos matrices A, B ∈ Mm×n (k) son equivalentes cuando


existen matrices invertibles P ∈ Mm (k) y Q ∈ Mn (k) tales que B = P AQ.
Acabamos de ver que esto sucede exactamente cuando A y B representan
a un mismo morfismo de k-módulos libres k (m) → k (n) , donde los cambios
de base están dados por P y Q−1 respectivamente.

Dualidad
Cuando V es un k-módulo libre y k es un anillo conmutativo, el k-módulo
Homk (V, k) es el módulo dual de V , escrito V ∗ .
Teorema 4.4 a) Si V es un k-módulo libre con base {²1 , ..., ²n }, entonces
V ∗ admite como base a {²∗1 , ..., ²∗n }, donde ²∗i (²j ) = δij para 1 ≤ i, j ≤ n.
b) La función h : V → V ∗∗ dada por h(u)(v ∗ ) = v ∗ (u) ∈ k para todos
u ∈ V, v ∗ ∈ V ∗ es un isomorfismo de k-módulos.
156 4. Algebra Lineal
Pn
c) Sea T : V → V lineal tal que T (²i ) = j=1 aij ²j , para todo 1 ≤ i ≤ n.
Definimos T ∗ : V ∗ → V ∗ lineal ası́: T ∗ (f )(v) = f (T (v)), para f ∈ V ∗ y
v ∈ V . Entonces la matriz asociada a T ∗ con respecto a la base {²∗1 , ..., ²∗n }
de V ∗ es At , la transpuesta de A = (aij ).

Demostración: Pna) Sea∗ f ∈ V tal que f (²i ) = ai ∈ k para 1 ≤ i ≤ n,
Pn (f − i=1 ai ²i )(²j )∗ = 0, ∗para todo
entonces 1 ≤ j ≤ n. Ası́, tenemos que
f = i=1 ai ²∗i , porP lo que (²1 , ..., ²n ) = V ∗ . P
n ∗ n ∗
Por otra parte, i=1 ci ²i = 0 ⇒ cj = i=1 ci ²i (²j ) = 0 para todo
∗ ∗
1 ≤ j ≤ n. Ası́, {²1 , ..., ²n } es linealmente independiente.
b) h es claramente lineal: h(au1 + bu2 )(v ∗ ) = v ∗ (au1 + bu2 ) = av ∗ (u1 ) +
bv (u2 ) = (ah(u1 ) +Pbh(u1 ))(v ∗ ), para todos a, b ∈ k, u1 , u2P

∈ V, v ∗ ∈ V ∗ .
n ∗ ∗ n
Ahora bien, u = i=1 ci ²i ∈ ker h ⇒ 0 = h(u)(²j ) = ²j ( i=1 ci ²i ) = cj ,
para todo 1 ≤ j ≤ n. Ası́, u = 0 y h es inyectiva.
Finalmente, (²∗∗ ∗∗
1 , ..., ²n ) = V
∗∗
y h(²i ) = ²∗∗
i para todo 1 ≤ i ≤ n. Ası́,
h es suprayectiva. Pn
c) Sea B = (bij ) la matriz tal que T ∗ (²∗i ) = j=1 bij ²∗j , calculamos bir
para 1 ≤ i, r ≤ n:
n
X n
X
∗ ∗ ∗ ∗ ∗
bir = (bij ²j )(²r ) = (T ²i )(²r ) = ²i (T (²r )) = ²i ( arj ²j ) = ari .
j=1 j=1

Ejercicios
1. Sea k un anillo conmutativo con 1. Demuestre que Homk (k (m) , k (n) )
es un módulo libre de rango mn.
2. Si M = M1 + · · · + Mr . Demuestre que M = M1 ⊕ · · · ⊕ Mr si y sólo si
(M1 + · · · + Mi−1 + Mi+1 + · · · + Mr ) ∩ Mi = (0) para todo 1 ≤ i ≤ r.
3. Exhiba un conjunto {v1 , ..., vn } ⊆ k (n) linealmente independiente que
no sea base de k (n) , para k un anillo conmutativo que no sea campo.
4. Sean V y W espacios vectoriales de dimensión finita. Demuestre que
dim V + dim W = dim(V + W ) + dim(V ∩ W ).
5. Sea T : M → L lineal. Defina una transformación dual adecuada
T ∗ : L∗ → M ∗ que sea lineal; y demuestre que
a) T es inyectivo si y sólo si T ∗ es suprayectivo.
b) T (v) = w tiene al menos una solución v para cada w ∈ L si y sólo si
T ∗ (w∗ ) = v ∗ tiene cuando más una solución w∗ para cada v ∗ ∈ M ∗ .
c) Cuando M = L y T, S ∈ End(M ), entonces (ST )∗ = T ∗ S ∗ y
1∗ = 1.
d) Cuando M = L y T es invertible, entonces T ∗ es invertible y
(T ∗ )−1 = (T −1 )∗ .
4.2 Algebras 157

4.2 Algebras
En esta sección, suponemos que k es un anillo conmutativo con uno. Un
álgebra sobre k, también llamado k-álgebra es un morfismo de anillos
f : k → A tal que Im f ⊆ Z(A). Cuando el morfismo f está entendido,
abusivamente se dice que el álgebra es el anillo A, que en todo caso posee
una estructura adicional de k-módulo.

Ejemplos. Algunos de los objetos más importantes que se estudian en


Algebra son precisamente k-álgebras:

1. Si F/k es una extensión de campos, entonces la inclusión k ,→ F es


un k-álgebra.

2. El anillo de polinomios A = k[X1 , ..., Xn ] en n variables, donde el


morfismo estructural f : k → A envı́a los elementos de k a los poli-
nomios constantes.

3. El anillo End V , donde V es un módulo libre sobre el anillo con-


mutativo k; y donde k → End V envı́a cada elemento a ∈ k a la
multiplicación izquierda por a.

4. El anillo de matrices cuadradas Mn (k), donde el morfismo f : k → A


envı́a los elementos de k a las matrices escalares, esto es, f (c) = (cδij ).

5. Sea G un grupo. El k-álgebra de grupo k[G] se construye ası́:


X
k[G] = { cg g | cg ∈ k, cg 6= 0 en un subconjunto finito de G},
g∈G
X X X
donde ag g + bg g = (ag + bg )g y
g∈G g∈G g∈G
X X X X
( ah h)( bt t) = cg g, con cg = ah bt .
h∈G t∈G g∈G ht=g

Aquı́, f : k → k[G] está dado por f (a) = a1, para a ∈ k, donde 1 es


la identidad del grupo.

6. En el ejemplo anterior, es suficiente que G sea un monoide para pro-


ducir un álgebra, el k-álgebra de monoide k[G]. Ası́, cuando G es
el monoide libre abeliano generado por X1 , ..., Xn , escrito multiplica-
tivamente, resulta que k[G] es el anillo de polinomios k[X1 , ..., Xn ].

7. El álgebra de cuaternios reales R → H, donde el anillo H es el


del Ejemplo 9 de la Sección 2.1; y donde el morfismo estructural es
ϕ : R → H con ϕ(a) = a + 0i + 0j + 0k para todo a ∈ R.
158 4. Algebra Lineal

Un k-álgebra f : k → A es asociativo, conmutativo, etc. según lo sea


el anillo A. Todos los ejemplos anteriores son asociativos.
Un morfismo de k-álgebras f : k → A y g : k → B es un morfismo de
anillos ϕ : A → B que hace conmutativo al diagrama
f ll5 A
lRlll ϕ
k RRR
R ²
g R)
B
Dada una colección posiblemente infinita de conjuntos
Q {Ai | i ∈ I}, se
define el producto cartesiano de esta colección: i∈I Ai como el conjunto
de funciones f : I → ∪i∈I Ai talesQque f (i) ∈ Ai para todo i ∈ I. También
definimos las proyecciones πi : i∈I Ai → Ai ası́: πi (f ) = f (i).
Observemos que dado un conjunto C y dada una colección Q de funciones
{gi : C → Ai | i ∈ I}, existe una única función g : C → i∈I AiQtal que
πi ◦ g = gi para todo i ∈ I. La función g está dada por g(c) = fc ∈ i∈I Ai ,
con fc (i) = gi (c) para todo i ∈ I.
Dada una colección posiblemente infinita de k-módulos {Mi | i ∈ I},
se define el producto directo de esta colección: Q como el k-módulo con
operaciones definidas sobre el producto cartesiano i∈I Mi de los QMi ası́:
(f + g)(i) = f (i) + g(i) y (cf )(i) = cf (i), para i ∈
Q I; c ∈ k; f, g ∈ i∈I Mi .
Al k-módulo ası́ obtenido también lo escribimos i∈I Mi .
El producto directo de k-módulos también satisface una propiedad uni-
versal: Dados un k-módulo C Q y k-morfismos {gi : C → Mi | i ∈ I}, existe
un único k-morfismo g : C → i∈I Mi tal que πi ◦ g = gi para todo ` i ∈ I.
Para la misma colección {Mi | i ∈ I}, se define la suma directa i∈I Mi
como el k-submódulo del producto directo, consistente de aquellas funciones
f : I → ∪i∈I Ai tales que f (i) 6= 0 para subconjuntos finitos de I. Cuando
el
Lconjunto ı́ndice I es finito, también usamos (y preferimos) la notación
i∈I Mi para la suma `directa. Para cada i ∈ I, tenemos la inyección
canónica ji : Mi → i∈I Mi , dada por ji (m) = f , donde f (i) = m y
f (t) = 0 para t 6= i. Este k-morfismo es inyectivo,
` pues πi ◦ ji = idMi .
Se dice que M es libre cuando M = i∈I Mi , con Mi = k para todo
i ∈ I, para algún conjunto I. Esta definición generaliza a la dada en la
sección anterior para módulos finitamente generados.

Sean A y B dos k-módulos. El producto tensorial de A y B es un


k-módulo C para el que existe una función bilineal g : A × B → C tal que
dados un k-módulo P y una función bilineal h : A × B → P , siempre existe
un único k-morfismo (función lineal de k-módulos) ϕ : C → P tal que el
siguiente diagrama conmuta:
g
A×B /C
xxx
x
h
xxxϕ
² x{x
P
4.2 Algebras 159

A partir de la definición, el producto tensorial es único hasta isomorfismo,


en caso de existir, por razones puramente filosóficas: Si C y D son dos obje-
tos adecuados, en este caso k-módulos, que cumplen la condición universal
ϕ ψ
requerida, entonces existen k-morfismos C → D y D → C, con ϕ ◦ ψ = idD
y ψ ◦ ϕ = idC , de manera que C y D son isomorfos. A continuación cons-
truimos el producto tensorial de los k-módulos A y B.
Sea M el k-módulo libre generado por el (conjunto) producto cartesiano
A × B y sea N el submódulo de M generado por los elementos de la forma

r(m, n) − (rm, n), r(m, n) − (m, rn),


(m1 + m2 , n) − (m1 , n) − (m2 , n),
(m, n1 + n2 ) − (m, n1 ) − (m, n2 ),
para r ∈ k; m, m1 , m2 ∈ A; n, n1 , n2 ∈ B.

Sea C = M/N y sea g la composición de la inyección A × B ,→ M con


la proyección M → M/N = C. Entonces g es una función bilineal de k-
módulos, que claramente cumple con la propiedad universal requerida. En
lugar de C, escribimos el producto tensorial de A y B ası́: A⊗k B, omitiendo
el subı́dice k cuando quede entendido. Si a ∈ A y b ∈ B, escribimos a ⊗ b
en lugar de g(a, b).

Observaciones. De manera análoga, a partir de los k-módulos A1 , ..., An ,


es posible construir el producto A1 ⊗ · · · ⊗ An .
Es muy importante notar que dados k-módulos A, B y P , existe una
h
biyección del conjunto Bil(A × B, P ) = {A × B → P | h bilineal} al
ϕ
conjunto {A ⊗ B → P | ϕ lineal} = Hom(A ⊗ B, P ), donde g es el morfismo
usado para construir al producto tensorial y h = ϕ ◦ g en el diagrama
g
A×B / A⊗B
ttt
tt
h
tt ϕ
² ty tt
P

Dados k-módulos A, B, en general, no es inmediata la estructura del


producto A⊗B. El párrafo anterior nos debe dar una idea de la complejidad
del problema, ası́ como de la posible estructura de A ⊗ B.

f g
Una sucesión de k-módulos y morfismos · · · → N → M → P → · · ·
es exacta en M cuando Im f = ker g. Tendremos una sucesión exacta
cuando lo sea en todos sus módulos. Por ejemplo, la exactitud de la sucesión
f g
N → M → P → 0,

significa que además de Im f = ker g, se tiene que g es suprayectivo.


A continuación reunimos algunas propiedades del producto tensorial.
160 4. Algebra Lineal

Proposición 4.5 Si M, N, P y Q son k-módulos, entonces


1. k ⊗k M =∼ M.

2. M ⊗ (N ⊗ P ) ∼
=M ⊗N ⊗P ∼
= (M ⊗ N ) ⊗ P .
3. M ⊗ N ∼
= N ⊗ M.
4. M ⊗ (N ⊕ P ) ∼
= (M ⊗ N ) ⊕ (M ⊗ P ).
f g
5. Si N → M → P → 0 es una sucesión exacta, entonces también lo es
1⊗f 1⊗g
Q ⊗ N −→ Q ⊗ M −→ Q ⊗ P → 0.
Demostración:
1. El morfismo f : k × M → M , dado por f (a, m) = am es bilineal;
y es tal que para cualesquiera k-módulo L y k-morfismo bilineal h :
k × M → L, existe un único morfismo ϕ que hace conmutativo al
diagrama
f
k×M /M
ww
ww
h wwϕ
² w{ ww
L
2. Veamos que M ⊗ (N ⊗ P ) ∼ = M ⊗ N ⊗ P . Existe una única función
bilineal g : M × (N ⊗ P ) → M ⊗ N ⊗ P que cumple la condición
g(m, n ⊗ p) = m ⊗ n ⊗ p, para m ∈ M, n ∈ N, p ∈ P . Dado un k-
módulo L, es suficiente observar que a cada h ∈ Bil(M × (N ⊗ P ), L),
le corresponde un morfismo único ϕ ∈ Hom(M ⊗ N ⊗ P, L) tal que
h = ϕ ◦ g:
g
M × (N ⊗ P ) / M ⊗N ⊗P
m mmm
mmmm
h
mm ϕ
² vmmmmm
L
Esto nos dice que M ⊗ N ⊗ P es (isomorfo con) el producto tensorial
M ⊗ (N ⊗ P ). La otra afirmación admite una demostración análoga.
3. Aquı́ es suficiente identificar Bil(M × N, L) con Bil(N × M, L) y
con Hom(N ⊗ M, L), observando que la identificación se hace ante
g : M × N → N ⊗ M , donde g(m, n) = n ⊗ m para m ∈ M, n ∈ N .
4. Sea g : M × (N ⊕ P ) → (M ⊗ N ) ⊕ (M ⊗ P ) el k-morfismo dado por
g(m, (n, p)) = (m ⊗ n, m ⊗ p), para m ∈ M, n ∈ N, p ∈ P . Dado un
k-módulo L, es g la función bilineal usada para identificar
Bil(M × (N ⊕ P ), L)
¿ Bil(M × N, L) ⊕ Bil(M × P, L)
¿ Hom(M ⊗ N, L) ⊕ Hom(M ⊗ P, L).
4.2 Algebras 161

5. Dado un generador q ⊗ p de Q ⊗ P , existe m ∈ M tal que g(m) = p,


de manera que (1⊗g)(q ⊗m) = q ⊗p, por lo que 1⊗g es suprayectivo.
Por otra parte, g ◦ f = 0 ⇒ (1 ⊗ g) ◦ (1 ⊗ f ) = 0, de donde obtenemos
que Im(1 ⊗ f ) ⊆ ker(1 ⊗ g). Esta inclusión nos permite definir un
morfismo ϕ : (Q ⊗ M )/(Im(1 ⊗ f )) → Q ⊗ P satisfaciendo ϕ[(q ⊗ m) +
Im(1 ⊗ f )] = q ⊗ g(m). Para concluir, veremos que ϕ es inyectivo:
Dados q ∈ Q y p ∈ P , elegimos m ∈ M tal que g(m) = p. Afirmamos
que la clase (q ⊗ m) + Im(1 ⊗ f ) es independiente de la elección de
m, pues si m0 ∈ M cumple con g(m0 ) = p, entonces m − m0 ∈ ker g,
por lo que existe z ∈ N con f (z) = m − m0 ; y ası́ (q ⊗ m) + Im(1 ⊗
f ) = (q ⊗ m0 ) + Im(1 ⊗ f ). Esto nos permite definir un k-morfismo
η : Q×P → (Q⊗M )/(Im(1⊗f )) tal que η(q, p) = q⊗m+(Im(1⊗f )),
para cualquier m ∈ M tal que g(m) = p; pero entonces existe otro
k-morfismo ψ : Q ⊗ P → (Q ⊗ M )/(Im(1 ⊗ f )) tal que ψ(q ⊗ p) =
q ⊗ m + (Im(1 ⊗ f )) con g(m) = p. Como ψ ◦ ϕ = 1, tenemos nuestra
conclusión.

Observaciones. La notación 1 ⊗ f usada en la proposición, es abusiva,


pues no se refiere a ningún producto tensorial de funciones; sino a la función
inducida por 1 y f en un producto tensorial de módulos.
El producto tensorial de dos módulos da origen a reestructuraciones.
Por ejemplo, Zm ⊗Z Zn = (0), si Zn es el grupo cı́clico de orden n y
(m, n) = 1, pues cualquier a ⊗ b ∈ Zm ⊗ Zn es una Z-combinación lineal de
m(a ⊗ b) = (ma ⊗ b) = 0 y de n(a ⊗ b) = (a ⊗ nb) = 0.
No es cierto que para todo anillo conmutativo k, toda sucesión exacta
g f
N → M → P de k-módulos y todo k-módulo L, siempre se tenga exactitud
1⊗g 1⊗f
de la sucesión L ⊗ N −→ L ⊗ M −→ L ⊗ P . Por ejemplo, la sucesión
f
0 → Z → Z de Z-módulos, con f (z) = 2z para todo z ∈ Z es exacta; pero
si L = Z/2Z, entonces

1⊗f
0 → L ⊗ Z −→ L ⊗ Z

no es exacta, pues (1 ⊗ f )(a ⊗ b) = a ⊗ 2b = 2a ⊗ b = 0, por lo que 1 ⊗ f = 0,


mientras que L ⊗ Z ∼ = L 6= 0.

Corolario 4.6 Si M y L son k-módulos libres con bases {u1 , ..., um } y


{v1 , ..., vn } respectivamente, entonces M ⊗ L también es libre, de rango
mn; y admite como base al conjunto {ui ⊗ vj | 1 ≤ i ≤ m, 1 ≤ j ≤ n}.
Lm Ln
Demostración: Tenemos que M = i=1 kui y L = j=1 kvj , por lo que
Ln Lm,n
M ⊗L ∼ = j=1 M ⊗ (kvj ) ∼ = i,j=1 k(ui ⊗ vj ), usando las afirmaciones
1,3 y 4 de la proposición.
162 4. Algebra Lineal

Corolario 4.7 Sean k un anillo conmutativo, a un ideal y M un k-módulo,


entonces (k/a) ⊗k M ∼
= M/aM .

Demostración: Consideremos el producto tensorial con M de la sucesión


exacta 0 → a → k → k/a → 0. Obtenemos la siguiente sucesión exacta
a⊗M → k ⊗M → (k/a)⊗M → 0, donde k ⊗M ∼ = M y donde la imagen de
a⊗M ante este isomorfimo es aM . Ası́, (k/a)⊗M ∼
= (k ⊗M )/ Im(a⊗M ) ∼ =
(M/aM ).

Algebras tensorial, simétrico y alternante


Sea M un k-módulo. Al producto tensorial M ⊗ · · · ⊗ M con n factores
lo escribimos Tkn M , omitiendo el subı́ndice cuando quede entendido. Al
k-módulo a
T (M ) = T nM (4.1)
n≥0

le damos una estructura de k-álgebra con una multiplicación k-bilineal

T (M ) × T (M ) → T (M ) tal que T r M × T s M → T r+s M, (4.2)

donde el producto de los generadores a1 ⊗ · · · ⊗ ar y b1 ⊗ · · · ⊗ bs se define


como a1 ⊗ · · · ⊗ ar ⊗ b1 ⊗ · · · ⊗ bs . Aquı́, el morfismo estructural del álgebra
la composición de la identidad k → T 0 M con la inclusión canónica
T (M ) es `
T M ,→ n≥0 T n M = T (M ). El resultado es el álgebra tensorial T (M ).
0

Un álgebra con una descomposición como la de (4.1) que cumple con la


condición (4.2) es un álgebra graduado.

El álgebra simétrico S(M ) del k-módulo M es el k-álgebra que resulta


del cociente de T (M ) entre el ideal bilateral s generado por las expresiones
a ⊗ b − b ⊗ a, para todos a, b ∈ M . Escribimos S n M = T n M/(s ∩ T n M )
para considerar el morfismo de módulos
a a
ϕ= ϕn : T (M ) → SnM
n≥0 n≥0

obtenido de aplicar los morfismos naturales


` ϕn : T n M → S n M a las com-
ponentes de T (M` ). Aquı́, ker ϕ = n≥0 (s ∩ T n M ). El ideal s cumple con
la igualdad s = n≥0 (s ∩ T n M ), por lo que es un ideal homogéneo.
Esto nos permite considerar a ϕ como un morfismo de anillos, que le da
estructura de álgebra graduado al álgebra simétrico S(M ):
a
S(M ) = T (M )/s ∼
= S n M.
n≥0

Es fácil ver que si n ≥ 2, σ ∈ Sn es una permutación y a1 , ..., an ∈ M ,


entonces s contiene a (a1 ⊗ · · · ⊗ an ) − (aσ(1) ⊗ · · · ⊗ aσ(n) ).
4.2 Algebras 163
V
El álgebra alternante (M ) del k-módulo M es el k-álgebra que se ob-
tiene al formar el cociente del álgebra tensorial T (M ) entre el ideal bilateral
a generado por las expresiones a⊗a, para todo a ∈ M . Si a, b ∈ M , entonces
a contiene a las expresiones a⊗b+b⊗a = (a+b)⊗(a+b)−a⊗a−b⊗b.
V Para
a1 , ..., ar ∈ M , la imagen de a1 ⊗· · ·⊗ar en (M ) se escribe a1 ∧· · ·∧ar , de
manera que aV ∧b+b∧` a = 0,V
siempre que a,Vb ∈ M . Como a es homogéneo,
n n
tenemos que (M ) = n≥0 M, donde M = T n M/(a ∩ T n M ).
n
Una función f : M → k se llama alternante cuando f (m1 , ..., mn ) = 0
si mi = mj para algunos i 6= j.

Observaciones. Sean n un entero positivo fijo y M un k-módulo. Ası́ como


T n M satisface una propiedad universal, tenemos que
1. La composición de los morfismos naturales g : M n → T n M → S n M
es multilineal y simétrica; y cumple con la condición universal de
que para todo k-módulo L y toda función multilineal y simétrica
h : M n → L, existe un único morfismo ϕ : S n M → L que hace
conmutativo al diagrama
g
Mn / SnM
w w
h www

² w{ ww
L
Vn
2. La composición de los morfismos naturales f : M n → T n M → M
es multilineal y alternante; y cumple con la condición universal de
que para todo k-módulo L y toda función multilineal
Vn y alternante
q : M n → L, existe un único morfismo ψ : M → L que hace
conmutativo al diagrama

Mn
f
/ Vn M
w
ww
q
wwwψ
² w{ ww
L

Teorema 4.8 Sean k un anillo conmutativo, M y N k-módulos. Entonces:


1. Cada T n (M ⊕ N ) de la descomposición de T (M ⊕ N ), es la suma di-
recta de todos los productos tensoriales de k-módulos, con n factores,
elegidos entre M y N .
2. S(M ⊕ N ) ∼ = S(M ) ⊗ S(N ) es un isomorfismo de álgebras, siempre
que S(M ) ⊗ S(N ) esté provisto de la multiplicación conmutativa.
V ∼ V V
3. V(M ⊕ N V) = (M ) ⊗ (N ) es un isomorfismo de álgebras si a
(M ) ⊗ (N ) se le provee de la multiplicación bilineal
Vq que cumple
Vp
(a ⊗ b) ∧ (c ⊗ d) = (−1)pq (ac ⊗ bd), para todos b ∈ N, c ∈ M.
164 4. Algebra Lineal

Demostración: La primera afirmación es consecuencia de la Proposición


4.5. Por ejemplo,

T 2 (M ⊕ N ) = (M ⊗ M ) ⊕ (M ⊗ N ) ⊕ (N ⊗ M ) ⊕ (N ⊗ N ).

Ası́, podrı́amos escribir

T (M ⊕ N ) = T (M ) ⊗ T (N ) ⊗ T (M ) ⊗ T (N ) ⊗ · · ·

A partir de aquı́, las dos siguientes afirmaciones admiten demostraciones


análogas
V entre sı́. Veamos por ejemplo la última.
(M ⊕ N ) es el resultado de dividir T (M ⊕ N ) entre el ideal a generado
por las expresiones a ⊗ a, para todos a ∈ M ⊕ N . Sea b el subideal de a
generado por las expresiones a ⊗ b + b ⊗ a para todos a ∈ M, b ∈ N ; y sea a
la imagen de a en T (M ⊕ N )/b. Entonces, T (M ⊕ N )/b ∼ = T (M ) ⊗ T (N ),
mientras que
^ ^ ^
(M ⊕ N ) ∼ = [T (M ) ⊗ T (N )]/a ∼
= (M ) ⊗ (N ).

Este último objeto provisto de la multiplicación indicada.

Corolario 4.9 Sea M un k-módulo libre con base {u1 , ..., um }. Entonces:

1. T (M ) y todos los T n M también son libres. El rango de T n M es mn ;


y {ui1 ⊗ · · · ⊗ uin | 1 ≤ i1 , ..., in ≤ m} es una base de T n M , por lo
que T (M ) se identifica con el álgebra no comutativo de polinomios en
las variables {u1 , ..., um } con coeficientes en k.

2. ¡S(M ) y¢ todos los S n M también son libres. El rango de S n M es


m+n−1
m−1 ; y el conjunto de monomios de grado n en u1 , ..., um es
una base de S n M , por lo que S(M ) se identifica con el álgebra de
polinomios en esas variables con coeficientes en k.
V Vn Vn
3. ¡ (M
¢ ) y todos los M también son libres. El rango de VM es
m n
n ; y {ui1 ∧ · · · ∧ uin | 1 ≤ i1 < · · · < in ≤ m} es una base de M.

Demostración: Por el Corolario 4.6, tenemos que T (M ) y todo T n M


también son libres, como en el enunciado. Ası́, T (M ) se identifica con el
álgebra no comutativo de polinomios en las ui con coeficientes
`m en k.
Después, inducción en m produce M = k m = ku1 ⊕ i=2 kui . Aquı́,
m
a
S(M ) = S(ku1 ) ⊗ S( kui ),
i=2

donde S(ku1 ) tiene como base ` a las potencias de u1 , mientras que la


m
hipótesis inductiva dice que S( i=2 kui ) es el anillo de polinomios en
u2 , ..., um . La conclusión se obtiene de ahı́ usando el Teorema 4.8.2.
4.2 Algebras 165
`m V V V `m
Finalmente,
V M = ku1 ⊕ i=2 kui produce M = ku1 ⊗ i=2 kui
con (ku1 ) = k[u1 ]/(u21 ) = k ⊕ ku1 . De manera que

^ ^am
(M ) = (k ⊕ ku1 ) ⊗ ( kui ),
i=2
n
^ n
^ n−1
^
m m−1
(k ) = (k ) ⊕ [ku1 ⊗ (k m−1 )],

de donde se obtiene la conclusión usando el Teorema 4.8.3.

Transformaciones de rango uno


Supongamos que M y L son espacios vectoriales sobre un campo k, con
bases {u1 , ..., um } y {v1 , ..., vn } respectivamente. Sabemos que entonces el
dual M ∗ = Homk (M, k) también es libre, con base {u∗1 , ..., u∗m }, donde
u∗i (uj ) = δij . El Corolario 4.6, garantiza que L ⊗ M ∗ es libre, con base

{vj ⊗ u∗i | 1 ≤ j ≤ n, 1 ≤ i ≤ m}.

Ası́, L⊗M ∗ = ∼ Homk (M, L), al ser ambos módulos libres de rango mn; pero
este isomorfismo es “natural”, por lo que no le asignamos ningún sı́mbolo,
simplemente consideramos que v ⊗u∗ pertenece a Homk (M, L); y que actúa
ası́: (v ⊗ u∗ )(x) = u∗ (x)v, para todos x ∈ M, u∗ ∈ M ∗ y v ∈ L.
Observando que (vj ⊗ u∗i )(up ) = δip vj , es claro que a T le corresponde
la matriz
P A = (aij ) ∈ Mm×n con respecto a las bases elegidas si y sólo si
T = ij aij (vj ⊗ u∗i ).
El rango de una transformación T : M → L es el de su imagen T (M );
ası́, cada v ⊗ u∗ ∈ Homk (M, L) es de rango uno. Aquı́ tenemos que

Im(v ⊗ u∗ ) = hvi y que ker(v ⊗ u∗ ) = ker u∗ .

Observaciones. Si V es un espacio vectorial de dimensión n, entonces se


tiene para todos v, z ∈ V, u∗ , w∗ ∈ V ∗ y T ∈ End V que:

1. T (v ⊗ u∗ ) = T v ⊗ u∗ ,

2. (v ⊗ u∗ )T = v ⊗ T ∗ u∗ ,

3. (v ⊗ u∗ )(z ⊗ w∗ ) = (u∗ z)(v ⊗ w∗ ),

4. (v ⊗ u∗ )∗ = u∗ ⊗ v ∗∗ ∼
= u∗ ⊗ v.

Teorema 4.10 a) Si rango T = r, entonces T es la suma de r transfor-


maciones de rango uno; pero no es suma de ningún numero menor de tales
transformaciones.
b) rango T = rango T ∗ .
166 4. Algebra Lineal

Demostración: a) Sean {w1 , ..., wr } una base de T (M ) y v ∈P M , entonces


r
existen escalares ci ∈ k para 1 ≤ i ≤ r tales que T (v) = i=1 ci wi ; y

que definen
Pr funciones lineales fi ∈ M con f i (v) = ci . Ası́ resulta que
T = i=1 (wi ⊗ fi ). Ps
Supongamos
Ps que T = i=1 Bi , con rango Bi = 1, para Ps toda Bi , entonces
T (M ) ⊆ i=1 Bi (M ), por lo que r = rango T (M ) ≤ i=1 rango Bi = s.
b) Supongamos que rango T = r, de manera que existe {v1 , ..., vr } lineal-
mente independiente con
r
X r
X r
X
T = (vi ⊗ u∗i ) ⇒ T ∗ = (vi ⊗ u∗i )∗ = (u∗i ⊗ vi ),
i=1 i=1 i=1

identificando a cada vi∗∗ con vi , por lo que rango T ∗ ≤ r.


Afirmamos que {u∗1 , ..., u∗r } es linealmente independiente.
DePno ser ası́,
s
tal vez reordenando los ı́ndices, se tendrı́an expresiones u∗i
= j=1 aij u∗j
para 1 ≤ i ≤ r, con escalares aij , donde s < r. Pero entonces tendrı́amos
r
X s
X s X
X r
T = (vi ⊗ aij u∗j ) = ( aij vi ) ⊗ u∗j ),
i=1 j=1 j=1 i=1

una suma de s transformaciones de rango ≤ 1; y una contradicción.


Elegimos wj∗ ∈ L∗ tales que wj∗ (vi ) = δij , para tener T ∗ (wj∗ ) = u∗j . Ası́,
ui ∈ Im T ∗ , para todo 1 ≤ i ≤ r; y rango T ∗ = r.

Dados un campo k y una matriz A ∈ Mm×n (k), definimos el rango


renglón de A como la dimensión del subespacio de k (m) generado por los
renglones de A. El rango columna de A es la dimensión del subespacio
de k (n) generado por las columnas de A.

Corolario 4.11 rango renglón A = rango columna A.


Demostración: Supongamos que la matriz A está asociada a la función T :
k (m) → k (n) , entonces At está asociada a T ∗ : k (n) → k (m) . La conclusión es
consecuencia de que rango renglón A = rango T y que rango columna A =
rango T ∗ .
Teorema 4.12 Si T : V → W es una transformación lineal y V es de
dimensión finita, entonces dim V = rango T + dim ker T .
Demostración: Sea {u1 , ..., ur } una base de ker T que se extiende a la base
{u1 , ..., ur , v1 , ..., vs } de V . Aquı́ tenemos que dim ker T = r, que dim V =
r + s y que B = {T (v1 ), ..., T (vs )} genera a T (V ); pero B resulta ser una
base de T (V ) y s = ◦(B) = rango T , al ser B linealmente independiente:
s
X Xs s
X
ci T (vi ) = 0 ⇒ T ( ci vi ) = 0 ⇒ ci vi ∈ ker T ⇒ ci = 0, ∀ i.
i=1 i=1 i=1
4.2 Algebras 167

Ejercicios
1. a) Sea G un grupo finito. Demuestre que ◦(G) es la dimensión como
espacio vectorial sobre un campo k del k-álgebra de grupo k[G].
b) Sea H el grupo de cuaternios de la Sección 1.3. Investigue si son
isomorfos R[H] y el álgebra de cuaternios reales H.
2. Sea f : k → A un k-álgebra, libre como k-módulo, con rangok A = n.
Demuestre que A es isomorfo con un subálgebra de Endk k (n) .
3. La multiplicación de Arens. Sea V un espacio vectorial sobre k de
dimensión infinita, provisto de una multiplicación bilineal V ×V → V .
Definimos una serie de multiplicaciones como se indica.
V ∗ × V → V ∗ , (u∗ · v)(w) = u∗ (vw),
V × V ∗ → V ∗ , (u∗∗ · v ∗ )(w) = u∗∗ (v ∗ · w),
∗∗

V × V ∗∗ → V ∗∗ , (u∗∗ · v ∗∗ )(w∗ ) = u∗∗ (v ∗∗ · w∗ ).


∗∗

Demuestre que h : V → V ∗∗ dada por h(u)(v ∗ ) = v ∗ (u) ∈ k, para


u ∈ V, v ∗ ∈ V ∗ es inyectiva. Demuestre que V ∗∗ ×V ∗∗ → V ∗∗ extiende
a la multiplicación original y que es asociativa, si la multiplicación
original lo era.
`
4. Verifique que la suma directa i∈I Mi de k-módulos satisface la
siguiente propiedad universal: Dados un k-módulo C y`k-morfismos
{gi : Mi → C | i ∈ I}; existe un único k-morfismo g : i∈I Mi → C
tal que g ◦ ji = gi , para todo i ∈ I.
5. Sean R un anillo local, m su ideal máximo, k = R/m y M un R-
módulo finitamente generado. Demuestre que k ⊗ M = 0 ⇒ M = 0.
6. Sean k un campo y V un espacio vectorial sobre k de dimensión finita.
Demuestre que para T, S ∈ End V , es cierto que
(a) rango(T + S) ≤ rango(T ) + rango(S).
(b) rango(T ◦ S) ≤ min{rango(T ), rango(S)}.
(c) S invertible ⇒ rango(T ◦ S) = rango(T ) = rango(S ◦ T ).
7. Sean k un campo, V un espacio vectorial sobre k de dimensión finita
y W un subespacio de V . Demuestre que End V es simple y que
(a) {T ∈ End V | Im T ⊆ W } es un ideal derecho de End V .
(b) Todo ideal derecho de End V es de la forma anterior. (Sugeren-
cia: Reduzca al caso de transformaciones de rango uno).
(c) {T ∈ End V | W ⊆ ker T } es un ideal izquierdo de End V .
(d) Todo ideal izquierdo de End V es de la forma anterior.
(e) Determine los ideales izquierdos y derechos mı́nimos 6= 0 de
End V .
168 4. Algebra Lineal

4.3 Determinantes
Sean k un anillo conmutativo y V un k-módulo libre con base {²1 , ..., ²n }. En
V V0 V1 V2 Vn
la
Vrdescomposición V = V ⊕ V ⊕ V ⊕· · ·⊕ V , se tiene que cada
V es un módulo libre con base {²i1 ∧ · · · ∧ ²ir | 1 ≤ i1 < · · · < ir ≤ n}.
V0 ∼ V1 ∼ Vn Vn
En particular, V = k, V = V y dim V = 1. Además, V tiene
como base al conjunto con un sólo elemento {²
Pn 1 ∧ · · · ∧ ²n }.
Dados n vectores u1 , ..., un ∈ V con ui = j=1 aij ²j para cada 1 ≤ i ≤ n,
calculamos su producto exterior, para obtener
n
X n
X
u1 ∧ · · · ∧ un = a1j ²j ∧ · · · ∧ anj ²j = ∆ ²1 ∧ · · · ∧ ²n ,
j=1 j=1

para algún elemento ∆ ∈ k. Esto nos permite definir una función multi-
lineal y alternante det : V n → k llamada determinante. De manera que
det(u1 , ..., un ) = ∆.
Dada A = (aij ) ∈ Mn (k), una matriz n × n; definimos elP determi-
n
nante de A, escrito det A, como det(u1 , ..., un ), donde ui = j=1 aij ²j
son los vectores renglón de A. Ası́, tenemos otra función, también llamada
determinante, det : Mn (k) → k. También escribimos det A ası́:

a11 ··· a1n


.. .. ..
. . .
an1 ··· ann

Observaciones. Obtenemos las siguientes propiedades de los determi-


nantes a partir de su definición.

1. El caso 2 × 2.
a11 a12
= a11 a22 − a12 a21 , pues
a21 a22
(a11 ²1 + a12 ²2 ) ∧ (a21 ²1 + a22 ²2 ) = (a11 a22 − a12 a21 ) (²1 ∧ ²2 ).

2. El determinante de una matriz diagonal es

a11 0 ··· 0
0 a22 ··· 0
.. .. .. .. = a11 · · · ann ,
. . . .
0 0 ··· ann

pues (a11 ²1 ) ∧ · · · ∧ (ann ²n ) = (a11 · · · ann ) ²1 ∧ · · · ∧ ²n . Casos par-


ticulares importantes son el determinante de la matriz identidad,
det(δij ) = 1; y el determinante de una matriz escalar, det(bδij ) = bn .
4.3 Determinantes 169

3. Efectuando la multiplicación exterior para una matriz A = (aij ),


vemos que
X n
Y
det A = (−1)σ ai,σ(i) . (4.3)
σ∈Sn i=1

De manera que det : Mn (k) → k es una función polinomial ho-


mogénea de grado n con n! términos, la mitad de los cuales tienen
coeficiente 1; y la otra mitad tienen coeficiente −1. Cada término de
(4.3) incluye exactamente un factor de cada renglón (columna) de A.
4. El determinante de una matriz es igual al de su transpuesta.
Sean A = (aij ) y B = At = (bij ), de manera que bij = aji , para
cualesquiera ı́ndices i, j. Escribimos τ = σ −1 , para obtener
X n
Y X n
Y
det At = det B = (−1)σ bi,σ(i) = (−1)σ aσ(i),i
σ∈Sn i=1 σ∈Sn i=1
X Yn X Yn
= (−1)σ ai,σ−1 (i) = (−1) τ
ai,τ (i) = det A.
σ∈Sn i=1 τ ∈Sn i=1

Pn
5. Dada A ∈ Mn (k), con vectores columna vp = i=1 aip ²i , también
podemos considerar det(v1 , ..., vn ). Una consecuencia inmediata de la
observación anterior es que det A = det(v1 , ..., vn ). De manera que
podemos decir que el determinante de una matriz es una función
multilineal y alternante de sus renglones o de sus columnas.
Teorema 4.13 Si A, B ∈ Mn (k), entonces det(AB) = (det A)(det B).
Demostración: Sean u1 , ..., un los
Pnvectores renglón
Pn de B y A = (aij ),
entonces los renglones de AB son j=1 a1j uj , ..., j=1 anj uj . El cálculo
n
X n
X
a1j uj ∧ · · · ∧ anj uj = (det A) u1 ∧ · · · ∧ un
j=1 j=1
= (det A)(det B) ²1 ∧ · · · ∧ ²n
demuestra que det(AB) = (det A)(det B).
Teorema 4.14 (Regla de Cramer) Si el sistema de ecuaciones lineales
a11 X1 + ··· + a1n Xn = c1
.. ..
. . (4.4)
an1 X1 + ··· + ann Xn = cn
satisface la condición D = det(aij ) ∈ k ? , entonces existen soluciones únicas
dadas por: Xi = D−1 det(a1 , ..., ai−1 , c, ai+1 , ..., an ), para 1 ≤ i ≤ n, donde
c es el vector con coordendas c1 , ..., cn ; mientras que aj es el j-ésimo vector
columna de la matriz A = (aij ).
170 4. Algebra Lineal

Demostración: El sistema de ecuaciones (4.4) puede expresarse como la


igualdad de matrices en Mn×1 (k[X1 , ..., Xn ]):
      
X1 a11 · · · a1n X1 c1
 .
.   .
. . . .
.   .
.   .. 
( a1 · · · an ) . = . . . . = . .
Xn an1 · · · ann Xn cn
Pn
Ası́, (4.4) dice que j=1 Xj aj = c. La conclusión es consecuencia del
cálculo siguiente

det(a1 , ..., ai−1 , c, ai+1 , ..., an )


Xn
= det(a1 , ..., ai−1 , Xj aj , ai+1 , ..., an )
j=1
= det(a1 , ..., ai−1 , Xi ai , ai+1 , ..., an ) = Xi D.

Teorema 4.15 Dado un anillo conmutativo k, una matriz A ∈ Mn (k) es


invertible si y sólo si su determinante lo es; en cuyo caso, det(A−1 ) =
(det A)−1 .
Demostración: Veamos primero que A invertible ⇒ det A ∈ k ? :

AA−1 = 1 ⇒ (det A)(det A−1 ) = 1 ⇒ det(A−1 ) = (det A)−1 .

Recı́procamente,
Pn si det A ∈ k ? , entonces cada sistema de ecuaciones li-
neales j=1 Xj aj = ²ti con 1 ≤ i ≤ n, formado usando las columnas aj de
A, tiene como solución única al vector columna (b1i , ..., bni )t . Entonces la
matriz B = (bij ) satisface AB = 1. Ası́, B = A−1 .

Observación. Si k es un campo, entonces el Teorema 4.15 afirma que A es


invertible si y sólo si det A 6= 0. La Proposición 4.2 implica que los renglones
de A forman un conjunto linealmente independiente si y sólo si det A 6= 0.

Dados un anillo conmutativo k y una matriz A = (aij ) ∈ Mn (k), escribi-


mos N = {1, ..., n}; y consideramos los renglones de A:
n
X
ai = aij ²j , para 1 ≤ i ≤ n.
j=1

La definición de det A = ∆(A) fue a través de la igualdad

a1 ∧ · · · ∧ an = ∆(A) ²1 ∧ · · · ∧ ²n .

Elijamos ahora un subconjunto P = {i1 , ..., ip } ⊆ N , donde i1 < · · · < ip .


Obtenemos una expresión única
X
ai1 ∧ · · · ∧ aip = ∆Q P (A) ²j1 ∧ · · · ∧ ²jp , (4.5)
Q⊆N,◦(Q)=p
4.3 Determinantes 171

donde ∆Q P (A) ∈ k, para cada Q = {j1 , ..., jp } ⊆ N con ◦(Q) = p. Aquı́


suponemos que j1 < · · · < jp .
j1 ,...,jp
Los elementos ∆Q P (A), también escritos ∆i1 ,...,ip (A), son los menores
¡n¢
p × p de A. El número de tales menores con P fijo es p .
Para calcular cada ∆Q P (A), consideramos las proyecciones fQ : V → VQ
en los distintos submódulos VQ = h²j | j ∈ Qi, de manera que

fQ (ai ) = aij1 ²j1 + · · · + aijp ²jp ,


fQ (ai1 ) ∧ · · · ∧ fQ (aip ) = ∆QP (A) ²j1 ∧ · · · ∧ ²jp . (4.6)

La ecuación (4.6) nos aclara que ∆Q


P (A) es el determinante de la subma-
triz de A formada por los renglones en P y las columnas en Q. Observamos

que ∆N 0
N (A) = ∆(A), convenimos que ∆∅ (A) = 1 y escribimos P = N r P .

Teorema 4.16 (Expansión de Laplace) Dada A = (aij ) ∈ Mn (k),


elegimos un conjunto de renglones P = {i1 , ..., ip } con i1 < · · · < ip .
Entonces
X Q0
det A = (−1)(i1 +j1 )+···+(ip +jp ) ∆Q
P (A)∆P 0 (A), (4.7)
Q⊆N,◦(Q)=p

donde Q = {j1 , ..., jp } con j1 < · · · < jp .

Demostración: Efectuamos el cálculo

(−1)(i1 −1)+···+(ip −p) (a1 ∧ · · · ∧ an ) =


(ai1 ∧ · · · ∧ aip ) ∧ (aip+1 ∧ · · · ∧ ain ) =
X
∆Q
P (A) ²j1 ∧ · · · ∧ ²jp ∧ (aip+1 ∧ · · · ∧ ain ) =
Q⊆N,◦(Q)=p
X 0
∆Q
P (A) ²j1 ∧ · · · ∧ ²jp ∧ (∆Q
P 0 (A) ²jp+1 ∧ · · · ∧ ²jn ) =
Q⊆N,◦(Q)=p
X 0
(j1 −1)+···+(jp −p)
(−1) ∆Q Q
P (A) ∆P 0 (A) ²1 ∧ · · · ∧ ²n ,
Q⊆N,◦(Q)=p

donde P 0 = {ip+1 , ..., in } con ip+1 < · · · < in y Q0 = {jp+1 , ..., jn } con
jp+1 < · · · < jn , de manera que a1 ∧ · · · ∧ an =
X 0
(−1)(i1 +j1 )+···+(ip +jp ) ∆Q Q
P (A) ∆P 0 (A) ²1 ∧ · · · ∧ ²n ,
Q⊆N,◦(Q)=p

de donde se obtiene la conclusión.


Es posible enunciar un resultado análogo partiendo de un conjunto fijo
de columnas. En vista de (4.7), se dice que
P P 0
(−1)( i∈P i+ j∈Q j)
∆Q
P 0 (A)
172 4. Algebra Lineal

es el cofactor de ∆Q P (A).
En el caso en que P = {i} y Q = {j}, se tiene que ∆Q P (A) = aij y que
su cofactor, escrito Aij es (−1)i+j por el determinante de la submatriz de
A obtenida eliminando el renglón i y la columna j.
La expresión
det A = ai1 Ai1 + · · · + ain Ain
es la expansión a lo largo del renglón i.
La matriz cof A = (Aij ) es la matriz de cofactores de A. La matriz
adj A = (Aij )t es la matriz adjunta de A.
Teorema 4.17 Para A = (aij ) ∈ Mn (k), se tiene que

A(adj A) = (adj A)A = (det A)1,

donde 1 es la matriz identidad n × n.


Demostración: El elemento en la posición ij de A(adj A) es

ai1 Aj1 + · · · + ain Ajn ;

pero tenemos que ai1 Ai1 + · · · + ain Ain = det A, mientras que si i 6= j, se
tiene que ai1 Aj1 +· · ·+ain Ajn = 0, al ser la expansión a lo largo del renglón
j de la matriz con dos renglones iguales, obtenida de A reemplazando al
renglón j por el renglón i.
Corolario 4.18 Si A ∈ Mn (k) y det A ∈ k ? , entonces

A−1 = (det A)−1 (adj A).

Ejemplo. En el caso 2 × 2, se tiene que


µ ¶µ ¶
a b d −b
= ad − bc = ∆,
c d −c a

de manera que si existe ∆−1 , entonces


µ ¶−1 µ ¶
a b d −b
= (ad − bc)−1 .
c d −c a

Supongamos que k es un campo y que A = (aij ) ∈ Mm×n (k). Decimos


que A tiene rango determinantal r en caso de que exista un menor r × r
de A distinto de cero; pero con todos los menores (r + 1) × (r + 1) de A
iguales a cero.
Teorema 4.19 Si k es un campo y A = (aij ) ∈ Mm×n (k), entonces
rango A = rango determinantal A.
4.3 Determinantes 173

Demostración: Procedemos por inducción en r = rango A. Aquı́ existe un


conjunto linealmente independiente de r renglones de A; y todo conjunto
que contenga más de r renglones de A es linealmente dependiente.
Todo menor de A de tamaño s × s con s > r vale cero, pues la subma-
triz asociada consiste de las coordenadas de una proyección de s vectores
renglón de A, que forman un conjunto linealmente dependiente.
Supongamos que los primeros r renglones de A son linealmente indepen-
dientes. Sea B la submatriz de A formada por estos renglones.
Como el conjunto de los primeros r−1 renglones de A (ó de B) es también
linealmente independiente, la hipótesis inductiva garantiza que existe un
menor de B, que excluya a su último renglón, de tamaño (r − 1) × (r − 1)
distinto de cero. Supongamos que ∆1,...,r−1 1,...,r−1
1,...,r−1 (A) = ∆1,...,r−1 (B) 6= 0.
Queremos demostrar que existe un menor r × r de B distinto de cero.
Supongamos que esto es falso. La expansión en la última columna de
∆1,...,r
1,...,r (B) es:
Xr
air Air = 0, (4.8)
i=1

donde Air es el cofactor de air en ∆1,...,r


1,...,r (B). Para cada p < r,

r
X
aip Air = 0, (4.9)
i=1

por ser la expansión de un determinante con dos columnas iguales. Esta


igualdad también es válida para p > r, al ser la expansión de ∆1,...,r−1,p
1,...,r (B)
en la columna p.
Si a1 , ..., ar son los renglones de B, las ecuaciones (4.8-9) afirman que
r
X
Air ai = 0.
i=1

Esta es una contradictoria relación de dependencia lineal, pues Arr =


∆1,...,r−1
1,...,r−1 (B) 6= 0.

Teorema 4.20 Sean k un dominio de factorización única, R = k[Xij ] el


anillo de polinomios en las n2 variables Xij , para 1 ≤ i, j ≤ n; y sea
A = (Xij ) ∈ Mn (R). Entonces det A es irreducible en R.
Demostración: El Teorema 2.54 garantiza que R también es de factoriza-
ción única. Procedemos por inducción en n. Supongamos que det A admite
una factorización no trivial.
Sea Q el anillo de polinomios sobre k en las variables Xij 6= X11 , de
manera que R = Q[X11 ]. La expansión a lo largo del renglón 1 de det A es
n
X
det A = X1i A1i = X11 A11 + p, con p ∈ Q.
i=1
174 4. Algebra Lineal

Aquı́ podemos suponer que A11 es irreducible en Q, por lo que A11 también
es irreducible en R; y det A sólo puede factorizarse ası́ en Q[X11 ]:

det A = (aX11 + b)c, con a, b, c ∈ Q.

Esto implica que ac = A11 , por lo que podemos suponer que a = 1 ó


bien que c = 1. Veamos qué sucede en cada caso. Si c = 1, entonces la
factorización es trivial; y terminamos.
La factorización no trivial de det A implica que a = 1; pero entonces
c = A11 ; y ası́ A11 | (det A). Análogamente, (A11 · · · Ann ) | (det A), que es
absurdo para n = 2 porque (X11 X22 ) - (X11 X22 −X12 X21 ); y que también
es absurdo para n > 2 porque el grado de (A11 · · · Ann ) es n(n − 1), mayor
que el grado n de det A.

Teorema 4.21 Sean k un campo infinito, R = k[Xij ] el anillo de poli-


nomios en las n2 variables Xij , para 1 ≤ i, j ≤ n; y sea f (Xij ) ∈ R
homogéneo tal que al evaluarlo en elementos de Mn (k) se tengan f (1) = 1
y f (AB) = f (A)f (B). Entonces f (Xij ) es una potencia del polinomio
det(Xij ).

Demostración: Supongamos que el grado de f (Xij ) es r. Como

(adj A)A = (det A)1 ⇒ f (adj A)f (A) = f [(det A)1] = (det A)r ;

y dado que k es infinito, tenemos que f (adj X)f (X) = (det X)r , por el
Ejercicio 2.7.9, al escribir X = (Xij ) ∈ Mn (R). Ası́, f (Xij ) | det(Xij )r . El
teorema anterior garantiza que f (Xij ) es una potencia de det(Xij ), porque
f (1) = 1.

Ejemplo. Sea k un campo tal que p - n, donde p = caract k. Dados


a0 , a1 , ..., an−1 ∈ k, el circulante C(a0 , a1 , ..., an−1 ) es el siguiente deter-
minante:
a0 a1 a2 ··· an−1
an−1 a0 a1 ··· an−2
an−2 an−1 a0 ··· an−3
.. .. .. .. ..
. . . . .
a1 a2 a3 ··· a0

Supongamos que k contiene una raı́z n-ésima primitiva de la unidad


ζ = ζ1 y que ζi = ζ i para 1 ≤ i ≤ n. Consideremos un k-álgebra A
con base {1, u, u2 , ..., un−1 } y con la multiplicación indicada, sujeta a la
condición un = 1.
4.3 Determinantes 175

Sea a = a0 +a1 u+a2 u2 +· · ·+an−1 un−1 ∈ A. La multiplicación izquierda


por a tiene asociada la matriz
 a a1 a2 · · · an−1 
0
 an−1 a0 a1 · · · an−2 
 
B= an−2 an−1 a0 · · · an−3  ,
 . .. .. . . .. 
 . . 
. . . .
a1 a2 a3 · · · a0
que satisface det B = C(a0 , a1 , ..., an−1 ).
Sean vi los vectores dados por
  1 1 ··· 1  1 
v1
n−1
 v2   1 ζ1 · · · ζ1   u 
 . =. ..   
 ..   . .
.. ..
.   ...  .
. .
vn 1 ζn−1 · · · ζn−1 n−1 un−1

El conjunto {v1 , ..., vn } es Quna base de A porque la matriz de coefi-


cientes tiene determinante ± i<j (ζi < ζj ) 6= 0. La matriz asociada a
la multiplicación izquierda por u con respecto a la nueva base es diago-
n−1 n−1
nal, dado que uvi = u(1 + ζi−1 u + · · · + ζi−1 u ) = ζ 1−i vi , para todo
1 ≤ i ≤ n. Por tanto, multiplicación izquierda por a tiene matriz diagonal
con a0 + a1 ζ 1−i + a2 ζ 2(1−i) + · · · Q
+ an−1 ζ (n−1)(1−i) en la posición ii. Con-
n
cluimos que C(a0 , a1 , ..., an−1 ) = i=1 (a0 + a1 ζi + a2 ζi2 + · · · + an−1 ζin−1 ).

Números duales y derivación de determinantes


Dado un anillo conmutativo k, definimos el álgebra de números duales
sobre k como k[²] = k[T ]/(T 2 ), de manera que los elementos de k[²] son de
la forma a + b², con a, b ∈ k. La relación ²2 = 0 tiene el propósito de crear
una extensión natural en k[²][X] para cada f (X) ∈ k[X]:
f (X + ²) = f (X) + D[f (X)]²,
donde D[f (X)] es la derivada de f , igualdad que puede verificarse fácil-
mente para monomios y extenderse linealmente al caso general.
Si consideramos una matriz B = (bij (X)) ∈ Mn (k[X]), con renglones bi ,
para 1 ≤ i ≤ n, tendremos que
det B + D(det B)² = det[bij (X + ²)] = det[bij (X) + D(bij )²]
= det(b1 + D(b1 )², ..., bn + D(bn )²)
n
X
= det B + det(b1 , ..., bi−1 , D(bi ), bi+1 , ..., bn )²,
i=1

por lo que
n
X
D(det B) = det(b1 , ..., bi−1 , D(bi ), bi+1 , ..., bn ).
i=1
176 4. Algebra Lineal

Ejercicios
1. Demuestre que el determinante de una matriz con una partición y
submatrices cuadradas en la diagonal es
 
A11 ? ··· ?
n
 0 A22 · · · ?  Y
det 
 ... .. .. 
..  = (det Aii ).
. . . i=1
0 0 ··· Ann

2. Dado un anillo Pnconmutativo(n) k con 1, sea {²1 , ..., ²n } una base de k (n)
y sean ui = j=1 aij ²j ∈ k , para 1 ≤ i ≤ n. Demuestre que todo
v ∈ k (n) /(u1 , ..., un ) satisface (det A)v = 0, donde A = (aij ).
3. Sean k un campo y A ∈ Mn (k). Demuestre que

(a) det(adj A) = (det A)n−1 .


(b) adj(adj A) = (det A)n−2 A.
(c) rango(A) = n ⇒ rango(adj A) = n.
(d) rango(A) = (n − 1) ⇒ rango(adj A) = 1.
(e) rango(A) < (n − 1) ⇒ rango(adj A) = 0.

4. Para los siguientes determinantes n × n, demuestre que

0 1 1 ··· 1
1 0 1 ··· 1
1 1 0 ··· 1 = (−1)n−1 (n − 1).
..
.
1 1 1 ··· 0

a+b a a ··· a
a a+b a ··· a
a a a+b ··· a = bn−1 (na + b).
..
.
a a a ··· a+b

5. Sea A = (aij ) ∈ Mn (k). Demuestre que


n
X {1,j}0
det A = a11 A11 − (−1)i+j ai1 a1j ∆{1,i}0 (A).
i,j=2

V
6. Demuestre que el álgebra de números duales es isomorfo con V,
cuando dim V = 1.
4.4 Matrices sobre Dominios Principales 177

4.4 Matrices sobre Dominios Principales


Suponemos que k es un anillo conmutativo. En el anillo de las matrices
cuadradas Mn (k) definimos la matriz Eij como aquella que tiene al número
1 en la posición ij y ceros en las otras posiciones. Esto lo hacemos para
cualquier pareja de ı́ndices ij.
Para i 6= j y t ∈ k, definimos a la matriz elemental de primer
tipo xij (t) = 1 + tEij , también llamada transvección. El producto y el
conmutador de estas matrices se comportan ası́:

xij (t) xij (r) = xij (t + r). (4.10)


½
xiq (tr), si j = p, i 6= q
(xij (t), xpq (r)) = (4.11)
1, si j 6= p, i =
6 q
Recordemos que el conmutador de a, b es (a, b) = aba−1 b−1 ; y observemos
que xij (0) = 1, mientras que [xij (t)]−1 = xij (−t), para todos t ∈ k, i 6= j.
De esta manera, las expresiones (4.11) calculan conmutadores donde el
conjunto {i, j, p, q} tiene al menos tres elementos.
Una matriz elemental de segundo tipo Di (t) es aquella con t ∈ k ?
en la posición ii; y con las demás coordenadas iguales a las de la matriz
identidad.
Para i 6= j, definimos a la matriz elemental de tercer tipo Pij como
aquella obtenida a partir de la matriz identidad al intercambiar sus ren-
glones i y j.

Observaciones. Las siguientes propiedades de las matrices elementales


son inmediatas:
1. Toda matriz elemental es invertible.
2. Multiplicación izquierda por xij (t) tiene el efecto de agregar t veces
el renglón j al renglón i.
3. Multiplicación derecha por xij (t) tiene el efecto de agregar t veces la
columna i a la columna j.
4. Multiplicación izquierda (derecha) por Di (t) tiene el efecto de multi-
plicar por t al renglón i (a la columna i).
5. Multiplicación izquierda (derecha) por Pij tiene el efecto de inter-
cambiar a los renglones (columnas) i y j.
Definimos tres tipos de operaciones renglón elementales: las cau-
sadas por multiplicación izquierda con matrices elementales del tipo corres-
pondiente. De manera semejante, las operaciones columna elementales
son causadas por multiplicación derecha con matrices elementales del tipo
correspondiente.
178 4. Algebra Lineal

Dados un anillo conmutativo k y un k-módulo libre N de rango r, tene-


mos un antiisomorfismo de anillos Ψ : Endk (N ) → Mr (k). El subconjunto
de automorfismos de N es un grupo ante composición de funciones, que lla-
mamos grupo general lineal, lo escribimos ası́: Autk (N ), o bien GL(N );
y a su imagen Ψ(Autk (N )) la escribimos ası́: GLr (k).
El grupo especial lineal SLr (k) es {A ∈ GLr (k) | det A = 1}, un
subgrupo normal de GLr (k), pues es el núcleo del morfismo det.
A continuación enfrentamos el problema de encontrar formas canónicas
ante equivalencia para matrices sobre anillos Euclideanos o principales. El
siguiente teorema es un gran paso en esta dirección.
Teorema 4.22 Sea (k, δ) un anillo Euclideano, entonces:
a) Las matrices elementales de 1er tipo generan a SLn (k).
b) Las matrices elementales de 1o y 2o tipos generan a GLn (k).
c) Toda matriz A ∈ Mm×n (k) puede llevarse a través de operaciones
elementales de 1o y 2o tipos, a una de la forma
 
d1
 .. 
 . 0 
 
diag(d1 , ..., dr , 0, ...) =  dr ,
 
 0 
..
0 .

con d1 · · · dr 6= 0; y con di | di+1 para 1 ≤ i < r.


d) Dada A ∈ Mm×n (k), existen matrices P ∈ GLm (k) y Q ∈ GLn (k)
con P AQ = diag(d1 , ..., dr , 0, ...).
Demostración: a) Dada una matriz A ∈ SLn (k), consideramos al con-
junto A de las matrices en Mn (k) que se pueden obtener a partir de A por
medio de una serie de operaciones elementales renglón o columna de 1er
tipo. Observemos que todo elemento de A es invertible.
Sea B = (bij ) ∈ A tal que bi1 6= 0 exhiba un valor δ(bi1 ) mı́nimo en-
tre todos los valores de δ evaluada en coordenadas no cero de la primera
columna de matrices en A.
En estas condiciones, bi1 | bj1 para todo 1 ≤ j ≤ n, pues de no ser ası́,
el algoritmo euclideano producirı́a 0 6= r ∈ k tal que bj1 = qbi1 + r con
δ(r) < δ(bi1 ); pero r estarı́a en la primera columna de alguna matriz en A.
Ası́, podemos suponer que bj1 = 0 ∀j 6= i; y vemos que bi1 ∈ k ? , para
conseguir una nueva B = (bij ) ∈ A con b11 = 1 y con bj1 = 0 ∀j 6= 1.
Por inducción en n, transformando a la submatriz de B obtenida al
eliminar el primer renglón y la primera columna, podemos exhibir una
matriz en A triangular superior
 
1 ?
 . .. ,
0 1
4.4 Matrices sobre Dominios Principales 179

para finalmente encontrar a la matriz identidad en A.


b) Partiendo de A ∈ Mn (k) con det A = c ∈ k ? , podemos escribir

A = diag(c, 1, ..., 1)[diag(c−1 , 1, ..., 1) A] = diag(c, 1, ..., 1) B,

con B = diag(c−1 , 1, ..., 1) A ∈ SLn (k).


c) El inciso b) implica que las matrices elementales de 3er tipo se pueden
expresar en términos de las de 1o y 2o tipos. Por tanto, aquı́ podemos
utilizar todo tipo de operaciones elementales.
Dada A ∈ Mn (k), consideramos al conjunto A de las matrices que se
pueden obtener a partir de A por medio de operaciones de 1o y 2o tipos.
Elegimos B = (bij ) ∈ A con bij 6= 0 y con δ(bij ) mı́nimo entre los valores
posibles para coordenadas de matrices en A. Suponemos que i = j = 1,
para poder también suponer que b1j = bi1 = 0, ∀ i, j > 1. Ası́,
 
b11 0 ··· 0
 0 b22 ··· b2n 
B=
 ... .. .. ..  ,
. . . 
0 bn2 ··· bnn

donde además b11 | bij para todos i, j > 1. Concluimos por inducción, pues
 
b22 ··· b2n
 ... ..
.
.. 
.
bn2 ··· bnn
llega a la forma indicada con coordenadas que son múltiplos de b11 .
d) Esto es claro.
Observaciones. Para saber que las matrices de la forma dada en c) son
canónicas, falta establecer la unicidad de los elementos di . Esto lo hacemos
en el siguiente teorema, para el caso más general de dominios principales,
donde primero vemos la existencia de esas matrices “diagonales”. Las afir-
maciones a) y b) anteriores no son válidas para todo dominio principal.
Teorema 4.23 a) Toda matriz A ∈ Mm×n (k) con k principal es equiva-
lente a una de la forma
 
d1
 .. 
 . 0 
 
diag(d1 , ..., dr , 0, ...) =  dr ,
 
 0 
..
0 .

con d1 · · · dr 6= 0; y con di | di+1 para 1 ≤ i < r.


b) Cada di es único módulo asociados; y si ∆i es el m.c.d. de los menores
i × i de A, entonces ∆i = d1 · · · di , para 1 ≤ i ≤ r.
180 4. Algebra Lineal

Demostración: a) Definimos la longitud de a, escrita `(a), como el nú-


mero de primos (con sus multiplicidades) que aparecen en la factorización
de a, de manera que `(a) = 0 ⇔ a ∈ k ? .
Dada A ∈ Mm×n (k), elegimos una matriz B = (bij ) con una coordenada
bpq tal que `(bpq ) sea mı́nimo entre las coordenadas de matrices equivalentes
con A. Podemos suponer que p = q = 1 para tener `(b11 ) mı́nimo.
Afirmamos que b11 | b1j y que b11 | bi1 para todos i, j > 1. Veamos
qué pasarı́a si b11 - b12 : Sea d = (b11 , b12 ), de manera que `(d) < `(b11 ) y
existirı́an x, y ∈ k con d = xb11 + yb12 .
Sean u = b12 /d, v = −b11 /d ∈ k, por lo que
µ ¶µ ¶
−v u x u
= 1.
y −x y v

Ası́, tendrı́amos que


  
x u d 0 ∗ ··· ∗
y v   
 
B 1 0 =  
   
 ..
.   *

0 1

con `(d) < `(b11 ), que es una contradicción.


Establecida la afirmación, podemos suponer que b1j = bi1 = 0 para
todos i, j > 1. Entonces tenemos que b11 | bij para todos i, j; pues de lo
contrario, al sumar el renglón i al renglón 1 contradirı́amos al paso anterior.
Concluimos por inducción en n ó en m, ya que la submatriz
 
b22 ··· b2n
 ... ..
.
.. 
.
bm2 ··· bmn

se puede “diagonalizar” preservándose la condición b11 | bij .


b) Si multiplicamos a la matriz A por la izquierda o por la derecha por
una matriz cuadrada invertible P del tamaño adecuado, tendremos que
todo menor i × i del resultado estará en el ideal (∆i ). Al ser P invertible,
esto implica que el m.c.d. de los menores i × i es el mismo en ambos casos.
Ası́, los ∆i son invariantes ante equivalencia. Cuando A es diagonal como
en a), con di | dj para todo i < j, se tienen las igualdades ∆i = d1 · · · di ,
para todo 1 ≤ i ≤ r, de donde se obtiene la unicidad de los factores di .

Decimos que una matriz “diagonal” como en a) está en forma canónica


y que los números di son los factores invariantes de A. Observemos que
r es el rango determinantal de A y que también es un invariante de A ante
equivalencia.
4.5 Módulos sobre Dominios Principales 181

Existen paquetes de computación como Macaulay2, CoCoA y Singular,


que efectúan el cálculo directo de los ideales ∆i , por lo que no es nece-
sario realizar operaciones elementales para encontrar la forma canónica de
una matriz dada. Sin embargo, en muchos casos es deseable encontrar las
matrices P ó Q que llevan una matriz dada a su forma canónica.

Ejemplo. Podemos llevar la matriz A ∈ M3 (Z) a su forma canónica B:


   
12 −12 240 1 0 0
A= 4 9 81  −→  0 12 0  = B,
0 480 0 0 0 480
pues ∆1 = 1, ∆2 = 12 y ∆3 = (12)(480).

Ejercicios
1. Encuentre un conjunto completo de invariantes ante equivalencia para
matrices m × n sobre un campo.
2. Sean k un dominio principal y d, a1 , ..., an ∈ k tales que valga la igual-
dad de ideales (d) = (a1 , ..., an ). Demuestre que existe A ∈ GLn (k)
tal que (a1 , a2 , ..., an )A = (d, 0, ..., 0).
3. Sean k un dominio principal y A, B ∈ Mn (k) con det AB 6= 0. Si
diag(a1 , ..., an ), diag(b1 , ..., bn ) y diag(c1 , ..., cn ) son formas canóni-
cas para A, B y C = AB respectivamente, demuestre que ai | ci y
bi | ci para todo 1 ≤ i ≤ n. (Sugerencias: Considere el caso en que A y
B son diagonales, suponga que k contiene un único elemento primo).

4.5 Módulos sobre Dominios Principales


En esta sección, suponemos que nuestros módulos son finitamente genera-
dos sobre un dominio principal k. El módulo generado por {a1 , ..., am } lo
escribimos ası́: (a1 , ..., am ), o bien ası́: ka1 + · · · + kam .
Teorema 4.24 a) Todo submódulo N de un módulo libre M , es libre con
rango N ≤ rango M .
b) Existen bases {u1 , ..., um } de M y {v1 , ..., vn } de N tales que vi = ai ui
para 1 ≤ i ≤ n, con a1 | a2 | · · · | an .
Demostración: a) Procedemos por inducción en m = rango M , siendo
claro el resultado para m = 1. Sea {u1 , ..., um } una base de M .
Si N ⊆ (a1 , ..., am−1 ), entonces concluimos por la hipótesis inductiva. Si
no, existe u = c1 u1 + · · · + cm um ∈ N con cm 6= 0. El conjunto de tales
coeficientes cm forma un ideal (b) de k, para el que existe
w = c01 u1 + · · · + c0m−1 um−1 + bum ∈ N.
182 4. Algebra Lineal

La hipótesis inductiva nos permite encontrar una base {v1 , ..., vn−1 } para
N ∩ (u1 , ..., um−1 ), con n ≤ m; pero entonces A = {v1 , ..., vn }, con vn = w,
es una base de N : Claramente, A genera a N ; y es fácil ver que A es
linealmente independiente.
b) Si Ψ : N ,→ M es la inclusión, entonces existen bases de M y de N
tales que con respecto a ellas, la matriz de Ψ está en la forma canónica del
Teorema 4.23.

Se dice que un k-módulo M es cı́clico cuando admite a un conjunto {a}


con un único elemento como generador. El anulador de un elemento
a ∈ M es el ideal de k, escrito an(a), definido como {r ∈ k | ra = 0}. El
anulador de un módulo M es el ideal {r ∈ k | rM = 0}, escrito an(M ).
Un k-módulo cı́clico M = (a) queda completamente descrito por el a-
nulador de su generador, pues M ∼ = k/ an(a). Observemos que si b ∈ (a),
entonces an(a) ⊆ an(b), de manera que si b es otro generador de (a), en-
tonces an(a) = an(b). En particular, si an(a) = 0, tendremos el isomorfismo
de k-módulos (a) ∼
= k.

Teorema 4.25 Sea M 6= (0) un k-módulo finitamente generado. Entonces


M es una suma directa de módulo cı́clicos:

M = ka1 ⊕ · · · ⊕ kas , donde (d1 ) ⊇ · · · ⊇ (ds ), an(ai ) = (di ) 6= k, ∀ i.

Demostración: Como M es finitamente generado, existen un k-módulo


libre k (n) y un morfismo suprayectivo ϕ : k (n) → M . Sean ker ϕ ∼ = k (m) y
(m) (n)
ψ:k →k la inclusión.
Elegimos bases adecuadamente, para tener a {u1 , ..., un } como base de
k (n) y como matriz asociada a ψ a una de forma diag(d01 , ..., d0r , 0, ...) con
d0i 6= 0 para todo i, con d0i | d0i+1 para i = 1, ..., r − 1.
Si d01 , ..., d0t = 1 (ó bien son unidades), vemos que M está generado por
las imágenes a1 = ϕ(ut+1 ), ..., as = ϕ(un ), al escribir s = n − t. Además,
si d1 = d0t+1 , ..., ds = d0n , tendremos que M = ka1 ⊕ · · · ⊕ kas , con ideales
an(ai ) = di como en el enunciado.
Al submódulo de torsión de M , escrito tor M , lo definimos como
tor M = {a ∈ M | existe 0 6= r ∈ k con ra = 0}. Se dice que M es
de torsión cuando M = tor M ; o que M es libre de torsión cuando
tor M = 0.
Teorema 4.26 Todo módulo finitamente generado sobre un dominio prin-
cipal, es la suma directa de su submódulo de torsión y de un módulo libre.
Demostración: Si M = ka1 ⊕ · · · ⊕ kas con an(a1 ) ⊇ · · · ⊇ an(as ), donde
an(ar ) 6= 0; pero an(ar+1 ) = 0, entonces ka1 ⊕ · · · ⊕ kar ⊆ tor M .
Recı́procamente, si m = c1 a1 + · · · + cs as ∈ tor M , entonces existe 0 6=
c ∈ k tal que 0 = cm = cc1 a1 + · · · + ccs as , por lo que para i > r se tiene
que cci = 0 y que ci = 0. Ası́, ka1 ⊕ · · · ⊕ kar = tor M .
4.5 Módulos sobre Dominios Principales 183

Por otra parte, kar+1 ⊕ · · · ⊕ kas ∼


= k (s−r) es libre, por lo que finalmente
(s−r)
M = (tor M ) ⊕ k .

Sabemos que todo dominio principal es de factorización única. Dado un


elemento primo p ∈ k, definimos la p-componente primaria Mp de un
k-módulo M como el conjunto {z ∈ M | pi z = 0 para algún i ∈ N}. Es
inmediato que Mp es un submódulo de tor M ; y que si p1 , ..., pr son distintos
primos, entonces Mp1 , ..., Mpr forman suma directa.

Lema 4.27 Sea M = ka un módulo cı́clico con an(a) = (r), donde r =


r1 r2 para r1 y r2 elementos primos relativos en k; entonces M = kb ⊕ kc,
con an(b) = (r1 ) y an(c) = (r2 ). Recı́procamente, si M = kb ⊕ kc, con
an(b) = (r1 ) y an(c) = (r2 ), donde r1 y r2 son primos relativos; entonces
M = ka con an(a) = (r1 r2 ).

Demostración: A partir de a, definimos b = r2 a y c = r1 a, para tener


que an(b) = (r1 ) y que an(c) = (r2 ). Además, existen s, t ∈ k tales que
1 = sr1 + tr2 , por lo que a = 1a = (sr1 + tr2 )a ∈ kb + kc; pero kb ∩ kc = 0,
pues m ∈ kb ∩ kc ⇒ r1 m = 0 = r2 m ⇒ 1m = (sr1 + tr2 )m = 0. Ası́,
M = kb ⊕ kc.
Recı́procamente, dado que M = kb ⊕ kc, definimos a = b + c. Aquı́,
ra = 0 implica rb = 0 = rc, porque kb ∩ kc = 0; y entonces r ∈ (r1 r2 ).
Como r1 r2 a = 0, vemos que an(a) = (r1 r2 ). Ahora bien, existen s, t ∈ k
con 1 = sr1 + tr2 , por lo que b = 1b = (sr1 + tr2 )b = tr2 b = tr2 (b + c) =
tr2 a ∈ ka. Análogamente, c ∈ ka; y ası́ ka = M .

Teorema 4.28 Si M es un módulo de torsión finitamente generado, en-


tonces Mp = 0 para todo primo p ∈ k, con un número finito de excepciones:
p1 , ..., pr ; y entonces M = Mp1 ⊕ · · · ⊕ Mpr . También existe una descom-
posición M = ka1 ⊕ · · · ⊕ kas , donde cada an(ai ) es de forma (pt ), con p
primo y t ≥ 1.

Demostración: Si {b1 , ..., bn } genera a M con an(bi ) = (si ) para cada i,


hacemos la lista p1 , ..., pr de los primos en k que dividen a los si , para tener
que cada kbi ⊆ Mp1 ⊕ · · · ⊕ Mpr ; y una descomposición de M como suma
directa de módulos cı́clicos primarios, gracias al lema.
Si q es un primo distinto de todo pi , entonces

Mq = Mq ∩ M = Mq ∩ (Mp1 ⊕ · · · ⊕ Mpr ) = 0.

Por el Lema 4.27, cada submódulo cı́clico kai ó kbj puede descomponerse
como suma directa de módulos cı́clicos primarios, es decir, con anuladores
de forma (pt ) con p primo.
Para M finitamente generado, tenemos M = (tor M ) ⊕ M 0 , con M 0 libre.
El rango de M es rango(M/ tor M ), que no depende del módulo M 0 .
184 4. Algebra Lineal

Teorema 4.29 a) Si tenemos M = ka1 ⊕· · ·⊕kar = kb1 ⊕· · ·⊕kbs , donde


k 6= an(a1 ) ⊇ · · · ⊇ an(ar ) y también k 6= an(b1 ) ⊇ · · · ⊇ an(bs ). Entonces
r = s y también an(ai ) = an(bi ), para 1 ≤ i ≤ r.
b) Si M es de torsión y M = kc1 ⊕ · · · ⊕ kcr = kd1 ⊕ · · · ⊕ kds con cada
an(ci ) y cada an(dj ) de forma (pt ), entonces r = s y an(ci ) = an(di ), para
1 ≤ i ≤ r.
Demostración: Las hipótesis an(a1 ) 6= k 6= an(b1 ) nos garantizan que
kai 6= 0 6= kbj , para todos i, j. El número de ı́ndices i tales que an(ai ) = 0
es el rango de (M/ tor M ); y coincide con el número de ı́ndices j tales
que an(bj ) = 0, por la observación previa. Esto nos permite suponer que
M = tor M .
Los anuladores de los elementos ai ó bj pueden recuperarse a partir de
los anuladores primarios ası́: an(a1 ) es el m.c.m. de todos ellos, an(a2 ) es
el m.c.m. de los anuladores primarios que queden al eliminar aquellos cuyo
producto es an(a1 ), etc.
Ası́, la unicidad de los anuladores primarios implica la unicidad de nues-
tros an(ai ). Por tanto, ahora suponemos que M = Mp es primario. Escri-
bamos pues an(ci ) = (pαi ) y an(dj ) = (pβj ), para tener

α1 ≤ · · · ≤ αr , β1 ≤ · · · ≤ βs .

Para cada t ∈ N definimos pt M = {pt m | m ∈ M }, un submódulo de M .


También definimos Mt = pt M/pt+1 M , que es un espacio vectorial sobre
k/(p) de manera natural, y de dimensión finita, independiente de cualquier
descomposición de M .
Observando que dim Mt es el número de sumandos cı́clicos primarios kz
con an(z) = (pw ), donde w > t, concluimos que los números αi (ó βj )
quedan determinados por esas dimensiones. Ası́, r = s y también an(ci ) =
an(di ), para 1 ≤ i ≤ r.
Los ideales an(a1 ), ..., an(ar ) se llaman ideales factores invariantes
de M . Los ideales an(z) = (pw ), con p primo, de una descomposición en
sumandos cı́clicos primarios de un módulo de torsión, se llaman ideales
divisores elementales.
Cuando k = Z, los ideales anteriores admiten generadores positivos; y
cuando k = K[T ], con K un campo y T una variable, admiten generadores
mónicos. Estos nuevos generadores se llaman factores invariantes ó di-
visores elementales, respectivamente.

Aplicación a Grupos Abelianos


Cuando k = Z, un k-módulo es lo mismo que un grupo Abeliano. Decimos
que un conjunto dado de invariantes ante cierta relación de equivalencia es
completo cuando dos objetos están en la misma clase de equivalencia si y
sólo si tienen iguales los invariantes del conjunto dado.
El siguiente teorema, que es inmediato, sintetiza todo lo obtenido en la
Sección 1.13.
4.6 Similaridad de Matrices sobre Campos 185

Teorema 4.30 a) Todo grupo Abeliano finitamente generado es la suma


directa de un grupo finito único (su torsión) y de un grupo libre Abeliano.
El rango de la componente libre es un invariante.
b) Todo grupo Abeliano finito es la suma directa de grupos cı́clicos de
órdenes potencias de primos. Estos órdenes con sus multiplicidades son
únicos y constituyen un conjunto completo de invariantes del grupo.
c) Todo grupo Abeliano finito es la suma directa de grupos cı́clicos de
órdenes d1 , ..., dn , donde di | di+1 para 1 ≤ i < n. Estos órdenes con sus
multiplicidades son únicos y constituyen un conjunto completo de invarian-
tes del grupo.

Ejercicios

Aquı́, Zn es el grupo cı́clico de orden n.

1. Dados un número primo p y un entero positivo n, demuestre que Zpn


no es la suma directa de dos subgrupos propios.

2. Demuestre que el ideal (2, X) de Z[X] no es suma directa de dos o


más Z[X]-módulos cı́clicos no triviales.

3. Sean k un dominio principal y M un k-módulo finitamente generado


de torsión, con ideales factores invariantes (d1 ) ⊇ · · · ⊇ (dn ). De-
muestre que todo submódulo y toda imagen homomorfa de M son de
torsión con factores invariantes (e1 ) ⊇ · · · ⊇ (es ) tales que s ≤ n; y
además es | dn , es−1 | dn−1 , ..., e1 | dn−s+1 .

4. Encuentre a los grupos Abelianos G no isomorfos entre sı́, tales que


exista una sucesión exacta 0 → Z4 → G → Z16 → 0.

5. Sea G = ha1 , a2 , a3 | 30a1 + 10a2 + 16a3 = 0, 4a1 + 2a2 + 2a3 =


0, 24a1 + 8a2 + 14a3 = 0i. Expréselo como suma directa de grupos
cı́clicos de órdenes potencias de primos.

4.6 Similaridad de Matrices sobre Campos


Sean k un campo, V un espacio vectorial de dimensión finita y T : V → V
una transformación lineal. Al elegir una base {u1 , ..., un } de V , obtenemos
la matriz A = (aij ) ∈ Mn (k) como sigue:
n
X
T (ui ) = aij uj , para 1 ≤ i ≤ n.
j=1
186 4. Algebra Lineal

Si elegimos una nueva base {v1 , ..., vn } de V relacionada con la base


original por medio de la matriz P = (pij ) ∈ Mn (k), donde
n
X
vi = pij uj , para 1 ≤ i ≤ n;
j=1

la Proposición 4.2 garantiza que P es invertible y el Teorema 4.3 implica que


la matriz que le corresponde a T con respecto a la nueva base es P AP −1 .
Decimos que dos matrices A, B ∈ Mn (k) son similares cuando existe
P ∈ Mn (k) invertible tal que B = P AP −1 . Claramente, similaridad es una
relación de equivalencia.
Supongamos fija la transformación T , y consideremos el anillo de poli-
nomios R = k[X] en la variable X con coeficientes en k. Hacemos de V
un R-módulo declarando que la variable X actúa precisamente como la
transformación lineal T .
Nos proponemos utilizar los resultados de la sección anterior para enten-
der al R-módulo V , el cual es finitamente generado como R-módulo por
cualquier base del espacio vectorial. Además, V es de torsión, pues dado
0 6= u ∈ V , tendremos que el conjunto {u, T (u), T 2 (u), ...} será linealmente
dependiente, por lo que un polinomio no trivial en T anulará a u.
ϕ ψ
Proposición 4.31 Se tiene la sucesión exacta R(n) → R(n) → V → 0,
donde ψ(ei ) = ui para todo 1 ≤ i ≤ n; y donde ϕ tiene como matriz a
 
X − a11 −a12 ··· −a1n
 −a21 X − a22 · · · −a2n 
X −A= ,
··· ··· ··· ···
−an1 −an2 · · · X − ann
con respecto a {e1 , ..., en }, base natural de R(n) .
Demostración: Claramente, ψ es suprayectivo. Como
n
X n
X
ψ(Xei − aij ej ) = T ui − aij uj = 0, para todo 1 ≤ i ≤ n,
j=1 j=1

se tiene que Im ϕ ⊆ ker ψ.


PPara
n
ver la inclusión recı́proca, supongamos que N = Im ϕ; y que x =
p
i=1 P i (X)e i ∈ ker ψ, con cada pi (X) ∈ R. Debido a que para todo i vale
n
Xei − j=1 aij ej ∈ N , tenemos que existen cj ∈ k tales que
n
X
x≡ cj ej (mod N );
j=1

pero entonces
n
X
ψ(x) = cj uj = 0 ⇒ cj = 0, ∀j.
j=1
4.6 Similaridad de Matrices sobre Campos 187

Ası́, x ∈ N ; y la sucesión es exacta.

f g
Cuando se tiene una sucesión es exacta M → N → P → 0, se dice que
P es el conúcleo de f . Ası́, V = coker ϕ = coker(X − A).
ϕ ψ
La sucesión exacta R(n) → R(n) → V → 0, ó bien la matriz X − A
constituyen una presentación del R-módulo V .
Gracias al Teorema 4.23, sabemos que al morfismo ϕ le corresponde
una matriz de forma diag(1, ..., 1, d1 , ..., dr ) con d1 | d2 | · · · | dr , donde
gr di ≥ 1 para todo i; y donde d1 · · · dr = det P (X − A)Q es asociado en R
del polinomio caracterı́stico de A:

det(X − A) = X n + an−1 X n−1 + · · · + a0 ,


Pn
donde −an−1 = tr A = i=1 aii y donde (−1)n a0 = det A.

Corolario 4.32 Si P (X − A)Q = diag(1, ..., 1, d1 , ..., dr ) con P, Q inverti-


bles, (d1 ) 6= R y Q−1 = (qij ), entonces V = Rvn−r+1 ⊕ · · · ⊕ Rvn , donde
n
X
vi = qij uj y an(vn−r+1 ) = (d1 ) ⊇ · · · ⊇ (dr ) = an(vn ).
j=1

Demostración: El Teorema 4.3 nos da V = Rv1 ⊕ · · · ⊕ Rvn , para


n
X
vi = qij uj , donde an(v1 ) = · · · = an(vn−r ) = R,
j=1

mientras que R 6= an (vn−r+1 ) = (d1 ) ⊇ · · · ⊇ (dr ) = an(vn ).


Sea J = {p(X) ∈ R | p(T ) = 0}, un ideal propio de R, pues al ser V un
R-módulo de torsión, existen 0 6= pi (X) ∈ R tales que pi (T )ui = 0 para
1 ≤ i ≤ n; y entonces p1 (X) · · · pn (X) ∈ J. Si J = (m(X)) con m(X)
mónico, decimos que m(X) es el polinomio mı́nimo de T .

Teorema 4.33 (Cayley-Hamilton-Frobenius) Con esta notación,

det(X − A) = m(X)∆n−1 ,

donde ∆n−1 es el m.c.d. en R de los menores (n − 1) × (n − 1) de la matriz


X − A. En particular, T es raı́z del polinomio det(X − A) = 0.

Demostración: En el corolario se ve que (m(X)) = (dr ); pero sabemos


que ∆n = dr ∆n−1 , con ∆n = det(X − A), por el Teorema 4.23.
Cuando V = Rv, decimos que V es cı́clico, o bien que v es cı́clico.
188 4. Algebra Lineal

Teorema 4.34 (Forma Canónica Racional) Sean k un campo arbi-


trario y A ∈ Mn (k) una matriz cuadrada. Entonces existe una matriz in-
vertible P ∈ Mn (k) tal que P AP −1 es de forma
 
C1
 C2 0 
 .. ,
 . 
0 Cr
donde cada bloque Ci es la matriz compañera
 
0 1 0 ··· 0
 0 0 1 ··· 0 
 . . 

Ci =  . . . . 

 0 0 0 ··· 1 
−c0 −c1 −c2 · · · −cm−1

de un polinomio di (X) = X m + cm−1 X m−1 + · · · + c0 . Esta expresión es


única si d1 (X) | d2 (X) | · · · | dr (X) y cada di (X) es mónico. Alternati-
vamente, la expresión es única hasta reacomodo de los bloques centrales si
cada di (X) es mónico y es potencia de un polinomio irreducible.
Demostración: Es suficiente considerar el caso cı́clico Rv con an(v) =
X m + cm−1 X m−1 + · · · + c0 . Aquı́, Rv admite como base al conjunto
{v, Xv, X 2 v, ..., X m−1 v}, donde la acción de T es como sigue:
Tv = Xv
T Xv = X 2v
..
.
T X m−1 v = X mv = −c0 v − c1 Xv − · · · − cm−1 X m−1 v
Ası́, V es suma directa de subespacios cı́clicos, en cada uno de los cuales
T tiene asociada una matriz Ci con respecto a una base adecuada.
Ejemplo. Encontraremos P ∈ M3 (Q) invertible tal que P AP −1 esté en su
forma canónica racional para
 
0 0 −1
A =  0 1 0  ∈ M3 (Q).
1 0 −1

   
X 0 1 0 0 X2 + X + 1
r
X −A= 0 X −1 0  −→  0 X − 1 0 
 −1 0 X +1  −1 0 X +1 
1 0 −X − 1 1 0 0
r c 
−→  0 X − 1 0  −→ 0 X −1 0 
2 2
0 0 X +X +1 0 0 X +X +1
4.6 Similaridad de Matrices sobre Campos 189

Ası́, tenemos que existen B, C ∈ M3 (Q[X]) invertibles tales que


 
1 0 0
B(X − A)C =  0 X − 1 0 .
2
0 0 X +X +1

Como solamente hubo una operación columna, vemos que


   
1 0 X +1 1 0 −X − 1
C = 0 1 0  y que C −1 =  0 1 0 .
0 0 1 0 0 1

La forma canónica racional de A es:


 
1 0 0
 0 0 1 .
0 −1 −1

Si la base original era {u1 , u2 , u3 }, la nueva base se obtiene ası́:


v0 = u1 − (X + 1)u3 = 0
v1 = u2
v2 = u3
v3 = Xu3 = u1 − u3
Matriz que produce el cambio de base:
 
0 1 0
P = 0 0 1 .
1 0 −1

Se puede verificar directamente que:


 
1 0 0
P AP −1 = 0 0 1 .
0 −1 −1

Teorema 4.35 (Forma Canónica de Jordan) Sean k un campo alge-


braicamente cerrado y A ∈ Mn (k) una matriz cuadrada. Entonces existe
una matriz invertible P ∈ Mn (k) tal que P AP −1 es de forma
 
J1 0
 J2 
 .. ,
 . 
0 Jr
190 4. Algebra Lineal

donde cada bloque Ji es de Jordan


 
λ 1 0
 λ 1 
 .. .. 
Ji = 
 . . 

 λ 1
0 λ
Esta expresión es única hasta reacomodo de los bloques de Jordan.
Demostración: Es suficiente ver el caso cı́clico Rv con an(v) = (X − λ)m ,
con λ ∈ k. Aquı́, el conjunto {v, (X − λ)v, (X − λ)2 v, ..., (X − λ)m−1 v} es
una base de Rv; y la acción de T es como sigue:
Tv = Xv = λv + (X − λ)v
T (X − λ)v = X(X − λ)v = λ(X − λ)v + (X − λ)2 v
.. ..
. .
T (X − λ)m−1 v = X(X − λ)m−1 v = λ(X − λ)m−1 v
+(X − λ)m v
= λ(X − λ)m−1 v
Ası́, V es suma directa de subespacios cı́clicos, en cada uno de los cuales
T tiene asociada la matriz Ji con respecto a una base adecuada.
Ejemplo. Buscamos P ∈ M3 (C) invertible tal que P AP −1 esté en su forma
canónica de Jordan para
 
0 0 −1
A =  0 1 0  ∈ M3 (C).
1 0 −1

En el ejemplo anterior, partimos de la base {u1 , u2 , u3 } y encontramos que


V = Rv1 ⊕Rv2 , con v1 = u2 y an(v1 ) = (X −1) y con v2 = u3 satisfaciendo
an(v2 ) = (X 2 + X − 1).
Sea ω es una raı́z cúbica primitiva de la unidad. Tenemos que

X 2 + X − 1 = (X − ω)(X − ω 2 ).

Como an[(X − ω 2 )v2 ] = (X − ω) y como an[(X − ω)v2 ] = (X − ω 2 ),


podemos considerar la base de V :

{u2 , (X − ω 2 )v2 = u1 − u3 − ω 2 u3 , (X − ω)v2 = u1 − u3 − ωu3 }

para tener que


   
0 1 0 1 0 0
P = 1 0 −1 − ω 2  ⇒ P AP −1 =  0 ω 0 .
1 0 −1 − ω 0 0 ω2
4.6 Similaridad de Matrices sobre Campos 191

Teorema 4.36 (Forma Canónica Real) Sea A ∈ Mn (R) una matriz


cuadrada. Entonces existe una matriz invertible P ∈ Mn (R) tal que P AP −1
es de forma
 
A1 0
 .. ,
.
0 Ar
donde cada bloque Ai es de Jordan Ji (λ) como en el teorema anterior con
λ ∈ R ó bien es de forma
 
0 1 0 0
 −b −a 1 0 
 
 0 1 0 0 
 
 −b −a 1 0 
 
 . .. . .. . .. 
 
 ,
 .. .. .. 
 . . . 
 

 0 1 0 0 

 −b −a 1 0 
 0 1 
−b −a

con a2 < 4b. Esta expresión es única hasta reacomodo de los bloques Ai .
Demostración: Los polinomios irreducibles de R[X] son de forma X − λ
ó bien X 2 + aX + b con a2 − 4b < 0. Conocemos el caso cı́clico Rv, donde
an(v) = (X − λ)m con λ ∈ R. Para el último caso, supongamos que Rv
satisface an(v) = (X 2 + aX + b)m con a2 < 4b. Aquı́, el conjunto

{v, Xv, (X 2 + aX + b)v, X(X 2 + aX + b)v, (X 2 + aX + b)2 v, ...


..., (X 2 + aX + b)m−1 v, X(X 2 + aX + b)m−1 v}

es una base de Rv; y la acción de T es como sigue:

T v = Xv
2 2
T (Xv) = X v = −bv − a(Xv) + (X + aX + b)v
T [(X 2 + aX + b)v] = X(X 2 + aX + b)v
..
.
2 m−1 2 m−1
T [(X + aX + b) v] = X(X + aX + b) v
2 m−1 2 2 m−1
T [X(X + aX + b) v] = X (X + aX + b) v
= −b(X 2 + aX + b)m−1 v − aX(X 2 + aX + b)m−1 v

Ası́, V es suma directa de subespacios cı́clicos, en cada uno de los cuales T


tiene asociada una matriz Ai con respecto a una base adecuada.
192 4. Algebra Lineal

Ejercicios
ϕ ψ
1. a) Demuestre que 0 → R(n) → R(n) → V → 0, con ϕ y ψ como en la
Proposición 4.31, es una sucesión exacta.
Pn
b) Demuestre que {Xei − j=1 aij ej | 1 ≤ i ≤ n} es una base para
ker ψ.
2. Si k es un campo y A, B ∈ Mn (k), demuestre que X − A y X − B son
equivalentes en Mn (k[X]) si y sólo si A y B son similares en Mn (k).
3. Sean A, B ∈ Mn (C). Demuestre que A y B son similares en Mn (C)
si y sólo si (c − A)m y (c − B)m tienen el mismo rango para todos
c ∈ C y m ∈ N.
4. Sean k un campo y A ∈ Mn (k) tal que A2 = A. Demuestre que A es
similar con  
1
 .. 
 . 0 
 
 1 
 ,
 0 
 
 . 
 0 . . 
0
5. Demuestre que toda matriz A ∈ Mn (k), con k un campo, es similar
con su transpuesta.
6. Si p es primo, demuestre que A, B ∈ Mp (Z/pZ) son similares si
   
0 1 1 1
 0 1   1 1 
 . .   . . 
A=  . .   . . .
. .  y B= . . 
 0 1   1 1
1 0 ··· 0 0 1

7. Encuentre el polinomio mı́nimo de


 
0 1 0 0 0 0
 0 0 1 0 0 0 
 
 −1 19 −23 1 0 0 
A= .
 0 0 0 0 1 0 
 
 0 0 0 0 0 1 
0 0 0 −1 19 −23

8. Demuestre que si A ∈ M2 (R) y A2 = −1, entonces A es similar con


µ ¶
0 1
.
−1 0
4.7 La Descomposición de Jordan-Chevalley 193

4.7 La Descomposición de Jordan-Chevalley


En esta sección continuamos estudiando la estructura de un espacio vec-
torial con respecto a su interacción con una transformación lineal dada.
Los métodos aquı́ usados no involucran la estructura de módulos sobre
dominios principales. Hasta nuevo aviso, suponemos lo siguiente: V es un
espacio vectorial de dimensión n sobre un campo algebraicamente cerrado
k; y T : V → V es una transformación lineal.
Se dice que T es diagonalizable o semisimple cuando existe una base
de V con respecto a la cual a T le corresponde una matriz diagonal.
Decimos que λ ∈ k y v ∈ V son respectivamente un valor caracterı́stico
y un vector caracterı́stico de T cuando T (v) = λv.

Teorema 4.37 Las siguientes condiciones en T son equivalentes:


a) T es diagonalizable.
b) V tiene una base que consiste de vectores caracterı́sticos de T .
c) V es suma directa de subespacios en los que T actúa como escalar.
d) T satisface algún polinomio en k[X] con raı́ces distintas.
e) El polinomio mı́nimo de T es separable.

Demostración: Las equivalencias a) ⇔ b) ⇔ c) y d) ⇔ e) son inmediatas.


Veamos que a) ⇒ d). Si T está asociada a la matriz
 
λ1
 .. 
 . 
 
 λ1 
 
 .. 
 . ,
 
 λs 
 
 .. 
 . 
λs

con respecto a alguna base y λi 6= λj siempre que i 6= j, entonces f (X) =


(X − λ1 ) · · · (X − λs ) es separable y f (T ) = 0.
d) ⇒ c): Si f (X) = (X − a1 ) · · · (X − as ) con ai 6= aj siempre que i 6= j
y f (T ) = 0, escribimos fi (X) = f (X)/(X − ai ) ∈ k[X] para 1 ≤ i ≤ s. Es
inmediato que se tiene la igualdad de “ideales” k[X] = (f1 (X), ..., fs (X)),
por lo que existen polinomios g1 , ..., gs tales que g1 f1 + · · · + gs fs = 1.
Los subespacios Vi = ker(T − ai ) forman suma directa. Dado v ∈ V ,
podemos escribir v = [g1 (T )f1 (T ) + · · · + gs (T )fs (T )]v ∈ V1 ⊕ · · · ⊕ Vs , por
lo que V = V1 ⊕ · · · ⊕ Vs y T actúa como el escalar ai en Vi .
Una transformación lineal T ∈ End(V ) es nilpotente cuando existe
r ∈ N tal que T r = 0.

Observaciones. Las siguientes afirmaciones son claras:


194 4. Algebra Lineal

1. Si T es simultáneamente semisimple y nilpotente, entonces T = 0.

2. El polinomio caracterı́stico det(λ − T ) de T es un polinomio en λ


con coeficientes que a su vez son polinomios en las coordenadas de
cualquier matriz A = (aij ) asociada a T .

3. El discriminante g(aij ) del polinomio caracterı́stico de T es un poli-


nomio en aij tal que la inecuación g(aij ) 6= 0 define un conjunto de
matrices semisimples en Mn (k).

Una bandera en V es una cadena de subespacios:

0 = W0 ⊂ W1 ⊂ · · · ⊂ Wn = V, tal que dim Wi = i ∀i.

Dada una base ordenada {u1 , ..., un } de V , le asociamos una bandera de


manera natural ası́: Wi = ku1 + · · · + kui . Decimos que T estabiliza a la
bandera W1 ⊂ · · · ⊂ Wn cuando T (Wi ) ⊆ Wi para todo i. Esto sucede si y
sólo si la matriz de T con respecto a {u1 , ..., un } es triangular:
 
∗ 0
 .. .
.
* ∗

Teorema 4.38 Toda T es triangulable, es decir, existe una bandera de V


estable ante T .

Demostración: Procedemos por inducción en n = dim V , siendo claro el


resultado para n = 1.
Como k es algebraicamente cerrado, el polinomio caracterı́stico f (X) =
det(X − T ) se factoriza ası́:
r
Y
(X − ai )ni con todo ai ∈ k.
i=1

Esto implica que f (ai ) = det(ai − T ) = 0 y que la transformación lineal


ai − T es singular, por lo que existe 0 6= v ∈ V tal que (ai − T )v = 0, es
decir, T (v) = ai v. Hemos exhibido un vector caracterı́stico de T .
Ası́, T estabiliza la lı́nea W1 = hvi y actúa en V /W1 . Concluimos por la
hipótesis inductiva.

Teorema 4.39 Sean A un conjunto de transformaciones lineales que con-


mutan entre sı́ y B un subconjunto de A consistente de elementos semisim-
ples. Entonces existe una base de V con respecto a la cual los elementos de
A son triangulares y los de B son diagonales.

Demostración: Procedemos por inducción en n = dim V , siendo claro el


resultado para n = 1.
4.7 La Descomposición de Jordan-Chevalley 195

Si todos los elementos de A son escalares, entonces no hay nada que


hacer. Suponemos esto falso y consideramos los dos casos siguientes:
Caso 1: No todos los elementos de B son escalares. Sea T ∈ B no escalar
y sean Vi = {v ∈ V | T (v) = λi v} 6= 0 tales que V = V1 ⊕ · · · ⊕ Vr . Aquı́
tenemos que todo S ∈ A estabiliza a todo Vi , pues

v ∈ Vi ⇒ T (Sv) = S(T v) = S(λi v) = λi (Sv) ⇒ Sv ∈ Vi .


Por la hipótesis inductiva, existen bases de los Vi tales que con respecto
a ellas, los elementos de A son triangulares y los de B (incluyendo a T ) son
diagonales. Entonces, la unión es una base de V como en el enunciado.
Caso 2: Todos los elementos de B son escalares. Por tanto, ya son dia-
gonales y es suficiente triangular simultáneamente los elementos de A.
Sean T ∈ A no escalar y Vλ = {v ∈ V | T (v) = λv} 6= 0; este último
espacio existe por el teorema anterior. Cada elemento de A estabiliza a Vλ
y actúa en V /Vλ . Por la inducción, existe una base de V /Vλ con respecto
a la cual A es triangular. Esta base se levanta a V para formar junto con
una base de Vλ , una base de V como en el enunciado.

Teorema 4.40 (Descomposición de Jordan-Chevalley) Supongamos


dada una transformación lineal T .
a) Existen S, N ∈ End(V ) únicos, tales que S es semisimple, N es nilpo-
tente, T = S + N y SN = N S.
b) Existen polinomios p(X), q(X) ∈ k[X] sin término constante, tales
que S = p(T ) y N = q(T ). En particular, S y N conmutan con toda
transformación lineal de V que conmute con T .
c) Si U ⊆ W ⊆ V son subespacios vectoriales tales que T (W ) ⊆ U ,
entonces S(W ) ⊆ U y N (W ) ⊆ U .
d) Si T1 , T2 ∈ End(V ) conmutan entre sı́, entonces la parte semisimple
(nilpotente) de T1 + T2 es la suma de las partes semisimples (nilpotentes)
de T1 y de T2 .

En las condiciones del teorema, S es la parte semisimple de T , mientras


que N es la parte nilpotente de T . Qr
Demostración: Supongamos que det(X − T ) = i=1 (X − ai )mi . Sean
Vi = ker((T − ai )mi ). Ası́, los subespacios Vi forman suma directa.
Escribimos fi (X) = det(X − T )/(X − ai )mi ∈ k[X] para 1 ≤ i ≤ r. Es
inmediato que se tiene la igualdad de “ideales” k[X] = (f1 (X), ..., fr (X)),
por lo que existen polinomios g1 , ..., gr tales que g1 f1 + · · · + gr fr = 1. Dado
v ∈ V , podemos escribir v = [g1 (T )f1 (T )+· · ·+gr (T )fr (T )]v ∈ V1 ⊕· · ·⊕Vr ,
por lo que V = V1 ⊕ · · · ⊕ Vr . Además, T estabiliza a cada Vi ; y ahı́ satisface
(T − ai )mi = 0.
Por el Teorema Chino del Resı́duo, existe p(X) ∈ k[X] tal que

p(X) ≡ ai (mod(X − ai )mi ), ∀i


p(X) ≡ 0(mod X)
196 4. Algebra Lineal

Sean q(X) = X −p(X), S = p(T ) y N = q(T ). Entonces S es semisimple,


porque estabiliza a cada Vi y ahı́ actúa como multiplicación escalar por ai .
Como N = T − S también estabiliza a cada Vi y actúa como T − ai , se ve
que N es nilpotente.
Hemos demostrado b) y la existencia de a). Veamos la unicidad de a):
Las igualdades T = S + N = S 0 + N 0 , SN = N S, S 0 N 0 = N 0 S 0 con S, S 0
semisimples y N, N 0 nilpotentes implican que S −S 0 = N 0 −N es nilpotente
por ser simultaneamente triangulables N y N 0 por una parte y semisimple
por ser simultaneamente diagonalizables S y S 0 por la otra. Por tanto,
S − S 0 = N 0 − N = 0.
Las afirmaciones de c) son inmediatas.
Veamos d): Si T1 = S1 + N1 y T2 = S2 + N2 son descomposiciones de
Jordan, entonces T1 + T2 = (S1 + S2 ) + (N1 + N2 ) con S1 + S2 semisimple,
que conmuta con N1 +N2 nilpotente, por lo que esta es una descomposición
de Jordan.
Algunos Grupos Lineales
Supongamos que V es un espacio vectorial de dimensión n sobre un
campo arbitrario k; y que T : V → V es una transformación lineal. Presen-
taremos algunos importantes grupos multiplicativos de matrices en Mn (k).
Sea B = {A = (aij ) ∈ Mn (k) | det A 6= 0, aij = 0 ∀ i < j}. Este
es el conjunto de las transformaciones lineales T ∈ Aut V que estabilizan
la bandera W1 ⊂ · · · ⊂ Wn , obtenida de una base {v1 , ..., vn } de V ası́:
Wi = hv1 , ..., vi i. La representación matricial de T es con respecto a esta
base. Claramente, B < GL(V ). Decimos que B es un subgrupo de Borel
de GL(V ).
Sea U = {A = (aij ) ∈ B | aii = 1 ∀i}. Cada T ∈ B actúa en cada cociente
Wi+1 /Wi de manera natural; U consiste de los elementos de B para los que
todas estas acciones inducidas son la identidad.
Decimos que una transformación lineal es unipotente cuando todos sus
valores caracterı́sticos están en el campo k y son iguales a 1. Como los
valores caracterı́sticos de una matriz triangular son los elementos de la
diagonal principal, vemos que U consiste de los elementos unipotentes de
B. Decimos que U es el grupo unipotente de B.
La función ϕ : B → (k ? )n , dada por ϕ(T ) = (a1 , ..., an ) cuando la
acción de T en Wi+1 /Wi es multiplicación escalar por ai+1 , es un mor-
fismo suprayectivo de grupos, cuyo núcleo es U. Por eso, U C B.
Ası́, tenemos la sucesión exacta
ϕ
1 → U ,→ B → (k ? )n → 1.

Existe otro morfismo ψ : (k ? )n → B, dado por

ψ(a1 , ..., an ) = diag(a1 , ..., an ),

que satisface ϕ ◦ ψ = 1, la identidad en (k ? )n . La imagen T = ψ[(k ? )n ] es


un toro máximo de B.
4.7 La Descomposición de Jordan-Chevalley 197

Recordemos que Eij tiene al número 1 en la posición ij y ceros en las


otras posiciones; y que xij (t) = 1 + tEij , para i 6= j y t ∈ k.
Definimos a los grupos unipotentes de un parámetro Uij como
Im xij = {xij (t) | t ∈ k}, para cada i 6= j.
Teorema 4.41 Los grupos T, U, Uij y B tienen las siguientes propiedades:
a) B es un grupo soluble.
b) U es un grupo nilpotente.
c) Uij < U C B para i > j; y T normaliza a cada Uij .
d) B = U o T.
e) U está generado por {Uij | i > j}.
f ) Uij ∼
= k+ , el grupo aditivo de k.
g) Si n ≥ 2 y ◦(k) ≥ 4, entonces U = (B, B), el grupo derivado de B.
Demostración: f ) es consecuencia de la ecuación (4.10): xij (t) xij (r) =
xij (t + r), ∀ t, r ∈ k.
c) Claramente, Uij < U, para i > j. Se tiene que U es normal en B
porque U = ker ϕ. Se infiere que T normaliza a cada Uij de la relación
diag(a1 , ..., an )xij (t)[diag(a1 , ..., an )]−1 = xij (ai a−1
j t).
d) Claramente, T y U generan a B. Como U C B y T ∩ U = 1, se tiene
que B es el producto semidirecto indicado.
e) Procedemos por inducción en n, siendo claro el resultado para n = 1.
Suponemos que n ≥ 2 y que A = (aij ) ∈ U. Entonces
 
1
0 1 0
xn1 (−an1 ) · · · x21 (−a21 )A =   ... * . . .
,

0 1
que nos permite concluir por la hipótesis inductiva.
g) Como U C B es tal que B/U ∼ = T es Abeliano, se tiene que (B, B) ⊆ U.
Recı́procamente, debido a e), es suficiente ver que Uij ⊆ (B, B) para todo
i > j: Cuando i > j + 1, existe un entero ` tal que i > ` > j, por lo que
xij (t) = (xi` (t), x`j (1)) para todo t ∈ k.
Cuando i = j + 1, concentramos nuestra atención en las submatrices de
las columnas y renglones j, j + 1. Esto nos reduce al caso n = 2, donde
◦(k) ≥ 4 ⇒ existe c ∈ k ? tal que c2 6= 1. El cálculo siguiente demuestra
que U21 ⊆ (B, B):
µ −1 ¶µ ¶µ ¶µ ¶ µ ¶
c 0 1 0 c 0 1 0 1 0
= .
0 c t 1 0 c−1 −t 1 t(c2 − 1) 1

b) Para cada r ∈ N, definimos Ur = hUij | i > j + ri, de manera que


Ur < U con Ur = 1 para r lo suficientemente grande; por ejemplo, tan
grande que no haya ı́ndices i > j + r. Ası́, tenemos la cadena de subgrupos

U = U0 ⊇ U1 ⊇ · · · ⊇ Ur ⊇ · · · ⊇ Un = 1
198 4. Algebra Lineal

para la que las inclusiones Li+1 U = (U, Li U ) ⊆ (U, Ui ) ⊆ Ui+1 se pueden


obtener inductivamente, demostrando que U es un grupo nilpotente.
a) Como U es soluble y normal en B con B/U Abeliano, se tiene que B
es soluble.

Ejercicios

1. Sea G un grupo multiplicativo finito de matrices en Mn (C). De-


muestre que toda matriz en G es diagonalizable.

2. Sea D : V → V la derivada, donde V es el espacio vectorial de


polinomios de grado ≤ n sobre un campo, para n > 1. Demuestre que
no existe ninguna base de V con respecto a la cual D sea diagonal.

3. Sea A ∈ M2 (R) con det A < 0. Demuestre que A es similar con una
matriz diagonal.

4. Sea T : V → V una transformación lineal de un espacio vectorial de


dimensión finita V sobre un campo k. Demuestre que el polinomio
mı́nimo y el polinomio caracterı́stico de T tienen los mismos factores
irreducibles, aunque tal vez no con la misma multiplicidad.

5. Encuentre la descomposición de Jordan de


 
1 1 ··· 1
1 1 ··· 1
A=
 ..  ∈ Mn (C).

.
1 1 ··· 1

6. Sea T = S + N una descomposición de Jordan, con S semisimple y


N nilpotente.
a) Demuestre que T es invertible si y sólo si S lo es.
b) En la situación de a), demuestre que S −1 es un polinomio en T .
c) Demuestre que T es unipotente si y sólo si T − 1 es nilpotente.
d) (Descomposición de Jordan multiplicativa) Suponga que T
es invertible. Demuestre que existen S semisimple y U unipotente
únicas, tales que T = SU = U S, donde S y U son polinomios en T .

7. Con la notación del texto, demuestre que si k es infinito, entonces


a) Z(T) = T.
b) N (T)/Z(T) ∼
= Sn , el grupo simétrico en n sı́mbolos.
4.8 Conmutatividad de Matrices 199

4.8 Conmutatividad de Matrices


Sea V un espacio vectorial de dimensión finita sobre un campo k. El anillo
End V está muy lejos de ser conmutativo, por lo que tenemos el problema
importante de encontrar qué transformaciones conmutan con una dada.
Iniciamos la discusión con un ejemplo sencillo. Consideremos la matriz
 
0 1 0 0 0
 −1 0 0
 0 0 

A=  0 0 0 1 0 

 0 0 0 0 1 
0 0 0 −1 0

asociada a la transformación lineal T : V → V del espacio vectorial V sobre


el campo k, con respecto a la base {u1 , ..., u5 }. Observamos que A está en
forma canónica racional, que si R = k[X] actúa en V de manera que X
actúe como T , entonces la estructura de R-módulo de V es:

V = Ru1 ⊕ Ru3 , con an(u1 ) = X 2 + 1, an(u3 ) = X 3 + X,

donde u2 = Xu1 , u4 = Xu3 , u5 = X 2 u3 .


Una función lineal L : V → V que conmute con T quedará determinada
por su acción en u1 y en u3 , pues L(u2 ) = L(Xu1 ) = L(T u1 ) = T L(u1 ),
ası́ como L(u4 ) = L(Xu3 ) = T L(u3 ) y L(u5 ) = L(X 2 u3 ) = T 2 L(u3 );
pero L(u1 ) y L(u3 ) no pueden ser arbitrarios, tienen que satisfacer las
condiciones (X 2 + 1)L(u1 ) = 0 y (X 3 + X)L(u3 ) = 0.
Escribiendo L(u1 ) = α(X)u1 + β(X)u3 , vemos que α(X) puede ser un
polinomio arbitrario, mientras que β(X) debe satisfacer X | β(X). De ma-
nera análoga, si L(u3 ) = γ(X)u1 +δ(X)u3 , vemos que γ(X) y δ(X) pueden
ser polinomios arbitrarios, pues (X 3 + X)(α(X)u1 + β(X)u3 ) = 0 en todo
caso. Ası́, existen escalares a1 , ..., a9 ∈ k tales que

L(u1 ) = a1 u1 + a2 Xu1 + a3 Xu3 + a4 X 2 u3


L(u3 ) = a5 u1 + a6 Xu1 + a7 u3 + a8 Xu3 + a9 X 2 u3 ,

por lo que, con respecto a esta base, L está representada por la matriz
 
a1 a2 0 a3 a4
 −a2 a 0 −a4 a3 
 1 
 a5 a a7 a8 a9 .
 6 
 −a6 a5 0 a7 − a9 a8 
−a5 −a6 0 −a8 a7 − a9

La matriz anterior fue construida a partir de los primeros renglones de


cada bloque, para después completarse de la única forma posible. Las ma-
trices que conmutan con A forman un espacio vectorial de dimensión 9.
200 4. Algebra Lineal

Teorema 4.42 (Frobenius) Sea T : V → V una transformación lineal


con factores invariantes d1 (X), ..., dr (X) de grados n1 ≤ · · · ≤ nr y con
V = Rv1 ⊕ · · · ⊕ Rvr . Sea Z(T ) el conjunto de las transformaciones lineales
de V que conmutan con T , entonces
a) Z(T ) consiste de las transformaciones L : V → V tales que L(vi ) =
αi1 (T )v1 + · · · + αir (T )vr , para 1 ≤ i ≤ r, donde αij (X) es un polinomio
arbitrario si j ≤ i;Py que satisface αij (X) ∈ (dj /di )R, si j > i.
r
b) dim Z(T ) = i=1 (2r − 2i + 1)ni = nr + 3nr−1 + 5nr−2 + · · ·
Demostración: a) Observemos que a T le corresponde una matriz en
forma canónica racional:
 

 .. 
A= .  (4.12)

con bloques diagonales de tamaños n1 ≤ · · · ≤ nr .


Tenemos que V = k[X]v1 ⊕ · · · ⊕ k[X]vr , donde dim k[X]vi = ni ∀i. La
matriz A está asociada a la siguiente base de V :

{v1 , Xv1 , ..., X n1 −1 v1 , ..., vr , Xvr , ..., X nr −1 vr }. (4.13)

Si B es una matriz que conmuta con A, entonces B está asociada a


una transformación lineal L : V → V , que está totalmente determinada
por su acción en {v1 , v2 , ..., vr }; pero que está sujeta a las condiciones
di (X)L(vi ) = 0, para 1 ≤ i ≤ r.
Fijemos un ı́ndice i y propongamos a αi1 (X)v1 + · · · + αir (X)vr ∈ V
como candidato para ser L(vi ). Dado que d1 (X) | · · · | dr (X), la condición
di (X)L(vi ) = 0 significa que αij (X) puede ser arbitrario si j ≤ i, mientras
que para j > i se requiere que

(dj /di ) | αij .

Ası́, para j > i, el polinomio αij puede ser cualquier elemento del k-espacio
vectorial (dj /di )k[X]vj , cuya dimensión es ni , mientras que para j ≤ i, el
polinomio αij puede ser cualquier elemento del k-espacio vectorial k[X]vj ,
cuya dimensión es nj . Ası́,
½
(dj /di )k[X]vj , si j > i
Zij = ⇒ dim Zij = min{ni , nj }.
k[X]vj , si j ≤ i
Situados en un bloque en la diagonal principal, al movernos en lı́nea
recta hacia la derecha o hacia abajo, se preserva la dimensión del espacio
Zij asociado a cada bloque.
De lo anterior, obtenemos un procedimiento para generar todas las ma-
trices que conmutan con A, ası́ como para calcular la dimensión del espacio
vectorial que forman tales matrices:
4.8 Conmutatividad de Matrices 201

Fijamos la base (4.13) y tomamos la partición (4.12) para todas las matri-
ces a considerar, donde el bloque ij corresponde al espacio Zij . Llenamos el
primer renglón de cada bloque cumpliendo con los requisitos que acabamos
de precisar; y completamos cada bloque: En este paso, solamente apare-
cen en cada reglón, combinaciones lineales de las coordenadas del primer
renglón del bloque en que nos encontremos, pues LX m vi = T m Lvi , ∀m.
b) La dimensión de Z(T ) es una suma de términos de forma ni , el número
de estos términos es igual al número de bloques en (4.12), que es r2 . El
término nr aparece una vez, pues corresponde al bloque del extremo inferior
derecho; el término nr−1 aparece tres veces, pues corresponde al gancho
siguiente como en la figura; el término nr−2 aparece cinco veces, pues co-
rresponde al gancho siguiente, etc.

• `@@ • • •
@
• • • •
• • • •
• • • •

LaPanterior manera de agrupar términos es la expresada en b). Notemos


r
que i=1 (2r − 2i + 1) = 1 + 3 + 5 + · · · = r2 ; y que esta igualdad está
ilustrada en la figura de arriba.

Corolario 4.43 Para una transformación lineal T : V → V , las siguientes


condiciones en son equivalentes:
a) T es cı́clica.
b) Z(T ) = {L ∈ End V | LT = T L} consiste de los polinomios en T .
c) Z(T ) es un conjunto conmutativo de transformaciones lineales.

Demostración: a) ⇒ b): Si T es cı́clica, entonces T tiene un único fac-


tor invariante de grado n = dim V . El Teorema de Frobenius dice que
dim Z(T ) = n; pero el conjunto de los polinomios en T está contenido en
Z(T ) y ya tiene dimensión n.
b) ⇒ c): Esto es claro.
c) ⇒ a): Supongamos T no cı́clica, entonces V = k[X]v1 ⊕ · · · ⊕ k[X]vr
con r ≥ 2 y an(v1 ) ⊇ · · · ⊇ an(vr ). Es suficiente exhibir L1 , L2 ∈ Z(T )
tales que L1 L2 6= L2 L1 .
Para construir a L1 , L2 , podemos decidir que ambas actúen como la
identidad en k[X]v3 ⊕ · · · ⊕ k[X]vr y ası́ pasar al caso r = 2. Esto nos
permite suponer que V = k[X]u ⊕ k[X]v con an(u) ⊇ an(v).
Las siguientes condiciones determinan transformaciones lineales únicas
L1 , L2 ∈ Z(T ):

L1 (u) = 0 L1 (v) = u
L2 (u) = u L2 (v) = 0
202 4. Algebra Lineal

Aquı́, L1 L2 (v) = 0; pero L2 L1 (v) = L2 (u) = u.

Corolario 4.44 El centro de Mn (k), con k un campo arbitrario, consiste


de las matrices escalares.

Demostración: Claramente, toda matriz escalar es central. Recı́proca-


mente, si A = (aij ) es central, entonces A conmuta con
 
0 1
 0 1 
 .. .. 
B=
 . . 

 0 1
0

y con B t . Como B y B t son cı́clicas, tenemos que A es un polinomio en B


y también es un polinomio en B t . Ası́, A es triangular superior e inferior,
con a11 = · · · = ann , por lo que es claro que A es escalar.

Teorema 4.45 (del Doble Centralizador) Si T : V → V es una trans-


formación lineal, entonces Z(Z(T )) consiste de los polinomios en T .

Demostración: Claramente, todo polinomio en T conmuta con todo ele-


mento de Z(T ).
Recı́procamente, supongamos que V = k[X]v1 ⊕ · · · ⊕ k[X]vr cumple con
an(v1 ) ⊇ · · · ⊇ an(vr ), al exigir que X actúe como T .
Por el Teorema 4.42 a), sabemos que existen transformaciones lineales
Pij ∈ Z(T ) para toda pareja P de ı́ndices i ≤ j, tales que Pij (vt ) = δtj vi .
r
Si L ∈ Z(Z(T )) y L(vi ) = i=1 αij (T )vj , entonces los cálculos

Xr
L(vi ) = L(Pii vi ) = Pii (Lvi ) = Pii ( αij (T )vj ) = αii (T )vi ,
i=1
r
X
L(vi ) = L(Pir vr ) = Pir (Lvr ) = Pir ( αrj (T )vj ) = αrr (T )vi
i=1

demuestran que L = αrr (T ).

Ejercicios

1. Sea k algebraicamente cerrado. Calcule

min{dim Z(A) | A ∈ Mn (k) semisimple}.


4.9 Formas Bilineales y Cuadráticas 203

2. Encuentre todas las matrices en M5 (Q) que conmutan con


 
0 1 0 0 0
 −2 0 0 0 0 
 
 0 0 0 1 0 .
 
0 0 0 0 1
0 0 −2 −2 −1

3. Sea A nilpotente. Demuestre que dim Z(A) es mı́nima (entre las di-
mensiones de centralizadores de matrices nilpotentes) si y sólo si el
polinomio mı́nimo de A es X n .

4. Calcule el valor mı́nimo de {dim Z(A) | A ∈ Mn (k)}, para A nilpo-


tente con polinomio mı́nimo 6= X n .

4.9 Formas Bilineales y Cuadráticas


Sea V un espacio vectorial de dimensión finita sobre un campo k. Una
forma simétrica bilineal o producto interno de V es una función
B : V × V → k tal que

1. B(au+bv, w) = aB(u, w)+bB(v, w), para todos a, b ∈ k; u, v, w ∈ V .

2. B(u, v) = B(v, u), para todos u, v ∈ V .

Sea {u1 , ..., un } una base de V . Esta elección le asigna una matriz a la
forma B ası́:

A = (aij ) ∈ Mn (k), donde aij = B(ui , uj ).

La matriz A es simétrica: aij = aji , para toda pareja de ı́ndices.


Escribamos (u, v) en lugar de B(u, v) y consideremos la base {u∗1 , ..., u∗n }
del espacio dual V ∗ , donde u∗i (uj ) = δij para 1 ≤ i, j ≤ n.

Proposición 4.46 La función h : V → V ∗ dada por h(u)(v) = (u, v), para


todos u, v ∈ V , es lineal; y le corresponde la matriz A con respecto a las
bases duales elegidas.
Pn
Demostración: Escribimos h(ui ) = j=1 cij u∗j para cada i con cij ∈ k; y
Pn
calculamos: cir = ( j=1 cij u∗j )(ur ) = h(ui )(ur ) = (ui , ur ) = air .
El núcleo de h es el radical de la forma. Se dice que la forma es no
singular cuando su radical es cero. Esto sucede si y sólo si h es biyectiva.

Ejemplo. Sean k = R y A = 1. En este caso, Rn provisto de la forma


(u, v) = a1 b1 + · · · + an bn , si u = a1 u1 + · · · + an un y v = b1 u1 + · · · + bn un
es el espacio euclideano.
204 4. Algebra Lineal

En general, si x = x1 u1 + · · · + xn un , y = y1 u1 + · · · + yn un ∈ V con
xi , yj ∈ k para todos i, j, se tiene que
 
n y1
X  
(x, y) = aij xi yj = (x1 , ..., xn )A  ...  .
i,j=1 yn

Teorema 4.47 Si a la forma bilineal B le corresponde la matriz A =


(aij ) ∈ Mn (k) con respecto a la P base {u1 , ..., un }, entonces con respecto a
n
la base {v1 , ..., vn } dada por vi = j=1 pij uj , para 1 ≤ i ≤ n, le corresponde
la matriz C = P AP , donde P = (pij ) y P t es la transpuesta de P .
t

Demostración: Escribimos C = (cij ) y calculamos


n
X n
X
cij = (vi , vj ) = ( pir ur , pjs us )
r=1 s=1
n
X n
X
= pir (ur , us )pjs = pir ars pjs .
r,s=1 r,s=1

Decimos que u y v son ortogonales cuando (u, v) = 0. Dado X ⊆ V un


subconjunto arbitrario de V , definimos X ⊥ = {v ∈ V | (x, v) = 0, ∀x ∈ X}.
Es claro que X ⊥ siempre es un subespacio de V y que V ⊥ es el radical de
la forma. Si U es un subespacio de V , decimos que U ⊥ es el complemento
ortogonal de U .

Teorema 4.48 Si U es un subespacio de V tal que U ∩ U ⊥ = 0, entonces


V = U ⊕ U ⊥.

Demostración: Dado v ∈ V arbitrario, es suficiente exhibir u ∈ U y


w ∈ U ⊥ tales que v = u + w.
Como U ∩ U ⊥ es el radical de la forma restringida a U , vemos que la
restricción es no singular. Por tanto, la función ϕ : U → U ∗ dada por
ϕ(x)(y) = (x, y) para x, y ∈ U es suprayectiva.
El vector v dado produce un elemento f ∈ U ∗ que actúa ası́: f (x) = (v, x)
para todo x ∈ U . Ası́ que existe u ∈ U tal que (v, x) = (u, x), ∀x ∈ U .
Esto significa que w = v − u ∈ U ⊥ .

Se dice que un vector v es isotrópico cuando (v, v) = 0.

Atención: A partir de este momento suponemos que la caracterı́stica


del campo k no es dos.

Teorema 4.49 Siempre existe una base ortogonal de V , es decir, una base
{u1 , ..., un } tal que (ui , uj ) = 0 si i =
6 j.
4.9 Formas Bilineales y Cuadráticas 205

Demostración: Si la forma es idénticamente cero, no hay más que hacer.


En caso contrario, existe un vector no isotrópico, pues la identidad

(u + v, u + v) = (u, u) + 2(u, v) + (v, v)

y la hipótesis caract k 6= 2 implican que si todo vector es isotrópico, entonces


la forma es idénticamente cero.
Ası́, podemos suponer que u1 no es isotrópico, para tener que U = hu1 i
satisface U ∩ U ⊥ = 0; y por el teorema anterior, V = U ⊕ U ⊥ .
Concluimos por inducción en dim V , pues dim U ⊥ < dim V ; y U ⊥ tiene
una base ortogonal, que junto con u1 forma una base ortogonal de V .
Este teorema admite la siguiente interpretación matricial:

Teorema 4.50 Si A ∈ Mn (k) es simétrica, entonces existe P ∈ Mn (k)


invertible tal que P AP t es diagonal.

Diremos que dos matrices A, B ∈ Mn (k) son congruentes cuando exista


P ∈ Mn (k) invertible tal que B = P AP t . Es inmediato que congruencia
es una relación de equivalencia, que dos matrices congruentes tienen el
mismo rango; y que si nos restringimos a matrices simétricas, dos matrices
son congruentes si y sólo si están asociadas a una misma forma simétrica
bilineal, donde la matriz P que las relaciona, expresa el cambio de base
correspondiente.
Una forma cuadrática Q : V → k es una función polinomial, ho-
mogénea de segundo grado en las coordenadas de v ∈ V . Toda forma bili-
neal B da origen a una forma cuadrática Q ası́: Q(v) = 21 B(v, v), ∀v ∈ V .
Si V tiene un producto interno, diremos que V es una suma directa
ortogonal, escrito V = V1 ⊥ · · · ⊥Vr cuando se tengan

V = V1 ⊕ · · · ⊕ Vr y (vi , vj ) = 0 ⇐ vi ∈ Vi , vj ∈ Vj , i 6= j.

Si k = R, se dice que una forma bilineal B o su forma cuadrática asociada


Q es positiva definida cuando v 6= 0 ⇒ Q(v) > 0. Se dice que B ó Q es
negativa definida cuando v 6= 0 ⇒ Q(v) < 0.

Teorema 4.51 (de la Inercia de Sylvester) Sea V un espacio vecto-


rial de dimensión finita sobre R, provisto de una forma simétrica bilineal.
Entonces existe una descomposición de V como suma directa ortogonal

V = V1 ⊥V2 ⊥V3 ,

tal que la forma restringida a V1 es positiva definida, en V2 es negativa


definida y en V3 es cero. La descomposición puede no ser única; pero las
dimensiones de los sumandos ortogonales sı́ lo son.

Demostración: Partimos de una base ortogonal {u1 , ..., un }, que existe


por el Teorema 4.49.
206 4. Algebra Lineal

Escribiendo (ui , ui ) = ai y con el propósito de crear una nueva base


ortogonal {v1 , ..., vn } tal que (vi , vi ) ∈ {1, −1, 0} para todo i, definimos los
vectores vi como sigue:
ui
√ , si ai > 0,
ai
ui
√ , si ai < 0,
−ai
ui , si ai = 0.
Sean V1 = hvi | (vi , vi ) = 1i, V2 = hvi | (vi , vi ) = −1i, V3 = hvi | (vi , vi ) = 0i.
Resulta que V = V1 ⊥V2 ⊥V3 es como en el enunciado. Si V = W1 ⊥W2 ⊥W3
es otra descomposición como en el enunciado, entonces
dim V3 = dim W3 = dim V − rango A,
para cualquier matriz A asociada al producto interno.
Sea f : V → V1 la proyección lineal. La restricción de f a W1 tiene
núcleo U = W1 ∩ (V2 ⊥V3 ), donde 0 6= v ∈ U ⇒ (v, v) ≤ 0 y también
(v, v) > 0. Ası́, U = 0, por lo que W1 se inyecta en V1 . Esto demuestra que
dim W1 ≤ dim V1 , la igualdad dim W1 = dim V1 se obtiene por simetrı́a.
La interpretación matricial del teorema anterior es la siguiente:
Teorema 4.52 Si A ∈ Mn (R) es simétrica, entonces existe P ∈ Mn (R)
invertible tal que P AP t = diag(1, ..., 1, −1, ..., −1, 0, ..., 0).
Dos matrices diagonales con elementos en {1, −1, 0} son congruentes si
y sólo si tienen el mismo número de “unos”, “menos unos” y “ceros” en
la diagonal.
El teorema anterior produce formas canónicas ante congruencia para
matrices reales simétricas.
Dada una matriz A ∈ Mn (k), en muchos casos podemos encontrar su
forma canónica ante congruencia sin tener que encontrar una matriz P que
efectúe la congruencia. El discriminante de un producto interno es el
determinante de cualquier matriz asociada. Para un producto interno no
singular, este es un invariante como elemento de k ? /(k ? )2 .
Los menores lı́deres de una matriz A ∈ Mn (k) son:
δr = ∆1,2,...,r
1,2,...,r (A), para 1 ≤ r ≤ n.

Si la matriz A está asociada a un producto interno con respecto a la


base {u1 , ..., un }, entonces sus menores lı́deres son los discriminantes del
producto interno restringido a los subespacios hu1 , ..., ui i, por lo que A es
congruente con diag(δ1 , δ2 /δ1 , ..., δn /δn−1 ).

Ejemplo. Consideremos la matriz simétrica A ∈ M3 (R) siguiente:


 
4 2 7
A =  2 −11 6  , donde δ1 = 4, δ2 = −48 y δ3 = 515.
7 6 1
4.9 Formas Bilineales y Cuadráticas 207

Ası́, existe P ∈ M3 (R) invertible con P AP t = diag(1, −1, −1).

El siguiente resultado es inmediato.


Teorema 4.53 Si A ∈ Mn (R) es simétrica con menores lı́deres distintos
de cero, entonces
a) A es positiva definida si y sólo si δr > 0 para todo r.
b) A es negativa definida si y sólo si δ2r+1 < 0 y δ2r > 0 para todo r.
Sea V un espacio euclideano, es decir, V = Rn , provisto de un
p producto
interno positivo definido. La longitud de un vector v es |v| = (v, v). La
distancia entre dos vectores u y v es d(u, v) = |u − v|.

Proceso de ortogonalización de Gram-Schmidt


A partir de un subconjunto linealmente independiente {u1 , ..., un } del
espacio euclideano V , es posible obtener una base ortogonal {v1 , ..., vn } del
espacio hu1 , ..., un i tal que la bandera asociada a ambos conjuntos sea la
misma:
hu1 , ..., ui i = hv1 , ..., vi i, ∀i.
El primer paso es muy fácil: Tomamos v1 = u1 .
Resolvemos para c12 la siguiente ecuación:

0 = (v1 , u2 − c12 v1 ) = (v1 , u2 ) − c12 (v1 , v1 ),

lo cual es posible porque (v1 , v1 ) > 0. Escribimos v2 = u2 −c12 v1 para tener


(v1 , v2 ) = 0 con {v1 , v2 } linealmente independiente.
En el siguiente paso resolvemos para c13 y c23 las siguientes ecuaciones:

0 = (v1 , u3 − c13 v1 ) = (v1 , u3 ) − c13 (v1 , v1 ),


0 = (v2 , u3 − c23 v2 ) = (v2 , u3 ) − c23 (v2 , v2 ),

lo cual es posible porque (v1 , v1 ) > 0 y (v2 , v2 ) > 0.


Escribimos v3 = u3 − c13 v1 − c23 v2 para tener (v1 , v3 ) = (v2 , v3 ) = 0
con {v1 , v2 , v3 } linealmente independiente. Continuando de esta manera se
llega a una base ortogonal como se deseaba, pues para cada i, tenemos que

ui − vi ∈ hu1 , ..., ui−1 i.

Volúmenes m-dimensionales
Dados m vectores u1 , ..., um con m ≤ n en un espacio euclideano Rn , el
m-paralelepı́pedo que generan es
m
X
P (u1 , ..., um ) = {v = ci ui ∈ Rn | 0 ≤ ci ≤ 1}.
i=1

Sea Pm,n la colección de todos los m-paralelepı́pedos en Rn ası́ generados.


208 4. Algebra Lineal

Queremos definir una función volumen vm : Pm,n → R. Si el conjunto


{u1 , ..., um } es ortogonal, queremos tener
m
Y
vm (P (u1 , ..., um )) = |ui |.
i=1

Si el conjunto {u1 , ..., um } es linealmente dependiente, queremos tener

vm (P (u1 , ..., um )) = 0.

Dado un conjunto linealmente independiente {u1 , ..., um }, lo ortogonali-


zamos à la Gram-Schmidt hasta obtener {v1 , ..., vm }. Interpretamos cada
expresión ui = (ui − vi ) + vi como la descomposición ortogonal de ui en
su componente ui − vi en la “base” hu1 , ..., ui−1 i de P (u1 , ..., ui ), más la
“altura” vi . Basados en esta interpretación, definimos
m
Y
vm (P (u1 , ..., um )) = |vi |.
i=1
Pn
Teorema 4.54 a) Si ui = j=1 aij ²j para 1 ≤ i ≤ m, donde {²1 , ..., ²n }
es la base natural de Rn y A = (aij ) ∈ Mm×n (R), entonces

vm (P (u1 , ..., um )) = det AAt .

b) Si T : V → V es lineal, entonces

vm (P (T u1 , ..., T um )) = | det T |vm (P (u1 , ..., um )).

Demostración: Procedemos p por inducción


p en m.√Cuando √ m = 1, tenemos
v1 (P (u1 )) = |v1 | = |u1 | = (u1 , u1 ) = u1 ut1 = AAt = det AAt .
Sea A1 la submatriz de A obtenida al eliminar el último renglón. Podemos
suponer que q
vm−1 (P (u1 , ..., um−1 )) = det A1 At1 .
Como vm − um ∈ hu1 , ..., um−1 i, existe una matriz C, que es producto
de matrices elementales de primer tipo, tal que
µ ¶
A1
CA = y det C = det C t = 1.
vm

Esto nos permite realizar los siguientes cálculos:


µ ¶
t t A1
CAA C = ( At1 vm t
)
vm
µ ¶ µ ¶
A1 At1 A1 vm t
A1 At1 0
= t t = t ;
vm A1 vm vm 0 vm vm
4.9 Formas Bilineales y Cuadráticas 209

m
Y
det AAt = (det A1 At1 )|vm |2 = |vi |2 ,
i=1

de donde se obtiene a). La afirmación b) es inmediata.

Ejercicios
1. Sea V un espacio vectorial de dimensión finita sobre R, provisto de un
producto interno sin vectores isotrópicos distintos de cero. Demuestre
que el producto interno es positivo definido o negativo definido.
2. Sea k algebraicamente cerrado. Demuestre que dos matrices A, B en
Mn (k), simétricas, son congruentes si y sólo si tienen el mismo rango.
Encuentre formas canónicas para este caso.
3. Sean V un espacio vectorial de dimensión finita provisto de un pro-
ducto interno y B = {w1 , ..., wr } ⊂ V tal que det A 6= 0, donde
A = (aij ) ∈ Mr (k) es tal que aij = (wi , wj ). Demuestre que B es
linealmente independiente.
4. a) Demuestre que el área de un triángulo cuyos vértices son (0, 0, 0),
(a1 , a2 , a3 ) y (b1 , b2 , b3 ) es
µ ¶
1√ t a1 a2 a3
det AA , donde A =
2 b1 b2 b3

b) Demuestre que el volumen de un tetraedro con vértices en el origen


y en los puntos u1 , u2 , u3 ∈ Rn es
 
u1
1√
det AAt , donde A =  u2 
6
u3
5. Sea V un espacio vectorial con un producto interno. Sea u un vector
no isotrópico. Definimos la reflección Tu : V → V ası́:
(v, u)
Tu (v) = −v + 2 u.
(u, u)
La función −Tu es la simetrı́a determinada por u. Demuestre que
a) Tu (u) = u y que Tu (w) = −w para w ∈ hui⊥ .
b) Tu2 = 1.
c) Tu preserva el valor de los productos internos.
6. Demuestre las siguientes propiedades de la longitud y de la distancia:
a) |cv| = |c| · |v| si c ∈ R.
b) |(u, v)| ≤ |u| · |v|.
c) |u + v| ≤ |u| + |v|.
d) d(u, w) ≤ d(u, v) + d(v, w).
210 4. Algebra Lineal

4.10 Formas Alternas


En esta sección suponemos que k es un campo de caracterı́stica distinta de
dos. Sea V un espacio vectorial de dimensión finita sobre k. Una forma
alterna en V es una función bilineal

f : V × V → k, tal que f (v, v) = 0, para todo v ∈ V.

Escribimos (u, v) en lugar de f (u, v) y observamos que 0 = (u + v, u + v) =


(u, u) + (u, v) + (v, u) + (v, v) implica la propiedad llamada antisimetrı́a:

(u, v) = −(v, u), para todos u, v ∈ V.

Si a la forma alterna le corresponde la matriz A = (aij ) ∈ Mn (k) con


respecto a la base {u1 , ..., un }, donde aij = (ui , uj ), entonces A es una
matriz alterna, es decir aij = −aji para todos i, j; y además, aii = 0
para todo i. Esto es, At = −A.

Observaciones. Las siguientes afirmaciones son inmediatas.


1. La matriz A corresponde, con respecto a bases duales elegidas, a la
función lineal h : V → V ∗ dada por h(u)(v) = (u, v), para todos
u, v ∈ V .
2. La forma f es no degenerada si y sólo si h es biyectiva, equivalente-
mente, si y sólo si det A 6= 0.
3. Si la forma f es no degenerada, entonces n es par, pues det A =
det At = (−1)n det A.
4. El rango de toda forma o matriz alterna es par.
Teorema 4.55 Sea V un espacio vectorial de dimensión finita provisto de
una forma alterna no degenerada. Entonces existe una base {v1 , v2 , ..., v2n }
tal que (v2i−1 , v2i ) = 1 = −(v2i , v2i−1 ) para 1 ≤ i ≤ n; y tal que (vr , vs ) = 0
si {r, s} 6= {2i − 1, 2i}.
Demostración: Hacemos inducción en n, siendo claro el caso n = 0.
Elegimos v1 ∈ V de manera arbitraria. Como existen vectores no orto-
gonales a v1 , elegimos v2 ∈ V con (v1 , v2 ) = 1.
Sea W = hv1 , v2 i. Afirmamos que W ∩ W ⊥ = 0. Esto es porque

av1 + bv2 ∈ W ⊥ ⇒ (v1 , av1 + bv2 ) = b = 0 y (av1 + bv2 , v2 ) = a = 0.

Como W ∩ W ⊥ = 0, tenemos que V = W ⊕ W ⊥ con dim W ⊥ < dim V ,


por el Teorema 4.48. Concluimos por la inducción.
Corolario 4.56 Todas las formas alternas no degeneradas en un espacio
vectorial V son equivalentes ante Aut V .
4.10 Formas Alternas 211

La interpretación matricial de los resultados anteriores es la siguiente:


Teorema 4.57 Si A ∈ Mn (k) es una matriz alterna invertible, entonces
existe otra matriz invertible P ∈ Mn (k) tal que
 
0 1
 −1 0 
 . 
t
P AP =   . . . (4.14)

 0 1
−1 0
Llamémosle A0 a la matriz en la derecha de la ecuación (4.15). Esta
es una matriz alterna asociada a una base como en el Teorema 4.55, le
llamaremos la matriz alterna canónica. Es claro que det A0 = 1.
Dada una matriz alterna A, tenemos B invertible tal que A = BA0 B t ,
por lo que det A = (det B)(det B t ) = (det B)2 . Definimos el Pfaffiano de
A, escrito Pf A, como det B, de manera que det A = (Pf A)2 .

Observaciones.
1. La definición anterior parece ambigua, porque no tenemos unicidad
de B. La propiedad det A = (Pf A)2 reduce la ambigüedad al factor
±1. El próximo teorema demostrará que la ambigüedad no existe.
2. De nuestra definición, es claro que Pf(CAC t ) = (det C)(Pf A).

Ejemplos. En los casos n = 2 y n = 4, tenemos que


µ ¶
0 a
det = a2 ,
−a 0
 
0 a12 a13 a14
 −a 0 a23 a24 
det  12 
−a13 −a23 0 a34
−a14 −a24 −a34 0
= (a12 a34 − a13 a24 + a14 a23 )2 .

Consideremos el anillo de polinomios R = Z[aij ] en las n(n − 1)/2 va-


riables aij con 1 ≤ i < j ≤ n. Escribiendo aii = 0 para 1 ≤ i ≤ n; y
también aij = −aji para i > j, definimos la matriz alterna genérica
A = (aij ) ∈ Mn (R).
Existe B ∈ Mn (Q(aij )) tal que A = BA0 B t , entonces det B = Pf A es el
Pfaffiano genérico, que satisface det A = (Pf A)2 ∈ Z[aij ]. La unicidad
de la factorización en Z[aij ] implica que Pf A ∈ Z[aij ].
El grupo octaédrico Octn consiste de los elementos w ∈ S2n que al
actuar en {±1, ±2, ..., ±n}, cumplen con w(−i) = −w(i), para 1 ≤ i ≤ n.
Claramente, ◦(Octn ) = n!2n . También hay una acción natural de Octn en
{{1, 2}, {3, 4}, ..., {2n − 1, 2n}}.
212 4. Algebra Lineal

Teorema 4.58 Si A ∈ M2n (k) es una matriz alterna invertible, entonces

X n
Y
Pf A = (−1)σ aσ(2i−1),σ(2i)
σ∈S2n /Octn i=1
n
1 X Y
= (−1)σ aσ(2i−1),σ(2i) .
n!2n i=1
σ∈S2n

Demostración: Sea V el espacio vectorial sobre k de dimensión 2n sub-


yacente. V
Dada T ∈ Aut V , consideramos su acción inducida en el álgebra
exterior V .
V2
Concentramos nuestra atención en V , donde se encuentran dos ele-
mentos que corresponden a las matrices A0 y A, o a sus formas bilineales
asociadas:
Xn X
f0 = (v2i−1 ∧ v2i ), f = aij (vi ∧ vj ).
i=1 i<j
V2
Supongamos que ( T )(f0 ) = f , esto equivale a requerir la igualdad
A = P A0 P t , si P es la matriz asociada a T . Entonces
2n
^ µ n¶
f fn
( T) 0 = ;
n! n!

pero efectuando los cálculos obtenemos


n
1 n 1 X
f0 = ( v2i−1 ∧ v2i )n = v1 ∧ v2 ∧ · · · ∧ v2n ,
n! n! i=1

de manera que
2n
^ µ n¶
f
( T ) 0 = (det T )v1 ∧ v2 ∧ · · · ∧ v2n .
n!

Por otra parte,

fn 1 X
= ( aij vi ∧ vj )n =
n! n! i<j
n
1 X σ
Y
(−1) aσ(2i−1),σ(2i) (v1 ∧ v2 ∧ · · · ∧ v2n ),
n!2n i=1
σ∈S2n

de donde llegamos a la conclusión.

Ejemplo. Sea Aij la submatriz (n − 2) × (n − 2) obtenida a partir de


A omitiendo los renglones y columnas i, j. Sea αij = (−1)i+j−1 Pf Aij .
4.10 Formas Alternas 213

Aprovechando el
Pnrazonamiento anterior, Pdescomponemos f = f1 + f2 , es-
cribiendo f1 = j=2 a1j (v1 ∧ vj ) y f2 = 1<i<j aij (vi ∧ vj ). Calcularemos
Pf A = det T como sigue:
1 1
(Pf A)v1 ∧ · · · ∧ v2n = f n = (f1 + f2 )n
µ ¶ n! n!
1 n 1
= (f1 ∧ f2n−1 ) = f1 ∧ f n−1
n! 1 (n − 1)! 2
n
X Xn
=[ a1j (v1 ∧ vj )] ∧ [ (Pf A1j )b v1 ∧ v2 ∧ · · · ∧ vbj ∧ · · · ∧ v2n ]
j=2 j=2
n
X
=[ (−1)j a1j (Pf A1j )]v1 ∧ · · · ∧ v2n ,
j=2

En el cálculo anterior, usamos el Teorema del Binomio, pues f1 y f2 con-


mutan entre sı́, y con cualquier otra cosa, por ser de grado par. Obtuvimos
n
X
Pf A = a1j α1j .
j=2

V2
El grupo multiplicativo {T ∈ Aut V | ( T )(f0 ) = f0 } es el grupo
simpléctico Sp2n .
Corolario 4.59 Si T ∈ Sp2n , entonces det T = 1.
V2
Demostración: Si T ∈ Sp2n , entonces ( T )(f0 ) = f0 . De esta manera,
V2n V2n
( T ) estabiliza a (1/n!)f0n = v1 ∧v2 ∧· · ·∧v2n ; pero la acción de ( T)
en v1 ∧ v2 ∧ · · · ∧ v2n es multiplicación por det T . Ası́, det T = 1.

Ejercicios
1. Demuestre que si se intercambian los reglones r y s de una matriz
alterna A; y simultáneamente se intercambian las columnas r y s,
entonces Pf A cambia de signo.
2. Demuestre que si se multiplican simultáneamente el renglón r y la
columna r de una matriz alterna A por un escalar c, entonces Pf A
queda multiplicado por c.
3. Demuestre que Sp2 = SL2 .
4. Dada una matriz A = (aij ) ∈ Mn (k) con n par y renglones A1 , ..., An ;
definimos un producto para los renglones Ai · Aj = cij ∈ k ası́:
ai1 ai2 a ai4 a ai,n
cij = + i3 + · · · + i,n−1
aj1 aj2 aj3 aj4 aj,n−1 aj,n
Demuestre que la matriz C = (cij ) es alterna y que Pf C = det A.
5. Demuestre que el Pfaffiano genérico es irreducible en Z[aij ].
214 4. Algebra Lineal

4.11 Formas Hermitianas


Sea V un espacio vectorial de dimensión finita sobre C. Para α = a+bi ∈ C
con a, b ∈ R, escribimos la conjugación compleja ası́: α = a−bi. Una forma
Hermitiana o producto interno sesquilineal en V es una función

S :V ×V →C tal que

1. S(au + bv, w) = aS(u, w) + bS(v, w), para todos a, b ∈ C; u, v, w ∈ V .

2. S(u, v) = S(v, u), para todos u, v ∈ V .

Cuando S queda entendida, escribimos (u, v) en lugar de S(u, v). Al elegir


una base {u1 , ..., un } de V , a la forma S se le asocia una matriz ası́:

A = (aij ) ∈ Mn (C), donde aij = (ui , uj ).

La matriz A es Hermitiana, es decir aij = aji , para toda pareja de


ı́ndices. En particular, los elementos de la diagonal son reales.
Durante el resto de la sección supondremos que V tiene una forma Hermi-
tiana fija positiva definida, es decir, que 0 6= v ∈ V ⇒ (v, v) ∈ R, (v, v) > 0.
En estas condiciones diremos que V es un espacio p unitario. Aquı́ defini-
mos la longitud de un vector v como |v| = (v, v) y la distancia entre
dos vectores u y v como d(u, v) = |u − v|.

Observaciones. Las siguientes afirmaciones o son inmediatas o admiten


demostraciones similares a las ya dadas para afirmaciones semejantes, usa-
mos la notación de arriba.

1. Si x = x1 u1 + · · · + xn un , y = y1 u1 + · · · + yn un , entonces
 
n y1
X  .. 
(x, y) = aij xi yj = (x1 , ..., xn )A  .  .
i,j=1 yn

2. La longitud y la distancia cumplen las propiedades del Ejercicio 4.9.6.

3. Con respecto a una nuevaPnbase {v1 , ..., vn } de V , relacionada con la


base anterior ası́: vi = j=1 pij uj ∀i, a S le corresponde la matriz
P AP ∗ , donde P ∗ = (qij ) con qij = pji es la adjunta Hermitiana
de P = (pij ).

4. Existe una base ortonormal de V , esto es, una base {w1 , ..., wn }, tal
que (wi , wj ) = δij .

5. Existe P ∈ Mn (C) invertible tal que P AP ∗ es la identidad.


4.11 Formas Hermitianas 215

6. La función f : V → V ∗ dada por f (u)(v) = (v, u), para u, v ∈ V , es


semilineal y biyectiva. Decir que f es semilineal significa que
f (u1 + u2 ) = f (u1 ) + f (u2 ), f (αu) = αf (u), ∀u, u1 , u2 ∈ V, α ∈ C.

Dados T : V → V y v ∈ V , podemos definir h ∈ V ∗ ası́: h(u) = (T (u), v),


para todo u ∈ V . La Observación 6 garantiza la existencia de un único
vector w ∈ V tal que h(u) = (u, w). Esto nos permite definir una función
T ∗ : V → V , dada por T ∗ (v) = w en la situación anterior. La función T ∗
es la adjunta Hermitiana de T . Notemos que se cumple la igualdad
(T (u), v) = (u, T ∗ (v)), ∀ u, v ∈ V, T ∈ End V. (4.15)
Proposición 4.60 La adjunta Hermitiana T ∗ de una transformación T
tiene las siguientes propiedades:
a) T ∗ es lineal.
b) Si la matriz de T es A = (aij ) con respecto a una base ortonormal de
V y T ∗ tiene asociada a la matriz B = (bij ) con respecto a la misma base,
entonces aij = bji .
c) T ∗∗ = T .
d) (S + T )∗ = S ∗ + T ∗ , para toda S lineal.
e) (αT )∗ = αT ∗ , para toda α ∈ C.
f ) (ST )∗ = T ∗ S ∗ , para toda S lineal.
Demostración: a) Partiendo de (4.16), tenemos que
(u, T ∗ (av + bw)) = (T u, av + bw) = a(T u, v) + b(T u, w) =
a(u, T v) + b(u, T ∗ w) = (u, aT ∗ v + bT ∗ w), ∀a, b ∈ C; u, v, w ∈ V.

Como V es un espacio unitario, se obtiene la linealidad de T ∗ .P


n
b) Sea {u1 , ..., un } una base ortonormal de V con T (ui ) = j=1 aij uj .
P n
Estamos suponiendo que T ∗ (ur ) = s=1 brs us , para 1 ≤ r ≤ n. Entonces:
n
X
aij = (T ui , uj ) = (ui , T ∗ uj ) = (ui , bjs us ) = bji .
s=1

Las afirmaciones c), d) y e) son consecuencias inmediatas de b). Para ver


f ), calculamos: (u, (ST )∗ v) = (ST u, v) = (T u, S ∗ v) = (u, T ∗ S ∗ v).
Dada A = (aij ) ∈ Mn (C), definimos su adjunta Hermitiana como la
matriz B = (bij ) tal que bij = aji , para todos 1 ≤ i, j ≤ n. Escribimos la
adjunta Hermitiana de A ası́: A∗ .
Teorema 4.61 Las siguientes condiciones en T : V → V son equivalentes:
a) (T v, T v) = (v, v) para todo v ∈ V .
b) (T u, T v) = (u, v) para todos u, v ∈ V .
c) T envı́a una base ortonormal a otra.
d) T ∗ = T −1 .
e) T T ∗ = 1 = T ∗ T .
216 4. Algebra Lineal

Demostración: La equivalencia d) ⇔ e) es clara, por lo que veremos las


implicaciones a) ⇒ b) ⇒ c) ⇒ e) ⇒ a).
a) ⇒ b): Como (T (u + v), T (u + v)) = (u + v, u + v), tenemos que

(T u, T v) + (T v, T u) = (u, v) + (v, u). (4.16)

También tenemos (T u, T (−iv)) + (T (−iv), T u) = (u, −iv) + (−iv, u), es


decir, i(T u, T v) − i(T v, T u) = i(u, v) − i(v, u), lo cual nos da

(T u, T v) − (T v, T u) = (u, v) − (v, u) (4.17)

De (4.17) y (4.18) obtenemos (T u, T v) = (u, v) para todos u, v ∈ V .


b) ⇒ c): Si {u1 , ..., un } es una base ortonormal de V y T (ui ) = vi para
toda i, entonces (vi , vj ) = (T ui , T uj ) = (ui , uj ) = δij .
c) ⇒ e): Dada una base ortonormal {u1 , ..., un }, tenemos que

δij = (ui , uj ) = (T ui , T uj ) = (ui , T ∗ T uj ) ⇒ uj = T ∗ T uj , ∀j.

Esto implica que T T ∗ = 1 = T ∗ T .


e) ⇒ a): Si v ∈ V , entonces (v, v) = (v, 1v) = (v, T ∗ T v) = (T v, T v).

Una transformación lineal T es unitaria cuando satisface las condiciones


del teorema anterior. Se dice que T es Hermitiana cuando T = T ∗ , que es
antihermitiana cuando T = −T ∗ , o que es normal cuando T T ∗ = T ∗ T .
Se definen estas mismas nociones para matrices complejas cuadradas, de
manera análoga. Ası́, resulta que la matriz asociada con respecto a una
base ortonormal, a una transformación lineal unitaria (resp. Hermitiana,
antihermitiana o normal) es unitaria (resp. Hermitiana, antihermitiana o
normal).

Observaciones. Si A = (aij ) ∈ Mn (R), entonces


1. A es Hermitiana si y sólo si A es simétrica.
2. A es antihermitiana si y sólo si A es antisimétrica.
3. A es normal si y sólo si A conmuta con su transpuesta.
4. A es unitaria si y sólo si AAt = 1 = At A, es decir, At = A−1 .
Una matriz A ∈ Mn (R) tal que At = A−1 se llama ortogonal.
Teorema 4.62 Sea V un espacio unitario.
a) Si T ∈ End V es Hermitiana y W es un subespacio de V estable ante
T , entonces T (W ⊥ ) ⊆ W ⊥ .
b) Si A ⊆ End V satisface T ∈ A ⇒ T ∗ ∈ A y si T (W ) ⊆ W para un
subespacio W de V , entonces T (W ⊥ ) ⊆ W ⊥ , ∀ T ∈ A.
c) Si T ∈ End V es Hermitiana, entonces V admite una base ortonormal
formada por vectores caracterı́sticos de T .
4.11 Formas Hermitianas 217

d) Si A es un conjunto de transformaciones lineales Hermitianas de V


que conmutan entre sı́, entonces V admite una base ortonormal formada
por vectores caracterı́sticos simultáneos de todas las T ∈ A.

Demostración: a) es consecuencia inmediata de b).


b): Si u ∈ W, v ∈ W ⊥ , T ∈ A, entonces (T v, u) = (v, T ∗ u) = 0, porque
T ∈ A ⇒ T ∗u ∈ W .

c) es consecuencia inmediata de d).


d): Por el Teorema 4.39, existe un vector caracterı́stico v común a toda
T ∈ A. Si W = hvi,pentonces W ⊥ es estable ante toda T ∈ A, gracias a b).
Definimos v1 = v/ (v, v) y obtenemos por inducción en dim V una base
ortonormal {v2 , ..., vn } de W ⊥ , con todo vi vector caracterı́stico de toda
T ∈ A, de manera que {v1 , ..., vn } es una base ortonormal de V .

Como la transición de una base ortonormal a otra, se da por medio de


una matriz unitaria, tenemos la siguiente versión matricial del resultado
anterior:

Corolario 4.63 Dado un conjunto conmutativo de matrices Hermitianas


C, existe una matriz unitaria U tal que U AU ∗ = U AU −1 es diagonal para
toda A ∈ C.

Teorema 4.64 Sea V un espacio unitario.


a) Si T : V → V es normal, entonces V admite una base ortonormal de
vectores caracterı́sticos de T .
b) Dada una matriz normal N , existe una matriz unitaria U tal que
U N U ∗ = U N U −1 es diagonal.
c) Para T normal, T ∗ es un polinomio en T con coeficientes en C.
d) Si A es un conjunto conmutativo de transformaciones normales, en-
tonces V admite una base ortonormal formada por vectores caracterı́sticos
simultáneos de todas las T ∈ A.
e) Dado un conjunto conmutativo de matrices normales C, existe una
matriz unitaria U tal que U AU ∗ = U AU −1 es diagonal para toda A ∈ C.

Demostración: a) Sean T1 = T + T ∗ y T2 = iT − iT ∗ . Por ser T normal,


tenemos que T1 = T1∗ , T2 = T2∗ y que T1 T2 = T2 T1 . Por tanto, V admite una
base ortonormal de vectores caracterı́sticos de T1 y T2 ; pero tenemos que
T = (1/2)(T1 −iT2 ). Ası́, estos vectores también son vectores caracterı́sticos
de T .
b) es la versión matricial de a).
c) Si a T se le asocia la matriz diag(a1 , ..., an ) con respecto a una base
ortonormal de V , tenemos que a T ∗ se le asocia la matriz diag(a1 , ..., an )
con respecto a la misma base.
El Teorema de Interpolación de Lagrange garantiza que existe un poli-
nomio p(X) ∈ C[X] de grado menor o igual que n − 1, tal que p(ai ) = ai ,
para 1 ≤ i ≤ n. Entonces p(T ) = T ∗ .
218 4. Algebra Lineal

d) Sea C = A ∪ {T ∗ | T ∈ A}. Entonces c) garantiza que C es un


conjunto conmutativo, por lo que existe un vector caracterı́stico v común

a todo T ∈ A. El Teorema p 4.62 b) implica que hvi es estable ante todo
T ∈ C. Definimos v1 = v/ (v, v) y obtenemos por inducción en dim V una
base ortonormal {v2 , ..., vn } de hvi⊥ , con todo vi vector caracterı́stico de
toda T ∈ C, de manera que {v1 , ..., vn } es una base ortonormal de V como
la buscada.
e) es la versión matricial de d).

Corolario 4.65 a) Los valores caracterı́sticos de toda transformación li-


neal T Hermitiana son reales.
b) Los valores caracterı́sticos λ de toda transformación lineal unitaria T
satisfacen λλ = 1.
c) Sea T una transformación normal. Si sus valores caracterı́sticos son
reales, entonces T es Hermitiana. Si sus valores caracterı́sticos λ satisfacen
λλ = 1, entonces T es unitaria.

Demostración: Por ser T normal, en cualquier caso, le asociamos una


matriz diagonal con respecto a una base ortonormal de V . Entonces todo
es claro.
Cuando el campo es R, podemos refinar nuestros resultados como sigue.

Teorema 4.66 (del Eje Principal)


a) Si A ∈ Mn (R) es simétrica, entonces existe P ortogonal tal que
P AP t = P AP −1 es diagonal.
b) El espacio vectorial V = Rn admite una base ortonormal consistente
de vectores caracterı́sticos de una transformación lineal simétrica dada.

Demostración: a) y b) son afirmaciones equivalentes que demostraremos


simultáneamente.
Tenemos una transformación lineal T : Rn → Rn del espacio euclideano
de vectores renglón, definida ası́: T (v) = vA, donde A es la matriz simétrica
dada. La acción de T puede extenderse a Cn con la misma definición.
Como T es Hermitiana, Qrsus valores ncaracterı́sticos distintos λ1 , ..., λr
son reales. Sea p(X) = i=1 (X − λ i ) i
el polinomio caracterı́stico de
T . Entonces tenemos la descomposición V = V1 ⊕ · · · ⊕ Vr , donde Vi =
ker(T − λi )ni , para 1 ≤ i ≤ r.
A la transformación normal T le corresponde una matriz diagonal sobre
C, con respecto a una base ortonormal de Cn . Por ello,

(T − λi )ni v = 0 ⇒ (T − λi )v = 0,

es decir, todo vi ∈ Vi es un vector caracterı́stico de T .


Si vi ∈ Vi y vj ∈ Vj con i 6= j, entonces λi 6= λj ; y por lo tanto

λj (vi , vj ) = (vi , T vj ) = (T vi , vj ) = λi (vi , vj ) ⇒ (vi , vj ) = 0.


4.11 Formas Hermitianas 219

Ası́ tenemos que V = V1 ⊥ · · · ⊥Vr es una suma directa ortogonal de espacios


en los que T actúa como escalar real, cada uno de los cuales admite una
base ortonormal, cuya unión es una base de V como en el enunciado.

Teorema 4.67 Sea B ∈ Mn (R) una matriz ortogonal. Entonces existe P


ortogonal con P BP t = P BP −1 de forma
 
1r
 −1s 
 
 cos α sen α 
 1 1 
 − sen α cos α 
 1 1 
 . .. 
 
 
 cos αt sen αt 
− sen αt cos αt

Demostración: Sea A = B + B t = B + B −1 . Entonces A es simétrica y


conmuta con B. Por el teorema anterior, existe una descomposición V =
V1 ⊥ · · · ⊥Vr , donde vi ∈ Vi ⇒ vi A = λi vi , con λ1 , ..., λr elementos distintos
de R.
La función lineal L definida como multiplicación derecha por la matriz
B, estabiliza a cada Vi , donde actúa biyectivamente.
Como vi (B+B −1 ) = λi vi para vi ∈ Vi , tenemos que vi (B 2 −λi B+1) = 0,
lo que implica que el subespacio W = hvi , vi Bi de Vi es invariante ante
L; pero entonces el complemento ortogonal W ⊥ de W en Vi también es
invariante ante L: Si u ∈ W y v ∈ W ⊥ entonces (vB, u) = (v, B −1 u) = 0,
porque B t = B −1 y porque L actúa biyectivamente en W .
Ası́, cada Vi es una suma directa ortogonal de subespacios W invariantes
ante L de dimensión ≤ 2.
Sea T la transformación lineal dada por multiplicación derecha por B
restringida al espacio W .
Si dim W = 1, entonces T es ortogonal y actúa como escalar. Este debe
ser ±1.
Si dim W = 2, entonces con respecto a cualquier base ortogonal de W ,
se le asocia a T una matriz µ ¶
a b
c d
con a2 + b2 = 1 = c2 + d2 y ac + bd = 0. Además, T 2 − λi T + 1 = 0 ⇒
det T = 1, esto es ad − bc = 1. Estas ecuaciones admiten una solución de
la forma a = d = cos α, b = −c = sen α.

Notemos que toda transformación lineal ortogonal, o bien toda matriz


ortogonal tiene determinante ±1. Una rotación es una transformación
ortogonal con determinante uno.
220 4. Algebra Lineal

Sea T : V → V una transformación lineal Hermitiana de un espacio


unitario V . Sabemos que los valores caracterı́sticos de T son reales. Decimos
que T es positiva definida (resp. negativa definida) cuando todo valor
caracterı́stico λ de T es positivo (resp. negativo).

Proposición 4.68 Sea T una función lineal de un espacio unitario V .


a) Si T es Hermitiana, entonces T es positiva definida si y sólo si
(T v, v) > 0 para todo 0 6= v ∈ V .
b) Si T es invertible, entonces T T ∗ es positiva definida.

Demostración: a) Existe un base ortonormal {v1 , ..., vn } de V formada


por vectores caracterı́sticos de T : Aquı́, T (vi ) = λi vi , para 1 ≤ i ≤ n. Si
λi > 0, para
Pntodo i, entonces cualquier vector 0 6= v ∈ V puede escribirse
como v = i=1 ai vi , de manera que
n
X n
X n
X n
X n
X
(T v, v) = (T ai vi , ai vi ) = ( λi ai vi , ai vi ) = λi ai ai > 0.
i=1 i=1 i=1 i=1 i=1

Recı́procamente, si v es un vector caracterı́stico de T con T (v) = λv,


tenemos que
λ(v, v) = (T v, v) > 0 ⇒ λ > 0.
b) Claramente T T ∗ es Hermitiana. Dado 0 6= v ∈ V , se tiene que
(T T ∗ v, v) = (T ∗ v, T ∗ v) > 0, porque T invertible ⇒ T ∗ invertible.

Proposición 4.69 Toda transformación lineal positiva definida T admite


una única raı́z cuadrada positiva definida, que es un polinomio en T .

Demostración: Una vez que a T se le asocia una matriz diag(λ1 , ..., λn )


con respecto a una base ortonormal de V , con todo λi > 0, tomamos µi > 0
con µ2i = λi para cada i.
La transformación lineal H, asociada a la matriz diag(µ1 , ..., µn ) respec-
to a la base ortonormal anterior, satisface H 2 = T . La Interpolación de
Lagrange produce un polinomio f tal que f (λi ) = µi , para todo i. Ası́,
f (T ) = H conmuta con toda transformación lineal que conmute con T .
Si H1 es otra raı́z cuadrada positiva definida de T , entonces, al diago-
nalizar H1 , vemos que H1 conmuta con T y con H, por lo que es posible
diagonalizar simultáneamente H1 y H. Ası́ se ve que H1 = H.

Teorema 4.70 (Descomposición Polar) Sea T : V → V una trans-


formación lineal invertible de un espacio unitario V . Entonces existen H
positiva definida y U unitaria, únicas; tales que T = HU .

Demostración: Veamos la unicidad: T = HU ⇒ T ∗ = U ∗ H; y entonces


T T ∗ = HU U ∗ H = H 2 . Ası́, H es la única raı́z cuadrada positiva definida
de T T ∗ .
4.12 Ejercicios Generales 221

Veamos la existencia: Partiendo de H como acabamos de ver, definimos


U = H −1 T , para tener U ∗ = T ∗ (H −1 )∗ = T ∗ H −1 , por lo que U U ∗ =
H −1 T T ∗ H −1 = 1. Ası́, U es unitaria y T = HU .

Ejercicios
1. Demuestre que para toda A ∈ Mn (C), existe U unitaria tal que
U AU −1 es triangular.

2. Demuestre que si para A ∈ Mn (C), existe U unitaria tal que U AU −1


es diagonal, entonces A es normal.

3. Demuestre que si A ∈ Mn (R) es invertible, entonces existen matrices


B simétrica positiva definida y C ortogonal únicas, tales que A = BC.

4.12 Ejercicios Generales


1. Sea A ∈ Mn (Q) con tr A = 0. Demuestre que A es similar a una
matriz con ceros en la diagonal principal.

2. Sea det : Rn × · · · × Rn → R. Demuestre que la derivada total de esta


función, evaluada en (a1 , ..., an ); y escrita (D det)(a1 , ..., an ) satisface
n
X
(D det)(a1 , ..., an )(b1 , ..., bn ) = det(a1 , ..., ai−1 , bi , ai+1 , ..., an ).
i=1

3. Sean k un anillo conmutativo con uno y V un k-módulo libre de


rango r. Dado L ∈ Endk V , se genera una serie de transformaciones
inducidas por L en distintos objetos construidos a partir de V .
Q
a) Demuestre que existe un único morfismo, llamado L que hace
conmutativo a todo diagrama donde pi es la proyección en el i-ésimo
factor directo:
pi
Vn /V
Q
L L
² pi ²
Vn /V
Q
b) Demuestre que los distintos L inducen morfismos únicos T n L
n
del álgebra tensorial T V , que hacen conmutativos a los diagramas

Vn / T nV
Q
L T nL
² ²
Vn / T nV
222 4. Algebra Lineal

y que inducen un único morfismo T (L) : T (V ) → T (V ), donde


a
T (V ) = T n V.
n≥0

Q
c) Demuestre que los distintos L inducen morfismos únicos S n L
del álgebra simétrico S n V , que hacen conmutativos a los diagramas

Vn / SnV
Q
L Sn L
² ²
Vn / SnV

y que inducen un único morfismo S(L) : S(V ) → S(V ), donde


a
S(V ) = S n V.
n≥0

Q Vn
d) Demuestre que los V distintos L inducen morfismos únicos L
n
del álgebra alternante V , que hacen conmutativos a los diagramas

Vn / Vn V
Q Vn
L L
² ²
Vn / Vn V
V V V
y que inducen un único morfismo L: V → V , donde
^ r ^
a n
V = V.
n=0

e) Sean L1 , L2 ∈ End V . Demuestre que T (L1 ◦ L2 ) = T (L1 ) ◦ T (L2 )


y que T (1) = 1. Enuncie y demuestre propiedades análogas para los
otros morfismos inducidos.
Vn
f ) Demuestre que L es multiplicación por det L.
V2
g) Demuestre que a cada elemento de V se le asocia una matrix
alterna A de manera natural. Al elegir una V base de V , a L se le
2
asocia la matriz C. Demuestre que entonces L corresponde a la
t
transformación A 7→ CAC .
4. Demuestre que dadas matrices A ∈ Mm×n y B ∈ Mn×r , todo menor
t × t de AB, con t ≤ m, n, r; es una suma de productos D1 D2 , donde
D1 es un menor t × t de A, mientras que D2 lo es de B. Escriba la
expresión precisa de este resultado.
Capı́tulo 5
Temas Complementarios

5.1 Teorema de la Base Normal


Dada una extensión finita de Galois F/k con Gal(F/k) = {σ1 , ..., σn }, se
dice que una base de F/k es una base normal cuando es de la forma
{σ1 (w), ..., σn (w)} para algún w ∈ F . Aquı́ veremos que toda extensión
finita de Galois posee una base normal.
Proposición 5.1 Sea F/k una extensión separable de campos de grado n
y sean σ1 , ..., σn los distintos k-morfismos F → k. Entonces un subconjunto
B = {a1 , ..., an } ⊆ F es una base de F sobre k si y sólo si det(σi aj ) 6= 0.
Demostración: Teniendo el número correcto de elementos, B es una base
de F/k si y sólo si B es linealmente independiente sobre k.
La ecuación lineal a1 x1 + · · · + an xn = 0 tiene las mismas soluciones en
k que el sistema de ecuaciones (que la incluye):

σ1 (a1 )x1 + · · · + σ1 (an )xn = 0


..
.
σn (a1 )x1 + · · · + σn (an )xn = 0 (5.1)
pues las soluciones a1 c1 + · · · + an cn = 0 con todo ci ∈ k generan au-
tomáticamente soluciones del sistema (5.1), al aplicar a esta expresión los
distintos morfismos σi . Nuestra conclusión se obtiene al observar que la
matriz de coeficientes del sistema de ecuaciones es (σi aj ) ∈ Mn (F ).
Teorema 5.2 (de la Base Normal) Sea F/k una extensión finita de
Galois con G = Gal(F/k) = {σ1 , ..., σn }. Entonces existe w ∈ F tal que
{σ1 (w), ..., σn (w)} es una base de F/k.
Demostración: Caso 1: k es finito. Aquı́, el Teorema 3.50 a) afirma que
G es cı́clico, por lo que podemos suponer que G = hσi, con σ i = σi para
1 ≤ i ≤ n.
El Teorema 3.59 afirma que el conjunto G es linealmente independiente
sobre F y con mayor razón sobre k. Por tanto σ ∈ Endk F tiene polinomio
224 5. Temas Complementarios

mı́nimo de grado ≥ n; y la acción de σ hace de F un módulo cı́clico. Esto


significa precisamente que existe w ∈ F tal que {σ1 (w), ..., σn (w)} es una
base de F/k.
Caso 2: k es infinito. Por el Corolario 3.37, existe un elemento primitivo
u ∈ F tal que F = k(u). Sea f (X) = Polmin(u,
Qn k). Escribimos ui = σi (u),
para 1 ≤ i ≤ n, observamos que f (X) = i=1 (X − ui ); y consideramos los
siguientes polinomios:

f (X) f (X)
q(X) = 0
y qi (X) = σi [q(X)] =
(X − u)f (u) (X − ui )f 0 (ui )

Los polinomios qi (X) están en F [X] y tienen la siguiente propiedad:

qi (uj ) = δij . (5.2)

Ante la acción de G en {qi (X) | 1 ≤ i ≤ n}, cada elemento 1 6= σ ∈ G


actúa sin puntos fijos.
Es inmediato que

i 6= j ⇒ qi (X)qj (X) ≡ 0 (mod f (X)). (5.3)

En la ecuación
n
X
qi (X) − 1 = 0, (5.4)
i=1

el polinomio de la izquierda tiene grado ≤ n − 1; pero (5.2) implica que


tiene las n raı́ces u1 , ..., un ; por lo que (5.4) es una identidad polinomial.
Multiplicamos (5.4) por qi (X) y usamos (5.3) para obtener

qi (X)2 ≡ qi (X) (mod f (X)). (5.5)

Consideramos ahora la matriz A = (σi σj [q(X)]) ∈ Mn (F [X]), para la


que obtenemos con ayuda de (5.3-5) que

AAt ≡ 1 (mod f (X)).

Por lo tanto, el polinomio g(X) = det A ∈ F [X] satisface

g(X)2 ≡ 1 (mod f (X)).

Ası́, g(X) no es cero; y existe b ∈ F tal que g(b) 6= 0. Escribiendo w = q(b),


esto significa que det(σi σj (w)) 6= 0 y que {σ1 (w), ..., σn (w)} es linealmente
independiente sobre k.

Proposición 5.3 Sea F/k una extensión de campos con k infinito. Dado
un polinomio 0 6= p(X1 , ..., Xn ) ∈ F [X1 , ..., Xn ], existen a1 , ..., an ∈ k tales
que p(a1 , ..., an ) 6= 0.
5.1 Teorema de la Base Normal 225

Demostración: Procedemos por inducción en el número de variables n,


siendo claro el caso n = 1, pues todo polinomio en una variable tiene un
número finito de raı́ces. Escribimos nuestro polinomio
r
X
p(X1 , ..., Xn ) = qi (X1 , ..., Xn−1 )Xni ,
i=0

donde se tiene que qi (X1 , ..., Xn−1 ) ∈ F [X1 , ..., Xn−1 ], para 0 ≤ i ≤ r; y
además qr (X1 , ..., Xn−1 ) 6= 0.
Por la hipótesis inductiva, existen elementos a1 , ..., an−1 ∈ k tales que
qr (a1 , ..., an−1 ) 6= 0, por lo que
r
X
0 6= qi (a1 , ..., an−1 )Xni ∈ F [Xn ].
i=0

De manera que existe an ∈ k tal que p(a1 , ..., an ) 6= 0.


Teorema 5.4 (Independencia Algebraica de Morfismos) Sea F/k
una extensión separable de campos de grado n, con k infinito; y sea A =
{σ1 , ..., σn } el conjunto de los distintos k-morfismos F → k. Entonces A
es algebraicamente independiente sobre F .
Demostración: Supongamos que f (X1 , ..., Xn ) ∈ F [X1 , ..., Xn ] es tal que
f (σ1 (u), ..., σn (u)) = 0, para todo u ∈ F .
Sea {u1 , ..., un } una base de F sobre k.P Efectuamos la transformación
n
lineal T en las variables dada por T (Xi ) = j=1 (σi uj )Xj , para 1 ≤ i ≤ n,
de manera que T es invertible al asociarse a la matriz (σi uj ) ∈ Mn (F ).
El polinomio g(X1 , ..., Xn ) = f (T (X1 ), ..., T (Xn )) satisface
g(a1 , ..., an ) = f (Σj (σ1 uj )aj , ..., Σj (σn uj )aj )
= f (σ1 (Σj aj uj ), ..., σn (Σj aj uj )) = 0;
siempre que a1 , ..., an ∈ k.
La proposición anterior implica que g(X1 , ..., Xn ) = 0; pero entonces
f (X1 , ..., Xn ) = 0, ya que si L es la transformación lineal inversa de T , se
tiene que f (X1 , ..., Xn ) = g(L(X1 ), ..., L(Xn )) = 0.
Concluimos esta sección con una segunda demostración para el Caso 2
del Teorema de la Base Normal.
Demostración: Sea R = k[X1 , ..., Xn ]. Consideramos la correspondencia
Xi ¿ σi entre variables y elementos de G. Sea X ∈ Mn (R) la matriz que
tiene a la variable Xi(j) correspondiente a σi σj en la posición ij. Escribimos
f (X1 , ..., Xn ) = det X.
Como cada renglón y cada columna de la matriz X es una permutación
del conjunto de las variables X1 , ..., Xn ; vemos que f (1, 0, ..., 0) = ±1. Esto
implica que f (X1 , ..., Xn ) 6= 0.
Sabemos que G es algebraicamente independiente sobre F , por lo que
det(σi σj ) 6= 0. Siendo F infinito, la Proposición 5.3 implica que existe
226 5. Temas Complementarios

w ∈ F tal que det((σi σj )(w)) 6= 0; pero entonces {σ1 (w), ..., σn (w)} es
linealmente independiente sobre k.

Ejercicios
1. Sea F/k una extensión finita de campos, de Galois con grupo de
Galois G = Gal(F/k). Demuestre que F es un k[G]-módulo libre de
rango uno.
2. Sea F/k una extensión finita de Galois con G = Gal(F/k) y con k
infinito. Demuestre que existe u ∈ F tal que para todo subgrupo
H < G, se tenga que {σ(u) | σ ∈ H} es una base de F sobre F H .

5.2 Formas Bilineales sobre Campos Finitos


Dados un campo k y dos matrices simétricas A, B ∈ Mn (k), tenemos un
problema natural que es decidir si A y B son congruentes. Este problema
lo resuelve completamente el Teorema de la Inercia de Sylvester (Teorema
4.52) para el caso en que k = R. Este resultado también exhibe formas
canónicas para matrices simétricas ante congruencia.
El caso de k algebraicamente cerrado y caract k 6= 2, también es fácil;
y se propuso como el Ejercicio 4.9.2. Cuando k = Q, la situación es más
complicada; pero se sabe la respuesta, que viene dada por el Teorema de
Hasse-Minkowski, enunciado en la última sección de este capı́tulo.
En el caso de campos finitos, también hay una respuesta completa y
sencilla al problema de congruencia, como veremos a continuación.
Atención: Desde ahora suponemos que k es finito, que caract k 6= 2 y
que V es un espacio vectorial de dimensión finita sobre k.
Teorema 5.5 Dada una extensión de campos finitos F/k, el morfismo
norma NkF : F ? → k ? es suprayectivo.
Demostración: Sean ◦(k) = q = pm , [F : k] = n y Gal(F/k) = hτ i, donde
p es primo, τ = σ m y σ es el morfismo de Frobenius. Entonces

a ∈ ker NkF ⇔ aτ (a) · · · τ n−1 (a) = 1;


2
+···+q n−1
pero 1 = aτ (a) · · · τ n−1 (a) = a1+q+q tiene cuando más
qn − 1
1 + q + q 2 + · · · + q n−1 =
q−1
soluciones, por lo que ◦(Im NkF ) ≥ q − 1. Siendo clara la desigualdad
◦(Im NkF ) ≤ q − 1, se tiene que Im NkF = k ? .
Una forma bilineal B es isotrópica cuando existe un vector isotrópico
(v 6= 0 con B(v, v) = 0). En caso contrario, la forma es anisotrópica.
5.2 Formas Bilineales sobre Campos Finitos 227

Proposición 5.6 Sea B : V × V → k una forma simétrica bilineal isotró-


pica no degenerada. Entonces, dado b ∈ k, existe v ∈ V tal que B(v, v) = b.

Demostración: Supongamos que 0 6= u ∈ V es isotrópico: B(u, u) = 0.


Como B no es degenerada, existe w ∈ V tal que B(u, w) = 1, entonces
escribimos v = cu + w y calculamos B(v, v) = 2c + B(w, w), donde es
posible resolver c = [b − B(w, w)]/2, para tener B(v, v) = b.

Teorema 5.7 Sea B : V × V → k una forma simétrica bilineal no de-


generada, tal que dim V ≥ 2. Entonces, dado b ∈ k, existe v ∈ V tal que
B(v, v) = b.

Demostración: En vista del resultado anterior, podemos suponer que B es


anisotrópica. Claramente, una vez que b sea dado, es suficiente encontrar un
vector v tal que B(v, v) = b, en cualquier subespacio de V . Ası́, suponemos
que dim V = 2.
Como existe una base ortogonal de V , podemos también suponer que
B(v, v) = ax2 + cy 2 con ac 6= 0, si v = (x, y). Dividiendo entre a, todavı́a
podemos limitarnos al caso en que B(v, v) = x2 + cy 2 , pues si conseguimos
que x2 + (c/a)y 2 = b/a, entonces tendremos ax2 + cy 2 = b.
La hipótesis de que B es anisotrópica significa que x2 + cy 2 6= 0 siempre
que (x, y) 6= 0. Esto√ quiere decir que −c no es un cuadrado en k. Ası́,
la extensión F = k( −c)/k√es de grado dos. Lo que queremos demostrar
es que la norma NkF (x + y −c) = x2 + cy 2 es suprayectiva; pero esto lo
tenemos gracias al Teorema 5.5.

Teorema 5.8 Sea k un campo finito con caract k 6= 2. Dada una forma
simétrica bilineal no degenerada B : V × V → k, existe una base orto-
gonal {u1 , ..., un } de V tal que B(ui , ui ) = 1, siempre que 1 ≤ i < n; y
B(un , un ) = d, donde d es el discriminante de la forma.

Demostración: Por el resultado anterior, si dim V = n ≥ 2, entonces


existe u1 ∈ V tal que B(u1 , u1 ) = 1.
Consideramos la descomposición V = hu1 i ⊕ hu1 i⊥ . Si se tiene que
dimhu1 i⊥ ≥ 2, entonces existe u2 ∈ hu1 i⊥ tal que B(u2 , u2 ) = 1, y
ası́ sucesivamente, hasta que hu1 , ..., un−1 i⊥ = hun i, que debe satisfacer
B(un , un ) = d.

Teorema 5.9 a) Dada una matriz simétrica invertible A ∈ Mn (k), donde


k es un campo finito con caract k 6= 2, existe una matriz ortogonal P tal
que P AP t = diag(1, ..., 1, d), donde d = det A.
b) Las matrices diag(1, ..., 1, d1 ) y diag(1, ..., 1, d2 ) son congruentes si y
sólo si d1 d−1 ? 2
2 ∈ (k ) .

Demostración: a) es la versión matricial del teorema anterior.


b) es consecuencia de que al discriminante lo consideramos un elemento
de k ? /(k ? )2 .
228 5. Temas Complementarios

Observación. Hay campos infinitos F , donde el rango y el discriminante


forman un conjunto completo de invariantes para sus formas cuadráticas.
Lo que se necesita para que esto sea cierto, es poder resolver en F toda
ecuación ax2 + by 2 = 1 con a, b ∈ F dados, como se aprecia al revisar la
demostración del Teorema 5.8.
Esto ocurre por ejemplo, en el caso de una extensión algebraica infinita
F de un campo finito k, pues si a, b ∈ F , entonces la extensión k(a, b)/k es
finita; y ahı́ podemos resolver esas ecuaciones.

Ejercicio
1. Demuestre que el número de clases de equivalencia ante congruencia
para matrices simétricas n × n sobre un campo finito de orden impar
es 2n + 1.

5.3 La Densidad de Jacobson y sus Consecuencias


Sean U y V espacios vectoriales de dimensión no necesariamente finita,
sobre un anillo de división D. En el conjunto S = HomD (U, V ) definimos
una topologı́a decretando que los abiertos básicos sean de la siguiente forma:
Fijamos n ∈ N, n elementos linealmente independientes u1 , ..., un ∈ U ; y
n elementos arbitrarios v1 , ..., vn ∈ V ; entonces O(u1 , ..., un ; v1 , ..., vn ) =
{A ∈ S | A(ui ) = vi , ∀i} es un abierto básico. Ası́, un conjunto abierto es
una unión arbitraria de conjuntos O(u1 , ..., un ; v1 , ..., vn ).
Esta topologı́a hace de S un espacio de Hausdorff. Cuando la dimensión
de U es finita, la topologı́a es discreta. Nos interesa saber cuándo un sub-
conjunto S0 ⊆ S es denso en S.
(1) Si dim U < ∞, S0 es denso en S exactamente cuando S = S0 .
(2) En general, S0 es denso en S cuando S0 es n-transitivo para todo
n ∈ N, es decir, cuando dados {u1 , ..., un } ⊆ U linealmente independiente
y elementos v1 , ..., vn ∈ V , exista L ∈ S0 tal que L(ui ) = vi , para todo i.
Ejemplo. El conjunto HomF D (U, V ) de funciones lineales de rango finito,
es siempre denso en HomD (U, V ).
Sean U un grupo abeliano y R un subanillo del anillo de endomorfismos
de U . Recordemos que un R-módulo M 6= 0 es simple o irreducible cuando
sus únicos submódulos son M y 0. El Lema de Schur, p. 84, afirma que
D = EndR U es un anillo de división, si U es irreducible como R-módulo.

Lema 5.10 Sean M 6= 0 un R-módulo irreducible y 0 6= a ∈ M , entonces


Ra = M .

Demostración: Como Ra es un submódulo de M , es suficiente notar que


Ra 6= 0.
5.3 La Densidad de Jacobson y sus Consecuencias 229

Teorema 5.11 (de la Densidad de Jacobson) Sean U un grupo abe-


liano aditivo y R un anillo de endomorfismos de U . Supongamos que U
es irreducible como R-módulo y que D es el anillo de división EndR U ,
entonces R es denso en EndD U .
Demostración: El lema afirma que R es 1-transitivo. Sabiendo esto, de-
mostraremos que
(*) Dado {u1 , ..., un } ⊆ U linealmente independiente, existe r ∈ R tal que
ru1 = · · · = run−1 = 0; con run 6= 0.
Procedemos por inducción en n, donde el caso n = 1 es la 1-transitividad
de R. Ası́, suponemos que n ≥ 2 y que (*) es cierta para n − 1.
Sea I = {r ∈ R | ru1 = · · · = run−2 = 0}. Este es un ideal izquierdo de
R. La hipótesis inductiva afirma que Iun−1 6= 0; pero entonces existe i ∈ I
tal que iun−1 6= 0, por lo que Iun−1 ⊇ Riun−1 = U . Ası́, Iun−1 = U .
Supongamos que (*) es falsa. Esto significa que para i ∈ I, se tiene

(iun−1 = 0) ⇒ (iun = 0),

lo cual nos permite definir T ∈ End U como sigue: Para u = iun−1 con
i ∈ I, escribimos T (u) = iun . Ahora afirmamos que T ∈ EndR U .
Si r ∈ R y u ∈ U es tal que u = jun−1 con j ∈ I, entonces

rT (u) = rT (jun−1 ) = r(jun ) = (rj)un = T (rjun−1 ) = T (ru),

por lo que T ∈ EndR U ; y T resulta ser multiplicación por un escalar α ∈ D.


Por tanto, si i ∈ I, tenemos que iun = T (iun−1 ) = iαun−1 ; de manera
que I anula al vector un − αun−1 , que es linealmente independiente de
{u1 , ..., un−2 }, contradiciendo la hipótesis inductiva y demostrando (*).
Sabiendo (*), dados {a1 , ..., an } linealmente independiente y b1 , ..., bn
arbitrarios, existen ri ∈ R tales que ri aj = δij bj , pues por ejemplo existe
r ∈ R tal que ra1 = · · · = ran−1 = 0, ran 6= 0; y entonces existe s ∈ R con
sran = bn , además de que sra1 = · · · = sran−1 = 0.
Ası́, (r1 + · · · + rn )(ai ) = bi , para i = 1, ..., n.
Se dice que un anillo satisface la condición descendente en ideales izquier-
dos cuando toda cadena estrictamente descendente de ideales izquierdos es
finita. Esto es equivalente a exigir que todo conjunto no vacı́o de ideales
izquierdos tenga un mı́nimo.
Ejemplo. Si Dn es el álgebra de matrices n × n sobre un anillo de división
D, entonces es claro que Dn satisface la condición descendente en ideales
izquierdos, pues estos son subespacios vectoriales. Es fácil ver que Dn es
también un anillo simple.
Un R-módulo M es fiel cuando rM = 0 implica r = 0, para r ∈ R.
Teorema 5.12 (Wedderburn-Artin) Sea R un anillo simple que satis-
face la condición descendente en ideales izquierdos, entonces R ∼
= Dn , para
un anillo de división D.
230 5. Temas Complementarios

Demostración: Sea U 6= 0 un ideal izquierdo mı́nimo de R. Como el ideal


I = {r ∈ R | rU = 0} de R es bilateral, vemos que I = 0, por lo que U es
un R-módulo fiel. Ası́, R es un anillo de endomorfismos de U .
El R-módulo U es irreducible, pues todo submódulo propio de U es un
ideal izquierdo de R contenido propiamente en U .
Sea D el anillo de división EndR U . Tenemos que R es denso en EndD U .
Afirmamos que dimD U es finita. Si B = {u1 , u2 , ...} ⊆ U es linealmente
independiente sobre D, entonces los ideales izquierdos Im = an(u1 , ..., um )
de R forman una cadena estrictamente descendente, por la densidad de
R en EndD U . Concluimos que B es finito, que dimD U es finita; y que
R = EndD U ∼ = Dn , para algún n.
Corolario 5.13 Sea A un álgebra simple de dimensión finita sobre un
campo algebraicamente cerrado k. Entonces A ∼
= kn para algún n.
Demostración: Como los ideales izquierdos de A son subespacios vecto-
riales, vemos que A satisface la condición descendente en ideales izquierdos.
Entonces A ∼ = Dn para algún n y un anillo de división D con dimk D < ∞,
pues dimk A < ∞. Si a ∈ D, entonces k(a)/k es una extensión finita de
campos, por lo que a ∈ k. Ası́ tenemos que D = k.
Un subconjunto S ⊆ EndD U actúa irreduciblemente en U cuando los
únicos subespacios W de U tales que SW ⊆ W son 0 y U .
Lema 5.14 Sea U un espacio vectorial de dimensión finita sobre un campo
algebraicamente cerrado k y sea S un subálgebra de Endk U que actúa i-
rreduciblemente. Entonces todo elemento de Endk U que conmuta con los
elementos de S es un escalar.
Demostración: Sea T ∈ Endk U tal que conmuta con los elementos de S
y sea α ∈ k un valor caracterı́stico de T . Entonces T − α también conmuta
con los elementos de S.
Sea W = ker(T − α). Afirmamos que W es invariante ante S: Si u ∈ W
y L ∈ S, entonces el cálculo
(T − α)(Lu) = T Lu − αLu = LT u − Lαu = Lαu − Lαu = 0
demuestra que Lu ∈ W . Ası́, W = U ; y por tanto, T = α.
Teorema 5.15 (Burnside) Sea A un álgebra de transformaciones linea-
les de un espacio vectorial U de dimensión finita sobre un campo algebraica-
mente cerrado k. Si A actúa irreduciblemente, entonces A = Endk U .
Demostración: Por el Teorema de la Densidad, A = EndD U , donde D
es el centralizador de EndA U . Por el lema, D = k.

Ejercicios
1. Sea V un espacio vectorial de dimensión finita sobre un anillo de
división D. Demuestre que EndD V es un anillo simple que satisface
la condición descendente en ideales izquierdos.
5.4 Semisimplicidad 231

2. Sea R un anillo doblemente transitivo de transformaciones lineales en


un espacio vectorial V sobre un anillo de división D. Demuestre que
(a) R es denso en EndD V .
(b) EndR V = D.
(Sugerencia: Demuestre primero (b): Si existe alguna transformación
T ∈ (EndR V )rD, entonces también existe 0 6= v ∈ V tal que {v, T v}
es linealmente independiente, por lo que podremos encontrar S ∈ R
con Sv = 0 y ST v = v; pero entonces 0 6= v = ST v = T Sv = 0).
3. Demuestre las siguientes afirmaciones que incluyen un Teorema de
Kolchin (b).
a) Sean k un campo, V 6= (0) un espacio vectorial de dimensión finita
y G < GL(V ) que consiste de elementos unipotentes. Entonces existe
un vector caracterı́stico v común para los elementos de G, esto es
x(v) = v, para todo x ∈ G.
Un grupo, como G, que consiste de elementos unipotentes se llama
unipotente.
b) Todo grupo unipotente estabiliza una bandera y es triangulable.
c) Todo grupo unipotente es nilpotente.
Para demostrar a) se ofrecen las siguientes sugerencias:
d) Redúzcase al caso en que k es algebraicamente cerrado, pues se
trata de resolver sistemas de ecuaciones lineales.
e) Redúzcase al caso en que V es un k[G]-módulo irreducible.
f ) Observe que para todos x, y ∈ G, se tiene dim V = tr(xy) = tr(y).
De manera que para toda n ∈ End V con x = 1+n, para algún x ∈ G,
se tiene que tr(y) + tr(ny) = tr(xy) = tr(y) implica tr(ny) = 0 para
todo n de la forma anterior y todo y ∈ G.
g) Invoque el Teorema de Burnside para obtener tr(ny) = 0 para todo
n de la forma anterior y todo y ∈ End V . Deduzca que n = 0 y que
x = 1.

5.4 Semisimplicidad
Fijemos un anillo asociativo R y consideremos módulos izquierdos sobre R.
Proposición 5.16 Sea M un R-módulo. Las siguientes condiciones son
equivalentes:
1. M es suma de módulos simples.
2. M es suma directa de módulos simples.
3. Si L
E es un submódulo de M , entonces existe un submódulo P tal que
M =E P.
232 5. Temas Complementarios
P
Demostración: 1 ⇒ 2 : Supongamos que M = i∈I Mi , con P
todo Mi
simple. Sea J un subconjunto máximo de I tal que la suma N = j∈J Mj
sea directa. Afirmamos que N = M . Es suficiente ver que para todo i ∈ I,
se tiene Mi ⊆ N ; pero Mi ∩ N es 0 ó Mi . Como Mi ∩ N = 0 implica que
J no es máximo, se obtiene Mi ∩ N = Mi , es decir, Mi ⊆ N .
2 ⇒ 3 : Dado un submódulo E de` M , consideramos a J, un subconjunto
máximo de I tal que la suma ` E + j∈J Mj sea directa. El razonamiento
anterior demuestra que E + j∈J Mj = M .
3 ⇒ 1 : Primero veremos que todo submódulo N 6= 0 de M contiene
algún submódulo simple. A partir de un elemento 0 6= a ∈ N , conside-
ramos al ideal izquierdo I = an a de R. Tenemos que 0 6= Ra ∼ = R/I
como R-módulos. Sea m un ideal izquierdo máximo de R que contenga a
I, entonces ma es un submódulo máximo de Ra. Por hipótesis, existe un
submódulo P tal que M = ma ⊕ P , por lo que Ra = ma ⊕ (P ∩ Ra). En
estas condiciones, el módulo P ∩ Ra es simple y está contenido en N .
Sea E la suma de todos los submódulos simples de M . Afirmamos que
E = M . Pues de no ser ası́, existirı́a un submódulo L 6= 0 con M =
E ⊕ L; pero entonces L contendrı́a un submódulo simple ajeno a E. Esta
contradicción concluye la demostración.
Se dice que un R-módulo M es semisimple cuando satisface las condi-
ciones de la proposición.

Proposición 5.17 Todo submódulo y todo cociente de un módulo semisim-


ple M , son semisimples.

Demostración: Dado un submódulo N , sea E la suma de sus submódulos


simples. Suponiendo E 6= N , existe un submódulo L 6= 0 de M tal que
M = E ⊕ L; pero entonces N = E ⊕ (L ∩ N ); y L contiene un submódulo
simple de N ajeno a E. Esta contradicción demuestra la primera afirmación.
En cuanto a los cocientes, escribimos M = N ⊕ P , donde sabemos que P
es la suma de sus submódulos simples. Ası́, M/N ∼= P es semisimple.
Se dice que un anillo R es semisimple cuando lo es como R-módulo. El
siguiente resultado es inmediato.

Corolario 5.18 Si R es un anillo semisimple, entonces todo R-módulo es


semisimple.

Se dice que un ideal izquierdo I de un anillo R es simple cuando lo


es como R-módulo. Dos ideales izquierdos I, J de un anillo R se dicen
isomorfos cuando lo son como R-módulos.
A partir de un anillo semisimple R, consideramos una colección de ideales
izquierdos {Ei }i∈I que contenga exactamente un representante para cada
clase de isomorfismo de ideales simples de R.

Teorema 5.19 Sea R un anillo semisimple. Entonces:


a) El número n de ideales simples de R no isomorfos entre sı́ es finito.
5.4 Semisimplicidad 233

b) Si Ri es la suma de los ideales izquierdos de R isomorfos a Ei , cada


Ri es un ideal bilateral de R y es un anillo cuyas operaciones son inducidas
por las deQ R.
c) R ∼ = i Ri .
d) Si ei es la identidad multiplicativa de Ri , para i = 1, ..., n; entonces
{e1 , ..., en } es una colección de idempotentes ortogonales con suma 1.

Demostración: Observemos primero que si M es un R-módulo simple,


entonces para cada i se tiene que, ó bien Ei ∼
= M , ó bien Ei M = 0. Esto es
cierto porque Ei M es un submódulo de M ; y Ei M = M ⇒ Ei a = M para
cualquier a ∈ M tal que Ei a 6= 0, que a su vez da origen al isomorfismo
Ei → M dado por t 7→ ta.
Sea Ri la suma de losPideales izquierdos simples de R isomorfos con Ei .
Es inmediato que R = i∈I Ri y que i 6= j ⇒ Ri Rj = 0. En vista de esto
y de que para cada i, Ri es un ideal izquierdo, se tiene que

Ri ⊆ Ri R ⊆ Ri Ri ⊆ Ri ,

lo que demuestra que todo Ri es un ideal bilateral.


b) y d) Escribiendo 1 = e1 + · · · + en , con 0 6= ei ∈ Ri , para todo i, es
inmediato que ei ej = δij ei . Esto significa que {e1 , ..., en } es una colección de
idempotentes ortogonales con suma 1; y que ei es la identidad multiplicativa
del anillo Ri , cuyas operaciones son las inducidas por R.
a) Para cada r ∈ R se tiene que r = re1 + · · · + ren y que rei ∈ Ri , lo
que demuestra que el conjunto de ı́ndices I = {1, ..., n} es P finito.
c) Como QRi Rj = 0 para i 6= j, tenemos que a suma R = i Ri es directa
y que R = i Ri .

Teorema 5.20 Sean R semisimple y M 6= 0 un R-módulo. Entonces


n
a
M= Ri M,
i=1

con cada Ri M la suma de los submódulos simples de M isomorfos con Ei .

Demostración: Por el Corolario 5.18, M es semisimple. Ası́ sabemos


` que
M es la suma de sus submódulos simples; por tanto, M = RM = i Ri M ,
con cada Ri M como en el enunciado.
Teorema 5.21 Sean k un anillo de división, V un espacio vectorial de
dimensión finita sobre k y R = Endk V . Entonces
a) R es semisimple y todos sus módulos simples son isomorfismos.
b) V es un R-módulo simple.
Demostración: b) V es simple porque R actúa transitivamente en V r{0}.
a) A partir de una base {u1 , ..., un } de V , obtenemos un isomorfismo de
R-módulos ϕ : R → V n ası́: ϕ(T ) = (T u1 , ..., T un ). Ası́, el R-módulo R es
234 5. Temas Complementarios

una suma (directa)


Q de R-módulos simples isomorfos y es semisimple. En la
expresión R ∼
= i Ri del Teorema 5.19, hay solamente un factor, porque R
no tiene ideales bilaterales no triviales.

Ejercicios
1. Sean V un espacio vectorial de dimensión finita sobre un campo alge-
braicamente cerrado k y A ∈ Endk V . Demuestre que k[A] es un anillo
semisimple si y sólo si A es una transformación lineal semisimple.

2. Demuestre el Teorema de Maschke: Sean G un grupo de orden n y k


un campo tal que (caract k) - n, entonces el álgebra de grupo k[G] es
semisimple.
(Sugerencia: Demuestre que dados un k[G]-módulo E y un k[G]-
submódulo F , entonces existe un k[G]-submódulo H de E tal que
E = F ⊕ H. A partir de la proyección lineal π : E → F , considere la
transformación dada por
1 X −1
ϕ(x) = g · (π(g · x)).)
n
g∈G

3. Demuestre que si R es un anillo que satisface la condición descen-


dente en ideales izquierdos, entonces todo conjunto no vacı́o de ideales
izquierdos contiene un elemento mı́nimo.

4. Demuestre que si R es un anillo que satisface la condición descen-


dente en ideales izquierdos, entonces R es semisimple si y sólo si la
intersección de todos sus ideales izquierdos máximos es cero.

5. Sea R un anillo conmutativo semisimple que satisface la condición


descendente en ideales. Demuestre que R es isomorfo con un producto
directo finito de campos.

5.5 Algebras de Clifford


Sea V un espacio vectorial de dimensión n sobre un campo k con caract 6= 2.
Supongamos que V tiene una forma cuadrática q : V → k. Esto es,
X
q(v) = aij vi vj , con aij ∈ k, si v = (v1 , ..., vn ).
i≤j

Observemos que entonces, la función B : V × V → k, definida como


B(x, y) = q(x + y) − q(x) − q(y) es una forma simétrica bilineal tal que
q(x) = 21 B(x, x).
5.5 Algebras de Clifford 235

El álgebra de Clifford C = C(V ) = C(V, q) de la forma q es un álgebra


asociativo con unidad sobre k, junto con una función lineal f : V → C tal
que f (v)2 = q(v) para todo v ∈ V ; y que es universal con respecto a estas
propiedades. Esto quiere decir que dados un álgebra asociativo C 0 y una
función lineal f 0 : V → C 0 tal que f 0 (v)2 = q(v) para todo v ∈ V , existe
un único morfismo de álgebras h : C → C 0 tal que f 0 = h ◦ f , es decir, que
hace conmutativo al diagrama

f
V A /C
AA
AA
f0
AA h
à ²
C0

Unicidad: A partir de la definición, es claro que C es único, módulo


isomorfismos de k-álgebras.
La imagen f (V ) genera a C: Sea C 0 el subálgebra generado por f (V ).
Consideramos al morfismo inclusión h0 : C 0 → C, entonces existe un único
morfismo h : C → C 0 que hace conmutativo al diagrama

f
V A /C
AA O
AA h h0
f 0 =f
AA
à ²
C0

pero h0 ◦ h es la identidad en C, ya que f = (h0 ◦ h) ◦ f , por lo que h0 es


suprayectivo y C 0 = C.
Existencia: Consideremos todas las parejas de álgebras asociativos Ci
y funciones lineales fi : V → Ci , donde fi (V ) genere a Ci y donde fi (v)2 =
q(v), para todo v ∈ V . Elijamos una pareja para cada clase de isomorfismo.
Ası́ obtenemos unQ conjunto ı́ndice I.
Sea f : V → i∈I Ci dado por f (v)i = fi (v). Entonces el subálgebra C
generado por f (V ) cumple la condición universal de la definición.
En el Problema 2 se exhibe un morfismo inyectivo de espacios vectoriales
ψ : V → A, tal que ψ 2 (v) = q(v) · 1, para todo v ∈ V ; y tal que A es un
álgebra asociativo con uno.
Una involución es un automorfismo de orden dos.
Lema 5.22 Existe una única involución i de C tal que i[f (v)] = −f (v).
Proposición 5.23 Para cada w∗ ∈ V ∗ , existe una i-derivación
d = dw∗ : C → C tal que
a) d es lineal.
b) d(1) = 0.
c) d[f (v)] = w∗ (v), para todo v ∈ V .
d) d(cc0 ) = d(c)c0 + i(c)d(c0 ), para todos c, c0 ∈ C.
236 5. Temas Complementarios

Demostración: Inventamos un sı́mbolo nuevo u, para construir el álgebra


de polinomios C[u]; pero definimos en ellos la multiplicación
X X X
( aj uj )( br ur ) = aj ij (br )uj+r ,
j r j,r

que es asociativa. De manera que tenemos un álgebra de polinomios


torcidos C[u], que da origen a los números duales torcidos C[u]/(u2 ),
cuyos elementos son de forma a + bu con a, b ∈ C.
Para cada v ∈ V , consideramos al elemento f (v) + w∗ (v)u ∈ C[u]; y
definimos una función lineal f 0 : V → C[u]/(u2 ) ası́:

f 0 (v) = f (v) + w∗ (v)u (mod u2 ),

que satisface f 0 (v)2 = f (v)2 + {w∗ (v)i[f (v)] + w∗ (v)f (v)}u = f (v)2 = q(v).
Ası́, existe un único morfismo h que hace conmutativo al diagrama

f
V II /C
II
II
I h
f 0 II$ ²
C[u]/(u2 )

Pero la proyección h0 : C[u]/(u2 ) → C es tal que h0 ◦ h es la identidad en


C, como puede verificarse en f (V ). Obtenemos que h(c) = c + d(c)u para
cierta función lineal d : C → C tal que d[f (v)] = w∗ (v). De la igualdad
h(cc0 ) = h(c)h(c0 ) se deducen las condiciones restantes b) y d).
Teorema 5.24 Sea {v1 , ..., vn } una base de V . Entonces el siguiente con-
junto es una base de C:

{f (vi1 )f (vi2 ) · · · f (vir ) | 1 ≤ i1 < i2 < · · · < ir ≤ n; 0 ≤ r ≤ n}.

Demostración: Como f (V ) genera a C, todo c ∈ C es una combinación


lineal de productos f (vi1 )f (vi2 ) · · · f (vir ).
Si i > j, entonces f (vi )f (vj )+f (vj )f (vi ) = f (vi +vj )2 −f (vi )2 −f (vj )2 =
2B(vi , vj ), por lo que f (vi )f (vj ) = 2B(vi , vj ) − f (vj )f (vi ); y todo c ∈ C
es una combinación lineal de elementos de nuestro conjunto, es decir, de
aquellos
P f (vi1 )f (vi2 ) · · · f (vir ) con i1 < i2 < · · · < ir .
Si i1 <···<ir ai1 ···ir f (vi1 ) · · · f (vir ) = 0, entonces
" #
X
0 = (dvi∗r ◦ · · · ◦ dvi∗ ) ai1 ···ir f (vi1 ) · · · f (vir ) = ai1 ···ir ;
1
i1 <···<ir

y nuestro conjunto es linealmente independiente.


Corolario 5.25 El morfismo f : V → C es inyectivo.
5.5 Algebras de Clifford 237

Ası́, de ahora en adelante, identificamos a V con f (V ).

Corolario 5.26 Si dim V = n, entonces dim C = 2n .

Corolario 5.27 Sean V y V 0 espacios vectoriales provistos de formas bi-


lineales B y B 0 respectivamente. Si f : V → V 0 es una función lineal tal
que B 0 (f (u), f (v)) = B(u, v) para todos u, v ∈ V , entonces f se extiende a
un único morfismo de álgebras f : C → C 0 . Si f es inyectivo (suprayectivo,
biyectivo o es un automorfismo), entonces su extensión a C también lo es.
En particular, si V es un subespacio de V 0 , entonces C(V ) es un subálgebra
de C(V 0 ).

Ejemplos.

1. Cuando q(v) = 0 para todo v ∈ V , tenemos que C(V ) = ∼ V V . Si


además dim V = 1, entonces C(V ) consiste de elementos a + bv con
a, b ∈ k, donde v 2 = 0. Estos son los números duales.

2. Cuando dim V = 1 y q es no degenerada, C(V ) tiene base {1, v}, con


v 2 = a ∈ k. Distinguimos dos casos.

Caso 1: a ∈/ k 2 . Aquı́, C(V ) = k( a).
Caso 2: a ∈ k 2 . Cambiando de base, se puede tener v 2 = 1.
Usando caract k 6= 2, vemos que (1/2)(1 + v) y (1/2)(1 − v) vienen
a ser idempotentes ortogonales con suma uno, por lo que C(V ) =
k((1/2)(1 + v)) ⊕ k((1/2)(1 − v)). Ası́, C(V ) ∼ = k ⊕ k. Cuando la
caracterı́stica es 2, entonces {1, 1+v} es una base de C(V ) y (1+v)2 =
0, de manera que C(V ) se identifica otra vez con los números duales.

3. Cuando dim V = 2 y también caract k 6= 2, entonces podemos escribir


q(xu + yv) = ax2 + by 2 , para una base ortogonal {u, v} de V con
q(u) = a, q(v) = b. Supongamos que q es no degenerada, de manera
que ab 6= 0. Aquı́, {1, u, v, uv} es una base de C(V ) con uv = −vu, que
nos permite identificar a C(V ) con los cuaternios generalizados:

α = p + qu + rv + suv, α = p − qu − rv − suv
αα = p2 − aq 2 − br2 + abs2 .

El caso clásico ocurre cuando a = b = −1 y k = R, siendo la forma


q(w) = −x2 − y 2 para w = (x, y).

4. El caso clásico de álgebras de Clifford con dim V = n, se da cuando


k = R y q es negativa definida.

Se dice que un k-álgebra es simple central cuando no tiene ideales


bilaterales y su centro es k. Si D es un anillo de división, Dn denota el
álgebra de matrices n × n sobre D.
238 5. Temas Complementarios

Proposición 5.28 Sea V un espacio vectorial de dimensión dos, provisto


de una forma cuadrática no degenerada. Entonces el álgebra de cuaternios
generalizados C(V ) es simple central.

Demostración: Sabemos que C(V ) tiene una base {1, u, v, uv} que satis-
face u2 = a, v 2 = b y uv = −vu. Supongamos que p, q, r, s ∈ k son tales
que α = p + qu + rv + suv está en el centro de C(V ).
Calculamos: uα = qa + pu + sav + ruv, αu = qa + pu − sav − ruv. Esto
implica r = s = 0. Después calculamos vα = pv − quv, αv = pv + quv.
Esto implica q = 0. Ası́, α ∈ 1 · k.
Sea I un ideal bilateral de C(V ) y sea α = p+qu+rv +suv ∈ I. Entonces
β = uα + αu = 2(qa + pu) ∈ I y también vβ + βv = 4qav ∈ I, que a su vez
implica que 4qav 2 = 4qab ∈ I. Ası́, q = 0. De manera análoga, se puede
obtener que r = s = 0, forzando entonces a que p = 0; y a que α = 0. Ası́,
I = 0.
Proposición 5.29 Sea V un espacio vectorial de dimensión dos, provisto
de una forma cuadrática no degenerada. Entonces el álgebra de cuaternios
generalizados C(V ) es un anillo de división o bien es isomorfo con el álgebra
de matrices 2 × 2 sobre k.
Demostración: Si la forma αα = p2 − aq 2 − br2 + abs2 del Ejemplo 3
representa a cero solamente de manera trivial, entonces C(V ) es un anillo
de división:
1
α 6= 0 ⇒ α−1 = α.
αα
Si C(V ) no es un anillo de división, entonces como C(V ) es simple central
y satisface la condición descendente en ideales izquierdos, por el Teorema
de Wedderburn tenemos que C(V ) ∼ = Dm , para un anillo de división D que
es un álgebra sobre k. Como dimk C(V ) = 4 y C(V ) 6= D, se tiene que
D = k y que m = 2. Ası́, C(V ) ∼ = k2 .
Cuando el campo k es suficientemente grande, por ejemplo, cuando k
es algebraicamente cerrado, siempre es posible conseguir que la forma αα
del Ejemplo 3 represente a cero de manera no trivial, extrayendo una raı́z
cuadrada adecuada. Por lo que en este caso, C(V ) ∼ = k2 .
Se dice que V es un plano hiperbólico cuando dim V = 2 y V es
isotrópico con una forma cuadrática no degenerada.

Proposición 5.30 Todo plano hiperbólico V tiene una base {u, v} tal que
q(u) = q(v) = 0 y que (u, v) = 1.

Demostración: Sea 0 6= u ∈ V isotrópico, esto es, q(u) = 21 (u, u) = 0.


Como el producto interno no es degenerado, existe w ∈ V tal que (u, w) = 1,
entonces el vector v = −q(w)u + w satisface q(v) = 0 y (u, v) = 1.
Ejemplo. El álgebra de Clifford C(V ) de un plano hiperbólico admite una
base {1, u, v, uv} tal que u2 = v 2 = 0 y que uv + vu = 1, al encontrar u, v
5.5 Algebras de Clifford 239

isotrópicos con (u, v) = 21 ; pero {u, v, uv, vu} resulta ser una mejor base,
ya que exhibe a C(V ) como el álgebra de matrices 2 × 2 sobre k ası́:

e11 = uv e12 = u
e21 = v e22 = vu
Esto es porque e11 e12 = uvu = u(1 − uv) = u − u2 v = u = e12 , etc.
Supongamos ahora que el espacio vectorial V tiene una base ortogonal
..., vn }; y que en C(V ) se tiene vi2 = ai ∈ k ? , para 1 ≤ i ≤ n, de manera
{v1 , Q
n
que 1 ai = ∆ es el discriminante de la forma.

Teorema 5.31 Si n es par, entonces el centro Z de C(V ) es k. Si n es


impar, entonces dimk Z = 2 y Z está generado por {1, v1 v2 · · · vn }. En este
último caso,
½
k ⊕ k, si (−1)n(n−1)/2 ∆ ∈ k 2
Z∼
= p
k( (−1)n(n−1)/2 ∆), en caso contrario

Demostración: Observamos que conjugación con vi deja fijo a cualquier


monomio de C(V ), o lo envı́a a su negativo. Por tanto, Z es el espacio
vectorial generado por los monomios de C(V ) que conmutan con todo vi .
Al calcular vi (vi1 vi2 · · · vir )vi−1 , el factor izquierdo vi produce un número
de cambios de signo al brincar hacia la derecha para ocupar su posición,
mientras que el factor derecho vi−1 produce otro número de cambios de
signo al brincar hacia la izquierda hasta ocupar la suya.
Por tanto, cuando r es par, vi1 vi2 · · · vir conmuta con todo vi que no
ocurre entre los vij ; y anticonmuta con los vi que sı́ ocurren entre los vij .
Cuando r es impar, la situación es al revés. La conclusión es la del enun-
ciado.

Teorema 5.32 Sea V un espacio vectorial con una forma q no degenerada


tal que n = dim V ≥ 3 y sea U un subespacio de dimensión dos, donde la
restricción q0 de q es no degenerada. Escribimos V = U ⊕ U ⊥ ; y q1 la
restricción de q a U ⊥ . Entonces

C(V, q) ∼
= C(U, q0 ) ⊗ C(U ⊥ , −δq1 ),

donde δ es el discriminante de q0 .

Demostración: La inyección canónica U ,→ V da origen a una inyección


f : C(U, q0 ) ,→ C(V, q).
Sea {u, v} una base ortogonal de U , entonces d = 2uv ∈ C(U, q0 ) satisface
d2 = −4q(u)q(v) = −B(u, u)B(v, v) = −δ. La inyección canónica U ⊥ ,→ V
da origen a una inyección C(U ⊥ , q1 ) ,→ C(V, q), que a su vez da origen a
un morfismo g : C(U ⊥ , −δq1 ) ,→ C(V, q), que envı́a a cualquier elemento
z ∈ U ⊥ ⊆ C(U ⊥ , −δq1 ) al producto dz, pues (dz)2 = −δq(z).
240 5. Temas Complementarios

Como y(dz) = (dz)y, para todos y ∈ U, z ∈ U ⊥ , vemos que f (U ) centra-


liza a g(U ⊥ ). Ası́, gracias a la propiedad universal del producto tensorial,
obtenemos un morfismo ϕ : C(U, q0 ) ⊗ C(U ⊥ , −δq1 ) → C(V, q) a partir de
f y g. Aquı́, ϕ(y ⊗ 1 + 1 ⊗ z) = y + dz, para y ∈ U, z ∈ U ⊥ .
La igualdad d2 = −δ demuestra que d es invertible en C(U, q0 ). Por
otra parte, yd = −dy en C(U, q0 ), para todo y ∈ U . Dados y ∈ U, z ∈ U ⊥ ,
consideramos al elemento w = (y ⊗1)+(d−1 ⊗z) ∈ C(U, q0 )⊗C(U ⊥ , −δq1 );
y calculamos:

w2 = (q(y) ⊗ 1) + (yd−1 + d−1 y) ⊗ z + (1 ⊗ q(z)) = q(y) + q(z) = q(y + z).

La propiedad universal de C(V, q) produce el morfismo ψ : C(V, q) →


C(U, q0 ) ⊗ C(U ⊥ , −δq1 ) tal que ψ(y + z) = (y ⊗ 1) + (d−1 ⊗ z), para
y ∈ U, z ∈ U ⊥ .
Tenemos que ϕ ◦ ψ y ψ ◦ ϕ son los morfismos identidad en C(V, q) y en
C(U, q0 ) ⊗ C(U ⊥ , −δq1 ) respectivamente, como se ve al evaluarlos en sus
generadores.
Dado un álgebra de Clifford C(V ), definimos C + (V ) como el subálgebra
de C(V ) generado por los elementos de grado par.
Proposición 5.33 a) C + (V ) es un álgebra de Clifford sobre un espacio
de dimensión dim V − 1.
b) Si dim V = n es impar, entonces C(V ) ∼= C + (V ) ⊗ Z, donde Z es el
centro de C(V ).
Demostración: a): Sea {u1 , ..., un } una base ortogonal de V que satisface
u21 = a1 , ..., u2n = an en C(V ). Sean v1 = u1 un , ..., vn−1 = un−1 un , entonces
C + (V ) es el álgebra de Clifford del espacio hv1 , ..., vn−1 i, donde vi y vj
anticonmutan para i 6= j, con v12 = −a1 an , ..., vn−12
= −an−1 an .
b): Esto es claro, pues Z = h1, u1 · · · un i, cuando n es impar.
Teorema 5.34 Sea q una forma cuadrática no degenerada sobre un es-
pacio vectorial V de dimensión n sobre un campo k con caract k 6= 2.
Entonces:
a) Si n es par, C(V ) es un producto tensorial de álgebras de cuaternios.
b) Si n es impar, C(V ) es un producto tensorial del centro con álgebras
de cuaternios.
c) Si n es par y k es algebraicamente cerrado, C(V ) es isomorfo a un
álgebra de matrices.
d) Si n es impar y k es algebraicamente cerrado, C(V ) es isomorfo a la
suma directa de dos álgebras de matrices de la misma dimensión.
Demostración: Procedemos por inducción en n. Cuando n = 1, b) y d) se
obtienen del Ejemplo 2; mientras que cuando n = 2, el Ejemplo 3 muestra
que C(V ) es un álgebra de cuaternios; y la Proposición 5.29 afirma que
C(V ) es un álgebra de matrices para k algebraicamente cerrado, por lo que
se tienen a) y c).
5.6 Teoremas de Frobenius y de Hurwitz 241

Supongamos que n > 2. Aquı́ podemos elegir un subespacio U de di-


mensión dos, donde la restricción q0 de q sea no degenerada. Entonces
V = U ⊕ U ⊥ y la restricción q1 de q a U ⊥ también es no degenerada.
Por el Teorema 5.32, C(V, q) ∼ = C(U, q0 ) ⊗ C(U ⊥ , −δq1 ), donde δ es el dis-
criminante de q0 . Sabemos que C(U, q0 ) es un álgebra de cuaternios, por
lo que la hipótesis inductiva aplicada a C(U ⊥ , −δq1 ) nos permite obtener
a). Si k es algebraicamente cerrado, c) es consecuencia de que un producto
tensorial de álgebras de matrices también es un álgebra de matrices.
Ahora, b) es consecuencia de a) y de la Proposición 5.33; mientras que
d) se obtiene de c) y de las Proposiciones 4.5.4 y 5.33.

Ejercicios
1. Demuestre que si i es la involución del Lema 5.22 y si d es cualquier
i-derivación de la Proposición 5.23, entonces d ◦ i + i ◦ d = 0 y d2 = 0.

2. Sea V un espacio vectorial de dimensión finita sobre un campo k


con caract kV6= 2, provisto de una forma cuadrática q : V → k. Sea
A = Endk ( V ).

• Observe que A es un álgebra asociativo.


V V
• Para cada v ∈ V
V , defina `v : V → V ası́: `v (w) = v ∧ w,
para todo w ∈ V . Observe que `v ∈ A y que `2v = 0.
• Para cada v ∈ V , defina gv ∈ V ∗ ası́: gv (u) = B(v, u), para
todo u ∈ V , donde B es la forma bilineal asociada a q. Sea dv
la antiderivación de la Proposición 5.23 correspondiente a gv .
Observe que dv ∈ A y que d2v = 0.
• Para cada v ∈ V , defina ψ(v) = `v + dv . Observe que ψ(v) ∈ A.
Demuestre que ψ(v)2 = q(v) · 1 y que ψ : V → A es inyectivo.

5.6 Teoremas de Frobenius y de Hurwitz


Concluimos el capı́tulo y el libro con la discusión de dos resultados clásicos,
cuyas demostraciones utilisarán el material que hemos desarrollado en este
capı́tulo.

Teorema 5.35 (Frobenius) Sea A un álgebra de división de dimensión


finita sobre R. Entonces A es isomorfo con alguno de los siguientes objetos:
Los números reales R.
Los números complejos C.
Los cuaternios reales H.

Demostración: Paso 1: El conjunto V = {v ∈ A | v 2 ≤ 0} es un subespacio


vectorial de A de codimensión uno.
242 5. Temas Complementarios

Si dim A = m, dado a ∈ A, consideramos la multiplicación izquierda por


a como la transformación lineal Ta : A → A; ası́ Ta ∈ End A. Como el
morfismo A → End(A) dado por a 7→ Ta es inyectivo, identificamos a con
su imagen Ta . El polinomio caracterı́stico p(X) de a se factoriza como
p(X) = (X − t1 ) · · · (X − tr )(X − z1 )(X − z 1 ) · · · (X − zs )(X − z s ),
donde m = r+2s y cada polinomio X 2 −2(Re zj )X +|zj | = (X −zj )(X −z j )
es irreducible en R[X].
Dado que p(a) = 0 por Cayley-Hamilton y que A es un álgebra de di-
visión, obtenemos que o bien a = ti ∈ R o bien a2 − 2(Re zj )a + |zj | = 0.
En este último caso, escribimos z = zj para tener que el polinomio mı́nimo
de a es X 2 − 2(Re z)X + |z| y que el polinomio caracterı́stico de a es
(X 2 − 2(Re z)X + |z|)k , donde 2k = m.
Cuando a ∈ V , se da esta última situación; y además a es raı́z de un
polinomio cuadrático X 2 + b con b real no negativo. De esto resulta que
a ∈ V si y sólo si Re z = 0, es decir si y sólo si tr Ta = 0, de donde se
obtiene la afirmación.
Paso 2: Conclusión. Dado que A = R ⊕ V , vemos que A = R[V ]. Sea W
un subespacio mı́nimo de V tal que A = R[W ].
Definimos una función simétrica bilineal en W ası́:
1
B(u, v) = − (uv + vu).
2
Como (u + v)2 − u2 − v 2 = uv + vu, resulta que B tiene valores reales.
Además, B(u, u) > 0 para 0 6= u ∈ W , pues u2 ≤ 0, de manera que B es
positiva definida.
Sea {e1 , ..., en } una base ortonormal de W . Esto significa que e2i = −1
y que ei ej = −ej ei para todos i, j. Ası́, el anillo de división A es isomorfo
al álgebra de Clifford C(W ) asociada a una forma cuadrática negativa
definida. Por lo tanto, resultan los siguientes casos:
• Cuando n = 0, se tiene que A ∼
= R.
• Cuando n = 1, se tiene que A ∼
= C.
• Cuando n = 2, se tiene que A ∼
= H.
• Cuando n ≥ 3, el álgebra C(W ) nunca es un anillo de división:
Sea a = e1 e2 en . Aquı́, a2 = 1, de manera que (a + 1)(a − 1) = 1
implicarı́a que a = ±1; y entonces en = ±(e1 e2 )−1 = ±e−12 e1
−1
=
±(−e2 )(−e1 ) = ∓e1 e2 , contradiciendo la independencia lineal de
{e1 e2 , en }.
Teorema 5.36 (Hurwitz) Sea V un espacio vectorial de dimensión n
sobre un campo k de caracterı́stica 6= 2, provisto de una forma cuadrática
no degenerada q : V → k y de una multiplicación bilineal u · v tal que
q(u · v) = q(u)q(v), para todos u, v ∈ V . Entonces n = 1, 2, 4, 8.
5.6 Teoremas de Frobenius y de Hurwitz 243

Demostración: Paso 1: Es posible extender al campo k arbitrariamente,


por lo que suponemos que k es algebraicamente cerrado.
Paso 2: Polarización de v en q(uv) = q(u)q(v) produce

B(uv, uw) = q(u)B(v, w), para todos u, v, w ∈ V,

donde la forma bilineal B es la asociada a q. Esto es porque se tienen

q(uv + uw) = B(uv, uw) + q(uv) + q(uw)


q(u)q(v + w) = q(u)[B(v, w) + q(v) + q(w)]

Paso 3: Gracias al Paso 1, es posible elegir u1 ∈ V tal que q(u1 ) = 1.


Gracias al Paso 2, vemos que `u1 ∈ End V es ortogonal y por tanto es
invertible. Definimos una nueva multiplicación en V ası́:

u ◦ v = `−1
u1 (uv)

Aquı́, u1 ◦ v = v, para todo v ∈ V , es decir, u1 actúa como identidad


izquierda. Escribiremos e en lugar de u1 , omitiremos el signo “◦”; y usare-
mos esta nueva multiplicación, de manera que ahora tenemos una identidad
izquierda e ∈ V con q(e) = 1.
Paso 4: Conclusión. Consideramos al espacio e⊥ , de dimensión n − 1.
Sean x ∈ e⊥ ; y, z ∈ V . Le aplicamos q a la igualdad (e + x)y = y + xy,
para obtener q(e+x)q(y) = q(y)+q(xy)+B(y, xy); pero q(e+x) = 1+q(x),
por lo que obtenemos que B(y, xy) = 0, para todos x ∈ e⊥ , y ∈ V .
Polarizamos en y esta última igualdad, para tener

0 = B(y + z, x(y + z)) = B(y, xy) + B(y, xz) + B(z, xy) + B(z, xz),

de manera que B(y, xz)+B(z, xy) = 0, para todos x ∈ e⊥ ; y, z ∈ V . Ahora


reemplazamos z por xz, para tener B(y, x(xz)) + B(xz, xy) = 0, de donde
obtenemos B(y, x(xz)) + B(y, q(x)z) = 0 ó bien B(y, x(xz) + q(x)z) = 0,
para todos y, z ∈ V . Esto significa que x(xz) + q(x)z = 0, para todo z ∈ V .
Si `x es multiplicación izquierda por x, tenemos que `2x = −q(x), para
todo x ∈ e⊥ . Por tanto, tenemos un morfismo del álgebra de Clifford C =
C(e⊥ , −q) hacia End V , dado por x 7→ `x . Ası́, V es un C-módulo.
Supongamos n impar. Como k es algebraicamente cerrado, el Teorema
5.34c) afirma que C es un álgebra de matrices sobre un espacio W tal que
dim W = 2(n−1)/2 . Por el Teorema 5.21, C es un anillo semisimple y W es
un C-módulo simple. Por el Teorema 5.20, V es una suma directa de copias
de W . Por tanto, n = r2(n−1)/2 . Esto implica que n = 1.
Supongamos n par. Aquı́, C es la suma de dos álgebras de matrices,
cada una sobre un espacio de dimensión 2(n−2)/2 , por el Teorema 5.34.
Nuestra representación ahora es suma de r de copias del primer espacio
más s copias del segundo. Por tanto, n = (r + s)2(n−2)/2 y se tienen la
244 5. Temas Complementarios

siguientes posibilidades:

n=2 r+s=2
n=4 r+s=2
n=6 r + s = 23 eliminada
n=8 r+s=1
n>8 n < 2(n−2)/2 eliminada

Observación. Aunque los álgebras de Clifford son asociativos, a la multi-


plicación bilineal u · v del Teorema de Hurwitz no se le exigió asociatividad,
ni conmutatividad, ni existencia de identidad.

5.7 Ejercicios Generales


1. Un k-superálgebra es un k-álgebra A que admite una Z/2Z gradua-
ción, esto es, una descomposición como suma directa de k espacios
vectoriales A = A0 ⊕ A1 , tal que Ai Aj ⊆ Ai+j , donde los ı́ndices se
suman módulo dos. Si a ∈ Ai r {0}, escribimos gr(a) = i.
a) Defina los conceptos de morfimo graduado de superálgebras y de
superideal.
b) Demuestre que el núcleo de un morfimo graduado de superálgebras
es un superideal y que el cociente de un superálgebra entre un su-
perideal es un superálgebra.

2. Dadas dos k-superálgebras A y B, definimos el superproducto tenso-


b como [(A0 ⊗ B0 ) ⊕ (A1 ⊗ B1 )] ⊕ [(A0 ⊗ B1 ) ⊕ (A1 ⊗ B0 )],
rial A⊗B
con multiplicación (a ⊗ b)(c ⊗ d) = (−1)gr(b) gr(c) ac ⊗ bd.
a) Demuestre que A⊗B b es un superálgebra asociativo.
Definimos el superconmutador {a, b} de dos elementos homogéneos a
y b como ab−(−1)gr(a) gr(b) ba; a y b superconmutan cuando {a, b} = 0.
Dos elementos arbitrarios c y d superconmutan cuando {ci , dj } = 0
para todas las componentes homogéneas ci de c y dj de d.
b) Demuestre que dados dos morfismos graduados de superálgebras
i : A → C y j : B → C tales que i(A) superconmuta con j(B),
entonces tenemos un morfismo graduado inducido de superálgebras
b → C.
asociativos A⊗B

3. Dado un espacio vectorial U provisto de una forma cuadrática q y con


una descomposición ortogonal U = U1 ⊕ U2 , demuestre que existe un
isomorfismo de superálgebras C(U ) ∼ b
= C(U1 )⊗C(U 2 ).
V
4. Demuestre que C(V ⊕ V ∗ ) ∼= End( V ), donde V ⊕ V ∗ tiene la forma
cuadrática standard, es decir, B(u + u∗ , v + v ∗ ) = u∗ (v) + v ∗ (u).
5.8 Enunciados 245

5.8 Enunciados
En esta sección enunciamos una serie de resultados importantes.

Teorema 1 (Burnside) Si p y q son números primos, entonces todo


grupo de orden pa q b es soluble.
Teorema 2 (Feit-Thompson) Todo grupo finito cuyo orden sea impar,
es soluble.
Teorema 3 (Nielsen-Schreier) Todo subgrupo de un grupo libre, es libre.
Teorema 4 (Kronecker-Weber) Sea K una extensión abeliana finita de
Q. Entonces existe una raı́z de la unidad ζ tal que K ⊆ Q[ζ].
Teorema 5 (Cartan-Dieudonné) Si V es un espacio vectorial provisto
de un producto interno y dim V = n, entonces toda transformación ortogo-
nal es un producto de cuando más n simetrı́as.
Teorema 6 (Dirichlet) Sean m y n enteros primos relativos. Entonces
el conjunto de primos p tales que p ≡ m(mod n) es infinito.
Teorema 7 (Lindemann-Weierstrass) a) Si α1 , ..., αn son números al-
gebraicos, linealmente independientes sobre Q, entonces {eα1 , ..., eαn } es
algebraicamente independiente sobre Q.
b) Si α1 , ..., αn son números algebraicos distintos, entonces {eα1 , ..., eαn }
es linealmente independiente sobre Q.
Teorema 8 (Hasse-Minkowski) Dos matrices cuadradas y simétricas
A, B ∈ Mn (Q) son congruentes sobre Q si y sólo si lo son sobre R y sobre
los campos p-ádicos Qp para todo primo p.
Capı́tulo 6
Errata de la versión anterior

• p.14: La condición 3 es superflua.


• p.16 lı́nea - 6: Sea A = {(x1 , ..., xp ) ∈ Gp | x1 · · · xp = 1}.
• p.30 Ejercicio 3: Sean k un campo arbitrario y G = GLn (k) el grupo
multiplicativo de las matrices invertibles n × n con coeficientes en k.
Definimos al grupo B = {[aij ] ∈ G | aij = 0 cuando i > j}, ası́ como
al grupo U = {[aij ] ∈ B | aii = 1 para toda i}. Demuestre que:
a) U C B < G.
b) U = (B, B), suponiendo que n ≥ 2 y que ◦(k) ≥ 4.
c) U es nilpotente.
d) B es soluble.
∼ U n T.
e) B =
• p.40 lı́nea 10:

Zpq = ha | apq = 1i = ha, b | ap = 1, bq = 1, aba−1 b−1 = 1i

• p.42 Teorema 1.77: Sea A un grupo abeliano tal que ...


• p.56 Problema 7:

ei ej = δij ei , e1 + · · · + en = 1.

• p.63 lı́nea 11: Recı́procamente, sea p un ideal primo de R tal que


p ∩ S = ∅. Entonces ϕ−1 (S −1 p) = p, pues (p : s) = p para todo
s ∈ S.
• p.63 lı́nea 15: Ası́, S −1 p es primo.

• p.71 lı́nea 7: Usando la norma N de Q[ −19] ...
• p.74 lı́nea - 13: c(f ) = m.c.d.{a0 , a1 , ..., an }.
• p.83 lı́nea 4: Concluimos que R(f, g) = S.
6. Errata de la versión anterior 247

• p.87 lı́nea 7: ... es nilpotente. Supondremos que nuestros anillos son


conmutativos.

• p.103 lı́nea - 14: b) K es el campo generado por ∪σ σ(F ), ...

• p.112 lı́nea - 15: Por el Lema 3.33, tenemos que [F : k] ≤ ◦(G); pero
[F : k] = ◦(Gal(F/k)) y G ⊆ Gal(F/k) implican que G = Gal(F/k) y
que F/k es una extensión finita.

• p.115
Consideremos la cadena K = K0 ⊆ K1 ⊆ · · · ⊆ Kn−1 = F, donde
Ki = Ki−1 (Ti ), de manera que Ki /Ki−1 es simple con elemento pri-
mitivo Ti , que es raı́z del polinomio

f (X)
fi (X) = ∈ Ki−1 [X],
(X − T1 ) · · · (X − Ti−1 )

que es de grado n − i + 1. Esto implica que [Ki : Ki−1 ] ≤ n − i + 1,


para 1 ≤ i ≤ n − 1. Observe que fi (X) ∈ k[s1 , ..., sn , T1 , ..., Ti−1 ][X].
Como
n−1
Y
(n − i + 1) = n(n − 1) · · · 2 = n! = ◦(Sn ) = [F : K],
i=1

se ve que [Ki : Ki−1 ] = n − i + 1, para 1 ≤ i ≤ n − 1; y que


fi (X) = Polmin(Ti , Ki−1 ).
Dado un polinomio arbitrario p(T1 , ..., Tn ) ∈ R, podemos usar la
relación Tn = s1 − T1 − · · · − Tn−1 , para eliminar Tn en favor de
las otras Ti y de s1 . Después usamos fn−1 (X), que es de grado dos,
2
para eliminar a Tn−1 , expresándolo como polinomio en Tn−1 de grado
≤ 1 con coeficientes en k[s1 , ..., sn , T1 , ..., Tn−2 ]. Continuamos este
proceso hasta expresar a p(T1 , ..., Tn ) como combinación lineal de
los n! monomios T1r1 T2r2 · · · Tnrn , con ri ≤ n − i, para 1 ≤ i ≤ n,
con coeficientes en k[s1 , ..., sn ]. Además, para cada i, el conjunto
{1, Ti , ..., Tin−i } es una base de Ki sobre Ki−1 , por lo que los n!
monomios mencionados forman una base de F sobre K. Esto im-
plica que la expresión de p(T1 , ..., Tn ) indicada, es única. Observe que
en ninguno de estos monomios aparece Tn , por lo que si p(T1 , ..., Tn )
es simétrico, entonces solamente aparece el término constante.

• p.137 lı́nea 7: Sea F/k una extensión finita de Galois ...

• p.138 El penúltimo párrafo debe decir ası́:


La cadena de campos correspondiente: k = F0 ⊆ F1 ⊆ · · · ⊆ Fs = F ,
es tal que cada extensión Fi+1 /Fi es de Galois con grupo cı́clico de
orden pi , por lo que F1 /k es de tipo 1), 2) ó 3). El tipo 2) sólo puede
248 6. Errata de la versión anterior

ocurrir cuando k contenga a las raı́ces p1 -ésimas de la unidad; y la


demostración concluye por inducción. En caso contrario, adjuntamos
una raı́z m-ésima primitiva de la unidad ζ al campo k, donde m =
Q
pi 6=caract pi .

• p.150 La demostración del Teorema 3.78 debe iniciar ası́:


Podemos suponer que n ≥ 3. Gracias a los Teoremas 3.48 y 3.36
que afirman que existen extensiones de Fp de cualquier grado para
cualquier primo p; y que estas son simples, puede verse que exis-
ten f1 (X) ∈ F2 [X] mónico, irreducible de grado n, g2 (X) ∈ F3 [X]
mónico, irreducible de grado n − 1; ası́ como f3 (X) ∈ F5 [X] mónico,
de grado n, con factorización irreducible consistente en un polinomio
cuadrático, junto con uno o dos factores de grado impar. Definimos
f2 (X) = Xg2 (X) y observamos que es posible tener todo fi (X) sep-
arable.
• p.164 lı́nea 10: generado por las expresiones a ⊗ b + b ⊗ a para todos
a ∈ M, b ∈ N ;
Bibliografı́a

[1] Artin, E. Geometric Algebra, John Wiley, 1988.

[2] Artin, M. Algebra, second edition, Birkhäuser, 2003.

[3] Atiyah, M. F. and MacDonald, I. G. Introduction to Commutative


Algebra, Perseus Books, 1994.

[4] Bourbaki, N. Éléments de mathématique. Algèbre, Chapitres 1 à


3, Masson-Dunod, 1970; Chapitres 4 à 7, Masson-Dunod, 1981.
Algebra 1, Springer, 1989; Algebra 2, Springer, 1990.

[5] Burnside, W. Theory of Groups of Finite Order, second edition,


Dover, 1955.

[6] Childs, L. A Concrete Introduction to Higher Algebra, Under-


graduate Texts in Mathematics, second edition, Springer, 1995.

[7] Cox, D. A., Little, J. B. and O’Shea, D. Ideals, Varieties and Algo-
rithms, second edition, Springer, 1997.

[8] Jacobson, N. Basic Algebra I, second edition, W. H. Freeman, 1989;


Basic Algebra II, W. H. Freeman, 1974.

[9] Kempf, G. Algebraic Structures, Friedrich Vieweg, 2003.

[10] Lang, S. Algebra, third revised edition, Graduate Texts in Mathe-


matics, Springer, 2002.

[11] Lidl, R. and Niederreiter, H. Introduction to Finite Fields and


Their Applications, Cambridge University Press, 1986.

[12] van der Waerden, B. L. Algebra, Springer, 2003.


250 Bibliografı́a

Para cubrir los requisitos de Algebra Lineal y para continuar con ese
tema:

[13] Birkhoff, G. and MacLane, S. A Survey of Modern Algebra, fourth


edition, Macmillan, 1977.
[14] Curtis, C. W. Linear Algebra. An Introductory Approach,
fourth edition, seventh printing, Undergraduate Texts in Mathematics,
Springer, 1999.
[15] Fraleigh, J. B. and Beauregard, R. A. Linear Algebra, Addison-
Wesley, 1990.
[16] Greub, W. Linear Algebra, fourth edition, Graduate Texts in Math-
ematics, Springer, 1975.
[17] Greub, W. Multilinear Algebra, second edition, Springer, 1978.
[18] Halmos, P. R. Finite-Dimensional Vector Spaces, second edition,
fifth printing, Undergraduate Texts in Mathematics, Springer, 1993.
[19] Hoffman, K. and Kunze, R. Linear Algebra, second edition,
Prentice-Hall, 1971.
[20] Kaplansky, I. Linear Algebra and Geometry, a second course,
Dover, 1995.

[21] Lang, S. Linear Algebra, third edition, Undergraduate Texts in


Mathematics, Springer, 1987.
[22] Nering, E. D. Linear Algebra and Matrix Theory, second edition,
John Wiley, 1995.
[23] Noble, B. and Daniel, J. W. Applied Linear Algebra, third edition,
Prentice-Hall, 1988.

Para encontrar más ejercicios de grado de dificultad más variado:

[24] Herstein, I. N. Topics in Algebra, second edition, Wiley, New York


1975.
[25] Lang, S. Undergraduate Algebra, third edition, Undergraduate
Texts in Mathematics, Springer, 2005.
Indice Alfabético

acción de división, 50
de un grupo, 14 de polinomios, 73
irreducible, 230 euclideano, 64
primitiva, 24 euclideano generalizado, 71
transitiva, 14 local, 61
adjunta Hermitiana, 214, 215 Noetheriano, 85
álgebra, 157 semisimple, 232
álgebra simple, 54
alternante, 162, 163 total de fracciones, 62
asociativo, 158 antisimetrı́a, 210
conmutativo, 158 anulador
de Clifford, 234 de un elemento, 182
de grupo, 157 de un módulo, 182
de monoide, 157 asociado, 65
de polinomios asociatividad, 3
torcidos, 236 automorfismo, 13
graduado, 162 automorfismo
simétrico, 162 externo, 34
simple central, 237 interno, 13
sobre k, 157
tensorial, 162 bandera, 194
algebraicamente base, 153
independiente, 79 base normal, 223
álgebras, 157 base ortonormal, 214
algoritmo euclideano, 1, 73 bloque de Jordan, 190, 191
anillo, 49 buen orden, 2
anillo
asociativo, 49 cadena, 57
Booleano, 56 campo, 50
conmutativo, 49 campo
252 Indice Alfabético

algebraicamente cerrado, 98 derivado total, 70


de descomposición, 101 multiplicativo, 61
de descomposición conmutador, 10, 28
de un polinomio, 100 conmutatividad
de fracciones, 62 de matrices, 199
de los números contenido, 74
algebraicos, 100 convolución de Dirichlet, 53
finito, 125 cota superior, 57
intermedio, 109 cuadratura del cı́rculo, 147
ordenado, 117 cuaternios
ordenado generalizados, 237
completo, 124 reales, 50, 157
perfecto, 107
primo, 93 de torsión, 45, 182
real cerrado, 117 derivada, 77
carácter, 133 descomposición
caracterı́stica, 54, 93 de Jordan
centralizador, 13 multiplicativa, 198
centro, 13, 51 de Jordan-Chevalley, 195
cerradura polar, 220
algebraica, 99 determinante, 168
inseparable pura, 106 determinante
normal, 103 de una matriz, 168
separable, 106 de Vandermonde, 92
ciclo, 18 discriminante, 83
circulante, 174 discriminante
clase de un producto interno, 206
de conjugación, 13 genérico, 82
de equivalencia, 2 distancia, 207, 214
lateral, 54 distributividad, 49
lateral divisor de cero, 50
derecha, 5 divisores elementales, 44, 184
doble, 8 dominio, 50
cociclo, 134 dominio
coeficiente lı́der, 73 de factorización única, 65
cofactor, 172 principal, 64
cofrontera, 134 dualidad, 155
complemento ortogonal, 204 duplicación del cubo, 147
componente primaria, 183
conúcleo, 187 ecuación
conjugación, 13 cuadrática general, 139
conjugado, 13 cúbica general, 139
conjunto de clase, 15
completo de invariantes, 184 elemento
derivado, 70 algebraico, 93
Indice Alfabético 253

inseparable puro, 106 alterna, 210


máximo, 57 anisotrópica, 226
positivo, 117 canónica, 180
primitivo, 96, 112 cuadrática, 205
separable, 104 Hermitiana, 214
trascendente, 93 isotrópica, 226
endomorfismo, 13 negativa definida, 205
enteros positiva definida, 205
Gaussianos, 50 simétrica bilineal, 203
módulo n, 2 función
espacio alternante, 163
euclideano, 203 aritmética, 52
unitario, 214 ϕ de Euler, 5
estabilizador, 14 lineal, 153
expansión multilineal, 153
a lo largo de un renglón, 172
exponente, 137 grado
extensión de inseparabilidad, 108
Abeliana, 126 de una extensión, 93
algebraica, 93 Gram-Schmidt, 207
cı́clica, 126 grupo, 3
ciclotómica, 128 grupo
de campos, 93 abeliano, 3
de Galois, 109 afı́n, 26
finita, 93 alternante, 19
finita cı́clico, 4, 5
separable, 104 de cohomologı́a, 134
finitamente generada, 96 de cuaternios, 9
infinita, 93 de Galois, 109
inseparable pura, 105 de Galois
normal, 101 de un polinomio, 114
simple, 96 de relaciones, 40
soluble derivado, 10, 28
con radicales, 138 diédrico, 26
trascendente, 93 especial lineal, 4, 178
finitamente generado, 42
fórmulas de general lineal, 4, 178
Tartaglia-Cardano, 141 libre, 39
factor libre abeliano, 40
invariante, 180 nilpotente, 28
factores octaédrico, 211
de composición, 36 simétrico, 4
de una serie, 36 simpléctico, 213
invariantes, 45, 184 simple, 9
forma soluble, 28
254 Indice Alfabético

unipotente, 196 módulo


unipotente cı́clico, 182, 187
de un parámetro, 197 dual, 155
grupos fiel, 229
isomorfos, 11 irreducible, 84
lineales, 196 izquierdo, 84
libre, 153, 158
holomorfo, 47 Noetheriano, 85
homomorfismo, 10 semisimple, 232
matrices
ideal, 54 congruentes, 205
ideal equivalentes, 155
bilateral, 54 similares, 186
derecho, 54 matriz
homogéneo, 162 adjunta, 172
irreducible, 87 alterna, 210
izquierdo, 54 alterna
máximo, 56 canónica, 211
primario, 87 genérica, 211
primo, 56 compañera, 188
principal, 54, 64 de cofactores, 172
producto, 70 elemental
simple, 232 de primer tipo, 177
ideales de segundo tipo, 177
divisores elementales, 184 de tercer tipo, 177
factores invariantes, 184 Hermitiana, 214
isomorfos, 231 ortogonal, 216
primos relativos, 58 simétrica, 203
identidad, 3 menor, 171
ı́ndice, 5 menor
inverso, 3 lı́der, 206
involución, 235 monoide, 8
inyección canónica, 158 monomio, 73
irreducible, 65 morfismo
isomorfismo, 11 de anillos, 54
de campos, 97
ley de cancelación, 50 de Frobenius, 105
libre de torsión, 45, 182 de grupos, 10
linealmente independiente, 153 de k-módulos, 153
localización, 61 inverso, 11
longitud, 36, 180, 207, 214 natural, 11, 55, 62
longitud constructible, 144 multiplicidad, 74

mı́nimo común múltiplo, 1 nilpotente, 57


máximo común divisor, 1, 65 nilradical, 57
Indice Alfabético 255

no generador, 48 primo, 1
no singular, 203 primo de Fermat, 147
norma, 67, 133 primos relativos, 1, 65
normalidad, 100 producto
normalizador, 13 cartesiano, 158
núcleo, 11, 54 directo, 25, 55, 158
números interno, 203
duales, 175 interno
duales sesquilineal, 214
torcidos, 236 semidirecto, 26
naturales, 2 tensorial, 158
proyección, 158
operaciones punto fijo, 14
columna elementales, 177
renglón elementales, 177 raı́z, 74
órbita, 14 raı́z primitiva
orden, 3, 88 de la unidad, 128
orden radical, 203
de un elemento, 5 radical de Jacobson, 57
ortogonalización rango, 45, 154, 165, 183
de Gram-Schmidt, 207 rango
columna, 166
paralelepı́pedo, 207 determinantal, 172
parte renglón, 166
nilpotente, 196 uno, 165
semisimple, 196 refinamiento, 36
permutación, 4 reflección, 209
permutación reflexiva, 2
par, 19 relación de equivalencia, 2
Pfaffiano, 211 residuo
Pfaffiano genérico, 211 cuadrático, 68
plano hiperbólico, 238 no cuadrático, 68
polı́gono constructible, 147 resolvente de Lagrange, 140
polinomio resultante, 81
caracterı́stico, 187 resultante genérico, 82
homogéneo, 73 rotación, 219
mı́nimo, 187
mónico, 73 sı́mbolo
primitivo, 74 de Legendre, 69
separable, 104 separabilidad, 104
simétrico, 79 serie
simétrico elemental, 79 central
soluble ascendente, 30
con radicales, 139 descendente, 28
presentación, 40 de composición, 36
256 Indice Alfabético

derivada, 28 dual, 156


subnormal, 36 Hermitiana, 216
series negativa definida, 220
equivalentes, 36 nilpotente, 193
formales de potencias, 88 normal, 216
signo positiva definida, 220
de una permutación, 19 semilineal, 215
simetrı́a determinada semisimple, 193
por un vector, 209 unipotente, 196
simétrica, 2 unitaria, 216
similaridad de matrices, 185 transitiva, 2
sistema translación, 142
de generadores, 40 transportador, 62
de relaciones, 40 transposición, 19
subanillo, 50 transvección, 177
subgrupo, 4 traza, 133
generado por trisección de ángulos, 147
un subconjunto, 5
subgrupo unidad, 50
caracterı́stico, 13
de Borel, 196 valor
de Frattini, 48 caracterı́stico, 193
de Sylow, 32 vector
normal, 9 caracterı́stico, 193
submódulo isotrópico, 204
de torsión, 182 vectores
sucesión ortogonales, 204
de Sturm, 122 volumen
de Sturm standard, 122 m-dimensional, 207
exacta, 159
suma
de Gauss, 130
de Gauss modificada, 131
directa, 153, 158, 167
directa
de módulos, 86
ortogonal, 205

toro máximo, 196


torsión, 45
transformación
afı́n, 26, 142
antihermitiana, 216
de rango uno, 165
diagonalizable, 193

También podría gustarte