Archivos en la Categoría: Física

el placer de descubrir

Voy a empezar a promocionar libros en este blog, y comienzo con esta maravilla: “El placer de descubrir”, una recopilación de entrevistas, conferencias y artículos del gran físico del siglo pasado, Richard P. Feynman, Premio Nobel de 1965, de quien ya he hablado en varias ocasiones, y que para mi es el modelo a seguir en ciencia.

La grandeza de Feynman no se debe solo a sus descubrimientos sobre electrodinámica cuántica o a que sea, como le bautizaron, el “padre de la nanotecnología”. Su grandeza se debe a que todos sus pasos los dio con gran humor, imaginación y humildad, hasta el punto de que uno de los libros que tratan sobre él se titula: “¿Está usted de broma, señor Feynman?”.

En “El placer de descubrir” podremos aprender mucho sobre cómo debe pensar alguien verdaderamente interesado en descubrir, y trata los siguientes temas:

Infancia:

En varios capítulos descubrimos cómo desde pequeño fue educado por su padre para amar la ciencia, dando paseos por el bosque y analizando cada minúsculo detalle, jugando con secuencias lógicas de colores y números, y analizando la mecánica clásica con un simple coche de ruedas:

Un día estaba yo jugando con lo que llamamos un vagón exprés (…). Tenía dentro una bola (lo recuerdo bien) y me fijé en un detalle del movimiento de la bola, así que le dije a mi padre: “Papá, he notado algo: cuando tiro del vagón la bola rueda hacia la parte trasera, y cuando estoy tirando y de repoente dejo de hacerlo, la bola rueda hacia la parte delantera (…), ¿por qué pasa eso?” (…) “Nadie lo sabe. Hay un principio general que dice que las cosas que están en movimiento tratan de seguir en movimiento, y las cosas que están en reposo tienden a permanecer en reposo a menos que ejerzas una fuerza sobre ellas (…). Esta tendencia se llama inercia pero nadie sabe por qué es verdad. (…) Si te fijas bien verás que no es la bola la que rueda hacia la parte trasera del vagón, sino que es la parte trasera del vagón la que tú estás tirando hacia la bola; verás que la bola sigue quieta o que quizá empieza a moverse debido a la fricción, pero en realidad se mueve hacia adelante y no hacia atrás.”

Asimismo, podemos incluir en su época joven experimentos acerca de si es posible o no contar mientras se lee o se habla, con resultados interesantes.

Participación en el Proyecto Manhattan:

De su participación en el proyecto de la bomba atómica podemos encontrar un joya de capítulo en este libro, donde Feynman nos cuenta cómo era la estancia en Los Álamos, y un sinfín de anécdotas: cómo consiguió tener una habitación para él solo, cómo filtraba información “disimuladamente”, cómo aprendió a desvalijar cajas fuertes escuchando sonidos o probando con constantes universales, cómo tuvo algunos golpes de suerte para contestar adecuadamente en situaciones en las que estaba despistado, cómo consiguió ser la primera persona que vió una bomba atómica en fase de pruebas sin gafas de protección cubriéndose con la luna de un coche de la radiacción ultravioleta, cómo conoció al Premio Nobel Niels Bohr sin dudar en preguntarle si estaba loco, y más situaciones como la que sigue:

Y así llega el día, el primer día de la censura. ¡Teléfono! ¡Riiiiing! Yo: “¿Qué?” “Venga, por favor.” Yo voy. “¿Qué es esto?” Es una carta de mi padre. “Bien, ¿qué es?” Hay un papel rayado, y hay unas líneas con puntos: cuatro puntos abajo, un punto arriba, dos puntos abajo, un punto arriba, un punto debajo de un punto. “¿Qué es esto?” Yo dije: “Es un código.” Y ellos: “sí, es un código; pero ¿qué dice?”. Yo dije: “No sé lo que dice.” Dijeron: “Bien, ¿cuál es la clave del código; cómo lo descrifra?”. Yo dije: “Pues no lo sé.” Entonces ellos dijeron: “¿Qué es esto?”. Yo dije: “Es una carta de mi mujer.” “dice TJXYWZ TW1X3. ¿Qué es esto?” Yo dije: “Otro código.” “¿Cuál es la clave?” “No lo sé.” Dijeron: “¿Usted está recibiendo mensajes en clave y no la conoce?” “Exactamente. Juego con ellos. Les reto a que me envíen un código que no pueda descifrar, ¿ven ustedes? De modo que se inventan códigos y me envían mensajes sin decirme cuál es la clave.” Ahora bien, una de las reglas de la censura era que no iban a interferir en nada que uno hiciera normalmente en el correo. Así que dijeron: “Bien, usted va a tener que decirles que por favor envíen la clave con el mensaje.” Dije: “¡Pero yo no quiero saber la clave!” Dijeron: “Muy bien, nosotros sacaremos la clave.” Y llegamos a ese compromiso.

Reflexiones Éticas:

Encontramos también en el libro entrevistas y conferencias en las que Richard expone su opinión sobre cómo se está menospreciando la ciencia en la sociedad, y que es vergonzoso que las pseudociencias (astrología, tarot, sanadores…) ganen tanto terreno:

Pienso, y todos ustedes deben saberlo por experiencia, que la gente (quiero decir la persona media, la gran mayoría de las personas, la inmensa mayoría de las personas) son lamentablemente, penosamente, absolutamente ignorantes de la ciencia en el mundo en el que viven, y pueden seguir así. No quiero decir nada de ellos; lo que quiero decir es que pueden seguir sin que les preocupe lo más mínimo (sólo tibiamente) y cuando ocasionalmente ven la CP mencionada en los periódicos, preguntan qué es eso. Y una cuestión interesante de la relación entre ciencia y sociedad moderna es precisamente ésa: ¿por qué es posible que la gente en una sociedad moderna permanezca tan penosamente ignorante, y pese a todo razonablemente felíz, cuando hay tanto conocimiento al que no pueden acceder?

Conferencia “Hay Mucho Sitio al Fondo”:

Esta conferencia, que el libro reproduce integramente, le valió a Feynman el ya mencionado título de “padre de la nanotecnología”, pues en ella aseguraba, algo adelantado a su época, que en un futuro cercano sería posible usar los propios átomos para procesar cada bit de un ordenador, de modo que todos los libros del mundo podrían grabarse con láser sobre nada menos que 2/3 de la punta de un alfiler.

En resumen, es un libro interesante, sobre una persona muy interesante, y que cautivará a cualquiera que esté interesado en el tema.

Movimiento Armónico Simple:

muelle romicEl movimiento oscilatorio es un movimiento periódico en torno a un punto de equilibrio. Todo movimiento oscilatorio tiene unas características importantes: frecuencia, periodo y amplitud. El movimiento armónico simple (m.a.s.) es el movimiento armónico más sencillo.

Para estudiar el m.a.s. se busca su analogía con el movimiento circular uniforme. Consideremos la partícula “P” de velocidad constante “v0″ describiendo una trayectoria circular de radio “A”.

Podemos definir la posición de “P” con “x”, “y” o con “σ”, que está relacionado con la velocidad angular:

  • ω = dσ / dt.

, que, a su vez, está relacionada con la velocidad lineal por:

  • v = A ω.

Para calcular “σ” integramos:

  • ∫dσ = ω ∫dt.
  • σ = ω t + σ0.

Calculemos la proyección sobre el eje “x” de “P”: “Q”. El punto “Q” se mueve hacia “x-” o hacia “x+” según “P” vaya girando. “Q” tiene un m.a.s.

El desplazamiento de “Q” respecto a “0″ vendrá dado por la proyección de “P” sobre el eje “x” por definición:

  • x = A Cosσ = A Cos(ω t + σ0).

Para pasar de coseno a seno, a “σ0″ se le suman “π / 2″ radianes:

  • x = A Cosσ = A Cos(ω t + σ0 + π / 2).

Estudiemos las características de m.a.s.

Amplitud (A):

Desplazamiento máximo respecto a la posición de equilibrio (0).

Frecuencia Angular (ω):

Número de radianes que recorre en un segundo.

Periodo (T):

Tiempo que tarda en completar una vuelta o ciclo. Al recorrer un ciclo, la fase aumenta en “2 π” radianes:

  • T = 2 π / ω.

Frecuencia (f):

Número de vueltas que da en un segundo.

  • f = 1 / T = ω / (2 π).

Estudiemos la velocidad de “Q” en m.a.s. Se puede obtener derivando:

  • v = dx / dt = – ω A Sen(ω t + σ0).

Esta “v” es la misma que la proyección sobre “x” de la velocidad “v0″. Apreciamos que nuestra “v” está en función de “t”, pero es útil conocerla también en función de “x”. La distancia “¬PQ”, por pitágoras, es:

  • d(¬P, ¬Q) = [A^2 - x^2]^1/2.

, y por trigonometría:

  • d(¬P, ¬Q) = A Senσ.

Por tanto:

  • A Senσ = [A^2 - x^2]^0.5.

, de donde:

  • Senσ = [A^2 - x^2]^1/2 / A.

Sustituyendo en “v”:

  • v = – ω [A^2 - x^2]^1/2.

Para ponerlo en función de “v0″:

  • v = – ω A [1 - (x / A)^2]^1/2 = ± v0 [1 - (x / A)^2]^1/2.

Se cumplen las siguientes propiedades:

  • x = – A → v = 0.
  • x = 0 → v = ± v0.
  • x = A → v = 0.

Estudiemos la aceleración del movimiento armónico simple.

La partícula “P” está sometida a una aceleración centrípeta:

  • ac = v^2 / A = ω^2 A.

“a”, la aceleración de “Q”, es la proyección de “ac” sobre el eje “x”.

  • a = dv / dt = – ac Cosσ = – ω^2 A Cos(ω t + σ0).

Ecuación Diferencial de un Movimiento en un M.A.S:

  • a = d^2 x / dt^2 = dv / dt = dx dv / (dt dx) = v dv / dx = – ω^2 x.

Ya podemos integrar:

  • ∫v dv = – ω^2 ∫x dx.
  • v^2 / 2 = – ω^2 x^2 / 2 + cte.
  • v^2 = – ω^2 x^2 + 2 cte = ω^2 (2 cte / ω^2 – x^2) = ω^2 (A^2 – x^2).
  • v = ω [A^2 - x^2]^1/2.

, expresión que ya obtuvimos.

Obtenemos “x”:

  • v = dx / dt = w [A^2 - x^2]^1/2.
  • ∫(dx / [A^2 - x^2]^1/2) = ω ∫dt.

Para integrar se hace el cambio de variable:

  • x = A Cosσ.
  • dx = – A Senσ dσ.
  • [A^2 - x^2]^1/2 = A[1 - Cosσ^2]^1/2 = A Senσ.
  • ∫- A Senσ dσ / (A Senσ) = – ∫dσ = ω ∫dt.
  • σ = – ω t + σ0.

Ahora deshacemos el cambio de variable:

  • x = A Cosσ = A Cos(- ω t + σ0).

Por tanto, hemos llegado a las ecuaciones que ya teníamos a partir de la ecuación diferencial. “A” y “σ0″ ahora son constantes de integración que dependen de las condiciones iniciales. Determinémoslas:

Partimos de:

  • x = A Cos(ω t + σ0).
  • v = – ω A Sen(ω t + σ0).
  • t = 0.
  • x = x0 = A Cos(σ0).
  • v = v0 = – A ω Sen(σ0).

Hacemos la división:

  • v0 / x0 = – A ω Sen(σ0) / (A Cos(σ0)) = – ω Tg(σ0).
  • Tg(σ0) = – v0 / (x0 ω).
  • σ0 = Arcotg(- v0 / (x0 ω)).

Para calcular “A”, usaremos:

  • Senσ^2 + Cosσ^2 = 1.
  • x0^2 = A^2 Cos(σ0)^2.
  • v0^2 = – A^2 ω^2 Sen(σ0)^2.
  • (v0 / ω)^2 = - A^2 Sen(σ0)^2.

Sumando:

  • x0^2 + (v0 / ω)^2 = A^2 (Cos(σ0)^2 + Sen(σ0)^2) = A^2.
  • A = [x0^2 + (v0 / ω)^2]^1/2.

Fuerza de Restitución Elástica:

camaSupongamos un cuerpo de masa “m” unido a un muelle de masa despreciable en la posición de equilibrio. Tirando del objeto, si el muelle es ideal, la fuerza con la que se opone el muelle a la fuerza exterior viene dada por la Ley de Hooke:

  • Fe = – k x.

, que es opuesta al desplazamiento, donde “k” es la constante de elasticidad.

Por la 2ª Ley de Newton:

  • m a = – k x.

Comparando con la ecuación diferencial del m.a.s:

  • a = – ω^2 x = – k x / m.

El muelle se muelle se mueve con un m.a.s. de:

  • ω = [k / m]^1/2.

“ω” no depende de la separación inicial (ésta solo influye en la amplitud).

Supongamos un m.a.s. vertical, donde el punto de equilibrio depende del peso. En la posición de equilibrio se cumplirá:

  • |¬P| = |¬Fe|.
  • mg = k l.
  • l = m g / k.

A partir de aquí el razonamiento es similar al m.a.s. simple horizontal. Una partícula con m.a.s. se mueve como si estuviese unida a un muelle ideal.

Energía en el M.A.S:

Ya conocemos cómo es la fuerza asociada a un m.a.s:

  • Fe = – k x.

, que es conservativa (no realiza trabajo a lo largo de la trayectoria), por lo que la disminución o el aumento de la energía cinética es a costa de la variación de la energía potencial.

Energía Potencial Elástica:

La energía potencial elástica en “Q” será el trabajo necesario para llevar la partícula de “O” a “Q”.

  • Ep = ∫F dx = – k ∫x dx.
  • Ep = k x^2 / 2.

Como la fuerza es constante se cumple:

  • Ec + Ep = cte.
  • m v^2 / 2 + k x^2 / 2 = cte.
  • m A^2 ω^2 Sen(ω t + σ0)^2 / 2 + k A^2 Cos(ω t + σ0)^2 / 2 = cte.

, y como:

  • k = m ω^2.

, nos resulta:

  • k A^2 (Sen(ω t + σ0)^2 + Cos(ω t + σ0)^2) / 2 = k A^2 / 2 = cte.
  • m v^2 = k (A^2 – x^2).
  • v^2 = k (A^2 – x^2) / m.
  • v = w (A^2 – x^2).

de nuevo.

Péndulo Simple:

penduloModelo de péndulo ideal: masa puntual “m” colgando de un hilo de masa despreciable y longitud “l”. Si lo desplazamos “σ” radianes de su posición de equilibrio, los pares de fuerzas se compensan siguiendo la igualdad:

  • P Cosσ = T.

La responsable de la oscilación es “P Senσ”.

  • F = – P Senσ.
  • m a = – m g Senσ.
  • a = – g Senσ.
  • l d^2σ / dt^2 = – g Senσ.
  • d^2σ / dt^2 = – g Senσ / l.

Para “σ” muy pequeños se movería con m.a.s., y por Taylor:

  • Senσ ≈ σ.

Por lo que:

  • l d^2σ / dt^2 = – g σ.
  • w^2 = g / l.

Notación Compleja:

Un número complejo es isomorfo a un vector en 2 dimensiones, ya que se puede representar en el plano complejo donde la abscisa es la parte real y la ordenada la imaginaria.

  • z = x + i y.
  • Parte Real = x = r Cosσ.
  • Parte Imaginaria = y = r Senσ.
  • z = x + i y = r (Cosσ + i Senσ) = r e^(i σ).

, donde “r” es la amplitud y “σ” la fase. Expresado en forma fasorial:

  • z = r \ σ.

El complejo conjugado sería de la forma:

  • z* = x – y i = r (Cosσ – i Senσ) = r ^(- i σ) =r \ – σ.

El módulo se calcula elementalmente:

  • r = [x^2 + y^2]^1/2.

Y la fase:

  • σ = Arcotg(y / x).

El problema es que los arcotangentes de un complejo y su conjugado resultan ser idénticos, por lo que, para corregir el error, se le suman “π” radianes a “z*”.

Supongamos que la fase varía con el tiempo:

  • σ = ω t + σ0.

, entonces, “z” rota con una frecuencia angular “ω”. Por tanto:

  • z = r e^(i σ) = r e^(i (ω t + σ0)).
  • z = r e^(i ω t) e^(i σ0).

Cada vez que se cumple un periodo “T” se da una vuelta completa, y el fasor vuelve a su valor original. Los fasores se representan con:

  • t = 0.

, es decir, no se representa la dependencia temporal. Los fasores, además, son fáciles de derivar.

  • dz / dt = d(r e^(i ω t) e^(i σ0)) / dt.
  • dz / dt = i ω r e^(i ω t) e^(i σ0) = i w z.
  • d^2z / dt^2 = i ω (i w z) = – ω^2 z.

La parte real del fasor “z” es:

  • r Cosσ = r Cos(ω t + σ0).

La de “dz / dt” es:

  • - ω r Senσ = – ω r Sen(ω t + σ0).

Y por último, la de “d^2z / dt^2″ es:

  • - ω^2 r Cosσ = - ω^2 r Cos(ω t + σ0).

Descripción de una onda unidimensional:

Una onda es una perturbación del equilibrio que se propaga de una región del espacio a otra. Se propaga la perturbación, que implica un transporte de energía y momento, y no la materia (ésta se mueve solo en torno a unas posiciones de equilibrio).

Según su naturaleza hay dos tipos de ondas:

  • Mecánicas: necesitan un material elástico para propagarse que se llama medio, como por ejemplo las ondas de agua, el sonido, o una cuerda.
  • Electromagnéticas: no necesitan un medio para propagarse, y por tanto son las únicas que pueden viajar en el vacío. Se producen por cargas aceleradas de partículas atómicas o subatómicas. Algunos ejemplos son los rayos x, la radio, la luz, que solo varían su frecuencia y su longitud de onda.

Ondas Mecánicas:

Según la dirección de la perturbación, hay varios tipos de onda:

  • Transversales: los desplazamientos de las partículas del medio son perpensidulares a la dirección de la onda, como es el caso de la oscilación de la cuerda.
  • Longitudinales: las partículas se mueven en la dirección de la onda, como es el caso de un muelle que se contrae o un gas comprimido por un pistón.

La cresta de una ola es una onda transversal y longitudinal a la vez.

Características de las ondas:

  • La Velocidad de Propagación de la onda, que solo depende de las propiedades mecánicas del medio, y no de la velocidad de vibración de las partículas.
  • El medio no viaja por el espacio: sus partículas realizan un movimiento en torno a unas posiciones de equilibrio.
  • Para generar la onda hay que aportar energía realizando un trabajo sobre el sistema.

Descripción Matemática de una Onda Unidimensional:

Supongamos que el medio en que se propaga es elástico, lineal y no dispersivo. Entonces, la onda se propaga a velocidad constante y sin perder la forma.

Supongamos un pulso que se propaga a una velocidad “v”.

Calculemos la función que describa la posición de un punto en cualquier instante. Supongamos, por tanto:

  • y = f(x).

Pero necesitamos una dependencia temporal. Para relacionar las funciones en:

  • t = 0.
  • t’ ≠ 0.

, consideremos un sistema de referencia en la propia perturbación. En este sistema, la función que nos da la posición inicial es igual a la del resto del tiempo:

  • y’ = f(x’).

para cualquier “t”.

La relación entre los sistemas viene dada por:

  • y’ = y.
  • x’ = x – vt.

Por tanto:

  • y = y’ = f(x’) = f(x – v t) = f(x / v + t).

Así, ya tenemos la dependencia temporal en la función de onda, que presenta una onda propagándose a velocidad “v” en la dirección “y” que representa el movimiento vertical de un punto “x” en un tiempo “t”. Por tanto, si “t” aumenta en “1″ segundo, hay que aumentar “x” en “v” metros para que “y” tenga el mismo valor.

Hablamos de Ondas Progresivas cuando:

  • v > 0.

, y de Ondas Regresivas cuando:

  • v < 0.

Para ondas longitudinales:

  • y = Φ = desplazamiento paralelo a la velocidad de la onda.

En general, una onda unidimensional será una combinación de una onda regresiva y una progresiva:

  • Φ(x, t) = f(x – v t) – g(x + v t).

Ondas Periódicas:

SinLa perturbación se repite cada cierto tiempo de forma regular, es decir, de una fuente periódica.

.-Longitud de Onda “λ”:

Es la distancia espacial (en “m”) en la que la onda efectúa una oscilación completa y tras la cual se repite, es decir, la perturbación se repite cada “λ” metros.

  • Φ(x, t) = Φ(x ± λ, t) = Φ(x ± n λ, t).

.-Periodo “T”:

tiempo (en “s”) que la onda tarda en completar una oscilación completa. Fijado un punto “x” del medio, tiempo que tarda dicho punto en dar una oscilación, se cumple:

  • Φ(x, t) = Φ(x, t ± T) = Φ(x, t ± n T).

.-Frecuencia “f”:

Número de oscilaciones por segundo (en “Hz”):

  • f = 1 / T.

Para relacionar “v”, “T” y “λ” nos ponemos en “x0″ y mecimos con un cronómetro los metros de perturbación que pasan en un segundo, es decir, su frecuencia:

  • v = λ f.

Ondas Armónicas:

La perturbación tiene forma sinusoidal, es decir, definida por senos y cosenos (cualquier onda periódica es suma de ondas armónicas).

El m.a.s. nos sirve para crear ondas armónicas, de modo que:

  • Φ(x, t) = A Sen(- 2 π x / λ).

Observamos una periodicidad espacial, que nos permite definir el Número de Onda:

  • k = – 2 π / λ.

La función total es una función de “t” y de “x”:

  • Φ(x, t) = A Sen(- k (x – v t)) = A Sen(- k x + k v t) = A Sen(- k x + 2 π f t).
  • Φ(x, t) = A Sen(ω t – k x).

, donde “ω”, “f” y “A” son propiedades de la fuente, y “v” solo del medio.

  • Φ(x, t) = A Sen(ω t ± k x + Φ0).
  • Φ(x, t) = A e^(i(ω t ± k x + Φ0)).

Ecuación de una Onda Unidimensional:

Vamos a demostrar que una función:

  • Φ = Φ(x ± ω t).

es una onda unidimensional propagándose en “± x”.

  • α = x ± ω t.
  • Φ = Φ(α).
  • dΦ / dx = dΦ / dα dx = dΦ / dα = Φ’.
  • dΦ / dt = dΦ dα / dα dt = ± v dΦ / dt = ± v Φ’.
  • d^2Φ / dx^2 = Φ”.
  • d^2Φ / dt^2 = v^2 Φ”.

Por tanto, cualquier función dependiente de “x” y “t” de la forma:

  • Φ = Φ(x ± ω t).

cumple:

  • d^2Φ / dx^2 = Φ”.
  • d^2Φ / dt^2 = v^2 Φ”.
  • Φ” = d^2Φ / dx^2 = d^2Φ / (v^2 dt^2).
  • d^2Φ / dx^2 – d^2Φ / (v^2 dt^2) = 0.

, que es la ecuación de ondas unidimensionales propagándose en la dirección “± x” a “v”.

La solución general es:

  • Φ(x, t) = f(x – v t) + g(x + v t).

Como es una ecuación diferencial lineal y sabemos que hay una solución que es una onda y otra que es otra onda, su suma también es solución, por aplicación del principio de superposición.

Cuerda Tensa. Ondas Transversales:

cuerdaConsideremos un segmento de cuerda sometido a una determinada perturbación y analicemos las fuerzas que actúan sobre ella (tensiones, que son la misma) para estudiar el movimiento.

Dados dos segmentos de cuerda “1″ y “2″, de inclinaciones:

  • σ1 ≠ σ2.

por la ligera inclinación debida a la onda:

  • ∑Fy = T2y – T1y = T Sen(σ2) – T Sen(σ1) = T (Sen(σ2) – Sen(σ2)).
  • ∑Fx = 0.

No hay movimiento en “x”.

Considerando una onda de amplitud pequeña, “σ1″ y “σ2″ son pequeños, cumpliéndose:

  • Cosσ ≈ 1.
  • Senσ ≈ Tgσ.

Además, podemos considerar:

  • m = μ Δx.

, siendo “μ” la densidad lineal.

  • ∑Fy = T(Tg(σ2)- Tg(σ1)).

En un determinado punto:

  • Tgσ = dy / dx.

, es decir, la pendiente “S” del punto.

  • ∑Fy = T(S2 – S1) = T ΔS = m ay = m d^2y / dt^2 = μ Δx d^2y / dt^2.
  • T ΔS / Δx = μ d^2y / dt^2.
  • d^2y / dt^2 = μ d^2y / (T dt^2).
  • d^2y / dt^2 – μ d^2y / (T dt^2) = 0.

Comparando con la ecuación de ondas:

  • 1 / v^2 = μ / T.
  • v = [T / μ]^1/2.

La velocidad de propagación de una onda depende del medio.

Ondas Sonoras en un Tubo de Aire. Ondas Longitudinales:

Las ondas longitudinales de presión / descompresión en un medio sólido, líquido o gaseoso son ondas sonoras de frecuencia audible entre los los 20 Hz y los 20 kHz.

Consideremos una onda sonora propagándose en un tubo de sección “A”. Consideremos una región en equilibrio:

  • p1 = p2.

Sea “ρ0″ la densidad de masa. Si hay una perturbación “dΦ” el gas se expandirá o se contraerá, respectivamente, según:

  • dΦ > 0.
  • dΦ < 0.

Para la región de volumen considerado, “ρ” será distinto, pero no la masa:

  • m1 = m2.
  • ρ0 V1 = ρ V2.
  • ρ0 A dx = ρ A (dx + dΦ).
  • ρ = ρ0 / (1 + dΦ / dx) = ρ0 (1 + dΦ / dx)^(-1).

Veamos las presiones que ejercen las dos masas de aire que rodean la sección considerada para estudiar la fuerza que actúa sobre la misma:

  • Fxi = p A.
  • Fxd = p’ A.

Siendo “Fxi” la fuerza por el lado izquierdo y “Fxd” la fuerza por el lado derecho. La fuerza resultante “Fx” será:

  • Fx = (p – p’) A = – A dp.
  • Fx = m a = m d^2Φ / dt^2.

Combinando:

  • m d^2Φ / dt^2 = ρ0 A dx d^2Φ / dt^2 = – A dp.
  • - dp / dx = – ρ0 = d^2Φ / dt^2.

Por la regla de la cadena:

  • dp / dx = dp dρ / dρ dx.

pero como:

  • ρ =  ρ0 (1 + dΦ / dx)^(-1).

Obtenemos:

  • dp / dx = dp (- ρ0 d^2Φ / dx^2) / dρ.

Comparando:

  • d^2Φ / dx^2 = d^2Φ dρ / (dt^2 dp).

, que es la ecuación de ondas de una onda unidimensional propagándose en la dirección:

  • v = [dp / dρ]^1/2.

En general, la velocidad de propagación de una onda longitudinal se calcula en función del módulo de volumen del medio, denominaremos “β” a la inversa de la compresibilidad, que juega el papel de la constante elásticas del muelle:

  • v = [β / ρ]^1/2.

Para sólidos “s”, líquidos “l”, y gases “g”, se cumple:

  • vs > vl > vg.
  • βs > βl > βg.

Algunos casos particulares son, la varilla al comprimirse, de ecuación:

  • v = [γ / ρ]^1/2.

, donde “γ” representa el Módulo de Young, una constante predeterminada para cada material.

En el gas ideal:

  • v = [γ R T / M]^1/2.

, donde “R” es la constante de los gases (8,31 J / mol), “M” es la masa molecular del gas, “T” la temperatura absoluta y “γ” la constante del gas vista en el tema anterior.

Transporte de Energía en una Onda Transversal en una Cuerda:

Supongamos una onda que viaja de izquierda a derecha en un punto “A” de la cuerda. Calculemos el trabajo realizado por unidad de tiempo (potencia) en un segundo elemental de la cuerda, considerando la fuerza que un trazo de cuerda ejerce sobre otro de la derecha.

  • Fy = – T Senσ ≈ – T Tgσ.
  • Tgσ = dy / dx = S.

Ya tenemos la fuerza que se ejerce sobre “A”, el cual se va a desplazar con una velocidad, y cuando el punto “A” se mueve en la dirección “y”, realiza trabajo sobre ese punto.

La potencia la medimos como:

  • P(x, t) = F(x, t) v(x, t) = – T  dy(x, t) dy(x, t) / dx dt.

Consideremos una onda armónica:

  • y(x, t) = A Sen(ω t + k x).
  • dy(x, t) / dx= A k Cos(ω t – k+x).
  • dy(x, t) / dt = A ω Cos(ω t – k+x).

A partir de la expresión anterior:

  • P = T k ω A^2 Cos(ω t – kx)^2.

, y como:

  • T = v^2 μ.
  • v = ω / k.

nos resulta:

  • P = v μ ω^2 A^2 Cos(ω t – kx)^2.

, que es la potencia instantánea de onda en el punto “x”. Consecuentemente, la potencia máxima será:

  • Pmax = v μ ω^2 A^2.

Pero a nosotros no nos interesa la potencia instantánea, sino la potencia promedio de un ciclo:

  • P‾ = (∫(v μ ω^2 A^2 Cos(ω t – kx)^2 dt) desde “0″ hasta “T”) / T.
  • P‾ = ω ∫(v μ ω^2 A^2 Cos(ω t – kx)^2 dt) desde “0″ hasta “2 π / ω” / 2 π.
  • P‾ = μ v ω^2 A^2 / 2.

, y esta es la potencia promedio de todas las ondas, proporcional al cuadrado de la amplitud:

  • P‾ = α A^2.

La energía que fluye del punto “A” al “B” es:

  • ΔE‾ = P‾ Δt = μ ω^2 A^2 Δx / 2.

Transporte de Energía en Ondas Longitudinales:

La potencia media por unidad de sección transversal (intensidad de la onda) es:

  • I = P‾ / A.

Principio de Superposición:

reflexionCuando dos ondas interfieren, el desplazamiento real de cualquier punto del medio en cualquier instante se obtiene sumandoel desplazamiento que tendría el punto si solo estuviese presente la primera onda y el que tendría si solo estuviese la segunda.

  • Onda 1: y1(x, t).
  • Onda 2: y2(x, t).
  • Onda resultante: y1 + y2 = y(x, t).

La interferencia puede ser ocnstructiva o destructiva según si las ondas están o no en fase, respectivamente. Este principio es aplicable por la linealidad de las funciones de onda.
Reflexión en un Punto Fijo:

Supongamos un punto sobre una pared incapaz de oscilar (es un punto fijo), y supongamos que una onda se propaga hacia el punto en cuestión, de forma que cuando llegue a él tendrá que tomar un valor nulo. Asimismo, después de chocar con la pared, nuestra onda deberá reflejarse, es decir, volver hacia atrás de un modo opuesto al de llegó.

La única explicación matemática posible es que desde la pared, en todo momento, se propage en sentido opuesto a la onda original una onda exactamente igual solo que con sentido y módulo opuesto, de modo que en todo instante amvas ondas se anulen en el punto de la pared.

Poner una condición de este tipo en la propagación de las ondas es establecer una condición de contorno, y si un punto siempre es fijo es un nodo.

Ondas Estacionarias en una Cuerda:

Las ondas que se superponen en una cuerda producen, como onda resultante, ondas estacionarias, para ciertas frecuencias.

Supongamos que tenemos una onda armónica incidente:

  • y1(x, t) = A Sen(ω t – k x).

Debido a la reflexión en el punto fijo “B”, existe una onda reflejada:

  • y2(x, t) = – A Sen(ω t + k x).

La onda resultante será:

  • y(x, t) = y1 + y2 = A Sen(ω t – k x) - A Sen(ω t + k x).
  • y(x, t) = A(Sen(ω t – k x) – Sen(ω t + k x)).
  • y(x, t) = A(Sen(ω t) Cos(k x) – Cos(ω t) Sen(k x) – Sen(ω t) Cos(k x) – Cos(ω t) Sen(k x)).
  • y(x, t) = – 2 A Cos(ω t) Sen(k x).

Como en el punto final de la cuerda de longitud “L” la onda debe anularse, obtenemos que:

  • - 2 A Cos(ω t) Sen(k L) = 0.
  • Sen(k L) = 0.
  • k L = Arcosen(0) = n π radianes.

Es decir, el factor “k L” debe ser igual siempre a un ángulo cuyo seno se anule, representados por “n π”. PAra cada valor de “n”, el valor de “k” será distinto, por lo que es necesario definir los “kn”, que representan el valor de “n” al que van asociados, por lo que, en definitiva:

  • kn = n π / L.

Como previamente sabiamos que:

  • k = 2 π / λ.
  • kn = 2π / λn.

Nos resulta:

  • 2 π / λn = n π / L.

, donde los “λn” representan las longitudes de onda asociadas a cada valor de “n”, que se despejan como:

  • λn = 2 L / n.

La interpretación física de este fenómeno es que las distintas longitudes de onda representan los distintos armónicos de una cuerda, y en base a ellos se construyen los instrumentos musicales. “n = 1″ seria el primer armónico, “n = 2″ el segundo, y así sucesivamente.

3-4-1

Potencia e Intensidad de las Ondas:

Estudiaremos ambas propiedades particularizando a ondas sonoras, pues la intensidad se define como vimos antes:

  • I = P‾ / S.

, donde “S” representa la sección del frente de onda. Además, siempre se cumplía que:

  • I = α A^2.

, donde “A” representa la amplitud de la onda.

.-Ondas Dispersivas:

Si la fuente es puntual , se producen ondas esféricas, que se propagan a la misma velocidad en todas direcciones. En este caso la sección será la superficie de la esfera, por lo que:

  • I = P‾ / (4 π r^2) = β / r^2.
  • I = α A^2.
  • α A^2 = β / r^2.
  • A^2 r^2 = cte.
  • A r = cte.

Si la fuente es lineal se producen ondas cilíndircas:

  • I = P‾ / (2 π r h) = β / r.
  • I = α A^2.
  • α A^2 = β / r.
  • A^2 r = cte.
  • A r^1/2 = cte.

.-Ondas No Dispersivas:

Si la onda es plana, se propaga en una única dirección, por lo que la sección es constante, y se cumple:

  • I = P‾ / S = cte.
  • I = α A^2.
  • α A^2 = cte.
  • A = cte.

Efecto Doppler:

Cuando una fuente de sonido y un oyente están en movimiento uno respecto al otro, la frecuencia percibida por el agente es distinta a la transmitida por la fuente. Cuando se acercan, la frecuencia es mayor y viceversa.

Supongamos que la velocidad de la fuente “vf” y la del oyende “vo” tienen la misma dirección, siendo la dirección positiva la que va del oyente  “o” a la fuente “f”.

.-Fuente en reposo:

Si representamos los puntos con igual fase (frentes de onda) de una fase determinada, la distancia entre ellos es “λf”. El oyente se acerca con “vo” a la fuente; esta emite un sonido de frecuencia “νf”, y por tanto el periodo es:

  • Tf = 1 / νf.

Si conocemos la velocidad del sonido “v”,  resulta que:

  • λf = v Tf.

, y es que aunque “o” ve una separación “λf”, percibe una frecuencia mayor, porque su velocidad medida “v’” es:

  • v’ = vo + v.

Por lo que su frecuencia medida es:

  • νo = v’ / λf = (v + vo) / (v / νf) = (v + vo) νf / v.

.-Fuente y oyente en movimiento:

Al desplazarse “f”, se desplazan los centros de origen de las ondas, por lo que “λ1 ≠ λ2″.

Definimos “Tf” como el tiempo en que la cresta recorre “v Tf”, y la fuente “vf Tf”:

  • λ = v Tf + vf Tf = (v + vf) / νf.

De modo que en la fórmula de la frecuencia medida cambia este parámetro:

  • νo = v’ / λf = (v + vo) / (v + vf / νf) = (v + vo) νf / (v + vf).

En general, aunque “f” y “o” tengan la misma velocidad relativa, el efecto Doppler será distinto según se mueve “f”, “0″ o los dos.

Conociendo ya la geometría del plano y del espacio, en esta entrada pretendo dar un salto más allá y analizar qué pasa con ciertas figuras cuando introducimos el parámetro tiempo en nuestras descripciones. A diferencia de sus geometrías precedentes, aquí nos encontraremos con la particularidad de que los tres ejes (x, y, z, t) no son equivalentes, y que denominaremos a las figuras de forma diferente  según dónde esté ubicado el parámetro “t” en la ecuación, es decir, la geometría espacio-temporal es una idea más compleja que la geometría de 4 dimensiones, si bien tienen varias cosas en común. Así pues, estructuraré esta entrada explicando las cosas según el modelo 4-D, y después aportando las restricciones de que la 4ª dimensión. El espacio sobre el que trabajaremos será euclidiano, por lo que despreciaremos cualquier posible efecto relativista.

Puntos y vectores en 4 dimensiones:

En analogía con los anteriores espacios, el punto “¬P” se representará en función de sus 4 parámetros (x, y, z, t), y todo vector “¬v” dependerá de sus cuatro componentes (vx, vy, vz, vt).

Recta en 4 dimensiones:

A partir de las anteriores definiciones, podemos describir nuestra primera figura geométrica del siguiente modo:

  • ¬P = ¬P0 + λ ¬v.
  • ¬P = (x, y, z, t).
  • ¬P0 = (x0, y0, z0, t0).
  • ¬v = (vx, vy, vz, vt).

, donde “λ” puede tomar cualquier valor real y “P0″ representa un punto cualquiera de la recta.

En versión paramétrica, sus ecuaciones serían:

  • x = x0 + λ vx.
  • y = y0 + λ vy.
  • z = z0 + λ vz.
  • t = t0 + λ vt.

En continua:

  • λ = (x – xo) / vx = (y – yo) / vy = (z – zo) / vz = (t – t0) / vt.

, también representable como:

  • λ = Δx / vx = Δy / vy = Δz / vz = Δt / vt.

Punto en M.R.U.. Vector velocidad:

La recta “r” en 4 dimensiones antes descrita, si tiene un vector director “¬v” que cumpla:

  • vz ≠ 0.

toma un único valor (x, y, z) para cada valor de “t”, por lo que podemos considerarla, en analogía con el espacio en 3 dimensiones, un punto en movimiento.

Para ello, es más cómodo definir un cierto vector velocidad (vx, vy, vz, 1) equivalente, porque así, despejando de la ecuación continua antes vista:

  • λ = Δt.

, y obtenemos:

  • ¬P = ¬P0 + Δt ¬v.

, que, en analogía con la cinemática clásica, representa un movimiento rectilíneo uniforme (m.r.u.) para un punto material, y cumple:

  • x = x0 + vx Δt.
  • y = y0 + vy Δt.
  • z = z0 + vz Δt.
  • t = t0 + Δt.

, verificando la última ecuación nuestra definición de “Δt”.

Por último:

  • Δt = Δx / vx = Δy / vy = Δz / vz.

Evidentemente, este enfoque de la recta de 4 dimensiones no tiene sentido en caso de que:

  • vt = 0.

, pues toda ella estaría comprendida dentro de un único valor de “t”, inmóvil.

Posición relativa de dos rectas de 4 Dimensiones:

Dadas dos rectas “r1″ y “r2″ 4-D:

  • ¬P1 = ¬P01 + α ¬v1.
  • ¬P2 = ¬P02 + β ¬v2.

Diremos que son paralelas si sus vectores lo son, es decir, si “α” toma algún valor tal que:

  • α ¬v1 = ¬v2.

Si además de ésto, el punto “¬P02″ pertenece a “r1″, serán coincidentes:

  • ¬P01 + α ¬v1 = ¬P02.

En caso de que no sean paralelas, simplemente podrán cortarse o no. Si se cortan es trivial deducir el único punto de corte (x, y, z, t) que puden poseer, pues tiene que ser el único que tengan en común.

  • x = x01 + α vx1 = x02 + β vx2.
  • y = y01 + α vy1 = y02 + β vy2.
  • z = z01 + α vz1 = z02 + β vz2.
  • t = t01 + α vt1 = t02 + β vt2.

En caso de que el sistema tenga solución se cortan en ella. En caso contrario simplemente se cruzan, pero no llegan a chocar.

Movimiento Relativo de Dos Puntos en M.R.U:

Si, a partir del apartado anterior, queremos que nuestras rectas 4-D “r1″ y “r2″ sean ambas puntos en m.r.u., deben cumplir que:

  • v1t ≠ 0.
  • v2t ≠ 0.

, y por comodidad les impondremos:

  • t01 = 0.
  • t02 = 0.
  • v1t = 1.
  • v2t = 1.

Las dos primeras condiciones se cumplen tomando como puntos de origen “¬P01″ y “¬P02″ aquéllos ubicados en:

  • t = 0.

para cada una. Es decir, no basta con poner un “0″ en sus coordenadas de golpe. Para la segunda hay que dividir todas las componentes de los vectores dirección entre sus componentes “v1t” y “v2t” respectivamente.

Nos resultan así:

  • (x, y, z, t) = (x01, y01, z01, 0) + Δt (v1x, v1y, v1z, 1).
  • (x, y, z, t) = (x02, y02, z02, 0) + Δt (v2x, v2y, v2z, 1).

Estos cuerpos tomarán trayectorias paralelas si:

  • Δt ¬v1 = ¬v2.

, y además serán coincidentes si:

  • ¬P01 = ¬P02.

Si sus trayectorias no son paralelas pueden colisionar o no. Y si lo hacen tiene que existir un valor “Δt” en el que cumplan:

  • x01 + v1x Δt = x02 + v2x Δt.
  • y01 + v1y Δt = y02 + v2y Δt.
  • z01 + v1z Δt = z02 + v2z Δt.

Plano en 4 Dimensiones:

Denominaremos plano 4-D “γ” al conjunto de puntos que cumplen la ecuación:

  • ¬P = ¬P0 + α ¬v + β ¬w.

En paramétricas:

  • x = xo + α vx + β wx.
  • y = yo + α vy + β wy.
  • z = zo + α vz + β wz.
  • t = to + α vt + β wt.

Recta en M.R.U:

Esta vez las condiciones que impondremos sobre la ecuación serán más complejas. En primer lugar:

  • t0 = 0.

, como hemos hecho hasta ahora. En segundo lugar, tan solo uno de los dos vectores “¬v” o “¬w” debe depender del tiempo, por lo que sin pérdida de generalidad impondremos:

  • vt = 1.
  • wt = 0.

La unión de estas dos condiciones sin alterar la ecuación original es bastante compleja, por lo que la explicaré paso a paso. En primer lugar debemos considerar el vector 3-D perpendicular a las  componentes (x, y, z) de los “¬v” y “¬w” originales a través del producto vectorial:

  • ¬l = (vy wz – vz wy, vx wz – vz wx, vx wy – vy wx) = (lx, ly, lz).

Depués denominar un nuevo vector:

  • ¬m = (wx – vx, wy – vy, wz – vz, 0) = (mx, my, mz, 0).

Y finalmente el vector producto vectorial de “¬l” y las componentes (x, y, z) de “¬m”:

  • ¬n = (ly mz – lz my, lx mz – lz mx, lx my – ly mx) = (nx, ny, nz).

Y fabricamos los nuevos vectores:

  • ¬v = ¬m.
  • ¬w = (nx, ny, nz, 1).

Y nos resulta:

  • ¬P = ¬P0 + λ ¬v + Δt ¬w.

Teniendo esta ecuación resulta evidente que para valores fijos de “Δt” la figura resultante es una recta, que se va desplazando con m.r.u. a lo largo del tiempo.

En caso de que inicialmente ya solo uno de los dos vectores dependa del tiempo tan solo hay que dejar la componente “t” del otro igual a “1″, y en caso de que ninguno de ellos lo haga estariamos ante un simple plano estacionario de ecuaciones:

  • (x, y, z) = (x0, y0, z0) + α (vx, vy, vz) + β (wx, wy, wz).
  • t = t0.

Posición Relativa entre dos Planos de 4 Dimensiones:

Dados dos planos 4-D “γ1″ y “γ2″ genéricos:

  • ¬P1 = ¬P01 + α ¬v1 + β ¬w1.
  • ¬P2 = ¬P02 + δ ¬v2 + ε ¬w2.

Para que sean paralelos el subespacio generado por sus vectores debe tener dimensión dos. Es decir, que de entre los vectores “¬v1″, “¬v2″, “¬w1″, “¬w2″ dos de ellos sean linealmente dependientes de los otros dos. Lo cual es equivalente a calcular el rango de la matriz:

  • M  = [v1x, v1y, v1z, v1t; v2x, v2y, v2z, v2t; w1x, w1y, w1z, w1t; w2x, w2y, w2z, w2t].

y comprobar que es igual a “2″.

Si además de ser paralelas, el punto “¬P02″ pertenece a “γ1″:

  • ¬P01 + α ¬v1 + β ¬w1 = ¬P02.

para algún par de valores de “α” y “β” serán, además, coincidentes.

Si, en cambio, el rango de la matriz “M” es “3″, los planos 4-D se podrán cortar en una recta 4-D, y en caso de que el rango sea “4″, se cortarán en un punto que satisfaga:

  • x = x01 + α v1x + β w1x = x02 + δ v2x + ε w2x.
  • y = y01 + α v1y + β w1y = y02 + δ v2y + ε w2y.
  • z = z01 + α v1z + β w1z = x02 + δ v2z + ε w2z.
  • t = t01 + α v1t + β w1t = t02 + δ v2t + ε w2t.

, y sabemos que este sistema siempre puede tener solución porque estamos ante cuatro ecuaciones linealmente independientes de cuatro vectores. En caso de que el rango sea “3″, como ya dijimos, el corte se producirá sobre una recta 4-D, pues estaremos ante un sistema de cuatro ecuaciones compatibles y dependientes de tres vectores (el cuarto es combinación lineal de los anteriores).

Concluimos pues que, por muy antiintuitivo que sea, dos planos 4-D pueden intersecar en un punto, como veremos más detalladamente en el próximo apartado.

Por último, e intuitivamente, si el mencionado sistema de ecuaciones resulta incompatible, no poseerán puntos en común.

Movimiento Relativo de Dos Rectas en M.R.U:

Dadas dos rectas en m.r.u. “γ1″ y “γ2″:

  • ¬P1 = ¬P01 + d ¬v1 + Δt ¬w1.
  • ¬P2 = ¬Po2 + e ¬v2 + Δt¬w2.

Serán paralelas si, para algún valor de “d” y “Δt”, se cumple:

  • d ¬v1 = ¬v2.
  • Δt ¬w1 = ¬w2.

Si además:

  • ¬P01 + d ¬v1 + Δt ¬w1 = ¬P02.

serán coincidentes.

Analicemos ahora los posibles cortes. En caso de que no sean paralelas generalmente se cortarán en un punto, pues barrerán dos planos sobre el espacio 3-D, que siempre intersecan según las ecuaciones antes vistas.

La única posibilidad de que dos rectas en m.r.u. intersequen en una recta es que ambas coincidan en algún espacio 3-D delimitado por un determinado tiempo “t”, es decir, que sus vectores “¬v” sean linealmente dependientes, y que además, si prescindimos de ellos, los puntos en movimiento “r” y “s” determinados por:

  • ¬P1 = ¬P01 + Δt ¬w1.
  • ¬P2 = ¬P02 + Δt ¬w2.

converjan.

Movimiento Relativo de una Recta en M.R.U. Respecto a un Plano Estacionario:

Supongamos la recta en m.r.u. “r” y el plano estacionario “s” dados por las ecuaciones:

  • ¬P1 = ¬P01 + e ¬v1 + Δt ¬w1.
  • ¬P2 = ¬P02 + α ¬v2 + β ¬w2.

, donde obviamente “s” tiene un valor fijo del tiempo por definición.

Cuando se cumpla:

  • ¬t1 = ¬t2.

recta y plano compartirán el mismo espacio y las leyes que rigen su intersección son las vistas en R^3.

Si las componentes (x, y, z) de “¬v1″ son linealmente dependientes de las de los vectores “¬v2″ y “¬w2″ la “r” estará contenida en “s” durante el instante “t” mencionado, mientras que en caso contrario convergeran en un punto.

Espacio Generado por 3 Vectores de 4 Dimensiones:

Definimos como volumen 4-D “π” al conjunto de puntos que cumplen la ecuación:

  • ¬P = ¬P0 + α ¬u + β ¬v + γ ¬w.

, y como tiene una dimensión menos que la del espacio total, podemos definirlo a través de la ecuación normal con ayuda del vector “¬n” perpendicular a los tres vectores directores de “π”. Ésto lo realizamos a través de un producto vectorial de 4 dimensiones, definido como el determinante de la matriz:

  • [¬i, ¬j, ¬k, ¬l; ux, uy, uz, ut; vx, vy, vz, vt; wx, wy, wz, wt].

, donde “¬l” es el vector unitario en la dirección tiempo. Se calcule como se calcule este determinante (según el orden de los vectores), el resultado siempre será el mismo, excepto tal vez un cambio de signo que no afecta, resultándonos:

  • ¬n = (nx, ny, nz, nt).

De modo que la ecuación normal nos resultará:

  • nx x + ny y + nz z + nt t + k = 0.

, que por primera vez no es una ecuación vectorial. “k” es un escalar que se calcula de modo que el punto “¬P0″ satisfaga la ecuación. Más concretamente, resulta sencillo representar esta ecuación como un producto escalar:

  • ¬n ¬P + k = 0.

, donde “¬P” representa al conjunto de puntos que cumplen esa ecuación.

Plano en M.R.U:

Si a partir de la ecuación:

  • ¬P = ¬P0 + α ¬u + β ¬v + γ ¬w.

Imponemos las condiciones:

  • t0 = 0.
  • ut = 0.
  • vt = 0.
  • wt = 1.

a través de los métodos anteriormente vistos, obtenemos:

  • ¬P = ¬P0 + d ¬u + e ¬v + Δt ¬w.

, donde se aprecia que estamos ante la ecuación de un plano que se mueve con un m.r.u. a lo largo del tiempo.

No obstante, también es más cómodo representarlo a través de su ecuación normal, entre otras cosas porque siempre vamos a saber que existe, y nos permite saber con más antelación si depende del tiempo o no. Veamos algunos ejemplos:

  • t = 0.

Es el conjunto de todos los puntos que  existen en el mencionado tiempo, es decir, no es un plano en m.r.u.

  • x = 0.

Es el plano que foman entre los ejes “y” y “z”, invariante a lo largo de todo el tiempo.

  • x = t.

Es el plano antes mecionado desplazándose paralelamente al eje “x” de un modo directamente proporcional al tiempo.

Posición Relativa entre  Dos Planos en M.R.U. Redefinición de la Recta en M.R.U:

Dados dos planos en m.r.u. “π1″ y “π2″:

  • ¬n1 ¬P1 + k1 = 0.
  • ¬n2 ¬P2 + k2 = 0.

Si:

  • λ ¬n1 = ¬n2.

, son paralelos, pues sus vectores normales únicos son linealmente dependientes.

Si, además, dado un punto “¬P02″ perteneciente a “π2″, cumple:

  • ¬n1 ¬P02 + k1 = 0.

serán coincidentes.

En caso de que no sean paralelos, por lo general se cortarán siempre en una recta en m.r.u., redefinida a través de las ecuaciones de ambos. Es decir, si “π1″ y “π2″ son linealmente independientes entre ellos, sus ecuaciones juntas definen una recta.

Asimismo, la intersección de tres planos en m.r.u. linealmente independientes define un punto en m.r.u., y la intersección de cuatro define un punto.

Ejemplos:

  • t = 0.
  • x = 0.

Nos encontramos ante un plano de 4-D sobre los ejes “x” e “y” en el tiempo origen.

  • x = 0.
  • y = 0.

Nos encontramos ante la recta que compone el eje “z”, constante a lo largo del tiempo.

  • x = 0.
  • y = 0.
  • z = 0.

Definimos aquí el origen de coordenadas a lo largo del tiempo.

Movimiento Relativo entre un Plano y una Recta en M.R.U. Redefinición del Punto en M.R.U:

Sean el plano en m.r.u. “π” y la recta en m.r.u. “γ”:

  • ¬n1 ¬P1 + k1 = 0.
  • ¬n2 ¬P2 + k2 = 0.
  • ¬n3 ¬P3 + k3 = 0.

Si las tres ecuaciones son linealmente independientes se cortarán en un punto en m.r.u. definido entre las tres ecuaciones, mientras que si la primera es dependiente de alguna de las otras dos se cortarán en la propia recta “γ”.

Veamos un ejemplo:

  • x = t.
  • x = 0.
  • y = 0.

Estamos intersecando el plano perpendicular a “x” que se movia proporcionalmente a “t” con el eje “z” a lo largo del tiempo, antes definidos. Nos resulta el eje “z” en el tiempo inicial.

Movimiento Relativo entre un Plano y un Punto en M.R.U:

Sean el plano en m.r.u. “π” y el punto en m.r.u. “r”:

  • ¬n1 ¬P1 + k1 = 0.
  • ¬n2 ¬P2 + k2 = 0.
  • ¬n3 ¬P3 + k3 = 0.
  • ¬n4 ¬P4 + k4 = 0.

Si las cuatro ecuaciones son linealmente independientes se cortan en un punto, y en caso contrario se cortan en el propio punto en movimiento “r”.

Veamos un ejemplo:

  • z = 0.
  • x = 0.
  • y = 0.
  • z = 0.

Estamos intersecando el plano formado por “y” y “z” a lo largo del tiempo con el origen de coordenadas a lo largo del tiempo. Se ve que la primera ecuación es dependiente de la cuarta, por lo que se intersecan en el origen a lo largo del tiempo.

Movimiento Relativo entre una Recta y un Punto en M.R.U:

Sean la recta en m.r.u. “γ” y el punto en m.r.u. “r”:

  • ¬n1 ¬P1 + k1 = 0.
  • ¬n2 ¬P2 + k2 = 0.
  • ¬n3 ¬P3 + k3 = 0.
  • ¬n4 ¬P4 + k4 = 0.
  • ¬n5 ¬P5 + k5 = 0.

Como es imposible que cuatro ecuaciones sean linealmente independientes en un espacio 4-D, al menos una de ellas siempre será linealmente dependiente de las otra 4. Si solo una lo es, convergerán en un punto. Si lo son dos, se cortarán en el propio punto en movimiento.

Superficies Evolutivas:

Acabamos de definir el el plano en m.r.u. como una función de los parámetros (x, y, z, t) igualada a “0″, pero la forma que adopta su ecuación no es más que un caso particular que la de este tipo de superficie cuando se mueve en m.r.u. Así pues, podemos generalizar la ecuación implícita dependiente de cuatro parámetros como la que define siempre algún tipo de superficie variando en el tiempo, es decir, evolucionando, de modo que toda superficie en movimiento “σ” se podrá definir como:

  • σ(x, y, z, t) = 0.

Un plano con movimiento rectilíneo uniformemente acelerado (m.r.u.a.) tomaría la forma:

  • ¬n ¬P + (t + c)^2 = 0.

, donde “c” representa cualquier escalar constante.

Curvas Evolutivas:

Del mismo modo que la intersección de dos planos en m.r.u. engendraba una recta en m.r.u, la intersección de dos superficies evolutivas definirá una curva evolutiva “Φ”, definida con las ecuaciones de las mismas:

  • σ1(x, y, z, t) = 0.
  • σ2(x, y, z, t) = 0.

Veremos ejemplos de esto en otra ocasión.

Superficies Evolutivas de Revolución:

.-Revolución de Primer Orden:

Decimos que una superficie evolutiva consta de una revolución de primer orden si dos de sus parámetros distintos de “t”, como por ejemplo “x” e “y”, cumplen:

  • (x – x0)^2 + (y – y0)^2 = R^2.

para algún valor de “x0″, “y0″ y “R”, es decir, si sobre que el plano que forman sus ejes la superficie siempre toma la forma de circunferencias.

.-Revolución de Segundo Orden:

Diremos, en analogía con lo anterior, que una superficie evolutiva consta de una revolución de segundo orden si siempre se cumple:

  • (x – x0)^2 + (y – y0)^2 + (z – zo)^2 = R^2.

para algún valor de “x0″, “y0″, “z0″ y “R”, o dicho de otro modo, si posee forma esférica en todos los instantes de tiempo.

Superficies Evolutivas Cilíndricas:

Decimos que una superficie evolutiva “σ” es cilíndrica si, dada una curva evolutiva “Φ”, definimos una dirección vectorial “¬v” y la aplicamos sobre todos y cada uno de sus puntos. Por ejemplo, si a la esfera:

  • x^2 + y^2 + z^2 = 0.
  • t = 0.

le obligamos a seguir “λ” veces el vector:

  • ¬v = (1, 1, 1, 1).

, nos estamos cargando la segunda ecuación de nuestra figura, que fijaba el tiempo, y pasa a ser una esfera en m.r.u., es decir, una superficie evolutiva con cualidades cilíndricas.

Todas las figuras (superficies, curvas, puntos) en m.r.u. son cilíndricas.

Superficies Evolutivas Cónicas:

Dada una curva evolutiva “Φ” y un punto “¬P” perteneciente o no a la misma. Definimos como superficie evolutiva cónica al conjunto de puntos “¬Q” que cumplen, para algún valor de “λ” y algún punto “¬O” de “Φ”:

  • ¬P + λ (¬O – ¬P) = ¬Q.

Tomemos como ejemplo:

  • ¬P = (0, 0, 0, 0).

Φ:

  • x^2 + y^2 + z^2 = R^2.
  • t = 0.

al origen de coordenadas y una esfera estacionaria que lo tenga por centro. Si pensamos en todos los puntos que están alineados con el origen pasando por nuestra esfera obtenemos todo el espacio:

  • t = 0.

De modo que, en cierto modo, los espacios delimitados por un valor concreto de cualquiera de las componentes son superficies evolutivas cónicas.

Estudio General de las Cuádricas Evolutivas:

De modo análogo a como acontecía en R^2 y en R^3, todas las curvas cuádricas evolutivas estarán definidas por ecuaciones del estilo:

  • a1 x^2 + a2 y^2 + a3 z^2 + a4 t^2 + b12 z t + b13 y t + b14 y z + b23 x t + b24 x z + b34 x y + c1 x + c2 y + c3 z + c4 t + d = 0.

Matricialmente:

  • Pt M P = 0.

, donde “t” representa matriz traspuesta, y:

  • P = [1; x; y; z; t].
  • M = [d, c1, c2, c3, c4; c1, a1, b34, b24, b23; c2, b34, a2, b14, b13; c3, b24, b14, a3, b12; c4, b23, b13, b12, a4].

En general, siempre exigiremos que, para que la ecuación ciertamente represente una cuádrica evolutiva, cumpla:

  • detM ≠ 0.

Una vez sepamos esto, definimos la matriz de términos cuadráticos:

  • A = [a1, b34, b24, b23; b34, a2, b14, b13; b24, b14, a3, b12; b23, b13, b12, a4].

Y calculamos sus cuatro autovalores “λ1″, “λ2″, “λ3″, “λ4″, de los cuales a lo sumo uno de ellos será nulo. En caso de que ninguno de ellos lo sea, tal y como pasaba en anteriores dimensiones, nos encontramos ante una cuádrica evolutiva de ecuación:

  • λ1 x^2 + λ2 y^2 + λ3 z^2 + λ4 t^2 + detM / detA = 0.

En caso de que uno de ellos lo sea, pongamos por ejemplo “λ4″, nos resulta:

  • λ1 x^2 + λ2 y^2 + λ3 z^2 + 2 [- detM / (λ1 λ2 λ3)]^1/2 z = 0.

Pero estas cuádricas son genéricas para un espacio extrañamente simétrico de 4-D. Nosotros queremos que la cuarta dimensión sea el tiempo para darle sentido físico, de modo que, para las anteriores ecuaciones, no solo será interesante saber dónde está ubicado el tiempo, sino que además habrá que analizar su signo. Veamos los 18 casos posibles.

En las próximas explicaciones, despreciaremos la posible existencia de términos constantes innecesarios que, si bien nos proporcionarían más generalidad, oscurecerían la visión de las figuras descritas, que es el verdadero objetivo. Consecuentemente, todas las figuras poseerán algún grado de revolución.

Elipsoide Evolutivo Creciente:

  • x^2 + y^2 + z^2 = t.

Dada su revolución de 2º grado, estamos ante una esfera cuyo radio aumenta de la forma:

  • R = t^1/2.

Así pues, obtenemos una representación de cómo el origen de coordenadas se va dilatando esféricamente hasta el infinito.

Elipsoide Evolutivo Decreciente:

  • x^2 + y^2 + z^2 = – t.

En esta ocasión, el elipsoide solo está definido para valores negativos del tiempo, es decir, precedentes al origen. Nos encontramos ante el caso opuesto al de antes: una esfera infinita se comprime hasta ser un punto, el origen de coordenadas.

Elipsoide Evolutivo Cóncavo:

  • x^2 + y^2 + z^2 + t^2 = 1.

Dada su forma, podemos introducir el concepto de revolución de 3er grado. Si escribimos esto de un modo más claro:

  • x^2 + y^2 + z^2 = 1 – t^2.

, apreciamos que el radio de nuestra esfera se comprime con el valor absoluto del tiempo, de modo que alcanza un radio máximo en el tiempo inicial. Nos encontramos ante el origen de coordenadas, que en:

  • t = – 1.

comenzó a dilatarse esféricamente, alcanzando un radio:

  • R = 1.

en el instante:

  • t = 0.

para volver a su condición de punto en el instante:

  • t = 1.

Elipsoide Evolutivo Convexo:

  • x^2 + y^2 + z^2 – t^2 = 1.

De un modo más claro:

  • x^2 + y^2 + z^2 = 1 + t^2.

Estamos ante una esfera de radio infinito en sus orígenes, que en el instante:

  • t = 0.

se ha comprimido a una esfera:

  • x^2 + y^2 + z^2 = 1.

, para posteriormente se ha vuelto a dilatar hasta alcanzar de nuevo un radio infinito.

Elipsoide Evolutivo Imaginario:

  • x^2 + y^2 + z^2 + t^2 = – 1.

La suma de números cuadrados nunca puede ser negativa, por lo que esta ecuación no toma valores reales.

Elipsoide Evolutivo Fraccionado.

  • x^2 + y^2 + z^2 – t^2 = – 1.

Reordenando:

  • x^2 + y^2 + z^2 =  t^2 – 1.

De nuevo estamos ante una esfera de radio infinito que se contrae y se vuelve a expandir, pero en esta ocasión en los instantes:

  • t = – 1.
  • t = 1.

se cumple que:

  • R = 0.

, de modo que en el intervalo (-1, 1) no está definida. La consideramos fraccionada por este periodo de tiempo en el que su radio se contrae más de lo físicamente posible, haciéndola desaparecer hasta que crece de nuevo.

Hiperboloide Evolutivo de 2 Hojas:

  • x^2 + y^2 + t^2 – z^2 = – 1.

Expresado de otro modo:

  • x^2 + y^2 – z^2 = – 1 – t^2.

Dado que la parte derecha de la ecuación es negativa, el hiperboloide siempre será de 2 hojas, y comienza y acaba en su forma límite, que es formando dos planos infinitos en la base y en el techo del espacio 3-D. Por el medio del tiempo se va aproximando a su forma más conocida, achatándose y tendiendo a un cono hasta:

  • t = 0.

, para después crecer de nuevo y retomar su forma original.

Hiperboloide Evolutivo de 1 Hoja:

  • x^2 + y^2 – z^2 – t^2 = 1.

O dicho de otro modo:

  • x^2 + y^2 – z^2 = 1 + t^2.

Como la parte derecha siempre es positiva, siempre estaremos ante un hiperboloide de 1 hoja, que comienza siendo un cilindro de radio infinito, para después achatarse por el centro, tendiendo a formar un cono hasta:

  • t = o.

, momento en el que vuelve a expandirse.

Hiperboloide Evolutivo Creciente:

  • x^2 + y^2 – z^2 = t.

Observamos que, en un principio, a medida que “t” es negativo y se va aproximando al “0″, estamos ante un hiperboloide evolutivo de 2 hojas con una evolución más lineal. Sin embargo, en esta ocasión, cuando:

  • t = 0.

llega a ser un cono, y no recupera su forma original, sino que el cono se transforma a en un hiperboloide evolutivo de 1 hoja que acabará siendo un cilindro de radio infinito.

Hiperboloide Evolutivo Decreciente:

  • x^2 + y^2 – z^2 = – t.

Estamos ante el mismo caso que antes, solo que en esta ocasión comienza siendo un  hiperboloide evolutivo de 1 hoja y acaba siendo un 2 hojas.

Hiperboloide Evolutivo Centrado en 2 Hojas:

  • x^2 + y^2 – z^2 – t^2 = -1.

También expresable como:

  • x^2 + y^2 – z^2 = -1 + t^2.

En analogía con el hiperboloide evolutivo de 1 hoja, el término de la derecha es casi siempre positivo, y por tanto podemos compararlos, con la particularidad de que esta vez en los valores:

  • t = – 1.
  • t = 1.

llega a ser un cono, y en el intervalo (-1, 1) es un 2 hojas que se infla un poco para deshacerse de nuevo y dar lugar al 1 hoja original.

Hiperboloide Evolutivo Centrado en 1 Hoja:

  • x^2 + y^2 + t^2 – z^2 = 1.

Enunciable mejor como:

  • x^2 + y^2 – z^2 = 1 – t^2.

Comparándolo con el anterior, el término de la derecha es casi siempre evolutivo, y podemos asumir que se comporta exactamente igual cambiando en todo momento “2 hojas” por “1 hoja” y viceversa.

Paraboloide Evolutivo Elíptico Creciente 1:

  • x^2 + y^2 + t^2 = z.

De un modo más claro:

  • x^2 + y^2 = z – t^2.

El paraboloide solo está definido para valores positivos del miembro derecho de la ecuación, por lo que a medida que aumenta el valor absoluto del tiempo el vértice del paraboloide se eleva a:

  • z = t^2.

Paraboloide Evolutivo Elíptico Decreciente 1:

  • x^2 + y^2 + t^2 = – z.

Enunciable como:

  • x^2 + y^2 = – z – t^2.

Debido a que el segundo miembro siempre tiene que ser positivo para que esté definido, el vértice del paraboloide se encontrará en todo momento en:

  • z = – t^2.

, e irá descendiendo o ascendiendo acorde con ello. Este paraboloide está curvado hacia abajo, mientras que el anterior lo estaba hacia arriba.

Paraboloide Evolutivo Elíptico Creciente 2:

  • x^2 + y^2 – t^2 = z.

Operando:

  • x^2 + y^2 = z + t^2.

El vértice de este paraboloide estará ubicado en:

  • z = – t^2.

, ascendiendo.

Paraboloide Evolutivo Elíptico Decreciente 2:

  • x^2 + y^2 – t^2 =  – z.

Haciendo el cambio pertinente:

  • x^2 + y^2 =  – z + t^2.

Tenemos el vértice ubicado en:

  • z = t^2.

, descendiendo.

Paraboloide Evolutivo Hiperbólico Creciente:

  • x^2 + t^2 – y^2 = z.

El punto de silla de la figura se encuentra en:

  • z = t^2.

, ascendiendo con el valor absoluto del tiempo.

Paraboloide Evolutivo Hiperbólico Decreciente:

  • x^2 + t^2 – y^2 = – z.

Tenemos un punto de silla descendiente en:

  • z = – t^2.

En anteriores capítulos hemos tratado la geometría analítica en el plano y en el espacio, y consecuentemente las curvas cónicas y las cuádricas. Haremos ahora, pues, un análisis detallado de las mismas.

Análisis General de las Cónicas:

Hasta el momento habíamos considerado las tres cónicas fundamentales a partir de sus ecuaciones reducidas. Estas ecuaciones son de segundo grado en las coordenadas “x” e “y”. Si cambiamos el origen de corrdenadas o rotamos los ejes, las ecuaciones reducidas de las cónicas se transforman en ecuaciones de segundo grado. Consideremos la ecuación general:

  • a1 x^2 + a2 y^2 + 2 b x y + 2 c1 x + 2 c2 y + d = 0.

Esta ecuación se puede escribir de forma matricial como:

  • [x, y] [a1, b; b, a2] [x; y] 2 [c1, c2] [x; y] + d = 0.

, o bien:

  • Pt A P + 2 Bt P + c = 0.

, donde la “t” junto a una matriz indica traspuesta, es decir, las filas intercambiadas por las culumnas, y:

  • P = [x; y].
  • B = [c1; c2].
  • A = [a1, b; b, a2].

De una forma más compacta:

  • [1, x, y] [d, c1, c2; c1, a1, b; c2, b, a2] [1, x, y] = 0.
  • Qt M Q = 0.
  • Q = [1; x; y].

El lugar geométrico de los puntos (x, y) que verifican la ecuación anterior respecto a un sistema de coordenadas concreto se denomina cónica. En general, pediremos que:

  • [a1, b; b, a2] ≠ [0, 0; 0, 0].

, ya que en caso contrario tendríamos la ecuación de una línea recta en el plano. Adoptaremos la notación:

  • M = [d, c1, c2; c1, a1, b; c2, b, a2].
  • A = [a1, b; b, a2].

La matriz “A” es simétrica. A la matriz “M” se la denomina matriz de la cónica, mientras que a “A” la denominamos matriz de los términos cuadráticos.

Cónica Ordinaria y Cónica Degenerada:

Si una cónica cumple que:

  • detM ≠ 0.

, se la denomina cónica ordinaria, y será en general una elipse, una hipérbola o una parábola.

Si una cónica cumple que:

  • detM = 0.

, se la denomina cónica degeneradam y será la ecuación de un punto, un par de rectas, o tal vez no tendrá solución real.

Ecuación Reducida de las Cónicas:

Consideremos una cónica de ecuación:

  • a1 x^2 + a2 y^2 + 2 b x y + 2 c1 x + 2 c2 y + d = 0.

, o bien en forma matricial:

  • [1, x, y] [d, c1, c2; c1, a1, b; c2, b, a2] [1, x, y] = 0.

Sabemos, además, que siempre existe una rotación de ejes que diagonaliza la matriz de los términos cuadráticos:

  • A = [a1, b; b, a2].

Sea entonces ésta la transformación:

  • x’ = Cosσ x – Senσ y.
  • y’ = Senσx + Cosσ y.

En las nuevas coordenadas:

  • A’ = [λ1, 0; 0, λ2].

, y la ecuación de la cónica se escribe como:

  • λ1 (x’)^2 + λ2 (y’)^2 + 2 α x’ + 2 β y’ + γ = 0.

Consideremos los casos:

.- λ1, λ2 ≠ 0:

Podemos entonces trasladar el origen de coordenadas de modo que en unas nuevas coordenadas (x”, y”) la ecuación sea:

  • λ1 (x”)^2 + λ2(y”)^2 + k = 0.

Basta tomar:

  • x’ = x” – α / λ1.
  • y’ = y” – β / λ2.

, y sustituirlo en la ecuación general:

  • λ1 (x’)^2 + λ2 (y’)^2 + 2 α x’ + 2 β y’ + γ = 0.

, de donde:

  • λ1 (x”)^2 + λ2(y”)^2 + k = 0.

, con:

  • k = γ – α^2 / λ1 – β^2 / λ2.

En este nuevo sistema de ejes:

  • M” = [k, 0, 0; 0, λ1, 0; 0, 0, λ2].
  • A” = [λ1, 0; 0, λ2].

, por tanto:

  • detM” = ρ^3 detM.
  • detA” = ρ^2 detA.
  • λ1 = ρ λ1.
  • λ2 = ρ λ2.

De aquí obtenemos:

  • ρ = 1.

, y además:

  • k λ1 λ2 = detM.
  • λ1 λ2 = detA.
  • k = detM / detA.

Llegamos a la ecuación reducida:

  • λ1(x”)^2 + λ2 (y”)^2 + detM / detA = 0.

Los tipos de cónicas descritas por esta ecuación reducida son elipses e hipérbolas, y pares de rectas concurrentes:

Elipses:

  • λ1 > 0.
  • λ2 > 0.
  • detM / detA < 0.
  • λ1 < 0.
  • λ2 < 0.
  • detM / detA > 0.

Elipses Imaginarias:

  • λ1 > 0.
  • λ2 > 0.
  • detM / detA > 0.
  • λ1 < 0.
  • λ2 < 0.
  • detM / detA > 0.

Hipérbolas:

  • λ1 > 0.
  • λ2 < 0.
  • detM / detA ≠ 0.
  • λ1 < 0.
  • λ2 > 0.
  • detM / detA ≠ 0.

Pares de rectas:

  • λ1 λ2 < 0.
  • detM = 0.

Origen:

  • λ1 λ2 > 0.
  • detM = 0.

.-Alguno de los Autovalores de “A” es nulo.

Sin pérdida de generalidad, podemos considerar:

  • λ1 = 0.
  • λ2 ≠ 0.

Si consideremos la ecuación en el sistema en que “A” es diagonal tendremos:

  • λ2 (y’)^2 + 2 α x’ + 2 β y’ + γ = 0.

Hacemos el cambio:

  • y’ = y” – β / λ2.
  • x’ = x”.

Denotando:

  • k = γ – β^2 / λ2.

tenemos:

  • λ2 (y”)^2 + 2 α x” + k = 0.

Hagamos ahora el cambio:

  • y”’ = y”.
  • x”’ = x” + k / (2 α).
  • λ2 (y”’)^2 + 2 α (x”’ – k / (2 α)) + k = 0.
  • λ2 (y”’)^2 + 2 α x”’ = 0.
  • M”’ = [0, α, 0; α, 0, o; 0, 0, λ2].
  • A”’ = [0, 0; 0, λ2].
  • detM”’ = – α^2 λ2 = ρ^3 det M.
  • λ2 = ρ λ2.

Entonces tenemos de nuevo:

  • ρ = 1.

, y:

  • α^2 = – detM / λ2 > 0.

Por tanto la ecuación de la cónica será:

  • λ2 (y”’)^2 + 2 [- detM / λ2]^1/2 x”’ = 0.

En esta ecuación los dos signos de la raíz son posibles.

Parábolas:

  • detM ≠ 0.

Rectas:

  • detM = 0.

Estudio General de las Cuádricas:

Denominaremos cuádrica al lugar geométrico de los puntos cuyas coordenadas (x, y, z) satisfacen una ecuación del tipo:

  • a1 x^2 + a2 y^2 + a3 z^2 + 2 b1 yz + 2 b2 xz + 2 b3 xy + 2 c1 x + 2 c2 y + 2 c3 z + d = 0.

En forma matricial la escribimos como:

  • [1, x, y, z] [d, c1, c2, c3; c1, a1, b3, b2; c2, b3, a2, b1; c3, b2, b1, a3] [1; x; y; z] = 0.
  • Qt M Q = 0.

Denominamos matriz de la cuádrica y matriz de los términos cuadráticos, respectivamente, a:

  • M = [d, c1, c2, c3; c1, a1, b3, b2; c2, b3, a2, b1; c3, b2, b1, a3].
  • A = [a1, b3, b2; b3, a2, b1; b2, b1, a3].

También podemos escribir la cuádrica de la siguiente manera:

  • [x, y, z] A [x; y; z] + 2 [c1, c2, c3] [x; y; z] +d = 0.
  • Pt A P + 2 Ct + d = 0.

Si:

  • detM ≠ 0.

, tendremos una cuádrica ordinaria: un elipsoide, un hiperboloide o un paraboloide.

Si:

  • detM = 0.

, tendremos una cuádrica degenerada: un cono, un cilindro o un par de planos.

Ecuaciones Reducidas de las Cuádricas:

Consideremos un cierto sistema de ejes y sea la cuádrica con ecuación:

  • a1 x^2 + a2 y^2 + a3 z^2 + 2 b1 yz + 2 b2 xz + 2 b3 xy + 2 c1 x + 2 c2 y + 2 c3 z + d = 0.

Como “A” es una matriz simétrica diagonalizable, para una cierta transformación ortogonal cumplirá que:

  • A = [λ1, 0, 0; 0, λ2, 0; 0, 0, λ3].

En estas nuevas coordenadas, la cuádrica se escribe como:

  • λ1 (x’)^2 + λ2 (y’)^2 + λ3 (z’)^2 + 2 α x’ + 2 β y’ + 2 γ z’ + δ = 0.

.-Si ninguno de los autovalores es nulo:

Podemos hacer los cambios:

  • x’ = x” – α / λ1.
  • y’ = y” – β / λ2.
  • z’ = z” – γ / λ3.

Con lo cual obtenemos:

  • λ1 (x’)^2 + λ2 (y’)^2 + λ3 (z’)^2 + k = 0.
  • M” = [k, 0, 0, 0; 0, λ1, 0, 0; 0, 0, λ2, 0; 0, 0, λ3].
  • detM” = ρ^4 detM.
  • detA” = ρ^3 detA.
  • λ1 = ρ λ1.
  • λ2 = ρ λ2.
  • λ3 = ρ λ3.

Por lo tanto:

  • ρ = 1.

, y obtenemos:

  • k = detM / detA.

La ecuación reducida de la cuádrica es entonces:

  • λ1 (x’)^2 + λ2 (y’)^2 + λ3 (z’)^2 + detM / detA = 0.

Y ésta será en general un hiperboloide, un elipsoide o un cono.

.-Supongamos que un Autovalor es Nulo:

Podemos tomar sin pérdida de generalidad:

  • λ3 = 0.

Entonces la ecuación de la cuádrica es:

  • λ1 (x’)^2 + λ2 (y’)^2 + 2 α x’ + 2 β y’ + 2 γ z’ + δ = 0.

Haciendo los cambios:

  • x’ = x” – α / λ1.
  • y’ = y” – β / λ2.
  • z’ = z”.

, obtenemos:

  • λ1 (x”)^2 + λ2 (y”)^2 + 2 γ z” + k = 0.

Como para que sea una cuádrica:

  • detM ≠ 0.

, vemos que la matriz M” es:

  • [k, 0, 0, γ; 0, λ1, 0, 0; 0, 0, λ2, 0; γ, 0, 0, 0].

Tenemos:

  • detM” = – γ^2 λ1 λ2 ≠ 0.

, y consecuentemente:

  • γ ≠ 0.

, y podemos hacer el cambio:

  • z” = z”’ – k / (2 γ).

, con lo cual obtenemos la ecuación:

  • λ1 (x”’)^2 + λ2 (y”’)^2 + 2 γ z’ ” = 0.

Podemos obtener “γ” en función de “detM”, “λ1″ y “λ2″:

  • detM”’ = – ρ γ^2 λ1 λ2 = detM.
  • λ1 = ρ λ1.
  • λ2 = ρ λ2.

, por tanto:

  • ρ = 1.

y despejamos “γ”:

  • γ^2 = – detM / (λ1 λ2).
  • γ = [- detM / (λ1 λ2)]^1/2.

, con lo que la ecuación reducida se escribe como:

  • λ1 (x”’)^2 + λ2 (y”’)^2 + 2 [- detM / (λ1 λ2)]^1/2 z’ ” = 0.

, y es un paraboloide elíptico o hiperbólico.

A partir de la teoría de aplicaciones lineales ya vista, es posible, siempre que la aplicación vaya de un espacio R^n a otro R^n, enfocar la aplicación como un cambio de base, es decir, si yo defino una base de vectores, por ejemplo en R^3:

  • ¬v1 = (v1x, v1y, v1z).
  • ¬v2 = (v2x, v2y, v2z).
  • ¬v3 = (v3x, v3y, v3z).

en función de la base canónica de vectores:

  • ¬i = (1, 0, o).
  • ¬j = (0, 1, 0).
  • ¬k = (0, 0, 1).

, estoy diciendo que:

  • ¬v1 = v11 ¬i + v12 ¬j + v13 ¬k.
  • ¬v2 = v21 ¬i + v22 ¬j + v23 ¬k.
  • ¬v3 = v31 ¬i + v32 ¬j + v33 ¬k.

Pero no siempre tenemos que representar las coordenadas de nuestro vector en la base canónica, y si elegimos otra base cambiarán sustancialmente.

Consideremos los vectores {¬v1, ¬v2, ¬v3} respecto a su propia base. Obtendríamos:

  • ¬v1 = (1, o, o).
  • ¬v2 = (0, 1, 0).
  • ¬v3 = (0, 0, 1).

Y la base canónica se expresaría de otro modo:

  • ¬i = ξ11 ¬v1 + ξ12 ¬v2 + ξ13 ¬v3.
  • ¬j = ξ21 ¬v1 + ξ22 ¬v2 +ξ23 ¬v3.
  • ¬k = ξ31 ¬v1 + ξ32 ¬v2 + ξ33 ¬v3.

Los coeficientes “vij” y “ξij” definen un par de matrices inversas, “V” y “Ξ”, que representan, respectivamente, el cambio de la base {¬v1, ¬v2, ¬v3} a la base {¬i, ¬j, ¬k}, y viceversa.

Visto esto, una aplicación lineal poseerá una matriz asociada distinta según la base respecto a la cual se haga, y denominaremos Diagonalización de de la Matriz de una Aplicación Lineal al cambio de base que simplifica la transformación, de tal modo que la imagen de cualquier vector ¬v={vx, vy, vz}, sea simplemente f(¬v)={λ1 vx, λ2 vy, λ3 vz}. Es decir, la transformación depende solo de “n” coeficientes {λ1, λ2, λ3}, y no de “n^2″ como en el caso general. (Si ahora tenemos tres coeficientes es porque estamos viendo el caso particular de R^3 sin perdida de generalidad).

Denominaremos Autovector a cualquier vector perteneciente al espacio de partida que, tras tomar imagen en la aplicación lineal es linealmente dependiente consigo mismo, es decir, “¬v” es un autovector si:

  • f(¬v) = λ ¬v.

, y por tanto todos los autovectores toman valores en sus propios subespacios. El coeficiente “λ” asociado al autovector se define como Autovalor de la aplicación lineal, y existirán tantos como autovectores linealmente independientes se puedan encontrar. Resulta obvio, entonces, que una aplicación lineal de un espacio de “n” dimensiones poseerá “n” autovalores como mucho.

Veamos ahora cómo calcular dichos autovalores. En R^3 supondremos una aplicación lineal tal que:

  • ¬vx’ = a11 ¬vx + a12 ¬vy + a13 ¬vz.
  • ¬vy’ = a21 ¬vx + a22 ¬vy + a23 ¬vz.
  • ¬vz’ = a31 ¬vx + a32 ¬vy + a33 ¬vz.

Matricialmente:

  • ¬v’ = M ¬v.

, donde “M” es la matriz de la aplicación lineal.

Si suponemos “¬v” un autovector, cumplirá:

  • M ¬v = λ I ¬v,

, donde “I” es la matriz identidad, necesaria para la expresión.

Agrupando:

  • (M – λ I) ¬v = ¬0.

Y esto es lo mismo que exigir que:

  • |M – λ I| = ¬0.

Así pues, si queremos calcular los posibles valores de “λ”, no tenemos más que despejarlos de esta simple operación (pueden resultar complejos). Resuelto esto, se pueden despejar los autovectores del sistma para cada valor de “λ”.

Hechos los cálculos, siempre se cumple que nuestra nueva aplicación lineal, enfocada desde la base de los autovectores, tomará la forma:

  • ¬vx’ = λ1 ¬vx.
  • ¬vy’ = λ2 ¬vy.
  • ¬vz’ = λ3 ¬vz.

, la cual simplifica bastante las cosas.

vectoresResumiremos brevemente en esta entrada algunas propiedades importantes de los espacios euclidianos de “n” dimensiones, definidos a través del conjunto de vectores “¬vi = {vi1, vi2, …, vin}” que los componen.

Dependencia Lineal:

Hablamos de dependencia lineal entre dos o más vectores cuando uno de ellos se puede construir combinando los demás.

Sean, por ejemplo, los vectores “¬v” y “¬w”, si se cumple:

  • ¬v = α ¬w.

, siendo “λ” un número real, decimos que “v” es linealmente dependiente de “w”.

Análogamente, si poseemos tres vectores “¬u”, “¬v”, “¬w”,  siendo “v” y “w” linealmente independientes, y se verifica:

  • ¬u = α ¬v + β ¬w.

, “¬u” es linealmente dependiente de “¬v” y “¬w”.

Por las propiedades de esta denominada dependencia lineal, el modo de calcular los valores “α” y “β” es por medio de las componentes de los vecores:

  • u1 = α v1 + β w1.
  • u2 = α v2 + β w2.
  • un = α vn + β wn.

Dado que tenemos 2 incógnitas y “n” ecuaciones, si el sistema es incompatible “u” no es linealmente dependiente de “¬v” y “¬w”, si es compatible siempre será determinado y podremos calcular los coeficientes deseados.

El método del cálculo es análogo para trabajar con cualquier número de vectores.

Demostraremos ahora que, en un espacio de “n” dimensiones, el número máximo de vectores linealmente independientes entre ellos es también “n”. Para ello supondremos que no, y que es posible que dados “n + 1″ vectores, es posible que cada uno de ellos sea linealmente independiente de los anteriores. Si representamos las ecuaciones correspondientes, igualando cada componente del vector estudiado a una combinación de los otros a través de los coeficientes que, en caso de que fuesen linealmente dependientes, existitían.En este caso tendríamos un sistema de “n” incógnitas y de “n” ecuaciones incompatible, tal y como hemos visto antes. Sin embargo, las leyes fundamentales del álgebra nos dicen que a no ser que dos de las ecuaciones sean linealmente dependientes, es imposible que el sistema sea incompatible, y como hemos puesto de condición que nuestros vectores fuesen linealmente independientes llegamos a una contradicción. El vector “n + 1″ tiene que ser, a la fuerza, dependiente de los anteriores.

Subespacios:

Conocido el concepto de dependencia lineal, podemos comenzar a valorar sus consecuencias geométricas.

Dado un espacio de dimensión “n”, siempre existirán, como mucho, combinaciones de hasta “n” vectores linealmente independientes, y todos los demás podrán ser expresados como una combinación lineal de los mismos.

Si consideramos el espacio R^1, es decir, la recta, el único vector independiente existente nos indica la dirección de la misma, y podemos generar todo el espacio (la recta), como combinación lineal del mismo.

Si consideramos el espacio R^2, el plano, y sobre él definimos un vector (v1, v2), que al ser libre deberemos ubicar sobre el origen, combinanciones lineales del mismo definirán la recta sobre el plano que pasa por el origen con la dirección del vector. Dicha recta, compuesta por los vectores linealmente dependientes al mismo, es un subespacio de R^2 de dimensión “1″. Si definimos otro vector linealmente independiente con el primero, cualquier punto de R^2 se podrá construir como combinación lineal de los anteriores.

Si ampliamos a R^3, con un vector podremos definir un subespacio de dimensión “1″, que será una vez más una recta que cruce el origen de coordenadas.  Añadiendo un vector más linealmente independiente con el primero, definiremos otro subespacio de dimensión “2″, que será un plano que cruce el origen. Finalmente, al obtener tres vectores linealmente independientes podremos generar todo el espacio.

En resumen, un subespacio de dimensión “n” es el lugar geométrico de los vectores linealmente dependientes a “n” vectores libres y linealmente independientes entre ellos. Por medio de esta propia definición, un subespacio nunca puede tener una dimensión mayor que el espacio en el que está contenido, pero si igual.

Bases:

Dado un espacio de dimensión “n”, decimos que nos encontramos ante una base del mismo si poseemos un conjunto de vectores que lo genera de modo unívoco, es decir, que cualquier vector de nuestro espacio está asociado a ellos a través de unos coeficientes determinados, y que a través de estos coeficientes se puede también saber de qué vector se está hablando.

Para que un conjunto de vectores sea base, tienen que cumplir, por tanto, dos normas evidentes:

  • Ser el mínimo número de vectores que genere el espacio, es decir, que no se pueda prescindir de ninguno de ellos.
  • Ser el máximo número de vectores linealmente independientes posible.

Es trivial, de hecho, demostrar que los enunciados anteriores son equivalentes a través de la relación de dependencia lineal.

Si nuestra base de vectores es ortogonal, es decir, todos ellos son perpendiculares (o sus productos escalares nulos), nos encontramos ante una Base Ortogonal.

Aplicaciones Lineales:

Si definimos una función que a cada vector “¬v” le da un nuevo valor “f(¬v)”, y ésta es expresable a través de un sistema lineal de ecuaciones, hablamos de una aplicación lineal, y cumple las siguientes propiedades:

  • f(α ¬v) = α f(¬v).
  • f(¬v + ¬w) = f(¬v) + f(¬w).

, de donde, consecuentemente:

  • f(α ¬v + β ¬w) = α f(¬v) + β f(¬w).

Consecuencia directa de ello es que un vector “¬u” perteneciente al subespacio generado por “¬v” y “¬w”, cumplirá que “f(¬u)” seguirá perteneciendo al subespacio generado por “f(¬u)” y “f(¬w)”.

Dichas aplicaciones pueden realizarse dentro del propio espacio o no, es decir, si el vector “¬v” pertenece a R^n, y “f(¬v)” pertenece a “R^m”, no tiene por qué cumplirse:

  • n = m.

Casos particulares de aplicaciones lineales donde:

  • n = m.

para los vectores “¬v = {vx, vy}” y “¬w = {wx, wy, wz}”, son:

  • vx’ = a11 vx + a12 vy.
  • vy’ = a21 vx + a22 vy.
  • wx’ = a11 wx + a12 wy + a13 wz.
  • wy’ = a21 wx + a22 wy + a23 wz.
  • wz’ = a31 wx + a32 wy + a33 wz.

, donde los términos “aij” definen las matrices asociadas a las aplicaciones lineales correspondientes y que, una vez más, gracias a wordpress.com no puedo representar.

Casos particulares de aplicaciones lineales donde:

  • n ≠ m.

, son:

  • vx’ = a11 vx + a12 vy + a13 vz.
  • vy’ = a21 vx + a22 vy + a23 vz.
  • wx’ = a11 wx + a12 wy.
  • wy’ = a21 wx + a22 wy.
  • wz’ = a31 wx + a32 wy.

Y algunos casos aleatorios son:

  • vx’ = vx.
  • vy’ = 0.
  • wx’ = a11 vx + a12 vy.
  • wy’ = a21 vx + a23 vz.
  • wz’ = a32 vy + a33 vz.

Núcleo:

Dada una aplicación lineal “f(¬v)”, llamamos núcleo de la aplicación al conjunto de vectores que, al “pasar” por ella, toman, componente a componente el valor 0.

Por ejemplo, dada la aplicación anterior:

  • wx’ = a11 wx + a12 wy + a13 wz.
  • wy’ = a21 wx + a22 wy + a23 wz.
  • wz’ = a31 wx + a32 wy + a33 wz.

El núcleo de la misma son los vectores {wx, wy, wz} que cumplen:

  • 0 = a11 wx + a12 wy + a13 wz.
  • 0 = a21 wx + a22 wy + a23 wz.
  • 0 = a31 wx + a32 wy + a33 wz.

Si el sistema de ecuaciones es incompatible, la aplicación no tiene núcleo, lo cual es imposible, pues el vector “¬0″ siempre va a si mismo, aunque cambie la dimensión del espacio. Si el sistema es compatible y determinado tan solo el vector “¬0″ pertenece al núcleo. En conclusión, la mayoría de las veces surgirán sistemas compatibles indeterminados, con hasta “n – 1″ ecuaciones indeterminadas resultantes. Si “m” es el número de ecuaciones que nos resultan, “n – m” nos da la dimensión del subespacio que va a dar al núcleo de la aplicación.

La Teoría de Probabilidades es una rama de las matemáticas que se centra en el análisis de lo esperables que pueden ser un conjunto de sucesos, útil para estimar posibles comportamientos promedios de la naturaleza, así como la economía o el mundo de los juegos de azar.

Cuando estudiamos un suceso, definimos como Espacio Muestral los posibles resultados del mismo: E {a1, a2, a3, …, an}.

σ-Álgebra:

conjuntosAplicada a un Espacio Muestral, definimos como σ-Álgebra al álgebra que define 3 operaciones en “E”, que son la unión “U“, la intersección “∩” y la negación “‾”, bajo las cuales el Espacio Muestral es cerrado. Si consideramos los subconjuntos “Ai” de “E” y los elementos “ai” del mismo, se cumple:

.-”Ai U Aj” es el conjunto de elementos “ai” que o bien pertenecen a “Ai” o bien pertenecen a “Aj”.

.-”Ai ∩ Aj” es el conjunto de elementos “ai” que pertenecen a “Ai” y también a “Aj”.

.-”Ai‾” es el conjunto de elementos “ai” que no pertenecen a “Ai”.

La σ-Álgebra cumple las siguientes propiedades:

.-El vacío “ø” pertenece al Espacio Muestral “E”.

.-Si “Ai” pertenece a “E”, “Ai‾” también.

.-U(Ai) desde “i = 1″ hasta “n” pertenece a “E”. (La unión numerable de subconjuntos de “E” pertenece a “E”). Si unimos todos los subconjuntos Ai posibles obtendremos, evidentemente, el propio Espacio Muestral.

Espacio de Probabilidad:

El Espacio Muestral “E” toma valores en el Espacio de Probabilidad, contenido en el intervalo [0, 1], de tal modo que a cada subconjunto “Ai” le corresponde una determinada probabilidad “p(Ai)” contenida en el mencionado Espacio de Probabilidad. Si la probabilidad de un suceso es “1″ se dará siempre, si es nula no se dará nunca, y en cualquier otro caso  puede acontecer o no.

Podemos interpretar la probabilidad técnicamente como el límite de la frecuencia relativa de los elementos de una Muestra cuando el número de los mismos tiende a infinito.

  • p(Ai) = lim(N→∞) n(Ai) / N.

En caso de que no dispongamos de ninguna muestra analizada, hay otras formas de intuir la probabilidad, como es el caso de la Regla de Laplace:

  • p(Ai) = nº casos favorables / nº casos posibles.

En caso de que no sepamos nada sobre el experimento y dispongamos del Espacio Muestral, el Principio de Razón Insuficiente o de Máxima Entropía nos explica que todos los casos son igual de favorables:

  • p(Ai) = 1 / n.

Podemos, en resumen, definir la probabilidad como una medida del grado de certidumbre sobre un suceso en un experimento aleatorio, o como una medida de información sobre el mismo.

Axiomas de Kolmogorov:

kolmogorovSiempre que estemos ante un fenómeno aleatorio definido en un espacio muestral “E”. La representación a través de la función “p” que lleva cada elemento “Ai” de “E” al Espacio de Probabilidad es una medida de probabilidad si se verifica que:

  • 0 ≤ p(Ai) ≤ 1.

, que la probabilidad de “E” es 1, o sea, es un suceso seguro:

  • p(E) = 1.

, y que si “Ai” y “Aj” son sucesos mútuamente excluyentes:

  • Ai ∩ Aj = ø.
  • p(Ai U Aj) = p(Ai) + p(Aj).

Algunas otras propiedades son:

  • p(Ai‾) = 1 – p(Ai).
  • p(Ai U Ai‾) = p(E) = 1.
  • p(Ai ∩ Ai‾) = 0.
  • p(Ai U Aj) = p(Ai) + p(Aj) – p(Ai ∩ Aj).

Para evaluar prácticamente la probabilidad de un suceso desconocido debemos realizar experimentos, analizarlos teóricamente aplicando el Principio de Máxima Entropía, y combinar la teoría con la experiencia.

Definimos Probabilidad Marginal como la de un subconjunto de “E”, es decirm a “p(Ai)”, Probabilidad Conjunta de dos subconjuntos “Ai” y “Aj” como la de su intersección: p(Ai ∩ Aj), cumpliéndose que la Probabilidad Marginal de un elemento es igual a la suma de sus Probabilidades Conjuntas con los otros “n” subconjuntos mútuamente excluyentes:

  • p(Ai) = ∑(p(Ai ∩ Aj)) desde “j = 1″ hasta “n”.

La Probabilidad Condicionada es la probabilidad de que se de un suceso “Ai” sabiendo que se ha dado otro “Aj”:

  • p(Ai / Aj) = p(Ai ∩ Aj) / p(Aj).
  • p(Ai / Aj) ≠ p(Aj / Ai).

Hablamos de Independencia Estadística entre dos subconjuntos “Ai” y “Aj” cuando, siendo ambos aleatorios, se cumple:

  • p(Ai / Aj) = p(Ai).
  • p(Aj / Ai) = p(Aj).

También enunciable como:

  • p(Ai ∩ Aj) = p(Ai) p(Aj).

Teorema de Bayes:

Si disponemos de un experimento aleatorio en dos etapas  de espacios muestrales {Aa, A2, …, An} y {B1, B2, …, Bm}, y conozco todos los posibles valores de p(Bj / Ai), se cumple que:

  • p(Ai / Bj) = (p(Bj / Ai) p(Ai)) / (∑(p(Bj / Ak) p(Ak)) desde “k = 1″ hasta “n”).

Variables Aleatorias Discretas:

Si nuestro Espacio Muestral “E” toma valores numerables en la recta real, o puede ser asociado a ellos, estamos ante una variable aleatoria discreta, donde E{x1, x2, …, xn}.

.-Función de Probabilidad:

La probabilidad de que un suceso tome el valor “xi” se define como:

  • p(x = xi) = pi.
  • 0 ≤ pi ≤ 1.
  • ∑(p(x = xi)) desde “i = 1″ hasta “n” = ∑(pi) desde “i = 1″ hasta “n” = 1.

.-Distribución Uniforme:

Si todos los posibles valores “xi” poseen una misma probabilidad de acontecer hablamos de una distribución de probabilidad uniforme:

  • pi = p(x = xi) = 1 / n.

.-Función de Distribución de Probabilidad:

Si definimos “F(xk)”  como la función que determina la probabilidad de que un suceso tome un valor menor o igual a “xk” obtenemos la siguiente igualdad:

  • F(xk) = p(x ≤ xk) = ∑(p(x = xj)) desde “j = 1″ hasta “k”.
  • F(x) = 0, si el suceso toma un valor menor a “x1″.
  • F(xn) = 1.

“F(xk)” es una función monótona creciente.

Variable Aleatoria Continua. Función de Densidad de Probabilidad:

Si nuestro Espacio Muestral “E” toma valores no numerables en la recta real, o puede ser asociado a ellos, estamos ante una variable aleatoria continua, donde el Espacio Muestral es infinito. Esta inmensa cantidad de posibles resultados “xi” hace que la probabilidad particular de cada uno de ellos sea “0″, pues cada “xi” lleva asociada una probabilidad “p(x)” tal que:

  • dp(x) = f(x) dx.

, siendo f(x) la Función de Densidad de Probabilidad, que indica la probabilidad particular de cada suceso:

  • f(x) = dp(x) / dx.

.-Paso al Continuo:

Si en la variables discretas el espacio muestra se podia definir como:

  • E = ∑ desde “i = 1″ hasta “n”.

, en la variable continua nos encontramos con que:

  • E = ∫(dx) en el Espacio Muestral = ∫(dx) desde “- ∞” hasta “∞”.

.-Distribución de Probabilidad:

Al ser “E” continuo, debemos redefinir la función de probabilidad:

  • p(a ≤ x ≤ b) = ∫(dp(x)) desde “a” hasta “b” = ∫(f(x) dx) desde “a” hasta “b”.

.-Función de Distribución Acumulativa:

Es fácil redefinirla también a partir de la discreta:

  • F(x0) = p(x ≤ x0) = ∫(f(x) dx) desde “- ∞” hasta “x0″.
  • lim(x0→-∞) F(x0) = 0.
  • lim(xo→∞) F(x0) = 1.

A través del Teorema fundamental del cálculo integral, obtenemos:

  • dF(x) / dt = f(x).

Medidas Características de una Distribución de Probabilidad para una Variable Aleatoria Discreta:

.-Espacio Muestral:

  • E = {A1, A2, …, An}

para “n” elementos.

.-Sucesos:

A través de la función “x(Ai)” denominamos a los elementos de “E” como el suceso tal que:

  • x(Ai) = xi.

.-Función de Probabilidad:

Definimos “p(xi)” como la función que da a un suceso el valor de su probabilidad (en el Espacio de Probabilidad):

  • p(xi) = pi.

.-Medidas de Centralización:

..-Moda:

La moda es el suceso “xi” con mayor probabilidad.

..-Mediana:

La mediana es el suceso “xi” que toma el valor 0,5 en la función de distribución acumulativa, es decir:

  • F(xi) = 0,5.

..-Media o Valor Esperado:

  • E{x} = ∑(pi xi) desde “i=1″ hasta “n” = μ.

.-Medidas de Dispersión:

..-Varianza:

  • σ^2 = E{(x – μ)^2} = ∑(pi (xi – μ)^2) desde “i = 1″ hasta “n”.

..-Desviación Típica:

  • σ = (σ^2)^1/2.

..Función Generatriz de Momentos:

  • mr(c) = E{(x – c)^r} = ∑(pi (xi – c)^r) desde “i=1″ hasta “n”.

Hablaremos de momentos respecto al origen y centrales si se cumple:

  • c = 0.
  • c = μ.

respectivamente.

Medidas Características de una Distribución de Probabilidad para una Variable Aleatoria Continua:

.-Espacio Muestral:

En esta ocasión abarca todo el conjunto de los números reales.

  • E = R.

.-Sucesos:

  • x(Ai) = xi.

.-Función de Probabilidad:

Definimos “f(x)” como la función que da a un suceso el valor de su probabilidad (en el Espacio de Probabilidad):

  • f(xi) = pi.

Cumple que:

  • ∫(f(x) dx) desde “- ∞” hasta “- ∞” = 0.
  • ∫(f(x) dx) desde “- ∞” hasta “∞” = 1.

.-Medidas de Centralización:

..-Moda:

La moda es el suceso “xi” con mayor probabilidad. Cumple que:

  • f’(xi) = 0.
  • f”(xi) < 0.

..-Mediana:

La mediana es el suceso “xi” que toma el valor 0,5 en la función de distribución acumulativa, es decir:

  • F(xi) = 0,5.

..-Media o Valor Esperado:

  • E{x} = ∫(x dp(x)) desde “- ∞” hasta “∞” = ∫(f(x) x dx) desde “- ∞” hasta “∞” = μ.

.-Medidas de Dispersión:

..-Varianza:

  • σ^2 = E{(x – μ)^2} = ∫(f(x) (xi – μ)^2 dx) desde “- ∞” hasta “∞”.

..-Desviación Típica:

  • σ = (σ^2)^1/2.

..Función Generatriz de Momentos:

  • mx(t) = E{e^(t x)} = ∫(f(x) e^(t x) dx) desde “- ∞” hasta “∞”.
  • e^(t x) = h(x).
  • mx(t) = E{h(x)} = ∫(f(x) h(x) dx) desde “- ∞” hasta “∞”.

Distribución Binomial:

dadoLa probabilidad de que se de un determinado suceso en un experimento sigue una distribución binomial si cumple los requisitos de ser un experimento de Bernoulli, es decir, que sea un fenómeno con dos posibles sucesos mútuamente excluyentes. Uno de los sucesos será el éxito: “A”, y el otro el fracaso: “B”. Obtenemos así nuestro espacio muestral y nuestros sucesos:

  • E = {A, B}.
  • x(A) = 1.
  • x(B) = 0.

La distribución de probabilidad, que veremos ahora en detalle, cumplirá los axiomas elementales de nuestra σ-Álgebra, teniendo en cuenta la nueva nomenclatura:

  • p(A) = p.
  • p(B) = 1 – p(A) = q.

Si consideramos una variable “x” que represente el número de sucesos, su espacio muestral será el conjunto de los números naturales (1 éxito, 2 éxitos, 3 éxitos…), y la probabilidad de obtener “n” éxitos la denominamos como: p(x=r).

La media o esperanza de la distribución binomial y su varianza son:

  • μ = E{x} = p 1 + q 0 = p.
  • σ^2 = E{x – E{x}} = p (1 – p)^2 + q (0 – p)^2 = p (1 – p) = p q.

Y su distribución de probabilidad para “n” experimentos es:

  • p(x = r) = (n|r) p^r q^(n – r).

, donde (n|r) representa un número combinatorio derivado del binomio de Newton, y que se define por:

  • (n|r) = n! / (r! (n – r)!).
  • r ≤ n.

Recordemos que el factorial de un número entero “n!” no es más que el producto del mismo por todos y cada uno de los enteros menores que él.

Si queremos normalizar la distribución, entre otras cosas, debemos asegurarnos de que cumple con los axiomas de Kolmogorov, sobre todo el de que la suma de todas las probabilidades de todos los posibles de “r” para un determinado valor “n” de experimentos sumen 1:

  • ∑(p(x = r)) desde “r = 0″ hasta “n” = ∑((n|r) p^r q^(n – r)) desde “r  = 0″ hasta “n”.

Por simetría con el binomio de Newton:

  • ∑(p(x = r)) desde “r = 0″ hasta “n” = (p + q)^n = 1^n = 1.

Se cumple el axioma de Kolmogorov.

Calculemos ahora la media o esperanza matemática para un valor dado de “n”:

  • E{x} = ∑(pi xi) desde “i = 1″ hasta “n”.
  • E{x} = ∑(r (n|r) p^r q^(n – r)) desde “r  = 0″ hasta “n”.
  • E{x} = ∑(r (n|r) p^r q^(n – r)) desde “r  = 1″ hasta “n”.

Haciendo un cambio de variable:

  • r’ = r – 1.
  • n’ = n -1.

Y operando:

  • E{x} = n p.

La varianza, y consecuentemente la desviación típica, son algo más complejas de calcular, por lo que obviaremos pasos intermedios:

  • σ^2 = E{x^2} – E{x}^2 = n p q.
  • σ = [n p q]^1/2.

1ª Variable de Pascal o Geométrica:

revolverEn un experimento de Bernoulli definimos una nueva variable “x” que medirá el número de éxitos antes de el primer fracaso, por lo que su Espacio Muestral “E” tomará valores naturales: 0, 1, 2…, y aplicando la distribución binomial obtenemos que la probabilidad de que el número de éxitos “x” antes del primer fracaso sea igual a “r” es:

  • p(x = r) = p^r q.

Se cumple:

  • ∑(p(x = r)) desde “r = 0″ hasta “∞” = 1.
  • E{x} = p / q.
  • σ^2 = p / q^2.
  • σ = p^1/2 / q.

2ª Variable de Pascal o Geométrica:

De nuevo en un experimento de Bernoulli, esta vez definiremos una variable “x” que indicará el número de intentos hasta el primer fracaso, por lo que su Espacio Muestral tomará los mismos valores que en el caso anterior menos el “0″ (no se pueden hacer 0 intentos y fracasar). En esta ocasión:

  • p(x = r) = p^(r – 1) q.

Y se cumple:

  • ∑(p^(r – 1) q) desde “r = 1″ hasta “∞” = 1.
  • E{x} = 1 / q.
  • σ^2 = p / q^2.
  • σ = p^1/2 / q.

Ley de los Grandes Números:

Supongamos una variable binomial “A”que, muestra a muestra, resulta poseer una frecuencia relativa “fA” aleatoria, y sea “f(fA)” la función de probabilidad de que tome un valor concreto. Si definimos el valor esperado de fa “E{fA}” como el estimador más fiel del valor de la misma, y lo calculamos haciendo “N” experimentos, cuando el número de los mismos tienda a infinito veremos que:

  • E{fA} = p(A).

Veamos si se cumple:

  • fi = nA / N.

, siendo “ni” la frecuencia absoluta (número de veces que aparece en total).

  • E{fA} = E{nA / N} = E{nA} / N = N pA / N = p(A).

Vemos que la igualdad se cumple.

Comprobemos qué sucede con la varianza:

  • σ(fA)^2 = σ(nA / N)^2 = σ(nA)^2 / N^2.

Por ser una variable binomial:

  • σ(fA)^2 = N p q / N^2 = p q / N.

Si el número “N” de experimentos tiende a infinito, concluimos que la varianza de nuestra media tiende a “0″, y que por tanto nuestro valor de la probabilidad es exacto:

  • lim(N→∞) σ(fA)^2 = lim(N→∞) pq / N = 0.

Distribución de Poisson:

fotomultiplicadorSiguen una distribución de probabilidad de este tipo todos aquéllos experimentos en los que una variable discreta tiene lugar sobre un soporte continuo (espacio-tiempo). Algunos ejemplos son las llamadas a una central de averías o el bombardeo de una lámina de oro con neutrones.

Tiene que ser un proceso estable, en el que más o menos se establezca un valor medio representativo de la variable, y los sucesos han de surgir continuamente de manera independiente.

Nuestra variable “x” (número de sucesos por intervalo continuo) tomará valores en el Espacio Muestral “E” de los números enteros {0, 1, 2, …}, y si los posibles valores de “x” tienden a infinito la probabilidad de cada uno de ellos tiende a “0″. Definimos la media “λ” como:

  • λ = n p.
  • lim(n→∞) p = 0.

La probabilidad de que en un intervalo concreto la variable “x” tome un valor “r” es:

  • p(x = r) = (n|r) p^r q^(n – r) = (n|r) p^r (1 – p)^(n – r).

Aplicando la igualdad anterior:

  • lim(n→∞) (n|r) (λ / n)^r (1 – λ / n)^(n – r) = lim(n→∞) p(x = r).
  • lim(n→∞) p(x = r) = λ^r e^(- λ) / r!

, que es la disribución de la archifamosa ecuación de la distribución de Poisson.

Veamos que cumple el tercer axioma de Kolmogorov:

  • ∑(p(x = r)) desde “r = 0″ hasta “∞” = ∑(λ^r e^(- λ) / r!) desde “r = 0″ hasta “∞”.
  • ∑(p(x = r)) desde “r = 0″ hasta “∞” = e^(- λ) ∑(λ^r / r!) desde “r = 0″ hasta “∞”.
  • ∑(p(x = r)) desde “r = 0″ hasta “∞” = e^(- λ) e^(λ) = e^0 = 1.

Lo cumple.

Analicemos ahora el valor esperado:

  • ∑(p(x = r) r) desde “r = 0″ hasta “∞” = ∑(λ^r e^(- λ) r / r!) desde “r = 0″ hasta “∞”.
  • ∑(p(x = r) r) desde “r = 0″ hasta “∞” = λ ∑(λ^(r – 1) e^(- λ) / (r – 1)!) desde “r = 1″ hasta “∞”.
  • ∑(p(x = r) r) desde “r = 0″ hasta “∞” = λ e^(- λ) e^(λ) = λ.

La varianza tendrá la peculiaridad de ser igual a la media:

  • σ^2 = E{x^2} – E{x}^2 = λ.

Y el Coeficiente de Variación:

  • CV = σ / E{x} = λ^1/2 / λ = 1 / λ^1/2 = 1 / (n p)^1/2 ≈ 1 / n^1/2.

Distribución Exponencial:

Si suponemos un proceso de Poisson de media “λ”, y queremos definir la variable “t”, tiempo entre dos sucesos, dicha variable será continua y tomará valores en el intervalo [0, ∞). Si queremos calcular la probabilidad de que "t" tome un valor mayor que "t0", su distribución de probabilidad se define como:

  • p(t > t0) = p(x = 0 en (0, t0)) = (λ t0)^0 e^(λ t0) / 0! = e^(λ t0).

, de ahí que se la denomine distribución exponencial.

Análogamente, la probabilidad de que "t" sea menor o igual que un determinado "t0" se define como:

  • p(t ≤ t0) = 1 - p(t > t0) = 1 - e^(λ t0).

Otras características son:

  • F(t) = 1 - e^(λ t).
  • f(t) = dF(t) / dt = λ e^(λ t).

Distribución Gaussiana o Normal:

iq-gaussianoSupongamos una variable aleatoria continua (de cualquier valor numérico real) que posea una media "μ" y una desviación típica "σ". Decimos que estamos ante una Variable Aleatoria Normal N(μ, σ) si su distribución de probabilidad es:

  • f(x) = e^((x - μ)^2 / (2 σ^2)) / ([2 π]^1/2 σ).

Esta función, que como se aprecia en la representación tiene forma de campana, es la conocida Campana de Gauss, cuyo valor central toma el valor “μ”, y posee puntos de inflexión en los puntos “μ – σ” y “μ + σ”.

La función Acumulativa de esta distribución se define como:

  • F(x0) = ∫(e^((x – μ)^2 / (2 σ^2)) dx / ([2 π]^1/2 σ)) desde “- ∞” hasta “x0″.

Y la probabilidad de que “x” tome valores en el intervalo [a, b] es de:

  • p(a ≤ x ≤ b) = ∫(e^((x – μ)^2 / (2 σ^2)) dx / ([2 π]^1/2 σ)) desde “a” hasta “b”.

El problema de esta función de densidad de probabilidad reside en que no es integrable, y por tanto los valores de su primitiva se deben tantear por métodos numéricos. Asimismo, como hay infinidad de distribuciones gaussianas según sus valores de “μ” y de “σ”, necesitamos buscar una relación entre todas ellas para estudiarlas todas de golpe.

Llamamos proceso de Normalización o Tipificación al proceso mediante el cual convertimos cualquier variable aleatoria N(μ, σ) a una N(0, 1). Para ello, definimos un parámetro “z” tal que:

  • z = (x – μ) / σ.

De modo que:

  • f(x) = e^(z^2 / 2) / [2 π]^1/2.

Cualquier función normal tipificada de este modo se denomina Variable Aleatoria Estándar, y su distribución de probabilidad es:

  • p(a ≤ x ≤ b) = p((a – μ) / σ ≤ x ≤ (b – μ) / σ) = F((b – μ) / σ) – F((a – μ) / σ).

La Función Generatriz de Momentos de la Gaussiana Estándar se define como:

  • mz(t) = E{e^(z t)}.
  • mz(t) = ∫(e^(z t) e^(z^2 / 2) dz / [2 π]^1/2) desde “- ∞” hasta “∞”.
  • mz(t) = e^(t^2 / 2).

Teorema del Límite Central:

Supongamos una variable “X” definida com0:

  • X = x1 + x2 + x3 + x4 + x5 + … + xn.

Si cada “xi” que la compone es una variable aleatoria independiente de las demás, con una media “μi” y una desviación típica “σi”, y estos valores no son muy dispares entre cada uno de los elementos, podemos concluir que cuando el número “n” de elementos tiende a infinito la distribución de probabilidad de “X” es gaussiana.

Distribución Log-Normal:

lognormalDefinamos una variable aleatoria “Y” dependiente de otras variables aleatorias “xi” independientes entre si de modo que:

  • Y = x1 x2 x3 x4 … xn = Π(xi) desde “i = 1″ hasta “n”.

Consecuentemente:

  • Ln(Y) = ∑(log(xi)) desde “i = 1″ hasta “n” = z.

Por el teorema antes mencionado, cuando el número de elementos “xi” tiende a infinito, “z” se vuelve una variable aleatoria normal de media “μ” y desviación típica “σ”:

  • μ = ∑(log(μi)) desde “i = 1″ hasta “n”.

, por lo que su función de densidad de probabilidad es:

  • f(z) = e^((z – μ)^2 / (2 σ^2)) / ([2 π]^1/2 σ).

Por otra parte, sabemos que:

  • dp(z) = f(z) dz.
  • dp(y) = g(y) dy.

Como ambas distribuciones son continuas sus diferenciales de probabilidad son nulos y podemos igualarlas:

  • f(z) dz = g(y) dy.
  • g(y) = f(z) dz / dy.
  • dz / dy = dLn(y) / dy = 1 / y.

Para este último resultado aplicamos la derivada del logaritmo natural, por lo que esta “y” solo toma valores en (0, ∞), y la función de probabilidad de “y” nos resulta:

  • g(y) = e^((z – μ)^2 / (2 σ^2)) / ([2 π]^1/2 σ y).

Distribución de Weibull (Gompertz):

esperanzaEsta distribución analiza la probabilidad del fallo de un elemento, también enunciable como la esperanza de vida. Si definimos “t” como el tiempo que puede pasar antes de que el elemento analizado falle, evidentemente tomará valores en el intervalo (0, ∞). Su distribución genérica de probabilidad de durar “t” tiempo es:

  • λ(t) = p(t0 < t ≤ t0 + Δt) = p(t0 < t ≤ t0 + Δt) / p(t > t0).
  • λ(t) = f(t0) Δt / (1 – F(t0)).

Su función acumulativa es:

  • Λ(t) = ∫(λ(t0) dt0) desde “0″ hasta “t”.
  • Λ(t) = ∫(f(t0) Δt dt0 / (1 – F(t0))) desde “0″ hasta “t”.
  • Λ(t) = – [Ln|1 - F(t0)|] desde “0″ hasta “t” = - Ln|1 – F(t0)|.

De donde:

  • F(t) = 1 – e^(- Λ(t)).
  • f(t) = dF(t) / dt = 1 – λ(t) e^(- Λ(t)).

Si suponemos una Tasa de Fallo Potencial o de Weibull para “h” y “c” predeterminados obtenemos:

  • λ(t) = h t^(c – 1).
  • Λ(t) = h t^c / c.
  • f(t) = h t^(c – 1) e ^(- h t^2 / c).

Si suponemos una Tasa de Fallo Exponencial o de Gompertz para “k” y “b” predeterminados obtenemos:

  • λ(t) = k e^(b t).
  • Λ(t) = k (e^(b t) – 1) / b.
  • f(t) = k e^(b t) e ^(- k (e^(b t) – 1) / b).

ATENCIÓN:

Por economía, en esta entrada supondremos que, si no se especifica lo contrario, todas las integrales “∫” se definen en el intervalo del que se haya hablado donde aparezcan y los sumatorios “∑” entre “n=1″ e “∞”.

Coeficientes de Fourier:

En muchos problemas de física las ecuaciones que los describen admiten soluciones elementales en forma de senos y cosenos (vibraciones mecánicas, respuesta de un circuito eléctrico, difracción de la luz…), de manera que si somos capaces de representar una función arbitraria como una suma de funciones trigonométricas resulta fácil expresar la solución de estos problemas frente a una “excitación” arbitraria.

Consideremos una cierta función real de variable real, “f(x)”, definida en el intervalo [-π, π]. Supongamos que esta función se puede expandir como una suma de funciones trigonométricas:

  • f(x) = a0 / 2 + a1 Cosx + b1 Senx + a2 Cos(2 x) + b2 Sen(2 x) + …

Se nos plantea el problema de encontrar los coeficientes “an” y “bn” que hacen que se cumpla la igualdad anterior en el intervalo [-π, π]. Más adelante estudiaremos en detalle qué condiciones ha de cumplir “f(x)” para que este desarrollo sea correcto.

Supondremos que esta serie es uniformemente convergente para poder integrar término a término:

  • ∫(f(x) dx) = (a0 / 2) ∫(dx) + ∑[an ∫(Cos(n x) dx) + bn ∫(Sen(n x) dx]).

Observemos que, con nuestros criterios:

  • ∫(dx) = 2 π.
  • ∫(Cos(n x) dx) = 0.
  • ∫(Sen(n x) dx) = 0.

De modo que obtenemos:

  • a0 π = ∫(f(x) dx).
  • a0 = ∫(f(x) dx) / π.

Es decir, “a0″ es el valor medio de la función “f(x)” en el intervalo [-π, π].

Para calcular “an” multiplicaremos nuestra serie por “Cos(m x)”, de modo que:

  • f(x) Cos(m x) = a0 Cos(m x) / 2 + ∑[an Cos(n x) Cos(m x) + bn Sen(n x) Cos(m x)].

Ya hemos visto que:

  • ∫(Cos(n x) dx) = 0.

, por otra parte tenemos que:

  • Cos(n x) Cos(m x) = (Cos((n + m) x) + Cos((n – m) x)) / 2.
  • Sen(n x) Cos(m x) = (Sen((n + m) x) + Sen((n – m) x)) / 2.
  • Sen(n x) Sen(m x) = (Cos((n – m) x) – Cos((n + m) x)) / 2.

Por lo tanto:

  • ∫(Cos(n x) Cos(m x) dx) = [∫(Cos((n + m) x) dx) + ∫(Cos((n - m) x) dx)] / 2.

, donde “n” y “m” son números naturales. Pero:

  • ∫(Cos((n + m) x) dx) = 0.
  • ∫(Cos((m – n) x) dx) = 0, si “m ≠ n”.
  • ∫(Cos((n – m) x) dx) = 2 π, si “m = n”.

Resumiendo:

  • ∫(Cos(n x) Cos(m x) dx) = 0, si “m ≠ n”, e = π, si “m = n”.

Para la otra integral tenemos:

  • ∫(Sen(n x) Cos(m x) dx) = [∫(Sen((n + m) x) dx) + ∫(Sen((n - m) x) dx)] / 2.
  • ∫(Sen((n + m) x) dx) = 0.
  • ∫(Sen((n – m) x) dx) = 0, si “m ≠ n”.

Cuando “m = n” tenemos directamente:

  • Sen((n – m) x) = 0.

Resumiendo entonces:

  • ∫(Sen(n x) Cos(m x) dx) = 0.

, con “n” y “m” números naturales.

  • ∫(f(x) Cos(m x) dx) = π an.
  • an = ∫(f(x) Cos(m x) dx) / π.
  • n ≥ 0.

Para calcular “bn” multiplicamos la serie por “Sen(m x)” y procedemos de manera análoga:

  • ∫(f(x) Sen(m x) dx) = a0 ∫(Sen(m x) dx) / 2 + ∑[an ∫(Cos(n x) Sen(m x) dx) + bn ∫(Sen(n x) Sen(m x) dx)].

Recordemos que:

  • ∫(Sen(n x) dx) = 0.
  • n ≥ 0.
  • ∫(Sen(n x) Cos(m x) dx) = 0.

, con “n” y “m” números naturales.

Finalmente:

  • ∫(Sen(n x) Sen(m x) dx) = [∫(Cos((n - m) x) dx) - ∫(Cos((n + m) x) dx)] / 2.

  • ∫(Cos((n + m) x) dx) = 0.

  • ∫(Cos((m – n) x) dx) = 0, si “m ≠ n”.

  • ∫(Cos((n – m) x) dx) = 2 π, si “m = n”.

  • ∫(Sen(n x) Sen(m x) dx) = 0, si “m ≠ n”, e = π, si “m = n”.

Por lo tanto obtenemos:

  • ∫(f(x) Sen(m x) dx) = π bn.

  • bn = ∫(f(x) Sen(m x) dx) / π.

  • n ≥ 1.

Por lo tanto, si la serie de Fourier que hemos descrito al principio  es uniformemente convergente, entonces los coeficientes “an” y “bn” se obtienen mediante las fórmulas obtenidas.

En muchos casos, no obstante, no sabemos si una función dad admite un desarrollo medianteuna serie trigonométrica uniformemente convergente. De todos modos, resulta útil tomar la perspectiva de definir ciertos números “an” y “bn”, que usaremos para construir la serie trigonométrica. A éstos números los llamamos coeficientes de Fourier, y la serie, serie de Fourier.

De acuerdo con esto, una serie de Fourier es un tipo especial de serie trigonométrica cuyos coeficientes se calculan con las anteriores ecuaciones a cierta función “f(x)”. Para ello solo es necesario que tales integrales existan.

Obviamente, lo que uno desea es que la serie de Fourier sea convergente y tenga como suma la propia “f(x)”, pero no siempre ocurre así: existen funciones integrables en el intervalo [- π, π] que no son la suma de ninguna serie de Fourier. Y a la inversa, existen series trigonométricas convergentes que no son ninguna serie de Fourier. Por ejemplo, la serie:

  • ∑(Sen(n x) / log(1 + n)).

converge para todo valor de “x”, pero no es una serie de Fourier, lo cual significa que los coeficientes de esta serie no se pueden obtener aplicando las fórmulas anteriores a ninguna función integrable.

Convergencia de una Serie Funcional:

Sea “fn”, con “n” natural, un conjunto de funciones reales con el mismo dominio “S” sobre la recta real.

Se dice que la sucesion “fn” converge puntualmente a “f” en el dominio “S” si cumple que:

  • f(x) = lim(n→∞) fn(x).

, para cualquier “x” perteneciente a “S”.

Se dice que la sucesión “fn” converge uniformemente a “f” en el dominio “S” si cumple que: para todo:

  • ε > 0.

existe un número natural “N” tal que todo:

  • n > N.

se cumple que:

  • |fn(x) – f(x)| < ε.

, siendo “x” perteneciente a “S”.

Consideremos una serie funcional a partir de una sucesión de funciones “fn”. La sucesión de sumas parciales “Sn” viene dada por:

  • Sn(x) = ∑(fk(x)) desde “k = 1″ hasta “n”.

, para todo “x” perteneciente a “S”.

Si la sucesión “Sn” converge a “f” en “x” diremos que la serie de funciones es convergente y:

  • ∑(fk(x)) = f(x).

Si en particular la sucesión “Sn” converge uniformemente a la función “f” en el conjunto “S”, diremos que la serie converge uniformemente en “S”. La condición de convergencia uniforme es suficientemente fuerte para garantizar que se puede integrar término a término la serie.

El Problema de la Convergencia:

Se plantea la cuestión de cándo la serie de Fourier converge a la función de partida. Consideremos la serie de Fourier dada por:

  • f(x) = a0 / 2 + ∑[an Cos(n x) + bn Sen(n x)].

Cada término de esta serie es una función periódica de periodo “2 π”, ya que:

  • Cos(n x) = Cos(n x + 2 π).
  • Sen(n x) = Sen(n x + 2 π).

Por lo tanto, cuando esta serie es convergente, la función a la que converge debe verificar:

  • f(x + 2 π) = f(x).

En particular, se cumple además que:

  • f(π) = f(- π).

Obviamente, esta condición no se cumple para cualquier función arbitraria en el intervalo [- π, π]. Dada cualquier función definida únicamente en el intervalo [- π, π], podemos extenderla periódicamentea toda la recta real mediante la condición:

  • f(x + 2 π) = f(x).

Por otra parte, consideremos los siguientes límites laterales de la función:

  • f(x+) = lim(ε→0) f(x + ε).
  • f(x-) = lim(ε→0) f(x – ε).
  • ε > 0.

Una función que presente una discontinuidad de salto en un cierto punto tiene límites laterales distintos en ese punto.

Teorema de Dirichlet:

Sea “f(x)” una función acotada y definida en el intervalo [- π, π] con un número finito de discontinuidades y un número finito de máximos y mínimos. Para otros valores de “x” fuera del intervalo [- π, π] extendemos la definición de “f(x)” por medio de la condición de periodicidad:

  • f(x + 2 π) = f(x).

Entonces la serie de Fourier converge a: “[f(x‾) + f(x+)] / 2″.

en todo punto “x”, y por lo tanto converge a “f(x)” en todo punto de continuidad de la función. En los puntos de discontinuidad podemos redefinir la función como el promedio de sus límites laterales:

  • f*(x) = [f(x-) + f(x+)] / 2.

Entonces la serie de Fourier representa la función f*(x) en todo punto “x” perteneciente a la recta real.

Las condiciones de validez de este teorema se denominan condiciones de Dirichlet. En general, la continuidad de una funicón no es suficiente, ni tampoco necesaria, para garantizar la convergencia de su serie de Fourier.

El Fenómeno de Gibbs:

Aunque el teorema de Dirichlet nos garantiza que en una discontinuidad de una función “f(x)” la serie de Fourier converge a:

  • f*(x) = [f(x-) + f(x+)] / 2.

La serie presentará un pico próximo a la discontinuidad. Este pico se acercará más a la discontinuidad al sumar más términos de la serie, pero su amplitud “δ” no disminuye cuando el número de términos sumados tiende a infinito. El valor de “δ” es proporcional a la magnitud de discontinuidad en “x0″.

Series de Fourier de Funciones Pares e Impares:

Se dice que una función real de variable real es par si:

  • f(x) = f(- x).

Se dice que una función real de variable real es impar si:

  • f(x) = – f(- x).

Una función par presenta simetría respecto al eje “y”, mientras que una función impar presenta simetría respecto al origen de coordenadas. Obsérvese que toda función impar debe pasar por el origen de coordenadas, ya que debe cumplir:

  • f(0) = – f(0).

, y el único número real que verifica esto es el 0.

Ejemplos de funciones pares:

  • f(x) = Cos(n x).
  • f(x) = x^2.

Ejemplos de funciones impares:

  • f(x) = Sen(n x).
  • f(x) = x^3.

Si una función es par verifica lo siguiente:

  • ∫(f(x) dx) desde “- a” hasta “a” = 2 ∫(f(x) dx) desde “0″ hasta “a.

Si una función es impar se cumple:

  • ∫(f(x) dx) desde “- a” hasta “a” = 0.

Además, bajo el producto las funciones pares e impares se comportan de la siguiente manera:

  • par x par = par.
  • par x impar = impar.
  • impar x impar = par.

Toda función real de variable real puede descomponerse en una función par y otra función impar:

  • f+(x) = (f(x) + f(- x)) / 2.
  • f-(x) = (f(x) – f(- x)) / 2.

Esta claro que con esta definición tenemos:

  • f(x) = f+(x) + f-(x).

Podemos entonces escribir:

  • ∫(f(x) dx) = ∫(f+(x) dx) = 2 ∫(f+(x) dx) desde “0″ hasta “π”.

Las reglas de paridad nos pertmiten establecer la cancelación de algunas integrales si tener que calcularlas explícitamente. Por ejemplo:

  • ∫(x Sen(n x) dx) = 2 ∫(x Sen(x) dx) desde “0″ hasta “π”.

Puesto que se trata de una función par (impar x impar). Teniendo todo esto en cuenta, es evidente por ejemplo que:

  • ∫(Sen(n x) dx) = 0.
  • ∫(x^2 Sen(n x) dx) = 0.
  • ∫(x Cos(x) dx) = 0.

Propiedad:

Sea “f(x)” una función integrable definida en el intervalo [- π, π]. Se verifica que:

.-Si “f(x)” es par:

Su serie de Fourier sólo contiene términos de tipo Coseno:

  • f(x) ≈ a0 / 2 + ∑(an Cos(n x)).

La función “f(x) Sen(n x)” es impar y:

  • bn = (∫(f(x) Sen(n x) dx)) / π = 0.
  • an = (∫(f(x) Cos(n x) dx)) / π = 2 (∫(f(x) Cos(n x) dx) desde “0″ hasta “π”) / π.

.-Si “f(x)” es impar:

Su serie de Fourier solo contiene términos tipo Seno:

  • f(x) ≈ ∑(bn Sen(n x)).

La función “f(x) Cos(n x)” es impar y:

  • an = (∫(f(x) Cos(n x) dx)) / π = 0.
  • bn = (∫(f(x) Sen(n x) dx)) / π = 2 (∫(f(x) Sen(n x) dx) desde “0″ hasta “π”) / π.

Extensión Par e Impar:

Dada una función “f(x)” definida en el intervalo [0, π], podemos extenderla al intervalo [- π, 0] de modo que sea par o impar a voluntad:

  • f(x) =  f(- x).
  • f(x) = – f(- x).

Siendo la primera una extensión par y la segunda una impar. Sus funciones serán tipo Coseno y tipo Seno, respectivamente.

Derivación e Integración de las Series de Fourier:

Consideremos las siguientes series de Fourier en el intervalo [- π, π]:

  • x^1 → 2 ∑((- 1)^(n+1) Sen(n x) / n).
  • x^2 → π^2 / 3 + 4 ∑((- 1)^n Cos(n x) / n^2).
  • x^3 → ∑((12 / n^3 – 2 π^2 / n) (- 1)^n Sen(n x)).
  • x^4 → π^4 / 5 + ∑((8 π^2 / n^2 – 48 / n^4) (- 1)^n Cos(n x)).

Obsérvese que la serie de Fourier de “x” se puede obtener derivando término a término la de “x^2″, pero esto no es un resultado general, es decir, la convergencia de una serie de Fourier no garantiza que la derivada término a término de la serie converja a la derivada de la función de partida. La propia serie de Fourier de “x” no puede ser derivada término a término para obtener la constante unidad. Pueden darse ciertascondiciones que deben satisfacer las funciones para que sus series de Fourier se puedan derivar e integrar término a término.

Teorema:

Sea una función “f(x)” periódica y continua a trozos, entonces su serie de Fourier, aunque no sea convergente, puede integrarse término a término y la serie resultante converge a la integral de la función “f(x)”.

Teorema:

Sea una función “f(x)” periódica, continua en todo “x” y tal que “f’” satisfaga las conciones de Dirichlet, entonces la serie de Fourier de “f’” coincide con las derivada de la serie de Fourier de “f(t)”.

Si derivamos la serie de Fourier de:

  • f(x) = x^3 / 3.

no obtenemos la serie de Fourier de “x^2″. No se cumplen las condiciones del teorema previo, pues la función:

  • f(x) = x^3 / 3.

extendida periódicamente a toda la recta real no es continua. Por otro lado, la función:

  • f(x) = x^2.

extendida de forma periódica sí que es continua, por lo tanto el teorema anterior garantiza que podemos derivar término a término su serie de Fourier para obtener la serie de Fourier de la función “2 x”.

Extensión a Intervalos Arbitrarios:

La forma canónica de la serie de Fourier que hemos manejado hasta ahora estaba definida en el intervalo:

  • - π ≤ x < π.

, pero es sencillo extender el estudio a intervalos del tipo:

  • - L ≤ x < L.
  • L>0.

arbitrario. Basta hacer un cambio de escala en el eje “x” de modo que transformamos el intervalo [- π, π] en el intervalo [- L, L]: Si hacemos:

  • x = L t / π.

, entonces, si “t” pertenece al intervalo [- π, π], “x” pertenece a [- L, L].

Vemos por lo tanto que, dada una función “f(x)” definida sobre el intervalo [- L, L], el sencillo cambio de variable anteriornos lleva a otra función, “g(t)”, definida en el intervalo [- π, π].

  • f(x) = f(L t / π) = g(t).

, con “t” perteneciente a [- π, π].

Si “f(x)” satisface las condiciones de Dirichlet, es obvio que “g(t)” también lo hace. La serie de Fourier de “g(t)” será:

  • g(t) = a0 / 2 + ∑(an Cos(n t) + bn Sen(n t)).
  • an = (∫(g(t) Cos(n t) dt) / π.
  • bn = (∫(g(t) Sen(n t) dt)) / π.

Podemos retornar a la variable original “x” teniendo en cuenta que:

  • t = π x / L.

En consecuencia, la serie de Fourier de cualquier función “f(x)” definida en un intervalo simétrico en torno al “0″, [- L, L], será:

  • f(x) = a0 / 2 + ∑(an Cos(n π x / L) + bn Sen(n π x / L)).
  • an = (∫(f(x) Cos(n π x / L) dx) / π.
  • bn = (∫(f(x) Sen(n π x / L) dx)) / π.

Funciones Ortogonales. Series de Fourier Generalizadas:

Dadas las funciones “f1(x)” y “f2(x)”. definidas en un cierto intervalo de la recta real [a, b], diremos que son funciones ortogonales si verifican:

  • ∫(f1(x) f2(x) dx) = 0.

Esta propiedad se puede extender a un cierto conjunto numerable de funciones sobre un intervalo, de modo que se trate de una colección de funciones mutuamente ortogonales.

Sea pues un conjunto {Φn(x)} de funciones reales definidas sobre el intervalo [a, b]. Si se verifica que:

  • ∫(Φm(x) Φn(x) dx) = 0.
  • m ≠ n.

se dice que es un conjunto de funciones ortogonales en el intervalo [a, b].

Definiremos como norma cuadrática de una función en el intervalo [a, b] a la integral:

  • 0 ≤ ||Φn(x||^2 = ∫(Φn(x)^2 dx).

Obsérvese que siempre podemos convertir un conjunto ortogonal de funciones {Φn(x)} en un conjunto ortonormal dividiendo por la norma de cada una de ellas:

  • θn(x) = Φn(x) / ||Φn(x)||.

De este modo tenemos asegurado que:

  • ||θn(x)|| = 1.

, y {θn(x)} es entonces un conjunto ortonormal.

Sea ahora {θn(x)} una sucesión ortonormal de funciones en el intervalo [a,b]. Dada una función “f(x)” cualquiera, podemos intentar expresarla mediante el siguiente desarrollo en el intervalo [a, b]:

  • f(x) = ∑(ak θk(x)).

Para determinar los coeficientes “an”  multiplicamos ambos lados de la ecuación anterior por “θk(x)”:

  • f(x) θn(x) = ∑(ak θk(x) θn(x)).

Vamos a suponer que podemos realizar la integración en el intervalo [a, b]. Entonces tenemos:

  • ∫(f(x) θn(x) dx) = ∑[ak ∫(ak θk(x) dx)] = ∑(ak δkn) = an.

Estos números se denominan coeficientes de Fourier de “f(x)” respecto a la sucesión ortonormal {θn(x)}, y la serie asociada siguiente es la serie de Fourier de “f(x)” respecto a {θn(x)}.

  • ∑(ak θk(x)).

A este tipo de serie se le denomina serie de Fourier generalizada.

La descomposición de una función “f(x)” en términos de funciones {θn(x)} es análoga a la descomposición de un vector en componentes referidas a una cierta base, por ello se puede definir de modo análogo un producto escalar o interior de funciones:

  • (f, g) = ∫(f(x) g(x) dx).

que verifica las propiedades usuales de linealidad y simetría:

  • (f1 + f2, g) = (f1, g) + (f2, g).
  • (c f, g) = c (f, g).
  • (f, g) = (g, f).

Con esta notación, dos funciones se dicen ortonormales si su producto escalar es cero:

  • (f, g) = 0.

Y además su norma al cuadrado es:

  • ||f||^2 = (f, f).

Los coeficientes de Fourier vendrían dados entonces por el siguiente producto escalar:

  • an = (f, θn).

Comparemos esto con la expansión de un vector de R^3 en términos de una base ortonormal {¬e1, ¬e2, ¬e3}. Tendríamos:

  • ¬v = a1 ¬e1 + a2 ¬e2 + a3 ¬e3.
  • an = (¬v, ¬en) = (¬en, ¬v) = ¬v ¬en.

A pesar de esta comparación, hemos de tener en cuenta que en el caso de series de Fourier trabajamos con espacios lineales de funciones definidas en un cierto intervalo [a, b], y no con un espacio lineal vectorial ordinario. Estos espacios lineales de funciones tienen dimensión infinita, en el sentido de que es necesaria una sucesión ortonormal infinita para poder representar una función arbitraria “f(x)” definida en [a, b].

En realidad, no todas las funciones admiten un desarrollo en serie de Fourier, como ya sabemos. Denotaremos por “R” el espacio de todas las funciones “f(x)” definidas en [a, b] que admiten un desarrollo en serie de Fourier. Este espacio está constituído por todas las funciones integrables Riemann sobre dicho intervalo. Además, no todas las sucesiones ortonormales de funciones son adecuadas para representar una función arbitraria de “R”. Para ello necesitamos que el conjunto {θn} sea maximal, esto es, que pueda reproducir de modo exhaustivas todas las funciones de “R”. Se dice que una sucesión ortonormal {θn(x)} es completa o maximal respecto al intervalo [a, b] si la única función ortogonal a todas las funciones “θn(x)” es la función cero o nula. Una función “f” es nula si cumple:

  • ||f^2|| = (f, f) = 0.

O lo que es equivalente:

  • ∫(|f(x)|^2 dx) = 0.

Con la definición de producto dado para nuestro espacio de funciones “R”, tenemos también una definición de distancia entre funciones:

  • d(f, g) = ||f – g|| = [∫((f(x) - g(x))^2 dx)]^1/2.

Un espacio lineal en el que hemos definido una distancia que satisface las propiedades usuales, se llama espacio métrico. Dos funciones de “R” se consideran iguales si difieren en una función nula.

Convergencia en Media de las Series de Fourier:

Sea “f(x)” una función definida sobre un intervalo [a, b] y sea {pn(x)} una sucesión de funciones en este intervalo, todas ellas integrables en [a, b]. Queremos estudiar la convergencia de la sucesión {pn(x)} a “f(x)”. Si aproximamos “f(x)” por “pn(x)”, las expresiones:

  • |f(x) – pn(x)|.
  • |f(x) – pn(x)|^2.

proporcionan una medida del error cometido en la aproximación. Cuando la sucesión de funciones {pn(x)} converge a la función “f(x)” en todo punto “x” del intervalo [a, b], entonces la expresión “(f(x) – pn(x))^2″ tiende a cero y hablamos de convergencia puntual o convergencia punto a punto. Por otra parte, si queremos dar una medida global del error que cometemos al aproximar la función “f(x)” por “pn(x)”, es más adecuado utilizar la segunda expresión para definir el error cuadrático medio a lo largo del intervalo [a, b] como:

  • En = ∫((f(x) – pn(x))^2 dx).

Se dice que la sucesión {pn} converge en media a la función “f(x)” cuando se verifica:

  • lim(n→∞) En = 0.

A veces esto se denota también como:

  • l.i.m(n→∞) pn(x) = f(x).

, donde “l.i.m” significa convergencia en media. Fijémonos que una función que cumple las condiciones de Dirichlet verificará que su serie de Fourier converge en media a “f(x)”. Por otra parte, tal y como hemos definido el valor de “En”, se cumple que:

  • En = ||f – pn||^2.

Por lo tanto la convergencia media significa:

  • lim(n→∞) ||f – pn|| = lim(n→∞) d(f, pn) = 0.

Consideremos {θn(x)} una ortonormal de funciones en [a, b]:

  • (θn,θm) = ∫(θn(x) θm(x) dx) = δnm

Vamos a aproximar una función integrable dada, “f”, mediante una combinación lineal de “n” funciones del conjunto {θn(x)}. Para ello escribimos “pn” como como una combinación lineal de “n” de estas funciones:

  • pn(x) = ∑(bk θk(x)).

Podremos entonces calcular “En” del modo siguiente:

  • En = ∫((f – pn)^2 dx).
  • En = ∫((f – ∑(bk θk))^2 dx).
  • En = ∫((f^2 + ((bk θk))^2 – 2 f (bk θk)) dx).
  • En = ∫(f^2 dx) desde “a” hasta “b” + ∫(((bk θk))^2 dx) – 2 (bk ∫(f θk dx)).
  • En = ∫(f^2 dx) + ∑(bk^2) – 2 ∑(ak bk).
  • En = ∫(f^2 dx) + ∑(bk^2 – 2 ak bk).

Ahora bien:

  • bk^2 – 2 ak bk = bk^2 – 2 ak bk + ak^2 – ak^2 = (bk – ak)^2 – ak^2.

Por lo tanto:

  • En = ∫(f^2 dx) + ∑(ak – bk)^2 – ∑(ak)^2.

Como todos los términos de la suma aparecen elevados al cuadrado, el error “En” cuadrático medio mínimo corresponde a elegir:

  • ak = bk.

, y en consecuencia:

  • En = ∫(f^2 dx) - ∑(ak)^2.

Como:

  • En ≥ 0.

por construcción se cumple que:

  • ∫(f^2 dx) ∑(ak)^2.

Como esta expresión es válida para todo “n” por grande que sea, podemos denominar a esta expresión como la Desigualdad de Bessel.

Puesto que la serie “∑(ak)^2″ es monótona creciente y acotada superiormente, se deduce que es una serie convergente. Una condición necesaria para que la serie sea convergente es que su término general tenga un límite nulo cuando “n→∞”. Por lo tanto deducimos que:

  • lin(n→∞) an = 0.

Si la serie de Fourier converge en media a la función “f(x)” tenemos:

  • lin(n→∞) En = 0.

Pero como:

  • En = ∫(f^2 dx) – ∑(ak)^2.

se verificará la siguiente igualdad cyando la serie converge en media:

  • ∫(f^2 dx) = ∑(ak)^2.

, la denominada Identidad de Parseval.

Usando la definición de norma de una función podemos escribir la identidad de Parseval de una manera que nos recuerda el cuadrado de la norma de un vector en un espacio lineal. Comparémosla con la expresión de la norma de un vector en R^3:

  • f(x) = ∑(ak θk(x)).
  • ¬v = a1 ¬e1 + a2 ¬e2 + a3 ¬e3.
  • ||f||^2 = ∑(ak)^2.
  • ||¬v||^2 = ∑(ak)^2 desde “k = 1″ hasta “3″.

La serie de Fourier de una función “f” en un intervalo [a, b] converge en media a la función si y solo si se cumple la igualdad anterior. Por otra parte, cuando consideramos una sucesión ortonormal {θn} en el intervalo [a, b], si se cumple que toda función “f” de “R” converge en media a su serie de Fourier respecto a la sucesión {θn}, se dice que {θn(x)} es una sucesión ortonormal completa.

La Serie de Fourier en Forma Compleja:

Vamos a escribir la serie de Fourier de un modo más compacto mediante su extensión al plano complejo. Consideremos una serie de Fourier de una función “f(x)” definida sobre un intervalo simétrico [- L, L]:

  • f(x) = a0 / 2 + ∑[an Cos(n π x / L) + bn Sen(n π x / L)].

Siendo:

  • an = ∫(f(x) Cos(n π x / L) dx) / L.
  • bn = ∫(f(x) Sen(n π x / L) dx) / L.

Si hacemos la extensión al campo complejo:

  • e^(i n π x / L) = Cos(n π x / L) + i Sen(n π x / L).

o bien:

  • Cos(n π x / L) = [e^(i n π x / L) + e^(- i n π x / L)] / 2.
  • Sen(n π x / L) = [e^(i n π x / L) - e^(- i n π x / L)] / 2 i.

Sustituyendo en la serie de Fourier original:

  • f(x) = a0 / 2 + ∑[an [e^(i n π x / L) + e^(- i n π x / L)] / 2 + bn [e^(i n π x / L) - e^(- i n π x / L)] / 2 i].
  • f(x) = a0 / 2 + ∑[(an / 2 + bn / (2 i)) e^(i n π x / L) + (an / 2 - bn / (2 i)) e^(- i n π x / L)].
  • f(x) = a0 / 2 + ∑[(an - i bn) e^(i n π x / L) / 2] + ∑[(an + i bn) e^(- i n π x / L) / 2].

Podemos escribir la serie con un único sumatorio extendido a índices positivos y negativos introduciendo la siguiente notación:

  • ck = “(an – i bn) / 2″ y “k = n” si “k > 0″.
  • ck = “a0 / 2″  si “k = 0″.
  • ck = “(an + i bn) / 2″ y “k = – n” si “k < 0″.
  • f(x) = ∑(ck e^(i n π x / L)) desde “-∞” hasta “∞”.

Veamos ahora cómo se calculan los coeficientes “ck” de la serie de Fourier compleja. Los “an” y “bn” vienen dados por:

  • an = ∫(f(x) Cos(n π x / L) dx) / L.
  • an = ∫(f(x) [e^(i n π x / L) + e^(- i n π x / L)] / 2 dx) / L.
  • bn = ∫(f(x) Sen(n π x / L) dx) / L.
  • bn = ∫(f(x) [e^(i n π x / L) - e^(- i n π x / L)] / 2 i dx) / L.

Con lo cual los “ck” serán, para:

  • k > 0.
  • k = n.
  • ck = (an – i bn) / 2.
  • ck = ∫(f(x) [e^(i n π x / L) + e^(- i n π x / L)] / 2 dx) / (2 L) – ∫(f(x) [e^(i n π x / L) - e^(- i n π x / L)] / 2 dx) / (2 L).
  • ck = ∫(f(x) e^(- i n π x / L) dx) / (2L).

Para :

  • k < 0.
  • k = – n.
  • ck = (an + i bn) / 2.
  • ck = ∫(f(x) [e^(i n π x / L) + e^(- i n π x / L)] / 2 dx) / (2 L) + ∫(f(x) [e^(i n π x / L) - e^(- i n π x / L)] / 2 dx) / (2 L).
  • ck = ∫(f(x) e^(i n π x / L) dx) / (2L).

Para:

  • k = 0.
  • c0 = ∫(f(x) dx) / (2 L) = a0 / 2.

cieloestrelladoLas estrellas son grandes acumulaciones de gas sometido a fuertes reacciones nucleares. Entre sus propiedades se encuentra la de emitir radiación en forma de luz y calor, así como generar potentes campos gravitatorios capaces de poner a orbitar planetas a su alrededor.

El índice de luminosidad de una estrella se mide a través de la ecuación:

  • L = 4 π σ r^2 T^4.

, donde “L” representa la luminosidad, “σ” una constante universal asociada a la luminosidad del Sol, “r” el radio de la estrella, y “T” la temperatura de la misma. Despejando, podemos calcular el radio:

  • r = [L / (4 π σ T^4)]^1/2.

A la hora de analizar estrellas es interesante tratar con los Diagramas HR, que representan las tres variables anteriores, clasificando las estrellas según las mismas.

Para entenderlos un poco mejor, tal vez será necesario recordar brevemente la ecuación de Planck y el espectro luminoso.

La velocidad de la luz, “c”, era igual a 300000 km/s en el vacío, y la velocidad del haz de luz se define como:

  • c = λ ν.

, donde “λ” es la longitud de onda y “ν” es la frecuencia, cuyo producto debe ser constante, por lo que son inversamente proporcionales. Asimismo, la ecuación de Planck nos decía que la energía de la onda era proporcional a la frecuencia a través de la constante “h”:

  • E = h ν.

Además, el color con el que apreciamos el haz lumínico depende de su energía, siendo, en orden ascendente de energía: negros, infrarrojos, rojos, anaranjados, amarillos, verdes, azules, añiles, violeta, ultravioleta… De todo esto concluimos que las estrellas a mayor temperatura son más propensas al color violeta, apróximándose más al tono rojizo cuanta menor sea su energía. Además, no debemos olvidar que por causa del Efecto Doppler, todas las estrellas tienden al color rojo en su apariencia, pues al alejarse disminuyen la frecuencia de onda aparente.

diagrama-hrEn el diagrama HR adjunto, la temperatura está representada de mayor a menor en el eje horizontal (grados Kelvin), mientras que la luminosidad está representada en el eje vertical de menor a mayor (Unidades Solares). El radio de las estrellas está representado en las líneas trasversales que cruzan el diagrama, medido tomando el Radio Solar como unidad.

La esperanza de vida de una estrella, también anotada en algunos tramos, es una estimación en base a las características físicas de la misma.  Cuanta más masa tiene una estrella, mayor es su velocidad de combustión, y menor será su esperanza de vida, pues no le llevará mucho, relativamente, consumirse. Si tomamos la masa solar:

  • S = 2 x 10^30 kg.

, como sistema de referencia, obtenemos las siguiente tabla:

  • 1 S = 7000000000 años.
  • 3 S = 200000000 años.
  • 7 S = 65000000 años.
  • 15 S = 10000000 años.

El Sol, que evidentemente está incluido en la primera categoría, aún está en la primera etapa de su vida, pues todavía está ganando temperatura y luminosidad. Una Vez alcance su temperatura máxima, su radio disminuirá, y con él su luminosidad, perdiendo posteriormente temperatura para acabar volviéndose una Enana Blanca.

enana-blanca¿Pero cómo saber en qué se convertirá cada estrella al extinguirse? Pues esto depende fundamentalmente de su radio y su masa.

Si la estrella es muy pequeña y tiene muy poca masa se convertirá en una Enana Blanca, de luminosidad, temperatura e interacción gravitatoria medias. Para llegar a esta fase la anterior estrella se desprende de su corteza.

pulsarSi tiene algo más de masa se convertirá en un Pulsar a través del mismo poceso. Los pulsares tienen la peculiaridad de estar compuestos de partículas quasi-elementales, por lo que se las conoce como estrellas de neutrones. El nombre de pulsar deriva de la señal o pulso que emiten sobre los detectores cada vez que uno de sus haces lumínicos incide directamente sobre nosotros.

Si la densidad de una estrella es lo suficientemente grande, ésta se convertira en un Agujero Negro, siempre que se cumpla la condición:

, es decir, que la raíz cuadrada del cociente “2 G M / r” sea igual o mayor que la velocidad de la luz, siendo “G” la constante de gravitación universal, “M” la masa de la estrella, y “r” el radio de la estrella.

supernovaSi la estrella es lo suficientemente grande, se convertirá en una Supernova y desprenderá grandes cantidades de energía.

Las estrellas acostumbran a encontrarse formando grupos más o menos grandes en los que todas ellas interaccionan gravitatoriamente con una gran dependencia, por lo que no se puede estudiar su movimiento por separado.

binariaDe entre todas las estrellas que observamos, el 80% de ellas son estrellas dobles, es decir, un sistema de al menos dos astros. Asimismo, el 24% son ternas de estrellas, y el 7,2% son cuaternas.

cumulo-abiertocumulo-globularCon respecto a las agrupaciones de grandes cantidades de estrellas en el cielo, encontramos cúmulos abiertos si están más o menos dispersas, y cúmulos globulares si todas ellas se acumulan en torno a un punto, que será el centro de masas del sistema.

galaxia-elipticagalaxia-espiralLas galaxias, por su parte, las clasificamos según otro criterio más adaptado. Serán elípticas si su forma se asemeja a la de una elipse, como las órbitas planetarias, y espirales si las estrellas forman curvas que convergen en círculo al núcleo galáctico.

Representacion de Puntos en el Espacio:

puntos1Consideremos tres rectas “x”, “y”, “z”, que son mutuamente perpendiculares y se intersecan en un mismo punto “O”. Éste punto se denominará origen de coordenadas y divide a cada eje en dos semiejes (positivo y negativo). Para cada punto “M” del espacio podemos encontrar las correspondientes coordenadas “P”, “Q”, “R”, de la siguiente forma.

El punto “P” es la intersección del eje “OX” con un eje paralelo al plano “yz” que pasa por “M”. De modo análogo se obtienen los puntos “Q” y “R” como resultado de la proyección del punto “M” en sus respectivos ejes coordenados.

La longitud de los segmentos es:

  • OP = x.
  • OQ = y.
  • OR = z.

, de modo que a cada punto del espacio le asignaremos la terna ordenada de números (x, y, z).

Denotaremos por “¬i”, “¬j”, “¬k”, a los vectores unitarios coordenados cuya dirección y sentido es el positivo de estos ejes. Dado un punto arbitrario “M”, se cumple que su vector de posición satisface

  • ¬OM = ¬OP + ¬OQ + ¬OR.

En términos de los vectores unitarios:

  • ¬OM = x ¬i + y ¬j + z ¬k.

Siendo siempre:

  • x = ¬OM ¬i.
  • y = ¬OM ¬j.
  • z = ¬OM ¬k.

La base (¬i, ¬j, ¬k) del espacio tridimensional es una base ortonormal, ya que todos sus vectores son unitarios y ortogonales dos a dos. Existe correspondencia biunívoca (única) entre cada punto “M” del espacio y el conjunto de las coordenadas cartesianas rectangulares (x, y, z).

Distancia entre Dos Puntos:

Sean los puntos “M1″ y “M2″, y sean sus coordenadas respectivas (x1, y1, z1) y (x2, y2, z2). Denominaremos distancia entre los puntos “M1″ y “M2″ a la longitud del segmento que los une:

Este resultado se obtiene aplicando reiteradamente el Teorema de Pitágoras. A esta distancia se le denomina distancia mínima euclídea entre los puntos “M1″ y “M2″.

Transformación de Coordenadas:

Consideremos dos sistemas de ejes de coordenadas cartesianos (x, y, z) y (x’, y’, z’), con sus respectivos orígenes “O” y “O’”. Dado un punto “A” del espacio tridimensional, podremos expresar sus coordenadas en ambos sistemas:

  • ¬OA = x ¬ex + y ¬ey + z ¬ez.
  • ¬O’A = x’ ¬ex’ + y’ ¬ey’+ z’ ¬ez’.

Las coordenadas del origen “O” expresadas en sistema (x’, y’, z’) son:

  • ¬O’O = x0′ ¬ex’ + y0′ ¬ey’+ z0′ ¬ez’.

A partir de las definiciones se cumple:

  • ¬O’A = ¬O’O + ¬OA = (x0′ ¬ex’ + y0′ ¬ey’+ z0′ ¬ez’) + (x ¬ex + y ¬ey + z ¬ez).

Expresemos ahora los vectores unitarios “¬ex”, “¬ey”, “¬ez”, en el sistema de vectores “¬ex’”, “ey’”, “ez’”:

  • ¬ex = a11 ¬e’x + a12 ¬ey’ + a13 ¬ez’.
  • ¬ey = a21 ¬e’x + a22 ¬ey’ + a23 ¬ez’.
  • ¬ez = a31 ¬e’x + a32 ¬ey’ + a33 ¬ez’.

Sustituyendo:

  • ¬O’A = (x0′ ¬ex’ + y0′ ¬ey’+ z0′ ¬ez’) + (x a11 + y a21 + z a31) ¬ex’ + (x a12 + y a22 + z a32) ¬ey’ + (x a13 + y a23 + z a33) ¬ez’, de donde: ¬O’A = (x0′ + x a11 + y a21 + z a31) ¬ex’ + (y0′ + x a12 + y a22 + z a32) ¬ey’ + (z0′ + x a13 + y a23 + z a33) ¬ez’.

De donde:

  • x’ = x0′ + x a11 + y a21 + z a31.
  • y’ = y0′ + x a12 + y a22 + z a32.
  • z’ = z0′ + x a13 + y a23 + z a33.

En estas ecuaciones aparecen en los dos miembros coordenadas referidas al sistema nuevo. Esto permite una escritura más compacta, pero si queremos poner en cada miembro de las expresiones coordenadas referidas a un único sistema de referencia hemos de modificar:

  • ¬O’A = – ¬OO’ + ¬OA.

Siempre se cumple que:

  • ¬ex ¬ex’ = a11.
  • ¬ey ¬ex’ = a21.
  • ¬ez ¬ex’ = a31.
  • ¬ex ¬ey’ = a12.
  • ¬ey ¬ey’ = a22.
  • ¬ez ¬ey’ = a32.
  • ¬ex ¬ez’ = a13.
  • ¬ey ¬ez’ = a23.
  • ¬ez ¬ez’ = a33.

Por lo tanto, si hacemos la descomposición inversa de los vectores:

  • ¬ex’ = a11 ¬ex + a21 ¬ey + a31 ¬ez.
  • ¬ey’ = a12 ¬ex + a22 ¬ey + a32 ez.
  • ¬ez’ = a13 ¬ex + a23 ¬ey + a33 ez.

Para que la transformación lleve de un sistema de ejes ortogonales a otro ha de cumplirse:

  • |¬ex|^2 = |¬ey|^2 = |¬ez|^2 = |¬ex’|^2 = |¬ey’|^2 = |¬ez’|^2 = 1.
  • ¬ex ¬ey = ¬ex ¬ez = ¬ey ¬ez = ¬ex’ ¬ey’ = ¬ex’ ¬ez’ = ¬ey’ ¬ez’ = 0.

Todas estas ecuaciones conducen a:

  • a11^2 + a12^2 + a13^2 = 1.
  • a21^2 + a22^2 + a23^2 = 1.
  • a31^2 + a32^2 + a33^2 = 1.
  • a11 a21 + a12 a22 + a13 a23 = 0.
  • a21 a31 + a22 a32 + a23 a33 = 0.
  • a31 a11 + a32 a12 + a33 a13 = 0.

Es decir, la suma de los cuadrados de los elementos con alguna componente similar es “1″, y la suma de los productos dos a dos de las componentes de los vectores de la segunda base es “0″. A este tipo de transformaciones se les denomina ortogonales.

Un modo de obtener una transformación ortogonal usando parámetros con un claro significado geométrico es mediante los Ángulos de Euler. Sean dos sistemas coordenados (x, y, z) y (x’, y’, z’) que comparten el origen de coordenadas. Para determinar la posición de los ejes del sistema (x’, y’, z’) respecto a los ejes del sistema (x, y, z) basta con conocer los siguientes tres ángulos:

  • El ángulo “σ” que forman los ejes zz’.
  • El ángulo “Ψ” desde el eje “x’” a la recta “OH” de intersección del plano “xy” con el plano “x’y'”.
  • El ángulo “φ” que forma la recta “OH” con el eje “x”.

angulos-eulerAl conjunto (φ, σ, Ψ) se le conoce como ángulos de Euler, y determinan completamente la posición de (x’, y’, z’) respecto a los ejes del sistema (x, y, z). El movimiento que lleva del triedro (x, y, z) al (x’, y’, z’) se puede descomponer en tres pasos:

.-Una rotación de un ángulo “φ” alrededor del eje “z”:

  • x1 = x Cosφ + y Senφ.
  • y1 = – x Senφ + y Cosφ.
  • z1 = z.

.-Una rotación de un ángulo “σ” alrededor del eje “x” resultante (eje “OH”, que llamaremos eje “x2″):

  • x2 = x1.
  • y2 = y1 Cosσ + z1 Senσ.
  • z2 = – y1 Senσ + z1 Cosσ.

.-Una rotación de un ángulo “ψ” alrededor del eje “z” resultante, que llamaremos eje “z3″:

  • x’ = x2 CosΨ + y2 SenΨ.
  • y’ = – x2 SenΨ + y2 CosΨ.
  • z’ =  z2.

En resumen:

  • x’ = (Cosφ SenΨ – Senφ SenΨ Cosσ) x + (Senφ CosΨ + Cosφ SenΨ Cosσ) y + (SenΨ Senσ) z.
  • y’ = – (Cosφ SenΨ – Senφ CosΨ Cosσ) x + (- Senφ SenΨ + Cosφ CosΨ Cosσ) y + (CosΨ Senσ) z.
  • z’ = (Senφ Senσ) x – (Cosφ Senσ) y + (Cosσ) z.

Sistemas de Coordenadas Cilíndricas:

coordenadas-cilindricasConsideremos un sistema de coordenadas cartesianas con ejes “x”, “y”, “z”. Las coordenadas cilíndricas de un punto serán denotadas por el radio “ρ”, la altura “z”, y el ángulo “Φ”; (ρ, Φ, z), y cumplen:

  • x = ρ CosΦ.
  • y = ρ SenΦ.
  • z = z.
  • ρ ≥ 0.
  • 0 ≤ Φ ≤ 2 π.
  • ¬r = ρ CosΦ ¬i + ρ SenΦ ¬j + z ¬k.

Las superficies de coordenadas constantes son:

  • “ρ = cte” genera un cilindro de eje “z”.
  • “Φ = cte” genera un plano que contiene al eje “z” y forma un ángulo “Φ” con el plano “xz”, siendo secante al plano “xy”.
  • “z = cte” genera un plano horizontal de altura “z”.

Las transformaciones inversas son:

  • ρ = [x^2 + y^2]^1/2.
  • Φ = Arcotg(y / x).
  • z = z.

Los vectores unitarios coordenados serán:

  • ¬ex = (d¬r / dx) / |d¬r / dx|, siendo “x” la coordenada curvilínea correspondiente.

A veces se definen los Coeficientes de Escala asociados a las coordenadas curvilíneas mediante hx = |d¬r / dx|. En nuestro caso:

  • d¬r / dΦ = - ρ SenΦ ¬i + ρ CosΦ ¬j.
  • d¬r / dρ = CosΦ ¬i + SenΦ ¬j.
  • d¬r / dz = ¬k.
  • hΦ = ρ.
  • hρ = 1.
  • hz = 1.

Por lo tanto:

  • ¬eρ = CosΦ ¬i + SenΦ ¬j.
  • ¬eΦ = - SenΦ ¬i + CosΦ ¬j.
  • ¬ez = ¬k.

Coordenadas Esféricas:

coordenadas-esfericas1Denotaremos las coordenadas esféricas de un punto en el espacio por el radio “ρ”, el ángulo “σ” de latitud, y el ángulo “Φ” de corte con el plano ecuador, (ρ, σ, Φ), y verifican:

  • x = ρ Senσ CosΦ.
  • y = ρ Senσ SenΦ.
  • z = ρ Cosσ.
  • ρ ≥ 0.
  • 0 ≤ Φ ≤ 2 π.
  • 0 ≤ σ ≤ π.
  • ¬r = ρ Senσ CosΦ ¬i + ρ Senσ SenΦ ¬j + ρ Cosσ ¬k.

Las relaciones recíprocas son:

  • ρ = [x^2 + y^2 + z^2]^1/2.
  • Φ = Arcotg(y / x).
  • σ = Arcotg([x^2 + y^2]^1/2 / z).

Las superficies coordenadas  correspondientes son:

  • “ρ = cte” genera una esfera de centro “O”.
  • “Φ = cte” genera un semiplano que contiene al eje “z” y forma un ángulo “Φ” con el eje “x”.
  • “σ = cte” es un cono de semianchura “σ” y que posee al eje “z” como eje de simetría.

Además:

  • d¬r / dρ = Senσ CosΦ ¬i + Senσ SenΦ ¬j + Cosσ ¬k.
  • d¬r / dσ = ρ Cosσ CosΦ ¬i + ρ Cosσ SenΦ ¬j – ρ Senσ ¬k.
  • d¬r / dΦ = – ρ Senσ SenΦ ¬i + ρ Senσ CosΦ ¬j.
  • hρ = 1.
  • hσ = ρ.
  • hΦ = ρ Senσ.

Los vectores unitarios coordenados son entonces:

  • ¬er = Senσ CosΦ ¬i + Senσ SenΦ ¬j + Cosσ ¬k.
  • ¬eσ = Cosσ CosΦ ¬i + Cosσ SenΦ ¬j – Senσ ¬k.
  • ¬eΦ = – SenΦ ¬i + CosΦ ¬j.

El sistema de coordenadas esférico tiene sobre todo interés en la descripción de problemas con simetría esférica.

Ecuación de una Recta en el Espacio:

Dado un punto “P” de “R^3″ y un vector no nulo “¬u”, se llama recta que pasa por “P” y tiene por dirección “¬u” al conjunto de puntos que cumplen:

  • ¬Pi = ¬P + λ ¬u (ecuación vectorial).

En componentes obtenemos las ecuaciones paramétricas:

  • pxi = px + λ ¬ux.
  • pyi = py + λ ¬uy.
  • pzi = pz + λ ¬uz.

Dados dos puntos “¬P” y “¬Q” distintos, por ellos pasa una sola recta, cuyas ecuaciones paramétricas son:

  • x = px + λ (¬qx – px).
  • y = py + λ (¬qy – py).
  • z = pz + λ (¬qz – pz).

Una recta que pase por un punto “¬P” con una dirección “¬u” coincide con otra que pase por “¬Q” con dirección “¬v” si los vectores “¬u”, “¬v”, “¬Q – ¬P” son proporcionales. Si despejamos “λ” de las ecuaciones paramétricas obtendremos:

  • λ = (x – px) / ux.
  • λ = (y – py) / uy.
  • λ = (z – pz) / uz.

, con lo que la recta queda también determinada por la llamada ecuación continua:

  • (x – px) / ux = (y – py) / uy = (z – pz) / uz.

La recta que pasa por los puntos “¬P” y “¬Q” se puede escribir como:

  • (x – px) / (qx – px) = (y – py) / (qy – py)= (z – pz) / (qz – pz).

Posición Relativa de Dos Rectas:

En el espacio dos rectas pueden ser paralelas, cortarse o cruzarse, de modo que la situación es algo más complicada que en el plano. Sean dos rectas que pasan por “¬P” y “¬Q” y tienen direcciones “¬u” y “¬v”, respectivamente. Sea “M” la matriz de coeficientes de determinante ecuación:

  • |M| = (uy vz – vy uz) (qx – px) + (vx uz – ux vz) (qy – py) + (ux vy – vx uy) (qz – pz).

.- Si “¬u ≠ λ ¬v”:

  • Si “|M| ≠ 0″ las rectas de cruzan.
  • Si “|M| = 0″ las rectas se cortan en un punto.

.- Si “¬u = λ ¬u”:

  • Si “¬Q – ¬P ≠ λ ¬u” las rectas son paralelas.
  • Si “¬Q – ¬P = λ ¬u” las rectas son coincidentes.

Ecuación de un Plano:

En el espacio tridimensional un plano quedará determinado especificando un punto “P” por el que pase y la dirección dada por dos vectores “¬u” y “¬v” linealmente independientes. Un conjunto “¬X” pertenecerá al plano si existen dos coeficientes “λ”, “μ” tales que:

  • ¬Qi – ¬Q = λ ¬u + μ ¬v.

A ésta se le denomina ecuación vectorial del plano. Las ecuaciones paramétricas son:

  • x = px + λ ux + μ vx.
  • y = py + λ uy + μ vy.
  • z = pz + λ uz + μ vz.

El plano que pasa por tres puntos no alineados P(px, py, pz), Q(qx, qy, qz), R(rx, ry, rz), lo podemos construir de la siguiente forma:

  • x = px + λ (qx – px) + μ (rx – px).
  • y = py + λ (qy – py) + μ (ry – py).
  • z = pz + λ (qz – pz) + μ (rz – pz).

Ecuación Euclídea de un Plano:

Un plano del espacio “R^3″ queda determinado si se conoce uno de sus puntos “P” y un vector no nulo “¬n” ortogonal al plano. Un punto “Q” pertenecerá al plano si: (¬Q – ¬P) ¬n = 0, pues si este producto escalar es nulo serán perpendiculares. Ésta se conoce como la ecuación euclídea del plano.

La ecuación general de un plano en el espacio será:

  • a x + b y + c z + d = 0.

, donde el vector ¬n(a, b, c) es perpendicular al plano.

Rectas como Intersecciones de Planos:

Toda recta en el espacio tridimensional se puede expresar como intersección de dos planos cuyos vectores normales no son proporcionales. Así pues, podemos definir la recta “r” como:

  • a1 x + b1 y + c1 z + d1 = 0.
  • a2 x + b2 y + c2 z + d2 = 0.

, donde el vector normal al primer plano es ¬m(a1, b1, c1) y el vector normal al segundo plano es ¬n(a2, b2, c2).


Posicion Relativa de Rectas y Planos:

Sea un plano “π” de ecuación “a x + by + c z + d = 0″, y consideremos una recta “r” cuyo vector director es ¬u(ux, uy, uz), y pasa por P(x0, y0, z0). Entonces la ecuación de la recta será: “(x – x0) / ux = (y – y0) / uy = (z – z0) / uz.”

El ángulo entre la recta y el plano “Φ” es el ángulo que forma el vector “¬u” con su proyección ortogonal sobre el plano “π”:

  • Φ = Arcosen(|¬u ¬n| / ||¬u|| ||¬a||).

Tenemos las siguientes posibilidades para la posición relativa de la recta y el plano:

  • La recta y el plano se cortan en un punto si los vectores “¬u” y “¬n” no son perpendiculares.
  • La recta y el plano son paralelos si los vectores “¬u” y “¬n” son perpendiculares y el sistema de ecuaciones es incompatible.
  • La recta está contenida en el plano si los vectores “¬u” y “¬n” son perpendiculares y el sistema de ecuaciones es compatible.

Distancia de un Punto a un Plano:

Consideremos un punto “P” y un plano “π” tales que “P” no pertenezca a “π”. Entonces existe un punto “P0″ en “π” tal que el vector “¬P – ¬P0″ es perpendicular a “π”. La distancia de “P” a “π” es la menor de las distancias de “P” a los puntos del plano “π”, y coincide con la longitud del segment0 PP0, que es la proyección del vector (¬Q – ¬P) sobre la normal al plano, “¬n”, siendo “¬Q” un punto del plano:

  • d(P,π) = |(¬Q – ¬P) ¬n| / ||¬n||.

Superficies y Curvas en el Espacio Tridimensional:

esfera2La ecuación de una superficie en el espacio tridimensional puede escribirse como f(x, y, z) = 0, y se denomina ecuación implícita de la superficie. Los puntos cuyas coordenadas (x, y, z) satisfacen dicha ecuación forman parte de la superficie. Un ejemplo es la esfera de radio “R” con centro en (x0, y0, z0):

  • (x – x0)^2 + (y – y0)^2 + (z – zo)^2 = R^2.

Otra forma de escribir la ecuación de una superficie es mediante el uso de parámetros. En general, si “u”, “v” pertenecen a “R”, una superficie podrá escribirse como:

  • x = f1(u, v).
  • y = f2(u, v).
  • z = f3(u, v).

Éstas se conocen como las componentes paramétricas de la superficie. Veamos por ejemplo las de la esfera (coordenadas esféricas):

  • x = R Senσ CosΦ.
  • y = R Senσ SenΦ.
  • z = R Cosσ.

cilindro-espacioOtro ejemplo. Consideremos el cilindro de radio “R” y que tiene como eje el eje “z”. Los puntos que se encuentran sobre el cilindro verifican que su distancia al eje debe ser “R”, de modo que tenemos la ecuación:

  • x^2 + y^2 = R^2, para cualquier valor de “z”.

Sus ecuaciones paramétricas podrían ser (coordenadas cilíndricas):

  • x = R CosΦ.
  • y = R SenΦ.
  • z = z.

Si intersecamos dos superficies tendremos en general una curva, de modo que al conjunto de de ecuaciones:

  • f1(x, y, z) = 0.
  • f2(x, y, z) = 0.

se les denomina a veces ecuación de una curva en forma implícita.

Consideremos las ecuaciones:

  • x^2 + y^2 = R^2.
  • x = h.

Se trata de un cilindro de radio “R” y un plano paralelo al plano “xy” que pasa por “x = h”. Tomadas en conjunto, esas dos ecuaciones describen una circunferencia de radio “R” centrada en (0, 0, h).

Otra forma de escribir la ecuación de una curva en 3 dimensiones es mediante un cierto parámetro, con lo cual tenemos las ecuaciones paramétricas de la curva:

  • x = g1(t).
  • y = g2(t).
  • z = g3(t).

En el caso de la circunferencia anterior tendríamos:

  • x = R Cost.
  • y = R Sent.
  • z = h.

Finalmente, una curva y una superficie intersecan normalmente en uno o varios puntos.

Superficies de Revolución:

Supongamos una curva en el plano “xz” dada mediante la ecuación z = f(x). Si giramos esta curva alrededor del eje “z”, cada punto de la curva describirá una circunferencia con centro en el punto (0, 0, z0), y radio “x0″. Los puntos de esta circunferencia verifican entonces:

  • x^2 + y^2 = x0^2.
  • z = z0.

Tenemos entonces “z0 = f([x^2 + y^2]^1/2). La ecuación de la superficie de revolución generada podemos escribirla como:

  • z = f([x^2 + y^2]^1/2) = f(r).

Superficies Cilíndricas:

Sea “γ” cierta curva en el espacio y sea “¬u” una dirección. Denominaremos superficie cilíndrica  de curva directriz “γ” y de generatriz “¬u” a la superficie contruida haciendo pasar por cada punto de “γ” una recta paralela a “¬u”.

Consideremos por ejemplo la siguiente elipse en el plano “xy”:

  • x0^2 / a^2 + y0^2 / b^2 = 1.

Si tomamos la generatriz paralela al eje “z” (ux = uy = 0, uz = 1), tendremos la ecuación de un cilindro elínptico de generatriz “z”:

  • x^2 / a^2 + y^2 / b^2 = 1.

Si tomamos, sin embargo, la recta “x = z, y = 0″ por generatriz, obtendremos un cilindro elíptico de generatriz “x = z, y = 0″ (ux = uy = 0, uz = 1):

  • (x – z)^2 / a^2 + y^2 / b^2 = 1.

Superficies Cónicas:

conoSea “γ” una curva arbitraria y “O” un punto fuera de ella. Tracemos una recta por cada punto de “γ” que pasa por “O”. El conjunto de puntos situados en estas rectas se denomina superficie cónica. “γ” es la directriz, “O” es el vértice, y cada recta “l” que pase por “γ” y “O” se denomina generatriz.

Supongamos que el vértice está situado en el origen de coordenadas, y tomemos como generatriz una recta que pase por “O” y por un punto (x0, y0, z0) de la curva “γ”. Las ecuaciones paramétricas de esta generatriz serán:

  • x = t x0.
  • y = t y0.
  • z = t z0.

Y su ecuación implícita es:

  • f1(x0, y0, z0) = 0.
  • f2(x0, y0, z0) = 0.

Como (x0, y0, z0) pertenece a la curva, y por lo tanto definible en general por medio a dunas ecuaciones paramétricas, ha de verificarse que:

  • x0 = g1(u).
  • y0 = g2(u).
  • z0 = g3(u).

de donde:

  • x = t g1(u).
  • y = t g2(u).
  • z = t g3(u).

Éstas serían las ecuaciones paramétricas de una seuperficie cónica con el vértice en el origen de coordenadas. Su ecuación implícita vendría dada por:

  • F(x, y, z) =0.

, por lo tanto podemos escribir:

  • F(x, y, z) = F(t x0, t y0, t z0) = F(x0, y0, z0) = 0.

Una propiedad interesante que se deriva de esto es que cualquier función homogénea de grado “q”:

  • F(t x, t y, t z) = t^q F(x, y, z).

puede representar una superficie cónica con vértice en el origen si la escribimos como:

  • F(x, y, z) = 0.

En efecto, si el punto (x0, y0, z0) está en la superficie tenemos:

  • F(x0, y0, z0) = F(t x0, t y0, t z0) = t^q F(x0, y0, z0).

Por lo tanto los puntos de las rectas que pasan por el origen está en la superficie.

El Elipsoide:

elipsoideConsideremos en el espacio euclídeo un sistema de ejes rectangulares “xyz”, y sean los números reales:

  • a > 0.
  • b > 0.
  • c > 0.

Definimos los puntos:

  • A = (a, 0, 0).
  • A’ = (- a, 0, 0).
  • B = (0, b, 0).
  • B’ = (0, – b, 0).
  • C = (0, 0, c).
  • C’ = (0, 0, – c).

Sean las elipses siguientes:

  • “Ex” con ejes “BB’”, “CC’”.
  • “Ey” con ejes “AA’”, “CC’”.
  • “Ez” con ejes “AA’”, “BB’”.

Cuyas ecuaciones son:

.-Ex:

  • y^2 / b^2 + z^2 / c^2 = 1.
  • x = 0.

.-Ey:

  • x^2 / a^2 + z^2 / c^2 = 1.
  • y = 0.

.-Ez:

  • x^2 / a^2 + y^2 / b^2 = 1.
  • z = 0.

Se llama elipsoide de vértices “A”, “A’”, “B”, “B’”, “C”, “C’”, al lugar geométrico que describe una elipse situada en un plano perpendicular al eje “z”, y que tiene sus vértices en las elipses “Ex”, “Ey”. La ecuación reducida del elipsoide es:

  • x^2 / a^2 + y^2 / b^2 + z^2 / c^2 = 1.

Un plano perpendicular al eje “z”, tal como el:

  • z = h.

, corta a la elipse “Ex” en los puntos:

  • y^2 / b^2 + h^2 / c^2 = 1.
  • x = 0.

, y a la elipse “Ey” en los puntos:

  • x^2 / a^2 + h^2 / c^2 = 1.
  • y = 0.

Es decir, por un lado a los puntos:

  • y = +- b [1 - h^2 / c^2]^1/2.
  • x = 0.
  • z = h.

, y por el otro a los puntos:

  • x = +- a [1 - h^2 / c^2]^1/2.
  • y = 0.
  • z = h.

De aquí deducimos que uno de los semiejes de la elipse variable por longitud “a [1 - h^2 / c^2]^1/2″ (el correspondiente al eje “x”), y el otro tiene por longitud “b [1 - h^2 / c^2]^1/2″ (el correspondiente al eje “y”). La ecuación de la elipse resultado de la intersección del elipsoide con un plano:

  • z = h.

es, por lo tanto:

  • z = h.
  • x^2 / (a^2 (1 – h^2 / c^2)) + y^2 / (b^2 (1 – h^2 / c^2)) = 1.
  • - c ≤ h ≤ c.

El lugar geométrico que barre esta elipse variando “h” desde “- c” hasta “c” es la superficie del elipsoide.

Propiedades del Elipsoide:

El elipsoide:

  • x^2 / a^2 + y^2 / B`2 + z^2 / c^2 = 1.

es simétrico respecto al origen de coordenadas. También es simétrico respecto a los ejes “x”, “y”, “z”, y respecto a los planos coordenados:

  • x = 0.
  • y = 0.
  • z = 0.

El elipsoide está situado entre dos esferas cuyos radios son:

  • r = mínimo de (a, b, c).
  • R = máximo de (a, b, c).

Si:

  • a = b.

, entonces el elipsoide es de revolución alrededor del eje “z”. Si además:

  • a = b = c.

, se trata de una esfera de radio “a”. Si:

  • a = c.

, tenemos una elipsoide de revolución alrededor del eje “y”.

Hiperboloide de una hoja:

hiperboloide-una-hoja1Consideremos un sistema de ejes rectangulares “xyz”, y sean los números reales:

  • a > 0.
  • b > 0.
  • c > 0.

Definimos los puntos:

  • A = (a, 0, 0).
  • A’ = (- a, 0, 0).
  • B = (0, b, 0).
  • B’ = (0, – b, 0).
  • C = (0, 0, c).
  • C’ = (0, 0, – c).
  • Sea “E” la elipse de simejes “AA’” y “BB’”.
  • Sea “Hx” la hipérbola con el eje real “BB’” e imaginario “CC’”.
  • Sea “Hy” la hipérbola con eje real “AA’” e imaginario “CC’”.

El hiperboloide de una hoja con ejes reales “AA’”, “BB’”, y cuyo eje imaginario es “CC’”, es el lugar geométrico de los puntos que pertenecen a una elipse situada en un plano perpendicular a “z” y con vértices en las hipérbolas “Hx” y “Hy”. Su ecuación reducida es:

  • x^2 / a^2 + y^2 / b^2 – z^2 / c^2 = 1.

Las ecuaciones de la elipse “E” son:

  • x^2 / a^2 + y^2 / b^2 = 1.
  • z = 0.

Las de la hipérbola “Hx”:

  • y^2 / b^2 – z^2 / c^2 = 1.
  • x = 0.

Y las de la hipérbola “Hy”:

  • x^2 / a^2 – z^2 / c^2 = 1.
  • y = 0.

Si cortamos estas hipérbolas “Hx” y “Hy” con el plano horizontal:

  • z = h.

obtendremos los siguientes puntos de corte: por parte de “Hx:”

  • y = +- b [1 + h^2 / c^2]^1/2.
  • x = 0.
  • z = h.

y por parte de “Hy”:

  • x = +- a [1 + h^2 / c^2]^1/2.
  • y = 0.
  • z = h.

Por lo tanto la elipseresultado de la intersección del hiperboloide con el plano:

  • z = h.

será:

  • z = h.
  • x^2 / (a^2 (1 + h^2 / c^2)) + y^2 / (b^2 (1 + h^2 / c^2)) = 1.
  • - ∞ ≤ h ≤ ∞.

Al hacer variar esta elipse en el eje “z” obtenemos la superficie del hiperboloide de una hoja. Si eliminamos “h” de las dos ecuaciones anteriores obtendremos la ecuación reducida.

Propiedades del Hiperboloide de Una Hoja:

El hiperboloide:

  • x^2 / a^2 + y^2 / b^2 – z^2 / c^2 = 1.

es simétrico respecto al origen “O”, a los ejes “x”, “y” y “z”, y también respecto a los planos coordenados.

El hiperboloide está situado fuera del cono:

  • x^2 / a^2 + y^2 / b^2 – z^2 / c^2 = 0.

Este cono es asintótico al hiperboloide, y es el cono que generan las asíntotas que resultan de cortar al hiperboloide con planos que contienen al eje “z”.

Sabemos que la intersección del hiperboloide con el plano:

  • z = h.

es:

  • x^2 / (a^2 (1 + h^2 / c^2)) + y^2 / (b^2 (1 + h^2 / c^2)) = 1.

, mientras que la intersección del cono con ese mismo plano es:

  • x0^2 / (a^2 h^2 / c^2) + y0^2 / (b^2 h^2 / c^2) = 1.

Si un punto (x0, y0) cumple la anterior ecuación, entonces el punto:

  • x = [1 + h^2 / c^2]^1/2 x0 / (h / c).
  • y = [1 + h^2 / c^2]^1/2 y0 / (h / c).

cumple pertenecer a la intersección con el hiperboloide. Los puntos (x, y) y (x0, y0) están en un plano perpendicular al eje “z”, y sus distancias a este eje verifican:

  • d = [x^2 + y^2]^1/2 = [c^2 / h^2 + 1]^1/2 [x0^2 + y0^2]^1/2.
  • d ≥ d0 = [x0^2 + y0^2]^1/2.

La ecuación del hiperboloide en coordenadas cilíndricas es:

  • ρ^2 (CosΦ^2 / a^2 + SenΦ^2 / b^2) – z^2 / c^2 = 1.

La intersección de este hiperboloide con un plano:

  • Φ = cte.

es una hipérbola. Las asíntotas de esta hipérbola son las rectas que admiten por ecuación conjunta a:

  • ρ^2 (CosΦ^2 / a^2 + SenΦ^2 / b^2) = z^2 / c^2.

El lugar geométrico que engendran estas rectas es el cono antes descrito.

Si:

  • a = b.

, entonces el hiperboloide de revolución gira en torno al eje “z”.

Hiperboloide de dos hojas:

hiperboloide-dos-hojasConsideremos un sistema de ejes rectangulares “xyz”, y sean los números reales:

  • a > 0.
  • b > 0.
  • c > 0.

Definimos los puntos:

  • A = (a, 0, 0).
  • A’ = (- a, 0, 0).
  • B = (b, 0, 0).
  • B’ = (- b, 0, 0).
  • C = (c, 0, 0).
  • C’ = (- c, 0, 0).
  • Sea “Hx” la hipérbola con eje real “CC’” e imaginario “BB’”.
  • Sea “Hy” la hiperbola con eje real “CC’” e imaginario “AA’”.

Se llama hiperboloide de dos hojas, que tiene como eje real “CC’” y como ejes imaginarios “AA’” y “BB’”, al lugar geométrico que describe una elipse variable situada en un plano perpendicular al eje “z” y cuyos vértices están en las hipérbolas “Hx” y “Hy”. Su ecuación reducida es:

  • x^2 / a^2 + y^2 / b^2 – z^2 / c^2 = – 1.

La hipérbola “Hx” es:

  • y^2 / b^2 – z^2 / c^2 = 1.
  • x = 0.

Y la hipérbola “Hy” es:

  • x^2 / a^2 – z^2 / c^2 = 1.
  • y = 0.

Si cortamos al hiperboloide con un plano:

  • z = h.

obtenemos dos elipses con vértices en los puntos:

  • y^2 / b^2 – z^2 / c^2 = 1.
  • x = 0.
  • z = h.

y:

  • x^2 / a^2 – z^2 / c^2 = 1.
  • y = 0.
  • z = h.

La ecuación de la elipse será:

  • x^2 / (a^2 (h^2 / c^2 – 1)) + y^2 / (b^2 (h^2 / c^2 – 1)) = 1.
  • |h| ≥ c.

Propiedades del Hiperboloides de Dos Hojas:

El hiperboloide de dos hojas es simétrico respecto al origen “O”, respecto a los ejes “x”, “y”, “z”, y también respecto a los planos coordenados.

El hiperboloide se halla situado fuera de la región:

  • |z| < c.

, ya que:

  • z^2 / c^2 = 1 + x^2 / a^2 + y^2 / b^2 ≥ 1.

Si:

  • a = b.

, entonces el hiperboloide es de revolucion:

  • (x^2 + y^2) / a^2 – z^2 / c^2 = 1.

, resultado de hacer girar alrededor del eje “z” una hipérbola conjugada al caso del hiperboloide de una hoja.

Paraboloide Elíptico:

paraboloideConsideremos en un sistema de semiejes rectangulares las siguientes parábolas: “Py”:

  • x^2 = 2 p z.
  • y = 0.

“Px”:

  • y^2 = 2 q z.
  • x = 0.

  • p > 0.
  • q > 0.

Tienen el vértice en el origen, la concavidad en el mismo sentido, y están situadas en planos perpendiculares.

El paraboloide elíptico es el lugar geométrico que describe una elipse variable con vértices en “Px” y “Py”. Su ecuación reducida es:

  • x^2 / p + y^2 / q = 2 z.

Si cortamos este paraboloide con un plano:

  • z = h.

obtenemos los siguientes puntos de corte por parte de “Px”:

  • x = +- [2 p h]^1/2.
  • y = 0.
  • z = h.

, y por parte de “Py”:

  • y = +- [2 q h]^1/2.
  • x = 0.
  • z = h.

La elipse resultado de la intersección será:

  • x^2 / 2 p h + y^2 / 2 q h = 1.

Propiedades del Paraboloide Elíptico:

El punto “O” se llama vértice deñ paraboloide elíptico, pero no es un centro de simetría. El paraboloide es simétrico respecto al eje “z” y los planos:

  • x = 0.
  • y = 0.

Si cortamos el paraboloide con los planos:

  • x = cte.

ó:

  • y = cte.

, obtenemos las parábolas:

  • x = c.
  • c^2 / 2 p + y^2 / 2 q = z.
  • y^2 = 2 q z – q c^2 / p.

, y:

  • y = c.
  • x^2 / 2 p + c^2 / 2 q = z.
  • x^2 = 2 p z – p c^2 / q.

Si:

  • p = q.

, entonces el paraboloide es de revolución, resultado de girar una parábola con el centro en el origen alrededor del eje “z”:

  • x^2 + y^2 = 2 p z.

Paraboloide Hiperbólico:

silla-montarConsideremos un sistema de ejes coordenados rectangulares y a las siguientes parábolas: Px:

  • y^2 = – 2 q z.
  • x = o.

Py:

  • x^2 = 2 p z.
  • y = 0.
  • p > 0.
  • q > 0.

Tienen el mismo vértice, la concavidad en distinto sentido, y están situadas en planos perpendiculares. Se llama paraboloide hiperbólico al lugar geométrico que describe una parábola variable paralela a “Px” que se desplaza de manera que su vértice recorre “Py”. Su ecuación reducida es:

  • x^2 / p – y^2 / q = 2 z.

Si intersecamos el paraboloide con:

  • y = h.

obtenemos:

  • x^2 / p = 2 z + h^2 / q.
  • x^2 = 2 p (z + h^2 / 2 q).

, que es una parábola en el plano:

  • y = h.

, con vértice (0, h, – h^2 / 2 q). Análogamente, si intersecamos el paraboloide con el plano:

  • x = h.

, obtenemos:

  • - x^2 / p = 2 z – h^2 / q.
  • x^2 = – 2 p (z – h^2 / 2 q).

, que es una parábola en el plano:

  • x = h.

con vértice (h, 0, h^2 / 2 q).

Si intersecamos al paraboloide hiperbólico con planos:

  • z = h.

obtenemos hipérbolas conjugadas:

  • x^2 / p – y^2 / q = 2 h.
  • x^2 / 2 h p – y^2 / 2 h q = 1, si h > 0.
  • x^2 / |2 h p| – y^2 / |2 h q| = 1, si h < 0.

Al paraboloide hiperbólico se le llama a veces “superficie en silla de montar”, por su analogía con ella.

Propiedades del Paraboloide Hiperbólico:

Se denomina vértice del paraboloide hiperbólico al punto “O”. Es simétrico respecto a “z” y a los planos:

  • x = 0.
  • y = 0.

Esta superficie no es en ningún caso una superficie de revolución.