Archivos en la Categoría: matematicas

Conociendo ya la geometría del plano y del espacio, en esta entrada pretendo dar un salto más allá y analizar qué pasa con ciertas figuras cuando introducimos el parámetro tiempo en nuestras descripciones. A diferencia de sus geometrías precedentes, aquí nos encontraremos con la particularidad de que los tres ejes (x, y, z, t) no son equivalentes, y que denominaremos a las figuras de forma diferente  según dónde esté ubicado el parámetro “t” en la ecuación, es decir, la geometría espacio-temporal es una idea más compleja que la geometría de 4 dimensiones, si bien tienen varias cosas en común. Así pues, estructuraré esta entrada explicando las cosas según el modelo 4-D, y después aportando las restricciones de que la 4ª dimensión. El espacio sobre el que trabajaremos será euclidiano, por lo que despreciaremos cualquier posible efecto relativista.

Puntos y vectores en 4 dimensiones:

En analogía con los anteriores espacios, el punto “¬P” se representará en función de sus 4 parámetros (x, y, z, t), y todo vector “¬v” dependerá de sus cuatro componentes (vx, vy, vz, vt).

Recta en 4 dimensiones:

A partir de las anteriores definiciones, podemos describir nuestra primera figura geométrica del siguiente modo:

  • ¬P = ¬P0 + λ ¬v.
  • ¬P = (x, y, z, t).
  • ¬P0 = (x0, y0, z0, t0).
  • ¬v = (vx, vy, vz, vt).

, donde “λ” puede tomar cualquier valor real y “P0″ representa un punto cualquiera de la recta.

En versión paramétrica, sus ecuaciones serían:

  • x = x0 + λ vx.
  • y = y0 + λ vy.
  • z = z0 + λ vz.
  • t = t0 + λ vt.

En continua:

  • λ = (x – xo) / vx = (y – yo) / vy = (z – zo) / vz = (t – t0) / vt.

, también representable como:

  • λ = Δx / vx = Δy / vy = Δz / vz = Δt / vt.

Punto en M.R.U.. Vector velocidad:

La recta “r” en 4 dimensiones antes descrita, si tiene un vector director “¬v” que cumpla:

  • vz ≠ 0.

toma un único valor (x, y, z) para cada valor de “t”, por lo que podemos considerarla, en analogía con el espacio en 3 dimensiones, un punto en movimiento.

Para ello, es más cómodo definir un cierto vector velocidad (vx, vy, vz, 1) equivalente, porque así, despejando de la ecuación continua antes vista:

  • λ = Δt.

, y obtenemos:

  • ¬P = ¬P0 + Δt ¬v.

, que, en analogía con la cinemática clásica, representa un movimiento rectilíneo uniforme (m.r.u.) para un punto material, y cumple:

  • x = x0 + vx Δt.
  • y = y0 + vy Δt.
  • z = z0 + vz Δt.
  • t = t0 + Δt.

, verificando la última ecuación nuestra definición de “Δt”.

Por último:

  • Δt = Δx / vx = Δy / vy = Δz / vz.

Evidentemente, este enfoque de la recta de 4 dimensiones no tiene sentido en caso de que:

  • vt = 0.

, pues toda ella estaría comprendida dentro de un único valor de “t”, inmóvil.

Posición relativa de dos rectas de 4 Dimensiones:

Dadas dos rectas “r1″ y “r2″ 4-D:

  • ¬P1 = ¬P01 + α ¬v1.
  • ¬P2 = ¬P02 + β ¬v2.

Diremos que son paralelas si sus vectores lo son, es decir, si “α” toma algún valor tal que:

  • α ¬v1 = ¬v2.

Si además de ésto, el punto “¬P02″ pertenece a “r1″, serán coincidentes:

  • ¬P01 + α ¬v1 = ¬P02.

En caso de que no sean paralelas, simplemente podrán cortarse o no. Si se cortan es trivial deducir el único punto de corte (x, y, z, t) que puden poseer, pues tiene que ser el único que tengan en común.

  • x = x01 + α vx1 = x02 + β vx2.
  • y = y01 + α vy1 = y02 + β vy2.
  • z = z01 + α vz1 = z02 + β vz2.
  • t = t01 + α vt1 = t02 + β vt2.

En caso de que el sistema tenga solución se cortan en ella. En caso contrario simplemente se cruzan, pero no llegan a chocar.

Movimiento Relativo de Dos Puntos en M.R.U:

Si, a partir del apartado anterior, queremos que nuestras rectas 4-D “r1″ y “r2″ sean ambas puntos en m.r.u., deben cumplir que:

  • v1t ≠ 0.
  • v2t ≠ 0.

, y por comodidad les impondremos:

  • t01 = 0.
  • t02 = 0.
  • v1t = 1.
  • v2t = 1.

Las dos primeras condiciones se cumplen tomando como puntos de origen “¬P01″ y “¬P02″ aquéllos ubicados en:

  • t = 0.

para cada una. Es decir, no basta con poner un “0″ en sus coordenadas de golpe. Para la segunda hay que dividir todas las componentes de los vectores dirección entre sus componentes “v1t” y “v2t” respectivamente.

Nos resultan así:

  • (x, y, z, t) = (x01, y01, z01, 0) + Δt (v1x, v1y, v1z, 1).
  • (x, y, z, t) = (x02, y02, z02, 0) + Δt (v2x, v2y, v2z, 1).

Estos cuerpos tomarán trayectorias paralelas si:

  • Δt ¬v1 = ¬v2.

, y además serán coincidentes si:

  • ¬P01 = ¬P02.

Si sus trayectorias no son paralelas pueden colisionar o no. Y si lo hacen tiene que existir un valor “Δt” en el que cumplan:

  • x01 + v1x Δt = x02 + v2x Δt.
  • y01 + v1y Δt = y02 + v2y Δt.
  • z01 + v1z Δt = z02 + v2z Δt.

Plano en 4 Dimensiones:

Denominaremos plano 4-D “γ” al conjunto de puntos que cumplen la ecuación:

  • ¬P = ¬P0 + α ¬v + β ¬w.

En paramétricas:

  • x = xo + α vx + β wx.
  • y = yo + α vy + β wy.
  • z = zo + α vz + β wz.
  • t = to + α vt + β wt.

Recta en M.R.U:

Esta vez las condiciones que impondremos sobre la ecuación serán más complejas. En primer lugar:

  • t0 = 0.

, como hemos hecho hasta ahora. En segundo lugar, tan solo uno de los dos vectores “¬v” o “¬w” debe depender del tiempo, por lo que sin pérdida de generalidad impondremos:

  • vt = 1.
  • wt = 0.

La unión de estas dos condiciones sin alterar la ecuación original es bastante compleja, por lo que la explicaré paso a paso. En primer lugar debemos considerar el vector 3-D perpendicular a las  componentes (x, y, z) de los “¬v” y “¬w” originales a través del producto vectorial:

  • ¬l = (vy wz – vz wy, vx wz – vz wx, vx wy – vy wx) = (lx, ly, lz).

Depués denominar un nuevo vector:

  • ¬m = (wx – vx, wy – vy, wz – vz, 0) = (mx, my, mz, 0).

Y finalmente el vector producto vectorial de “¬l” y las componentes (x, y, z) de “¬m”:

  • ¬n = (ly mz – lz my, lx mz – lz mx, lx my – ly mx) = (nx, ny, nz).

Y fabricamos los nuevos vectores:

  • ¬v = ¬m.
  • ¬w = (nx, ny, nz, 1).

Y nos resulta:

  • ¬P = ¬P0 + λ ¬v + Δt ¬w.

Teniendo esta ecuación resulta evidente que para valores fijos de “Δt” la figura resultante es una recta, que se va desplazando con m.r.u. a lo largo del tiempo.

En caso de que inicialmente ya solo uno de los dos vectores dependa del tiempo tan solo hay que dejar la componente “t” del otro igual a “1″, y en caso de que ninguno de ellos lo haga estariamos ante un simple plano estacionario de ecuaciones:

  • (x, y, z) = (x0, y0, z0) + α (vx, vy, vz) + β (wx, wy, wz).
  • t = t0.

Posición Relativa entre dos Planos de 4 Dimensiones:

Dados dos planos 4-D “γ1″ y “γ2″ genéricos:

  • ¬P1 = ¬P01 + α ¬v1 + β ¬w1.
  • ¬P2 = ¬P02 + δ ¬v2 + ε ¬w2.

Para que sean paralelos el subespacio generado por sus vectores debe tener dimensión dos. Es decir, que de entre los vectores “¬v1″, “¬v2″, “¬w1″, “¬w2″ dos de ellos sean linealmente dependientes de los otros dos. Lo cual es equivalente a calcular el rango de la matriz:

  • M  = [v1x, v1y, v1z, v1t; v2x, v2y, v2z, v2t; w1x, w1y, w1z, w1t; w2x, w2y, w2z, w2t].

y comprobar que es igual a “2″.

Si además de ser paralelas, el punto “¬P02″ pertenece a “γ1″:

  • ¬P01 + α ¬v1 + β ¬w1 = ¬P02.

para algún par de valores de “α” y “β” serán, además, coincidentes.

Si, en cambio, el rango de la matriz “M” es “3″, los planos 4-D se podrán cortar en una recta 4-D, y en caso de que el rango sea “4″, se cortarán en un punto que satisfaga:

  • x = x01 + α v1x + β w1x = x02 + δ v2x + ε w2x.
  • y = y01 + α v1y + β w1y = y02 + δ v2y + ε w2y.
  • z = z01 + α v1z + β w1z = x02 + δ v2z + ε w2z.
  • t = t01 + α v1t + β w1t = t02 + δ v2t + ε w2t.

, y sabemos que este sistema siempre puede tener solución porque estamos ante cuatro ecuaciones linealmente independientes de cuatro vectores. En caso de que el rango sea “3″, como ya dijimos, el corte se producirá sobre una recta 4-D, pues estaremos ante un sistema de cuatro ecuaciones compatibles y dependientes de tres vectores (el cuarto es combinación lineal de los anteriores).

Concluimos pues que, por muy antiintuitivo que sea, dos planos 4-D pueden intersecar en un punto, como veremos más detalladamente en el próximo apartado.

Por último, e intuitivamente, si el mencionado sistema de ecuaciones resulta incompatible, no poseerán puntos en común.

Movimiento Relativo de Dos Rectas en M.R.U:

Dadas dos rectas en m.r.u. “γ1″ y “γ2″:

  • ¬P1 = ¬P01 + d ¬v1 + Δt ¬w1.
  • ¬P2 = ¬Po2 + e ¬v2 + Δt¬w2.

Serán paralelas si, para algún valor de “d” y “Δt”, se cumple:

  • d ¬v1 = ¬v2.
  • Δt ¬w1 = ¬w2.

Si además:

  • ¬P01 + d ¬v1 + Δt ¬w1 = ¬P02.

serán coincidentes.

Analicemos ahora los posibles cortes. En caso de que no sean paralelas generalmente se cortarán en un punto, pues barrerán dos planos sobre el espacio 3-D, que siempre intersecan según las ecuaciones antes vistas.

La única posibilidad de que dos rectas en m.r.u. intersequen en una recta es que ambas coincidan en algún espacio 3-D delimitado por un determinado tiempo “t”, es decir, que sus vectores “¬v” sean linealmente dependientes, y que además, si prescindimos de ellos, los puntos en movimiento “r” y “s” determinados por:

  • ¬P1 = ¬P01 + Δt ¬w1.
  • ¬P2 = ¬P02 + Δt ¬w2.

converjan.

Movimiento Relativo de una Recta en M.R.U. Respecto a un Plano Estacionario:

Supongamos la recta en m.r.u. “r” y el plano estacionario “s” dados por las ecuaciones:

  • ¬P1 = ¬P01 + e ¬v1 + Δt ¬w1.
  • ¬P2 = ¬P02 + α ¬v2 + β ¬w2.

, donde obviamente “s” tiene un valor fijo del tiempo por definición.

Cuando se cumpla:

  • ¬t1 = ¬t2.

recta y plano compartirán el mismo espacio y las leyes que rigen su intersección son las vistas en R^3.

Si las componentes (x, y, z) de “¬v1″ son linealmente dependientes de las de los vectores “¬v2″ y “¬w2″ la “r” estará contenida en “s” durante el instante “t” mencionado, mientras que en caso contrario convergeran en un punto.

Espacio Generado por 3 Vectores de 4 Dimensiones:

Definimos como volumen 4-D “π” al conjunto de puntos que cumplen la ecuación:

  • ¬P = ¬P0 + α ¬u + β ¬v + γ ¬w.

, y como tiene una dimensión menos que la del espacio total, podemos definirlo a través de la ecuación normal con ayuda del vector “¬n” perpendicular a los tres vectores directores de “π”. Ésto lo realizamos a través de un producto vectorial de 4 dimensiones, definido como el determinante de la matriz:

  • [¬i, ¬j, ¬k, ¬l; ux, uy, uz, ut; vx, vy, vz, vt; wx, wy, wz, wt].

, donde “¬l” es el vector unitario en la dirección tiempo. Se calcule como se calcule este determinante (según el orden de los vectores), el resultado siempre será el mismo, excepto tal vez un cambio de signo que no afecta, resultándonos:

  • ¬n = (nx, ny, nz, nt).

De modo que la ecuación normal nos resultará:

  • nx x + ny y + nz z + nt t + k = 0.

, que por primera vez no es una ecuación vectorial. “k” es un escalar que se calcula de modo que el punto “¬P0″ satisfaga la ecuación. Más concretamente, resulta sencillo representar esta ecuación como un producto escalar:

  • ¬n ¬P + k = 0.

, donde “¬P” representa al conjunto de puntos que cumplen esa ecuación.

Plano en M.R.U:

Si a partir de la ecuación:

  • ¬P = ¬P0 + α ¬u + β ¬v + γ ¬w.

Imponemos las condiciones:

  • t0 = 0.
  • ut = 0.
  • vt = 0.
  • wt = 1.

a través de los métodos anteriormente vistos, obtenemos:

  • ¬P = ¬P0 + d ¬u + e ¬v + Δt ¬w.

, donde se aprecia que estamos ante la ecuación de un plano que se mueve con un m.r.u. a lo largo del tiempo.

No obstante, también es más cómodo representarlo a través de su ecuación normal, entre otras cosas porque siempre vamos a saber que existe, y nos permite saber con más antelación si depende del tiempo o no. Veamos algunos ejemplos:

  • t = 0.

Es el conjunto de todos los puntos que  existen en el mencionado tiempo, es decir, no es un plano en m.r.u.

  • x = 0.

Es el plano que foman entre los ejes “y” y “z”, invariante a lo largo de todo el tiempo.

  • x = t.

Es el plano antes mecionado desplazándose paralelamente al eje “x” de un modo directamente proporcional al tiempo.

Posición Relativa entre  Dos Planos en M.R.U. Redefinición de la Recta en M.R.U:

Dados dos planos en m.r.u. “π1″ y “π2″:

  • ¬n1 ¬P1 + k1 = 0.
  • ¬n2 ¬P2 + k2 = 0.

Si:

  • λ ¬n1 = ¬n2.

, son paralelos, pues sus vectores normales únicos son linealmente dependientes.

Si, además, dado un punto “¬P02″ perteneciente a “π2″, cumple:

  • ¬n1 ¬P02 + k1 = 0.

serán coincidentes.

En caso de que no sean paralelos, por lo general se cortarán siempre en una recta en m.r.u., redefinida a través de las ecuaciones de ambos. Es decir, si “π1″ y “π2″ son linealmente independientes entre ellos, sus ecuaciones juntas definen una recta.

Asimismo, la intersección de tres planos en m.r.u. linealmente independientes define un punto en m.r.u., y la intersección de cuatro define un punto.

Ejemplos:

  • t = 0.
  • x = 0.

Nos encontramos ante un plano de 4-D sobre los ejes “x” e “y” en el tiempo origen.

  • x = 0.
  • y = 0.

Nos encontramos ante la recta que compone el eje “z”, constante a lo largo del tiempo.

  • x = 0.
  • y = 0.
  • z = 0.

Definimos aquí el origen de coordenadas a lo largo del tiempo.

Movimiento Relativo entre un Plano y una Recta en M.R.U. Redefinición del Punto en M.R.U:

Sean el plano en m.r.u. “π” y la recta en m.r.u. “γ”:

  • ¬n1 ¬P1 + k1 = 0.
  • ¬n2 ¬P2 + k2 = 0.
  • ¬n3 ¬P3 + k3 = 0.

Si las tres ecuaciones son linealmente independientes se cortarán en un punto en m.r.u. definido entre las tres ecuaciones, mientras que si la primera es dependiente de alguna de las otras dos se cortarán en la propia recta “γ”.

Veamos un ejemplo:

  • x = t.
  • x = 0.
  • y = 0.

Estamos intersecando el plano perpendicular a “x” que se movia proporcionalmente a “t” con el eje “z” a lo largo del tiempo, antes definidos. Nos resulta el eje “z” en el tiempo inicial.

Movimiento Relativo entre un Plano y un Punto en M.R.U:

Sean el plano en m.r.u. “π” y el punto en m.r.u. “r”:

  • ¬n1 ¬P1 + k1 = 0.
  • ¬n2 ¬P2 + k2 = 0.
  • ¬n3 ¬P3 + k3 = 0.
  • ¬n4 ¬P4 + k4 = 0.

Si las cuatro ecuaciones son linealmente independientes se cortan en un punto, y en caso contrario se cortan en el propio punto en movimiento “r”.

Veamos un ejemplo:

  • z = 0.
  • x = 0.
  • y = 0.
  • z = 0.

Estamos intersecando el plano formado por “y” y “z” a lo largo del tiempo con el origen de coordenadas a lo largo del tiempo. Se ve que la primera ecuación es dependiente de la cuarta, por lo que se intersecan en el origen a lo largo del tiempo.

Movimiento Relativo entre una Recta y un Punto en M.R.U:

Sean la recta en m.r.u. “γ” y el punto en m.r.u. “r”:

  • ¬n1 ¬P1 + k1 = 0.
  • ¬n2 ¬P2 + k2 = 0.
  • ¬n3 ¬P3 + k3 = 0.
  • ¬n4 ¬P4 + k4 = 0.
  • ¬n5 ¬P5 + k5 = 0.

Como es imposible que cuatro ecuaciones sean linealmente independientes en un espacio 4-D, al menos una de ellas siempre será linealmente dependiente de las otra 4. Si solo una lo es, convergerán en un punto. Si lo son dos, se cortarán en el propio punto en movimiento.

Superficies Evolutivas:

Acabamos de definir el el plano en m.r.u. como una función de los parámetros (x, y, z, t) igualada a “0″, pero la forma que adopta su ecuación no es más que un caso particular que la de este tipo de superficie cuando se mueve en m.r.u. Así pues, podemos generalizar la ecuación implícita dependiente de cuatro parámetros como la que define siempre algún tipo de superficie variando en el tiempo, es decir, evolucionando, de modo que toda superficie en movimiento “σ” se podrá definir como:

  • σ(x, y, z, t) = 0.

Un plano con movimiento rectilíneo uniformemente acelerado (m.r.u.a.) tomaría la forma:

  • ¬n ¬P + (t + c)^2 = 0.

, donde “c” representa cualquier escalar constante.

Curvas Evolutivas:

Del mismo modo que la intersección de dos planos en m.r.u. engendraba una recta en m.r.u, la intersección de dos superficies evolutivas definirá una curva evolutiva “Φ”, definida con las ecuaciones de las mismas:

  • σ1(x, y, z, t) = 0.
  • σ2(x, y, z, t) = 0.

Veremos ejemplos de esto en otra ocasión.

Superficies Evolutivas de Revolución:

.-Revolución de Primer Orden:

Decimos que una superficie evolutiva consta de una revolución de primer orden si dos de sus parámetros distintos de “t”, como por ejemplo “x” e “y”, cumplen:

  • (x – x0)^2 + (y – y0)^2 = R^2.

para algún valor de “x0″, “y0″ y “R”, es decir, si sobre que el plano que forman sus ejes la superficie siempre toma la forma de circunferencias.

.-Revolución de Segundo Orden:

Diremos, en analogía con lo anterior, que una superficie evolutiva consta de una revolución de segundo orden si siempre se cumple:

  • (x – x0)^2 + (y – y0)^2 + (z – zo)^2 = R^2.

para algún valor de “x0″, “y0″, “z0″ y “R”, o dicho de otro modo, si posee forma esférica en todos los instantes de tiempo.

Superficies Evolutivas Cilíndricas:

Decimos que una superficie evolutiva “σ” es cilíndrica si, dada una curva evolutiva “Φ”, definimos una dirección vectorial “¬v” y la aplicamos sobre todos y cada uno de sus puntos. Por ejemplo, si a la esfera:

  • x^2 + y^2 + z^2 = 0.
  • t = 0.

le obligamos a seguir “λ” veces el vector:

  • ¬v = (1, 1, 1, 1).

, nos estamos cargando la segunda ecuación de nuestra figura, que fijaba el tiempo, y pasa a ser una esfera en m.r.u., es decir, una superficie evolutiva con cualidades cilíndricas.

Todas las figuras (superficies, curvas, puntos) en m.r.u. son cilíndricas.

Superficies Evolutivas Cónicas:

Dada una curva evolutiva “Φ” y un punto “¬P” perteneciente o no a la misma. Definimos como superficie evolutiva cónica al conjunto de puntos “¬Q” que cumplen, para algún valor de “λ” y algún punto “¬O” de “Φ”:

  • ¬P + λ (¬O – ¬P) = ¬Q.

Tomemos como ejemplo:

  • ¬P = (0, 0, 0, 0).

Φ:

  • x^2 + y^2 + z^2 = R^2.
  • t = 0.

al origen de coordenadas y una esfera estacionaria que lo tenga por centro. Si pensamos en todos los puntos que están alineados con el origen pasando por nuestra esfera obtenemos todo el espacio:

  • t = 0.

De modo que, en cierto modo, los espacios delimitados por un valor concreto de cualquiera de las componentes son superficies evolutivas cónicas.

Estudio General de las Cuádricas Evolutivas:

De modo análogo a como acontecía en R^2 y en R^3, todas las curvas cuádricas evolutivas estarán definidas por ecuaciones del estilo:

  • a1 x^2 + a2 y^2 + a3 z^2 + a4 t^2 + b12 z t + b13 y t + b14 y z + b23 x t + b24 x z + b34 x y + c1 x + c2 y + c3 z + c4 t + d = 0.

Matricialmente:

  • Pt M P = 0.

, donde “t” representa matriz traspuesta, y:

  • P = [1; x; y; z; t].
  • M = [d, c1, c2, c3, c4; c1, a1, b34, b24, b23; c2, b34, a2, b14, b13; c3, b24, b14, a3, b12; c4, b23, b13, b12, a4].

En general, siempre exigiremos que, para que la ecuación ciertamente represente una cuádrica evolutiva, cumpla:

  • detM ≠ 0.

Una vez sepamos esto, definimos la matriz de términos cuadráticos:

  • A = [a1, b34, b24, b23; b34, a2, b14, b13; b24, b14, a3, b12; b23, b13, b12, a4].

Y calculamos sus cuatro autovalores “λ1″, “λ2″, “λ3″, “λ4″, de los cuales a lo sumo uno de ellos será nulo. En caso de que ninguno de ellos lo sea, tal y como pasaba en anteriores dimensiones, nos encontramos ante una cuádrica evolutiva de ecuación:

  • λ1 x^2 + λ2 y^2 + λ3 z^2 + λ4 t^2 + detM / detA = 0.

En caso de que uno de ellos lo sea, pongamos por ejemplo “λ4″, nos resulta:

  • λ1 x^2 + λ2 y^2 + λ3 z^2 + 2 [- detM / (λ1 λ2 λ3)]^1/2 z = 0.

Pero estas cuádricas son genéricas para un espacio extrañamente simétrico de 4-D. Nosotros queremos que la cuarta dimensión sea el tiempo para darle sentido físico, de modo que, para las anteriores ecuaciones, no solo será interesante saber dónde está ubicado el tiempo, sino que además habrá que analizar su signo. Veamos los 18 casos posibles.

En las próximas explicaciones, despreciaremos la posible existencia de términos constantes innecesarios que, si bien nos proporcionarían más generalidad, oscurecerían la visión de las figuras descritas, que es el verdadero objetivo. Consecuentemente, todas las figuras poseerán algún grado de revolución.

Elipsoide Evolutivo Creciente:

  • x^2 + y^2 + z^2 = t.

Dada su revolución de 2º grado, estamos ante una esfera cuyo radio aumenta de la forma:

  • R = t^1/2.

Así pues, obtenemos una representación de cómo el origen de coordenadas se va dilatando esféricamente hasta el infinito.

Elipsoide Evolutivo Decreciente:

  • x^2 + y^2 + z^2 = – t.

En esta ocasión, el elipsoide solo está definido para valores negativos del tiempo, es decir, precedentes al origen. Nos encontramos ante el caso opuesto al de antes: una esfera infinita se comprime hasta ser un punto, el origen de coordenadas.

Elipsoide Evolutivo Cóncavo:

  • x^2 + y^2 + z^2 + t^2 = 1.

Dada su forma, podemos introducir el concepto de revolución de 3er grado. Si escribimos esto de un modo más claro:

  • x^2 + y^2 + z^2 = 1 – t^2.

, apreciamos que el radio de nuestra esfera se comprime con el valor absoluto del tiempo, de modo que alcanza un radio máximo en el tiempo inicial. Nos encontramos ante el origen de coordenadas, que en:

  • t = – 1.

comenzó a dilatarse esféricamente, alcanzando un radio:

  • R = 1.

en el instante:

  • t = 0.

para volver a su condición de punto en el instante:

  • t = 1.

Elipsoide Evolutivo Convexo:

  • x^2 + y^2 + z^2 – t^2 = 1.

De un modo más claro:

  • x^2 + y^2 + z^2 = 1 + t^2.

Estamos ante una esfera de radio infinito en sus orígenes, que en el instante:

  • t = 0.

se ha comprimido a una esfera:

  • x^2 + y^2 + z^2 = 1.

, para posteriormente se ha vuelto a dilatar hasta alcanzar de nuevo un radio infinito.

Elipsoide Evolutivo Imaginario:

  • x^2 + y^2 + z^2 + t^2 = – 1.

La suma de números cuadrados nunca puede ser negativa, por lo que esta ecuación no toma valores reales.

Elipsoide Evolutivo Fraccionado.

  • x^2 + y^2 + z^2 – t^2 = – 1.

Reordenando:

  • x^2 + y^2 + z^2 =  t^2 – 1.

De nuevo estamos ante una esfera de radio infinito que se contrae y se vuelve a expandir, pero en esta ocasión en los instantes:

  • t = – 1.
  • t = 1.

se cumple que:

  • R = 0.

, de modo que en el intervalo (-1, 1) no está definida. La consideramos fraccionada por este periodo de tiempo en el que su radio se contrae más de lo físicamente posible, haciéndola desaparecer hasta que crece de nuevo.

Hiperboloide Evolutivo de 2 Hojas:

  • x^2 + y^2 + t^2 – z^2 = – 1.

Expresado de otro modo:

  • x^2 + y^2 – z^2 = – 1 – t^2.

Dado que la parte derecha de la ecuación es negativa, el hiperboloide siempre será de 2 hojas, y comienza y acaba en su forma límite, que es formando dos planos infinitos en la base y en el techo del espacio 3-D. Por el medio del tiempo se va aproximando a su forma más conocida, achatándose y tendiendo a un cono hasta:

  • t = 0.

, para después crecer de nuevo y retomar su forma original.

Hiperboloide Evolutivo de 1 Hoja:

  • x^2 + y^2 – z^2 – t^2 = 1.

O dicho de otro modo:

  • x^2 + y^2 – z^2 = 1 + t^2.

Como la parte derecha siempre es positiva, siempre estaremos ante un hiperboloide de 1 hoja, que comienza siendo un cilindro de radio infinito, para después achatarse por el centro, tendiendo a formar un cono hasta:

  • t = o.

, momento en el que vuelve a expandirse.

Hiperboloide Evolutivo Creciente:

  • x^2 + y^2 – z^2 = t.

Observamos que, en un principio, a medida que “t” es negativo y se va aproximando al “0″, estamos ante un hiperboloide evolutivo de 2 hojas con una evolución más lineal. Sin embargo, en esta ocasión, cuando:

  • t = 0.

llega a ser un cono, y no recupera su forma original, sino que el cono se transforma a en un hiperboloide evolutivo de 1 hoja que acabará siendo un cilindro de radio infinito.

Hiperboloide Evolutivo Decreciente:

  • x^2 + y^2 – z^2 = – t.

Estamos ante el mismo caso que antes, solo que en esta ocasión comienza siendo un  hiperboloide evolutivo de 1 hoja y acaba siendo un 2 hojas.

Hiperboloide Evolutivo Centrado en 2 Hojas:

  • x^2 + y^2 – z^2 – t^2 = -1.

También expresable como:

  • x^2 + y^2 – z^2 = -1 + t^2.

En analogía con el hiperboloide evolutivo de 1 hoja, el término de la derecha es casi siempre positivo, y por tanto podemos compararlos, con la particularidad de que esta vez en los valores:

  • t = – 1.
  • t = 1.

llega a ser un cono, y en el intervalo (-1, 1) es un 2 hojas que se infla un poco para deshacerse de nuevo y dar lugar al 1 hoja original.

Hiperboloide Evolutivo Centrado en 1 Hoja:

  • x^2 + y^2 + t^2 – z^2 = 1.

Enunciable mejor como:

  • x^2 + y^2 – z^2 = 1 – t^2.

Comparándolo con el anterior, el término de la derecha es casi siempre evolutivo, y podemos asumir que se comporta exactamente igual cambiando en todo momento “2 hojas” por “1 hoja” y viceversa.

Paraboloide Evolutivo Elíptico Creciente 1:

  • x^2 + y^2 + t^2 = z.

De un modo más claro:

  • x^2 + y^2 = z – t^2.

El paraboloide solo está definido para valores positivos del miembro derecho de la ecuación, por lo que a medida que aumenta el valor absoluto del tiempo el vértice del paraboloide se eleva a:

  • z = t^2.

Paraboloide Evolutivo Elíptico Decreciente 1:

  • x^2 + y^2 + t^2 = – z.

Enunciable como:

  • x^2 + y^2 = – z – t^2.

Debido a que el segundo miembro siempre tiene que ser positivo para que esté definido, el vértice del paraboloide se encontrará en todo momento en:

  • z = – t^2.

, e irá descendiendo o ascendiendo acorde con ello. Este paraboloide está curvado hacia abajo, mientras que el anterior lo estaba hacia arriba.

Paraboloide Evolutivo Elíptico Creciente 2:

  • x^2 + y^2 – t^2 = z.

Operando:

  • x^2 + y^2 = z + t^2.

El vértice de este paraboloide estará ubicado en:

  • z = – t^2.

, ascendiendo.

Paraboloide Evolutivo Elíptico Decreciente 2:

  • x^2 + y^2 – t^2 =  – z.

Haciendo el cambio pertinente:

  • x^2 + y^2 =  – z + t^2.

Tenemos el vértice ubicado en:

  • z = t^2.

, descendiendo.

Paraboloide Evolutivo Hiperbólico Creciente:

  • x^2 + t^2 – y^2 = z.

El punto de silla de la figura se encuentra en:

  • z = t^2.

, ascendiendo con el valor absoluto del tiempo.

Paraboloide Evolutivo Hiperbólico Decreciente:

  • x^2 + t^2 – y^2 = – z.

Tenemos un punto de silla descendiente en:

  • z = – t^2.

En anteriores capítulos hemos tratado la geometría analítica en el plano y en el espacio, y consecuentemente las curvas cónicas y las cuádricas. Haremos ahora, pues, un análisis detallado de las mismas.

Análisis General de las Cónicas:

Hasta el momento habíamos considerado las tres cónicas fundamentales a partir de sus ecuaciones reducidas. Estas ecuaciones son de segundo grado en las coordenadas “x” e “y”. Si cambiamos el origen de corrdenadas o rotamos los ejes, las ecuaciones reducidas de las cónicas se transforman en ecuaciones de segundo grado. Consideremos la ecuación general:

  • a1 x^2 + a2 y^2 + 2 b x y + 2 c1 x + 2 c2 y + d = 0.

Esta ecuación se puede escribir de forma matricial como:

  • [x, y] [a1, b; b, a2] [x; y] 2 [c1, c2] [x; y] + d = 0.

, o bien:

  • Pt A P + 2 Bt P + c = 0.

, donde la “t” junto a una matriz indica traspuesta, es decir, las filas intercambiadas por las culumnas, y:

  • P = [x; y].
  • B = [c1; c2].
  • A = [a1, b; b, a2].

De una forma más compacta:

  • [1, x, y] [d, c1, c2; c1, a1, b; c2, b, a2] [1, x, y] = 0.
  • Qt M Q = 0.
  • Q = [1; x; y].

El lugar geométrico de los puntos (x, y) que verifican la ecuación anterior respecto a un sistema de coordenadas concreto se denomina cónica. En general, pediremos que:

  • [a1, b; b, a2] ≠ [0, 0; 0, 0].

, ya que en caso contrario tendríamos la ecuación de una línea recta en el plano. Adoptaremos la notación:

  • M = [d, c1, c2; c1, a1, b; c2, b, a2].
  • A = [a1, b; b, a2].

La matriz “A” es simétrica. A la matriz “M” se la denomina matriz de la cónica, mientras que a “A” la denominamos matriz de los términos cuadráticos.

Cónica Ordinaria y Cónica Degenerada:

Si una cónica cumple que:

  • detM ≠ 0.

, se la denomina cónica ordinaria, y será en general una elipse, una hipérbola o una parábola.

Si una cónica cumple que:

  • detM = 0.

, se la denomina cónica degeneradam y será la ecuación de un punto, un par de rectas, o tal vez no tendrá solución real.

Ecuación Reducida de las Cónicas:

Consideremos una cónica de ecuación:

  • a1 x^2 + a2 y^2 + 2 b x y + 2 c1 x + 2 c2 y + d = 0.

, o bien en forma matricial:

  • [1, x, y] [d, c1, c2; c1, a1, b; c2, b, a2] [1, x, y] = 0.

Sabemos, además, que siempre existe una rotación de ejes que diagonaliza la matriz de los términos cuadráticos:

  • A = [a1, b; b, a2].

Sea entonces ésta la transformación:

  • x’ = Cosσ x – Senσ y.
  • y’ = Senσx + Cosσ y.

En las nuevas coordenadas:

  • A’ = [λ1, 0; 0, λ2].

, y la ecuación de la cónica se escribe como:

  • λ1 (x’)^2 + λ2 (y’)^2 + 2 α x’ + 2 β y’ + γ = 0.

Consideremos los casos:

.- λ1, λ2 ≠ 0:

Podemos entonces trasladar el origen de coordenadas de modo que en unas nuevas coordenadas (x”, y”) la ecuación sea:

  • λ1 (x”)^2 + λ2(y”)^2 + k = 0.

Basta tomar:

  • x’ = x” – α / λ1.
  • y’ = y” – β / λ2.

, y sustituirlo en la ecuación general:

  • λ1 (x’)^2 + λ2 (y’)^2 + 2 α x’ + 2 β y’ + γ = 0.

, de donde:

  • λ1 (x”)^2 + λ2(y”)^2 + k = 0.

, con:

  • k = γ – α^2 / λ1 – β^2 / λ2.

En este nuevo sistema de ejes:

  • M” = [k, 0, 0; 0, λ1, 0; 0, 0, λ2].
  • A” = [λ1, 0; 0, λ2].

, por tanto:

  • detM” = ρ^3 detM.
  • detA” = ρ^2 detA.
  • λ1 = ρ λ1.
  • λ2 = ρ λ2.

De aquí obtenemos:

  • ρ = 1.

, y además:

  • k λ1 λ2 = detM.
  • λ1 λ2 = detA.
  • k = detM / detA.

Llegamos a la ecuación reducida:

  • λ1(x”)^2 + λ2 (y”)^2 + detM / detA = 0.

Los tipos de cónicas descritas por esta ecuación reducida son elipses e hipérbolas, y pares de rectas concurrentes:

Elipses:

  • λ1 > 0.
  • λ2 > 0.
  • detM / detA < 0.
  • λ1 < 0.
  • λ2 < 0.
  • detM / detA > 0.

Elipses Imaginarias:

  • λ1 > 0.
  • λ2 > 0.
  • detM / detA > 0.
  • λ1 < 0.
  • λ2 < 0.
  • detM / detA > 0.

Hipérbolas:

  • λ1 > 0.
  • λ2 < 0.
  • detM / detA ≠ 0.
  • λ1 < 0.
  • λ2 > 0.
  • detM / detA ≠ 0.

Pares de rectas:

  • λ1 λ2 < 0.
  • detM = 0.

Origen:

  • λ1 λ2 > 0.
  • detM = 0.

.-Alguno de los Autovalores de “A” es nulo.

Sin pérdida de generalidad, podemos considerar:

  • λ1 = 0.
  • λ2 ≠ 0.

Si consideremos la ecuación en el sistema en que “A” es diagonal tendremos:

  • λ2 (y’)^2 + 2 α x’ + 2 β y’ + γ = 0.

Hacemos el cambio:

  • y’ = y” – β / λ2.
  • x’ = x”.

Denotando:

  • k = γ – β^2 / λ2.

tenemos:

  • λ2 (y”)^2 + 2 α x” + k = 0.

Hagamos ahora el cambio:

  • y”’ = y”.
  • x”’ = x” + k / (2 α).
  • λ2 (y”’)^2 + 2 α (x”’ – k / (2 α)) + k = 0.
  • λ2 (y”’)^2 + 2 α x”’ = 0.
  • M”’ = [0, α, 0; α, 0, o; 0, 0, λ2].
  • A”’ = [0, 0; 0, λ2].
  • detM”’ = – α^2 λ2 = ρ^3 det M.
  • λ2 = ρ λ2.

Entonces tenemos de nuevo:

  • ρ = 1.

, y:

  • α^2 = – detM / λ2 > 0.

Por tanto la ecuación de la cónica será:

  • λ2 (y”’)^2 + 2 [- detM / λ2]^1/2 x”’ = 0.

En esta ecuación los dos signos de la raíz son posibles.

Parábolas:

  • detM ≠ 0.

Rectas:

  • detM = 0.

Estudio General de las Cuádricas:

Denominaremos cuádrica al lugar geométrico de los puntos cuyas coordenadas (x, y, z) satisfacen una ecuación del tipo:

  • a1 x^2 + a2 y^2 + a3 z^2 + 2 b1 yz + 2 b2 xz + 2 b3 xy + 2 c1 x + 2 c2 y + 2 c3 z + d = 0.

En forma matricial la escribimos como:

  • [1, x, y, z] [d, c1, c2, c3; c1, a1, b3, b2; c2, b3, a2, b1; c3, b2, b1, a3] [1; x; y; z] = 0.
  • Qt M Q = 0.

Denominamos matriz de la cuádrica y matriz de los términos cuadráticos, respectivamente, a:

  • M = [d, c1, c2, c3; c1, a1, b3, b2; c2, b3, a2, b1; c3, b2, b1, a3].
  • A = [a1, b3, b2; b3, a2, b1; b2, b1, a3].

También podemos escribir la cuádrica de la siguiente manera:

  • [x, y, z] A [x; y; z] + 2 [c1, c2, c3] [x; y; z] +d = 0.
  • Pt A P + 2 Ct + d = 0.

Si:

  • detM ≠ 0.

, tendremos una cuádrica ordinaria: un elipsoide, un hiperboloide o un paraboloide.

Si:

  • detM = 0.

, tendremos una cuádrica degenerada: un cono, un cilindro o un par de planos.

Ecuaciones Reducidas de las Cuádricas:

Consideremos un cierto sistema de ejes y sea la cuádrica con ecuación:

  • a1 x^2 + a2 y^2 + a3 z^2 + 2 b1 yz + 2 b2 xz + 2 b3 xy + 2 c1 x + 2 c2 y + 2 c3 z + d = 0.

Como “A” es una matriz simétrica diagonalizable, para una cierta transformación ortogonal cumplirá que:

  • A = [λ1, 0, 0; 0, λ2, 0; 0, 0, λ3].

En estas nuevas coordenadas, la cuádrica se escribe como:

  • λ1 (x’)^2 + λ2 (y’)^2 + λ3 (z’)^2 + 2 α x’ + 2 β y’ + 2 γ z’ + δ = 0.

.-Si ninguno de los autovalores es nulo:

Podemos hacer los cambios:

  • x’ = x” – α / λ1.
  • y’ = y” – β / λ2.
  • z’ = z” – γ / λ3.

Con lo cual obtenemos:

  • λ1 (x’)^2 + λ2 (y’)^2 + λ3 (z’)^2 + k = 0.
  • M” = [k, 0, 0, 0; 0, λ1, 0, 0; 0, 0, λ2, 0; 0, 0, λ3].
  • detM” = ρ^4 detM.
  • detA” = ρ^3 detA.
  • λ1 = ρ λ1.
  • λ2 = ρ λ2.
  • λ3 = ρ λ3.

Por lo tanto:

  • ρ = 1.

, y obtenemos:

  • k = detM / detA.

La ecuación reducida de la cuádrica es entonces:

  • λ1 (x’)^2 + λ2 (y’)^2 + λ3 (z’)^2 + detM / detA = 0.

Y ésta será en general un hiperboloide, un elipsoide o un cono.

.-Supongamos que un Autovalor es Nulo:

Podemos tomar sin pérdida de generalidad:

  • λ3 = 0.

Entonces la ecuación de la cuádrica es:

  • λ1 (x’)^2 + λ2 (y’)^2 + 2 α x’ + 2 β y’ + 2 γ z’ + δ = 0.

Haciendo los cambios:

  • x’ = x” – α / λ1.
  • y’ = y” – β / λ2.
  • z’ = z”.

, obtenemos:

  • λ1 (x”)^2 + λ2 (y”)^2 + 2 γ z” + k = 0.

Como para que sea una cuádrica:

  • detM ≠ 0.

, vemos que la matriz M” es:

  • [k, 0, 0, γ; 0, λ1, 0, 0; 0, 0, λ2, 0; γ, 0, 0, 0].

Tenemos:

  • detM” = – γ^2 λ1 λ2 ≠ 0.

, y consecuentemente:

  • γ ≠ 0.

, y podemos hacer el cambio:

  • z” = z”’ – k / (2 γ).

, con lo cual obtenemos la ecuación:

  • λ1 (x”’)^2 + λ2 (y”’)^2 + 2 γ z’ ” = 0.

Podemos obtener “γ” en función de “detM”, “λ1″ y “λ2″:

  • detM”’ = – ρ γ^2 λ1 λ2 = detM.
  • λ1 = ρ λ1.
  • λ2 = ρ λ2.

, por tanto:

  • ρ = 1.

y despejamos “γ”:

  • γ^2 = – detM / (λ1 λ2).
  • γ = [- detM / (λ1 λ2)]^1/2.

, con lo que la ecuación reducida se escribe como:

  • λ1 (x”’)^2 + λ2 (y”’)^2 + 2 [- detM / (λ1 λ2)]^1/2 z’ ” = 0.

, y es un paraboloide elíptico o hiperbólico.

vectoresResumiremos brevemente en esta entrada algunas propiedades importantes de los espacios euclidianos de “n” dimensiones, definidos a través del conjunto de vectores “¬vi = {vi1, vi2, …, vin}” que los componen.

Dependencia Lineal:

Hablamos de dependencia lineal entre dos o más vectores cuando uno de ellos se puede construir combinando los demás.

Sean, por ejemplo, los vectores “¬v” y “¬w”, si se cumple:

  • ¬v = α ¬w.

, siendo “λ” un número real, decimos que “v” es linealmente dependiente de “w”.

Análogamente, si poseemos tres vectores “¬u”, “¬v”, “¬w”,  siendo “v” y “w” linealmente independientes, y se verifica:

  • ¬u = α ¬v + β ¬w.

, “¬u” es linealmente dependiente de “¬v” y “¬w”.

Por las propiedades de esta denominada dependencia lineal, el modo de calcular los valores “α” y “β” es por medio de las componentes de los vecores:

  • u1 = α v1 + β w1.
  • u2 = α v2 + β w2.
  • un = α vn + β wn.

Dado que tenemos 2 incógnitas y “n” ecuaciones, si el sistema es incompatible “u” no es linealmente dependiente de “¬v” y “¬w”, si es compatible siempre será determinado y podremos calcular los coeficientes deseados.

El método del cálculo es análogo para trabajar con cualquier número de vectores.

Demostraremos ahora que, en un espacio de “n” dimensiones, el número máximo de vectores linealmente independientes entre ellos es también “n”. Para ello supondremos que no, y que es posible que dados “n + 1″ vectores, es posible que cada uno de ellos sea linealmente independiente de los anteriores. Si representamos las ecuaciones correspondientes, igualando cada componente del vector estudiado a una combinación de los otros a través de los coeficientes que, en caso de que fuesen linealmente dependientes, existitían.En este caso tendríamos un sistema de “n” incógnitas y de “n” ecuaciones incompatible, tal y como hemos visto antes. Sin embargo, las leyes fundamentales del álgebra nos dicen que a no ser que dos de las ecuaciones sean linealmente dependientes, es imposible que el sistema sea incompatible, y como hemos puesto de condición que nuestros vectores fuesen linealmente independientes llegamos a una contradicción. El vector “n + 1″ tiene que ser, a la fuerza, dependiente de los anteriores.

Subespacios:

Conocido el concepto de dependencia lineal, podemos comenzar a valorar sus consecuencias geométricas.

Dado un espacio de dimensión “n”, siempre existirán, como mucho, combinaciones de hasta “n” vectores linealmente independientes, y todos los demás podrán ser expresados como una combinación lineal de los mismos.

Si consideramos el espacio R^1, es decir, la recta, el único vector independiente existente nos indica la dirección de la misma, y podemos generar todo el espacio (la recta), como combinación lineal del mismo.

Si consideramos el espacio R^2, el plano, y sobre él definimos un vector (v1, v2), que al ser libre deberemos ubicar sobre el origen, combinanciones lineales del mismo definirán la recta sobre el plano que pasa por el origen con la dirección del vector. Dicha recta, compuesta por los vectores linealmente dependientes al mismo, es un subespacio de R^2 de dimensión “1″. Si definimos otro vector linealmente independiente con el primero, cualquier punto de R^2 se podrá construir como combinación lineal de los anteriores.

Si ampliamos a R^3, con un vector podremos definir un subespacio de dimensión “1″, que será una vez más una recta que cruce el origen de coordenadas.  Añadiendo un vector más linealmente independiente con el primero, definiremos otro subespacio de dimensión “2″, que será un plano que cruce el origen. Finalmente, al obtener tres vectores linealmente independientes podremos generar todo el espacio.

En resumen, un subespacio de dimensión “n” es el lugar geométrico de los vectores linealmente dependientes a “n” vectores libres y linealmente independientes entre ellos. Por medio de esta propia definición, un subespacio nunca puede tener una dimensión mayor que el espacio en el que está contenido, pero si igual.

Bases:

Dado un espacio de dimensión “n”, decimos que nos encontramos ante una base del mismo si poseemos un conjunto de vectores que lo genera de modo unívoco, es decir, que cualquier vector de nuestro espacio está asociado a ellos a través de unos coeficientes determinados, y que a través de estos coeficientes se puede también saber de qué vector se está hablando.

Para que un conjunto de vectores sea base, tienen que cumplir, por tanto, dos normas evidentes:

  • Ser el mínimo número de vectores que genere el espacio, es decir, que no se pueda prescindir de ninguno de ellos.
  • Ser el máximo número de vectores linealmente independientes posible.

Es trivial, de hecho, demostrar que los enunciados anteriores son equivalentes a través de la relación de dependencia lineal.

Si nuestra base de vectores es ortogonal, es decir, todos ellos son perpendiculares (o sus productos escalares nulos), nos encontramos ante una Base Ortogonal.

Aplicaciones Lineales:

Si definimos una función que a cada vector “¬v” le da un nuevo valor “f(¬v)”, y ésta es expresable a través de un sistema lineal de ecuaciones, hablamos de una aplicación lineal, y cumple las siguientes propiedades:

  • f(α ¬v) = α f(¬v).
  • f(¬v + ¬w) = f(¬v) + f(¬w).

, de donde, consecuentemente:

  • f(α ¬v + β ¬w) = α f(¬v) + β f(¬w).

Consecuencia directa de ello es que un vector “¬u” perteneciente al subespacio generado por “¬v” y “¬w”, cumplirá que “f(¬u)” seguirá perteneciendo al subespacio generado por “f(¬u)” y “f(¬w)”.

Dichas aplicaciones pueden realizarse dentro del propio espacio o no, es decir, si el vector “¬v” pertenece a R^n, y “f(¬v)” pertenece a “R^m”, no tiene por qué cumplirse:

  • n = m.

Casos particulares de aplicaciones lineales donde:

  • n = m.

para los vectores “¬v = {vx, vy}” y “¬w = {wx, wy, wz}”, son:

  • vx’ = a11 vx + a12 vy.
  • vy’ = a21 vx + a22 vy.
  • wx’ = a11 wx + a12 wy + a13 wz.
  • wy’ = a21 wx + a22 wy + a23 wz.
  • wz’ = a31 wx + a32 wy + a33 wz.

, donde los términos “aij” definen las matrices asociadas a las aplicaciones lineales correspondientes y que, una vez más, gracias a wordpress.com no puedo representar.

Casos particulares de aplicaciones lineales donde:

  • n ≠ m.

, son:

  • vx’ = a11 vx + a12 vy + a13 vz.
  • vy’ = a21 vx + a22 vy + a23 vz.
  • wx’ = a11 wx + a12 wy.
  • wy’ = a21 wx + a22 wy.
  • wz’ = a31 wx + a32 wy.

Y algunos casos aleatorios son:

  • vx’ = vx.
  • vy’ = 0.
  • wx’ = a11 vx + a12 vy.
  • wy’ = a21 vx + a23 vz.
  • wz’ = a32 vy + a33 vz.

Núcleo:

Dada una aplicación lineal “f(¬v)”, llamamos núcleo de la aplicación al conjunto de vectores que, al “pasar” por ella, toman, componente a componente el valor 0.

Por ejemplo, dada la aplicación anterior:

  • wx’ = a11 wx + a12 wy + a13 wz.
  • wy’ = a21 wx + a22 wy + a23 wz.
  • wz’ = a31 wx + a32 wy + a33 wz.

El núcleo de la misma son los vectores {wx, wy, wz} que cumplen:

  • 0 = a11 wx + a12 wy + a13 wz.
  • 0 = a21 wx + a22 wy + a23 wz.
  • 0 = a31 wx + a32 wy + a33 wz.

Si el sistema de ecuaciones es incompatible, la aplicación no tiene núcleo, lo cual es imposible, pues el vector “¬0″ siempre va a si mismo, aunque cambie la dimensión del espacio. Si el sistema es compatible y determinado tan solo el vector “¬0″ pertenece al núcleo. En conclusión, la mayoría de las veces surgirán sistemas compatibles indeterminados, con hasta “n – 1″ ecuaciones indeterminadas resultantes. Si “m” es el número de ecuaciones que nos resultan, “n – m” nos da la dimensión del subespacio que va a dar al núcleo de la aplicación.

La Teoría de Probabilidades es una rama de las matemáticas que se centra en el análisis de lo esperables que pueden ser un conjunto de sucesos, útil para estimar posibles comportamientos promedios de la naturaleza, así como la economía o el mundo de los juegos de azar.

Cuando estudiamos un suceso, definimos como Espacio Muestral los posibles resultados del mismo: E {a1, a2, a3, …, an}.

σ-Álgebra:

conjuntosAplicada a un Espacio Muestral, definimos como σ-Álgebra al álgebra que define 3 operaciones en “E”, que son la unión “U“, la intersección “∩” y la negación “‾”, bajo las cuales el Espacio Muestral es cerrado. Si consideramos los subconjuntos “Ai” de “E” y los elementos “ai” del mismo, se cumple:

.-”Ai U Aj” es el conjunto de elementos “ai” que o bien pertenecen a “Ai” o bien pertenecen a “Aj”.

.-”Ai ∩ Aj” es el conjunto de elementos “ai” que pertenecen a “Ai” y también a “Aj”.

.-”Ai‾” es el conjunto de elementos “ai” que no pertenecen a “Ai”.

La σ-Álgebra cumple las siguientes propiedades:

.-El vacío “ø” pertenece al Espacio Muestral “E”.

.-Si “Ai” pertenece a “E”, “Ai‾” también.

.-U(Ai) desde “i = 1″ hasta “n” pertenece a “E”. (La unión numerable de subconjuntos de “E” pertenece a “E”). Si unimos todos los subconjuntos Ai posibles obtendremos, evidentemente, el propio Espacio Muestral.

Espacio de Probabilidad:

El Espacio Muestral “E” toma valores en el Espacio de Probabilidad, contenido en el intervalo [0, 1], de tal modo que a cada subconjunto “Ai” le corresponde una determinada probabilidad “p(Ai)” contenida en el mencionado Espacio de Probabilidad. Si la probabilidad de un suceso es “1″ se dará siempre, si es nula no se dará nunca, y en cualquier otro caso  puede acontecer o no.

Podemos interpretar la probabilidad técnicamente como el límite de la frecuencia relativa de los elementos de una Muestra cuando el número de los mismos tiende a infinito.

  • p(Ai) = lim(N→∞) n(Ai) / N.

En caso de que no dispongamos de ninguna muestra analizada, hay otras formas de intuir la probabilidad, como es el caso de la Regla de Laplace:

  • p(Ai) = nº casos favorables / nº casos posibles.

En caso de que no sepamos nada sobre el experimento y dispongamos del Espacio Muestral, el Principio de Razón Insuficiente o de Máxima Entropía nos explica que todos los casos son igual de favorables:

  • p(Ai) = 1 / n.

Podemos, en resumen, definir la probabilidad como una medida del grado de certidumbre sobre un suceso en un experimento aleatorio, o como una medida de información sobre el mismo.

Axiomas de Kolmogorov:

kolmogorovSiempre que estemos ante un fenómeno aleatorio definido en un espacio muestral “E”. La representación a través de la función “p” que lleva cada elemento “Ai” de “E” al Espacio de Probabilidad es una medida de probabilidad si se verifica que:

  • 0 ≤ p(Ai) ≤ 1.

, que la probabilidad de “E” es 1, o sea, es un suceso seguro:

  • p(E) = 1.

, y que si “Ai” y “Aj” son sucesos mútuamente excluyentes:

  • Ai ∩ Aj = ø.
  • p(Ai U Aj) = p(Ai) + p(Aj).

Algunas otras propiedades son:

  • p(Ai‾) = 1 – p(Ai).
  • p(Ai U Ai‾) = p(E) = 1.
  • p(Ai ∩ Ai‾) = 0.
  • p(Ai U Aj) = p(Ai) + p(Aj) – p(Ai ∩ Aj).

Para evaluar prácticamente la probabilidad de un suceso desconocido debemos realizar experimentos, analizarlos teóricamente aplicando el Principio de Máxima Entropía, y combinar la teoría con la experiencia.

Definimos Probabilidad Marginal como la de un subconjunto de “E”, es decirm a “p(Ai)”, Probabilidad Conjunta de dos subconjuntos “Ai” y “Aj” como la de su intersección: p(Ai ∩ Aj), cumpliéndose que la Probabilidad Marginal de un elemento es igual a la suma de sus Probabilidades Conjuntas con los otros “n” subconjuntos mútuamente excluyentes:

  • p(Ai) = ∑(p(Ai ∩ Aj)) desde “j = 1″ hasta “n”.

La Probabilidad Condicionada es la probabilidad de que se de un suceso “Ai” sabiendo que se ha dado otro “Aj”:

  • p(Ai / Aj) = p(Ai ∩ Aj) / p(Aj).
  • p(Ai / Aj) ≠ p(Aj / Ai).

Hablamos de Independencia Estadística entre dos subconjuntos “Ai” y “Aj” cuando, siendo ambos aleatorios, se cumple:

  • p(Ai / Aj) = p(Ai).
  • p(Aj / Ai) = p(Aj).

También enunciable como:

  • p(Ai ∩ Aj) = p(Ai) p(Aj).

Teorema de Bayes:

Si disponemos de un experimento aleatorio en dos etapas  de espacios muestrales {Aa, A2, …, An} y {B1, B2, …, Bm}, y conozco todos los posibles valores de p(Bj / Ai), se cumple que:

  • p(Ai / Bj) = (p(Bj / Ai) p(Ai)) / (∑(p(Bj / Ak) p(Ak)) desde “k = 1″ hasta “n”).

Variables Aleatorias Discretas:

Si nuestro Espacio Muestral “E” toma valores numerables en la recta real, o puede ser asociado a ellos, estamos ante una variable aleatoria discreta, donde E{x1, x2, …, xn}.

.-Función de Probabilidad:

La probabilidad de que un suceso tome el valor “xi” se define como:

  • p(x = xi) = pi.
  • 0 ≤ pi ≤ 1.
  • ∑(p(x = xi)) desde “i = 1″ hasta “n” = ∑(pi) desde “i = 1″ hasta “n” = 1.

.-Distribución Uniforme:

Si todos los posibles valores “xi” poseen una misma probabilidad de acontecer hablamos de una distribución de probabilidad uniforme:

  • pi = p(x = xi) = 1 / n.

.-Función de Distribución de Probabilidad:

Si definimos “F(xk)”  como la función que determina la probabilidad de que un suceso tome un valor menor o igual a “xk” obtenemos la siguiente igualdad:

  • F(xk) = p(x ≤ xk) = ∑(p(x = xj)) desde “j = 1″ hasta “k”.
  • F(x) = 0, si el suceso toma un valor menor a “x1″.
  • F(xn) = 1.

“F(xk)” es una función monótona creciente.

Variable Aleatoria Continua. Función de Densidad de Probabilidad:

Si nuestro Espacio Muestral “E” toma valores no numerables en la recta real, o puede ser asociado a ellos, estamos ante una variable aleatoria continua, donde el Espacio Muestral es infinito. Esta inmensa cantidad de posibles resultados “xi” hace que la probabilidad particular de cada uno de ellos sea “0″, pues cada “xi” lleva asociada una probabilidad “p(x)” tal que:

  • dp(x) = f(x) dx.

, siendo f(x) la Función de Densidad de Probabilidad, que indica la probabilidad particular de cada suceso:

  • f(x) = dp(x) / dx.

.-Paso al Continuo:

Si en la variables discretas el espacio muestra se podia definir como:

  • E = ∑ desde “i = 1″ hasta “n”.

, en la variable continua nos encontramos con que:

  • E = ∫(dx) en el Espacio Muestral = ∫(dx) desde “- ∞” hasta “∞”.

.-Distribución de Probabilidad:

Al ser “E” continuo, debemos redefinir la función de probabilidad:

  • p(a ≤ x ≤ b) = ∫(dp(x)) desde “a” hasta “b” = ∫(f(x) dx) desde “a” hasta “b”.

.-Función de Distribución Acumulativa:

Es fácil redefinirla también a partir de la discreta:

  • F(x0) = p(x ≤ x0) = ∫(f(x) dx) desde “- ∞” hasta “x0″.
  • lim(x0→-∞) F(x0) = 0.
  • lim(xo→∞) F(x0) = 1.

A través del Teorema fundamental del cálculo integral, obtenemos:

  • dF(x) / dt = f(x).

Medidas Características de una Distribución de Probabilidad para una Variable Aleatoria Discreta:

.-Espacio Muestral:

  • E = {A1, A2, …, An}

para “n” elementos.

.-Sucesos:

A través de la función “x(Ai)” denominamos a los elementos de “E” como el suceso tal que:

  • x(Ai) = xi.

.-Función de Probabilidad:

Definimos “p(xi)” como la función que da a un suceso el valor de su probabilidad (en el Espacio de Probabilidad):

  • p(xi) = pi.

.-Medidas de Centralización:

..-Moda:

La moda es el suceso “xi” con mayor probabilidad.

..-Mediana:

La mediana es el suceso “xi” que toma el valor 0,5 en la función de distribución acumulativa, es decir:

  • F(xi) = 0,5.

..-Media o Valor Esperado:

  • E{x} = ∑(pi xi) desde “i=1″ hasta “n” = μ.

.-Medidas de Dispersión:

..-Varianza:

  • σ^2 = E{(x – μ)^2} = ∑(pi (xi – μ)^2) desde “i = 1″ hasta “n”.

..-Desviación Típica:

  • σ = (σ^2)^1/2.

..Función Generatriz de Momentos:

  • mr(c) = E{(x – c)^r} = ∑(pi (xi – c)^r) desde “i=1″ hasta “n”.

Hablaremos de momentos respecto al origen y centrales si se cumple:

  • c = 0.
  • c = μ.

respectivamente.

Medidas Características de una Distribución de Probabilidad para una Variable Aleatoria Continua:

.-Espacio Muestral:

En esta ocasión abarca todo el conjunto de los números reales.

  • E = R.

.-Sucesos:

  • x(Ai) = xi.

.-Función de Probabilidad:

Definimos “f(x)” como la función que da a un suceso el valor de su probabilidad (en el Espacio de Probabilidad):

  • f(xi) = pi.

Cumple que:

  • ∫(f(x) dx) desde “- ∞” hasta “- ∞” = 0.
  • ∫(f(x) dx) desde “- ∞” hasta “∞” = 1.

.-Medidas de Centralización:

..-Moda:

La moda es el suceso “xi” con mayor probabilidad. Cumple que:

  • f’(xi) = 0.
  • f”(xi) < 0.

..-Mediana:

La mediana es el suceso “xi” que toma el valor 0,5 en la función de distribución acumulativa, es decir:

  • F(xi) = 0,5.

..-Media o Valor Esperado:

  • E{x} = ∫(x dp(x)) desde “- ∞” hasta “∞” = ∫(f(x) x dx) desde “- ∞” hasta “∞” = μ.

.-Medidas de Dispersión:

..-Varianza:

  • σ^2 = E{(x – μ)^2} = ∫(f(x) (xi – μ)^2 dx) desde “- ∞” hasta “∞”.

..-Desviación Típica:

  • σ = (σ^2)^1/2.

..Función Generatriz de Momentos:

  • mx(t) = E{e^(t x)} = ∫(f(x) e^(t x) dx) desde “- ∞” hasta “∞”.
  • e^(t x) = h(x).
  • mx(t) = E{h(x)} = ∫(f(x) h(x) dx) desde “- ∞” hasta “∞”.

Distribución Binomial:

dadoLa probabilidad de que se de un determinado suceso en un experimento sigue una distribución binomial si cumple los requisitos de ser un experimento de Bernoulli, es decir, que sea un fenómeno con dos posibles sucesos mútuamente excluyentes. Uno de los sucesos será el éxito: “A”, y el otro el fracaso: “B”. Obtenemos así nuestro espacio muestral y nuestros sucesos:

  • E = {A, B}.
  • x(A) = 1.
  • x(B) = 0.

La distribución de probabilidad, que veremos ahora en detalle, cumplirá los axiomas elementales de nuestra σ-Álgebra, teniendo en cuenta la nueva nomenclatura:

  • p(A) = p.
  • p(B) = 1 – p(A) = q.

Si consideramos una variable “x” que represente el número de sucesos, su espacio muestral será el conjunto de los números naturales (1 éxito, 2 éxitos, 3 éxitos…), y la probabilidad de obtener “n” éxitos la denominamos como: p(x=r).

La media o esperanza de la distribución binomial y su varianza son:

  • μ = E{x} = p 1 + q 0 = p.
  • σ^2 = E{x – E{x}} = p (1 – p)^2 + q (0 – p)^2 = p (1 – p) = p q.

Y su distribución de probabilidad para “n” experimentos es:

  • p(x = r) = (n|r) p^r q^(n – r).

, donde (n|r) representa un número combinatorio derivado del binomio de Newton, y que se define por:

  • (n|r) = n! / (r! (n – r)!).
  • r ≤ n.

Recordemos que el factorial de un número entero “n!” no es más que el producto del mismo por todos y cada uno de los enteros menores que él.

Si queremos normalizar la distribución, entre otras cosas, debemos asegurarnos de que cumple con los axiomas de Kolmogorov, sobre todo el de que la suma de todas las probabilidades de todos los posibles de “r” para un determinado valor “n” de experimentos sumen 1:

  • ∑(p(x = r)) desde “r = 0″ hasta “n” = ∑((n|r) p^r q^(n – r)) desde “r  = 0″ hasta “n”.

Por simetría con el binomio de Newton:

  • ∑(p(x = r)) desde “r = 0″ hasta “n” = (p + q)^n = 1^n = 1.

Se cumple el axioma de Kolmogorov.

Calculemos ahora la media o esperanza matemática para un valor dado de “n”:

  • E{x} = ∑(pi xi) desde “i = 1″ hasta “n”.
  • E{x} = ∑(r (n|r) p^r q^(n – r)) desde “r  = 0″ hasta “n”.
  • E{x} = ∑(r (n|r) p^r q^(n – r)) desde “r  = 1″ hasta “n”.

Haciendo un cambio de variable:

  • r’ = r – 1.
  • n’ = n -1.

Y operando:

  • E{x} = n p.

La varianza, y consecuentemente la desviación típica, son algo más complejas de calcular, por lo que obviaremos pasos intermedios:

  • σ^2 = E{x^2} – E{x}^2 = n p q.
  • σ = [n p q]^1/2.

1ª Variable de Pascal o Geométrica:

revolverEn un experimento de Bernoulli definimos una nueva variable “x” que medirá el número de éxitos antes de el primer fracaso, por lo que su Espacio Muestral “E” tomará valores naturales: 0, 1, 2…, y aplicando la distribución binomial obtenemos que la probabilidad de que el número de éxitos “x” antes del primer fracaso sea igual a “r” es:

  • p(x = r) = p^r q.

Se cumple:

  • ∑(p(x = r)) desde “r = 0″ hasta “∞” = 1.
  • E{x} = p / q.
  • σ^2 = p / q^2.
  • σ = p^1/2 / q.

2ª Variable de Pascal o Geométrica:

De nuevo en un experimento de Bernoulli, esta vez definiremos una variable “x” que indicará el número de intentos hasta el primer fracaso, por lo que su Espacio Muestral tomará los mismos valores que en el caso anterior menos el “0″ (no se pueden hacer 0 intentos y fracasar). En esta ocasión:

  • p(x = r) = p^(r – 1) q.

Y se cumple:

  • ∑(p^(r – 1) q) desde “r = 1″ hasta “∞” = 1.
  • E{x} = 1 / q.
  • σ^2 = p / q^2.
  • σ = p^1/2 / q.

Ley de los Grandes Números:

Supongamos una variable binomial “A”que, muestra a muestra, resulta poseer una frecuencia relativa “fA” aleatoria, y sea “f(fA)” la función de probabilidad de que tome un valor concreto. Si definimos el valor esperado de fa “E{fA}” como el estimador más fiel del valor de la misma, y lo calculamos haciendo “N” experimentos, cuando el número de los mismos tienda a infinito veremos que:

  • E{fA} = p(A).

Veamos si se cumple:

  • fi = nA / N.

, siendo “ni” la frecuencia absoluta (número de veces que aparece en total).

  • E{fA} = E{nA / N} = E{nA} / N = N pA / N = p(A).

Vemos que la igualdad se cumple.

Comprobemos qué sucede con la varianza:

  • σ(fA)^2 = σ(nA / N)^2 = σ(nA)^2 / N^2.

Por ser una variable binomial:

  • σ(fA)^2 = N p q / N^2 = p q / N.

Si el número “N” de experimentos tiende a infinito, concluimos que la varianza de nuestra media tiende a “0″, y que por tanto nuestro valor de la probabilidad es exacto:

  • lim(N→∞) σ(fA)^2 = lim(N→∞) pq / N = 0.

Distribución de Poisson:

fotomultiplicadorSiguen una distribución de probabilidad de este tipo todos aquéllos experimentos en los que una variable discreta tiene lugar sobre un soporte continuo (espacio-tiempo). Algunos ejemplos son las llamadas a una central de averías o el bombardeo de una lámina de oro con neutrones.

Tiene que ser un proceso estable, en el que más o menos se establezca un valor medio representativo de la variable, y los sucesos han de surgir continuamente de manera independiente.

Nuestra variable “x” (número de sucesos por intervalo continuo) tomará valores en el Espacio Muestral “E” de los números enteros {0, 1, 2, …}, y si los posibles valores de “x” tienden a infinito la probabilidad de cada uno de ellos tiende a “0″. Definimos la media “λ” como:

  • λ = n p.
  • lim(n→∞) p = 0.

La probabilidad de que en un intervalo concreto la variable “x” tome un valor “r” es:

  • p(x = r) = (n|r) p^r q^(n – r) = (n|r) p^r (1 – p)^(n – r).

Aplicando la igualdad anterior:

  • lim(n→∞) (n|r) (λ / n)^r (1 – λ / n)^(n – r) = lim(n→∞) p(x = r).
  • lim(n→∞) p(x = r) = λ^r e^(- λ) / r!

, que es la disribución de la archifamosa ecuación de la distribución de Poisson.

Veamos que cumple el tercer axioma de Kolmogorov:

  • ∑(p(x = r)) desde “r = 0″ hasta “∞” = ∑(λ^r e^(- λ) / r!) desde “r = 0″ hasta “∞”.
  • ∑(p(x = r)) desde “r = 0″ hasta “∞” = e^(- λ) ∑(λ^r / r!) desde “r = 0″ hasta “∞”.
  • ∑(p(x = r)) desde “r = 0″ hasta “∞” = e^(- λ) e^(λ) = e^0 = 1.

Lo cumple.

Analicemos ahora el valor esperado:

  • ∑(p(x = r) r) desde “r = 0″ hasta “∞” = ∑(λ^r e^(- λ) r / r!) desde “r = 0″ hasta “∞”.
  • ∑(p(x = r) r) desde “r = 0″ hasta “∞” = λ ∑(λ^(r – 1) e^(- λ) / (r – 1)!) desde “r = 1″ hasta “∞”.
  • ∑(p(x = r) r) desde “r = 0″ hasta “∞” = λ e^(- λ) e^(λ) = λ.

La varianza tendrá la peculiaridad de ser igual a la media:

  • σ^2 = E{x^2} – E{x}^2 = λ.

Y el Coeficiente de Variación:

  • CV = σ / E{x} = λ^1/2 / λ = 1 / λ^1/2 = 1 / (n p)^1/2 ≈ 1 / n^1/2.

Distribución Exponencial:

Si suponemos un proceso de Poisson de media “λ”, y queremos definir la variable “t”, tiempo entre dos sucesos, dicha variable será continua y tomará valores en el intervalo [0, ∞). Si queremos calcular la probabilidad de que "t" tome un valor mayor que "t0", su distribución de probabilidad se define como:

  • p(t > t0) = p(x = 0 en (0, t0)) = (λ t0)^0 e^(λ t0) / 0! = e^(λ t0).

, de ahí que se la denomine distribución exponencial.

Análogamente, la probabilidad de que "t" sea menor o igual que un determinado "t0" se define como:

  • p(t ≤ t0) = 1 - p(t > t0) = 1 - e^(λ t0).

Otras características son:

  • F(t) = 1 - e^(λ t).
  • f(t) = dF(t) / dt = λ e^(λ t).

Distribución Gaussiana o Normal:

iq-gaussianoSupongamos una variable aleatoria continua (de cualquier valor numérico real) que posea una media "μ" y una desviación típica "σ". Decimos que estamos ante una Variable Aleatoria Normal N(μ, σ) si su distribución de probabilidad es:

  • f(x) = e^((x - μ)^2 / (2 σ^2)) / ([2 π]^1/2 σ).

Esta función, que como se aprecia en la representación tiene forma de campana, es la conocida Campana de Gauss, cuyo valor central toma el valor “μ”, y posee puntos de inflexión en los puntos “μ – σ” y “μ + σ”.

La función Acumulativa de esta distribución se define como:

  • F(x0) = ∫(e^((x – μ)^2 / (2 σ^2)) dx / ([2 π]^1/2 σ)) desde “- ∞” hasta “x0″.

Y la probabilidad de que “x” tome valores en el intervalo [a, b] es de:

  • p(a ≤ x ≤ b) = ∫(e^((x – μ)^2 / (2 σ^2)) dx / ([2 π]^1/2 σ)) desde “a” hasta “b”.

El problema de esta función de densidad de probabilidad reside en que no es integrable, y por tanto los valores de su primitiva se deben tantear por métodos numéricos. Asimismo, como hay infinidad de distribuciones gaussianas según sus valores de “μ” y de “σ”, necesitamos buscar una relación entre todas ellas para estudiarlas todas de golpe.

Llamamos proceso de Normalización o Tipificación al proceso mediante el cual convertimos cualquier variable aleatoria N(μ, σ) a una N(0, 1). Para ello, definimos un parámetro “z” tal que:

  • z = (x – μ) / σ.

De modo que:

  • f(x) = e^(z^2 / 2) / [2 π]^1/2.

Cualquier función normal tipificada de este modo se denomina Variable Aleatoria Estándar, y su distribución de probabilidad es:

  • p(a ≤ x ≤ b) = p((a – μ) / σ ≤ x ≤ (b – μ) / σ) = F((b – μ) / σ) – F((a – μ) / σ).

La Función Generatriz de Momentos de la Gaussiana Estándar se define como:

  • mz(t) = E{e^(z t)}.
  • mz(t) = ∫(e^(z t) e^(z^2 / 2) dz / [2 π]^1/2) desde “- ∞” hasta “∞”.
  • mz(t) = e^(t^2 / 2).

Teorema del Límite Central:

Supongamos una variable “X” definida com0:

  • X = x1 + x2 + x3 + x4 + x5 + … + xn.

Si cada “xi” que la compone es una variable aleatoria independiente de las demás, con una media “μi” y una desviación típica “σi”, y estos valores no son muy dispares entre cada uno de los elementos, podemos concluir que cuando el número “n” de elementos tiende a infinito la distribución de probabilidad de “X” es gaussiana.

Distribución Log-Normal:

lognormalDefinamos una variable aleatoria “Y” dependiente de otras variables aleatorias “xi” independientes entre si de modo que:

  • Y = x1 x2 x3 x4 … xn = Π(xi) desde “i = 1″ hasta “n”.

Consecuentemente:

  • Ln(Y) = ∑(log(xi)) desde “i = 1″ hasta “n” = z.

Por el teorema antes mencionado, cuando el número de elementos “xi” tiende a infinito, “z” se vuelve una variable aleatoria normal de media “μ” y desviación típica “σ”:

  • μ = ∑(log(μi)) desde “i = 1″ hasta “n”.

, por lo que su función de densidad de probabilidad es:

  • f(z) = e^((z – μ)^2 / (2 σ^2)) / ([2 π]^1/2 σ).

Por otra parte, sabemos que:

  • dp(z) = f(z) dz.
  • dp(y) = g(y) dy.

Como ambas distribuciones son continuas sus diferenciales de probabilidad son nulos y podemos igualarlas:

  • f(z) dz = g(y) dy.
  • g(y) = f(z) dz / dy.
  • dz / dy = dLn(y) / dy = 1 / y.

Para este último resultado aplicamos la derivada del logaritmo natural, por lo que esta “y” solo toma valores en (0, ∞), y la función de probabilidad de “y” nos resulta:

  • g(y) = e^((z – μ)^2 / (2 σ^2)) / ([2 π]^1/2 σ y).

Distribución de Weibull (Gompertz):

esperanzaEsta distribución analiza la probabilidad del fallo de un elemento, también enunciable como la esperanza de vida. Si definimos “t” como el tiempo que puede pasar antes de que el elemento analizado falle, evidentemente tomará valores en el intervalo (0, ∞). Su distribución genérica de probabilidad de durar “t” tiempo es:

  • λ(t) = p(t0 < t ≤ t0 + Δt) = p(t0 < t ≤ t0 + Δt) / p(t > t0).
  • λ(t) = f(t0) Δt / (1 – F(t0)).

Su función acumulativa es:

  • Λ(t) = ∫(λ(t0) dt0) desde “0″ hasta “t”.
  • Λ(t) = ∫(f(t0) Δt dt0 / (1 – F(t0))) desde “0″ hasta “t”.
  • Λ(t) = – [Ln|1 - F(t0)|] desde “0″ hasta “t” = - Ln|1 – F(t0)|.

De donde:

  • F(t) = 1 – e^(- Λ(t)).
  • f(t) = dF(t) / dt = 1 – λ(t) e^(- Λ(t)).

Si suponemos una Tasa de Fallo Potencial o de Weibull para “h” y “c” predeterminados obtenemos:

  • λ(t) = h t^(c – 1).
  • Λ(t) = h t^c / c.
  • f(t) = h t^(c – 1) e ^(- h t^2 / c).

Si suponemos una Tasa de Fallo Exponencial o de Gompertz para “k” y “b” predeterminados obtenemos:

  • λ(t) = k e^(b t).
  • Λ(t) = k (e^(b t) – 1) / b.
  • f(t) = k e^(b t) e ^(- k (e^(b t) – 1) / b).

ATENCIÓN:

Por economía, en esta entrada supondremos que, si no se especifica lo contrario, todas las integrales “∫” se definen en el intervalo del que se haya hablado donde aparezcan y los sumatorios “∑” entre “n=1″ e “∞”.

Coeficientes de Fourier:

En muchos problemas de física las ecuaciones que los describen admiten soluciones elementales en forma de senos y cosenos (vibraciones mecánicas, respuesta de un circuito eléctrico, difracción de la luz…), de manera que si somos capaces de representar una función arbitraria como una suma de funciones trigonométricas resulta fácil expresar la solución de estos problemas frente a una “excitación” arbitraria.

Consideremos una cierta función real de variable real, “f(x)”, definida en el intervalo [-π, π]. Supongamos que esta función se puede expandir como una suma de funciones trigonométricas:

  • f(x) = a0 / 2 + a1 Cosx + b1 Senx + a2 Cos(2 x) + b2 Sen(2 x) + …

Se nos plantea el problema de encontrar los coeficientes “an” y “bn” que hacen que se cumpla la igualdad anterior en el intervalo [-π, π]. Más adelante estudiaremos en detalle qué condiciones ha de cumplir “f(x)” para que este desarrollo sea correcto.

Supondremos que esta serie es uniformemente convergente para poder integrar término a término:

  • ∫(f(x) dx) = (a0 / 2) ∫(dx) + ∑[an ∫(Cos(n x) dx) + bn ∫(Sen(n x) dx]).

Observemos que, con nuestros criterios:

  • ∫(dx) = 2 π.
  • ∫(Cos(n x) dx) = 0.
  • ∫(Sen(n x) dx) = 0.

De modo que obtenemos:

  • a0 π = ∫(f(x) dx).
  • a0 = ∫(f(x) dx) / π.

Es decir, “a0″ es el valor medio de la función “f(x)” en el intervalo [-π, π].

Para calcular “an” multiplicaremos nuestra serie por “Cos(m x)”, de modo que:

  • f(x) Cos(m x) = a0 Cos(m x) / 2 + ∑[an Cos(n x) Cos(m x) + bn Sen(n x) Cos(m x)].

Ya hemos visto que:

  • ∫(Cos(n x) dx) = 0.

, por otra parte tenemos que:

  • Cos(n x) Cos(m x) = (Cos((n + m) x) + Cos((n – m) x)) / 2.
  • Sen(n x) Cos(m x) = (Sen((n + m) x) + Sen((n – m) x)) / 2.
  • Sen(n x) Sen(m x) = (Cos((n – m) x) – Cos((n + m) x)) / 2.

Por lo tanto:

  • ∫(Cos(n x) Cos(m x) dx) = [∫(Cos((n + m) x) dx) + ∫(Cos((n - m) x) dx)] / 2.

, donde “n” y “m” son números naturales. Pero:

  • ∫(Cos((n + m) x) dx) = 0.
  • ∫(Cos((m – n) x) dx) = 0, si “m ≠ n”.
  • ∫(Cos((n – m) x) dx) = 2 π, si “m = n”.

Resumiendo:

  • ∫(Cos(n x) Cos(m x) dx) = 0, si “m ≠ n”, e = π, si “m = n”.

Para la otra integral tenemos:

  • ∫(Sen(n x) Cos(m x) dx) = [∫(Sen((n + m) x) dx) + ∫(Sen((n - m) x) dx)] / 2.
  • ∫(Sen((n + m) x) dx) = 0.
  • ∫(Sen((n – m) x) dx) = 0, si “m ≠ n”.

Cuando “m = n” tenemos directamente:

  • Sen((n – m) x) = 0.

Resumiendo entonces:

  • ∫(Sen(n x) Cos(m x) dx) = 0.

, con “n” y “m” números naturales.

  • ∫(f(x) Cos(m x) dx) = π an.
  • an = ∫(f(x) Cos(m x) dx) / π.
  • n ≥ 0.

Para calcular “bn” multiplicamos la serie por “Sen(m x)” y procedemos de manera análoga:

  • ∫(f(x) Sen(m x) dx) = a0 ∫(Sen(m x) dx) / 2 + ∑[an ∫(Cos(n x) Sen(m x) dx) + bn ∫(Sen(n x) Sen(m x) dx)].

Recordemos que:

  • ∫(Sen(n x) dx) = 0.
  • n ≥ 0.
  • ∫(Sen(n x) Cos(m x) dx) = 0.

, con “n” y “m” números naturales.

Finalmente:

  • ∫(Sen(n x) Sen(m x) dx) = [∫(Cos((n - m) x) dx) - ∫(Cos((n + m) x) dx)] / 2.

  • ∫(Cos((n + m) x) dx) = 0.

  • ∫(Cos((m – n) x) dx) = 0, si “m ≠ n”.

  • ∫(Cos((n – m) x) dx) = 2 π, si “m = n”.

  • ∫(Sen(n x) Sen(m x) dx) = 0, si “m ≠ n”, e = π, si “m = n”.

Por lo tanto obtenemos:

  • ∫(f(x) Sen(m x) dx) = π bn.

  • bn = ∫(f(x) Sen(m x) dx) / π.

  • n ≥ 1.

Por lo tanto, si la serie de Fourier que hemos descrito al principio  es uniformemente convergente, entonces los coeficientes “an” y “bn” se obtienen mediante las fórmulas obtenidas.

En muchos casos, no obstante, no sabemos si una función dad admite un desarrollo medianteuna serie trigonométrica uniformemente convergente. De todos modos, resulta útil tomar la perspectiva de definir ciertos números “an” y “bn”, que usaremos para construir la serie trigonométrica. A éstos números los llamamos coeficientes de Fourier, y la serie, serie de Fourier.

De acuerdo con esto, una serie de Fourier es un tipo especial de serie trigonométrica cuyos coeficientes se calculan con las anteriores ecuaciones a cierta función “f(x)”. Para ello solo es necesario que tales integrales existan.

Obviamente, lo que uno desea es que la serie de Fourier sea convergente y tenga como suma la propia “f(x)”, pero no siempre ocurre así: existen funciones integrables en el intervalo [- π, π] que no son la suma de ninguna serie de Fourier. Y a la inversa, existen series trigonométricas convergentes que no son ninguna serie de Fourier. Por ejemplo, la serie:

  • ∑(Sen(n x) / log(1 + n)).

converge para todo valor de “x”, pero no es una serie de Fourier, lo cual significa que los coeficientes de esta serie no se pueden obtener aplicando las fórmulas anteriores a ninguna función integrable.

Convergencia de una Serie Funcional:

Sea “fn”, con “n” natural, un conjunto de funciones reales con el mismo dominio “S” sobre la recta real.

Se dice que la sucesion “fn” converge puntualmente a “f” en el dominio “S” si cumple que:

  • f(x) = lim(n→∞) fn(x).

, para cualquier “x” perteneciente a “S”.

Se dice que la sucesión “fn” converge uniformemente a “f” en el dominio “S” si cumple que: para todo:

  • ε > 0.

existe un número natural “N” tal que todo:

  • n > N.

se cumple que:

  • |fn(x) – f(x)| < ε.

, siendo “x” perteneciente a “S”.

Consideremos una serie funcional a partir de una sucesión de funciones “fn”. La sucesión de sumas parciales “Sn” viene dada por:

  • Sn(x) = ∑(fk(x)) desde “k = 1″ hasta “n”.

, para todo “x” perteneciente a “S”.

Si la sucesión “Sn” converge a “f” en “x” diremos que la serie de funciones es convergente y:

  • ∑(fk(x)) = f(x).

Si en particular la sucesión “Sn” converge uniformemente a la función “f” en el conjunto “S”, diremos que la serie converge uniformemente en “S”. La condición de convergencia uniforme es suficientemente fuerte para garantizar que se puede integrar término a término la serie.

El Problema de la Convergencia:

Se plantea la cuestión de cándo la serie de Fourier converge a la función de partida. Consideremos la serie de Fourier dada por:

  • f(x) = a0 / 2 + ∑[an Cos(n x) + bn Sen(n x)].

Cada término de esta serie es una función periódica de periodo “2 π”, ya que:

  • Cos(n x) = Cos(n x + 2 π).
  • Sen(n x) = Sen(n x + 2 π).

Por lo tanto, cuando esta serie es convergente, la función a la que converge debe verificar:

  • f(x + 2 π) = f(x).

En particular, se cumple además que:

  • f(π) = f(- π).

Obviamente, esta condición no se cumple para cualquier función arbitraria en el intervalo [- π, π]. Dada cualquier función definida únicamente en el intervalo [- π, π], podemos extenderla periódicamentea toda la recta real mediante la condición:

  • f(x + 2 π) = f(x).

Por otra parte, consideremos los siguientes límites laterales de la función:

  • f(x+) = lim(ε→0) f(x + ε).
  • f(x-) = lim(ε→0) f(x – ε).
  • ε > 0.

Una función que presente una discontinuidad de salto en un cierto punto tiene límites laterales distintos en ese punto.

Teorema de Dirichlet:

Sea “f(x)” una función acotada y definida en el intervalo [- π, π] con un número finito de discontinuidades y un número finito de máximos y mínimos. Para otros valores de “x” fuera del intervalo [- π, π] extendemos la definición de “f(x)” por medio de la condición de periodicidad:

  • f(x + 2 π) = f(x).

Entonces la serie de Fourier converge a: “[f(x‾) + f(x+)] / 2″.

en todo punto “x”, y por lo tanto converge a “f(x)” en todo punto de continuidad de la función. En los puntos de discontinuidad podemos redefinir la función como el promedio de sus límites laterales:

  • f*(x) = [f(x-) + f(x+)] / 2.

Entonces la serie de Fourier representa la función f*(x) en todo punto “x” perteneciente a la recta real.

Las condiciones de validez de este teorema se denominan condiciones de Dirichlet. En general, la continuidad de una funicón no es suficiente, ni tampoco necesaria, para garantizar la convergencia de su serie de Fourier.

El Fenómeno de Gibbs:

Aunque el teorema de Dirichlet nos garantiza que en una discontinuidad de una función “f(x)” la serie de Fourier converge a:

  • f*(x) = [f(x-) + f(x+)] / 2.

La serie presentará un pico próximo a la discontinuidad. Este pico se acercará más a la discontinuidad al sumar más términos de la serie, pero su amplitud “δ” no disminuye cuando el número de términos sumados tiende a infinito. El valor de “δ” es proporcional a la magnitud de discontinuidad en “x0″.

Series de Fourier de Funciones Pares e Impares:

Se dice que una función real de variable real es par si:

  • f(x) = f(- x).

Se dice que una función real de variable real es impar si:

  • f(x) = – f(- x).

Una función par presenta simetría respecto al eje “y”, mientras que una función impar presenta simetría respecto al origen de coordenadas. Obsérvese que toda función impar debe pasar por el origen de coordenadas, ya que debe cumplir:

  • f(0) = – f(0).

, y el único número real que verifica esto es el 0.

Ejemplos de funciones pares:

  • f(x) = Cos(n x).
  • f(x) = x^2.

Ejemplos de funciones impares:

  • f(x) = Sen(n x).
  • f(x) = x^3.

Si una función es par verifica lo siguiente:

  • ∫(f(x) dx) desde “- a” hasta “a” = 2 ∫(f(x) dx) desde “0″ hasta “a.

Si una función es impar se cumple:

  • ∫(f(x) dx) desde “- a” hasta “a” = 0.

Además, bajo el producto las funciones pares e impares se comportan de la siguiente manera:

  • par x par = par.
  • par x impar = impar.
  • impar x impar = par.

Toda función real de variable real puede descomponerse en una función par y otra función impar:

  • f+(x) = (f(x) + f(- x)) / 2.
  • f-(x) = (f(x) – f(- x)) / 2.

Esta claro que con esta definición tenemos:

  • f(x) = f+(x) + f-(x).

Podemos entonces escribir:

  • ∫(f(x) dx) = ∫(f+(x) dx) = 2 ∫(f+(x) dx) desde “0″ hasta “π”.

Las reglas de paridad nos pertmiten establecer la cancelación de algunas integrales si tener que calcularlas explícitamente. Por ejemplo:

  • ∫(x Sen(n x) dx) = 2 ∫(x Sen(x) dx) desde “0″ hasta “π”.

Puesto que se trata de una función par (impar x impar). Teniendo todo esto en cuenta, es evidente por ejemplo que:

  • ∫(Sen(n x) dx) = 0.
  • ∫(x^2 Sen(n x) dx) = 0.
  • ∫(x Cos(x) dx) = 0.

Propiedad:

Sea “f(x)” una función integrable definida en el intervalo [- π, π]. Se verifica que:

.-Si “f(x)” es par:

Su serie de Fourier sólo contiene términos de tipo Coseno:

  • f(x) ≈ a0 / 2 + ∑(an Cos(n x)).

La función “f(x) Sen(n x)” es impar y:

  • bn = (∫(f(x) Sen(n x) dx)) / π = 0.
  • an = (∫(f(x) Cos(n x) dx)) / π = 2 (∫(f(x) Cos(n x) dx) desde “0″ hasta “π”) / π.

.-Si “f(x)” es impar:

Su serie de Fourier solo contiene términos tipo Seno:

  • f(x) ≈ ∑(bn Sen(n x)).

La función “f(x) Cos(n x)” es impar y:

  • an = (∫(f(x) Cos(n x) dx)) / π = 0.
  • bn = (∫(f(x) Sen(n x) dx)) / π = 2 (∫(f(x) Sen(n x) dx) desde “0″ hasta “π”) / π.

Extensión Par e Impar:

Dada una función “f(x)” definida en el intervalo [0, π], podemos extenderla al intervalo [- π, 0] de modo que sea par o impar a voluntad:

  • f(x) =  f(- x).
  • f(x) = – f(- x).

Siendo la primera una extensión par y la segunda una impar. Sus funciones serán tipo Coseno y tipo Seno, respectivamente.

Derivación e Integración de las Series de Fourier:

Consideremos las siguientes series de Fourier en el intervalo [- π, π]:

  • x^1 → 2 ∑((- 1)^(n+1) Sen(n x) / n).
  • x^2 → π^2 / 3 + 4 ∑((- 1)^n Cos(n x) / n^2).
  • x^3 → ∑((12 / n^3 – 2 π^2 / n) (- 1)^n Sen(n x)).
  • x^4 → π^4 / 5 + ∑((8 π^2 / n^2 – 48 / n^4) (- 1)^n Cos(n x)).

Obsérvese que la serie de Fourier de “x” se puede obtener derivando término a término la de “x^2″, pero esto no es un resultado general, es decir, la convergencia de una serie de Fourier no garantiza que la derivada término a término de la serie converja a la derivada de la función de partida. La propia serie de Fourier de “x” no puede ser derivada término a término para obtener la constante unidad. Pueden darse ciertascondiciones que deben satisfacer las funciones para que sus series de Fourier se puedan derivar e integrar término a término.

Teorema:

Sea una función “f(x)” periódica y continua a trozos, entonces su serie de Fourier, aunque no sea convergente, puede integrarse término a término y la serie resultante converge a la integral de la función “f(x)”.

Teorema:

Sea una función “f(x)” periódica, continua en todo “x” y tal que “f’” satisfaga las conciones de Dirichlet, entonces la serie de Fourier de “f’” coincide con las derivada de la serie de Fourier de “f(t)”.

Si derivamos la serie de Fourier de:

  • f(x) = x^3 / 3.

no obtenemos la serie de Fourier de “x^2″. No se cumplen las condiciones del teorema previo, pues la función:

  • f(x) = x^3 / 3.

extendida periódicamente a toda la recta real no es continua. Por otro lado, la función:

  • f(x) = x^2.

extendida de forma periódica sí que es continua, por lo tanto el teorema anterior garantiza que podemos derivar término a término su serie de Fourier para obtener la serie de Fourier de la función “2 x”.

Extensión a Intervalos Arbitrarios:

La forma canónica de la serie de Fourier que hemos manejado hasta ahora estaba definida en el intervalo:

  • - π ≤ x < π.

, pero es sencillo extender el estudio a intervalos del tipo:

  • - L ≤ x < L.
  • L>0.

arbitrario. Basta hacer un cambio de escala en el eje “x” de modo que transformamos el intervalo [- π, π] en el intervalo [- L, L]: Si hacemos:

  • x = L t / π.

, entonces, si “t” pertenece al intervalo [- π, π], “x” pertenece a [- L, L].

Vemos por lo tanto que, dada una función “f(x)” definida sobre el intervalo [- L, L], el sencillo cambio de variable anteriornos lleva a otra función, “g(t)”, definida en el intervalo [- π, π].

  • f(x) = f(L t / π) = g(t).

, con “t” perteneciente a [- π, π].

Si “f(x)” satisface las condiciones de Dirichlet, es obvio que “g(t)” también lo hace. La serie de Fourier de “g(t)” será:

  • g(t) = a0 / 2 + ∑(an Cos(n t) + bn Sen(n t)).
  • an = (∫(g(t) Cos(n t) dt) / π.
  • bn = (∫(g(t) Sen(n t) dt)) / π.

Podemos retornar a la variable original “x” teniendo en cuenta que:

  • t = π x / L.

En consecuencia, la serie de Fourier de cualquier función “f(x)” definida en un intervalo simétrico en torno al “0″, [- L, L], será:

  • f(x) = a0 / 2 + ∑(an Cos(n π x / L) + bn Sen(n π x / L)).
  • an = (∫(f(x) Cos(n π x / L) dx) / π.
  • bn = (∫(f(x) Sen(n π x / L) dx)) / π.

Funciones Ortogonales. Series de Fourier Generalizadas:

Dadas las funciones “f1(x)” y “f2(x)”. definidas en un cierto intervalo de la recta real [a, b], diremos que son funciones ortogonales si verifican:

  • ∫(f1(x) f2(x) dx) = 0.

Esta propiedad se puede extender a un cierto conjunto numerable de funciones sobre un intervalo, de modo que se trate de una colección de funciones mutuamente ortogonales.

Sea pues un conjunto {Φn(x)} de funciones reales definidas sobre el intervalo [a, b]. Si se verifica que:

  • ∫(Φm(x) Φn(x) dx) = 0.
  • m ≠ n.

se dice que es un conjunto de funciones ortogonales en el intervalo [a, b].

Definiremos como norma cuadrática de una función en el intervalo [a, b] a la integral:

  • 0 ≤ ||Φn(x||^2 = ∫(Φn(x)^2 dx).

Obsérvese que siempre podemos convertir un conjunto ortogonal de funciones {Φn(x)} en un conjunto ortonormal dividiendo por la norma de cada una de ellas:

  • θn(x) = Φn(x) / ||Φn(x)||.

De este modo tenemos asegurado que:

  • ||θn(x)|| = 1.

, y {θn(x)} es entonces un conjunto ortonormal.

Sea ahora {θn(x)} una sucesión ortonormal de funciones en el intervalo [a,b]. Dada una función “f(x)” cualquiera, podemos intentar expresarla mediante el siguiente desarrollo en el intervalo [a, b]:

  • f(x) = ∑(ak θk(x)).

Para determinar los coeficientes “an”  multiplicamos ambos lados de la ecuación anterior por “θk(x)”:

  • f(x) θn(x) = ∑(ak θk(x) θn(x)).

Vamos a suponer que podemos realizar la integración en el intervalo [a, b]. Entonces tenemos:

  • ∫(f(x) θn(x) dx) = ∑[ak ∫(ak θk(x) dx)] = ∑(ak δkn) = an.

Estos números se denominan coeficientes de Fourier de “f(x)” respecto a la sucesión ortonormal {θn(x)}, y la serie asociada siguiente es la serie de Fourier de “f(x)” respecto a {θn(x)}.

  • ∑(ak θk(x)).

A este tipo de serie se le denomina serie de Fourier generalizada.

La descomposición de una función “f(x)” en términos de funciones {θn(x)} es análoga a la descomposición de un vector en componentes referidas a una cierta base, por ello se puede definir de modo análogo un producto escalar o interior de funciones:

  • (f, g) = ∫(f(x) g(x) dx).

que verifica las propiedades usuales de linealidad y simetría:

  • (f1 + f2, g) = (f1, g) + (f2, g).
  • (c f, g) = c (f, g).
  • (f, g) = (g, f).

Con esta notación, dos funciones se dicen ortonormales si su producto escalar es cero:

  • (f, g) = 0.

Y además su norma al cuadrado es:

  • ||f||^2 = (f, f).

Los coeficientes de Fourier vendrían dados entonces por el siguiente producto escalar:

  • an = (f, θn).

Comparemos esto con la expansión de un vector de R^3 en términos de una base ortonormal {¬e1, ¬e2, ¬e3}. Tendríamos:

  • ¬v = a1 ¬e1 + a2 ¬e2 + a3 ¬e3.
  • an = (¬v, ¬en) = (¬en, ¬v) = ¬v ¬en.

A pesar de esta comparación, hemos de tener en cuenta que en el caso de series de Fourier trabajamos con espacios lineales de funciones definidas en un cierto intervalo [a, b], y no con un espacio lineal vectorial ordinario. Estos espacios lineales de funciones tienen dimensión infinita, en el sentido de que es necesaria una sucesión ortonormal infinita para poder representar una función arbitraria “f(x)” definida en [a, b].

En realidad, no todas las funciones admiten un desarrollo en serie de Fourier, como ya sabemos. Denotaremos por “R” el espacio de todas las funciones “f(x)” definidas en [a, b] que admiten un desarrollo en serie de Fourier. Este espacio está constituído por todas las funciones integrables Riemann sobre dicho intervalo. Además, no todas las sucesiones ortonormales de funciones son adecuadas para representar una función arbitraria de “R”. Para ello necesitamos que el conjunto {θn} sea maximal, esto es, que pueda reproducir de modo exhaustivas todas las funciones de “R”. Se dice que una sucesión ortonormal {θn(x)} es completa o maximal respecto al intervalo [a, b] si la única función ortogonal a todas las funciones “θn(x)” es la función cero o nula. Una función “f” es nula si cumple:

  • ||f^2|| = (f, f) = 0.

O lo que es equivalente:

  • ∫(|f(x)|^2 dx) = 0.

Con la definición de producto dado para nuestro espacio de funciones “R”, tenemos también una definición de distancia entre funciones:

  • d(f, g) = ||f – g|| = [∫((f(x) - g(x))^2 dx)]^1/2.

Un espacio lineal en el que hemos definido una distancia que satisface las propiedades usuales, se llama espacio métrico. Dos funciones de “R” se consideran iguales si difieren en una función nula.

Convergencia en Media de las Series de Fourier:

Sea “f(x)” una función definida sobre un intervalo [a, b] y sea {pn(x)} una sucesión de funciones en este intervalo, todas ellas integrables en [a, b]. Queremos estudiar la convergencia de la sucesión {pn(x)} a “f(x)”. Si aproximamos “f(x)” por “pn(x)”, las expresiones:

  • |f(x) – pn(x)|.
  • |f(x) – pn(x)|^2.

proporcionan una medida del error cometido en la aproximación. Cuando la sucesión de funciones {pn(x)} converge a la función “f(x)” en todo punto “x” del intervalo [a, b], entonces la expresión “(f(x) – pn(x))^2″ tiende a cero y hablamos de convergencia puntual o convergencia punto a punto. Por otra parte, si queremos dar una medida global del error que cometemos al aproximar la función “f(x)” por “pn(x)”, es más adecuado utilizar la segunda expresión para definir el error cuadrático medio a lo largo del intervalo [a, b] como:

  • En = ∫((f(x) – pn(x))^2 dx).

Se dice que la sucesión {pn} converge en media a la función “f(x)” cuando se verifica:

  • lim(n→∞) En = 0.

A veces esto se denota también como:

  • l.i.m(n→∞) pn(x) = f(x).

, donde “l.i.m” significa convergencia en media. Fijémonos que una función que cumple las condiciones de Dirichlet verificará que su serie de Fourier converge en media a “f(x)”. Por otra parte, tal y como hemos definido el valor de “En”, se cumple que:

  • En = ||f – pn||^2.

Por lo tanto la convergencia media significa:

  • lim(n→∞) ||f – pn|| = lim(n→∞) d(f, pn) = 0.

Consideremos {θn(x)} una ortonormal de funciones en [a, b]:

  • (θn,θm) = ∫(θn(x) θm(x) dx) = δnm

Vamos a aproximar una función integrable dada, “f”, mediante una combinación lineal de “n” funciones del conjunto {θn(x)}. Para ello escribimos “pn” como como una combinación lineal de “n” de estas funciones:

  • pn(x) = ∑(bk θk(x)).

Podremos entonces calcular “En” del modo siguiente:

  • En = ∫((f – pn)^2 dx).
  • En = ∫((f – ∑(bk θk))^2 dx).
  • En = ∫((f^2 + ((bk θk))^2 – 2 f (bk θk)) dx).
  • En = ∫(f^2 dx) desde “a” hasta “b” + ∫(((bk θk))^2 dx) – 2 (bk ∫(f θk dx)).
  • En = ∫(f^2 dx) + ∑(bk^2) – 2 ∑(ak bk).
  • En = ∫(f^2 dx) + ∑(bk^2 – 2 ak bk).

Ahora bien:

  • bk^2 – 2 ak bk = bk^2 – 2 ak bk + ak^2 – ak^2 = (bk – ak)^2 – ak^2.

Por lo tanto:

  • En = ∫(f^2 dx) + ∑(ak – bk)^2 – ∑(ak)^2.

Como todos los términos de la suma aparecen elevados al cuadrado, el error “En” cuadrático medio mínimo corresponde a elegir:

  • ak = bk.

, y en consecuencia:

  • En = ∫(f^2 dx) - ∑(ak)^2.

Como:

  • En ≥ 0.

por construcción se cumple que:

  • ∫(f^2 dx) ∑(ak)^2.

Como esta expresión es válida para todo “n” por grande que sea, podemos denominar a esta expresión como la Desigualdad de Bessel.

Puesto que la serie “∑(ak)^2″ es monótona creciente y acotada superiormente, se deduce que es una serie convergente. Una condición necesaria para que la serie sea convergente es que su término general tenga un límite nulo cuando “n→∞”. Por lo tanto deducimos que:

  • lin(n→∞) an = 0.

Si la serie de Fourier converge en media a la función “f(x)” tenemos:

  • lin(n→∞) En = 0.

Pero como:

  • En = ∫(f^2 dx) – ∑(ak)^2.

se verificará la siguiente igualdad cyando la serie converge en media:

  • ∫(f^2 dx) = ∑(ak)^2.

, la denominada Identidad de Parseval.

Usando la definición de norma de una función podemos escribir la identidad de Parseval de una manera que nos recuerda el cuadrado de la norma de un vector en un espacio lineal. Comparémosla con la expresión de la norma de un vector en R^3:

  • f(x) = ∑(ak θk(x)).
  • ¬v = a1 ¬e1 + a2 ¬e2 + a3 ¬e3.
  • ||f||^2 = ∑(ak)^2.
  • ||¬v||^2 = ∑(ak)^2 desde “k = 1″ hasta “3″.

La serie de Fourier de una función “f” en un intervalo [a, b] converge en media a la función si y solo si se cumple la igualdad anterior. Por otra parte, cuando consideramos una sucesión ortonormal {θn} en el intervalo [a, b], si se cumple que toda función “f” de “R” converge en media a su serie de Fourier respecto a la sucesión {θn}, se dice que {θn(x)} es una sucesión ortonormal completa.

La Serie de Fourier en Forma Compleja:

Vamos a escribir la serie de Fourier de un modo más compacto mediante su extensión al plano complejo. Consideremos una serie de Fourier de una función “f(x)” definida sobre un intervalo simétrico [- L, L]:

  • f(x) = a0 / 2 + ∑[an Cos(n π x / L) + bn Sen(n π x / L)].

Siendo:

  • an = ∫(f(x) Cos(n π x / L) dx) / L.
  • bn = ∫(f(x) Sen(n π x / L) dx) / L.

Si hacemos la extensión al campo complejo:

  • e^(i n π x / L) = Cos(n π x / L) + i Sen(n π x / L).

o bien:

  • Cos(n π x / L) = [e^(i n π x / L) + e^(- i n π x / L)] / 2.
  • Sen(n π x / L) = [e^(i n π x / L) - e^(- i n π x / L)] / 2 i.

Sustituyendo en la serie de Fourier original:

  • f(x) = a0 / 2 + ∑[an [e^(i n π x / L) + e^(- i n π x / L)] / 2 + bn [e^(i n π x / L) - e^(- i n π x / L)] / 2 i].
  • f(x) = a0 / 2 + ∑[(an / 2 + bn / (2 i)) e^(i n π x / L) + (an / 2 - bn / (2 i)) e^(- i n π x / L)].
  • f(x) = a0 / 2 + ∑[(an - i bn) e^(i n π x / L) / 2] + ∑[(an + i bn) e^(- i n π x / L) / 2].

Podemos escribir la serie con un único sumatorio extendido a índices positivos y negativos introduciendo la siguiente notación:

  • ck = “(an – i bn) / 2″ y “k = n” si “k > 0″.
  • ck = “a0 / 2″  si “k = 0″.
  • ck = “(an + i bn) / 2″ y “k = – n” si “k < 0″.
  • f(x) = ∑(ck e^(i n π x / L)) desde “-∞” hasta “∞”.

Veamos ahora cómo se calculan los coeficientes “ck” de la serie de Fourier compleja. Los “an” y “bn” vienen dados por:

  • an = ∫(f(x) Cos(n π x / L) dx) / L.
  • an = ∫(f(x) [e^(i n π x / L) + e^(- i n π x / L)] / 2 dx) / L.
  • bn = ∫(f(x) Sen(n π x / L) dx) / L.
  • bn = ∫(f(x) [e^(i n π x / L) - e^(- i n π x / L)] / 2 i dx) / L.

Con lo cual los “ck” serán, para:

  • k > 0.
  • k = n.
  • ck = (an – i bn) / 2.
  • ck = ∫(f(x) [e^(i n π x / L) + e^(- i n π x / L)] / 2 dx) / (2 L) – ∫(f(x) [e^(i n π x / L) - e^(- i n π x / L)] / 2 dx) / (2 L).
  • ck = ∫(f(x) e^(- i n π x / L) dx) / (2L).

Para :

  • k < 0.
  • k = – n.
  • ck = (an + i bn) / 2.
  • ck = ∫(f(x) [e^(i n π x / L) + e^(- i n π x / L)] / 2 dx) / (2 L) + ∫(f(x) [e^(i n π x / L) - e^(- i n π x / L)] / 2 dx) / (2 L).
  • ck = ∫(f(x) e^(i n π x / L) dx) / (2L).

Para:

  • k = 0.
  • c0 = ∫(f(x) dx) / (2 L) = a0 / 2.

Representacion de Puntos en el Espacio:

puntos1Consideremos tres rectas “x”, “y”, “z”, que son mutuamente perpendiculares y se intersecan en un mismo punto “O”. Éste punto se denominará origen de coordenadas y divide a cada eje en dos semiejes (positivo y negativo). Para cada punto “M” del espacio podemos encontrar las correspondientes coordenadas “P”, “Q”, “R”, de la siguiente forma.

El punto “P” es la intersección del eje “OX” con un eje paralelo al plano “yz” que pasa por “M”. De modo análogo se obtienen los puntos “Q” y “R” como resultado de la proyección del punto “M” en sus respectivos ejes coordenados.

La longitud de los segmentos es:

  • OP = x.
  • OQ = y.
  • OR = z.

, de modo que a cada punto del espacio le asignaremos la terna ordenada de números (x, y, z).

Denotaremos por “¬i”, “¬j”, “¬k”, a los vectores unitarios coordenados cuya dirección y sentido es el positivo de estos ejes. Dado un punto arbitrario “M”, se cumple que su vector de posición satisface

  • ¬OM = ¬OP + ¬OQ + ¬OR.

En términos de los vectores unitarios:

  • ¬OM = x ¬i + y ¬j + z ¬k.

Siendo siempre:

  • x = ¬OM ¬i.
  • y = ¬OM ¬j.
  • z = ¬OM ¬k.

La base (¬i, ¬j, ¬k) del espacio tridimensional es una base ortonormal, ya que todos sus vectores son unitarios y ortogonales dos a dos. Existe correspondencia biunívoca (única) entre cada punto “M” del espacio y el conjunto de las coordenadas cartesianas rectangulares (x, y, z).

Distancia entre Dos Puntos:

Sean los puntos “M1″ y “M2″, y sean sus coordenadas respectivas (x1, y1, z1) y (x2, y2, z2). Denominaremos distancia entre los puntos “M1″ y “M2″ a la longitud del segmento que los une:

Este resultado se obtiene aplicando reiteradamente el Teorema de Pitágoras. A esta distancia se le denomina distancia mínima euclídea entre los puntos “M1″ y “M2″.

Transformación de Coordenadas:

Consideremos dos sistemas de ejes de coordenadas cartesianos (x, y, z) y (x’, y’, z’), con sus respectivos orígenes “O” y “O’”. Dado un punto “A” del espacio tridimensional, podremos expresar sus coordenadas en ambos sistemas:

  • ¬OA = x ¬ex + y ¬ey + z ¬ez.
  • ¬O’A = x’ ¬ex’ + y’ ¬ey’+ z’ ¬ez’.

Las coordenadas del origen “O” expresadas en sistema (x’, y’, z’) son:

  • ¬O’O = x0′ ¬ex’ + y0′ ¬ey’+ z0′ ¬ez’.

A partir de las definiciones se cumple:

  • ¬O’A = ¬O’O + ¬OA = (x0′ ¬ex’ + y0′ ¬ey’+ z0′ ¬ez’) + (x ¬ex + y ¬ey + z ¬ez).

Expresemos ahora los vectores unitarios “¬ex”, “¬ey”, “¬ez”, en el sistema de vectores “¬ex’”, “ey’”, “ez’”:

  • ¬ex = a11 ¬e’x + a12 ¬ey’ + a13 ¬ez’.
  • ¬ey = a21 ¬e’x + a22 ¬ey’ + a23 ¬ez’.
  • ¬ez = a31 ¬e’x + a32 ¬ey’ + a33 ¬ez’.

Sustituyendo:

  • ¬O’A = (x0′ ¬ex’ + y0′ ¬ey’+ z0′ ¬ez’) + (x a11 + y a21 + z a31) ¬ex’ + (x a12 + y a22 + z a32) ¬ey’ + (x a13 + y a23 + z a33) ¬ez’, de donde: ¬O’A = (x0′ + x a11 + y a21 + z a31) ¬ex’ + (y0′ + x a12 + y a22 + z a32) ¬ey’ + (z0′ + x a13 + y a23 + z a33) ¬ez’.

De donde:

  • x’ = x0′ + x a11 + y a21 + z a31.
  • y’ = y0′ + x a12 + y a22 + z a32.
  • z’ = z0′ + x a13 + y a23 + z a33.

En estas ecuaciones aparecen en los dos miembros coordenadas referidas al sistema nuevo. Esto permite una escritura más compacta, pero si queremos poner en cada miembro de las expresiones coordenadas referidas a un único sistema de referencia hemos de modificar:

  • ¬O’A = – ¬OO’ + ¬OA.

Siempre se cumple que:

  • ¬ex ¬ex’ = a11.
  • ¬ey ¬ex’ = a21.
  • ¬ez ¬ex’ = a31.
  • ¬ex ¬ey’ = a12.
  • ¬ey ¬ey’ = a22.
  • ¬ez ¬ey’ = a32.
  • ¬ex ¬ez’ = a13.
  • ¬ey ¬ez’ = a23.
  • ¬ez ¬ez’ = a33.

Por lo tanto, si hacemos la descomposición inversa de los vectores:

  • ¬ex’ = a11 ¬ex + a21 ¬ey + a31 ¬ez.
  • ¬ey’ = a12 ¬ex + a22 ¬ey + a32 ez.
  • ¬ez’ = a13 ¬ex + a23 ¬ey + a33 ez.

Para que la transformación lleve de un sistema de ejes ortogonales a otro ha de cumplirse:

  • |¬ex|^2 = |¬ey|^2 = |¬ez|^2 = |¬ex’|^2 = |¬ey’|^2 = |¬ez’|^2 = 1.
  • ¬ex ¬ey = ¬ex ¬ez = ¬ey ¬ez = ¬ex’ ¬ey’ = ¬ex’ ¬ez’ = ¬ey’ ¬ez’ = 0.

Todas estas ecuaciones conducen a:

  • a11^2 + a12^2 + a13^2 = 1.
  • a21^2 + a22^2 + a23^2 = 1.
  • a31^2 + a32^2 + a33^2 = 1.
  • a11 a21 + a12 a22 + a13 a23 = 0.
  • a21 a31 + a22 a32 + a23 a33 = 0.
  • a31 a11 + a32 a12 + a33 a13 = 0.

Es decir, la suma de los cuadrados de los elementos con alguna componente similar es “1″, y la suma de los productos dos a dos de las componentes de los vectores de la segunda base es “0″. A este tipo de transformaciones se les denomina ortogonales.

Un modo de obtener una transformación ortogonal usando parámetros con un claro significado geométrico es mediante los Ángulos de Euler. Sean dos sistemas coordenados (x, y, z) y (x’, y’, z’) que comparten el origen de coordenadas. Para determinar la posición de los ejes del sistema (x’, y’, z’) respecto a los ejes del sistema (x, y, z) basta con conocer los siguientes tres ángulos:

  • El ángulo “σ” que forman los ejes zz’.
  • El ángulo “Ψ” desde el eje “x’” a la recta “OH” de intersección del plano “xy” con el plano “x’y'”.
  • El ángulo “φ” que forma la recta “OH” con el eje “x”.

angulos-eulerAl conjunto (φ, σ, Ψ) se le conoce como ángulos de Euler, y determinan completamente la posición de (x’, y’, z’) respecto a los ejes del sistema (x, y, z). El movimiento que lleva del triedro (x, y, z) al (x’, y’, z’) se puede descomponer en tres pasos:

.-Una rotación de un ángulo “φ” alrededor del eje “z”:

  • x1 = x Cosφ + y Senφ.
  • y1 = – x Senφ + y Cosφ.
  • z1 = z.

.-Una rotación de un ángulo “σ” alrededor del eje “x” resultante (eje “OH”, que llamaremos eje “x2″):

  • x2 = x1.
  • y2 = y1 Cosσ + z1 Senσ.
  • z2 = – y1 Senσ + z1 Cosσ.

.-Una rotación de un ángulo “ψ” alrededor del eje “z” resultante, que llamaremos eje “z3″:

  • x’ = x2 CosΨ + y2 SenΨ.
  • y’ = – x2 SenΨ + y2 CosΨ.
  • z’ =  z2.

En resumen:

  • x’ = (Cosφ SenΨ – Senφ SenΨ Cosσ) x + (Senφ CosΨ + Cosφ SenΨ Cosσ) y + (SenΨ Senσ) z.
  • y’ = – (Cosφ SenΨ – Senφ CosΨ Cosσ) x + (- Senφ SenΨ + Cosφ CosΨ Cosσ) y + (CosΨ Senσ) z.
  • z’ = (Senφ Senσ) x – (Cosφ Senσ) y + (Cosσ) z.

Sistemas de Coordenadas Cilíndricas:

coordenadas-cilindricasConsideremos un sistema de coordenadas cartesianas con ejes “x”, “y”, “z”. Las coordenadas cilíndricas de un punto serán denotadas por el radio “ρ”, la altura “z”, y el ángulo “Φ”; (ρ, Φ, z), y cumplen:

  • x = ρ CosΦ.
  • y = ρ SenΦ.
  • z = z.
  • ρ ≥ 0.
  • 0 ≤ Φ ≤ 2 π.
  • ¬r = ρ CosΦ ¬i + ρ SenΦ ¬j + z ¬k.

Las superficies de coordenadas constantes son:

  • “ρ = cte” genera un cilindro de eje “z”.
  • “Φ = cte” genera un plano que contiene al eje “z” y forma un ángulo “Φ” con el plano “xz”, siendo secante al plano “xy”.
  • “z = cte” genera un plano horizontal de altura “z”.

Las transformaciones inversas son:

  • ρ = [x^2 + y^2]^1/2.
  • Φ = Arcotg(y / x).
  • z = z.

Los vectores unitarios coordenados serán:

  • ¬ex = (d¬r / dx) / |d¬r / dx|, siendo “x” la coordenada curvilínea correspondiente.

A veces se definen los Coeficientes de Escala asociados a las coordenadas curvilíneas mediante hx = |d¬r / dx|. En nuestro caso:

  • d¬r / dΦ = - ρ SenΦ ¬i + ρ CosΦ ¬j.
  • d¬r / dρ = CosΦ ¬i + SenΦ ¬j.
  • d¬r / dz = ¬k.
  • hΦ = ρ.
  • hρ = 1.
  • hz = 1.

Por lo tanto:

  • ¬eρ = CosΦ ¬i + SenΦ ¬j.
  • ¬eΦ = - SenΦ ¬i + CosΦ ¬j.
  • ¬ez = ¬k.

Coordenadas Esféricas:

coordenadas-esfericas1Denotaremos las coordenadas esféricas de un punto en el espacio por el radio “ρ”, el ángulo “σ” de latitud, y el ángulo “Φ” de corte con el plano ecuador, (ρ, σ, Φ), y verifican:

  • x = ρ Senσ CosΦ.
  • y = ρ Senσ SenΦ.
  • z = ρ Cosσ.
  • ρ ≥ 0.
  • 0 ≤ Φ ≤ 2 π.
  • 0 ≤ σ ≤ π.
  • ¬r = ρ Senσ CosΦ ¬i + ρ Senσ SenΦ ¬j + ρ Cosσ ¬k.

Las relaciones recíprocas son:

  • ρ = [x^2 + y^2 + z^2]^1/2.
  • Φ = Arcotg(y / x).
  • σ = Arcotg([x^2 + y^2]^1/2 / z).

Las superficies coordenadas  correspondientes son:

  • “ρ = cte” genera una esfera de centro “O”.
  • “Φ = cte” genera un semiplano que contiene al eje “z” y forma un ángulo “Φ” con el eje “x”.
  • “σ = cte” es un cono de semianchura “σ” y que posee al eje “z” como eje de simetría.

Además:

  • d¬r / dρ = Senσ CosΦ ¬i + Senσ SenΦ ¬j + Cosσ ¬k.
  • d¬r / dσ = ρ Cosσ CosΦ ¬i + ρ Cosσ SenΦ ¬j – ρ Senσ ¬k.
  • d¬r / dΦ = – ρ Senσ SenΦ ¬i + ρ Senσ CosΦ ¬j.
  • hρ = 1.
  • hσ = ρ.
  • hΦ = ρ Senσ.

Los vectores unitarios coordenados son entonces:

  • ¬er = Senσ CosΦ ¬i + Senσ SenΦ ¬j + Cosσ ¬k.
  • ¬eσ = Cosσ CosΦ ¬i + Cosσ SenΦ ¬j – Senσ ¬k.
  • ¬eΦ = – SenΦ ¬i + CosΦ ¬j.

El sistema de coordenadas esférico tiene sobre todo interés en la descripción de problemas con simetría esférica.

Ecuación de una Recta en el Espacio:

Dado un punto “P” de “R^3″ y un vector no nulo “¬u”, se llama recta que pasa por “P” y tiene por dirección “¬u” al conjunto de puntos que cumplen:

  • ¬Pi = ¬P + λ ¬u (ecuación vectorial).

En componentes obtenemos las ecuaciones paramétricas:

  • pxi = px + λ ¬ux.
  • pyi = py + λ ¬uy.
  • pzi = pz + λ ¬uz.

Dados dos puntos “¬P” y “¬Q” distintos, por ellos pasa una sola recta, cuyas ecuaciones paramétricas son:

  • x = px + λ (¬qx – px).
  • y = py + λ (¬qy – py).
  • z = pz + λ (¬qz – pz).

Una recta que pase por un punto “¬P” con una dirección “¬u” coincide con otra que pase por “¬Q” con dirección “¬v” si los vectores “¬u”, “¬v”, “¬Q – ¬P” son proporcionales. Si despejamos “λ” de las ecuaciones paramétricas obtendremos:

  • λ = (x – px) / ux.
  • λ = (y – py) / uy.
  • λ = (z – pz) / uz.

, con lo que la recta queda también determinada por la llamada ecuación continua:

  • (x – px) / ux = (y – py) / uy = (z – pz) / uz.

La recta que pasa por los puntos “¬P” y “¬Q” se puede escribir como:

  • (x – px) / (qx – px) = (y – py) / (qy – py)= (z – pz) / (qz – pz).

Posición Relativa de Dos Rectas:

En el espacio dos rectas pueden ser paralelas, cortarse o cruzarse, de modo que la situación es algo más complicada que en el plano. Sean dos rectas que pasan por “¬P” y “¬Q” y tienen direcciones “¬u” y “¬v”, respectivamente. Sea “M” la matriz de coeficientes de determinante ecuación:

  • |M| = (uy vz – vy uz) (qx – px) + (vx uz – ux vz) (qy – py) + (ux vy – vx uy) (qz – pz).

.- Si “¬u ≠ λ ¬v”:

  • Si “|M| ≠ 0″ las rectas de cruzan.
  • Si “|M| = 0″ las rectas se cortan en un punto.

.- Si “¬u = λ ¬u”:

  • Si “¬Q – ¬P ≠ λ ¬u” las rectas son paralelas.
  • Si “¬Q – ¬P = λ ¬u” las rectas son coincidentes.

Ecuación de un Plano:

En el espacio tridimensional un plano quedará determinado especificando un punto “P” por el que pase y la dirección dada por dos vectores “¬u” y “¬v” linealmente independientes. Un conjunto “¬X” pertenecerá al plano si existen dos coeficientes “λ”, “μ” tales que:

  • ¬Qi – ¬Q = λ ¬u + μ ¬v.

A ésta se le denomina ecuación vectorial del plano. Las ecuaciones paramétricas son:

  • x = px + λ ux + μ vx.
  • y = py + λ uy + μ vy.
  • z = pz + λ uz + μ vz.

El plano que pasa por tres puntos no alineados P(px, py, pz), Q(qx, qy, qz), R(rx, ry, rz), lo podemos construir de la siguiente forma:

  • x = px + λ (qx – px) + μ (rx – px).
  • y = py + λ (qy – py) + μ (ry – py).
  • z = pz + λ (qz – pz) + μ (rz – pz).

Ecuación Euclídea de un Plano:

Un plano del espacio “R^3″ queda determinado si se conoce uno de sus puntos “P” y un vector no nulo “¬n” ortogonal al plano. Un punto “Q” pertenecerá al plano si: (¬Q – ¬P) ¬n = 0, pues si este producto escalar es nulo serán perpendiculares. Ésta se conoce como la ecuación euclídea del plano.

La ecuación general de un plano en el espacio será:

  • a x + b y + c z + d = 0.

, donde el vector ¬n(a, b, c) es perpendicular al plano.

Rectas como Intersecciones de Planos:

Toda recta en el espacio tridimensional se puede expresar como intersección de dos planos cuyos vectores normales no son proporcionales. Así pues, podemos definir la recta “r” como:

  • a1 x + b1 y + c1 z + d1 = 0.
  • a2 x + b2 y + c2 z + d2 = 0.

, donde el vector normal al primer plano es ¬m(a1, b1, c1) y el vector normal al segundo plano es ¬n(a2, b2, c2).


Posicion Relativa de Rectas y Planos:

Sea un plano “π” de ecuación “a x + by + c z + d = 0″, y consideremos una recta “r” cuyo vector director es ¬u(ux, uy, uz), y pasa por P(x0, y0, z0). Entonces la ecuación de la recta será: “(x – x0) / ux = (y – y0) / uy = (z – z0) / uz.”

El ángulo entre la recta y el plano “Φ” es el ángulo que forma el vector “¬u” con su proyección ortogonal sobre el plano “π”:

  • Φ = Arcosen(|¬u ¬n| / ||¬u|| ||¬a||).

Tenemos las siguientes posibilidades para la posición relativa de la recta y el plano:

  • La recta y el plano se cortan en un punto si los vectores “¬u” y “¬n” no son perpendiculares.
  • La recta y el plano son paralelos si los vectores “¬u” y “¬n” son perpendiculares y el sistema de ecuaciones es incompatible.
  • La recta está contenida en el plano si los vectores “¬u” y “¬n” son perpendiculares y el sistema de ecuaciones es compatible.

Distancia de un Punto a un Plano:

Consideremos un punto “P” y un plano “π” tales que “P” no pertenezca a “π”. Entonces existe un punto “P0″ en “π” tal que el vector “¬P – ¬P0″ es perpendicular a “π”. La distancia de “P” a “π” es la menor de las distancias de “P” a los puntos del plano “π”, y coincide con la longitud del segment0 PP0, que es la proyección del vector (¬Q – ¬P) sobre la normal al plano, “¬n”, siendo “¬Q” un punto del plano:

  • d(P,π) = |(¬Q – ¬P) ¬n| / ||¬n||.

Superficies y Curvas en el Espacio Tridimensional:

esfera2La ecuación de una superficie en el espacio tridimensional puede escribirse como f(x, y, z) = 0, y se denomina ecuación implícita de la superficie. Los puntos cuyas coordenadas (x, y, z) satisfacen dicha ecuación forman parte de la superficie. Un ejemplo es la esfera de radio “R” con centro en (x0, y0, z0):

  • (x – x0)^2 + (y – y0)^2 + (z – zo)^2 = R^2.

Otra forma de escribir la ecuación de una superficie es mediante el uso de parámetros. En general, si “u”, “v” pertenecen a “R”, una superficie podrá escribirse como:

  • x = f1(u, v).
  • y = f2(u, v).
  • z = f3(u, v).

Éstas se conocen como las componentes paramétricas de la superficie. Veamos por ejemplo las de la esfera (coordenadas esféricas):

  • x = R Senσ CosΦ.
  • y = R Senσ SenΦ.
  • z = R Cosσ.

cilindro-espacioOtro ejemplo. Consideremos el cilindro de radio “R” y que tiene como eje el eje “z”. Los puntos que se encuentran sobre el cilindro verifican que su distancia al eje debe ser “R”, de modo que tenemos la ecuación:

  • x^2 + y^2 = R^2, para cualquier valor de “z”.

Sus ecuaciones paramétricas podrían ser (coordenadas cilíndricas):

  • x = R CosΦ.
  • y = R SenΦ.
  • z = z.

Si intersecamos dos superficies tendremos en general una curva, de modo que al conjunto de de ecuaciones:

  • f1(x, y, z) = 0.
  • f2(x, y, z) = 0.

se les denomina a veces ecuación de una curva en forma implícita.

Consideremos las ecuaciones:

  • x^2 + y^2 = R^2.
  • x = h.

Se trata de un cilindro de radio “R” y un plano paralelo al plano “xy” que pasa por “x = h”. Tomadas en conjunto, esas dos ecuaciones describen una circunferencia de radio “R” centrada en (0, 0, h).

Otra forma de escribir la ecuación de una curva en 3 dimensiones es mediante un cierto parámetro, con lo cual tenemos las ecuaciones paramétricas de la curva:

  • x = g1(t).
  • y = g2(t).
  • z = g3(t).

En el caso de la circunferencia anterior tendríamos:

  • x = R Cost.
  • y = R Sent.
  • z = h.

Finalmente, una curva y una superficie intersecan normalmente en uno o varios puntos.

Superficies de Revolución:

Supongamos una curva en el plano “xz” dada mediante la ecuación z = f(x). Si giramos esta curva alrededor del eje “z”, cada punto de la curva describirá una circunferencia con centro en el punto (0, 0, z0), y radio “x0″. Los puntos de esta circunferencia verifican entonces:

  • x^2 + y^2 = x0^2.
  • z = z0.

Tenemos entonces “z0 = f([x^2 + y^2]^1/2). La ecuación de la superficie de revolución generada podemos escribirla como:

  • z = f([x^2 + y^2]^1/2) = f(r).

Superficies Cilíndricas:

Sea “γ” cierta curva en el espacio y sea “¬u” una dirección. Denominaremos superficie cilíndrica  de curva directriz “γ” y de generatriz “¬u” a la superficie contruida haciendo pasar por cada punto de “γ” una recta paralela a “¬u”.

Consideremos por ejemplo la siguiente elipse en el plano “xy”:

  • x0^2 / a^2 + y0^2 / b^2 = 1.

Si tomamos la generatriz paralela al eje “z” (ux = uy = 0, uz = 1), tendremos la ecuación de un cilindro elínptico de generatriz “z”:

  • x^2 / a^2 + y^2 / b^2 = 1.

Si tomamos, sin embargo, la recta “x = z, y = 0″ por generatriz, obtendremos un cilindro elíptico de generatriz “x = z, y = 0″ (ux = uy = 0, uz = 1):

  • (x – z)^2 / a^2 + y^2 / b^2 = 1.

Superficies Cónicas:

conoSea “γ” una curva arbitraria y “O” un punto fuera de ella. Tracemos una recta por cada punto de “γ” que pasa por “O”. El conjunto de puntos situados en estas rectas se denomina superficie cónica. “γ” es la directriz, “O” es el vértice, y cada recta “l” que pase por “γ” y “O” se denomina generatriz.

Supongamos que el vértice está situado en el origen de coordenadas, y tomemos como generatriz una recta que pase por “O” y por un punto (x0, y0, z0) de la curva “γ”. Las ecuaciones paramétricas de esta generatriz serán:

  • x = t x0.
  • y = t y0.
  • z = t z0.

Y su ecuación implícita es:

  • f1(x0, y0, z0) = 0.
  • f2(x0, y0, z0) = 0.

Como (x0, y0, z0) pertenece a la curva, y por lo tanto definible en general por medio a dunas ecuaciones paramétricas, ha de verificarse que:

  • x0 = g1(u).
  • y0 = g2(u).
  • z0 = g3(u).

de donde:

  • x = t g1(u).
  • y = t g2(u).
  • z = t g3(u).

Éstas serían las ecuaciones paramétricas de una seuperficie cónica con el vértice en el origen de coordenadas. Su ecuación implícita vendría dada por:

  • F(x, y, z) =0.

, por lo tanto podemos escribir:

  • F(x, y, z) = F(t x0, t y0, t z0) = F(x0, y0, z0) = 0.

Una propiedad interesante que se deriva de esto es que cualquier función homogénea de grado “q”:

  • F(t x, t y, t z) = t^q F(x, y, z).

puede representar una superficie cónica con vértice en el origen si la escribimos como:

  • F(x, y, z) = 0.

En efecto, si el punto (x0, y0, z0) está en la superficie tenemos:

  • F(x0, y0, z0) = F(t x0, t y0, t z0) = t^q F(x0, y0, z0).

Por lo tanto los puntos de las rectas que pasan por el origen está en la superficie.

El Elipsoide:

elipsoideConsideremos en el espacio euclídeo un sistema de ejes rectangulares “xyz”, y sean los números reales:

  • a > 0.
  • b > 0.
  • c > 0.

Definimos los puntos:

  • A = (a, 0, 0).
  • A’ = (- a, 0, 0).
  • B = (0, b, 0).
  • B’ = (0, – b, 0).
  • C = (0, 0, c).
  • C’ = (0, 0, – c).

Sean las elipses siguientes:

  • “Ex” con ejes “BB’”, “CC’”.
  • “Ey” con ejes “AA’”, “CC’”.
  • “Ez” con ejes “AA’”, “BB’”.

Cuyas ecuaciones son:

.-Ex:

  • y^2 / b^2 + z^2 / c^2 = 1.
  • x = 0.

.-Ey:

  • x^2 / a^2 + z^2 / c^2 = 1.
  • y = 0.

.-Ez:

  • x^2 / a^2 + y^2 / b^2 = 1.
  • z = 0.

Se llama elipsoide de vértices “A”, “A’”, “B”, “B’”, “C”, “C’”, al lugar geométrico que describe una elipse situada en un plano perpendicular al eje “z”, y que tiene sus vértices en las elipses “Ex”, “Ey”. La ecuación reducida del elipsoide es:

  • x^2 / a^2 + y^2 / b^2 + z^2 / c^2 = 1.

Un plano perpendicular al eje “z”, tal como el:

  • z = h.

, corta a la elipse “Ex” en los puntos:

  • y^2 / b^2 + h^2 / c^2 = 1.
  • x = 0.

, y a la elipse “Ey” en los puntos:

  • x^2 / a^2 + h^2 / c^2 = 1.
  • y = 0.

Es decir, por un lado a los puntos:

  • y = +- b [1 - h^2 / c^2]^1/2.
  • x = 0.
  • z = h.

, y por el otro a los puntos:

  • x = +- a [1 - h^2 / c^2]^1/2.
  • y = 0.
  • z = h.

De aquí deducimos que uno de los semiejes de la elipse variable por longitud “a [1 - h^2 / c^2]^1/2″ (el correspondiente al eje “x”), y el otro tiene por longitud “b [1 - h^2 / c^2]^1/2″ (el correspondiente al eje “y”). La ecuación de la elipse resultado de la intersección del elipsoide con un plano:

  • z = h.

es, por lo tanto:

  • z = h.
  • x^2 / (a^2 (1 – h^2 / c^2)) + y^2 / (b^2 (1 – h^2 / c^2)) = 1.
  • - c ≤ h ≤ c.

El lugar geométrico que barre esta elipse variando “h” desde “- c” hasta “c” es la superficie del elipsoide.

Propiedades del Elipsoide:

El elipsoide:

  • x^2 / a^2 + y^2 / B`2 + z^2 / c^2 = 1.

es simétrico respecto al origen de coordenadas. También es simétrico respecto a los ejes “x”, “y”, “z”, y respecto a los planos coordenados:

  • x = 0.
  • y = 0.
  • z = 0.

El elipsoide está situado entre dos esferas cuyos radios son:

  • r = mínimo de (a, b, c).
  • R = máximo de (a, b, c).

Si:

  • a = b.

, entonces el elipsoide es de revolución alrededor del eje “z”. Si además:

  • a = b = c.

, se trata de una esfera de radio “a”. Si:

  • a = c.

, tenemos una elipsoide de revolución alrededor del eje “y”.

Hiperboloide de una hoja:

hiperboloide-una-hoja1Consideremos un sistema de ejes rectangulares “xyz”, y sean los números reales:

  • a > 0.
  • b > 0.
  • c > 0.

Definimos los puntos:

  • A = (a, 0, 0).
  • A’ = (- a, 0, 0).
  • B = (0, b, 0).
  • B’ = (0, – b, 0).
  • C = (0, 0, c).
  • C’ = (0, 0, – c).
  • Sea “E” la elipse de simejes “AA’” y “BB’”.
  • Sea “Hx” la hipérbola con el eje real “BB’” e imaginario “CC’”.
  • Sea “Hy” la hipérbola con eje real “AA’” e imaginario “CC’”.

El hiperboloide de una hoja con ejes reales “AA’”, “BB’”, y cuyo eje imaginario es “CC’”, es el lugar geométrico de los puntos que pertenecen a una elipse situada en un plano perpendicular a “z” y con vértices en las hipérbolas “Hx” y “Hy”. Su ecuación reducida es:

  • x^2 / a^2 + y^2 / b^2 – z^2 / c^2 = 1.

Las ecuaciones de la elipse “E” son:

  • x^2 / a^2 + y^2 / b^2 = 1.
  • z = 0.

Las de la hipérbola “Hx”:

  • y^2 / b^2 – z^2 / c^2 = 1.
  • x = 0.

Y las de la hipérbola “Hy”:

  • x^2 / a^2 – z^2 / c^2 = 1.
  • y = 0.

Si cortamos estas hipérbolas “Hx” y “Hy” con el plano horizontal:

  • z = h.

obtendremos los siguientes puntos de corte: por parte de “Hx:”

  • y = +- b [1 + h^2 / c^2]^1/2.
  • x = 0.
  • z = h.

y por parte de “Hy”:

  • x = +- a [1 + h^2 / c^2]^1/2.
  • y = 0.
  • z = h.

Por lo tanto la elipseresultado de la intersección del hiperboloide con el plano:

  • z = h.

será:

  • z = h.
  • x^2 / (a^2 (1 + h^2 / c^2)) + y^2 / (b^2 (1 + h^2 / c^2)) = 1.
  • - ∞ ≤ h ≤ ∞.

Al hacer variar esta elipse en el eje “z” obtenemos la superficie del hiperboloide de una hoja. Si eliminamos “h” de las dos ecuaciones anteriores obtendremos la ecuación reducida.

Propiedades del Hiperboloide de Una Hoja:

El hiperboloide:

  • x^2 / a^2 + y^2 / b^2 – z^2 / c^2 = 1.

es simétrico respecto al origen “O”, a los ejes “x”, “y” y “z”, y también respecto a los planos coordenados.

El hiperboloide está situado fuera del cono:

  • x^2 / a^2 + y^2 / b^2 – z^2 / c^2 = 0.

Este cono es asintótico al hiperboloide, y es el cono que generan las asíntotas que resultan de cortar al hiperboloide con planos que contienen al eje “z”.

Sabemos que la intersección del hiperboloide con el plano:

  • z = h.

es:

  • x^2 / (a^2 (1 + h^2 / c^2)) + y^2 / (b^2 (1 + h^2 / c^2)) = 1.

, mientras que la intersección del cono con ese mismo plano es:

  • x0^2 / (a^2 h^2 / c^2) + y0^2 / (b^2 h^2 / c^2) = 1.

Si un punto (x0, y0) cumple la anterior ecuación, entonces el punto:

  • x = [1 + h^2 / c^2]^1/2 x0 / (h / c).
  • y = [1 + h^2 / c^2]^1/2 y0 / (h / c).

cumple pertenecer a la intersección con el hiperboloide. Los puntos (x, y) y (x0, y0) están en un plano perpendicular al eje “z”, y sus distancias a este eje verifican:

  • d = [x^2 + y^2]^1/2 = [c^2 / h^2 + 1]^1/2 [x0^2 + y0^2]^1/2.
  • d ≥ d0 = [x0^2 + y0^2]^1/2.

La ecuación del hiperboloide en coordenadas cilíndricas es:

  • ρ^2 (CosΦ^2 / a^2 + SenΦ^2 / b^2) – z^2 / c^2 = 1.

La intersección de este hiperboloide con un plano:

  • Φ = cte.

es una hipérbola. Las asíntotas de esta hipérbola son las rectas que admiten por ecuación conjunta a:

  • ρ^2 (CosΦ^2 / a^2 + SenΦ^2 / b^2) = z^2 / c^2.

El lugar geométrico que engendran estas rectas es el cono antes descrito.

Si:

  • a = b.

, entonces el hiperboloide de revolución gira en torno al eje “z”.

Hiperboloide de dos hojas:

hiperboloide-dos-hojasConsideremos un sistema de ejes rectangulares “xyz”, y sean los números reales:

  • a > 0.
  • b > 0.
  • c > 0.

Definimos los puntos:

  • A = (a, 0, 0).
  • A’ = (- a, 0, 0).
  • B = (b, 0, 0).
  • B’ = (- b, 0, 0).
  • C = (c, 0, 0).
  • C’ = (- c, 0, 0).
  • Sea “Hx” la hipérbola con eje real “CC’” e imaginario “BB’”.
  • Sea “Hy” la hiperbola con eje real “CC’” e imaginario “AA’”.

Se llama hiperboloide de dos hojas, que tiene como eje real “CC’” y como ejes imaginarios “AA’” y “BB’”, al lugar geométrico que describe una elipse variable situada en un plano perpendicular al eje “z” y cuyos vértices están en las hipérbolas “Hx” y “Hy”. Su ecuación reducida es:

  • x^2 / a^2 + y^2 / b^2 – z^2 / c^2 = – 1.

La hipérbola “Hx” es:

  • y^2 / b^2 – z^2 / c^2 = 1.
  • x = 0.

Y la hipérbola “Hy” es:

  • x^2 / a^2 – z^2 / c^2 = 1.
  • y = 0.

Si cortamos al hiperboloide con un plano:

  • z = h.

obtenemos dos elipses con vértices en los puntos:

  • y^2 / b^2 – z^2 / c^2 = 1.
  • x = 0.
  • z = h.

y:

  • x^2 / a^2 – z^2 / c^2 = 1.
  • y = 0.
  • z = h.

La ecuación de la elipse será:

  • x^2 / (a^2 (h^2 / c^2 – 1)) + y^2 / (b^2 (h^2 / c^2 – 1)) = 1.
  • |h| ≥ c.

Propiedades del Hiperboloides de Dos Hojas:

El hiperboloide de dos hojas es simétrico respecto al origen “O”, respecto a los ejes “x”, “y”, “z”, y también respecto a los planos coordenados.

El hiperboloide se halla situado fuera de la región:

  • |z| < c.

, ya que:

  • z^2 / c^2 = 1 + x^2 / a^2 + y^2 / b^2 ≥ 1.

Si:

  • a = b.

, entonces el hiperboloide es de revolucion:

  • (x^2 + y^2) / a^2 – z^2 / c^2 = 1.

, resultado de hacer girar alrededor del eje “z” una hipérbola conjugada al caso del hiperboloide de una hoja.

Paraboloide Elíptico:

paraboloideConsideremos en un sistema de semiejes rectangulares las siguientes parábolas: “Py”:

  • x^2 = 2 p z.
  • y = 0.

“Px”:

  • y^2 = 2 q z.
  • x = 0.

  • p > 0.
  • q > 0.

Tienen el vértice en el origen, la concavidad en el mismo sentido, y están situadas en planos perpendiculares.

El paraboloide elíptico es el lugar geométrico que describe una elipse variable con vértices en “Px” y “Py”. Su ecuación reducida es:

  • x^2 / p + y^2 / q = 2 z.

Si cortamos este paraboloide con un plano:

  • z = h.

obtenemos los siguientes puntos de corte por parte de “Px”:

  • x = +- [2 p h]^1/2.
  • y = 0.
  • z = h.

, y por parte de “Py”:

  • y = +- [2 q h]^1/2.
  • x = 0.
  • z = h.

La elipse resultado de la intersección será:

  • x^2 / 2 p h + y^2 / 2 q h = 1.

Propiedades del Paraboloide Elíptico:

El punto “O” se llama vértice deñ paraboloide elíptico, pero no es un centro de simetría. El paraboloide es simétrico respecto al eje “z” y los planos:

  • x = 0.
  • y = 0.

Si cortamos el paraboloide con los planos:

  • x = cte.

ó:

  • y = cte.

, obtenemos las parábolas:

  • x = c.
  • c^2 / 2 p + y^2 / 2 q = z.
  • y^2 = 2 q z – q c^2 / p.

, y:

  • y = c.
  • x^2 / 2 p + c^2 / 2 q = z.
  • x^2 = 2 p z – p c^2 / q.

Si:

  • p = q.

, entonces el paraboloide es de revolución, resultado de girar una parábola con el centro en el origen alrededor del eje “z”:

  • x^2 + y^2 = 2 p z.

Paraboloide Hiperbólico:

silla-montarConsideremos un sistema de ejes coordenados rectangulares y a las siguientes parábolas: Px:

  • y^2 = – 2 q z.
  • x = o.

Py:

  • x^2 = 2 p z.
  • y = 0.
  • p > 0.
  • q > 0.

Tienen el mismo vértice, la concavidad en distinto sentido, y están situadas en planos perpendiculares. Se llama paraboloide hiperbólico al lugar geométrico que describe una parábola variable paralela a “Px” que se desplaza de manera que su vértice recorre “Py”. Su ecuación reducida es:

  • x^2 / p – y^2 / q = 2 z.

Si intersecamos el paraboloide con:

  • y = h.

obtenemos:

  • x^2 / p = 2 z + h^2 / q.
  • x^2 = 2 p (z + h^2 / 2 q).

, que es una parábola en el plano:

  • y = h.

, con vértice (0, h, – h^2 / 2 q). Análogamente, si intersecamos el paraboloide con el plano:

  • x = h.

, obtenemos:

  • - x^2 / p = 2 z – h^2 / q.
  • x^2 = – 2 p (z – h^2 / 2 q).

, que es una parábola en el plano:

  • x = h.

con vértice (h, 0, h^2 / 2 q).

Si intersecamos al paraboloide hiperbólico con planos:

  • z = h.

obtenemos hipérbolas conjugadas:

  • x^2 / p – y^2 / q = 2 h.
  • x^2 / 2 h p – y^2 / 2 h q = 1, si h > 0.
  • x^2 / |2 h p| – y^2 / |2 h q| = 1, si h < 0.

Al paraboloide hiperbólico se le llama a veces “superficie en silla de montar”, por su analogía con ella.

Propiedades del Paraboloide Hiperbólico:

Se denomina vértice del paraboloide hiperbólico al punto “O”. Es simétrico respecto a “z” y a los planos:

  • x = 0.
  • y = 0.

Esta superficie no es en ningún caso una superficie de revolución.


ecuacionesLas leyes físicas, al ser ésta una ciencia experimental, se formulan en base a los resultados obtenidos durante observaciones. Así pues, una ley representa una aproximación estadística a los resultados que cabe esperar de un experiencia concreta.

Si definimos población como el conjunto de elementos sobre el cual debería actuar una cierta ley, en general el número de los mismos es tan elevado que debemos recurrir al muestreo y seleccionar una muestra de la misma que más o menos contenga todas los posibles resultados.

Una vez analizada una muestra, un posterior tratamiento estadístico nos permitirá estudiar si es posible generalizar algunas características para toda la población o no. Veremos en este tema, pues, cómo analizar muestras.

Tipos de Variables:

Cuando el fenómeno que vamos a estudiar toma valores muy concretos (un dado solo puede valer 1, 2, 3, 4, 5 ó 6), hablamos de una variable discreta.

Cuando el fenómeno toma una cantidad de valores infinita y no numerable (las posibles alturas de una persona), hablamos de una variable continua. Al proceso mediante el cual aproximamos una variable continua a una discreta se le denomina discretización de la variable.

Si la altura un conjunto de 100 personas está entre 1,6 metros y 2 metros, una forma de discretizar la variable continua es agrupar las alturas en intervalos o clases de 0,05 m: [1,6 metros, 1,65 metros) ..., de tal modo que un valor no esté en dos grupos distintos.

En caso de que el posible número de valores de una variable discreta o discretizada sea muy amplio, lo aconsejable es discretizarla aún más, en un número de clases próximo a la raíz cuadrada del número de valores (Si hay 100 resultados posibles los agruparemos en 10 clases).

Tabla de frecuencias:

tablasUna vez que tenemos nuestras variables discretizadas, es aconsejable escribir sus tablas de frecuencia, que pueden tener una infinidad de componentes, de los cuales 3 suelen aparecer siempre:

  • La columna de las clases "xi", en la que se indicará el nombre de todas las clases que aparecen en el experimento.
  • La columna de frecuencias absolutas "ni", que, junto a la columna de clases, indicará el número de veces que aparece cada una.
  • La columna de frecuencias relativas "fi", que indica lo mismo que la anterior, pero dividido entre el número total de resultados "N". Si el número "N" de veces que tiramos el dado es igual a 10, y el valor "xi" igual a 5 aparece 4 veces (ni), su frecuencia relativa es fi = ni / N = 4 / 10.

Medidas de Centralización:

Una vez que hemos obtenido una muestra y hemos escrito la correspondiente tablas de frecuencias, es interesante empezar a estudiar en torno a qué clases hay mayor acumulación de elementos. Hay varias formas de estudiar esto.

.-Moda: es la clase o el conjunto de clases que más veces aparecen. En general es única, multiplicándose con cuantas más clases tengan el mayor número de frecuencia absoluta. Se representa por "Md".

.-Mediana: si consideramos el número "N" de elementos analizados y los ordenamos por orden según el valor de sus clases, denominamos mediana a la clase del elemento "N / 2". Se representa por "Me".

.-Primer Cuartil: igual que en el caso anterior. En esta ocasión será el elemento "N / 4".

.-Tercer Cuartil: igual que en los casos anteriores. En esta ocasión será el elemento "3 N / 4".

De entre todas las medidas de centralización, sin duda, las más importantes son las medias, por la complejidad de su cálculo. Fundamentalmente hay cuatro tipos de medias, a saber:

.-Arimética: se suman todos los elementos y el resultado se divide entre el número total de elementos. Se representa por "x‾", y analíticamente se expresa:

  • x‾ = ∑(xi) desde "1" hasta "N" / N.

Si "K" es el número de clases, podremos simplificar la expresión sumando cada clase un número de veces igual a su frecuencia absoluta:

  • x‾ = ∑(xi ni) desde "1" hasta "K" / N = ∑(fi xi) desde "1" hasta "K".

.-Geométrica: se multiplican todos los elementos y al resultado se le aplica la raíz N-ésima.

  • xg‾ = (Π(xi) desde "1" hasta "N")^1/N.

Sin embargo, la forma más común de expresarla es como 10 elevado a la media de los logaritmos de los elementos:

  • xg‾ = 10^(log(x)‾).

.-Cuadrática: se suman todos los elementos elevados al cuadrado, y al resultado se le aplica la raíz cuadrada:

  • xq = (∑(xi^2) desde "1" hasta "N")^1/2.

Sin embargo, es más usual verla expresado como la raíz de la media de los cuadrados de los elementos:

  • xq‾ = (x^2‾)^1/2.

.-Armónica: se define su inversa como la media de la suma de las inversas de los elementos, de modo que:

  • xa = 1 / ((1 / x)‾).

Suele acontecer la siguiente relacion:

  • xa ≤ xg‾ ≤ x‾ ≤ xq‾.

Medidas de Dispersión:

dispersionEste nuevo tipo de medidas es útil para saber más o menos el nivel de concentración de los datos. Así pues, se puede interpretar como una forma de valorar la fiabilidad de decir que la mayoría se agrupan en torno a un valor. Cuanta mayor sea la dispersión mayor será la aleatoriedad del experimento.

.-Rango: es la diferencia entre el elemento de mayor valor y el el de menor valor.

.-Rango Intercuartílico: es la diferencia entre el primer y el tercer cuartiles.

.-Varianza: se define como la suma de las distancias al cuadrado entre cada elemento y la media aritmética, dividida cada una de ellas entre el número de elementos:

  • s^2 = ∑([xi - x‾]^2) desde “1″ hasta “N” / N.

.-Desviación Típica: se define como la raíz cuadrada de la varianza. Posee las mismas unidades que los elementos y por tanto es la que se les puede sumar. Se define como:

  • s = [s^2]^1/2.

En general, en distribuciones de datos normales o gaussianas, el intervalo (x‾ – 2 s, x‾ + 2 s) contiene el 95% de los elementos.

Conociendo todo esto, es interesante introducir el llamado Coeficiente de Pearson para dispersiones, que se define como:

  • cp = s / x‾.

Factor “k”:

  • k = (xi – x‾) / s(x).

Básicamente es una medida que da una idea de lo alejado que está un elemento de la media aritmética, es por eso que al valor del elemento “xi” se le resta el de la media de los elementos “x”, y después se divide entre la desviación típica de los “xi”. Si la distancia de un elemento a la media es menor que la desviación típica, diramos que está poco disperso, en caso contrario diremos que está bastante disperso.

La Desigualdad de Tchebychev:

  • f(xi//|xi – x‾| > k s) < 1 / k^2.

, es otro dato importante en las medidas de dispersión, pues implica que cuando un elemento está alejado k s veces de la media su frecuencia será menor que la inversa del cuadrado de “k”.

.-Momentos Característicos de la Distribución de Datos:

Se define como el momento de orden r-ésimo respecto a un valor “c” en una distribución de datos a la expresión:

  • mr(c) = (x – c)^r‾.

, es decir, la media de las distancias de los elementos a “c” elevadas a “r”.

Así pues, el momento de primer orden respecto a “0″ es la media, y el momento de segundo orden respecto a la media es la varianza.

Medidas de Asimetría:

asimetriaLa asimetría, como su propio nombre nos indica, nos da una idea de hacia qué lado de la media están más agrupados los datos, y en general usaremos dos coeficientes, siendo uno de ellos mucho más fiable que el otro.

.-Coeficiente de Pearson: se define como el cociente de la distancia de la media a la moda, dividido entre la desviación típica. Si es positivo hablamos de asimetría positiva, y análogamente trataremos los valores negativos:

  • Ap = (x‾ – Md) / s.

Tiene el fallo de que no considerar la posibilidad de que haya más de una moda.

.-Coeficiente de Fisher: se define como el momento de tercer orden respecto a la media dividido entre el cubo de la desviación típica:

  • Af = m3(x‾) / s^3.

, que en última instancia es:

  • ∑(fi(xi – x‾)^3) desde “1″ hasta “K” / s^3.

Medidas de Apuntamiento:

curtosisEn última instancia, el apuntamiento nos da una idea de lo importante que es la media en una distribución (si los datos se amontonan ciertamente en torno a ella o no). El factor curtosis, que es el que nos ayudará a determinar esta característica, se define como:

  • g = m4(x‾) / s^4.

Si “g” es igual a 3, la distribución será normal o gaussiana. Si “g” es menor que 3, la distribución será leptocúrtica, y si “g” es mayor que 3 la distribución será platicúrtica.

Distribuciones Bivariantes:

Son otro tipo de distribuciones en las que, para un mismo elemento, analizamos dos características “x” e “y” en vez de una, y posteriormente analizamos si están relacionadas en toda la muestra. Un ejemplo de este tipo de distribuciones pueden ser: la altura y el peso (sin relación), las notas en dos asignaturas (más o menos relacionadas), o la masa y el peso (completamente relacionadas)…

Medidas interesantes de este tipo de distribuciones son:

.-Distribución de Frecuencia Marginal:

Hablamos de Frecuencia Absoluta Marginal para referirnos al número de veces que una de las variables toma cierto valor. Así, la frecuencia absoluta marginal del valor “xi” de la variable “x” es el número de veces que aparece, independientemente del valor de “y”. Así pues, matemáticamente la expresaremos como la suma de las veces que que aparece “xi” junto a todos los valores de “y” que comparte, que serán “j”:

  • nxi = ∑(nij) desde “j=1″ hasta “l”.

Análogamente:

  • nyj = ∑(nij) desde “i=1″ hasta “k”.

, siendo “k” el número de valores de “x” ue pueden aparecer con “yj”.

La Frecuencia Relativa Marginal la podemos obtener sustituyendo “nij” por “fij”:

  • fxi = ∑(fij) desde “j=1″ hasta “l”.
  • fyj = ∑(fij) desde “i=1″ hasta “k”.

.-Frecuencias Coordinadas:

Definimos la frecuencia coordinada “f’” respecto a un valor “xi” como el cociente de la frecuencia relativa de algún elemento que tome el valor “xi” y la frecuencia relativa marginal de “xi”:

  • f’(yj // x = xi ) = fij / fxi.

(La frecuencia coordinada para cualquier valor de “y” siempre y cuando “x = xi”). Análogamente:

  • f’(xi // y = yj) = fij / fyj.

.-Momentos bivariantes:

Definimos el momento de una distribución bivariante de datos de orden “r, s” respecto a los puntos “c, d” como:

  • m”r,s”(c,d) = ∑(∑(fij (xi – c)^r (yj – d)^s) desde “j = 1″ hasta “l”) desde “i = 1″ hasta “k”.

Se cumplen las siguientes propiedades:

  • m”0,0″(c,d) = 1. El momento “0,0″ respecto a (c,d) es siempre la unidad.
  • m”1,0″(0,d) = x‾. El momento “1,0″ respecto a (0,d) es siempre la media de la variable “x”.
  • m”0,1″(c,0) = y‾. El momento “0,1″ respecto a (c,0) es siempre la media de la variable “y”.
  • m”2,0″(x‾,d) = s(x)^2. El momento “2,0″ respecto a (x‾,d) es siempre la varianza de la variable “x”.
  • m”0,2″(c,y‾) = s(y)^2. El momento “0,2″ respecto a (c,y‾) es siempre la varianza de la variable “y”.

.-Covarianza:

Se define la covarianza de una distribución bivariante como el momento “1,1″ respecto a (x‾,y‾).

  • Cov(x,y) = m”1,1″(x‾,y‾) = ∑(∑(fij (xi – x‾) (yj – y)) desde “j = 1″ hasta “l”) desde “i = 1″ hasta “k”. Desarrollando el producto nos resulta: Cov(x,y) = ∑(∑(fij (xi yi - x‾ yi – xi y‾ + x‾ y)) desde “j = 1″ hasta “l”) desde “i = 1″ hasta “k” = (x y)‾ – x‾ y‾ – x‾ y‾ + x‾ y‾ = (x y)‾ – x‾ y‾.

La covarianza es igual a la media del producto “xi yi” menos el producto de la media de la variable “x” por la media de la variable “y”.

La covarianza de una variable consigo misma es siempre igual a la varianza de la misma:

  • Cov(x,x) = (x^2)‾ – (x‾)^2 = s(x)^2.

.-Coeficiente de Correlación:

Para ver la relación entre las dos variables se establecen varios coeficientes de correlación, que indican el tipo de relación entre las mismas. Veremos ahora el Coeficiente de Correlación Lineal “r”, que tan solo nos da una idea de si las variables son directa o inversamente proporcionales, y cuanto. Este coeficiente es igual a la covarianza dividida entre el producto de las varianzas de cada una de las dos variables a analizar:

  • r = Cov(x,y) / (s(x) s(y).

Se puede comprobar que “r” es adimensional, y que toma valores entre “-1″ y “1″. Cuanto más cerca esté del “1″ mayor será la relación directa entre las variables, siendo perfecta en el “1″. Cuando más cerca esté del “-1″ mayor será la relación inversa entre las variables, siendo perfecta en el “-1″. Finalmente, cuanto más cerca esté del “0″ menor será la relación entre las variables, siendo completamente independientes en el “0″.

Rectas de Regresión de una Variable sobre Otra:

regresionUna vez obtenido un coeficiente de correlación entre dos variables de una distribución multivariante, y comprobado que existe una dependencia entre las mismas, es posible calcular la ecuación de una recta que se aproxime bastante a todos los elementos obtenidos.

En dos dimensiones, podremos considerar a esta recta por su ecuación explícita: y = m x + n, siendo “x” e “y” las componentes de los puntos contenidos en ella, “m” la pendiente, y “n” una constante.

Si “y” representa la variable “y” de la distribución, hablaremos de la recta de regresión de “y” sobre “x”. Si “y” representa la variable “x” de la distribución, hablaremos de la recta de regresión de “x” sobre “y”.

Nosotros veremos como ejemplo el primer caso, pero el otro sería idéntico.

La distancia sobre “y” de la recta “r” a un punto Pi(xi, yi) es:

  • ¬d(r,Pi) = (xi, m xi + n) – (xi, yi) = (0, m xi + n – yi).

Lo expresaremos siempre elevado al cuadrado para que sea positivo:

  • d = (m xi + n – yi)^2.

Así pues, la suma de todas las distancias es:

  • ¬dt = (0, ∑((m xi + n – yi)^2) desde “i = 1″ hasta “N”).

Como queremos que “dt” sea mínima, es decir, que la distancia total de los puntos a la recta sea lo más pequeña posible, recurrimos a la primera derivada.

Como es la derivada de un vector (tiene dos componentes), tenemos que aplicar la función gradiente para derivar, y consecuentemente el operador nabla “¬Å”, que como ya expliqué en su ocasión represento por este símbolo porque wordpress.com no dispone del de verdad.

  • ¬Å ¬dt = (2 ∑(m xi + n – yi) desde “i = 1″ hasta “N”, 2 ∑(xi (m xi + n – yi)) desde “i = 1″ hasta “N”).

El primer término es la derivada respecto a “n”, y el segundo es la derivada respecto a “m”.

Como ambas derivadas tienen que ser “0″ para que encontremos el mínimo, obtenemos:

  • 2 ∑(m xi + n – yi) desde “i = 1″ hasta “N” = 0.
  • 2 ∑(xi (m xi + n – yi)) desde “i = 1″ hasta “N” = 0.

equivalentes a:

  • ∑(yi) desde “i=1″ hasta “N” = n ∑(1) desde “i=1″ hasta “N” + m ∑(xi) desde “i=1″ hasta “N”.
  • ∑(yi) desde “i=1″ hasta “N” = n ∑(xi) desde “i=1″ hasta “N” + m ∑(xi^2) desde “i=1″ hasta “N”.

Operando, obtenemos que:

  • m = Cov(x,y) / s(x)^2.

Asimismo, como el punto P(x‾, y‾) va a ser el Centro de Gravedad del Ajuste, pues siempre será el punto de corte de las dos posibles  rectas de regresión, sabemos que, al ser una recta, se cumple:

  • y‾ = m x‾ + n, de donde: n = y‾ – m x‾.

puntos-planoRepresentación de Puntos en el Plano:

Consideremos un plano donde dibujamos dos líneas perpendiculares que denominamos “OX” y “OY”. Estas líneas se intersecan en un punto “O” que llamaremos el origen de coordenadas. El origen divide a los ejes en dos partes denominadas semiejes (semieje positivo y negativo). Cualquier punto del plano vendrá especificado por un par de números reales que denominaremos coordenadas del punto P = (px, py). Para obtener estas coordenadas trazamos una línea paralela al eje “Y” que pasa por “P”: el punto de corte de esta línea con el eje “X” se encuantra a una distancia “px” del origen. Análogamente, si trazamos una línea que pasa por “P” paralela al eje “X”, la distancia del punto de corte con el eje “Y” al origen “O” es “py”. A estas coordenadas se las denomina coordenadas cartesianas rectangulares.

A su vez, después de establecer los ejes coordenados podemos decir que el plano 2D está dividido en cuatro cuadrantes. En sentido contrario al avance de las agujas del reloj: I, II, III, IV. Los puntos que se encuentran en el eje “X” o eje de abscisas tienen coordenada “y = 0″. Los puntos que se encuentran en el eje “Y” o de ordenadas tienen coordenada “x = 0″. El origen de coordenadas será obviamente (0, 0).

En general denotaremos un punto en el plano mediante el par ordenado constituido por sus coordenadas (x, y). Abusando un poco del lenguaje podemos decir que que el plano donde se han introducido introducido las coordenadas cartesianas”x” e “y” es el plano “xy”. Se cumple que dado un par arbitrario de números reales “x” e “y” existe siempre un punto “P” en el plano “xy” cuya abscisa es igual a “x” y cuya ordenada es igual a “y”, que denotaremos por (x, y). Esta correspondencia es biunívoca. Definimos como los vectores unitarios coordenados ¬i y ¬j a aquéllos de longitud unidad orientados según los ejes coordenados.

  • ¬i = (1, 0).
  • ¬j = (0, 1).

Así pues:

  • x = ¬OP ¬i.
  • y = ¬OP ¬j.

escalarmente, y por último:

  • ¬OP = x ¬i + y ¬j.

Distancia entre dos puntos:

Sean dos puntos “P1″ y “P2″ en el plano “xy” de coordenadas (x1, y1) y (x2, y2), respectivamente. La distancia entre “P1″ y “P2″ en función de sus coordenadas es:

  • d^2 = (x1 – x2)^2 + (y1 – y2)^2.

, de donde se despeja fácilmente que:

  • d = [(x1 - x2)^2 + (y1 - y2)^2]^1/2 = d(P1, P2).

A esta distancia se le denomina también distancia euclídea en el plano, y cumple las siguientes propiedades:

  • d(P1, P2) ≥ 0.
  • Si d(P1, P2) = o, entonces P1 = P2.
  • d(P1, P2) = d(P2, P1).

Consideremos el lugar geométrico de los puntos “M” que distan una distancia “r” de un punto “P” de coordenadas (a, b). Tenemos:

  • d(M, P) = [(x - a)^2 + (y - b)^2]^1/2 = r.

, que se escribe como:

  • (x – a)^2 + (y – b)^2 = r^2.

Esta es la ecuación canónica de una circunferencia de radio “r”.

Veamos cómo dividir un segmento de acuerdo con una razón dada. Consideremos dos puntos M1(x1, y1) y M2(x2, y2), y el segmento que va de uno a otro. Trataremos de encontrar un punto intermedio “M” tal que para dos números reales cualesquiera “λ1″ y “λ2″ > 0 se cumpla que d(M1, M) / d(M2, M) = λ1 / λ2. Suponiendo que el segmento no es paralelo al eje “X”, por semejanza de triángulos tendremos:

  • d(M1, M) / d(M2, M) = |x1 – x| / |x2 – x| = λ1 / λ2.
  • d(M1, M) / d(M2, M) = |y1 – y| / |y2 – y| = λ1 / λ2.

De la primera ecuación tenemos:

  • x = (x1 λ2 + x2 λ1) / ( λ1 + λ2).

Análogamente, de la segunda:

  • y = (y1 λ2 + y2 λ1) / ( λ1 + λ2).

Coordenadas polares:

coordenadas-polaresSupongamos que tenemos definido en el plano l origen de coordenadas “O”, la unidad de escala de longitud y un eje ¬L que pasa por el punto “O”. Sea “M” un punto arbitrario del plano que no coincide con “O”. Determinaremos su posición en el plano unívocamente mediante dos números:

  • La distancia entre “M” y “O”, que denotaremos por “r”.
  • El ángulo “φ”, medido en el sentido contrario al avance de las agujas del reloj, entre el semieje positivo ¬L y la dirección ¬OM.

Al par ordenado de valores (r, φ) se le denomina coordenadas polares del punto “M”. “r” es el radio polar y “φ” es el ángulo polar. Es habitual llamar a “O” el polo y a “¬L” el eje polar. Con la definición anterior, para todo punto “M” del plano, excepto el punto “O”, tenemos “r > 0″ y “0 ≤ φ ≤ 2 π”. Al polo “O” se le asigna “r = 0″, mientras que el ángulo “φ” está indeterminado. Al sistema de coordenadas que acabamos de construir en el plano se le denomina sistema de coordenadas polares. Podemos relacionar el sistema de coordenadas cartesianas rectangulares con el de coordenadas polares:

  • El polo “O” es el origen de coordenadas (0, 0).
  • El eje orientado “X” es el eje polar. El eje “Y” forma un ángulo de “π / 2″ respecto al eje “X”. De este modo tenemos ¬L = ¬i.

Se llaman líneas coordenadas a aquéllas definidasmediante las condiciones:

  • r = cte.
  • φ = cte”.

En coordenadas polares, estas líneas corresponden a circunferencias centradas en el origen y a semirrectas que pasan por el origen, respectivamente. Los vectores unitarios coordenados son vectores unitarios perpendiculares a las líneas coordenadas de cada punto, y con el mismo sentido del crecimiento de dicha coordenada. Con esta definición, los vectores “¬er” y “¬eφ” son ortonormales y su dirección depende del punto del espacio que consideremos:

  • ¬er = Cosφ ¬i + Senφ ¬j.
  • ¬eφ = – Senφ ¬i + Cosφ ¬j.

La elección de un adecuado sistema de vectores unitarios tiene especial importancia en la expresión de los campos vecoriales. Interesa que las coordenadas curvilíneas elegidas se adecúen a la simetría que presente el campo. Consideremos por ejemplo una carga eléctrica “q” en el origen de coordenadas. El campo eléctrico generado tiene dirección radial y su módulo es:

  • |¬Eq| = (K q / r^2) ¬er.

, mientras que en coordenadas cartesianas (en 2D) tendríamos:

  • ¬Eq = (K q / (x^2 + y^2) ) ((x / [x^2 + y^2]^1/2) ¬i + (y / [x^2 + y^2]^1/2) ¬j) = (K q / [x^2 + y^2]^3/2) (x ¬i + y ¬j).

La relación entre coordenadas polares y cartesianas es:

  • r = [x^2 + y^2]^1/2.
  • Cosφ = x / [x^2 + y^2]^1/2.
  • Senφ = y / [x^2 + y^2]^1/2.

A su vez, podemos escribir:

  • x = r Cosφ.
  • y = r Senφ.

Ya vimos que la ecuación de la circunferencia de radio “r” centrada en el origen en coordenadas cartesianas es:

  • x^2 + y^2 = r^2.

, mientras que en coordenadas polares es simplemente:

  • r = cte.

La ecuación, en coordenadas cartesianas, de una circunferencia centrada en un punto (a, b) arbitrario y radio “R” es:

  • (x – a)^2 + (y – b)^2 = R^2.

Su expresion en coordenadas polares, siendo:

  • a = r0 Cosφ.
  • b = r0 Senφ.

, se expresa del siguiente modo:

  • 2 r r0 Cos(φ – φ0) = r^2 + r0^2 – R^2.

, y en caso de que la circunferencia pase por el eje de coordenadas (r0 = R), queda aún más simplificada:

  • r = 2 R Cos(φ – φ0).

Transformación de Coordenadas:

rototraslacionEn algunos casos puede resultar útil referir las coordenadas a sistemas de ejes a los originalmente planteados. Consideremos las siguientes transformaciones:

  • Traslaciones: tomamos un nuevo sistema de ejes coordenados cartesianos O’ X’ Y’ donde el origen de coordenadas O’ tiene coordenadas (x0, y0) referidas a los ejes coordenados O X Y. Obviamente se cumple que x’ = x – x0, y’ = y – y0. A esta transformación se la denomina traslación.
  • Rotaciones: tomamos un nuevo sistema de ejes cartesianos O’ X’ Y’ en el que los ejes X’ e Y’ se giran solidariamente un cierto ángulo “α” en sentido antihorario.

Veamos cuál es la relación entre las coordenadas X Y referidas al sistema inicial y las coordenadas X’ Y’ referidas al sistema girado. Obsérvese que la componente “x” del vextor unitario “¬i” viene dada por el producto escalar:

  • ¬i’ ¬i = Cosα.

, mientras que la componente “y” del vector viene dada por:

  • ¬i’ ¬j = Senα.

Tenemos entonces:

  • ¬i’ = Cosα ¬i + Senα ¬j.
  • ¬j’ = – Senα ¬i + Cosα ¬j.

Dado un punto “P” en el plano de coordenadas (x, y), escribimos:

  • ¬OP = x ¬i + y ¬j.

en el sistema de coordenadas sin transformar, mientras que en el transformado tenemos:

  • ¬OP = x’ ¬i’ + y’ ¬j’.

Sustituyendo con las anteriores igualdades:

  • ¬OP = (x’ Cosα – y’ Senα) ¬i + (x’ Senα + y’ Cosα) ¬j.

Pesto que éstas son las componentes respecto a la base de vectores coordenados “¬i” y “¬j” deducimos:

  • x = x’ Cosα – y’ Senα.
  • y = x’ Senα + y’ Cosα.

Con 0 ≤ α ≤ 2 π. Por otro lado, los vectores coordenados ¬i y ¬j en términos de los ¬i’ y ¬j’ vienen dados por:

  • ¬i = Cosα ¬i’ – Senα ¬j’.
  • ¬j = Senα ¬i’ + Senα ¬j’.

Como:

  • ¬OP = x ¬i + y ¬j = (x Cosα + y Senα) ¬i + (- x Senα + y Cosα) ¬j.

, deducimos que:

  • x’ = x Cosα – y Senα.
  • y’ = – x Senα + y Cosα.

Si realizamos una transformación de coordenadas donde se produce una traslación junto con una rotación de los ejes, obtenemos una forma general de las transformaciones de coordenadas en el plano. Para ver cuál es la relación entre las coordenadas referidas al sistema O’ X’ Y’ y las relaciones al sistema O X Y resulta útil construir un sistema auxiliar O’ X” Y” que tiene el mismo origen que el sistema O’ X’ Y’, pero con los ejes paralelos a los del sistema O X Y. Podemos entonces escribir:

  • x” = x’ Cosα – y’ Senα.
  • y” = x’ Senα + y’ Cosα.

y además:

  • x = x” + x0.
  • y = y” + y0.

siendo (x0, y0) las coordenadas de O’ en el sistema de referencia O X Y. De lo cual, en resumen, se deduce que:

  • x = x’ Cosα – y’ Senα + x0.
  • y = x’ Senα + y’ Cosα + y0.

Por otra parte, la relación entre las coordenadas referidas al sistema O’ X” Y” y las referidas al sistema O’ X’ Y’ es:

  • x’ = x” Cosα + y” Senα.
  • y’ = – x” Senα + y” Cosα.

también expresable como:

  • x’ = (x – x0) Cosα + (y – y0) Senα.
  • y’ = – (x – xo) Senα + (y – y0) Cosα.

Es posible demostrar que cualquier transformación de coordenadas X Y a X’ Y’ que deje invariante la distancia entre dos puntos P1(x1, y1) y P2(x2, y2), es decir: (x1 – x2)^2 + (y1 – y2)^2 = (x’1 – x’2)^2 + (y’1 – y’2)^2, descrita por las fórmulas de transformación anteriores salvo tal vez un signo:

  • x’ = (x – x0) Cosα + (y – y0) Senα.
  • y’ = +-[- (x - xo) Senα + (y - y0) Cosα].

El signo menos que aparece en la última fórmula se debe a una reflexión a lo largo de una línea que pasa por el origen de coordenadas.

Reflexión Especular:

Consideremos un sistema de coordenadas O X’ Y’ en el que se cumple que los ejes de abscisas coinciden (O X = O X’) y que el eje de coordenas transformado O Y’ tiene orientación opuesta al O Y. Para un punto “M” arbitrario la relación entre las coordenadas nuevas y las viejas será entonces:

  • x = x’.
  • y = – y’.

Esto es una reflexión especular respecto al eje O X.

De modo análogo podemos hacer una reflexión especular respecto al eje O Y. Se puede demostrar que cualquier transformación de las coordenadas cartesianas rectangulares que conserve la distancia se puede descomponer en una traslación, giro y reflexión especular.

Curvas en el Plano:

Consideremos una curva en el plano X Y tal como indica la figura. La ecuación dada por:

  • f(x, y) = 0.

se llama ecuación implícita de la curva. Los puntos del plano cuyas coordenadas (x, y) cumplen:

  • f(x, y) = 0.

se dice que son puntos de la curva. En esencia, la geometría analítica aborda el problema de las curvas en el plano desde las dos perspectivas:

  • Encontrar la ecuación de una curva dadas sis propiedades geométricas.
  • Encontrar las propiedades geométricas de una curva dada su ecuación.

Ecuaciones Paramétricas de una Curva:

Supongamos un punto “P” sobre una cierta curva y que para cada valor del parámetro “t” las coordenadas del punto son:

  • x = f(t).
  • y = g(t).

Estas son las llamadas ecuaciones paramétricas de la curva en función del parámetro “t”. En el caso de una partícula que se mueva por el espacio físico que se mueva por el espacio describiendo la curva, este parámetro podría ser por ejemplo el tiempo.

Supongamos un círculo con centro en el origen y radio “R”. Podemos escribir:

  • x = R Cosα.
  • y = R Senα.

, con 0 ≤ α ≤ 2 π. En este caso el parámetro de la curva es el ángulo “α”. A partir de las ecuaciones paramétricas podemos obtener la ecuación en forma implícita despejando el parámetro:

  • x^2 + y^2 = R^2 Cosα^2 + R^2 Senα^2 = R^2.

Consideremos las ecuaciones paramétricas siguientes:

  • x = a Cost.
  • y = b Sent.
  • 0 ≤ t ≤ 2 π.

Para eliminar el parámetro “t” dividimos “x” por “a” e “y” por “b”, de modo que:

  • x^2 / a^2 + y^2 / b^2 = 1.

Tenemos así la forma implícita de la ecuación de la curva, en este caso una elipse.

Conviene señalar que, en general, el conjunto de puntos que satisfacen las ecuaciones paramétricas no coincide con el conjunto de puntos que satisfacen la ecuación de la curva en su forma implícita. Consideremos el siguiente ejemplo:

  • x = a Cosht.
  • y = b Senht.
  • Cosht = (e^x + e^-x) / 2.
  • Senht = (e^x – e^-x) / 2.

Se cumple que:

  • Cosht^2 – Senht^2 = 1.

, y por tanto la ecuación implícita de la curva es:

  • x^2 / a^2 – y^2 / b^2 = 1.

Se trata de una hipérbola. En esta ecuación el punto (-a, 0) es solución, pero no satisface las ecuaciones paramétricas originales.

Rectas en el Plano:

rectasSea ¬P un punto del plano R^2 y ¬u un vector no nulo de R^2 (vector director). Se llama recta que pasa por ¬P y tiene la dirección ¬u al conjunto formado por los puntos ¬r de R^2 tales que:

  • ¬r = ¬P + λ ¬u.

, para cualquier valor de “λ”.

Esta se denomina ecuación vectorial de la recta. Dos rectas definidas por:

  • ¬r = ¬P + λ ¬u.
  • ¬s = ¬Q + λ ¬v.

serán la misma si y solo si los vectores “¬P – ¬Q”, “¬u” y “¬v” son vectores proporcionales.

Se llama segmento que tiene por origen y extremo los puntos “¬P” y “¬Q” al conjunto de puntos de valores “¬xi” tales que:

  • ¬xi = ¬P + λ (¬Q – ¬P).

, siempre que 0 ≤ λ ≤ 1.

Si escribimos la ecuación vectorial usando coordenadas o componentes tendremos:

  • x = px + λ ux, y = py + λ uy.

Éstas últimas se conocen como ecuaciones paramétricas de la recta en R^2.

Si despejamos “λ” obtendremos:

  • (x – px) / ux = (y – py) / uy.

A ésta se la denomina ecuación continua o canónica de la recta.

Obtengamos ahora la ecuación de la recta que pasa por los puntos ¬P(px, py) y Q(qx, qy). Las paramétricas:

  • x = λ (qx – px) + px.
  • y = λ (qy – py) + py.

La continua:

  • (x – px) / (qx – px) = (y – py) / (qy – py).

Consideremos una línea recta que pasa por el punto A0(x0, y0), y sea ¬n = (a, b) un vector normal a la recta. Cualquier otro punto “P” que pertenece a la recta cumple que el vector “¬P – ¬A0″ es perpendicular a “¬n”, y por lo tanto el producto escalar de ambos vectores debe ser nulo, surgiendo así la ecuación euclídea:

  • ¬n (¬P – ¬A0) = 0.

Sustituyendo llegamos inmediatamente a la ecuación normal:

  • a x + b y + (- a x0 – b y0) = 0.

Los coeficientes que acompañan a “x” e “y” tienen la interpretación de ser los coeficientes de un vector normal a la recta.

En muchos casos es común usar como vector normal a la recta un vector unitario. Supongamos que la normal a la recta forma un ángulo “α” con el eje “X”, entonces:

  • ¬n = (Cosα, Senα).

Por otra parte observemos que si ¬n es unitario, entonces:

  • a x0 + b y0 = p.

es la proyección del vector de posición (x0, y0) en la dirección normal a la recta. Esta proyección es constante para todos los puntos de la recta, según se manifiesta en la ecuación. Esa ecuación la podemos escribir ahora como:

  • Cosα x + Senα y = p.

, y además |p| representa la distancia al origen.

Ya hemos demostrado que dada una recta, y mediante su normal, podemos siempre escribir una ecuación de la forma:

  • a x + b y + c = 0.

Veamos el recíproco, es decir, cualquier ecuación de esta forma es la ecuación de una recta en el plano. Supongamos que (x0, y0) es una solución para la ecuación anterior (un punto de la recta), entonces:

  • a x0 + b y0 + c = 0.

, y por tanto:

  • c = – a x0 – b y0.

Por ello podemos escribir:

  • ax + b y – a x0 – b y0 = 0.

, de donde:

  • (x – x0) / b = (y – y0) /- a.

, que es la ecuación de una recta que pasa por el punto (x0, y0) y con normal (a, b). Por lo tanto, la ecuación general de una recta en el plano es:

  • a x + b y + c = 0.

Siendo el vector (a, b) perpendicular a dicha recta.

Posición Relativa a los Ejes Coordenados:

Supongamos una recta en el plano R^2 dada por la ecuación:

  • a x + b y + c = 0.

Tenemos:

  • Si a = 0, entonces y = – c / b. Es una línea horizontal paralela al eje “X”.
  • Si b = 0, entonces x = – c / a. Es una línea vertical paralela al eje “Y”.
  • Si c = 0 entonces ax + by = 0. Es una línea que pasa por el origen de coordenadas.

Si en la ecuación general b ≠ 0, entonces se puede escribir:

  • y = – a x / b – c / b.

, o bien:

  • y = k x + q con k = – a / b, q = – c / b.

Considerando dos puntos de la recta (x1, x2), (x2, y2):

  • y1 = k x1  + q.
  • y2 = k x2 + q.

podremos despejar “k” como:

  • k = (y2 – y1) / (x2 – x1).

, y:

  • k = Tgα.

, salvo tal vez un signo de reflexión especular.

Posición Relativa entre Dos Rectas:

Consideremos dos rectas en el plano dadas las ecuaciones:

  • a1 x + b1 y + c1 = 0.
  • a2 x + b2 y + c2 = 0.

Veamos si las rectas son paralelas o se cortan. Como ya sabemos, los coeficientes de “x” e “y” son los componentes de un vector perpendicular a la recta.

Por tanto el paralelismo entre dos rectas significa que los vectores (a1, b1) y (a2, b2) tienen la misma dirección, lo cual a su vez implica que los vectores (a1, b1) y (b2, – a2) son perpendiculares, con lo cual, por un producto escalar:

  • a1 b2 – b1 a2 = 0.

, de donde:

  • a1 / a2 = b1 / b2.

, y pendientes iguales implican paralelismo. La condición de paralelismo significa que no hay solución común a ambas ecuaciones.Si ademas obtenemos que:

  • a1 / a2 = b1 / b2 = c1 / c2.

, entonces las dos rectas son la misma, y aparecen infinitas soluciones.

Si por el contrario tenemos:

  • a1 / a2 ≠ b1 / b2.

, entonces el sistema de ecuaciones tiene solución única y las rectas son secantes. Para que dos rectas sean perpendiculares sus vectores han de ser perpendiculares:

  • a1 a2 + b1 b2 = 0.

, o bien:

  • a1 / b1 = – b2 / a2.

Ángulo entre Dos Rectas:

Consideremos dos rectas “r” y “s” del plano euclídeo dadas por las ecuaciones:

  • r→a1 x + b1 y + c1 = 0.
  • s→a2 x + b2 y + c2 = 0.

Los vectores normales a esas rectas son:

  • ¬n1(a1, b1).
  • ¬n2(a2, b2).

, respectivamente. El coseno del ángulo entre las dos rectas viene dado por:

  • Cosφ = |Cos(¬n1, ¬n2)| = (|¬n1 ¬n2|) / (||¬n1|| ||¬n2||).

, para 0 ≤ φ ≤ 2 π.

Consideremos, por ejemplo, dos rectas escritas en la forma:

  • y = m x + h.
  • y = m’ x + h’.

Sus vectores normales son ¬n1(m, -1) y ¬n2(m’, -1). Por prodcto escalar:

  • Cosφ = |(m m’ + 1) / ([1 + m^2]^1/2 [1 + m'^2]^1/2)|.

, y por comodidad:

  • Tgφ = [1 - Cosφ^2] / Cosφ = |m m’| / |1 + m m’|.

Distancia de un Punto a una Recta:

Sea un punto P(xp, yp) del plano y una recta “r” dada por la acuación normal:

  • a1 x + b1 y + c1 = 0.

La distancia del punto “P” a la recta es la menor de las distancias de “P” a cualquiera de los puntos de la recta. Sea “¬r” el vector de posición de cualquier punto de la recta y “¬p” el vector de posición del punto (px, py), entonces la distancia “d” que buscamos es la proyección del vector “¬r – ¬p” sobre la dirección perpendicular a la recta:

  • d = |(¬r – ¬p) ¬n| / ||¬n||.

Calculando:

  • (¬r – ¬p) ¬n = x a1 + y b1 – a1 xp – b1 yp.

Como el punto (x, y) pertenece a la recta se cumplirá que:

  • x a1 + y b1 = – c1.

, y por lo tanto:

  • |(¬r – ¬p) ¬n| = |a1 xp + b1 yp + c1|.

, y la distancia del punto a la recta vendrá dada por:

  • d(P, r) = |a1 xp + b1 yp + c1| / [a1^2 + b1^2]^1/2.

Haces de rectas:

Consideremos dos líneas rectas “r” y “s” distintas dadas por las ecuaciones:

  • a1 x + b1 y + c1 = 0.
  • a2 x + b2 y + c2 = 0.

Definimos haz de rectas determinado por “r” y “s” como el conjunto de puntos de R^2 que satisfacen la composición lineal de las ecuaciones de las rectas:

  • α (a1 x + b1 y + c1) + β (a2 x + b2 y + c2) = 0.

, siendo “α” y “β” no nulos. El haz de rectas que determina “r” y “s” es un conjunto de rectas parametrizadas por los números reales “α” y “β”. Si “r” y “s” se cortan en un punto el haz lo forman todas las rectas que pasan por ese punto, mientras que si “r” y “s” son paralelas el haz lo forman todas las rectas paralelas a “r” y “s”.

.-Consideremos que las rectas “r” y “s” se cortan en un punto P(x0, y0), entonces se cumple que:

  • a1 x0 + b1 y0 + c1 = 0.
  • a2 x0 + b2 y0 + c2 = 0.

Y todas las rectas del haz pasan por (x0, y0) porque verifican la ecuación:

  • α (a1 x0 + b1 y0 + c1) + β (a2 x0 + b2 y0 + c2) = 0.

Por otro lado, cualquier recta que pase por el punto (x0, y0) pertenece también al haz. En efecto, dado cualquier punto del plano (x, y) distinto de (x0, y0), podemos hacer que satisfaga la ecuación sin más que tomar los siguientes “α” y “β”:

  • α = a2 x + b2 y + c2.
  • β = – (a1 x + b1 y + c1).

Tenemos entonces que cualquier punto del plano perteneciente al haz de rectas y que todas las rectas del haz pasan por el punto (x0, y0). Como por dos puntos del plano solo pasa una recta, concluimos que toda recta que pase por (x0, y0) pertenece al haz.

.-Si las rectas “r” y “s” son paralelas pero no coincidentes se verifica el siguiente sistema:

  • a1 / a2 = b1 / b2 = 1 /γ.

, y se cumplirá entonces que el haz será:

  • (α + β γ) a1 x + (α + β γ) b1 y + α c1 + β c2 = 0.

, que es una recta paralela a “r” y a “s”. Como vimos antes, por todo punto del plano pasa una recta del haz, por tanto el haz está formado en este caso por todas las rectas paralelas a “r” y a “s”.

Curvas de segundo orden en el plano. Cónicas:

conicasComenzaremos con una introducción particular a cada una de las tres cónicas. Posteriormente daremos una definición general de las cónicas y demostraremos sus propiedades. Luego expresaremos sus ecuaciones en coordenadas polares y, para terminar, haremos un estudio general de las curvas de segundo orden en el plano.

Consideremos un punto “P” en el espacio tridimensional R^3, situado en la perpendicular al centro de una circunferencia en un plano “σ”. Tracemos todas las rectas que pasan por “P” y algún punto de la circunferencia, así obtenemos un cono con vértice “P” y semiángulo “α”.

.-Si intersecamos al cono con un plano perpendicular a su eje de simetría obtendremos una circunferencia.

.-Si intersecamos al cono con un plano inclinado que forma un ángulo mayor que “α” con su eje de simetría obtendremos una elipse.

.-Si lo intersecamos con un plano paralelo a una de sus generatrices obtendremos una parábola.

.-Si lo intersecamos con un plano que forma un ángulo menor que “α” con su eje de simetría obtendremos una hipérbola con dos ramas.

Hay muchos fenómenos naturales que conducen a secciones cónicas. La trayectoria de cuerpos en campos gravitatorios es un ejemplo. La trayectoria del extremo de una sombra de un palo sobre una superficie plana a lo largo de un día es también una sección cónica. Demostraremos  más adelante un teorema sobre las secciones cónicas y sus propiedades. Por ahora estudiaremos la elipse, la hipérbola y la parábola por separado.

La Elipse:

elipseSe llama elipse, que tiene por focos los puntos “F” y “F’” situados a distancia “2 c”, y cuya constante es “2 a”, siendo “a > c > 0, al lugar geométrico de los puntos “Pi” pertenecientes a R^2 tales que la suma de las distancias de “P” a los focos es la constante “2 a”:

  • d(F, P) + d(P, F’) = 2 a.

Se llaman ejes de la elipse (por sus ejes de simetría) a la recta F F’ (eje focal o mayor) y a su mediatriz (eje secundario o menor). La intersección de los dos ejes de la elipse es el punto “O”, centro de simetría. Los puntos de la elipse que se encuentran en sus ejes se llaman vértices (A y A’ en el eje mayor y B y B’ en el eje menor). Se verifica que:

  • d(O, A) = d(O, A’) = a.
  • d(F, B) = d(F, B’) = d(F’, B) = d(F’, B’) = a.
  • d(O, B) = d(O, B’) = b, siendo “b” tal que a^2 = b^2 + c^2.

Veamos ahora cuál es la ecuación de la elipse en coordenadas rectangulares suponiendo que su centro coincide con el origen de coordenadas y que sus ejes de simetria coinciden con los ejes de coordenadas. Tenemos:

  • F = (c, 0).
  • F’ = (-c, 0).
  • d(P, F) = [(x - c)^2 + y^2]^1/2.
  • d(P, F’) = [(x + c)^2 + y^2]^1/2.

La condición de la elipse será que la suma de las distancias de “P” a cada uno de los focos sean igual a “2 a”:

  • [(x - c)^2 + y^2]^1/2 + [(x + c)^2 + y^2]^1/2 = 2 a.

, que simplificado queda:

  • x^2 / a^2 + y^2 / b^2 = 1.

, que es la ecuación canónica o reducida de la elipse.

La elipse puede considerarse como una generalización de la circunferencia, pues si “a” = “b” la elipse se convierte en una circunferencia de radio “a”.

Propiedades de la Elipse:

  • La elipse de semiejes “a” y “b” está contenida en el rectángulo |x| < a, |y| < b. Es fácil demostrarlo ya que como x^2 / a^2 + y^2 / b^2 = 1, se tienen que cumplir: “x^2 / a^2 < 1″, y “y^2 / b^2 < 1″.
  • Los puntos (+- a, 0) y (0, +- b) son los vértices de la elipse.
  • Los ejes “OX” y “Y” son ejes de simetría de la elipse. Si (x0, y0) es un punto de la elipse, entonces (- x0, y0), (x0, – y0) y (- x0, – y0) son también puntos de la elipse.
  • Los puntos (c, 0) y (- c , 0) son los focos de la elipse, y “2 c” es la distancia focal. El parámetro “e = c / a” se denomina excentricidad de la elipse, y verifica 0 < e < 1 (porque a^2 = b^2 + c^2 → a > c). Para una circunferencia tenemos “a = b” y “e = c = 0″.

Rectas Directrices y Redefinición de la Elipse:

Las rectas dadas por:

  • δ1: x + a / e = 0.
  • δ2: x – a / e = 0.

se conocen como rectas directrices de la elipse (izquierda y derecha, respectivamente). Con su ayuda podemos definir la elipse como el lugar geométrico de los puntos del plano que verifican que la razón de la distancia a un foco y a la recta directriz correspondiente es igual a la excentricidad de la elipse:

  • d(P, F) / d(P, δ) = e.

La recta directriz derecha es:

  • δ2: e x – a = 0.

La distancia de un punto “P” de la elipse a esta recta es:

  • d(P, δ) = (a – e x) / e.

, cumpliéndose “a > e x”. La distancia de un punto de la elipse al foco derecho es:

  • d(P, F) = [(x - c)^2 + y^2]^1/2.

Como (x, y) está en la elipse siempre que:

  • x^2 / a^2 + y^2 / b^2 = 1.

, se cumple:

  • y = b^2 (1 – x^2 / a^2).

Sustituyendo:

  • d(P, F) = a – e x.

Vemos entonces que se obtiene:

  • d(P, F) / d(P, δ) = e.

Ecuaciones Paramétricas:

  • x = a Cosσ.
  • y = b Senσ.
  • 0 ≤ σ ≤ 2 π.

En la elipse se puede inscribir una circunferencia con centro (0, 0) y radio “r = b”. A su vez, la elipse está inscrita en una circunferencia con centro en (0, 0) y radio “r = a”.

La Hipérbola:

hiperbolaLlamaremos hipérbola, que tiene por focos los puntos “F” y “F’” situados a una distancia “2 c”, y cuya constante es “2 a”, siendo 0 < a < c, al lugar geométrico de los puntos de R^2 tales que la diferencia de sus distancias a los focos es “2 a”.

Se llama eje focal o real a la recta “F F’”, y eje secundario o imaginario a su mediatriz. Su punto de intersección, O = (0, 0), es el centro de simetría.

El eje “F F’” corta a la hipérbola en dos puntos “A” y “A’”, que se llaman vértices, de modo que:

  • OA = OA’ = a.

El eje imaginario no corta a la hipérbola, que tiene dos ramas, una a cada lado de este eje. A los puntos B(0, b) y B’(0, – b), con el parámetro “b” verificando la relación:

  • a^2 + b^2 = c^2.

, se les conoce como extremos del eje imaginario.

Si se cumple que “a = b”, entonces la hipérbola se dice equilátera.

Veamos ahora la ecuación de la hipérbola a partir de la relación dada. Sus focos son F(c, 0) y F’(- c, 0), por lo tanto tenemos, restando las distancias:

  • |[(x - c)^2 + y^2]^1/2 – [(x+c)^2 + y^2]^1/2| = 2 a.

Elevando al cuadrado y operando obtenemos:

  • x^2 / a^2 – y^2 / b^2 = 1.

Propiedades:

  • La hipérbola se haya fuera de la franja |x| < a. En efecto, basta ver que x^2 / a^2 = 1 + y^2 / b^2 ≥ 1, por lo tanto |x| ≥ a. Los puntos (+- a, 0) son los vértices de la hipérbola.
  • Está contenida en la región comprendida entre las rectas y = +- b x / a, que contiene el eje “OX”. Para comprobarlo basta con tomar la desigualdad x^2 / a^2 > y^2 / b^2, con lo cual |x| / a > |y| / b. Entonces |y| < b |x| / a. La hipérbola se halla contenida por tanto en dos regiones, una contiene la rama derecha y la otra a la izquierda.
  • Se cumple que cuando hacemos tender x^2 + y^2 → ∞, la distancia entre los puntos de la hipérbola a una de las rectas +- b x / a tiende a “0″. Estas rectas se denominan asíntotas de la hipérbola. Para verlo, tomemos, por ejemplo, la asíntota y = b x / a. Un punto de la hipérbola tendrá coordenadas P(x, (b / a) [x^2 - a^2]^1/2. La ecuación de la recta se podrá escribir como b x – a y = 0, y la distancia del punto “P” a la recta es: d(P, r) = b |x – [x^2 - a^2]^1/2| / [a^2 + b^2]^1/2. Queremos estudiar el comportamiento de esta expresión cuando x → ∞. Multiplicando numerador y denominador por “x + [x^2 - a^2]^1/2 tenemos: d(P, r) = a^2 b / ([a^2 + b^2]^1/2 (x + [x^2 - a^2]^1/2)). Vemos que d(P, r) → 0.

Otra Definición de la Hipérbola:

Denominamos excentricidad de la hipérbola al parámetro:

  • e = c / a.

Se cumple que e > 1. Las rectas:

  • x = – a / e.
  • x = a / e.

se denominan rectas directrices de la hipérbola. Podemos definir entonces la hipérbola como el conjunto de puntos del plano para los que la razón entre la distancia al foco y a la recta directriz correspondiente es igual a la excentricidad. Igual que con la elipse:

  • d(P, F) / d(P, δ) = e.

Tomemos la recta:

  • e x – a = 0.

Entonces:

  • d(P, δ) = (e x – a) / e.

, y por otra parte:

  • d(P, F) = e x – a.

Por lo tanto vemos que se cumple la definición.

Ecuaciones Paramétricas:

Las ecuaciones paramétricas de una hipérbola de semiejes “a” y “b” son:

  • +- x = a Cosht.
  • y = a Senht.
  • - ∞ < t < ∞.

El doble signo da lugar a las dos ramas de la hipérbola.

Hipérbola Conjugada:

Dada la hipérbola de ecuación:

  • x^2 / a^2 – y^2 / b^2 = 1.

, se denomina hipérbola conjugada a aquella que tiene como ecuación:

  • x^2 / a^2 – y^2 / b^2 = – 1.

Comparte las mismas asíntotas que la hipérbola original.

La Parábola:

parabolaLlamamos parábola en el plano euclídeo, que tiene por foco el punto “F” y por directriz la recta “δ” situada a una distancia “p > 0″ del foco “F”, al lugar geométrico de los puntos que equidistan de “F” y “δ”.

Llamamos eje de simetría de la parábola al eje perpendicular a la recta “δ” que pasa por el foco “F”. El eje corta a la parábola en un punto “O”, que se llama vértice. La parábola no tiene centro, y es una curva no acotada que carece de asíntotas.

Un punto pertenecerá a la parábola si verifica que:

  • [(x - p / 2)^2 + y^2]^1/2 = |x + p / 2|.

Con lo cual:

  • y^2 = 2 p x.

La Parábola como Límite de la Elipse:

Consideremos la siguiente elipse:

  • x^2 / a^2 + y^2 / b^2 = 1.

Hacemos el cambio de coordenadas:

  • x’ = x + a.
  • y’ = y.

, es decir:

  • x = x’ – a.
  • y = y’.

La ecuación de la elipse en las nuevas coordenadas es:

  • y’^2 = 2 b^2 x’ / a – b^2 x’^2 / a^2.

Hagamos ahora tender a → ∞ manteniendo el foco “F” en su posición fija. Las coordenadas del foco son F(s, 0), con:

  • s = cte.
  • s = a – c.

, de donde:

  • c = a – s.

Teniendo en cuenta la relación entre los parámetros “a”, “b” y “c” de la elipse:

  • b^2 / a^2 = 2 s / a – s^2 / a^2.

Vemos que siempre que a → ∞ se cumple:

  • b^2 / a → 2 s

y que:

  • b^2 / a^2 → 0.

Por lo tanto la ecuación de la elipse se convierte en:

  • y’^2 = 4 s x’.

, que es la ecuación de una parábola con parámetro:

  • p = 2 s.

Análogamente se puede demostrar que si en una hipérbola mantenemos un foco fijo y hacemos tender a → ∞ obtenemos una parábola.

La definición de la parábola por medio de su directriz es:

  • d(P, F) / d(P, δ) = e.

La parábola es una cónica con excentricidad:

  • e= 1.

Tangente a las Cónicas:

Consideremos una cruva expresada mediante la ecuación:

  • y = f(x).

Sea A(x0, y0) un punto fijo de la curva y consideremos B(x1, y1) otro punto cualquiera de la curva. La ecuación secante estará expresada mediante:

  • y – y0 = (Δy / Δx) (x – x0).
  • Δy = y1 – y0.
  • Δx = x1 – x0.

Cuando hacemos tender B → A, la recta secante tiende a ser la recta tangente a la curva en el punto “A”, y además: Δy / Δx = f’(x0). Por lo tanto la ecuación de la recta tangente a la curva se puede escribir simplemente como:

  • y – y0 = f’(x0) (x – x0).

A veces la curva tiene una expresión analítica más sencilla cuando expresamos:

  • x = g(y).

En este caso podemos escribir la ecuación de la recta tangente como:

  • x – x0 = g’(y0) (y – y0).

Consideremos ahora una elipse, una hipérbola y una parábola, cuyas ecuaciones reducidas son:

  • x^2 / a^2 + y^2 / b^2 = 1.
  • x^2 / a^2 – y^2 / b^2 = 1.
  • y^2 = 2 p x.

Se puede demostrar que en cualquiera de sus puntos (x0, y0) cada una de estas cónicas tiene como tangente la recta dada por las ecuaciones siguientes, respectivamente:

  • x x0 / a^2 + y y0 / b^2 = 1.
  • x x0 / a^2 – y y0 / b^2 = 1.
  • y y0 = p (x0 + x).

Propiedad Óptica de la Parábola:

Una de las propiedades ópticas más conocidas de la parábola es que si ésta actúa como una superficie reflectante cualquier rayo de luz que incida sobre ella según una dirección paralela a su eje se refleja pasando por su foco. En efecto, acabamos de ver que la recta tangente que pasa por (x0, y0) es:

  • p x – y0 y + p x0 = 0.

Sea “β” el ángulo que la normal a esta recta forma con la dirección horizontal, y sea “α” el ángulo que forma con el vector que une (x0, y0) y el foco “F”. Matemáticamente se calcula por trigonometría que:

  • α = β.

Foco, Directriz y Excentricidad:

Dados en el plano un foco “F”, una recta directriz “δ” que no pasa por “F”, y un número no negativo “e” llamado excentricidad, se verifica que el lugar geométrico de los puntos “P” tales que sus distancias a “F” y a “δ” se mantienen en relación constante e igual a “e” forman una cónica. Concretamente:

  • Si e < 1 obtenemos una elipse.
  • Si e = 1 obtenemos una parábola.
  • Si e > 1 obtenemos una hipérbola.

Cónicas Equivalentes:

Hasta el momento hemos estudiado las tres cónicas fundamentales a partir de sus ecuaciones reducidas. Estas ecuaciones son de segundo grado en coordenadas “x” e “y”. Si cambiamos el origen de coordenadas o rotamos los ejes, las ecuaciones reducidas de las cónicas se transforman en general en ecuaciones de segundo grado, por lo que se les suelen expresar de un modo general como:

  • a11 x^2 + a12 x y + a22 y^2 + 2 b1 x + 2 b2 y + c = 0.

Obviamente, si multiplicamos esta ecuación por una constante “ρ”, la nueva ecuación: ρ(a11 x^2 + a12 x y + a22 y^2 + 2 b1 x + 2 b2 y + c) = 0 representa la misma cónica que la anterior, ya que ambas ecuaciones tienen el mismo conjunto de soluciones.

Dado que de la mayoría de los temas que me han presentado hoy ya han aparecido por este blog, voy a pasar de los repetidos y centrarme en las cosas nuevas de la conferencia de astronomía de hoy.

Tras una presentación sobre la historia de la mecánica celeste, de la cual ya hablé en el enlace de arriba, los datos nuevos e interesantes que tengo que añadir son el modelo cosmológico de Tycho Brahe y las elementos keplerianos para determinar la órbita seguida por un astro, que son perfectamente calculables a partir tan solo de tres observaciones del mismo (aplicando después las leyes de geometría elemental, Kepler y Newton).

braheEl modelo de Brahe, que debemos ubicar entre el de Copérnico y el de Kepler (fue tutor del segundo) tenía la pecualiaridad de seguir siendo Geocéntrico, pese a las anteriores aportaciones de Copérnico. Según Brahe, La Tierra era el centro del Universo, y en torno a ella giraban la Luna y el Sol, girando todos los demás planetas en torno al Sol, con órbitas lo suficientemente grandes o pequeñas como para no chocar nunca con La Tierra. Este modelo, pese a lo rebuscado que pueda parecer, tenía bastante lógica, pues respetaba el Geocéntrico y además concordaba con las observaciones del movimiento de los otros planetas en el firmamento. Sin embargo, tal vez hubiese sido demasiado evidente que si La Tierra también es un planeta debería de girar también en torno al Sol.

Una vez estuvo instaurado el modelo Heliocéntrico y las mencionadas leyes de Kepler y Newton, llegaron los elementos keplerianos de las órbitas, llamados asi en honor a Kepler.

Para comprenderlos mejor, primero asegurémonos de que sabemos bien lo que es una elipse tanto teórica como matemáticamente, y para ello partiremos del círculo.

circuloEl círculo tiene infinitos ejes de simetría, como todos sabemos, y es por eso que siempre podremos escoger dos de estos ejes que sean perpendiculares para considerarlos nuestros ejes de coordenadas en 2D. Respecto a estos ejes aparecen cuatro fragmentos de círculo que tendrán la misma forma, y por tanto la misma superficie. Dado que si tomamos dos ejes y analizamos el fragmento del eje “x>0″ y del “eje y>0″ observaremos que la longitud de ambos semiejes es el radio del círculo, y que a medida que avanzamos en uno decrecemos la componente en el otro. Es decir, tienen una relación inversa, que se expresa mediante la siguiente suma:

  • x^2 + y^2 = r^2.

El cuadrado del radio del círculo será siempre igual a la suma de los cuadrados de las componentes del punto referentes a nuestro sistema. Así pues, si avanzamos “r” en el eje “x”, observamos que “y” tiene que valer “0″, como efectivamente hace.

elipseAhora bien, en la elipse ambos ejes se pueden prolongar, y no necesariamesme en la misma proporción, lo que acaba con la simetría infinita y nuestros ejes serán ya los únicos ejes de simetría. Al más grande lo denominamos eje mayor, y al más pequeño lo denominamos eje menor. Si “a” y “b” son los incrementos observados en dichos ejes, la nueva ecuación será:

  • a x^2 + b y^2 = r^2.

, donde “r” pasa a ser una simple constante, pues al no ser circular ya no podemos hablar de radio. El punto donde se cortan los dos ejes sigue siendo el centro de la elipse, y si analizamos los ejes desde el obtenemos dos semiejes mayores y dos semiejes menores tras dividir los grandes a la mitad en este punto. Si desde cada uno de los extremos del eje menor tomamos la distancia de uno de los semiejes mayores y la llevamos sobre ambos formando un triángulo, obtenemos dos puntos sobre el eje mayor llamados focos, que por construcción cumplen la propiedad de que si a cualquier punto en la elipse se le calculan las distancias a ambos los focos y se suman, el resultado es la longitud del eje mayor.

En conclusión, podemos construir cualquier elipse conociendo al menos dos de los elementos anteriores, pues solo hemos necesitado dos datos (los ejes) para construirla entera. Sabiendo estos detalles, ya podemos comprender mejor los elementos keplerianos.

Supongamos que nosotros, desde La Tierra, queremos calcular la elipse de traslación de otro astro en el cielo, conociendo la posición del astro en torno al cual gira. Para mayor comodidad supondremos que estamos calculando la elipse de Marte en torno al Sol.

keplerianosEl primer dato necesario será la Longitud del Nodo Ascendente. Imaginemonos La Tierra rotando en torno al Sol sobre una elipse contenida en un plano (como siempre), donde el Sol es uno de los focos. Al estar el Sol en un foco, asumimos que si trazamos una paralela al eje menor sobre él cortaremos a la elipse en dos secciones, siendo una mucho mayor que la otra. En lo referente a los puntos de corte, uno será el que lleve a La Tierra a la parte grande de la elipse, y el otro el que la lleve a la parte pequeña (teniendo en cuenta su sentido de traslación). El punto que la lleva a la parte grande podemos definirlo como el Nodo Ascendente o Punto de Aries, y al otro el Nodo Desdendente o Punto de Libra. Recordemos el símbolo “γ” como el Punto de Aries de de La Tierra. Consideremos ahora el plano de traslación de Marte “p1″, dentro del cual también podremos calcular el Punto de Aries marciano, al que denominaremos “Ω”. Si ahora consideramos los puntos del Sol, “γ”, “Ω”, sabiendo que son tres determinan un plano, al que llamaremos plano “p2″. Dentro de este plano, si desde el Sol trazamos dos vectores, uno que lo una con “γ”, y otro que lo una con “Ω”, el menor ángulo que formen los vectores será conocido como el ángulo “Ω” también, y será nuestro medio de trasladar cuentas desde “γ” en nuestra órbita hasta “Ψ” en la órbita de Marte, medida en radianes. La Longitud del Nodo Ascendente será la distancia del Sol al punto “Ω”.

El segundo elemento, la Inclinación, no es más que el menor de los ángulos de intersección del plano “p1″ de Marte con el plano “p2″ antes mencionado.

Si consideramos el vector que une el Sol con el Perihelio de Marte (punto más próximo al Sol en órbita) y trazamos su ángulo desde el vector que unía al Sol con el Punto de Aries “Ω”, siguiendo el sentido de la ruta del planeta, obtenemos el ángulo “ω”, que será nuestro tercer elemento, el Argumento del Perihelio.

Dado que la órbita marciana, como todas, será una elipse, otro elemento será evidentemente el Semieje Mayor, aunque el eje mayor entero, por motivos más que evidentes, también valdrá.

El quinto elemento, la Excentricidad, mide el grado de desnivel entre los ejes de la elipse. Si retomamos la ecuación de la elipse mencionada anteriormente:

  • a x^2 + b y^2 = r^2.

, el Excentricidad mediría la relación entre los coeficientes “a” y “b”.

Por último, la Anomalía Media de la Época es la que hace referencia a la dinámica del planeta: grados recorridos en torno al Sol, arco desplazado…

relojsolarEn lo referente a los relojes solares se ha tratado la problemática de que según la región en la que se vaya a usar su orientación y sus elementos deben adaptarse a la incidendia de la radiación lumínica, ya que si usamos el mismo reloj solar en el ecuador o en el polo obtendremos resultados dispares.

Así pues, podemos sacar algunos datos a tener siempre en cuenta a la hora de hacer un reloj solar, que son la latitud del punto donde se va a implantar, esto es, su grado de inclinación con respecto al ecuador, y la estación del año, pues el mismo reloj dilataría las horas en verano y las comprimiría en invierno, según el tiempo de Sol diario.

Orientarse con sombras era un buen método de cronometrar en la antigüedad, pero hoy en día los relojes solares ya no son realmente útiles a no ser que alguien esté perdido, puesto que tienen el gran problema de que no aportan información alguna por la noche.

La estructuración del programa es un simple menu.

Para introducir dilataciones o compresiones se hace como cocientes. Es decir, si quieres una dilatacion en la que el tiempo dure el triple solo tendras que poner un 3. Si quieres una contracion en la que el espacio se comprima a una cuarta parte deberas introducir 1/4, o sea se, 0,25.

Cuando el programa devuelva 1.#INF00 el resultado valdrá infinito.

Se puede compilar con cualquier programa que use “c” como lenguaje de programación. Por ejemplo Dev_c++.

#include <stdio.h>
#include <stdlib.h>
#include <math.h>
#define c 300000000

int main(){
int eleccion1,eleccion2,velocidadA,dilatacionmedida,eleccion3,velocidadB;
float cocienteA,gammaA,dilatacion,cocienteB,gammaB,velocidadAA,cocienteC,gammaC,compresionmedida,gammaD,velocidadBB;
do{
printf(“Sobre que desea trabajar?:\n1.Dilatacion del tiempo\n2.Compresion del espacio\n3.Salir\n\n”);
scanf(“%d”,&eleccion1);
if(eleccion1==1){
do{
printf(“1.Medir una dilatacion temporal\n2.Calcular la velocidad de una dilatacion temporal\n3.Volver atras\n\n”);
scanf(“%d”,&eleccion2);
if(eleccion2==1){
printf(“Introduzca la velocidad relativa en m/s\n\n”);
scanf(“%d”,&velocidadA);
if(velocidadA>=0 && velocidadA<=c){
cocienteA=pow(velocidadA,2)/pow(c,2);
gammaA=sqrt(1-cocienteA);
dilatacion=1/gammaA;
printf(“La dilatacion es de %f\n\n”,dilatacion);
}
else{
printf(“La velocidad indicada es imposible\n\n”);
}
}
if(eleccion2==2){
printf(“Indicar la dilatacion medida\n\n”);
scanf(“%d”,&dilatacionmedida);
if(dilatacionmedida>=1){
cocienteB=1/pow(dilatacionmedida,2);
gammaB=sqrt(1-cocienteB);
velocidadAA=c*gammaB;
printf(“La velocidad relativa es de %f m/s\n\n”,velocidadAA);
}
else{
printf(“La dilatacion indicada es imposible\n\n”);
}
}
}
while(eleccion2!=3);
}
if(eleccion1==2){
do{
printf(“1.Medir una compresion espacial\n2.Calcular la velocidad de una compresion espacial\n3.Volver atras\n\n”);
scanf(“%d”,&eleccion3);
if(eleccion3==1){
printf(“Introduzca la velocidad relativa en m/s\n\n”);
scanf(“%d”,&velocidadB);
if(velocidadB>=0 && velocidadB<=c){
cocienteC=pow(velocidadB,2)/pow(c,2);
gammaC=sqrt(1-cocienteC);
printf(“La compresion es de %f\n\n”,gammaC);
}
else{
printf(“La velocidad indicada es imposible\n\n”);
}
}
if(eleccion3==2){
printf(“Indicar la compresion medida\n\n”);
scanf(“%f”,&compresionmedida);
if(compresionmedida<=1 && compresionmedida>=0){
gammaD=sqrt(1-pow(compresionmedida,2));
velocidadBB=c*gammaD;
printf(“La velocidad relativa es de %f m/s\n\n”,velocidadBB);
}
else{
printf(“La compresion indicada es imposible\n\n”);
}
}
}
while(eleccion3!=3);
}
}
while(eleccion1!=3);
system(“PAUSE”);
return 0;
}