Procesado y Manipulación de Datos (I)

 

PROCESADO Y MANIPULACION DE DATOS-I

Versión inicial: Octubre de 1992

Ultima revisión: Enero de 1998




 

PREDICCION LINEAL.

Es proceso que permite calcular partes no adquiridas del Fid utilizando la parte realmente adquirida

En la mayoría de los experimentos de 2D se dan alguna de las siguientes situaciones, o ambas:

  • Los primeros puntos del Fid tienen distorsiones creadas por el propio equipo, saturación de los preamplificadores, no linearidad de los filtros, etc.
  • El tiempo de adquisición de los Fid´s es demasiado corto con el consiguiente truncamiento. Este efecto es más acusado en la dimensión F1 de los exp. de 2D, o en F1 y F2 en 3D.

 Estos efectos se traducen en una baja resolución, necesidad de utilización de funciones de procesado enérgicas, distorsiones en la línea de base, etc. El problema de la baja resolución se puede solventar incrementando el número de variaciones del tiempo de evolución, lo que implica un considerable aumento del tiempo de realización del experimento.

Estos dos problemas se pueden solventar de una manera más eficaz, mediante la utilización de la predicción lineal, aunque con un cierto incremento del tiempo de calculo, pero no del de acumulación. La predicción lineal utiliza una parte del Fid para analizar las frecuencias presentes y utiliza esta información para extender el Fid, hacia atrás o a delante.

Una de las utilidades más espectaculares es que nos permite doblar sin grandes problemas la resolución digital de un espectro ya adquirido, o bien planificar experimentos de duración menor.

A partir de la versión de VNMRX 4.3.1 se ha incorporado esta posibilidad, presentado con respecto a versiones anteriores alguna mejora como la de posibilitar la realización de predicción lineal en ambos sentidos de una manera concatenada, de modo que al mismo tiempo se pueden corregir los primeros puntos y extender el Fid (solventar distorsiones de fase, línea de base e incrementar la resolución. La utilización de la predicción lineal está especialmente indicada en los experimentos multidimensionales, para incrementar la resolución digital en F1. En el caso de los experimentos de heterocorrelación tipo HMBC o HSQC es muy útil debido al tamaño de la SW1, ya que de otro modo sería preciso la utilización de valores elevados de ni. En el caso de los experimentos de Noesy y Roesy la aplicación sistemática de la predicción lineal favorece la observación de señales de correlación de poca intensidad y él calculo de volúmenes se señales próximas.

 

Parámetros.

 lpalg (lpalg1, lpalg2): Algoritmo utilizado en la predicción lineal. Puede ser igual a lpfft o lparfft, el primero, se utiliza preferentemente para señales agudas y el segundo en el caso de señales anchas.

 lpopt (lpopt1, lpopt2): Indica en que sentido se realiza la predicción lineal, hacia adelante f o hacia atrás b en el dominio de tiempo de la dimensión np.

 lpfilt (lpfilt1, lpfilt2): Indica él numero de coeficientes utilizados para calcular la extensión. Debe ser mayor que él número de señales sinusoidales contenidas en el Fid o en el interferograma.

 lpnupts (lpnupts1, lpnupts2): Indica él numero e puntos de la dimensión np que son utilizados para construir la matriz utilizada en predicción. Lpnupts ³ 2*lpfilt.

 strtlp (strtlp1, strtlp2): Indica el primer punto utilizado para calcular los coeficientes utilizados en la predicción lineal.

  lpext (lpext1, lpext2): Indica el numero de puntos en que los datos originales se extienden, tanto hacia adelante (strtext+lpext)<fn/2 como a hacia atrás (strtext-lpext) ³ 0.

  strtext (strtext1, strtext2): Indica el punto (incluido este) en el que empieza la extensión lineal. Puede tomar valores desde 1 a np/2.

  lpprint (lpprint1,lpprint2): Controla el fichero de salida de la predicción lineal y crea un fichero con el nombre lpanalyz.out con los datos.

  lptrace (lptrace1, lptrace2): Indica a que espectro o traza, de acuerdo con los valores de lpprint, corresponde la información contenida en el fichero lpanalyz.out.

 

Procedimiento.

1. Crear los parámetros utilizados en la predicción lineal:

 parlp crea los parámetros lpalg, lpopt, lpfilt, lpnupts, strtlp, strtext, lptrace, lpprint correspondientes a un espectro de 1D o a la dimensión f2 en 2D. También se pueden crear con addpar(´lp´).

 parlp(1) crea los parámetros lpalg1, lpopt1, lpfilt1, lpnupts1, strtlp1, strtext1, lptrace1, lpprint1 correspondientes a la dimensión f1 en 2D. También se pueden crear con addpar(´lp´,1). Con parlp(2) o addpar(´lp´,2) se crean los parámetros correspondientes a la dimensión f2 en un experimento de 3D.

 

2. Ajuste de los parámetros. (dglp)

 Seleccionar el algoritmo. Por lo general los mejores resultados se obtienen con lpalg=lpfft independientemente si la predicción es hacia adelante o hacia atrás.

 Poner lpopt1 igual f si se quiere extender el Fid incrementando su longitud o lpopt=f si lo que se desea es recalcular los primeros puntos del Fid.

Ejemplos

    • Ajuste de los parámetros para una predicción lineal con lpopt1=f , doblando el número de puntos inicial.

(FID inicial con 128 puntos en f1, correspondiendo a un exp de 2D en AV)

lpfilt1= 8 ó 12; lpnupts1=256; strtlp=256; lpext1=256; strtext1=257

Estos valores indican que la extensión lineal se construye del siguiente modo: con ocho coeficientes, se utilizan 256 puntos, del Fid, para calcular los coef, los puntos utilizados empiezan en el número 256, el fid se extiende 256 puntos más y la extensión empieza a partir del punto 257.

    • Ajuste de los parámetros para una predicción lineal con lpopt=b, prediciendo los cinco primeros puntos del Fid (corrección de problemas con la fase o con la línea de base).

lpfilt1= 32; lpnupts1=64; strtlp=5; lpext1=4; strtext1=4.

 

3. Ajuste de las funciones de procesado y activación de la predicción lineal.

En principio el ajuste de los parámetros de procesado no se puede hacer mediante el procesado interactivo por menú, ya que el fid corregido no aparece, por lo que es preciso calcular cual es la función adecuada en cada caso, siempre teniendo en cuenta la longitud final del Fid.

En todas las pruebas que se han realizado las funciones de procesado más adecuadas han resultado ser una combinación de sb y sbs cuyo valor debe ser igual al tiempo de adquisición con signo negativo, en el caso de que se trate de un experimento de 2D en fase. Si el experimento es en valor absoluto como un Cosy o similar, el sb y sbs deberán ser iguales a la mitad del tiempo de adquisición tiempo de adquisición, (con signo positivo), esta última combinación tiene un efecto similar a un pseudo.

Es posible ver el Fid resultado de la predicción lineal con wft(´noft´ ).

En el caso de un experimento de Cosy en el que mediante la predicción lineal se haya ampliado él numero de puntos complejos iniciales de 256 a 512 en t1, el nuevo tiempo de adquisición máximo en F1 será 512/sw1, siendo sw1 la ventana espectral en F1. En este caso sb1= 512/2Sw1 y sbs1=512/2sw1.

Si el experimento es en fase, pe. un Tocsy, Roesy, Roesy, etc., las funciones de procesado serán:

sb1=-512/sw1 y sbs1=-512/sw1.

También se debe tener en cuenta la necesidad de ajustar fn y/o fn1 de acuerdo con los nuevos valores para que el zero filling sea efectivo.

El proceso de predicción lineal se efectúa cuando se realiza la transformada de Fourier, siempre y cuando el parámetro , según el caso sea igual a lp. (proc1=='lp') en los casos anteriores.

En los espectros procedentes de un equipo Bruker sólo es posible aplicar la predicción lineal cuando no debe efectuarse la transformada en modo rft. (espectros adquiridos en modo TPPI, o los que requieren una transformada de Fourier real).

En una comunicación aparecida en el Magnetic Moments de Varian*, se recomienda la utilización de una función gausiana para el procesado en F1 gf1=0.6(newni)/SW1.

 

Ejemplos de aplicaciones de la predicción lineal.

1. Incremento de la resolución digital en F1 en los experimentos de herocorrelación.

Experimento de ghsqc-tocsy 1H-15N, del peptido GFL ( marcado en N15). El espectro fue adquirido con un valor inicial de ni de 128, nt= 4 y el tiempo total de adquisición fue de 1 hora 30 minutos. Mediante la utilización de lp se paso a un ni de 512 puntos y se utilizo una función gaussiana en F1. Para obtener la misma resolución digital en F1 hubiera sido preciso adquirir durante unas horas.

En la figura 1 se puede comprobar el espectacular incremento de resolución en F1, con la diferenciación de cada una de las señales de correlación.

 

 

Las diferencias de aspecto entre los dos mapas de contorno no sólo se deben a la mayor resolución sino también a la diferente escala ( necesaria para ver el mismo número de señales). Ello se debe a un aparente incremento de la relación SN, tal como se puede ver en la siguiente figura, donde se muestra la comparación de la misma traza, extraidas del espectro con y sin predicción lineal. El valor de relación SN obtenido en estas trazas es de 40.3 para el procesado estándar y de 58.3 para el de la predicción lineal.

 

 

2. Aplicación del proceso de predicción lineal a un experimento de Noesy.

Experimento de Noesy de la celobiosa ( en cdcl3), mix=0.6 ni=256 nt= 16, tiempo de adquisición total de 4.5 horas. En este caso la predicción lineal ha permitido pasar a un ni de 512. En la siguiente figura, se muestra los mapas de contorno de los dos procesado, pudiéndose apreciar el incremento de resolución en el espectro procesado con lp.

 

En este caso no se ha observado un incremento significativo de la relación SN (puede ser debido a la anchura de las señales ???). Los resultados son similares cuando se utilizan funciones de procesado tipo sb1 y sbs1 y también para otros valores de lpfilt1 (comprendidos entre 8 y 16).

3. Aplicación de la predicción lineal en un experimento de homocorrelación gcosy.

Muestra celobiosa ni=256 nt=1 tiempo de adquisición total 6 minutos. Mediante la predicción lineal se ha extendido el ni a 512, en este caso se ha utilizado el macro lpcosy. En la siguiente figura se muestran los mapas de contorno de los dos procesados, donde también se puede comprobar el incremento de resolución en F1.

 

 

En la siguiente figura se puede observar los efectos de la utilización de un valor de lpfilt1 demasiado grande, ( 32 en este caso).

 

 

 

4. Corrección de los primeros puntos del fid

En este caso se puede ver la utilidad de la aplicación de la LP para la supresión de las distorsiones de la línea de base del espectro, ocasionadas por un error en la adquisición de los primeros puntos del Fid. En la siguiente figura se muestra una ampliación de un espectro de Flúor 19, con y sin predicción lineal, observándose la desaparición de las ondulaciones de la línea de base en cuando se predicen los 4 primeros puntos del Fid.

 

 

En general la predicción de los primeros puntos del fid es aconsejable siempre que se observen distorsiones en la línea de base, espectros de F19, sólidos, etc. También puede ser utilizada para la eliminación de señales muy anchas ( que sólo están contenidas en el inicio del Fid). De este modo es posiblee liminar o disminuir las señales de Boro debidas a los tubos de RMN sin afectar a las señales del compuesto orgánico ( este truco sólo funciona si existe una diferencia significativa en la anchura de las señales)

 

Notas y comentarios:

Para facilitar la utilización de la predicción lineal en F1, modo f, de los experimentos de 2D se han creado varios macros que crean y ajustan los parámetros de modo que el Fid se extiende al doble. Estos macros también ajustan las funciones de procesado y el fn.

lpcosy: para el Cosy en valor absoluto

lpph: para 2D homonucleares y heteronucleares en fase. fn y fn1.

El macro lpph se ha modificado, con respecto a versiones iniciales, para permitir su utilización incluso cuando el experimento no ha terminado o bien se ha finalizado sin alcanzar él ni previsto inicialmente. El valor de fn1 se ajusta en función del incremento propuesto para ni y no realiza un zero filling (sólo se redondea al siguiente valor, 64, 128, 256, 1024, 2048, 4096).

setlp3d: Valido para la predicción lineal de los experimentos de 3D homonucleares, tocsy-noesy-3D, etc

************

En el caso de los experimentos heteronucleares, como el hmqc, hsqc o ghsqc se ha podido incrementar el valor del ni hasta cuatro veces, sin observar un incremento de los artefactos. Así es fácil pasar de un ni de 128 a otro de 512, con la consiguiente ganancia de resolución y también con un incremento de la relación SN.

En el caso de los experimentos de correlación homonuclear y en las pruebas efectuadas los mejores resultados se obtienen doblando el valor inicial de ni ( de 256 a 512). En algunos casos al intentar incrementos mayores se ha observado un incremento significativo del número e intensidad de los artefactos que aparecen en el espectro.

***********

En la utilización de la LP se tiene que tener especial cuidado en los valores de lpfilt1 ya que a pesar de que el manual indica que debe ser mayor que el número de señales contenidas en el Fid, la utilización de valores altos en LP con f da lugar a la aparición de artefactos como los que se pueden ver en la figura 5. En las pruebas realizadas los mejores resultados corresponden a valores de 8-12 para el lpfilt1 (aunque en algunos casos se ha podido utilizar un lpfilt1 de 16 sin que los artefactos impidieran la observación de las señales).En el caso de LP con b si que se pueden utilizar valores superiores.

***********

La utilización de la LP incrementa el tiempo necesario para la transformada de Fourier, así para transformar una matriz de 4096*2048 con 512 puntos en F1 se precisan 3 minutos en un IPX (16M) si se efectúa la predicción lineal y sólo 1.3 minutos sin predicción lineal. La transformada normal de 4096*1024 tarda 45 segundos. El tiempo se incrementa entre dos y cuatro veces, dependiendo de la RAM, cuando se trata de un IPC.

En los ordenadores disponibles en la actualidad (sun Ultra 1 y Sparc-20 o 4), el proceso de predicción lineal con matrices de puntos de hasta 4096 *2048 es muy rapido (no mucho más de un minuto). Sólo en el caso de los experimentos de 3D el tiempo es considerable ( entre 30 minutos y 4 horas, en función de la matriz final). Por el momento el unico problema que puede haber para la utilización sistemática de la predicción lineal es la disponibilidad de espacio en el sistema de X-terminales ( problema que puede ser menor con la incorporación del sistema RAID de 18 Gigabytes)

***********

En ocasiones se han detectado fallos de la LP en ordenadores IPC con VNMRS 4.31, probablemente debidos a corrupción de software. La utilidad de la LP puede estar limitada por la anchura natural de las señales, por lo que en caso de líneas anchas puede no observarse una gran mejora en el espectro. La LP sólo puede efectuarse si se dispone de VNMRS o VNMRX, no es posible en el Gemini directamente.

***********

En resumen se recomienda la utilización regular de la LP tanto para incrementar la resolución como para poder disminuir el tiempo de realización de los experimentos. La LP prácticamente no ocasiona disminución de la sensibilidad ( en algunos casos, heterocorrelaciones, se ha detectado un incremento de la relación SN) y en ocasiones permite la observación de nuevas señales. Se recomienda que antes de la utilización de la predicción lineal se compruebe la disponibilidad de espacio en el disco de trabajo y que una vez finalizado el estudio del experimento se proceda a borrar el espacio de trabajo (exp de vnmrsys)

 

************

Esta nota de aplicación se confecciono inicialmente sobre la base de la información aparecida en el Magnetic Moments de Varian Vol V No 2 1992 y de la información que contienen los manuales de Varian VNMR 5.31.

 

*Como ampliación se puede consultar el Magnetic Moments de Varian Vol VIII No 4 1997, aparecido con posterioridad a la primera redacción de esta hoja de aplicación. En este se encuentran dos comunicaciones que remarcan la utilidad de la LP tanto en los experimentos Noesy, como en las heterocorrelaciones tipo hmqc y ghsqc.