Página Personal de Roberto Tejero

                                Selecciona español         Pick   english


Home


Presentation
   Details
   Research
   Projects
   Publications

M. Modelling
   M. Mechanics
   M. Dynamics
   Homology
   Struct. Analysis

PC-Farm
   Hardware
   Software

PdbStat

Water Ref

CASD-NMR

Manuals

Docs

Gallery

Programs


Links

Introducción

Pretendo dejar constancia aquí, sin ser exhaustivo, de las ideas y experiencias montando granjas (clusters, grids, etc) desde el comienzo.   La idea básica es poder disponer de un ordenador de gran potencia construído a base de ordenadores normales (PC normal de bajo precio).   La pieza básica una vez montado es el gestor de trabajo o sistema de colas.

La sección tiene una parte dedicada al hardware y la otra al software que, de momento, solo cubre los distintos sistemas de colas.

La motivación que me dirgió en un principio a la instalación de estos sistemas fue que el proceso de determinación estructural se adapta a un proceso paralelo donde la determinación de la estructura 10 es independiente de la 1 por poner un ejemplo.

En este sentido se adapta fácilmente a un entorno de cálculo distribuído con la aceleración que supone el determinar todas las estructuras a la vez en lugar de tener que esperar a que finalice el cálculo 1 para comenzar el 2.

Es fácil comprobar que a mayor número de CPU mayor velocidad sin tener que preocuparse por problemas de escalado.   Un buen sistema de discos con rápido acceso es suficiente.   No es un auténtico proceso de paralelización o dicho en otras palabras, es paralelización de granularidad alta, donde no tenemos que modificar el código de los programas a usar.


Determinación de estructuras a partir de datos de RMN

Una vez dispuse de la primera granja (CABM, 1996) escribí un programa en shell (bash) (también existe una versión en perl) llamado CreateProc que se encarga de la distribución del cálculo por el número de nodos (o procesadores) elegido en la línea de comando.   La ventaja de CreateProc es que se engloba fácilmente en AutoStrcuture para llevar a cabo del cálculo de estructuras de forma totalmente automática en segundos.   CreateProc queda en estado dormido hasta que finaliza el último de los procesos y comienza una serie de llamadas a PdbStat para realizar estadística sobre las coordenadas encontradas y devolver el control a AutoStructure si se estaba utilizando el proceso automático o al usuario si se estaba utilizando interactivamente.

Con los procesadores actuales y disponiendo de una granja de unos 12 procesadores, el proceso de determinación de estructuras a partir de datos de RMN se lleva a cabo en menos de 1 minuto para unas 60 estructuras usando programas como DYANA.   Disponiendo de 60 procesadores el tiempo se reduce a unos segundos.   Para programas más grandes como X-PLOR, CNS, CONGEN se producen 12 estructras cada 5 minutos usando protocolos bastante sofisticados.  


Enlaces

Por cierto, aquí , tenéis un buen enlace para seguir profundizando en granjas, Beowulf, etc y encontrar enlaces a otros sitios interesantes relacionados con el tema.

Album

Albumes

Some Structures

Friends at CABM


NMRLab at CABM


[ Powered by Apache ]