Página Personal de Roberto Tejero

                                Selecciona español         Pick   english


Home


Presentation
   Details
   Research
   Projects
   Publications

M. Modelling
   M. Mechanics
   M. Dynamics
   Homology
   Struct. Analysis

PC-Farm
   Hardware
   Software

PdbStat

Water Ref

CASD-NMR

Manuals

Docs

Gallery

Programs


Links

Gestores de trabajo, sistemas de colas

Para poder llegar a HTC (High Throughput Computing), además de tener el conjunto de ordenadores que conforman el grid o farm se necesita un gestor de trabajo para distribuir los tareas sobre el conjunto y que a ojos de los usuarios parezca un solo ordenador dotado de muchas CPU.

Esto es el 'sistema de colas' o Batch System o cualquier otro nombre parecido. Con él los trabajos enviados por un usuario son repartidos (enrutados) hacia las cpu que en ese momento estén libres o quedan en 'espera de ejecución' si todas ellas están ocupadas.

Desde el inicio, allá por 1996/97, probé con diferentes sistemas y la verdad es que todos ellos tienen ventajas e inconvenientes. Al principio opté por DQS , después de comparar con CONDOR , ya que si bien no era muy robusto era verdaderamente rápido y al disponer del código fuente pude programar algunas características específicas que necesitábamos.   Además se acercaba más a nuestra filosofía de determinación de estructuras ya que no queríamos conseguir un entorno de HTC para diversos proyectos sino, más bien, realizar cierto tipo de paralelización en el proceso de obtención de estructuras.

Las versiones que utilicé fueron DQS-3.2.7 y DQS-3.3.1.   Dependiendo del tipo de cálculos hay que ser cuidadoso ya que DQS no disponía de soporte para ficheros de más de 2GB y a pesar de que el sistema de ficheros del nodo lo soportaba, DQS cortaba el cálculo cuando el fichero alcanzaba ese tamaño. Para el cálculo de estructuras no hay problema ya que en general los ficheros son muchos pero pequeños, para una simulación de dinámica molecular ya hay que analizar el problema en cuestión.

Más adelante apareció PBS , (versión OpenPBS) que es el sistema que actualmente uso. De nuevo, es un programa flexible y al disponer del código fuente he podido adaptar algunos de los comandos para un funcionamiento más exótico en nustras máquinas.

Otros sistemas que he probado, si bien no en tanta profundidad como los anteriores, son Sun Grid Engine (SGE) , Condor , NQS .

De nuevo debo agradecer la financiación del proyecto PB98-1455 que ha hecho posible este profundo estudio con el objeto de seleccionar los sistemas que más se ajustaran a las condiciones de cálculo masivo de estructuras en el menor tiempo posible.

Determinación estructural

En el caso de la determinación de estructuras de bipolímeros en disolución a partir de datos de RMN, generalmente por satisfacción de restricciones de distancias y ángulos diedros, usamos generalmente CreateProc .   CreateProc es un programa en lenguaje shell (Bash) que se encarga de la distribución de cálculo sobre los nodos disponibles sin intervención del usuario y sin conocicimientos previos de los diversos gestores de trabajo.   Dispone además de plantillas con los protocolos necesarios para llevar a cabo simulated annealing con DYANA y/o X-PLOR o CNS .   Más en concreto, CreateProc está diseñado para el funcionamiento con la versión del NIH de X-PLOR y usa los datos disponibles sobre la marcha, es decir si se dispone de los datos de acoplamientos residuales dipolares (RDC), o restricciones para ángulos diedros, o datos sobre los desplazamientos químicos, estos son incorporados automáticamente sin necesidad de intervención.

CreateProc es la herramienta utilizada por AutoStructure para la selección del protocolo a usar y el reparto de trabajo sobre los nodos.

Album

Albumes

Some Structures

Friends at CABM


NMRLab at CABM


[ Powered by Apache ]