Página Personal de Roberto Tejero |
|
|||
Presentation Details Research Projects Publications M. Modelling M. Mechanics M. Dynamics Homology Struct. Analysis PC-Farm Hardware Software |
Gestores de trabajo, sistemas de colas
Para poder llegar a HTC (High Throughput Computing), además de tener el conjunto de ordenadores que conforman el grid o farm se necesita un gestor de trabajo para distribuir los tareas sobre el conjunto y que a ojos de los usuarios parezca un solo ordenador dotado de muchas CPU. Esto es el 'sistema de colas' o Batch System o cualquier otro nombre parecido. Con él los trabajos enviados por un usuario son repartidos (enrutados) hacia las cpu que en ese momento estén libres o quedan en 'espera de ejecución' si todas ellas están ocupadas. Desde el inicio, allá por 1996/97, probé con diferentes sistemas y la verdad es que todos ellos tienen ventajas e inconvenientes. Al principio opté por DQS , después de comparar con CONDOR , ya que si bien no era muy robusto era verdaderamente rápido y al disponer del código fuente pude programar algunas características específicas que necesitábamos. Además se acercaba más a nuestra filosofía de determinación de estructuras ya que no queríamos conseguir un entorno de HTC para diversos proyectos sino, más bien, realizar cierto tipo de paralelización en el proceso de obtención de estructuras. Las versiones que utilicé fueron DQS-3.2.7 y DQS-3.3.1. Dependiendo del tipo de cálculos hay que ser cuidadoso ya que DQS no disponía de soporte para ficheros de más de 2GB y a pesar de que el sistema de ficheros del nodo lo soportaba, DQS cortaba el cálculo cuando el fichero alcanzaba ese tamaño. Para el cálculo de estructuras no hay problema ya que en general los ficheros son muchos pero pequeños, para una simulación de dinámica molecular ya hay que analizar el problema en cuestión. Más adelante apareció PBS , (versión OpenPBS) que es el sistema que actualmente uso. De nuevo, es un programa flexible y al disponer del código fuente he podido adaptar algunos de los comandos para un funcionamiento más exótico en nustras máquinas. Otros sistemas que he probado, si bien no en tanta profundidad como los anteriores, son Sun Grid Engine (SGE) , Condor , NQS . De nuevo debo agradecer la financiación del proyecto PB98-1455 que ha hecho posible este profundo estudio con el objeto de seleccionar los sistemas que más se ajustaran a las condiciones de cálculo masivo de estructuras en el menor tiempo posible. Determinación estructuralEn el caso de la determinación de estructuras de bipolímeros en disolución a partir de datos de RMN, generalmente por satisfacción de restricciones de distancias y ángulos diedros, usamos generalmente CreateProc . CreateProc es un programa en lenguaje shell (Bash) que se encarga de la distribución de cálculo sobre los nodos disponibles sin intervención del usuario y sin conocicimientos previos de los diversos gestores de trabajo. Dispone además de plantillas con los protocolos necesarios para llevar a cabo simulated annealing con DYANA y/o X-PLOR o CNS . Más en concreto, CreateProc está diseñado para el funcionamiento con la versión del NIH de X-PLOR y usa los datos disponibles sobre la marcha, es decir si se dispone de los datos de acoplamientos residuales dipolares (RDC), o restricciones para ángulos diedros, o datos sobre los desplazamientos químicos, estos son incorporados automáticamente sin necesidad de intervención. CreateProc es la herramienta utilizada por AutoStructure para la selección del protocolo a usar y el reparto de trabajo sobre los nodos. |
|
||
|