next up previous contents
Next: 4.4.9 Utilización en aplicaciones Up: 4.4.8 Algunas pruebas de Previous: 4.4.8.1 El benchmark de   Índice General


4.4.8.2 Discusión de resultados

La gráfica obtenida en este caso es similar a las mostradas en la sección (3.2.9). Nuevamente se observa que al principio, utilizando pocos nodos, el rendimiento no mejora respecto al tiempo con un solo procesador. Sin embargo, en este caso se observa que el rendimiento mejora de manera más consistente al incrementar el número de nodos, alcanzando el desempeño de la versión uniprocesador más rápidamente y teniendo mejora constante de rendimiento al agregar más nodos.

Esto responde al algoritmo de asignación de trabajo utilizado en MPI-POVRay. En la sección (3.2.10) se describió una manera más eficiente de asignar el trabajo en bloques pequeños a los nodos que vayan concluyendo el trabajo previamente asignado y vayan quedando disponibles. MPI-POVRay utiliza este algoritmo de asignación, y como se aprecia, los resultados son bastante positivos.

Los resultados obtenidos pueden compararse con las tablas del benchmark oficial. El mejor tiempo obtenido por el cluster (145 segundos) se ubica alrededor de los tiempos logrados por equipos Pentium II a 266 y 300 MHz (entre 140 y 150 segundos). Por otro lado, el tiempo con un solo procesador (461 segundos) está entre los tiempos logrados por equipos Pentium a 120 y 133 MHz; esto tiene sentido si se considera que el servidor principal, donde se realizaron las pruebas uniprocesador, cuenta con un procesador Pentium a 133 MHz.

El benchmark oficial cuenta con una tabla de resultados para equipos paralelos, entre los que se incluyen gran cantidad de clusters. En esta tabla, un cluster con dos nodos Pentium MMX a 166 MHz obtuvo un tiempo de 145 segundos, exactamente el mismo que se obtuvo en este cluster.

De estos resultados pueden desprenderse dos observaciones, que refuerzan las conclusiones obtenidas en los anteriores benchmarks y pruebas realizadas en el cluster. La primera es que el rendimiento efectivamente se incrementa al utilizar más nodos, si bien el rendimiento máximo que se logró corresponde al de equipos uniprocesador que en la actualidad no se consideran avanzados (tómese el ejemplo del equipo Pentium II a 266 MHz). La segunda, y quizá más importante, es que, por medio de la cooperación entre sistemas que son ya francamente obsoletos, como los nodos empleados en este proyecto, se alcanza el rendimiento de un equipo que está varias generaciones adelante de los mismos nodos4.16.


next up previous contents
Next: 4.4.9 Utilización en aplicaciones Up: 4.4.8 Algunas pruebas de Previous: 4.4.8.1 El benchmark de   Índice General
2002-05-15