Una nota: Usar "todos los cores" no significa que sea mas rápido. A menos que un algoritmos sea
https://en.wikipedia.org/wiki/Embarrassingly_parallel aumentar el numero de "comunicaciones" trae un costo.
En el esquema moderno de los computadores, nada mas rapido que un scan de datos secuenciales en bloques que coincidan con el cache de la cpu.