Tal como dice "escafandra" es cosa del SO la distribución del trabajo entre los procesadores, cabe mencionar que hasta donde yo sé xp solo es capaz de distribuir el trabajo en dos núcleos, con cuatro creo que no (tal vez aquí es donde radique tu problema).
Ahora según dice
aquí bastaría con programar tu aplicación con hilos (tal como sabes), para que el SO (uno que soporte los 4), se encargue de distribuir el trabajo entre los diferentes núcleos. Nos vemos