lo otro que puedes hacer es generar una carga de registro pero particionada el proceso 1 graba 99.9999 registros el proceso 2 graba 100.000 a 199.000 eso generaria una carga simultanea a a base de datos es posible que mejore . Otra solucion
es us disco mas rapido ahora en el mercado hay unod discos superveloces pero +$$$$