Ok, maar een core is zo snel als 'ie is. Ofwel er wordt een instructie uitgevoerd, of de core staat op een instructie te wachten. Dit wil zeggen dat twee threads simultaan uitvoeren eigenlijk betekent: de instructies van de ene thread kunnen uitvoeren afgewisseld met instructies van de andere thread. Dit in tegenstelling tot eerst alle instructies van de ene thread uitvoeren en daarna alle instructies van de andere thread.
Kortom, volgens mij, wordt hier dus alleen de capaciteit van de core beter benut, ofwel de tijd dat een core op instructies staat te wachten wordt bekort. De mate waarin dat gebeurt hangt dan natuurlijk sterk af van de opbouw en samenhang van de uit te voeren threads.
De tekst suggereert dat met deze methode de processor 2x zo snel zal worden. Dit lijkt mij dus volstrekte onzin.