Schneller als memcpy: Ein Benchmark benutzerdefinierter Speicherkopiermethoden
Bei der Profilerstellung stellte der Autor fest, dass `memcpy` bei großen binären Nachrichten ein Engpass war. Es wurden mehrere benutzerdefinierte Speicherkopiermethoden implementiert und verglichen, darunter Varianten mit REP MOVSB- und AVX-Instruktionen (aligniert, stream-aligniert und stream-aligniert mit Prefetching). Für kleine bis mittelgroße Nachrichten war die entrollte AVX-Version am schnellsten. Für große Nachrichten (> 1 MB) war die stream-alignierte AVX-Version mit Prefetching am schnellsten, aber ihre Leistung bei kleinen Nachrichten war miserabel. Fazit: `std::memcpy` bietet eine gute Balance zwischen Leistung und Anpassungsfähigkeit; benutzerdefinierte Methoden sind unnötig, es sei denn, die Leistung steht im Vordergrund.