Salinan kode mesin yang tepat berjalan 50% lebih lambat dari fungsi aslinya

Saya telah bereksperimen sedikit dengan eksekusi dari RAM dan memori flash pada sistem embedded. Untuk prototyping dan pengujian cepat, saya saat ini menggunakan Arduino Due (SAM3X8E ARM Cortex-M3). Sejauh yang saya bisa lihat, runtime dan bootloader Arduino seharusnya tidak membuat perbedaan di...