SSE/AVX/AVX2/AVX512
部分 intel CPU 支持向量指令集同时进行多路整数和浮点数计算,以此来进行对相关算法进行优化,这里整理相关链接:
- 编译器支持相关封装避免编写汇编代码,官方指南:Intrinsics Guide
- 基于 sse_mathfun 的 avx_mathfun 封装相关宏和函数
- mp3 库 lame 中的 SSE 加速实现 libmp3lame/vector/xmm_quantize_sub.c
部分 intel CPU 支持向量指令集同时进行多路整数和浮点数计算,以此来进行对相关算法进行优化,这里整理相关链接: