SIMD 支持
VecElement{T}
类型是为了构建 SIMD 运算符的库。实际使用中要求使用 llvmcall
。类型按下文定义:
struct VecElement{T}
value::T
end
It has a special compilation rule: a homogeneous tuple of VecElement{T}
maps to an LLVM vector
type when T
is a primitive bits type.
使用 -O3
参数时,编译器 可能 自动为这样的元组向量化运算符。 例如接下来的程序,使用 julia -O3
编译,在x86系统中会生成两个 SIMD 附加指令(addps
):
const m128 = NTuple{4,VecElement{Float32}}
function add(a::m128, b::m128)
(VecElement(a[1].value+b[1].value),
VecElement(a[2].value+b[2].value),
VecElement(a[3].value+b[3].value),
VecElement(a[4].value+b[4].value))
end
triple(c::m128) = add(add(c,c),c)
code_native(triple,(m128,))
然而,因为无法依靠自动向量化,以后将主要通过使用基于 llvmcall
的库来提供 SIMD 支持。