eschnett · dannys4 · Jul 22, 2021 · Jul 23, 2021 · Jul 23, 2021 · Jul 24, 2021
diff --git a/src/LLVM_intrinsics.jl b/src/LLVM_intrinsics.jl
@@ -418,6 +418,7 @@ end
 const MULADD_INTRINSICS = [
     :fmuladd,
     :fma,
+
 ]
 
 for f in MULADD_INTRINSICS
@@ -431,6 +432,23 @@ for f in MULADD_INTRINSICS
 end
 
 
+for (t, N, T) in [("d"    , 2, Float64), ("s"    , 4, Float32),
+                  ("d.256", 4, Float64), ("s.256", 8, Float32),
+                  # ("d.512", 8, Float64), ("s.512", 16, Float32) # These don't seem supported by LLVM yet
+                 ]
+    @eval @generated function fmaddsub(a::LVec{$N, $T}, b::LVec{$N, $T}, c::LVec{$N, $T})
+        ff = "llvm.x86.fma.vfmaddsub.p"*$t
+        return :(
+            $(Expr(:meta, :inline));
+            ccall($ff, llvmcall, LVec{$($N), $($T)}, (LVec{$($N), $($T)}, LVec{$($N), $($T)}, LVec{$($N), $($T)}), a, b, c)
+        )
+    end
+end
+
+# function fmaddsub(a::LVec{4, Float64}, b::LVec{4, Float64}, c::LVec{4, Float64}) where N
+#     ccall("llvm.x86.fma.vfmaddsub.pd.256", llvmcall, LVec{4, Float64}, (LVec{4, Float64}, LVec{4, Float64}, LVec{4, Float64}), a, b, c)
+# end
+
 ################
 # Load / store #
 ################