Lines Matching refs:__m512

35 typedef float __m512 __attribute__((__vector_size__(64)));
66 static __inline__ __m512 __DEFAULT_FN_ATTRS
69 return (__m512)__builtin_ia32_undef512();
72 static __inline__ __m512 __DEFAULT_FN_ATTRS
75 return (__m512)__builtin_ia32_undef512();
109 static __inline __m512 __DEFAULT_FN_ATTRS
112 return (__m512){ 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0,
121 static __inline __m512 __DEFAULT_FN_ATTRS
124 return (__m512){ __w, __w, __w, __w, __w, __w, __w, __w,
147 static __inline__ __m512 __DEFAULT_FN_ATTRS
173 static __inline __m512 __DEFAULT_FN_ATTRS
187 _mm512_castps512_ps128(__m512 __a)
418 static __inline __m512 __DEFAULT_FN_ATTRS
419 _mm512_add_ps(__m512 __a, __m512 __b)
430 static __inline __m512 __DEFAULT_FN_ATTRS
431 _mm512_mul_ps(__m512 __a, __m512 __b)
442 static __inline __m512 __DEFAULT_FN_ATTRS
443 _mm512_sub_ps(__m512 __a, __m512 __b)
559 static __inline__ __m512 __DEFAULT_FN_ATTRS
560 _mm512_max_ps(__m512 __A, __m512 __B)
562 return (__m512) __builtin_ia32_maxps512_mask ((__v16sf) __A,
682 static __inline__ __m512 __DEFAULT_FN_ATTRS
683 _mm512_min_ps(__m512 __A, __m512 __B)
685 return (__m512) __builtin_ia32_minps512_mask ((__v16sf) __A,
883 static __inline__ __m512 __DEFAULT_FN_ATTRS
884 _mm512_sqrt_ps(__m512 __a)
886 return (__m512)__builtin_ia32_sqrtps512_mask((__v16sf)__a,
900 static __inline__ __m512 __DEFAULT_FN_ATTRS
901 _mm512_rsqrt14_ps(__m512 __A)
903 return (__m512) __builtin_ia32_rsqrt14ps512_mask ((__v16sf) __A,
938 static __inline__ __m512 __DEFAULT_FN_ATTRS
939 _mm512_rcp14_ps(__m512 __A)
941 return (__m512) __builtin_ia32_rcp14ps512_mask ((__v16sf) __A,
966 static __inline __m512 __DEFAULT_FN_ATTRS
967 _mm512_floor_ps(__m512 __A)
969 return (__m512) __builtin_ia32_rndscaleps_mask ((__v16sf) __A,
984 static __inline __m512 __DEFAULT_FN_ATTRS
985 _mm512_ceil_ps(__m512 __A)
987 return (__m512) __builtin_ia32_rndscaleps_mask ((__v16sf) __A,
1097 static __inline__ __m512 __DEFAULT_FN_ATTRS
1098 _mm512_mask_add_ps(__m512 __W, __mmask16 __U, __m512 __A, __m512 __B) {
1099 return (__m512) __builtin_ia32_addps512_mask ((__v16sf) __A,
1106 static __inline__ __m512 __DEFAULT_FN_ATTRS
1107 _mm512_maskz_add_ps(__mmask16 __U, __m512 __A, __m512 __B) {
1108 return (__m512) __builtin_ia32_addps512_mask ((__v16sf) __A,
1128 (__m512) __builtin_ia32_addps512_mask ((__v16sf) __A, (__v16sf) __B, \
1132 (__m512) __builtin_ia32_addps512_mask ((__v16sf) __A, (__v16sf) __B, \
1136 (__m512) __builtin_ia32_addps512_mask ((__v16sf) __A, (__v16sf) __B, \
1217 static __inline__ __m512 __DEFAULT_FN_ATTRS
1218 _mm512_mask_sub_ps(__m512 __W, __mmask16 __U, __m512 __A, __m512 __B) {
1219 return (__m512) __builtin_ia32_subps512_mask ((__v16sf) __A,
1226 static __inline__ __m512 __DEFAULT_FN_ATTRS
1227 _mm512_maskz_sub_ps(__mmask16 __U, __m512 __A, __m512 __B) {
1228 return (__m512) __builtin_ia32_subps512_mask ((__v16sf) __A,
1249 (__m512) __builtin_ia32_subps512_mask ((__v16sf) __A, (__v16sf) __B, \
1253 (__m512) __builtin_ia32_subps512_mask ((__v16sf) __A, (__v16sf) __B, \
1257 (__m512) __builtin_ia32_subps512_mask ((__v16sf) __A, (__v16sf) __B, \
1338 static __inline__ __m512 __DEFAULT_FN_ATTRS
1339 _mm512_mask_mul_ps(__m512 __W, __mmask16 __U, __m512 __A, __m512 __B) {
1340 return (__m512) __builtin_ia32_mulps512_mask ((__v16sf) __A,
1347 static __inline__ __m512 __DEFAULT_FN_ATTRS
1348 _mm512_maskz_mul_ps(__mmask16 __U, __m512 __A, __m512 __B) {
1349 return (__m512) __builtin_ia32_mulps512_mask ((__v16sf) __A,
1370 (__m512) __builtin_ia32_mulps512_mask ((__v16sf) __A, (__v16sf) __B, \
1374 (__m512) __builtin_ia32_mulps512_mask ((__v16sf) __A, (__v16sf) __B, \
1378 (__m512) __builtin_ia32_mulps512_mask ((__v16sf) __A, (__v16sf) __B, \
1460 static __inline__ __m512 __DEFAULT_FN_ATTRS
1461 _mm512_mask_div_ps(__m512 __W, __mmask16 __U, __m512 __A, __m512 __B) {
1462 return (__m512) __builtin_ia32_divps512_mask ((__v16sf) __A,
1469 static __inline__ __m512 __DEFAULT_FN_ATTRS
1470 _mm512_maskz_div_ps(__mmask16 __U, __m512 __A, __m512 __B) {
1471 return (__m512) __builtin_ia32_divps512_mask ((__v16sf) __A,
1492 (__m512) __builtin_ia32_divps512_mask ((__v16sf) __A, (__v16sf) __B, \
1496 (__m512) __builtin_ia32_divps512_mask ((__v16sf) __A, (__v16sf) __B, \
1500 (__m512) __builtin_ia32_divps512_mask ((__v16sf) __A, (__v16sf) __B, \
1504 (__m512)__builtin_ia32_rndscaleps_mask((__v16sf)(A), (B), (__v16sf)(A), \
1704 (__m512) __builtin_ia32_vfmaddps512_mask ((__v16sf) (A), \
1710 (__m512) __builtin_ia32_vfmaddps512_mask ((__v16sf) (A), \
1716 (__m512) __builtin_ia32_vfmaddps512_mask3 ((__v16sf) (A), \
1722 (__m512) __builtin_ia32_vfmaddps512_maskz ((__v16sf) (A), \
1728 (__m512) __builtin_ia32_vfmaddps512_mask ((__v16sf) (A), \
1734 (__m512) __builtin_ia32_vfmaddps512_mask ((__v16sf) (A), \
1740 (__m512) __builtin_ia32_vfmaddps512_maskz ((__v16sf) (A), \
1746 (__m512) __builtin_ia32_vfmaddps512_mask (-(__v16sf) (A), \
1752 (__m512) __builtin_ia32_vfmaddps512_mask3 (-(__v16sf) (A), \
1758 (__m512) __builtin_ia32_vfmaddps512_maskz (-(__v16sf) (A), \
1764 (__m512) __builtin_ia32_vfmaddps512_mask (-(__v16sf) (A), \
1770 (__m512) __builtin_ia32_vfmaddps512_maskz (-(__v16sf) (A), \
1775 static __inline__ __m512 __DEFAULT_FN_ATTRS
1776 _mm512_fmadd_ps(__m512 __A, __m512 __B, __m512 __C)
1778 return (__m512) __builtin_ia32_vfmaddps512_mask ((__v16sf) __A,
1785 static __inline__ __m512 __DEFAULT_FN_ATTRS
1786 _mm512_mask_fmadd_ps(__m512 __A, __mmask16 __U, __m512 __B, __m512 __C)
1788 return (__m512) __builtin_ia32_vfmaddps512_mask ((__v16sf) __A,
1795 static __inline__ __m512 __DEFAULT_FN_ATTRS
1796 _mm512_mask3_fmadd_ps(__m512 __A, __m512 __B, __m512 __C, __mmask16 __U)
1798 return (__m512) __builtin_ia32_vfmaddps512_mask3 ((__v16sf) __A,
1805 static __inline__ __m512 __DEFAULT_FN_ATTRS
1806 _mm512_maskz_fmadd_ps(__mmask16 __U, __m512 __A, __m512 __B, __m512 __C)
1808 return (__m512) __builtin_ia32_vfmaddps512_maskz ((__v16sf) __A,
1815 static __inline__ __m512 __DEFAULT_FN_ATTRS
1816 _mm512_fmsub_ps(__m512 __A, __m512 __B, __m512 __C)
1818 return (__m512) __builtin_ia32_vfmaddps512_mask ((__v16sf) __A,
1825 static __inline__ __m512 __DEFAULT_FN_ATTRS
1826 _mm512_mask_fmsub_ps(__m512 __A, __mmask16 __U, __m512 __B, __m512 __C)
1828 return (__m512) __builtin_ia32_vfmaddps512_mask ((__v16sf) __A,
1835 static __inline__ __m512 __DEFAULT_FN_ATTRS
1836 _mm512_maskz_fmsub_ps(__mmask16 __U, __m512 __A, __m512 __B, __m512 __C)
1838 return (__m512) __builtin_ia32_vfmaddps512_maskz ((__v16sf) __A,
1845 static __inline__ __m512 __DEFAULT_FN_ATTRS
1846 _mm512_fnmadd_ps(__m512 __A, __m512 __B, __m512 __C)
1848 return (__m512) __builtin_ia32_vfmaddps512_mask (-(__v16sf) __A,
1855 static __inline__ __m512 __DEFAULT_FN_ATTRS
1856 _mm512_mask3_fnmadd_ps(__m512 __A, __m512 __B, __m512 __C, __mmask16 __U)
1858 return (__m512) __builtin_ia32_vfmaddps512_mask3 (-(__v16sf) __A,
1865 static __inline__ __m512 __DEFAULT_FN_ATTRS
1866 _mm512_maskz_fnmadd_ps(__mmask16 __U, __m512 __A, __m512 __B, __m512 __C)
1868 return (__m512) __builtin_ia32_vfmaddps512_maskz (-(__v16sf) __A,
1875 static __inline__ __m512 __DEFAULT_FN_ATTRS
1876 _mm512_fnmsub_ps(__m512 __A, __m512 __B, __m512 __C)
1878 return (__m512) __builtin_ia32_vfmaddps512_mask (-(__v16sf) __A,
1885 static __inline__ __m512 __DEFAULT_FN_ATTRS
1886 _mm512_maskz_fnmsub_ps(__mmask16 __U, __m512 __A, __m512 __B, __m512 __C)
1888 return (__m512) __builtin_ia32_vfmaddps512_maskz (-(__v16sf) __A,
2008 (__m512) __builtin_ia32_vfmaddsubps512_mask ((__v16sf) (A), \
2014 (__m512) __builtin_ia32_vfmaddsubps512_mask ((__v16sf) (A), \
2020 (__m512) __builtin_ia32_vfmaddsubps512_mask3 ((__v16sf) (A), \
2026 (__m512) __builtin_ia32_vfmaddsubps512_maskz ((__v16sf) (A), \
2032 (__m512) __builtin_ia32_vfmaddsubps512_mask ((__v16sf) (A), \
2038 (__m512) __builtin_ia32_vfmaddsubps512_mask ((__v16sf) (A), \
2044 (__m512) __builtin_ia32_vfmaddsubps512_maskz ((__v16sf) (A), \
2049 static __inline__ __m512 __DEFAULT_FN_ATTRS
2050 _mm512_fmaddsub_ps(__m512 __A, __m512 __B, __m512 __C)
2052 return (__m512) __builtin_ia32_vfmaddsubps512_mask ((__v16sf) __A,
2059 static __inline__ __m512 __DEFAULT_FN_ATTRS
2060 _mm512_mask_fmaddsub_ps(__m512 __A, __mmask16 __U, __m512 __B, __m512 __C)
2062 return (__m512) __builtin_ia32_vfmaddsubps512_mask ((__v16sf) __A,
2069 static __inline__ __m512 __DEFAULT_FN_ATTRS
2070 _mm512_mask3_fmaddsub_ps(__m512 __A, __m512 __B, __m512 __C, __mmask16 __U)
2072 return (__m512) __builtin_ia32_vfmaddsubps512_mask3 ((__v16sf) __A,
2079 static __inline__ __m512 __DEFAULT_FN_ATTRS
2080 _mm512_maskz_fmaddsub_ps(__mmask16 __U, __m512 __A, __m512 __B, __m512 __C)
2082 return (__m512) __builtin_ia32_vfmaddsubps512_maskz ((__v16sf) __A,
2089 static __inline__ __m512 __DEFAULT_FN_ATTRS
2090 _mm512_fmsubadd_ps(__m512 __A, __m512 __B, __m512 __C)
2092 return (__m512) __builtin_ia32_vfmaddsubps512_mask ((__v16sf) __A,
2099 static __inline__ __m512 __DEFAULT_FN_ATTRS
2100 _mm512_mask_fmsubadd_ps(__m512 __A, __mmask16 __U, __m512 __B, __m512 __C)
2102 return (__m512) __builtin_ia32_vfmaddsubps512_mask ((__v16sf) __A,
2109 static __inline__ __m512 __DEFAULT_FN_ATTRS
2110 _mm512_maskz_fmsubadd_ps(__mmask16 __U, __m512 __A, __m512 __B, __m512 __C)
2112 return (__m512) __builtin_ia32_vfmaddsubps512_maskz ((__v16sf) __A,
2136 (__m512) __builtin_ia32_vfmsubps512_mask3 ((__v16sf) (A), \
2141 static __inline__ __m512 __DEFAULT_FN_ATTRS
2142 _mm512_mask3_fmsub_ps(__m512 __A, __m512 __B, __m512 __C, __mmask16 __U)
2144 return (__m512) __builtin_ia32_vfmsubps512_mask3 ((__v16sf) __A,
2168 (__m512) __builtin_ia32_vfmsubaddps512_mask3 ((__v16sf) (A), \
2173 static __inline__ __m512 __DEFAULT_FN_ATTRS
2174 _mm512_mask3_fmsubadd_ps(__m512 __A, __m512 __B, __m512 __C, __mmask16 __U)
2176 return (__m512) __builtin_ia32_vfmsubaddps512_mask3 ((__v16sf) __A,
2200 (__m512) __builtin_ia32_vfnmaddps512_mask ((__v16sf) (A), \
2205 static __inline__ __m512 __DEFAULT_FN_ATTRS
2206 _mm512_mask_fnmadd_ps(__m512 __A, __mmask16 __U, __m512 __B, __m512 __C)
2208 return (__m512) __builtin_ia32_vfnmaddps512_mask ((__v16sf) __A,
2248 (__m512) __builtin_ia32_vfnmsubps512_mask ((__v16sf) (A), \
2254 (__m512) __builtin_ia32_vfnmsubps512_mask3 ((__v16sf) (A), \
2259 static __inline__ __m512 __DEFAULT_FN_ATTRS
2260 _mm512_mask_fnmsub_ps(__m512 __A, __mmask16 __U, __m512 __B, __m512 __C)
2262 return (__m512) __builtin_ia32_vfnmsubps512_mask ((__v16sf) __A,
2269 static __inline__ __m512 __DEFAULT_FN_ATTRS
2270 _mm512_mask3_fnmsub_ps(__m512 __A, __m512 __B, __m512 __C, __mmask16 __U)
2272 return (__m512) __builtin_ia32_vfnmsubps512_mask3 ((__v16sf) __A,
2311 static __inline __m512 __DEFAULT_FN_ATTRS
2312 _mm512_permutex2var_ps(__m512 __A, __m512i __I, __m512 __B)
2314 return (__m512) __builtin_ia32_vpermt2varps512_mask ((__v16si) __I
2344 __builtin_ia32_extractf32x4_mask((__v16sf)(__m512)(A), \
2359 static __inline __m512 __DEFAULT_FN_ATTRS
2360 _mm512_mask_blend_ps(__mmask16 __U, __m512 __A, __m512 __W)
2362 return (__m512) __builtin_ia32_blendmps_512_mask ((__v16sf) __A,
2386 (__mmask16)__builtin_ia32_cmpps512_mask((__v16sf)(__m512)(A), \
2387 (__v16sf)(__m512)(B), \
2391 (__mmask16)__builtin_ia32_cmpps512_mask((__v16sf)(__m512)(A), \
2392 (__v16sf)(__m512)(B), \
2420 _mm512_cvttps_epu32(__m512 __A)
2430 (__m512)__builtin_ia32_cvtdq2ps512_mask((__v16si)(A), \
2435 (__m512)__builtin_ia32_cvtudq2ps512_mask((__v16si)(A), \
2467 static __inline __m512 __DEFAULT_FN_ATTRS
2470 return (__m512) __builtin_ia32_vcvtph2ps512_mask ((__v16hi) __A,
2478 _mm512_cvttps_epi32(__m512 __a)
2538 static __inline __m512 __DEFAULT_FN_ATTRS
2539 _mm512_unpackhi_ps(__m512 __a, __m512 __b)
2548 static __inline __m512 __DEFAULT_FN_ATTRS
2549 _mm512_unpacklo_ps(__m512 __a, __m512 __b)
2596 static __inline __m512 __DEFAULT_FN_ATTRS
2599 return (__m512) __builtin_ia32_loadups512_mask ((const __v16sf *)__P,
2614 static __inline __m512 __DEFAULT_FN_ATTRS
2617 return (__m512) __builtin_ia32_loadaps512_mask ((const __v16sf *)__P,
2641 static __inline __m512 __DEFAULT_FN_ATTRS
2645 __m512 __v;
2650 static __inline __m512 __DEFAULT_FN_ATTRS
2653 return (__m512) __builtin_ia32_loadaps512_mask ((const __v16sf *)__p,
2697 _mm512_mask_storeu_ps(void *__P, __mmask16 __U, __m512 __A)
2704 _mm512_storeu_ps(void *__P, __m512 __A)
2722 _mm512_mask_store_ps(void *__P, __mmask16 __U, __m512 __A)
2729 _mm512_store_ps(void *__P, __m512 __A)
2731 *(__m512*)__P = __A;