Searched refs:__A (Results 1 - 25 of 42) sorted by relevance

12

/freebsd-current/contrib/llvm-project/clang/lib/Headers/
H A Draointintrin.h20 /// Atomically add a 32-bit value at memory operand \a __A and a 32-bit \a __B,
30 /// \param __A
36 /// MEM[__A+31:__A] := MEM[__A+31:__A] + __B[31:0]
38 static __inline__ void __DEFAULT_FN_ATTRS _aadd_i32(int *__A, int __B) { argument
39 __builtin_ia32_aadd32((int *)__A, __B);
42 /// Atomically and a 32-bit value at memory operand \a __A and a 32-bit \a __B,
52 /// \param __A
60 _aand_i32(int *__A, int __B) argument
82 _aor_i32(int *__A, int __B) argument
104 _axor_i32(int *__A, int __B) argument
127 _aadd_i64(long long *__A, long long __B) argument
150 _aand_i64(long long *__A, long long __B) argument
173 _aor_i64(long long *__A, long long __B) argument
196 _axor_i64(long long *__A, long long __B) argument
[all...]
H A Davxneconvertintrin.h29 /// stored at memory locations starting at location \a __A to a
37 /// _mm_bcstnebf16_ps(const void *__A);
42 /// \param __A
49 /// b := Convert_BF16_To_FP32(MEM[__A+15:__A])
57 _mm_bcstnebf16_ps(const void *__A) { argument
58 return (__m128)__builtin_ia32_vbcstnebf162ps128((const __bf16 *)__A);
62 /// stored at memory locations starting at location \a __A to a
70 /// _mm256_bcstnebf16_ps(const void *__A);
75 /// \param __A
90 _mm256_bcstnebf16_ps(const void *__A) argument
123 _mm_bcstnesh_ps(const void *__A) argument
156 _mm256_bcstnesh_ps(const void *__A) argument
189 _mm_cvtneebf16_ps(const __m128bh *__A) argument
222 _mm256_cvtneebf16_ps(const __m256bh *__A) argument
255 _mm_cvtneeph_ps(const __m128h *__A) argument
288 _mm256_cvtneeph_ps(const __m256h *__A) argument
321 _mm_cvtneobf16_ps(const __m128bh *__A) argument
354 _mm256_cvtneobf16_ps(const __m256bh *__A) argument
387 _mm_cvtneoph_ps(const __m128h *__A) argument
420 _mm256_cvtneoph_ps(const __m256h *__A) argument
448 _mm_cvtneps_avx_pbh(__m128 __A) argument
476 _mm256_cvtneps_avx_pbh(__m256 __A) argument
[all...]
H A Dpopcntintrin.h28 /// \param __A
33 _mm_popcnt_u32(unsigned int __A) argument
35 return __builtin_popcount(__A);
45 /// \param __A
50 _mm_popcnt_u64(unsigned long long __A) argument
52 return __builtin_popcountll(__A);
H A Dusermsrintrin.h17 /// Reads the contents of a 64-bit MSR specified in \a __A into \a dst.
20 /// \param __A
24 /// DEST := MSR[__A]
28 _urdmsr(unsigned long long __A) { argument
29 return __builtin_ia32_urdmsr(__A);
32 /// Writes the contents of \a __B into the 64-bit MSR specified in \a __A.
36 /// \param __A
42 /// MSR[__A] := __B
46 _uwrmsr(unsigned long long __A, unsigned long long __B) { argument
47 return __builtin_ia32_uwrmsr(__A, __
[all...]
H A Davx512cdintrin.h23 _mm512_conflict_epi64 (__m512i __A) argument
25 return (__m512i) __builtin_ia32_vpconflictdi_512 ((__v8di) __A);
29 _mm512_mask_conflict_epi64 (__m512i __W, __mmask8 __U, __m512i __A) argument
32 (__v8di)_mm512_conflict_epi64(__A),
37 _mm512_maskz_conflict_epi64 (__mmask8 __U, __m512i __A) argument
40 (__v8di)_mm512_conflict_epi64(__A),
45 _mm512_conflict_epi32 (__m512i __A) argument
47 return (__m512i) __builtin_ia32_vpconflictsi_512 ((__v16si) __A);
51 _mm512_mask_conflict_epi32 (__m512i __W, __mmask16 __U, __m512i __A) argument
54 (__v16si)_mm512_conflict_epi32(__A),
59 _mm512_maskz_conflict_epi32(__mmask16 __U, __m512i __A) argument
67 _mm512_lzcnt_epi32(__m512i __A) argument
73 _mm512_mask_lzcnt_epi32(__m512i __W, __mmask16 __U, __m512i __A) argument
81 _mm512_maskz_lzcnt_epi32(__mmask16 __U, __m512i __A) argument
89 _mm512_lzcnt_epi64(__m512i __A) argument
95 _mm512_mask_lzcnt_epi64(__m512i __W, __mmask8 __U, __m512i __A) argument
103 _mm512_maskz_lzcnt_epi64(__mmask8 __U, __m512i __A) argument
111 _mm512_broadcastmb_epi64(__mmask8 __A) argument
117 _mm512_broadcastmw_epi32(__mmask16 __A) argument
[all...]
H A Dxopintrin.h24 _mm_maccs_epi16(__m128i __A, __m128i __B, __m128i __C) argument
26 return (__m128i)__builtin_ia32_vpmacssww((__v8hi)__A, (__v8hi)__B, (__v8hi)__C);
30 _mm_macc_epi16(__m128i __A, __m128i __B, __m128i __C) argument
32 return (__m128i)__builtin_ia32_vpmacsww((__v8hi)__A, (__v8hi)__B, (__v8hi)__C);
36 _mm_maccsd_epi16(__m128i __A, __m128i __B, __m128i __C) argument
38 return (__m128i)__builtin_ia32_vpmacsswd((__v8hi)__A, (__v8hi)__B, (__v4si)__C);
42 _mm_maccd_epi16(__m128i __A, __m128i __B, __m128i __C) argument
44 return (__m128i)__builtin_ia32_vpmacswd((__v8hi)__A, (__v8hi)__B, (__v4si)__C);
48 _mm_maccs_epi32(__m128i __A, __m128i __B, __m128i __C) argument
50 return (__m128i)__builtin_ia32_vpmacssdd((__v4si)__A, (__v4s
54 _mm_macc_epi32(__m128i __A, __m128i __B, __m128i __C) argument
60 _mm_maccslo_epi32(__m128i __A, __m128i __B, __m128i __C) argument
66 _mm_macclo_epi32(__m128i __A, __m128i __B, __m128i __C) argument
72 _mm_maccshi_epi32(__m128i __A, __m128i __B, __m128i __C) argument
78 _mm_macchi_epi32(__m128i __A, __m128i __B, __m128i __C) argument
84 _mm_maddsd_epi16(__m128i __A, __m128i __B, __m128i __C) argument
90 _mm_maddd_epi16(__m128i __A, __m128i __B, __m128i __C) argument
96 _mm_haddw_epi8(__m128i __A) argument
102 _mm_haddd_epi8(__m128i __A) argument
108 _mm_haddq_epi8(__m128i __A) argument
114 _mm_haddd_epi16(__m128i __A) argument
120 _mm_haddq_epi16(__m128i __A) argument
126 _mm_haddq_epi32(__m128i __A) argument
132 _mm_haddw_epu8(__m128i __A) argument
138 _mm_haddd_epu8(__m128i __A) argument
144 _mm_haddq_epu8(__m128i __A) argument
150 _mm_haddd_epu16(__m128i __A) argument
156 _mm_haddq_epu16(__m128i __A) argument
162 _mm_haddq_epu32(__m128i __A) argument
168 _mm_hsubw_epi8(__m128i __A) argument
174 _mm_hsubd_epi16(__m128i __A) argument
180 _mm_hsubq_epi32(__m128i __A) argument
186 _mm_cmov_si128(__m128i __A, __m128i __B, __m128i __C) argument
192 _mm256_cmov_si256(__m256i __A, __m256i __B, __m256i __C) argument
198 _mm_perm_epi8(__m128i __A, __m128i __B, __m128i __C) argument
204 _mm_rot_epi8(__m128i __A, __m128i __B) argument
210 _mm_rot_epi16(__m128i __A, __m128i __B) argument
216 _mm_rot_epi32(__m128i __A, __m128i __B) argument
222 _mm_rot_epi64(__m128i __A, __m128i __B) argument
240 _mm_shl_epi8(__m128i __A, __m128i __B) argument
246 _mm_shl_epi16(__m128i __A, __m128i __B) argument
252 _mm_shl_epi32(__m128i __A, __m128i __B) argument
258 _mm_shl_epi64(__m128i __A, __m128i __B) argument
264 _mm_sha_epi8(__m128i __A, __m128i __B) argument
270 _mm_sha_epi16(__m128i __A, __m128i __B) argument
276 _mm_sha_epi32(__m128i __A, __m128i __B) argument
282 _mm_sha_epi64(__m128i __A, __m128i __B) argument
329 _mm_comlt_epu8(__m128i __A, __m128i __B) argument
335 _mm_comle_epu8(__m128i __A, __m128i __B) argument
341 _mm_comgt_epu8(__m128i __A, __m128i __B) argument
347 _mm_comge_epu8(__m128i __A, __m128i __B) argument
353 _mm_comeq_epu8(__m128i __A, __m128i __B) argument
359 _mm_comneq_epu8(__m128i __A, __m128i __B) argument
365 _mm_comfalse_epu8(__m128i __A, __m128i __B) argument
371 _mm_comtrue_epu8(__m128i __A, __m128i __B) argument
377 _mm_comlt_epu16(__m128i __A, __m128i __B) argument
383 _mm_comle_epu16(__m128i __A, __m128i __B) argument
389 _mm_comgt_epu16(__m128i __A, __m128i __B) argument
395 _mm_comge_epu16(__m128i __A, __m128i __B) argument
401 _mm_comeq_epu16(__m128i __A, __m128i __B) argument
407 _mm_comneq_epu16(__m128i __A, __m128i __B) argument
413 _mm_comfalse_epu16(__m128i __A, __m128i __B) argument
419 _mm_comtrue_epu16(__m128i __A, __m128i __B) argument
425 _mm_comlt_epu32(__m128i __A, __m128i __B) argument
431 _mm_comle_epu32(__m128i __A, __m128i __B) argument
437 _mm_comgt_epu32(__m128i __A, __m128i __B) argument
443 _mm_comge_epu32(__m128i __A, __m128i __B) argument
449 _mm_comeq_epu32(__m128i __A, __m128i __B) argument
455 _mm_comneq_epu32(__m128i __A, __m128i __B) argument
461 _mm_comfalse_epu32(__m128i __A, __m128i __B) argument
467 _mm_comtrue_epu32(__m128i __A, __m128i __B) argument
473 _mm_comlt_epu64(__m128i __A, __m128i __B) argument
479 _mm_comle_epu64(__m128i __A, __m128i __B) argument
485 _mm_comgt_epu64(__m128i __A, __m128i __B) argument
491 _mm_comge_epu64(__m128i __A, __m128i __B) argument
497 _mm_comeq_epu64(__m128i __A, __m128i __B) argument
503 _mm_comneq_epu64(__m128i __A, __m128i __B) argument
509 _mm_comfalse_epu64(__m128i __A, __m128i __B) argument
515 _mm_comtrue_epu64(__m128i __A, __m128i __B) argument
521 _mm_comlt_epi8(__m128i __A, __m128i __B) argument
527 _mm_comle_epi8(__m128i __A, __m128i __B) argument
533 _mm_comgt_epi8(__m128i __A, __m128i __B) argument
539 _mm_comge_epi8(__m128i __A, __m128i __B) argument
545 _mm_comeq_epi8(__m128i __A, __m128i __B) argument
551 _mm_comneq_epi8(__m128i __A, __m128i __B) argument
557 _mm_comfalse_epi8(__m128i __A, __m128i __B) argument
563 _mm_comtrue_epi8(__m128i __A, __m128i __B) argument
569 _mm_comlt_epi16(__m128i __A, __m128i __B) argument
575 _mm_comle_epi16(__m128i __A, __m128i __B) argument
581 _mm_comgt_epi16(__m128i __A, __m128i __B) argument
587 _mm_comge_epi16(__m128i __A, __m128i __B) argument
593 _mm_comeq_epi16(__m128i __A, __m128i __B) argument
599 _mm_comneq_epi16(__m128i __A, __m128i __B) argument
605 _mm_comfalse_epi16(__m128i __A, __m128i __B) argument
611 _mm_comtrue_epi16(__m128i __A, __m128i __B) argument
617 _mm_comlt_epi32(__m128i __A, __m128i __B) argument
623 _mm_comle_epi32(__m128i __A, __m128i __B) argument
629 _mm_comgt_epi32(__m128i __A, __m128i __B) argument
635 _mm_comge_epi32(__m128i __A, __m128i __B) argument
641 _mm_comeq_epi32(__m128i __A, __m128i __B) argument
647 _mm_comneq_epi32(__m128i __A, __m128i __B) argument
653 _mm_comfalse_epi32(__m128i __A, __m128i __B) argument
659 _mm_comtrue_epi32(__m128i __A, __m128i __B) argument
665 _mm_comlt_epi64(__m128i __A, __m128i __B) argument
671 _mm_comle_epi64(__m128i __A, __m128i __B) argument
677 _mm_comgt_epi64(__m128i __A, __m128i __B) argument
683 _mm_comge_epi64(__m128i __A, __m128i __B) argument
689 _mm_comeq_epi64(__m128i __A, __m128i __B) argument
695 _mm_comneq_epi64(__m128i __A, __m128i __B) argument
701 _mm_comfalse_epi64(__m128i __A, __m128i __B) argument
707 _mm_comtrue_epi64(__m128i __A, __m128i __B) argument
732 _mm_frcz_ss(__m128 __A) argument
738 _mm_frcz_sd(__m128d __A) argument
744 _mm_frcz_ps(__m128 __A) argument
750 _mm_frcz_pd(__m128d __A) argument
756 _mm256_frcz_ps(__m256 __A) argument
762 _mm256_frcz_pd(__m256d __A) argument
[all...]
H A Davx512vlcdintrin.h27 _mm_broadcastmb_epi64 (__mmask8 __A) argument
29 return (__m128i) _mm_set1_epi64x((long long) __A);
33 _mm256_broadcastmb_epi64 (__mmask8 __A) argument
35 return (__m256i) _mm256_set1_epi64x((long long)__A);
39 _mm_broadcastmw_epi32 (__mmask16 __A) argument
41 return (__m128i) _mm_set1_epi32((int)__A);
45 _mm256_broadcastmw_epi32 (__mmask16 __A) argument
47 return (__m256i) _mm256_set1_epi32((int)__A);
52 _mm_conflict_epi64 (__m128i __A) argument
54 return (__m128i) __builtin_ia32_vpconflictdi_128 ((__v2di) __A);
58 _mm_mask_conflict_epi64(__m128i __W, __mmask8 __U, __m128i __A) argument
66 _mm_maskz_conflict_epi64(__mmask8 __U, __m128i __A) argument
74 _mm256_conflict_epi64(__m256i __A) argument
80 _mm256_mask_conflict_epi64(__m256i __W, __mmask8 __U, __m256i __A) argument
88 _mm256_maskz_conflict_epi64(__mmask8 __U, __m256i __A) argument
96 _mm_conflict_epi32(__m128i __A) argument
102 _mm_mask_conflict_epi32(__m128i __W, __mmask8 __U, __m128i __A) argument
110 _mm_maskz_conflict_epi32(__mmask8 __U, __m128i __A) argument
118 _mm256_conflict_epi32(__m256i __A) argument
124 _mm256_mask_conflict_epi32(__m256i __W, __mmask8 __U, __m256i __A) argument
132 _mm256_maskz_conflict_epi32(__mmask8 __U, __m256i __A) argument
140 _mm_lzcnt_epi32(__m128i __A) argument
146 _mm_mask_lzcnt_epi32(__m128i __W, __mmask8 __U, __m128i __A) argument
154 _mm_maskz_lzcnt_epi32(__mmask8 __U, __m128i __A) argument
162 _mm256_lzcnt_epi32(__m256i __A) argument
168 _mm256_mask_lzcnt_epi32(__m256i __W, __mmask8 __U, __m256i __A) argument
176 _mm256_maskz_lzcnt_epi32(__mmask8 __U, __m256i __A) argument
184 _mm_lzcnt_epi64(__m128i __A) argument
190 _mm_mask_lzcnt_epi64(__m128i __W, __mmask8 __U, __m128i __A) argument
198 _mm_maskz_lzcnt_epi64(__mmask8 __U, __m128i __A) argument
206 _mm256_lzcnt_epi64(__m256i __A) argument
212 _mm256_mask_lzcnt_epi64(__m256i __W, __mmask8 __U, __m256i __A) argument
220 _mm256_maskz_lzcnt_epi64(__mmask8 __U, __m256i __A) argument
[all...]
H A Davx512vpopcntdqvlintrin.h29 _mm_popcnt_epi64(__m128i __A) { argument
30 return (__m128i)__builtin_ia32_vpopcntq_128((__v2di)__A);
34 _mm_mask_popcnt_epi64(__m128i __W, __mmask8 __U, __m128i __A) { argument
36 (__mmask8)__U, (__v2di)_mm_popcnt_epi64(__A), (__v2di)__W);
40 _mm_maskz_popcnt_epi64(__mmask8 __U, __m128i __A) { argument
41 return _mm_mask_popcnt_epi64((__m128i)_mm_setzero_si128(), __U, __A);
45 _mm_popcnt_epi32(__m128i __A) { argument
46 return (__m128i)__builtin_ia32_vpopcntd_128((__v4si)__A);
50 _mm_mask_popcnt_epi32(__m128i __W, __mmask8 __U, __m128i __A) { argument
52 (__mmask8)__U, (__v4si)_mm_popcnt_epi32(__A), (__v4s
56 _mm_maskz_popcnt_epi32(__mmask8 __U, __m128i __A) argument
61 _mm256_popcnt_epi64(__m256i __A) argument
66 _mm256_mask_popcnt_epi64(__m256i __W, __mmask8 __U, __m256i __A) argument
72 _mm256_maskz_popcnt_epi64(__mmask8 __U, __m256i __A) argument
77 _mm256_popcnt_epi32(__m256i __A) argument
82 _mm256_mask_popcnt_epi32(__m256i __W, __mmask8 __U, __m256i __A) argument
88 _mm256_maskz_popcnt_epi32(__mmask8 __U, __m256i __A) argument
[all...]
H A Dfma4intrin.h24 _mm_macc_ps(__m128 __A, __m128 __B, __m128 __C) argument
26 return (__m128)__builtin_ia32_vfmaddps((__v4sf)__A, (__v4sf)__B, (__v4sf)__C);
30 _mm_macc_pd(__m128d __A, __m128d __B, __m128d __C) argument
32 return (__m128d)__builtin_ia32_vfmaddpd((__v2df)__A, (__v2df)__B, (__v2df)__C);
36 _mm_macc_ss(__m128 __A, __m128 __B, __m128 __C) argument
38 return (__m128)__builtin_ia32_vfmaddss((__v4sf)__A, (__v4sf)__B, (__v4sf)__C);
42 _mm_macc_sd(__m128d __A, __m128d __B, __m128d __C) argument
44 return (__m128d)__builtin_ia32_vfmaddsd((__v2df)__A, (__v2df)__B, (__v2df)__C);
48 _mm_msub_ps(__m128 __A, __m128 __B, __m128 __C) argument
50 return (__m128)__builtin_ia32_vfmaddps((__v4sf)__A, (__v4s
54 _mm_msub_pd(__m128d __A, __m128d __B, __m128d __C) argument
60 _mm_msub_ss(__m128 __A, __m128 __B, __m128 __C) argument
66 _mm_msub_sd(__m128d __A, __m128d __B, __m128d __C) argument
72 _mm_nmacc_ps(__m128 __A, __m128 __B, __m128 __C) argument
78 _mm_nmacc_pd(__m128d __A, __m128d __B, __m128d __C) argument
84 _mm_nmacc_ss(__m128 __A, __m128 __B, __m128 __C) argument
90 _mm_nmacc_sd(__m128d __A, __m128d __B, __m128d __C) argument
96 _mm_nmsub_ps(__m128 __A, __m128 __B, __m128 __C) argument
102 _mm_nmsub_pd(__m128d __A, __m128d __B, __m128d __C) argument
108 _mm_nmsub_ss(__m128 __A, __m128 __B, __m128 __C) argument
114 _mm_nmsub_sd(__m128d __A, __m128d __B, __m128d __C) argument
120 _mm_maddsub_ps(__m128 __A, __m128 __B, __m128 __C) argument
126 _mm_maddsub_pd(__m128d __A, __m128d __B, __m128d __C) argument
132 _mm_msubadd_ps(__m128 __A, __m128 __B, __m128 __C) argument
138 _mm_msubadd_pd(__m128d __A, __m128d __B, __m128d __C) argument
144 _mm256_macc_ps(__m256 __A, __m256 __B, __m256 __C) argument
150 _mm256_macc_pd(__m256d __A, __m256d __B, __m256d __C) argument
156 _mm256_msub_ps(__m256 __A, __m256 __B, __m256 __C) argument
162 _mm256_msub_pd(__m256d __A, __m256d __B, __m256d __C) argument
168 _mm256_nmacc_ps(__m256 __A, __m256 __B, __m256 __C) argument
174 _mm256_nmacc_pd(__m256d __A, __m256d __B, __m256d __C) argument
180 _mm256_nmsub_ps(__m256 __A, __m256 __B, __m256 __C) argument
186 _mm256_nmsub_pd(__m256d __A, __m256d __B, __m256d __C) argument
192 _mm256_maddsub_ps(__m256 __A, __m256 __B, __m256 __C) argument
198 _mm256_maddsub_pd(__m256d __A, __m256d __B, __m256d __C) argument
204 _mm256_msubadd_ps(__m256 __A, __m256 __B, __m256 __C) argument
210 _mm256_msubadd_pd(__m256d __A, __m256d __B, __m256d __C) argument
[all...]
H A Davxvnniintrin.h32 /// \fn __m256i _mm256_dpbusd_epi32(__m256i __S, __m256i __A, __m256i __B)
33 /// \fn __m256i _mm256_dpbusds_epi32(__m256i __S, __m256i __A, __m256i __B)
34 /// \fn __m256i _mm256_dpwssd_epi32(__m256i __S, __m256i __A, __m256i __B)
35 /// \fn __m256i _mm256_dpwssds_epi32(__m256i __S, __m256i __A, __m256i __B)
36 /// \fn __m128i _mm_dpbusd_epi32(__m128i __S, __m128i __A, __m128i __B)
37 /// \fn __m128i _mm_dpbusds_epi32(__m128i __S, __m128i __A, __m128i __B)
38 /// \fn __m128i _mm_dpwssd_epi32(__m128i __S, __m128i __A, __m128i __B)
39 /// \fn __m128i _mm_dpwssds_epi32(__m128i __S, __m128i __A, __m128i __B)
46 /// Multiply groups of 4 adjacent pairs of unsigned 8-bit integers in \a __A with
55 /// tmp1.word := Signed(ZeroExtend16(__A
64 _mm256_dpbusd_avx_epi32(__m256i __S, __m256i __A, __m256i __B) argument
87 _mm256_dpbusds_avx_epi32(__m256i __S, __m256i __A, __m256i __B) argument
108 _mm256_dpwssd_avx_epi32(__m256i __S, __m256i __A, __m256i __B) argument
129 _mm256_dpwssds_avx_epi32(__m256i __S, __m256i __A, __m256i __B) argument
152 _mm_dpbusd_avx_epi32(__m128i __S, __m128i __A, __m128i __B) argument
175 _mm_dpbusds_avx_epi32(__m128i __S, __m128i __A, __m128i __B) argument
196 _mm_dpwssd_avx_epi32(__m128i __S, __m128i __A, __m128i __B) argument
217 _mm_dpwssds_avx_epi32(__m128i __S, __m128i __A, __m128i __B) argument
[all...]
H A Dfmaintrin.h22 /// For each element, computes <c> (__A * __B) + __C </c>.
28 /// \param __A
36 _mm_fmadd_ps(__m128 __A, __m128 __B, __m128 __C) argument
38 return (__m128)__builtin_ia32_vfmaddps((__v4sf)__A, (__v4sf)__B, (__v4sf)__C);
42 /// For each element, computes <c> (__A * __B) + __C </c>.
48 /// \param __A
56 _mm_fmadd_pd(__m128d __A, __m128d __B, __m128d __C) argument
58 return (__m128d)__builtin_ia32_vfmaddpd((__v2df)__A, (__v2df)__B, (__v2df)__C);
64 /// result[31:0] = (__A[31:0] * __B[31:0]) + __C[31:0]
65 /// result[127:32] = __A[12
84 _mm_fmadd_ss(__m128 __A, __m128 __B, __m128 __C) argument
112 _mm_fmadd_sd(__m128d __A, __m128d __B, __m128d __C) argument
132 _mm_fmsub_ps(__m128 __A, __m128 __B, __m128 __C) argument
152 _mm_fmsub_pd(__m128d __A, __m128d __B, __m128d __C) argument
180 _mm_fmsub_ss(__m128 __A, __m128 __B, __m128 __C) argument
208 _mm_fmsub_sd(__m128d __A, __m128d __B, __m128d __C) argument
228 _mm_fnmadd_ps(__m128 __A, __m128 __B, __m128 __C) argument
248 _mm_fnmadd_pd(__m128d __A, __m128d __B, __m128d __C) argument
276 _mm_fnmadd_ss(__m128 __A, __m128 __B, __m128 __C) argument
304 _mm_fnmadd_sd(__m128d __A, __m128d __B, __m128d __C) argument
324 _mm_fnmsub_ps(__m128 __A, __m128 __B, __m128 __C) argument
344 _mm_fnmsub_pd(__m128d __A, __m128d __B, __m128d __C) argument
372 _mm_fnmsub_ss(__m128 __A, __m128 __B, __m128 __C) argument
400 _mm_fnmsub_sd(__m128d __A, __m128d __B, __m128d __C) argument
426 _mm_fmaddsub_ps(__m128 __A, __m128 __B, __m128 __C) argument
450 _mm_fmaddsub_pd(__m128d __A, __m128d __B, __m128d __C) argument
476 _mm_fmsubadd_ps(__m128 __A, __m128 __B, __m128 __C) argument
500 _mm_fmsubadd_pd(__m128d __A, __m128d __B, __m128d __C) argument
520 _mm256_fmadd_ps(__m256 __A, __m256 __B, __m256 __C) argument
540 _mm256_fmadd_pd(__m256d __A, __m256d __B, __m256d __C) argument
560 _mm256_fmsub_ps(__m256 __A, __m256 __B, __m256 __C) argument
580 _mm256_fmsub_pd(__m256d __A, __m256d __B, __m256d __C) argument
600 _mm256_fnmadd_ps(__m256 __A, __m256 __B, __m256 __C) argument
620 _mm256_fnmadd_pd(__m256d __A, __m256d __B, __m256d __C) argument
640 _mm256_fnmsub_ps(__m256 __A, __m256 __B, __m256 __C) argument
660 _mm256_fnmsub_pd(__m256d __A, __m256d __B, __m256d __C) argument
690 _mm256_fmaddsub_ps(__m256 __A, __m256 __B, __m256 __C) argument
716 _mm256_fmaddsub_pd(__m256d __A, __m256d __B, __m256d __C) argument
746 _mm256_fmsubadd_ps(__m256 __A, __m256 __B, __m256 __C) argument
772 _mm256_fmsubadd_pd(__m256d __A, __m256d __B, __m256d __C) argument
[all...]
H A Dvaesintrin.h27 _mm256_aesenc_epi128(__m256i __A, __m256i __B) argument
29 return (__m256i) __builtin_ia32_aesenc256((__v4di) __A,
34 _mm256_aesdec_epi128(__m256i __A, __m256i __B) argument
36 return (__m256i) __builtin_ia32_aesdec256((__v4di) __A,
41 _mm256_aesenclast_epi128(__m256i __A, __m256i __B) argument
43 return (__m256i) __builtin_ia32_aesenclast256((__v4di) __A,
48 _mm256_aesdeclast_epi128(__m256i __A, __m256i __B) argument
50 return (__m256i) __builtin_ia32_aesdeclast256((__v4di) __A,
56 _mm512_aesenc_epi128(__m512i __A, __m512i __B) argument
58 return (__m512i) __builtin_ia32_aesenc512((__v8di) __A,
63 _mm512_aesdec_epi128(__m512i __A, __m512i __B) argument
70 _mm512_aesenclast_epi128(__m512i __A, __m512i __B) argument
77 _mm512_aesdeclast_epi128(__m512i __A, __m512i __B) argument
[all...]
H A Davx512vpopcntdqintrin.h24 static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_popcnt_epi64(__m512i __A) { argument
25 return (__m512i)__builtin_ia32_vpopcntq_512((__v8di)__A);
29 _mm512_mask_popcnt_epi64(__m512i __W, __mmask8 __U, __m512i __A) { argument
31 (__mmask8)__U, (__v8di)_mm512_popcnt_epi64(__A), (__v8di)__W);
35 _mm512_maskz_popcnt_epi64(__mmask8 __U, __m512i __A) { argument
36 return _mm512_mask_popcnt_epi64((__m512i)_mm512_setzero_si512(), __U, __A);
39 static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_popcnt_epi32(__m512i __A) { argument
40 return (__m512i)__builtin_ia32_vpopcntd_512((__v16si)__A);
44 _mm512_mask_popcnt_epi32(__m512i __W, __mmask16 __U, __m512i __A) { argument
46 (__mmask16)__U, (__v16si)_mm512_popcnt_epi32(__A), (__v16s
50 _mm512_maskz_popcnt_epi32(__mmask16 __U, __m512i __A) argument
[all...]
H A Davx512bitalgintrin.h24 _mm512_popcnt_epi16(__m512i __A) argument
26 return (__m512i) __builtin_ia32_vpopcntw_512((__v32hi) __A);
30 _mm512_mask_popcnt_epi16(__m512i __A, __mmask32 __U, __m512i __B) argument
34 (__v32hi) __A);
46 _mm512_popcnt_epi8(__m512i __A) argument
48 return (__m512i) __builtin_ia32_vpopcntb_512((__v64qi) __A);
52 _mm512_mask_popcnt_epi8(__m512i __A, __mmask64 __U, __m512i __B) argument
56 (__v64qi) __A);
68 _mm512_mask_bitshuffle_epi64_mask(__mmask64 __U, __m512i __A, __m512i __B) argument
70 return (__mmask64) __builtin_ia32_vpshufbitqmb512_mask((__v64qi) __A,
76 _mm512_bitshuffle_epi64_mask(__m512i __A, __m512i __B) argument
[all...]
H A Dia32intrin.h37 /// \param __A
42 __bsfd(int __A) { argument
43 return __builtin_ctz((unsigned int)__A);
54 /// \param __A
59 __bsrd(int __A) { argument
60 return 31 - __builtin_clz((unsigned int)__A);
70 /// \param __A
74 __bswapd(int __A) { argument
75 return (int)__builtin_bswap32((unsigned int)__A);
85 /// \param __A
89 _bswap(int __A) argument
142 __bsfq(long long __A) argument
158 __bsrq(long long __A) argument
174 __bswapq(long long __A) argument
209 __popcntd(unsigned int __A) argument
246 __popcntq(unsigned long long __A) argument
342 _castf32_u32(float __A) argument
357 _castf64_u64(double __A) argument
372 _castu32_f32(unsigned int __A) argument
387 _castu64_f64(unsigned long long __A) argument
486 __rdpmc(int __A) argument
501 __rdtscp(unsigned int *__A) argument
[all...]
H A Davx512bwintrin.h39 _kand_mask32(__mmask32 __A, __mmask32 __B) argument
41 return (__mmask32)__builtin_ia32_kandsi((__mmask32)__A, (__mmask32)__B);
44 static __inline__ __mmask64 __DEFAULT_FN_ATTRS _kand_mask64(__mmask64 __A, argument
46 return (__mmask64)__builtin_ia32_kanddi((__mmask64)__A, (__mmask64)__B);
50 _kandn_mask32(__mmask32 __A, __mmask32 __B) argument
52 return (__mmask32)__builtin_ia32_kandnsi((__mmask32)__A, (__mmask32)__B);
55 static __inline__ __mmask64 __DEFAULT_FN_ATTRS _kandn_mask64(__mmask64 __A, argument
57 return (__mmask64)__builtin_ia32_kandndi((__mmask64)__A, (__mmask64)__B);
61 _kor_mask32(__mmask32 __A, __mmask32 __B) argument
63 return (__mmask32)__builtin_ia32_korsi((__mmask32)__A, (__mmask3
66 _kor_mask64(__mmask64 __A, __mmask64 __B) argument
72 _kxnor_mask32(__mmask32 __A, __mmask32 __B) argument
77 _kxnor_mask64(__mmask64 __A, __mmask64 __B) argument
83 _kxor_mask32(__mmask32 __A, __mmask32 __B) argument
88 _kxor_mask64(__mmask64 __A, __mmask64 __B) argument
94 _kortestc_mask32_u8(__mmask32 __A, __mmask32 __B) argument
100 _kortestz_mask32_u8(__mmask32 __A, __mmask32 __B) argument
106 _kortest_mask32_u8(__mmask32 __A, __mmask32 __B, unsigned char *__C) argument
112 _kortestc_mask64_u8(__mmask64 __A, __mmask64 __B) argument
117 _kortestz_mask64_u8(__mmask64 __A, __mmask64 __B) argument
122 _kortest_mask64_u8(__mmask64 __A, __mmask64 __B, unsigned char *__C) argument
128 _ktestc_mask32_u8(__mmask32 __A, __mmask32 __B) argument
134 _ktestz_mask32_u8(__mmask32 __A, __mmask32 __B) argument
140 _ktest_mask32_u8(__mmask32 __A, __mmask32 __B, unsigned char *__C) argument
146 _ktestc_mask64_u8(__mmask64 __A, __mmask64 __B) argument
151 _ktestz_mask64_u8(__mmask64 __A, __mmask64 __B) argument
156 _ktest_mask64_u8(__mmask64 __A, __mmask64 __B, unsigned char *__C) argument
162 _kadd_mask32(__mmask32 __A, __mmask32 __B) argument
167 _kadd_mask64(__mmask64 __A, __mmask64 __B) argument
185 _cvtmask32_u32(__mmask32 __A) argument
190 _cvtmask64_u64(__mmask64 __A) argument
195 _cvtu32_mask32(unsigned int __A) argument
200 _cvtu64_mask64(unsigned long long __A) argument
205 _load_mask32(__mmask32 *__A) argument
209 _load_mask64(__mmask64 *__A) argument
214 _store_mask32(__mmask32 *__A, __mmask32 __B) argument
218 _store_mask64(__mmask64 *__A, __mmask64 __B) argument
366 _mm512_add_epi8(__m512i __A, __m512i __B) argument
371 _mm512_mask_add_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B) argument
378 _mm512_maskz_add_epi8(__mmask64 __U, __m512i __A, __m512i __B) argument
385 _mm512_sub_epi8(__m512i __A, __m512i __B) argument
390 _mm512_mask_sub_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B) argument
397 _mm512_maskz_sub_epi8(__mmask64 __U, __m512i __A, __m512i __B) argument
404 _mm512_add_epi16(__m512i __A, __m512i __B) argument
409 _mm512_mask_add_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B) argument
416 _mm512_maskz_add_epi16(__mmask32 __U, __m512i __A, __m512i __B) argument
423 _mm512_sub_epi16(__m512i __A, __m512i __B) argument
428 _mm512_mask_sub_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B) argument
435 _mm512_maskz_sub_epi16(__mmask32 __U, __m512i __A, __m512i __B) argument
442 _mm512_mullo_epi16(__m512i __A, __m512i __B) argument
447 _mm512_mask_mullo_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B) argument
454 _mm512_maskz_mullo_epi16(__mmask32 __U, __m512i __A, __m512i __B) argument
461 _mm512_mask_blend_epi8(__mmask64 __U, __m512i __A, __m512i __W) argument
469 _mm512_mask_blend_epi16(__mmask32 __U, __m512i __A, __m512i __W) argument
477 _mm512_abs_epi8(__m512i __A) argument
483 _mm512_mask_abs_epi8(__m512i __W, __mmask64 __U, __m512i __A) argument
491 _mm512_maskz_abs_epi8(__mmask64 __U, __m512i __A) argument
499 _mm512_abs_epi16(__m512i __A) argument
505 _mm512_mask_abs_epi16(__m512i __W, __mmask32 __U, __m512i __A) argument
513 _mm512_maskz_abs_epi16(__mmask32 __U, __m512i __A) argument
521 _mm512_packs_epi32(__m512i __A, __m512i __B) argument
527 _mm512_maskz_packs_epi32(__mmask32 __M, __m512i __A, __m512i __B) argument
535 _mm512_mask_packs_epi32(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B) argument
543 _mm512_packs_epi16(__m512i __A, __m512i __B) argument
549 _mm512_mask_packs_epi16(__m512i __W, __mmask64 __M, __m512i __A, __m512i __B) argument
557 _mm512_maskz_packs_epi16(__mmask64 __M, __m512i __A, __m512i __B) argument
565 _mm512_packus_epi32(__m512i __A, __m512i __B) argument
571 _mm512_maskz_packus_epi32(__mmask32 __M, __m512i __A, __m512i __B) argument
579 _mm512_mask_packus_epi32(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B) argument
587 _mm512_packus_epi16(__m512i __A, __m512i __B) argument
593 _mm512_mask_packus_epi16(__m512i __W, __mmask64 __M, __m512i __A, __m512i __B) argument
601 _mm512_maskz_packus_epi16(__mmask64 __M, __m512i __A, __m512i __B) argument
609 _mm512_adds_epi8(__m512i __A, __m512i __B) argument
615 _mm512_mask_adds_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B) argument
623 _mm512_maskz_adds_epi8(__mmask64 __U, __m512i __A, __m512i __B) argument
631 _mm512_adds_epi16(__m512i __A, __m512i __B) argument
637 _mm512_mask_adds_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B) argument
645 _mm512_maskz_adds_epi16(__mmask32 __U, __m512i __A, __m512i __B) argument
653 _mm512_adds_epu8(__m512i __A, __m512i __B) argument
659 _mm512_mask_adds_epu8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B) argument
667 _mm512_maskz_adds_epu8(__mmask64 __U, __m512i __A, __m512i __B) argument
675 _mm512_adds_epu16(__m512i __A, __m512i __B) argument
681 _mm512_mask_adds_epu16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B) argument
689 _mm512_maskz_adds_epu16(__mmask32 __U, __m512i __A, __m512i __B) argument
697 _mm512_avg_epu8(__m512i __A, __m512i __B) argument
703 _mm512_mask_avg_epu8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B) argument
712 _mm512_maskz_avg_epu8(__mmask64 __U, __m512i __A, __m512i __B) argument
720 _mm512_avg_epu16(__m512i __A, __m512i __B) argument
726 _mm512_mask_avg_epu16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B) argument
735 _mm512_maskz_avg_epu16(__mmask32 __U, __m512i __A, __m512i __B) argument
743 _mm512_max_epi8(__m512i __A, __m512i __B) argument
749 _mm512_maskz_max_epi8(__mmask64 __M, __m512i __A, __m512i __B) argument
757 _mm512_mask_max_epi8(__m512i __W, __mmask64 __M, __m512i __A, __m512i __B) argument
765 _mm512_max_epi16(__m512i __A, __m512i __B) argument
771 _mm512_maskz_max_epi16(__mmask32 __M, __m512i __A, __m512i __B) argument
779 _mm512_mask_max_epi16(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B) argument
788 _mm512_max_epu8(__m512i __A, __m512i __B) argument
794 _mm512_maskz_max_epu8(__mmask64 __M, __m512i __A, __m512i __B) argument
802 _mm512_mask_max_epu8(__m512i __W, __mmask64 __M, __m512i __A, __m512i __B) argument
810 _mm512_max_epu16(__m512i __A, __m512i __B) argument
816 _mm512_maskz_max_epu16(__mmask32 __M, __m512i __A, __m512i __B) argument
824 _mm512_mask_max_epu16(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B) argument
832 _mm512_min_epi8(__m512i __A, __m512i __B) argument
838 _mm512_maskz_min_epi8(__mmask64 __M, __m512i __A, __m512i __B) argument
846 _mm512_mask_min_epi8(__m512i __W, __mmask64 __M, __m512i __A, __m512i __B) argument
854 _mm512_min_epi16(__m512i __A, __m512i __B) argument
860 _mm512_maskz_min_epi16(__mmask32 __M, __m512i __A, __m512i __B) argument
868 _mm512_mask_min_epi16(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B) argument
876 _mm512_min_epu8(__m512i __A, __m512i __B) argument
882 _mm512_maskz_min_epu8(__mmask64 __M, __m512i __A, __m512i __B) argument
890 _mm512_mask_min_epu8(__m512i __W, __mmask64 __M, __m512i __A, __m512i __B) argument
898 _mm512_min_epu16(__m512i __A, __m512i __B) argument
904 _mm512_maskz_min_epu16(__mmask32 __M, __m512i __A, __m512i __B) argument
912 _mm512_mask_min_epu16(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B) argument
920 _mm512_shuffle_epi8(__m512i __A, __m512i __B) argument
926 _mm512_mask_shuffle_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B) argument
934 _mm512_maskz_shuffle_epi8(__mmask64 __U, __m512i __A, __m512i __B) argument
942 _mm512_subs_epi8(__m512i __A, __m512i __B) argument
948 _mm512_mask_subs_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B) argument
956 _mm512_maskz_subs_epi8(__mmask64 __U, __m512i __A, __m512i __B) argument
964 _mm512_subs_epi16(__m512i __A, __m512i __B) argument
970 _mm512_mask_subs_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B) argument
978 _mm512_maskz_subs_epi16(__mmask32 __U, __m512i __A, __m512i __B) argument
986 _mm512_subs_epu8(__m512i __A, __m512i __B) argument
992 _mm512_mask_subs_epu8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B) argument
1000 _mm512_maskz_subs_epu8(__mmask64 __U, __m512i __A, __m512i __B) argument
1008 _mm512_subs_epu16(__m512i __A, __m512i __B) argument
1014 _mm512_mask_subs_epu16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B) argument
1022 _mm512_maskz_subs_epu16(__mmask32 __U, __m512i __A, __m512i __B) argument
1030 _mm512_permutex2var_epi16(__m512i __A, __m512i __I, __m512i __B) argument
1037 _mm512_mask_permutex2var_epi16(__m512i __A, __mmask32 __U, __m512i __I, __m512i __B) argument
1046 _mm512_mask2_permutex2var_epi16(__m512i __A, __m512i __I, __mmask32 __U, __m512i __B) argument
1055 _mm512_maskz_permutex2var_epi16(__mmask32 __U, __m512i __A, __m512i __I, __m512i __B) argument
1064 _mm512_mulhrs_epi16(__m512i __A, __m512i __B) argument
1070 _mm512_mask_mulhrs_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B) argument
1078 _mm512_maskz_mulhrs_epi16(__mmask32 __U, __m512i __A, __m512i __B) argument
1086 _mm512_mulhi_epi16(__m512i __A, __m512i __B) argument
1092 _mm512_mask_mulhi_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B) argument
1101 _mm512_maskz_mulhi_epi16(__mmask32 __U, __m512i __A, __m512i __B) argument
1109 _mm512_mulhi_epu16(__m512i __A, __m512i __B) argument
1115 _mm512_mask_mulhi_epu16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B) argument
1123 _mm512_maskz_mulhi_epu16(__mmask32 __U, __m512i __A, __m512i __B) argument
1151 _mm512_madd_epi16(__m512i __A, __m512i __B) argument
1156 _mm512_mask_madd_epi16(__m512i __W, __mmask16 __U, __m512i __A, __m512i __B) argument
1163 _mm512_maskz_madd_epi16(__mmask16 __U, __m512i __A, __m512i __B) argument
1170 _mm512_cvtsepi16_epi8(__m512i __A) argument
1177 _mm512_mask_cvtsepi16_epi8(__m256i __O, __mmask32 __M, __m512i __A) argument
1184 _mm512_maskz_cvtsepi16_epi8(__mmask32 __M, __m512i __A) argument
1191 _mm512_cvtusepi16_epi8(__m512i __A) argument
1198 _mm512_mask_cvtusepi16_epi8(__m256i __O, __mmask32 __M, __m512i __A) argument
1205 _mm512_maskz_cvtusepi16_epi8(__mmask32 __M, __m512i __A) argument
1212 _mm512_cvtepi16_epi8(__m512i __A) argument
1219 _mm512_mask_cvtepi16_epi8(__m256i __O, __mmask32 __M, __m512i __A) argument
1226 _mm512_maskz_cvtepi16_epi8(__mmask32 __M, __m512i __A) argument
1233 _mm512_mask_cvtepi16_storeu_epi8(void * __P, __mmask32 __M, __m512i __A) argument
1239 _mm512_mask_cvtsepi16_storeu_epi8(void * __P, __mmask32 __M, __m512i __A) argument
1245 _mm512_mask_cvtusepi16_storeu_epi8(void * __P, __mmask32 __M, __m512i __A) argument
1251 _mm512_unpackhi_epi8(__m512i __A, __m512i __B) argument
1272 _mm512_mask_unpackhi_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B) argument
1279 _mm512_maskz_unpackhi_epi8(__mmask64 __U, __m512i __A, __m512i __B) argument
1286 _mm512_unpackhi_epi16(__m512i __A, __m512i __B) argument
1299 _mm512_mask_unpackhi_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B) argument
1306 _mm512_maskz_unpackhi_epi16(__mmask32 __U, __m512i __A, __m512i __B) argument
1313 _mm512_unpacklo_epi8(__m512i __A, __m512i __B) argument
1334 _mm512_mask_unpacklo_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B) argument
1341 _mm512_maskz_unpacklo_epi8(__mmask64 __U, __m512i __A, __m512i __B) argument
1348 _mm512_unpacklo_epi16(__m512i __A, __m512i __B) argument
1361 _mm512_mask_unpacklo_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B) argument
1368 _mm512_maskz_unpacklo_epi16(__mmask32 __U, __m512i __A, __m512i __B) argument
1375 _mm512_cvtepi8_epi16(__m256i __A) argument
1383 _mm512_mask_cvtepi8_epi16(__m512i __W, __mmask32 __U, __m256i __A) argument
1391 _mm512_maskz_cvtepi8_epi16(__mmask32 __U, __m256i __A) argument
1399 _mm512_cvtepu8_epi16(__m256i __A) argument
1405 _mm512_mask_cvtepu8_epi16(__m512i __W, __mmask32 __U, __m256i __A) argument
1413 _mm512_maskz_cvtepu8_epi16(__mmask32 __U, __m256i __A) argument
1454 _mm512_sllv_epi16(__m512i __A, __m512i __B) argument
1460 _mm512_mask_sllv_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B) argument
1468 _mm512_maskz_sllv_epi16(__mmask32 __U, __m512i __A, __m512i __B) argument
1476 _mm512_sll_epi16(__m512i __A, __m128i __B) argument
1482 _mm512_mask_sll_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m128i __B) argument
1490 _mm512_maskz_sll_epi16(__mmask32 __U, __m512i __A, __m128i __B) argument
1498 _mm512_slli_epi16(__m512i __A, unsigned int __B) argument
1504 _mm512_mask_slli_epi16(__m512i __W, __mmask32 __U, __m512i __A, unsigned int __B) argument
1513 _mm512_maskz_slli_epi16(__mmask32 __U, __m512i __A, unsigned int __B) argument
1524 _mm512_srlv_epi16(__m512i __A, __m512i __B) argument
1530 _mm512_mask_srlv_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B) argument
1538 _mm512_maskz_srlv_epi16(__mmask32 __U, __m512i __A, __m512i __B) argument
1546 _mm512_srav_epi16(__m512i __A, __m512i __B) argument
1552 _mm512_mask_srav_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B) argument
1560 _mm512_maskz_srav_epi16(__mmask32 __U, __m512i __A, __m512i __B) argument
1568 _mm512_sra_epi16(__m512i __A, __m128i __B) argument
1574 _mm512_mask_sra_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m128i __B) argument
1582 _mm512_maskz_sra_epi16(__mmask32 __U, __m512i __A, __m128i __B) argument
1590 _mm512_srai_epi16(__m512i __A, unsigned int __B) argument
1596 _mm512_mask_srai_epi16(__m512i __W, __mmask32 __U, __m512i __A, unsigned int __B) argument
1605 _mm512_maskz_srai_epi16(__mmask32 __U, __m512i __A, unsigned int __B) argument
1613 _mm512_srl_epi16(__m512i __A, __m128i __B) argument
1619 _mm512_mask_srl_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m128i __B) argument
1627 _mm512_maskz_srl_epi16(__mmask32 __U, __m512i __A, __m128i __B) argument
1635 _mm512_srli_epi16(__m512i __A, unsigned int __B) argument
1641 _mm512_mask_srli_epi16(__m512i __W, __mmask32 __U, __m512i __A, unsigned int __B) argument
1650 _mm512_maskz_srli_epi16(__mmask32 __U, __m512i __A, int __B) argument
1661 _mm512_mask_mov_epi16(__m512i __W, __mmask32 __U, __m512i __A) argument
1669 _mm512_maskz_mov_epi16(__mmask32 __U, __m512i __A) argument
1677 _mm512_mask_mov_epi8(__m512i __W, __mmask64 __U, __m512i __A) argument
1685 _mm512_maskz_mov_epi8(__mmask64 __U, __m512i __A) argument
1693 _mm512_mask_set1_epi8(__m512i __O, __mmask64 __M, char __A) argument
1701 _mm512_maskz_set1_epi8(__mmask64 __M, char __A) argument
1708 _mm512_kunpackd(__mmask64 __A, __mmask64 __B) argument
1715 _mm512_kunpackw(__mmask32 __A, __mmask32 __B) argument
1774 _mm512_storeu_epi16(void *__P, __m512i __A) argument
1783 _mm512_mask_storeu_epi16(void *__P, __mmask32 __U, __m512i __A) argument
1791 _mm512_storeu_epi8(void *__P, __m512i __A) argument
1800 _mm512_mask_storeu_epi8(void *__P, __mmask64 __U, __m512i __A) argument
1808 _mm512_test_epi8_mask(__m512i __A, __m512i __B) argument
1815 _mm512_mask_test_epi8_mask(__mmask64 __U, __m512i __A, __m512i __B) argument
1822 _mm512_test_epi16_mask(__m512i __A, __m512i __B) argument
1829 _mm512_mask_test_epi16_mask(__mmask32 __U, __m512i __A, __m512i __B) argument
1836 _mm512_testn_epi8_mask(__m512i __A, __m512i __B) argument
1842 _mm512_mask_testn_epi8_mask(__mmask64 __U, __m512i __A, __m512i __B) argument
1849 _mm512_testn_epi16_mask(__m512i __A, __m512i __B) argument
1856 _mm512_mask_testn_epi16_mask(__mmask32 __U, __m512i __A, __m512i __B) argument
1863 _mm512_movepi8_mask(__m512i __A) argument
1869 _mm512_movepi16_mask(__m512i __A) argument
1875 _mm512_movm_epi8(__mmask64 __A) argument
1881 _mm512_movm_epi16(__mmask32 __A) argument
1887 _mm512_broadcastb_epi8(__m128i __A) argument
1897 _mm512_mask_broadcastb_epi8(__m512i __O, __mmask64 __M, __m128i __A) argument
1905 _mm512_maskz_broadcastb_epi8(__mmask64 __M, __m128i __A) argument
1913 _mm512_mask_set1_epi16(__m512i __O, __mmask32 __M, short __A) argument
1921 _mm512_maskz_set1_epi16(__mmask32 __M, short __A) argument
1929 _mm512_broadcastw_epi16(__m128i __A) argument
1937 _mm512_mask_broadcastw_epi16(__m512i __O, __mmask32 __M, __m128i __A) argument
1945 _mm512_maskz_broadcastw_epi16(__mmask32 __M, __m128i __A) argument
1953 _mm512_permutexvar_epi16(__m512i __A, __m512i __B) argument
1959 _mm512_maskz_permutexvar_epi16(__mmask32 __M, __m512i __A, __m512i __B) argument
1968 _mm512_mask_permutexvar_epi16(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B) argument
2005 _mm512_sad_epu8(__m512i __A, __m512i __B) argument
[all...]
H A Davx512vlbf16intrin.h33 /// \param __A
38 /// conversion of __B, and higher 64 bits come from conversion of __A.
40 _mm_cvtne2ps_pbh(__m128 __A, __m128 __B) { argument
41 return (__m128bh)__builtin_ia32_cvtne2ps2bf16_128((__v4sf) __A,
51 /// \param __A
59 /// A 1 means conversion of __A or __B. A 0 means element from __W.
61 /// conversion of __B, and higher 64 bits come from conversion of __A.
63 _mm_mask_cvtne2ps_pbh(__m128bh __W, __mmask8 __U, __m128 __A, __m128 __B) { argument
65 (__v8bf)_mm_cvtne2ps_pbh(__A, __B),
75 /// \param __A
85 _mm_maskz_cvtne2ps_pbh(__mmask8 __U, __m128 __A, __m128 __B) argument
104 _mm256_cvtne2ps_pbh(__m256 __A, __m256 __B) argument
127 _mm256_mask_cvtne2ps_pbh(__m256bh __W, __mmask16 __U, __m256 __A, __m256 __B) argument
149 _mm256_maskz_cvtne2ps_pbh(__mmask16 __U, __m256 __A, __m256 __B) argument
184 _mm_mask_cvtneps_pbh(__m128bh __W, __mmask8 __U, __m128 __A) argument
204 _mm_maskz_cvtneps_pbh(__mmask8 __U, __m128 __A) argument
237 _mm256_mask_cvtneps_pbh(__m128bh __W, __mmask8 __U, __m256 __A) argument
256 _mm256_maskz_cvtneps_pbh(__mmask8 __U, __m256 __A) argument
277 _mm_dpbf16_ps(__m128 __D, __m128bh __A, __m128bh __B) argument
301 _mm_mask_dpbf16_ps(__m128 __D, __mmask8 __U, __m128bh __A, __m128bh __B) argument
325 _mm_maskz_dpbf16_ps(__mmask8 __U, __m128 __D, __m128bh __A, __m128bh __B) argument
346 _mm256_dpbf16_ps(__m256 __D, __m256bh __A, __m256bh __B) argument
370 _mm256_mask_dpbf16_ps(__m256 __D, __mmask8 __U, __m256bh __A, __m256bh __B) argument
394 _mm256_maskz_dpbf16_ps(__mmask8 __U, __m256 __D, __m256bh __A, __m256bh __B) argument
410 _mm_cvtness_sbh(float __A) argument
424 _mm_cvtpbh_ps(__m128bh __A) argument
436 _mm256_cvtpbh_ps(__m128bh __A) argument
452 _mm_maskz_cvtpbh_ps(__mmask8 __U, __m128bh __A) argument
468 _mm256_maskz_cvtpbh_ps(__mmask8 __U, __m128bh __A) argument
487 _mm_mask_cvtpbh_ps(__m128 __S, __mmask8 __U, __m128bh __A) argument
507 _mm256_mask_cvtpbh_ps(__m256 __S, __mmask8 __U, __m128bh __A) argument
[all...]
H A Davx512bf16intrin.h35 /// \param __A
39 static __inline__ float __DEFAULT_FN_ATTRS _mm_cvtsbh_ss(__bf16 __A) { argument
40 return __builtin_ia32_cvtsbf162ss_32(__A);
49 /// \param __A
54 /// conversion of __B, and higher 256 bits come from conversion of __A.
56 _mm512_cvtne2ps_pbh(__m512 __A, __m512 __B) { argument
57 return (__m512bh)__builtin_ia32_cvtne2ps2bf16_512((__v16sf) __A,
67 /// \param __A
75 /// A 1 means conversion of __A or __B. A 0 means element from __W.
77 /// conversion of __B, and higher 256 bits come from conversion of __A
79 _mm512_mask_cvtne2ps_pbh(__m512bh __W, __mmask32 __U, __m512 __A, __m512 __B) argument
101 _mm512_maskz_cvtne2ps_pbh(__mmask32 __U, __m512 __A, __m512 __B) argument
117 _mm512_cvtneps_pbh(__m512 __A) argument
138 _mm512_mask_cvtneps_pbh(__m256bh __W, __mmask16 __U, __m512 __A) argument
157 _mm512_maskz_cvtneps_pbh(__mmask16 __U, __m512 __A) argument
178 _mm512_dpbf16_ps(__m512 __D, __m512bh __A, __m512bh __B) argument
202 _mm512_mask_dpbf16_ps(__m512 __D, __mmask16 __U, __m512bh __A, __m512bh __B) argument
226 _mm512_maskz_dpbf16_ps(__mmask16 __U, __m512 __D, __m512bh __A, __m512bh __B) argument
239 _mm512_cvtpbh_ps(__m256bh __A) argument
255 _mm512_maskz_cvtpbh_ps(__mmask16 __U, __m256bh __A) argument
273 _mm512_mask_cvtpbh_ps(__m512 __S, __mmask16 __U, __m256bh __A) argument
[all...]
H A Davx512vlintrin.h233 _mm256_mask_add_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument
236 (__v8si)_mm256_add_epi32(__A, __B),
241 _mm256_maskz_add_epi32(__mmask8 __U, __m256i __A, __m256i __B) argument
244 (__v8si)_mm256_add_epi32(__A, __B),
249 _mm256_mask_add_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument
252 (__v4di)_mm256_add_epi64(__A, __B),
257 _mm256_maskz_add_epi64(__mmask8 __U, __m256i __A, __m256i __B) argument
260 (__v4di)_mm256_add_epi64(__A, __B),
265 _mm256_mask_sub_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument
268 (__v8si)_mm256_sub_epi32(__A, __
273 _mm256_maskz_sub_epi32(__mmask8 __U, __m256i __A, __m256i __B) argument
281 _mm256_mask_sub_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument
289 _mm256_maskz_sub_epi64(__mmask8 __U, __m256i __A, __m256i __B) argument
297 _mm_mask_add_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument
305 _mm_maskz_add_epi32(__mmask8 __U, __m128i __A, __m128i __B) argument
313 _mm_mask_add_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument
321 _mm_maskz_add_epi64(__mmask8 __U, __m128i __A, __m128i __B) argument
329 _mm_mask_sub_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument
337 _mm_maskz_sub_epi32(__mmask8 __U, __m128i __A, __m128i __B) argument
345 _mm_mask_sub_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument
353 _mm_maskz_sub_epi64(__mmask8 __U, __m128i __A, __m128i __B) argument
425 _mm256_maskz_mullo_epi32(__mmask8 __M, __m256i __A, __m256i __B) argument
433 _mm256_mask_mullo_epi32(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) argument
441 _mm_maskz_mullo_epi32(__mmask8 __M, __m128i __A, __m128i __B) argument
449 _mm_mask_mullo_epi32(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) argument
463 _mm256_mask_and_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument
471 _mm256_maskz_and_epi32(__mmask8 __U, __m256i __A, __m256i __B) argument
483 _mm_mask_and_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument
491 _mm_maskz_and_epi32(__mmask8 __U, __m128i __A, __m128i __B) argument
497 _mm256_andnot_epi32(__m256i __A, __m256i __B) argument
503 _mm256_mask_andnot_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument
511 _mm256_maskz_andnot_epi32(__mmask8 __U, __m256i __A, __m256i __B) argument
518 _mm_andnot_epi32(__m128i __A, __m128i __B) argument
524 _mm_mask_andnot_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument
532 _mm_maskz_andnot_epi32(__mmask8 __U, __m128i __A, __m128i __B) argument
544 _mm256_mask_or_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument
552 _mm256_maskz_or_epi32(__mmask8 __U, __m256i __A, __m256i __B) argument
564 _mm_mask_or_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument
572 _mm_maskz_or_epi32(__mmask8 __U, __m128i __A, __m128i __B) argument
584 _mm256_mask_xor_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument
592 _mm256_maskz_xor_epi32(__mmask8 __U, __m256i __A, __m256i __B) argument
604 _mm_mask_xor_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument
612 _mm_maskz_xor_epi32(__mmask8 __U, __m128i __A, __m128i __B) argument
624 _mm256_mask_and_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument
632 _mm256_maskz_and_epi64(__mmask8 __U, __m256i __A, __m256i __B) argument
644 _mm_mask_and_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument
652 _mm_maskz_and_epi64(__mmask8 __U, __m128i __A, __m128i __B) argument
658 _mm256_andnot_epi64(__m256i __A, __m256i __B) argument
664 _mm256_mask_andnot_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument
672 _mm256_maskz_andnot_epi64(__mmask8 __U, __m256i __A, __m256i __B) argument
679 _mm_andnot_epi64(__m128i __A, __m128i __B) argument
685 _mm_mask_andnot_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument
693 _mm_maskz_andnot_epi64(__mmask8 __U, __m128i __A, __m128i __B) argument
705 _mm256_mask_or_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument
713 _mm256_maskz_or_epi64(__mmask8 __U, __m256i __A, __m256i __B) argument
725 _mm_mask_or_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument
733 _mm_maskz_or_epi64(__mmask8 __U, __m128i __A, __m128i __B) argument
745 _mm256_mask_xor_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument
753 _mm256_maskz_xor_epi64(__mmask8 __U, __m256i __A, __m256i __B) argument
765 _mm_mask_xor_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument
774 _mm_maskz_xor_epi64(__mmask8 __U, __m128i __A, __m128i __B) argument
900 _mm_mask_fmadd_pd(__m128d __A, __mmask8 __U, __m128d __B, __m128d __C) argument
910 _mm_mask3_fmadd_pd(__m128d __A, __m128d __B, __m128d __C, __mmask8 __U) argument
920 _mm_maskz_fmadd_pd(__mmask8 __U, __m128d __A, __m128d __B, __m128d __C) argument
930 _mm_mask_fmsub_pd(__m128d __A, __mmask8 __U, __m128d __B, __m128d __C) argument
940 _mm_maskz_fmsub_pd(__mmask8 __U, __m128d __A, __m128d __B, __m128d __C) argument
950 _mm_mask3_fnmadd_pd(__m128d __A, __m128d __B, __m128d __C, __mmask8 __U) argument
960 _mm_maskz_fnmadd_pd(__mmask8 __U, __m128d __A, __m128d __B, __m128d __C) argument
970 _mm_maskz_fnmsub_pd(__mmask8 __U, __m128d __A, __m128d __B, __m128d __C) argument
980 _mm256_mask_fmadd_pd(__m256d __A, __mmask8 __U, __m256d __B, __m256d __C) argument
990 _mm256_mask3_fmadd_pd(__m256d __A, __m256d __B, __m256d __C, __mmask8 __U) argument
1000 _mm256_maskz_fmadd_pd(__mmask8 __U, __m256d __A, __m256d __B, __m256d __C) argument
1010 _mm256_mask_fmsub_pd(__m256d __A, __mmask8 __U, __m256d __B, __m256d __C) argument
1020 _mm256_maskz_fmsub_pd(__mmask8 __U, __m256d __A, __m256d __B, __m256d __C) argument
1030 _mm256_mask3_fnmadd_pd(__m256d __A, __m256d __B, __m256d __C, __mmask8 __U) argument
1040 _mm256_maskz_fnmadd_pd(__mmask8 __U, __m256d __A, __m256d __B, __m256d __C) argument
1050 _mm256_maskz_fnmsub_pd(__mmask8 __U, __m256d __A, __m256d __B, __m256d __C) argument
1060 _mm_mask_fmadd_ps(__m128 __A, __mmask8 __U, __m128 __B, __m128 __C) argument
1070 _mm_mask3_fmadd_ps(__m128 __A, __m128 __B, __m128 __C, __mmask8 __U) argument
1080 _mm_maskz_fmadd_ps(__mmask8 __U, __m128 __A, __m128 __B, __m128 __C) argument
1090 _mm_mask_fmsub_ps(__m128 __A, __mmask8 __U, __m128 __B, __m128 __C) argument
1100 _mm_maskz_fmsub_ps(__mmask8 __U, __m128 __A, __m128 __B, __m128 __C) argument
1110 _mm_mask3_fnmadd_ps(__m128 __A, __m128 __B, __m128 __C, __mmask8 __U) argument
1120 _mm_maskz_fnmadd_ps(__mmask8 __U, __m128 __A, __m128 __B, __m128 __C) argument
1130 _mm_maskz_fnmsub_ps(__mmask8 __U, __m128 __A, __m128 __B, __m128 __C) argument
1140 _mm256_mask_fmadd_ps(__m256 __A, __mmask8 __U, __m256 __B, __m256 __C) argument
1150 _mm256_mask3_fmadd_ps(__m256 __A, __m256 __B, __m256 __C, __mmask8 __U) argument
1160 _mm256_maskz_fmadd_ps(__mmask8 __U, __m256 __A, __m256 __B, __m256 __C) argument
1170 _mm256_mask_fmsub_ps(__m256 __A, __mmask8 __U, __m256 __B, __m256 __C) argument
1180 _mm256_maskz_fmsub_ps(__mmask8 __U, __m256 __A, __m256 __B, __m256 __C) argument
1190 _mm256_mask3_fnmadd_ps(__m256 __A, __m256 __B, __m256 __C, __mmask8 __U) argument
1200 _mm256_maskz_fnmadd_ps(__mmask8 __U, __m256 __A, __m256 __B, __m256 __C) argument
1210 _mm256_maskz_fnmsub_ps(__mmask8 __U, __m256 __A, __m256 __B, __m256 __C) argument
1220 _mm_mask_fmaddsub_pd(__m128d __A, __mmask8 __U, __m128d __B, __m128d __C) argument
1230 _mm_mask3_fmaddsub_pd(__m128d __A, __m128d __B, __m128d __C, __mmask8 __U) argument
1240 _mm_maskz_fmaddsub_pd(__mmask8 __U, __m128d __A, __m128d __B, __m128d __C) argument
1250 _mm_mask_fmsubadd_pd(__m128d __A, __mmask8 __U, __m128d __B, __m128d __C) argument
1260 _mm_maskz_fmsubadd_pd(__mmask8 __U, __m128d __A, __m128d __B, __m128d __C) argument
1270 _mm256_mask_fmaddsub_pd(__m256d __A, __mmask8 __U, __m256d __B, __m256d __C) argument
1280 _mm256_mask3_fmaddsub_pd(__m256d __A, __m256d __B, __m256d __C, __mmask8 __U) argument
1290 _mm256_maskz_fmaddsub_pd(__mmask8 __U, __m256d __A, __m256d __B, __m256d __C) argument
1300 _mm256_mask_fmsubadd_pd(__m256d __A, __mmask8 __U, __m256d __B, __m256d __C) argument
1310 _mm256_maskz_fmsubadd_pd(__mmask8 __U, __m256d __A, __m256d __B, __m256d __C) argument
1320 _mm_mask_fmaddsub_ps(__m128 __A, __mmask8 __U, __m128 __B, __m128 __C) argument
1330 _mm_mask3_fmaddsub_ps(__m128 __A, __m128 __B, __m128 __C, __mmask8 __U) argument
1340 _mm_maskz_fmaddsub_ps(__mmask8 __U, __m128 __A, __m128 __B, __m128 __C) argument
1350 _mm_mask_fmsubadd_ps(__m128 __A, __mmask8 __U, __m128 __B, __m128 __C) argument
1360 _mm_maskz_fmsubadd_ps(__mmask8 __U, __m128 __A, __m128 __B, __m128 __C) argument
1370 _mm256_mask_fmaddsub_ps(__m256 __A, __mmask8 __U, __m256 __B, __m256 __C) argument
1381 _mm256_mask3_fmaddsub_ps(__m256 __A, __m256 __B, __m256 __C, __mmask8 __U) argument
1391 _mm256_maskz_fmaddsub_ps(__mmask8 __U, __m256 __A, __m256 __B, __m256 __C) argument
1401 _mm256_mask_fmsubadd_ps(__m256 __A, __mmask8 __U, __m256 __B, __m256 __C) argument
1411 _mm256_maskz_fmsubadd_ps(__mmask8 __U, __m256 __A, __m256 __B, __m256 __C) argument
1421 _mm_mask3_fmsub_pd(__m128d __A, __m128d __B, __m128d __C, __mmask8 __U) argument
1431 _mm256_mask3_fmsub_pd(__m256d __A, __m256d __B, __m256d __C, __mmask8 __U) argument
1441 _mm_mask3_fmsub_ps(__m128 __A, __m128 __B, __m128 __C, __mmask8 __U) argument
1451 _mm256_mask3_fmsub_ps(__m256 __A, __m256 __B, __m256 __C, __mmask8 __U) argument
1461 _mm_mask3_fmsubadd_pd(__m128d __A, __m128d __B, __m128d __C, __mmask8 __U) argument
1471 _mm256_mask3_fmsubadd_pd(__m256d __A, __m256d __B, __m256d __C, __mmask8 __U) argument
1481 _mm_mask3_fmsubadd_ps(__m128 __A, __m128 __B, __m128 __C, __mmask8 __U) argument
1491 _mm256_mask3_fmsubadd_ps(__m256 __A, __m256 __B, __m256 __C, __mmask8 __U) argument
1501 _mm_mask_fnmadd_pd(__m128d __A, __mmask8 __U, __m128d __B, __m128d __C) argument
1511 _mm256_mask_fnmadd_pd(__m256d __A, __mmask8 __U, __m256d __B, __m256d __C) argument
1521 _mm_mask_fnmadd_ps(__m128 __A, __mmask8 __U, __m128 __B, __m128 __C) argument
1531 _mm256_mask_fnmadd_ps(__m256 __A, __mmask8 __U, __m256 __B, __m256 __C) argument
1541 _mm_mask_fnmsub_pd(__m128d __A, __mmask8 __U, __m128d __B, __m128d __C) argument
1551 _mm_mask3_fnmsub_pd(__m128d __A, __m128d __B, __m128d __C, __mmask8 __U) argument
1561 _mm256_mask_fnmsub_pd(__m256d __A, __mmask8 __U, __m256d __B, __m256d __C) argument
1571 _mm256_mask3_fnmsub_pd(__m256d __A, __m256d __B, __m256d __C, __mmask8 __U) argument
1581 _mm_mask_fnmsub_ps(__m128 __A, __mmask8 __U, __m128 __B, __m128 __C) argument
1591 _mm_mask3_fnmsub_ps(__m128 __A, __m128 __B, __m128 __C, __mmask8 __U) argument
1601 _mm256_mask_fnmsub_ps(__m256 __A, __mmask8 __U, __m256 __B, __m256 __C) argument
1611 _mm256_mask3_fnmsub_ps(__m256 __A, __m256 __B, __m256 __C, __mmask8 __U) argument
1621 _mm_mask_add_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) argument
1628 _mm_maskz_add_pd(__mmask8 __U, __m128d __A, __m128d __B) argument
1635 _mm256_mask_add_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) argument
1642 _mm256_maskz_add_pd(__mmask8 __U, __m256d __A, __m256d __B) argument
1649 _mm_mask_add_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) argument
1656 _mm_maskz_add_ps(__mmask8 __U, __m128 __A, __m128 __B) argument
1663 _mm256_mask_add_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) argument
1670 _mm256_maskz_add_ps(__mmask8 __U, __m256 __A, __m256 __B) argument
1677 _mm_mask_blend_epi32(__mmask8 __U, __m128i __A, __m128i __W) argument
1684 _mm256_mask_blend_epi32(__mmask8 __U, __m256i __A, __m256i __W) argument
1691 _mm_mask_blend_pd(__mmask8 __U, __m128d __A, __m128d __W) argument
1698 _mm256_mask_blend_pd(__mmask8 __U, __m256d __A, __m256d __W) argument
1705 _mm_mask_blend_ps(__mmask8 __U, __m128 __A, __m128 __W) argument
1712 _mm256_mask_blend_ps(__mmask8 __U, __m256 __A, __m256 __W) argument
1719 _mm_mask_blend_epi64(__mmask8 __U, __m128i __A, __m128i __W) argument
1726 _mm256_mask_blend_epi64(__mmask8 __U, __m256i __A, __m256i __W) argument
1733 _mm_mask_compress_pd(__m128d __W, __mmask8 __U, __m128d __A) argument
1740 _mm_maskz_compress_pd(__mmask8 __U, __m128d __A) argument
1748 _mm256_mask_compress_pd(__m256d __W, __mmask8 __U, __m256d __A) argument
1755 _mm256_maskz_compress_pd(__mmask8 __U, __m256d __A) argument
1763 _mm_mask_compress_epi64(__m128i __W, __mmask8 __U, __m128i __A) argument
1770 _mm_maskz_compress_epi64(__mmask8 __U, __m128i __A) argument
1778 _mm256_mask_compress_epi64(__m256i __W, __mmask8 __U, __m256i __A) argument
1785 _mm256_maskz_compress_epi64(__mmask8 __U, __m256i __A) argument
1793 _mm_mask_compress_ps(__m128 __W, __mmask8 __U, __m128 __A) argument
1800 _mm_maskz_compress_ps(__mmask8 __U, __m128 __A) argument
1808 _mm256_mask_compress_ps(__m256 __W, __mmask8 __U, __m256 __A) argument
1815 _mm256_maskz_compress_ps(__mmask8 __U, __m256 __A) argument
1823 _mm_mask_compress_epi32(__m128i __W, __mmask8 __U, __m128i __A) argument
1830 _mm_maskz_compress_epi32(__mmask8 __U, __m128i __A) argument
1838 _mm256_mask_compress_epi32(__m256i __W, __mmask8 __U, __m256i __A) argument
1845 _mm256_maskz_compress_epi32(__mmask8 __U, __m256i __A) argument
1853 _mm_mask_compressstoreu_pd(void *__P, __mmask8 __U, __m128d __A) argument
1860 _mm256_mask_compressstoreu_pd(void *__P, __mmask8 __U, __m256d __A) argument
1867 _mm_mask_compressstoreu_epi64(void *__P, __mmask8 __U, __m128i __A) argument
1874 _mm256_mask_compressstoreu_epi64(void *__P, __mmask8 __U, __m256i __A) argument
1881 _mm_mask_compressstoreu_ps(void *__P, __mmask8 __U, __m128 __A) argument
1888 _mm256_mask_compressstoreu_ps(void *__P, __mmask8 __U, __m256 __A) argument
1895 _mm_mask_compressstoreu_epi32(void *__P, __mmask8 __U, __m128i __A) argument
1902 _mm256_mask_compressstoreu_epi32(void *__P, __mmask8 __U, __m256i __A) argument
1909 _mm_mask_cvtepi32_pd(__m128d __W, __mmask8 __U, __m128i __A) argument
1916 _mm_maskz_cvtepi32_pd(__mmask8 __U, __m128i __A) argument
1923 _mm256_mask_cvtepi32_pd(__m256d __W, __mmask8 __U, __m128i __A) argument
1930 _mm256_maskz_cvtepi32_pd(__mmask8 __U, __m128i __A) argument
1937 _mm_mask_cvtepi32_ps(__m128 __W, __mmask8 __U, __m128i __A) argument
1944 _mm_maskz_cvtepi32_ps(__mmask8 __U, __m128i __A) argument
1951 _mm256_mask_cvtepi32_ps(__m256 __W, __mmask8 __U, __m256i __A) argument
1958 _mm256_maskz_cvtepi32_ps(__mmask8 __U, __m256i __A) argument
1965 _mm_mask_cvtpd_epi32(__m128i __W, __mmask8 __U, __m128d __A) argument
1972 _mm_maskz_cvtpd_epi32(__mmask8 __U, __m128d __A) argument
1980 _mm256_mask_cvtpd_epi32(__m128i __W, __mmask8 __U, __m256d __A) argument
1987 _mm256_maskz_cvtpd_epi32(__mmask8 __U, __m256d __A) argument
1994 _mm_mask_cvtpd_ps(__m128 __W, __mmask8 __U, __m128d __A) argument
2001 _mm_maskz_cvtpd_ps(__mmask8 __U, __m128d __A) argument
2009 _mm256_mask_cvtpd_ps(__m128 __W, __mmask8 __U, __m256d __A) argument
2016 _mm256_maskz_cvtpd_ps(__mmask8 __U, __m256d __A) argument
2023 _mm_cvtpd_epu32(__m128d __A) argument
2031 _mm_mask_cvtpd_epu32(__m128i __W, __mmask8 __U, __m128d __A) argument
2038 _mm_maskz_cvtpd_epu32(__mmask8 __U, __m128d __A) argument
2046 _mm256_cvtpd_epu32(__m256d __A) argument
2054 _mm256_mask_cvtpd_epu32(__m128i __W, __mmask8 __U, __m256d __A) argument
2061 _mm256_maskz_cvtpd_epu32(__mmask8 __U, __m256d __A) argument
2069 _mm_mask_cvtps_epi32(__m128i __W, __mmask8 __U, __m128 __A) argument
2076 _mm_maskz_cvtps_epi32(__mmask8 __U, __m128 __A) argument
2083 _mm256_mask_cvtps_epi32(__m256i __W, __mmask8 __U, __m256 __A) argument
2090 _mm256_maskz_cvtps_epi32(__mmask8 __U, __m256 __A) argument
2097 _mm_mask_cvtps_pd(__m128d __W, __mmask8 __U, __m128 __A) argument
2104 _mm_maskz_cvtps_pd(__mmask8 __U, __m128 __A) argument
2111 _mm256_mask_cvtps_pd(__m256d __W, __mmask8 __U, __m128 __A) argument
2118 _mm256_maskz_cvtps_pd(__mmask8 __U, __m128 __A) argument
2125 _mm_cvtps_epu32(__m128 __A) argument
2133 _mm_mask_cvtps_epu32(__m128i __W, __mmask8 __U, __m128 __A) argument
2140 _mm_maskz_cvtps_epu32(__mmask8 __U, __m128 __A) argument
2148 _mm256_cvtps_epu32(__m256 __A) argument
2156 _mm256_mask_cvtps_epu32(__m256i __W, __mmask8 __U, __m256 __A) argument
2163 _mm256_maskz_cvtps_epu32(__mmask8 __U, __m256 __A) argument
2171 _mm_mask_cvttpd_epi32(__m128i __W, __mmask8 __U, __m128d __A) argument
2178 _mm_maskz_cvttpd_epi32(__mmask8 __U, __m128d __A) argument
2186 _mm256_mask_cvttpd_epi32(__m128i __W, __mmask8 __U, __m256d __A) argument
2193 _mm256_maskz_cvttpd_epi32(__mmask8 __U, __m256d __A) argument
2200 _mm_cvttpd_epu32(__m128d __A) argument
2208 _mm_mask_cvttpd_epu32(__m128i __W, __mmask8 __U, __m128d __A) argument
2215 _mm_maskz_cvttpd_epu32(__mmask8 __U, __m128d __A) argument
2223 _mm256_cvttpd_epu32(__m256d __A) argument
2231 _mm256_mask_cvttpd_epu32(__m128i __W, __mmask8 __U, __m256d __A) argument
2238 _mm256_maskz_cvttpd_epu32(__mmask8 __U, __m256d __A) argument
2246 _mm_mask_cvttps_epi32(__m128i __W, __mmask8 __U, __m128 __A) argument
2253 _mm_maskz_cvttps_epi32(__mmask8 __U, __m128 __A) argument
2260 _mm256_mask_cvttps_epi32(__m256i __W, __mmask8 __U, __m256 __A) argument
2267 _mm256_maskz_cvttps_epi32(__mmask8 __U, __m256 __A) argument
2274 _mm_cvttps_epu32(__m128 __A) argument
2282 _mm_mask_cvttps_epu32(__m128i __W, __mmask8 __U, __m128 __A) argument
2289 _mm_maskz_cvttps_epu32(__mmask8 __U, __m128 __A) argument
2297 _mm256_cvttps_epu32(__m256 __A) argument
2305 _mm256_mask_cvttps_epu32(__m256i __W, __mmask8 __U, __m256 __A) argument
2312 _mm256_maskz_cvttps_epu32(__mmask8 __U, __m256 __A) argument
2320 _mm_cvtepu32_pd(__m128i __A) argument
2326 _mm_mask_cvtepu32_pd(__m128d __W, __mmask8 __U, __m128i __A) argument
2333 _mm_maskz_cvtepu32_pd(__mmask8 __U, __m128i __A) argument
2340 _mm256_cvtepu32_pd(__m128i __A) argument
2345 _mm256_mask_cvtepu32_pd(__m256d __W, __mmask8 __U, __m128i __A) argument
2352 _mm256_maskz_cvtepu32_pd(__mmask8 __U, __m128i __A) argument
2359 _mm_cvtepu32_ps(__m128i __A) argument
2364 _mm_mask_cvtepu32_ps(__m128 __W, __mmask8 __U, __m128i __A) argument
2371 _mm_maskz_cvtepu32_ps(__mmask8 __U, __m128i __A) argument
2378 _mm256_cvtepu32_ps(__m256i __A) argument
2383 _mm256_mask_cvtepu32_ps(__m256 __W, __mmask8 __U, __m256i __A) argument
2390 _mm256_maskz_cvtepu32_ps(__mmask8 __U, __m256i __A) argument
2397 _mm_mask_div_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) argument
2404 _mm_maskz_div_pd(__mmask8 __U, __m128d __A, __m128d __B) argument
2411 _mm256_mask_div_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) argument
2418 _mm256_maskz_div_pd(__mmask8 __U, __m256d __A, __m256d __B) argument
2425 _mm_mask_div_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) argument
2432 _mm_maskz_div_ps(__mmask8 __U, __m128 __A, __m128 __B) argument
2439 _mm256_mask_div_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) argument
2446 _mm256_maskz_div_ps(__mmask8 __U, __m256 __A, __m256 __B) argument
2453 _mm_mask_expand_pd(__m128d __W, __mmask8 __U, __m128d __A) argument
2460 _mm_maskz_expand_pd(__mmask8 __U, __m128d __A) argument
2468 _mm256_mask_expand_pd(__m256d __W, __mmask8 __U, __m256d __A) argument
2475 _mm256_maskz_expand_pd(__mmask8 __U, __m256d __A) argument
2483 _mm_mask_expand_epi64(__m128i __W, __mmask8 __U, __m128i __A) argument
2490 _mm_maskz_expand_epi64(__mmask8 __U, __m128i __A) argument
2498 _mm256_mask_expand_epi64(__m256i __W, __mmask8 __U, __m256i __A) argument
2505 _mm256_maskz_expand_epi64(__mmask8 __U, __m256i __A) argument
2648 _mm_mask_expand_ps(__m128 __W, __mmask8 __U, __m128 __A) argument
2655 _mm_maskz_expand_ps(__mmask8 __U, __m128 __A) argument
2663 _mm256_mask_expand_ps(__m256 __W, __mmask8 __U, __m256 __A) argument
2670 _mm256_maskz_expand_ps(__mmask8 __U, __m256 __A) argument
2678 _mm_mask_expand_epi32(__m128i __W, __mmask8 __U, __m128i __A) argument
2685 _mm_maskz_expand_epi32(__mmask8 __U, __m128i __A) argument
2693 _mm256_mask_expand_epi32(__m256i __W, __mmask8 __U, __m256i __A) argument
2700 _mm256_maskz_expand_epi32(__mmask8 __U, __m256i __A) argument
2708 _mm_getexp_pd(__m128d __A) argument
2716 _mm_mask_getexp_pd(__m128d __W, __mmask8 __U, __m128d __A) argument
2723 _mm_maskz_getexp_pd(__mmask8 __U, __m128d __A) argument
2731 _mm256_getexp_pd(__m256d __A) argument
2739 _mm256_mask_getexp_pd(__m256d __W, __mmask8 __U, __m256d __A) argument
2746 _mm256_maskz_getexp_pd(__mmask8 __U, __m256d __A) argument
2754 _mm_getexp_ps(__m128 __A) argument
2762 _mm_mask_getexp_ps(__m128 __W, __mmask8 __U, __m128 __A) argument
2769 _mm_maskz_getexp_ps(__mmask8 __U, __m128 __A) argument
2777 _mm256_getexp_ps(__m256 __A) argument
2785 _mm256_mask_getexp_ps(__m256 __W, __mmask8 __U, __m256 __A) argument
2792 _mm256_maskz_getexp_ps(__mmask8 __U, __m256 __A) argument
2800 _mm_mask_max_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) argument
2807 _mm_maskz_max_pd(__mmask8 __U, __m128d __A, __m128d __B) argument
2814 _mm256_mask_max_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) argument
2821 _mm256_maskz_max_pd(__mmask8 __U, __m256d __A, __m256d __B) argument
2828 _mm_mask_max_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) argument
2835 _mm_maskz_max_ps(__mmask8 __U, __m128 __A, __m128 __B) argument
2842 _mm256_mask_max_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) argument
2849 _mm256_maskz_max_ps(__mmask8 __U, __m256 __A, __m256 __B) argument
2856 _mm_mask_min_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) argument
2863 _mm_maskz_min_pd(__mmask8 __U, __m128d __A, __m128d __B) argument
2870 _mm256_mask_min_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) argument
2877 _mm256_maskz_min_pd(__mmask8 __U, __m256d __A, __m256d __B) argument
2884 _mm_mask_min_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) argument
2891 _mm_maskz_min_ps(__mmask8 __U, __m128 __A, __m128 __B) argument
2898 _mm256_mask_min_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) argument
2905 _mm256_maskz_min_ps(__mmask8 __U, __m256 __A, __m256 __B) argument
2912 _mm_mask_mul_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) argument
2919 _mm_maskz_mul_pd(__mmask8 __U, __m128d __A, __m128d __B) argument
2926 _mm256_mask_mul_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) argument
2933 _mm256_maskz_mul_pd(__mmask8 __U, __m256d __A, __m256d __B) argument
2940 _mm_mask_mul_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) argument
2947 _mm_maskz_mul_ps(__mmask8 __U, __m128 __A, __m128 __B) argument
2954 _mm256_mask_mul_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) argument
2961 _mm256_maskz_mul_ps(__mmask8 __U, __m256 __A, __m256 __B) argument
2968 _mm_mask_abs_epi32(__m128i __W, __mmask8 __U, __m128i __A) argument
2975 _mm_maskz_abs_epi32(__mmask8 __U, __m128i __A) argument
2982 _mm256_mask_abs_epi32(__m256i __W, __mmask8 __U, __m256i __A) argument
2989 _mm256_maskz_abs_epi32(__mmask8 __U, __m256i __A) argument
2996 _mm_abs_epi64(__m128i __A) argument
3001 _mm_mask_abs_epi64(__m128i __W, __mmask8 __U, __m128i __A) argument
3008 _mm_maskz_abs_epi64(__mmask8 __U, __m128i __A) argument
3015 _mm256_abs_epi64(__m256i __A) argument
3020 _mm256_mask_abs_epi64(__m256i __W, __mmask8 __U, __m256i __A) argument
3027 _mm256_maskz_abs_epi64(__mmask8 __U, __m256i __A) argument
3034 _mm_maskz_max_epi32(__mmask8 __M, __m128i __A, __m128i __B) argument
3041 _mm_mask_max_epi32(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) argument
3048 _mm256_maskz_max_epi32(__mmask8 __M, __m256i __A, __m256i __B) argument
3055 _mm256_mask_max_epi32(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) argument
3062 _mm_max_epi64(__m128i __A, __m128i __B) argument
3067 _mm_maskz_max_epi64(__mmask8 __M, __m128i __A, __m128i __B) argument
3074 _mm_mask_max_epi64(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) argument
3081 _mm256_max_epi64(__m256i __A, __m256i __B) argument
3086 _mm256_maskz_max_epi64(__mmask8 __M, __m256i __A, __m256i __B) argument
3093 _mm256_mask_max_epi64(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) argument
3100 _mm_maskz_max_epu32(__mmask8 __M, __m128i __A, __m128i __B) argument
3107 _mm_mask_max_epu32(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) argument
3114 _mm256_maskz_max_epu32(__mmask8 __M, __m256i __A, __m256i __B) argument
3121 _mm256_mask_max_epu32(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) argument
3128 _mm_max_epu64(__m128i __A, __m128i __B) argument
3133 _mm_maskz_max_epu64(__mmask8 __M, __m128i __A, __m128i __B) argument
3140 _mm_mask_max_epu64(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) argument
3147 _mm256_max_epu64(__m256i __A, __m256i __B) argument
3152 _mm256_maskz_max_epu64(__mmask8 __M, __m256i __A, __m256i __B) argument
3159 _mm256_mask_max_epu64(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) argument
3166 _mm_maskz_min_epi32(__mmask8 __M, __m128i __A, __m128i __B) argument
3173 _mm_mask_min_epi32(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) argument
3180 _mm256_maskz_min_epi32(__mmask8 __M, __m256i __A, __m256i __B) argument
3187 _mm256_mask_min_epi32(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) argument
3194 _mm_min_epi64(__m128i __A, __m128i __B) argument
3199 _mm_mask_min_epi64(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) argument
3206 _mm_maskz_min_epi64(__mmask8 __M, __m128i __A, __m128i __B) argument
3213 _mm256_min_epi64(__m256i __A, __m256i __B) argument
3218 _mm256_mask_min_epi64(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) argument
3225 _mm256_maskz_min_epi64(__mmask8 __M, __m256i __A, __m256i __B) argument
3232 _mm_maskz_min_epu32(__mmask8 __M, __m128i __A, __m128i __B) argument
3239 _mm_mask_min_epu32(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) argument
3246 _mm256_maskz_min_epu32(__mmask8 __M, __m256i __A, __m256i __B) argument
3253 _mm256_mask_min_epu32(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) argument
3260 _mm_min_epu64(__m128i __A, __m128i __B) argument
3265 _mm_mask_min_epu64(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) argument
3272 _mm_maskz_min_epu64(__mmask8 __M, __m128i __A, __m128i __B) argument
3279 _mm256_min_epu64(__m256i __A, __m256i __B) argument
3284 _mm256_mask_min_epu64(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) argument
3291 _mm256_maskz_min_epu64(__mmask8 __M, __m256i __A, __m256i __B) argument
3372 _mm_scalef_pd(__m128d __A, __m128d __B) argument
3381 _mm_mask_scalef_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) argument
3390 _mm_maskz_scalef_pd(__mmask8 __U, __m128d __A, __m128d __B) argument
3399 _mm256_scalef_pd(__m256d __A, __m256d __B) argument
3408 _mm256_mask_scalef_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) argument
3417 _mm256_maskz_scalef_pd(__mmask8 __U, __m256d __A, __m256d __B) argument
3426 _mm_scalef_ps(__m128 __A, __m128 __B) argument
3435 _mm_mask_scalef_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) argument
3443 _mm_maskz_scalef_ps(__mmask8 __U, __m128 __A, __m128 __B) argument
3452 _mm256_scalef_ps(__m256 __A, __m256 __B) argument
3461 _mm256_mask_scalef_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) argument
3470 _mm256_maskz_scalef_ps(__mmask8 __U, __m256 __A, __m256 __B) argument
3639 _mm_mask_sqrt_pd(__m128d __W, __mmask8 __U, __m128d __A) argument
3646 _mm_maskz_sqrt_pd(__mmask8 __U, __m128d __A) argument
3653 _mm256_mask_sqrt_pd(__m256d __W, __mmask8 __U, __m256d __A) argument
3660 _mm256_maskz_sqrt_pd(__mmask8 __U, __m256d __A) argument
3667 _mm_mask_sqrt_ps(__m128 __W, __mmask8 __U, __m128 __A) argument
3674 _mm_maskz_sqrt_ps(__mmask8 __U, __m128 __A) argument
3681 _mm256_mask_sqrt_ps(__m256 __W, __mmask8 __U, __m256 __A) argument
3688 _mm256_maskz_sqrt_ps(__mmask8 __U, __m256 __A) argument
3695 _mm_mask_sub_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) argument
3702 _mm_maskz_sub_pd(__mmask8 __U, __m128d __A, __m128d __B) argument
3709 _mm256_mask_sub_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) argument
3716 _mm256_maskz_sub_pd(__mmask8 __U, __m256d __A, __m256d __B) argument
3723 _mm_mask_sub_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) argument
3730 _mm_maskz_sub_ps(__mmask8 __U, __m128 __A, __m128 __B) argument
3737 _mm256_mask_sub_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) argument
3744 _mm256_maskz_sub_ps(__mmask8 __U, __m256 __A, __m256 __B) argument
3751 _mm_permutex2var_epi32(__m128i __A, __m128i __I, __m128i __B) argument
3757 _mm_mask_permutex2var_epi32(__m128i __A, __mmask8 __U, __m128i __I, __m128i __B) argument
3765 _mm_mask2_permutex2var_epi32(__m128i __A, __m128i __I, __mmask8 __U, __m128i __B) argument
3773 _mm_maskz_permutex2var_epi32(__mmask8 __U, __m128i __A, __m128i __I, __m128i __B) argument
3781 _mm256_permutex2var_epi32(__m256i __A, __m256i __I, __m256i __B) argument
3787 _mm256_mask_permutex2var_epi32(__m256i __A, __mmask8 __U, __m256i __I, __m256i __B) argument
3795 _mm256_mask2_permutex2var_epi32(__m256i __A, __m256i __I, __mmask8 __U, __m256i __B) argument
3803 _mm256_maskz_permutex2var_epi32(__mmask8 __U, __m256i __A, __m256i __I, __m256i __B) argument
3811 _mm_permutex2var_pd(__m128d __A, __m128i __I, __m128d __B) argument
3817 _mm_mask_permutex2var_pd(__m128d __A, __mmask8 __U, __m128i __I, __m128d __B) argument
3824 _mm_mask2_permutex2var_pd(__m128d __A, __m128i __I, __mmask8 __U, __m128d __B) argument
3831 _mm_maskz_permutex2var_pd(__mmask8 __U, __m128d __A, __m128i __I, __m128d __B) argument
3838 _mm256_permutex2var_pd(__m256d __A, __m256i __I, __m256d __B) argument
3844 _mm256_mask_permutex2var_pd(__m256d __A, __mmask8 __U, __m256i __I, __m256d __B) argument
3852 _mm256_mask2_permutex2var_pd(__m256d __A, __m256i __I, __mmask8 __U, __m256d __B) argument
3860 _mm256_maskz_permutex2var_pd(__mmask8 __U, __m256d __A, __m256i __I, __m256d __B) argument
3868 _mm_permutex2var_ps(__m128 __A, __m128i __I, __m128 __B) argument
3874 _mm_mask_permutex2var_ps(__m128 __A, __mmask8 __U, __m128i __I, __m128 __B) argument
3881 _mm_mask2_permutex2var_ps(__m128 __A, __m128i __I, __mmask8 __U, __m128 __B) argument
3888 _mm_maskz_permutex2var_ps(__mmask8 __U, __m128 __A, __m128i __I, __m128 __B) argument
3895 _mm256_permutex2var_ps(__m256 __A, __m256i __I, __m256 __B) argument
3901 _mm256_mask_permutex2var_ps(__m256 __A, __mmask8 __U, __m256i __I, __m256 __B) argument
3908 _mm256_mask2_permutex2var_ps(__m256 __A, __m256i __I, __mmask8 __U, __m256 __B) argument
3916 _mm256_maskz_permutex2var_ps(__mmask8 __U, __m256 __A, __m256i __I, __m256 __B) argument
3924 _mm_permutex2var_epi64(__m128i __A, __m128i __I, __m128i __B) argument
3930 _mm_mask_permutex2var_epi64(__m128i __A, __mmask8 __U, __m128i __I, __m128i __B) argument
3938 _mm_mask2_permutex2var_epi64(__m128i __A, __m128i __I, __mmask8 __U, __m128i __B) argument
3946 _mm_maskz_permutex2var_epi64(__mmask8 __U, __m128i __A, __m128i __I, __m128i __B) argument
3955 _mm256_permutex2var_epi64(__m256i __A, __m256i __I, __m256i __B) argument
3961 _mm256_mask_permutex2var_epi64(__m256i __A, __mmask8 __U, __m256i __I, __m256i __B) argument
3969 _mm256_mask2_permutex2var_epi64(__m256i __A, __m256i __I, __mmask8 __U, __m256i __B) argument
3977 _mm256_maskz_permutex2var_epi64(__mmask8 __U, __m256i __A, __m256i __I, __m256i __B) argument
3985 _mm_mask_cvtepi8_epi32(__m128i __W, __mmask8 __U, __m128i __A) argument
3993 _mm_maskz_cvtepi8_epi32(__mmask8 __U, __m128i __A) argument
4001 _mm256_mask_cvtepi8_epi32(__m256i __W, __mmask8 __U, __m128i __A) argument
4009 _mm256_maskz_cvtepi8_epi32(__mmask8 __U, __m128i __A) argument
4017 _mm_mask_cvtepi8_epi64(__m128i __W, __mmask8 __U, __m128i __A) argument
4025 _mm_maskz_cvtepi8_epi64(__mmask8 __U, __m128i __A) argument
4033 _mm256_mask_cvtepi8_epi64(__m256i __W, __mmask8 __U, __m128i __A) argument
4041 _mm256_maskz_cvtepi8_epi64(__mmask8 __U, __m128i __A) argument
4081 _mm_mask_cvtepi16_epi32(__m128i __W, __mmask8 __U, __m128i __A) argument
4089 _mm_maskz_cvtepi16_epi32(__mmask8 __U, __m128i __A) argument
4097 _mm256_mask_cvtepi16_epi32(__m256i __W, __mmask8 __U, __m128i __A) argument
4105 _mm256_maskz_cvtepi16_epi32(__mmask8 __U, __m128i __A) argument
4113 _mm_mask_cvtepi16_epi64(__m128i __W, __mmask8 __U, __m128i __A) argument
4121 _mm_maskz_cvtepi16_epi64(__mmask8 __U, __m128i __A) argument
4129 _mm256_mask_cvtepi16_epi64(__m256i __W, __mmask8 __U, __m128i __A) argument
4137 _mm256_maskz_cvtepi16_epi64(__mmask8 __U, __m128i __A) argument
4146 _mm_mask_cvtepu8_epi32(__m128i __W, __mmask8 __U, __m128i __A) argument
4154 _mm_maskz_cvtepu8_epi32(__mmask8 __U, __m128i __A) argument
4162 _mm256_mask_cvtepu8_epi32(__m256i __W, __mmask8 __U, __m128i __A) argument
4170 _mm256_maskz_cvtepu8_epi32(__mmask8 __U, __m128i __A) argument
4178 _mm_mask_cvtepu8_epi64(__m128i __W, __mmask8 __U, __m128i __A) argument
4186 _mm_maskz_cvtepu8_epi64(__mmask8 __U, __m128i __A) argument
4194 _mm256_mask_cvtepu8_epi64(__m256i __W, __mmask8 __U, __m128i __A) argument
4202 _mm256_maskz_cvtepu8_epi64(__mmask8 __U, __m128i __A) argument
4242 _mm_mask_cvtepu16_epi32(__m128i __W, __mmask8 __U, __m128i __A) argument
4250 _mm_maskz_cvtepu16_epi32(__mmask8 __U, __m128i __A) argument
4258 _mm256_mask_cvtepu16_epi32(__m256i __W, __mmask8 __U, __m128i __A) argument
4266 _mm256_maskz_cvtepu16_epi32(__mmask8 __U, __m128i __A) argument
4274 _mm_mask_cvtepu16_epi64(__m128i __W, __mmask8 __U, __m128i __A) argument
4282 _mm_maskz_cvtepu16_epi64(__mmask8 __U, __m128i __A) argument
4290 _mm256_mask_cvtepu16_epi64(__m256i __W, __mmask8 __U, __m128i __A) argument
4298 _mm256_maskz_cvtepu16_epi64(__mmask8 __U, __m128i __A) argument
4359 _mm_rolv_epi32(__m128i __A, __m128i __B) argument
4365 _mm_mask_rolv_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument
4373 _mm_maskz_rolv_epi32(__mmask8 __U, __m128i __A, __m128i __B) argument
4381 _mm256_rolv_epi32(__m256i __A, __m256i __B) argument
4387 _mm256_mask_rolv_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument
4395 _mm256_maskz_rolv_epi32(__mmask8 __U, __m256i __A, __m256i __B) argument
4403 _mm_rolv_epi64(__m128i __A, __m128i __B) argument
4409 _mm_mask_rolv_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument
4417 _mm_maskz_rolv_epi64(__mmask8 __U, __m128i __A, __m128i __B) argument
4425 _mm256_rolv_epi64(__m256i __A, __m256i __B) argument
4431 _mm256_mask_rolv_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument
4439 _mm256_maskz_rolv_epi64(__mmask8 __U, __m256i __A, __m256i __B) argument
4499 _mm_mask_sll_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument
4507 _mm_maskz_sll_epi32(__mmask8 __U, __m128i __A, __m128i __B) argument
4515 _mm256_mask_sll_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m128i __B) argument
4523 _mm256_maskz_sll_epi32(__mmask8 __U, __m256i __A, __m128i __B) argument
4531 _mm_mask_slli_epi32(__m128i __W, __mmask8 __U, __m128i __A, unsigned int __B) argument
4539 _mm_maskz_slli_epi32(__mmask8 __U, __m128i __A, unsigned int __B) argument
4547 _mm256_mask_slli_epi32(__m256i __W, __mmask8 __U, __m256i __A, unsigned int __B) argument
4555 _mm256_maskz_slli_epi32(__mmask8 __U, __m256i __A, unsigned int __B) argument
4563 _mm_mask_sll_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument
4571 _mm_maskz_sll_epi64(__mmask8 __U, __m128i __A, __m128i __B) argument
4579 _mm256_mask_sll_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m128i __B) argument
4587 _mm256_maskz_sll_epi64(__mmask8 __U, __m256i __A, __m128i __B) argument
4595 _mm_mask_slli_epi64(__m128i __W, __mmask8 __U, __m128i __A, unsigned int __B) argument
4603 _mm_maskz_slli_epi64(__mmask8 __U, __m128i __A, unsigned int __B) argument
4611 _mm256_mask_slli_epi64(__m256i __W, __mmask8 __U, __m256i __A, unsigned int __B) argument
4619 _mm256_maskz_slli_epi64(__mmask8 __U, __m256i __A, unsigned int __B) argument
4627 _mm_rorv_epi32(__m128i __A, __m128i __B) argument
4633 _mm_mask_rorv_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument
4641 _mm_maskz_rorv_epi32(__mmask8 __U, __m128i __A, __m128i __B) argument
4649 _mm256_rorv_epi32(__m256i __A, __m256i __B) argument
4655 _mm256_mask_rorv_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument
4663 _mm256_maskz_rorv_epi32(__mmask8 __U, __m256i __A, __m256i __B) argument
4671 _mm_rorv_epi64(__m128i __A, __m128i __B) argument
4677 _mm_mask_rorv_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument
4685 _mm_maskz_rorv_epi64(__mmask8 __U, __m128i __A, __m128i __B) argument
4693 _mm256_rorv_epi64(__m256i __A, __m256i __B) argument
4699 _mm256_mask_rorv_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument
4707 _mm256_maskz_rorv_epi64(__mmask8 __U, __m256i __A, __m256i __B) argument
4843 _mm_mask_srl_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument
4851 _mm_maskz_srl_epi32(__mmask8 __U, __m128i __A, __m128i __B) argument
4859 _mm256_mask_srl_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m128i __B) argument
4867 _mm256_maskz_srl_epi32(__mmask8 __U, __m256i __A, __m128i __B) argument
4875 _mm_mask_srli_epi32(__m128i __W, __mmask8 __U, __m128i __A, unsigned int __B) argument
4883 _mm_maskz_srli_epi32(__mmask8 __U, __m128i __A, unsigned int __B) argument
4891 _mm256_mask_srli_epi32(__m256i __W, __mmask8 __U, __m256i __A, unsigned int __B) argument
4899 _mm256_maskz_srli_epi32(__mmask8 __U, __m256i __A, unsigned int __B) argument
4907 _mm_mask_srl_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument
4915 _mm_maskz_srl_epi64(__mmask8 __U, __m128i __A, __m128i __B) argument
4923 _mm256_mask_srl_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m128i __B) argument
4931 _mm256_maskz_srl_epi64(__mmask8 __U, __m256i __A, __m128i __B) argument
4939 _mm_mask_srli_epi64(__m128i __W, __mmask8 __U, __m128i __A, unsigned int __B) argument
4947 _mm_maskz_srli_epi64(__mmask8 __U, __m128i __A, unsigned int __B) argument
4955 _mm256_mask_srli_epi64(__m256i __W, __mmask8 __U, __m256i __A, unsigned int __B) argument
4963 _mm256_maskz_srli_epi64(__mmask8 __U, __m256i __A, unsigned int __B) argument
5047 _mm_mask_mov_epi32(__m128i __W, __mmask8 __U, __m128i __A) argument
5055 _mm_maskz_mov_epi32(__mmask8 __U, __m128i __A) argument
5064 _mm256_mask_mov_epi32(__m256i __W, __mmask8 __U, __m256i __A) argument
5072 _mm256_maskz_mov_epi32(__mmask8 __U, __m256i __A) argument
5130 _mm_store_epi32(void *__P, __m128i __A) argument
5136 _mm_mask_store_epi32(void *__P, __mmask8 __U, __m128i __A) argument
5144 _mm256_store_epi32(void *__P, __m256i __A) argument
5150 _mm256_mask_store_epi32(void *__P, __mmask8 __U, __m256i __A) argument
5158 _mm_mask_mov_epi64(__m128i __W, __mmask8 __U, __m128i __A) argument
5166 _mm_maskz_mov_epi64(__mmask8 __U, __m128i __A) argument
5174 _mm256_mask_mov_epi64(__m256i __W, __mmask8 __U, __m256i __A) argument
5182 _mm256_maskz_mov_epi64(__mmask8 __U, __m256i __A) argument
5240 _mm_store_epi64(void *__P, __m128i __A) argument
5246 _mm_mask_store_epi64(void *__P, __mmask8 __U, __m128i __A) argument
5254 _mm256_store_epi64(void *__P, __m256i __A) argument
5260 _mm256_mask_store_epi64(void *__P, __mmask8 __U, __m256i __A) argument
5268 _mm_mask_movedup_pd(__m128d __W, __mmask8 __U, __m128d __A) argument
5276 _mm_maskz_movedup_pd(__mmask8 __U, __m128d __A) argument
5284 _mm256_mask_movedup_pd(__m256d __W, __mmask8 __U, __m256d __A) argument
5292 _mm256_maskz_movedup_pd(__mmask8 __U, __m256d __A) argument
5300 _mm_mask_set1_epi32(__m128i __O, __mmask8 __M, int __A) argument
5308 _mm_maskz_set1_epi32( __mmask8 __M, int __A) argument
5316 _mm256_mask_set1_epi32(__m256i __O, __mmask8 __M, int __A) argument
5324 _mm256_maskz_set1_epi32( __mmask8 __M, int __A) argument
5333 _mm_mask_set1_epi64(__m128i __O, __mmask8 __M, long long __A) argument
5341 _mm_maskz_set1_epi64(__mmask8 __M, long long __A) argument
5349 _mm256_mask_set1_epi64(__m256i __O, __mmask8 __M, long long __A) argument
5357 _mm256_maskz_set1_epi64(__mmask8 __M, long long __A) argument
5677 _mm_mask_store_pd(void *__P, __mmask8 __U, __m128d __A) argument
5685 _mm256_mask_store_pd(void *__P, __mmask8 __U, __m256d __A) argument
5693 _mm_mask_store_ps(void *__P, __mmask8 __U, __m128 __A) argument
5701 _mm256_mask_store_ps(void *__P, __mmask8 __U, __m256 __A) argument
5709 _mm_storeu_epi64(void *__P, __m128i __A) argument
5718 _mm_mask_storeu_epi64(void *__P, __mmask8 __U, __m128i __A) argument
5726 _mm256_storeu_epi64(void *__P, __m256i __A) argument
5735 _mm256_mask_storeu_epi64(void *__P, __mmask8 __U, __m256i __A) argument
5743 _mm_storeu_epi32(void *__P, __m128i __A) argument
5752 _mm_mask_storeu_epi32(void *__P, __mmask8 __U, __m128i __A) argument
5760 _mm256_storeu_epi32(void *__P, __m256i __A) argument
5769 _mm256_mask_storeu_epi32(void *__P, __mmask8 __U, __m256i __A) argument
5777 _mm_mask_storeu_pd(void *__P, __mmask8 __U, __m128d __A) argument
5785 _mm256_mask_storeu_pd(void *__P, __mmask8 __U, __m256d __A) argument
5793 _mm_mask_storeu_ps(void *__P, __mmask8 __U, __m128 __A) argument
5801 _mm256_mask_storeu_ps(void *__P, __mmask8 __U, __m256 __A) argument
5810 _mm_mask_unpackhi_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) argument
5818 _mm_maskz_unpackhi_pd(__mmask8 __U, __m128d __A, __m128d __B) argument
5826 _mm256_mask_unpackhi_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) argument
5834 _mm256_maskz_unpackhi_pd(__mmask8 __U, __m256d __A, __m256d __B) argument
5842 _mm_mask_unpackhi_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) argument
5850 _mm_maskz_unpackhi_ps(__mmask8 __U, __m128 __A, __m128 __B) argument
5858 _mm256_mask_unpackhi_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) argument
5866 _mm256_maskz_unpackhi_ps(__mmask8 __U, __m256 __A, __m256 __B) argument
5874 _mm_mask_unpacklo_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) argument
5882 _mm_maskz_unpacklo_pd(__mmask8 __U, __m128d __A, __m128d __B) argument
5890 _mm256_mask_unpacklo_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) argument
5898 _mm256_maskz_unpacklo_pd(__mmask8 __U, __m256d __A, __m256d __B) argument
5906 _mm_mask_unpacklo_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) argument
5914 _mm_maskz_unpacklo_ps(__mmask8 __U, __m128 __A, __m128 __B) argument
5922 _mm256_mask_unpacklo_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) argument
5930 _mm256_maskz_unpacklo_ps(__mmask8 __U, __m256 __A, __m256 __B) argument
5938 _mm_rcp14_pd(__m128d __A) argument
5947 _mm_mask_rcp14_pd(__m128d __W, __mmask8 __U, __m128d __A) argument
5955 _mm_maskz_rcp14_pd(__mmask8 __U, __m128d __A) argument
5964 _mm256_rcp14_pd(__m256d __A) argument
5973 _mm256_mask_rcp14_pd(__m256d __W, __mmask8 __U, __m256d __A) argument
5981 _mm256_maskz_rcp14_pd(__mmask8 __U, __m256d __A) argument
5990 _mm_rcp14_ps(__m128 __A) argument
5999 _mm_mask_rcp14_ps(__m128 __W, __mmask8 __U, __m128 __A) argument
6007 _mm_maskz_rcp14_ps(__mmask8 __U, __m128 __A) argument
6016 _mm256_rcp14_ps(__m256 __A) argument
6025 _mm256_mask_rcp14_ps(__m256 __W, __mmask8 __U, __m256 __A) argument
6033 _mm256_maskz_rcp14_ps(__mmask8 __U, __m256 __A) argument
6082 _mm_mask_permutevar_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128i __C) argument
6090 _mm_maskz_permutevar_pd(__mmask8 __U, __m128d __A, __m128i __C) argument
6098 _mm256_mask_permutevar_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256i __C) argument
6106 _mm256_maskz_permutevar_pd(__mmask8 __U, __m256d __A, __m256i __C) argument
6114 _mm_mask_permutevar_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128i __C) argument
6122 _mm_maskz_permutevar_ps(__mmask8 __U, __m128 __A, __m128i __C) argument
6130 _mm256_mask_permutevar_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256i __C) argument
6138 _mm256_maskz_permutevar_ps(__mmask8 __U, __m256 __A, __m256i __C) argument
6146 _mm_test_epi32_mask(__m128i __A, __m128i __B) argument
6152 _mm_mask_test_epi32_mask(__mmask8 __U, __m128i __A, __m128i __B) argument
6159 _mm256_test_epi32_mask(__m256i __A, __m256i __B) argument
6166 _mm256_mask_test_epi32_mask(__mmask8 __U, __m256i __A, __m256i __B) argument
6173 _mm_test_epi64_mask(__m128i __A, __m128i __B) argument
6179 _mm_mask_test_epi64_mask(__mmask8 __U, __m128i __A, __m128i __B) argument
6186 _mm256_test_epi64_mask(__m256i __A, __m256i __B) argument
6193 _mm256_mask_test_epi64_mask(__mmask8 __U, __m256i __A, __m256i __B) argument
6200 _mm_testn_epi32_mask(__m128i __A, __m128i __B) argument
6206 _mm_mask_testn_epi32_mask(__mmask8 __U, __m128i __A, __m128i __B) argument
6213 _mm256_testn_epi32_mask(__m256i __A, __m256i __B) argument
6220 _mm256_mask_testn_epi32_mask(__mmask8 __U, __m256i __A, __m256i __B) argument
6227 _mm_testn_epi64_mask(__m128i __A, __m128i __B) argument
6233 _mm_mask_testn_epi64_mask(__mmask8 __U, __m128i __A, __m128i __B) argument
6240 _mm256_testn_epi64_mask(__m256i __A, __m256i __B) argument
6247 _mm256_mask_testn_epi64_mask(__mmask8 __U, __m256i __A, __m256i __B) argument
6254 _mm_mask_unpackhi_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument
6262 _mm_maskz_unpackhi_epi32(__mmask8 __U, __m128i __A, __m128i __B) argument
6270 _mm256_mask_unpackhi_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument
6278 _mm256_maskz_unpackhi_epi32(__mmask8 __U, __m256i __A, __m256i __B) argument
6286 _mm_mask_unpackhi_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument
6294 _mm_maskz_unpackhi_epi64(__mmask8 __U, __m128i __A, __m128i __B) argument
6302 _mm256_mask_unpackhi_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument
6310 _mm256_maskz_unpackhi_epi64(__mmask8 __U, __m256i __A, __m256i __B) argument
6318 _mm_mask_unpacklo_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument
6326 _mm_maskz_unpacklo_epi32(__mmask8 __U, __m128i __A, __m128i __B) argument
6334 _mm256_mask_unpacklo_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument
6342 _mm256_maskz_unpacklo_epi32(__mmask8 __U, __m256i __A, __m256i __B) argument
6350 _mm_mask_unpacklo_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument
6358 _mm_maskz_unpacklo_epi64(__mmask8 __U, __m128i __A, __m128i __B) argument
6366 _mm256_mask_unpacklo_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument
6374 _mm256_maskz_unpacklo_epi64(__mmask8 __U, __m256i __A, __m256i __B) argument
6382 _mm_mask_sra_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument
6390 _mm_maskz_sra_epi32(__mmask8 __U, __m128i __A, __m128i __B) argument
6398 _mm256_mask_sra_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m128i __B) argument
6406 _mm256_maskz_sra_epi32(__mmask8 __U, __m256i __A, __m128i __B) argument
6414 _mm_mask_srai_epi32(__m128i __W, __mmask8 __U, __m128i __A, unsigned int __B) argument
6422 _mm_maskz_srai_epi32(__mmask8 __U, __m128i __A, unsigned int __B) argument
6430 _mm256_mask_srai_epi32(__m256i __W, __mmask8 __U, __m256i __A, unsigned int __B) argument
6438 _mm256_maskz_srai_epi32(__mmask8 __U, __m256i __A, unsigned int __B) argument
6446 _mm_sra_epi64(__m128i __A, __m128i __B) argument
6452 _mm_mask_sra_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument
6460 _mm_maskz_sra_epi64(__mmask8 __U, __m128i __A, __m128i __B) argument
6468 _mm256_sra_epi64(__m256i __A, __m128i __B) argument
6474 _mm256_mask_sra_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m128i __B) argument
6482 _mm256_maskz_sra_epi64(__mmask8 __U, __m256i __A, __m128i __B) argument
6490 _mm_srai_epi64(__m128i __A, unsigned int __imm) argument
6496 _mm_mask_srai_epi64(__m128i __W, __mmask8 __U, __m128i __A, unsigned int __imm) argument
6504 _mm_maskz_srai_epi64(__mmask8 __U, __m128i __A, unsigned int __imm) argument
6512 _mm256_srai_epi64(__m256i __A, unsigned int __imm) argument
6518 _mm256_mask_srai_epi64(__m256i __W, __mmask8 __U, __m256i __A, unsigned int __imm) argument
6527 _mm256_maskz_srai_epi64(__mmask8 __U, __m256i __A, unsigned int __imm) argument
6692 _mm_rsqrt14_pd(__m128d __A) argument
6701 _mm_mask_rsqrt14_pd(__m128d __W, __mmask8 __U, __m128d __A) argument
6709 _mm_maskz_rsqrt14_pd(__mmask8 __U, __m128d __A) argument
6718 _mm256_rsqrt14_pd(__m256d __A) argument
6727 _mm256_mask_rsqrt14_pd(__m256d __W, __mmask8 __U, __m256d __A) argument
6735 _mm256_maskz_rsqrt14_pd(__mmask8 __U, __m256d __A) argument
6744 _mm_rsqrt14_ps(__m128 __A) argument
6753 _mm_mask_rsqrt14_ps(__m128 __W, __mmask8 __U, __m128 __A) argument
6761 _mm_maskz_rsqrt14_ps(__mmask8 __U, __m128 __A) argument
6770 _mm256_rsqrt14_ps(__m256 __A) argument
6779 _mm256_mask_rsqrt14_ps(__m256 __W, __mmask8 __U, __m256 __A) argument
6787 _mm256_maskz_rsqrt14_ps(__mmask8 __U, __m256 __A) argument
6796 _mm256_broadcast_f32x4(__m128 __A) argument
6803 _mm256_mask_broadcast_f32x4(__m256 __O, __mmask8 __M, __m128 __A) argument
6811 _mm256_maskz_broadcast_f32x4(__mmask8 __M, __m128 __A) argument
6819 _mm256_broadcast_i32x4(__m128i __A) argument
6826 _mm256_mask_broadcast_i32x4(__m256i __O, __mmask8 __M, __m128i __A) argument
6834 _mm256_maskz_broadcast_i32x4(__mmask8 __M, __m128i __A) argument
6842 _mm256_mask_broadcastsd_pd(__m256d __O, __mmask8 __M, __m128d __A) argument
6850 _mm256_maskz_broadcastsd_pd(__mmask8 __M, __m128d __A) argument
6858 _mm_mask_broadcastss_ps(__m128 __O, __mmask8 __M, __m128 __A) argument
6866 _mm_maskz_broadcastss_ps(__mmask8 __M, __m128 __A) argument
6874 _mm256_mask_broadcastss_ps(__m256 __O, __mmask8 __M, __m128 __A) argument
6882 _mm256_maskz_broadcastss_ps(__mmask8 __M, __m128 __A) argument
6890 _mm_mask_broadcastd_epi32(__m128i __O, __mmask8 __M, __m128i __A) argument
6898 _mm_maskz_broadcastd_epi32(__mmask8 __M, __m128i __A) argument
6906 _mm256_mask_broadcastd_epi32(__m256i __O, __mmask8 __M, __m128i __A) argument
6914 _mm256_maskz_broadcastd_epi32(__mmask8 __M, __m128i __A) argument
6922 _mm_mask_broadcastq_epi64(__m128i __O, __mmask8 __M, __m128i __A) argument
6930 _mm_maskz_broadcastq_epi64(__mmask8 __M, __m128i __A) argument
6938 _mm256_mask_broadcastq_epi64(__m256i __O, __mmask8 __M, __m128i __A) argument
6946 _mm256_maskz_broadcastq_epi64(__mmask8 __M, __m128i __A) argument
6954 _mm_cvtsepi32_epi8(__m128i __A) argument
6962 _mm_mask_cvtsepi32_epi8(__m128i __O, __mmask8 __M, __m128i __A) argument
6969 _mm_maskz_cvtsepi32_epi8(__mmask8 __M, __m128i __A) argument
6977 _mm_mask_cvtsepi32_storeu_epi8(void * __P, __mmask8 __M, __m128i __A) argument
6983 _mm256_cvtsepi32_epi8(__m256i __A) argument
6991 _mm256_mask_cvtsepi32_epi8(__m128i __O, __mmask8 __M, __m256i __A) argument
6998 _mm256_maskz_cvtsepi32_epi8(__mmask8 __M, __m256i __A) argument
7006 _mm256_mask_cvtsepi32_storeu_epi8(void * __P, __mmask8 __M, __m256i __A) argument
7012 _mm_cvtsepi32_epi16(__m128i __A) argument
7020 _mm_mask_cvtsepi32_epi16(__m128i __O, __mmask8 __M, __m128i __A) argument
7028 _mm_maskz_cvtsepi32_epi16(__mmask8 __M, __m128i __A) argument
7036 _mm_mask_cvtsepi32_storeu_epi16(void * __P, __mmask8 __M, __m128i __A) argument
7042 _mm256_cvtsepi32_epi16(__m256i __A) argument
7050 _mm256_mask_cvtsepi32_epi16(__m128i __O, __mmask8 __M, __m256i __A) argument
7057 _mm256_maskz_cvtsepi32_epi16(__mmask8 __M, __m256i __A) argument
7065 _mm256_mask_cvtsepi32_storeu_epi16(void * __P, __mmask8 __M, __m256i __A) argument
7071 _mm_cvtsepi64_epi8(__m128i __A) argument
7079 _mm_mask_cvtsepi64_epi8(__m128i __O, __mmask8 __M, __m128i __A) argument
7086 _mm_maskz_cvtsepi64_epi8(__mmask8 __M, __m128i __A) argument
7094 _mm_mask_cvtsepi64_storeu_epi8(void * __P, __mmask8 __M, __m128i __A) argument
7100 _mm256_cvtsepi64_epi8(__m256i __A) argument
7108 _mm256_mask_cvtsepi64_epi8(__m128i __O, __mmask8 __M, __m256i __A) argument
7115 _mm256_maskz_cvtsepi64_epi8(__mmask8 __M, __m256i __A) argument
7123 _mm256_mask_cvtsepi64_storeu_epi8(void * __P, __mmask8 __M, __m256i __A) argument
7129 _mm_cvtsepi64_epi32(__m128i __A) argument
7137 _mm_mask_cvtsepi64_epi32(__m128i __O, __mmask8 __M, __m128i __A) argument
7144 _mm_maskz_cvtsepi64_epi32(__mmask8 __M, __m128i __A) argument
7152 _mm_mask_cvtsepi64_storeu_epi32(void * __P, __mmask8 __M, __m128i __A) argument
7158 _mm256_cvtsepi64_epi32(__m256i __A) argument
7166 _mm256_mask_cvtsepi64_epi32(__m128i __O, __mmask8 __M, __m256i __A) argument
7174 _mm256_maskz_cvtsepi64_epi32(__mmask8 __M, __m256i __A) argument
7182 _mm256_mask_cvtsepi64_storeu_epi32(void * __P, __mmask8 __M, __m256i __A) argument
7188 _mm_cvtsepi64_epi16(__m128i __A) argument
7196 _mm_mask_cvtsepi64_epi16(__m128i __O, __mmask8 __M, __m128i __A) argument
7203 _mm_maskz_cvtsepi64_epi16(__mmask8 __M, __m128i __A) argument
7211 _mm_mask_cvtsepi64_storeu_epi16(void * __P, __mmask8 __M, __m128i __A) argument
7217 _mm256_cvtsepi64_epi16(__m256i __A) argument
7225 _mm256_mask_cvtsepi64_epi16(__m128i __O, __mmask8 __M, __m256i __A) argument
7232 _mm256_maskz_cvtsepi64_epi16(__mmask8 __M, __m256i __A) argument
7240 _mm256_mask_cvtsepi64_storeu_epi16(void * __P, __mmask8 __M, __m256i __A) argument
7246 _mm_cvtusepi32_epi8(__m128i __A) argument
7254 _mm_mask_cvtusepi32_epi8(__m128i __O, __mmask8 __M, __m128i __A) argument
7262 _mm_maskz_cvtusepi32_epi8(__mmask8 __M, __m128i __A) argument
7270 _mm_mask_cvtusepi32_storeu_epi8(void * __P, __mmask8 __M, __m128i __A) argument
7276 _mm256_cvtusepi32_epi8(__m256i __A) argument
7284 _mm256_mask_cvtusepi32_epi8(__m128i __O, __mmask8 __M, __m256i __A) argument
7292 _mm256_maskz_cvtusepi32_epi8(__mmask8 __M, __m256i __A) argument
7300 _mm256_mask_cvtusepi32_storeu_epi8(void * __P, __mmask8 __M, __m256i __A) argument
7306 _mm_cvtusepi32_epi16(__m128i __A) argument
7314 _mm_mask_cvtusepi32_epi16(__m128i __O, __mmask8 __M, __m128i __A) argument
7321 _mm_maskz_cvtusepi32_epi16(__mmask8 __M, __m128i __A) argument
7329 _mm_mask_cvtusepi32_storeu_epi16(void * __P, __mmask8 __M, __m128i __A) argument
7335 _mm256_cvtusepi32_epi16(__m256i __A) argument
7343 _mm256_mask_cvtusepi32_epi16(__m128i __O, __mmask8 __M, __m256i __A) argument
7350 _mm256_maskz_cvtusepi32_epi16(__mmask8 __M, __m256i __A) argument
7358 _mm256_mask_cvtusepi32_storeu_epi16(void * __P, __mmask8 __M, __m256i __A) argument
7364 _mm_cvtusepi64_epi8(__m128i __A) argument
7372 _mm_mask_cvtusepi64_epi8(__m128i __O, __mmask8 __M, __m128i __A) argument
7380 _mm_maskz_cvtusepi64_epi8(__mmask8 __M, __m128i __A) argument
7388 _mm_mask_cvtusepi64_storeu_epi8(void * __P, __mmask8 __M, __m128i __A) argument
7394 _mm256_cvtusepi64_epi8(__m256i __A) argument
7402 _mm256_mask_cvtusepi64_epi8(__m128i __O, __mmask8 __M, __m256i __A) argument
7410 _mm256_maskz_cvtusepi64_epi8(__mmask8 __M, __m256i __A) argument
7418 _mm256_mask_cvtusepi64_storeu_epi8(void * __P, __mmask8 __M, __m256i __A) argument
7424 _mm_cvtusepi64_epi32(__m128i __A) argument
7432 _mm_mask_cvtusepi64_epi32(__m128i __O, __mmask8 __M, __m128i __A) argument
7439 _mm_maskz_cvtusepi64_epi32(__mmask8 __M, __m128i __A) argument
7447 _mm_mask_cvtusepi64_storeu_epi32(void * __P, __mmask8 __M, __m128i __A) argument
7453 _mm256_cvtusepi64_epi32(__m256i __A) argument
7461 _mm256_mask_cvtusepi64_epi32(__m128i __O, __mmask8 __M, __m256i __A) argument
7468 _mm256_maskz_cvtusepi64_epi32(__mmask8 __M, __m256i __A) argument
7476 _mm256_mask_cvtusepi64_storeu_epi32(void * __P, __mmask8 __M, __m256i __A) argument
7482 _mm_cvtusepi64_epi16(__m128i __A) argument
7490 _mm_mask_cvtusepi64_epi16(__m128i __O, __mmask8 __M, __m128i __A) argument
7497 _mm_maskz_cvtusepi64_epi16(__mmask8 __M, __m128i __A) argument
7505 _mm_mask_cvtusepi64_storeu_epi16(void * __P, __mmask8 __M, __m128i __A) argument
7511 _mm256_cvtusepi64_epi16(__m256i __A) argument
7519 _mm256_mask_cvtusepi64_epi16(__m128i __O, __mmask8 __M, __m256i __A) argument
7526 _mm256_maskz_cvtusepi64_epi16(__mmask8 __M, __m256i __A) argument
7534 _mm256_mask_cvtusepi64_storeu_epi16(void * __P, __mmask8 __M, __m256i __A) argument
7540 _mm_cvtepi32_epi8(__m128i __A) argument
7548 _mm_mask_cvtepi32_epi8(__m128i __O, __mmask8 __M, __m128i __A) argument
7555 _mm_maskz_cvtepi32_epi8(__mmask8 __M, __m128i __A) argument
7564 _mm_mask_cvtepi32_storeu_epi8(void * __P, __mmask8 __M, __m128i __A) argument
7570 _mm256_cvtepi32_epi8(__m256i __A) argument
7579 _mm256_mask_cvtepi32_epi8(__m128i __O, __mmask8 __M, __m256i __A) argument
7586 _mm256_maskz_cvtepi32_epi8(__mmask8 __M, __m256i __A) argument
7594 _mm256_mask_cvtepi32_storeu_epi8(void * __P, __mmask8 __M, __m256i __A) argument
7600 _mm_cvtepi32_epi16(__m128i __A) argument
7608 _mm_mask_cvtepi32_epi16(__m128i __O, __mmask8 __M, __m128i __A) argument
7615 _mm_maskz_cvtepi32_epi16(__mmask8 __M, __m128i __A) argument
7623 _mm_mask_cvtepi32_storeu_epi16(void * __P, __mmask8 __M, __m128i __A) argument
7629 _mm256_cvtepi32_epi16(__m256i __A) argument
7635 _mm256_mask_cvtepi32_epi16(__m128i __O, __mmask8 __M, __m256i __A) argument
7642 _mm256_maskz_cvtepi32_epi16(__mmask8 __M, __m256i __A) argument
7650 _mm256_mask_cvtepi32_storeu_epi16(void * __P, __mmask8 __M, __m256i __A) argument
7656 _mm_cvtepi64_epi8(__m128i __A) argument
7664 _mm_mask_cvtepi64_epi8(__m128i __O, __mmask8 __M, __m128i __A) argument
7671 _mm_maskz_cvtepi64_epi8(__mmask8 __M, __m128i __A) argument
7679 _mm_mask_cvtepi64_storeu_epi8(void * __P, __mmask8 __M, __m128i __A) argument
7685 _mm256_cvtepi64_epi8(__m256i __A) argument
7693 _mm256_mask_cvtepi64_epi8(__m128i __O, __mmask8 __M, __m256i __A) argument
7700 _mm256_maskz_cvtepi64_epi8(__mmask8 __M, __m256i __A) argument
7708 _mm256_mask_cvtepi64_storeu_epi8(void * __P, __mmask8 __M, __m256i __A) argument
7714 _mm_cvtepi64_epi32(__m128i __A) argument
7721 _mm_mask_cvtepi64_epi32(__m128i __O, __mmask8 __M, __m128i __A) argument
7728 _mm_maskz_cvtepi64_epi32(__mmask8 __M, __m128i __A) argument
7736 _mm_mask_cvtepi64_storeu_epi32(void * __P, __mmask8 __M, __m128i __A) argument
7742 _mm256_cvtepi64_epi32(__m256i __A) argument
7748 _mm256_mask_cvtepi64_epi32(__m128i __O, __mmask8 __M, __m256i __A) argument
7756 _mm256_maskz_cvtepi64_epi32(__mmask8 __M, __m256i __A) argument
7764 _mm256_mask_cvtepi64_storeu_epi32(void * __P, __mmask8 __M, __m256i __A) argument
7770 _mm_cvtepi64_epi16(__m128i __A) argument
7778 _mm_mask_cvtepi64_epi16(__m128i __O, __mmask8 __M, __m128i __A) argument
7786 _mm_maskz_cvtepi64_epi16(__mmask8 __M, __m128i __A) argument
7794 _mm_mask_cvtepi64_storeu_epi16(void * __P, __mmask8 __M, __m128i __A) argument
7800 _mm256_cvtepi64_epi16(__m256i __A) argument
7808 _mm256_mask_cvtepi64_epi16(__m128i __O, __mmask8 __M, __m256i __A) argument
7815 _mm256_maskz_cvtepi64_epi16(__mmask8 __M, __m256i __A) argument
7823 _mm256_mask_cvtepi64_storeu_epi16(void * __P, __mmask8 __M, __m256i __A) argument
8226 _mm_mask_movehdup_ps(__m128 __W, __mmask8 __U, __m128 __A) argument
8234 _mm_maskz_movehdup_ps(__mmask8 __U, __m128 __A) argument
8242 _mm256_mask_movehdup_ps(__m256 __W, __mmask8 __U, __m256 __A) argument
8250 _mm256_maskz_movehdup_ps(__mmask8 __U, __m256 __A) argument
8258 _mm_mask_moveldup_ps(__m128 __W, __mmask8 __U, __m128 __A) argument
8266 _mm_maskz_moveldup_ps(__mmask8 __U, __m128 __A) argument
8274 _mm256_mask_moveldup_ps(__m256 __W, __mmask8 __U, __m256 __A) argument
8282 _mm256_maskz_moveldup_ps(__mmask8 __U, __m256 __A) argument
8310 _mm_mask_mov_pd(__m128d __W, __mmask8 __U, __m128d __A) argument
8318 _mm_maskz_mov_pd(__mmask8 __U, __m128d __A) argument
8326 _mm256_mask_mov_pd(__m256d __W, __mmask8 __U, __m256d __A) argument
8334 _mm256_maskz_mov_pd(__mmask8 __U, __m256d __A) argument
8342 _mm_mask_mov_ps(__m128 __W, __mmask8 __U, __m128 __A) argument
8350 _mm_maskz_mov_ps(__mmask8 __U, __m128 __A) argument
8358 _mm256_mask_mov_ps(__m256 __W, __mmask8 __U, __m256 __A) argument
8366 _mm256_maskz_mov_ps(__mmask8 __U, __m256 __A) argument
8374 _mm_mask_cvtph_ps(__m128 __W, __mmask8 __U, __m128i __A) argument
8382 _mm_maskz_cvtph_ps(__mmask8 __U, __m128i __A) argument
8391 _mm256_mask_cvtph_ps(__m256 __W, __mmask8 __U, __m128i __A) argument
8399 _mm256_maskz_cvtph_ps(__mmask8 __U, __m128i __A) argument
[all...]
H A Davx512vldqintrin.h28 _mm256_mullo_epi64 (__m256i __A, __m256i __B) { argument
29 return (__m256i) ((__v4du) __A * (__v4du) __B);
33 _mm256_mask_mullo_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) { argument
35 (__v4di)_mm256_mullo_epi64(__A, __B),
40 _mm256_maskz_mullo_epi64(__mmask8 __U, __m256i __A, __m256i __B) { argument
42 (__v4di)_mm256_mullo_epi64(__A, __B),
47 _mm_mullo_epi64 (__m128i __A, __m128i __B) { argument
48 return (__m128i) ((__v2du) __A * (__v2du) __B);
52 _mm_mask_mullo_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) { argument
54 (__v2di)_mm_mullo_epi64(__A, __
59 _mm_maskz_mullo_epi64(__mmask8 __U, __m128i __A, __m128i __B) argument
66 _mm256_mask_andnot_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) argument
73 _mm256_maskz_andnot_pd(__mmask8 __U, __m256d __A, __m256d __B) argument
80 _mm_mask_andnot_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) argument
87 _mm_maskz_andnot_pd(__mmask8 __U, __m128d __A, __m128d __B) argument
94 _mm256_mask_andnot_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) argument
101 _mm256_maskz_andnot_ps(__mmask8 __U, __m256 __A, __m256 __B) argument
108 _mm_mask_andnot_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) argument
115 _mm_maskz_andnot_ps(__mmask8 __U, __m128 __A, __m128 __B) argument
122 _mm256_mask_and_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) argument
129 _mm256_maskz_and_pd(__mmask8 __U, __m256d __A, __m256d __B) argument
136 _mm_mask_and_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) argument
143 _mm_maskz_and_pd(__mmask8 __U, __m128d __A, __m128d __B) argument
150 _mm256_mask_and_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) argument
157 _mm256_maskz_and_ps(__mmask8 __U, __m256 __A, __m256 __B) argument
164 _mm_mask_and_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) argument
171 _mm_maskz_and_ps(__mmask8 __U, __m128 __A, __m128 __B) argument
178 _mm256_mask_xor_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) argument
185 _mm256_maskz_xor_pd(__mmask8 __U, __m256d __A, __m256d __B) argument
192 _mm_mask_xor_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) argument
199 _mm_maskz_xor_pd(__mmask8 __U, __m128d __A, __m128d __B) argument
206 _mm256_mask_xor_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) argument
213 _mm256_maskz_xor_ps(__mmask8 __U, __m256 __A, __m256 __B) argument
220 _mm_mask_xor_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) argument
227 _mm_maskz_xor_ps(__mmask8 __U, __m128 __A, __m128 __B) argument
234 _mm256_mask_or_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) argument
241 _mm256_maskz_or_pd(__mmask8 __U, __m256d __A, __m256d __B) argument
248 _mm_mask_or_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) argument
255 _mm_maskz_or_pd(__mmask8 __U, __m128d __A, __m128d __B) argument
262 _mm256_mask_or_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) argument
269 _mm256_maskz_or_ps(__mmask8 __U, __m256 __A, __m256 __B) argument
276 _mm_mask_or_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) argument
283 _mm_maskz_or_ps(__mmask8 __U, __m128 __A, __m128 __B) argument
290 _mm_cvtpd_epi64(__m128d __A) argument
297 _mm_mask_cvtpd_epi64(__m128i __W, __mmask8 __U, __m128d __A) argument
304 _mm_maskz_cvtpd_epi64(__mmask8 __U, __m128d __A) argument
311 _mm256_cvtpd_epi64(__m256d __A) argument
318 _mm256_mask_cvtpd_epi64(__m256i __W, __mmask8 __U, __m256d __A) argument
325 _mm256_maskz_cvtpd_epi64(__mmask8 __U, __m256d __A) argument
332 _mm_cvtpd_epu64(__m128d __A) argument
339 _mm_mask_cvtpd_epu64(__m128i __W, __mmask8 __U, __m128d __A) argument
346 _mm_maskz_cvtpd_epu64(__mmask8 __U, __m128d __A) argument
353 _mm256_cvtpd_epu64(__m256d __A) argument
360 _mm256_mask_cvtpd_epu64(__m256i __W, __mmask8 __U, __m256d __A) argument
367 _mm256_maskz_cvtpd_epu64(__mmask8 __U, __m256d __A) argument
374 _mm_cvtps_epi64(__m128 __A) argument
381 _mm_mask_cvtps_epi64(__m128i __W, __mmask8 __U, __m128 __A) argument
388 _mm_maskz_cvtps_epi64(__mmask8 __U, __m128 __A) argument
395 _mm256_cvtps_epi64(__m128 __A) argument
402 _mm256_mask_cvtps_epi64(__m256i __W, __mmask8 __U, __m128 __A) argument
409 _mm256_maskz_cvtps_epi64(__mmask8 __U, __m128 __A) argument
416 _mm_cvtps_epu64(__m128 __A) argument
423 _mm_mask_cvtps_epu64(__m128i __W, __mmask8 __U, __m128 __A) argument
430 _mm_maskz_cvtps_epu64(__mmask8 __U, __m128 __A) argument
437 _mm256_cvtps_epu64(__m128 __A) argument
444 _mm256_mask_cvtps_epu64(__m256i __W, __mmask8 __U, __m128 __A) argument
451 _mm256_maskz_cvtps_epu64(__mmask8 __U, __m128 __A) argument
458 _mm_cvtepi64_pd(__m128i __A) argument
463 _mm_mask_cvtepi64_pd(__m128d __W, __mmask8 __U, __m128i __A) argument
470 _mm_maskz_cvtepi64_pd(__mmask8 __U, __m128i __A) argument
477 _mm256_cvtepi64_pd(__m256i __A) argument
482 _mm256_mask_cvtepi64_pd(__m256d __W, __mmask8 __U, __m256i __A) argument
489 _mm256_maskz_cvtepi64_pd(__mmask8 __U, __m256i __A) argument
496 _mm_cvtepi64_ps(__m128i __A) argument
503 _mm_mask_cvtepi64_ps(__m128 __W, __mmask8 __U, __m128i __A) argument
510 _mm_maskz_cvtepi64_ps(__mmask8 __U, __m128i __A) argument
517 _mm256_cvtepi64_ps(__m256i __A) argument
522 _mm256_mask_cvtepi64_ps(__m128 __W, __mmask8 __U, __m256i __A) argument
529 _mm256_maskz_cvtepi64_ps(__mmask8 __U, __m256i __A) argument
536 _mm_cvttpd_epi64(__m128d __A) argument
543 _mm_mask_cvttpd_epi64(__m128i __W, __mmask8 __U, __m128d __A) argument
550 _mm_maskz_cvttpd_epi64(__mmask8 __U, __m128d __A) argument
557 _mm256_cvttpd_epi64(__m256d __A) argument
564 _mm256_mask_cvttpd_epi64(__m256i __W, __mmask8 __U, __m256d __A) argument
571 _mm256_maskz_cvttpd_epi64(__mmask8 __U, __m256d __A) argument
578 _mm_cvttpd_epu64(__m128d __A) argument
585 _mm_mask_cvttpd_epu64(__m128i __W, __mmask8 __U, __m128d __A) argument
592 _mm_maskz_cvttpd_epu64(__mmask8 __U, __m128d __A) argument
599 _mm256_cvttpd_epu64(__m256d __A) argument
606 _mm256_mask_cvttpd_epu64(__m256i __W, __mmask8 __U, __m256d __A) argument
613 _mm256_maskz_cvttpd_epu64(__mmask8 __U, __m256d __A) argument
620 _mm_cvttps_epi64(__m128 __A) argument
627 _mm_mask_cvttps_epi64(__m128i __W, __mmask8 __U, __m128 __A) argument
634 _mm_maskz_cvttps_epi64(__mmask8 __U, __m128 __A) argument
641 _mm256_cvttps_epi64(__m128 __A) argument
648 _mm256_mask_cvttps_epi64(__m256i __W, __mmask8 __U, __m128 __A) argument
655 _mm256_maskz_cvttps_epi64(__mmask8 __U, __m128 __A) argument
662 _mm_cvttps_epu64(__m128 __A) argument
669 _mm_mask_cvttps_epu64(__m128i __W, __mmask8 __U, __m128 __A) argument
676 _mm_maskz_cvttps_epu64(__mmask8 __U, __m128 __A) argument
683 _mm256_cvttps_epu64(__m128 __A) argument
690 _mm256_mask_cvttps_epu64(__m256i __W, __mmask8 __U, __m128 __A) argument
697 _mm256_maskz_cvttps_epu64(__mmask8 __U, __m128 __A) argument
704 _mm_cvtepu64_pd(__m128i __A) argument
709 _mm_mask_cvtepu64_pd(__m128d __W, __mmask8 __U, __m128i __A) argument
716 _mm_maskz_cvtepu64_pd(__mmask8 __U, __m128i __A) argument
723 _mm256_cvtepu64_pd(__m256i __A) argument
728 _mm256_mask_cvtepu64_pd(__m256d __W, __mmask8 __U, __m256i __A) argument
735 _mm256_maskz_cvtepu64_pd(__mmask8 __U, __m256i __A) argument
742 _mm_cvtepu64_ps(__m128i __A) argument
749 _mm_mask_cvtepu64_ps(__m128 __W, __mmask8 __U, __m128i __A) argument
756 _mm_maskz_cvtepu64_ps(__mmask8 __U, __m128i __A) argument
763 _mm256_cvtepu64_ps(__m256i __A) argument
768 _mm256_mask_cvtepu64_ps(__m128 __W, __mmask8 __U, __m256i __A) argument
775 _mm256_maskz_cvtepu64_ps(__mmask8 __U, __m256i __A) argument
912 _mm_movepi32_mask(__m128i __A) argument
918 _mm256_movepi32_mask(__m256i __A) argument
924 _mm_movm_epi32(__mmask8 __A) argument
930 _mm256_movm_epi32(__mmask8 __A) argument
936 _mm_movm_epi64(__mmask8 __A) argument
942 _mm256_movm_epi64(__mmask8 __A) argument
948 _mm_movepi64_mask(__m128i __A) argument
954 _mm256_movepi64_mask(__m256i __A) argument
960 _mm256_broadcast_f32x2(__m128 __A) argument
967 _mm256_mask_broadcast_f32x2(__m256 __O, __mmask8 __M, __m128 __A) argument
975 _mm256_maskz_broadcast_f32x2(__mmask8 __M, __m128 __A) argument
983 _mm256_broadcast_f64x2(__m128d __A) argument
990 _mm256_mask_broadcast_f64x2(__m256d __O, __mmask8 __M, __m128d __A) argument
998 _mm256_maskz_broadcast_f64x2(__mmask8 __M, __m128d __A) argument
1006 _mm_broadcast_i32x2(__m128i __A) argument
1013 _mm_mask_broadcast_i32x2(__m128i __O, __mmask8 __M, __m128i __A) argument
1021 _mm_maskz_broadcast_i32x2(__mmask8 __M, __m128i __A) argument
1029 _mm256_broadcast_i32x2(__m128i __A) argument
1036 _mm256_mask_broadcast_i32x2(__m256i __O, __mmask8 __M, __m128i __A) argument
1044 _mm256_maskz_broadcast_i32x2(__mmask8 __M, __m128i __A) argument
1052 _mm256_broadcast_i64x2(__m128i __A) argument
1059 _mm256_mask_broadcast_i64x2(__m256i __O, __mmask8 __M, __m128i __A) argument
1067 _mm256_maskz_broadcast_i64x2(__mmask8 __M, __m128i __A) argument
[all...]
H A Davxvnniint8intrin.h25 /// Multiply groups of 4 adjacent pairs of signed 8-bit integers in \a __A with
33 /// _mm_dpbssd_epi32(__m128i __W, __m128i __A, __m128i __B);
38 /// \param __A
47 /// tmp1.word := SignExtend16(__A.byte[4*j]) * SignExtend16(__B.byte[4*j])
48 /// tmp2.word := SignExtend16(__A.byte[4*j+1]) * SignExtend16(__B.byte[4*j+1])
49 /// tmp3.word := SignExtend16(__A.byte[4*j+2]) * SignExtend16(__B.byte[4*j+2])
50 /// tmp4.word := SignExtend16(__A.byte[4*j+3]) * SignExtend16(__B.byte[4*j+3])
56 __m128i __A,
58 return (__m128i)__builtin_ia32_vpdpbssd128((__v4si)__W, (__v4si)__A,
62 /// Multiply groups of 4 adjacent pairs of signed 8-bit integers in \a __A wit
55 _mm_dpbssd_epi32(__m128i __W, __m128i __A, __m128i __B) argument
93 _mm256_dpbssd_epi32(__m256i __W, __m256i __A, __m256i __B) argument
129 _mm_dpbssds_epi32(__m128i __W, __m128i __A, __m128i __B) argument
168 _mm256_dpbssds_epi32(__m256i __W, __m256i __A, __m256i __B) argument
203 _mm_dpbsud_epi32(__m128i __W, __m128i __A, __m128i __B) argument
241 _mm256_dpbsud_epi32(__m256i __W, __m256i __A, __m256i __B) argument
277 _mm_dpbsuds_epi32(__m128i __W, __m128i __A, __m128i __B) argument
316 _mm256_dpbsuds_epi32(__m256i __W, __m256i __A, __m256i __B) argument
351 _mm_dpbuud_epi32(__m128i __W, __m128i __A, __m128i __B) argument
389 _mm256_dpbuud_epi32(__m256i __W, __m256i __A, __m256i __B) argument
425 _mm_dpbuuds_epi32(__m128i __W, __m128i __A, __m128i __B) argument
464 _mm256_dpbuuds_epi32(__m256i __W, __m256i __A, __m256i __B) argument
[all...]
H A Davxvnniint16intrin.h26 /// Multiply groups of 2 adjacent pairs of signed 16-bit integers in \a __A with
34 /// __m128i _mm_dpwsud_epi32(__m128i __W, __m128i __A, __m128i __B)
41 /// \param __A
50 /// tmp1.dword := SignExtend32(__A.word[2*j]) * ZeroExtend32(__B.word[2*j])
51 /// tmp2.dword := SignExtend32(__A.word[2*j+1]) * ZeroExtend32(__B.word[2*j+1])
57 __m128i __A,
59 return (__m128i)__builtin_ia32_vpdpwsud128((__v4si)__W, (__v4si)__A,
63 /// Multiply groups of 2 adjacent pairs of signed 16-bit integers in \a __A with
71 /// __m256i _mm256_dpwsud_epi32(__m256i __W, __m256i __A, __m256i __B)
78 /// \param __A
56 _mm_dpwsud_epi32(__m128i __W, __m128i __A, __m128i __B) argument
94 _mm256_dpwsud_epi32(__m256i __W, __m256i __A, __m256i __B) argument
130 _mm_dpwsuds_epi32(__m128i __W, __m128i __A, __m128i __B) argument
169 _mm256_dpwsuds_epi32(__m256i __W, __m256i __A, __m256i __B) argument
204 _mm_dpwusd_epi32(__m128i __W, __m128i __A, __m128i __B) argument
242 _mm256_dpwusd_epi32(__m256i __W, __m256i __A, __m256i __B) argument
278 _mm_dpwusds_epi32(__m128i __W, __m128i __A, __m128i __B) argument
317 _mm256_dpwusds_epi32(__m256i __W, __m256i __A, __m256i __B) argument
352 _mm_dpwuud_epi32(__m128i __W, __m128i __A, __m128i __B) argument
390 _mm256_dpwuud_epi32(__m256i __W, __m256i __A, __m256i __B) argument
426 _mm_dpwuuds_epi32(__m128i __W, __m128i __A, __m128i __B) argument
465 _mm256_dpwuuds_epi32(__m256i __W, __m256i __A, __m256i __B) argument
[all...]
H A Dsha512intrin.h28 /// __m256i _mm256_sha512msg1_epi64(__m256i __A, __m128i __B)
33 /// \param __A
53 /// W[3] := __A.qword[3]
54 /// W[2] := __A.qword[2]
55 /// W[1] := __A.qword[1]
56 /// W[0] := __A.qword[0]
64 _mm256_sha512msg1_epi64(__m256i __A, __m128i __B) { argument
65 return (__m256i)__builtin_ia32_vsha512msg1((__v4du)__A, (__v2du)__B);
75 /// __m256i _mm256_sha512msg2_epi64(__m256i __A, __m256i __B)
80 /// \param __A
112 _mm256_sha512msg2_epi64(__m256i __A, __m256i __B) argument
193 _mm256_sha512rnds2_epi64(__m256i __A, __m256i __B, __m128i __C) argument
[all...]
/freebsd-current/contrib/llvm-project/clang/lib/Headers/ppc_wrappers/
H A Demmintrin.h125 _mm_move_sd(__m128d __A, __m128d __B) { argument
126 __v2df __result = (__v2df)__A;
176 _mm_store_pd(double *__P, __m128d __A) { argument
177 vec_st((__v16qu)__A, 0, (__v16qu *)__P);
183 _mm_storeu_pd(double *__P, __m128d __A) { argument
184 *(__m128d_u *)__P = __A;
190 _mm_store_sd(double *__P, __m128d __A) { argument
191 *__P = ((__v2df)__A)[0];
196 _mm_cvtsd_f64(__m128d __A) { argument
197 return ((__v2df)__A)[
202 _mm_storel_pd(double *__P, __m128d __A) argument
209 _mm_storeh_pd(double *__P, __m128d __A) argument
216 _mm_store1_pd(double *__P, __m128d __A) argument
222 _mm_store_pd1(double *__P, __m128d __A) argument
229 _mm_storer_pd(double *__P, __m128d __A) argument
236 _mm_cvtsi128_si64(__m128i __A) argument
243 _mm_cvtsi128_si64x(__m128i __A) argument
249 _mm_add_pd(__m128d __A, __m128d __B) argument
258 _mm_add_sd(__m128d __A, __m128d __B) argument
265 _mm_sub_pd(__m128d __A, __m128d __B) argument
271 _mm_sub_sd(__m128d __A, __m128d __B) argument
278 _mm_mul_pd(__m128d __A, __m128d __B) argument
284 _mm_mul_sd(__m128d __A, __m128d __B) argument
291 _mm_div_pd(__m128d __A, __m128d __B) argument
297 _mm_div_sd(__m128d __A, __m128d __B) argument
304 _mm_sqrt_pd(__m128d __A) argument
311 _mm_sqrt_sd(__m128d __A, __m128d __B) argument
319 _mm_min_pd(__m128d __A, __m128d __B) argument
325 _mm_min_sd(__m128d __A, __m128d __B) argument
335 _mm_max_pd(__m128d __A, __m128d __B) argument
341 _mm_max_sd(__m128d __A, __m128d __B) argument
351 _mm_cmpeq_pd(__m128d __A, __m128d __B) argument
357 _mm_cmplt_pd(__m128d __A, __m128d __B) argument
363 _mm_cmple_pd(__m128d __A, __m128d __B) argument
369 _mm_cmpgt_pd(__m128d __A, __m128d __B) argument
375 _mm_cmpge_pd(__m128d __A, __m128d __B) argument
381 _mm_cmpneq_pd(__m128d __A, __m128d __B) argument
388 _mm_cmpnlt_pd(__m128d __A, __m128d __B) argument
394 _mm_cmpnle_pd(__m128d __A, __m128d __B) argument
400 _mm_cmpngt_pd(__m128d __A, __m128d __B) argument
406 _mm_cmpnge_pd(__m128d __A, __m128d __B) argument
412 _mm_cmpord_pd(__m128d __A, __m128d __B) argument
423 _mm_cmpunord_pd(__m128d __A, __m128d __B) argument
447 _mm_cmpeq_sd(__m128d __A, __m128d __B) argument
463 _mm_cmplt_sd(__m128d __A, __m128d __B) argument
473 _mm_cmple_sd(__m128d __A, __m128d __B) argument
483 _mm_cmpgt_sd(__m128d __A, __m128d __B) argument
493 _mm_cmpge_sd(__m128d __A, __m128d __B) argument
503 _mm_cmpneq_sd(__m128d __A, __m128d __B) argument
514 _mm_cmpnlt_sd(__m128d __A, __m128d __B) argument
525 _mm_cmpnle_sd(__m128d __A, __m128d __B) argument
536 _mm_cmpngt_sd(__m128d __A, __m128d __B) argument
547 _mm_cmpnge_sd(__m128d __A, __m128d __B) argument
558 _mm_cmpord_sd(__m128d __A, __m128d __B) argument
566 _mm_cmpunord_sd(__m128d __A, __m128d __B) argument
581 _mm_comieq_sd(__m128d __A, __m128d __B) argument
587 _mm_comilt_sd(__m128d __A, __m128d __B) argument
593 _mm_comile_sd(__m128d __A, __m128d __B) argument
599 _mm_comigt_sd(__m128d __A, __m128d __B) argument
605 _mm_comige_sd(__m128d __A, __m128d __B) argument
611 _mm_comineq_sd(__m128d __A, __m128d __B) argument
617 _mm_ucomieq_sd(__m128d __A, __m128d __B) argument
623 _mm_ucomilt_sd(__m128d __A, __m128d __B) argument
629 _mm_ucomile_sd(__m128d __A, __m128d __B) argument
635 _mm_ucomigt_sd(__m128d __A, __m128d __B) argument
641 _mm_ucomige_sd(__m128d __A, __m128d __B) argument
647 _mm_ucomineq_sd(__m128d __A, __m128d __B) argument
692 _mm_set1_epi64x(long long __A) argument
698 _mm_set1_epi64(__m64 __A) argument
704 _mm_set1_epi32(int __A) argument
710 _mm_set1_epi16(short __A) argument
716 _mm_set1_epi8(char __A) argument
797 _mm_movpi64_epi64(__m64 __A) argument
803 _mm_move_epi64(__m128i __A) argument
825 _mm_cvtepi32_pd(__m128i __A) argument
837 _mm_cvtepi32_ps(__m128i __A) argument
843 _mm_cvtpd_epi32(__m128d __A) argument
872 _mm_cvtpd_pi32(__m128d __A) argument
880 _mm_cvtpd_ps(__m128d __A) argument
907 _mm_cvttpd_epi32(__m128d __A) argument
937 _mm_cvttpd_pi32(__m128d __A) argument
945 _mm_cvtsi128_si32(__m128i __A) argument
952 _mm_cvtpi32_pd(__m64 __A) argument
966 _mm_cvtps_epi32(__m128 __A) argument
977 _mm_cvttps_epi32(__m128 __A) argument
986 _mm_cvtps_pd(__m128 __A) argument
1017 _mm_cvtsd_si32(__m128d __A) argument
1026 _mm_cvtsd_si64(__m128d __A) argument
1036 _mm_cvtsd_si64x(__m128d __A) argument
1042 _mm_cvttsd_si32(__m128d __A) argument
1051 _mm_cvttsd_si64(__m128d __A) argument
1060 _mm_cvttsd_si64x(__m128d __A) argument
1066 _mm_cvtsd_ss(__m128 __A, __m128d __B) argument
1088 _mm_cvtsi32_sd(__m128d __A, int __B) argument
1098 _mm_cvtsi64_sd(__m128d __A, long long __B) argument
1108 _mm_cvtsi64x_sd(__m128d __A, long long __B) argument
1114 _mm_cvtss_sd(__m128d __A, __m128 __B) argument
1131 _mm_shuffle_pd(__m128d __A, __m128d __B, const int __mask) argument
1156 _mm_unpackhi_pd(__m128d __A, __m128d __B) argument
1162 _mm_unpacklo_pd(__m128d __A, __m128d __B) argument
1168 _mm_loadh_pd(__m128d __A, double const *__B) argument
1176 _mm_loadl_pd(__m128d __A, double const *__B) argument
1188 _mm_movemask_pd(__m128d __A) argument
1215 _mm_packs_epi16(__m128i __A, __m128i __B) argument
1221 _mm_packs_epi32(__m128i __A, __m128i __B) argument
1227 _mm_packus_epi16(__m128i __A, __m128i __B) argument
1233 _mm_unpackhi_epi8(__m128i __A, __m128i __B) argument
1239 _mm_unpackhi_epi16(__m128i __A, __m128i __B) argument
1245 _mm_unpackhi_epi32(__m128i __A, __m128i __B) argument
1251 _mm_unpackhi_epi64(__m128i __A, __m128i __B) argument
1257 _mm_unpacklo_epi8(__m128i __A, __m128i __B) argument
1263 _mm_unpacklo_epi16(__m128i __A, __m128i __B) argument
1269 _mm_unpacklo_epi32(__m128i __A, __m128i __B) argument
1275 _mm_unpacklo_epi64(__m128i __A, __m128i __B) argument
1281 _mm_add_epi8(__m128i __A, __m128i __B) argument
1287 _mm_add_epi16(__m128i __A, __m128i __B) argument
1293 _mm_add_epi32(__m128i __A, __m128i __B) argument
1299 _mm_add_epi64(__m128i __A, __m128i __B) argument
1305 _mm_adds_epi8(__m128i __A, __m128i __B) argument
1311 _mm_adds_epi16(__m128i __A, __m128i __B) argument
1317 _mm_adds_epu8(__m128i __A, __m128i __B) argument
1323 _mm_adds_epu16(__m128i __A, __m128i __B) argument
1329 _mm_sub_epi8(__m128i __A, __m128i __B) argument
1335 _mm_sub_epi16(__m128i __A, __m128i __B) argument
1341 _mm_sub_epi32(__m128i __A, __m128i __B) argument
1347 _mm_sub_epi64(__m128i __A, __m128i __B) argument
1353 _mm_subs_epi8(__m128i __A, __m128i __B) argument
1359 _mm_subs_epi16(__m128i __A, __m128i __B) argument
1365 _mm_subs_epu8(__m128i __A, __m128i __B) argument
1371 _mm_subs_epu16(__m128i __A, __m128i __B) argument
1377 _mm_madd_epi16(__m128i __A, __m128i __B) argument
1385 _mm_mulhi_epi16(__m128i __A, __m128i __B) argument
1405 _mm_mullo_epi16(__m128i __A, __m128i __B) argument
1411 _mm_mul_su32(__m64 __A, __m64 __B) argument
1421 _mm_mul_epu32(__m128i __A, __m128i __B) argument
1441 _mm_slli_epi16(__m128i __A, int __B) argument
1459 _mm_slli_epi32(__m128i __A, int __B) argument
1478 _mm_slli_epi64(__m128i __A, int __B) argument
1497 _mm_srai_epi16(__m128i __A, int __B) argument
1514 _mm_srai_epi32(__m128i __A, int __B) argument
1534 _mm_bslli_si128(__m128i __A, const int __N) argument
1548 _mm_bsrli_si128(__m128i __A, const int __N) argument
1577 _mm_srli_si128(__m128i __A, const int __N) argument
1583 _mm_slli_si128(__m128i __A, const int _imm5) argument
1602 _mm_srli_epi16(__m128i __A, int __B) argument
1620 _mm_srli_epi32(__m128i __A, int __B) argument
1642 _mm_srli_epi64(__m128i __A, int __B) argument
1664 _mm_sll_epi16(__m128i __A, __m128i __B) argument
1684 _mm_sll_epi32(__m128i __A, __m128i __B) argument
1704 _mm_sll_epi64(__m128i __A, __m128i __B) argument
1721 _mm_sra_epi16(__m128i __A, __m128i __B) argument
1739 _mm_sra_epi32(__m128i __A, __m128i __B) argument
1757 _mm_srl_epi16(__m128i __A, __m128i __B) argument
1777 _mm_srl_epi32(__m128i __A, __m128i __B) argument
1798 _mm_srl_epi64(__m128i __A, __m128i __B) argument
1815 _mm_and_pd(__m128d __A, __m128d __B) argument
1821 _mm_andnot_pd(__m128d __A, __m128d __B) argument
1827 _mm_or_pd(__m128d __A, __m128d __B) argument
1833 _mm_xor_pd(__m128d __A, __m128d __B) argument
1839 _mm_and_si128(__m128i __A, __m128i __B) argument
1845 _mm_andnot_si128(__m128i __A, __m128i __B) argument
1851 _mm_or_si128(__m128i __A, __m128i __B) argument
1857 _mm_xor_si128(__m128i __A, __m128i __B) argument
1863 _mm_cmpeq_epi8(__m128i __A, __m128i __B) argument
1869 _mm_cmpeq_epi16(__m128i __A, __m128i __B) argument
1875 _mm_cmpeq_epi32(__m128i __A, __m128i __B) argument
1881 _mm_cmplt_epi8(__m128i __A, __m128i __B) argument
1887 _mm_cmplt_epi16(__m128i __A, __m128i __B) argument
1893 _mm_cmplt_epi32(__m128i __A, __m128i __B) argument
1899 _mm_cmpgt_epi8(__m128i __A, __m128i __B) argument
1905 _mm_cmpgt_epi16(__m128i __A, __m128i __B) argument
1911 _mm_cmpgt_epi32(__m128i __A, __m128i __B) argument
1917 _mm_extract_epi16(__m128i const __A, int const __N) argument
1923 _mm_insert_epi16(__m128i const __A, int const __D, int const __N) argument
1933 _mm_max_epi16(__m128i __A, __m128i __B) argument
1939 _mm_max_epu8(__m128i __A, __m128i __B) argument
1945 _mm_min_epi16(__m128i __A, __m128i __B) argument
1951 _mm_min_epu8(__m128i __A, __m128i __B) argument
1962 _mm_movemask_epi8(__m128i __A) argument
1985 _mm_mulhi_epu16(__m128i __A, __m128i __B) argument
2004 _mm_shufflehi_epi16(__m128i __A, const int __mask) argument
2037 _mm_shufflelo_epi16(__m128i __A, const int __mask) argument
2069 _mm_shuffle_epi32(__m128i __A, const int __mask) argument
2093 _mm_maskmoveu_si128(__m128i __A, __m128i __B, char *__C) argument
2106 _mm_avg_epu8(__m128i __A, __m128i __B) argument
2112 _mm_avg_epu16(__m128i __A, __m128i __B) argument
2118 _mm_sad_epu8(__m128i __A, __m128i __B) argument
2156 _mm_stream_si32(int *__A, int __B) argument
2164 _mm_stream_si64(long long int *__A, long long int __B) argument
2172 _mm_stream_si128(__m128i *__A, __m128i __B) argument
2180 _mm_stream_pd(double *__A, __m128d __B) argument
2188 _mm_clflush(void const *__A) argument
2209 _mm_cvtsi32_si128(int __A) argument
2215 _mm_cvtsi64_si128(long long __A) argument
2222 _mm_cvtsi64x_si128(long long __A) argument
2230 _mm_castpd_ps(__m128d __A) argument
2236 _mm_castpd_si128(__m128d __A) argument
2242 _mm_castps_pd(__m128 __A) argument
2248 _mm_castps_si128(__m128 __A) argument
2254 _mm_castsi128_ps(__m128i __A) argument
2260 _mm_castsi128_pd(__m128i __A) argument
[all...]
H A Dxmmintrin.h149 _mm_store_ps(float *__P, __m128 __A) { argument
150 vec_st((__v4sf)__A, 0, (__v4sf *)__P);
156 _mm_storeu_ps(float *__P, __m128 __A) { argument
157 *(__m128_u *)__P = __A;
163 _mm_storer_ps(float *__P, __m128 __A) { argument
169 __tmp = (__m128)vec_perm(__A, __A, __permute_vector);
177 _mm_store1_ps(float *__P, __m128 __A) { argument
178 __v4sf __va = vec_splat((__v4sf)__A, 0);
184 _mm_store_ps1(float *__P, __m128 __A) { argument
198 _mm_move_ss(__m128 __A, __m128 __B) argument
214 _mm_store_ss(float *__P, __m128 __A) argument
224 _mm_add_ss(__m128 __A, __m128 __B) argument
246 _mm_sub_ss(__m128 __A, __m128 __B) argument
268 _mm_mul_ss(__m128 __A, __m128 __B) argument
290 _mm_div_ss(__m128 __A, __m128 __B) argument
312 _mm_sqrt_ss(__m128 __A) argument
329 _mm_add_ps(__m128 __A, __m128 __B) argument
335 _mm_sub_ps(__m128 __A, __m128 __B) argument
341 _mm_mul_ps(__m128 __A, __m128 __B) argument
347 _mm_div_ps(__m128 __A, __m128 __B) argument
353 _mm_sqrt_ps(__m128 __A) argument
359 _mm_rcp_ps(__m128 __A) argument
365 _mm_rsqrt_ps(__m128 __A) argument
371 _mm_rcp_ss(__m128 __A) argument
387 _mm_rsqrt_ss(__m128 __A) argument
403 _mm_min_ss(__m128 __A, __m128 __B) argument
420 _mm_max_ss(__m128 __A, __m128 __B) argument
437 _mm_min_ps(__m128 __A, __m128 __B) argument
444 _mm_max_ps(__m128 __A, __m128 __B) argument
452 _mm_and_ps(__m128 __A, __m128 __B) argument
459 _mm_andnot_ps(__m128 __A, __m128 __B) argument
465 _mm_or_ps(__m128 __A, __m128 __B) argument
471 _mm_xor_ps(__m128 __A, __m128 __B) argument
480 _mm_cmpeq_ps(__m128 __A, __m128 __B) argument
486 _mm_cmplt_ps(__m128 __A, __m128 __B) argument
492 _mm_cmple_ps(__m128 __A, __m128 __B) argument
498 _mm_cmpgt_ps(__m128 __A, __m128 __B) argument
504 _mm_cmpge_ps(__m128 __A, __m128 __B) argument
510 _mm_cmpneq_ps(__m128 __A, __m128 __B) argument
517 _mm_cmpnlt_ps(__m128 __A, __m128 __B) argument
523 _mm_cmpnle_ps(__m128 __A, __m128 __B) argument
529 _mm_cmpngt_ps(__m128 __A, __m128 __B) argument
535 _mm_cmpnge_ps(__m128 __A, __m128 __B) argument
541 _mm_cmpord_ps(__m128 __A, __m128 __B) argument
556 _mm_cmpunord_ps(__m128 __A, __m128 __B) argument
574 _mm_cmpeq_ss(__m128 __A, __m128 __B) argument
591 _mm_cmplt_ss(__m128 __A, __m128 __B) argument
608 _mm_cmple_ss(__m128 __A, __m128 __B) argument
625 _mm_cmpgt_ss(__m128 __A, __m128 __B) argument
642 _mm_cmpge_ss(__m128 __A, __m128 __B) argument
659 _mm_cmpneq_ss(__m128 __A, __m128 __B) argument
677 _mm_cmpnlt_ss(__m128 __A, __m128 __B) argument
694 _mm_cmpnle_ss(__m128 __A, __m128 __B) argument
711 _mm_cmpngt_ss(__m128 __A, __m128 __B) argument
728 _mm_cmpnge_ss(__m128 __A, __m128 __B) argument
745 _mm_cmpord_ss(__m128 __A, __m128 __B) argument
764 _mm_cmpunord_ss(__m128 __A, __m128 __B) argument
785 _mm_comieq_ss(__m128 __A, __m128 __B) argument
791 _mm_comilt_ss(__m128 __A, __m128 __B) argument
797 _mm_comile_ss(__m128 __A, __m128 __B) argument
803 _mm_comigt_ss(__m128 __A, __m128 __B) argument
809 _mm_comige_ss(__m128 __A, __m128 __B) argument
815 _mm_comineq_ss(__m128 __A, __m128 __B) argument
829 _mm_ucomieq_ss(__m128 __A, __m128 __B) argument
835 _mm_ucomilt_ss(__m128 __A, __m128 __B) argument
841 _mm_ucomile_ss(__m128 __A, __m128 __B) argument
847 _mm_ucomigt_ss(__m128 __A, __m128 __B) argument
853 _mm_ucomige_ss(__m128 __A, __m128 __B) argument
859 _mm_ucomineq_ss(__m128 __A, __m128 __B) argument
865 _mm_cvtss_f32(__m128 __A) argument
873 _mm_cvtss_si32(__m128 __A) argument
894 _mm_cvt_ss2si(__m128 __A) argument
904 _mm_cvtss_si64(__m128 __A) argument
926 _mm_cvtss_si64x(__m128 __A) argument
954 _mm_cvtps_pi32(__m128 __A) argument
969 _mm_cvt_ps2pi(__m128 __A) argument
976 _mm_cvttss_si32(__m128 __A) argument
985 _mm_cvtt_ss2si(__m128 __A) argument
992 _mm_cvttss_si64(__m128 __A) argument
1002 _mm_cvttss_si64x(__m128 __A) argument
1013 _mm_cvttps_pi32(__m128 __A) argument
1026 _mm_cvtt_ps2pi(__m128 __A) argument
1033 _mm_cvtsi32_ss(__m128 __A, int __B) argument
1042 _mm_cvt_si2ss(__m128 __A, int __B) argument
1050 _mm_cvtsi64_ss(__m128 __A, long long __B) argument
1060 _mm_cvtsi64x_ss(__m128 __A, long long __B) argument
1068 _mm_cvtpi32_ps(__m128 __A, __m64 __B) argument
1082 _mm_cvt_pi2ps(__m128 __A, __m64 __B) argument
1089 _mm_cvtpi16_ps(__m64 __A) argument
1104 _mm_cvtpu16_ps(__m64 __A) argument
1125 _mm_cvtpi8_ps(__m64 __A) argument
1143 _mm_cvtpu8_ps(__m64 __A) argument
1168 _mm_cvtpi32x2_ps(__m64 __A, __m64 __B) argument
1180 _mm_cvtps_pi16(__m128 __A) argument
1195 _mm_cvtps_pi8(__m128 __A) argument
1213 _mm_shuffle_ps(__m128 __A, __m128 __B, int const __mask) argument
1237 _mm_unpackhi_ps(__m128 __A, __m128 __B) argument
1244 _mm_unpacklo_ps(__m128 __A, __m128 __B) argument
1252 _mm_loadh_pi(__m128 __A, __m64 const *__P) argument
1263 _mm_storeh_pi(__m64 *__P, __m128 __A) argument
1272 _mm_movehl_ps(__m128 __A, __m128 __B) argument
1280 _mm_movelh_ps(__m128 __A, __m128 __B) argument
1289 _mm_loadl_pi(__m128 __A, __m64 const *__P) argument
1300 _mm_storel_pi(__m64 *__P, __m128 __A) argument
1312 _mm_movemask_ps(__m128 __A) argument
1353 _mm_extract_pi16(__m64 const __A, int const __N) argument
1364 _m_pextrw(__m64 const __A, int const __N) argument
1372 _mm_insert_pi16(__m64 const __A, int const __D, int const __N) argument
1383 _m_pinsrw(__m64 const __A, int const __D, int const __N) argument
1391 _mm_max_pi16(__m64 __A, __m64 __B) argument
1422 _m_pmaxsw(__m64 __A, __m64 __B) argument
1429 _mm_max_pu8(__m64 __A, __m64 __B) argument
1458 _m_pmaxub(__m64 __A, __m64 __B) argument
1465 _mm_min_pi16(__m64 __A, __m64 __B) argument
1496 _m_pminsw(__m64 __A, __m64 __B) argument
1503 _mm_min_pu8(__m64 __A, __m64 __B) argument
1532 _m_pminub(__m64 __A, __m64 __B) argument
1539 _mm_movemask_pi8(__m64 __A) argument
1564 _m_pmovmskb(__m64 __A) argument
1572 _mm_mulhi_pu16(__m64 __A, __m64 __B) argument
1598 _m_pmulhuw(__m64 __A, __m64 __B) argument
1606 _mm_shuffle_pi16(__m64 __A, int const __N) argument
1640 _m_pshufw(__m64 __A, int const __N) argument
1649 _mm_maskmove_si64(__m64 __A, __m64 __N, char *__P) argument
1662 _m_maskmovq(__m64 __A, __m64 __N, char *__P) argument
1669 _mm_avg_pu8(__m64 __A, __m64 __B) argument
1680 _m_pavgb(__m64 __A, __m64 __B) argument
1687 _mm_avg_pu16(__m64 __A, __m64 __B) argument
1698 _m_pavgw(__m64 __A, __m64 __B) argument
1707 _mm_sad_pu8(__m64 __A, __m64 __B) argument
1731 _m_psadbw(__m64 __A, __m64 __B) argument
1738 _mm_stream_pi(__m64 *__P, __m64 __A) argument
1747 _mm_stream_ps(float *__P, __m128 __A) argument
[all...]

Completed in 315 milliseconds

12