Searched refs:__A (Results 1 - 25 of 44) sorted by relevance

12

/openbsd-current/gnu/llvm/clang/lib/Headers/
H A Draointintrin.h20 /// Atomically add a 32-bit value at memory operand \a __A and a 32-bit \a __B,
30 /// \param __A
36 /// MEM[__A+31:__A] := MEM[__A+31:__A] + __B[31:0]
38 static __inline__ void __DEFAULT_FN_ATTRS _aadd_i32(int *__A, int __B) { argument
39 __builtin_ia32_aadd32((int *)__A, __B);
42 /// Atomically and a 32-bit value at memory operand \a __A and a 32-bit \a __B,
52 /// \param __A
60 _aand_i32(int *__A, int __B) argument
82 _aor_i32(int *__A, int __B) argument
104 _axor_i32(int *__A, int __B) argument
127 _aadd_i64(long long *__A, long long __B) argument
150 _aand_i64(long long *__A, long long __B) argument
173 _aor_i64(long long *__A, long long __B) argument
196 _axor_i64(long long *__A, long long __B) argument
[all...]
H A Davxneconvertintrin.h29 /// stored at memory locations starting at location \a __A to a
37 /// _mm_bcstnebf16_ps(const void *__A);
42 /// \param __A
49 /// b := Convert_BF16_To_FP32(MEM[__A+15:__A])
57 _mm_bcstnebf16_ps(const void *__A) { argument
58 return (__m128)__builtin_ia32_vbcstnebf162ps128((const __bf16 *)__A);
62 /// stored at memory locations starting at location \a __A to a
70 /// _mm256_bcstnebf16_ps(const void *__A);
75 /// \param __A
90 _mm256_bcstnebf16_ps(const void *__A) argument
123 _mm_bcstnesh_ps(const void *__A) argument
156 _mm256_bcstnesh_ps(const void *__A) argument
189 _mm_cvtneebf16_ps(const __m128bh *__A) argument
222 _mm256_cvtneebf16_ps(const __m256bh *__A) argument
255 _mm_cvtneeph_ps(const __m128h *__A) argument
288 _mm256_cvtneeph_ps(const __m256h *__A) argument
321 _mm_cvtneobf16_ps(const __m128bh *__A) argument
354 _mm256_cvtneobf16_ps(const __m256bh *__A) argument
387 _mm_cvtneoph_ps(const __m128h *__A) argument
420 _mm256_cvtneoph_ps(const __m256h *__A) argument
448 _mm_cvtneps_avx_pbh(__m128 __A) argument
476 _mm256_cvtneps_avx_pbh(__m256 __A) argument
[all...]
H A Dpopcntintrin.h28 /// \param __A
33 _mm_popcnt_u32(unsigned int __A) argument
35 return __builtin_popcount(__A);
45 /// \param __A
50 _mm_popcnt_u64(unsigned long long __A) argument
52 return __builtin_popcountll(__A);
H A Davx512cdintrin.h21 _mm512_conflict_epi64 (__m512i __A) argument
23 return (__m512i) __builtin_ia32_vpconflictdi_512 ((__v8di) __A);
27 _mm512_mask_conflict_epi64 (__m512i __W, __mmask8 __U, __m512i __A) argument
30 (__v8di)_mm512_conflict_epi64(__A),
35 _mm512_maskz_conflict_epi64 (__mmask8 __U, __m512i __A) argument
38 (__v8di)_mm512_conflict_epi64(__A),
43 _mm512_conflict_epi32 (__m512i __A) argument
45 return (__m512i) __builtin_ia32_vpconflictsi_512 ((__v16si) __A);
49 _mm512_mask_conflict_epi32 (__m512i __W, __mmask16 __U, __m512i __A) argument
52 (__v16si)_mm512_conflict_epi32(__A),
57 _mm512_maskz_conflict_epi32(__mmask16 __U, __m512i __A) argument
65 _mm512_lzcnt_epi32(__m512i __A) argument
71 _mm512_mask_lzcnt_epi32(__m512i __W, __mmask16 __U, __m512i __A) argument
79 _mm512_maskz_lzcnt_epi32(__mmask16 __U, __m512i __A) argument
87 _mm512_lzcnt_epi64(__m512i __A) argument
93 _mm512_mask_lzcnt_epi64(__m512i __W, __mmask8 __U, __m512i __A) argument
101 _mm512_maskz_lzcnt_epi64(__mmask8 __U, __m512i __A) argument
109 _mm512_broadcastmb_epi64(__mmask8 __A) argument
115 _mm512_broadcastmw_epi32(__mmask16 __A) argument
[all...]
H A Davx512vlcdintrin.h22 _mm_broadcastmb_epi64 (__mmask8 __A) argument
24 return (__m128i) _mm_set1_epi64x((long long) __A);
28 _mm256_broadcastmb_epi64 (__mmask8 __A) argument
30 return (__m256i) _mm256_set1_epi64x((long long)__A);
34 _mm_broadcastmw_epi32 (__mmask16 __A) argument
36 return (__m128i) _mm_set1_epi32((int)__A);
40 _mm256_broadcastmw_epi32 (__mmask16 __A) argument
42 return (__m256i) _mm256_set1_epi32((int)__A);
47 _mm_conflict_epi64 (__m128i __A) argument
49 return (__m128i) __builtin_ia32_vpconflictdi_128 ((__v2di) __A);
53 _mm_mask_conflict_epi64(__m128i __W, __mmask8 __U, __m128i __A) argument
61 _mm_maskz_conflict_epi64(__mmask8 __U, __m128i __A) argument
69 _mm256_conflict_epi64(__m256i __A) argument
75 _mm256_mask_conflict_epi64(__m256i __W, __mmask8 __U, __m256i __A) argument
83 _mm256_maskz_conflict_epi64(__mmask8 __U, __m256i __A) argument
91 _mm_conflict_epi32(__m128i __A) argument
97 _mm_mask_conflict_epi32(__m128i __W, __mmask8 __U, __m128i __A) argument
105 _mm_maskz_conflict_epi32(__mmask8 __U, __m128i __A) argument
113 _mm256_conflict_epi32(__m256i __A) argument
119 _mm256_mask_conflict_epi32(__m256i __W, __mmask8 __U, __m256i __A) argument
127 _mm256_maskz_conflict_epi32(__mmask8 __U, __m256i __A) argument
135 _mm_lzcnt_epi32(__m128i __A) argument
141 _mm_mask_lzcnt_epi32(__m128i __W, __mmask8 __U, __m128i __A) argument
149 _mm_maskz_lzcnt_epi32(__mmask8 __U, __m128i __A) argument
157 _mm256_lzcnt_epi32(__m256i __A) argument
163 _mm256_mask_lzcnt_epi32(__m256i __W, __mmask8 __U, __m256i __A) argument
171 _mm256_maskz_lzcnt_epi32(__mmask8 __U, __m256i __A) argument
179 _mm_lzcnt_epi64(__m128i __A) argument
185 _mm_mask_lzcnt_epi64(__m128i __W, __mmask8 __U, __m128i __A) argument
193 _mm_maskz_lzcnt_epi64(__mmask8 __U, __m128i __A) argument
201 _mm256_lzcnt_epi64(__m256i __A) argument
207 _mm256_mask_lzcnt_epi64(__m256i __W, __mmask8 __U, __m256i __A) argument
215 _mm256_maskz_lzcnt_epi64(__mmask8 __U, __m256i __A) argument
[all...]
H A Dxopintrin.h24 _mm_maccs_epi16(__m128i __A, __m128i __B, __m128i __C) argument
26 return (__m128i)__builtin_ia32_vpmacssww((__v8hi)__A, (__v8hi)__B, (__v8hi)__C);
30 _mm_macc_epi16(__m128i __A, __m128i __B, __m128i __C) argument
32 return (__m128i)__builtin_ia32_vpmacsww((__v8hi)__A, (__v8hi)__B, (__v8hi)__C);
36 _mm_maccsd_epi16(__m128i __A, __m128i __B, __m128i __C) argument
38 return (__m128i)__builtin_ia32_vpmacsswd((__v8hi)__A, (__v8hi)__B, (__v4si)__C);
42 _mm_maccd_epi16(__m128i __A, __m128i __B, __m128i __C) argument
44 return (__m128i)__builtin_ia32_vpmacswd((__v8hi)__A, (__v8hi)__B, (__v4si)__C);
48 _mm_maccs_epi32(__m128i __A, __m128i __B, __m128i __C) argument
50 return (__m128i)__builtin_ia32_vpmacssdd((__v4si)__A, (__v4s
54 _mm_macc_epi32(__m128i __A, __m128i __B, __m128i __C) argument
60 _mm_maccslo_epi32(__m128i __A, __m128i __B, __m128i __C) argument
66 _mm_macclo_epi32(__m128i __A, __m128i __B, __m128i __C) argument
72 _mm_maccshi_epi32(__m128i __A, __m128i __B, __m128i __C) argument
78 _mm_macchi_epi32(__m128i __A, __m128i __B, __m128i __C) argument
84 _mm_maddsd_epi16(__m128i __A, __m128i __B, __m128i __C) argument
90 _mm_maddd_epi16(__m128i __A, __m128i __B, __m128i __C) argument
96 _mm_haddw_epi8(__m128i __A) argument
102 _mm_haddd_epi8(__m128i __A) argument
108 _mm_haddq_epi8(__m128i __A) argument
114 _mm_haddd_epi16(__m128i __A) argument
120 _mm_haddq_epi16(__m128i __A) argument
126 _mm_haddq_epi32(__m128i __A) argument
132 _mm_haddw_epu8(__m128i __A) argument
138 _mm_haddd_epu8(__m128i __A) argument
144 _mm_haddq_epu8(__m128i __A) argument
150 _mm_haddd_epu16(__m128i __A) argument
156 _mm_haddq_epu16(__m128i __A) argument
162 _mm_haddq_epu32(__m128i __A) argument
168 _mm_hsubw_epi8(__m128i __A) argument
174 _mm_hsubd_epi16(__m128i __A) argument
180 _mm_hsubq_epi32(__m128i __A) argument
186 _mm_cmov_si128(__m128i __A, __m128i __B, __m128i __C) argument
192 _mm256_cmov_si256(__m256i __A, __m256i __B, __m256i __C) argument
198 _mm_perm_epi8(__m128i __A, __m128i __B, __m128i __C) argument
204 _mm_rot_epi8(__m128i __A, __m128i __B) argument
210 _mm_rot_epi16(__m128i __A, __m128i __B) argument
216 _mm_rot_epi32(__m128i __A, __m128i __B) argument
222 _mm_rot_epi64(__m128i __A, __m128i __B) argument
240 _mm_shl_epi8(__m128i __A, __m128i __B) argument
246 _mm_shl_epi16(__m128i __A, __m128i __B) argument
252 _mm_shl_epi32(__m128i __A, __m128i __B) argument
258 _mm_shl_epi64(__m128i __A, __m128i __B) argument
264 _mm_sha_epi8(__m128i __A, __m128i __B) argument
270 _mm_sha_epi16(__m128i __A, __m128i __B) argument
276 _mm_sha_epi32(__m128i __A, __m128i __B) argument
282 _mm_sha_epi64(__m128i __A, __m128i __B) argument
329 _mm_comlt_epu8(__m128i __A, __m128i __B) argument
335 _mm_comle_epu8(__m128i __A, __m128i __B) argument
341 _mm_comgt_epu8(__m128i __A, __m128i __B) argument
347 _mm_comge_epu8(__m128i __A, __m128i __B) argument
353 _mm_comeq_epu8(__m128i __A, __m128i __B) argument
359 _mm_comneq_epu8(__m128i __A, __m128i __B) argument
365 _mm_comfalse_epu8(__m128i __A, __m128i __B) argument
371 _mm_comtrue_epu8(__m128i __A, __m128i __B) argument
377 _mm_comlt_epu16(__m128i __A, __m128i __B) argument
383 _mm_comle_epu16(__m128i __A, __m128i __B) argument
389 _mm_comgt_epu16(__m128i __A, __m128i __B) argument
395 _mm_comge_epu16(__m128i __A, __m128i __B) argument
401 _mm_comeq_epu16(__m128i __A, __m128i __B) argument
407 _mm_comneq_epu16(__m128i __A, __m128i __B) argument
413 _mm_comfalse_epu16(__m128i __A, __m128i __B) argument
419 _mm_comtrue_epu16(__m128i __A, __m128i __B) argument
425 _mm_comlt_epu32(__m128i __A, __m128i __B) argument
431 _mm_comle_epu32(__m128i __A, __m128i __B) argument
437 _mm_comgt_epu32(__m128i __A, __m128i __B) argument
443 _mm_comge_epu32(__m128i __A, __m128i __B) argument
449 _mm_comeq_epu32(__m128i __A, __m128i __B) argument
455 _mm_comneq_epu32(__m128i __A, __m128i __B) argument
461 _mm_comfalse_epu32(__m128i __A, __m128i __B) argument
467 _mm_comtrue_epu32(__m128i __A, __m128i __B) argument
473 _mm_comlt_epu64(__m128i __A, __m128i __B) argument
479 _mm_comle_epu64(__m128i __A, __m128i __B) argument
485 _mm_comgt_epu64(__m128i __A, __m128i __B) argument
491 _mm_comge_epu64(__m128i __A, __m128i __B) argument
497 _mm_comeq_epu64(__m128i __A, __m128i __B) argument
503 _mm_comneq_epu64(__m128i __A, __m128i __B) argument
509 _mm_comfalse_epu64(__m128i __A, __m128i __B) argument
515 _mm_comtrue_epu64(__m128i __A, __m128i __B) argument
521 _mm_comlt_epi8(__m128i __A, __m128i __B) argument
527 _mm_comle_epi8(__m128i __A, __m128i __B) argument
533 _mm_comgt_epi8(__m128i __A, __m128i __B) argument
539 _mm_comge_epi8(__m128i __A, __m128i __B) argument
545 _mm_comeq_epi8(__m128i __A, __m128i __B) argument
551 _mm_comneq_epi8(__m128i __A, __m128i __B) argument
557 _mm_comfalse_epi8(__m128i __A, __m128i __B) argument
563 _mm_comtrue_epi8(__m128i __A, __m128i __B) argument
569 _mm_comlt_epi16(__m128i __A, __m128i __B) argument
575 _mm_comle_epi16(__m128i __A, __m128i __B) argument
581 _mm_comgt_epi16(__m128i __A, __m128i __B) argument
587 _mm_comge_epi16(__m128i __A, __m128i __B) argument
593 _mm_comeq_epi16(__m128i __A, __m128i __B) argument
599 _mm_comneq_epi16(__m128i __A, __m128i __B) argument
605 _mm_comfalse_epi16(__m128i __A, __m128i __B) argument
611 _mm_comtrue_epi16(__m128i __A, __m128i __B) argument
617 _mm_comlt_epi32(__m128i __A, __m128i __B) argument
623 _mm_comle_epi32(__m128i __A, __m128i __B) argument
629 _mm_comgt_epi32(__m128i __A, __m128i __B) argument
635 _mm_comge_epi32(__m128i __A, __m128i __B) argument
641 _mm_comeq_epi32(__m128i __A, __m128i __B) argument
647 _mm_comneq_epi32(__m128i __A, __m128i __B) argument
653 _mm_comfalse_epi32(__m128i __A, __m128i __B) argument
659 _mm_comtrue_epi32(__m128i __A, __m128i __B) argument
665 _mm_comlt_epi64(__m128i __A, __m128i __B) argument
671 _mm_comle_epi64(__m128i __A, __m128i __B) argument
677 _mm_comgt_epi64(__m128i __A, __m128i __B) argument
683 _mm_comge_epi64(__m128i __A, __m128i __B) argument
689 _mm_comeq_epi64(__m128i __A, __m128i __B) argument
695 _mm_comneq_epi64(__m128i __A, __m128i __B) argument
701 _mm_comfalse_epi64(__m128i __A, __m128i __B) argument
707 _mm_comtrue_epi64(__m128i __A, __m128i __B) argument
732 _mm_frcz_ss(__m128 __A) argument
738 _mm_frcz_sd(__m128d __A) argument
744 _mm_frcz_ps(__m128 __A) argument
750 _mm_frcz_pd(__m128d __A) argument
756 _mm256_frcz_ps(__m256 __A) argument
762 _mm256_frcz_pd(__m256d __A) argument
[all...]
H A Davx512vpopcntdqvlintrin.h25 _mm_popcnt_epi64(__m128i __A) { argument
26 return (__m128i)__builtin_ia32_vpopcntq_128((__v2di)__A);
30 _mm_mask_popcnt_epi64(__m128i __W, __mmask8 __U, __m128i __A) { argument
32 (__mmask8)__U, (__v2di)_mm_popcnt_epi64(__A), (__v2di)__W);
36 _mm_maskz_popcnt_epi64(__mmask8 __U, __m128i __A) { argument
37 return _mm_mask_popcnt_epi64((__m128i)_mm_setzero_si128(), __U, __A);
41 _mm_popcnt_epi32(__m128i __A) { argument
42 return (__m128i)__builtin_ia32_vpopcntd_128((__v4si)__A);
46 _mm_mask_popcnt_epi32(__m128i __W, __mmask8 __U, __m128i __A) { argument
48 (__mmask8)__U, (__v4si)_mm_popcnt_epi32(__A), (__v4s
52 _mm_maskz_popcnt_epi32(__mmask8 __U, __m128i __A) argument
57 _mm256_popcnt_epi64(__m256i __A) argument
62 _mm256_mask_popcnt_epi64(__m256i __W, __mmask8 __U, __m256i __A) argument
68 _mm256_maskz_popcnt_epi64(__mmask8 __U, __m256i __A) argument
73 _mm256_popcnt_epi32(__m256i __A) argument
78 _mm256_mask_popcnt_epi32(__m256i __W, __mmask8 __U, __m256i __A) argument
84 _mm256_maskz_popcnt_epi32(__mmask8 __U, __m256i __A) argument
[all...]
H A Dfma4intrin.h24 _mm_macc_ps(__m128 __A, __m128 __B, __m128 __C) argument
26 return (__m128)__builtin_ia32_vfmaddps((__v4sf)__A, (__v4sf)__B, (__v4sf)__C);
30 _mm_macc_pd(__m128d __A, __m128d __B, __m128d __C) argument
32 return (__m128d)__builtin_ia32_vfmaddpd((__v2df)__A, (__v2df)__B, (__v2df)__C);
36 _mm_macc_ss(__m128 __A, __m128 __B, __m128 __C) argument
38 return (__m128)__builtin_ia32_vfmaddss((__v4sf)__A, (__v4sf)__B, (__v4sf)__C);
42 _mm_macc_sd(__m128d __A, __m128d __B, __m128d __C) argument
44 return (__m128d)__builtin_ia32_vfmaddsd((__v2df)__A, (__v2df)__B, (__v2df)__C);
48 _mm_msub_ps(__m128 __A, __m128 __B, __m128 __C) argument
50 return (__m128)__builtin_ia32_vfmaddps((__v4sf)__A, (__v4s
54 _mm_msub_pd(__m128d __A, __m128d __B, __m128d __C) argument
60 _mm_msub_ss(__m128 __A, __m128 __B, __m128 __C) argument
66 _mm_msub_sd(__m128d __A, __m128d __B, __m128d __C) argument
72 _mm_nmacc_ps(__m128 __A, __m128 __B, __m128 __C) argument
78 _mm_nmacc_pd(__m128d __A, __m128d __B, __m128d __C) argument
84 _mm_nmacc_ss(__m128 __A, __m128 __B, __m128 __C) argument
90 _mm_nmacc_sd(__m128d __A, __m128d __B, __m128d __C) argument
96 _mm_nmsub_ps(__m128 __A, __m128 __B, __m128 __C) argument
102 _mm_nmsub_pd(__m128d __A, __m128d __B, __m128d __C) argument
108 _mm_nmsub_ss(__m128 __A, __m128 __B, __m128 __C) argument
114 _mm_nmsub_sd(__m128d __A, __m128d __B, __m128d __C) argument
120 _mm_maddsub_ps(__m128 __A, __m128 __B, __m128 __C) argument
126 _mm_maddsub_pd(__m128d __A, __m128d __B, __m128d __C) argument
132 _mm_msubadd_ps(__m128 __A, __m128 __B, __m128 __C) argument
138 _mm_msubadd_pd(__m128d __A, __m128d __B, __m128d __C) argument
144 _mm256_macc_ps(__m256 __A, __m256 __B, __m256 __C) argument
150 _mm256_macc_pd(__m256d __A, __m256d __B, __m256d __C) argument
156 _mm256_msub_ps(__m256 __A, __m256 __B, __m256 __C) argument
162 _mm256_msub_pd(__m256d __A, __m256d __B, __m256d __C) argument
168 _mm256_nmacc_ps(__m256 __A, __m256 __B, __m256 __C) argument
174 _mm256_nmacc_pd(__m256d __A, __m256d __B, __m256d __C) argument
180 _mm256_nmsub_ps(__m256 __A, __m256 __B, __m256 __C) argument
186 _mm256_nmsub_pd(__m256d __A, __m256d __B, __m256d __C) argument
192 _mm256_maddsub_ps(__m256 __A, __m256 __B, __m256 __C) argument
198 _mm256_maddsub_pd(__m256d __A, __m256d __B, __m256d __C) argument
204 _mm256_msubadd_ps(__m256 __A, __m256 __B, __m256 __C) argument
210 _mm256_msubadd_pd(__m256d __A, __m256d __B, __m256d __C) argument
[all...]
H A Dfmaintrin.h22 _mm_fmadd_ps(__m128 __A, __m128 __B, __m128 __C) argument
24 return (__m128)__builtin_ia32_vfmaddps((__v4sf)__A, (__v4sf)__B, (__v4sf)__C);
28 _mm_fmadd_pd(__m128d __A, __m128d __B, __m128d __C) argument
30 return (__m128d)__builtin_ia32_vfmaddpd((__v2df)__A, (__v2df)__B, (__v2df)__C);
34 _mm_fmadd_ss(__m128 __A, __m128 __B, __m128 __C) argument
36 return (__m128)__builtin_ia32_vfmaddss3((__v4sf)__A, (__v4sf)__B, (__v4sf)__C);
40 _mm_fmadd_sd(__m128d __A, __m128d __B, __m128d __C) argument
42 return (__m128d)__builtin_ia32_vfmaddsd3((__v2df)__A, (__v2df)__B, (__v2df)__C);
46 _mm_fmsub_ps(__m128 __A, __m128 __B, __m128 __C) argument
48 return (__m128)__builtin_ia32_vfmaddps((__v4sf)__A, (__v4s
52 _mm_fmsub_pd(__m128d __A, __m128d __B, __m128d __C) argument
58 _mm_fmsub_ss(__m128 __A, __m128 __B, __m128 __C) argument
64 _mm_fmsub_sd(__m128d __A, __m128d __B, __m128d __C) argument
70 _mm_fnmadd_ps(__m128 __A, __m128 __B, __m128 __C) argument
76 _mm_fnmadd_pd(__m128d __A, __m128d __B, __m128d __C) argument
82 _mm_fnmadd_ss(__m128 __A, __m128 __B, __m128 __C) argument
88 _mm_fnmadd_sd(__m128d __A, __m128d __B, __m128d __C) argument
94 _mm_fnmsub_ps(__m128 __A, __m128 __B, __m128 __C) argument
100 _mm_fnmsub_pd(__m128d __A, __m128d __B, __m128d __C) argument
106 _mm_fnmsub_ss(__m128 __A, __m128 __B, __m128 __C) argument
112 _mm_fnmsub_sd(__m128d __A, __m128d __B, __m128d __C) argument
118 _mm_fmaddsub_ps(__m128 __A, __m128 __B, __m128 __C) argument
124 _mm_fmaddsub_pd(__m128d __A, __m128d __B, __m128d __C) argument
130 _mm_fmsubadd_ps(__m128 __A, __m128 __B, __m128 __C) argument
136 _mm_fmsubadd_pd(__m128d __A, __m128d __B, __m128d __C) argument
142 _mm256_fmadd_ps(__m256 __A, __m256 __B, __m256 __C) argument
148 _mm256_fmadd_pd(__m256d __A, __m256d __B, __m256d __C) argument
154 _mm256_fmsub_ps(__m256 __A, __m256 __B, __m256 __C) argument
160 _mm256_fmsub_pd(__m256d __A, __m256d __B, __m256d __C) argument
166 _mm256_fnmadd_ps(__m256 __A, __m256 __B, __m256 __C) argument
172 _mm256_fnmadd_pd(__m256d __A, __m256d __B, __m256d __C) argument
178 _mm256_fnmsub_ps(__m256 __A, __m256 __B, __m256 __C) argument
184 _mm256_fnmsub_pd(__m256d __A, __m256d __B, __m256d __C) argument
190 _mm256_fmaddsub_ps(__m256 __A, __m256 __B, __m256 __C) argument
196 _mm256_fmaddsub_pd(__m256d __A, __m256d __B, __m256d __C) argument
202 _mm256_fmsubadd_ps(__m256 __A, __m256 __B, __m256 __C) argument
208 _mm256_fmsubadd_pd(__m256d __A, __m256d __B, __m256d __C) argument
[all...]
H A Dvaesintrin.h25 _mm256_aesenc_epi128(__m256i __A, __m256i __B) argument
27 return (__m256i) __builtin_ia32_aesenc256((__v4di) __A,
32 _mm256_aesdec_epi128(__m256i __A, __m256i __B) argument
34 return (__m256i) __builtin_ia32_aesdec256((__v4di) __A,
39 _mm256_aesenclast_epi128(__m256i __A, __m256i __B) argument
41 return (__m256i) __builtin_ia32_aesenclast256((__v4di) __A,
46 _mm256_aesdeclast_epi128(__m256i __A, __m256i __B) argument
48 return (__m256i) __builtin_ia32_aesdeclast256((__v4di) __A,
54 _mm512_aesenc_epi128(__m512i __A, __m512i __B) argument
56 return (__m512i) __builtin_ia32_aesenc512((__v8di) __A,
61 _mm512_aesdec_epi128(__m512i __A, __m512i __B) argument
68 _mm512_aesenclast_epi128(__m512i __A, __m512i __B) argument
75 _mm512_aesdeclast_epi128(__m512i __A, __m512i __B) argument
[all...]
H A Davxvnniintrin.h32 /// \fn __m256i _mm256_dpbusd_epi32(__m256i __S, __m256i __A, __m256i __B)
33 /// \fn __m256i _mm256_dpbusds_epi32(__m256i __S, __m256i __A, __m256i __B)
34 /// \fn __m256i _mm256_dpwssd_epi32(__m256i __S, __m256i __A, __m256i __B)
35 /// \fn __m256i _mm256_dpwssds_epi32(__m256i __S, __m256i __A, __m256i __B)
36 /// \fn __m128i _mm_dpbusd_epi32(__m128i __S, __m128i __A, __m128i __B)
37 /// \fn __m128i _mm_dpbusds_epi32(__m128i __S, __m128i __A, __m128i __B)
38 /// \fn __m128i _mm_dpwssd_epi32(__m128i __S, __m128i __A, __m128i __B)
39 /// \fn __m128i _mm_dpwssds_epi32(__m128i __S, __m128i __A, __m128i __B)
46 /// Multiply groups of 4 adjacent pairs of unsigned 8-bit integers in \a __A with
55 /// tmp1.word := Signed(ZeroExtend16(__A
64 _mm256_dpbusd_avx_epi32(__m256i __S, __m256i __A, __m256i __B) argument
87 _mm256_dpbusds_avx_epi32(__m256i __S, __m256i __A, __m256i __B) argument
108 _mm256_dpwssd_avx_epi32(__m256i __S, __m256i __A, __m256i __B) argument
129 _mm256_dpwssds_avx_epi32(__m256i __S, __m256i __A, __m256i __B) argument
152 _mm_dpbusd_avx_epi32(__m128i __S, __m128i __A, __m128i __B) argument
175 _mm_dpbusds_avx_epi32(__m128i __S, __m128i __A, __m128i __B) argument
196 _mm_dpwssd_avx_epi32(__m128i __S, __m128i __A, __m128i __B) argument
217 _mm_dpwssds_avx_epi32(__m128i __S, __m128i __A, __m128i __B) argument
[all...]
H A Davx512bitalgintrin.h21 _mm512_popcnt_epi16(__m512i __A) argument
23 return (__m512i) __builtin_ia32_vpopcntw_512((__v32hi) __A);
27 _mm512_mask_popcnt_epi16(__m512i __A, __mmask32 __U, __m512i __B) argument
31 (__v32hi) __A);
43 _mm512_popcnt_epi8(__m512i __A) argument
45 return (__m512i) __builtin_ia32_vpopcntb_512((__v64qi) __A);
49 _mm512_mask_popcnt_epi8(__m512i __A, __mmask64 __U, __m512i __B) argument
53 (__v64qi) __A);
65 _mm512_mask_bitshuffle_epi64_mask(__mmask64 __U, __m512i __A, __m512i __B) argument
67 return (__mmask64) __builtin_ia32_vpshufbitqmb512_mask((__v64qi) __A,
73 _mm512_bitshuffle_epi64_mask(__m512i __A, __m512i __B) argument
[all...]
H A Davx512vpopcntdqintrin.h22 static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_popcnt_epi64(__m512i __A) { argument
23 return (__m512i)__builtin_ia32_vpopcntq_512((__v8di)__A);
27 _mm512_mask_popcnt_epi64(__m512i __W, __mmask8 __U, __m512i __A) { argument
29 (__mmask8)__U, (__v8di)_mm512_popcnt_epi64(__A), (__v8di)__W);
33 _mm512_maskz_popcnt_epi64(__mmask8 __U, __m512i __A) { argument
34 return _mm512_mask_popcnt_epi64((__m512i)_mm512_setzero_si512(), __U, __A);
37 static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_popcnt_epi32(__m512i __A) { argument
38 return (__m512i)__builtin_ia32_vpopcntd_512((__v16si)__A);
42 _mm512_mask_popcnt_epi32(__m512i __W, __mmask16 __U, __m512i __A) { argument
44 (__mmask16)__U, (__v16si)_mm512_popcnt_epi32(__A), (__v16s
48 _mm512_maskz_popcnt_epi32(__mmask16 __U, __m512i __A) argument
[all...]
H A Dia32intrin.h37 * \param __A
42 __bsfd(int __A) { argument
43 return __builtin_ctz((unsigned int)__A);
54 * \param __A
59 __bsrd(int __A) { argument
60 return 31 - __builtin_clz((unsigned int)__A);
70 * \param __A
75 __bswapd(int __A) { argument
76 return (int)__builtin_bswap32((unsigned int)__A);
80 _bswap(int __A) { argument
101 __bsfq(long long __A) argument
118 __bsrq(long long __A) argument
134 __bswapq(long long __A) argument
154 __popcntd(unsigned int __A) argument
175 __popcntq(unsigned long long __A) argument
221 _castf32_u32(float __A) argument
236 _castf64_u64(double __A) argument
251 _castu32_f32(unsigned int __A) argument
266 _castu64_f64(unsigned long long __A) argument
357 __rdpmc(int __A) argument
363 __rdtscp(unsigned int *__A) argument
[all...]
H A Davx512bwintrin.h37 _kand_mask32(__mmask32 __A, __mmask32 __B) argument
39 return (__mmask32)__builtin_ia32_kandsi((__mmask32)__A, (__mmask32)__B);
43 _kand_mask64(__mmask64 __A, __mmask64 __B) argument
45 return (__mmask64)__builtin_ia32_kanddi((__mmask64)__A, (__mmask64)__B);
49 _kandn_mask32(__mmask32 __A, __mmask32 __B) argument
51 return (__mmask32)__builtin_ia32_kandnsi((__mmask32)__A, (__mmask32)__B);
55 _kandn_mask64(__mmask64 __A, __mmask64 __B) argument
57 return (__mmask64)__builtin_ia32_kandndi((__mmask64)__A, (__mmask64)__B);
61 _kor_mask32(__mmask32 __A, __mmask32 __B) argument
63 return (__mmask32)__builtin_ia32_korsi((__mmask32)__A, (__mmask3
67 _kor_mask64(__mmask64 __A, __mmask64 __B) argument
73 _kxnor_mask32(__mmask32 __A, __mmask32 __B) argument
79 _kxnor_mask64(__mmask64 __A, __mmask64 __B) argument
85 _kxor_mask32(__mmask32 __A, __mmask32 __B) argument
91 _kxor_mask64(__mmask64 __A, __mmask64 __B) argument
97 _kortestc_mask32_u8(__mmask32 __A, __mmask32 __B) argument
103 _kortestz_mask32_u8(__mmask32 __A, __mmask32 __B) argument
109 _kortest_mask32_u8(__mmask32 __A, __mmask32 __B, unsigned char *__C) argument
115 _kortestc_mask64_u8(__mmask64 __A, __mmask64 __B) argument
121 _kortestz_mask64_u8(__mmask64 __A, __mmask64 __B) argument
127 _kortest_mask64_u8(__mmask64 __A, __mmask64 __B, unsigned char *__C) argument
133 _ktestc_mask32_u8(__mmask32 __A, __mmask32 __B) argument
139 _ktestz_mask32_u8(__mmask32 __A, __mmask32 __B) argument
145 _ktest_mask32_u8(__mmask32 __A, __mmask32 __B, unsigned char *__C) argument
151 _ktestc_mask64_u8(__mmask64 __A, __mmask64 __B) argument
157 _ktestz_mask64_u8(__mmask64 __A, __mmask64 __B) argument
163 _ktest_mask64_u8(__mmask64 __A, __mmask64 __B, unsigned char *__C) argument
169 _kadd_mask32(__mmask32 __A, __mmask32 __B) argument
175 _kadd_mask64(__mmask64 __A, __mmask64 __B) argument
193 _cvtmask32_u32(__mmask32 __A) argument
198 _cvtmask64_u64(__mmask64 __A) argument
203 _cvtu32_mask32(unsigned int __A) argument
208 _cvtu64_mask64(unsigned long long __A) argument
213 _load_mask32(__mmask32 *__A) argument
218 _load_mask64(__mmask64 *__A) argument
223 _store_mask32(__mmask32 *__A, __mmask32 __B) argument
228 _store_mask64(__mmask64 *__A, __mmask64 __B) argument
375 _mm512_add_epi8(__m512i __A, __m512i __B) argument
380 _mm512_mask_add_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B) argument
387 _mm512_maskz_add_epi8(__mmask64 __U, __m512i __A, __m512i __B) argument
394 _mm512_sub_epi8(__m512i __A, __m512i __B) argument
399 _mm512_mask_sub_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B) argument
406 _mm512_maskz_sub_epi8(__mmask64 __U, __m512i __A, __m512i __B) argument
413 _mm512_add_epi16(__m512i __A, __m512i __B) argument
418 _mm512_mask_add_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B) argument
425 _mm512_maskz_add_epi16(__mmask32 __U, __m512i __A, __m512i __B) argument
432 _mm512_sub_epi16(__m512i __A, __m512i __B) argument
437 _mm512_mask_sub_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B) argument
444 _mm512_maskz_sub_epi16(__mmask32 __U, __m512i __A, __m512i __B) argument
451 _mm512_mullo_epi16(__m512i __A, __m512i __B) argument
456 _mm512_mask_mullo_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B) argument
463 _mm512_maskz_mullo_epi16(__mmask32 __U, __m512i __A, __m512i __B) argument
470 _mm512_mask_blend_epi8(__mmask64 __U, __m512i __A, __m512i __W) argument
478 _mm512_mask_blend_epi16(__mmask32 __U, __m512i __A, __m512i __W) argument
486 _mm512_abs_epi8(__m512i __A) argument
492 _mm512_mask_abs_epi8(__m512i __W, __mmask64 __U, __m512i __A) argument
500 _mm512_maskz_abs_epi8(__mmask64 __U, __m512i __A) argument
508 _mm512_abs_epi16(__m512i __A) argument
514 _mm512_mask_abs_epi16(__m512i __W, __mmask32 __U, __m512i __A) argument
522 _mm512_maskz_abs_epi16(__mmask32 __U, __m512i __A) argument
530 _mm512_packs_epi32(__m512i __A, __m512i __B) argument
536 _mm512_maskz_packs_epi32(__mmask32 __M, __m512i __A, __m512i __B) argument
544 _mm512_mask_packs_epi32(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B) argument
552 _mm512_packs_epi16(__m512i __A, __m512i __B) argument
558 _mm512_mask_packs_epi16(__m512i __W, __mmask64 __M, __m512i __A, __m512i __B) argument
566 _mm512_maskz_packs_epi16(__mmask64 __M, __m512i __A, __m512i __B) argument
574 _mm512_packus_epi32(__m512i __A, __m512i __B) argument
580 _mm512_maskz_packus_epi32(__mmask32 __M, __m512i __A, __m512i __B) argument
588 _mm512_mask_packus_epi32(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B) argument
596 _mm512_packus_epi16(__m512i __A, __m512i __B) argument
602 _mm512_mask_packus_epi16(__m512i __W, __mmask64 __M, __m512i __A, __m512i __B) argument
610 _mm512_maskz_packus_epi16(__mmask64 __M, __m512i __A, __m512i __B) argument
618 _mm512_adds_epi8(__m512i __A, __m512i __B) argument
624 _mm512_mask_adds_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B) argument
632 _mm512_maskz_adds_epi8(__mmask64 __U, __m512i __A, __m512i __B) argument
640 _mm512_adds_epi16(__m512i __A, __m512i __B) argument
646 _mm512_mask_adds_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B) argument
654 _mm512_maskz_adds_epi16(__mmask32 __U, __m512i __A, __m512i __B) argument
662 _mm512_adds_epu8(__m512i __A, __m512i __B) argument
668 _mm512_mask_adds_epu8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B) argument
676 _mm512_maskz_adds_epu8(__mmask64 __U, __m512i __A, __m512i __B) argument
684 _mm512_adds_epu16(__m512i __A, __m512i __B) argument
690 _mm512_mask_adds_epu16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B) argument
698 _mm512_maskz_adds_epu16(__mmask32 __U, __m512i __A, __m512i __B) argument
706 _mm512_avg_epu8(__m512i __A, __m512i __B) argument
712 _mm512_mask_avg_epu8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B) argument
721 _mm512_maskz_avg_epu8(__mmask64 __U, __m512i __A, __m512i __B) argument
729 _mm512_avg_epu16(__m512i __A, __m512i __B) argument
735 _mm512_mask_avg_epu16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B) argument
744 _mm512_maskz_avg_epu16(__mmask32 __U, __m512i __A, __m512i __B) argument
752 _mm512_max_epi8(__m512i __A, __m512i __B) argument
758 _mm512_maskz_max_epi8(__mmask64 __M, __m512i __A, __m512i __B) argument
766 _mm512_mask_max_epi8(__m512i __W, __mmask64 __M, __m512i __A, __m512i __B) argument
774 _mm512_max_epi16(__m512i __A, __m512i __B) argument
780 _mm512_maskz_max_epi16(__mmask32 __M, __m512i __A, __m512i __B) argument
788 _mm512_mask_max_epi16(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B) argument
797 _mm512_max_epu8(__m512i __A, __m512i __B) argument
803 _mm512_maskz_max_epu8(__mmask64 __M, __m512i __A, __m512i __B) argument
811 _mm512_mask_max_epu8(__m512i __W, __mmask64 __M, __m512i __A, __m512i __B) argument
819 _mm512_max_epu16(__m512i __A, __m512i __B) argument
825 _mm512_maskz_max_epu16(__mmask32 __M, __m512i __A, __m512i __B) argument
833 _mm512_mask_max_epu16(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B) argument
841 _mm512_min_epi8(__m512i __A, __m512i __B) argument
847 _mm512_maskz_min_epi8(__mmask64 __M, __m512i __A, __m512i __B) argument
855 _mm512_mask_min_epi8(__m512i __W, __mmask64 __M, __m512i __A, __m512i __B) argument
863 _mm512_min_epi16(__m512i __A, __m512i __B) argument
869 _mm512_maskz_min_epi16(__mmask32 __M, __m512i __A, __m512i __B) argument
877 _mm512_mask_min_epi16(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B) argument
885 _mm512_min_epu8(__m512i __A, __m512i __B) argument
891 _mm512_maskz_min_epu8(__mmask64 __M, __m512i __A, __m512i __B) argument
899 _mm512_mask_min_epu8(__m512i __W, __mmask64 __M, __m512i __A, __m512i __B) argument
907 _mm512_min_epu16(__m512i __A, __m512i __B) argument
913 _mm512_maskz_min_epu16(__mmask32 __M, __m512i __A, __m512i __B) argument
921 _mm512_mask_min_epu16(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B) argument
929 _mm512_shuffle_epi8(__m512i __A, __m512i __B) argument
935 _mm512_mask_shuffle_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B) argument
943 _mm512_maskz_shuffle_epi8(__mmask64 __U, __m512i __A, __m512i __B) argument
951 _mm512_subs_epi8(__m512i __A, __m512i __B) argument
957 _mm512_mask_subs_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B) argument
965 _mm512_maskz_subs_epi8(__mmask64 __U, __m512i __A, __m512i __B) argument
973 _mm512_subs_epi16(__m512i __A, __m512i __B) argument
979 _mm512_mask_subs_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B) argument
987 _mm512_maskz_subs_epi16(__mmask32 __U, __m512i __A, __m512i __B) argument
995 _mm512_subs_epu8(__m512i __A, __m512i __B) argument
1001 _mm512_mask_subs_epu8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B) argument
1009 _mm512_maskz_subs_epu8(__mmask64 __U, __m512i __A, __m512i __B) argument
1017 _mm512_subs_epu16(__m512i __A, __m512i __B) argument
1023 _mm512_mask_subs_epu16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B) argument
1031 _mm512_maskz_subs_epu16(__mmask32 __U, __m512i __A, __m512i __B) argument
1039 _mm512_permutex2var_epi16(__m512i __A, __m512i __I, __m512i __B) argument
1046 _mm512_mask_permutex2var_epi16(__m512i __A, __mmask32 __U, __m512i __I, __m512i __B) argument
1055 _mm512_mask2_permutex2var_epi16(__m512i __A, __m512i __I, __mmask32 __U, __m512i __B) argument
1064 _mm512_maskz_permutex2var_epi16(__mmask32 __U, __m512i __A, __m512i __I, __m512i __B) argument
1073 _mm512_mulhrs_epi16(__m512i __A, __m512i __B) argument
1079 _mm512_mask_mulhrs_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B) argument
1087 _mm512_maskz_mulhrs_epi16(__mmask32 __U, __m512i __A, __m512i __B) argument
1095 _mm512_mulhi_epi16(__m512i __A, __m512i __B) argument
1101 _mm512_mask_mulhi_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B) argument
1110 _mm512_maskz_mulhi_epi16(__mmask32 __U, __m512i __A, __m512i __B) argument
1118 _mm512_mulhi_epu16(__m512i __A, __m512i __B) argument
1124 _mm512_mask_mulhi_epu16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B) argument
1132 _mm512_maskz_mulhi_epu16(__mmask32 __U, __m512i __A, __m512i __B) argument
1160 _mm512_madd_epi16(__m512i __A, __m512i __B) argument
1165 _mm512_mask_madd_epi16(__m512i __W, __mmask16 __U, __m512i __A, __m512i __B) argument
1172 _mm512_maskz_madd_epi16(__mmask16 __U, __m512i __A, __m512i __B) argument
1179 _mm512_cvtsepi16_epi8(__m512i __A) argument
1186 _mm512_mask_cvtsepi16_epi8(__m256i __O, __mmask32 __M, __m512i __A) argument
1193 _mm512_maskz_cvtsepi16_epi8(__mmask32 __M, __m512i __A) argument
1200 _mm512_cvtusepi16_epi8(__m512i __A) argument
1207 _mm512_mask_cvtusepi16_epi8(__m256i __O, __mmask32 __M, __m512i __A) argument
1214 _mm512_maskz_cvtusepi16_epi8(__mmask32 __M, __m512i __A) argument
1221 _mm512_cvtepi16_epi8(__m512i __A) argument
1228 _mm512_mask_cvtepi16_epi8(__m256i __O, __mmask32 __M, __m512i __A) argument
1235 _mm512_maskz_cvtepi16_epi8(__mmask32 __M, __m512i __A) argument
1242 _mm512_mask_cvtepi16_storeu_epi8(void * __P, __mmask32 __M, __m512i __A) argument
1248 _mm512_mask_cvtsepi16_storeu_epi8(void * __P, __mmask32 __M, __m512i __A) argument
1254 _mm512_mask_cvtusepi16_storeu_epi8(void * __P, __mmask32 __M, __m512i __A) argument
1260 _mm512_unpackhi_epi8(__m512i __A, __m512i __B) argument
1281 _mm512_mask_unpackhi_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B) argument
1288 _mm512_maskz_unpackhi_epi8(__mmask64 __U, __m512i __A, __m512i __B) argument
1295 _mm512_unpackhi_epi16(__m512i __A, __m512i __B) argument
1308 _mm512_mask_unpackhi_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B) argument
1315 _mm512_maskz_unpackhi_epi16(__mmask32 __U, __m512i __A, __m512i __B) argument
1322 _mm512_unpacklo_epi8(__m512i __A, __m512i __B) argument
1343 _mm512_mask_unpacklo_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B) argument
1350 _mm512_maskz_unpacklo_epi8(__mmask64 __U, __m512i __A, __m512i __B) argument
1357 _mm512_unpacklo_epi16(__m512i __A, __m512i __B) argument
1370 _mm512_mask_unpacklo_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B) argument
1377 _mm512_maskz_unpacklo_epi16(__mmask32 __U, __m512i __A, __m512i __B) argument
1384 _mm512_cvtepi8_epi16(__m256i __A) argument
1392 _mm512_mask_cvtepi8_epi16(__m512i __W, __mmask32 __U, __m256i __A) argument
1400 _mm512_maskz_cvtepi8_epi16(__mmask32 __U, __m256i __A) argument
1408 _mm512_cvtepu8_epi16(__m256i __A) argument
1414 _mm512_mask_cvtepu8_epi16(__m512i __W, __mmask32 __U, __m256i __A) argument
1422 _mm512_maskz_cvtepu8_epi16(__mmask32 __U, __m256i __A) argument
1463 _mm512_sllv_epi16(__m512i __A, __m512i __B) argument
1469 _mm512_mask_sllv_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B) argument
1477 _mm512_maskz_sllv_epi16(__mmask32 __U, __m512i __A, __m512i __B) argument
1485 _mm512_sll_epi16(__m512i __A, __m128i __B) argument
1491 _mm512_mask_sll_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m128i __B) argument
1499 _mm512_maskz_sll_epi16(__mmask32 __U, __m512i __A, __m128i __B) argument
1507 _mm512_slli_epi16(__m512i __A, unsigned int __B) argument
1513 _mm512_mask_slli_epi16(__m512i __W, __mmask32 __U, __m512i __A, unsigned int __B) argument
1522 _mm512_maskz_slli_epi16(__mmask32 __U, __m512i __A, unsigned int __B) argument
1533 _mm512_srlv_epi16(__m512i __A, __m512i __B) argument
1539 _mm512_mask_srlv_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B) argument
1547 _mm512_maskz_srlv_epi16(__mmask32 __U, __m512i __A, __m512i __B) argument
1555 _mm512_srav_epi16(__m512i __A, __m512i __B) argument
1561 _mm512_mask_srav_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B) argument
1569 _mm512_maskz_srav_epi16(__mmask32 __U, __m512i __A, __m512i __B) argument
1577 _mm512_sra_epi16(__m512i __A, __m128i __B) argument
1583 _mm512_mask_sra_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m128i __B) argument
1591 _mm512_maskz_sra_epi16(__mmask32 __U, __m512i __A, __m128i __B) argument
1599 _mm512_srai_epi16(__m512i __A, unsigned int __B) argument
1605 _mm512_mask_srai_epi16(__m512i __W, __mmask32 __U, __m512i __A, unsigned int __B) argument
1614 _mm512_maskz_srai_epi16(__mmask32 __U, __m512i __A, unsigned int __B) argument
1622 _mm512_srl_epi16(__m512i __A, __m128i __B) argument
1628 _mm512_mask_srl_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m128i __B) argument
1636 _mm512_maskz_srl_epi16(__mmask32 __U, __m512i __A, __m128i __B) argument
1644 _mm512_srli_epi16(__m512i __A, unsigned int __B) argument
1650 _mm512_mask_srli_epi16(__m512i __W, __mmask32 __U, __m512i __A, unsigned int __B) argument
1659 _mm512_maskz_srli_epi16(__mmask32 __U, __m512i __A, int __B) argument
1670 _mm512_mask_mov_epi16(__m512i __W, __mmask32 __U, __m512i __A) argument
1678 _mm512_maskz_mov_epi16(__mmask32 __U, __m512i __A) argument
1686 _mm512_mask_mov_epi8(__m512i __W, __mmask64 __U, __m512i __A) argument
1694 _mm512_maskz_mov_epi8(__mmask64 __U, __m512i __A) argument
1702 _mm512_mask_set1_epi8(__m512i __O, __mmask64 __M, char __A) argument
1710 _mm512_maskz_set1_epi8(__mmask64 __M, char __A) argument
1718 _mm512_kunpackd(__mmask64 __A, __mmask64 __B) argument
1725 _mm512_kunpackw(__mmask32 __A, __mmask32 __B) argument
1784 _mm512_storeu_epi16(void *__P, __m512i __A) argument
1793 _mm512_mask_storeu_epi16(void *__P, __mmask32 __U, __m512i __A) argument
1801 _mm512_storeu_epi8(void *__P, __m512i __A) argument
1810 _mm512_mask_storeu_epi8(void *__P, __mmask64 __U, __m512i __A) argument
1818 _mm512_test_epi8_mask(__m512i __A, __m512i __B) argument
1825 _mm512_mask_test_epi8_mask(__mmask64 __U, __m512i __A, __m512i __B) argument
1832 _mm512_test_epi16_mask(__m512i __A, __m512i __B) argument
1839 _mm512_mask_test_epi16_mask(__mmask32 __U, __m512i __A, __m512i __B) argument
1846 _mm512_testn_epi8_mask(__m512i __A, __m512i __B) argument
1852 _mm512_mask_testn_epi8_mask(__mmask64 __U, __m512i __A, __m512i __B) argument
1859 _mm512_testn_epi16_mask(__m512i __A, __m512i __B) argument
1866 _mm512_mask_testn_epi16_mask(__mmask32 __U, __m512i __A, __m512i __B) argument
1873 _mm512_movepi8_mask(__m512i __A) argument
1879 _mm512_movepi16_mask(__m512i __A) argument
1885 _mm512_movm_epi8(__mmask64 __A) argument
1891 _mm512_movm_epi16(__mmask32 __A) argument
1897 _mm512_broadcastb_epi8(__m128i __A) argument
1907 _mm512_mask_broadcastb_epi8(__m512i __O, __mmask64 __M, __m128i __A) argument
1915 _mm512_maskz_broadcastb_epi8(__mmask64 __M, __m128i __A) argument
1923 _mm512_mask_set1_epi16(__m512i __O, __mmask32 __M, short __A) argument
1931 _mm512_maskz_set1_epi16(__mmask32 __M, short __A) argument
1939 _mm512_broadcastw_epi16(__m128i __A) argument
1947 _mm512_mask_broadcastw_epi16(__m512i __O, __mmask32 __M, __m128i __A) argument
1955 _mm512_maskz_broadcastw_epi16(__mmask32 __M, __m128i __A) argument
1963 _mm512_permutexvar_epi16(__m512i __A, __m512i __B) argument
1969 _mm512_maskz_permutexvar_epi16(__mmask32 __M, __m512i __A, __m512i __B) argument
1978 _mm512_mask_permutexvar_epi16(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B) argument
2015 _mm512_sad_epu8(__m512i __A, __m512i __B) argument
[all...]
H A Davx512vlbf16intrin.h31 /// \param __A
36 /// conversion of __B, and higher 64 bits come from conversion of __A.
38 _mm_cvtne2ps_pbh(__m128 __A, __m128 __B) { argument
39 return (__m128bh)__builtin_ia32_cvtne2ps2bf16_128((__v4sf) __A,
49 /// \param __A
57 /// A 1 means conversion of __A or __B. A 0 means element from __W.
59 /// conversion of __B, and higher 64 bits come from conversion of __A.
61 _mm_mask_cvtne2ps_pbh(__m128bh __W, __mmask8 __U, __m128 __A, __m128 __B) { argument
63 (__v8bf)_mm_cvtne2ps_pbh(__A, __B),
73 /// \param __A
83 _mm_maskz_cvtne2ps_pbh(__mmask8 __U, __m128 __A, __m128 __B) argument
102 _mm256_cvtne2ps_pbh(__m256 __A, __m256 __B) argument
125 _mm256_mask_cvtne2ps_pbh(__m256bh __W, __mmask16 __U, __m256 __A, __m256 __B) argument
147 _mm256_maskz_cvtne2ps_pbh(__mmask16 __U, __m256 __A, __m256 __B) argument
182 _mm_mask_cvtneps_pbh(__m128bh __W, __mmask8 __U, __m128 __A) argument
202 _mm_maskz_cvtneps_pbh(__mmask8 __U, __m128 __A) argument
235 _mm256_mask_cvtneps_pbh(__m128bh __W, __mmask8 __U, __m256 __A) argument
254 _mm256_maskz_cvtneps_pbh(__mmask8 __U, __m256 __A) argument
275 _mm_dpbf16_ps(__m128 __D, __m128bh __A, __m128bh __B) argument
299 _mm_mask_dpbf16_ps(__m128 __D, __mmask8 __U, __m128bh __A, __m128bh __B) argument
323 _mm_maskz_dpbf16_ps(__mmask8 __U, __m128 __D, __m128bh __A, __m128bh __B) argument
344 _mm256_dpbf16_ps(__m256 __D, __m256bh __A, __m256bh __B) argument
368 _mm256_mask_dpbf16_ps(__m256 __D, __mmask8 __U, __m256bh __A, __m256bh __B) argument
392 _mm256_maskz_dpbf16_ps(__mmask8 __U, __m256 __D, __m256bh __A, __m256bh __B) argument
408 _mm_cvtness_sbh(float __A) argument
422 _mm_cvtpbh_ps(__m128bh __A) argument
434 _mm256_cvtpbh_ps(__m128bh __A) argument
450 _mm_maskz_cvtpbh_ps(__mmask8 __U, __m128bh __A) argument
466 _mm256_maskz_cvtpbh_ps(__mmask8 __U, __m128bh __A) argument
485 _mm_mask_cvtpbh_ps(__m128 __S, __mmask8 __U, __m128bh __A) argument
505 _mm256_mask_cvtpbh_ps(__m256 __S, __mmask8 __U, __m128bh __A) argument
[all...]
H A Davx512bf16intrin.h34 /// \param __A
38 static __inline__ float __DEFAULT_FN_ATTRS _mm_cvtsbh_ss(__bf16 __A) { argument
39 return __builtin_ia32_cvtsbf162ss_32(__A);
48 /// \param __A
53 /// conversion of __B, and higher 256 bits come from conversion of __A.
55 _mm512_cvtne2ps_pbh(__m512 __A, __m512 __B) { argument
56 return (__m512bh)__builtin_ia32_cvtne2ps2bf16_512((__v16sf) __A,
66 /// \param __A
74 /// A 1 means conversion of __A or __B. A 0 means element from __W.
76 /// conversion of __B, and higher 256 bits come from conversion of __A
78 _mm512_mask_cvtne2ps_pbh(__m512bh __W, __mmask32 __U, __m512 __A, __m512 __B) argument
100 _mm512_maskz_cvtne2ps_pbh(__mmask32 __U, __m512 __A, __m512 __B) argument
116 _mm512_cvtneps_pbh(__m512 __A) argument
137 _mm512_mask_cvtneps_pbh(__m256bh __W, __mmask16 __U, __m512 __A) argument
156 _mm512_maskz_cvtneps_pbh(__mmask16 __U, __m512 __A) argument
177 _mm512_dpbf16_ps(__m512 __D, __m512bh __A, __m512bh __B) argument
201 _mm512_mask_dpbf16_ps(__m512 __D, __mmask16 __U, __m512bh __A, __m512bh __B) argument
225 _mm512_maskz_dpbf16_ps(__mmask16 __U, __m512 __D, __m512bh __A, __m512bh __B) argument
238 _mm512_cvtpbh_ps(__m256bh __A) argument
254 _mm512_maskz_cvtpbh_ps(__mmask16 __U, __m256bh __A) argument
272 _mm512_mask_cvtpbh_ps(__m512 __S, __mmask16 __U, __m256bh __A) argument
[all...]
H A Davx512vlintrin.h227 _mm256_mask_add_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument
230 (__v8si)_mm256_add_epi32(__A, __B),
235 _mm256_maskz_add_epi32(__mmask8 __U, __m256i __A, __m256i __B) argument
238 (__v8si)_mm256_add_epi32(__A, __B),
243 _mm256_mask_add_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument
246 (__v4di)_mm256_add_epi64(__A, __B),
251 _mm256_maskz_add_epi64(__mmask8 __U, __m256i __A, __m256i __B) argument
254 (__v4di)_mm256_add_epi64(__A, __B),
259 _mm256_mask_sub_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument
262 (__v8si)_mm256_sub_epi32(__A, __
267 _mm256_maskz_sub_epi32(__mmask8 __U, __m256i __A, __m256i __B) argument
275 _mm256_mask_sub_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument
283 _mm256_maskz_sub_epi64(__mmask8 __U, __m256i __A, __m256i __B) argument
291 _mm_mask_add_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument
299 _mm_maskz_add_epi32(__mmask8 __U, __m128i __A, __m128i __B) argument
307 _mm_mask_add_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument
315 _mm_maskz_add_epi64(__mmask8 __U, __m128i __A, __m128i __B) argument
323 _mm_mask_sub_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument
331 _mm_maskz_sub_epi32(__mmask8 __U, __m128i __A, __m128i __B) argument
339 _mm_mask_sub_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument
347 _mm_maskz_sub_epi64(__mmask8 __U, __m128i __A, __m128i __B) argument
419 _mm256_maskz_mullo_epi32(__mmask8 __M, __m256i __A, __m256i __B) argument
427 _mm256_mask_mullo_epi32(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) argument
435 _mm_maskz_mullo_epi32(__mmask8 __M, __m128i __A, __m128i __B) argument
443 _mm_mask_mullo_epi32(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) argument
457 _mm256_mask_and_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument
465 _mm256_maskz_and_epi32(__mmask8 __U, __m256i __A, __m256i __B) argument
477 _mm_mask_and_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument
485 _mm_maskz_and_epi32(__mmask8 __U, __m128i __A, __m128i __B) argument
491 _mm256_andnot_epi32(__m256i __A, __m256i __B) argument
497 _mm256_mask_andnot_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument
505 _mm256_maskz_andnot_epi32(__mmask8 __U, __m256i __A, __m256i __B) argument
512 _mm_andnot_epi32(__m128i __A, __m128i __B) argument
518 _mm_mask_andnot_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument
526 _mm_maskz_andnot_epi32(__mmask8 __U, __m128i __A, __m128i __B) argument
538 _mm256_mask_or_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument
546 _mm256_maskz_or_epi32(__mmask8 __U, __m256i __A, __m256i __B) argument
558 _mm_mask_or_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument
566 _mm_maskz_or_epi32(__mmask8 __U, __m128i __A, __m128i __B) argument
578 _mm256_mask_xor_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument
586 _mm256_maskz_xor_epi32(__mmask8 __U, __m256i __A, __m256i __B) argument
598 _mm_mask_xor_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument
606 _mm_maskz_xor_epi32(__mmask8 __U, __m128i __A, __m128i __B) argument
618 _mm256_mask_and_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument
626 _mm256_maskz_and_epi64(__mmask8 __U, __m256i __A, __m256i __B) argument
638 _mm_mask_and_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument
646 _mm_maskz_and_epi64(__mmask8 __U, __m128i __A, __m128i __B) argument
652 _mm256_andnot_epi64(__m256i __A, __m256i __B) argument
658 _mm256_mask_andnot_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument
666 _mm256_maskz_andnot_epi64(__mmask8 __U, __m256i __A, __m256i __B) argument
673 _mm_andnot_epi64(__m128i __A, __m128i __B) argument
679 _mm_mask_andnot_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument
687 _mm_maskz_andnot_epi64(__mmask8 __U, __m128i __A, __m128i __B) argument
699 _mm256_mask_or_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument
707 _mm256_maskz_or_epi64(__mmask8 __U, __m256i __A, __m256i __B) argument
719 _mm_mask_or_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument
727 _mm_maskz_or_epi64(__mmask8 __U, __m128i __A, __m128i __B) argument
739 _mm256_mask_xor_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument
747 _mm256_maskz_xor_epi64(__mmask8 __U, __m256i __A, __m256i __B) argument
759 _mm_mask_xor_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument
768 _mm_maskz_xor_epi64(__mmask8 __U, __m128i __A, __m128i __B) argument
894 _mm_mask_fmadd_pd(__m128d __A, __mmask8 __U, __m128d __B, __m128d __C) argument
904 _mm_mask3_fmadd_pd(__m128d __A, __m128d __B, __m128d __C, __mmask8 __U) argument
914 _mm_maskz_fmadd_pd(__mmask8 __U, __m128d __A, __m128d __B, __m128d __C) argument
924 _mm_mask_fmsub_pd(__m128d __A, __mmask8 __U, __m128d __B, __m128d __C) argument
934 _mm_maskz_fmsub_pd(__mmask8 __U, __m128d __A, __m128d __B, __m128d __C) argument
944 _mm_mask3_fnmadd_pd(__m128d __A, __m128d __B, __m128d __C, __mmask8 __U) argument
954 _mm_maskz_fnmadd_pd(__mmask8 __U, __m128d __A, __m128d __B, __m128d __C) argument
964 _mm_maskz_fnmsub_pd(__mmask8 __U, __m128d __A, __m128d __B, __m128d __C) argument
974 _mm256_mask_fmadd_pd(__m256d __A, __mmask8 __U, __m256d __B, __m256d __C) argument
984 _mm256_mask3_fmadd_pd(__m256d __A, __m256d __B, __m256d __C, __mmask8 __U) argument
994 _mm256_maskz_fmadd_pd(__mmask8 __U, __m256d __A, __m256d __B, __m256d __C) argument
1004 _mm256_mask_fmsub_pd(__m256d __A, __mmask8 __U, __m256d __B, __m256d __C) argument
1014 _mm256_maskz_fmsub_pd(__mmask8 __U, __m256d __A, __m256d __B, __m256d __C) argument
1024 _mm256_mask3_fnmadd_pd(__m256d __A, __m256d __B, __m256d __C, __mmask8 __U) argument
1034 _mm256_maskz_fnmadd_pd(__mmask8 __U, __m256d __A, __m256d __B, __m256d __C) argument
1044 _mm256_maskz_fnmsub_pd(__mmask8 __U, __m256d __A, __m256d __B, __m256d __C) argument
1054 _mm_mask_fmadd_ps(__m128 __A, __mmask8 __U, __m128 __B, __m128 __C) argument
1064 _mm_mask3_fmadd_ps(__m128 __A, __m128 __B, __m128 __C, __mmask8 __U) argument
1074 _mm_maskz_fmadd_ps(__mmask8 __U, __m128 __A, __m128 __B, __m128 __C) argument
1084 _mm_mask_fmsub_ps(__m128 __A, __mmask8 __U, __m128 __B, __m128 __C) argument
1094 _mm_maskz_fmsub_ps(__mmask8 __U, __m128 __A, __m128 __B, __m128 __C) argument
1104 _mm_mask3_fnmadd_ps(__m128 __A, __m128 __B, __m128 __C, __mmask8 __U) argument
1114 _mm_maskz_fnmadd_ps(__mmask8 __U, __m128 __A, __m128 __B, __m128 __C) argument
1124 _mm_maskz_fnmsub_ps(__mmask8 __U, __m128 __A, __m128 __B, __m128 __C) argument
1134 _mm256_mask_fmadd_ps(__m256 __A, __mmask8 __U, __m256 __B, __m256 __C) argument
1144 _mm256_mask3_fmadd_ps(__m256 __A, __m256 __B, __m256 __C, __mmask8 __U) argument
1154 _mm256_maskz_fmadd_ps(__mmask8 __U, __m256 __A, __m256 __B, __m256 __C) argument
1164 _mm256_mask_fmsub_ps(__m256 __A, __mmask8 __U, __m256 __B, __m256 __C) argument
1174 _mm256_maskz_fmsub_ps(__mmask8 __U, __m256 __A, __m256 __B, __m256 __C) argument
1184 _mm256_mask3_fnmadd_ps(__m256 __A, __m256 __B, __m256 __C, __mmask8 __U) argument
1194 _mm256_maskz_fnmadd_ps(__mmask8 __U, __m256 __A, __m256 __B, __m256 __C) argument
1204 _mm256_maskz_fnmsub_ps(__mmask8 __U, __m256 __A, __m256 __B, __m256 __C) argument
1214 _mm_mask_fmaddsub_pd(__m128d __A, __mmask8 __U, __m128d __B, __m128d __C) argument
1224 _mm_mask3_fmaddsub_pd(__m128d __A, __m128d __B, __m128d __C, __mmask8 __U) argument
1234 _mm_maskz_fmaddsub_pd(__mmask8 __U, __m128d __A, __m128d __B, __m128d __C) argument
1244 _mm_mask_fmsubadd_pd(__m128d __A, __mmask8 __U, __m128d __B, __m128d __C) argument
1254 _mm_maskz_fmsubadd_pd(__mmask8 __U, __m128d __A, __m128d __B, __m128d __C) argument
1264 _mm256_mask_fmaddsub_pd(__m256d __A, __mmask8 __U, __m256d __B, __m256d __C) argument
1274 _mm256_mask3_fmaddsub_pd(__m256d __A, __m256d __B, __m256d __C, __mmask8 __U) argument
1284 _mm256_maskz_fmaddsub_pd(__mmask8 __U, __m256d __A, __m256d __B, __m256d __C) argument
1294 _mm256_mask_fmsubadd_pd(__m256d __A, __mmask8 __U, __m256d __B, __m256d __C) argument
1304 _mm256_maskz_fmsubadd_pd(__mmask8 __U, __m256d __A, __m256d __B, __m256d __C) argument
1314 _mm_mask_fmaddsub_ps(__m128 __A, __mmask8 __U, __m128 __B, __m128 __C) argument
1324 _mm_mask3_fmaddsub_ps(__m128 __A, __m128 __B, __m128 __C, __mmask8 __U) argument
1334 _mm_maskz_fmaddsub_ps(__mmask8 __U, __m128 __A, __m128 __B, __m128 __C) argument
1344 _mm_mask_fmsubadd_ps(__m128 __A, __mmask8 __U, __m128 __B, __m128 __C) argument
1354 _mm_maskz_fmsubadd_ps(__mmask8 __U, __m128 __A, __m128 __B, __m128 __C) argument
1364 _mm256_mask_fmaddsub_ps(__m256 __A, __mmask8 __U, __m256 __B, __m256 __C) argument
1375 _mm256_mask3_fmaddsub_ps(__m256 __A, __m256 __B, __m256 __C, __mmask8 __U) argument
1385 _mm256_maskz_fmaddsub_ps(__mmask8 __U, __m256 __A, __m256 __B, __m256 __C) argument
1395 _mm256_mask_fmsubadd_ps(__m256 __A, __mmask8 __U, __m256 __B, __m256 __C) argument
1405 _mm256_maskz_fmsubadd_ps(__mmask8 __U, __m256 __A, __m256 __B, __m256 __C) argument
1415 _mm_mask3_fmsub_pd(__m128d __A, __m128d __B, __m128d __C, __mmask8 __U) argument
1425 _mm256_mask3_fmsub_pd(__m256d __A, __m256d __B, __m256d __C, __mmask8 __U) argument
1435 _mm_mask3_fmsub_ps(__m128 __A, __m128 __B, __m128 __C, __mmask8 __U) argument
1445 _mm256_mask3_fmsub_ps(__m256 __A, __m256 __B, __m256 __C, __mmask8 __U) argument
1455 _mm_mask3_fmsubadd_pd(__m128d __A, __m128d __B, __m128d __C, __mmask8 __U) argument
1465 _mm256_mask3_fmsubadd_pd(__m256d __A, __m256d __B, __m256d __C, __mmask8 __U) argument
1475 _mm_mask3_fmsubadd_ps(__m128 __A, __m128 __B, __m128 __C, __mmask8 __U) argument
1485 _mm256_mask3_fmsubadd_ps(__m256 __A, __m256 __B, __m256 __C, __mmask8 __U) argument
1495 _mm_mask_fnmadd_pd(__m128d __A, __mmask8 __U, __m128d __B, __m128d __C) argument
1505 _mm256_mask_fnmadd_pd(__m256d __A, __mmask8 __U, __m256d __B, __m256d __C) argument
1515 _mm_mask_fnmadd_ps(__m128 __A, __mmask8 __U, __m128 __B, __m128 __C) argument
1525 _mm256_mask_fnmadd_ps(__m256 __A, __mmask8 __U, __m256 __B, __m256 __C) argument
1535 _mm_mask_fnmsub_pd(__m128d __A, __mmask8 __U, __m128d __B, __m128d __C) argument
1545 _mm_mask3_fnmsub_pd(__m128d __A, __m128d __B, __m128d __C, __mmask8 __U) argument
1555 _mm256_mask_fnmsub_pd(__m256d __A, __mmask8 __U, __m256d __B, __m256d __C) argument
1565 _mm256_mask3_fnmsub_pd(__m256d __A, __m256d __B, __m256d __C, __mmask8 __U) argument
1575 _mm_mask_fnmsub_ps(__m128 __A, __mmask8 __U, __m128 __B, __m128 __C) argument
1585 _mm_mask3_fnmsub_ps(__m128 __A, __m128 __B, __m128 __C, __mmask8 __U) argument
1595 _mm256_mask_fnmsub_ps(__m256 __A, __mmask8 __U, __m256 __B, __m256 __C) argument
1605 _mm256_mask3_fnmsub_ps(__m256 __A, __m256 __B, __m256 __C, __mmask8 __U) argument
1615 _mm_mask_add_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) argument
1622 _mm_maskz_add_pd(__mmask8 __U, __m128d __A, __m128d __B) argument
1629 _mm256_mask_add_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) argument
1636 _mm256_maskz_add_pd(__mmask8 __U, __m256d __A, __m256d __B) argument
1643 _mm_mask_add_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) argument
1650 _mm_maskz_add_ps(__mmask8 __U, __m128 __A, __m128 __B) argument
1657 _mm256_mask_add_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) argument
1664 _mm256_maskz_add_ps(__mmask8 __U, __m256 __A, __m256 __B) argument
1671 _mm_mask_blend_epi32(__mmask8 __U, __m128i __A, __m128i __W) argument
1678 _mm256_mask_blend_epi32(__mmask8 __U, __m256i __A, __m256i __W) argument
1685 _mm_mask_blend_pd(__mmask8 __U, __m128d __A, __m128d __W) argument
1692 _mm256_mask_blend_pd(__mmask8 __U, __m256d __A, __m256d __W) argument
1699 _mm_mask_blend_ps(__mmask8 __U, __m128 __A, __m128 __W) argument
1706 _mm256_mask_blend_ps(__mmask8 __U, __m256 __A, __m256 __W) argument
1713 _mm_mask_blend_epi64(__mmask8 __U, __m128i __A, __m128i __W) argument
1720 _mm256_mask_blend_epi64(__mmask8 __U, __m256i __A, __m256i __W) argument
1727 _mm_mask_compress_pd(__m128d __W, __mmask8 __U, __m128d __A) argument
1734 _mm_maskz_compress_pd(__mmask8 __U, __m128d __A) argument
1742 _mm256_mask_compress_pd(__m256d __W, __mmask8 __U, __m256d __A) argument
1749 _mm256_maskz_compress_pd(__mmask8 __U, __m256d __A) argument
1757 _mm_mask_compress_epi64(__m128i __W, __mmask8 __U, __m128i __A) argument
1764 _mm_maskz_compress_epi64(__mmask8 __U, __m128i __A) argument
1772 _mm256_mask_compress_epi64(__m256i __W, __mmask8 __U, __m256i __A) argument
1779 _mm256_maskz_compress_epi64(__mmask8 __U, __m256i __A) argument
1787 _mm_mask_compress_ps(__m128 __W, __mmask8 __U, __m128 __A) argument
1794 _mm_maskz_compress_ps(__mmask8 __U, __m128 __A) argument
1802 _mm256_mask_compress_ps(__m256 __W, __mmask8 __U, __m256 __A) argument
1809 _mm256_maskz_compress_ps(__mmask8 __U, __m256 __A) argument
1817 _mm_mask_compress_epi32(__m128i __W, __mmask8 __U, __m128i __A) argument
1824 _mm_maskz_compress_epi32(__mmask8 __U, __m128i __A) argument
1832 _mm256_mask_compress_epi32(__m256i __W, __mmask8 __U, __m256i __A) argument
1839 _mm256_maskz_compress_epi32(__mmask8 __U, __m256i __A) argument
1847 _mm_mask_compressstoreu_pd(void *__P, __mmask8 __U, __m128d __A) argument
1854 _mm256_mask_compressstoreu_pd(void *__P, __mmask8 __U, __m256d __A) argument
1861 _mm_mask_compressstoreu_epi64(void *__P, __mmask8 __U, __m128i __A) argument
1868 _mm256_mask_compressstoreu_epi64(void *__P, __mmask8 __U, __m256i __A) argument
1875 _mm_mask_compressstoreu_ps(void *__P, __mmask8 __U, __m128 __A) argument
1882 _mm256_mask_compressstoreu_ps(void *__P, __mmask8 __U, __m256 __A) argument
1889 _mm_mask_compressstoreu_epi32(void *__P, __mmask8 __U, __m128i __A) argument
1896 _mm256_mask_compressstoreu_epi32(void *__P, __mmask8 __U, __m256i __A) argument
1903 _mm_mask_cvtepi32_pd(__m128d __W, __mmask8 __U, __m128i __A) argument
1910 _mm_maskz_cvtepi32_pd(__mmask8 __U, __m128i __A) argument
1917 _mm256_mask_cvtepi32_pd(__m256d __W, __mmask8 __U, __m128i __A) argument
1924 _mm256_maskz_cvtepi32_pd(__mmask8 __U, __m128i __A) argument
1931 _mm_mask_cvtepi32_ps(__m128 __W, __mmask8 __U, __m128i __A) argument
1938 _mm_maskz_cvtepi32_ps(__mmask8 __U, __m128i __A) argument
1945 _mm256_mask_cvtepi32_ps(__m256 __W, __mmask8 __U, __m256i __A) argument
1952 _mm256_maskz_cvtepi32_ps(__mmask8 __U, __m256i __A) argument
1959 _mm_mask_cvtpd_epi32(__m128i __W, __mmask8 __U, __m128d __A) argument
1966 _mm_maskz_cvtpd_epi32(__mmask8 __U, __m128d __A) argument
1974 _mm256_mask_cvtpd_epi32(__m128i __W, __mmask8 __U, __m256d __A) argument
1981 _mm256_maskz_cvtpd_epi32(__mmask8 __U, __m256d __A) argument
1988 _mm_mask_cvtpd_ps(__m128 __W, __mmask8 __U, __m128d __A) argument
1995 _mm_maskz_cvtpd_ps(__mmask8 __U, __m128d __A) argument
2003 _mm256_mask_cvtpd_ps(__m128 __W, __mmask8 __U, __m256d __A) argument
2010 _mm256_maskz_cvtpd_ps(__mmask8 __U, __m256d __A) argument
2017 _mm_cvtpd_epu32(__m128d __A) argument
2025 _mm_mask_cvtpd_epu32(__m128i __W, __mmask8 __U, __m128d __A) argument
2032 _mm_maskz_cvtpd_epu32(__mmask8 __U, __m128d __A) argument
2040 _mm256_cvtpd_epu32(__m256d __A) argument
2048 _mm256_mask_cvtpd_epu32(__m128i __W, __mmask8 __U, __m256d __A) argument
2055 _mm256_maskz_cvtpd_epu32(__mmask8 __U, __m256d __A) argument
2063 _mm_mask_cvtps_epi32(__m128i __W, __mmask8 __U, __m128 __A) argument
2070 _mm_maskz_cvtps_epi32(__mmask8 __U, __m128 __A) argument
2077 _mm256_mask_cvtps_epi32(__m256i __W, __mmask8 __U, __m256 __A) argument
2084 _mm256_maskz_cvtps_epi32(__mmask8 __U, __m256 __A) argument
2091 _mm_mask_cvtps_pd(__m128d __W, __mmask8 __U, __m128 __A) argument
2098 _mm_maskz_cvtps_pd(__mmask8 __U, __m128 __A) argument
2105 _mm256_mask_cvtps_pd(__m256d __W, __mmask8 __U, __m128 __A) argument
2112 _mm256_maskz_cvtps_pd(__mmask8 __U, __m128 __A) argument
2119 _mm_cvtps_epu32(__m128 __A) argument
2127 _mm_mask_cvtps_epu32(__m128i __W, __mmask8 __U, __m128 __A) argument
2134 _mm_maskz_cvtps_epu32(__mmask8 __U, __m128 __A) argument
2142 _mm256_cvtps_epu32(__m256 __A) argument
2150 _mm256_mask_cvtps_epu32(__m256i __W, __mmask8 __U, __m256 __A) argument
2157 _mm256_maskz_cvtps_epu32(__mmask8 __U, __m256 __A) argument
2165 _mm_mask_cvttpd_epi32(__m128i __W, __mmask8 __U, __m128d __A) argument
2172 _mm_maskz_cvttpd_epi32(__mmask8 __U, __m128d __A) argument
2180 _mm256_mask_cvttpd_epi32(__m128i __W, __mmask8 __U, __m256d __A) argument
2187 _mm256_maskz_cvttpd_epi32(__mmask8 __U, __m256d __A) argument
2194 _mm_cvttpd_epu32(__m128d __A) argument
2202 _mm_mask_cvttpd_epu32(__m128i __W, __mmask8 __U, __m128d __A) argument
2209 _mm_maskz_cvttpd_epu32(__mmask8 __U, __m128d __A) argument
2217 _mm256_cvttpd_epu32(__m256d __A) argument
2225 _mm256_mask_cvttpd_epu32(__m128i __W, __mmask8 __U, __m256d __A) argument
2232 _mm256_maskz_cvttpd_epu32(__mmask8 __U, __m256d __A) argument
2240 _mm_mask_cvttps_epi32(__m128i __W, __mmask8 __U, __m128 __A) argument
2247 _mm_maskz_cvttps_epi32(__mmask8 __U, __m128 __A) argument
2254 _mm256_mask_cvttps_epi32(__m256i __W, __mmask8 __U, __m256 __A) argument
2261 _mm256_maskz_cvttps_epi32(__mmask8 __U, __m256 __A) argument
2268 _mm_cvttps_epu32(__m128 __A) argument
2276 _mm_mask_cvttps_epu32(__m128i __W, __mmask8 __U, __m128 __A) argument
2283 _mm_maskz_cvttps_epu32(__mmask8 __U, __m128 __A) argument
2291 _mm256_cvttps_epu32(__m256 __A) argument
2299 _mm256_mask_cvttps_epu32(__m256i __W, __mmask8 __U, __m256 __A) argument
2306 _mm256_maskz_cvttps_epu32(__mmask8 __U, __m256 __A) argument
2314 _mm_cvtepu32_pd(__m128i __A) argument
2320 _mm_mask_cvtepu32_pd(__m128d __W, __mmask8 __U, __m128i __A) argument
2327 _mm_maskz_cvtepu32_pd(__mmask8 __U, __m128i __A) argument
2334 _mm256_cvtepu32_pd(__m128i __A) argument
2339 _mm256_mask_cvtepu32_pd(__m256d __W, __mmask8 __U, __m128i __A) argument
2346 _mm256_maskz_cvtepu32_pd(__mmask8 __U, __m128i __A) argument
2353 _mm_cvtepu32_ps(__m128i __A) argument
2358 _mm_mask_cvtepu32_ps(__m128 __W, __mmask8 __U, __m128i __A) argument
2365 _mm_maskz_cvtepu32_ps(__mmask8 __U, __m128i __A) argument
2372 _mm256_cvtepu32_ps(__m256i __A) argument
2377 _mm256_mask_cvtepu32_ps(__m256 __W, __mmask8 __U, __m256i __A) argument
2384 _mm256_maskz_cvtepu32_ps(__mmask8 __U, __m256i __A) argument
2391 _mm_mask_div_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) argument
2398 _mm_maskz_div_pd(__mmask8 __U, __m128d __A, __m128d __B) argument
2405 _mm256_mask_div_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) argument
2412 _mm256_maskz_div_pd(__mmask8 __U, __m256d __A, __m256d __B) argument
2419 _mm_mask_div_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) argument
2426 _mm_maskz_div_ps(__mmask8 __U, __m128 __A, __m128 __B) argument
2433 _mm256_mask_div_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) argument
2440 _mm256_maskz_div_ps(__mmask8 __U, __m256 __A, __m256 __B) argument
2447 _mm_mask_expand_pd(__m128d __W, __mmask8 __U, __m128d __A) argument
2454 _mm_maskz_expand_pd(__mmask8 __U, __m128d __A) argument
2462 _mm256_mask_expand_pd(__m256d __W, __mmask8 __U, __m256d __A) argument
2469 _mm256_maskz_expand_pd(__mmask8 __U, __m256d __A) argument
2477 _mm_mask_expand_epi64(__m128i __W, __mmask8 __U, __m128i __A) argument
2484 _mm_maskz_expand_epi64(__mmask8 __U, __m128i __A) argument
2492 _mm256_mask_expand_epi64(__m256i __W, __mmask8 __U, __m256i __A) argument
2499 _mm256_maskz_expand_epi64(__mmask8 __U, __m256i __A) argument
2642 _mm_mask_expand_ps(__m128 __W, __mmask8 __U, __m128 __A) argument
2649 _mm_maskz_expand_ps(__mmask8 __U, __m128 __A) argument
2657 _mm256_mask_expand_ps(__m256 __W, __mmask8 __U, __m256 __A) argument
2664 _mm256_maskz_expand_ps(__mmask8 __U, __m256 __A) argument
2672 _mm_mask_expand_epi32(__m128i __W, __mmask8 __U, __m128i __A) argument
2679 _mm_maskz_expand_epi32(__mmask8 __U, __m128i __A) argument
2687 _mm256_mask_expand_epi32(__m256i __W, __mmask8 __U, __m256i __A) argument
2694 _mm256_maskz_expand_epi32(__mmask8 __U, __m256i __A) argument
2702 _mm_getexp_pd(__m128d __A) argument
2710 _mm_mask_getexp_pd(__m128d __W, __mmask8 __U, __m128d __A) argument
2717 _mm_maskz_getexp_pd(__mmask8 __U, __m128d __A) argument
2725 _mm256_getexp_pd(__m256d __A) argument
2733 _mm256_mask_getexp_pd(__m256d __W, __mmask8 __U, __m256d __A) argument
2740 _mm256_maskz_getexp_pd(__mmask8 __U, __m256d __A) argument
2748 _mm_getexp_ps(__m128 __A) argument
2756 _mm_mask_getexp_ps(__m128 __W, __mmask8 __U, __m128 __A) argument
2763 _mm_maskz_getexp_ps(__mmask8 __U, __m128 __A) argument
2771 _mm256_getexp_ps(__m256 __A) argument
2779 _mm256_mask_getexp_ps(__m256 __W, __mmask8 __U, __m256 __A) argument
2786 _mm256_maskz_getexp_ps(__mmask8 __U, __m256 __A) argument
2794 _mm_mask_max_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) argument
2801 _mm_maskz_max_pd(__mmask8 __U, __m128d __A, __m128d __B) argument
2808 _mm256_mask_max_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) argument
2815 _mm256_maskz_max_pd(__mmask8 __U, __m256d __A, __m256d __B) argument
2822 _mm_mask_max_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) argument
2829 _mm_maskz_max_ps(__mmask8 __U, __m128 __A, __m128 __B) argument
2836 _mm256_mask_max_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) argument
2843 _mm256_maskz_max_ps(__mmask8 __U, __m256 __A, __m256 __B) argument
2850 _mm_mask_min_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) argument
2857 _mm_maskz_min_pd(__mmask8 __U, __m128d __A, __m128d __B) argument
2864 _mm256_mask_min_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) argument
2871 _mm256_maskz_min_pd(__mmask8 __U, __m256d __A, __m256d __B) argument
2878 _mm_mask_min_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) argument
2885 _mm_maskz_min_ps(__mmask8 __U, __m128 __A, __m128 __B) argument
2892 _mm256_mask_min_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) argument
2899 _mm256_maskz_min_ps(__mmask8 __U, __m256 __A, __m256 __B) argument
2906 _mm_mask_mul_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) argument
2913 _mm_maskz_mul_pd(__mmask8 __U, __m128d __A, __m128d __B) argument
2920 _mm256_mask_mul_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) argument
2927 _mm256_maskz_mul_pd(__mmask8 __U, __m256d __A, __m256d __B) argument
2934 _mm_mask_mul_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) argument
2941 _mm_maskz_mul_ps(__mmask8 __U, __m128 __A, __m128 __B) argument
2948 _mm256_mask_mul_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) argument
2955 _mm256_maskz_mul_ps(__mmask8 __U, __m256 __A, __m256 __B) argument
2962 _mm_mask_abs_epi32(__m128i __W, __mmask8 __U, __m128i __A) argument
2969 _mm_maskz_abs_epi32(__mmask8 __U, __m128i __A) argument
2976 _mm256_mask_abs_epi32(__m256i __W, __mmask8 __U, __m256i __A) argument
2983 _mm256_maskz_abs_epi32(__mmask8 __U, __m256i __A) argument
2990 _mm_abs_epi64(__m128i __A) argument
2995 _mm_mask_abs_epi64(__m128i __W, __mmask8 __U, __m128i __A) argument
3002 _mm_maskz_abs_epi64(__mmask8 __U, __m128i __A) argument
3009 _mm256_abs_epi64(__m256i __A) argument
3014 _mm256_mask_abs_epi64(__m256i __W, __mmask8 __U, __m256i __A) argument
3021 _mm256_maskz_abs_epi64(__mmask8 __U, __m256i __A) argument
3028 _mm_maskz_max_epi32(__mmask8 __M, __m128i __A, __m128i __B) argument
3035 _mm_mask_max_epi32(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) argument
3042 _mm256_maskz_max_epi32(__mmask8 __M, __m256i __A, __m256i __B) argument
3049 _mm256_mask_max_epi32(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) argument
3056 _mm_max_epi64(__m128i __A, __m128i __B) argument
3061 _mm_maskz_max_epi64(__mmask8 __M, __m128i __A, __m128i __B) argument
3068 _mm_mask_max_epi64(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) argument
3075 _mm256_max_epi64(__m256i __A, __m256i __B) argument
3080 _mm256_maskz_max_epi64(__mmask8 __M, __m256i __A, __m256i __B) argument
3087 _mm256_mask_max_epi64(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) argument
3094 _mm_maskz_max_epu32(__mmask8 __M, __m128i __A, __m128i __B) argument
3101 _mm_mask_max_epu32(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) argument
3108 _mm256_maskz_max_epu32(__mmask8 __M, __m256i __A, __m256i __B) argument
3115 _mm256_mask_max_epu32(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) argument
3122 _mm_max_epu64(__m128i __A, __m128i __B) argument
3127 _mm_maskz_max_epu64(__mmask8 __M, __m128i __A, __m128i __B) argument
3134 _mm_mask_max_epu64(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) argument
3141 _mm256_max_epu64(__m256i __A, __m256i __B) argument
3146 _mm256_maskz_max_epu64(__mmask8 __M, __m256i __A, __m256i __B) argument
3153 _mm256_mask_max_epu64(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) argument
3160 _mm_maskz_min_epi32(__mmask8 __M, __m128i __A, __m128i __B) argument
3167 _mm_mask_min_epi32(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) argument
3174 _mm256_maskz_min_epi32(__mmask8 __M, __m256i __A, __m256i __B) argument
3181 _mm256_mask_min_epi32(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) argument
3188 _mm_min_epi64(__m128i __A, __m128i __B) argument
3193 _mm_mask_min_epi64(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) argument
3200 _mm_maskz_min_epi64(__mmask8 __M, __m128i __A, __m128i __B) argument
3207 _mm256_min_epi64(__m256i __A, __m256i __B) argument
3212 _mm256_mask_min_epi64(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) argument
3219 _mm256_maskz_min_epi64(__mmask8 __M, __m256i __A, __m256i __B) argument
3226 _mm_maskz_min_epu32(__mmask8 __M, __m128i __A, __m128i __B) argument
3233 _mm_mask_min_epu32(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) argument
3240 _mm256_maskz_min_epu32(__mmask8 __M, __m256i __A, __m256i __B) argument
3247 _mm256_mask_min_epu32(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) argument
3254 _mm_min_epu64(__m128i __A, __m128i __B) argument
3259 _mm_mask_min_epu64(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) argument
3266 _mm_maskz_min_epu64(__mmask8 __M, __m128i __A, __m128i __B) argument
3273 _mm256_min_epu64(__m256i __A, __m256i __B) argument
3278 _mm256_mask_min_epu64(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) argument
3285 _mm256_maskz_min_epu64(__mmask8 __M, __m256i __A, __m256i __B) argument
3366 _mm_scalef_pd(__m128d __A, __m128d __B) argument
3375 _mm_mask_scalef_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) argument
3384 _mm_maskz_scalef_pd(__mmask8 __U, __m128d __A, __m128d __B) argument
3393 _mm256_scalef_pd(__m256d __A, __m256d __B) argument
3402 _mm256_mask_scalef_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) argument
3411 _mm256_maskz_scalef_pd(__mmask8 __U, __m256d __A, __m256d __B) argument
3420 _mm_scalef_ps(__m128 __A, __m128 __B) argument
3429 _mm_mask_scalef_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) argument
3437 _mm_maskz_scalef_ps(__mmask8 __U, __m128 __A, __m128 __B) argument
3446 _mm256_scalef_ps(__m256 __A, __m256 __B) argument
3455 _mm256_mask_scalef_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) argument
3464 _mm256_maskz_scalef_ps(__mmask8 __U, __m256 __A, __m256 __B) argument
3633 _mm_mask_sqrt_pd(__m128d __W, __mmask8 __U, __m128d __A) argument
3640 _mm_maskz_sqrt_pd(__mmask8 __U, __m128d __A) argument
3647 _mm256_mask_sqrt_pd(__m256d __W, __mmask8 __U, __m256d __A) argument
3654 _mm256_maskz_sqrt_pd(__mmask8 __U, __m256d __A) argument
3661 _mm_mask_sqrt_ps(__m128 __W, __mmask8 __U, __m128 __A) argument
3668 _mm_maskz_sqrt_ps(__mmask8 __U, __m128 __A) argument
3675 _mm256_mask_sqrt_ps(__m256 __W, __mmask8 __U, __m256 __A) argument
3682 _mm256_maskz_sqrt_ps(__mmask8 __U, __m256 __A) argument
3689 _mm_mask_sub_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) argument
3696 _mm_maskz_sub_pd(__mmask8 __U, __m128d __A, __m128d __B) argument
3703 _mm256_mask_sub_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) argument
3710 _mm256_maskz_sub_pd(__mmask8 __U, __m256d __A, __m256d __B) argument
3717 _mm_mask_sub_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) argument
3724 _mm_maskz_sub_ps(__mmask8 __U, __m128 __A, __m128 __B) argument
3731 _mm256_mask_sub_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) argument
3738 _mm256_maskz_sub_ps(__mmask8 __U, __m256 __A, __m256 __B) argument
3745 _mm_permutex2var_epi32(__m128i __A, __m128i __I, __m128i __B) argument
3751 _mm_mask_permutex2var_epi32(__m128i __A, __mmask8 __U, __m128i __I, __m128i __B) argument
3759 _mm_mask2_permutex2var_epi32(__m128i __A, __m128i __I, __mmask8 __U, __m128i __B) argument
3767 _mm_maskz_permutex2var_epi32(__mmask8 __U, __m128i __A, __m128i __I, __m128i __B) argument
3775 _mm256_permutex2var_epi32(__m256i __A, __m256i __I, __m256i __B) argument
3781 _mm256_mask_permutex2var_epi32(__m256i __A, __mmask8 __U, __m256i __I, __m256i __B) argument
3789 _mm256_mask2_permutex2var_epi32(__m256i __A, __m256i __I, __mmask8 __U, __m256i __B) argument
3797 _mm256_maskz_permutex2var_epi32(__mmask8 __U, __m256i __A, __m256i __I, __m256i __B) argument
3805 _mm_permutex2var_pd(__m128d __A, __m128i __I, __m128d __B) argument
3811 _mm_mask_permutex2var_pd(__m128d __A, __mmask8 __U, __m128i __I, __m128d __B) argument
3818 _mm_mask2_permutex2var_pd(__m128d __A, __m128i __I, __mmask8 __U, __m128d __B) argument
3825 _mm_maskz_permutex2var_pd(__mmask8 __U, __m128d __A, __m128i __I, __m128d __B) argument
3832 _mm256_permutex2var_pd(__m256d __A, __m256i __I, __m256d __B) argument
3838 _mm256_mask_permutex2var_pd(__m256d __A, __mmask8 __U, __m256i __I, __m256d __B) argument
3846 _mm256_mask2_permutex2var_pd(__m256d __A, __m256i __I, __mmask8 __U, __m256d __B) argument
3854 _mm256_maskz_permutex2var_pd(__mmask8 __U, __m256d __A, __m256i __I, __m256d __B) argument
3862 _mm_permutex2var_ps(__m128 __A, __m128i __I, __m128 __B) argument
3868 _mm_mask_permutex2var_ps(__m128 __A, __mmask8 __U, __m128i __I, __m128 __B) argument
3875 _mm_mask2_permutex2var_ps(__m128 __A, __m128i __I, __mmask8 __U, __m128 __B) argument
3882 _mm_maskz_permutex2var_ps(__mmask8 __U, __m128 __A, __m128i __I, __m128 __B) argument
3889 _mm256_permutex2var_ps(__m256 __A, __m256i __I, __m256 __B) argument
3895 _mm256_mask_permutex2var_ps(__m256 __A, __mmask8 __U, __m256i __I, __m256 __B) argument
3902 _mm256_mask2_permutex2var_ps(__m256 __A, __m256i __I, __mmask8 __U, __m256 __B) argument
3910 _mm256_maskz_permutex2var_ps(__mmask8 __U, __m256 __A, __m256i __I, __m256 __B) argument
3918 _mm_permutex2var_epi64(__m128i __A, __m128i __I, __m128i __B) argument
3924 _mm_mask_permutex2var_epi64(__m128i __A, __mmask8 __U, __m128i __I, __m128i __B) argument
3932 _mm_mask2_permutex2var_epi64(__m128i __A, __m128i __I, __mmask8 __U, __m128i __B) argument
3940 _mm_maskz_permutex2var_epi64(__mmask8 __U, __m128i __A, __m128i __I, __m128i __B) argument
3949 _mm256_permutex2var_epi64(__m256i __A, __m256i __I, __m256i __B) argument
3955 _mm256_mask_permutex2var_epi64(__m256i __A, __mmask8 __U, __m256i __I, __m256i __B) argument
3963 _mm256_mask2_permutex2var_epi64(__m256i __A, __m256i __I, __mmask8 __U, __m256i __B) argument
3971 _mm256_maskz_permutex2var_epi64(__mmask8 __U, __m256i __A, __m256i __I, __m256i __B) argument
3979 _mm_mask_cvtepi8_epi32(__m128i __W, __mmask8 __U, __m128i __A) argument
3987 _mm_maskz_cvtepi8_epi32(__mmask8 __U, __m128i __A) argument
3995 _mm256_mask_cvtepi8_epi32(__m256i __W, __mmask8 __U, __m128i __A) argument
4003 _mm256_maskz_cvtepi8_epi32(__mmask8 __U, __m128i __A) argument
4011 _mm_mask_cvtepi8_epi64(__m128i __W, __mmask8 __U, __m128i __A) argument
4019 _mm_maskz_cvtepi8_epi64(__mmask8 __U, __m128i __A) argument
4027 _mm256_mask_cvtepi8_epi64(__m256i __W, __mmask8 __U, __m128i __A) argument
4035 _mm256_maskz_cvtepi8_epi64(__mmask8 __U, __m128i __A) argument
4075 _mm_mask_cvtepi16_epi32(__m128i __W, __mmask8 __U, __m128i __A) argument
4083 _mm_maskz_cvtepi16_epi32(__mmask8 __U, __m128i __A) argument
4091 _mm256_mask_cvtepi16_epi32(__m256i __W, __mmask8 __U, __m128i __A) argument
4099 _mm256_maskz_cvtepi16_epi32(__mmask8 __U, __m128i __A) argument
4107 _mm_mask_cvtepi16_epi64(__m128i __W, __mmask8 __U, __m128i __A) argument
4115 _mm_maskz_cvtepi16_epi64(__mmask8 __U, __m128i __A) argument
4123 _mm256_mask_cvtepi16_epi64(__m256i __W, __mmask8 __U, __m128i __A) argument
4131 _mm256_maskz_cvtepi16_epi64(__mmask8 __U, __m128i __A) argument
4140 _mm_mask_cvtepu8_epi32(__m128i __W, __mmask8 __U, __m128i __A) argument
4148 _mm_maskz_cvtepu8_epi32(__mmask8 __U, __m128i __A) argument
4156 _mm256_mask_cvtepu8_epi32(__m256i __W, __mmask8 __U, __m128i __A) argument
4164 _mm256_maskz_cvtepu8_epi32(__mmask8 __U, __m128i __A) argument
4172 _mm_mask_cvtepu8_epi64(__m128i __W, __mmask8 __U, __m128i __A) argument
4180 _mm_maskz_cvtepu8_epi64(__mmask8 __U, __m128i __A) argument
4188 _mm256_mask_cvtepu8_epi64(__m256i __W, __mmask8 __U, __m128i __A) argument
4196 _mm256_maskz_cvtepu8_epi64(__mmask8 __U, __m128i __A) argument
4236 _mm_mask_cvtepu16_epi32(__m128i __W, __mmask8 __U, __m128i __A) argument
4244 _mm_maskz_cvtepu16_epi32(__mmask8 __U, __m128i __A) argument
4252 _mm256_mask_cvtepu16_epi32(__m256i __W, __mmask8 __U, __m128i __A) argument
4260 _mm256_maskz_cvtepu16_epi32(__mmask8 __U, __m128i __A) argument
4268 _mm_mask_cvtepu16_epi64(__m128i __W, __mmask8 __U, __m128i __A) argument
4276 _mm_maskz_cvtepu16_epi64(__mmask8 __U, __m128i __A) argument
4284 _mm256_mask_cvtepu16_epi64(__m256i __W, __mmask8 __U, __m128i __A) argument
4292 _mm256_maskz_cvtepu16_epi64(__mmask8 __U, __m128i __A) argument
4353 _mm_rolv_epi32(__m128i __A, __m128i __B) argument
4359 _mm_mask_rolv_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument
4367 _mm_maskz_rolv_epi32(__mmask8 __U, __m128i __A, __m128i __B) argument
4375 _mm256_rolv_epi32(__m256i __A, __m256i __B) argument
4381 _mm256_mask_rolv_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument
4389 _mm256_maskz_rolv_epi32(__mmask8 __U, __m256i __A, __m256i __B) argument
4397 _mm_rolv_epi64(__m128i __A, __m128i __B) argument
4403 _mm_mask_rolv_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument
4411 _mm_maskz_rolv_epi64(__mmask8 __U, __m128i __A, __m128i __B) argument
4419 _mm256_rolv_epi64(__m256i __A, __m256i __B) argument
4425 _mm256_mask_rolv_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument
4433 _mm256_maskz_rolv_epi64(__mmask8 __U, __m256i __A, __m256i __B) argument
4493 _mm_mask_sll_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument
4501 _mm_maskz_sll_epi32(__mmask8 __U, __m128i __A, __m128i __B) argument
4509 _mm256_mask_sll_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m128i __B) argument
4517 _mm256_maskz_sll_epi32(__mmask8 __U, __m256i __A, __m128i __B) argument
4525 _mm_mask_slli_epi32(__m128i __W, __mmask8 __U, __m128i __A, unsigned int __B) argument
4533 _mm_maskz_slli_epi32(__mmask8 __U, __m128i __A, unsigned int __B) argument
4541 _mm256_mask_slli_epi32(__m256i __W, __mmask8 __U, __m256i __A, unsigned int __B) argument
4549 _mm256_maskz_slli_epi32(__mmask8 __U, __m256i __A, unsigned int __B) argument
4557 _mm_mask_sll_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument
4565 _mm_maskz_sll_epi64(__mmask8 __U, __m128i __A, __m128i __B) argument
4573 _mm256_mask_sll_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m128i __B) argument
4581 _mm256_maskz_sll_epi64(__mmask8 __U, __m256i __A, __m128i __B) argument
4589 _mm_mask_slli_epi64(__m128i __W, __mmask8 __U, __m128i __A, unsigned int __B) argument
4597 _mm_maskz_slli_epi64(__mmask8 __U, __m128i __A, unsigned int __B) argument
4605 _mm256_mask_slli_epi64(__m256i __W, __mmask8 __U, __m256i __A, unsigned int __B) argument
4613 _mm256_maskz_slli_epi64(__mmask8 __U, __m256i __A, unsigned int __B) argument
4621 _mm_rorv_epi32(__m128i __A, __m128i __B) argument
4627 _mm_mask_rorv_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument
4635 _mm_maskz_rorv_epi32(__mmask8 __U, __m128i __A, __m128i __B) argument
4643 _mm256_rorv_epi32(__m256i __A, __m256i __B) argument
4649 _mm256_mask_rorv_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument
4657 _mm256_maskz_rorv_epi32(__mmask8 __U, __m256i __A, __m256i __B) argument
4665 _mm_rorv_epi64(__m128i __A, __m128i __B) argument
4671 _mm_mask_rorv_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument
4679 _mm_maskz_rorv_epi64(__mmask8 __U, __m128i __A, __m128i __B) argument
4687 _mm256_rorv_epi64(__m256i __A, __m256i __B) argument
4693 _mm256_mask_rorv_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument
4701 _mm256_maskz_rorv_epi64(__mmask8 __U, __m256i __A, __m256i __B) argument
4837 _mm_mask_srl_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument
4845 _mm_maskz_srl_epi32(__mmask8 __U, __m128i __A, __m128i __B) argument
4853 _mm256_mask_srl_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m128i __B) argument
4861 _mm256_maskz_srl_epi32(__mmask8 __U, __m256i __A, __m128i __B) argument
4869 _mm_mask_srli_epi32(__m128i __W, __mmask8 __U, __m128i __A, unsigned int __B) argument
4877 _mm_maskz_srli_epi32(__mmask8 __U, __m128i __A, unsigned int __B) argument
4885 _mm256_mask_srli_epi32(__m256i __W, __mmask8 __U, __m256i __A, unsigned int __B) argument
4893 _mm256_maskz_srli_epi32(__mmask8 __U, __m256i __A, unsigned int __B) argument
4901 _mm_mask_srl_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument
4909 _mm_maskz_srl_epi64(__mmask8 __U, __m128i __A, __m128i __B) argument
4917 _mm256_mask_srl_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m128i __B) argument
4925 _mm256_maskz_srl_epi64(__mmask8 __U, __m256i __A, __m128i __B) argument
4933 _mm_mask_srli_epi64(__m128i __W, __mmask8 __U, __m128i __A, unsigned int __B) argument
4941 _mm_maskz_srli_epi64(__mmask8 __U, __m128i __A, unsigned int __B) argument
4949 _mm256_mask_srli_epi64(__m256i __W, __mmask8 __U, __m256i __A, unsigned int __B) argument
4957 _mm256_maskz_srli_epi64(__mmask8 __U, __m256i __A, unsigned int __B) argument
5041 _mm_mask_mov_epi32(__m128i __W, __mmask8 __U, __m128i __A) argument
5049 _mm_maskz_mov_epi32(__mmask8 __U, __m128i __A) argument
5058 _mm256_mask_mov_epi32(__m256i __W, __mmask8 __U, __m256i __A) argument
5066 _mm256_maskz_mov_epi32(__mmask8 __U, __m256i __A) argument
5124 _mm_store_epi32(void *__P, __m128i __A) argument
5130 _mm_mask_store_epi32(void *__P, __mmask8 __U, __m128i __A) argument
5138 _mm256_store_epi32(void *__P, __m256i __A) argument
5144 _mm256_mask_store_epi32(void *__P, __mmask8 __U, __m256i __A) argument
5152 _mm_mask_mov_epi64(__m128i __W, __mmask8 __U, __m128i __A) argument
5160 _mm_maskz_mov_epi64(__mmask8 __U, __m128i __A) argument
5168 _mm256_mask_mov_epi64(__m256i __W, __mmask8 __U, __m256i __A) argument
5176 _mm256_maskz_mov_epi64(__mmask8 __U, __m256i __A) argument
5234 _mm_store_epi64(void *__P, __m128i __A) argument
5240 _mm_mask_store_epi64(void *__P, __mmask8 __U, __m128i __A) argument
5248 _mm256_store_epi64(void *__P, __m256i __A) argument
5254 _mm256_mask_store_epi64(void *__P, __mmask8 __U, __m256i __A) argument
5262 _mm_mask_movedup_pd(__m128d __W, __mmask8 __U, __m128d __A) argument
5270 _mm_maskz_movedup_pd(__mmask8 __U, __m128d __A) argument
5278 _mm256_mask_movedup_pd(__m256d __W, __mmask8 __U, __m256d __A) argument
5286 _mm256_maskz_movedup_pd(__mmask8 __U, __m256d __A) argument
5294 _mm_mask_set1_epi32(__m128i __O, __mmask8 __M, int __A) argument
5302 _mm_maskz_set1_epi32( __mmask8 __M, int __A) argument
5310 _mm256_mask_set1_epi32(__m256i __O, __mmask8 __M, int __A) argument
5318 _mm256_maskz_set1_epi32( __mmask8 __M, int __A) argument
5327 _mm_mask_set1_epi64(__m128i __O, __mmask8 __M, long long __A) argument
5335 _mm_maskz_set1_epi64(__mmask8 __M, long long __A) argument
5343 _mm256_mask_set1_epi64(__m256i __O, __mmask8 __M, long long __A) argument
5351 _mm256_maskz_set1_epi64(__mmask8 __M, long long __A) argument
5671 _mm_mask_store_pd(void *__P, __mmask8 __U, __m128d __A) argument
5679 _mm256_mask_store_pd(void *__P, __mmask8 __U, __m256d __A) argument
5687 _mm_mask_store_ps(void *__P, __mmask8 __U, __m128 __A) argument
5695 _mm256_mask_store_ps(void *__P, __mmask8 __U, __m256 __A) argument
5703 _mm_storeu_epi64(void *__P, __m128i __A) argument
5712 _mm_mask_storeu_epi64(void *__P, __mmask8 __U, __m128i __A) argument
5720 _mm256_storeu_epi64(void *__P, __m256i __A) argument
5729 _mm256_mask_storeu_epi64(void *__P, __mmask8 __U, __m256i __A) argument
5737 _mm_storeu_epi32(void *__P, __m128i __A) argument
5746 _mm_mask_storeu_epi32(void *__P, __mmask8 __U, __m128i __A) argument
5754 _mm256_storeu_epi32(void *__P, __m256i __A) argument
5763 _mm256_mask_storeu_epi32(void *__P, __mmask8 __U, __m256i __A) argument
5771 _mm_mask_storeu_pd(void *__P, __mmask8 __U, __m128d __A) argument
5779 _mm256_mask_storeu_pd(void *__P, __mmask8 __U, __m256d __A) argument
5787 _mm_mask_storeu_ps(void *__P, __mmask8 __U, __m128 __A) argument
5795 _mm256_mask_storeu_ps(void *__P, __mmask8 __U, __m256 __A) argument
5804 _mm_mask_unpackhi_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) argument
5812 _mm_maskz_unpackhi_pd(__mmask8 __U, __m128d __A, __m128d __B) argument
5820 _mm256_mask_unpackhi_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) argument
5828 _mm256_maskz_unpackhi_pd(__mmask8 __U, __m256d __A, __m256d __B) argument
5836 _mm_mask_unpackhi_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) argument
5844 _mm_maskz_unpackhi_ps(__mmask8 __U, __m128 __A, __m128 __B) argument
5852 _mm256_mask_unpackhi_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) argument
5860 _mm256_maskz_unpackhi_ps(__mmask8 __U, __m256 __A, __m256 __B) argument
5868 _mm_mask_unpacklo_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) argument
5876 _mm_maskz_unpacklo_pd(__mmask8 __U, __m128d __A, __m128d __B) argument
5884 _mm256_mask_unpacklo_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) argument
5892 _mm256_maskz_unpacklo_pd(__mmask8 __U, __m256d __A, __m256d __B) argument
5900 _mm_mask_unpacklo_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) argument
5908 _mm_maskz_unpacklo_ps(__mmask8 __U, __m128 __A, __m128 __B) argument
5916 _mm256_mask_unpacklo_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) argument
5924 _mm256_maskz_unpacklo_ps(__mmask8 __U, __m256 __A, __m256 __B) argument
5932 _mm_rcp14_pd(__m128d __A) argument
5941 _mm_mask_rcp14_pd(__m128d __W, __mmask8 __U, __m128d __A) argument
5949 _mm_maskz_rcp14_pd(__mmask8 __U, __m128d __A) argument
5958 _mm256_rcp14_pd(__m256d __A) argument
5967 _mm256_mask_rcp14_pd(__m256d __W, __mmask8 __U, __m256d __A) argument
5975 _mm256_maskz_rcp14_pd(__mmask8 __U, __m256d __A) argument
5984 _mm_rcp14_ps(__m128 __A) argument
5993 _mm_mask_rcp14_ps(__m128 __W, __mmask8 __U, __m128 __A) argument
6001 _mm_maskz_rcp14_ps(__mmask8 __U, __m128 __A) argument
6010 _mm256_rcp14_ps(__m256 __A) argument
6019 _mm256_mask_rcp14_ps(__m256 __W, __mmask8 __U, __m256 __A) argument
6027 _mm256_maskz_rcp14_ps(__mmask8 __U, __m256 __A) argument
6076 _mm_mask_permutevar_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128i __C) argument
6084 _mm_maskz_permutevar_pd(__mmask8 __U, __m128d __A, __m128i __C) argument
6092 _mm256_mask_permutevar_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256i __C) argument
6100 _mm256_maskz_permutevar_pd(__mmask8 __U, __m256d __A, __m256i __C) argument
6108 _mm_mask_permutevar_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128i __C) argument
6116 _mm_maskz_permutevar_ps(__mmask8 __U, __m128 __A, __m128i __C) argument
6124 _mm256_mask_permutevar_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256i __C) argument
6132 _mm256_maskz_permutevar_ps(__mmask8 __U, __m256 __A, __m256i __C) argument
6140 _mm_test_epi32_mask(__m128i __A, __m128i __B) argument
6146 _mm_mask_test_epi32_mask(__mmask8 __U, __m128i __A, __m128i __B) argument
6153 _mm256_test_epi32_mask(__m256i __A, __m256i __B) argument
6160 _mm256_mask_test_epi32_mask(__mmask8 __U, __m256i __A, __m256i __B) argument
6167 _mm_test_epi64_mask(__m128i __A, __m128i __B) argument
6173 _mm_mask_test_epi64_mask(__mmask8 __U, __m128i __A, __m128i __B) argument
6180 _mm256_test_epi64_mask(__m256i __A, __m256i __B) argument
6187 _mm256_mask_test_epi64_mask(__mmask8 __U, __m256i __A, __m256i __B) argument
6194 _mm_testn_epi32_mask(__m128i __A, __m128i __B) argument
6200 _mm_mask_testn_epi32_mask(__mmask8 __U, __m128i __A, __m128i __B) argument
6207 _mm256_testn_epi32_mask(__m256i __A, __m256i __B) argument
6214 _mm256_mask_testn_epi32_mask(__mmask8 __U, __m256i __A, __m256i __B) argument
6221 _mm_testn_epi64_mask(__m128i __A, __m128i __B) argument
6227 _mm_mask_testn_epi64_mask(__mmask8 __U, __m128i __A, __m128i __B) argument
6234 _mm256_testn_epi64_mask(__m256i __A, __m256i __B) argument
6241 _mm256_mask_testn_epi64_mask(__mmask8 __U, __m256i __A, __m256i __B) argument
6248 _mm_mask_unpackhi_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument
6256 _mm_maskz_unpackhi_epi32(__mmask8 __U, __m128i __A, __m128i __B) argument
6264 _mm256_mask_unpackhi_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument
6272 _mm256_maskz_unpackhi_epi32(__mmask8 __U, __m256i __A, __m256i __B) argument
6280 _mm_mask_unpackhi_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument
6288 _mm_maskz_unpackhi_epi64(__mmask8 __U, __m128i __A, __m128i __B) argument
6296 _mm256_mask_unpackhi_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument
6304 _mm256_maskz_unpackhi_epi64(__mmask8 __U, __m256i __A, __m256i __B) argument
6312 _mm_mask_unpacklo_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument
6320 _mm_maskz_unpacklo_epi32(__mmask8 __U, __m128i __A, __m128i __B) argument
6328 _mm256_mask_unpacklo_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument
6336 _mm256_maskz_unpacklo_epi32(__mmask8 __U, __m256i __A, __m256i __B) argument
6344 _mm_mask_unpacklo_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument
6352 _mm_maskz_unpacklo_epi64(__mmask8 __U, __m128i __A, __m128i __B) argument
6360 _mm256_mask_unpacklo_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument
6368 _mm256_maskz_unpacklo_epi64(__mmask8 __U, __m256i __A, __m256i __B) argument
6376 _mm_mask_sra_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument
6384 _mm_maskz_sra_epi32(__mmask8 __U, __m128i __A, __m128i __B) argument
6392 _mm256_mask_sra_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m128i __B) argument
6400 _mm256_maskz_sra_epi32(__mmask8 __U, __m256i __A, __m128i __B) argument
6408 _mm_mask_srai_epi32(__m128i __W, __mmask8 __U, __m128i __A, unsigned int __B) argument
6416 _mm_maskz_srai_epi32(__mmask8 __U, __m128i __A, unsigned int __B) argument
6424 _mm256_mask_srai_epi32(__m256i __W, __mmask8 __U, __m256i __A, unsigned int __B) argument
6432 _mm256_maskz_srai_epi32(__mmask8 __U, __m256i __A, unsigned int __B) argument
6440 _mm_sra_epi64(__m128i __A, __m128i __B) argument
6446 _mm_mask_sra_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument
6454 _mm_maskz_sra_epi64(__mmask8 __U, __m128i __A, __m128i __B) argument
6462 _mm256_sra_epi64(__m256i __A, __m128i __B) argument
6468 _mm256_mask_sra_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m128i __B) argument
6476 _mm256_maskz_sra_epi64(__mmask8 __U, __m256i __A, __m128i __B) argument
6484 _mm_srai_epi64(__m128i __A, unsigned int __imm) argument
6490 _mm_mask_srai_epi64(__m128i __W, __mmask8 __U, __m128i __A, unsigned int __imm) argument
6498 _mm_maskz_srai_epi64(__mmask8 __U, __m128i __A, unsigned int __imm) argument
6506 _mm256_srai_epi64(__m256i __A, unsigned int __imm) argument
6512 _mm256_mask_srai_epi64(__m256i __W, __mmask8 __U, __m256i __A, unsigned int __imm) argument
6521 _mm256_maskz_srai_epi64(__mmask8 __U, __m256i __A, unsigned int __imm) argument
6686 _mm_rsqrt14_pd(__m128d __A) argument
6695 _mm_mask_rsqrt14_pd(__m128d __W, __mmask8 __U, __m128d __A) argument
6703 _mm_maskz_rsqrt14_pd(__mmask8 __U, __m128d __A) argument
6712 _mm256_rsqrt14_pd(__m256d __A) argument
6721 _mm256_mask_rsqrt14_pd(__m256d __W, __mmask8 __U, __m256d __A) argument
6729 _mm256_maskz_rsqrt14_pd(__mmask8 __U, __m256d __A) argument
6738 _mm_rsqrt14_ps(__m128 __A) argument
6747 _mm_mask_rsqrt14_ps(__m128 __W, __mmask8 __U, __m128 __A) argument
6755 _mm_maskz_rsqrt14_ps(__mmask8 __U, __m128 __A) argument
6764 _mm256_rsqrt14_ps(__m256 __A) argument
6773 _mm256_mask_rsqrt14_ps(__m256 __W, __mmask8 __U, __m256 __A) argument
6781 _mm256_maskz_rsqrt14_ps(__mmask8 __U, __m256 __A) argument
6790 _mm256_broadcast_f32x4(__m128 __A) argument
6797 _mm256_mask_broadcast_f32x4(__m256 __O, __mmask8 __M, __m128 __A) argument
6805 _mm256_maskz_broadcast_f32x4(__mmask8 __M, __m128 __A) argument
6813 _mm256_broadcast_i32x4(__m128i __A) argument
6820 _mm256_mask_broadcast_i32x4(__m256i __O, __mmask8 __M, __m128i __A) argument
6828 _mm256_maskz_broadcast_i32x4(__mmask8 __M, __m128i __A) argument
6836 _mm256_mask_broadcastsd_pd(__m256d __O, __mmask8 __M, __m128d __A) argument
6844 _mm256_maskz_broadcastsd_pd(__mmask8 __M, __m128d __A) argument
6852 _mm_mask_broadcastss_ps(__m128 __O, __mmask8 __M, __m128 __A) argument
6860 _mm_maskz_broadcastss_ps(__mmask8 __M, __m128 __A) argument
6868 _mm256_mask_broadcastss_ps(__m256 __O, __mmask8 __M, __m128 __A) argument
6876 _mm256_maskz_broadcastss_ps(__mmask8 __M, __m128 __A) argument
6884 _mm_mask_broadcastd_epi32(__m128i __O, __mmask8 __M, __m128i __A) argument
6892 _mm_maskz_broadcastd_epi32(__mmask8 __M, __m128i __A) argument
6900 _mm256_mask_broadcastd_epi32(__m256i __O, __mmask8 __M, __m128i __A) argument
6908 _mm256_maskz_broadcastd_epi32(__mmask8 __M, __m128i __A) argument
6916 _mm_mask_broadcastq_epi64(__m128i __O, __mmask8 __M, __m128i __A) argument
6924 _mm_maskz_broadcastq_epi64(__mmask8 __M, __m128i __A) argument
6932 _mm256_mask_broadcastq_epi64(__m256i __O, __mmask8 __M, __m128i __A) argument
6940 _mm256_maskz_broadcastq_epi64(__mmask8 __M, __m128i __A) argument
6948 _mm_cvtsepi32_epi8(__m128i __A) argument
6956 _mm_mask_cvtsepi32_epi8(__m128i __O, __mmask8 __M, __m128i __A) argument
6963 _mm_maskz_cvtsepi32_epi8(__mmask8 __M, __m128i __A) argument
6971 _mm_mask_cvtsepi32_storeu_epi8(void * __P, __mmask8 __M, __m128i __A) argument
6977 _mm256_cvtsepi32_epi8(__m256i __A) argument
6985 _mm256_mask_cvtsepi32_epi8(__m128i __O, __mmask8 __M, __m256i __A) argument
6992 _mm256_maskz_cvtsepi32_epi8(__mmask8 __M, __m256i __A) argument
7000 _mm256_mask_cvtsepi32_storeu_epi8(void * __P, __mmask8 __M, __m256i __A) argument
7006 _mm_cvtsepi32_epi16(__m128i __A) argument
7014 _mm_mask_cvtsepi32_epi16(__m128i __O, __mmask8 __M, __m128i __A) argument
7022 _mm_maskz_cvtsepi32_epi16(__mmask8 __M, __m128i __A) argument
7030 _mm_mask_cvtsepi32_storeu_epi16(void * __P, __mmask8 __M, __m128i __A) argument
7036 _mm256_cvtsepi32_epi16(__m256i __A) argument
7044 _mm256_mask_cvtsepi32_epi16(__m128i __O, __mmask8 __M, __m256i __A) argument
7051 _mm256_maskz_cvtsepi32_epi16(__mmask8 __M, __m256i __A) argument
7059 _mm256_mask_cvtsepi32_storeu_epi16(void * __P, __mmask8 __M, __m256i __A) argument
7065 _mm_cvtsepi64_epi8(__m128i __A) argument
7073 _mm_mask_cvtsepi64_epi8(__m128i __O, __mmask8 __M, __m128i __A) argument
7080 _mm_maskz_cvtsepi64_epi8(__mmask8 __M, __m128i __A) argument
7088 _mm_mask_cvtsepi64_storeu_epi8(void * __P, __mmask8 __M, __m128i __A) argument
7094 _mm256_cvtsepi64_epi8(__m256i __A) argument
7102 _mm256_mask_cvtsepi64_epi8(__m128i __O, __mmask8 __M, __m256i __A) argument
7109 _mm256_maskz_cvtsepi64_epi8(__mmask8 __M, __m256i __A) argument
7117 _mm256_mask_cvtsepi64_storeu_epi8(void * __P, __mmask8 __M, __m256i __A) argument
7123 _mm_cvtsepi64_epi32(__m128i __A) argument
7131 _mm_mask_cvtsepi64_epi32(__m128i __O, __mmask8 __M, __m128i __A) argument
7138 _mm_maskz_cvtsepi64_epi32(__mmask8 __M, __m128i __A) argument
7146 _mm_mask_cvtsepi64_storeu_epi32(void * __P, __mmask8 __M, __m128i __A) argument
7152 _mm256_cvtsepi64_epi32(__m256i __A) argument
7160 _mm256_mask_cvtsepi64_epi32(__m128i __O, __mmask8 __M, __m256i __A) argument
7168 _mm256_maskz_cvtsepi64_epi32(__mmask8 __M, __m256i __A) argument
7176 _mm256_mask_cvtsepi64_storeu_epi32(void * __P, __mmask8 __M, __m256i __A) argument
7182 _mm_cvtsepi64_epi16(__m128i __A) argument
7190 _mm_mask_cvtsepi64_epi16(__m128i __O, __mmask8 __M, __m128i __A) argument
7197 _mm_maskz_cvtsepi64_epi16(__mmask8 __M, __m128i __A) argument
7205 _mm_mask_cvtsepi64_storeu_epi16(void * __P, __mmask8 __M, __m128i __A) argument
7211 _mm256_cvtsepi64_epi16(__m256i __A) argument
7219 _mm256_mask_cvtsepi64_epi16(__m128i __O, __mmask8 __M, __m256i __A) argument
7226 _mm256_maskz_cvtsepi64_epi16(__mmask8 __M, __m256i __A) argument
7234 _mm256_mask_cvtsepi64_storeu_epi16(void * __P, __mmask8 __M, __m256i __A) argument
7240 _mm_cvtusepi32_epi8(__m128i __A) argument
7248 _mm_mask_cvtusepi32_epi8(__m128i __O, __mmask8 __M, __m128i __A) argument
7256 _mm_maskz_cvtusepi32_epi8(__mmask8 __M, __m128i __A) argument
7264 _mm_mask_cvtusepi32_storeu_epi8(void * __P, __mmask8 __M, __m128i __A) argument
7270 _mm256_cvtusepi32_epi8(__m256i __A) argument
7278 _mm256_mask_cvtusepi32_epi8(__m128i __O, __mmask8 __M, __m256i __A) argument
7286 _mm256_maskz_cvtusepi32_epi8(__mmask8 __M, __m256i __A) argument
7294 _mm256_mask_cvtusepi32_storeu_epi8(void * __P, __mmask8 __M, __m256i __A) argument
7300 _mm_cvtusepi32_epi16(__m128i __A) argument
7308 _mm_mask_cvtusepi32_epi16(__m128i __O, __mmask8 __M, __m128i __A) argument
7315 _mm_maskz_cvtusepi32_epi16(__mmask8 __M, __m128i __A) argument
7323 _mm_mask_cvtusepi32_storeu_epi16(void * __P, __mmask8 __M, __m128i __A) argument
7329 _mm256_cvtusepi32_epi16(__m256i __A) argument
7337 _mm256_mask_cvtusepi32_epi16(__m128i __O, __mmask8 __M, __m256i __A) argument
7344 _mm256_maskz_cvtusepi32_epi16(__mmask8 __M, __m256i __A) argument
7352 _mm256_mask_cvtusepi32_storeu_epi16(void * __P, __mmask8 __M, __m256i __A) argument
7358 _mm_cvtusepi64_epi8(__m128i __A) argument
7366 _mm_mask_cvtusepi64_epi8(__m128i __O, __mmask8 __M, __m128i __A) argument
7374 _mm_maskz_cvtusepi64_epi8(__mmask8 __M, __m128i __A) argument
7382 _mm_mask_cvtusepi64_storeu_epi8(void * __P, __mmask8 __M, __m128i __A) argument
7388 _mm256_cvtusepi64_epi8(__m256i __A) argument
7396 _mm256_mask_cvtusepi64_epi8(__m128i __O, __mmask8 __M, __m256i __A) argument
7404 _mm256_maskz_cvtusepi64_epi8(__mmask8 __M, __m256i __A) argument
7412 _mm256_mask_cvtusepi64_storeu_epi8(void * __P, __mmask8 __M, __m256i __A) argument
7418 _mm_cvtusepi64_epi32(__m128i __A) argument
7426 _mm_mask_cvtusepi64_epi32(__m128i __O, __mmask8 __M, __m128i __A) argument
7433 _mm_maskz_cvtusepi64_epi32(__mmask8 __M, __m128i __A) argument
7441 _mm_mask_cvtusepi64_storeu_epi32(void * __P, __mmask8 __M, __m128i __A) argument
7447 _mm256_cvtusepi64_epi32(__m256i __A) argument
7455 _mm256_mask_cvtusepi64_epi32(__m128i __O, __mmask8 __M, __m256i __A) argument
7462 _mm256_maskz_cvtusepi64_epi32(__mmask8 __M, __m256i __A) argument
7470 _mm256_mask_cvtusepi64_storeu_epi32(void * __P, __mmask8 __M, __m256i __A) argument
7476 _mm_cvtusepi64_epi16(__m128i __A) argument
7484 _mm_mask_cvtusepi64_epi16(__m128i __O, __mmask8 __M, __m128i __A) argument
7491 _mm_maskz_cvtusepi64_epi16(__mmask8 __M, __m128i __A) argument
7499 _mm_mask_cvtusepi64_storeu_epi16(void * __P, __mmask8 __M, __m128i __A) argument
7505 _mm256_cvtusepi64_epi16(__m256i __A) argument
7513 _mm256_mask_cvtusepi64_epi16(__m128i __O, __mmask8 __M, __m256i __A) argument
7520 _mm256_maskz_cvtusepi64_epi16(__mmask8 __M, __m256i __A) argument
7528 _mm256_mask_cvtusepi64_storeu_epi16(void * __P, __mmask8 __M, __m256i __A) argument
7534 _mm_cvtepi32_epi8(__m128i __A) argument
7542 _mm_mask_cvtepi32_epi8(__m128i __O, __mmask8 __M, __m128i __A) argument
7549 _mm_maskz_cvtepi32_epi8(__mmask8 __M, __m128i __A) argument
7558 _mm_mask_cvtepi32_storeu_epi8(void * __P, __mmask8 __M, __m128i __A) argument
7564 _mm256_cvtepi32_epi8(__m256i __A) argument
7573 _mm256_mask_cvtepi32_epi8(__m128i __O, __mmask8 __M, __m256i __A) argument
7580 _mm256_maskz_cvtepi32_epi8(__mmask8 __M, __m256i __A) argument
7588 _mm256_mask_cvtepi32_storeu_epi8(void * __P, __mmask8 __M, __m256i __A) argument
7594 _mm_cvtepi32_epi16(__m128i __A) argument
7602 _mm_mask_cvtepi32_epi16(__m128i __O, __mmask8 __M, __m128i __A) argument
7609 _mm_maskz_cvtepi32_epi16(__mmask8 __M, __m128i __A) argument
7617 _mm_mask_cvtepi32_storeu_epi16(void * __P, __mmask8 __M, __m128i __A) argument
7623 _mm256_cvtepi32_epi16(__m256i __A) argument
7629 _mm256_mask_cvtepi32_epi16(__m128i __O, __mmask8 __M, __m256i __A) argument
7636 _mm256_maskz_cvtepi32_epi16(__mmask8 __M, __m256i __A) argument
7644 _mm256_mask_cvtepi32_storeu_epi16(void * __P, __mmask8 __M, __m256i __A) argument
7650 _mm_cvtepi64_epi8(__m128i __A) argument
7658 _mm_mask_cvtepi64_epi8(__m128i __O, __mmask8 __M, __m128i __A) argument
7665 _mm_maskz_cvtepi64_epi8(__mmask8 __M, __m128i __A) argument
7673 _mm_mask_cvtepi64_storeu_epi8(void * __P, __mmask8 __M, __m128i __A) argument
7679 _mm256_cvtepi64_epi8(__m256i __A) argument
7687 _mm256_mask_cvtepi64_epi8(__m128i __O, __mmask8 __M, __m256i __A) argument
7694 _mm256_maskz_cvtepi64_epi8(__mmask8 __M, __m256i __A) argument
7702 _mm256_mask_cvtepi64_storeu_epi8(void * __P, __mmask8 __M, __m256i __A) argument
7708 _mm_cvtepi64_epi32(__m128i __A) argument
7715 _mm_mask_cvtepi64_epi32(__m128i __O, __mmask8 __M, __m128i __A) argument
7722 _mm_maskz_cvtepi64_epi32(__mmask8 __M, __m128i __A) argument
7730 _mm_mask_cvtepi64_storeu_epi32(void * __P, __mmask8 __M, __m128i __A) argument
7736 _mm256_cvtepi64_epi32(__m256i __A) argument
7742 _mm256_mask_cvtepi64_epi32(__m128i __O, __mmask8 __M, __m256i __A) argument
7750 _mm256_maskz_cvtepi64_epi32(__mmask8 __M, __m256i __A) argument
7758 _mm256_mask_cvtepi64_storeu_epi32(void * __P, __mmask8 __M, __m256i __A) argument
7764 _mm_cvtepi64_epi16(__m128i __A) argument
7772 _mm_mask_cvtepi64_epi16(__m128i __O, __mmask8 __M, __m128i __A) argument
7780 _mm_maskz_cvtepi64_epi16(__mmask8 __M, __m128i __A) argument
7788 _mm_mask_cvtepi64_storeu_epi16(void * __P, __mmask8 __M, __m128i __A) argument
7794 _mm256_cvtepi64_epi16(__m256i __A) argument
7802 _mm256_mask_cvtepi64_epi16(__m128i __O, __mmask8 __M, __m256i __A) argument
7809 _mm256_maskz_cvtepi64_epi16(__mmask8 __M, __m256i __A) argument
7817 _mm256_mask_cvtepi64_storeu_epi16(void * __P, __mmask8 __M, __m256i __A) argument
8220 _mm_mask_movehdup_ps(__m128 __W, __mmask8 __U, __m128 __A) argument
8228 _mm_maskz_movehdup_ps(__mmask8 __U, __m128 __A) argument
8236 _mm256_mask_movehdup_ps(__m256 __W, __mmask8 __U, __m256 __A) argument
8244 _mm256_maskz_movehdup_ps(__mmask8 __U, __m256 __A) argument
8252 _mm_mask_moveldup_ps(__m128 __W, __mmask8 __U, __m128 __A) argument
8260 _mm_maskz_moveldup_ps(__mmask8 __U, __m128 __A) argument
8268 _mm256_mask_moveldup_ps(__m256 __W, __mmask8 __U, __m256 __A) argument
8276 _mm256_maskz_moveldup_ps(__mmask8 __U, __m256 __A) argument
8304 _mm_mask_mov_pd(__m128d __W, __mmask8 __U, __m128d __A) argument
8312 _mm_maskz_mov_pd(__mmask8 __U, __m128d __A) argument
8320 _mm256_mask_mov_pd(__m256d __W, __mmask8 __U, __m256d __A) argument
8328 _mm256_maskz_mov_pd(__mmask8 __U, __m256d __A) argument
8336 _mm_mask_mov_ps(__m128 __W, __mmask8 __U, __m128 __A) argument
8344 _mm_maskz_mov_ps(__mmask8 __U, __m128 __A) argument
8352 _mm256_mask_mov_ps(__m256 __W, __mmask8 __U, __m256 __A) argument
8360 _mm256_maskz_mov_ps(__mmask8 __U, __m256 __A) argument
8368 _mm_mask_cvtph_ps(__m128 __W, __mmask8 __U, __m128i __A) argument
8376 _mm_maskz_cvtph_ps(__mmask8 __U, __m128i __A) argument
8385 _mm256_mask_cvtph_ps(__m256 __W, __mmask8 __U, __m128i __A) argument
8393 _mm256_maskz_cvtph_ps(__mmask8 __U, __m128i __A) argument
[all...]
/openbsd-current/gnu/gcc/gcc/config/i386/
H A Dmm3dnow.h47 _m_pavgusb (__m64 __A, __m64 __B) argument
49 return (__m64)__builtin_ia32_pavgusb ((__v8qi)__A, (__v8qi)__B);
53 _m_pf2id (__m64 __A) argument
55 return (__m64)__builtin_ia32_pf2id ((__v2sf)__A);
59 _m_pfacc (__m64 __A, __m64 __B) argument
61 return (__m64)__builtin_ia32_pfacc ((__v2sf)__A, (__v2sf)__B);
65 _m_pfadd (__m64 __A, __m64 __B) argument
67 return (__m64)__builtin_ia32_pfadd ((__v2sf)__A, (__v2sf)__B);
71 _m_pfcmpeq (__m64 __A, __m64 __B) argument
73 return (__m64)__builtin_ia32_pfcmpeq ((__v2sf)__A, (__v2s
77 _m_pfcmpge(__m64 __A, __m64 __B) argument
83 _m_pfcmpgt(__m64 __A, __m64 __B) argument
89 _m_pfmax(__m64 __A, __m64 __B) argument
95 _m_pfmin(__m64 __A, __m64 __B) argument
101 _m_pfmul(__m64 __A, __m64 __B) argument
107 _m_pfrcp(__m64 __A) argument
113 _m_pfrcpit1(__m64 __A, __m64 __B) argument
119 _m_pfrcpit2(__m64 __A, __m64 __B) argument
125 _m_pfrsqrt(__m64 __A) argument
131 _m_pfrsqit1(__m64 __A, __m64 __B) argument
137 _m_pfsub(__m64 __A, __m64 __B) argument
143 _m_pfsubr(__m64 __A, __m64 __B) argument
149 _m_pi2fd(__m64 __A) argument
155 _m_pmulhrw(__m64 __A, __m64 __B) argument
173 _m_from_float(float __A) argument
179 _m_to_float(__m64 __A) argument
188 _m_pf2iw(__m64 __A) argument
194 _m_pfnacc(__m64 __A, __m64 __B) argument
200 _m_pfpnacc(__m64 __A, __m64 __B) argument
206 _m_pi2fw(__m64 __A) argument
212 _m_pswapd(__m64 __A) argument
[all...]
H A Demmintrin.h95 _mm_move_sd (__m128d __A, __m128d __B) argument
97 return (__m128d) __builtin_ia32_movsd ((__v2df)__A, (__v2df)__B);
144 _mm_store_pd (double *__P, __m128d __A) argument
146 *(__m128d *)__P = __A;
151 _mm_storeu_pd (double *__P, __m128d __A) argument
153 __builtin_ia32_storeupd (__P, __A);
158 _mm_store_sd (double *__P, __m128d __A) argument
160 *__P = __builtin_ia32_vec_ext_v2df (__A, 0);
164 _mm_cvtsd_f64 (__m128d __A) argument
166 return __builtin_ia32_vec_ext_v2df (__A,
170 _mm_storel_pd(double *__P, __m128d __A) argument
177 _mm_storeh_pd(double *__P, __m128d __A) argument
185 _mm_store1_pd(double *__P, __m128d __A) argument
191 _mm_store_pd1(double *__P, __m128d __A) argument
198 _mm_storer_pd(double *__P, __m128d __A) argument
204 _mm_cvtsi128_si32(__m128i __A) argument
212 _mm_cvtsi128_si64(__m128i __A) argument
219 _mm_cvtsi128_si64x(__m128i __A) argument
226 _mm_add_pd(__m128d __A, __m128d __B) argument
232 _mm_add_sd(__m128d __A, __m128d __B) argument
238 _mm_sub_pd(__m128d __A, __m128d __B) argument
244 _mm_sub_sd(__m128d __A, __m128d __B) argument
250 _mm_mul_pd(__m128d __A, __m128d __B) argument
256 _mm_mul_sd(__m128d __A, __m128d __B) argument
262 _mm_div_pd(__m128d __A, __m128d __B) argument
268 _mm_div_sd(__m128d __A, __m128d __B) argument
274 _mm_sqrt_pd(__m128d __A) argument
281 _mm_sqrt_sd(__m128d __A, __m128d __B) argument
288 _mm_min_pd(__m128d __A, __m128d __B) argument
294 _mm_min_sd(__m128d __A, __m128d __B) argument
300 _mm_max_pd(__m128d __A, __m128d __B) argument
306 _mm_max_sd(__m128d __A, __m128d __B) argument
312 _mm_and_pd(__m128d __A, __m128d __B) argument
318 _mm_andnot_pd(__m128d __A, __m128d __B) argument
324 _mm_or_pd(__m128d __A, __m128d __B) argument
330 _mm_xor_pd(__m128d __A, __m128d __B) argument
336 _mm_cmpeq_pd(__m128d __A, __m128d __B) argument
342 _mm_cmplt_pd(__m128d __A, __m128d __B) argument
348 _mm_cmple_pd(__m128d __A, __m128d __B) argument
354 _mm_cmpgt_pd(__m128d __A, __m128d __B) argument
360 _mm_cmpge_pd(__m128d __A, __m128d __B) argument
366 _mm_cmpneq_pd(__m128d __A, __m128d __B) argument
372 _mm_cmpnlt_pd(__m128d __A, __m128d __B) argument
378 _mm_cmpnle_pd(__m128d __A, __m128d __B) argument
384 _mm_cmpngt_pd(__m128d __A, __m128d __B) argument
390 _mm_cmpnge_pd(__m128d __A, __m128d __B) argument
396 _mm_cmpord_pd(__m128d __A, __m128d __B) argument
402 _mm_cmpunord_pd(__m128d __A, __m128d __B) argument
408 _mm_cmpeq_sd(__m128d __A, __m128d __B) argument
414 _mm_cmplt_sd(__m128d __A, __m128d __B) argument
420 _mm_cmple_sd(__m128d __A, __m128d __B) argument
426 _mm_cmpgt_sd(__m128d __A, __m128d __B) argument
436 _mm_cmpge_sd(__m128d __A, __m128d __B) argument
446 _mm_cmpneq_sd(__m128d __A, __m128d __B) argument
452 _mm_cmpnlt_sd(__m128d __A, __m128d __B) argument
458 _mm_cmpnle_sd(__m128d __A, __m128d __B) argument
464 _mm_cmpngt_sd(__m128d __A, __m128d __B) argument
474 _mm_cmpnge_sd(__m128d __A, __m128d __B) argument
484 _mm_cmpord_sd(__m128d __A, __m128d __B) argument
490 _mm_cmpunord_sd(__m128d __A, __m128d __B) argument
496 _mm_comieq_sd(__m128d __A, __m128d __B) argument
502 _mm_comilt_sd(__m128d __A, __m128d __B) argument
508 _mm_comile_sd(__m128d __A, __m128d __B) argument
514 _mm_comigt_sd(__m128d __A, __m128d __B) argument
520 _mm_comige_sd(__m128d __A, __m128d __B) argument
526 _mm_comineq_sd(__m128d __A, __m128d __B) argument
532 _mm_ucomieq_sd(__m128d __A, __m128d __B) argument
538 _mm_ucomilt_sd(__m128d __A, __m128d __B) argument
544 _mm_ucomile_sd(__m128d __A, __m128d __B) argument
550 _mm_ucomigt_sd(__m128d __A, __m128d __B) argument
556 _mm_ucomige_sd(__m128d __A, __m128d __B) argument
562 _mm_ucomineq_sd(__m128d __A, __m128d __B) argument
610 _mm_set1_epi64x(long long __A) argument
616 _mm_set1_epi64(__m64 __A) argument
622 _mm_set1_epi32(int __A) argument
628 _mm_set1_epi16(short __A) argument
634 _mm_set1_epi8(char __A) argument
717 _mm_movpi64_epi64(__m64 __A) argument
723 _mm_move_epi64(__m128i __A) argument
736 _mm_cvtepi32_pd(__m128i __A) argument
742 _mm_cvtepi32_ps(__m128i __A) argument
748 _mm_cvtpd_epi32(__m128d __A) argument
754 _mm_cvtpd_pi32(__m128d __A) argument
760 _mm_cvtpd_ps(__m128d __A) argument
766 _mm_cvttpd_epi32(__m128d __A) argument
772 _mm_cvttpd_pi32(__m128d __A) argument
778 _mm_cvtpi32_pd(__m64 __A) argument
784 _mm_cvtps_epi32(__m128 __A) argument
790 _mm_cvttps_epi32(__m128 __A) argument
796 _mm_cvtps_pd(__m128 __A) argument
802 _mm_cvtsd_si32(__m128d __A) argument
810 _mm_cvtsd_si64(__m128d __A) argument
817 _mm_cvtsd_si64x(__m128d __A) argument
824 _mm_cvttsd_si32(__m128d __A) argument
832 _mm_cvttsd_si64(__m128d __A) argument
839 _mm_cvttsd_si64x(__m128d __A) argument
846 _mm_cvtsd_ss(__m128 __A, __m128d __B) argument
852 _mm_cvtsi32_sd(__m128d __A, int __B) argument
860 _mm_cvtsi64_sd(__m128d __A, long long __B) argument
867 _mm_cvtsi64x_sd(__m128d __A, long long __B) argument
874 _mm_cvtss_sd(__m128d __A, __m128 __B) argument
882 _mm_unpackhi_pd(__m128d __A, __m128d __B) argument
888 _mm_unpacklo_pd(__m128d __A, __m128d __B) argument
894 _mm_loadh_pd(__m128d __A, double const *__B) argument
900 _mm_loadl_pd(__m128d __A, double const *__B) argument
906 _mm_movemask_pd(__m128d __A) argument
912 _mm_packs_epi16(__m128i __A, __m128i __B) argument
918 _mm_packs_epi32(__m128i __A, __m128i __B) argument
924 _mm_packus_epi16(__m128i __A, __m128i __B) argument
930 _mm_unpackhi_epi8(__m128i __A, __m128i __B) argument
936 _mm_unpackhi_epi16(__m128i __A, __m128i __B) argument
942 _mm_unpackhi_epi32(__m128i __A, __m128i __B) argument
948 _mm_unpackhi_epi64(__m128i __A, __m128i __B) argument
954 _mm_unpacklo_epi8(__m128i __A, __m128i __B) argument
960 _mm_unpacklo_epi16(__m128i __A, __m128i __B) argument
966 _mm_unpacklo_epi32(__m128i __A, __m128i __B) argument
972 _mm_unpacklo_epi64(__m128i __A, __m128i __B) argument
978 _mm_add_epi8(__m128i __A, __m128i __B) argument
984 _mm_add_epi16(__m128i __A, __m128i __B) argument
990 _mm_add_epi32(__m128i __A, __m128i __B) argument
996 _mm_add_epi64(__m128i __A, __m128i __B) argument
1002 _mm_adds_epi8(__m128i __A, __m128i __B) argument
1008 _mm_adds_epi16(__m128i __A, __m128i __B) argument
1014 _mm_adds_epu8(__m128i __A, __m128i __B) argument
1020 _mm_adds_epu16(__m128i __A, __m128i __B) argument
1026 _mm_sub_epi8(__m128i __A, __m128i __B) argument
1032 _mm_sub_epi16(__m128i __A, __m128i __B) argument
1038 _mm_sub_epi32(__m128i __A, __m128i __B) argument
1044 _mm_sub_epi64(__m128i __A, __m128i __B) argument
1050 _mm_subs_epi8(__m128i __A, __m128i __B) argument
1056 _mm_subs_epi16(__m128i __A, __m128i __B) argument
1062 _mm_subs_epu8(__m128i __A, __m128i __B) argument
1068 _mm_subs_epu16(__m128i __A, __m128i __B) argument
1074 _mm_madd_epi16(__m128i __A, __m128i __B) argument
1080 _mm_mulhi_epi16(__m128i __A, __m128i __B) argument
1086 _mm_mullo_epi16(__m128i __A, __m128i __B) argument
1092 _mm_mul_su32(__m64 __A, __m64 __B) argument
1098 _mm_mul_epu32(__m128i __A, __m128i __B) argument
1196 _mm_sll_epi16(__m128i __A, __m128i __B) argument
1202 _mm_sll_epi32(__m128i __A, __m128i __B) argument
1208 _mm_sll_epi64(__m128i __A, __m128i __B) argument
1214 _mm_sra_epi16(__m128i __A, __m128i __B) argument
1220 _mm_sra_epi32(__m128i __A, __m128i __B) argument
1226 _mm_srl_epi16(__m128i __A, __m128i __B) argument
1232 _mm_srl_epi32(__m128i __A, __m128i __B) argument
1238 _mm_srl_epi64(__m128i __A, __m128i __B) argument
1244 _mm_and_si128(__m128i __A, __m128i __B) argument
1250 _mm_andnot_si128(__m128i __A, __m128i __B) argument
1256 _mm_or_si128(__m128i __A, __m128i __B) argument
1262 _mm_xor_si128(__m128i __A, __m128i __B) argument
1268 _mm_cmpeq_epi8(__m128i __A, __m128i __B) argument
1274 _mm_cmpeq_epi16(__m128i __A, __m128i __B) argument
1280 _mm_cmpeq_epi32(__m128i __A, __m128i __B) argument
1286 _mm_cmplt_epi8(__m128i __A, __m128i __B) argument
1292 _mm_cmplt_epi16(__m128i __A, __m128i __B) argument
1298 _mm_cmplt_epi32(__m128i __A, __m128i __B) argument
1304 _mm_cmpgt_epi8(__m128i __A, __m128i __B) argument
1310 _mm_cmpgt_epi16(__m128i __A, __m128i __B) argument
1316 _mm_cmpgt_epi32(__m128i __A, __m128i __B) argument
1341 _mm_max_epi16(__m128i __A, __m128i __B) argument
1347 _mm_max_epu8(__m128i __A, __m128i __B) argument
1353 _mm_min_epi16(__m128i __A, __m128i __B) argument
1359 _mm_min_epu8(__m128i __A, __m128i __B) argument
1365 _mm_movemask_epi8(__m128i __A) argument
1371 _mm_mulhi_epu16(__m128i __A, __m128i __B) argument
1381 _mm_maskmoveu_si128(__m128i __A, __m128i __B, char *__C) argument
1387 _mm_avg_epu8(__m128i __A, __m128i __B) argument
1393 _mm_avg_epu16(__m128i __A, __m128i __B) argument
1399 _mm_sad_epu8(__m128i __A, __m128i __B) argument
1405 _mm_stream_si32(int *__A, int __B) argument
1411 _mm_stream_si128(__m128i *__A, __m128i __B) argument
1417 _mm_stream_pd(double *__A, __m128d __B) argument
1423 _mm_clflush(void const *__A) argument
1441 _mm_cvtsi32_si128(int __A) argument
1449 _mm_cvtsi64_si128(long long __A) argument
1456 _mm_cvtsi64x_si128(long long __A) argument
1465 _mm_castpd_ps(__m128d __A) argument
1471 _mm_castpd_si128(__m128d __A) argument
1477 _mm_castps_pd(__m128 __A) argument
1483 _mm_castps_si128(__m128 __A) argument
1489 _mm_castsi128_ps(__m128i __A) argument
1495 _mm_castsi128_pd(__m128i __A) argument
[all...]
H A Dxmmintrin.h103 _mm_add_ss (__m128 __A, __m128 __B) argument
105 return (__m128) __builtin_ia32_addss ((__v4sf)__A, (__v4sf)__B);
109 _mm_sub_ss (__m128 __A, __m128 __B) argument
111 return (__m128) __builtin_ia32_subss ((__v4sf)__A, (__v4sf)__B);
115 _mm_mul_ss (__m128 __A, __m128 __B) argument
117 return (__m128) __builtin_ia32_mulss ((__v4sf)__A, (__v4sf)__B);
121 _mm_div_ss (__m128 __A, __m128 __B) argument
123 return (__m128) __builtin_ia32_divss ((__v4sf)__A, (__v4sf)__B);
127 _mm_sqrt_ss (__m128 __A) argument
129 return (__m128) __builtin_ia32_sqrtss ((__v4sf)__A);
133 _mm_rcp_ss(__m128 __A) argument
139 _mm_rsqrt_ss(__m128 __A) argument
145 _mm_min_ss(__m128 __A, __m128 __B) argument
151 _mm_max_ss(__m128 __A, __m128 __B) argument
159 _mm_add_ps(__m128 __A, __m128 __B) argument
165 _mm_sub_ps(__m128 __A, __m128 __B) argument
171 _mm_mul_ps(__m128 __A, __m128 __B) argument
177 _mm_div_ps(__m128 __A, __m128 __B) argument
183 _mm_sqrt_ps(__m128 __A) argument
189 _mm_rcp_ps(__m128 __A) argument
195 _mm_rsqrt_ps(__m128 __A) argument
201 _mm_min_ps(__m128 __A, __m128 __B) argument
207 _mm_max_ps(__m128 __A, __m128 __B) argument
215 _mm_and_ps(__m128 __A, __m128 __B) argument
221 _mm_andnot_ps(__m128 __A, __m128 __B) argument
227 _mm_or_ps(__m128 __A, __m128 __B) argument
233 _mm_xor_ps(__m128 __A, __m128 __B) argument
243 _mm_cmpeq_ss(__m128 __A, __m128 __B) argument
249 _mm_cmplt_ss(__m128 __A, __m128 __B) argument
255 _mm_cmple_ss(__m128 __A, __m128 __B) argument
261 _mm_cmpgt_ss(__m128 __A, __m128 __B) argument
271 _mm_cmpge_ss(__m128 __A, __m128 __B) argument
281 _mm_cmpneq_ss(__m128 __A, __m128 __B) argument
287 _mm_cmpnlt_ss(__m128 __A, __m128 __B) argument
293 _mm_cmpnle_ss(__m128 __A, __m128 __B) argument
299 _mm_cmpngt_ss(__m128 __A, __m128 __B) argument
309 _mm_cmpnge_ss(__m128 __A, __m128 __B) argument
319 _mm_cmpord_ss(__m128 __A, __m128 __B) argument
325 _mm_cmpunord_ss(__m128 __A, __m128 __B) argument
335 _mm_cmpeq_ps(__m128 __A, __m128 __B) argument
341 _mm_cmplt_ps(__m128 __A, __m128 __B) argument
347 _mm_cmple_ps(__m128 __A, __m128 __B) argument
353 _mm_cmpgt_ps(__m128 __A, __m128 __B) argument
359 _mm_cmpge_ps(__m128 __A, __m128 __B) argument
365 _mm_cmpneq_ps(__m128 __A, __m128 __B) argument
371 _mm_cmpnlt_ps(__m128 __A, __m128 __B) argument
377 _mm_cmpnle_ps(__m128 __A, __m128 __B) argument
383 _mm_cmpngt_ps(__m128 __A, __m128 __B) argument
389 _mm_cmpnge_ps(__m128 __A, __m128 __B) argument
395 _mm_cmpord_ps(__m128 __A, __m128 __B) argument
401 _mm_cmpunord_ps(__m128 __A, __m128 __B) argument
410 _mm_comieq_ss(__m128 __A, __m128 __B) argument
416 _mm_comilt_ss(__m128 __A, __m128 __B) argument
422 _mm_comile_ss(__m128 __A, __m128 __B) argument
428 _mm_comigt_ss(__m128 __A, __m128 __B) argument
434 _mm_comige_ss(__m128 __A, __m128 __B) argument
440 _mm_comineq_ss(__m128 __A, __m128 __B) argument
446 _mm_ucomieq_ss(__m128 __A, __m128 __B) argument
452 _mm_ucomilt_ss(__m128 __A, __m128 __B) argument
458 _mm_ucomile_ss(__m128 __A, __m128 __B) argument
464 _mm_ucomigt_ss(__m128 __A, __m128 __B) argument
470 _mm_ucomige_ss(__m128 __A, __m128 __B) argument
476 _mm_ucomineq_ss(__m128 __A, __m128 __B) argument
484 _mm_cvtss_si32(__m128 __A) argument
490 _mm_cvt_ss2si(__m128 __A) argument
501 _mm_cvtss_si64(__m128 __A) argument
508 _mm_cvtss_si64x(__m128 __A) argument
517 _mm_cvtps_pi32(__m128 __A) argument
523 _mm_cvt_ps2pi(__m128 __A) argument
530 _mm_cvttss_si32(__m128 __A) argument
536 _mm_cvtt_ss2si(__m128 __A) argument
546 _mm_cvttss_si64(__m128 __A) argument
553 _mm_cvttss_si64x(__m128 __A) argument
562 _mm_cvttps_pi32(__m128 __A) argument
568 _mm_cvtt_ps2pi(__m128 __A) argument
575 _mm_cvtsi32_ss(__m128 __A, int __B) argument
581 _mm_cvt_si2ss(__m128 __A, int __B) argument
591 _mm_cvtsi64_ss(__m128 __A, long long __B) argument
598 _mm_cvtsi64x_ss(__m128 __A, long long __B) argument
607 _mm_cvtpi32_ps(__m128 __A, __m64 __B) argument
613 _mm_cvt_pi2ps(__m128 __A, __m64 __B) argument
620 _mm_cvtpi16_ps(__m64 __A) argument
646 _mm_cvtpu16_ps(__m64 __A) argument
666 _mm_cvtpi8_ps(__m64 __A) argument
683 _mm_cvtpu8_ps(__m64 __A) argument
691 _mm_cvtpi32x2_ps(__m64 __A, __m64 __B) argument
701 _mm_cvtps_pi16(__m128 __A) argument
712 _mm_cvtps_pi8(__m128 __A) argument
733 _mm_unpackhi_ps(__m128 __A, __m128 __B) argument
740 _mm_unpacklo_ps(__m128 __A, __m128 __B) argument
748 _mm_loadh_pi(__m128 __A, __m64 const *__P) argument
755 _mm_storeh_pi(__m64 *__P, __m128 __A) argument
762 _mm_movehl_ps(__m128 __A, __m128 __B) argument
769 _mm_movelh_ps(__m128 __A, __m128 __B) argument
777 _mm_loadl_pi(__m128 __A, __m64 const *__P) argument
784 _mm_storel_pi(__m64 *__P, __m128 __A) argument
791 _mm_movemask_ps(__m128 __A) argument
938 _mm_store_ss(float *__P, __m128 __A) argument
944 _mm_cvtss_f32(__m128 __A) argument
951 _mm_store_ps(float *__P, __m128 __A) argument
958 _mm_storeu_ps(float *__P, __m128 __A) argument
965 _mm_store1_ps(float *__P, __m128 __A) argument
973 _mm_store_ps1(float *__P, __m128 __A) argument
980 _mm_storer_ps(float *__P, __m128 __A) argument
989 _mm_move_ss(__m128 __A, __m128 __B) argument
1034 _mm_max_pi16(__m64 __A, __m64 __B) argument
1040 _m_pmaxsw(__m64 __A, __m64 __B) argument
1047 _mm_max_pu8(__m64 __A, __m64 __B) argument
1053 _m_pmaxub(__m64 __A, __m64 __B) argument
1060 _mm_min_pi16(__m64 __A, __m64 __B) argument
1066 _m_pminsw(__m64 __A, __m64 __B) argument
1073 _mm_min_pu8(__m64 __A, __m64 __B) argument
1079 _m_pminub(__m64 __A, __m64 __B) argument
1086 _mm_movemask_pi8(__m64 __A) argument
1092 _m_pmovmskb(__m64 __A) argument
1100 _mm_mulhi_pu16(__m64 __A, __m64 __B) argument
1106 _m_pmulhuw(__m64 __A, __m64 __B) argument
1135 _mm_maskmove_si64(__m64 __A, __m64 __N, char *__P) argument
1141 _m_maskmovq(__m64 __A, __m64 __N, char *__P) argument
1148 _mm_avg_pu8(__m64 __A, __m64 __B) argument
1154 _m_pavgb(__m64 __A, __m64 __B) argument
1161 _mm_avg_pu16(__m64 __A, __m64 __B) argument
1167 _m_pavgw(__m64 __A, __m64 __B) argument
1176 _mm_sad_pu8(__m64 __A, __m64 __B) argument
1182 _m_psadbw(__m64 __A, __m64 __B) argument
1202 _mm_stream_pi(__m64 *__P, __m64 __A) argument
1209 _mm_stream_ps(float *__P, __m128 __A) argument
[all...]
/openbsd-current/gnu/usr.bin/gcc/gcc/config/i386/
H A Dxmmintrin.h92 _mm_add_ss (__m128 __A, __m128 __B) argument
94 return (__m128) __builtin_ia32_addss ((__v4sf)__A, (__v4sf)__B);
98 _mm_sub_ss (__m128 __A, __m128 __B) argument
100 return (__m128) __builtin_ia32_subss ((__v4sf)__A, (__v4sf)__B);
104 _mm_mul_ss (__m128 __A, __m128 __B) argument
106 return (__m128) __builtin_ia32_mulss ((__v4sf)__A, (__v4sf)__B);
110 _mm_div_ss (__m128 __A, __m128 __B) argument
112 return (__m128) __builtin_ia32_divss ((__v4sf)__A, (__v4sf)__B);
116 _mm_sqrt_ss (__m128 __A) argument
118 return (__m128) __builtin_ia32_sqrtss ((__v4sf)__A);
122 _mm_rcp_ss(__m128 __A) argument
128 _mm_rsqrt_ss(__m128 __A) argument
134 _mm_min_ss(__m128 __A, __m128 __B) argument
140 _mm_max_ss(__m128 __A, __m128 __B) argument
148 _mm_add_ps(__m128 __A, __m128 __B) argument
154 _mm_sub_ps(__m128 __A, __m128 __B) argument
160 _mm_mul_ps(__m128 __A, __m128 __B) argument
166 _mm_div_ps(__m128 __A, __m128 __B) argument
172 _mm_sqrt_ps(__m128 __A) argument
178 _mm_rcp_ps(__m128 __A) argument
184 _mm_rsqrt_ps(__m128 __A) argument
190 _mm_min_ps(__m128 __A, __m128 __B) argument
196 _mm_max_ps(__m128 __A, __m128 __B) argument
204 _mm_and_ps(__m128 __A, __m128 __B) argument
210 _mm_andnot_ps(__m128 __A, __m128 __B) argument
216 _mm_or_ps(__m128 __A, __m128 __B) argument
222 _mm_xor_ps(__m128 __A, __m128 __B) argument
232 _mm_cmpeq_ss(__m128 __A, __m128 __B) argument
238 _mm_cmplt_ss(__m128 __A, __m128 __B) argument
244 _mm_cmple_ss(__m128 __A, __m128 __B) argument
250 _mm_cmpgt_ss(__m128 __A, __m128 __B) argument
260 _mm_cmpge_ss(__m128 __A, __m128 __B) argument
270 _mm_cmpneq_ss(__m128 __A, __m128 __B) argument
276 _mm_cmpnlt_ss(__m128 __A, __m128 __B) argument
282 _mm_cmpnle_ss(__m128 __A, __m128 __B) argument
288 _mm_cmpngt_ss(__m128 __A, __m128 __B) argument
298 _mm_cmpnge_ss(__m128 __A, __m128 __B) argument
308 _mm_cmpord_ss(__m128 __A, __m128 __B) argument
314 _mm_cmpunord_ss(__m128 __A, __m128 __B) argument
324 _mm_cmpeq_ps(__m128 __A, __m128 __B) argument
330 _mm_cmplt_ps(__m128 __A, __m128 __B) argument
336 _mm_cmple_ps(__m128 __A, __m128 __B) argument
342 _mm_cmpgt_ps(__m128 __A, __m128 __B) argument
348 _mm_cmpge_ps(__m128 __A, __m128 __B) argument
354 _mm_cmpneq_ps(__m128 __A, __m128 __B) argument
360 _mm_cmpnlt_ps(__m128 __A, __m128 __B) argument
366 _mm_cmpnle_ps(__m128 __A, __m128 __B) argument
372 _mm_cmpngt_ps(__m128 __A, __m128 __B) argument
378 _mm_cmpnge_ps(__m128 __A, __m128 __B) argument
384 _mm_cmpord_ps(__m128 __A, __m128 __B) argument
390 _mm_cmpunord_ps(__m128 __A, __m128 __B) argument
399 _mm_comieq_ss(__m128 __A, __m128 __B) argument
405 _mm_comilt_ss(__m128 __A, __m128 __B) argument
411 _mm_comile_ss(__m128 __A, __m128 __B) argument
417 _mm_comigt_ss(__m128 __A, __m128 __B) argument
423 _mm_comige_ss(__m128 __A, __m128 __B) argument
429 _mm_comineq_ss(__m128 __A, __m128 __B) argument
435 _mm_ucomieq_ss(__m128 __A, __m128 __B) argument
441 _mm_ucomilt_ss(__m128 __A, __m128 __B) argument
447 _mm_ucomile_ss(__m128 __A, __m128 __B) argument
453 _mm_ucomigt_ss(__m128 __A, __m128 __B) argument
459 _mm_ucomige_ss(__m128 __A, __m128 __B) argument
465 _mm_ucomineq_ss(__m128 __A, __m128 __B) argument
473 _mm_cvtss_si32(__m128 __A) argument
479 _mm_cvt_ss2si(__m128 __A) argument
488 _mm_cvtss_si64x(__m128 __A) argument
497 _mm_cvtps_pi32(__m128 __A) argument
503 _mm_cvt_ps2pi(__m128 __A) argument
510 _mm_cvttss_si32(__m128 __A) argument
516 _mm_cvtt_ss2si(__m128 __A) argument
524 _mm_cvttss_si64x(__m128 __A) argument
533 _mm_cvttps_pi32(__m128 __A) argument
539 _mm_cvtt_ps2pi(__m128 __A) argument
546 _mm_cvtsi32_ss(__m128 __A, int __B) argument
552 _mm_cvt_si2ss(__m128 __A, int __B) argument
560 _mm_cvtsi64x_ss(__m128 __A, long long __B) argument
569 _mm_cvtpi32_ps(__m128 __A, __m64 __B) argument
575 _mm_cvt_pi2ps(__m128 __A, __m64 __B) argument
582 _mm_cvtpi16_ps(__m64 __A) argument
609 _mm_cvtpu16_ps(__m64 __A) argument
630 _mm_cvtpi8_ps(__m64 __A) argument
648 _mm_cvtpu8_ps(__m64 __A) argument
657 _mm_cvtpi32x2_ps(__m64 __A, __m64 __B) argument
667 _mm_cvtps_pi16(__m128 __A) argument
678 _mm_cvtps_pi8(__m128 __A) argument
700 _mm_unpackhi_ps(__m128 __A, __m128 __B) argument
707 _mm_unpacklo_ps(__m128 __A, __m128 __B) argument
715 _mm_loadh_pi(__m128 __A, __m64 const *__P) argument
722 _mm_storeh_pi(__m64 *__P, __m128 __A) argument
729 _mm_movehl_ps(__m128 __A, __m128 __B) argument
736 _mm_movelh_ps(__m128 __A, __m128 __B) argument
744 _mm_loadl_pi(__m128 __A, __m64 const *__P) argument
751 _mm_storel_pi(__m64 *__P, __m128 __A) argument
758 _mm_movemask_ps(__m128 __A) argument
924 _mm_store_ss(float *__P, __m128 __A) argument
931 _mm_store1_ps(float *__P, __m128 __A) argument
939 _mm_store_ps1(float *__P, __m128 __A) argument
946 _mm_store_ps(float *__P, __m128 __A) argument
953 _mm_storeu_ps(float *__P, __m128 __A) argument
960 _mm_storer_ps(float *__P, __m128 __A) argument
969 _mm_move_ss(__m128 __A, __m128 __B) argument
1015 _mm_max_pi16(__m64 __A, __m64 __B) argument
1021 _m_pmaxsw(__m64 __A, __m64 __B) argument
1028 _mm_max_pu8(__m64 __A, __m64 __B) argument
1034 _m_pmaxub(__m64 __A, __m64 __B) argument
1041 _mm_min_pi16(__m64 __A, __m64 __B) argument
1047 _m_pminsw(__m64 __A, __m64 __B) argument
1054 _mm_min_pu8(__m64 __A, __m64 __B) argument
1060 _m_pminub(__m64 __A, __m64 __B) argument
1067 _mm_movemask_pi8(__m64 __A) argument
1073 _m_pmovmskb(__m64 __A) argument
1081 _mm_mulhi_pu16(__m64 __A, __m64 __B) argument
1087 _m_pmulhuw(__m64 __A, __m64 __B) argument
1116 _mm_maskmove_si64(__m64 __A, __m64 __N, char *__P) argument
1122 _m_maskmovq(__m64 __A, __m64 __N, char *__P) argument
1129 _mm_avg_pu8(__m64 __A, __m64 __B) argument
1135 _m_pavgb(__m64 __A, __m64 __B) argument
1142 _mm_avg_pu16(__m64 __A, __m64 __B) argument
1148 _m_pavgw(__m64 __A, __m64 __B) argument
1157 _mm_sad_pu8(__m64 __A, __m64 __B) argument
1163 _m_psadbw(__m64 __A, __m64 __B) argument
1183 _mm_stream_pi(__m64 *__P, __m64 __A) argument
1190 _mm_stream_ps(float *__P, __m128 __A) argument
[all...]
H A Demmintrin.h145 _mm_store_sd (double *__P, __m128d __A) argument
147 __builtin_ia32_storesd (__P, (__v2df)__A);
152 _mm_store1_pd (double *__P, __m128d __A) argument
154 __v2df __va = (__v2df)__A;
160 _mm_store_pd1 (double *__P, __m128d __A) argument
162 _mm_store1_pd (__P, __A);
167 _mm_store_pd (double *__P, __m128d __A) argument
169 __builtin_ia32_storeapd (__P, (__v2df)__A);
174 _mm_storeu_pd (double *__P, __m128d __A) argument
176 __builtin_ia32_storeupd (__P, (__v2df)__A);
181 _mm_storer_pd(double *__P, __m128d __A) argument
190 _mm_move_sd(__m128d __A, __m128d __B) argument
197 _mm_add_pd(__m128d __A, __m128d __B) argument
203 _mm_add_sd(__m128d __A, __m128d __B) argument
209 _mm_sub_pd(__m128d __A, __m128d __B) argument
215 _mm_sub_sd(__m128d __A, __m128d __B) argument
221 _mm_mul_pd(__m128d __A, __m128d __B) argument
227 _mm_mul_sd(__m128d __A, __m128d __B) argument
233 _mm_div_pd(__m128d __A, __m128d __B) argument
239 _mm_div_sd(__m128d __A, __m128d __B) argument
245 _mm_sqrt_pd(__m128d __A) argument
252 _mm_sqrt_sd(__m128d __A, __m128d __B) argument
259 _mm_min_pd(__m128d __A, __m128d __B) argument
265 _mm_min_sd(__m128d __A, __m128d __B) argument
271 _mm_max_pd(__m128d __A, __m128d __B) argument
277 _mm_max_sd(__m128d __A, __m128d __B) argument
283 _mm_and_pd(__m128d __A, __m128d __B) argument
289 _mm_andnot_pd(__m128d __A, __m128d __B) argument
295 _mm_or_pd(__m128d __A, __m128d __B) argument
301 _mm_xor_pd(__m128d __A, __m128d __B) argument
307 _mm_cmpeq_pd(__m128d __A, __m128d __B) argument
313 _mm_cmplt_pd(__m128d __A, __m128d __B) argument
319 _mm_cmple_pd(__m128d __A, __m128d __B) argument
325 _mm_cmpgt_pd(__m128d __A, __m128d __B) argument
331 _mm_cmpge_pd(__m128d __A, __m128d __B) argument
337 _mm_cmpneq_pd(__m128d __A, __m128d __B) argument
343 _mm_cmpnlt_pd(__m128d __A, __m128d __B) argument
349 _mm_cmpnle_pd(__m128d __A, __m128d __B) argument
355 _mm_cmpngt_pd(__m128d __A, __m128d __B) argument
361 _mm_cmpnge_pd(__m128d __A, __m128d __B) argument
367 _mm_cmpord_pd(__m128d __A, __m128d __B) argument
373 _mm_cmpunord_pd(__m128d __A, __m128d __B) argument
379 _mm_cmpeq_sd(__m128d __A, __m128d __B) argument
385 _mm_cmplt_sd(__m128d __A, __m128d __B) argument
391 _mm_cmple_sd(__m128d __A, __m128d __B) argument
397 _mm_cmpgt_sd(__m128d __A, __m128d __B) argument
407 _mm_cmpge_sd(__m128d __A, __m128d __B) argument
417 _mm_cmpneq_sd(__m128d __A, __m128d __B) argument
423 _mm_cmpnlt_sd(__m128d __A, __m128d __B) argument
429 _mm_cmpnle_sd(__m128d __A, __m128d __B) argument
435 _mm_cmpngt_sd(__m128d __A, __m128d __B) argument
445 _mm_cmpnge_sd(__m128d __A, __m128d __B) argument
455 _mm_cmpord_sd(__m128d __A, __m128d __B) argument
461 _mm_cmpunord_sd(__m128d __A, __m128d __B) argument
467 _mm_comieq_sd(__m128d __A, __m128d __B) argument
473 _mm_comilt_sd(__m128d __A, __m128d __B) argument
479 _mm_comile_sd(__m128d __A, __m128d __B) argument
485 _mm_comigt_sd(__m128d __A, __m128d __B) argument
491 _mm_comige_sd(__m128d __A, __m128d __B) argument
497 _mm_comineq_sd(__m128d __A, __m128d __B) argument
503 _mm_ucomieq_sd(__m128d __A, __m128d __B) argument
509 _mm_ucomilt_sd(__m128d __A, __m128d __B) argument
515 _mm_ucomile_sd(__m128d __A, __m128d __B) argument
521 _mm_ucomigt_sd(__m128d __A, __m128d __B) argument
527 _mm_ucomige_sd(__m128d __A, __m128d __B) argument
533 _mm_ucomineq_sd(__m128d __A, __m128d __B) argument
583 _mm_move_epi64(__m128i __A) argument
596 _mm_set_epi64(__m64 __A, __m64 __B) argument
692 _mm_set1_epi64(__m64 __A) argument
699 _mm_set1_epi32(int __A) argument
707 _mm_set1_epi64x(long long __A) argument
715 _mm_set1_epi16(short __A) argument
724 _mm_set1_epi8(char __A) argument
734 _mm_setr_epi64(__m64 __A, __m64 __B) argument
812 _mm_cvtepi32_pd(__m128i __A) argument
818 _mm_cvtepi32_ps(__m128i __A) argument
824 _mm_cvtpd_epi32(__m128d __A) argument
830 _mm_cvtpd_pi32(__m128d __A) argument
836 _mm_cvtpd_ps(__m128d __A) argument
842 _mm_cvttpd_epi32(__m128d __A) argument
848 _mm_cvttpd_pi32(__m128d __A) argument
854 _mm_cvtpi32_pd(__m64 __A) argument
860 _mm_cvtps_epi32(__m128 __A) argument
866 _mm_cvttps_epi32(__m128 __A) argument
872 _mm_cvtps_pd(__m128 __A) argument
878 _mm_cvtsd_si32(__m128d __A) argument
885 _mm_cvtsd_si64x(__m128d __A) argument
892 _mm_cvttsd_si32(__m128d __A) argument
899 _mm_cvttsd_si64x(__m128d __A) argument
906 _mm_cvtsd_ss(__m128 __A, __m128d __B) argument
912 _mm_cvtsi32_sd(__m128d __A, int __B) argument
919 _mm_cvtsi64x_sd(__m128d __A, long long __B) argument
926 _mm_cvtss_sd(__m128d __A, __m128 __B) argument
934 _mm_unpackhi_pd(__m128d __A, __m128d __B) argument
940 _mm_unpacklo_pd(__m128d __A, __m128d __B) argument
946 _mm_loadh_pd(__m128d __A, double const *__B) argument
952 _mm_storeh_pd(double *__A, __m128d __B) argument
958 _mm_loadl_pd(__m128d __A, double const *__B) argument
964 _mm_storel_pd(double *__A, __m128d __B) argument
970 _mm_movemask_pd(__m128d __A) argument
976 _mm_packs_epi16(__m128i __A, __m128i __B) argument
982 _mm_packs_epi32(__m128i __A, __m128i __B) argument
988 _mm_packus_epi16(__m128i __A, __m128i __B) argument
994 _mm_unpackhi_epi8(__m128i __A, __m128i __B) argument
1000 _mm_unpackhi_epi16(__m128i __A, __m128i __B) argument
1006 _mm_unpackhi_epi32(__m128i __A, __m128i __B) argument
1012 _mm_unpackhi_epi64(__m128i __A, __m128i __B) argument
1018 _mm_unpacklo_epi8(__m128i __A, __m128i __B) argument
1024 _mm_unpacklo_epi16(__m128i __A, __m128i __B) argument
1030 _mm_unpacklo_epi32(__m128i __A, __m128i __B) argument
1036 _mm_unpacklo_epi64(__m128i __A, __m128i __B) argument
1042 _mm_add_epi8(__m128i __A, __m128i __B) argument
1048 _mm_add_epi16(__m128i __A, __m128i __B) argument
1054 _mm_add_epi32(__m128i __A, __m128i __B) argument
1060 _mm_add_epi64(__m128i __A, __m128i __B) argument
1066 _mm_adds_epi8(__m128i __A, __m128i __B) argument
1072 _mm_adds_epi16(__m128i __A, __m128i __B) argument
1078 _mm_adds_epu8(__m128i __A, __m128i __B) argument
1084 _mm_adds_epu16(__m128i __A, __m128i __B) argument
1090 _mm_sub_epi8(__m128i __A, __m128i __B) argument
1096 _mm_sub_epi16(__m128i __A, __m128i __B) argument
1102 _mm_sub_epi32(__m128i __A, __m128i __B) argument
1108 _mm_sub_epi64(__m128i __A, __m128i __B) argument
1114 _mm_subs_epi8(__m128i __A, __m128i __B) argument
1120 _mm_subs_epi16(__m128i __A, __m128i __B) argument
1126 _mm_subs_epu8(__m128i __A, __m128i __B) argument
1132 _mm_subs_epu16(__m128i __A, __m128i __B) argument
1138 _mm_madd_epi16(__m128i __A, __m128i __B) argument
1144 _mm_mulhi_epi16(__m128i __A, __m128i __B) argument
1150 _mm_mullo_epi16(__m128i __A, __m128i __B) argument
1156 _mm_mul_su32(__m64 __A, __m64 __B) argument
1162 _mm_mul_epu32(__m128i __A, __m128i __B) argument
1168 _mm_sll_epi16(__m128i __A, __m128i __B) argument
1174 _mm_sll_epi32(__m128i __A, __m128i __B) argument
1180 _mm_sll_epi64(__m128i __A, __m128i __B) argument
1186 _mm_sra_epi16(__m128i __A, __m128i __B) argument
1192 _mm_sra_epi32(__m128i __A, __m128i __B) argument
1198 _mm_srl_epi16(__m128i __A, __m128i __B) argument
1204 _mm_srl_epi32(__m128i __A, __m128i __B) argument
1210 _mm_srl_epi64(__m128i __A, __m128i __B) argument
1216 _mm_slli_epi16(__m128i __A, int __B) argument
1222 _mm_slli_epi32(__m128i __A, int __B) argument
1228 _mm_slli_epi64(__m128i __A, int __B) argument
1234 _mm_srai_epi16(__m128i __A, int __B) argument
1240 _mm_srai_epi32(__m128i __A, int __B) argument
1262 _mm_srli_epi16(__m128i __A, int __B) argument
1268 _mm_srli_epi32(__m128i __A, int __B) argument
1274 _mm_srli_epi64(__m128i __A, int __B) argument
1280 _mm_and_si128(__m128i __A, __m128i __B) argument
1286 _mm_andnot_si128(__m128i __A, __m128i __B) argument
1292 _mm_or_si128(__m128i __A, __m128i __B) argument
1298 _mm_xor_si128(__m128i __A, __m128i __B) argument
1304 _mm_cmpeq_epi8(__m128i __A, __m128i __B) argument
1310 _mm_cmpeq_epi16(__m128i __A, __m128i __B) argument
1316 _mm_cmpeq_epi32(__m128i __A, __m128i __B) argument
1322 _mm_cmplt_epi8(__m128i __A, __m128i __B) argument
1328 _mm_cmplt_epi16(__m128i __A, __m128i __B) argument
1334 _mm_cmplt_epi32(__m128i __A, __m128i __B) argument
1340 _mm_cmpgt_epi8(__m128i __A, __m128i __B) argument
1346 _mm_cmpgt_epi16(__m128i __A, __m128i __B) argument
1352 _mm_cmpgt_epi32(__m128i __A, __m128i __B) argument
1362 _mm_max_epi16(__m128i __A, __m128i __B) argument
1368 _mm_max_epu8(__m128i __A, __m128i __B) argument
1374 _mm_min_epi16(__m128i __A, __m128i __B) argument
1380 _mm_min_epu8(__m128i __A, __m128i __B) argument
1386 _mm_movemask_epi8(__m128i __A) argument
1392 _mm_mulhi_epu16(__m128i __A, __m128i __B) argument
1402 _mm_maskmoveu_si128(__m128i __A, __m128i __B, char *__C) argument
1408 _mm_avg_epu8(__m128i __A, __m128i __B) argument
1414 _mm_avg_epu16(__m128i __A, __m128i __B) argument
1420 _mm_sad_epu8(__m128i __A, __m128i __B) argument
1426 _mm_stream_si32(int *__A, int __B) argument
1432 _mm_stream_si128(__m128i *__A, __m128i __B) argument
1438 _mm_stream_pd(double *__A, __m128d __B) argument
1444 _mm_movpi64_epi64(__m64 __A) argument
1450 _mm_clflush(void const *__A) argument
1468 _mm_cvtsi32_si128(int __A) argument
1475 _mm_cvtsi64x_si128(long long __A) argument
1482 _mm_cvtsi128_si32(__m128i __A) argument
1491 _mm_cvtsi128_si64x(__m128i __A) argument
[all...]
/openbsd-current/gnu/llvm/clang/lib/Headers/ppc_wrappers/
H A Demmintrin.h124 _mm_move_sd(__m128d __A, __m128d __B) { argument
125 __v2df __result = (__v2df)__A;
175 _mm_store_pd(double *__P, __m128d __A) { argument
176 vec_st((__v16qu)__A, 0, (__v16qu *)__P);
182 _mm_storeu_pd(double *__P, __m128d __A) { argument
183 *(__m128d_u *)__P = __A;
189 _mm_store_sd(double *__P, __m128d __A) { argument
190 *__P = ((__v2df)__A)[0];
195 _mm_cvtsd_f64(__m128d __A) { argument
196 return ((__v2df)__A)[
201 _mm_storel_pd(double *__P, __m128d __A) argument
208 _mm_storeh_pd(double *__P, __m128d __A) argument
215 _mm_store1_pd(double *__P, __m128d __A) argument
221 _mm_store_pd1(double *__P, __m128d __A) argument
228 _mm_storer_pd(double *__P, __m128d __A) argument
235 _mm_cvtsi128_si64(__m128i __A) argument
242 _mm_cvtsi128_si64x(__m128i __A) argument
248 _mm_add_pd(__m128d __A, __m128d __B) argument
257 _mm_add_sd(__m128d __A, __m128d __B) argument
264 _mm_sub_pd(__m128d __A, __m128d __B) argument
270 _mm_sub_sd(__m128d __A, __m128d __B) argument
277 _mm_mul_pd(__m128d __A, __m128d __B) argument
283 _mm_mul_sd(__m128d __A, __m128d __B) argument
290 _mm_div_pd(__m128d __A, __m128d __B) argument
296 _mm_div_sd(__m128d __A, __m128d __B) argument
303 _mm_sqrt_pd(__m128d __A) argument
310 _mm_sqrt_sd(__m128d __A, __m128d __B) argument
318 _mm_min_pd(__m128d __A, __m128d __B) argument
324 _mm_min_sd(__m128d __A, __m128d __B) argument
334 _mm_max_pd(__m128d __A, __m128d __B) argument
340 _mm_max_sd(__m128d __A, __m128d __B) argument
350 _mm_cmpeq_pd(__m128d __A, __m128d __B) argument
356 _mm_cmplt_pd(__m128d __A, __m128d __B) argument
362 _mm_cmple_pd(__m128d __A, __m128d __B) argument
368 _mm_cmpgt_pd(__m128d __A, __m128d __B) argument
374 _mm_cmpge_pd(__m128d __A, __m128d __B) argument
380 _mm_cmpneq_pd(__m128d __A, __m128d __B) argument
387 _mm_cmpnlt_pd(__m128d __A, __m128d __B) argument
393 _mm_cmpnle_pd(__m128d __A, __m128d __B) argument
399 _mm_cmpngt_pd(__m128d __A, __m128d __B) argument
405 _mm_cmpnge_pd(__m128d __A, __m128d __B) argument
411 _mm_cmpord_pd(__m128d __A, __m128d __B) argument
422 _mm_cmpunord_pd(__m128d __A, __m128d __B) argument
446 _mm_cmpeq_sd(__m128d __A, __m128d __B) argument
462 _mm_cmplt_sd(__m128d __A, __m128d __B) argument
472 _mm_cmple_sd(__m128d __A, __m128d __B) argument
482 _mm_cmpgt_sd(__m128d __A, __m128d __B) argument
492 _mm_cmpge_sd(__m128d __A, __m128d __B) argument
502 _mm_cmpneq_sd(__m128d __A, __m128d __B) argument
513 _mm_cmpnlt_sd(__m128d __A, __m128d __B) argument
524 _mm_cmpnle_sd(__m128d __A, __m128d __B) argument
535 _mm_cmpngt_sd(__m128d __A, __m128d __B) argument
546 _mm_cmpnge_sd(__m128d __A, __m128d __B) argument
557 _mm_cmpord_sd(__m128d __A, __m128d __B) argument
565 _mm_cmpunord_sd(__m128d __A, __m128d __B) argument
580 _mm_comieq_sd(__m128d __A, __m128d __B) argument
586 _mm_comilt_sd(__m128d __A, __m128d __B) argument
592 _mm_comile_sd(__m128d __A, __m128d __B) argument
598 _mm_comigt_sd(__m128d __A, __m128d __B) argument
604 _mm_comige_sd(__m128d __A, __m128d __B) argument
610 _mm_comineq_sd(__m128d __A, __m128d __B) argument
616 _mm_ucomieq_sd(__m128d __A, __m128d __B) argument
622 _mm_ucomilt_sd(__m128d __A, __m128d __B) argument
628 _mm_ucomile_sd(__m128d __A, __m128d __B) argument
634 _mm_ucomigt_sd(__m128d __A, __m128d __B) argument
640 _mm_ucomige_sd(__m128d __A, __m128d __B) argument
646 _mm_ucomineq_sd(__m128d __A, __m128d __B) argument
691 _mm_set1_epi64x(long long __A) argument
697 _mm_set1_epi64(__m64 __A) argument
703 _mm_set1_epi32(int __A) argument
709 _mm_set1_epi16(short __A) argument
715 _mm_set1_epi8(char __A) argument
796 _mm_movpi64_epi64(__m64 __A) argument
802 _mm_move_epi64(__m128i __A) argument
824 _mm_cvtepi32_pd(__m128i __A) argument
836 _mm_cvtepi32_ps(__m128i __A) argument
842 _mm_cvtpd_epi32(__m128d __A) argument
871 _mm_cvtpd_pi32(__m128d __A) argument
879 _mm_cvtpd_ps(__m128d __A) argument
906 _mm_cvttpd_epi32(__m128d __A) argument
936 _mm_cvttpd_pi32(__m128d __A) argument
944 _mm_cvtsi128_si32(__m128i __A) argument
951 _mm_cvtpi32_pd(__m64 __A) argument
965 _mm_cvtps_epi32(__m128 __A) argument
976 _mm_cvttps_epi32(__m128 __A) argument
985 _mm_cvtps_pd(__m128 __A) argument
1016 _mm_cvtsd_si32(__m128d __A) argument
1025 _mm_cvtsd_si64(__m128d __A) argument
1035 _mm_cvtsd_si64x(__m128d __A) argument
1041 _mm_cvttsd_si32(__m128d __A) argument
1050 _mm_cvttsd_si64(__m128d __A) argument
1059 _mm_cvttsd_si64x(__m128d __A) argument
1065 _mm_cvtsd_ss(__m128 __A, __m128d __B) argument
1087 _mm_cvtsi32_sd(__m128d __A, int __B) argument
1097 _mm_cvtsi64_sd(__m128d __A, long long __B) argument
1107 _mm_cvtsi64x_sd(__m128d __A, long long __B) argument
1113 _mm_cvtss_sd(__m128d __A, __m128 __B) argument
1130 _mm_shuffle_pd(__m128d __A, __m128d __B, const int __mask) argument
1155 _mm_unpackhi_pd(__m128d __A, __m128d __B) argument
1161 _mm_unpacklo_pd(__m128d __A, __m128d __B) argument
1167 _mm_loadh_pd(__m128d __A, double const *__B) argument
1175 _mm_loadl_pd(__m128d __A, double const *__B) argument
1187 _mm_movemask_pd(__m128d __A) argument
1214 _mm_packs_epi16(__m128i __A, __m128i __B) argument
1220 _mm_packs_epi32(__m128i __A, __m128i __B) argument
1226 _mm_packus_epi16(__m128i __A, __m128i __B) argument
1232 _mm_unpackhi_epi8(__m128i __A, __m128i __B) argument
1238 _mm_unpackhi_epi16(__m128i __A, __m128i __B) argument
1244 _mm_unpackhi_epi32(__m128i __A, __m128i __B) argument
1250 _mm_unpackhi_epi64(__m128i __A, __m128i __B) argument
1256 _mm_unpacklo_epi8(__m128i __A, __m128i __B) argument
1262 _mm_unpacklo_epi16(__m128i __A, __m128i __B) argument
1268 _mm_unpacklo_epi32(__m128i __A, __m128i __B) argument
1274 _mm_unpacklo_epi64(__m128i __A, __m128i __B) argument
1280 _mm_add_epi8(__m128i __A, __m128i __B) argument
1286 _mm_add_epi16(__m128i __A, __m128i __B) argument
1292 _mm_add_epi32(__m128i __A, __m128i __B) argument
1298 _mm_add_epi64(__m128i __A, __m128i __B) argument
1304 _mm_adds_epi8(__m128i __A, __m128i __B) argument
1310 _mm_adds_epi16(__m128i __A, __m128i __B) argument
1316 _mm_adds_epu8(__m128i __A, __m128i __B) argument
1322 _mm_adds_epu16(__m128i __A, __m128i __B) argument
1328 _mm_sub_epi8(__m128i __A, __m128i __B) argument
1334 _mm_sub_epi16(__m128i __A, __m128i __B) argument
1340 _mm_sub_epi32(__m128i __A, __m128i __B) argument
1346 _mm_sub_epi64(__m128i __A, __m128i __B) argument
1352 _mm_subs_epi8(__m128i __A, __m128i __B) argument
1358 _mm_subs_epi16(__m128i __A, __m128i __B) argument
1364 _mm_subs_epu8(__m128i __A, __m128i __B) argument
1370 _mm_subs_epu16(__m128i __A, __m128i __B) argument
1376 _mm_madd_epi16(__m128i __A, __m128i __B) argument
1384 _mm_mulhi_epi16(__m128i __A, __m128i __B) argument
1404 _mm_mullo_epi16(__m128i __A, __m128i __B) argument
1410 _mm_mul_su32(__m64 __A, __m64 __B) argument
1420 _mm_mul_epu32(__m128i __A, __m128i __B) argument
1440 _mm_slli_epi16(__m128i __A, int __B) argument
1458 _mm_slli_epi32(__m128i __A, int __B) argument
1477 _mm_slli_epi64(__m128i __A, int __B) argument
1496 _mm_srai_epi16(__m128i __A, int __B) argument
1513 _mm_srai_epi32(__m128i __A, int __B) argument
1533 _mm_bslli_si128(__m128i __A, const int __N) argument
1547 _mm_bsrli_si128(__m128i __A, const int __N) argument
1576 _mm_srli_si128(__m128i __A, const int __N) argument
1582 _mm_slli_si128(__m128i __A, const int _imm5) argument
1601 _mm_srli_epi16(__m128i __A, int __B) argument
1619 _mm_srli_epi32(__m128i __A, int __B) argument
1641 _mm_srli_epi64(__m128i __A, int __B) argument
1663 _mm_sll_epi16(__m128i __A, __m128i __B) argument
1683 _mm_sll_epi32(__m128i __A, __m128i __B) argument
1703 _mm_sll_epi64(__m128i __A, __m128i __B) argument
1720 _mm_sra_epi16(__m128i __A, __m128i __B) argument
1738 _mm_sra_epi32(__m128i __A, __m128i __B) argument
1756 _mm_srl_epi16(__m128i __A, __m128i __B) argument
1776 _mm_srl_epi32(__m128i __A, __m128i __B) argument
1797 _mm_srl_epi64(__m128i __A, __m128i __B) argument
1814 _mm_and_pd(__m128d __A, __m128d __B) argument
1820 _mm_andnot_pd(__m128d __A, __m128d __B) argument
1826 _mm_or_pd(__m128d __A, __m128d __B) argument
1832 _mm_xor_pd(__m128d __A, __m128d __B) argument
1838 _mm_and_si128(__m128i __A, __m128i __B) argument
1844 _mm_andnot_si128(__m128i __A, __m128i __B) argument
1850 _mm_or_si128(__m128i __A, __m128i __B) argument
1856 _mm_xor_si128(__m128i __A, __m128i __B) argument
1862 _mm_cmpeq_epi8(__m128i __A, __m128i __B) argument
1868 _mm_cmpeq_epi16(__m128i __A, __m128i __B) argument
1874 _mm_cmpeq_epi32(__m128i __A, __m128i __B) argument
1880 _mm_cmplt_epi8(__m128i __A, __m128i __B) argument
1886 _mm_cmplt_epi16(__m128i __A, __m128i __B) argument
1892 _mm_cmplt_epi32(__m128i __A, __m128i __B) argument
1898 _mm_cmpgt_epi8(__m128i __A, __m128i __B) argument
1904 _mm_cmpgt_epi16(__m128i __A, __m128i __B) argument
1910 _mm_cmpgt_epi32(__m128i __A, __m128i __B) argument
1916 _mm_extract_epi16(__m128i const __A, int const __N) argument
1922 _mm_insert_epi16(__m128i const __A, int const __D, int const __N) argument
1932 _mm_max_epi16(__m128i __A, __m128i __B) argument
1938 _mm_max_epu8(__m128i __A, __m128i __B) argument
1944 _mm_min_epi16(__m128i __A, __m128i __B) argument
1950 _mm_min_epu8(__m128i __A, __m128i __B) argument
1961 _mm_movemask_epi8(__m128i __A) argument
1984 _mm_mulhi_epu16(__m128i __A, __m128i __B) argument
2003 _mm_shufflehi_epi16(__m128i __A, const int __mask) argument
2036 _mm_shufflelo_epi16(__m128i __A, const int __mask) argument
2068 _mm_shuffle_epi32(__m128i __A, const int __mask) argument
2092 _mm_maskmoveu_si128(__m128i __A, __m128i __B, char *__C) argument
2105 _mm_avg_epu8(__m128i __A, __m128i __B) argument
2111 _mm_avg_epu16(__m128i __A, __m128i __B) argument
2117 _mm_sad_epu8(__m128i __A, __m128i __B) argument
2155 _mm_stream_si32(int *__A, int __B) argument
2163 _mm_stream_si64(long long int *__A, long long int __B) argument
2171 _mm_stream_si128(__m128i *__A, __m128i __B) argument
2179 _mm_stream_pd(double *__A, __m128d __B) argument
2187 _mm_clflush(void const *__A) argument
2208 _mm_cvtsi32_si128(int __A) argument
2214 _mm_cvtsi64_si128(long long __A) argument
2221 _mm_cvtsi64x_si128(long long __A) argument
2229 _mm_castpd_ps(__m128d __A) argument
2235 _mm_castpd_si128(__m128d __A) argument
2241 _mm_castps_pd(__m128 __A) argument
2247 _mm_castps_si128(__m128 __A) argument
2253 _mm_castsi128_ps(__m128i __A) argument
2259 _mm_castsi128_pd(__m128i __A) argument
[all...]
H A Dxmmintrin.h149 _mm_store_ps(float *__P, __m128 __A) { argument
150 vec_st((__v4sf)__A, 0, (__v4sf *)__P);
156 _mm_storeu_ps(float *__P, __m128 __A) { argument
157 *(__m128_u *)__P = __A;
163 _mm_storer_ps(float *__P, __m128 __A) { argument
169 __tmp = (__m128)vec_perm(__A, __A, __permute_vector);
177 _mm_store1_ps(float *__P, __m128 __A) { argument
178 __v4sf __va = vec_splat((__v4sf)__A, 0);
184 _mm_store_ps1(float *__P, __m128 __A) { argument
198 _mm_move_ss(__m128 __A, __m128 __B) argument
214 _mm_store_ss(float *__P, __m128 __A) argument
224 _mm_add_ss(__m128 __A, __m128 __B) argument
246 _mm_sub_ss(__m128 __A, __m128 __B) argument
268 _mm_mul_ss(__m128 __A, __m128 __B) argument
290 _mm_div_ss(__m128 __A, __m128 __B) argument
312 _mm_sqrt_ss(__m128 __A) argument
329 _mm_add_ps(__m128 __A, __m128 __B) argument
335 _mm_sub_ps(__m128 __A, __m128 __B) argument
341 _mm_mul_ps(__m128 __A, __m128 __B) argument
347 _mm_div_ps(__m128 __A, __m128 __B) argument
353 _mm_sqrt_ps(__m128 __A) argument
359 _mm_rcp_ps(__m128 __A) argument
365 _mm_rsqrt_ps(__m128 __A) argument
371 _mm_rcp_ss(__m128 __A) argument
387 _mm_rsqrt_ss(__m128 __A) argument
403 _mm_min_ss(__m128 __A, __m128 __B) argument
420 _mm_max_ss(__m128 __A, __m128 __B) argument
437 _mm_min_ps(__m128 __A, __m128 __B) argument
444 _mm_max_ps(__m128 __A, __m128 __B) argument
452 _mm_and_ps(__m128 __A, __m128 __B) argument
459 _mm_andnot_ps(__m128 __A, __m128 __B) argument
465 _mm_or_ps(__m128 __A, __m128 __B) argument
471 _mm_xor_ps(__m128 __A, __m128 __B) argument
480 _mm_cmpeq_ps(__m128 __A, __m128 __B) argument
486 _mm_cmplt_ps(__m128 __A, __m128 __B) argument
492 _mm_cmple_ps(__m128 __A, __m128 __B) argument
498 _mm_cmpgt_ps(__m128 __A, __m128 __B) argument
504 _mm_cmpge_ps(__m128 __A, __m128 __B) argument
510 _mm_cmpneq_ps(__m128 __A, __m128 __B) argument
517 _mm_cmpnlt_ps(__m128 __A, __m128 __B) argument
523 _mm_cmpnle_ps(__m128 __A, __m128 __B) argument
529 _mm_cmpngt_ps(__m128 __A, __m128 __B) argument
535 _mm_cmpnge_ps(__m128 __A, __m128 __B) argument
541 _mm_cmpord_ps(__m128 __A, __m128 __B) argument
556 _mm_cmpunord_ps(__m128 __A, __m128 __B) argument
574 _mm_cmpeq_ss(__m128 __A, __m128 __B) argument
591 _mm_cmplt_ss(__m128 __A, __m128 __B) argument
608 _mm_cmple_ss(__m128 __A, __m128 __B) argument
625 _mm_cmpgt_ss(__m128 __A, __m128 __B) argument
642 _mm_cmpge_ss(__m128 __A, __m128 __B) argument
659 _mm_cmpneq_ss(__m128 __A, __m128 __B) argument
677 _mm_cmpnlt_ss(__m128 __A, __m128 __B) argument
694 _mm_cmpnle_ss(__m128 __A, __m128 __B) argument
711 _mm_cmpngt_ss(__m128 __A, __m128 __B) argument
728 _mm_cmpnge_ss(__m128 __A, __m128 __B) argument
745 _mm_cmpord_ss(__m128 __A, __m128 __B) argument
764 _mm_cmpunord_ss(__m128 __A, __m128 __B) argument
785 _mm_comieq_ss(__m128 __A, __m128 __B) argument
791 _mm_comilt_ss(__m128 __A, __m128 __B) argument
797 _mm_comile_ss(__m128 __A, __m128 __B) argument
803 _mm_comigt_ss(__m128 __A, __m128 __B) argument
809 _mm_comige_ss(__m128 __A, __m128 __B) argument
815 _mm_comineq_ss(__m128 __A, __m128 __B) argument
829 _mm_ucomieq_ss(__m128 __A, __m128 __B) argument
835 _mm_ucomilt_ss(__m128 __A, __m128 __B) argument
841 _mm_ucomile_ss(__m128 __A, __m128 __B) argument
847 _mm_ucomigt_ss(__m128 __A, __m128 __B) argument
853 _mm_ucomige_ss(__m128 __A, __m128 __B) argument
859 _mm_ucomineq_ss(__m128 __A, __m128 __B) argument
865 _mm_cvtss_f32(__m128 __A) argument
873 _mm_cvtss_si32(__m128 __A) argument
894 _mm_cvt_ss2si(__m128 __A) argument
904 _mm_cvtss_si64(__m128 __A) argument
926 _mm_cvtss_si64x(__m128 __A) argument
954 _mm_cvtps_pi32(__m128 __A) argument
969 _mm_cvt_ps2pi(__m128 __A) argument
976 _mm_cvttss_si32(__m128 __A) argument
985 _mm_cvtt_ss2si(__m128 __A) argument
992 _mm_cvttss_si64(__m128 __A) argument
1002 _mm_cvttss_si64x(__m128 __A) argument
1013 _mm_cvttps_pi32(__m128 __A) argument
1026 _mm_cvtt_ps2pi(__m128 __A) argument
1033 _mm_cvtsi32_ss(__m128 __A, int __B) argument
1042 _mm_cvt_si2ss(__m128 __A, int __B) argument
1050 _mm_cvtsi64_ss(__m128 __A, long long __B) argument
1060 _mm_cvtsi64x_ss(__m128 __A, long long __B) argument
1068 _mm_cvtpi32_ps(__m128 __A, __m64 __B) argument
1082 _mm_cvt_pi2ps(__m128 __A, __m64 __B) argument
1089 _mm_cvtpi16_ps(__m64 __A) argument
1104 _mm_cvtpu16_ps(__m64 __A) argument
1125 _mm_cvtpi8_ps(__m64 __A) argument
1143 _mm_cvtpu8_ps(__m64 __A) argument
1168 _mm_cvtpi32x2_ps(__m64 __A, __m64 __B) argument
1180 _mm_cvtps_pi16(__m128 __A) argument
1195 _mm_cvtps_pi8(__m128 __A) argument
1213 _mm_shuffle_ps(__m128 __A, __m128 __B, int const __mask) argument
1237 _mm_unpackhi_ps(__m128 __A, __m128 __B) argument
1244 _mm_unpacklo_ps(__m128 __A, __m128 __B) argument
1252 _mm_loadh_pi(__m128 __A, __m64 const *__P) argument
1263 _mm_storeh_pi(__m64 *__P, __m128 __A) argument
1272 _mm_movehl_ps(__m128 __A, __m128 __B) argument
1280 _mm_movelh_ps(__m128 __A, __m128 __B) argument
1289 _mm_loadl_pi(__m128 __A, __m64 const *__P) argument
1300 _mm_storel_pi(__m64 *__P, __m128 __A) argument
1312 _mm_movemask_ps(__m128 __A) argument
1353 _mm_extract_pi16(__m64 const __A, int const __N) argument
1364 _m_pextrw(__m64 const __A, int const __N) argument
1372 _mm_insert_pi16(__m64 const __A, int const __D, int const __N) argument
1383 _m_pinsrw(__m64 const __A, int const __D, int const __N) argument
1391 _mm_max_pi16(__m64 __A, __m64 __B) argument
1422 _m_pmaxsw(__m64 __A, __m64 __B) argument
1429 _mm_max_pu8(__m64 __A, __m64 __B) argument
1458 _m_pmaxub(__m64 __A, __m64 __B) argument
1465 _mm_min_pi16(__m64 __A, __m64 __B) argument
1496 _m_pminsw(__m64 __A, __m64 __B) argument
1503 _mm_min_pu8(__m64 __A, __m64 __B) argument
1532 _m_pminub(__m64 __A, __m64 __B) argument
1539 _mm_movemask_pi8(__m64 __A) argument
1564 _m_pmovmskb(__m64 __A) argument
1572 _mm_mulhi_pu16(__m64 __A, __m64 __B) argument
1598 _m_pmulhuw(__m64 __A, __m64 __B) argument
1606 _mm_shuffle_pi16(__m64 __A, int const __N) argument
1640 _m_pshufw(__m64 __A, int const __N) argument
1649 _mm_maskmove_si64(__m64 __A, __m64 __N, char *__P) argument
1662 _m_maskmovq(__m64 __A, __m64 __N, char *__P) argument
1669 _mm_avg_pu8(__m64 __A, __m64 __B) argument
1680 _m_pavgb(__m64 __A, __m64 __B) argument
1687 _mm_avg_pu16(__m64 __A, __m64 __B) argument
1698 _m_pavgw(__m64 __A, __m64 __B) argument
1707 _mm_sad_pu8(__m64 __A, __m64 __B) argument
1731 _m_psadbw(__m64 __A, __m64 __B) argument
1738 _mm_stream_pi(__m64 *__P, __m64 __A) argument
1747 _mm_stream_ps(float *__P, __m128 __A) argument
[all...]

Completed in 578 milliseconds

12