/freebsd-current/contrib/llvm-project/clang/lib/Headers/ |
H A D | raointintrin.h | 20 /// Atomically add a 32-bit value at memory operand \a __A and a 32-bit \a __B, 30 /// \param __A 36 /// MEM[__A+31:__A] := MEM[__A+31:__A] + __B[31:0] 38 static __inline__ void __DEFAULT_FN_ATTRS _aadd_i32(int *__A, int __B) { argument 39 __builtin_ia32_aadd32((int *)__A, __B); 42 /// Atomically and a 32-bit value at memory operand \a __A and a 32-bit \a __B, 52 /// \param __A 60 _aand_i32(int *__A, int __B) argument 82 _aor_i32(int *__A, int __B) argument 104 _axor_i32(int *__A, int __B) argument 127 _aadd_i64(long long *__A, long long __B) argument 150 _aand_i64(long long *__A, long long __B) argument 173 _aor_i64(long long *__A, long long __B) argument 196 _axor_i64(long long *__A, long long __B) argument [all...] |
H A D | avxneconvertintrin.h | 29 /// stored at memory locations starting at location \a __A to a 37 /// _mm_bcstnebf16_ps(const void *__A); 42 /// \param __A 49 /// b := Convert_BF16_To_FP32(MEM[__A+15:__A]) 57 _mm_bcstnebf16_ps(const void *__A) { argument 58 return (__m128)__builtin_ia32_vbcstnebf162ps128((const __bf16 *)__A); 62 /// stored at memory locations starting at location \a __A to a 70 /// _mm256_bcstnebf16_ps(const void *__A); 75 /// \param __A 90 _mm256_bcstnebf16_ps(const void *__A) argument 123 _mm_bcstnesh_ps(const void *__A) argument 156 _mm256_bcstnesh_ps(const void *__A) argument 189 _mm_cvtneebf16_ps(const __m128bh *__A) argument 222 _mm256_cvtneebf16_ps(const __m256bh *__A) argument 255 _mm_cvtneeph_ps(const __m128h *__A) argument 288 _mm256_cvtneeph_ps(const __m256h *__A) argument 321 _mm_cvtneobf16_ps(const __m128bh *__A) argument 354 _mm256_cvtneobf16_ps(const __m256bh *__A) argument 387 _mm_cvtneoph_ps(const __m128h *__A) argument 420 _mm256_cvtneoph_ps(const __m256h *__A) argument 448 _mm_cvtneps_avx_pbh(__m128 __A) argument 476 _mm256_cvtneps_avx_pbh(__m256 __A) argument [all...] |
H A D | popcntintrin.h | 28 /// \param __A 33 _mm_popcnt_u32(unsigned int __A) argument 35 return __builtin_popcount(__A); 45 /// \param __A 50 _mm_popcnt_u64(unsigned long long __A) argument 52 return __builtin_popcountll(__A);
|
H A D | usermsrintrin.h | 17 /// Reads the contents of a 64-bit MSR specified in \a __A into \a dst. 20 /// \param __A 24 /// DEST := MSR[__A] 28 _urdmsr(unsigned long long __A) { argument 29 return __builtin_ia32_urdmsr(__A); 32 /// Writes the contents of \a __B into the 64-bit MSR specified in \a __A. 36 /// \param __A 42 /// MSR[__A] := __B 46 _uwrmsr(unsigned long long __A, unsigned long long __B) { argument 47 return __builtin_ia32_uwrmsr(__A, __ [all...] |
H A D | avx512cdintrin.h | 23 _mm512_conflict_epi64 (__m512i __A) argument 25 return (__m512i) __builtin_ia32_vpconflictdi_512 ((__v8di) __A); 29 _mm512_mask_conflict_epi64 (__m512i __W, __mmask8 __U, __m512i __A) argument 32 (__v8di)_mm512_conflict_epi64(__A), 37 _mm512_maskz_conflict_epi64 (__mmask8 __U, __m512i __A) argument 40 (__v8di)_mm512_conflict_epi64(__A), 45 _mm512_conflict_epi32 (__m512i __A) argument 47 return (__m512i) __builtin_ia32_vpconflictsi_512 ((__v16si) __A); 51 _mm512_mask_conflict_epi32 (__m512i __W, __mmask16 __U, __m512i __A) argument 54 (__v16si)_mm512_conflict_epi32(__A), 59 _mm512_maskz_conflict_epi32(__mmask16 __U, __m512i __A) argument 67 _mm512_lzcnt_epi32(__m512i __A) argument 73 _mm512_mask_lzcnt_epi32(__m512i __W, __mmask16 __U, __m512i __A) argument 81 _mm512_maskz_lzcnt_epi32(__mmask16 __U, __m512i __A) argument 89 _mm512_lzcnt_epi64(__m512i __A) argument 95 _mm512_mask_lzcnt_epi64(__m512i __W, __mmask8 __U, __m512i __A) argument 103 _mm512_maskz_lzcnt_epi64(__mmask8 __U, __m512i __A) argument 111 _mm512_broadcastmb_epi64(__mmask8 __A) argument 117 _mm512_broadcastmw_epi32(__mmask16 __A) argument [all...] |
H A D | xopintrin.h | 24 _mm_maccs_epi16(__m128i __A, __m128i __B, __m128i __C) argument 26 return (__m128i)__builtin_ia32_vpmacssww((__v8hi)__A, (__v8hi)__B, (__v8hi)__C); 30 _mm_macc_epi16(__m128i __A, __m128i __B, __m128i __C) argument 32 return (__m128i)__builtin_ia32_vpmacsww((__v8hi)__A, (__v8hi)__B, (__v8hi)__C); 36 _mm_maccsd_epi16(__m128i __A, __m128i __B, __m128i __C) argument 38 return (__m128i)__builtin_ia32_vpmacsswd((__v8hi)__A, (__v8hi)__B, (__v4si)__C); 42 _mm_maccd_epi16(__m128i __A, __m128i __B, __m128i __C) argument 44 return (__m128i)__builtin_ia32_vpmacswd((__v8hi)__A, (__v8hi)__B, (__v4si)__C); 48 _mm_maccs_epi32(__m128i __A, __m128i __B, __m128i __C) argument 50 return (__m128i)__builtin_ia32_vpmacssdd((__v4si)__A, (__v4s 54 _mm_macc_epi32(__m128i __A, __m128i __B, __m128i __C) argument 60 _mm_maccslo_epi32(__m128i __A, __m128i __B, __m128i __C) argument 66 _mm_macclo_epi32(__m128i __A, __m128i __B, __m128i __C) argument 72 _mm_maccshi_epi32(__m128i __A, __m128i __B, __m128i __C) argument 78 _mm_macchi_epi32(__m128i __A, __m128i __B, __m128i __C) argument 84 _mm_maddsd_epi16(__m128i __A, __m128i __B, __m128i __C) argument 90 _mm_maddd_epi16(__m128i __A, __m128i __B, __m128i __C) argument 96 _mm_haddw_epi8(__m128i __A) argument 102 _mm_haddd_epi8(__m128i __A) argument 108 _mm_haddq_epi8(__m128i __A) argument 114 _mm_haddd_epi16(__m128i __A) argument 120 _mm_haddq_epi16(__m128i __A) argument 126 _mm_haddq_epi32(__m128i __A) argument 132 _mm_haddw_epu8(__m128i __A) argument 138 _mm_haddd_epu8(__m128i __A) argument 144 _mm_haddq_epu8(__m128i __A) argument 150 _mm_haddd_epu16(__m128i __A) argument 156 _mm_haddq_epu16(__m128i __A) argument 162 _mm_haddq_epu32(__m128i __A) argument 168 _mm_hsubw_epi8(__m128i __A) argument 174 _mm_hsubd_epi16(__m128i __A) argument 180 _mm_hsubq_epi32(__m128i __A) argument 186 _mm_cmov_si128(__m128i __A, __m128i __B, __m128i __C) argument 192 _mm256_cmov_si256(__m256i __A, __m256i __B, __m256i __C) argument 198 _mm_perm_epi8(__m128i __A, __m128i __B, __m128i __C) argument 204 _mm_rot_epi8(__m128i __A, __m128i __B) argument 210 _mm_rot_epi16(__m128i __A, __m128i __B) argument 216 _mm_rot_epi32(__m128i __A, __m128i __B) argument 222 _mm_rot_epi64(__m128i __A, __m128i __B) argument 240 _mm_shl_epi8(__m128i __A, __m128i __B) argument 246 _mm_shl_epi16(__m128i __A, __m128i __B) argument 252 _mm_shl_epi32(__m128i __A, __m128i __B) argument 258 _mm_shl_epi64(__m128i __A, __m128i __B) argument 264 _mm_sha_epi8(__m128i __A, __m128i __B) argument 270 _mm_sha_epi16(__m128i __A, __m128i __B) argument 276 _mm_sha_epi32(__m128i __A, __m128i __B) argument 282 _mm_sha_epi64(__m128i __A, __m128i __B) argument 329 _mm_comlt_epu8(__m128i __A, __m128i __B) argument 335 _mm_comle_epu8(__m128i __A, __m128i __B) argument 341 _mm_comgt_epu8(__m128i __A, __m128i __B) argument 347 _mm_comge_epu8(__m128i __A, __m128i __B) argument 353 _mm_comeq_epu8(__m128i __A, __m128i __B) argument 359 _mm_comneq_epu8(__m128i __A, __m128i __B) argument 365 _mm_comfalse_epu8(__m128i __A, __m128i __B) argument 371 _mm_comtrue_epu8(__m128i __A, __m128i __B) argument 377 _mm_comlt_epu16(__m128i __A, __m128i __B) argument 383 _mm_comle_epu16(__m128i __A, __m128i __B) argument 389 _mm_comgt_epu16(__m128i __A, __m128i __B) argument 395 _mm_comge_epu16(__m128i __A, __m128i __B) argument 401 _mm_comeq_epu16(__m128i __A, __m128i __B) argument 407 _mm_comneq_epu16(__m128i __A, __m128i __B) argument 413 _mm_comfalse_epu16(__m128i __A, __m128i __B) argument 419 _mm_comtrue_epu16(__m128i __A, __m128i __B) argument 425 _mm_comlt_epu32(__m128i __A, __m128i __B) argument 431 _mm_comle_epu32(__m128i __A, __m128i __B) argument 437 _mm_comgt_epu32(__m128i __A, __m128i __B) argument 443 _mm_comge_epu32(__m128i __A, __m128i __B) argument 449 _mm_comeq_epu32(__m128i __A, __m128i __B) argument 455 _mm_comneq_epu32(__m128i __A, __m128i __B) argument 461 _mm_comfalse_epu32(__m128i __A, __m128i __B) argument 467 _mm_comtrue_epu32(__m128i __A, __m128i __B) argument 473 _mm_comlt_epu64(__m128i __A, __m128i __B) argument 479 _mm_comle_epu64(__m128i __A, __m128i __B) argument 485 _mm_comgt_epu64(__m128i __A, __m128i __B) argument 491 _mm_comge_epu64(__m128i __A, __m128i __B) argument 497 _mm_comeq_epu64(__m128i __A, __m128i __B) argument 503 _mm_comneq_epu64(__m128i __A, __m128i __B) argument 509 _mm_comfalse_epu64(__m128i __A, __m128i __B) argument 515 _mm_comtrue_epu64(__m128i __A, __m128i __B) argument 521 _mm_comlt_epi8(__m128i __A, __m128i __B) argument 527 _mm_comle_epi8(__m128i __A, __m128i __B) argument 533 _mm_comgt_epi8(__m128i __A, __m128i __B) argument 539 _mm_comge_epi8(__m128i __A, __m128i __B) argument 545 _mm_comeq_epi8(__m128i __A, __m128i __B) argument 551 _mm_comneq_epi8(__m128i __A, __m128i __B) argument 557 _mm_comfalse_epi8(__m128i __A, __m128i __B) argument 563 _mm_comtrue_epi8(__m128i __A, __m128i __B) argument 569 _mm_comlt_epi16(__m128i __A, __m128i __B) argument 575 _mm_comle_epi16(__m128i __A, __m128i __B) argument 581 _mm_comgt_epi16(__m128i __A, __m128i __B) argument 587 _mm_comge_epi16(__m128i __A, __m128i __B) argument 593 _mm_comeq_epi16(__m128i __A, __m128i __B) argument 599 _mm_comneq_epi16(__m128i __A, __m128i __B) argument 605 _mm_comfalse_epi16(__m128i __A, __m128i __B) argument 611 _mm_comtrue_epi16(__m128i __A, __m128i __B) argument 617 _mm_comlt_epi32(__m128i __A, __m128i __B) argument 623 _mm_comle_epi32(__m128i __A, __m128i __B) argument 629 _mm_comgt_epi32(__m128i __A, __m128i __B) argument 635 _mm_comge_epi32(__m128i __A, __m128i __B) argument 641 _mm_comeq_epi32(__m128i __A, __m128i __B) argument 647 _mm_comneq_epi32(__m128i __A, __m128i __B) argument 653 _mm_comfalse_epi32(__m128i __A, __m128i __B) argument 659 _mm_comtrue_epi32(__m128i __A, __m128i __B) argument 665 _mm_comlt_epi64(__m128i __A, __m128i __B) argument 671 _mm_comle_epi64(__m128i __A, __m128i __B) argument 677 _mm_comgt_epi64(__m128i __A, __m128i __B) argument 683 _mm_comge_epi64(__m128i __A, __m128i __B) argument 689 _mm_comeq_epi64(__m128i __A, __m128i __B) argument 695 _mm_comneq_epi64(__m128i __A, __m128i __B) argument 701 _mm_comfalse_epi64(__m128i __A, __m128i __B) argument 707 _mm_comtrue_epi64(__m128i __A, __m128i __B) argument 732 _mm_frcz_ss(__m128 __A) argument 738 _mm_frcz_sd(__m128d __A) argument 744 _mm_frcz_ps(__m128 __A) argument 750 _mm_frcz_pd(__m128d __A) argument 756 _mm256_frcz_ps(__m256 __A) argument 762 _mm256_frcz_pd(__m256d __A) argument [all...] |
H A D | avx512vlcdintrin.h | 27 _mm_broadcastmb_epi64 (__mmask8 __A) argument 29 return (__m128i) _mm_set1_epi64x((long long) __A); 33 _mm256_broadcastmb_epi64 (__mmask8 __A) argument 35 return (__m256i) _mm256_set1_epi64x((long long)__A); 39 _mm_broadcastmw_epi32 (__mmask16 __A) argument 41 return (__m128i) _mm_set1_epi32((int)__A); 45 _mm256_broadcastmw_epi32 (__mmask16 __A) argument 47 return (__m256i) _mm256_set1_epi32((int)__A); 52 _mm_conflict_epi64 (__m128i __A) argument 54 return (__m128i) __builtin_ia32_vpconflictdi_128 ((__v2di) __A); 58 _mm_mask_conflict_epi64(__m128i __W, __mmask8 __U, __m128i __A) argument 66 _mm_maskz_conflict_epi64(__mmask8 __U, __m128i __A) argument 74 _mm256_conflict_epi64(__m256i __A) argument 80 _mm256_mask_conflict_epi64(__m256i __W, __mmask8 __U, __m256i __A) argument 88 _mm256_maskz_conflict_epi64(__mmask8 __U, __m256i __A) argument 96 _mm_conflict_epi32(__m128i __A) argument 102 _mm_mask_conflict_epi32(__m128i __W, __mmask8 __U, __m128i __A) argument 110 _mm_maskz_conflict_epi32(__mmask8 __U, __m128i __A) argument 118 _mm256_conflict_epi32(__m256i __A) argument 124 _mm256_mask_conflict_epi32(__m256i __W, __mmask8 __U, __m256i __A) argument 132 _mm256_maskz_conflict_epi32(__mmask8 __U, __m256i __A) argument 140 _mm_lzcnt_epi32(__m128i __A) argument 146 _mm_mask_lzcnt_epi32(__m128i __W, __mmask8 __U, __m128i __A) argument 154 _mm_maskz_lzcnt_epi32(__mmask8 __U, __m128i __A) argument 162 _mm256_lzcnt_epi32(__m256i __A) argument 168 _mm256_mask_lzcnt_epi32(__m256i __W, __mmask8 __U, __m256i __A) argument 176 _mm256_maskz_lzcnt_epi32(__mmask8 __U, __m256i __A) argument 184 _mm_lzcnt_epi64(__m128i __A) argument 190 _mm_mask_lzcnt_epi64(__m128i __W, __mmask8 __U, __m128i __A) argument 198 _mm_maskz_lzcnt_epi64(__mmask8 __U, __m128i __A) argument 206 _mm256_lzcnt_epi64(__m256i __A) argument 212 _mm256_mask_lzcnt_epi64(__m256i __W, __mmask8 __U, __m256i __A) argument 220 _mm256_maskz_lzcnt_epi64(__mmask8 __U, __m256i __A) argument [all...] |
H A D | avx512vpopcntdqvlintrin.h | 29 _mm_popcnt_epi64(__m128i __A) { argument 30 return (__m128i)__builtin_ia32_vpopcntq_128((__v2di)__A); 34 _mm_mask_popcnt_epi64(__m128i __W, __mmask8 __U, __m128i __A) { argument 36 (__mmask8)__U, (__v2di)_mm_popcnt_epi64(__A), (__v2di)__W); 40 _mm_maskz_popcnt_epi64(__mmask8 __U, __m128i __A) { argument 41 return _mm_mask_popcnt_epi64((__m128i)_mm_setzero_si128(), __U, __A); 45 _mm_popcnt_epi32(__m128i __A) { argument 46 return (__m128i)__builtin_ia32_vpopcntd_128((__v4si)__A); 50 _mm_mask_popcnt_epi32(__m128i __W, __mmask8 __U, __m128i __A) { argument 52 (__mmask8)__U, (__v4si)_mm_popcnt_epi32(__A), (__v4s 56 _mm_maskz_popcnt_epi32(__mmask8 __U, __m128i __A) argument 61 _mm256_popcnt_epi64(__m256i __A) argument 66 _mm256_mask_popcnt_epi64(__m256i __W, __mmask8 __U, __m256i __A) argument 72 _mm256_maskz_popcnt_epi64(__mmask8 __U, __m256i __A) argument 77 _mm256_popcnt_epi32(__m256i __A) argument 82 _mm256_mask_popcnt_epi32(__m256i __W, __mmask8 __U, __m256i __A) argument 88 _mm256_maskz_popcnt_epi32(__mmask8 __U, __m256i __A) argument [all...] |
H A D | fma4intrin.h | 24 _mm_macc_ps(__m128 __A, __m128 __B, __m128 __C) argument 26 return (__m128)__builtin_ia32_vfmaddps((__v4sf)__A, (__v4sf)__B, (__v4sf)__C); 30 _mm_macc_pd(__m128d __A, __m128d __B, __m128d __C) argument 32 return (__m128d)__builtin_ia32_vfmaddpd((__v2df)__A, (__v2df)__B, (__v2df)__C); 36 _mm_macc_ss(__m128 __A, __m128 __B, __m128 __C) argument 38 return (__m128)__builtin_ia32_vfmaddss((__v4sf)__A, (__v4sf)__B, (__v4sf)__C); 42 _mm_macc_sd(__m128d __A, __m128d __B, __m128d __C) argument 44 return (__m128d)__builtin_ia32_vfmaddsd((__v2df)__A, (__v2df)__B, (__v2df)__C); 48 _mm_msub_ps(__m128 __A, __m128 __B, __m128 __C) argument 50 return (__m128)__builtin_ia32_vfmaddps((__v4sf)__A, (__v4s 54 _mm_msub_pd(__m128d __A, __m128d __B, __m128d __C) argument 60 _mm_msub_ss(__m128 __A, __m128 __B, __m128 __C) argument 66 _mm_msub_sd(__m128d __A, __m128d __B, __m128d __C) argument 72 _mm_nmacc_ps(__m128 __A, __m128 __B, __m128 __C) argument 78 _mm_nmacc_pd(__m128d __A, __m128d __B, __m128d __C) argument 84 _mm_nmacc_ss(__m128 __A, __m128 __B, __m128 __C) argument 90 _mm_nmacc_sd(__m128d __A, __m128d __B, __m128d __C) argument 96 _mm_nmsub_ps(__m128 __A, __m128 __B, __m128 __C) argument 102 _mm_nmsub_pd(__m128d __A, __m128d __B, __m128d __C) argument 108 _mm_nmsub_ss(__m128 __A, __m128 __B, __m128 __C) argument 114 _mm_nmsub_sd(__m128d __A, __m128d __B, __m128d __C) argument 120 _mm_maddsub_ps(__m128 __A, __m128 __B, __m128 __C) argument 126 _mm_maddsub_pd(__m128d __A, __m128d __B, __m128d __C) argument 132 _mm_msubadd_ps(__m128 __A, __m128 __B, __m128 __C) argument 138 _mm_msubadd_pd(__m128d __A, __m128d __B, __m128d __C) argument 144 _mm256_macc_ps(__m256 __A, __m256 __B, __m256 __C) argument 150 _mm256_macc_pd(__m256d __A, __m256d __B, __m256d __C) argument 156 _mm256_msub_ps(__m256 __A, __m256 __B, __m256 __C) argument 162 _mm256_msub_pd(__m256d __A, __m256d __B, __m256d __C) argument 168 _mm256_nmacc_ps(__m256 __A, __m256 __B, __m256 __C) argument 174 _mm256_nmacc_pd(__m256d __A, __m256d __B, __m256d __C) argument 180 _mm256_nmsub_ps(__m256 __A, __m256 __B, __m256 __C) argument 186 _mm256_nmsub_pd(__m256d __A, __m256d __B, __m256d __C) argument 192 _mm256_maddsub_ps(__m256 __A, __m256 __B, __m256 __C) argument 198 _mm256_maddsub_pd(__m256d __A, __m256d __B, __m256d __C) argument 204 _mm256_msubadd_ps(__m256 __A, __m256 __B, __m256 __C) argument 210 _mm256_msubadd_pd(__m256d __A, __m256d __B, __m256d __C) argument [all...] |
H A D | avxvnniintrin.h | 32 /// \fn __m256i _mm256_dpbusd_epi32(__m256i __S, __m256i __A, __m256i __B) 33 /// \fn __m256i _mm256_dpbusds_epi32(__m256i __S, __m256i __A, __m256i __B) 34 /// \fn __m256i _mm256_dpwssd_epi32(__m256i __S, __m256i __A, __m256i __B) 35 /// \fn __m256i _mm256_dpwssds_epi32(__m256i __S, __m256i __A, __m256i __B) 36 /// \fn __m128i _mm_dpbusd_epi32(__m128i __S, __m128i __A, __m128i __B) 37 /// \fn __m128i _mm_dpbusds_epi32(__m128i __S, __m128i __A, __m128i __B) 38 /// \fn __m128i _mm_dpwssd_epi32(__m128i __S, __m128i __A, __m128i __B) 39 /// \fn __m128i _mm_dpwssds_epi32(__m128i __S, __m128i __A, __m128i __B) 46 /// Multiply groups of 4 adjacent pairs of unsigned 8-bit integers in \a __A with 55 /// tmp1.word := Signed(ZeroExtend16(__A 64 _mm256_dpbusd_avx_epi32(__m256i __S, __m256i __A, __m256i __B) argument 87 _mm256_dpbusds_avx_epi32(__m256i __S, __m256i __A, __m256i __B) argument 108 _mm256_dpwssd_avx_epi32(__m256i __S, __m256i __A, __m256i __B) argument 129 _mm256_dpwssds_avx_epi32(__m256i __S, __m256i __A, __m256i __B) argument 152 _mm_dpbusd_avx_epi32(__m128i __S, __m128i __A, __m128i __B) argument 175 _mm_dpbusds_avx_epi32(__m128i __S, __m128i __A, __m128i __B) argument 196 _mm_dpwssd_avx_epi32(__m128i __S, __m128i __A, __m128i __B) argument 217 _mm_dpwssds_avx_epi32(__m128i __S, __m128i __A, __m128i __B) argument [all...] |
H A D | fmaintrin.h | 22 /// For each element, computes <c> (__A * __B) + __C </c>. 28 /// \param __A 36 _mm_fmadd_ps(__m128 __A, __m128 __B, __m128 __C) argument 38 return (__m128)__builtin_ia32_vfmaddps((__v4sf)__A, (__v4sf)__B, (__v4sf)__C); 42 /// For each element, computes <c> (__A * __B) + __C </c>. 48 /// \param __A 56 _mm_fmadd_pd(__m128d __A, __m128d __B, __m128d __C) argument 58 return (__m128d)__builtin_ia32_vfmaddpd((__v2df)__A, (__v2df)__B, (__v2df)__C); 64 /// result[31:0] = (__A[31:0] * __B[31:0]) + __C[31:0] 65 /// result[127:32] = __A[12 84 _mm_fmadd_ss(__m128 __A, __m128 __B, __m128 __C) argument 112 _mm_fmadd_sd(__m128d __A, __m128d __B, __m128d __C) argument 132 _mm_fmsub_ps(__m128 __A, __m128 __B, __m128 __C) argument 152 _mm_fmsub_pd(__m128d __A, __m128d __B, __m128d __C) argument 180 _mm_fmsub_ss(__m128 __A, __m128 __B, __m128 __C) argument 208 _mm_fmsub_sd(__m128d __A, __m128d __B, __m128d __C) argument 228 _mm_fnmadd_ps(__m128 __A, __m128 __B, __m128 __C) argument 248 _mm_fnmadd_pd(__m128d __A, __m128d __B, __m128d __C) argument 276 _mm_fnmadd_ss(__m128 __A, __m128 __B, __m128 __C) argument 304 _mm_fnmadd_sd(__m128d __A, __m128d __B, __m128d __C) argument 324 _mm_fnmsub_ps(__m128 __A, __m128 __B, __m128 __C) argument 344 _mm_fnmsub_pd(__m128d __A, __m128d __B, __m128d __C) argument 372 _mm_fnmsub_ss(__m128 __A, __m128 __B, __m128 __C) argument 400 _mm_fnmsub_sd(__m128d __A, __m128d __B, __m128d __C) argument 426 _mm_fmaddsub_ps(__m128 __A, __m128 __B, __m128 __C) argument 450 _mm_fmaddsub_pd(__m128d __A, __m128d __B, __m128d __C) argument 476 _mm_fmsubadd_ps(__m128 __A, __m128 __B, __m128 __C) argument 500 _mm_fmsubadd_pd(__m128d __A, __m128d __B, __m128d __C) argument 520 _mm256_fmadd_ps(__m256 __A, __m256 __B, __m256 __C) argument 540 _mm256_fmadd_pd(__m256d __A, __m256d __B, __m256d __C) argument 560 _mm256_fmsub_ps(__m256 __A, __m256 __B, __m256 __C) argument 580 _mm256_fmsub_pd(__m256d __A, __m256d __B, __m256d __C) argument 600 _mm256_fnmadd_ps(__m256 __A, __m256 __B, __m256 __C) argument 620 _mm256_fnmadd_pd(__m256d __A, __m256d __B, __m256d __C) argument 640 _mm256_fnmsub_ps(__m256 __A, __m256 __B, __m256 __C) argument 660 _mm256_fnmsub_pd(__m256d __A, __m256d __B, __m256d __C) argument 690 _mm256_fmaddsub_ps(__m256 __A, __m256 __B, __m256 __C) argument 716 _mm256_fmaddsub_pd(__m256d __A, __m256d __B, __m256d __C) argument 746 _mm256_fmsubadd_ps(__m256 __A, __m256 __B, __m256 __C) argument 772 _mm256_fmsubadd_pd(__m256d __A, __m256d __B, __m256d __C) argument [all...] |
H A D | vaesintrin.h | 27 _mm256_aesenc_epi128(__m256i __A, __m256i __B) argument 29 return (__m256i) __builtin_ia32_aesenc256((__v4di) __A, 34 _mm256_aesdec_epi128(__m256i __A, __m256i __B) argument 36 return (__m256i) __builtin_ia32_aesdec256((__v4di) __A, 41 _mm256_aesenclast_epi128(__m256i __A, __m256i __B) argument 43 return (__m256i) __builtin_ia32_aesenclast256((__v4di) __A, 48 _mm256_aesdeclast_epi128(__m256i __A, __m256i __B) argument 50 return (__m256i) __builtin_ia32_aesdeclast256((__v4di) __A, 56 _mm512_aesenc_epi128(__m512i __A, __m512i __B) argument 58 return (__m512i) __builtin_ia32_aesenc512((__v8di) __A, 63 _mm512_aesdec_epi128(__m512i __A, __m512i __B) argument 70 _mm512_aesenclast_epi128(__m512i __A, __m512i __B) argument 77 _mm512_aesdeclast_epi128(__m512i __A, __m512i __B) argument [all...] |
H A D | avx512vpopcntdqintrin.h | 24 static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_popcnt_epi64(__m512i __A) { argument 25 return (__m512i)__builtin_ia32_vpopcntq_512((__v8di)__A); 29 _mm512_mask_popcnt_epi64(__m512i __W, __mmask8 __U, __m512i __A) { argument 31 (__mmask8)__U, (__v8di)_mm512_popcnt_epi64(__A), (__v8di)__W); 35 _mm512_maskz_popcnt_epi64(__mmask8 __U, __m512i __A) { argument 36 return _mm512_mask_popcnt_epi64((__m512i)_mm512_setzero_si512(), __U, __A); 39 static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_popcnt_epi32(__m512i __A) { argument 40 return (__m512i)__builtin_ia32_vpopcntd_512((__v16si)__A); 44 _mm512_mask_popcnt_epi32(__m512i __W, __mmask16 __U, __m512i __A) { argument 46 (__mmask16)__U, (__v16si)_mm512_popcnt_epi32(__A), (__v16s 50 _mm512_maskz_popcnt_epi32(__mmask16 __U, __m512i __A) argument [all...] |
H A D | avx512bitalgintrin.h | 24 _mm512_popcnt_epi16(__m512i __A) argument 26 return (__m512i) __builtin_ia32_vpopcntw_512((__v32hi) __A); 30 _mm512_mask_popcnt_epi16(__m512i __A, __mmask32 __U, __m512i __B) argument 34 (__v32hi) __A); 46 _mm512_popcnt_epi8(__m512i __A) argument 48 return (__m512i) __builtin_ia32_vpopcntb_512((__v64qi) __A); 52 _mm512_mask_popcnt_epi8(__m512i __A, __mmask64 __U, __m512i __B) argument 56 (__v64qi) __A); 68 _mm512_mask_bitshuffle_epi64_mask(__mmask64 __U, __m512i __A, __m512i __B) argument 70 return (__mmask64) __builtin_ia32_vpshufbitqmb512_mask((__v64qi) __A, 76 _mm512_bitshuffle_epi64_mask(__m512i __A, __m512i __B) argument [all...] |
H A D | ia32intrin.h | 37 /// \param __A 42 __bsfd(int __A) { argument 43 return __builtin_ctz((unsigned int)__A); 54 /// \param __A 59 __bsrd(int __A) { argument 60 return 31 - __builtin_clz((unsigned int)__A); 70 /// \param __A 74 __bswapd(int __A) { argument 75 return (int)__builtin_bswap32((unsigned int)__A); 85 /// \param __A 89 _bswap(int __A) argument 142 __bsfq(long long __A) argument 158 __bsrq(long long __A) argument 174 __bswapq(long long __A) argument 209 __popcntd(unsigned int __A) argument 246 __popcntq(unsigned long long __A) argument 342 _castf32_u32(float __A) argument 357 _castf64_u64(double __A) argument 372 _castu32_f32(unsigned int __A) argument 387 _castu64_f64(unsigned long long __A) argument 486 __rdpmc(int __A) argument 501 __rdtscp(unsigned int *__A) argument [all...] |
H A D | avx512bwintrin.h | 39 _kand_mask32(__mmask32 __A, __mmask32 __B) argument 41 return (__mmask32)__builtin_ia32_kandsi((__mmask32)__A, (__mmask32)__B); 44 static __inline__ __mmask64 __DEFAULT_FN_ATTRS _kand_mask64(__mmask64 __A, argument 46 return (__mmask64)__builtin_ia32_kanddi((__mmask64)__A, (__mmask64)__B); 50 _kandn_mask32(__mmask32 __A, __mmask32 __B) argument 52 return (__mmask32)__builtin_ia32_kandnsi((__mmask32)__A, (__mmask32)__B); 55 static __inline__ __mmask64 __DEFAULT_FN_ATTRS _kandn_mask64(__mmask64 __A, argument 57 return (__mmask64)__builtin_ia32_kandndi((__mmask64)__A, (__mmask64)__B); 61 _kor_mask32(__mmask32 __A, __mmask32 __B) argument 63 return (__mmask32)__builtin_ia32_korsi((__mmask32)__A, (__mmask3 66 _kor_mask64(__mmask64 __A, __mmask64 __B) argument 72 _kxnor_mask32(__mmask32 __A, __mmask32 __B) argument 77 _kxnor_mask64(__mmask64 __A, __mmask64 __B) argument 83 _kxor_mask32(__mmask32 __A, __mmask32 __B) argument 88 _kxor_mask64(__mmask64 __A, __mmask64 __B) argument 94 _kortestc_mask32_u8(__mmask32 __A, __mmask32 __B) argument 100 _kortestz_mask32_u8(__mmask32 __A, __mmask32 __B) argument 106 _kortest_mask32_u8(__mmask32 __A, __mmask32 __B, unsigned char *__C) argument 112 _kortestc_mask64_u8(__mmask64 __A, __mmask64 __B) argument 117 _kortestz_mask64_u8(__mmask64 __A, __mmask64 __B) argument 122 _kortest_mask64_u8(__mmask64 __A, __mmask64 __B, unsigned char *__C) argument 128 _ktestc_mask32_u8(__mmask32 __A, __mmask32 __B) argument 134 _ktestz_mask32_u8(__mmask32 __A, __mmask32 __B) argument 140 _ktest_mask32_u8(__mmask32 __A, __mmask32 __B, unsigned char *__C) argument 146 _ktestc_mask64_u8(__mmask64 __A, __mmask64 __B) argument 151 _ktestz_mask64_u8(__mmask64 __A, __mmask64 __B) argument 156 _ktest_mask64_u8(__mmask64 __A, __mmask64 __B, unsigned char *__C) argument 162 _kadd_mask32(__mmask32 __A, __mmask32 __B) argument 167 _kadd_mask64(__mmask64 __A, __mmask64 __B) argument 185 _cvtmask32_u32(__mmask32 __A) argument 190 _cvtmask64_u64(__mmask64 __A) argument 195 _cvtu32_mask32(unsigned int __A) argument 200 _cvtu64_mask64(unsigned long long __A) argument 205 _load_mask32(__mmask32 *__A) argument 209 _load_mask64(__mmask64 *__A) argument 214 _store_mask32(__mmask32 *__A, __mmask32 __B) argument 218 _store_mask64(__mmask64 *__A, __mmask64 __B) argument 366 _mm512_add_epi8(__m512i __A, __m512i __B) argument 371 _mm512_mask_add_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B) argument 378 _mm512_maskz_add_epi8(__mmask64 __U, __m512i __A, __m512i __B) argument 385 _mm512_sub_epi8(__m512i __A, __m512i __B) argument 390 _mm512_mask_sub_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B) argument 397 _mm512_maskz_sub_epi8(__mmask64 __U, __m512i __A, __m512i __B) argument 404 _mm512_add_epi16(__m512i __A, __m512i __B) argument 409 _mm512_mask_add_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B) argument 416 _mm512_maskz_add_epi16(__mmask32 __U, __m512i __A, __m512i __B) argument 423 _mm512_sub_epi16(__m512i __A, __m512i __B) argument 428 _mm512_mask_sub_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B) argument 435 _mm512_maskz_sub_epi16(__mmask32 __U, __m512i __A, __m512i __B) argument 442 _mm512_mullo_epi16(__m512i __A, __m512i __B) argument 447 _mm512_mask_mullo_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B) argument 454 _mm512_maskz_mullo_epi16(__mmask32 __U, __m512i __A, __m512i __B) argument 461 _mm512_mask_blend_epi8(__mmask64 __U, __m512i __A, __m512i __W) argument 469 _mm512_mask_blend_epi16(__mmask32 __U, __m512i __A, __m512i __W) argument 477 _mm512_abs_epi8(__m512i __A) argument 483 _mm512_mask_abs_epi8(__m512i __W, __mmask64 __U, __m512i __A) argument 491 _mm512_maskz_abs_epi8(__mmask64 __U, __m512i __A) argument 499 _mm512_abs_epi16(__m512i __A) argument 505 _mm512_mask_abs_epi16(__m512i __W, __mmask32 __U, __m512i __A) argument 513 _mm512_maskz_abs_epi16(__mmask32 __U, __m512i __A) argument 521 _mm512_packs_epi32(__m512i __A, __m512i __B) argument 527 _mm512_maskz_packs_epi32(__mmask32 __M, __m512i __A, __m512i __B) argument 535 _mm512_mask_packs_epi32(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B) argument 543 _mm512_packs_epi16(__m512i __A, __m512i __B) argument 549 _mm512_mask_packs_epi16(__m512i __W, __mmask64 __M, __m512i __A, __m512i __B) argument 557 _mm512_maskz_packs_epi16(__mmask64 __M, __m512i __A, __m512i __B) argument 565 _mm512_packus_epi32(__m512i __A, __m512i __B) argument 571 _mm512_maskz_packus_epi32(__mmask32 __M, __m512i __A, __m512i __B) argument 579 _mm512_mask_packus_epi32(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B) argument 587 _mm512_packus_epi16(__m512i __A, __m512i __B) argument 593 _mm512_mask_packus_epi16(__m512i __W, __mmask64 __M, __m512i __A, __m512i __B) argument 601 _mm512_maskz_packus_epi16(__mmask64 __M, __m512i __A, __m512i __B) argument 609 _mm512_adds_epi8(__m512i __A, __m512i __B) argument 615 _mm512_mask_adds_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B) argument 623 _mm512_maskz_adds_epi8(__mmask64 __U, __m512i __A, __m512i __B) argument 631 _mm512_adds_epi16(__m512i __A, __m512i __B) argument 637 _mm512_mask_adds_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B) argument 645 _mm512_maskz_adds_epi16(__mmask32 __U, __m512i __A, __m512i __B) argument 653 _mm512_adds_epu8(__m512i __A, __m512i __B) argument 659 _mm512_mask_adds_epu8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B) argument 667 _mm512_maskz_adds_epu8(__mmask64 __U, __m512i __A, __m512i __B) argument 675 _mm512_adds_epu16(__m512i __A, __m512i __B) argument 681 _mm512_mask_adds_epu16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B) argument 689 _mm512_maskz_adds_epu16(__mmask32 __U, __m512i __A, __m512i __B) argument 697 _mm512_avg_epu8(__m512i __A, __m512i __B) argument 703 _mm512_mask_avg_epu8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B) argument 712 _mm512_maskz_avg_epu8(__mmask64 __U, __m512i __A, __m512i __B) argument 720 _mm512_avg_epu16(__m512i __A, __m512i __B) argument 726 _mm512_mask_avg_epu16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B) argument 735 _mm512_maskz_avg_epu16(__mmask32 __U, __m512i __A, __m512i __B) argument 743 _mm512_max_epi8(__m512i __A, __m512i __B) argument 749 _mm512_maskz_max_epi8(__mmask64 __M, __m512i __A, __m512i __B) argument 757 _mm512_mask_max_epi8(__m512i __W, __mmask64 __M, __m512i __A, __m512i __B) argument 765 _mm512_max_epi16(__m512i __A, __m512i __B) argument 771 _mm512_maskz_max_epi16(__mmask32 __M, __m512i __A, __m512i __B) argument 779 _mm512_mask_max_epi16(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B) argument 788 _mm512_max_epu8(__m512i __A, __m512i __B) argument 794 _mm512_maskz_max_epu8(__mmask64 __M, __m512i __A, __m512i __B) argument 802 _mm512_mask_max_epu8(__m512i __W, __mmask64 __M, __m512i __A, __m512i __B) argument 810 _mm512_max_epu16(__m512i __A, __m512i __B) argument 816 _mm512_maskz_max_epu16(__mmask32 __M, __m512i __A, __m512i __B) argument 824 _mm512_mask_max_epu16(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B) argument 832 _mm512_min_epi8(__m512i __A, __m512i __B) argument 838 _mm512_maskz_min_epi8(__mmask64 __M, __m512i __A, __m512i __B) argument 846 _mm512_mask_min_epi8(__m512i __W, __mmask64 __M, __m512i __A, __m512i __B) argument 854 _mm512_min_epi16(__m512i __A, __m512i __B) argument 860 _mm512_maskz_min_epi16(__mmask32 __M, __m512i __A, __m512i __B) argument 868 _mm512_mask_min_epi16(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B) argument 876 _mm512_min_epu8(__m512i __A, __m512i __B) argument 882 _mm512_maskz_min_epu8(__mmask64 __M, __m512i __A, __m512i __B) argument 890 _mm512_mask_min_epu8(__m512i __W, __mmask64 __M, __m512i __A, __m512i __B) argument 898 _mm512_min_epu16(__m512i __A, __m512i __B) argument 904 _mm512_maskz_min_epu16(__mmask32 __M, __m512i __A, __m512i __B) argument 912 _mm512_mask_min_epu16(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B) argument 920 _mm512_shuffle_epi8(__m512i __A, __m512i __B) argument 926 _mm512_mask_shuffle_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B) argument 934 _mm512_maskz_shuffle_epi8(__mmask64 __U, __m512i __A, __m512i __B) argument 942 _mm512_subs_epi8(__m512i __A, __m512i __B) argument 948 _mm512_mask_subs_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B) argument 956 _mm512_maskz_subs_epi8(__mmask64 __U, __m512i __A, __m512i __B) argument 964 _mm512_subs_epi16(__m512i __A, __m512i __B) argument 970 _mm512_mask_subs_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B) argument 978 _mm512_maskz_subs_epi16(__mmask32 __U, __m512i __A, __m512i __B) argument 986 _mm512_subs_epu8(__m512i __A, __m512i __B) argument 992 _mm512_mask_subs_epu8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B) argument 1000 _mm512_maskz_subs_epu8(__mmask64 __U, __m512i __A, __m512i __B) argument 1008 _mm512_subs_epu16(__m512i __A, __m512i __B) argument 1014 _mm512_mask_subs_epu16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B) argument 1022 _mm512_maskz_subs_epu16(__mmask32 __U, __m512i __A, __m512i __B) argument 1030 _mm512_permutex2var_epi16(__m512i __A, __m512i __I, __m512i __B) argument 1037 _mm512_mask_permutex2var_epi16(__m512i __A, __mmask32 __U, __m512i __I, __m512i __B) argument 1046 _mm512_mask2_permutex2var_epi16(__m512i __A, __m512i __I, __mmask32 __U, __m512i __B) argument 1055 _mm512_maskz_permutex2var_epi16(__mmask32 __U, __m512i __A, __m512i __I, __m512i __B) argument 1064 _mm512_mulhrs_epi16(__m512i __A, __m512i __B) argument 1070 _mm512_mask_mulhrs_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B) argument 1078 _mm512_maskz_mulhrs_epi16(__mmask32 __U, __m512i __A, __m512i __B) argument 1086 _mm512_mulhi_epi16(__m512i __A, __m512i __B) argument 1092 _mm512_mask_mulhi_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B) argument 1101 _mm512_maskz_mulhi_epi16(__mmask32 __U, __m512i __A, __m512i __B) argument 1109 _mm512_mulhi_epu16(__m512i __A, __m512i __B) argument 1115 _mm512_mask_mulhi_epu16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B) argument 1123 _mm512_maskz_mulhi_epu16(__mmask32 __U, __m512i __A, __m512i __B) argument 1151 _mm512_madd_epi16(__m512i __A, __m512i __B) argument 1156 _mm512_mask_madd_epi16(__m512i __W, __mmask16 __U, __m512i __A, __m512i __B) argument 1163 _mm512_maskz_madd_epi16(__mmask16 __U, __m512i __A, __m512i __B) argument 1170 _mm512_cvtsepi16_epi8(__m512i __A) argument 1177 _mm512_mask_cvtsepi16_epi8(__m256i __O, __mmask32 __M, __m512i __A) argument 1184 _mm512_maskz_cvtsepi16_epi8(__mmask32 __M, __m512i __A) argument 1191 _mm512_cvtusepi16_epi8(__m512i __A) argument 1198 _mm512_mask_cvtusepi16_epi8(__m256i __O, __mmask32 __M, __m512i __A) argument 1205 _mm512_maskz_cvtusepi16_epi8(__mmask32 __M, __m512i __A) argument 1212 _mm512_cvtepi16_epi8(__m512i __A) argument 1219 _mm512_mask_cvtepi16_epi8(__m256i __O, __mmask32 __M, __m512i __A) argument 1226 _mm512_maskz_cvtepi16_epi8(__mmask32 __M, __m512i __A) argument 1233 _mm512_mask_cvtepi16_storeu_epi8(void * __P, __mmask32 __M, __m512i __A) argument 1239 _mm512_mask_cvtsepi16_storeu_epi8(void * __P, __mmask32 __M, __m512i __A) argument 1245 _mm512_mask_cvtusepi16_storeu_epi8(void * __P, __mmask32 __M, __m512i __A) argument 1251 _mm512_unpackhi_epi8(__m512i __A, __m512i __B) argument 1272 _mm512_mask_unpackhi_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B) argument 1279 _mm512_maskz_unpackhi_epi8(__mmask64 __U, __m512i __A, __m512i __B) argument 1286 _mm512_unpackhi_epi16(__m512i __A, __m512i __B) argument 1299 _mm512_mask_unpackhi_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B) argument 1306 _mm512_maskz_unpackhi_epi16(__mmask32 __U, __m512i __A, __m512i __B) argument 1313 _mm512_unpacklo_epi8(__m512i __A, __m512i __B) argument 1334 _mm512_mask_unpacklo_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B) argument 1341 _mm512_maskz_unpacklo_epi8(__mmask64 __U, __m512i __A, __m512i __B) argument 1348 _mm512_unpacklo_epi16(__m512i __A, __m512i __B) argument 1361 _mm512_mask_unpacklo_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B) argument 1368 _mm512_maskz_unpacklo_epi16(__mmask32 __U, __m512i __A, __m512i __B) argument 1375 _mm512_cvtepi8_epi16(__m256i __A) argument 1383 _mm512_mask_cvtepi8_epi16(__m512i __W, __mmask32 __U, __m256i __A) argument 1391 _mm512_maskz_cvtepi8_epi16(__mmask32 __U, __m256i __A) argument 1399 _mm512_cvtepu8_epi16(__m256i __A) argument 1405 _mm512_mask_cvtepu8_epi16(__m512i __W, __mmask32 __U, __m256i __A) argument 1413 _mm512_maskz_cvtepu8_epi16(__mmask32 __U, __m256i __A) argument 1454 _mm512_sllv_epi16(__m512i __A, __m512i __B) argument 1460 _mm512_mask_sllv_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B) argument 1468 _mm512_maskz_sllv_epi16(__mmask32 __U, __m512i __A, __m512i __B) argument 1476 _mm512_sll_epi16(__m512i __A, __m128i __B) argument 1482 _mm512_mask_sll_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m128i __B) argument 1490 _mm512_maskz_sll_epi16(__mmask32 __U, __m512i __A, __m128i __B) argument 1498 _mm512_slli_epi16(__m512i __A, unsigned int __B) argument 1504 _mm512_mask_slli_epi16(__m512i __W, __mmask32 __U, __m512i __A, unsigned int __B) argument 1513 _mm512_maskz_slli_epi16(__mmask32 __U, __m512i __A, unsigned int __B) argument 1524 _mm512_srlv_epi16(__m512i __A, __m512i __B) argument 1530 _mm512_mask_srlv_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B) argument 1538 _mm512_maskz_srlv_epi16(__mmask32 __U, __m512i __A, __m512i __B) argument 1546 _mm512_srav_epi16(__m512i __A, __m512i __B) argument 1552 _mm512_mask_srav_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B) argument 1560 _mm512_maskz_srav_epi16(__mmask32 __U, __m512i __A, __m512i __B) argument 1568 _mm512_sra_epi16(__m512i __A, __m128i __B) argument 1574 _mm512_mask_sra_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m128i __B) argument 1582 _mm512_maskz_sra_epi16(__mmask32 __U, __m512i __A, __m128i __B) argument 1590 _mm512_srai_epi16(__m512i __A, unsigned int __B) argument 1596 _mm512_mask_srai_epi16(__m512i __W, __mmask32 __U, __m512i __A, unsigned int __B) argument 1605 _mm512_maskz_srai_epi16(__mmask32 __U, __m512i __A, unsigned int __B) argument 1613 _mm512_srl_epi16(__m512i __A, __m128i __B) argument 1619 _mm512_mask_srl_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m128i __B) argument 1627 _mm512_maskz_srl_epi16(__mmask32 __U, __m512i __A, __m128i __B) argument 1635 _mm512_srli_epi16(__m512i __A, unsigned int __B) argument 1641 _mm512_mask_srli_epi16(__m512i __W, __mmask32 __U, __m512i __A, unsigned int __B) argument 1650 _mm512_maskz_srli_epi16(__mmask32 __U, __m512i __A, int __B) argument 1661 _mm512_mask_mov_epi16(__m512i __W, __mmask32 __U, __m512i __A) argument 1669 _mm512_maskz_mov_epi16(__mmask32 __U, __m512i __A) argument 1677 _mm512_mask_mov_epi8(__m512i __W, __mmask64 __U, __m512i __A) argument 1685 _mm512_maskz_mov_epi8(__mmask64 __U, __m512i __A) argument 1693 _mm512_mask_set1_epi8(__m512i __O, __mmask64 __M, char __A) argument 1701 _mm512_maskz_set1_epi8(__mmask64 __M, char __A) argument 1708 _mm512_kunpackd(__mmask64 __A, __mmask64 __B) argument 1715 _mm512_kunpackw(__mmask32 __A, __mmask32 __B) argument 1774 _mm512_storeu_epi16(void *__P, __m512i __A) argument 1783 _mm512_mask_storeu_epi16(void *__P, __mmask32 __U, __m512i __A) argument 1791 _mm512_storeu_epi8(void *__P, __m512i __A) argument 1800 _mm512_mask_storeu_epi8(void *__P, __mmask64 __U, __m512i __A) argument 1808 _mm512_test_epi8_mask(__m512i __A, __m512i __B) argument 1815 _mm512_mask_test_epi8_mask(__mmask64 __U, __m512i __A, __m512i __B) argument 1822 _mm512_test_epi16_mask(__m512i __A, __m512i __B) argument 1829 _mm512_mask_test_epi16_mask(__mmask32 __U, __m512i __A, __m512i __B) argument 1836 _mm512_testn_epi8_mask(__m512i __A, __m512i __B) argument 1842 _mm512_mask_testn_epi8_mask(__mmask64 __U, __m512i __A, __m512i __B) argument 1849 _mm512_testn_epi16_mask(__m512i __A, __m512i __B) argument 1856 _mm512_mask_testn_epi16_mask(__mmask32 __U, __m512i __A, __m512i __B) argument 1863 _mm512_movepi8_mask(__m512i __A) argument 1869 _mm512_movepi16_mask(__m512i __A) argument 1875 _mm512_movm_epi8(__mmask64 __A) argument 1881 _mm512_movm_epi16(__mmask32 __A) argument 1887 _mm512_broadcastb_epi8(__m128i __A) argument 1897 _mm512_mask_broadcastb_epi8(__m512i __O, __mmask64 __M, __m128i __A) argument 1905 _mm512_maskz_broadcastb_epi8(__mmask64 __M, __m128i __A) argument 1913 _mm512_mask_set1_epi16(__m512i __O, __mmask32 __M, short __A) argument 1921 _mm512_maskz_set1_epi16(__mmask32 __M, short __A) argument 1929 _mm512_broadcastw_epi16(__m128i __A) argument 1937 _mm512_mask_broadcastw_epi16(__m512i __O, __mmask32 __M, __m128i __A) argument 1945 _mm512_maskz_broadcastw_epi16(__mmask32 __M, __m128i __A) argument 1953 _mm512_permutexvar_epi16(__m512i __A, __m512i __B) argument 1959 _mm512_maskz_permutexvar_epi16(__mmask32 __M, __m512i __A, __m512i __B) argument 1968 _mm512_mask_permutexvar_epi16(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B) argument 2005 _mm512_sad_epu8(__m512i __A, __m512i __B) argument [all...] |
H A D | avx512vlbf16intrin.h | 33 /// \param __A 38 /// conversion of __B, and higher 64 bits come from conversion of __A. 40 _mm_cvtne2ps_pbh(__m128 __A, __m128 __B) { argument 41 return (__m128bh)__builtin_ia32_cvtne2ps2bf16_128((__v4sf) __A, 51 /// \param __A 59 /// A 1 means conversion of __A or __B. A 0 means element from __W. 61 /// conversion of __B, and higher 64 bits come from conversion of __A. 63 _mm_mask_cvtne2ps_pbh(__m128bh __W, __mmask8 __U, __m128 __A, __m128 __B) { argument 65 (__v8bf)_mm_cvtne2ps_pbh(__A, __B), 75 /// \param __A 85 _mm_maskz_cvtne2ps_pbh(__mmask8 __U, __m128 __A, __m128 __B) argument 104 _mm256_cvtne2ps_pbh(__m256 __A, __m256 __B) argument 127 _mm256_mask_cvtne2ps_pbh(__m256bh __W, __mmask16 __U, __m256 __A, __m256 __B) argument 149 _mm256_maskz_cvtne2ps_pbh(__mmask16 __U, __m256 __A, __m256 __B) argument 184 _mm_mask_cvtneps_pbh(__m128bh __W, __mmask8 __U, __m128 __A) argument 204 _mm_maskz_cvtneps_pbh(__mmask8 __U, __m128 __A) argument 237 _mm256_mask_cvtneps_pbh(__m128bh __W, __mmask8 __U, __m256 __A) argument 256 _mm256_maskz_cvtneps_pbh(__mmask8 __U, __m256 __A) argument 277 _mm_dpbf16_ps(__m128 __D, __m128bh __A, __m128bh __B) argument 301 _mm_mask_dpbf16_ps(__m128 __D, __mmask8 __U, __m128bh __A, __m128bh __B) argument 325 _mm_maskz_dpbf16_ps(__mmask8 __U, __m128 __D, __m128bh __A, __m128bh __B) argument 346 _mm256_dpbf16_ps(__m256 __D, __m256bh __A, __m256bh __B) argument 370 _mm256_mask_dpbf16_ps(__m256 __D, __mmask8 __U, __m256bh __A, __m256bh __B) argument 394 _mm256_maskz_dpbf16_ps(__mmask8 __U, __m256 __D, __m256bh __A, __m256bh __B) argument 410 _mm_cvtness_sbh(float __A) argument 424 _mm_cvtpbh_ps(__m128bh __A) argument 436 _mm256_cvtpbh_ps(__m128bh __A) argument 452 _mm_maskz_cvtpbh_ps(__mmask8 __U, __m128bh __A) argument 468 _mm256_maskz_cvtpbh_ps(__mmask8 __U, __m128bh __A) argument 487 _mm_mask_cvtpbh_ps(__m128 __S, __mmask8 __U, __m128bh __A) argument 507 _mm256_mask_cvtpbh_ps(__m256 __S, __mmask8 __U, __m128bh __A) argument [all...] |
H A D | avx512bf16intrin.h | 35 /// \param __A 39 static __inline__ float __DEFAULT_FN_ATTRS _mm_cvtsbh_ss(__bf16 __A) { argument 40 return __builtin_ia32_cvtsbf162ss_32(__A); 49 /// \param __A 54 /// conversion of __B, and higher 256 bits come from conversion of __A. 56 _mm512_cvtne2ps_pbh(__m512 __A, __m512 __B) { argument 57 return (__m512bh)__builtin_ia32_cvtne2ps2bf16_512((__v16sf) __A, 67 /// \param __A 75 /// A 1 means conversion of __A or __B. A 0 means element from __W. 77 /// conversion of __B, and higher 256 bits come from conversion of __A 79 _mm512_mask_cvtne2ps_pbh(__m512bh __W, __mmask32 __U, __m512 __A, __m512 __B) argument 101 _mm512_maskz_cvtne2ps_pbh(__mmask32 __U, __m512 __A, __m512 __B) argument 117 _mm512_cvtneps_pbh(__m512 __A) argument 138 _mm512_mask_cvtneps_pbh(__m256bh __W, __mmask16 __U, __m512 __A) argument 157 _mm512_maskz_cvtneps_pbh(__mmask16 __U, __m512 __A) argument 178 _mm512_dpbf16_ps(__m512 __D, __m512bh __A, __m512bh __B) argument 202 _mm512_mask_dpbf16_ps(__m512 __D, __mmask16 __U, __m512bh __A, __m512bh __B) argument 226 _mm512_maskz_dpbf16_ps(__mmask16 __U, __m512 __D, __m512bh __A, __m512bh __B) argument 239 _mm512_cvtpbh_ps(__m256bh __A) argument 255 _mm512_maskz_cvtpbh_ps(__mmask16 __U, __m256bh __A) argument 273 _mm512_mask_cvtpbh_ps(__m512 __S, __mmask16 __U, __m256bh __A) argument [all...] |
H A D | avx512vlintrin.h | 233 _mm256_mask_add_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument 236 (__v8si)_mm256_add_epi32(__A, __B), 241 _mm256_maskz_add_epi32(__mmask8 __U, __m256i __A, __m256i __B) argument 244 (__v8si)_mm256_add_epi32(__A, __B), 249 _mm256_mask_add_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument 252 (__v4di)_mm256_add_epi64(__A, __B), 257 _mm256_maskz_add_epi64(__mmask8 __U, __m256i __A, __m256i __B) argument 260 (__v4di)_mm256_add_epi64(__A, __B), 265 _mm256_mask_sub_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument 268 (__v8si)_mm256_sub_epi32(__A, __ 273 _mm256_maskz_sub_epi32(__mmask8 __U, __m256i __A, __m256i __B) argument 281 _mm256_mask_sub_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument 289 _mm256_maskz_sub_epi64(__mmask8 __U, __m256i __A, __m256i __B) argument 297 _mm_mask_add_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument 305 _mm_maskz_add_epi32(__mmask8 __U, __m128i __A, __m128i __B) argument 313 _mm_mask_add_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument 321 _mm_maskz_add_epi64(__mmask8 __U, __m128i __A, __m128i __B) argument 329 _mm_mask_sub_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument 337 _mm_maskz_sub_epi32(__mmask8 __U, __m128i __A, __m128i __B) argument 345 _mm_mask_sub_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument 353 _mm_maskz_sub_epi64(__mmask8 __U, __m128i __A, __m128i __B) argument 425 _mm256_maskz_mullo_epi32(__mmask8 __M, __m256i __A, __m256i __B) argument 433 _mm256_mask_mullo_epi32(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) argument 441 _mm_maskz_mullo_epi32(__mmask8 __M, __m128i __A, __m128i __B) argument 449 _mm_mask_mullo_epi32(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) argument 463 _mm256_mask_and_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument 471 _mm256_maskz_and_epi32(__mmask8 __U, __m256i __A, __m256i __B) argument 483 _mm_mask_and_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument 491 _mm_maskz_and_epi32(__mmask8 __U, __m128i __A, __m128i __B) argument 497 _mm256_andnot_epi32(__m256i __A, __m256i __B) argument 503 _mm256_mask_andnot_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument 511 _mm256_maskz_andnot_epi32(__mmask8 __U, __m256i __A, __m256i __B) argument 518 _mm_andnot_epi32(__m128i __A, __m128i __B) argument 524 _mm_mask_andnot_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument 532 _mm_maskz_andnot_epi32(__mmask8 __U, __m128i __A, __m128i __B) argument 544 _mm256_mask_or_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument 552 _mm256_maskz_or_epi32(__mmask8 __U, __m256i __A, __m256i __B) argument 564 _mm_mask_or_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument 572 _mm_maskz_or_epi32(__mmask8 __U, __m128i __A, __m128i __B) argument 584 _mm256_mask_xor_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument 592 _mm256_maskz_xor_epi32(__mmask8 __U, __m256i __A, __m256i __B) argument 604 _mm_mask_xor_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument 612 _mm_maskz_xor_epi32(__mmask8 __U, __m128i __A, __m128i __B) argument 624 _mm256_mask_and_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument 632 _mm256_maskz_and_epi64(__mmask8 __U, __m256i __A, __m256i __B) argument 644 _mm_mask_and_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument 652 _mm_maskz_and_epi64(__mmask8 __U, __m128i __A, __m128i __B) argument 658 _mm256_andnot_epi64(__m256i __A, __m256i __B) argument 664 _mm256_mask_andnot_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument 672 _mm256_maskz_andnot_epi64(__mmask8 __U, __m256i __A, __m256i __B) argument 679 _mm_andnot_epi64(__m128i __A, __m128i __B) argument 685 _mm_mask_andnot_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument 693 _mm_maskz_andnot_epi64(__mmask8 __U, __m128i __A, __m128i __B) argument 705 _mm256_mask_or_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument 713 _mm256_maskz_or_epi64(__mmask8 __U, __m256i __A, __m256i __B) argument 725 _mm_mask_or_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument 733 _mm_maskz_or_epi64(__mmask8 __U, __m128i __A, __m128i __B) argument 745 _mm256_mask_xor_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument 753 _mm256_maskz_xor_epi64(__mmask8 __U, __m256i __A, __m256i __B) argument 765 _mm_mask_xor_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument 774 _mm_maskz_xor_epi64(__mmask8 __U, __m128i __A, __m128i __B) argument 900 _mm_mask_fmadd_pd(__m128d __A, __mmask8 __U, __m128d __B, __m128d __C) argument 910 _mm_mask3_fmadd_pd(__m128d __A, __m128d __B, __m128d __C, __mmask8 __U) argument 920 _mm_maskz_fmadd_pd(__mmask8 __U, __m128d __A, __m128d __B, __m128d __C) argument 930 _mm_mask_fmsub_pd(__m128d __A, __mmask8 __U, __m128d __B, __m128d __C) argument 940 _mm_maskz_fmsub_pd(__mmask8 __U, __m128d __A, __m128d __B, __m128d __C) argument 950 _mm_mask3_fnmadd_pd(__m128d __A, __m128d __B, __m128d __C, __mmask8 __U) argument 960 _mm_maskz_fnmadd_pd(__mmask8 __U, __m128d __A, __m128d __B, __m128d __C) argument 970 _mm_maskz_fnmsub_pd(__mmask8 __U, __m128d __A, __m128d __B, __m128d __C) argument 980 _mm256_mask_fmadd_pd(__m256d __A, __mmask8 __U, __m256d __B, __m256d __C) argument 990 _mm256_mask3_fmadd_pd(__m256d __A, __m256d __B, __m256d __C, __mmask8 __U) argument 1000 _mm256_maskz_fmadd_pd(__mmask8 __U, __m256d __A, __m256d __B, __m256d __C) argument 1010 _mm256_mask_fmsub_pd(__m256d __A, __mmask8 __U, __m256d __B, __m256d __C) argument 1020 _mm256_maskz_fmsub_pd(__mmask8 __U, __m256d __A, __m256d __B, __m256d __C) argument 1030 _mm256_mask3_fnmadd_pd(__m256d __A, __m256d __B, __m256d __C, __mmask8 __U) argument 1040 _mm256_maskz_fnmadd_pd(__mmask8 __U, __m256d __A, __m256d __B, __m256d __C) argument 1050 _mm256_maskz_fnmsub_pd(__mmask8 __U, __m256d __A, __m256d __B, __m256d __C) argument 1060 _mm_mask_fmadd_ps(__m128 __A, __mmask8 __U, __m128 __B, __m128 __C) argument 1070 _mm_mask3_fmadd_ps(__m128 __A, __m128 __B, __m128 __C, __mmask8 __U) argument 1080 _mm_maskz_fmadd_ps(__mmask8 __U, __m128 __A, __m128 __B, __m128 __C) argument 1090 _mm_mask_fmsub_ps(__m128 __A, __mmask8 __U, __m128 __B, __m128 __C) argument 1100 _mm_maskz_fmsub_ps(__mmask8 __U, __m128 __A, __m128 __B, __m128 __C) argument 1110 _mm_mask3_fnmadd_ps(__m128 __A, __m128 __B, __m128 __C, __mmask8 __U) argument 1120 _mm_maskz_fnmadd_ps(__mmask8 __U, __m128 __A, __m128 __B, __m128 __C) argument 1130 _mm_maskz_fnmsub_ps(__mmask8 __U, __m128 __A, __m128 __B, __m128 __C) argument 1140 _mm256_mask_fmadd_ps(__m256 __A, __mmask8 __U, __m256 __B, __m256 __C) argument 1150 _mm256_mask3_fmadd_ps(__m256 __A, __m256 __B, __m256 __C, __mmask8 __U) argument 1160 _mm256_maskz_fmadd_ps(__mmask8 __U, __m256 __A, __m256 __B, __m256 __C) argument 1170 _mm256_mask_fmsub_ps(__m256 __A, __mmask8 __U, __m256 __B, __m256 __C) argument 1180 _mm256_maskz_fmsub_ps(__mmask8 __U, __m256 __A, __m256 __B, __m256 __C) argument 1190 _mm256_mask3_fnmadd_ps(__m256 __A, __m256 __B, __m256 __C, __mmask8 __U) argument 1200 _mm256_maskz_fnmadd_ps(__mmask8 __U, __m256 __A, __m256 __B, __m256 __C) argument 1210 _mm256_maskz_fnmsub_ps(__mmask8 __U, __m256 __A, __m256 __B, __m256 __C) argument 1220 _mm_mask_fmaddsub_pd(__m128d __A, __mmask8 __U, __m128d __B, __m128d __C) argument 1230 _mm_mask3_fmaddsub_pd(__m128d __A, __m128d __B, __m128d __C, __mmask8 __U) argument 1240 _mm_maskz_fmaddsub_pd(__mmask8 __U, __m128d __A, __m128d __B, __m128d __C) argument 1250 _mm_mask_fmsubadd_pd(__m128d __A, __mmask8 __U, __m128d __B, __m128d __C) argument 1260 _mm_maskz_fmsubadd_pd(__mmask8 __U, __m128d __A, __m128d __B, __m128d __C) argument 1270 _mm256_mask_fmaddsub_pd(__m256d __A, __mmask8 __U, __m256d __B, __m256d __C) argument 1280 _mm256_mask3_fmaddsub_pd(__m256d __A, __m256d __B, __m256d __C, __mmask8 __U) argument 1290 _mm256_maskz_fmaddsub_pd(__mmask8 __U, __m256d __A, __m256d __B, __m256d __C) argument 1300 _mm256_mask_fmsubadd_pd(__m256d __A, __mmask8 __U, __m256d __B, __m256d __C) argument 1310 _mm256_maskz_fmsubadd_pd(__mmask8 __U, __m256d __A, __m256d __B, __m256d __C) argument 1320 _mm_mask_fmaddsub_ps(__m128 __A, __mmask8 __U, __m128 __B, __m128 __C) argument 1330 _mm_mask3_fmaddsub_ps(__m128 __A, __m128 __B, __m128 __C, __mmask8 __U) argument 1340 _mm_maskz_fmaddsub_ps(__mmask8 __U, __m128 __A, __m128 __B, __m128 __C) argument 1350 _mm_mask_fmsubadd_ps(__m128 __A, __mmask8 __U, __m128 __B, __m128 __C) argument 1360 _mm_maskz_fmsubadd_ps(__mmask8 __U, __m128 __A, __m128 __B, __m128 __C) argument 1370 _mm256_mask_fmaddsub_ps(__m256 __A, __mmask8 __U, __m256 __B, __m256 __C) argument 1381 _mm256_mask3_fmaddsub_ps(__m256 __A, __m256 __B, __m256 __C, __mmask8 __U) argument 1391 _mm256_maskz_fmaddsub_ps(__mmask8 __U, __m256 __A, __m256 __B, __m256 __C) argument 1401 _mm256_mask_fmsubadd_ps(__m256 __A, __mmask8 __U, __m256 __B, __m256 __C) argument 1411 _mm256_maskz_fmsubadd_ps(__mmask8 __U, __m256 __A, __m256 __B, __m256 __C) argument 1421 _mm_mask3_fmsub_pd(__m128d __A, __m128d __B, __m128d __C, __mmask8 __U) argument 1431 _mm256_mask3_fmsub_pd(__m256d __A, __m256d __B, __m256d __C, __mmask8 __U) argument 1441 _mm_mask3_fmsub_ps(__m128 __A, __m128 __B, __m128 __C, __mmask8 __U) argument 1451 _mm256_mask3_fmsub_ps(__m256 __A, __m256 __B, __m256 __C, __mmask8 __U) argument 1461 _mm_mask3_fmsubadd_pd(__m128d __A, __m128d __B, __m128d __C, __mmask8 __U) argument 1471 _mm256_mask3_fmsubadd_pd(__m256d __A, __m256d __B, __m256d __C, __mmask8 __U) argument 1481 _mm_mask3_fmsubadd_ps(__m128 __A, __m128 __B, __m128 __C, __mmask8 __U) argument 1491 _mm256_mask3_fmsubadd_ps(__m256 __A, __m256 __B, __m256 __C, __mmask8 __U) argument 1501 _mm_mask_fnmadd_pd(__m128d __A, __mmask8 __U, __m128d __B, __m128d __C) argument 1511 _mm256_mask_fnmadd_pd(__m256d __A, __mmask8 __U, __m256d __B, __m256d __C) argument 1521 _mm_mask_fnmadd_ps(__m128 __A, __mmask8 __U, __m128 __B, __m128 __C) argument 1531 _mm256_mask_fnmadd_ps(__m256 __A, __mmask8 __U, __m256 __B, __m256 __C) argument 1541 _mm_mask_fnmsub_pd(__m128d __A, __mmask8 __U, __m128d __B, __m128d __C) argument 1551 _mm_mask3_fnmsub_pd(__m128d __A, __m128d __B, __m128d __C, __mmask8 __U) argument 1561 _mm256_mask_fnmsub_pd(__m256d __A, __mmask8 __U, __m256d __B, __m256d __C) argument 1571 _mm256_mask3_fnmsub_pd(__m256d __A, __m256d __B, __m256d __C, __mmask8 __U) argument 1581 _mm_mask_fnmsub_ps(__m128 __A, __mmask8 __U, __m128 __B, __m128 __C) argument 1591 _mm_mask3_fnmsub_ps(__m128 __A, __m128 __B, __m128 __C, __mmask8 __U) argument 1601 _mm256_mask_fnmsub_ps(__m256 __A, __mmask8 __U, __m256 __B, __m256 __C) argument 1611 _mm256_mask3_fnmsub_ps(__m256 __A, __m256 __B, __m256 __C, __mmask8 __U) argument 1621 _mm_mask_add_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) argument 1628 _mm_maskz_add_pd(__mmask8 __U, __m128d __A, __m128d __B) argument 1635 _mm256_mask_add_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) argument 1642 _mm256_maskz_add_pd(__mmask8 __U, __m256d __A, __m256d __B) argument 1649 _mm_mask_add_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) argument 1656 _mm_maskz_add_ps(__mmask8 __U, __m128 __A, __m128 __B) argument 1663 _mm256_mask_add_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) argument 1670 _mm256_maskz_add_ps(__mmask8 __U, __m256 __A, __m256 __B) argument 1677 _mm_mask_blend_epi32(__mmask8 __U, __m128i __A, __m128i __W) argument 1684 _mm256_mask_blend_epi32(__mmask8 __U, __m256i __A, __m256i __W) argument 1691 _mm_mask_blend_pd(__mmask8 __U, __m128d __A, __m128d __W) argument 1698 _mm256_mask_blend_pd(__mmask8 __U, __m256d __A, __m256d __W) argument 1705 _mm_mask_blend_ps(__mmask8 __U, __m128 __A, __m128 __W) argument 1712 _mm256_mask_blend_ps(__mmask8 __U, __m256 __A, __m256 __W) argument 1719 _mm_mask_blend_epi64(__mmask8 __U, __m128i __A, __m128i __W) argument 1726 _mm256_mask_blend_epi64(__mmask8 __U, __m256i __A, __m256i __W) argument 1733 _mm_mask_compress_pd(__m128d __W, __mmask8 __U, __m128d __A) argument 1740 _mm_maskz_compress_pd(__mmask8 __U, __m128d __A) argument 1748 _mm256_mask_compress_pd(__m256d __W, __mmask8 __U, __m256d __A) argument 1755 _mm256_maskz_compress_pd(__mmask8 __U, __m256d __A) argument 1763 _mm_mask_compress_epi64(__m128i __W, __mmask8 __U, __m128i __A) argument 1770 _mm_maskz_compress_epi64(__mmask8 __U, __m128i __A) argument 1778 _mm256_mask_compress_epi64(__m256i __W, __mmask8 __U, __m256i __A) argument 1785 _mm256_maskz_compress_epi64(__mmask8 __U, __m256i __A) argument 1793 _mm_mask_compress_ps(__m128 __W, __mmask8 __U, __m128 __A) argument 1800 _mm_maskz_compress_ps(__mmask8 __U, __m128 __A) argument 1808 _mm256_mask_compress_ps(__m256 __W, __mmask8 __U, __m256 __A) argument 1815 _mm256_maskz_compress_ps(__mmask8 __U, __m256 __A) argument 1823 _mm_mask_compress_epi32(__m128i __W, __mmask8 __U, __m128i __A) argument 1830 _mm_maskz_compress_epi32(__mmask8 __U, __m128i __A) argument 1838 _mm256_mask_compress_epi32(__m256i __W, __mmask8 __U, __m256i __A) argument 1845 _mm256_maskz_compress_epi32(__mmask8 __U, __m256i __A) argument 1853 _mm_mask_compressstoreu_pd(void *__P, __mmask8 __U, __m128d __A) argument 1860 _mm256_mask_compressstoreu_pd(void *__P, __mmask8 __U, __m256d __A) argument 1867 _mm_mask_compressstoreu_epi64(void *__P, __mmask8 __U, __m128i __A) argument 1874 _mm256_mask_compressstoreu_epi64(void *__P, __mmask8 __U, __m256i __A) argument 1881 _mm_mask_compressstoreu_ps(void *__P, __mmask8 __U, __m128 __A) argument 1888 _mm256_mask_compressstoreu_ps(void *__P, __mmask8 __U, __m256 __A) argument 1895 _mm_mask_compressstoreu_epi32(void *__P, __mmask8 __U, __m128i __A) argument 1902 _mm256_mask_compressstoreu_epi32(void *__P, __mmask8 __U, __m256i __A) argument 1909 _mm_mask_cvtepi32_pd(__m128d __W, __mmask8 __U, __m128i __A) argument 1916 _mm_maskz_cvtepi32_pd(__mmask8 __U, __m128i __A) argument 1923 _mm256_mask_cvtepi32_pd(__m256d __W, __mmask8 __U, __m128i __A) argument 1930 _mm256_maskz_cvtepi32_pd(__mmask8 __U, __m128i __A) argument 1937 _mm_mask_cvtepi32_ps(__m128 __W, __mmask8 __U, __m128i __A) argument 1944 _mm_maskz_cvtepi32_ps(__mmask8 __U, __m128i __A) argument 1951 _mm256_mask_cvtepi32_ps(__m256 __W, __mmask8 __U, __m256i __A) argument 1958 _mm256_maskz_cvtepi32_ps(__mmask8 __U, __m256i __A) argument 1965 _mm_mask_cvtpd_epi32(__m128i __W, __mmask8 __U, __m128d __A) argument 1972 _mm_maskz_cvtpd_epi32(__mmask8 __U, __m128d __A) argument 1980 _mm256_mask_cvtpd_epi32(__m128i __W, __mmask8 __U, __m256d __A) argument 1987 _mm256_maskz_cvtpd_epi32(__mmask8 __U, __m256d __A) argument 1994 _mm_mask_cvtpd_ps(__m128 __W, __mmask8 __U, __m128d __A) argument 2001 _mm_maskz_cvtpd_ps(__mmask8 __U, __m128d __A) argument 2009 _mm256_mask_cvtpd_ps(__m128 __W, __mmask8 __U, __m256d __A) argument 2016 _mm256_maskz_cvtpd_ps(__mmask8 __U, __m256d __A) argument 2023 _mm_cvtpd_epu32(__m128d __A) argument 2031 _mm_mask_cvtpd_epu32(__m128i __W, __mmask8 __U, __m128d __A) argument 2038 _mm_maskz_cvtpd_epu32(__mmask8 __U, __m128d __A) argument 2046 _mm256_cvtpd_epu32(__m256d __A) argument 2054 _mm256_mask_cvtpd_epu32(__m128i __W, __mmask8 __U, __m256d __A) argument 2061 _mm256_maskz_cvtpd_epu32(__mmask8 __U, __m256d __A) argument 2069 _mm_mask_cvtps_epi32(__m128i __W, __mmask8 __U, __m128 __A) argument 2076 _mm_maskz_cvtps_epi32(__mmask8 __U, __m128 __A) argument 2083 _mm256_mask_cvtps_epi32(__m256i __W, __mmask8 __U, __m256 __A) argument 2090 _mm256_maskz_cvtps_epi32(__mmask8 __U, __m256 __A) argument 2097 _mm_mask_cvtps_pd(__m128d __W, __mmask8 __U, __m128 __A) argument 2104 _mm_maskz_cvtps_pd(__mmask8 __U, __m128 __A) argument 2111 _mm256_mask_cvtps_pd(__m256d __W, __mmask8 __U, __m128 __A) argument 2118 _mm256_maskz_cvtps_pd(__mmask8 __U, __m128 __A) argument 2125 _mm_cvtps_epu32(__m128 __A) argument 2133 _mm_mask_cvtps_epu32(__m128i __W, __mmask8 __U, __m128 __A) argument 2140 _mm_maskz_cvtps_epu32(__mmask8 __U, __m128 __A) argument 2148 _mm256_cvtps_epu32(__m256 __A) argument 2156 _mm256_mask_cvtps_epu32(__m256i __W, __mmask8 __U, __m256 __A) argument 2163 _mm256_maskz_cvtps_epu32(__mmask8 __U, __m256 __A) argument 2171 _mm_mask_cvttpd_epi32(__m128i __W, __mmask8 __U, __m128d __A) argument 2178 _mm_maskz_cvttpd_epi32(__mmask8 __U, __m128d __A) argument 2186 _mm256_mask_cvttpd_epi32(__m128i __W, __mmask8 __U, __m256d __A) argument 2193 _mm256_maskz_cvttpd_epi32(__mmask8 __U, __m256d __A) argument 2200 _mm_cvttpd_epu32(__m128d __A) argument 2208 _mm_mask_cvttpd_epu32(__m128i __W, __mmask8 __U, __m128d __A) argument 2215 _mm_maskz_cvttpd_epu32(__mmask8 __U, __m128d __A) argument 2223 _mm256_cvttpd_epu32(__m256d __A) argument 2231 _mm256_mask_cvttpd_epu32(__m128i __W, __mmask8 __U, __m256d __A) argument 2238 _mm256_maskz_cvttpd_epu32(__mmask8 __U, __m256d __A) argument 2246 _mm_mask_cvttps_epi32(__m128i __W, __mmask8 __U, __m128 __A) argument 2253 _mm_maskz_cvttps_epi32(__mmask8 __U, __m128 __A) argument 2260 _mm256_mask_cvttps_epi32(__m256i __W, __mmask8 __U, __m256 __A) argument 2267 _mm256_maskz_cvttps_epi32(__mmask8 __U, __m256 __A) argument 2274 _mm_cvttps_epu32(__m128 __A) argument 2282 _mm_mask_cvttps_epu32(__m128i __W, __mmask8 __U, __m128 __A) argument 2289 _mm_maskz_cvttps_epu32(__mmask8 __U, __m128 __A) argument 2297 _mm256_cvttps_epu32(__m256 __A) argument 2305 _mm256_mask_cvttps_epu32(__m256i __W, __mmask8 __U, __m256 __A) argument 2312 _mm256_maskz_cvttps_epu32(__mmask8 __U, __m256 __A) argument 2320 _mm_cvtepu32_pd(__m128i __A) argument 2326 _mm_mask_cvtepu32_pd(__m128d __W, __mmask8 __U, __m128i __A) argument 2333 _mm_maskz_cvtepu32_pd(__mmask8 __U, __m128i __A) argument 2340 _mm256_cvtepu32_pd(__m128i __A) argument 2345 _mm256_mask_cvtepu32_pd(__m256d __W, __mmask8 __U, __m128i __A) argument 2352 _mm256_maskz_cvtepu32_pd(__mmask8 __U, __m128i __A) argument 2359 _mm_cvtepu32_ps(__m128i __A) argument 2364 _mm_mask_cvtepu32_ps(__m128 __W, __mmask8 __U, __m128i __A) argument 2371 _mm_maskz_cvtepu32_ps(__mmask8 __U, __m128i __A) argument 2378 _mm256_cvtepu32_ps(__m256i __A) argument 2383 _mm256_mask_cvtepu32_ps(__m256 __W, __mmask8 __U, __m256i __A) argument 2390 _mm256_maskz_cvtepu32_ps(__mmask8 __U, __m256i __A) argument 2397 _mm_mask_div_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) argument 2404 _mm_maskz_div_pd(__mmask8 __U, __m128d __A, __m128d __B) argument 2411 _mm256_mask_div_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) argument 2418 _mm256_maskz_div_pd(__mmask8 __U, __m256d __A, __m256d __B) argument 2425 _mm_mask_div_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) argument 2432 _mm_maskz_div_ps(__mmask8 __U, __m128 __A, __m128 __B) argument 2439 _mm256_mask_div_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) argument 2446 _mm256_maskz_div_ps(__mmask8 __U, __m256 __A, __m256 __B) argument 2453 _mm_mask_expand_pd(__m128d __W, __mmask8 __U, __m128d __A) argument 2460 _mm_maskz_expand_pd(__mmask8 __U, __m128d __A) argument 2468 _mm256_mask_expand_pd(__m256d __W, __mmask8 __U, __m256d __A) argument 2475 _mm256_maskz_expand_pd(__mmask8 __U, __m256d __A) argument 2483 _mm_mask_expand_epi64(__m128i __W, __mmask8 __U, __m128i __A) argument 2490 _mm_maskz_expand_epi64(__mmask8 __U, __m128i __A) argument 2498 _mm256_mask_expand_epi64(__m256i __W, __mmask8 __U, __m256i __A) argument 2505 _mm256_maskz_expand_epi64(__mmask8 __U, __m256i __A) argument 2648 _mm_mask_expand_ps(__m128 __W, __mmask8 __U, __m128 __A) argument 2655 _mm_maskz_expand_ps(__mmask8 __U, __m128 __A) argument 2663 _mm256_mask_expand_ps(__m256 __W, __mmask8 __U, __m256 __A) argument 2670 _mm256_maskz_expand_ps(__mmask8 __U, __m256 __A) argument 2678 _mm_mask_expand_epi32(__m128i __W, __mmask8 __U, __m128i __A) argument 2685 _mm_maskz_expand_epi32(__mmask8 __U, __m128i __A) argument 2693 _mm256_mask_expand_epi32(__m256i __W, __mmask8 __U, __m256i __A) argument 2700 _mm256_maskz_expand_epi32(__mmask8 __U, __m256i __A) argument 2708 _mm_getexp_pd(__m128d __A) argument 2716 _mm_mask_getexp_pd(__m128d __W, __mmask8 __U, __m128d __A) argument 2723 _mm_maskz_getexp_pd(__mmask8 __U, __m128d __A) argument 2731 _mm256_getexp_pd(__m256d __A) argument 2739 _mm256_mask_getexp_pd(__m256d __W, __mmask8 __U, __m256d __A) argument 2746 _mm256_maskz_getexp_pd(__mmask8 __U, __m256d __A) argument 2754 _mm_getexp_ps(__m128 __A) argument 2762 _mm_mask_getexp_ps(__m128 __W, __mmask8 __U, __m128 __A) argument 2769 _mm_maskz_getexp_ps(__mmask8 __U, __m128 __A) argument 2777 _mm256_getexp_ps(__m256 __A) argument 2785 _mm256_mask_getexp_ps(__m256 __W, __mmask8 __U, __m256 __A) argument 2792 _mm256_maskz_getexp_ps(__mmask8 __U, __m256 __A) argument 2800 _mm_mask_max_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) argument 2807 _mm_maskz_max_pd(__mmask8 __U, __m128d __A, __m128d __B) argument 2814 _mm256_mask_max_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) argument 2821 _mm256_maskz_max_pd(__mmask8 __U, __m256d __A, __m256d __B) argument 2828 _mm_mask_max_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) argument 2835 _mm_maskz_max_ps(__mmask8 __U, __m128 __A, __m128 __B) argument 2842 _mm256_mask_max_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) argument 2849 _mm256_maskz_max_ps(__mmask8 __U, __m256 __A, __m256 __B) argument 2856 _mm_mask_min_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) argument 2863 _mm_maskz_min_pd(__mmask8 __U, __m128d __A, __m128d __B) argument 2870 _mm256_mask_min_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) argument 2877 _mm256_maskz_min_pd(__mmask8 __U, __m256d __A, __m256d __B) argument 2884 _mm_mask_min_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) argument 2891 _mm_maskz_min_ps(__mmask8 __U, __m128 __A, __m128 __B) argument 2898 _mm256_mask_min_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) argument 2905 _mm256_maskz_min_ps(__mmask8 __U, __m256 __A, __m256 __B) argument 2912 _mm_mask_mul_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) argument 2919 _mm_maskz_mul_pd(__mmask8 __U, __m128d __A, __m128d __B) argument 2926 _mm256_mask_mul_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) argument 2933 _mm256_maskz_mul_pd(__mmask8 __U, __m256d __A, __m256d __B) argument 2940 _mm_mask_mul_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) argument 2947 _mm_maskz_mul_ps(__mmask8 __U, __m128 __A, __m128 __B) argument 2954 _mm256_mask_mul_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) argument 2961 _mm256_maskz_mul_ps(__mmask8 __U, __m256 __A, __m256 __B) argument 2968 _mm_mask_abs_epi32(__m128i __W, __mmask8 __U, __m128i __A) argument 2975 _mm_maskz_abs_epi32(__mmask8 __U, __m128i __A) argument 2982 _mm256_mask_abs_epi32(__m256i __W, __mmask8 __U, __m256i __A) argument 2989 _mm256_maskz_abs_epi32(__mmask8 __U, __m256i __A) argument 2996 _mm_abs_epi64(__m128i __A) argument 3001 _mm_mask_abs_epi64(__m128i __W, __mmask8 __U, __m128i __A) argument 3008 _mm_maskz_abs_epi64(__mmask8 __U, __m128i __A) argument 3015 _mm256_abs_epi64(__m256i __A) argument 3020 _mm256_mask_abs_epi64(__m256i __W, __mmask8 __U, __m256i __A) argument 3027 _mm256_maskz_abs_epi64(__mmask8 __U, __m256i __A) argument 3034 _mm_maskz_max_epi32(__mmask8 __M, __m128i __A, __m128i __B) argument 3041 _mm_mask_max_epi32(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) argument 3048 _mm256_maskz_max_epi32(__mmask8 __M, __m256i __A, __m256i __B) argument 3055 _mm256_mask_max_epi32(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) argument 3062 _mm_max_epi64(__m128i __A, __m128i __B) argument 3067 _mm_maskz_max_epi64(__mmask8 __M, __m128i __A, __m128i __B) argument 3074 _mm_mask_max_epi64(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) argument 3081 _mm256_max_epi64(__m256i __A, __m256i __B) argument 3086 _mm256_maskz_max_epi64(__mmask8 __M, __m256i __A, __m256i __B) argument 3093 _mm256_mask_max_epi64(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) argument 3100 _mm_maskz_max_epu32(__mmask8 __M, __m128i __A, __m128i __B) argument 3107 _mm_mask_max_epu32(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) argument 3114 _mm256_maskz_max_epu32(__mmask8 __M, __m256i __A, __m256i __B) argument 3121 _mm256_mask_max_epu32(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) argument 3128 _mm_max_epu64(__m128i __A, __m128i __B) argument 3133 _mm_maskz_max_epu64(__mmask8 __M, __m128i __A, __m128i __B) argument 3140 _mm_mask_max_epu64(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) argument 3147 _mm256_max_epu64(__m256i __A, __m256i __B) argument 3152 _mm256_maskz_max_epu64(__mmask8 __M, __m256i __A, __m256i __B) argument 3159 _mm256_mask_max_epu64(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) argument 3166 _mm_maskz_min_epi32(__mmask8 __M, __m128i __A, __m128i __B) argument 3173 _mm_mask_min_epi32(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) argument 3180 _mm256_maskz_min_epi32(__mmask8 __M, __m256i __A, __m256i __B) argument 3187 _mm256_mask_min_epi32(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) argument 3194 _mm_min_epi64(__m128i __A, __m128i __B) argument 3199 _mm_mask_min_epi64(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) argument 3206 _mm_maskz_min_epi64(__mmask8 __M, __m128i __A, __m128i __B) argument 3213 _mm256_min_epi64(__m256i __A, __m256i __B) argument 3218 _mm256_mask_min_epi64(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) argument 3225 _mm256_maskz_min_epi64(__mmask8 __M, __m256i __A, __m256i __B) argument 3232 _mm_maskz_min_epu32(__mmask8 __M, __m128i __A, __m128i __B) argument 3239 _mm_mask_min_epu32(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) argument 3246 _mm256_maskz_min_epu32(__mmask8 __M, __m256i __A, __m256i __B) argument 3253 _mm256_mask_min_epu32(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) argument 3260 _mm_min_epu64(__m128i __A, __m128i __B) argument 3265 _mm_mask_min_epu64(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) argument 3272 _mm_maskz_min_epu64(__mmask8 __M, __m128i __A, __m128i __B) argument 3279 _mm256_min_epu64(__m256i __A, __m256i __B) argument 3284 _mm256_mask_min_epu64(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) argument 3291 _mm256_maskz_min_epu64(__mmask8 __M, __m256i __A, __m256i __B) argument 3372 _mm_scalef_pd(__m128d __A, __m128d __B) argument 3381 _mm_mask_scalef_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) argument 3390 _mm_maskz_scalef_pd(__mmask8 __U, __m128d __A, __m128d __B) argument 3399 _mm256_scalef_pd(__m256d __A, __m256d __B) argument 3408 _mm256_mask_scalef_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) argument 3417 _mm256_maskz_scalef_pd(__mmask8 __U, __m256d __A, __m256d __B) argument 3426 _mm_scalef_ps(__m128 __A, __m128 __B) argument 3435 _mm_mask_scalef_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) argument 3443 _mm_maskz_scalef_ps(__mmask8 __U, __m128 __A, __m128 __B) argument 3452 _mm256_scalef_ps(__m256 __A, __m256 __B) argument 3461 _mm256_mask_scalef_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) argument 3470 _mm256_maskz_scalef_ps(__mmask8 __U, __m256 __A, __m256 __B) argument 3639 _mm_mask_sqrt_pd(__m128d __W, __mmask8 __U, __m128d __A) argument 3646 _mm_maskz_sqrt_pd(__mmask8 __U, __m128d __A) argument 3653 _mm256_mask_sqrt_pd(__m256d __W, __mmask8 __U, __m256d __A) argument 3660 _mm256_maskz_sqrt_pd(__mmask8 __U, __m256d __A) argument 3667 _mm_mask_sqrt_ps(__m128 __W, __mmask8 __U, __m128 __A) argument 3674 _mm_maskz_sqrt_ps(__mmask8 __U, __m128 __A) argument 3681 _mm256_mask_sqrt_ps(__m256 __W, __mmask8 __U, __m256 __A) argument 3688 _mm256_maskz_sqrt_ps(__mmask8 __U, __m256 __A) argument 3695 _mm_mask_sub_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) argument 3702 _mm_maskz_sub_pd(__mmask8 __U, __m128d __A, __m128d __B) argument 3709 _mm256_mask_sub_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) argument 3716 _mm256_maskz_sub_pd(__mmask8 __U, __m256d __A, __m256d __B) argument 3723 _mm_mask_sub_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) argument 3730 _mm_maskz_sub_ps(__mmask8 __U, __m128 __A, __m128 __B) argument 3737 _mm256_mask_sub_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) argument 3744 _mm256_maskz_sub_ps(__mmask8 __U, __m256 __A, __m256 __B) argument 3751 _mm_permutex2var_epi32(__m128i __A, __m128i __I, __m128i __B) argument 3757 _mm_mask_permutex2var_epi32(__m128i __A, __mmask8 __U, __m128i __I, __m128i __B) argument 3765 _mm_mask2_permutex2var_epi32(__m128i __A, __m128i __I, __mmask8 __U, __m128i __B) argument 3773 _mm_maskz_permutex2var_epi32(__mmask8 __U, __m128i __A, __m128i __I, __m128i __B) argument 3781 _mm256_permutex2var_epi32(__m256i __A, __m256i __I, __m256i __B) argument 3787 _mm256_mask_permutex2var_epi32(__m256i __A, __mmask8 __U, __m256i __I, __m256i __B) argument 3795 _mm256_mask2_permutex2var_epi32(__m256i __A, __m256i __I, __mmask8 __U, __m256i __B) argument 3803 _mm256_maskz_permutex2var_epi32(__mmask8 __U, __m256i __A, __m256i __I, __m256i __B) argument 3811 _mm_permutex2var_pd(__m128d __A, __m128i __I, __m128d __B) argument 3817 _mm_mask_permutex2var_pd(__m128d __A, __mmask8 __U, __m128i __I, __m128d __B) argument 3824 _mm_mask2_permutex2var_pd(__m128d __A, __m128i __I, __mmask8 __U, __m128d __B) argument 3831 _mm_maskz_permutex2var_pd(__mmask8 __U, __m128d __A, __m128i __I, __m128d __B) argument 3838 _mm256_permutex2var_pd(__m256d __A, __m256i __I, __m256d __B) argument 3844 _mm256_mask_permutex2var_pd(__m256d __A, __mmask8 __U, __m256i __I, __m256d __B) argument 3852 _mm256_mask2_permutex2var_pd(__m256d __A, __m256i __I, __mmask8 __U, __m256d __B) argument 3860 _mm256_maskz_permutex2var_pd(__mmask8 __U, __m256d __A, __m256i __I, __m256d __B) argument 3868 _mm_permutex2var_ps(__m128 __A, __m128i __I, __m128 __B) argument 3874 _mm_mask_permutex2var_ps(__m128 __A, __mmask8 __U, __m128i __I, __m128 __B) argument 3881 _mm_mask2_permutex2var_ps(__m128 __A, __m128i __I, __mmask8 __U, __m128 __B) argument 3888 _mm_maskz_permutex2var_ps(__mmask8 __U, __m128 __A, __m128i __I, __m128 __B) argument 3895 _mm256_permutex2var_ps(__m256 __A, __m256i __I, __m256 __B) argument 3901 _mm256_mask_permutex2var_ps(__m256 __A, __mmask8 __U, __m256i __I, __m256 __B) argument 3908 _mm256_mask2_permutex2var_ps(__m256 __A, __m256i __I, __mmask8 __U, __m256 __B) argument 3916 _mm256_maskz_permutex2var_ps(__mmask8 __U, __m256 __A, __m256i __I, __m256 __B) argument 3924 _mm_permutex2var_epi64(__m128i __A, __m128i __I, __m128i __B) argument 3930 _mm_mask_permutex2var_epi64(__m128i __A, __mmask8 __U, __m128i __I, __m128i __B) argument 3938 _mm_mask2_permutex2var_epi64(__m128i __A, __m128i __I, __mmask8 __U, __m128i __B) argument 3946 _mm_maskz_permutex2var_epi64(__mmask8 __U, __m128i __A, __m128i __I, __m128i __B) argument 3955 _mm256_permutex2var_epi64(__m256i __A, __m256i __I, __m256i __B) argument 3961 _mm256_mask_permutex2var_epi64(__m256i __A, __mmask8 __U, __m256i __I, __m256i __B) argument 3969 _mm256_mask2_permutex2var_epi64(__m256i __A, __m256i __I, __mmask8 __U, __m256i __B) argument 3977 _mm256_maskz_permutex2var_epi64(__mmask8 __U, __m256i __A, __m256i __I, __m256i __B) argument 3985 _mm_mask_cvtepi8_epi32(__m128i __W, __mmask8 __U, __m128i __A) argument 3993 _mm_maskz_cvtepi8_epi32(__mmask8 __U, __m128i __A) argument 4001 _mm256_mask_cvtepi8_epi32(__m256i __W, __mmask8 __U, __m128i __A) argument 4009 _mm256_maskz_cvtepi8_epi32(__mmask8 __U, __m128i __A) argument 4017 _mm_mask_cvtepi8_epi64(__m128i __W, __mmask8 __U, __m128i __A) argument 4025 _mm_maskz_cvtepi8_epi64(__mmask8 __U, __m128i __A) argument 4033 _mm256_mask_cvtepi8_epi64(__m256i __W, __mmask8 __U, __m128i __A) argument 4041 _mm256_maskz_cvtepi8_epi64(__mmask8 __U, __m128i __A) argument 4081 _mm_mask_cvtepi16_epi32(__m128i __W, __mmask8 __U, __m128i __A) argument 4089 _mm_maskz_cvtepi16_epi32(__mmask8 __U, __m128i __A) argument 4097 _mm256_mask_cvtepi16_epi32(__m256i __W, __mmask8 __U, __m128i __A) argument 4105 _mm256_maskz_cvtepi16_epi32(__mmask8 __U, __m128i __A) argument 4113 _mm_mask_cvtepi16_epi64(__m128i __W, __mmask8 __U, __m128i __A) argument 4121 _mm_maskz_cvtepi16_epi64(__mmask8 __U, __m128i __A) argument 4129 _mm256_mask_cvtepi16_epi64(__m256i __W, __mmask8 __U, __m128i __A) argument 4137 _mm256_maskz_cvtepi16_epi64(__mmask8 __U, __m128i __A) argument 4146 _mm_mask_cvtepu8_epi32(__m128i __W, __mmask8 __U, __m128i __A) argument 4154 _mm_maskz_cvtepu8_epi32(__mmask8 __U, __m128i __A) argument 4162 _mm256_mask_cvtepu8_epi32(__m256i __W, __mmask8 __U, __m128i __A) argument 4170 _mm256_maskz_cvtepu8_epi32(__mmask8 __U, __m128i __A) argument 4178 _mm_mask_cvtepu8_epi64(__m128i __W, __mmask8 __U, __m128i __A) argument 4186 _mm_maskz_cvtepu8_epi64(__mmask8 __U, __m128i __A) argument 4194 _mm256_mask_cvtepu8_epi64(__m256i __W, __mmask8 __U, __m128i __A) argument 4202 _mm256_maskz_cvtepu8_epi64(__mmask8 __U, __m128i __A) argument 4242 _mm_mask_cvtepu16_epi32(__m128i __W, __mmask8 __U, __m128i __A) argument 4250 _mm_maskz_cvtepu16_epi32(__mmask8 __U, __m128i __A) argument 4258 _mm256_mask_cvtepu16_epi32(__m256i __W, __mmask8 __U, __m128i __A) argument 4266 _mm256_maskz_cvtepu16_epi32(__mmask8 __U, __m128i __A) argument 4274 _mm_mask_cvtepu16_epi64(__m128i __W, __mmask8 __U, __m128i __A) argument 4282 _mm_maskz_cvtepu16_epi64(__mmask8 __U, __m128i __A) argument 4290 _mm256_mask_cvtepu16_epi64(__m256i __W, __mmask8 __U, __m128i __A) argument 4298 _mm256_maskz_cvtepu16_epi64(__mmask8 __U, __m128i __A) argument 4359 _mm_rolv_epi32(__m128i __A, __m128i __B) argument 4365 _mm_mask_rolv_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument 4373 _mm_maskz_rolv_epi32(__mmask8 __U, __m128i __A, __m128i __B) argument 4381 _mm256_rolv_epi32(__m256i __A, __m256i __B) argument 4387 _mm256_mask_rolv_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument 4395 _mm256_maskz_rolv_epi32(__mmask8 __U, __m256i __A, __m256i __B) argument 4403 _mm_rolv_epi64(__m128i __A, __m128i __B) argument 4409 _mm_mask_rolv_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument 4417 _mm_maskz_rolv_epi64(__mmask8 __U, __m128i __A, __m128i __B) argument 4425 _mm256_rolv_epi64(__m256i __A, __m256i __B) argument 4431 _mm256_mask_rolv_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument 4439 _mm256_maskz_rolv_epi64(__mmask8 __U, __m256i __A, __m256i __B) argument 4499 _mm_mask_sll_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument 4507 _mm_maskz_sll_epi32(__mmask8 __U, __m128i __A, __m128i __B) argument 4515 _mm256_mask_sll_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m128i __B) argument 4523 _mm256_maskz_sll_epi32(__mmask8 __U, __m256i __A, __m128i __B) argument 4531 _mm_mask_slli_epi32(__m128i __W, __mmask8 __U, __m128i __A, unsigned int __B) argument 4539 _mm_maskz_slli_epi32(__mmask8 __U, __m128i __A, unsigned int __B) argument 4547 _mm256_mask_slli_epi32(__m256i __W, __mmask8 __U, __m256i __A, unsigned int __B) argument 4555 _mm256_maskz_slli_epi32(__mmask8 __U, __m256i __A, unsigned int __B) argument 4563 _mm_mask_sll_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument 4571 _mm_maskz_sll_epi64(__mmask8 __U, __m128i __A, __m128i __B) argument 4579 _mm256_mask_sll_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m128i __B) argument 4587 _mm256_maskz_sll_epi64(__mmask8 __U, __m256i __A, __m128i __B) argument 4595 _mm_mask_slli_epi64(__m128i __W, __mmask8 __U, __m128i __A, unsigned int __B) argument 4603 _mm_maskz_slli_epi64(__mmask8 __U, __m128i __A, unsigned int __B) argument 4611 _mm256_mask_slli_epi64(__m256i __W, __mmask8 __U, __m256i __A, unsigned int __B) argument 4619 _mm256_maskz_slli_epi64(__mmask8 __U, __m256i __A, unsigned int __B) argument 4627 _mm_rorv_epi32(__m128i __A, __m128i __B) argument 4633 _mm_mask_rorv_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument 4641 _mm_maskz_rorv_epi32(__mmask8 __U, __m128i __A, __m128i __B) argument 4649 _mm256_rorv_epi32(__m256i __A, __m256i __B) argument 4655 _mm256_mask_rorv_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument 4663 _mm256_maskz_rorv_epi32(__mmask8 __U, __m256i __A, __m256i __B) argument 4671 _mm_rorv_epi64(__m128i __A, __m128i __B) argument 4677 _mm_mask_rorv_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument 4685 _mm_maskz_rorv_epi64(__mmask8 __U, __m128i __A, __m128i __B) argument 4693 _mm256_rorv_epi64(__m256i __A, __m256i __B) argument 4699 _mm256_mask_rorv_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument 4707 _mm256_maskz_rorv_epi64(__mmask8 __U, __m256i __A, __m256i __B) argument 4843 _mm_mask_srl_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument 4851 _mm_maskz_srl_epi32(__mmask8 __U, __m128i __A, __m128i __B) argument 4859 _mm256_mask_srl_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m128i __B) argument 4867 _mm256_maskz_srl_epi32(__mmask8 __U, __m256i __A, __m128i __B) argument 4875 _mm_mask_srli_epi32(__m128i __W, __mmask8 __U, __m128i __A, unsigned int __B) argument 4883 _mm_maskz_srli_epi32(__mmask8 __U, __m128i __A, unsigned int __B) argument 4891 _mm256_mask_srli_epi32(__m256i __W, __mmask8 __U, __m256i __A, unsigned int __B) argument 4899 _mm256_maskz_srli_epi32(__mmask8 __U, __m256i __A, unsigned int __B) argument 4907 _mm_mask_srl_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument 4915 _mm_maskz_srl_epi64(__mmask8 __U, __m128i __A, __m128i __B) argument 4923 _mm256_mask_srl_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m128i __B) argument 4931 _mm256_maskz_srl_epi64(__mmask8 __U, __m256i __A, __m128i __B) argument 4939 _mm_mask_srli_epi64(__m128i __W, __mmask8 __U, __m128i __A, unsigned int __B) argument 4947 _mm_maskz_srli_epi64(__mmask8 __U, __m128i __A, unsigned int __B) argument 4955 _mm256_mask_srli_epi64(__m256i __W, __mmask8 __U, __m256i __A, unsigned int __B) argument 4963 _mm256_maskz_srli_epi64(__mmask8 __U, __m256i __A, unsigned int __B) argument 5047 _mm_mask_mov_epi32(__m128i __W, __mmask8 __U, __m128i __A) argument 5055 _mm_maskz_mov_epi32(__mmask8 __U, __m128i __A) argument 5064 _mm256_mask_mov_epi32(__m256i __W, __mmask8 __U, __m256i __A) argument 5072 _mm256_maskz_mov_epi32(__mmask8 __U, __m256i __A) argument 5130 _mm_store_epi32(void *__P, __m128i __A) argument 5136 _mm_mask_store_epi32(void *__P, __mmask8 __U, __m128i __A) argument 5144 _mm256_store_epi32(void *__P, __m256i __A) argument 5150 _mm256_mask_store_epi32(void *__P, __mmask8 __U, __m256i __A) argument 5158 _mm_mask_mov_epi64(__m128i __W, __mmask8 __U, __m128i __A) argument 5166 _mm_maskz_mov_epi64(__mmask8 __U, __m128i __A) argument 5174 _mm256_mask_mov_epi64(__m256i __W, __mmask8 __U, __m256i __A) argument 5182 _mm256_maskz_mov_epi64(__mmask8 __U, __m256i __A) argument 5240 _mm_store_epi64(void *__P, __m128i __A) argument 5246 _mm_mask_store_epi64(void *__P, __mmask8 __U, __m128i __A) argument 5254 _mm256_store_epi64(void *__P, __m256i __A) argument 5260 _mm256_mask_store_epi64(void *__P, __mmask8 __U, __m256i __A) argument 5268 _mm_mask_movedup_pd(__m128d __W, __mmask8 __U, __m128d __A) argument 5276 _mm_maskz_movedup_pd(__mmask8 __U, __m128d __A) argument 5284 _mm256_mask_movedup_pd(__m256d __W, __mmask8 __U, __m256d __A) argument 5292 _mm256_maskz_movedup_pd(__mmask8 __U, __m256d __A) argument 5300 _mm_mask_set1_epi32(__m128i __O, __mmask8 __M, int __A) argument 5308 _mm_maskz_set1_epi32( __mmask8 __M, int __A) argument 5316 _mm256_mask_set1_epi32(__m256i __O, __mmask8 __M, int __A) argument 5324 _mm256_maskz_set1_epi32( __mmask8 __M, int __A) argument 5333 _mm_mask_set1_epi64(__m128i __O, __mmask8 __M, long long __A) argument 5341 _mm_maskz_set1_epi64(__mmask8 __M, long long __A) argument 5349 _mm256_mask_set1_epi64(__m256i __O, __mmask8 __M, long long __A) argument 5357 _mm256_maskz_set1_epi64(__mmask8 __M, long long __A) argument 5677 _mm_mask_store_pd(void *__P, __mmask8 __U, __m128d __A) argument 5685 _mm256_mask_store_pd(void *__P, __mmask8 __U, __m256d __A) argument 5693 _mm_mask_store_ps(void *__P, __mmask8 __U, __m128 __A) argument 5701 _mm256_mask_store_ps(void *__P, __mmask8 __U, __m256 __A) argument 5709 _mm_storeu_epi64(void *__P, __m128i __A) argument 5718 _mm_mask_storeu_epi64(void *__P, __mmask8 __U, __m128i __A) argument 5726 _mm256_storeu_epi64(void *__P, __m256i __A) argument 5735 _mm256_mask_storeu_epi64(void *__P, __mmask8 __U, __m256i __A) argument 5743 _mm_storeu_epi32(void *__P, __m128i __A) argument 5752 _mm_mask_storeu_epi32(void *__P, __mmask8 __U, __m128i __A) argument 5760 _mm256_storeu_epi32(void *__P, __m256i __A) argument 5769 _mm256_mask_storeu_epi32(void *__P, __mmask8 __U, __m256i __A) argument 5777 _mm_mask_storeu_pd(void *__P, __mmask8 __U, __m128d __A) argument 5785 _mm256_mask_storeu_pd(void *__P, __mmask8 __U, __m256d __A) argument 5793 _mm_mask_storeu_ps(void *__P, __mmask8 __U, __m128 __A) argument 5801 _mm256_mask_storeu_ps(void *__P, __mmask8 __U, __m256 __A) argument 5810 _mm_mask_unpackhi_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) argument 5818 _mm_maskz_unpackhi_pd(__mmask8 __U, __m128d __A, __m128d __B) argument 5826 _mm256_mask_unpackhi_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) argument 5834 _mm256_maskz_unpackhi_pd(__mmask8 __U, __m256d __A, __m256d __B) argument 5842 _mm_mask_unpackhi_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) argument 5850 _mm_maskz_unpackhi_ps(__mmask8 __U, __m128 __A, __m128 __B) argument 5858 _mm256_mask_unpackhi_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) argument 5866 _mm256_maskz_unpackhi_ps(__mmask8 __U, __m256 __A, __m256 __B) argument 5874 _mm_mask_unpacklo_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) argument 5882 _mm_maskz_unpacklo_pd(__mmask8 __U, __m128d __A, __m128d __B) argument 5890 _mm256_mask_unpacklo_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) argument 5898 _mm256_maskz_unpacklo_pd(__mmask8 __U, __m256d __A, __m256d __B) argument 5906 _mm_mask_unpacklo_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) argument 5914 _mm_maskz_unpacklo_ps(__mmask8 __U, __m128 __A, __m128 __B) argument 5922 _mm256_mask_unpacklo_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) argument 5930 _mm256_maskz_unpacklo_ps(__mmask8 __U, __m256 __A, __m256 __B) argument 5938 _mm_rcp14_pd(__m128d __A) argument 5947 _mm_mask_rcp14_pd(__m128d __W, __mmask8 __U, __m128d __A) argument 5955 _mm_maskz_rcp14_pd(__mmask8 __U, __m128d __A) argument 5964 _mm256_rcp14_pd(__m256d __A) argument 5973 _mm256_mask_rcp14_pd(__m256d __W, __mmask8 __U, __m256d __A) argument 5981 _mm256_maskz_rcp14_pd(__mmask8 __U, __m256d __A) argument 5990 _mm_rcp14_ps(__m128 __A) argument 5999 _mm_mask_rcp14_ps(__m128 __W, __mmask8 __U, __m128 __A) argument 6007 _mm_maskz_rcp14_ps(__mmask8 __U, __m128 __A) argument 6016 _mm256_rcp14_ps(__m256 __A) argument 6025 _mm256_mask_rcp14_ps(__m256 __W, __mmask8 __U, __m256 __A) argument 6033 _mm256_maskz_rcp14_ps(__mmask8 __U, __m256 __A) argument 6082 _mm_mask_permutevar_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128i __C) argument 6090 _mm_maskz_permutevar_pd(__mmask8 __U, __m128d __A, __m128i __C) argument 6098 _mm256_mask_permutevar_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256i __C) argument 6106 _mm256_maskz_permutevar_pd(__mmask8 __U, __m256d __A, __m256i __C) argument 6114 _mm_mask_permutevar_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128i __C) argument 6122 _mm_maskz_permutevar_ps(__mmask8 __U, __m128 __A, __m128i __C) argument 6130 _mm256_mask_permutevar_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256i __C) argument 6138 _mm256_maskz_permutevar_ps(__mmask8 __U, __m256 __A, __m256i __C) argument 6146 _mm_test_epi32_mask(__m128i __A, __m128i __B) argument 6152 _mm_mask_test_epi32_mask(__mmask8 __U, __m128i __A, __m128i __B) argument 6159 _mm256_test_epi32_mask(__m256i __A, __m256i __B) argument 6166 _mm256_mask_test_epi32_mask(__mmask8 __U, __m256i __A, __m256i __B) argument 6173 _mm_test_epi64_mask(__m128i __A, __m128i __B) argument 6179 _mm_mask_test_epi64_mask(__mmask8 __U, __m128i __A, __m128i __B) argument 6186 _mm256_test_epi64_mask(__m256i __A, __m256i __B) argument 6193 _mm256_mask_test_epi64_mask(__mmask8 __U, __m256i __A, __m256i __B) argument 6200 _mm_testn_epi32_mask(__m128i __A, __m128i __B) argument 6206 _mm_mask_testn_epi32_mask(__mmask8 __U, __m128i __A, __m128i __B) argument 6213 _mm256_testn_epi32_mask(__m256i __A, __m256i __B) argument 6220 _mm256_mask_testn_epi32_mask(__mmask8 __U, __m256i __A, __m256i __B) argument 6227 _mm_testn_epi64_mask(__m128i __A, __m128i __B) argument 6233 _mm_mask_testn_epi64_mask(__mmask8 __U, __m128i __A, __m128i __B) argument 6240 _mm256_testn_epi64_mask(__m256i __A, __m256i __B) argument 6247 _mm256_mask_testn_epi64_mask(__mmask8 __U, __m256i __A, __m256i __B) argument 6254 _mm_mask_unpackhi_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument 6262 _mm_maskz_unpackhi_epi32(__mmask8 __U, __m128i __A, __m128i __B) argument 6270 _mm256_mask_unpackhi_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument 6278 _mm256_maskz_unpackhi_epi32(__mmask8 __U, __m256i __A, __m256i __B) argument 6286 _mm_mask_unpackhi_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument 6294 _mm_maskz_unpackhi_epi64(__mmask8 __U, __m128i __A, __m128i __B) argument 6302 _mm256_mask_unpackhi_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument 6310 _mm256_maskz_unpackhi_epi64(__mmask8 __U, __m256i __A, __m256i __B) argument 6318 _mm_mask_unpacklo_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument 6326 _mm_maskz_unpacklo_epi32(__mmask8 __U, __m128i __A, __m128i __B) argument 6334 _mm256_mask_unpacklo_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument 6342 _mm256_maskz_unpacklo_epi32(__mmask8 __U, __m256i __A, __m256i __B) argument 6350 _mm_mask_unpacklo_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument 6358 _mm_maskz_unpacklo_epi64(__mmask8 __U, __m128i __A, __m128i __B) argument 6366 _mm256_mask_unpacklo_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) argument 6374 _mm256_maskz_unpacklo_epi64(__mmask8 __U, __m256i __A, __m256i __B) argument 6382 _mm_mask_sra_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument 6390 _mm_maskz_sra_epi32(__mmask8 __U, __m128i __A, __m128i __B) argument 6398 _mm256_mask_sra_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m128i __B) argument 6406 _mm256_maskz_sra_epi32(__mmask8 __U, __m256i __A, __m128i __B) argument 6414 _mm_mask_srai_epi32(__m128i __W, __mmask8 __U, __m128i __A, unsigned int __B) argument 6422 _mm_maskz_srai_epi32(__mmask8 __U, __m128i __A, unsigned int __B) argument 6430 _mm256_mask_srai_epi32(__m256i __W, __mmask8 __U, __m256i __A, unsigned int __B) argument 6438 _mm256_maskz_srai_epi32(__mmask8 __U, __m256i __A, unsigned int __B) argument 6446 _mm_sra_epi64(__m128i __A, __m128i __B) argument 6452 _mm_mask_sra_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) argument 6460 _mm_maskz_sra_epi64(__mmask8 __U, __m128i __A, __m128i __B) argument 6468 _mm256_sra_epi64(__m256i __A, __m128i __B) argument 6474 _mm256_mask_sra_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m128i __B) argument 6482 _mm256_maskz_sra_epi64(__mmask8 __U, __m256i __A, __m128i __B) argument 6490 _mm_srai_epi64(__m128i __A, unsigned int __imm) argument 6496 _mm_mask_srai_epi64(__m128i __W, __mmask8 __U, __m128i __A, unsigned int __imm) argument 6504 _mm_maskz_srai_epi64(__mmask8 __U, __m128i __A, unsigned int __imm) argument 6512 _mm256_srai_epi64(__m256i __A, unsigned int __imm) argument 6518 _mm256_mask_srai_epi64(__m256i __W, __mmask8 __U, __m256i __A, unsigned int __imm) argument 6527 _mm256_maskz_srai_epi64(__mmask8 __U, __m256i __A, unsigned int __imm) argument 6692 _mm_rsqrt14_pd(__m128d __A) argument 6701 _mm_mask_rsqrt14_pd(__m128d __W, __mmask8 __U, __m128d __A) argument 6709 _mm_maskz_rsqrt14_pd(__mmask8 __U, __m128d __A) argument 6718 _mm256_rsqrt14_pd(__m256d __A) argument 6727 _mm256_mask_rsqrt14_pd(__m256d __W, __mmask8 __U, __m256d __A) argument 6735 _mm256_maskz_rsqrt14_pd(__mmask8 __U, __m256d __A) argument 6744 _mm_rsqrt14_ps(__m128 __A) argument 6753 _mm_mask_rsqrt14_ps(__m128 __W, __mmask8 __U, __m128 __A) argument 6761 _mm_maskz_rsqrt14_ps(__mmask8 __U, __m128 __A) argument 6770 _mm256_rsqrt14_ps(__m256 __A) argument 6779 _mm256_mask_rsqrt14_ps(__m256 __W, __mmask8 __U, __m256 __A) argument 6787 _mm256_maskz_rsqrt14_ps(__mmask8 __U, __m256 __A) argument 6796 _mm256_broadcast_f32x4(__m128 __A) argument 6803 _mm256_mask_broadcast_f32x4(__m256 __O, __mmask8 __M, __m128 __A) argument 6811 _mm256_maskz_broadcast_f32x4(__mmask8 __M, __m128 __A) argument 6819 _mm256_broadcast_i32x4(__m128i __A) argument 6826 _mm256_mask_broadcast_i32x4(__m256i __O, __mmask8 __M, __m128i __A) argument 6834 _mm256_maskz_broadcast_i32x4(__mmask8 __M, __m128i __A) argument 6842 _mm256_mask_broadcastsd_pd(__m256d __O, __mmask8 __M, __m128d __A) argument 6850 _mm256_maskz_broadcastsd_pd(__mmask8 __M, __m128d __A) argument 6858 _mm_mask_broadcastss_ps(__m128 __O, __mmask8 __M, __m128 __A) argument 6866 _mm_maskz_broadcastss_ps(__mmask8 __M, __m128 __A) argument 6874 _mm256_mask_broadcastss_ps(__m256 __O, __mmask8 __M, __m128 __A) argument 6882 _mm256_maskz_broadcastss_ps(__mmask8 __M, __m128 __A) argument 6890 _mm_mask_broadcastd_epi32(__m128i __O, __mmask8 __M, __m128i __A) argument 6898 _mm_maskz_broadcastd_epi32(__mmask8 __M, __m128i __A) argument 6906 _mm256_mask_broadcastd_epi32(__m256i __O, __mmask8 __M, __m128i __A) argument 6914 _mm256_maskz_broadcastd_epi32(__mmask8 __M, __m128i __A) argument 6922 _mm_mask_broadcastq_epi64(__m128i __O, __mmask8 __M, __m128i __A) argument 6930 _mm_maskz_broadcastq_epi64(__mmask8 __M, __m128i __A) argument 6938 _mm256_mask_broadcastq_epi64(__m256i __O, __mmask8 __M, __m128i __A) argument 6946 _mm256_maskz_broadcastq_epi64(__mmask8 __M, __m128i __A) argument 6954 _mm_cvtsepi32_epi8(__m128i __A) argument 6962 _mm_mask_cvtsepi32_epi8(__m128i __O, __mmask8 __M, __m128i __A) argument 6969 _mm_maskz_cvtsepi32_epi8(__mmask8 __M, __m128i __A) argument 6977 _mm_mask_cvtsepi32_storeu_epi8(void * __P, __mmask8 __M, __m128i __A) argument 6983 _mm256_cvtsepi32_epi8(__m256i __A) argument 6991 _mm256_mask_cvtsepi32_epi8(__m128i __O, __mmask8 __M, __m256i __A) argument 6998 _mm256_maskz_cvtsepi32_epi8(__mmask8 __M, __m256i __A) argument 7006 _mm256_mask_cvtsepi32_storeu_epi8(void * __P, __mmask8 __M, __m256i __A) argument 7012 _mm_cvtsepi32_epi16(__m128i __A) argument 7020 _mm_mask_cvtsepi32_epi16(__m128i __O, __mmask8 __M, __m128i __A) argument 7028 _mm_maskz_cvtsepi32_epi16(__mmask8 __M, __m128i __A) argument 7036 _mm_mask_cvtsepi32_storeu_epi16(void * __P, __mmask8 __M, __m128i __A) argument 7042 _mm256_cvtsepi32_epi16(__m256i __A) argument 7050 _mm256_mask_cvtsepi32_epi16(__m128i __O, __mmask8 __M, __m256i __A) argument 7057 _mm256_maskz_cvtsepi32_epi16(__mmask8 __M, __m256i __A) argument 7065 _mm256_mask_cvtsepi32_storeu_epi16(void * __P, __mmask8 __M, __m256i __A) argument 7071 _mm_cvtsepi64_epi8(__m128i __A) argument 7079 _mm_mask_cvtsepi64_epi8(__m128i __O, __mmask8 __M, __m128i __A) argument 7086 _mm_maskz_cvtsepi64_epi8(__mmask8 __M, __m128i __A) argument 7094 _mm_mask_cvtsepi64_storeu_epi8(void * __P, __mmask8 __M, __m128i __A) argument 7100 _mm256_cvtsepi64_epi8(__m256i __A) argument 7108 _mm256_mask_cvtsepi64_epi8(__m128i __O, __mmask8 __M, __m256i __A) argument 7115 _mm256_maskz_cvtsepi64_epi8(__mmask8 __M, __m256i __A) argument 7123 _mm256_mask_cvtsepi64_storeu_epi8(void * __P, __mmask8 __M, __m256i __A) argument 7129 _mm_cvtsepi64_epi32(__m128i __A) argument 7137 _mm_mask_cvtsepi64_epi32(__m128i __O, __mmask8 __M, __m128i __A) argument 7144 _mm_maskz_cvtsepi64_epi32(__mmask8 __M, __m128i __A) argument 7152 _mm_mask_cvtsepi64_storeu_epi32(void * __P, __mmask8 __M, __m128i __A) argument 7158 _mm256_cvtsepi64_epi32(__m256i __A) argument 7166 _mm256_mask_cvtsepi64_epi32(__m128i __O, __mmask8 __M, __m256i __A) argument 7174 _mm256_maskz_cvtsepi64_epi32(__mmask8 __M, __m256i __A) argument 7182 _mm256_mask_cvtsepi64_storeu_epi32(void * __P, __mmask8 __M, __m256i __A) argument 7188 _mm_cvtsepi64_epi16(__m128i __A) argument 7196 _mm_mask_cvtsepi64_epi16(__m128i __O, __mmask8 __M, __m128i __A) argument 7203 _mm_maskz_cvtsepi64_epi16(__mmask8 __M, __m128i __A) argument 7211 _mm_mask_cvtsepi64_storeu_epi16(void * __P, __mmask8 __M, __m128i __A) argument 7217 _mm256_cvtsepi64_epi16(__m256i __A) argument 7225 _mm256_mask_cvtsepi64_epi16(__m128i __O, __mmask8 __M, __m256i __A) argument 7232 _mm256_maskz_cvtsepi64_epi16(__mmask8 __M, __m256i __A) argument 7240 _mm256_mask_cvtsepi64_storeu_epi16(void * __P, __mmask8 __M, __m256i __A) argument 7246 _mm_cvtusepi32_epi8(__m128i __A) argument 7254 _mm_mask_cvtusepi32_epi8(__m128i __O, __mmask8 __M, __m128i __A) argument 7262 _mm_maskz_cvtusepi32_epi8(__mmask8 __M, __m128i __A) argument 7270 _mm_mask_cvtusepi32_storeu_epi8(void * __P, __mmask8 __M, __m128i __A) argument 7276 _mm256_cvtusepi32_epi8(__m256i __A) argument 7284 _mm256_mask_cvtusepi32_epi8(__m128i __O, __mmask8 __M, __m256i __A) argument 7292 _mm256_maskz_cvtusepi32_epi8(__mmask8 __M, __m256i __A) argument 7300 _mm256_mask_cvtusepi32_storeu_epi8(void * __P, __mmask8 __M, __m256i __A) argument 7306 _mm_cvtusepi32_epi16(__m128i __A) argument 7314 _mm_mask_cvtusepi32_epi16(__m128i __O, __mmask8 __M, __m128i __A) argument 7321 _mm_maskz_cvtusepi32_epi16(__mmask8 __M, __m128i __A) argument 7329 _mm_mask_cvtusepi32_storeu_epi16(void * __P, __mmask8 __M, __m128i __A) argument 7335 _mm256_cvtusepi32_epi16(__m256i __A) argument 7343 _mm256_mask_cvtusepi32_epi16(__m128i __O, __mmask8 __M, __m256i __A) argument 7350 _mm256_maskz_cvtusepi32_epi16(__mmask8 __M, __m256i __A) argument 7358 _mm256_mask_cvtusepi32_storeu_epi16(void * __P, __mmask8 __M, __m256i __A) argument 7364 _mm_cvtusepi64_epi8(__m128i __A) argument 7372 _mm_mask_cvtusepi64_epi8(__m128i __O, __mmask8 __M, __m128i __A) argument 7380 _mm_maskz_cvtusepi64_epi8(__mmask8 __M, __m128i __A) argument 7388 _mm_mask_cvtusepi64_storeu_epi8(void * __P, __mmask8 __M, __m128i __A) argument 7394 _mm256_cvtusepi64_epi8(__m256i __A) argument 7402 _mm256_mask_cvtusepi64_epi8(__m128i __O, __mmask8 __M, __m256i __A) argument 7410 _mm256_maskz_cvtusepi64_epi8(__mmask8 __M, __m256i __A) argument 7418 _mm256_mask_cvtusepi64_storeu_epi8(void * __P, __mmask8 __M, __m256i __A) argument 7424 _mm_cvtusepi64_epi32(__m128i __A) argument 7432 _mm_mask_cvtusepi64_epi32(__m128i __O, __mmask8 __M, __m128i __A) argument 7439 _mm_maskz_cvtusepi64_epi32(__mmask8 __M, __m128i __A) argument 7447 _mm_mask_cvtusepi64_storeu_epi32(void * __P, __mmask8 __M, __m128i __A) argument 7453 _mm256_cvtusepi64_epi32(__m256i __A) argument 7461 _mm256_mask_cvtusepi64_epi32(__m128i __O, __mmask8 __M, __m256i __A) argument 7468 _mm256_maskz_cvtusepi64_epi32(__mmask8 __M, __m256i __A) argument 7476 _mm256_mask_cvtusepi64_storeu_epi32(void * __P, __mmask8 __M, __m256i __A) argument 7482 _mm_cvtusepi64_epi16(__m128i __A) argument 7490 _mm_mask_cvtusepi64_epi16(__m128i __O, __mmask8 __M, __m128i __A) argument 7497 _mm_maskz_cvtusepi64_epi16(__mmask8 __M, __m128i __A) argument 7505 _mm_mask_cvtusepi64_storeu_epi16(void * __P, __mmask8 __M, __m128i __A) argument 7511 _mm256_cvtusepi64_epi16(__m256i __A) argument 7519 _mm256_mask_cvtusepi64_epi16(__m128i __O, __mmask8 __M, __m256i __A) argument 7526 _mm256_maskz_cvtusepi64_epi16(__mmask8 __M, __m256i __A) argument 7534 _mm256_mask_cvtusepi64_storeu_epi16(void * __P, __mmask8 __M, __m256i __A) argument 7540 _mm_cvtepi32_epi8(__m128i __A) argument 7548 _mm_mask_cvtepi32_epi8(__m128i __O, __mmask8 __M, __m128i __A) argument 7555 _mm_maskz_cvtepi32_epi8(__mmask8 __M, __m128i __A) argument 7564 _mm_mask_cvtepi32_storeu_epi8(void * __P, __mmask8 __M, __m128i __A) argument 7570 _mm256_cvtepi32_epi8(__m256i __A) argument 7579 _mm256_mask_cvtepi32_epi8(__m128i __O, __mmask8 __M, __m256i __A) argument 7586 _mm256_maskz_cvtepi32_epi8(__mmask8 __M, __m256i __A) argument 7594 _mm256_mask_cvtepi32_storeu_epi8(void * __P, __mmask8 __M, __m256i __A) argument 7600 _mm_cvtepi32_epi16(__m128i __A) argument 7608 _mm_mask_cvtepi32_epi16(__m128i __O, __mmask8 __M, __m128i __A) argument 7615 _mm_maskz_cvtepi32_epi16(__mmask8 __M, __m128i __A) argument 7623 _mm_mask_cvtepi32_storeu_epi16(void * __P, __mmask8 __M, __m128i __A) argument 7629 _mm256_cvtepi32_epi16(__m256i __A) argument 7635 _mm256_mask_cvtepi32_epi16(__m128i __O, __mmask8 __M, __m256i __A) argument 7642 _mm256_maskz_cvtepi32_epi16(__mmask8 __M, __m256i __A) argument 7650 _mm256_mask_cvtepi32_storeu_epi16(void * __P, __mmask8 __M, __m256i __A) argument 7656 _mm_cvtepi64_epi8(__m128i __A) argument 7664 _mm_mask_cvtepi64_epi8(__m128i __O, __mmask8 __M, __m128i __A) argument 7671 _mm_maskz_cvtepi64_epi8(__mmask8 __M, __m128i __A) argument 7679 _mm_mask_cvtepi64_storeu_epi8(void * __P, __mmask8 __M, __m128i __A) argument 7685 _mm256_cvtepi64_epi8(__m256i __A) argument 7693 _mm256_mask_cvtepi64_epi8(__m128i __O, __mmask8 __M, __m256i __A) argument 7700 _mm256_maskz_cvtepi64_epi8(__mmask8 __M, __m256i __A) argument 7708 _mm256_mask_cvtepi64_storeu_epi8(void * __P, __mmask8 __M, __m256i __A) argument 7714 _mm_cvtepi64_epi32(__m128i __A) argument 7721 _mm_mask_cvtepi64_epi32(__m128i __O, __mmask8 __M, __m128i __A) argument 7728 _mm_maskz_cvtepi64_epi32(__mmask8 __M, __m128i __A) argument 7736 _mm_mask_cvtepi64_storeu_epi32(void * __P, __mmask8 __M, __m128i __A) argument 7742 _mm256_cvtepi64_epi32(__m256i __A) argument 7748 _mm256_mask_cvtepi64_epi32(__m128i __O, __mmask8 __M, __m256i __A) argument 7756 _mm256_maskz_cvtepi64_epi32(__mmask8 __M, __m256i __A) argument 7764 _mm256_mask_cvtepi64_storeu_epi32(void * __P, __mmask8 __M, __m256i __A) argument 7770 _mm_cvtepi64_epi16(__m128i __A) argument 7778 _mm_mask_cvtepi64_epi16(__m128i __O, __mmask8 __M, __m128i __A) argument 7786 _mm_maskz_cvtepi64_epi16(__mmask8 __M, __m128i __A) argument 7794 _mm_mask_cvtepi64_storeu_epi16(void * __P, __mmask8 __M, __m128i __A) argument 7800 _mm256_cvtepi64_epi16(__m256i __A) argument 7808 _mm256_mask_cvtepi64_epi16(__m128i __O, __mmask8 __M, __m256i __A) argument 7815 _mm256_maskz_cvtepi64_epi16(__mmask8 __M, __m256i __A) argument 7823 _mm256_mask_cvtepi64_storeu_epi16(void * __P, __mmask8 __M, __m256i __A) argument 8226 _mm_mask_movehdup_ps(__m128 __W, __mmask8 __U, __m128 __A) argument 8234 _mm_maskz_movehdup_ps(__mmask8 __U, __m128 __A) argument 8242 _mm256_mask_movehdup_ps(__m256 __W, __mmask8 __U, __m256 __A) argument 8250 _mm256_maskz_movehdup_ps(__mmask8 __U, __m256 __A) argument 8258 _mm_mask_moveldup_ps(__m128 __W, __mmask8 __U, __m128 __A) argument 8266 _mm_maskz_moveldup_ps(__mmask8 __U, __m128 __A) argument 8274 _mm256_mask_moveldup_ps(__m256 __W, __mmask8 __U, __m256 __A) argument 8282 _mm256_maskz_moveldup_ps(__mmask8 __U, __m256 __A) argument 8310 _mm_mask_mov_pd(__m128d __W, __mmask8 __U, __m128d __A) argument 8318 _mm_maskz_mov_pd(__mmask8 __U, __m128d __A) argument 8326 _mm256_mask_mov_pd(__m256d __W, __mmask8 __U, __m256d __A) argument 8334 _mm256_maskz_mov_pd(__mmask8 __U, __m256d __A) argument 8342 _mm_mask_mov_ps(__m128 __W, __mmask8 __U, __m128 __A) argument 8350 _mm_maskz_mov_ps(__mmask8 __U, __m128 __A) argument 8358 _mm256_mask_mov_ps(__m256 __W, __mmask8 __U, __m256 __A) argument 8366 _mm256_maskz_mov_ps(__mmask8 __U, __m256 __A) argument 8374 _mm_mask_cvtph_ps(__m128 __W, __mmask8 __U, __m128i __A) argument 8382 _mm_maskz_cvtph_ps(__mmask8 __U, __m128i __A) argument 8391 _mm256_mask_cvtph_ps(__m256 __W, __mmask8 __U, __m128i __A) argument 8399 _mm256_maskz_cvtph_ps(__mmask8 __U, __m128i __A) argument [all...] |
H A D | avx512vldqintrin.h | 28 _mm256_mullo_epi64 (__m256i __A, __m256i __B) { argument 29 return (__m256i) ((__v4du) __A * (__v4du) __B); 33 _mm256_mask_mullo_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B) { argument 35 (__v4di)_mm256_mullo_epi64(__A, __B), 40 _mm256_maskz_mullo_epi64(__mmask8 __U, __m256i __A, __m256i __B) { argument 42 (__v4di)_mm256_mullo_epi64(__A, __B), 47 _mm_mullo_epi64 (__m128i __A, __m128i __B) { argument 48 return (__m128i) ((__v2du) __A * (__v2du) __B); 52 _mm_mask_mullo_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B) { argument 54 (__v2di)_mm_mullo_epi64(__A, __ 59 _mm_maskz_mullo_epi64(__mmask8 __U, __m128i __A, __m128i __B) argument 66 _mm256_mask_andnot_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) argument 73 _mm256_maskz_andnot_pd(__mmask8 __U, __m256d __A, __m256d __B) argument 80 _mm_mask_andnot_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) argument 87 _mm_maskz_andnot_pd(__mmask8 __U, __m128d __A, __m128d __B) argument 94 _mm256_mask_andnot_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) argument 101 _mm256_maskz_andnot_ps(__mmask8 __U, __m256 __A, __m256 __B) argument 108 _mm_mask_andnot_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) argument 115 _mm_maskz_andnot_ps(__mmask8 __U, __m128 __A, __m128 __B) argument 122 _mm256_mask_and_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) argument 129 _mm256_maskz_and_pd(__mmask8 __U, __m256d __A, __m256d __B) argument 136 _mm_mask_and_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) argument 143 _mm_maskz_and_pd(__mmask8 __U, __m128d __A, __m128d __B) argument 150 _mm256_mask_and_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) argument 157 _mm256_maskz_and_ps(__mmask8 __U, __m256 __A, __m256 __B) argument 164 _mm_mask_and_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) argument 171 _mm_maskz_and_ps(__mmask8 __U, __m128 __A, __m128 __B) argument 178 _mm256_mask_xor_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) argument 185 _mm256_maskz_xor_pd(__mmask8 __U, __m256d __A, __m256d __B) argument 192 _mm_mask_xor_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) argument 199 _mm_maskz_xor_pd(__mmask8 __U, __m128d __A, __m128d __B) argument 206 _mm256_mask_xor_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) argument 213 _mm256_maskz_xor_ps(__mmask8 __U, __m256 __A, __m256 __B) argument 220 _mm_mask_xor_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) argument 227 _mm_maskz_xor_ps(__mmask8 __U, __m128 __A, __m128 __B) argument 234 _mm256_mask_or_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) argument 241 _mm256_maskz_or_pd(__mmask8 __U, __m256d __A, __m256d __B) argument 248 _mm_mask_or_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) argument 255 _mm_maskz_or_pd(__mmask8 __U, __m128d __A, __m128d __B) argument 262 _mm256_mask_or_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) argument 269 _mm256_maskz_or_ps(__mmask8 __U, __m256 __A, __m256 __B) argument 276 _mm_mask_or_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) argument 283 _mm_maskz_or_ps(__mmask8 __U, __m128 __A, __m128 __B) argument 290 _mm_cvtpd_epi64(__m128d __A) argument 297 _mm_mask_cvtpd_epi64(__m128i __W, __mmask8 __U, __m128d __A) argument 304 _mm_maskz_cvtpd_epi64(__mmask8 __U, __m128d __A) argument 311 _mm256_cvtpd_epi64(__m256d __A) argument 318 _mm256_mask_cvtpd_epi64(__m256i __W, __mmask8 __U, __m256d __A) argument 325 _mm256_maskz_cvtpd_epi64(__mmask8 __U, __m256d __A) argument 332 _mm_cvtpd_epu64(__m128d __A) argument 339 _mm_mask_cvtpd_epu64(__m128i __W, __mmask8 __U, __m128d __A) argument 346 _mm_maskz_cvtpd_epu64(__mmask8 __U, __m128d __A) argument 353 _mm256_cvtpd_epu64(__m256d __A) argument 360 _mm256_mask_cvtpd_epu64(__m256i __W, __mmask8 __U, __m256d __A) argument 367 _mm256_maskz_cvtpd_epu64(__mmask8 __U, __m256d __A) argument 374 _mm_cvtps_epi64(__m128 __A) argument 381 _mm_mask_cvtps_epi64(__m128i __W, __mmask8 __U, __m128 __A) argument 388 _mm_maskz_cvtps_epi64(__mmask8 __U, __m128 __A) argument 395 _mm256_cvtps_epi64(__m128 __A) argument 402 _mm256_mask_cvtps_epi64(__m256i __W, __mmask8 __U, __m128 __A) argument 409 _mm256_maskz_cvtps_epi64(__mmask8 __U, __m128 __A) argument 416 _mm_cvtps_epu64(__m128 __A) argument 423 _mm_mask_cvtps_epu64(__m128i __W, __mmask8 __U, __m128 __A) argument 430 _mm_maskz_cvtps_epu64(__mmask8 __U, __m128 __A) argument 437 _mm256_cvtps_epu64(__m128 __A) argument 444 _mm256_mask_cvtps_epu64(__m256i __W, __mmask8 __U, __m128 __A) argument 451 _mm256_maskz_cvtps_epu64(__mmask8 __U, __m128 __A) argument 458 _mm_cvtepi64_pd(__m128i __A) argument 463 _mm_mask_cvtepi64_pd(__m128d __W, __mmask8 __U, __m128i __A) argument 470 _mm_maskz_cvtepi64_pd(__mmask8 __U, __m128i __A) argument 477 _mm256_cvtepi64_pd(__m256i __A) argument 482 _mm256_mask_cvtepi64_pd(__m256d __W, __mmask8 __U, __m256i __A) argument 489 _mm256_maskz_cvtepi64_pd(__mmask8 __U, __m256i __A) argument 496 _mm_cvtepi64_ps(__m128i __A) argument 503 _mm_mask_cvtepi64_ps(__m128 __W, __mmask8 __U, __m128i __A) argument 510 _mm_maskz_cvtepi64_ps(__mmask8 __U, __m128i __A) argument 517 _mm256_cvtepi64_ps(__m256i __A) argument 522 _mm256_mask_cvtepi64_ps(__m128 __W, __mmask8 __U, __m256i __A) argument 529 _mm256_maskz_cvtepi64_ps(__mmask8 __U, __m256i __A) argument 536 _mm_cvttpd_epi64(__m128d __A) argument 543 _mm_mask_cvttpd_epi64(__m128i __W, __mmask8 __U, __m128d __A) argument 550 _mm_maskz_cvttpd_epi64(__mmask8 __U, __m128d __A) argument 557 _mm256_cvttpd_epi64(__m256d __A) argument 564 _mm256_mask_cvttpd_epi64(__m256i __W, __mmask8 __U, __m256d __A) argument 571 _mm256_maskz_cvttpd_epi64(__mmask8 __U, __m256d __A) argument 578 _mm_cvttpd_epu64(__m128d __A) argument 585 _mm_mask_cvttpd_epu64(__m128i __W, __mmask8 __U, __m128d __A) argument 592 _mm_maskz_cvttpd_epu64(__mmask8 __U, __m128d __A) argument 599 _mm256_cvttpd_epu64(__m256d __A) argument 606 _mm256_mask_cvttpd_epu64(__m256i __W, __mmask8 __U, __m256d __A) argument 613 _mm256_maskz_cvttpd_epu64(__mmask8 __U, __m256d __A) argument 620 _mm_cvttps_epi64(__m128 __A) argument 627 _mm_mask_cvttps_epi64(__m128i __W, __mmask8 __U, __m128 __A) argument 634 _mm_maskz_cvttps_epi64(__mmask8 __U, __m128 __A) argument 641 _mm256_cvttps_epi64(__m128 __A) argument 648 _mm256_mask_cvttps_epi64(__m256i __W, __mmask8 __U, __m128 __A) argument 655 _mm256_maskz_cvttps_epi64(__mmask8 __U, __m128 __A) argument 662 _mm_cvttps_epu64(__m128 __A) argument 669 _mm_mask_cvttps_epu64(__m128i __W, __mmask8 __U, __m128 __A) argument 676 _mm_maskz_cvttps_epu64(__mmask8 __U, __m128 __A) argument 683 _mm256_cvttps_epu64(__m128 __A) argument 690 _mm256_mask_cvttps_epu64(__m256i __W, __mmask8 __U, __m128 __A) argument 697 _mm256_maskz_cvttps_epu64(__mmask8 __U, __m128 __A) argument 704 _mm_cvtepu64_pd(__m128i __A) argument 709 _mm_mask_cvtepu64_pd(__m128d __W, __mmask8 __U, __m128i __A) argument 716 _mm_maskz_cvtepu64_pd(__mmask8 __U, __m128i __A) argument 723 _mm256_cvtepu64_pd(__m256i __A) argument 728 _mm256_mask_cvtepu64_pd(__m256d __W, __mmask8 __U, __m256i __A) argument 735 _mm256_maskz_cvtepu64_pd(__mmask8 __U, __m256i __A) argument 742 _mm_cvtepu64_ps(__m128i __A) argument 749 _mm_mask_cvtepu64_ps(__m128 __W, __mmask8 __U, __m128i __A) argument 756 _mm_maskz_cvtepu64_ps(__mmask8 __U, __m128i __A) argument 763 _mm256_cvtepu64_ps(__m256i __A) argument 768 _mm256_mask_cvtepu64_ps(__m128 __W, __mmask8 __U, __m256i __A) argument 775 _mm256_maskz_cvtepu64_ps(__mmask8 __U, __m256i __A) argument 912 _mm_movepi32_mask(__m128i __A) argument 918 _mm256_movepi32_mask(__m256i __A) argument 924 _mm_movm_epi32(__mmask8 __A) argument 930 _mm256_movm_epi32(__mmask8 __A) argument 936 _mm_movm_epi64(__mmask8 __A) argument 942 _mm256_movm_epi64(__mmask8 __A) argument 948 _mm_movepi64_mask(__m128i __A) argument 954 _mm256_movepi64_mask(__m256i __A) argument 960 _mm256_broadcast_f32x2(__m128 __A) argument 967 _mm256_mask_broadcast_f32x2(__m256 __O, __mmask8 __M, __m128 __A) argument 975 _mm256_maskz_broadcast_f32x2(__mmask8 __M, __m128 __A) argument 983 _mm256_broadcast_f64x2(__m128d __A) argument 990 _mm256_mask_broadcast_f64x2(__m256d __O, __mmask8 __M, __m128d __A) argument 998 _mm256_maskz_broadcast_f64x2(__mmask8 __M, __m128d __A) argument 1006 _mm_broadcast_i32x2(__m128i __A) argument 1013 _mm_mask_broadcast_i32x2(__m128i __O, __mmask8 __M, __m128i __A) argument 1021 _mm_maskz_broadcast_i32x2(__mmask8 __M, __m128i __A) argument 1029 _mm256_broadcast_i32x2(__m128i __A) argument 1036 _mm256_mask_broadcast_i32x2(__m256i __O, __mmask8 __M, __m128i __A) argument 1044 _mm256_maskz_broadcast_i32x2(__mmask8 __M, __m128i __A) argument 1052 _mm256_broadcast_i64x2(__m128i __A) argument 1059 _mm256_mask_broadcast_i64x2(__m256i __O, __mmask8 __M, __m128i __A) argument 1067 _mm256_maskz_broadcast_i64x2(__mmask8 __M, __m128i __A) argument [all...] |
H A D | avxvnniint8intrin.h | 25 /// Multiply groups of 4 adjacent pairs of signed 8-bit integers in \a __A with 33 /// _mm_dpbssd_epi32(__m128i __W, __m128i __A, __m128i __B); 38 /// \param __A 47 /// tmp1.word := SignExtend16(__A.byte[4*j]) * SignExtend16(__B.byte[4*j]) 48 /// tmp2.word := SignExtend16(__A.byte[4*j+1]) * SignExtend16(__B.byte[4*j+1]) 49 /// tmp3.word := SignExtend16(__A.byte[4*j+2]) * SignExtend16(__B.byte[4*j+2]) 50 /// tmp4.word := SignExtend16(__A.byte[4*j+3]) * SignExtend16(__B.byte[4*j+3]) 56 __m128i __A, 58 return (__m128i)__builtin_ia32_vpdpbssd128((__v4si)__W, (__v4si)__A, 62 /// Multiply groups of 4 adjacent pairs of signed 8-bit integers in \a __A wit 55 _mm_dpbssd_epi32(__m128i __W, __m128i __A, __m128i __B) argument 93 _mm256_dpbssd_epi32(__m256i __W, __m256i __A, __m256i __B) argument 129 _mm_dpbssds_epi32(__m128i __W, __m128i __A, __m128i __B) argument 168 _mm256_dpbssds_epi32(__m256i __W, __m256i __A, __m256i __B) argument 203 _mm_dpbsud_epi32(__m128i __W, __m128i __A, __m128i __B) argument 241 _mm256_dpbsud_epi32(__m256i __W, __m256i __A, __m256i __B) argument 277 _mm_dpbsuds_epi32(__m128i __W, __m128i __A, __m128i __B) argument 316 _mm256_dpbsuds_epi32(__m256i __W, __m256i __A, __m256i __B) argument 351 _mm_dpbuud_epi32(__m128i __W, __m128i __A, __m128i __B) argument 389 _mm256_dpbuud_epi32(__m256i __W, __m256i __A, __m256i __B) argument 425 _mm_dpbuuds_epi32(__m128i __W, __m128i __A, __m128i __B) argument 464 _mm256_dpbuuds_epi32(__m256i __W, __m256i __A, __m256i __B) argument [all...] |
H A D | avxvnniint16intrin.h | 26 /// Multiply groups of 2 adjacent pairs of signed 16-bit integers in \a __A with 34 /// __m128i _mm_dpwsud_epi32(__m128i __W, __m128i __A, __m128i __B) 41 /// \param __A 50 /// tmp1.dword := SignExtend32(__A.word[2*j]) * ZeroExtend32(__B.word[2*j]) 51 /// tmp2.dword := SignExtend32(__A.word[2*j+1]) * ZeroExtend32(__B.word[2*j+1]) 57 __m128i __A, 59 return (__m128i)__builtin_ia32_vpdpwsud128((__v4si)__W, (__v4si)__A, 63 /// Multiply groups of 2 adjacent pairs of signed 16-bit integers in \a __A with 71 /// __m256i _mm256_dpwsud_epi32(__m256i __W, __m256i __A, __m256i __B) 78 /// \param __A 56 _mm_dpwsud_epi32(__m128i __W, __m128i __A, __m128i __B) argument 94 _mm256_dpwsud_epi32(__m256i __W, __m256i __A, __m256i __B) argument 130 _mm_dpwsuds_epi32(__m128i __W, __m128i __A, __m128i __B) argument 169 _mm256_dpwsuds_epi32(__m256i __W, __m256i __A, __m256i __B) argument 204 _mm_dpwusd_epi32(__m128i __W, __m128i __A, __m128i __B) argument 242 _mm256_dpwusd_epi32(__m256i __W, __m256i __A, __m256i __B) argument 278 _mm_dpwusds_epi32(__m128i __W, __m128i __A, __m128i __B) argument 317 _mm256_dpwusds_epi32(__m256i __W, __m256i __A, __m256i __B) argument 352 _mm_dpwuud_epi32(__m128i __W, __m128i __A, __m128i __B) argument 390 _mm256_dpwuud_epi32(__m256i __W, __m256i __A, __m256i __B) argument 426 _mm_dpwuuds_epi32(__m128i __W, __m128i __A, __m128i __B) argument 465 _mm256_dpwuuds_epi32(__m256i __W, __m256i __A, __m256i __B) argument [all...] |
H A D | sha512intrin.h | 28 /// __m256i _mm256_sha512msg1_epi64(__m256i __A, __m128i __B) 33 /// \param __A 53 /// W[3] := __A.qword[3] 54 /// W[2] := __A.qword[2] 55 /// W[1] := __A.qword[1] 56 /// W[0] := __A.qword[0] 64 _mm256_sha512msg1_epi64(__m256i __A, __m128i __B) { argument 65 return (__m256i)__builtin_ia32_vsha512msg1((__v4du)__A, (__v2du)__B); 75 /// __m256i _mm256_sha512msg2_epi64(__m256i __A, __m256i __B) 80 /// \param __A 112 _mm256_sha512msg2_epi64(__m256i __A, __m256i __B) argument 193 _mm256_sha512rnds2_epi64(__m256i __A, __m256i __B, __m128i __C) argument [all...] |
/freebsd-current/contrib/llvm-project/clang/lib/Headers/ppc_wrappers/ |
H A D | emmintrin.h | 125 _mm_move_sd(__m128d __A, __m128d __B) { argument 126 __v2df __result = (__v2df)__A; 176 _mm_store_pd(double *__P, __m128d __A) { argument 177 vec_st((__v16qu)__A, 0, (__v16qu *)__P); 183 _mm_storeu_pd(double *__P, __m128d __A) { argument 184 *(__m128d_u *)__P = __A; 190 _mm_store_sd(double *__P, __m128d __A) { argument 191 *__P = ((__v2df)__A)[0]; 196 _mm_cvtsd_f64(__m128d __A) { argument 197 return ((__v2df)__A)[ 202 _mm_storel_pd(double *__P, __m128d __A) argument 209 _mm_storeh_pd(double *__P, __m128d __A) argument 216 _mm_store1_pd(double *__P, __m128d __A) argument 222 _mm_store_pd1(double *__P, __m128d __A) argument 229 _mm_storer_pd(double *__P, __m128d __A) argument 236 _mm_cvtsi128_si64(__m128i __A) argument 243 _mm_cvtsi128_si64x(__m128i __A) argument 249 _mm_add_pd(__m128d __A, __m128d __B) argument 258 _mm_add_sd(__m128d __A, __m128d __B) argument 265 _mm_sub_pd(__m128d __A, __m128d __B) argument 271 _mm_sub_sd(__m128d __A, __m128d __B) argument 278 _mm_mul_pd(__m128d __A, __m128d __B) argument 284 _mm_mul_sd(__m128d __A, __m128d __B) argument 291 _mm_div_pd(__m128d __A, __m128d __B) argument 297 _mm_div_sd(__m128d __A, __m128d __B) argument 304 _mm_sqrt_pd(__m128d __A) argument 311 _mm_sqrt_sd(__m128d __A, __m128d __B) argument 319 _mm_min_pd(__m128d __A, __m128d __B) argument 325 _mm_min_sd(__m128d __A, __m128d __B) argument 335 _mm_max_pd(__m128d __A, __m128d __B) argument 341 _mm_max_sd(__m128d __A, __m128d __B) argument 351 _mm_cmpeq_pd(__m128d __A, __m128d __B) argument 357 _mm_cmplt_pd(__m128d __A, __m128d __B) argument 363 _mm_cmple_pd(__m128d __A, __m128d __B) argument 369 _mm_cmpgt_pd(__m128d __A, __m128d __B) argument 375 _mm_cmpge_pd(__m128d __A, __m128d __B) argument 381 _mm_cmpneq_pd(__m128d __A, __m128d __B) argument 388 _mm_cmpnlt_pd(__m128d __A, __m128d __B) argument 394 _mm_cmpnle_pd(__m128d __A, __m128d __B) argument 400 _mm_cmpngt_pd(__m128d __A, __m128d __B) argument 406 _mm_cmpnge_pd(__m128d __A, __m128d __B) argument 412 _mm_cmpord_pd(__m128d __A, __m128d __B) argument 423 _mm_cmpunord_pd(__m128d __A, __m128d __B) argument 447 _mm_cmpeq_sd(__m128d __A, __m128d __B) argument 463 _mm_cmplt_sd(__m128d __A, __m128d __B) argument 473 _mm_cmple_sd(__m128d __A, __m128d __B) argument 483 _mm_cmpgt_sd(__m128d __A, __m128d __B) argument 493 _mm_cmpge_sd(__m128d __A, __m128d __B) argument 503 _mm_cmpneq_sd(__m128d __A, __m128d __B) argument 514 _mm_cmpnlt_sd(__m128d __A, __m128d __B) argument 525 _mm_cmpnle_sd(__m128d __A, __m128d __B) argument 536 _mm_cmpngt_sd(__m128d __A, __m128d __B) argument 547 _mm_cmpnge_sd(__m128d __A, __m128d __B) argument 558 _mm_cmpord_sd(__m128d __A, __m128d __B) argument 566 _mm_cmpunord_sd(__m128d __A, __m128d __B) argument 581 _mm_comieq_sd(__m128d __A, __m128d __B) argument 587 _mm_comilt_sd(__m128d __A, __m128d __B) argument 593 _mm_comile_sd(__m128d __A, __m128d __B) argument 599 _mm_comigt_sd(__m128d __A, __m128d __B) argument 605 _mm_comige_sd(__m128d __A, __m128d __B) argument 611 _mm_comineq_sd(__m128d __A, __m128d __B) argument 617 _mm_ucomieq_sd(__m128d __A, __m128d __B) argument 623 _mm_ucomilt_sd(__m128d __A, __m128d __B) argument 629 _mm_ucomile_sd(__m128d __A, __m128d __B) argument 635 _mm_ucomigt_sd(__m128d __A, __m128d __B) argument 641 _mm_ucomige_sd(__m128d __A, __m128d __B) argument 647 _mm_ucomineq_sd(__m128d __A, __m128d __B) argument 692 _mm_set1_epi64x(long long __A) argument 698 _mm_set1_epi64(__m64 __A) argument 704 _mm_set1_epi32(int __A) argument 710 _mm_set1_epi16(short __A) argument 716 _mm_set1_epi8(char __A) argument 797 _mm_movpi64_epi64(__m64 __A) argument 803 _mm_move_epi64(__m128i __A) argument 825 _mm_cvtepi32_pd(__m128i __A) argument 837 _mm_cvtepi32_ps(__m128i __A) argument 843 _mm_cvtpd_epi32(__m128d __A) argument 872 _mm_cvtpd_pi32(__m128d __A) argument 880 _mm_cvtpd_ps(__m128d __A) argument 907 _mm_cvttpd_epi32(__m128d __A) argument 937 _mm_cvttpd_pi32(__m128d __A) argument 945 _mm_cvtsi128_si32(__m128i __A) argument 952 _mm_cvtpi32_pd(__m64 __A) argument 966 _mm_cvtps_epi32(__m128 __A) argument 977 _mm_cvttps_epi32(__m128 __A) argument 986 _mm_cvtps_pd(__m128 __A) argument 1017 _mm_cvtsd_si32(__m128d __A) argument 1026 _mm_cvtsd_si64(__m128d __A) argument 1036 _mm_cvtsd_si64x(__m128d __A) argument 1042 _mm_cvttsd_si32(__m128d __A) argument 1051 _mm_cvttsd_si64(__m128d __A) argument 1060 _mm_cvttsd_si64x(__m128d __A) argument 1066 _mm_cvtsd_ss(__m128 __A, __m128d __B) argument 1088 _mm_cvtsi32_sd(__m128d __A, int __B) argument 1098 _mm_cvtsi64_sd(__m128d __A, long long __B) argument 1108 _mm_cvtsi64x_sd(__m128d __A, long long __B) argument 1114 _mm_cvtss_sd(__m128d __A, __m128 __B) argument 1131 _mm_shuffle_pd(__m128d __A, __m128d __B, const int __mask) argument 1156 _mm_unpackhi_pd(__m128d __A, __m128d __B) argument 1162 _mm_unpacklo_pd(__m128d __A, __m128d __B) argument 1168 _mm_loadh_pd(__m128d __A, double const *__B) argument 1176 _mm_loadl_pd(__m128d __A, double const *__B) argument 1188 _mm_movemask_pd(__m128d __A) argument 1215 _mm_packs_epi16(__m128i __A, __m128i __B) argument 1221 _mm_packs_epi32(__m128i __A, __m128i __B) argument 1227 _mm_packus_epi16(__m128i __A, __m128i __B) argument 1233 _mm_unpackhi_epi8(__m128i __A, __m128i __B) argument 1239 _mm_unpackhi_epi16(__m128i __A, __m128i __B) argument 1245 _mm_unpackhi_epi32(__m128i __A, __m128i __B) argument 1251 _mm_unpackhi_epi64(__m128i __A, __m128i __B) argument 1257 _mm_unpacklo_epi8(__m128i __A, __m128i __B) argument 1263 _mm_unpacklo_epi16(__m128i __A, __m128i __B) argument 1269 _mm_unpacklo_epi32(__m128i __A, __m128i __B) argument 1275 _mm_unpacklo_epi64(__m128i __A, __m128i __B) argument 1281 _mm_add_epi8(__m128i __A, __m128i __B) argument 1287 _mm_add_epi16(__m128i __A, __m128i __B) argument 1293 _mm_add_epi32(__m128i __A, __m128i __B) argument 1299 _mm_add_epi64(__m128i __A, __m128i __B) argument 1305 _mm_adds_epi8(__m128i __A, __m128i __B) argument 1311 _mm_adds_epi16(__m128i __A, __m128i __B) argument 1317 _mm_adds_epu8(__m128i __A, __m128i __B) argument 1323 _mm_adds_epu16(__m128i __A, __m128i __B) argument 1329 _mm_sub_epi8(__m128i __A, __m128i __B) argument 1335 _mm_sub_epi16(__m128i __A, __m128i __B) argument 1341 _mm_sub_epi32(__m128i __A, __m128i __B) argument 1347 _mm_sub_epi64(__m128i __A, __m128i __B) argument 1353 _mm_subs_epi8(__m128i __A, __m128i __B) argument 1359 _mm_subs_epi16(__m128i __A, __m128i __B) argument 1365 _mm_subs_epu8(__m128i __A, __m128i __B) argument 1371 _mm_subs_epu16(__m128i __A, __m128i __B) argument 1377 _mm_madd_epi16(__m128i __A, __m128i __B) argument 1385 _mm_mulhi_epi16(__m128i __A, __m128i __B) argument 1405 _mm_mullo_epi16(__m128i __A, __m128i __B) argument 1411 _mm_mul_su32(__m64 __A, __m64 __B) argument 1421 _mm_mul_epu32(__m128i __A, __m128i __B) argument 1441 _mm_slli_epi16(__m128i __A, int __B) argument 1459 _mm_slli_epi32(__m128i __A, int __B) argument 1478 _mm_slli_epi64(__m128i __A, int __B) argument 1497 _mm_srai_epi16(__m128i __A, int __B) argument 1514 _mm_srai_epi32(__m128i __A, int __B) argument 1534 _mm_bslli_si128(__m128i __A, const int __N) argument 1548 _mm_bsrli_si128(__m128i __A, const int __N) argument 1577 _mm_srli_si128(__m128i __A, const int __N) argument 1583 _mm_slli_si128(__m128i __A, const int _imm5) argument 1602 _mm_srli_epi16(__m128i __A, int __B) argument 1620 _mm_srli_epi32(__m128i __A, int __B) argument 1642 _mm_srli_epi64(__m128i __A, int __B) argument 1664 _mm_sll_epi16(__m128i __A, __m128i __B) argument 1684 _mm_sll_epi32(__m128i __A, __m128i __B) argument 1704 _mm_sll_epi64(__m128i __A, __m128i __B) argument 1721 _mm_sra_epi16(__m128i __A, __m128i __B) argument 1739 _mm_sra_epi32(__m128i __A, __m128i __B) argument 1757 _mm_srl_epi16(__m128i __A, __m128i __B) argument 1777 _mm_srl_epi32(__m128i __A, __m128i __B) argument 1798 _mm_srl_epi64(__m128i __A, __m128i __B) argument 1815 _mm_and_pd(__m128d __A, __m128d __B) argument 1821 _mm_andnot_pd(__m128d __A, __m128d __B) argument 1827 _mm_or_pd(__m128d __A, __m128d __B) argument 1833 _mm_xor_pd(__m128d __A, __m128d __B) argument 1839 _mm_and_si128(__m128i __A, __m128i __B) argument 1845 _mm_andnot_si128(__m128i __A, __m128i __B) argument 1851 _mm_or_si128(__m128i __A, __m128i __B) argument 1857 _mm_xor_si128(__m128i __A, __m128i __B) argument 1863 _mm_cmpeq_epi8(__m128i __A, __m128i __B) argument 1869 _mm_cmpeq_epi16(__m128i __A, __m128i __B) argument 1875 _mm_cmpeq_epi32(__m128i __A, __m128i __B) argument 1881 _mm_cmplt_epi8(__m128i __A, __m128i __B) argument 1887 _mm_cmplt_epi16(__m128i __A, __m128i __B) argument 1893 _mm_cmplt_epi32(__m128i __A, __m128i __B) argument 1899 _mm_cmpgt_epi8(__m128i __A, __m128i __B) argument 1905 _mm_cmpgt_epi16(__m128i __A, __m128i __B) argument 1911 _mm_cmpgt_epi32(__m128i __A, __m128i __B) argument 1917 _mm_extract_epi16(__m128i const __A, int const __N) argument 1923 _mm_insert_epi16(__m128i const __A, int const __D, int const __N) argument 1933 _mm_max_epi16(__m128i __A, __m128i __B) argument 1939 _mm_max_epu8(__m128i __A, __m128i __B) argument 1945 _mm_min_epi16(__m128i __A, __m128i __B) argument 1951 _mm_min_epu8(__m128i __A, __m128i __B) argument 1962 _mm_movemask_epi8(__m128i __A) argument 1985 _mm_mulhi_epu16(__m128i __A, __m128i __B) argument 2004 _mm_shufflehi_epi16(__m128i __A, const int __mask) argument 2037 _mm_shufflelo_epi16(__m128i __A, const int __mask) argument 2069 _mm_shuffle_epi32(__m128i __A, const int __mask) argument 2093 _mm_maskmoveu_si128(__m128i __A, __m128i __B, char *__C) argument 2106 _mm_avg_epu8(__m128i __A, __m128i __B) argument 2112 _mm_avg_epu16(__m128i __A, __m128i __B) argument 2118 _mm_sad_epu8(__m128i __A, __m128i __B) argument 2156 _mm_stream_si32(int *__A, int __B) argument 2164 _mm_stream_si64(long long int *__A, long long int __B) argument 2172 _mm_stream_si128(__m128i *__A, __m128i __B) argument 2180 _mm_stream_pd(double *__A, __m128d __B) argument 2188 _mm_clflush(void const *__A) argument 2209 _mm_cvtsi32_si128(int __A) argument 2215 _mm_cvtsi64_si128(long long __A) argument 2222 _mm_cvtsi64x_si128(long long __A) argument 2230 _mm_castpd_ps(__m128d __A) argument 2236 _mm_castpd_si128(__m128d __A) argument 2242 _mm_castps_pd(__m128 __A) argument 2248 _mm_castps_si128(__m128 __A) argument 2254 _mm_castsi128_ps(__m128i __A) argument 2260 _mm_castsi128_pd(__m128i __A) argument [all...] |
H A D | xmmintrin.h | 149 _mm_store_ps(float *__P, __m128 __A) { argument 150 vec_st((__v4sf)__A, 0, (__v4sf *)__P); 156 _mm_storeu_ps(float *__P, __m128 __A) { argument 157 *(__m128_u *)__P = __A; 163 _mm_storer_ps(float *__P, __m128 __A) { argument 169 __tmp = (__m128)vec_perm(__A, __A, __permute_vector); 177 _mm_store1_ps(float *__P, __m128 __A) { argument 178 __v4sf __va = vec_splat((__v4sf)__A, 0); 184 _mm_store_ps1(float *__P, __m128 __A) { argument 198 _mm_move_ss(__m128 __A, __m128 __B) argument 214 _mm_store_ss(float *__P, __m128 __A) argument 224 _mm_add_ss(__m128 __A, __m128 __B) argument 246 _mm_sub_ss(__m128 __A, __m128 __B) argument 268 _mm_mul_ss(__m128 __A, __m128 __B) argument 290 _mm_div_ss(__m128 __A, __m128 __B) argument 312 _mm_sqrt_ss(__m128 __A) argument 329 _mm_add_ps(__m128 __A, __m128 __B) argument 335 _mm_sub_ps(__m128 __A, __m128 __B) argument 341 _mm_mul_ps(__m128 __A, __m128 __B) argument 347 _mm_div_ps(__m128 __A, __m128 __B) argument 353 _mm_sqrt_ps(__m128 __A) argument 359 _mm_rcp_ps(__m128 __A) argument 365 _mm_rsqrt_ps(__m128 __A) argument 371 _mm_rcp_ss(__m128 __A) argument 387 _mm_rsqrt_ss(__m128 __A) argument 403 _mm_min_ss(__m128 __A, __m128 __B) argument 420 _mm_max_ss(__m128 __A, __m128 __B) argument 437 _mm_min_ps(__m128 __A, __m128 __B) argument 444 _mm_max_ps(__m128 __A, __m128 __B) argument 452 _mm_and_ps(__m128 __A, __m128 __B) argument 459 _mm_andnot_ps(__m128 __A, __m128 __B) argument 465 _mm_or_ps(__m128 __A, __m128 __B) argument 471 _mm_xor_ps(__m128 __A, __m128 __B) argument 480 _mm_cmpeq_ps(__m128 __A, __m128 __B) argument 486 _mm_cmplt_ps(__m128 __A, __m128 __B) argument 492 _mm_cmple_ps(__m128 __A, __m128 __B) argument 498 _mm_cmpgt_ps(__m128 __A, __m128 __B) argument 504 _mm_cmpge_ps(__m128 __A, __m128 __B) argument 510 _mm_cmpneq_ps(__m128 __A, __m128 __B) argument 517 _mm_cmpnlt_ps(__m128 __A, __m128 __B) argument 523 _mm_cmpnle_ps(__m128 __A, __m128 __B) argument 529 _mm_cmpngt_ps(__m128 __A, __m128 __B) argument 535 _mm_cmpnge_ps(__m128 __A, __m128 __B) argument 541 _mm_cmpord_ps(__m128 __A, __m128 __B) argument 556 _mm_cmpunord_ps(__m128 __A, __m128 __B) argument 574 _mm_cmpeq_ss(__m128 __A, __m128 __B) argument 591 _mm_cmplt_ss(__m128 __A, __m128 __B) argument 608 _mm_cmple_ss(__m128 __A, __m128 __B) argument 625 _mm_cmpgt_ss(__m128 __A, __m128 __B) argument 642 _mm_cmpge_ss(__m128 __A, __m128 __B) argument 659 _mm_cmpneq_ss(__m128 __A, __m128 __B) argument 677 _mm_cmpnlt_ss(__m128 __A, __m128 __B) argument 694 _mm_cmpnle_ss(__m128 __A, __m128 __B) argument 711 _mm_cmpngt_ss(__m128 __A, __m128 __B) argument 728 _mm_cmpnge_ss(__m128 __A, __m128 __B) argument 745 _mm_cmpord_ss(__m128 __A, __m128 __B) argument 764 _mm_cmpunord_ss(__m128 __A, __m128 __B) argument 785 _mm_comieq_ss(__m128 __A, __m128 __B) argument 791 _mm_comilt_ss(__m128 __A, __m128 __B) argument 797 _mm_comile_ss(__m128 __A, __m128 __B) argument 803 _mm_comigt_ss(__m128 __A, __m128 __B) argument 809 _mm_comige_ss(__m128 __A, __m128 __B) argument 815 _mm_comineq_ss(__m128 __A, __m128 __B) argument 829 _mm_ucomieq_ss(__m128 __A, __m128 __B) argument 835 _mm_ucomilt_ss(__m128 __A, __m128 __B) argument 841 _mm_ucomile_ss(__m128 __A, __m128 __B) argument 847 _mm_ucomigt_ss(__m128 __A, __m128 __B) argument 853 _mm_ucomige_ss(__m128 __A, __m128 __B) argument 859 _mm_ucomineq_ss(__m128 __A, __m128 __B) argument 865 _mm_cvtss_f32(__m128 __A) argument 873 _mm_cvtss_si32(__m128 __A) argument 894 _mm_cvt_ss2si(__m128 __A) argument 904 _mm_cvtss_si64(__m128 __A) argument 926 _mm_cvtss_si64x(__m128 __A) argument 954 _mm_cvtps_pi32(__m128 __A) argument 969 _mm_cvt_ps2pi(__m128 __A) argument 976 _mm_cvttss_si32(__m128 __A) argument 985 _mm_cvtt_ss2si(__m128 __A) argument 992 _mm_cvttss_si64(__m128 __A) argument 1002 _mm_cvttss_si64x(__m128 __A) argument 1013 _mm_cvttps_pi32(__m128 __A) argument 1026 _mm_cvtt_ps2pi(__m128 __A) argument 1033 _mm_cvtsi32_ss(__m128 __A, int __B) argument 1042 _mm_cvt_si2ss(__m128 __A, int __B) argument 1050 _mm_cvtsi64_ss(__m128 __A, long long __B) argument 1060 _mm_cvtsi64x_ss(__m128 __A, long long __B) argument 1068 _mm_cvtpi32_ps(__m128 __A, __m64 __B) argument 1082 _mm_cvt_pi2ps(__m128 __A, __m64 __B) argument 1089 _mm_cvtpi16_ps(__m64 __A) argument 1104 _mm_cvtpu16_ps(__m64 __A) argument 1125 _mm_cvtpi8_ps(__m64 __A) argument 1143 _mm_cvtpu8_ps(__m64 __A) argument 1168 _mm_cvtpi32x2_ps(__m64 __A, __m64 __B) argument 1180 _mm_cvtps_pi16(__m128 __A) argument 1195 _mm_cvtps_pi8(__m128 __A) argument 1213 _mm_shuffle_ps(__m128 __A, __m128 __B, int const __mask) argument 1237 _mm_unpackhi_ps(__m128 __A, __m128 __B) argument 1244 _mm_unpacklo_ps(__m128 __A, __m128 __B) argument 1252 _mm_loadh_pi(__m128 __A, __m64 const *__P) argument 1263 _mm_storeh_pi(__m64 *__P, __m128 __A) argument 1272 _mm_movehl_ps(__m128 __A, __m128 __B) argument 1280 _mm_movelh_ps(__m128 __A, __m128 __B) argument 1289 _mm_loadl_pi(__m128 __A, __m64 const *__P) argument 1300 _mm_storel_pi(__m64 *__P, __m128 __A) argument 1312 _mm_movemask_ps(__m128 __A) argument 1353 _mm_extract_pi16(__m64 const __A, int const __N) argument 1364 _m_pextrw(__m64 const __A, int const __N) argument 1372 _mm_insert_pi16(__m64 const __A, int const __D, int const __N) argument 1383 _m_pinsrw(__m64 const __A, int const __D, int const __N) argument 1391 _mm_max_pi16(__m64 __A, __m64 __B) argument 1422 _m_pmaxsw(__m64 __A, __m64 __B) argument 1429 _mm_max_pu8(__m64 __A, __m64 __B) argument 1458 _m_pmaxub(__m64 __A, __m64 __B) argument 1465 _mm_min_pi16(__m64 __A, __m64 __B) argument 1496 _m_pminsw(__m64 __A, __m64 __B) argument 1503 _mm_min_pu8(__m64 __A, __m64 __B) argument 1532 _m_pminub(__m64 __A, __m64 __B) argument 1539 _mm_movemask_pi8(__m64 __A) argument 1564 _m_pmovmskb(__m64 __A) argument 1572 _mm_mulhi_pu16(__m64 __A, __m64 __B) argument 1598 _m_pmulhuw(__m64 __A, __m64 __B) argument 1606 _mm_shuffle_pi16(__m64 __A, int const __N) argument 1640 _m_pshufw(__m64 __A, int const __N) argument 1649 _mm_maskmove_si64(__m64 __A, __m64 __N, char *__P) argument 1662 _m_maskmovq(__m64 __A, __m64 __N, char *__P) argument 1669 _mm_avg_pu8(__m64 __A, __m64 __B) argument 1680 _m_pavgb(__m64 __A, __m64 __B) argument 1687 _mm_avg_pu16(__m64 __A, __m64 __B) argument 1698 _m_pavgw(__m64 __A, __m64 __B) argument 1707 _mm_sad_pu8(__m64 __A, __m64 __B) argument 1731 _m_psadbw(__m64 __A, __m64 __B) argument 1738 _mm_stream_pi(__m64 *__P, __m64 __A) argument 1747 _mm_stream_ps(float *__P, __m128 __A) argument [all...] |