Lines Matching defs:__W

684 _mm512_mask_andnot_epi32(__m512i __W, __mmask16 __U, __m512i __A, __m512i __B)
688 (__v16si)__W);
705 _mm512_mask_andnot_epi64(__m512i __W, __mmask8 __U, __m512i __A, __m512i __B)
709 (__v8di)__W);
862 _mm512_mask_add_epi64(__m512i __W, __mmask8 __U, __m512i __A, __m512i __B)
866 (__v8di)__W);
884 _mm512_mask_sub_epi64(__m512i __W, __mmask8 __U, __m512i __A, __m512i __B)
888 (__v8di)__W);
906 _mm512_mask_add_epi32(__m512i __W, __mmask16 __U, __m512i __A, __m512i __B)
910 (__v16si)__W);
928 _mm512_mask_sub_epi32(__m512i __W, __mmask16 __U, __m512i __A, __m512i __B)
932 (__v16si)__W);
965 _mm512_mask_max_pd (__m512d __W, __mmask8 __U, __m512d __A, __m512d __B)
969 (__v8df)__W);
1002 _mm512_mask_max_ps (__m512 __W, __mmask16 __U, __m512 __A, __m512 __B)
1006 (__v16sf)__W);
1018 _mm_mask_max_ss(__m128 __W, __mmask8 __U,__m128 __A, __m128 __B) {
1021 (__v4sf) __W,
1054 _mm_mask_max_sd(__m128d __W, __mmask8 __U,__m128d __A, __m128d __B) {
1057 (__v2df) __W,
1097 _mm512_mask_max_epi32 (__m512i __W, __mmask16 __M, __m512i __A, __m512i __B)
1101 (__v16si)__W);
1119 _mm512_mask_max_epu32 (__m512i __W, __mmask16 __M, __m512i __A, __m512i __B)
1123 (__v16si)__W);
1141 _mm512_mask_max_epi64 (__m512i __W, __mmask8 __M, __m512i __A, __m512i __B)
1145 (__v8di)__W);
1163 _mm512_mask_max_epu64 (__m512i __W, __mmask8 __M, __m512i __A, __m512i __B)
1167 (__v8di)__W);
1200 _mm512_mask_min_pd (__m512d __W, __mmask8 __U, __m512d __A, __m512d __B)
1204 (__v8df)__W);
1237 _mm512_mask_min_ps (__m512 __W, __mmask16 __U, __m512 __A, __m512 __B)
1241 (__v16sf)__W);
1253 _mm_mask_min_ss(__m128 __W, __mmask8 __U,__m128 __A, __m128 __B) {
1256 (__v4sf) __W,
1289 _mm_mask_min_sd(__m128d __W, __mmask8 __U,__m128d __A, __m128d __B) {
1292 (__v2df) __W,
1332 _mm512_mask_min_epi32 (__m512i __W, __mmask16 __M, __m512i __A, __m512i __B)
1336 (__v16si)__W);
1354 _mm512_mask_min_epu32 (__m512i __W, __mmask16 __M, __m512i __A, __m512i __B)
1358 (__v16si)__W);
1376 _mm512_mask_min_epi64 (__m512i __W, __mmask8 __M, __m512i __A, __m512i __B)
1380 (__v8di)__W);
1398 _mm512_mask_min_epu64 (__m512i __W, __mmask8 __M, __m512i __A, __m512i __B)
1402 (__v8di)__W);
1420 _mm512_mask_mul_epi32(__m512i __W, __mmask8 __M, __m512i __X, __m512i __Y)
1424 (__v8di)__W);
1442 _mm512_mask_mul_epu32(__m512i __W, __mmask8 __M, __m512i __X, __m512i __Y)
1446 (__v8di)__W);
1472 _mm512_mask_mullo_epi32(__m512i __W, __mmask16 __M, __m512i __A, __m512i __B)
1476 (__v16si)__W);
1485 _mm512_mask_mullox_epi64(__m512i __W, __mmask8 __U, __m512i __A, __m512i __B) {
1488 (__v8di)__W);
1512 _mm512_mask_sqrt_pd (__m512d __W, __mmask8 __U, __m512d __A)
1516 (__v8df)__W);
1548 _mm512_mask_sqrt_ps(__m512 __W, __mmask16 __U, __m512 __A)
1552 (__v16sf)__W);
1572 _mm512_mask_rsqrt14_pd (__m512d __W, __mmask8 __U, __m512d __A)
1575 (__v8df) __W,
1598 _mm512_mask_rsqrt14_ps (__m512 __W, __mmask16 __U, __m512 __A)
1601 (__v16sf) __W,
1625 _mm_mask_rsqrt14_ss (__m128 __W, __mmask8 __U, __m128 __A, __m128 __B)
1629 (__v4sf) __W,
1653 _mm_mask_rsqrt14_sd (__m128d __W, __mmask8 __U, __m128d __A, __m128d __B)
1657 (__v2df) __W,
1680 _mm512_mask_rcp14_pd (__m512d __W, __mmask8 __U, __m512d __A)
1683 (__v8df) __W,
1706 _mm512_mask_rcp14_ps (__m512 __W, __mmask16 __U, __m512 __A)
1709 (__v16sf) __W,
1733 _mm_mask_rcp14_ss (__m128 __W, __mmask8 __U, __m128 __A, __m128 __B)
1737 (__v4sf) __W,
1761 _mm_mask_rcp14_sd (__m128d __W, __mmask8 __U, __m128d __A, __m128d __B)
1765 (__v2df) __W,
1788 _mm512_mask_floor_ps (__m512 __W, __mmask16 __U, __m512 __A)
1792 (__v16sf) __W, __U,
1806 _mm512_mask_floor_pd (__m512d __W, __mmask8 __U, __m512d __A)
1810 (__v8df) __W, __U,
1815 _mm512_mask_ceil_ps (__m512 __W, __mmask16 __U, __m512 __A)
1819 (__v16sf) __W, __U,
1842 _mm512_mask_ceil_pd (__m512d __W, __mmask8 __U, __m512d __A)
1846 (__v8df) __W, __U,
1857 _mm512_mask_abs_epi64 (__m512i __W, __mmask8 __U, __m512i __A)
1861 (__v8di)__W);
1879 _mm512_mask_abs_epi32 (__m512i __W, __mmask16 __U, __m512i __A)
1883 (__v16si)__W);
1895 _mm_mask_add_ss(__m128 __W, __mmask8 __U,__m128 __A, __m128 __B) {
1897 return __builtin_ia32_selectss_128(__U, __A, __W);
1925 _mm_mask_add_sd(__m128d __W, __mmask8 __U,__m128d __A, __m128d __B) {
1927 return __builtin_ia32_selectsd_128(__U, __A, __W);
1954 _mm512_mask_add_pd(__m512d __W, __mmask8 __U, __m512d __A, __m512d __B) {
1957 (__v8df)__W);
1968 _mm512_mask_add_ps(__m512 __W, __mmask16 __U, __m512 __A, __m512 __B) {
1971 (__v16sf)__W);
2010 _mm_mask_sub_ss(__m128 __W, __mmask8 __U,__m128 __A, __m128 __B) {
2012 return __builtin_ia32_selectss_128(__U, __A, __W);
2039 _mm_mask_sub_sd(__m128d __W, __mmask8 __U,__m128d __A, __m128d __B) {
2041 return __builtin_ia32_selectsd_128(__U, __A, __W);
2069 _mm512_mask_sub_pd(__m512d __W, __mmask8 __U, __m512d __A, __m512d __B) {
2072 (__v8df)__W);
2083 _mm512_mask_sub_ps(__m512 __W, __mmask16 __U, __m512 __A, __m512 __B) {
2086 (__v16sf)__W);
2125 _mm_mask_mul_ss(__m128 __W, __mmask8 __U,__m128 __A, __m128 __B) {
2127 return __builtin_ia32_selectss_128(__U, __A, __W);
2154 _mm_mask_mul_sd(__m128d __W, __mmask8 __U,__m128d __A, __m128d __B) {
2156 return __builtin_ia32_selectsd_128(__U, __A, __W);
2184 _mm512_mask_mul_pd(__m512d __W, __mmask8 __U, __m512d __A, __m512d __B) {
2187 (__v8df)__W);
2198 _mm512_mask_mul_ps(__m512 __W, __mmask16 __U, __m512 __A, __m512 __B) {
2201 (__v16sf)__W);
2240 _mm_mask_div_ss(__m128 __W, __mmask8 __U,__m128 __A, __m128 __B) {
2242 return __builtin_ia32_selectss_128(__U, __A, __W);
2270 _mm_mask_div_sd(__m128d __W, __mmask8 __U,__m128d __A, __m128d __B) {
2272 return __builtin_ia32_selectsd_128(__U, __A, __W);
2306 _mm512_mask_div_pd(__m512d __W, __mmask8 __U, __m512d __A, __m512d __B) {
2309 (__v8df)__W);
2326 _mm512_mask_div_ps(__m512 __W, __mmask16 __U, __m512 __A, __m512 __B) {
2329 (__v16sf)__W);
3380 _mm512_mask_blend_pd(__mmask8 __U, __m512d __A, __m512d __W)
3383 (__v8df) __W,
3388 _mm512_mask_blend_ps(__mmask16 __U, __m512 __A, __m512 __W)
3391 (__v16sf) __W,
3396 _mm512_mask_blend_epi64(__mmask8 __U, __m512i __A, __m512i __W)
3399 (__v8di) __W,
3404 _mm512_mask_blend_epi32(__mmask16 __U, __m512i __A, __m512i __W)
3407 (__v16si) __W,
3552 _mm512_mask_cvttps_epu32 (__m512i __W, __mmask16 __U, __m512 __A)
3555 (__v16si) __W,
3606 _mm512_mask_cvtepu32_ps (__m512 __W, __mmask16 __U, __m512i __A)
3610 (__v16sf)__W);
3628 _mm512_mask_cvtepi32_pd (__m512d __W, __mmask8 __U, __m256i __A)
3632 (__v8df)__W);
3650 _mm512_mask_cvtepi32lo_pd(__m512d __W, __mmask8 __U,__m512i __A)
3652 return (__m512d) _mm512_mask_cvtepi32_pd(__W, __U, _mm512_castsi512_si256(__A));
3662 _mm512_mask_cvtepi32_ps (__m512 __W, __mmask16 __U, __m512i __A)
3666 (__v16sf)__W);
3684 _mm512_mask_cvtepu32_pd (__m512d __W, __mmask8 __U, __m256i __A)
3688 (__v8df)__W);
3706 _mm512_mask_cvtepu32lo_pd(__m512d __W, __mmask8 __U,__m512i __A)
3708 return (__m512d) _mm512_mask_cvtepu32_pd(__W, __U, _mm512_castsi512_si256(__A));
3736 _mm512_mask_cvtpd_ps (__m256 __W, __mmask8 __U, __m512d __A)
3739 (__v8sf) __W,
3762 _mm512_mask_cvtpd_pslo (__m512 __W, __mmask8 __U,__m512d __A)
3765 (__v8sf) _mm512_mask_cvtpd_ps (_mm512_castps512_ps256(__W),
3817 _mm512_mask_cvtph_ps (__m512 __W, __mmask16 __U, __m256i __A)
3820 (__v16sf) __W,
3859 _mm512_mask_cvttpd_epi32 (__m256i __W, __mmask8 __U, __m512d __A)
3862 (__v8si) __W,
3901 _mm512_mask_cvttps_epi32 (__m512i __W, __mmask16 __U, __m512 __A)
3904 (__v16si) __W,
3943 _mm512_mask_cvtps_epi32 (__m512i __W, __mmask16 __U, __m512 __A)
3946 (__v16si) __W,
3987 _mm512_mask_cvtpd_epi32 (__m256i __W, __mmask8 __U, __m512d __A)
3990 (__v8si) __W,
4031 _mm512_mask_cvtps_epu32 (__m512i __W, __mmask16 __U, __m512 __A)
4034 (__v16si) __W,
4075 _mm512_mask_cvtpd_epu32 (__m256i __W, __mmask8 __U, __m512d __A)
4078 (__v8si) __W,
4115 _mm512_mask_unpackhi_pd(__m512d __W, __mmask8 __U, __m512d __A, __m512d __B)
4119 (__v8df)__W);
4138 _mm512_mask_unpacklo_pd(__m512d __W, __mmask8 __U, __m512d __A, __m512d __B)
4142 (__v8df)__W);
4164 _mm512_mask_unpackhi_ps(__m512 __W, __mmask16 __U, __m512 __A, __m512 __B)
4168 (__v16sf)__W);
4190 _mm512_mask_unpacklo_ps(__m512 __W, __mmask16 __U, __m512 __A, __m512 __B)
4194 (__v16sf)__W);
4216 _mm512_mask_unpackhi_epi32(__m512i __W, __mmask16 __U, __m512i __A, __m512i __B)
4220 (__v16si)__W);
4242 _mm512_mask_unpacklo_epi32(__m512i __W, __mmask16 __U, __m512i __A, __m512i __B)
4246 (__v16si)__W);
4265 _mm512_mask_unpackhi_epi64(__m512i __W, __mmask8 __U, __m512i __A, __m512i __B)
4269 (__v8di)__W);
4288 _mm512_mask_unpacklo_epi64 (__m512i __W, __mmask8 __U, __m512i __A, __m512i __B)
4292 (__v8di)__W);
4325 _mm512_mask_loadu_epi32 (__m512i __W, __mmask16 __U, void const *__P)
4328 (__v16si) __W,
4352 _mm512_mask_loadu_epi64 (__m512i __W, __mmask8 __U, void const *__P)
4355 (__v8di) __W,
4369 _mm512_mask_loadu_ps (__m512 __W, __mmask16 __U, void const *__P)
4372 (__v16sf) __W,
4386 _mm512_mask_loadu_pd (__m512d __W, __mmask8 __U, void const *__P)
4389 (__v8df) __W,
4427 _mm512_mask_load_ps (__m512 __W, __mmask16 __U, void const *__P)
4430 (__v16sf) __W,
4450 _mm512_mask_load_pd (__m512d __W, __mmask8 __U, void const *__P)
4453 (__v8df) __W,
4720 _mm512_mask_cvtepi8_epi32(__m512i __W, __mmask16 __U, __m128i __A)
4724 (__v16si)__W);
4744 _mm512_mask_cvtepi8_epi64(__m512i __W, __mmask8 __U, __m128i __A)
4748 (__v8di)__W);
4766 _mm512_mask_cvtepi32_epi64(__m512i __W, __mmask8 __U, __m256i __X)
4770 (__v8di)__W);
4788 _mm512_mask_cvtepi16_epi32(__m512i __W, __mmask16 __U, __m256i __A)
4792 (__v16si)__W);
4810 _mm512_mask_cvtepi16_epi64(__m512i __W, __mmask8 __U, __m128i __A)
4814 (__v8di)__W);
4832 _mm512_mask_cvtepu8_epi32(__m512i __W, __mmask16 __U, __m128i __A)
4836 (__v16si)__W);
4854 _mm512_mask_cvtepu8_epi64(__m512i __W, __mmask8 __U, __m128i __A)
4858 (__v8di)__W);
4876 _mm512_mask_cvtepu32_epi64(__m512i __W, __mmask8 __U, __m256i __X)
4880 (__v8di)__W);
4898 _mm512_mask_cvtepu16_epi32(__m512i __W, __mmask16 __U, __m256i __A)
4902 (__v16si)__W);
4920 _mm512_mask_cvtepu16_epi64(__m512i __W, __mmask8 __U, __m128i __A)
4924 (__v8di)__W);
4942 _mm512_mask_rorv_epi32 (__m512i __W, __mmask16 __U, __m512i __A, __m512i __B)
4946 (__v16si)__W);
4964 _mm512_mask_rorv_epi64 (__m512i __W, __mmask8 __U, __m512i __A, __m512i __B)
4968 (__v8di)__W);
5054 _mm512_mask_rolv_epi32 (__m512i __W, __mmask16 __U, __m512i __A, __m512i __B)
5058 (__v16si)__W);
5076 _mm512_mask_rolv_epi64 (__m512i __W, __mmask8 __U, __m512i __A, __m512i __B)
5080 (__v8di)__W);
5124 _mm512_mask_slli_epi32(__m512i __W, __mmask16 __U, __m512i __A,
5129 (__v16si)__W);
5146 _mm512_mask_slli_epi64(__m512i __W, __mmask8 __U, __m512i __A, unsigned int __B)
5150 (__v8di)__W);
5168 _mm512_mask_srli_epi32(__m512i __W, __mmask16 __U, __m512i __A,
5173 (__v16si)__W);
5190 _mm512_mask_srli_epi64(__m512i __W, __mmask8 __U, __m512i __A,
5195 (__v8di)__W);
5208 _mm512_mask_load_epi32 (__m512i __W, __mmask16 __U, void const *__P)
5211 (__v16si) __W,
5232 _mm512_mask_mov_epi32 (__m512i __W, __mmask16 __U, __m512i __A)
5236 (__v16si) __W);
5248 _mm512_mask_mov_epi64 (__m512i __W, __mmask8 __U, __m512i __A)
5252 (__v8di) __W);
5264 _mm512_mask_load_epi64 (__m512i __W, __mmask8 __U, void const *__P)
5267 (__v8di) __W,
5295 _mm512_mask_movedup_pd (__m512d __W, __mmask8 __U, __m512d __A)
5299 (__v8df)__W);
5483 _mm_mask_getexp_sd (__m128d __W, __mmask8 __U, __m128d __A, __m128d __B)
5487 (__v2df) __W,
5528 _mm_mask_getexp_ss (__m128 __W, __mmask8 __U, __m128 __A, __m128 __B)
5532 (__v4sf) __W,
5675 _mm512_mask_sll_epi32(__m512i __W, __mmask16 __U, __m512i __A, __m128i __B)
5679 (__v16si)__W);
5697 _mm512_mask_sll_epi64(__m512i __W, __mmask8 __U, __m512i __A, __m128i __B)
5701 (__v8di)__W);
5719 _mm512_mask_sllv_epi32(__m512i __W, __mmask16 __U, __m512i __X, __m512i __Y)
5723 (__v16si)__W);
5741 _mm512_mask_sllv_epi64(__m512i __W, __mmask8 __U, __m512i __X, __m512i __Y)
5745 (__v8di)__W);
5763 _mm512_mask_sra_epi32(__m512i __W, __mmask16 __U, __m512i __A, __m128i __B)
5767 (__v16si)__W);
5785 _mm512_mask_sra_epi64(__m512i __W, __mmask8 __U, __m512i __A, __m128i __B)
5789 (__v8di)__W);
5807 _mm512_mask_srav_epi32(__m512i __W, __mmask16 __U, __m512i __X, __m512i __Y)
5811 (__v16si)__W);
5829 _mm512_mask_srav_epi64(__m512i __W, __mmask8 __U, __m512i __X, __m512i __Y)
5833 (__v8di)__W);
5851 _mm512_mask_srl_epi32(__m512i __W, __mmask16 __U, __m512i __A, __m128i __B)
5855 (__v16si)__W);
5873 _mm512_mask_srl_epi64(__m512i __W, __mmask8 __U, __m512i __A, __m128i __B)
5877 (__v8di)__W);
5895 _mm512_mask_srlv_epi32(__m512i __W, __mmask16 __U, __m512i __X, __m512i __Y)
5899 (__v16si)__W);
5917 _mm512_mask_srlv_epi64(__m512i __W, __mmask8 __U, __m512i __X, __m512i __Y)
5921 (__v8di)__W);
6181 _mm512_mask_permutevar_pd(__m512d __W, __mmask8 __U, __m512d __A, __m512i __C)
6185 (__v8df)__W);
6203 _mm512_mask_permutevar_ps(__m512 __W, __mmask16 __U, __m512 __A, __m512i __C)
6207 (__v16sf)__W);
6309 _mm512_mask_cvttpd_epu32 (__m256i __W, __mmask8 __U, __m512d __A)
6312 (__v8si) __W,
6441 _mm512_mask_scalef_pd (__m512d __W, __mmask8 __U, __m512d __A, __m512d __B)
6445 (__v8df) __W,
6491 _mm512_mask_scalef_ps (__m512 __W, __mmask16 __U, __m512 __A, __m512 __B)
6495 (__v16sf) __W,
6527 _mm_mask_scalef_sd (__m128d __W, __mmask8 __U, __m128d __A, __m128d __B)
6531 (__v2df) __W,
6574 _mm_mask_scalef_ss (__m128 __W, __mmask8 __U, __m128 __A, __m128 __B)
6578 (__v4sf) __W,
6613 _mm512_mask_srai_epi32(__m512i __W, __mmask16 __U, __m512i __A,
6618 (__v16si)__W);
6636 _mm512_mask_srai_epi64(__m512i __W, __mmask8 __U, __m512i __A, unsigned int __B)
6640 (__v8di)__W);
6742 _mm_mask_sqrt_sd (__m128d __W, __mmask8 __U, __m128d __A, __m128d __B)
6746 (__v2df) __W,
6780 _mm_mask_sqrt_ss (__m128 __W, __mmask8 __U, __m128 __A, __m128 __B)
6784 (__v4sf) __W,
7564 _mm512_mask_getexp_pd (__m512d __W, __mmask8 __U, __m512d __A)
7567 (__v8df) __W,
7606 _mm512_mask_getexp_ps (__m512 __W, __mmask16 __U, __m512 __A)
7609 (__v16sf) __W,
7800 _mm_mask_fmadd_ss (__m128 __W, __mmask8 __U, __m128 __A, __m128 __B)
7802 return __builtin_ia32_vfmaddss3_mask((__v4sf)__W,
7838 _mm_mask3_fmadd_ss (__m128 __W, __m128 __X, __m128 __Y, __mmask8 __U)
7840 return __builtin_ia32_vfmaddss3_mask3((__v4sf)__W,
7854 _mm_mask_fmsub_ss (__m128 __W, __mmask8 __U, __m128 __A, __m128 __B)
7856 return __builtin_ia32_vfmaddss3_mask((__v4sf)__W,
7892 _mm_mask3_fmsub_ss (__m128 __W, __m128 __X, __m128 __Y, __mmask8 __U)
7894 return __builtin_ia32_vfmsubss3_mask3((__v4sf)__W,
7908 _mm_mask_fnmadd_ss (__m128 __W, __mmask8 __U, __m128 __A, __m128 __B)
7910 return __builtin_ia32_vfmaddss3_mask((__v4sf)__W,
7946 _mm_mask3_fnmadd_ss (__m128 __W, __m128 __X, __m128 __Y, __mmask8 __U)
7948 return __builtin_ia32_vfmaddss3_mask3((__v4sf)__W,
7962 _mm_mask_fnmsub_ss (__m128 __W, __mmask8 __U, __m128 __A, __m128 __B)
7964 return __builtin_ia32_vfmaddss3_mask((__v4sf)__W,
8000 _mm_mask3_fnmsub_ss (__m128 __W, __m128 __X, __m128 __Y, __mmask8 __U)
8002 return __builtin_ia32_vfmsubss3_mask3((__v4sf)__W,
8016 _mm_mask_fmadd_sd (__m128d __W, __mmask8 __U, __m128d __A, __m128d __B)
8018 return __builtin_ia32_vfmaddsd3_mask((__v2df)__W,
8054 _mm_mask3_fmadd_sd (__m128d __W, __m128d __X, __m128d __Y, __mmask8 __U)
8056 return __builtin_ia32_vfmaddsd3_mask3((__v2df)__W,
8070 _mm_mask_fmsub_sd (__m128d __W, __mmask8 __U, __m128d __A, __m128d __B)
8072 return __builtin_ia32_vfmaddsd3_mask((__v2df)__W,
8108 _mm_mask3_fmsub_sd (__m128d __W, __m128d __X, __m128d __Y, __mmask8 __U)
8110 return __builtin_ia32_vfmsubsd3_mask3((__v2df)__W,
8124 _mm_mask_fnmadd_sd (__m128d __W, __mmask8 __U, __m128d __A, __m128d __B)
8126 return __builtin_ia32_vfmaddsd3_mask((__v2df)__W,
8162 _mm_mask3_fnmadd_sd (__m128d __W, __m128d __X, __m128d __Y, __mmask8 __U)
8164 return __builtin_ia32_vfmaddsd3_mask3((__v2df)__W,
8178 _mm_mask_fnmsub_sd (__m128d __W, __mmask8 __U, __m128d __A, __m128d __B)
8180 return __builtin_ia32_vfmaddsd3_mask((__v2df)__W,
8217 _mm_mask3_fnmsub_sd (__m128d __W, __m128d __X, __m128d __Y, __mmask8 __U)
8219 return __builtin_ia32_vfmsubsd3_mask3((__v2df)__W,
8265 _mm512_mask_permutexvar_pd (__m512d __W, __mmask8 __U, __m512i __X, __m512d __Y)
8269 (__v8df)__W);
8295 _mm512_mask_permutexvar_epi64 (__m512i __W, __mmask8 __M, __m512i __X,
8300 (__v8di)__W);
8310 _mm512_mask_permutexvar_ps (__m512 __W, __mmask16 __U, __m512i __X, __m512 __Y)
8314 (__v16sf)__W);
8342 _mm512_mask_permutexvar_epi32 (__m512i __W, __mmask16 __M, __m512i __X,
8347 (__v16si)__W);
8480 _mm512_mask_compress_pd (__m512d __W, __mmask8 __U, __m512d __A)
8483 (__v8df) __W,
8497 _mm512_mask_compress_epi64 (__m512i __W, __mmask8 __U, __m512i __A)
8500 (__v8di) __W,
8514 _mm512_mask_compress_ps (__m512 __W, __mmask16 __U, __m512 __A)
8517 (__v16sf) __W,
8531 _mm512_mask_compress_epi32 (__m512i __W, __mmask16 __U, __m512i __A)
8534 (__v16si) __W,
8657 _mm512_mask_movehdup_ps (__m512 __W, __mmask16 __U, __m512 __A)
8661 (__v16sf)__W);
8680 _mm512_mask_moveldup_ps (__m512 __W, __mmask16 __U, __m512 __A)
8684 (__v16sf)__W);
8696 _mm_mask_move_ss (__m128 __W, __mmask8 __U, __m128 __A, __m128 __B)
8698 return __builtin_ia32_selectss_128(__U, _mm_move_ss(__A, __B), __W);
8709 _mm_mask_move_sd (__m128d __W, __mmask8 __U, __m128d __A, __m128d __B)
8711 return __builtin_ia32_selectsd_128(__U, _mm_move_sd(__A, __B), __W);
8722 _mm_mask_store_ss (float * __W, __mmask8 __U, __m128 __A)
8724 __builtin_ia32_storess128_mask ((__v4sf *)__W, __A, __U & 1);
8728 _mm_mask_store_sd (double * __W, __mmask8 __U, __m128d __A)
8730 __builtin_ia32_storesd128_mask ((__v2df *)__W, __A, __U & 1);
8734 _mm_mask_load_ss (__m128 __W, __mmask8 __U, const float* __A)
8736 __m128 src = (__v4sf) __builtin_shufflevector((__v4sf) __W,
8752 _mm_mask_load_sd (__m128d __W, __mmask8 __U, const double* __A)
8754 __m128d src = (__v2df) __builtin_shufflevector((__v2df) __W,
8783 _mm512_mask_expand_pd (__m512d __W, __mmask8 __U, __m512d __A)
8786 (__v8df) __W,
8799 _mm512_mask_expand_epi64 (__m512i __W, __mmask8 __U, __m512i __A)
8802 (__v8di) __W,
8815 _mm512_mask_expandloadu_pd(__m512d __W, __mmask8 __U, void const *__P)
8818 (__v8df) __W,
8831 _mm512_mask_expandloadu_epi64(__m512i __W, __mmask8 __U, void const *__P)
8834 (__v8di) __W,
8847 _mm512_mask_expandloadu_ps(__m512 __W, __mmask16 __U, void const *__P)
8850 (__v16sf) __W,
8863 _mm512_mask_expandloadu_epi32(__m512i __W, __mmask16 __U, void const *__P)
8866 (__v16si) __W,
8879 _mm512_mask_expand_ps (__m512 __W, __mmask16 __U, __m512 __A)
8882 (__v16sf) __W,
8895 _mm512_mask_expand_epi32 (__m512i __W, __mmask16 __U, __m512i __A)
8898 (__v16si) __W,
8932 _mm512_mask_cvtps_pd (__m512d __W, __mmask8 __U, __m256 __A)
8936 (__v8df)__W);
8954 _mm512_mask_cvtpslo_pd (__m512d __W, __mmask8 __U, __m512 __A)
8956 return (__m512d) _mm512_mask_cvtps_pd(__W, __U, _mm512_castps512_ps256(__A));
8960 _mm512_mask_mov_pd (__m512d __W, __mmask8 __U, __m512d __A)
8964 (__v8df) __W);
8976 _mm512_mask_mov_ps (__m512 __W, __mmask16 __U, __m512 __A)
8980 (__v16sf) __W);
9038 _mm_mask_cvtsd_ss (__m128 __W, __mmask8 __U, __m128 __A, __m128d __B)
9042 (__v4sf)__W,
9111 _mm_mask_cvtss_sd (__m128d __W, __mmask8 __U, __m128d __A, __m128 __B)
9115 (__v2df)__W,
9288 _mm512_mask_abs_ps(__m512 __W, __mmask16 __K, __m512 __A)
9290 return (__m512)_mm512_mask_and_epi32((__m512i)__W, __K, _mm512_set1_epi32(0x7FFFFFFF),(__m512i)__A) ;
9300 _mm512_mask_abs_pd(__m512d __W, __mmask8 __K, __m512d __A)
9302 return (__m512d)_mm512_mask_and_epi64((__v8di)__W, __K, _mm512_set1_epi64(0x7FFFFFFFFFFFFFFF),(__v8di)__A);
9321 static __inline__ long long __DEFAULT_FN_ATTRS512 _mm512_reduce_add_epi64(__m512i __W) {
9322 return __builtin_reduce_add((__v8di)__W);
9325 static __inline__ long long __DEFAULT_FN_ATTRS512 _mm512_reduce_mul_epi64(__m512i __W) {
9326 return __builtin_reduce_mul((__v8di)__W);
9329 static __inline__ long long __DEFAULT_FN_ATTRS512 _mm512_reduce_and_epi64(__m512i __W) {
9330 return __builtin_reduce_and((__v8di)__W);
9333 static __inline__ long long __DEFAULT_FN_ATTRS512 _mm512_reduce_or_epi64(__m512i __W) {
9334 return __builtin_reduce_or((__v8di)__W);
9338 _mm512_mask_reduce_add_epi64(__mmask8 __M, __m512i __W) {
9339 __W = _mm512_maskz_mov_epi64(__M, __W);
9340 return __builtin_reduce_add((__v8di)__W);
9344 _mm512_mask_reduce_mul_epi64(__mmask8 __M, __m512i __W) {
9345 __W = _mm512_mask_mov_epi64(_mm512_set1_epi64(1), __M, __W);
9346 return __builtin_reduce_mul((__v8di)__W);
9350 _mm512_mask_reduce_and_epi64(__mmask8 __M, __m512i __W) {
9351 __W = _mm512_mask_mov_epi64(_mm512_set1_epi64(-1LL), __M, __W);
9352 return __builtin_reduce_and((__v8di)__W);
9356 _mm512_mask_reduce_or_epi64(__mmask8 __M, __m512i __W) {
9357 __W = _mm512_maskz_mov_epi64(__M, __W);
9358 return __builtin_reduce_or((__v8di)__W);
9364 static __inline__ double __DEFAULT_FN_ATTRS512 _mm512_reduce_add_pd(__m512d __W) {
9365 return __builtin_ia32_reduce_fadd_pd512(-0.0, __W);
9368 static __inline__ double __DEFAULT_FN_ATTRS512 _mm512_reduce_mul_pd(__m512d __W) {
9369 return __builtin_ia32_reduce_fmul_pd512(1.0, __W);
9373 _mm512_mask_reduce_add_pd(__mmask8 __M, __m512d __W) {
9374 __W = _mm512_maskz_mov_pd(__M, __W);
9375 return __builtin_ia32_reduce_fadd_pd512(-0.0, __W);
9379 _mm512_mask_reduce_mul_pd(__mmask8 __M, __m512d __W) {
9380 __W = _mm512_mask_mov_pd(_mm512_set1_pd(1.0), __M, __W);
9381 return __builtin_ia32_reduce_fmul_pd512(1.0, __W);
9385 _mm512_reduce_add_epi32(__m512i __W) {
9386 return __builtin_reduce_add((__v16si)__W);
9390 _mm512_reduce_mul_epi32(__m512i __W) {
9391 return __builtin_reduce_mul((__v16si)__W);
9395 _mm512_reduce_and_epi32(__m512i __W) {
9396 return __builtin_reduce_and((__v16si)__W);
9400 _mm512_reduce_or_epi32(__m512i __W) {
9401 return __builtin_reduce_or((__v16si)__W);
9405 _mm512_mask_reduce_add_epi32( __mmask16 __M, __m512i __W) {
9406 __W = _mm512_maskz_mov_epi32(__M, __W);
9407 return __builtin_reduce_add((__v16si)__W);
9411 _mm512_mask_reduce_mul_epi32( __mmask16 __M, __m512i __W) {
9412 __W = _mm512_mask_mov_epi32(_mm512_set1_epi32(1), __M, __W);
9413 return __builtin_reduce_mul((__v16si)__W);
9417 _mm512_mask_reduce_and_epi32( __mmask16 __M, __m512i __W) {
9418 __W = _mm512_mask_mov_epi32(_mm512_set1_epi32(-1), __M, __W);
9419 return __builtin_reduce_and((__v16si)__W);
9423 _mm512_mask_reduce_or_epi32(__mmask16 __M, __m512i __W) {
9424 __W = _mm512_maskz_mov_epi32(__M, __W);
9425 return __builtin_reduce_or((__v16si)__W);
9429 _mm512_reduce_add_ps(__m512 __W) {
9430 return __builtin_ia32_reduce_fadd_ps512(-0.0f, __W);
9434 _mm512_reduce_mul_ps(__m512 __W) {
9435 return __builtin_ia32_reduce_fmul_ps512(1.0f, __W);
9439 _mm512_mask_reduce_add_ps(__mmask16 __M, __m512 __W) {
9440 __W = _mm512_maskz_mov_ps(__M, __W);
9441 return __builtin_ia32_reduce_fadd_ps512(-0.0f, __W);
9445 _mm512_mask_reduce_mul_ps(__mmask16 __M, __m512 __W) {
9446 __W = _mm512_mask_mov_ps(_mm512_set1_ps(1.0f), __M, __W);
9447 return __builtin_ia32_reduce_fmul_ps512(1.0f, __W);