Lines Matching refs:__A

209 _mm512_broadcastd_epi32 (__m128i __A)
211 return (__m512i)__builtin_shufflevector((__v4si) __A, (__v4si) __A,
216 _mm512_mask_broadcastd_epi32 (__m512i __O, __mmask16 __M, __m128i __A)
219 (__v16si) _mm512_broadcastd_epi32(__A),
224 _mm512_maskz_broadcastd_epi32 (__mmask16 __M, __m128i __A)
227 (__v16si) _mm512_broadcastd_epi32(__A),
232 _mm512_broadcastq_epi64 (__m128i __A)
234 return (__m512i)__builtin_shufflevector((__v2di) __A, (__v2di) __A,
239 _mm512_mask_broadcastq_epi64 (__m512i __O, __mmask8 __M, __m128i __A)
242 (__v8di) _mm512_broadcastq_epi64(__A),
248 _mm512_maskz_broadcastq_epi64 (__mmask8 __M, __m128i __A)
251 (__v8di) _mm512_broadcastq_epi64(__A),
317 _mm512_maskz_set1_epi32(__mmask16 __M, int __A)
320 (__v16si)_mm512_set1_epi32(__A),
331 _mm512_maskz_set1_epi64(__mmask8 __M, long long __A)
334 (__v8di)_mm512_set1_epi64(__A),
339 _mm512_broadcastss_ps(__m128 __A)
341 return (__m512)__builtin_shufflevector((__v4sf) __A, (__v4sf) __A,
346 _mm512_set4_epi32 (int __A, int __B, int __C, int __D)
349 { __D, __C, __B, __A, __D, __C, __B, __A,
350 __D, __C, __B, __A, __D, __C, __B, __A };
354 _mm512_set4_epi64 (long long __A, long long __B, long long __C,
358 { __D, __C, __B, __A, __D, __C, __B, __A };
362 _mm512_set4_pd (double __A, double __B, double __C, double __D)
365 { __D, __C, __B, __A, __D, __C, __B, __A };
369 _mm512_set4_ps (float __A, float __B, float __C, float __D)
372 { __D, __C, __B, __A, __D, __C, __B, __A,
373 __D, __C, __B, __A, __D, __C, __B, __A };
389 _mm512_broadcastsd_pd(__m128d __A)
391 return (__m512d)__builtin_shufflevector((__v2df) __A, (__v2df) __A,
417 _mm512_castpd512_pd256 (__m512d __A)
419 return __builtin_shufflevector(__A, __A, 0, 1, 2, 3);
429 _mm512_castps512_ps256 (__m512 __A)
431 return __builtin_shufflevector(__A, __A, 0, 1, 2, 3, 4, 5, 6, 7);
435 _mm512_castpd_ps (__m512d __A)
437 return (__m512) (__A);
441 _mm512_castpd_si512 (__m512d __A)
443 return (__m512i) (__A);
447 _mm512_castpd128_pd512 (__m128d __A)
449 return __builtin_shufflevector( __A, __A, 0, 1, -1, -1, -1, -1, -1, -1);
453 _mm512_castps_pd (__m512 __A)
455 return (__m512d) (__A);
459 _mm512_castps_si512 (__m512 __A)
461 return (__m512i) (__A);
465 _mm512_castps128_ps512 (__m128 __A)
467 return __builtin_shufflevector( __A, __A, 0, 1, 2, 3, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1);
471 _mm512_castsi128_si512 (__m128i __A)
473 return __builtin_shufflevector( __A, __A, 0, 1, -1, -1, -1, -1, -1, -1);
477 _mm512_castsi256_si512 (__m256i __A)
479 return __builtin_shufflevector( __A, __A, 0, 1, 2, 3, -1, -1, -1, -1);
483 _mm512_castsi512_ps (__m512i __A)
485 return (__m512) (__A);
489 _mm512_castsi512_pd (__m512i __A)
491 return (__m512d) (__A);
495 _mm512_castsi512_si128 (__m512i __A)
497 return (__m128i)__builtin_shufflevector(__A, __A , 0, 1);
501 _mm512_castsi512_si256 (__m512i __A)
503 return (__m256i)__builtin_shufflevector(__A, __A , 0, 1, 2, 3);
672 _mm512_andnot_si512 (__m512i __A, __m512i __B)
674 return (__m512i)(~(__v8du)__A & (__v8du)__B);
678 _mm512_andnot_epi32 (__m512i __A, __m512i __B)
680 return (__m512i)(~(__v16su)__A & (__v16su)__B);
684 _mm512_mask_andnot_epi32(__m512i __W, __mmask16 __U, __m512i __A, __m512i __B)
687 (__v16si)_mm512_andnot_epi32(__A, __B),
692 _mm512_maskz_andnot_epi32(__mmask16 __U, __m512i __A, __m512i __B)
695 __U, __A, __B);
699 _mm512_andnot_epi64(__m512i __A, __m512i __B)
701 return (__m512i)(~(__v8du)__A & (__v8du)__B);
705 _mm512_mask_andnot_epi64(__m512i __W, __mmask8 __U, __m512i __A, __m512i __B)
708 (__v8di)_mm512_andnot_epi64(__A, __B),
713 _mm512_maskz_andnot_epi64(__mmask8 __U, __m512i __A, __m512i __B)
716 __U, __A, __B);
856 _mm512_add_epi64 (__m512i __A, __m512i __B)
858 return (__m512i) ((__v8du) __A + (__v8du) __B);
862 _mm512_mask_add_epi64(__m512i __W, __mmask8 __U, __m512i __A, __m512i __B)
865 (__v8di)_mm512_add_epi64(__A, __B),
870 _mm512_maskz_add_epi64(__mmask8 __U, __m512i __A, __m512i __B)
873 (__v8di)_mm512_add_epi64(__A, __B),
878 _mm512_sub_epi64 (__m512i __A, __m512i __B)
880 return (__m512i) ((__v8du) __A - (__v8du) __B);
884 _mm512_mask_sub_epi64(__m512i __W, __mmask8 __U, __m512i __A, __m512i __B)
887 (__v8di)_mm512_sub_epi64(__A, __B),
892 _mm512_maskz_sub_epi64(__mmask8 __U, __m512i __A, __m512i __B)
895 (__v8di)_mm512_sub_epi64(__A, __B),
900 _mm512_add_epi32 (__m512i __A, __m512i __B)
902 return (__m512i) ((__v16su) __A + (__v16su) __B);
906 _mm512_mask_add_epi32(__m512i __W, __mmask16 __U, __m512i __A, __m512i __B)
909 (__v16si)_mm512_add_epi32(__A, __B),
914 _mm512_maskz_add_epi32 (__mmask16 __U, __m512i __A, __m512i __B)
917 (__v16si)_mm512_add_epi32(__A, __B),
922 _mm512_sub_epi32 (__m512i __A, __m512i __B)
924 return (__m512i) ((__v16su) __A - (__v16su) __B);
928 _mm512_mask_sub_epi32(__m512i __W, __mmask16 __U, __m512i __A, __m512i __B)
931 (__v16si)_mm512_sub_epi32(__A, __B),
936 _mm512_maskz_sub_epi32(__mmask16 __U, __m512i __A, __m512i __B)
939 (__v16si)_mm512_sub_epi32(__A, __B),
958 _mm512_max_pd(__m512d __A, __m512d __B)
960 return (__m512d) __builtin_ia32_maxpd512((__v8df) __A, (__v8df) __B,
965 _mm512_mask_max_pd (__m512d __W, __mmask8 __U, __m512d __A, __m512d __B)
968 (__v8df)_mm512_max_pd(__A, __B),
973 _mm512_maskz_max_pd (__mmask8 __U, __m512d __A, __m512d __B)
976 (__v8df)_mm512_max_pd(__A, __B),
995 _mm512_max_ps(__m512 __A, __m512 __B)
997 return (__m512) __builtin_ia32_maxps512((__v16sf) __A, (__v16sf) __B,
1002 _mm512_mask_max_ps (__m512 __W, __mmask16 __U, __m512 __A, __m512 __B)
1005 (__v16sf)_mm512_max_ps(__A, __B),
1010 _mm512_maskz_max_ps (__mmask16 __U, __m512 __A, __m512 __B)
1013 (__v16sf)_mm512_max_ps(__A, __B),
1018 _mm_mask_max_ss(__m128 __W, __mmask8 __U,__m128 __A, __m128 __B) {
1019 return (__m128) __builtin_ia32_maxss_round_mask ((__v4sf) __A,
1027 _mm_maskz_max_ss(__mmask8 __U,__m128 __A, __m128 __B) {
1028 return (__m128) __builtin_ia32_maxss_round_mask ((__v4sf) __A,
1054 _mm_mask_max_sd(__m128d __W, __mmask8 __U,__m128d __A, __m128d __B) {
1055 return (__m128d) __builtin_ia32_maxsd_round_mask ((__v2df) __A,
1063 _mm_maskz_max_sd(__mmask8 __U,__m128d __A, __m128d __B) {
1064 return (__m128d) __builtin_ia32_maxsd_round_mask ((__v2df) __A,
1091 _mm512_max_epi32(__m512i __A, __m512i __B)
1093 return (__m512i)__builtin_elementwise_max((__v16si)__A, (__v16si)__B);
1097 _mm512_mask_max_epi32 (__m512i __W, __mmask16 __M, __m512i __A, __m512i __B)
1100 (__v16si)_mm512_max_epi32(__A, __B),
1105 _mm512_maskz_max_epi32 (__mmask16 __M, __m512i __A, __m512i __B)
1108 (__v16si)_mm512_max_epi32(__A, __B),
1113 _mm512_max_epu32(__m512i __A, __m512i __B)
1115 return (__m512i)__builtin_elementwise_max((__v16su)__A, (__v16su)__B);
1119 _mm512_mask_max_epu32 (__m512i __W, __mmask16 __M, __m512i __A, __m512i __B)
1122 (__v16si)_mm512_max_epu32(__A, __B),
1127 _mm512_maskz_max_epu32 (__mmask16 __M, __m512i __A, __m512i __B)
1130 (__v16si)_mm512_max_epu32(__A, __B),
1135 _mm512_max_epi64(__m512i __A, __m512i __B)
1137 return (__m512i)__builtin_elementwise_max((__v8di)__A, (__v8di)__B);
1141 _mm512_mask_max_epi64 (__m512i __W, __mmask8 __M, __m512i __A, __m512i __B)
1144 (__v8di)_mm512_max_epi64(__A, __B),
1149 _mm512_maskz_max_epi64 (__mmask8 __M, __m512i __A, __m512i __B)
1152 (__v8di)_mm512_max_epi64(__A, __B),
1157 _mm512_max_epu64(__m512i __A, __m512i __B)
1159 return (__m512i)__builtin_elementwise_max((__v8du)__A, (__v8du)__B);
1163 _mm512_mask_max_epu64 (__m512i __W, __mmask8 __M, __m512i __A, __m512i __B)
1166 (__v8di)_mm512_max_epu64(__A, __B),
1171 _mm512_maskz_max_epu64 (__mmask8 __M, __m512i __A, __m512i __B)
1174 (__v8di)_mm512_max_epu64(__A, __B),
1193 _mm512_min_pd(__m512d __A, __m512d __B)
1195 return (__m512d) __builtin_ia32_minpd512((__v8df) __A, (__v8df) __B,
1200 _mm512_mask_min_pd (__m512d __W, __mmask8 __U, __m512d __A, __m512d __B)
1203 (__v8df)_mm512_min_pd(__A, __B),
1208 _mm512_maskz_min_pd (__mmask8 __U, __m512d __A, __m512d __B)
1211 (__v8df)_mm512_min_pd(__A, __B),
1230 _mm512_min_ps(__m512 __A, __m512 __B)
1232 return (__m512) __builtin_ia32_minps512((__v16sf) __A, (__v16sf) __B,
1237 _mm512_mask_min_ps (__m512 __W, __mmask16 __U, __m512 __A, __m512 __B)
1240 (__v16sf)_mm512_min_ps(__A, __B),
1245 _mm512_maskz_min_ps (__mmask16 __U, __m512 __A, __m512 __B)
1248 (__v16sf)_mm512_min_ps(__A, __B),
1253 _mm_mask_min_ss(__m128 __W, __mmask8 __U,__m128 __A, __m128 __B) {
1254 return (__m128) __builtin_ia32_minss_round_mask ((__v4sf) __A,
1262 _mm_maskz_min_ss(__mmask8 __U,__m128 __A, __m128 __B) {
1263 return (__m128) __builtin_ia32_minss_round_mask ((__v4sf) __A,
1289 _mm_mask_min_sd(__m128d __W, __mmask8 __U,__m128d __A, __m128d __B) {
1290 return (__m128d) __builtin_ia32_minsd_round_mask ((__v2df) __A,
1298 _mm_maskz_min_sd(__mmask8 __U,__m128d __A, __m128d __B) {
1299 return (__m128d) __builtin_ia32_minsd_round_mask ((__v2df) __A,
1326 _mm512_min_epi32(__m512i __A, __m512i __B)
1328 return (__m512i)__builtin_elementwise_min((__v16si)__A, (__v16si)__B);
1332 _mm512_mask_min_epi32 (__m512i __W, __mmask16 __M, __m512i __A, __m512i __B)
1335 (__v16si)_mm512_min_epi32(__A, __B),
1340 _mm512_maskz_min_epi32 (__mmask16 __M, __m512i __A, __m512i __B)
1343 (__v16si)_mm512_min_epi32(__A, __B),
1348 _mm512_min_epu32(__m512i __A, __m512i __B)
1350 return (__m512i)__builtin_elementwise_min((__v16su)__A, (__v16su)__B);
1354 _mm512_mask_min_epu32 (__m512i __W, __mmask16 __M, __m512i __A, __m512i __B)
1357 (__v16si)_mm512_min_epu32(__A, __B),
1362 _mm512_maskz_min_epu32 (__mmask16 __M, __m512i __A, __m512i __B)
1365 (__v16si)_mm512_min_epu32(__A, __B),
1370 _mm512_min_epi64(__m512i __A, __m512i __B)
1372 return (__m512i)__builtin_elementwise_min((__v8di)__A, (__v8di)__B);
1376 _mm512_mask_min_epi64 (__m512i __W, __mmask8 __M, __m512i __A, __m512i __B)
1379 (__v8di)_mm512_min_epi64(__A, __B),
1384 _mm512_maskz_min_epi64 (__mmask8 __M, __m512i __A, __m512i __B)
1387 (__v8di)_mm512_min_epi64(__A, __B),
1392 _mm512_min_epu64(__m512i __A, __m512i __B)
1394 return (__m512i)__builtin_elementwise_min((__v8du)__A, (__v8du)__B);
1398 _mm512_mask_min_epu64 (__m512i __W, __mmask8 __M, __m512i __A, __m512i __B)
1401 (__v8di)_mm512_min_epu64(__A, __B),
1406 _mm512_maskz_min_epu64 (__mmask8 __M, __m512i __A, __m512i __B)
1409 (__v8di)_mm512_min_epu64(__A, __B),
1458 _mm512_mullo_epi32 (__m512i __A, __m512i __B)
1460 return (__m512i) ((__v16su) __A * (__v16su) __B);
1464 _mm512_maskz_mullo_epi32(__mmask16 __M, __m512i __A, __m512i __B)
1467 (__v16si)_mm512_mullo_epi32(__A, __B),
1472 _mm512_mask_mullo_epi32(__m512i __W, __mmask16 __M, __m512i __A, __m512i __B)
1475 (__v16si)_mm512_mullo_epi32(__A, __B),
1480 _mm512_mullox_epi64 (__m512i __A, __m512i __B) {
1481 return (__m512i) ((__v8du) __A * (__v8du) __B);
1485 _mm512_mask_mullox_epi64(__m512i __W, __mmask8 __U, __m512i __A, __m512i __B) {
1487 (__v8di)_mm512_mullox_epi64(__A, __B),
1505 _mm512_sqrt_pd(__m512d __A)
1507 return (__m512d)__builtin_ia32_sqrtpd512((__v8df)__A,
1512 _mm512_mask_sqrt_pd (__m512d __W, __mmask8 __U, __m512d __A)
1515 (__v8df)_mm512_sqrt_pd(__A),
1520 _mm512_maskz_sqrt_pd (__mmask8 __U, __m512d __A)
1523 (__v8df)_mm512_sqrt_pd(__A),
1541 _mm512_sqrt_ps(__m512 __A)
1543 return (__m512)__builtin_ia32_sqrtps512((__v16sf)__A,
1548 _mm512_mask_sqrt_ps(__m512 __W, __mmask16 __U, __m512 __A)
1551 (__v16sf)_mm512_sqrt_ps(__A),
1556 _mm512_maskz_sqrt_ps( __mmask16 __U, __m512 __A)
1559 (__v16sf)_mm512_sqrt_ps(__A),
1564 _mm512_rsqrt14_pd(__m512d __A)
1566 return (__m512d) __builtin_ia32_rsqrt14pd512_mask ((__v8df) __A,
1572 _mm512_mask_rsqrt14_pd (__m512d __W, __mmask8 __U, __m512d __A)
1574 return (__m512d) __builtin_ia32_rsqrt14pd512_mask ((__v8df) __A,
1580 _mm512_maskz_rsqrt14_pd (__mmask8 __U, __m512d __A)
1582 return (__m512d) __builtin_ia32_rsqrt14pd512_mask ((__v8df) __A,
1589 _mm512_rsqrt14_ps(__m512 __A)
1591 return (__m512) __builtin_ia32_rsqrt14ps512_mask ((__v16sf) __A,
1598 _mm512_mask_rsqrt14_ps (__m512 __W, __mmask16 __U, __m512 __A)
1600 return (__m512) __builtin_ia32_rsqrt14ps512_mask ((__v16sf) __A,
1606 _mm512_maskz_rsqrt14_ps (__mmask16 __U, __m512 __A)
1608 return (__m512) __builtin_ia32_rsqrt14ps512_mask ((__v16sf) __A,
1615 _mm_rsqrt14_ss(__m128 __A, __m128 __B)
1617 return (__m128) __builtin_ia32_rsqrt14ss_mask ((__v4sf) __A,
1625 _mm_mask_rsqrt14_ss (__m128 __W, __mmask8 __U, __m128 __A, __m128 __B)
1627 return (__m128) __builtin_ia32_rsqrt14ss_mask ((__v4sf) __A,
1634 _mm_maskz_rsqrt14_ss (__mmask8 __U, __m128 __A, __m128 __B)
1636 return (__m128) __builtin_ia32_rsqrt14ss_mask ((__v4sf) __A,
1643 _mm_rsqrt14_sd(__m128d __A, __m128d __B)
1645 return (__m128d) __builtin_ia32_rsqrt14sd_mask ((__v2df) __A,
1653 _mm_mask_rsqrt14_sd (__m128d __W, __mmask8 __U, __m128d __A, __m128d __B)
1655 return (__m128d) __builtin_ia32_rsqrt14sd_mask ( (__v2df) __A,
1662 _mm_maskz_rsqrt14_sd (__mmask8 __U, __m128d __A, __m128d __B)
1664 return (__m128d) __builtin_ia32_rsqrt14sd_mask ( (__v2df) __A,
1671 _mm512_rcp14_pd(__m512d __A)
1673 return (__m512d) __builtin_ia32_rcp14pd512_mask ((__v8df) __A,
1680 _mm512_mask_rcp14_pd (__m512d __W, __mmask8 __U, __m512d __A)
1682 return (__m512d) __builtin_ia32_rcp14pd512_mask ((__v8df) __A,
1688 _mm512_maskz_rcp14_pd (__mmask8 __U, __m512d __A)
1690 return (__m512d) __builtin_ia32_rcp14pd512_mask ((__v8df) __A,
1697 _mm512_rcp14_ps(__m512 __A)
1699 return (__m512) __builtin_ia32_rcp14ps512_mask ((__v16sf) __A,
1706 _mm512_mask_rcp14_ps (__m512 __W, __mmask16 __U, __m512 __A)
1708 return (__m512) __builtin_ia32_rcp14ps512_mask ((__v16sf) __A,
1714 _mm512_maskz_rcp14_ps (__mmask16 __U, __m512 __A)
1716 return (__m512) __builtin_ia32_rcp14ps512_mask ((__v16sf) __A,
1723 _mm_rcp14_ss(__m128 __A, __m128 __B)
1725 return (__m128) __builtin_ia32_rcp14ss_mask ((__v4sf) __A,
1733 _mm_mask_rcp14_ss (__m128 __W, __mmask8 __U, __m128 __A, __m128 __B)
1735 return (__m128) __builtin_ia32_rcp14ss_mask ((__v4sf) __A,
1742 _mm_maskz_rcp14_ss (__mmask8 __U, __m128 __A, __m128 __B)
1744 return (__m128) __builtin_ia32_rcp14ss_mask ((__v4sf) __A,
1751 _mm_rcp14_sd(__m128d __A, __m128d __B)
1753 return (__m128d) __builtin_ia32_rcp14sd_mask ((__v2df) __A,
1761 _mm_mask_rcp14_sd (__m128d __W, __mmask8 __U, __m128d __A, __m128d __B)
1763 return (__m128d) __builtin_ia32_rcp14sd_mask ( (__v2df) __A,
1770 _mm_maskz_rcp14_sd (__mmask8 __U, __m128d __A, __m128d __B)
1772 return (__m128d) __builtin_ia32_rcp14sd_mask ( (__v2df) __A,
1779 _mm512_floor_ps(__m512 __A)
1781 return (__m512) __builtin_ia32_rndscaleps_mask ((__v16sf) __A,
1783 (__v16sf) __A, (unsigned short)-1,
1788 _mm512_mask_floor_ps (__m512 __W, __mmask16 __U, __m512 __A)
1790 return (__m512) __builtin_ia32_rndscaleps_mask ((__v16sf) __A,
1797 _mm512_floor_pd(__m512d __A)
1799 return (__m512d) __builtin_ia32_rndscalepd_mask ((__v8df) __A,
1801 (__v8df) __A, (unsigned char)-1,
1806 _mm512_mask_floor_pd (__m512d __W, __mmask8 __U, __m512d __A)
1808 return (__m512d) __builtin_ia32_rndscalepd_mask ((__v8df) __A,
1815 _mm512_mask_ceil_ps (__m512 __W, __mmask16 __U, __m512 __A)
1817 return (__m512) __builtin_ia32_rndscaleps_mask ((__v16sf) __A,
1824 _mm512_ceil_ps(__m512 __A)
1826 return (__m512) __builtin_ia32_rndscaleps_mask ((__v16sf) __A,
1828 (__v16sf) __A, (unsigned short)-1,
1833 _mm512_ceil_pd(__m512d __A)
1835 return (__m512d) __builtin_ia32_rndscalepd_mask ((__v8df) __A,
1837 (__v8df) __A, (unsigned char)-1,
1842 _mm512_mask_ceil_pd (__m512d __W, __mmask8 __U, __m512d __A)
1844 return (__m512d) __builtin_ia32_rndscalepd_mask ((__v8df) __A,
1851 _mm512_abs_epi64(__m512i __A)
1853 return (__m512i)__builtin_elementwise_abs((__v8di)__A);
1857 _mm512_mask_abs_epi64 (__m512i __W, __mmask8 __U, __m512i __A)
1860 (__v8di)_mm512_abs_epi64(__A),
1865 _mm512_maskz_abs_epi64 (__mmask8 __U, __m512i __A)
1868 (__v8di)_mm512_abs_epi64(__A),
1873 _mm512_abs_epi32(__m512i __A)
1875 return (__m512i)__builtin_elementwise_abs((__v16si) __A);
1879 _mm512_mask_abs_epi32 (__m512i __W, __mmask16 __U, __m512i __A)
1882 (__v16si)_mm512_abs_epi32(__A),
1887 _mm512_maskz_abs_epi32 (__mmask16 __U, __m512i __A)
1890 (__v16si)_mm512_abs_epi32(__A),
1895 _mm_mask_add_ss(__m128 __W, __mmask8 __U,__m128 __A, __m128 __B) {
1896 __A = _mm_add_ss(__A, __B);
1897 return __builtin_ia32_selectss_128(__U, __A, __W);
1901 _mm_maskz_add_ss(__mmask8 __U,__m128 __A, __m128 __B) {
1902 __A = _mm_add_ss(__A, __B);
1903 return __builtin_ia32_selectss_128(__U, __A, _mm_setzero_ps());
1925 _mm_mask_add_sd(__m128d __W, __mmask8 __U,__m128d __A, __m128d __B) {
1926 __A = _mm_add_sd(__A, __B);
1927 return __builtin_ia32_selectsd_128(__U, __A, __W);
1931 _mm_maskz_add_sd(__mmask8 __U,__m128d __A, __m128d __B) {
1932 __A = _mm_add_sd(__A, __B);
1933 return __builtin_ia32_selectsd_128(__U, __A, _mm_setzero_pd());
1954 _mm512_mask_add_pd(__m512d __W, __mmask8 __U, __m512d __A, __m512d __B) {
1956 (__v8df)_mm512_add_pd(__A, __B),
1961 _mm512_maskz_add_pd(__mmask8 __U, __m512d __A, __m512d __B) {
1963 (__v8df)_mm512_add_pd(__A, __B),
1968 _mm512_mask_add_ps(__m512 __W, __mmask16 __U, __m512 __A, __m512 __B) {
1970 (__v16sf)_mm512_add_ps(__A, __B),
1975 _mm512_maskz_add_ps(__mmask16 __U, __m512 __A, __m512 __B) {
1977 (__v16sf)_mm512_add_ps(__A, __B),
2010 _mm_mask_sub_ss(__m128 __W, __mmask8 __U,__m128 __A, __m128 __B) {
2011 __A = _mm_sub_ss(__A, __B);
2012 return __builtin_ia32_selectss_128(__U, __A, __W);
2016 _mm_maskz_sub_ss(__mmask8 __U,__m128 __A, __m128 __B) {
2017 __A = _mm_sub_ss(__A, __B);
2018 return __builtin_ia32_selectss_128(__U, __A, _mm_setzero_ps());
2039 _mm_mask_sub_sd(__m128d __W, __mmask8 __U,__m128d __A, __m128d __B) {
2040 __A = _mm_sub_sd(__A, __B);
2041 return __builtin_ia32_selectsd_128(__U, __A, __W);
2045 _mm_maskz_sub_sd(__mmask8 __U,__m128d __A, __m128d __B) {
2046 __A = _mm_sub_sd(__A, __B);
2047 return __builtin_ia32_selectsd_128(__U, __A, _mm_setzero_pd());
2069 _mm512_mask_sub_pd(__m512d __W, __mmask8 __U, __m512d __A, __m512d __B) {
2071 (__v8df)_mm512_sub_pd(__A, __B),
2076 _mm512_maskz_sub_pd(__mmask8 __U, __m512d __A, __m512d __B) {
2078 (__v8df)_mm512_sub_pd(__A, __B),
2083 _mm512_mask_sub_ps(__m512 __W, __mmask16 __U, __m512 __A, __m512 __B) {
2085 (__v16sf)_mm512_sub_ps(__A, __B),
2090 _mm512_maskz_sub_ps(__mmask16 __U, __m512 __A, __m512 __B) {
2092 (__v16sf)_mm512_sub_ps(__A, __B),
2125 _mm_mask_mul_ss(__m128 __W, __mmask8 __U,__m128 __A, __m128 __B) {
2126 __A = _mm_mul_ss(__A, __B);
2127 return __builtin_ia32_selectss_128(__U, __A, __W);
2131 _mm_maskz_mul_ss(__mmask8 __U,__m128 __A, __m128 __B) {
2132 __A = _mm_mul_ss(__A, __B);
2133 return __builtin_ia32_selectss_128(__U, __A, _mm_setzero_ps());
2154 _mm_mask_mul_sd(__m128d __W, __mmask8 __U,__m128d __A, __m128d __B) {
2155 __A = _mm_mul_sd(__A, __B);
2156 return __builtin_ia32_selectsd_128(__U, __A, __W);
2160 _mm_maskz_mul_sd(__mmask8 __U,__m128d __A, __m128d __B) {
2161 __A = _mm_mul_sd(__A, __B);
2162 return __builtin_ia32_selectsd_128(__U, __A, _mm_setzero_pd());
2184 _mm512_mask_mul_pd(__m512d __W, __mmask8 __U, __m512d __A, __m512d __B) {
2186 (__v8df)_mm512_mul_pd(__A, __B),
2191 _mm512_maskz_mul_pd(__mmask8 __U, __m512d __A, __m512d __B) {
2193 (__v8df)_mm512_mul_pd(__A, __B),
2198 _mm512_mask_mul_ps(__m512 __W, __mmask16 __U, __m512 __A, __m512 __B) {
2200 (__v16sf)_mm512_mul_ps(__A, __B),
2205 _mm512_maskz_mul_ps(__mmask16 __U, __m512 __A, __m512 __B) {
2207 (__v16sf)_mm512_mul_ps(__A, __B),
2240 _mm_mask_div_ss(__m128 __W, __mmask8 __U,__m128 __A, __m128 __B) {
2241 __A = _mm_div_ss(__A, __B);
2242 return __builtin_ia32_selectss_128(__U, __A, __W);
2246 _mm_maskz_div_ss(__mmask8 __U,__m128 __A, __m128 __B) {
2247 __A = _mm_div_ss(__A, __B);
2248 return __builtin_ia32_selectss_128(__U, __A, _mm_setzero_ps());
2270 _mm_mask_div_sd(__m128d __W, __mmask8 __U,__m128d __A, __m128d __B) {
2271 __A = _mm_div_sd(__A, __B);
2272 return __builtin_ia32_selectsd_128(__U, __A, __W);
2276 _mm_maskz_div_sd(__mmask8 __U,__m128d __A, __m128d __B) {
2277 __A = _mm_div_sd(__A, __B);
2278 return __builtin_ia32_selectsd_128(__U, __A, _mm_setzero_pd());
2306 _mm512_mask_div_pd(__m512d __W, __mmask8 __U, __m512d __A, __m512d __B) {
2308 (__v8df)_mm512_div_pd(__A, __B),
2313 _mm512_maskz_div_pd(__mmask8 __U, __m512d __A, __m512d __B) {
2315 (__v8df)_mm512_div_pd(__A, __B),
2326 _mm512_mask_div_ps(__m512 __W, __mmask16 __U, __m512 __A, __m512 __B) {
2328 (__v16sf)_mm512_div_ps(__A, __B),
2333 _mm512_maskz_div_ps(__mmask16 __U, __m512 __A, __m512 __B) {
2335 (__v16sf)_mm512_div_ps(__A, __B),
2516 _mm512_fmadd_pd(__m512d __A, __m512d __B, __m512d __C)
2518 return (__m512d) __builtin_ia32_vfmaddpd512_mask ((__v8df) __A,
2526 _mm512_mask_fmadd_pd(__m512d __A, __mmask8 __U, __m512d __B, __m512d __C)
2528 return (__m512d) __builtin_ia32_vfmaddpd512_mask ((__v8df) __A,
2536 _mm512_mask3_fmadd_pd(__m512d __A, __m512d __B, __m512d __C, __mmask8 __U)
2538 return (__m512d) __builtin_ia32_vfmaddpd512_mask3 ((__v8df) __A,
2546 _mm512_maskz_fmadd_pd(__mmask8 __U, __m512d __A, __m512d __B, __m512d __C)
2548 return (__m512d) __builtin_ia32_vfmaddpd512_maskz ((__v8df) __A,
2556 _mm512_fmsub_pd(__m512d __A, __m512d __B, __m512d __C)
2558 return (__m512d) __builtin_ia32_vfmaddpd512_mask ((__v8df) __A,
2566 _mm512_mask_fmsub_pd(__m512d __A, __mmask8 __U, __m512d __B, __m512d __C)
2568 return (__m512d) __builtin_ia32_vfmaddpd512_mask ((__v8df) __A,
2576 _mm512_maskz_fmsub_pd(__mmask8 __U, __m512d __A, __m512d __B, __m512d __C)
2578 return (__m512d) __builtin_ia32_vfmaddpd512_maskz ((__v8df) __A,
2586 _mm512_fnmadd_pd(__m512d __A, __m512d __B, __m512d __C)
2588 return (__m512d) __builtin_ia32_vfmaddpd512_mask ((__v8df) __A,
2596 _mm512_mask3_fnmadd_pd(__m512d __A, __m512d __B, __m512d __C, __mmask8 __U)
2598 return (__m512d) __builtin_ia32_vfmaddpd512_mask3 (-(__v8df) __A,
2606 _mm512_maskz_fnmadd_pd(__mmask8 __U, __m512d __A, __m512d __B, __m512d __C)
2608 return (__m512d) __builtin_ia32_vfmaddpd512_maskz (-(__v8df) __A,
2616 _mm512_fnmsub_pd(__m512d __A, __m512d __B, __m512d __C)
2618 return (__m512d) __builtin_ia32_vfmaddpd512_mask ((__v8df) __A,
2626 _mm512_maskz_fnmsub_pd(__mmask8 __U, __m512d __A, __m512d __B, __m512d __C)
2628 return (__m512d) __builtin_ia32_vfmaddpd512_maskz (-(__v8df) __A,
2720 _mm512_fmadd_ps(__m512 __A, __m512 __B, __m512 __C)
2722 return (__m512) __builtin_ia32_vfmaddps512_mask ((__v16sf) __A,
2730 _mm512_mask_fmadd_ps(__m512 __A, __mmask16 __U, __m512 __B, __m512 __C)
2732 return (__m512) __builtin_ia32_vfmaddps512_mask ((__v16sf) __A,
2740 _mm512_mask3_fmadd_ps(__m512 __A, __m512 __B, __m512 __C, __mmask16 __U)
2742 return (__m512) __builtin_ia32_vfmaddps512_mask3 ((__v16sf) __A,
2750 _mm512_maskz_fmadd_ps(__mmask16 __U, __m512 __A, __m512 __B, __m512 __C)
2752 return (__m512) __builtin_ia32_vfmaddps512_maskz ((__v16sf) __A,
2760 _mm512_fmsub_ps(__m512 __A, __m512 __B, __m512 __C)
2762 return (__m512) __builtin_ia32_vfmaddps512_mask ((__v16sf) __A,
2770 _mm512_mask_fmsub_ps(__m512 __A, __mmask16 __U, __m512 __B, __m512 __C)
2772 return (__m512) __builtin_ia32_vfmaddps512_mask ((__v16sf) __A,
2780 _mm512_maskz_fmsub_ps(__mmask16 __U, __m512 __A, __m512 __B, __m512 __C)
2782 return (__m512) __builtin_ia32_vfmaddps512_maskz ((__v16sf) __A,
2790 _mm512_fnmadd_ps(__m512 __A, __m512 __B, __m512 __C)
2792 return (__m512) __builtin_ia32_vfmaddps512_mask ((__v16sf) __A,
2800 _mm512_mask3_fnmadd_ps(__m512 __A, __m512 __B, __m512 __C, __mmask16 __U)
2802 return (__m512) __builtin_ia32_vfmaddps512_mask3 (-(__v16sf) __A,
2810 _mm512_maskz_fnmadd_ps(__mmask16 __U, __m512 __A, __m512 __B, __m512 __C)
2812 return (__m512) __builtin_ia32_vfmaddps512_maskz (-(__v16sf) __A,
2820 _mm512_fnmsub_ps(__m512 __A, __m512 __B, __m512 __C)
2822 return (__m512) __builtin_ia32_vfmaddps512_mask ((__v16sf) __A,
2830 _mm512_maskz_fnmsub_ps(__mmask16 __U, __m512 __A, __m512 __B, __m512 __C)
2832 return (__m512) __builtin_ia32_vfmaddps512_maskz (-(__v16sf) __A,
2889 _mm512_fmaddsub_pd(__m512d __A, __m512d __B, __m512d __C)
2891 return (__m512d) __builtin_ia32_vfmaddsubpd512_mask ((__v8df) __A,
2899 _mm512_mask_fmaddsub_pd(__m512d __A, __mmask8 __U, __m512d __B, __m512d __C)
2901 return (__m512d) __builtin_ia32_vfmaddsubpd512_mask ((__v8df) __A,
2909 _mm512_mask3_fmaddsub_pd(__m512d __A, __m512d __B, __m512d __C, __mmask8 __U)
2911 return (__m512d) __builtin_ia32_vfmaddsubpd512_mask3 ((__v8df) __A,
2919 _mm512_maskz_fmaddsub_pd(__mmask8 __U, __m512d __A, __m512d __B, __m512d __C)
2921 return (__m512d) __builtin_ia32_vfmaddsubpd512_maskz ((__v8df) __A,
2929 _mm512_fmsubadd_pd(__m512d __A, __m512d __B, __m512d __C)
2931 return (__m512d) __builtin_ia32_vfmaddsubpd512_mask ((__v8df) __A,
2939 _mm512_mask_fmsubadd_pd(__m512d __A, __mmask8 __U, __m512d __B, __m512d __C)
2941 return (__m512d) __builtin_ia32_vfmaddsubpd512_mask ((__v8df) __A,
2949 _mm512_maskz_fmsubadd_pd(__mmask8 __U, __m512d __A, __m512d __B, __m512d __C)
2951 return (__m512d) __builtin_ia32_vfmaddsubpd512_maskz ((__v8df) __A,
3008 _mm512_fmaddsub_ps(__m512 __A, __m512 __B, __m512 __C)
3010 return (__m512) __builtin_ia32_vfmaddsubps512_mask ((__v16sf) __A,
3018 _mm512_mask_fmaddsub_ps(__m512 __A, __mmask16 __U, __m512 __B, __m512 __C)
3020 return (__m512) __builtin_ia32_vfmaddsubps512_mask ((__v16sf) __A,
3028 _mm512_mask3_fmaddsub_ps(__m512 __A, __m512 __B, __m512 __C, __mmask16 __U)
3030 return (__m512) __builtin_ia32_vfmaddsubps512_mask3 ((__v16sf) __A,
3038 _mm512_maskz_fmaddsub_ps(__mmask16 __U, __m512 __A, __m512 __B, __m512 __C)
3040 return (__m512) __builtin_ia32_vfmaddsubps512_maskz ((__v16sf) __A,
3048 _mm512_fmsubadd_ps(__m512 __A, __m512 __B, __m512 __C)
3050 return (__m512) __builtin_ia32_vfmaddsubps512_mask ((__v16sf) __A,
3058 _mm512_mask_fmsubadd_ps(__m512 __A, __mmask16 __U, __m512 __B, __m512 __C)
3060 return (__m512) __builtin_ia32_vfmaddsubps512_mask ((__v16sf) __A,
3068 _mm512_maskz_fmsubadd_ps(__mmask16 __U, __m512 __A, __m512 __B, __m512 __C)
3070 return (__m512) __builtin_ia32_vfmaddsubps512_maskz ((__v16sf) __A,
3085 _mm512_mask3_fmsub_pd(__m512d __A, __m512d __B, __m512d __C, __mmask8 __U)
3087 return (__m512d)__builtin_ia32_vfmsubpd512_mask3 ((__v8df) __A,
3101 _mm512_mask3_fmsub_ps(__m512 __A, __m512 __B, __m512 __C, __mmask16 __U)
3103 return (__m512)__builtin_ia32_vfmsubps512_mask3 ((__v16sf) __A,
3118 _mm512_mask3_fmsubadd_pd(__m512d __A, __m512d __B, __m512d __C, __mmask8 __U)
3120 return (__m512d)__builtin_ia32_vfmsubaddpd512_mask3 ((__v8df) __A,
3135 _mm512_mask3_fmsubadd_ps(__m512 __A, __m512 __B, __m512 __C, __mmask16 __U)
3137 return (__m512)__builtin_ia32_vfmsubaddps512_mask3 ((__v16sf) __A,
3152 _mm512_mask_fnmadd_pd(__m512d __A, __mmask8 __U, __m512d __B, __m512d __C)
3154 return (__m512d) __builtin_ia32_vfmaddpd512_mask ((__v8df) __A,
3169 _mm512_mask_fnmadd_ps(__m512 __A, __mmask16 __U, __m512 __B, __m512 __C)
3171 return (__m512) __builtin_ia32_vfmaddps512_mask ((__v16sf) __A,
3193 _mm512_mask_fnmsub_pd(__m512d __A, __mmask8 __U, __m512d __B, __m512d __C)
3195 return (__m512d) __builtin_ia32_vfmaddpd512_mask ((__v8df) __A,
3203 _mm512_mask3_fnmsub_pd(__m512d __A, __m512d __B, __m512d __C, __mmask8 __U)
3205 return (__m512d) __builtin_ia32_vfmsubpd512_mask3 (-(__v8df) __A,
3227 _mm512_mask_fnmsub_ps(__m512 __A, __mmask16 __U, __m512 __B, __m512 __C)
3229 return (__m512) __builtin_ia32_vfmaddps512_mask ((__v16sf) __A,
3237 _mm512_mask3_fnmsub_ps(__m512 __A, __m512 __B, __m512 __C, __mmask16 __U)
3239 return (__m512) __builtin_ia32_vfmsubps512_mask3 (-(__v16sf) __A,
3251 _mm512_permutex2var_epi32(__m512i __A, __m512i __I, __m512i __B)
3253 return (__m512i)__builtin_ia32_vpermi2vard512((__v16si)__A, (__v16si) __I,
3258 _mm512_mask_permutex2var_epi32(__m512i __A, __mmask16 __U, __m512i __I,
3262 (__v16si)_mm512_permutex2var_epi32(__A, __I, __B),
3263 (__v16si)__A);
3267 _mm512_mask2_permutex2var_epi32(__m512i __A, __m512i __I, __mmask16 __U,
3271 (__v16si)_mm512_permutex2var_epi32(__A, __I, __B),
3276 _mm512_maskz_permutex2var_epi32(__mmask16 __U, __m512i __A, __m512i __I,
3280 (__v16si)_mm512_permutex2var_epi32(__A, __I, __B),
3285 _mm512_permutex2var_epi64(__m512i __A, __m512i __I, __m512i __B)
3287 return (__m512i)__builtin_ia32_vpermi2varq512((__v8di)__A, (__v8di) __I,
3292 _mm512_mask_permutex2var_epi64(__m512i __A, __mmask8 __U, __m512i __I,
3296 (__v8di)_mm512_permutex2var_epi64(__A, __I, __B),
3297 (__v8di)__A);
3301 _mm512_mask2_permutex2var_epi64(__m512i __A, __m512i __I, __mmask8 __U,
3305 (__v8di)_mm512_permutex2var_epi64(__A, __I, __B),
3310 _mm512_maskz_permutex2var_epi64(__mmask8 __U, __m512i __A, __m512i __I,
3314 (__v8di)_mm512_permutex2var_epi64(__A, __I, __B),
3380 _mm512_mask_blend_pd(__mmask8 __U, __m512d __A, __m512d __W)
3384 (__v8df) __A);
3388 _mm512_mask_blend_ps(__mmask16 __U, __m512 __A, __m512 __W)
3392 (__v16sf) __A);
3396 _mm512_mask_blend_epi64(__mmask8 __U, __m512i __A, __m512i __W)
3400 (__v8di) __A);
3404 _mm512_mask_blend_epi32(__mmask16 __U, __m512i __A, __m512i __W)
3408 (__v16si) __A);
3542 _mm512_cvttps_epu32(__m512 __A)
3544 return (__m512i) __builtin_ia32_cvttps2udq512_mask ((__v16sf) __A,
3552 _mm512_mask_cvttps_epu32 (__m512i __W, __mmask16 __U, __m512 __A)
3554 return (__m512i) __builtin_ia32_cvttps2udq512_mask ((__v16sf) __A,
3561 _mm512_maskz_cvttps_epu32 (__mmask16 __U, __m512 __A)
3563 return (__m512i) __builtin_ia32_cvttps2udq512_mask ((__v16sf) __A,
3600 _mm512_cvtepu32_ps (__m512i __A)
3602 return (__m512)__builtin_convertvector((__v16su)__A, __v16sf);
3606 _mm512_mask_cvtepu32_ps (__m512 __W, __mmask16 __U, __m512i __A)
3609 (__v16sf)_mm512_cvtepu32_ps(__A),
3614 _mm512_maskz_cvtepu32_ps (__mmask16 __U, __m512i __A)
3617 (__v16sf)_mm512_cvtepu32_ps(__A),
3622 _mm512_cvtepi32_pd(__m256i __A)
3624 return (__m512d)__builtin_convertvector((__v8si)__A, __v8df);
3628 _mm512_mask_cvtepi32_pd (__m512d __W, __mmask8 __U, __m256i __A)
3631 (__v8df)_mm512_cvtepi32_pd(__A),
3636 _mm512_maskz_cvtepi32_pd (__mmask8 __U, __m256i __A)
3639 (__v8df)_mm512_cvtepi32_pd(__A),
3644 _mm512_cvtepi32lo_pd(__m512i __A)
3646 return (__m512d) _mm512_cvtepi32_pd(_mm512_castsi512_si256(__A));
3650 _mm512_mask_cvtepi32lo_pd(__m512d __W, __mmask8 __U,__m512i __A)
3652 return (__m512d) _mm512_mask_cvtepi32_pd(__W, __U, _mm512_castsi512_si256(__A));
3656 _mm512_cvtepi32_ps (__m512i __A)
3658 return (__m512)__builtin_convertvector((__v16si)__A, __v16sf);
3662 _mm512_mask_cvtepi32_ps (__m512 __W, __mmask16 __U, __m512i __A)
3665 (__v16sf)_mm512_cvtepi32_ps(__A),
3670 _mm512_maskz_cvtepi32_ps (__mmask16 __U, __m512i __A)
3673 (__v16sf)_mm512_cvtepi32_ps(__A),
3678 _mm512_cvtepu32_pd(__m256i __A)
3680 return (__m512d)__builtin_convertvector((__v8su)__A, __v8df);
3684 _mm512_mask_cvtepu32_pd (__m512d __W, __mmask8 __U, __m256i __A)
3687 (__v8df)_mm512_cvtepu32_pd(__A),
3692 _mm512_maskz_cvtepu32_pd (__mmask8 __U, __m256i __A)
3695 (__v8df)_mm512_cvtepu32_pd(__A),
3700 _mm512_cvtepu32lo_pd(__m512i __A)
3702 return (__m512d) _mm512_cvtepu32_pd(_mm512_castsi512_si256(__A));
3706 _mm512_mask_cvtepu32lo_pd(__m512d __W, __mmask8 __U,__m512i __A)
3708 return (__m512d) _mm512_mask_cvtepu32_pd(__W, __U, _mm512_castsi512_si256(__A));
3727 _mm512_cvtpd_ps (__m512d __A)
3729 return (__m256) __builtin_ia32_cvtpd2ps512_mask ((__v8df) __A,
3736 _mm512_mask_cvtpd_ps (__m256 __W, __mmask8 __U, __m512d __A)
3738 return (__m256) __builtin_ia32_cvtpd2ps512_mask ((__v8df) __A,
3745 _mm512_maskz_cvtpd_ps (__mmask8 __U, __m512d __A)
3747 return (__m256) __builtin_ia32_cvtpd2ps512_mask ((__v8df) __A,
3754 _mm512_cvtpd_pslo (__m512d __A)
3756 return (__m512) __builtin_shufflevector((__v8sf) _mm512_cvtpd_ps(__A),
3762 _mm512_mask_cvtpd_pslo (__m512 __W, __mmask8 __U,__m512d __A)
3766 __U, __A),
3807 _mm512_cvtph_ps(__m256i __A)
3809 return (__m512) __builtin_ia32_vcvtph2ps512_mask ((__v16hi) __A,
3817 _mm512_mask_cvtph_ps (__m512 __W, __mmask16 __U, __m256i __A)
3819 return (__m512) __builtin_ia32_vcvtph2ps512_mask ((__v16hi) __A,
3826 _mm512_maskz_cvtph_ps (__mmask16 __U, __m256i __A)
3828 return (__m512) __builtin_ia32_vcvtph2ps512_mask ((__v16hi) __A,
3859 _mm512_mask_cvttpd_epi32 (__m256i __W, __mmask8 __U, __m512d __A)
3861 return (__m256i) __builtin_ia32_cvttpd2dq512_mask ((__v8df) __A,
3868 _mm512_maskz_cvttpd_epi32 (__mmask8 __U, __m512d __A)
3870 return (__m256i) __builtin_ia32_cvttpd2dq512_mask ((__v8df) __A,
3901 _mm512_mask_cvttps_epi32 (__m512i __W, __mmask16 __U, __m512 __A)
3903 return (__m512i) __builtin_ia32_cvttps2dq512_mask ((__v16sf) __A,
3910 _mm512_maskz_cvttps_epi32 (__mmask16 __U, __m512 __A)
3912 return (__m512i) __builtin_ia32_cvttps2dq512_mask ((__v16sf) __A,
3934 _mm512_cvtps_epi32 (__m512 __A)
3936 return (__m512i) __builtin_ia32_cvtps2dq512_mask ((__v16sf) __A,
3943 _mm512_mask_cvtps_epi32 (__m512i __W, __mmask16 __U, __m512 __A)
3945 return (__m512i) __builtin_ia32_cvtps2dq512_mask ((__v16sf) __A,
3952 _mm512_maskz_cvtps_epi32 (__mmask16 __U, __m512 __A)
3954 return (__m512i) __builtin_ia32_cvtps2dq512_mask ((__v16sf) __A,
3977 _mm512_cvtpd_epi32 (__m512d __A)
3979 return (__m256i) __builtin_ia32_cvtpd2dq512_mask ((__v8df) __A,
3987 _mm512_mask_cvtpd_epi32 (__m256i __W, __mmask8 __U, __m512d __A)
3989 return (__m256i) __builtin_ia32_cvtpd2dq512_mask ((__v8df) __A,
3996 _mm512_maskz_cvtpd_epi32 (__mmask8 __U, __m512d __A)
3998 return (__m256i) __builtin_ia32_cvtpd2dq512_mask ((__v8df) __A,
4021 _mm512_cvtps_epu32 ( __m512 __A)
4023 return (__m512i) __builtin_ia32_cvtps2udq512_mask ((__v16sf) __A,\
4031 _mm512_mask_cvtps_epu32 (__m512i __W, __mmask16 __U, __m512 __A)
4033 return (__m512i) __builtin_ia32_cvtps2udq512_mask ((__v16sf) __A,
4040 _mm512_maskz_cvtps_epu32 ( __mmask16 __U, __m512 __A)
4042 return (__m512i) __builtin_ia32_cvtps2udq512_mask ((__v16sf) __A,
4065 _mm512_cvtpd_epu32 (__m512d __A)
4067 return (__m256i) __builtin_ia32_cvtpd2udq512_mask ((__v8df) __A,
4075 _mm512_mask_cvtpd_epu32 (__m256i __W, __mmask8 __U, __m512d __A)
4077 return (__m256i) __builtin_ia32_cvtpd2udq512_mask ((__v8df) __A,
4084 _mm512_maskz_cvtpd_epu32 (__mmask8 __U, __m512d __A)
4086 return (__m256i) __builtin_ia32_cvtpd2udq512_mask ((__v8df) __A,
4115 _mm512_mask_unpackhi_pd(__m512d __W, __mmask8 __U, __m512d __A, __m512d __B)
4118 (__v8df)_mm512_unpackhi_pd(__A, __B),
4123 _mm512_maskz_unpackhi_pd(__mmask8 __U, __m512d __A, __m512d __B)
4126 (__v8df)_mm512_unpackhi_pd(__A, __B),
4138 _mm512_mask_unpacklo_pd(__m512d __W, __mmask8 __U, __m512d __A, __m512d __B)
4141 (__v8df)_mm512_unpacklo_pd(__A, __B),
4146 _mm512_maskz_unpacklo_pd (__mmask8 __U, __m512d __A, __m512d __B)
4149 (__v8df)_mm512_unpacklo_pd(__A, __B),
4164 _mm512_mask_unpackhi_ps(__m512 __W, __mmask16 __U, __m512 __A, __m512 __B)
4167 (__v16sf)_mm512_unpackhi_ps(__A, __B),
4172 _mm512_maskz_unpackhi_ps (__mmask16 __U, __m512 __A, __m512 __B)
4175 (__v16sf)_mm512_unpackhi_ps(__A, __B),
4190 _mm512_mask_unpacklo_ps(__m512 __W, __mmask16 __U, __m512 __A, __m512 __B)
4193 (__v16sf)_mm512_unpacklo_ps(__A, __B),
4198 _mm512_maskz_unpacklo_ps (__mmask16 __U, __m512 __A, __m512 __B)
4201 (__v16sf)_mm512_unpacklo_ps(__A, __B),
4206 _mm512_unpackhi_epi32(__m512i __A, __m512i __B)
4208 return (__m512i)__builtin_shufflevector((__v16si)__A, (__v16si)__B,
4216 _mm512_mask_unpackhi_epi32(__m512i __W, __mmask16 __U, __m512i __A, __m512i __B)
4219 (__v16si)_mm512_unpackhi_epi32(__A, __B),
4224 _mm512_maskz_unpackhi_epi32(__mmask16 __U, __m512i __A, __m512i __B)
4227 (__v16si)_mm512_unpackhi_epi32(__A, __B),
4232 _mm512_unpacklo_epi32(__m512i __A, __m512i __B)
4234 return (__m512i)__builtin_shufflevector((__v16si)__A, (__v16si)__B,
4242 _mm512_mask_unpacklo_epi32(__m512i __W, __mmask16 __U, __m512i __A, __m512i __B)
4245 (__v16si)_mm512_unpacklo_epi32(__A, __B),
4250 _mm512_maskz_unpacklo_epi32(__mmask16 __U, __m512i __A, __m512i __B)
4253 (__v16si)_mm512_unpacklo_epi32(__A, __B),
4258 _mm512_unpackhi_epi64(__m512i __A, __m512i __B)
4260 return (__m512i)__builtin_shufflevector((__v8di)__A, (__v8di)__B,
4265 _mm512_mask_unpackhi_epi64(__m512i __W, __mmask8 __U, __m512i __A, __m512i __B)
4268 (__v8di)_mm512_unpackhi_epi64(__A, __B),
4273 _mm512_maskz_unpackhi_epi64(__mmask8 __U, __m512i __A, __m512i __B)
4276 (__v8di)_mm512_unpackhi_epi64(__A, __B),
4281 _mm512_unpacklo_epi64 (__m512i __A, __m512i __B)
4283 return (__m512i)__builtin_shufflevector((__v8di)__A, (__v8di)__B,
4288 _mm512_mask_unpacklo_epi64 (__m512i __W, __mmask8 __U, __m512i __A, __m512i __B)
4291 (__v8di)_mm512_unpacklo_epi64(__A, __B),
4296 _mm512_maskz_unpacklo_epi64 (__mmask8 __U, __m512i __A, __m512i __B)
4299 (__v8di)_mm512_unpacklo_epi64(__A, __B),
4487 _mm512_storeu_epi64 (void *__P, __m512i __A)
4492 ((struct __storeu_epi64*)__P)->__v = __A;
4496 _mm512_mask_storeu_epi64(void *__P, __mmask8 __U, __m512i __A)
4498 __builtin_ia32_storedqudi512_mask ((long long *)__P, (__v8di) __A,
4503 _mm512_storeu_si512 (void *__P, __m512i __A)
4508 ((struct __storeu_si512*)__P)->__v = __A;
4512 _mm512_storeu_epi32 (void *__P, __m512i __A)
4517 ((struct __storeu_epi32*)__P)->__v = __A;
4521 _mm512_mask_storeu_epi32(void *__P, __mmask16 __U, __m512i __A)
4523 __builtin_ia32_storedqusi512_mask ((int *)__P, (__v16si) __A,
4528 _mm512_mask_storeu_pd(void *__P, __mmask8 __U, __m512d __A)
4530 __builtin_ia32_storeupd512_mask ((double *)__P, (__v8df) __A, (__mmask8) __U);
4534 _mm512_storeu_pd(void *__P, __m512d __A)
4539 ((struct __storeu_pd*)__P)->__v = __A;
4543 _mm512_mask_storeu_ps(void *__P, __mmask16 __U, __m512 __A)
4545 __builtin_ia32_storeups512_mask ((float *)__P, (__v16sf) __A,
4550 _mm512_storeu_ps(void *__P, __m512 __A)
4555 ((struct __storeu_ps*)__P)->__v = __A;
4559 _mm512_mask_store_pd(void *__P, __mmask8 __U, __m512d __A)
4561 __builtin_ia32_storeapd512_mask ((__v8df *)__P, (__v8df) __A, (__mmask8) __U);
4565 _mm512_store_pd(void *__P, __m512d __A)
4567 *(__m512d*)__P = __A;
4571 _mm512_mask_store_ps(void *__P, __mmask16 __U, __m512 __A)
4573 __builtin_ia32_storeaps512_mask ((__v16sf *)__P, (__v16sf) __A,
4578 _mm512_store_ps(void *__P, __m512 __A)
4580 *(__m512*)__P = __A;
4584 _mm512_store_si512 (void *__P, __m512i __A)
4586 *(__m512i *) __P = __A;
4590 _mm512_store_epi32 (void *__P, __m512i __A)
4592 *(__m512i *) __P = __A;
4596 _mm512_store_epi64 (void *__P, __m512i __A)
4598 *(__m512i *) __P = __A;
4712 _mm512_cvtepi8_epi32(__m128i __A)
4716 return (__m512i)__builtin_convertvector((__v16qs)__A, __v16si);
4720 _mm512_mask_cvtepi8_epi32(__m512i __W, __mmask16 __U, __m128i __A)
4723 (__v16si)_mm512_cvtepi8_epi32(__A),
4728 _mm512_maskz_cvtepi8_epi32(__mmask16 __U, __m128i __A)
4731 (__v16si)_mm512_cvtepi8_epi32(__A),
4736 _mm512_cvtepi8_epi64(__m128i __A)
4740 return (__m512i)__builtin_convertvector(__builtin_shufflevector((__v16qs)__A, (__v16qs)__A, 0, 1, 2, 3, 4, 5, 6, 7), __v8di);
4744 _mm512_mask_cvtepi8_epi64(__m512i __W, __mmask8 __U, __m128i __A)
4747 (__v8di)_mm512_cvtepi8_epi64(__A),
4752 _mm512_maskz_cvtepi8_epi64(__mmask8 __U, __m128i __A)
4755 (__v8di)_mm512_cvtepi8_epi64(__A),
4782 _mm512_cvtepi16_epi32(__m256i __A)
4784 return (__m512i)__builtin_convertvector((__v16hi)__A, __v16si);
4788 _mm512_mask_cvtepi16_epi32(__m512i __W, __mmask16 __U, __m256i __A)
4791 (__v16si)_mm512_cvtepi16_epi32(__A),
4796 _mm512_maskz_cvtepi16_epi32(__mmask16 __U, __m256i __A)
4799 (__v16si)_mm512_cvtepi16_epi32(__A),
4804 _mm512_cvtepi16_epi64(__m128i __A)
4806 return (__m512i)__builtin_convertvector((__v8hi)__A, __v8di);
4810 _mm512_mask_cvtepi16_epi64(__m512i __W, __mmask8 __U, __m128i __A)
4813 (__v8di)_mm512_cvtepi16_epi64(__A),
4818 _mm512_maskz_cvtepi16_epi64(__mmask8 __U, __m128i __A)
4821 (__v8di)_mm512_cvtepi16_epi64(__A),
4826 _mm512_cvtepu8_epi32(__m128i __A)
4828 return (__m512i)__builtin_convertvector((__v16qu)__A, __v16si);
4832 _mm512_mask_cvtepu8_epi32(__m512i __W, __mmask16 __U, __m128i __A)
4835 (__v16si)_mm512_cvtepu8_epi32(__A),
4840 _mm512_maskz_cvtepu8_epi32(__mmask16 __U, __m128i __A)
4843 (__v16si)_mm512_cvtepu8_epi32(__A),
4848 _mm512_cvtepu8_epi64(__m128i __A)
4850 return (__m512i)__builtin_convertvector(__builtin_shufflevector((__v16qu)__A, (__v16qu)__A, 0, 1, 2, 3, 4, 5, 6, 7), __v8di);
4854 _mm512_mask_cvtepu8_epi64(__m512i __W, __mmask8 __U, __m128i __A)
4857 (__v8di)_mm512_cvtepu8_epi64(__A),
4862 _mm512_maskz_cvtepu8_epi64(__mmask8 __U, __m128i __A)
4865 (__v8di)_mm512_cvtepu8_epi64(__A),
4892 _mm512_cvtepu16_epi32(__m256i __A)
4894 return (__m512i)__builtin_convertvector((__v16hu)__A, __v16si);
4898 _mm512_mask_cvtepu16_epi32(__m512i __W, __mmask16 __U, __m256i __A)
4901 (__v16si)_mm512_cvtepu16_epi32(__A),
4906 _mm512_maskz_cvtepu16_epi32(__mmask16 __U, __m256i __A)
4909 (__v16si)_mm512_cvtepu16_epi32(__A),
4914 _mm512_cvtepu16_epi64(__m128i __A)
4916 return (__m512i)__builtin_convertvector((__v8hu)__A, __v8di);
4920 _mm512_mask_cvtepu16_epi64(__m512i __W, __mmask8 __U, __m128i __A)
4923 (__v8di)_mm512_cvtepu16_epi64(__A),
4928 _mm512_maskz_cvtepu16_epi64(__mmask8 __U, __m128i __A)
4931 (__v8di)_mm512_cvtepu16_epi64(__A),
4936 _mm512_rorv_epi32 (__m512i __A, __m512i __B)
4938 return (__m512i)__builtin_ia32_prorvd512((__v16si)__A, (__v16si)__B);
4942 _mm512_mask_rorv_epi32 (__m512i __W, __mmask16 __U, __m512i __A, __m512i __B)
4945 (__v16si)_mm512_rorv_epi32(__A, __B),
4950 _mm512_maskz_rorv_epi32 (__mmask16 __U, __m512i __A, __m512i __B)
4953 (__v16si)_mm512_rorv_epi32(__A, __B),
4958 _mm512_rorv_epi64 (__m512i __A, __m512i __B)
4960 return (__m512i)__builtin_ia32_prorvq512((__v8di)__A, (__v8di)__B);
4964 _mm512_mask_rorv_epi64 (__m512i __W, __mmask8 __U, __m512i __A, __m512i __B)
4967 (__v8di)_mm512_rorv_epi64(__A, __B),
4972 _mm512_maskz_rorv_epi64 (__mmask8 __U, __m512i __A, __m512i __B)
4975 (__v8di)_mm512_rorv_epi64(__A, __B),
5048 _mm512_rolv_epi32 (__m512i __A, __m512i __B)
5050 return (__m512i)__builtin_ia32_prolvd512((__v16si)__A, (__v16si)__B);
5054 _mm512_mask_rolv_epi32 (__m512i __W, __mmask16 __U, __m512i __A, __m512i __B)
5057 (__v16si)_mm512_rolv_epi32(__A, __B),
5062 _mm512_maskz_rolv_epi32 (__mmask16 __U, __m512i __A, __m512i __B)
5065 (__v16si)_mm512_rolv_epi32(__A, __B),
5070 _mm512_rolv_epi64 (__m512i __A, __m512i __B)
5072 return (__m512i)__builtin_ia32_prolvq512((__v8di)__A, (__v8di)__B);
5076 _mm512_mask_rolv_epi64 (__m512i __W, __mmask8 __U, __m512i __A, __m512i __B)
5079 (__v8di)_mm512_rolv_epi64(__A, __B),
5084 _mm512_maskz_rolv_epi64 (__mmask8 __U, __m512i __A, __m512i __B)
5087 (__v8di)_mm512_rolv_epi64(__A, __B),
5118 _mm512_slli_epi32(__m512i __A, unsigned int __B)
5120 return (__m512i)__builtin_ia32_pslldi512((__v16si)__A, (int)__B);
5124 _mm512_mask_slli_epi32(__m512i __W, __mmask16 __U, __m512i __A,
5128 (__v16si)_mm512_slli_epi32(__A, __B),
5133 _mm512_maskz_slli_epi32(__mmask16 __U, __m512i __A, unsigned int __B) {
5135 (__v16si)_mm512_slli_epi32(__A, __B),
5140 _mm512_slli_epi64(__m512i __A, unsigned int __B)
5142 return (__m512i)__builtin_ia32_psllqi512((__v8di)__A, (int)__B);
5146 _mm512_mask_slli_epi64(__m512i __W, __mmask8 __U, __m512i __A, unsigned int __B)
5149 (__v8di)_mm512_slli_epi64(__A, __B),
5154 _mm512_maskz_slli_epi64(__mmask8 __U, __m512i __A, unsigned int __B)
5157 (__v8di)_mm512_slli_epi64(__A, __B),
5162 _mm512_srli_epi32(__m512i __A, unsigned int __B)
5164 return (__m512i)__builtin_ia32_psrldi512((__v16si)__A, (int)__B);
5168 _mm512_mask_srli_epi32(__m512i __W, __mmask16 __U, __m512i __A,
5172 (__v16si)_mm512_srli_epi32(__A, __B),
5177 _mm512_maskz_srli_epi32(__mmask16 __U, __m512i __A, unsigned int __B) {
5179 (__v16si)_mm512_srli_epi32(__A, __B),
5184 _mm512_srli_epi64(__m512i __A, unsigned int __B)
5186 return (__m512i)__builtin_ia32_psrlqi512((__v8di)__A, (int)__B);
5190 _mm512_mask_srli_epi64(__m512i __W, __mmask8 __U, __m512i __A,
5194 (__v8di)_mm512_srli_epi64(__A, __B),
5199 _mm512_maskz_srli_epi64(__mmask8 __U, __m512i __A,
5203 (__v8di)_mm512_srli_epi64(__A, __B),
5225 _mm512_mask_store_epi32 (void *__P, __mmask16 __U, __m512i __A)
5227 __builtin_ia32_movdqa32store512_mask ((__v16si *) __P, (__v16si) __A,
5232 _mm512_mask_mov_epi32 (__m512i __W, __mmask16 __U, __m512i __A)
5235 (__v16si) __A,
5240 _mm512_maskz_mov_epi32 (__mmask16 __U, __m512i __A)
5243 (__v16si) __A,
5248 _mm512_mask_mov_epi64 (__m512i __W, __mmask8 __U, __m512i __A)
5251 (__v8di) __A,
5256 _mm512_maskz_mov_epi64 (__mmask8 __U, __m512i __A)
5259 (__v8di) __A,
5281 _mm512_mask_store_epi64 (void *__P, __mmask8 __U, __m512i __A)
5283 __builtin_ia32_movdqa64store512_mask ((__v8di *) __P, (__v8di) __A,
5288 _mm512_movedup_pd (__m512d __A)
5290 return (__m512d)__builtin_shufflevector((__v8df)__A, (__v8df)__A,
5295 _mm512_mask_movedup_pd (__m512d __W, __mmask8 __U, __m512d __A)
5298 (__v8df)_mm512_movedup_pd(__A),
5303 _mm512_maskz_movedup_pd (__mmask8 __U, __m512d __A)
5306 (__v8df)_mm512_movedup_pd(__A),
5476 _mm_getexp_sd (__m128d __A, __m128d __B)
5478 return (__m128d) __builtin_ia32_getexpsd128_round_mask ((__v2df) __A,
5483 _mm_mask_getexp_sd (__m128d __W, __mmask8 __U, __m128d __A, __m128d __B)
5485 return (__m128d) __builtin_ia32_getexpsd128_round_mask ( (__v2df) __A,
5499 _mm_maskz_getexp_sd (__mmask8 __U, __m128d __A, __m128d __B)
5501 return (__m128d) __builtin_ia32_getexpsd128_round_mask ( (__v2df) __A,
5521 _mm_getexp_ss (__m128 __A, __m128 __B)
5523 return (__m128) __builtin_ia32_getexpss128_round_mask ((__v4sf) __A,
5528 _mm_mask_getexp_ss (__m128 __W, __mmask8 __U, __m128 __A, __m128 __B)
5530 return (__m128) __builtin_ia32_getexpss128_round_mask ((__v4sf) __A,
5544 _mm_maskz_getexp_ss (__mmask8 __U, __m128 __A, __m128 __B)
5546 return (__m128) __builtin_ia32_getexpss128_round_mask ((__v4sf) __A,
5650 _mm512_kmov (__mmask16 __A)
5652 return __A;
5669 _mm512_sll_epi32(__m512i __A, __m128i __B)
5671 return (__m512i)__builtin_ia32_pslld512((__v16si) __A, (__v4si)__B);
5675 _mm512_mask_sll_epi32(__m512i __W, __mmask16 __U, __m512i __A, __m128i __B)
5678 (__v16si)_mm512_sll_epi32(__A, __B),
5683 _mm512_maskz_sll_epi32(__mmask16 __U, __m512i __A, __m128i __B)
5686 (__v16si)_mm512_sll_epi32(__A, __B),
5691 _mm512_sll_epi64(__m512i __A, __m128i __B)
5693 return (__m512i)__builtin_ia32_psllq512((__v8di)__A, (__v2di)__B);
5697 _mm512_mask_sll_epi64(__m512i __W, __mmask8 __U, __m512i __A, __m128i __B)
5700 (__v8di)_mm512_sll_epi64(__A, __B),
5705 _mm512_maskz_sll_epi64(__mmask8 __U, __m512i __A, __m128i __B)
5708 (__v8di)_mm512_sll_epi64(__A, __B),
5757 _mm512_sra_epi32(__m512i __A, __m128i __B)
5759 return (__m512i)__builtin_ia32_psrad512((__v16si) __A, (__v4si)__B);
5763 _mm512_mask_sra_epi32(__m512i __W, __mmask16 __U, __m512i __A, __m128i __B)
5766 (__v16si)_mm512_sra_epi32(__A, __B),
5771 _mm512_maskz_sra_epi32(__mmask16 __U, __m512i __A, __m128i __B)
5774 (__v16si)_mm512_sra_epi32(__A, __B),
5779 _mm512_sra_epi64(__m512i __A, __m128i __B)
5781 return (__m512i)__builtin_ia32_psraq512((__v8di)__A, (__v2di)__B);
5785 _mm512_mask_sra_epi64(__m512i __W, __mmask8 __U, __m512i __A, __m128i __B)
5788 (__v8di)_mm512_sra_epi64(__A, __B),
5793 _mm512_maskz_sra_epi64(__mmask8 __U, __m512i __A, __m128i __B)
5796 (__v8di)_mm512_sra_epi64(__A, __B),
5845 _mm512_srl_epi32(__m512i __A, __m128i __B)
5847 return (__m512i)__builtin_ia32_psrld512((__v16si) __A, (__v4si)__B);
5851 _mm512_mask_srl_epi32(__m512i __W, __mmask16 __U, __m512i __A, __m128i __B)
5854 (__v16si)_mm512_srl_epi32(__A, __B),
5859 _mm512_maskz_srl_epi32(__mmask16 __U, __m512i __A, __m128i __B)
5862 (__v16si)_mm512_srl_epi32(__A, __B),
5867 _mm512_srl_epi64(__m512i __A, __m128i __B)
5869 return (__m512i)__builtin_ia32_psrlq512((__v8di)__A, (__v2di)__B);
5873 _mm512_mask_srl_epi64(__m512i __W, __mmask8 __U, __m512i __A, __m128i __B)
5876 (__v8di)_mm512_srl_epi64(__A, __B),
5881 _mm512_maskz_srl_epi64(__mmask8 __U, __m512i __A, __m128i __B)
5884 (__v8di)_mm512_srl_epi64(__A, __B),
5986 _mm_cvtsd_u32 (__m128d __A)
5988 return (unsigned) __builtin_ia32_vcvtsd2usi32 ((__v2df) __A,
5998 _mm_cvtsd_u64 (__m128d __A)
6001 __A,
6024 _mm_cvtss_u32 (__m128 __A)
6026 return (unsigned) __builtin_ia32_vcvtss2usi32 ((__v4sf) __A,
6036 _mm_cvtss_u64 (__m128 __A)
6039 __A,
6051 _mm_cvttsd_i32 (__m128d __A)
6053 return (int) __builtin_ia32_vcvttsd2si32 ((__v2df) __A,
6065 _mm_cvttsd_i64 (__m128d __A)
6067 return (long long) __builtin_ia32_vcvttsd2si64 ((__v2df) __A,
6076 _mm_cvttsd_u32 (__m128d __A)
6078 return (unsigned) __builtin_ia32_vcvttsd2usi32 ((__v2df) __A,
6088 _mm_cvttsd_u64 (__m128d __A)
6091 __A,
6103 _mm_cvttss_i32 (__m128 __A)
6105 return (int) __builtin_ia32_vcvttss2si32 ((__v4sf) __A,
6117 _mm_cvttss_i64 (__m128 __A)
6119 return (long long) __builtin_ia32_vcvttss2si64 ((__v4sf) __A,
6128 _mm_cvttss_u32 (__m128 __A)
6130 return (unsigned) __builtin_ia32_vcvttss2usi32 ((__v4sf) __A,
6140 _mm_cvttss_u64 (__m128 __A)
6143 __A,
6175 _mm512_permutevar_pd(__m512d __A, __m512i __C)
6177 return (__m512d)__builtin_ia32_vpermilvarpd512((__v8df)__A, (__v8di)__C);
6181 _mm512_mask_permutevar_pd(__m512d __W, __mmask8 __U, __m512d __A, __m512i __C)
6184 (__v8df)_mm512_permutevar_pd(__A, __C),
6189 _mm512_maskz_permutevar_pd(__mmask8 __U, __m512d __A, __m512i __C)
6192 (__v8df)_mm512_permutevar_pd(__A, __C),
6197 _mm512_permutevar_ps(__m512 __A, __m512i __C)
6199 return (__m512)__builtin_ia32_vpermilvarps512((__v16sf)__A, (__v16si)__C);
6203 _mm512_mask_permutevar_ps(__m512 __W, __mmask16 __U, __m512 __A, __m512i __C)
6206 (__v16sf)_mm512_permutevar_ps(__A, __C),
6211 _mm512_maskz_permutevar_ps(__mmask16 __U, __m512 __A, __m512i __C)
6214 (__v16sf)_mm512_permutevar_ps(__A, __C),
6219 _mm512_permutex2var_pd(__m512d __A, __m512i __I, __m512d __B)
6221 return (__m512d)__builtin_ia32_vpermi2varpd512((__v8df)__A, (__v8di)__I,
6226 _mm512_mask_permutex2var_pd(__m512d __A, __mmask8 __U, __m512i __I, __m512d __B)
6229 (__v8df)_mm512_permutex2var_pd(__A, __I, __B),
6230 (__v8df)__A);
6234 _mm512_mask2_permutex2var_pd(__m512d __A, __m512i __I, __mmask8 __U,
6238 (__v8df)_mm512_permutex2var_pd(__A, __I, __B),
6243 _mm512_maskz_permutex2var_pd(__mmask8 __U, __m512d __A, __m512i __I,
6247 (__v8df)_mm512_permutex2var_pd(__A, __I, __B),
6252 _mm512_permutex2var_ps(__m512 __A, __m512i __I, __m512 __B)
6254 return (__m512)__builtin_ia32_vpermi2varps512((__v16sf)__A, (__v16si)__I,
6259 _mm512_mask_permutex2var_ps(__m512 __A, __mmask16 __U, __m512i __I, __m512 __B)
6262 (__v16sf)_mm512_permutex2var_ps(__A, __I, __B),
6263 (__v16sf)__A);
6267 _mm512_mask2_permutex2var_ps(__m512 __A, __m512i __I, __mmask16 __U, __m512 __B)
6270 (__v16sf)_mm512_permutex2var_ps(__A, __I, __B),
6275 _mm512_maskz_permutex2var_ps(__mmask16 __U, __m512 __A, __m512i __I, __m512 __B)
6278 (__v16sf)_mm512_permutex2var_ps(__A, __I, __B),
6299 _mm512_cvttpd_epu32 (__m512d __A)
6301 return (__m256i) __builtin_ia32_cvttpd2udq512_mask ((__v8df) __A,
6309 _mm512_mask_cvttpd_epu32 (__m256i __W, __mmask8 __U, __m512d __A)
6311 return (__m256i) __builtin_ia32_cvttpd2udq512_mask ((__v8df) __A,
6318 _mm512_maskz_cvttpd_epu32 (__mmask8 __U, __m512d __A)
6320 return (__m256i) __builtin_ia32_cvttpd2udq512_mask ((__v8df) __A,
6430 _mm512_scalef_pd (__m512d __A, __m512d __B)
6432 return (__m512d) __builtin_ia32_scalefpd512_mask ((__v8df) __A,
6441 _mm512_mask_scalef_pd (__m512d __W, __mmask8 __U, __m512d __A, __m512d __B)
6443 return (__m512d) __builtin_ia32_scalefpd512_mask ((__v8df) __A,
6451 _mm512_maskz_scalef_pd (__mmask8 __U, __m512d __A, __m512d __B)
6453 return (__m512d) __builtin_ia32_scalefpd512_mask ((__v8df) __A,
6480 _mm512_scalef_ps (__m512 __A, __m512 __B)
6482 return (__m512) __builtin_ia32_scalefps512_mask ((__v16sf) __A,
6491 _mm512_mask_scalef_ps (__m512 __W, __mmask16 __U, __m512 __A, __m512 __B)
6493 return (__m512) __builtin_ia32_scalefps512_mask ((__v16sf) __A,
6501 _mm512_maskz_scalef_ps (__mmask16 __U, __m512 __A, __m512 __B)
6503 return (__m512) __builtin_ia32_scalefps512_mask ((__v16sf) __A,
6518 _mm_scalef_sd (__m128d __A, __m128d __B)
6520 return (__m128d) __builtin_ia32_scalefsd_round_mask ((__v2df) __A,
6527 _mm_mask_scalef_sd (__m128d __W, __mmask8 __U, __m128d __A, __m128d __B)
6529 return (__m128d) __builtin_ia32_scalefsd_round_mask ( (__v2df) __A,
6543 _mm_maskz_scalef_sd (__mmask8 __U, __m128d __A, __m128d __B)
6545 return (__m128d) __builtin_ia32_scalefsd_round_mask ( (__v2df) __A,
6565 _mm_scalef_ss (__m128 __A, __m128 __B)
6567 return (__m128) __builtin_ia32_scalefss_round_mask ((__v4sf) __A,
6574 _mm_mask_scalef_ss (__m128 __W, __mmask8 __U, __m128 __A, __m128 __B)
6576 return (__m128) __builtin_ia32_scalefss_round_mask ( (__v4sf) __A,
6590 _mm_maskz_scalef_ss (__mmask8 __U, __m128 __A, __m128 __B)
6592 return (__m128) __builtin_ia32_scalefss_round_mask ( (__v4sf) __A,
6607 _mm512_srai_epi32(__m512i __A, unsigned int __B)
6609 return (__m512i)__builtin_ia32_psradi512((__v16si)__A, (int)__B);
6613 _mm512_mask_srai_epi32(__m512i __W, __mmask16 __U, __m512i __A,
6617 (__v16si)_mm512_srai_epi32(__A, __B),
6622 _mm512_maskz_srai_epi32(__mmask16 __U, __m512i __A,
6625 (__v16si)_mm512_srai_epi32(__A, __B),
6630 _mm512_srai_epi64(__m512i __A, unsigned int __B)
6632 return (__m512i)__builtin_ia32_psraqi512((__v8di)__A, (int)__B);
6636 _mm512_mask_srai_epi64(__m512i __W, __mmask8 __U, __m512i __A, unsigned int __B)
6639 (__v8di)_mm512_srai_epi64(__A, __B),
6644 _mm512_maskz_srai_epi64(__mmask8 __U, __m512i __A, unsigned int __B)
6647 (__v8di)_mm512_srai_epi64(__A, __B),
6742 _mm_mask_sqrt_sd (__m128d __W, __mmask8 __U, __m128d __A, __m128d __B)
6744 return (__m128d) __builtin_ia32_sqrtsd_round_mask ( (__v2df) __A,
6758 _mm_maskz_sqrt_sd (__mmask8 __U, __m128d __A, __m128d __B)
6760 return (__m128d) __builtin_ia32_sqrtsd_round_mask ( (__v2df) __A,
6780 _mm_mask_sqrt_ss (__m128 __W, __mmask8 __U, __m128 __A, __m128 __B)
6782 return (__m128) __builtin_ia32_sqrtss_round_mask ( (__v4sf) __A,
6796 _mm_maskz_sqrt_ss (__mmask8 __U, __m128 __A, __m128 __B)
6798 return (__m128) __builtin_ia32_sqrtss_round_mask ( (__v4sf) __A,
6812 _mm512_broadcast_f32x4(__m128 __A)
6814 return (__m512)__builtin_shufflevector((__v4sf)__A, (__v4sf)__A,
6820 _mm512_mask_broadcast_f32x4(__m512 __O, __mmask16 __M, __m128 __A)
6823 (__v16sf)_mm512_broadcast_f32x4(__A),
6828 _mm512_maskz_broadcast_f32x4(__mmask16 __M, __m128 __A)
6831 (__v16sf)_mm512_broadcast_f32x4(__A),
6836 _mm512_broadcast_f64x4(__m256d __A)
6838 return (__m512d)__builtin_shufflevector((__v4df)__A, (__v4df)__A,
6843 _mm512_mask_broadcast_f64x4(__m512d __O, __mmask8 __M, __m256d __A)
6846 (__v8df)_mm512_broadcast_f64x4(__A),
6851 _mm512_maskz_broadcast_f64x4(__mmask8 __M, __m256d __A)
6854 (__v8df)_mm512_broadcast_f64x4(__A),
6859 _mm512_broadcast_i32x4(__m128i __A)
6861 return (__m512i)__builtin_shufflevector((__v4si)__A, (__v4si)__A,
6867 _mm512_mask_broadcast_i32x4(__m512i __O, __mmask16 __M, __m128i __A)
6870 (__v16si)_mm512_broadcast_i32x4(__A),
6875 _mm512_maskz_broadcast_i32x4(__mmask16 __M, __m128i __A)
6878 (__v16si)_mm512_broadcast_i32x4(__A),
6883 _mm512_broadcast_i64x4(__m256i __A)
6885 return (__m512i)__builtin_shufflevector((__v4di)__A, (__v4di)__A,
6890 _mm512_mask_broadcast_i64x4(__m512i __O, __mmask8 __M, __m256i __A)
6893 (__v8di)_mm512_broadcast_i64x4(__A),
6898 _mm512_maskz_broadcast_i64x4(__mmask8 __M, __m256i __A)
6901 (__v8di)_mm512_broadcast_i64x4(__A),
6906 _mm512_mask_broadcastsd_pd (__m512d __O, __mmask8 __M, __m128d __A)
6909 (__v8df) _mm512_broadcastsd_pd(__A),
6914 _mm512_maskz_broadcastsd_pd (__mmask8 __M, __m128d __A)
6917 (__v8df) _mm512_broadcastsd_pd(__A),
6922 _mm512_mask_broadcastss_ps (__m512 __O, __mmask16 __M, __m128 __A)
6925 (__v16sf) _mm512_broadcastss_ps(__A),
6930 _mm512_maskz_broadcastss_ps (__mmask16 __M, __m128 __A)
6933 (__v16sf) _mm512_broadcastss_ps(__A),
6938 _mm512_cvtsepi32_epi8 (__m512i __A)
6940 return (__m128i) __builtin_ia32_pmovsdb512_mask ((__v16si) __A,
6946 _mm512_mask_cvtsepi32_epi8 (__m128i __O, __mmask16 __M, __m512i __A)
6948 return (__m128i) __builtin_ia32_pmovsdb512_mask ((__v16si) __A,
6953 _mm512_maskz_cvtsepi32_epi8 (__mmask16 __M, __m512i __A)
6955 return (__m128i) __builtin_ia32_pmovsdb512_mask ((__v16si) __A,
6961 _mm512_mask_cvtsepi32_storeu_epi8 (void * __P, __mmask16 __M, __m512i __A)
6963 __builtin_ia32_pmovsdb512mem_mask ((__v16qi *) __P, (__v16si) __A, __M);
6967 _mm512_cvtsepi32_epi16 (__m512i __A)
6969 return (__m256i) __builtin_ia32_pmovsdw512_mask ((__v16si) __A,
6975 _mm512_mask_cvtsepi32_epi16 (__m256i __O, __mmask16 __M, __m512i __A)
6977 return (__m256i) __builtin_ia32_pmovsdw512_mask ((__v16si) __A,
6982 _mm512_maskz_cvtsepi32_epi16 (__mmask16 __M, __m512i __A)
6984 return (__m256i) __builtin_ia32_pmovsdw512_mask ((__v16si) __A,
6990 _mm512_mask_cvtsepi32_storeu_epi16 (void *__P, __mmask16 __M, __m512i __A)
6992 __builtin_ia32_pmovsdw512mem_mask ((__v16hi*) __P, (__v16si) __A, __M);
6996 _mm512_cvtsepi64_epi8 (__m512i __A)
6998 return (__m128i) __builtin_ia32_pmovsqb512_mask ((__v8di) __A,
7004 _mm512_mask_cvtsepi64_epi8 (__m128i __O, __mmask8 __M, __m512i __A)
7006 return (__m128i) __builtin_ia32_pmovsqb512_mask ((__v8di) __A,
7011 _mm512_maskz_cvtsepi64_epi8 (__mmask8 __M, __m512i __A)
7013 return (__m128i) __builtin_ia32_pmovsqb512_mask ((__v8di) __A,
7019 _mm512_mask_cvtsepi64_storeu_epi8 (void * __P, __mmask8 __M, __m512i __A)
7021 __builtin_ia32_pmovsqb512mem_mask ((__v16qi *) __P, (__v8di) __A, __M);
7025 _mm512_cvtsepi64_epi32 (__m512i __A)
7027 return (__m256i) __builtin_ia32_pmovsqd512_mask ((__v8di) __A,
7033 _mm512_mask_cvtsepi64_epi32 (__m256i __O, __mmask8 __M, __m512i __A)
7035 return (__m256i) __builtin_ia32_pmovsqd512_mask ((__v8di) __A,
7040 _mm512_maskz_cvtsepi64_epi32 (__mmask8 __M, __m512i __A)
7042 return (__m256i) __builtin_ia32_pmovsqd512_mask ((__v8di) __A,
7048 _mm512_mask_cvtsepi64_storeu_epi32 (void *__P, __mmask8 __M, __m512i __A)
7050 __builtin_ia32_pmovsqd512mem_mask ((__v8si *) __P, (__v8di) __A, __M);
7054 _mm512_cvtsepi64_epi16 (__m512i __A)
7056 return (__m128i) __builtin_ia32_pmovsqw512_mask ((__v8di) __A,
7062 _mm512_mask_cvtsepi64_epi16 (__m128i __O, __mmask8 __M, __m512i __A)
7064 return (__m128i) __builtin_ia32_pmovsqw512_mask ((__v8di) __A,
7069 _mm512_maskz_cvtsepi64_epi16 (__mmask8 __M, __m512i __A)
7071 return (__m128i) __builtin_ia32_pmovsqw512_mask ((__v8di) __A,
7077 _mm512_mask_cvtsepi64_storeu_epi16 (void * __P, __mmask8 __M, __m512i __A)
7079 __builtin_ia32_pmovsqw512mem_mask ((__v8hi *) __P, (__v8di) __A, __M);
7083 _mm512_cvtusepi32_epi8 (__m512i __A)
7085 return (__m128i) __builtin_ia32_pmovusdb512_mask ((__v16si) __A,
7091 _mm512_mask_cvtusepi32_epi8 (__m128i __O, __mmask16 __M, __m512i __A)
7093 return (__m128i) __builtin_ia32_pmovusdb512_mask ((__v16si) __A,
7099 _mm512_maskz_cvtusepi32_epi8 (__mmask16 __M, __m512i __A)
7101 return (__m128i) __builtin_ia32_pmovusdb512_mask ((__v16si) __A,
7107 _mm512_mask_cvtusepi32_storeu_epi8 (void * __P, __mmask16 __M, __m512i __A)
7109 __builtin_ia32_pmovusdb512mem_mask ((__v16qi *) __P, (__v16si) __A, __M);
7113 _mm512_cvtusepi32_epi16 (__m512i __A)
7115 return (__m256i) __builtin_ia32_pmovusdw512_mask ((__v16si) __A,
7121 _mm512_mask_cvtusepi32_epi16 (__m256i __O, __mmask16 __M, __m512i __A)
7123 return (__m256i) __builtin_ia32_pmovusdw512_mask ((__v16si) __A,
7129 _mm512_maskz_cvtusepi32_epi16 (__mmask16 __M, __m512i __A)
7131 return (__m256i) __builtin_ia32_pmovusdw512_mask ((__v16si) __A,
7137 _mm512_mask_cvtusepi32_storeu_epi16 (void *__P, __mmask16 __M, __m512i __A)
7139 __builtin_ia32_pmovusdw512mem_mask ((__v16hi*) __P, (__v16si) __A, __M);
7143 _mm512_cvtusepi64_epi8 (__m512i __A)
7145 return (__m128i) __builtin_ia32_pmovusqb512_mask ((__v8di) __A,
7151 _mm512_mask_cvtusepi64_epi8 (__m128i __O, __mmask8 __M, __m512i __A)
7153 return (__m128i) __builtin_ia32_pmovusqb512_mask ((__v8di) __A,
7159 _mm512_maskz_cvtusepi64_epi8 (__mmask8 __M, __m512i __A)
7161 return (__m128i) __builtin_ia32_pmovusqb512_mask ((__v8di) __A,
7167 _mm512_mask_cvtusepi64_storeu_epi8 (void * __P, __mmask8 __M, __m512i __A)
7169 __builtin_ia32_pmovusqb512mem_mask ((__v16qi *) __P, (__v8di) __A, __M);
7173 _mm512_cvtusepi64_epi32 (__m512i __A)
7175 return (__m256i) __builtin_ia32_pmovusqd512_mask ((__v8di) __A,
7181 _mm512_mask_cvtusepi64_epi32 (__m256i __O, __mmask8 __M, __m512i __A)
7183 return (__m256i) __builtin_ia32_pmovusqd512_mask ((__v8di) __A,
7188 _mm512_maskz_cvtusepi64_epi32 (__mmask8 __M, __m512i __A)
7190 return (__m256i) __builtin_ia32_pmovusqd512_mask ((__v8di) __A,
7196 _mm512_mask_cvtusepi64_storeu_epi32 (void* __P, __mmask8 __M, __m512i __A)
7198 __builtin_ia32_pmovusqd512mem_mask ((__v8si*) __P, (__v8di) __A, __M);
7202 _mm512_cvtusepi64_epi16 (__m512i __A)
7204 return (__m128i) __builtin_ia32_pmovusqw512_mask ((__v8di) __A,
7210 _mm512_mask_cvtusepi64_epi16 (__m128i __O, __mmask8 __M, __m512i __A)
7212 return (__m128i) __builtin_ia32_pmovusqw512_mask ((__v8di) __A,
7217 _mm512_maskz_cvtusepi64_epi16 (__mmask8 __M, __m512i __A)
7219 return (__m128i) __builtin_ia32_pmovusqw512_mask ((__v8di) __A,
7225 _mm512_mask_cvtusepi64_storeu_epi16 (void *__P, __mmask8 __M, __m512i __A)
7227 __builtin_ia32_pmovusqw512mem_mask ((__v8hi*) __P, (__v8di) __A, __M);
7231 _mm512_cvtepi32_epi8 (__m512i __A)
7233 return (__m128i) __builtin_ia32_pmovdb512_mask ((__v16si) __A,
7239 _mm512_mask_cvtepi32_epi8 (__m128i __O, __mmask16 __M, __m512i __A)
7241 return (__m128i) __builtin_ia32_pmovdb512_mask ((__v16si) __A,
7246 _mm512_maskz_cvtepi32_epi8 (__mmask16 __M, __m512i __A)
7248 return (__m128i) __builtin_ia32_pmovdb512_mask ((__v16si) __A,
7254 _mm512_mask_cvtepi32_storeu_epi8 (void * __P, __mmask16 __M, __m512i __A)
7256 __builtin_ia32_pmovdb512mem_mask ((__v16qi *) __P, (__v16si) __A, __M);
7260 _mm512_cvtepi32_epi16 (__m512i __A)
7262 return (__m256i) __builtin_ia32_pmovdw512_mask ((__v16si) __A,
7268 _mm512_mask_cvtepi32_epi16 (__m256i __O, __mmask16 __M, __m512i __A)
7270 return (__m256i) __builtin_ia32_pmovdw512_mask ((__v16si) __A,
7275 _mm512_maskz_cvtepi32_epi16 (__mmask16 __M, __m512i __A)
7277 return (__m256i) __builtin_ia32_pmovdw512_mask ((__v16si) __A,
7283 _mm512_mask_cvtepi32_storeu_epi16 (void * __P, __mmask16 __M, __m512i __A)
7285 __builtin_ia32_pmovdw512mem_mask ((__v16hi *) __P, (__v16si) __A, __M);
7289 _mm512_cvtepi64_epi8 (__m512i __A)
7291 return (__m128i) __builtin_ia32_pmovqb512_mask ((__v8di) __A,
7297 _mm512_mask_cvtepi64_epi8 (__m128i __O, __mmask8 __M, __m512i __A)
7299 return (__m128i) __builtin_ia32_pmovqb512_mask ((__v8di) __A,
7304 _mm512_maskz_cvtepi64_epi8 (__mmask8 __M, __m512i __A)
7306 return (__m128i) __builtin_ia32_pmovqb512_mask ((__v8di) __A,
7312 _mm512_mask_cvtepi64_storeu_epi8 (void * __P, __mmask8 __M, __m512i __A)
7314 __builtin_ia32_pmovqb512mem_mask ((__v16qi *) __P, (__v8di) __A, __M);
7318 _mm512_cvtepi64_epi32 (__m512i __A)
7320 return (__m256i) __builtin_ia32_pmovqd512_mask ((__v8di) __A,
7326 _mm512_mask_cvtepi64_epi32 (__m256i __O, __mmask8 __M, __m512i __A)
7328 return (__m256i) __builtin_ia32_pmovqd512_mask ((__v8di) __A,
7333 _mm512_maskz_cvtepi64_epi32 (__mmask8 __M, __m512i __A)
7335 return (__m256i) __builtin_ia32_pmovqd512_mask ((__v8di) __A,
7341 _mm512_mask_cvtepi64_storeu_epi32 (void* __P, __mmask8 __M, __m512i __A)
7343 __builtin_ia32_pmovqd512mem_mask ((__v8si *) __P, (__v8di) __A, __M);
7347 _mm512_cvtepi64_epi16 (__m512i __A)
7349 return (__m128i) __builtin_ia32_pmovqw512_mask ((__v8di) __A,
7355 _mm512_mask_cvtepi64_epi16 (__m128i __O, __mmask8 __M, __m512i __A)
7357 return (__m128i) __builtin_ia32_pmovqw512_mask ((__v8di) __A,
7362 _mm512_maskz_cvtepi64_epi16 (__mmask8 __M, __m512i __A)
7364 return (__m128i) __builtin_ia32_pmovqw512_mask ((__v8di) __A,
7370 _mm512_mask_cvtepi64_storeu_epi16 (void *__P, __mmask8 __M, __m512i __A)
7372 __builtin_ia32_pmovqw512mem_mask ((__v8hi *) __P, (__v8di) __A, __M);
7555 _mm512_getexp_pd (__m512d __A)
7557 return (__m512d) __builtin_ia32_getexppd512_mask ((__v8df) __A,
7564 _mm512_mask_getexp_pd (__m512d __W, __mmask8 __U, __m512d __A)
7566 return (__m512d) __builtin_ia32_getexppd512_mask ((__v8df) __A,
7573 _mm512_maskz_getexp_pd (__mmask8 __U, __m512d __A)
7575 return (__m512d) __builtin_ia32_getexppd512_mask ((__v8df) __A,
7597 _mm512_getexp_ps (__m512 __A)
7599 return (__m512) __builtin_ia32_getexpps512_mask ((__v16sf) __A,
7606 _mm512_mask_getexp_ps (__m512 __W, __mmask16 __U, __m512 __A)
7608 return (__m512) __builtin_ia32_getexpps512_mask ((__v16sf) __A,
7615 _mm512_maskz_getexp_ps (__mmask16 __U, __m512 __A)
7617 return (__m512) __builtin_ia32_getexpps512_mask ((__v16sf) __A,
7800 _mm_mask_fmadd_ss (__m128 __W, __mmask8 __U, __m128 __A, __m128 __B)
7803 (__v4sf)__A,
7822 _mm_maskz_fmadd_ss (__mmask8 __U, __m128 __A, __m128 __B, __m128 __C)
7824 return __builtin_ia32_vfmaddss3_maskz((__v4sf)__A,
7854 _mm_mask_fmsub_ss (__m128 __W, __mmask8 __U, __m128 __A, __m128 __B)
7857 (__v4sf)__A,
7876 _mm_maskz_fmsub_ss (__mmask8 __U, __m128 __A, __m128 __B, __m128 __C)
7878 return __builtin_ia32_vfmaddss3_maskz((__v4sf)__A,
7908 _mm_mask_fnmadd_ss (__m128 __W, __mmask8 __U, __m128 __A, __m128 __B)
7911 -(__v4sf)__A,
7930 _mm_maskz_fnmadd_ss (__mmask8 __U, __m128 __A, __m128 __B, __m128 __C)
7932 return __builtin_ia32_vfmaddss3_maskz((__v4sf)__A,
7962 _mm_mask_fnmsub_ss (__m128 __W, __mmask8 __U, __m128 __A, __m128 __B)
7965 -(__v4sf)__A,
7984 _mm_maskz_fnmsub_ss (__mmask8 __U, __m128 __A, __m128 __B, __m128 __C)
7986 return __builtin_ia32_vfmaddss3_maskz((__v4sf)__A,
8016 _mm_mask_fmadd_sd (__m128d __W, __mmask8 __U, __m128d __A, __m128d __B)
8019 (__v2df)__A,
8038 _mm_maskz_fmadd_sd (__mmask8 __U, __m128d __A, __m128d __B, __m128d __C)
8040 return __builtin_ia32_vfmaddsd3_maskz((__v2df)__A,
8070 _mm_mask_fmsub_sd (__m128d __W, __mmask8 __U, __m128d __A, __m128d __B)
8073 (__v2df)__A,
8092 _mm_maskz_fmsub_sd (__mmask8 __U, __m128d __A, __m128d __B, __m128d __C)
8094 return __builtin_ia32_vfmaddsd3_maskz((__v2df)__A,
8124 _mm_mask_fnmadd_sd (__m128d __W, __mmask8 __U, __m128d __A, __m128d __B)
8127 -(__v2df)__A,
8146 _mm_maskz_fnmadd_sd (__mmask8 __U, __m128d __A, __m128d __B, __m128d __C)
8148 return __builtin_ia32_vfmaddsd3_maskz((__v2df)__A,
8178 _mm_mask_fnmsub_sd (__m128d __W, __mmask8 __U, __m128d __A, __m128d __B)
8181 -(__v2df)__A,
8200 _mm_maskz_fnmsub_sd (__mmask8 __U, __m128d __A, __m128d __B, __m128d __C)
8202 return __builtin_ia32_vfmaddsd3_maskz((__v2df)__A,
8353 _mm512_kand (__mmask16 __A, __mmask16 __B)
8355 return (__mmask16) __builtin_ia32_kandhi ((__mmask16) __A, (__mmask16) __B);
8359 _mm512_kandn (__mmask16 __A, __mmask16 __B)
8361 return (__mmask16) __builtin_ia32_kandnhi ((__mmask16) __A, (__mmask16) __B);
8365 _mm512_kor (__mmask16 __A, __mmask16 __B)
8367 return (__mmask16) __builtin_ia32_korhi ((__mmask16) __A, (__mmask16) __B);
8371 _mm512_kortestc (__mmask16 __A, __mmask16 __B)
8373 return __builtin_ia32_kortestchi ((__mmask16) __A, (__mmask16) __B);
8377 _mm512_kortestz (__mmask16 __A, __mmask16 __B)
8379 return __builtin_ia32_kortestzhi ((__mmask16) __A, (__mmask16) __B);
8383 _kortestc_mask16_u8(__mmask16 __A, __mmask16 __B)
8385 return (unsigned char)__builtin_ia32_kortestchi(__A, __B);
8389 _kortestz_mask16_u8(__mmask16 __A, __mmask16 __B)
8391 return (unsigned char)__builtin_ia32_kortestzhi(__A, __B);
8395 _kortest_mask16_u8(__mmask16 __A, __mmask16 __B, unsigned char *__C) {
8396 *__C = (unsigned char)__builtin_ia32_kortestchi(__A, __B);
8397 return (unsigned char)__builtin_ia32_kortestzhi(__A, __B);
8401 _mm512_kunpackb (__mmask16 __A, __mmask16 __B)
8403 return (__mmask16) __builtin_ia32_kunpckhi ((__mmask16) __A, (__mmask16) __B);
8407 _mm512_kxnor (__mmask16 __A, __mmask16 __B)
8409 return (__mmask16) __builtin_ia32_kxnorhi ((__mmask16) __A, (__mmask16) __B);
8413 _mm512_kxor (__mmask16 __A, __mmask16 __B)
8415 return (__mmask16) __builtin_ia32_kxorhi ((__mmask16) __A, (__mmask16) __B);
8432 _cvtmask16_u32(__mmask16 __A) {
8433 return (unsigned int)__builtin_ia32_kmovw((__mmask16)__A);
8437 _cvtu32_mask16(unsigned int __A) {
8438 return (__mmask16)__builtin_ia32_kmovw((__mmask16)__A);
8442 _load_mask16(__mmask16 *__A) {
8443 return (__mmask16)__builtin_ia32_kmovw(*(__mmask16 *)__A);
8447 _store_mask16(__mmask16 *__A, __mmask16 __B) {
8448 *(__mmask16 *)__A = __builtin_ia32_kmovw((__mmask16)__B);
8452 _mm512_stream_si512 (void * __P, __m512i __A)
8455 __builtin_nontemporal_store((__v8di_aligned)__A, (__v8di_aligned*)__P);
8466 _mm512_stream_pd (void *__P, __m512d __A)
8469 __builtin_nontemporal_store((__v8df_aligned)__A, (__v8df_aligned*)__P);
8473 _mm512_stream_ps (void *__P, __m512 __A)
8476 __builtin_nontemporal_store((__v16sf_aligned)__A, (__v16sf_aligned*)__P);
8480 _mm512_mask_compress_pd (__m512d __W, __mmask8 __U, __m512d __A)
8482 return (__m512d) __builtin_ia32_compressdf512_mask ((__v8df) __A,
8488 _mm512_maskz_compress_pd (__mmask8 __U, __m512d __A)
8490 return (__m512d) __builtin_ia32_compressdf512_mask ((__v8df) __A,
8497 _mm512_mask_compress_epi64 (__m512i __W, __mmask8 __U, __m512i __A)
8499 return (__m512i) __builtin_ia32_compressdi512_mask ((__v8di) __A,
8505 _mm512_maskz_compress_epi64 (__mmask8 __U, __m512i __A)
8507 return (__m512i) __builtin_ia32_compressdi512_mask ((__v8di) __A,
8514 _mm512_mask_compress_ps (__m512 __W, __mmask16 __U, __m512 __A)
8516 return (__m512) __builtin_ia32_compresssf512_mask ((__v16sf) __A,
8522 _mm512_maskz_compress_ps (__mmask16 __U, __m512 __A)
8524 return (__m512) __builtin_ia32_compresssf512_mask ((__v16sf) __A,
8531 _mm512_mask_compress_epi32 (__m512i __W, __mmask16 __U, __m512i __A)
8533 return (__m512i) __builtin_ia32_compresssi512_mask ((__v16si) __A,
8539 _mm512_maskz_compress_epi32 (__mmask16 __U, __m512i __A)
8541 return (__m512i) __builtin_ia32_compresssi512_mask ((__v16si) __A,
8594 _mm512_test_epi32_mask (__m512i __A, __m512i __B)
8596 return _mm512_cmpneq_epi32_mask (_mm512_and_epi32(__A, __B),
8601 _mm512_mask_test_epi32_mask (__mmask16 __U, __m512i __A, __m512i __B)
8603 return _mm512_mask_cmpneq_epi32_mask (__U, _mm512_and_epi32 (__A, __B),
8608 _mm512_test_epi64_mask (__m512i __A, __m512i __B)
8610 return _mm512_cmpneq_epi64_mask (_mm512_and_epi32 (__A, __B),
8615 _mm512_mask_test_epi64_mask (__mmask8 __U, __m512i __A, __m512i __B)
8617 return _mm512_mask_cmpneq_epi64_mask (__U, _mm512_and_epi32 (__A, __B),
8622 _mm512_testn_epi32_mask (__m512i __A, __m512i __B)
8624 return _mm512_cmpeq_epi32_mask (_mm512_and_epi32 (__A, __B),
8629 _mm512_mask_testn_epi32_mask (__mmask16 __U, __m512i __A, __m512i __B)
8631 return _mm512_mask_cmpeq_epi32_mask (__U, _mm512_and_epi32 (__A, __B),
8636 _mm512_testn_epi64_mask (__m512i __A, __m512i __B)
8638 return _mm512_cmpeq_epi64_mask (_mm512_and_epi32 (__A, __B),
8643 _mm512_mask_testn_epi64_mask (__mmask8 __U, __m512i __A, __m512i __B)
8645 return _mm512_mask_cmpeq_epi64_mask (__U, _mm512_and_epi32 (__A, __B),
8650 _mm512_movehdup_ps (__m512 __A)
8652 return (__m512)__builtin_shufflevector((__v16sf)__A, (__v16sf)__A,
8657 _mm512_mask_movehdup_ps (__m512 __W, __mmask16 __U, __m512 __A)
8660 (__v16sf)_mm512_movehdup_ps(__A),
8665 _mm512_maskz_movehdup_ps (__mmask16 __U, __m512 __A)
8668 (__v16sf)_mm512_movehdup_ps(__A),
8673 _mm512_moveldup_ps (__m512 __A)
8675 return (__m512)__builtin_shufflevector((__v16sf)__A, (__v16sf)__A,
8680 _mm512_mask_moveldup_ps (__m512 __W, __mmask16 __U, __m512 __A)
8683 (__v16sf)_mm512_moveldup_ps(__A),
8688 _mm512_maskz_moveldup_ps (__mmask16 __U, __m512 __A)
8691 (__v16sf)_mm512_moveldup_ps(__A),
8696 _mm_mask_move_ss (__m128 __W, __mmask8 __U, __m128 __A, __m128 __B)
8698 return __builtin_ia32_selectss_128(__U, _mm_move_ss(__A, __B), __W);
8702 _mm_maskz_move_ss (__mmask8 __U, __m128 __A, __m128 __B)
8704 return __builtin_ia32_selectss_128(__U, _mm_move_ss(__A, __B),
8709 _mm_mask_move_sd (__m128d __W, __mmask8 __U, __m128d __A, __m128d __B)
8711 return __builtin_ia32_selectsd_128(__U, _mm_move_sd(__A, __B), __W);
8715 _mm_maskz_move_sd (__mmask8 __U, __m128d __A, __m128d __B)
8717 return __builtin_ia32_selectsd_128(__U, _mm_move_sd(__A, __B),
8722 _mm_mask_store_ss (float * __W, __mmask8 __U, __m128 __A)
8724 __builtin_ia32_storess128_mask ((__v4sf *)__W, __A, __U & 1);
8728 _mm_mask_store_sd (double * __W, __mmask8 __U, __m128d __A)
8730 __builtin_ia32_storesd128_mask ((__v2df *)__W, __A, __U & 1);
8734 _mm_mask_load_ss (__m128 __W, __mmask8 __U, const float* __A)
8740 return (__m128) __builtin_ia32_loadss128_mask ((const __v4sf *) __A, src, __U & 1);
8744 _mm_maskz_load_ss (__mmask8 __U, const float* __A)
8746 return (__m128)__builtin_ia32_loadss128_mask ((const __v4sf *) __A,
8752 _mm_mask_load_sd (__m128d __W, __mmask8 __U, const double* __A)
8758 return (__m128d) __builtin_ia32_loadsd128_mask ((const __v2df *) __A, src, __U & 1);
8762 _mm_maskz_load_sd (__mmask8 __U, const double* __A)
8764 return (__m128d) __builtin_ia32_loadsd128_mask ((const __v2df *) __A,
8783 _mm512_mask_expand_pd (__m512d __W, __mmask8 __U, __m512d __A)
8785 return (__m512d) __builtin_ia32_expanddf512_mask ((__v8df) __A,
8791 _mm512_maskz_expand_pd (__mmask8 __U, __m512d __A)
8793 return (__m512d) __builtin_ia32_expanddf512_mask ((__v8df) __A,
8799 _mm512_mask_expand_epi64 (__m512i __W, __mmask8 __U, __m512i __A)
8801 return (__m512i) __builtin_ia32_expanddi512_mask ((__v8di) __A,
8807 _mm512_maskz_expand_epi64 ( __mmask8 __U, __m512i __A)
8809 return (__m512i) __builtin_ia32_expanddi512_mask ((__v8di) __A,
8879 _mm512_mask_expand_ps (__m512 __W, __mmask16 __U, __m512 __A)
8881 return (__m512) __builtin_ia32_expandsf512_mask ((__v16sf) __A,
8887 _mm512_maskz_expand_ps (__mmask16 __U, __m512 __A)
8889 return (__m512) __builtin_ia32_expandsf512_mask ((__v16sf) __A,
8895 _mm512_mask_expand_epi32 (__m512i __W, __mmask16 __U, __m512i __A)
8897 return (__m512i) __builtin_ia32_expandsi512_mask ((__v16si) __A,
8903 _mm512_maskz_expand_epi32 (__mmask16 __U, __m512i __A)
8905 return (__m512i) __builtin_ia32_expandsi512_mask ((__v16si) __A,
8926 _mm512_cvtps_pd (__m256 __A)
8928 return (__m512d) __builtin_convertvector((__v8sf)__A, __v8df);
8932 _mm512_mask_cvtps_pd (__m512d __W, __mmask8 __U, __m256 __A)
8935 (__v8df)_mm512_cvtps_pd(__A),
8940 _mm512_maskz_cvtps_pd (__mmask8 __U, __m256 __A)
8943 (__v8df)_mm512_cvtps_pd(__A),
8948 _mm512_cvtpslo_pd (__m512 __A)
8950 return (__m512d) _mm512_cvtps_pd(_mm512_castps512_ps256(__A));
8954 _mm512_mask_cvtpslo_pd (__m512d __W, __mmask8 __U, __m512 __A)
8956 return (__m512d) _mm512_mask_cvtps_pd(__W, __U, _mm512_castps512_ps256(__A));
8960 _mm512_mask_mov_pd (__m512d __W, __mmask8 __U, __m512d __A)
8963 (__v8df) __A,
8968 _mm512_maskz_mov_pd (__mmask8 __U, __m512d __A)
8971 (__v8df) __A,
8976 _mm512_mask_mov_ps (__m512 __W, __mmask16 __U, __m512 __A)
8979 (__v16sf) __A,
8984 _mm512_maskz_mov_ps (__mmask16 __U, __m512 __A)
8987 (__v16sf) __A,
8992 _mm512_mask_compressstoreu_pd (void *__P, __mmask8 __U, __m512d __A)
8994 __builtin_ia32_compressstoredf512_mask ((__v8df *) __P, (__v8df) __A,
8999 _mm512_mask_compressstoreu_epi64 (void *__P, __mmask8 __U, __m512i __A)
9001 __builtin_ia32_compressstoredi512_mask ((__v8di *) __P, (__v8di) __A,
9006 _mm512_mask_compressstoreu_ps (void *__P, __mmask16 __U, __m512 __A)
9008 __builtin_ia32_compressstoresf512_mask ((__v16sf *) __P, (__v16sf) __A,
9013 _mm512_mask_compressstoreu_epi32 (void *__P, __mmask16 __U, __m512i __A)
9015 __builtin_ia32_compressstoresi512_mask ((__v16si *) __P, (__v16si) __A,
9038 _mm_mask_cvtsd_ss (__m128 __W, __mmask8 __U, __m128 __A, __m128d __B)
9040 return __builtin_ia32_cvtsd2ss_round_mask ((__v4sf)__A,
9047 _mm_maskz_cvtsd_ss (__mmask8 __U, __m128 __A, __m128d __B)
9049 return __builtin_ia32_cvtsd2ss_round_mask ((__v4sf)__A,
9111 _mm_mask_cvtss_sd (__m128d __W, __mmask8 __U, __m128d __A, __m128 __B)
9113 return __builtin_ia32_cvtss2sd_round_mask((__v2df)__A,
9120 _mm_maskz_cvtss_sd (__mmask8 __U, __m128d __A, __m128 __B)
9122 return __builtin_ia32_cvtss2sd_round_mask((__v2df)__A,
9129 _mm_cvtu32_sd (__m128d __A, unsigned __B)
9131 __A[0] = __B;
9132 return __A;
9141 _mm_cvtu64_sd (__m128d __A, unsigned long long __B)
9143 __A[0] = __B;
9144 return __A;
9153 _mm_cvtu32_ss (__m128 __A, unsigned __B)
9155 __A[0] = __B;
9156 return __A;
9165 _mm_cvtu64_ss (__m128 __A, unsigned long long __B)
9167 __A[0] = __B;
9168 return __A;
9173 _mm512_mask_set1_epi32 (__m512i __O, __mmask16 __M, int __A)
9176 (__v16si) _mm512_set1_epi32(__A),
9181 _mm512_mask_set1_epi64 (__m512i __O, __mmask8 __M, long long __A)
9184 (__v8di) _mm512_set1_epi64(__A),
9228 _mm512_set_epi32 (int __A, int __B, int __C, int __D,
9235 __H, __G, __F, __E, __D, __C, __B, __A };
9244 _mm512_set_epi64 (long long __A, long long __B, long long __C,
9249 { __H, __G, __F, __E, __D, __C, __B, __A };
9256 _mm512_set_pd (double __A, double __B, double __C, double __D,
9260 { __H, __G, __F, __E, __D, __C, __B, __A };
9267 _mm512_set_ps (float __A, float __B, float __C, float __D,
9274 __H, __G, __F, __E, __D, __C, __B, __A };
9282 _mm512_abs_ps(__m512 __A)
9284 return (__m512)_mm512_and_epi32(_mm512_set1_epi32(0x7FFFFFFF),(__m512i)__A) ;
9288 _mm512_mask_abs_ps(__m512 __W, __mmask16 __K, __m512 __A)
9290 return (__m512)_mm512_mask_and_epi32((__m512i)__W, __K, _mm512_set1_epi32(0x7FFFFFFF),(__m512i)__A) ;
9294 _mm512_abs_pd(__m512d __A)
9296 return (__m512d)_mm512_and_epi64(_mm512_set1_epi64(0x7FFFFFFFFFFFFFFF),(__v8di)__A) ;
9300 _mm512_mask_abs_pd(__m512d __W, __mmask8 __K, __m512d __A)
9302 return (__m512d)_mm512_mask_and_epi64((__v8di)__W, __K, _mm512_set1_epi64(0x7FFFFFFFFFFFFFFF),(__v8di)__A);
9588 /// \param __A
9593 _mm512_cvtsi512_si32(__m512i __A) {
9594 __v16si __b = (__v16si)__A;