Lines Matching refs:__A

227 _mm256_mask_add_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)
230 (__v8si)_mm256_add_epi32(__A, __B),
235 _mm256_maskz_add_epi32(__mmask8 __U, __m256i __A, __m256i __B)
238 (__v8si)_mm256_add_epi32(__A, __B),
243 _mm256_mask_add_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)
246 (__v4di)_mm256_add_epi64(__A, __B),
251 _mm256_maskz_add_epi64(__mmask8 __U, __m256i __A, __m256i __B)
254 (__v4di)_mm256_add_epi64(__A, __B),
259 _mm256_mask_sub_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)
262 (__v8si)_mm256_sub_epi32(__A, __B),
267 _mm256_maskz_sub_epi32(__mmask8 __U, __m256i __A, __m256i __B)
270 (__v8si)_mm256_sub_epi32(__A, __B),
275 _mm256_mask_sub_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)
278 (__v4di)_mm256_sub_epi64(__A, __B),
283 _mm256_maskz_sub_epi64(__mmask8 __U, __m256i __A, __m256i __B)
286 (__v4di)_mm256_sub_epi64(__A, __B),
291 _mm_mask_add_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
294 (__v4si)_mm_add_epi32(__A, __B),
299 _mm_maskz_add_epi32(__mmask8 __U, __m128i __A, __m128i __B)
302 (__v4si)_mm_add_epi32(__A, __B),
307 _mm_mask_add_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
310 (__v2di)_mm_add_epi64(__A, __B),
315 _mm_maskz_add_epi64(__mmask8 __U, __m128i __A, __m128i __B)
318 (__v2di)_mm_add_epi64(__A, __B),
323 _mm_mask_sub_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
326 (__v4si)_mm_sub_epi32(__A, __B),
331 _mm_maskz_sub_epi32(__mmask8 __U, __m128i __A, __m128i __B)
334 (__v4si)_mm_sub_epi32(__A, __B),
339 _mm_mask_sub_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
342 (__v2di)_mm_sub_epi64(__A, __B),
347 _mm_maskz_sub_epi64(__mmask8 __U, __m128i __A, __m128i __B)
350 (__v2di)_mm_sub_epi64(__A, __B),
419 _mm256_maskz_mullo_epi32(__mmask8 __M, __m256i __A, __m256i __B)
422 (__v8si)_mm256_mullo_epi32(__A, __B),
427 _mm256_mask_mullo_epi32(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B)
430 (__v8si)_mm256_mullo_epi32(__A, __B),
435 _mm_maskz_mullo_epi32(__mmask8 __M, __m128i __A, __m128i __B)
438 (__v4si)_mm_mullo_epi32(__A, __B),
443 _mm_mask_mullo_epi32(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B)
446 (__v4si)_mm_mullo_epi32(__A, __B),
457 _mm256_mask_and_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)
460 (__v8si)_mm256_and_epi32(__A, __B),
465 _mm256_maskz_and_epi32(__mmask8 __U, __m256i __A, __m256i __B)
467 return (__m256i)_mm256_mask_and_epi32(_mm256_setzero_si256(), __U, __A, __B);
477 _mm_mask_and_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
480 (__v4si)_mm_and_epi32(__A, __B),
485 _mm_maskz_and_epi32(__mmask8 __U, __m128i __A, __m128i __B)
487 return (__m128i)_mm_mask_and_epi32(_mm_setzero_si128(), __U, __A, __B);
491 _mm256_andnot_epi32(__m256i __A, __m256i __B)
493 return (__m256i)(~(__v8su)__A & (__v8su)__B);
497 _mm256_mask_andnot_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)
500 (__v8si)_mm256_andnot_epi32(__A, __B),
505 _mm256_maskz_andnot_epi32(__mmask8 __U, __m256i __A, __m256i __B)
508 __U, __A, __B);
512 _mm_andnot_epi32(__m128i __A, __m128i __B)
514 return (__m128i)(~(__v4su)__A & (__v4su)__B);
518 _mm_mask_andnot_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
521 (__v4si)_mm_andnot_epi32(__A, __B),
526 _mm_maskz_andnot_epi32(__mmask8 __U, __m128i __A, __m128i __B)
528 return (__m128i)_mm_mask_andnot_epi32(_mm_setzero_si128(), __U, __A, __B);
538 _mm256_mask_or_epi32 (__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)
541 (__v8si)_mm256_or_epi32(__A, __B),
546 _mm256_maskz_or_epi32(__mmask8 __U, __m256i __A, __m256i __B)
548 return (__m256i)_mm256_mask_or_epi32(_mm256_setzero_si256(), __U, __A, __B);
558 _mm_mask_or_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
561 (__v4si)_mm_or_epi32(__A, __B),
566 _mm_maskz_or_epi32(__mmask8 __U, __m128i __A, __m128i __B)
568 return (__m128i)_mm_mask_or_epi32(_mm_setzero_si128(), __U, __A, __B);
578 _mm256_mask_xor_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)
581 (__v8si)_mm256_xor_epi32(__A, __B),
586 _mm256_maskz_xor_epi32(__mmask8 __U, __m256i __A, __m256i __B)
588 return (__m256i)_mm256_mask_xor_epi32(_mm256_setzero_si256(), __U, __A, __B);
598 _mm_mask_xor_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
601 (__v4si)_mm_xor_epi32(__A, __B),
606 _mm_maskz_xor_epi32(__mmask8 __U, __m128i __A, __m128i __B)
608 return (__m128i)_mm_mask_xor_epi32(_mm_setzero_si128(), __U, __A, __B);
618 _mm256_mask_and_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)
621 (__v4di)_mm256_and_epi64(__A, __B),
626 _mm256_maskz_and_epi64(__mmask8 __U, __m256i __A, __m256i __B)
628 return (__m256i)_mm256_mask_and_epi64(_mm256_setzero_si256(), __U, __A, __B);
638 _mm_mask_and_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
641 (__v2di)_mm_and_epi64(__A, __B),
646 _mm_maskz_and_epi64(__mmask8 __U, __m128i __A, __m128i __B)
648 return (__m128i)_mm_mask_and_epi64(_mm_setzero_si128(), __U, __A, __B);
652 _mm256_andnot_epi64(__m256i __A, __m256i __B)
654 return (__m256i)(~(__v4du)__A & (__v4du)__B);
658 _mm256_mask_andnot_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)
661 (__v4di)_mm256_andnot_epi64(__A, __B),
666 _mm256_maskz_andnot_epi64(__mmask8 __U, __m256i __A, __m256i __B)
669 __U, __A, __B);
673 _mm_andnot_epi64(__m128i __A, __m128i __B)
675 return (__m128i)(~(__v2du)__A & (__v2du)__B);
679 _mm_mask_andnot_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
682 (__v2di)_mm_andnot_epi64(__A, __B),
687 _mm_maskz_andnot_epi64(__mmask8 __U, __m128i __A, __m128i __B)
689 return (__m128i)_mm_mask_andnot_epi64(_mm_setzero_si128(), __U, __A, __B);
699 _mm256_mask_or_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)
702 (__v4di)_mm256_or_epi64(__A, __B),
707 _mm256_maskz_or_epi64(__mmask8 __U, __m256i __A, __m256i __B)
709 return (__m256i)_mm256_mask_or_epi64(_mm256_setzero_si256(), __U, __A, __B);
719 _mm_mask_or_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
722 (__v2di)_mm_or_epi64(__A, __B),
727 _mm_maskz_or_epi64(__mmask8 __U, __m128i __A, __m128i __B)
729 return (__m128i)_mm_mask_or_epi64(_mm_setzero_si128(), __U, __A, __B);
739 _mm256_mask_xor_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)
742 (__v4di)_mm256_xor_epi64(__A, __B),
747 _mm256_maskz_xor_epi64(__mmask8 __U, __m256i __A, __m256i __B)
749 return (__m256i)_mm256_mask_xor_epi64(_mm256_setzero_si256(), __U, __A, __B);
759 _mm_mask_xor_epi64(__m128i __W, __mmask8 __U, __m128i __A,
763 (__v2di)_mm_xor_epi64(__A, __B),
768 _mm_maskz_xor_epi64(__mmask8 __U, __m128i __A, __m128i __B)
770 return (__m128i)_mm_mask_xor_epi64(_mm_setzero_si128(), __U, __A, __B);
894 _mm_mask_fmadd_pd(__m128d __A, __mmask8 __U, __m128d __B, __m128d __C)
897 __builtin_ia32_vfmaddpd ((__v2df) __A,
900 (__v2df) __A);
904 _mm_mask3_fmadd_pd(__m128d __A, __m128d __B, __m128d __C, __mmask8 __U)
907 __builtin_ia32_vfmaddpd ((__v2df) __A,
914 _mm_maskz_fmadd_pd(__mmask8 __U, __m128d __A, __m128d __B, __m128d __C)
917 __builtin_ia32_vfmaddpd ((__v2df) __A,
924 _mm_mask_fmsub_pd(__m128d __A, __mmask8 __U, __m128d __B, __m128d __C)
927 __builtin_ia32_vfmaddpd ((__v2df) __A,
930 (__v2df) __A);
934 _mm_maskz_fmsub_pd(__mmask8 __U, __m128d __A, __m128d __B, __m128d __C)
937 __builtin_ia32_vfmaddpd ((__v2df) __A,
944 _mm_mask3_fnmadd_pd(__m128d __A, __m128d __B, __m128d __C, __mmask8 __U)
947 __builtin_ia32_vfmaddpd (-(__v2df) __A,
954 _mm_maskz_fnmadd_pd(__mmask8 __U, __m128d __A, __m128d __B, __m128d __C)
957 __builtin_ia32_vfmaddpd (-(__v2df) __A,
964 _mm_maskz_fnmsub_pd(__mmask8 __U, __m128d __A, __m128d __B, __m128d __C)
967 __builtin_ia32_vfmaddpd (-(__v2df) __A,
974 _mm256_mask_fmadd_pd(__m256d __A, __mmask8 __U, __m256d __B, __m256d __C)
977 __builtin_ia32_vfmaddpd256 ((__v4df) __A,
980 (__v4df) __A);
984 _mm256_mask3_fmadd_pd(__m256d __A, __m256d __B, __m256d __C, __mmask8 __U)
987 __builtin_ia32_vfmaddpd256 ((__v4df) __A,
994 _mm256_maskz_fmadd_pd(__mmask8 __U, __m256d __A, __m256d __B, __m256d __C)
997 __builtin_ia32_vfmaddpd256 ((__v4df) __A,
1004 _mm256_mask_fmsub_pd(__m256d __A, __mmask8 __U, __m256d __B, __m256d __C)
1007 __builtin_ia32_vfmaddpd256 ((__v4df) __A,
1010 (__v4df) __A);
1014 _mm256_maskz_fmsub_pd(__mmask8 __U, __m256d __A, __m256d __B, __m256d __C)
1017 __builtin_ia32_vfmaddpd256 ((__v4df) __A,
1024 _mm256_mask3_fnmadd_pd(__m256d __A, __m256d __B, __m256d __C, __mmask8 __U)
1027 __builtin_ia32_vfmaddpd256 (-(__v4df) __A,
1034 _mm256_maskz_fnmadd_pd(__mmask8 __U, __m256d __A, __m256d __B, __m256d __C)
1037 __builtin_ia32_vfmaddpd256 (-(__v4df) __A,
1044 _mm256_maskz_fnmsub_pd(__mmask8 __U, __m256d __A, __m256d __B, __m256d __C)
1047 __builtin_ia32_vfmaddpd256 (-(__v4df) __A,
1054 _mm_mask_fmadd_ps(__m128 __A, __mmask8 __U, __m128 __B, __m128 __C)
1057 __builtin_ia32_vfmaddps ((__v4sf) __A,
1060 (__v4sf) __A);
1064 _mm_mask3_fmadd_ps(__m128 __A, __m128 __B, __m128 __C, __mmask8 __U)
1067 __builtin_ia32_vfmaddps ((__v4sf) __A,
1074 _mm_maskz_fmadd_ps(__mmask8 __U, __m128 __A, __m128 __B, __m128 __C)
1077 __builtin_ia32_vfmaddps ((__v4sf) __A,
1084 _mm_mask_fmsub_ps(__m128 __A, __mmask8 __U, __m128 __B, __m128 __C)
1087 __builtin_ia32_vfmaddps ((__v4sf) __A,
1090 (__v4sf) __A);
1094 _mm_maskz_fmsub_ps(__mmask8 __U, __m128 __A, __m128 __B, __m128 __C)
1097 __builtin_ia32_vfmaddps ((__v4sf) __A,
1104 _mm_mask3_fnmadd_ps(__m128 __A, __m128 __B, __m128 __C, __mmask8 __U)
1107 __builtin_ia32_vfmaddps (-(__v4sf) __A,
1114 _mm_maskz_fnmadd_ps(__mmask8 __U, __m128 __A, __m128 __B, __m128 __C)
1117 __builtin_ia32_vfmaddps (-(__v4sf) __A,
1124 _mm_maskz_fnmsub_ps(__mmask8 __U, __m128 __A, __m128 __B, __m128 __C)
1127 __builtin_ia32_vfmaddps (-(__v4sf) __A,
1134 _mm256_mask_fmadd_ps(__m256 __A, __mmask8 __U, __m256 __B, __m256 __C)
1137 __builtin_ia32_vfmaddps256 ((__v8sf) __A,
1140 (__v8sf) __A);
1144 _mm256_mask3_fmadd_ps(__m256 __A, __m256 __B, __m256 __C, __mmask8 __U)
1147 __builtin_ia32_vfmaddps256 ((__v8sf) __A,
1154 _mm256_maskz_fmadd_ps(__mmask8 __U, __m256 __A, __m256 __B, __m256 __C)
1157 __builtin_ia32_vfmaddps256 ((__v8sf) __A,
1164 _mm256_mask_fmsub_ps(__m256 __A, __mmask8 __U, __m256 __B, __m256 __C)
1167 __builtin_ia32_vfmaddps256 ((__v8sf) __A,
1170 (__v8sf) __A);
1174 _mm256_maskz_fmsub_ps(__mmask8 __U, __m256 __A, __m256 __B, __m256 __C)
1177 __builtin_ia32_vfmaddps256 ((__v8sf) __A,
1184 _mm256_mask3_fnmadd_ps(__m256 __A, __m256 __B, __m256 __C, __mmask8 __U)
1187 __builtin_ia32_vfmaddps256 (-(__v8sf) __A,
1194 _mm256_maskz_fnmadd_ps(__mmask8 __U, __m256 __A, __m256 __B, __m256 __C)
1197 __builtin_ia32_vfmaddps256 (-(__v8sf) __A,
1204 _mm256_maskz_fnmsub_ps(__mmask8 __U, __m256 __A, __m256 __B, __m256 __C)
1207 __builtin_ia32_vfmaddps256 (-(__v8sf) __A,
1214 _mm_mask_fmaddsub_pd(__m128d __A, __mmask8 __U, __m128d __B, __m128d __C)
1217 __builtin_ia32_vfmaddsubpd ((__v2df) __A,
1220 (__v2df) __A);
1224 _mm_mask3_fmaddsub_pd(__m128d __A, __m128d __B, __m128d __C, __mmask8 __U)
1227 __builtin_ia32_vfmaddsubpd ((__v2df) __A,
1234 _mm_maskz_fmaddsub_pd(__mmask8 __U, __m128d __A, __m128d __B, __m128d __C)
1237 __builtin_ia32_vfmaddsubpd ((__v2df) __A,
1244 _mm_mask_fmsubadd_pd(__m128d __A, __mmask8 __U, __m128d __B, __m128d __C)
1247 __builtin_ia32_vfmaddsubpd ((__v2df) __A,
1250 (__v2df) __A);
1254 _mm_maskz_fmsubadd_pd(__mmask8 __U, __m128d __A, __m128d __B, __m128d __C)
1257 __builtin_ia32_vfmaddsubpd ((__v2df) __A,
1264 _mm256_mask_fmaddsub_pd(__m256d __A, __mmask8 __U, __m256d __B, __m256d __C)
1267 __builtin_ia32_vfmaddsubpd256 ((__v4df) __A,
1270 (__v4df) __A);
1274 _mm256_mask3_fmaddsub_pd(__m256d __A, __m256d __B, __m256d __C, __mmask8 __U)
1277 __builtin_ia32_vfmaddsubpd256 ((__v4df) __A,
1284 _mm256_maskz_fmaddsub_pd(__mmask8 __U, __m256d __A, __m256d __B, __m256d __C)
1287 __builtin_ia32_vfmaddsubpd256 ((__v4df) __A,
1294 _mm256_mask_fmsubadd_pd(__m256d __A, __mmask8 __U, __m256d __B, __m256d __C)
1297 __builtin_ia32_vfmaddsubpd256 ((__v4df) __A,
1300 (__v4df) __A);
1304 _mm256_maskz_fmsubadd_pd(__mmask8 __U, __m256d __A, __m256d __B, __m256d __C)
1307 __builtin_ia32_vfmaddsubpd256 ((__v4df) __A,
1314 _mm_mask_fmaddsub_ps(__m128 __A, __mmask8 __U, __m128 __B, __m128 __C)
1317 __builtin_ia32_vfmaddsubps ((__v4sf) __A,
1320 (__v4sf) __A);
1324 _mm_mask3_fmaddsub_ps(__m128 __A, __m128 __B, __m128 __C, __mmask8 __U)
1327 __builtin_ia32_vfmaddsubps ((__v4sf) __A,
1334 _mm_maskz_fmaddsub_ps(__mmask8 __U, __m128 __A, __m128 __B, __m128 __C)
1337 __builtin_ia32_vfmaddsubps ((__v4sf) __A,
1344 _mm_mask_fmsubadd_ps(__m128 __A, __mmask8 __U, __m128 __B, __m128 __C)
1347 __builtin_ia32_vfmaddsubps ((__v4sf) __A,
1350 (__v4sf) __A);
1354 _mm_maskz_fmsubadd_ps(__mmask8 __U, __m128 __A, __m128 __B, __m128 __C)
1357 __builtin_ia32_vfmaddsubps ((__v4sf) __A,
1364 _mm256_mask_fmaddsub_ps(__m256 __A, __mmask8 __U, __m256 __B,
1368 __builtin_ia32_vfmaddsubps256 ((__v8sf) __A,
1371 (__v8sf) __A);
1375 _mm256_mask3_fmaddsub_ps(__m256 __A, __m256 __B, __m256 __C, __mmask8 __U)
1378 __builtin_ia32_vfmaddsubps256 ((__v8sf) __A,
1385 _mm256_maskz_fmaddsub_ps(__mmask8 __U, __m256 __A, __m256 __B, __m256 __C)
1388 __builtin_ia32_vfmaddsubps256 ((__v8sf) __A,
1395 _mm256_mask_fmsubadd_ps(__m256 __A, __mmask8 __U, __m256 __B, __m256 __C)
1398 __builtin_ia32_vfmaddsubps256 ((__v8sf) __A,
1401 (__v8sf) __A);
1405 _mm256_maskz_fmsubadd_ps(__mmask8 __U, __m256 __A, __m256 __B, __m256 __C)
1408 __builtin_ia32_vfmaddsubps256 ((__v8sf) __A,
1415 _mm_mask3_fmsub_pd(__m128d __A, __m128d __B, __m128d __C, __mmask8 __U)
1418 __builtin_ia32_vfmaddpd ((__v2df) __A,
1425 _mm256_mask3_fmsub_pd(__m256d __A, __m256d __B, __m256d __C, __mmask8 __U)
1428 __builtin_ia32_vfmaddpd256 ((__v4df) __A,
1435 _mm_mask3_fmsub_ps(__m128 __A, __m128 __B, __m128 __C, __mmask8 __U)
1438 __builtin_ia32_vfmaddps ((__v4sf) __A,
1445 _mm256_mask3_fmsub_ps(__m256 __A, __m256 __B, __m256 __C, __mmask8 __U)
1448 __builtin_ia32_vfmaddps256 ((__v8sf) __A,
1455 _mm_mask3_fmsubadd_pd(__m128d __A, __m128d __B, __m128d __C, __mmask8 __U)
1458 __builtin_ia32_vfmaddsubpd ((__v2df) __A,
1465 _mm256_mask3_fmsubadd_pd(__m256d __A, __m256d __B, __m256d __C, __mmask8 __U)
1468 __builtin_ia32_vfmaddsubpd256 ((__v4df) __A,
1475 _mm_mask3_fmsubadd_ps(__m128 __A, __m128 __B, __m128 __C, __mmask8 __U)
1478 __builtin_ia32_vfmaddsubps ((__v4sf) __A,
1485 _mm256_mask3_fmsubadd_ps(__m256 __A, __m256 __B, __m256 __C, __mmask8 __U)
1488 __builtin_ia32_vfmaddsubps256 ((__v8sf) __A,
1495 _mm_mask_fnmadd_pd(__m128d __A, __mmask8 __U, __m128d __B, __m128d __C)
1498 __builtin_ia32_vfmaddpd ((__v2df) __A,
1501 (__v2df) __A);
1505 _mm256_mask_fnmadd_pd(__m256d __A, __mmask8 __U, __m256d __B, __m256d __C)
1508 __builtin_ia32_vfmaddpd256 ((__v4df) __A,
1511 (__v4df) __A);
1515 _mm_mask_fnmadd_ps(__m128 __A, __mmask8 __U, __m128 __B, __m128 __C)
1518 __builtin_ia32_vfmaddps ((__v4sf) __A,
1521 (__v4sf) __A);
1525 _mm256_mask_fnmadd_ps(__m256 __A, __mmask8 __U, __m256 __B, __m256 __C)
1528 __builtin_ia32_vfmaddps256 ((__v8sf) __A,
1531 (__v8sf) __A);
1535 _mm_mask_fnmsub_pd(__m128d __A, __mmask8 __U, __m128d __B, __m128d __C)
1538 __builtin_ia32_vfmaddpd ((__v2df) __A,
1541 (__v2df) __A);
1545 _mm_mask3_fnmsub_pd(__m128d __A, __m128d __B, __m128d __C, __mmask8 __U)
1548 __builtin_ia32_vfmaddpd ((__v2df) __A,
1555 _mm256_mask_fnmsub_pd(__m256d __A, __mmask8 __U, __m256d __B, __m256d __C)
1558 __builtin_ia32_vfmaddpd256 ((__v4df) __A,
1561 (__v4df) __A);
1565 _mm256_mask3_fnmsub_pd(__m256d __A, __m256d __B, __m256d __C, __mmask8 __U)
1568 __builtin_ia32_vfmaddpd256 ((__v4df) __A,
1575 _mm_mask_fnmsub_ps(__m128 __A, __mmask8 __U, __m128 __B, __m128 __C)
1578 __builtin_ia32_vfmaddps ((__v4sf) __A,
1581 (__v4sf) __A);
1585 _mm_mask3_fnmsub_ps(__m128 __A, __m128 __B, __m128 __C, __mmask8 __U)
1588 __builtin_ia32_vfmaddps ((__v4sf) __A,
1595 _mm256_mask_fnmsub_ps(__m256 __A, __mmask8 __U, __m256 __B, __m256 __C)
1598 __builtin_ia32_vfmaddps256 ((__v8sf) __A,
1601 (__v8sf) __A);
1605 _mm256_mask3_fnmsub_ps(__m256 __A, __m256 __B, __m256 __C, __mmask8 __U)
1608 __builtin_ia32_vfmaddps256 ((__v8sf) __A,
1615 _mm_mask_add_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) {
1617 (__v2df)_mm_add_pd(__A, __B),
1622 _mm_maskz_add_pd(__mmask8 __U, __m128d __A, __m128d __B) {
1624 (__v2df)_mm_add_pd(__A, __B),
1629 _mm256_mask_add_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) {
1631 (__v4df)_mm256_add_pd(__A, __B),
1636 _mm256_maskz_add_pd(__mmask8 __U, __m256d __A, __m256d __B) {
1638 (__v4df)_mm256_add_pd(__A, __B),
1643 _mm_mask_add_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) {
1645 (__v4sf)_mm_add_ps(__A, __B),
1650 _mm_maskz_add_ps(__mmask8 __U, __m128 __A, __m128 __B) {
1652 (__v4sf)_mm_add_ps(__A, __B),
1657 _mm256_mask_add_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) {
1659 (__v8sf)_mm256_add_ps(__A, __B),
1664 _mm256_maskz_add_ps(__mmask8 __U, __m256 __A, __m256 __B) {
1666 (__v8sf)_mm256_add_ps(__A, __B),
1671 _mm_mask_blend_epi32 (__mmask8 __U, __m128i __A, __m128i __W) {
1674 (__v4si) __A);
1678 _mm256_mask_blend_epi32 (__mmask8 __U, __m256i __A, __m256i __W) {
1681 (__v8si) __A);
1685 _mm_mask_blend_pd (__mmask8 __U, __m128d __A, __m128d __W) {
1688 (__v2df) __A);
1692 _mm256_mask_blend_pd (__mmask8 __U, __m256d __A, __m256d __W) {
1695 (__v4df) __A);
1699 _mm_mask_blend_ps (__mmask8 __U, __m128 __A, __m128 __W) {
1702 (__v4sf) __A);
1706 _mm256_mask_blend_ps (__mmask8 __U, __m256 __A, __m256 __W) {
1709 (__v8sf) __A);
1713 _mm_mask_blend_epi64 (__mmask8 __U, __m128i __A, __m128i __W) {
1716 (__v2di) __A);
1720 _mm256_mask_blend_epi64 (__mmask8 __U, __m256i __A, __m256i __W) {
1723 (__v4di) __A);
1727 _mm_mask_compress_pd (__m128d __W, __mmask8 __U, __m128d __A) {
1728 return (__m128d) __builtin_ia32_compressdf128_mask ((__v2df) __A,
1734 _mm_maskz_compress_pd (__mmask8 __U, __m128d __A) {
1735 return (__m128d) __builtin_ia32_compressdf128_mask ((__v2df) __A,
1742 _mm256_mask_compress_pd (__m256d __W, __mmask8 __U, __m256d __A) {
1743 return (__m256d) __builtin_ia32_compressdf256_mask ((__v4df) __A,
1749 _mm256_maskz_compress_pd (__mmask8 __U, __m256d __A) {
1750 return (__m256d) __builtin_ia32_compressdf256_mask ((__v4df) __A,
1757 _mm_mask_compress_epi64 (__m128i __W, __mmask8 __U, __m128i __A) {
1758 return (__m128i) __builtin_ia32_compressdi128_mask ((__v2di) __A,
1764 _mm_maskz_compress_epi64 (__mmask8 __U, __m128i __A) {
1765 return (__m128i) __builtin_ia32_compressdi128_mask ((__v2di) __A,
1772 _mm256_mask_compress_epi64 (__m256i __W, __mmask8 __U, __m256i __A) {
1773 return (__m256i) __builtin_ia32_compressdi256_mask ((__v4di) __A,
1779 _mm256_maskz_compress_epi64 (__mmask8 __U, __m256i __A) {
1780 return (__m256i) __builtin_ia32_compressdi256_mask ((__v4di) __A,
1787 _mm_mask_compress_ps (__m128 __W, __mmask8 __U, __m128 __A) {
1788 return (__m128) __builtin_ia32_compresssf128_mask ((__v4sf) __A,
1794 _mm_maskz_compress_ps (__mmask8 __U, __m128 __A) {
1795 return (__m128) __builtin_ia32_compresssf128_mask ((__v4sf) __A,
1802 _mm256_mask_compress_ps (__m256 __W, __mmask8 __U, __m256 __A) {
1803 return (__m256) __builtin_ia32_compresssf256_mask ((__v8sf) __A,
1809 _mm256_maskz_compress_ps (__mmask8 __U, __m256 __A) {
1810 return (__m256) __builtin_ia32_compresssf256_mask ((__v8sf) __A,
1817 _mm_mask_compress_epi32 (__m128i __W, __mmask8 __U, __m128i __A) {
1818 return (__m128i) __builtin_ia32_compresssi128_mask ((__v4si) __A,
1824 _mm_maskz_compress_epi32 (__mmask8 __U, __m128i __A) {
1825 return (__m128i) __builtin_ia32_compresssi128_mask ((__v4si) __A,
1832 _mm256_mask_compress_epi32 (__m256i __W, __mmask8 __U, __m256i __A) {
1833 return (__m256i) __builtin_ia32_compresssi256_mask ((__v8si) __A,
1839 _mm256_maskz_compress_epi32 (__mmask8 __U, __m256i __A) {
1840 return (__m256i) __builtin_ia32_compresssi256_mask ((__v8si) __A,
1847 _mm_mask_compressstoreu_pd (void *__P, __mmask8 __U, __m128d __A) {
1849 (__v2df) __A,
1854 _mm256_mask_compressstoreu_pd (void *__P, __mmask8 __U, __m256d __A) {
1856 (__v4df) __A,
1861 _mm_mask_compressstoreu_epi64 (void *__P, __mmask8 __U, __m128i __A) {
1863 (__v2di) __A,
1868 _mm256_mask_compressstoreu_epi64 (void *__P, __mmask8 __U, __m256i __A) {
1870 (__v4di) __A,
1875 _mm_mask_compressstoreu_ps (void *__P, __mmask8 __U, __m128 __A) {
1877 (__v4sf) __A,
1882 _mm256_mask_compressstoreu_ps (void *__P, __mmask8 __U, __m256 __A) {
1884 (__v8sf) __A,
1889 _mm_mask_compressstoreu_epi32 (void *__P, __mmask8 __U, __m128i __A) {
1891 (__v4si) __A,
1896 _mm256_mask_compressstoreu_epi32 (void *__P, __mmask8 __U, __m256i __A) {
1898 (__v8si) __A,
1903 _mm_mask_cvtepi32_pd (__m128d __W, __mmask8 __U, __m128i __A) {
1905 (__v2df)_mm_cvtepi32_pd(__A),
1910 _mm_maskz_cvtepi32_pd (__mmask8 __U, __m128i __A) {
1912 (__v2df)_mm_cvtepi32_pd(__A),
1917 _mm256_mask_cvtepi32_pd (__m256d __W, __mmask8 __U, __m128i __A) {
1919 (__v4df)_mm256_cvtepi32_pd(__A),
1924 _mm256_maskz_cvtepi32_pd (__mmask8 __U, __m128i __A) {
1926 (__v4df)_mm256_cvtepi32_pd(__A),
1931 _mm_mask_cvtepi32_ps (__m128 __W, __mmask8 __U, __m128i __A) {
1933 (__v4sf)_mm_cvtepi32_ps(__A),
1938 _mm_maskz_cvtepi32_ps (__mmask8 __U, __m128i __A) {
1940 (__v4sf)_mm_cvtepi32_ps(__A),
1945 _mm256_mask_cvtepi32_ps (__m256 __W, __mmask8 __U, __m256i __A) {
1947 (__v8sf)_mm256_cvtepi32_ps(__A),
1952 _mm256_maskz_cvtepi32_ps (__mmask8 __U, __m256i __A) {
1954 (__v8sf)_mm256_cvtepi32_ps(__A),
1959 _mm_mask_cvtpd_epi32 (__m128i __W, __mmask8 __U, __m128d __A) {
1960 return (__m128i) __builtin_ia32_cvtpd2dq128_mask ((__v2df) __A,
1966 _mm_maskz_cvtpd_epi32 (__mmask8 __U, __m128d __A) {
1967 return (__m128i) __builtin_ia32_cvtpd2dq128_mask ((__v2df) __A,
1974 _mm256_mask_cvtpd_epi32 (__m128i __W, __mmask8 __U, __m256d __A) {
1976 (__v4si)_mm256_cvtpd_epi32(__A),
1981 _mm256_maskz_cvtpd_epi32 (__mmask8 __U, __m256d __A) {
1983 (__v4si)_mm256_cvtpd_epi32(__A),
1988 _mm_mask_cvtpd_ps (__m128 __W, __mmask8 __U, __m128d __A) {
1989 return (__m128) __builtin_ia32_cvtpd2ps_mask ((__v2df) __A,
1995 _mm_maskz_cvtpd_ps (__mmask8 __U, __m128d __A) {
1996 return (__m128) __builtin_ia32_cvtpd2ps_mask ((__v2df) __A,
2003 _mm256_mask_cvtpd_ps (__m128 __W, __mmask8 __U, __m256d __A) {
2005 (__v4sf)_mm256_cvtpd_ps(__A),
2010 _mm256_maskz_cvtpd_ps (__mmask8 __U, __m256d __A) {
2012 (__v4sf)_mm256_cvtpd_ps(__A),
2017 _mm_cvtpd_epu32 (__m128d __A) {
2018 return (__m128i) __builtin_ia32_cvtpd2udq128_mask ((__v2df) __A,
2025 _mm_mask_cvtpd_epu32 (__m128i __W, __mmask8 __U, __m128d __A) {
2026 return (__m128i) __builtin_ia32_cvtpd2udq128_mask ((__v2df) __A,
2032 _mm_maskz_cvtpd_epu32 (__mmask8 __U, __m128d __A) {
2033 return (__m128i) __builtin_ia32_cvtpd2udq128_mask ((__v2df) __A,
2040 _mm256_cvtpd_epu32 (__m256d __A) {
2041 return (__m128i) __builtin_ia32_cvtpd2udq256_mask ((__v4df) __A,
2048 _mm256_mask_cvtpd_epu32 (__m128i __W, __mmask8 __U, __m256d __A) {
2049 return (__m128i) __builtin_ia32_cvtpd2udq256_mask ((__v4df) __A,
2055 _mm256_maskz_cvtpd_epu32 (__mmask8 __U, __m256d __A) {
2056 return (__m128i) __builtin_ia32_cvtpd2udq256_mask ((__v4df) __A,
2063 _mm_mask_cvtps_epi32 (__m128i __W, __mmask8 __U, __m128 __A) {
2065 (__v4si)_mm_cvtps_epi32(__A),
2070 _mm_maskz_cvtps_epi32 (__mmask8 __U, __m128 __A) {
2072 (__v4si)_mm_cvtps_epi32(__A),
2077 _mm256_mask_cvtps_epi32 (__m256i __W, __mmask8 __U, __m256 __A) {
2079 (__v8si)_mm256_cvtps_epi32(__A),
2084 _mm256_maskz_cvtps_epi32 (__mmask8 __U, __m256 __A) {
2086 (__v8si)_mm256_cvtps_epi32(__A),
2091 _mm_mask_cvtps_pd (__m128d __W, __mmask8 __U, __m128 __A) {
2093 (__v2df)_mm_cvtps_pd(__A),
2098 _mm_maskz_cvtps_pd (__mmask8 __U, __m128 __A) {
2100 (__v2df)_mm_cvtps_pd(__A),
2105 _mm256_mask_cvtps_pd (__m256d __W, __mmask8 __U, __m128 __A) {
2107 (__v4df)_mm256_cvtps_pd(__A),
2112 _mm256_maskz_cvtps_pd (__mmask8 __U, __m128 __A) {
2114 (__v4df)_mm256_cvtps_pd(__A),
2119 _mm_cvtps_epu32 (__m128 __A) {
2120 return (__m128i) __builtin_ia32_cvtps2udq128_mask ((__v4sf) __A,
2127 _mm_mask_cvtps_epu32 (__m128i __W, __mmask8 __U, __m128 __A) {
2128 return (__m128i) __builtin_ia32_cvtps2udq128_mask ((__v4sf) __A,
2134 _mm_maskz_cvtps_epu32 (__mmask8 __U, __m128 __A) {
2135 return (__m128i) __builtin_ia32_cvtps2udq128_mask ((__v4sf) __A,
2142 _mm256_cvtps_epu32 (__m256 __A) {
2143 return (__m256i) __builtin_ia32_cvtps2udq256_mask ((__v8sf) __A,
2150 _mm256_mask_cvtps_epu32 (__m256i __W, __mmask8 __U, __m256 __A) {
2151 return (__m256i) __builtin_ia32_cvtps2udq256_mask ((__v8sf) __A,
2157 _mm256_maskz_cvtps_epu32 (__mmask8 __U, __m256 __A) {
2158 return (__m256i) __builtin_ia32_cvtps2udq256_mask ((__v8sf) __A,
2165 _mm_mask_cvttpd_epi32 (__m128i __W, __mmask8 __U, __m128d __A) {
2166 return (__m128i) __builtin_ia32_cvttpd2dq128_mask ((__v2df) __A,
2172 _mm_maskz_cvttpd_epi32 (__mmask8 __U, __m128d __A) {
2173 return (__m128i) __builtin_ia32_cvttpd2dq128_mask ((__v2df) __A,
2180 _mm256_mask_cvttpd_epi32 (__m128i __W, __mmask8 __U, __m256d __A) {
2182 (__v4si)_mm256_cvttpd_epi32(__A),
2187 _mm256_maskz_cvttpd_epi32 (__mmask8 __U, __m256d __A) {
2189 (__v4si)_mm256_cvttpd_epi32(__A),
2194 _mm_cvttpd_epu32 (__m128d __A) {
2195 return (__m128i) __builtin_ia32_cvttpd2udq128_mask ((__v2df) __A,
2202 _mm_mask_cvttpd_epu32 (__m128i __W, __mmask8 __U, __m128d __A) {
2203 return (__m128i) __builtin_ia32_cvttpd2udq128_mask ((__v2df) __A,
2209 _mm_maskz_cvttpd_epu32 (__mmask8 __U, __m128d __A) {
2210 return (__m128i) __builtin_ia32_cvttpd2udq128_mask ((__v2df) __A,
2217 _mm256_cvttpd_epu32 (__m256d __A) {
2218 return (__m128i) __builtin_ia32_cvttpd2udq256_mask ((__v4df) __A,
2225 _mm256_mask_cvttpd_epu32 (__m128i __W, __mmask8 __U, __m256d __A) {
2226 return (__m128i) __builtin_ia32_cvttpd2udq256_mask ((__v4df) __A,
2232 _mm256_maskz_cvttpd_epu32 (__mmask8 __U, __m256d __A) {
2233 return (__m128i) __builtin_ia32_cvttpd2udq256_mask ((__v4df) __A,
2240 _mm_mask_cvttps_epi32 (__m128i __W, __mmask8 __U, __m128 __A) {
2242 (__v4si)_mm_cvttps_epi32(__A),
2247 _mm_maskz_cvttps_epi32 (__mmask8 __U, __m128 __A) {
2249 (__v4si)_mm_cvttps_epi32(__A),
2254 _mm256_mask_cvttps_epi32 (__m256i __W, __mmask8 __U, __m256 __A) {
2256 (__v8si)_mm256_cvttps_epi32(__A),
2261 _mm256_maskz_cvttps_epi32 (__mmask8 __U, __m256 __A) {
2263 (__v8si)_mm256_cvttps_epi32(__A),
2268 _mm_cvttps_epu32 (__m128 __A) {
2269 return (__m128i) __builtin_ia32_cvttps2udq128_mask ((__v4sf) __A,
2276 _mm_mask_cvttps_epu32 (__m128i __W, __mmask8 __U, __m128 __A) {
2277 return (__m128i) __builtin_ia32_cvttps2udq128_mask ((__v4sf) __A,
2283 _mm_maskz_cvttps_epu32 (__mmask8 __U, __m128 __A) {
2284 return (__m128i) __builtin_ia32_cvttps2udq128_mask ((__v4sf) __A,
2291 _mm256_cvttps_epu32 (__m256 __A) {
2292 return (__m256i) __builtin_ia32_cvttps2udq256_mask ((__v8sf) __A,
2299 _mm256_mask_cvttps_epu32 (__m256i __W, __mmask8 __U, __m256 __A) {
2300 return (__m256i) __builtin_ia32_cvttps2udq256_mask ((__v8sf) __A,
2306 _mm256_maskz_cvttps_epu32 (__mmask8 __U, __m256 __A) {
2307 return (__m256i) __builtin_ia32_cvttps2udq256_mask ((__v8sf) __A,
2314 _mm_cvtepu32_pd (__m128i __A) {
2316 __builtin_shufflevector((__v4su)__A, (__v4su)__A, 0, 1), __v2df);
2320 _mm_mask_cvtepu32_pd (__m128d __W, __mmask8 __U, __m128i __A) {
2322 (__v2df)_mm_cvtepu32_pd(__A),
2327 _mm_maskz_cvtepu32_pd (__mmask8 __U, __m128i __A) {
2329 (__v2df)_mm_cvtepu32_pd(__A),
2334 _mm256_cvtepu32_pd (__m128i __A) {
2335 return (__m256d)__builtin_convertvector((__v4su)__A, __v4df);
2339 _mm256_mask_cvtepu32_pd (__m256d __W, __mmask8 __U, __m128i __A) {
2341 (__v4df)_mm256_cvtepu32_pd(__A),
2346 _mm256_maskz_cvtepu32_pd (__mmask8 __U, __m128i __A) {
2348 (__v4df)_mm256_cvtepu32_pd(__A),
2353 _mm_cvtepu32_ps (__m128i __A) {
2354 return (__m128)__builtin_convertvector((__v4su)__A, __v4sf);
2358 _mm_mask_cvtepu32_ps (__m128 __W, __mmask8 __U, __m128i __A) {
2360 (__v4sf)_mm_cvtepu32_ps(__A),
2365 _mm_maskz_cvtepu32_ps (__mmask8 __U, __m128i __A) {
2367 (__v4sf)_mm_cvtepu32_ps(__A),
2372 _mm256_cvtepu32_ps (__m256i __A) {
2373 return (__m256)__builtin_convertvector((__v8su)__A, __v8sf);
2377 _mm256_mask_cvtepu32_ps (__m256 __W, __mmask8 __U, __m256i __A) {
2379 (__v8sf)_mm256_cvtepu32_ps(__A),
2384 _mm256_maskz_cvtepu32_ps (__mmask8 __U, __m256i __A) {
2386 (__v8sf)_mm256_cvtepu32_ps(__A),
2391 _mm_mask_div_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) {
2393 (__v2df)_mm_div_pd(__A, __B),
2398 _mm_maskz_div_pd(__mmask8 __U, __m128d __A, __m128d __B) {
2400 (__v2df)_mm_div_pd(__A, __B),
2405 _mm256_mask_div_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) {
2407 (__v4df)_mm256_div_pd(__A, __B),
2412 _mm256_maskz_div_pd(__mmask8 __U, __m256d __A, __m256d __B) {
2414 (__v4df)_mm256_div_pd(__A, __B),
2419 _mm_mask_div_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) {
2421 (__v4sf)_mm_div_ps(__A, __B),
2426 _mm_maskz_div_ps(__mmask8 __U, __m128 __A, __m128 __B) {
2428 (__v4sf)_mm_div_ps(__A, __B),
2433 _mm256_mask_div_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) {
2435 (__v8sf)_mm256_div_ps(__A, __B),
2440 _mm256_maskz_div_ps(__mmask8 __U, __m256 __A, __m256 __B) {
2442 (__v8sf)_mm256_div_ps(__A, __B),
2447 _mm_mask_expand_pd (__m128d __W, __mmask8 __U, __m128d __A) {
2448 return (__m128d) __builtin_ia32_expanddf128_mask ((__v2df) __A,
2454 _mm_maskz_expand_pd (__mmask8 __U, __m128d __A) {
2455 return (__m128d) __builtin_ia32_expanddf128_mask ((__v2df) __A,
2462 _mm256_mask_expand_pd (__m256d __W, __mmask8 __U, __m256d __A) {
2463 return (__m256d) __builtin_ia32_expanddf256_mask ((__v4df) __A,
2469 _mm256_maskz_expand_pd (__mmask8 __U, __m256d __A) {
2470 return (__m256d) __builtin_ia32_expanddf256_mask ((__v4df) __A,
2477 _mm_mask_expand_epi64 (__m128i __W, __mmask8 __U, __m128i __A) {
2478 return (__m128i) __builtin_ia32_expanddi128_mask ((__v2di) __A,
2484 _mm_maskz_expand_epi64 (__mmask8 __U, __m128i __A) {
2485 return (__m128i) __builtin_ia32_expanddi128_mask ((__v2di) __A,
2492 _mm256_mask_expand_epi64 (__m256i __W, __mmask8 __U, __m256i __A) {
2493 return (__m256i) __builtin_ia32_expanddi256_mask ((__v4di) __A,
2499 _mm256_maskz_expand_epi64 (__mmask8 __U, __m256i __A) {
2500 return (__m256i) __builtin_ia32_expanddi256_mask ((__v4di) __A,
2642 _mm_mask_expand_ps (__m128 __W, __mmask8 __U, __m128 __A) {
2643 return (__m128) __builtin_ia32_expandsf128_mask ((__v4sf) __A,
2649 _mm_maskz_expand_ps (__mmask8 __U, __m128 __A) {
2650 return (__m128) __builtin_ia32_expandsf128_mask ((__v4sf) __A,
2657 _mm256_mask_expand_ps (__m256 __W, __mmask8 __U, __m256 __A) {
2658 return (__m256) __builtin_ia32_expandsf256_mask ((__v8sf) __A,
2664 _mm256_maskz_expand_ps (__mmask8 __U, __m256 __A) {
2665 return (__m256) __builtin_ia32_expandsf256_mask ((__v8sf) __A,
2672 _mm_mask_expand_epi32 (__m128i __W, __mmask8 __U, __m128i __A) {
2673 return (__m128i) __builtin_ia32_expandsi128_mask ((__v4si) __A,
2679 _mm_maskz_expand_epi32 (__mmask8 __U, __m128i __A) {
2680 return (__m128i) __builtin_ia32_expandsi128_mask ((__v4si) __A,
2687 _mm256_mask_expand_epi32 (__m256i __W, __mmask8 __U, __m256i __A) {
2688 return (__m256i) __builtin_ia32_expandsi256_mask ((__v8si) __A,
2694 _mm256_maskz_expand_epi32 (__mmask8 __U, __m256i __A) {
2695 return (__m256i) __builtin_ia32_expandsi256_mask ((__v8si) __A,
2702 _mm_getexp_pd (__m128d __A) {
2703 return (__m128d) __builtin_ia32_getexppd128_mask ((__v2df) __A,
2710 _mm_mask_getexp_pd (__m128d __W, __mmask8 __U, __m128d __A) {
2711 return (__m128d) __builtin_ia32_getexppd128_mask ((__v2df) __A,
2717 _mm_maskz_getexp_pd (__mmask8 __U, __m128d __A) {
2718 return (__m128d) __builtin_ia32_getexppd128_mask ((__v2df) __A,
2725 _mm256_getexp_pd (__m256d __A) {
2726 return (__m256d) __builtin_ia32_getexppd256_mask ((__v4df) __A,
2733 _mm256_mask_getexp_pd (__m256d __W, __mmask8 __U, __m256d __A) {
2734 return (__m256d) __builtin_ia32_getexppd256_mask ((__v4df) __A,
2740 _mm256_maskz_getexp_pd (__mmask8 __U, __m256d __A) {
2741 return (__m256d) __builtin_ia32_getexppd256_mask ((__v4df) __A,
2748 _mm_getexp_ps (__m128 __A) {
2749 return (__m128) __builtin_ia32_getexpps128_mask ((__v4sf) __A,
2756 _mm_mask_getexp_ps (__m128 __W, __mmask8 __U, __m128 __A) {
2757 return (__m128) __builtin_ia32_getexpps128_mask ((__v4sf) __A,
2763 _mm_maskz_getexp_ps (__mmask8 __U, __m128 __A) {
2764 return (__m128) __builtin_ia32_getexpps128_mask ((__v4sf) __A,
2771 _mm256_getexp_ps (__m256 __A) {
2772 return (__m256) __builtin_ia32_getexpps256_mask ((__v8sf) __A,
2779 _mm256_mask_getexp_ps (__m256 __W, __mmask8 __U, __m256 __A) {
2780 return (__m256) __builtin_ia32_getexpps256_mask ((__v8sf) __A,
2786 _mm256_maskz_getexp_ps (__mmask8 __U, __m256 __A) {
2787 return (__m256) __builtin_ia32_getexpps256_mask ((__v8sf) __A,
2794 _mm_mask_max_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) {
2796 (__v2df)_mm_max_pd(__A, __B),
2801 _mm_maskz_max_pd(__mmask8 __U, __m128d __A, __m128d __B) {
2803 (__v2df)_mm_max_pd(__A, __B),
2808 _mm256_mask_max_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) {
2810 (__v4df)_mm256_max_pd(__A, __B),
2815 _mm256_maskz_max_pd(__mmask8 __U, __m256d __A, __m256d __B) {
2817 (__v4df)_mm256_max_pd(__A, __B),
2822 _mm_mask_max_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) {
2824 (__v4sf)_mm_max_ps(__A, __B),
2829 _mm_maskz_max_ps(__mmask8 __U, __m128 __A, __m128 __B) {
2831 (__v4sf)_mm_max_ps(__A, __B),
2836 _mm256_mask_max_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) {
2838 (__v8sf)_mm256_max_ps(__A, __B),
2843 _mm256_maskz_max_ps(__mmask8 __U, __m256 __A, __m256 __B) {
2845 (__v8sf)_mm256_max_ps(__A, __B),
2850 _mm_mask_min_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) {
2852 (__v2df)_mm_min_pd(__A, __B),
2857 _mm_maskz_min_pd(__mmask8 __U, __m128d __A, __m128d __B) {
2859 (__v2df)_mm_min_pd(__A, __B),
2864 _mm256_mask_min_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) {
2866 (__v4df)_mm256_min_pd(__A, __B),
2871 _mm256_maskz_min_pd(__mmask8 __U, __m256d __A, __m256d __B) {
2873 (__v4df)_mm256_min_pd(__A, __B),
2878 _mm_mask_min_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) {
2880 (__v4sf)_mm_min_ps(__A, __B),
2885 _mm_maskz_min_ps(__mmask8 __U, __m128 __A, __m128 __B) {
2887 (__v4sf)_mm_min_ps(__A, __B),
2892 _mm256_mask_min_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) {
2894 (__v8sf)_mm256_min_ps(__A, __B),
2899 _mm256_maskz_min_ps(__mmask8 __U, __m256 __A, __m256 __B) {
2901 (__v8sf)_mm256_min_ps(__A, __B),
2906 _mm_mask_mul_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) {
2908 (__v2df)_mm_mul_pd(__A, __B),
2913 _mm_maskz_mul_pd(__mmask8 __U, __m128d __A, __m128d __B) {
2915 (__v2df)_mm_mul_pd(__A, __B),
2920 _mm256_mask_mul_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) {
2922 (__v4df)_mm256_mul_pd(__A, __B),
2927 _mm256_maskz_mul_pd(__mmask8 __U, __m256d __A, __m256d __B) {
2929 (__v4df)_mm256_mul_pd(__A, __B),
2934 _mm_mask_mul_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) {
2936 (__v4sf)_mm_mul_ps(__A, __B),
2941 _mm_maskz_mul_ps(__mmask8 __U, __m128 __A, __m128 __B) {
2943 (__v4sf)_mm_mul_ps(__A, __B),
2948 _mm256_mask_mul_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) {
2950 (__v8sf)_mm256_mul_ps(__A, __B),
2955 _mm256_maskz_mul_ps(__mmask8 __U, __m256 __A, __m256 __B) {
2957 (__v8sf)_mm256_mul_ps(__A, __B),
2962 _mm_mask_abs_epi32(__m128i __W, __mmask8 __U, __m128i __A) {
2964 (__v4si)_mm_abs_epi32(__A),
2969 _mm_maskz_abs_epi32(__mmask8 __U, __m128i __A) {
2971 (__v4si)_mm_abs_epi32(__A),
2976 _mm256_mask_abs_epi32(__m256i __W, __mmask8 __U, __m256i __A) {
2978 (__v8si)_mm256_abs_epi32(__A),
2983 _mm256_maskz_abs_epi32(__mmask8 __U, __m256i __A) {
2985 (__v8si)_mm256_abs_epi32(__A),
2990 _mm_abs_epi64 (__m128i __A) {
2991 return (__m128i)__builtin_elementwise_abs((__v2di)__A);
2995 _mm_mask_abs_epi64 (__m128i __W, __mmask8 __U, __m128i __A) {
2997 (__v2di)_mm_abs_epi64(__A),
3002 _mm_maskz_abs_epi64 (__mmask8 __U, __m128i __A) {
3004 (__v2di)_mm_abs_epi64(__A),
3009 _mm256_abs_epi64 (__m256i __A) {
3010 return (__m256i)__builtin_elementwise_abs((__v4di)__A);
3014 _mm256_mask_abs_epi64 (__m256i __W, __mmask8 __U, __m256i __A) {
3016 (__v4di)_mm256_abs_epi64(__A),
3021 _mm256_maskz_abs_epi64 (__mmask8 __U, __m256i __A) {
3023 (__v4di)_mm256_abs_epi64(__A),
3028 _mm_maskz_max_epi32(__mmask8 __M, __m128i __A, __m128i __B) {
3030 (__v4si)_mm_max_epi32(__A, __B),
3035 _mm_mask_max_epi32(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) {
3037 (__v4si)_mm_max_epi32(__A, __B),
3042 _mm256_maskz_max_epi32(__mmask8 __M, __m256i __A, __m256i __B) {
3044 (__v8si)_mm256_max_epi32(__A, __B),
3049 _mm256_mask_max_epi32(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) {
3051 (__v8si)_mm256_max_epi32(__A, __B),
3056 _mm_max_epi64 (__m128i __A, __m128i __B) {
3057 return (__m128i)__builtin_elementwise_max((__v2di)__A, (__v2di)__B);
3061 _mm_maskz_max_epi64 (__mmask8 __M, __m128i __A, __m128i __B) {
3063 (__v2di)_mm_max_epi64(__A, __B),
3068 _mm_mask_max_epi64 (__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) {
3070 (__v2di)_mm_max_epi64(__A, __B),
3075 _mm256_max_epi64 (__m256i __A, __m256i __B) {
3076 return (__m256i)__builtin_elementwise_max((__v4di)__A, (__v4di)__B);
3080 _mm256_maskz_max_epi64 (__mmask8 __M, __m256i __A, __m256i __B) {
3082 (__v4di)_mm256_max_epi64(__A, __B),
3087 _mm256_mask_max_epi64 (__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) {
3089 (__v4di)_mm256_max_epi64(__A, __B),
3094 _mm_maskz_max_epu32(__mmask8 __M, __m128i __A, __m128i __B) {
3096 (__v4si)_mm_max_epu32(__A, __B),
3101 _mm_mask_max_epu32(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) {
3103 (__v4si)_mm_max_epu32(__A, __B),
3108 _mm256_maskz_max_epu32(__mmask8 __M, __m256i __A, __m256i __B) {
3110 (__v8si)_mm256_max_epu32(__A, __B),
3115 _mm256_mask_max_epu32(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) {
3117 (__v8si)_mm256_max_epu32(__A, __B),
3122 _mm_max_epu64 (__m128i __A, __m128i __B) {
3123 return (__m128i)__builtin_elementwise_max((__v2du)__A, (__v2du)__B);
3127 _mm_maskz_max_epu64 (__mmask8 __M, __m128i __A, __m128i __B) {
3129 (__v2di)_mm_max_epu64(__A, __B),
3134 _mm_mask_max_epu64 (__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) {
3136 (__v2di)_mm_max_epu64(__A, __B),
3141 _mm256_max_epu64 (__m256i __A, __m256i __B) {
3142 return (__m256i)__builtin_elementwise_max((__v4du)__A, (__v4du)__B);
3146 _mm256_maskz_max_epu64 (__mmask8 __M, __m256i __A, __m256i __B) {
3148 (__v4di)_mm256_max_epu64(__A, __B),
3153 _mm256_mask_max_epu64 (__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) {
3155 (__v4di)_mm256_max_epu64(__A, __B),
3160 _mm_maskz_min_epi32(__mmask8 __M, __m128i __A, __m128i __B) {
3162 (__v4si)_mm_min_epi32(__A, __B),
3167 _mm_mask_min_epi32(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) {
3169 (__v4si)_mm_min_epi32(__A, __B),
3174 _mm256_maskz_min_epi32(__mmask8 __M, __m256i __A, __m256i __B) {
3176 (__v8si)_mm256_min_epi32(__A, __B),
3181 _mm256_mask_min_epi32(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) {
3183 (__v8si)_mm256_min_epi32(__A, __B),
3188 _mm_min_epi64 (__m128i __A, __m128i __B) {
3189 return (__m128i)__builtin_elementwise_min((__v2di)__A, (__v2di)__B);
3193 _mm_mask_min_epi64 (__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) {
3195 (__v2di)_mm_min_epi64(__A, __B),
3200 _mm_maskz_min_epi64 (__mmask8 __M, __m128i __A, __m128i __B) {
3202 (__v2di)_mm_min_epi64(__A, __B),
3207 _mm256_min_epi64 (__m256i __A, __m256i __B) {
3208 return (__m256i)__builtin_elementwise_min((__v4di)__A, (__v4di)__B);
3212 _mm256_mask_min_epi64 (__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) {
3214 (__v4di)_mm256_min_epi64(__A, __B),
3219 _mm256_maskz_min_epi64 (__mmask8 __M, __m256i __A, __m256i __B) {
3221 (__v4di)_mm256_min_epi64(__A, __B),
3226 _mm_maskz_min_epu32(__mmask8 __M, __m128i __A, __m128i __B) {
3228 (__v4si)_mm_min_epu32(__A, __B),
3233 _mm_mask_min_epu32(__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) {
3235 (__v4si)_mm_min_epu32(__A, __B),
3240 _mm256_maskz_min_epu32(__mmask8 __M, __m256i __A, __m256i __B) {
3242 (__v8si)_mm256_min_epu32(__A, __B),
3247 _mm256_mask_min_epu32(__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) {
3249 (__v8si)_mm256_min_epu32(__A, __B),
3254 _mm_min_epu64 (__m128i __A, __m128i __B) {
3255 return (__m128i)__builtin_elementwise_min((__v2du)__A, (__v2du)__B);
3259 _mm_mask_min_epu64 (__m128i __W, __mmask8 __M, __m128i __A, __m128i __B) {
3261 (__v2di)_mm_min_epu64(__A, __B),
3266 _mm_maskz_min_epu64 (__mmask8 __M, __m128i __A, __m128i __B) {
3268 (__v2di)_mm_min_epu64(__A, __B),
3273 _mm256_min_epu64 (__m256i __A, __m256i __B) {
3274 return (__m256i)__builtin_elementwise_min((__v4du)__A, (__v4du)__B);
3278 _mm256_mask_min_epu64 (__m256i __W, __mmask8 __M, __m256i __A, __m256i __B) {
3280 (__v4di)_mm256_min_epu64(__A, __B),
3285 _mm256_maskz_min_epu64 (__mmask8 __M, __m256i __A, __m256i __B) {
3287 (__v4di)_mm256_min_epu64(__A, __B),
3366 _mm_scalef_pd (__m128d __A, __m128d __B) {
3367 return (__m128d) __builtin_ia32_scalefpd128_mask ((__v2df) __A,
3375 _mm_mask_scalef_pd (__m128d __W, __mmask8 __U, __m128d __A,
3377 return (__m128d) __builtin_ia32_scalefpd128_mask ((__v2df) __A,
3384 _mm_maskz_scalef_pd (__mmask8 __U, __m128d __A, __m128d __B) {
3385 return (__m128d) __builtin_ia32_scalefpd128_mask ((__v2df) __A,
3393 _mm256_scalef_pd (__m256d __A, __m256d __B) {
3394 return (__m256d) __builtin_ia32_scalefpd256_mask ((__v4df) __A,
3402 _mm256_mask_scalef_pd (__m256d __W, __mmask8 __U, __m256d __A,
3404 return (__m256d) __builtin_ia32_scalefpd256_mask ((__v4df) __A,
3411 _mm256_maskz_scalef_pd (__mmask8 __U, __m256d __A, __m256d __B) {
3412 return (__m256d) __builtin_ia32_scalefpd256_mask ((__v4df) __A,
3420 _mm_scalef_ps (__m128 __A, __m128 __B) {
3421 return (__m128) __builtin_ia32_scalefps128_mask ((__v4sf) __A,
3429 _mm_mask_scalef_ps (__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) {
3430 return (__m128) __builtin_ia32_scalefps128_mask ((__v4sf) __A,
3437 _mm_maskz_scalef_ps (__mmask8 __U, __m128 __A, __m128 __B) {
3438 return (__m128) __builtin_ia32_scalefps128_mask ((__v4sf) __A,
3446 _mm256_scalef_ps (__m256 __A, __m256 __B) {
3447 return (__m256) __builtin_ia32_scalefps256_mask ((__v8sf) __A,
3455 _mm256_mask_scalef_ps (__m256 __W, __mmask8 __U, __m256 __A,
3457 return (__m256) __builtin_ia32_scalefps256_mask ((__v8sf) __A,
3464 _mm256_maskz_scalef_ps (__mmask8 __U, __m256 __A, __m256 __B) {
3465 return (__m256) __builtin_ia32_scalefps256_mask ((__v8sf) __A,
3633 _mm_mask_sqrt_pd(__m128d __W, __mmask8 __U, __m128d __A) {
3635 (__v2df)_mm_sqrt_pd(__A),
3640 _mm_maskz_sqrt_pd(__mmask8 __U, __m128d __A) {
3642 (__v2df)_mm_sqrt_pd(__A),
3647 _mm256_mask_sqrt_pd(__m256d __W, __mmask8 __U, __m256d __A) {
3649 (__v4df)_mm256_sqrt_pd(__A),
3654 _mm256_maskz_sqrt_pd(__mmask8 __U, __m256d __A) {
3656 (__v4df)_mm256_sqrt_pd(__A),
3661 _mm_mask_sqrt_ps(__m128 __W, __mmask8 __U, __m128 __A) {
3663 (__v4sf)_mm_sqrt_ps(__A),
3668 _mm_maskz_sqrt_ps(__mmask8 __U, __m128 __A) {
3670 (__v4sf)_mm_sqrt_ps(__A),
3675 _mm256_mask_sqrt_ps(__m256 __W, __mmask8 __U, __m256 __A) {
3677 (__v8sf)_mm256_sqrt_ps(__A),
3682 _mm256_maskz_sqrt_ps(__mmask8 __U, __m256 __A) {
3684 (__v8sf)_mm256_sqrt_ps(__A),
3689 _mm_mask_sub_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B) {
3691 (__v2df)_mm_sub_pd(__A, __B),
3696 _mm_maskz_sub_pd(__mmask8 __U, __m128d __A, __m128d __B) {
3698 (__v2df)_mm_sub_pd(__A, __B),
3703 _mm256_mask_sub_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B) {
3705 (__v4df)_mm256_sub_pd(__A, __B),
3710 _mm256_maskz_sub_pd(__mmask8 __U, __m256d __A, __m256d __B) {
3712 (__v4df)_mm256_sub_pd(__A, __B),
3717 _mm_mask_sub_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B) {
3719 (__v4sf)_mm_sub_ps(__A, __B),
3724 _mm_maskz_sub_ps(__mmask8 __U, __m128 __A, __m128 __B) {
3726 (__v4sf)_mm_sub_ps(__A, __B),
3731 _mm256_mask_sub_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B) {
3733 (__v8sf)_mm256_sub_ps(__A, __B),
3738 _mm256_maskz_sub_ps(__mmask8 __U, __m256 __A, __m256 __B) {
3740 (__v8sf)_mm256_sub_ps(__A, __B),
3745 _mm_permutex2var_epi32(__m128i __A, __m128i __I, __m128i __B) {
3746 return (__m128i)__builtin_ia32_vpermi2vard128((__v4si) __A, (__v4si)__I,
3751 _mm_mask_permutex2var_epi32(__m128i __A, __mmask8 __U, __m128i __I,
3754 (__v4si)_mm_permutex2var_epi32(__A, __I, __B),
3755 (__v4si)__A);
3759 _mm_mask2_permutex2var_epi32(__m128i __A, __m128i __I, __mmask8 __U,
3762 (__v4si)_mm_permutex2var_epi32(__A, __I, __B),
3767 _mm_maskz_permutex2var_epi32(__mmask8 __U, __m128i __A, __m128i __I,
3770 (__v4si)_mm_permutex2var_epi32(__A, __I, __B),
3775 _mm256_permutex2var_epi32(__m256i __A, __m256i __I, __m256i __B) {
3776 return (__m256i)__builtin_ia32_vpermi2vard256((__v8si)__A, (__v8si) __I,
3781 _mm256_mask_permutex2var_epi32(__m256i __A, __mmask8 __U, __m256i __I,
3784 (__v8si)_mm256_permutex2var_epi32(__A, __I, __B),
3785 (__v8si)__A);
3789 _mm256_mask2_permutex2var_epi32(__m256i __A, __m256i __I, __mmask8 __U,
3792 (__v8si)_mm256_permutex2var_epi32(__A, __I, __B),
3797 _mm256_maskz_permutex2var_epi32(__mmask8 __U, __m256i __A, __m256i __I,
3800 (__v8si)_mm256_permutex2var_epi32(__A, __I, __B),
3805 _mm_permutex2var_pd(__m128d __A, __m128i __I, __m128d __B) {
3806 return (__m128d)__builtin_ia32_vpermi2varpd128((__v2df)__A, (__v2di)__I,
3811 _mm_mask_permutex2var_pd(__m128d __A, __mmask8 __U, __m128i __I, __m128d __B) {
3813 (__v2df)_mm_permutex2var_pd(__A, __I, __B),
3814 (__v2df)__A);
3818 _mm_mask2_permutex2var_pd(__m128d __A, __m128i __I, __mmask8 __U, __m128d __B) {
3820 (__v2df)_mm_permutex2var_pd(__A, __I, __B),
3825 _mm_maskz_permutex2var_pd(__mmask8 __U, __m128d __A, __m128i __I, __m128d __B) {
3827 (__v2df)_mm_permutex2var_pd(__A, __I, __B),
3832 _mm256_permutex2var_pd(__m256d __A, __m256i __I, __m256d __B) {
3833 return (__m256d)__builtin_ia32_vpermi2varpd256((__v4df)__A, (__v4di)__I,
3838 _mm256_mask_permutex2var_pd(__m256d __A, __mmask8 __U, __m256i __I,
3841 (__v4df)_mm256_permutex2var_pd(__A, __I, __B),
3842 (__v4df)__A);
3846 _mm256_mask2_permutex2var_pd(__m256d __A, __m256i __I, __mmask8 __U,
3849 (__v4df)_mm256_permutex2var_pd(__A, __I, __B),
3854 _mm256_maskz_permutex2var_pd(__mmask8 __U, __m256d __A, __m256i __I,
3857 (__v4df)_mm256_permutex2var_pd(__A, __I, __B),
3862 _mm_permutex2var_ps(__m128 __A, __m128i __I, __m128 __B) {
3863 return (__m128)__builtin_ia32_vpermi2varps128((__v4sf)__A, (__v4si)__I,
3868 _mm_mask_permutex2var_ps(__m128 __A, __mmask8 __U, __m128i __I, __m128 __B) {
3870 (__v4sf)_mm_permutex2var_ps(__A, __I, __B),
3871 (__v4sf)__A);
3875 _mm_mask2_permutex2var_ps(__m128 __A, __m128i __I, __mmask8 __U, __m128 __B) {
3877 (__v4sf)_mm_permutex2var_ps(__A, __I, __B),
3882 _mm_maskz_permutex2var_ps(__mmask8 __U, __m128 __A, __m128i __I, __m128 __B) {
3884 (__v4sf)_mm_permutex2var_ps(__A, __I, __B),
3889 _mm256_permutex2var_ps(__m256 __A, __m256i __I, __m256 __B) {
3890 return (__m256)__builtin_ia32_vpermi2varps256((__v8sf)__A, (__v8si)__I,
3895 _mm256_mask_permutex2var_ps(__m256 __A, __mmask8 __U, __m256i __I, __m256 __B) {
3897 (__v8sf)_mm256_permutex2var_ps(__A, __I, __B),
3898 (__v8sf)__A);
3902 _mm256_mask2_permutex2var_ps(__m256 __A, __m256i __I, __mmask8 __U,
3905 (__v8sf)_mm256_permutex2var_ps(__A, __I, __B),
3910 _mm256_maskz_permutex2var_ps(__mmask8 __U, __m256 __A, __m256i __I,
3913 (__v8sf)_mm256_permutex2var_ps(__A, __I, __B),
3918 _mm_permutex2var_epi64(__m128i __A, __m128i __I, __m128i __B) {
3919 return (__m128i)__builtin_ia32_vpermi2varq128((__v2di)__A, (__v2di)__I,
3924 _mm_mask_permutex2var_epi64(__m128i __A, __mmask8 __U, __m128i __I,
3927 (__v2di)_mm_permutex2var_epi64(__A, __I, __B),
3928 (__v2di)__A);
3932 _mm_mask2_permutex2var_epi64(__m128i __A, __m128i __I, __mmask8 __U,
3935 (__v2di)_mm_permutex2var_epi64(__A, __I, __B),
3940 _mm_maskz_permutex2var_epi64(__mmask8 __U, __m128i __A, __m128i __I,
3943 (__v2di)_mm_permutex2var_epi64(__A, __I, __B),
3949 _mm256_permutex2var_epi64(__m256i __A, __m256i __I, __m256i __B) {
3950 return (__m256i)__builtin_ia32_vpermi2varq256((__v4di)__A, (__v4di) __I,
3955 _mm256_mask_permutex2var_epi64(__m256i __A, __mmask8 __U, __m256i __I,
3958 (__v4di)_mm256_permutex2var_epi64(__A, __I, __B),
3959 (__v4di)__A);
3963 _mm256_mask2_permutex2var_epi64(__m256i __A, __m256i __I, __mmask8 __U,
3966 (__v4di)_mm256_permutex2var_epi64(__A, __I, __B),
3971 _mm256_maskz_permutex2var_epi64(__mmask8 __U, __m256i __A, __m256i __I,
3974 (__v4di)_mm256_permutex2var_epi64(__A, __I, __B),
3979 _mm_mask_cvtepi8_epi32(__m128i __W, __mmask8 __U, __m128i __A)
3982 (__v4si)_mm_cvtepi8_epi32(__A),
3987 _mm_maskz_cvtepi8_epi32(__mmask8 __U, __m128i __A)
3990 (__v4si)_mm_cvtepi8_epi32(__A),
3995 _mm256_mask_cvtepi8_epi32 (__m256i __W, __mmask8 __U, __m128i __A)
3998 (__v8si)_mm256_cvtepi8_epi32(__A),
4003 _mm256_maskz_cvtepi8_epi32 (__mmask8 __U, __m128i __A)
4006 (__v8si)_mm256_cvtepi8_epi32(__A),
4011 _mm_mask_cvtepi8_epi64(__m128i __W, __mmask8 __U, __m128i __A)
4014 (__v2di)_mm_cvtepi8_epi64(__A),
4019 _mm_maskz_cvtepi8_epi64(__mmask8 __U, __m128i __A)
4022 (__v2di)_mm_cvtepi8_epi64(__A),
4027 _mm256_mask_cvtepi8_epi64(__m256i __W, __mmask8 __U, __m128i __A)
4030 (__v4di)_mm256_cvtepi8_epi64(__A),
4035 _mm256_maskz_cvtepi8_epi64(__mmask8 __U, __m128i __A)
4038 (__v4di)_mm256_cvtepi8_epi64(__A),
4075 _mm_mask_cvtepi16_epi32(__m128i __W, __mmask8 __U, __m128i __A)
4078 (__v4si)_mm_cvtepi16_epi32(__A),
4083 _mm_maskz_cvtepi16_epi32(__mmask8 __U, __m128i __A)
4086 (__v4si)_mm_cvtepi16_epi32(__A),
4091 _mm256_mask_cvtepi16_epi32(__m256i __W, __mmask8 __U, __m128i __A)
4094 (__v8si)_mm256_cvtepi16_epi32(__A),
4099 _mm256_maskz_cvtepi16_epi32 (__mmask8 __U, __m128i __A)
4102 (__v8si)_mm256_cvtepi16_epi32(__A),
4107 _mm_mask_cvtepi16_epi64(__m128i __W, __mmask8 __U, __m128i __A)
4110 (__v2di)_mm_cvtepi16_epi64(__A),
4115 _mm_maskz_cvtepi16_epi64(__mmask8 __U, __m128i __A)
4118 (__v2di)_mm_cvtepi16_epi64(__A),
4123 _mm256_mask_cvtepi16_epi64(__m256i __W, __mmask8 __U, __m128i __A)
4126 (__v4di)_mm256_cvtepi16_epi64(__A),
4131 _mm256_maskz_cvtepi16_epi64(__mmask8 __U, __m128i __A)
4134 (__v4di)_mm256_cvtepi16_epi64(__A),
4140 _mm_mask_cvtepu8_epi32(__m128i __W, __mmask8 __U, __m128i __A)
4143 (__v4si)_mm_cvtepu8_epi32(__A),
4148 _mm_maskz_cvtepu8_epi32(__mmask8 __U, __m128i __A)
4151 (__v4si)_mm_cvtepu8_epi32(__A),
4156 _mm256_mask_cvtepu8_epi32(__m256i __W, __mmask8 __U, __m128i __A)
4159 (__v8si)_mm256_cvtepu8_epi32(__A),
4164 _mm256_maskz_cvtepu8_epi32(__mmask8 __U, __m128i __A)
4167 (__v8si)_mm256_cvtepu8_epi32(__A),
4172 _mm_mask_cvtepu8_epi64(__m128i __W, __mmask8 __U, __m128i __A)
4175 (__v2di)_mm_cvtepu8_epi64(__A),
4180 _mm_maskz_cvtepu8_epi64(__mmask8 __U, __m128i __A)
4183 (__v2di)_mm_cvtepu8_epi64(__A),
4188 _mm256_mask_cvtepu8_epi64(__m256i __W, __mmask8 __U, __m128i __A)
4191 (__v4di)_mm256_cvtepu8_epi64(__A),
4196 _mm256_maskz_cvtepu8_epi64 (__mmask8 __U, __m128i __A)
4199 (__v4di)_mm256_cvtepu8_epi64(__A),
4236 _mm_mask_cvtepu16_epi32(__m128i __W, __mmask8 __U, __m128i __A)
4239 (__v4si)_mm_cvtepu16_epi32(__A),
4244 _mm_maskz_cvtepu16_epi32(__mmask8 __U, __m128i __A)
4247 (__v4si)_mm_cvtepu16_epi32(__A),
4252 _mm256_mask_cvtepu16_epi32(__m256i __W, __mmask8 __U, __m128i __A)
4255 (__v8si)_mm256_cvtepu16_epi32(__A),
4260 _mm256_maskz_cvtepu16_epi32(__mmask8 __U, __m128i __A)
4263 (__v8si)_mm256_cvtepu16_epi32(__A),
4268 _mm_mask_cvtepu16_epi64(__m128i __W, __mmask8 __U, __m128i __A)
4271 (__v2di)_mm_cvtepu16_epi64(__A),
4276 _mm_maskz_cvtepu16_epi64(__mmask8 __U, __m128i __A)
4279 (__v2di)_mm_cvtepu16_epi64(__A),
4284 _mm256_mask_cvtepu16_epi64(__m256i __W, __mmask8 __U, __m128i __A)
4287 (__v4di)_mm256_cvtepu16_epi64(__A),
4292 _mm256_maskz_cvtepu16_epi64(__mmask8 __U, __m128i __A)
4295 (__v4di)_mm256_cvtepu16_epi64(__A),
4353 _mm_rolv_epi32 (__m128i __A, __m128i __B)
4355 return (__m128i)__builtin_ia32_prolvd128((__v4si)__A, (__v4si)__B);
4359 _mm_mask_rolv_epi32 (__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
4362 (__v4si)_mm_rolv_epi32(__A, __B),
4367 _mm_maskz_rolv_epi32 (__mmask8 __U, __m128i __A, __m128i __B)
4370 (__v4si)_mm_rolv_epi32(__A, __B),
4375 _mm256_rolv_epi32 (__m256i __A, __m256i __B)
4377 return (__m256i)__builtin_ia32_prolvd256((__v8si)__A, (__v8si)__B);
4381 _mm256_mask_rolv_epi32 (__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)
4384 (__v8si)_mm256_rolv_epi32(__A, __B),
4389 _mm256_maskz_rolv_epi32 (__mmask8 __U, __m256i __A, __m256i __B)
4392 (__v8si)_mm256_rolv_epi32(__A, __B),
4397 _mm_rolv_epi64 (__m128i __A, __m128i __B)
4399 return (__m128i)__builtin_ia32_prolvq128((__v2di)__A, (__v2di)__B);
4403 _mm_mask_rolv_epi64 (__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
4406 (__v2di)_mm_rolv_epi64(__A, __B),
4411 _mm_maskz_rolv_epi64 (__mmask8 __U, __m128i __A, __m128i __B)
4414 (__v2di)_mm_rolv_epi64(__A, __B),
4419 _mm256_rolv_epi64 (__m256i __A, __m256i __B)
4421 return (__m256i)__builtin_ia32_prolvq256((__v4di)__A, (__v4di)__B);
4425 _mm256_mask_rolv_epi64 (__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)
4428 (__v4di)_mm256_rolv_epi64(__A, __B),
4433 _mm256_maskz_rolv_epi64 (__mmask8 __U, __m256i __A, __m256i __B)
4436 (__v4di)_mm256_rolv_epi64(__A, __B),
4493 _mm_mask_sll_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
4496 (__v4si)_mm_sll_epi32(__A, __B),
4501 _mm_maskz_sll_epi32(__mmask8 __U, __m128i __A, __m128i __B)
4504 (__v4si)_mm_sll_epi32(__A, __B),
4509 _mm256_mask_sll_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m128i __B)
4512 (__v8si)_mm256_sll_epi32(__A, __B),
4517 _mm256_maskz_sll_epi32(__mmask8 __U, __m256i __A, __m128i __B)
4520 (__v8si)_mm256_sll_epi32(__A, __B),
4525 _mm_mask_slli_epi32(__m128i __W, __mmask8 __U, __m128i __A, unsigned int __B)
4528 (__v4si)_mm_slli_epi32(__A, (int)__B),
4533 _mm_maskz_slli_epi32(__mmask8 __U, __m128i __A, unsigned int __B)
4536 (__v4si)_mm_slli_epi32(__A, (int)__B),
4541 _mm256_mask_slli_epi32(__m256i __W, __mmask8 __U, __m256i __A, unsigned int __B)
4544 (__v8si)_mm256_slli_epi32(__A, (int)__B),
4549 _mm256_maskz_slli_epi32(__mmask8 __U, __m256i __A, unsigned int __B)
4552 (__v8si)_mm256_slli_epi32(__A, (int)__B),
4557 _mm_mask_sll_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
4560 (__v2di)_mm_sll_epi64(__A, __B),
4565 _mm_maskz_sll_epi64(__mmask8 __U, __m128i __A, __m128i __B)
4568 (__v2di)_mm_sll_epi64(__A, __B),
4573 _mm256_mask_sll_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m128i __B)
4576 (__v4di)_mm256_sll_epi64(__A, __B),
4581 _mm256_maskz_sll_epi64(__mmask8 __U, __m256i __A, __m128i __B)
4584 (__v4di)_mm256_sll_epi64(__A, __B),
4589 _mm_mask_slli_epi64(__m128i __W, __mmask8 __U, __m128i __A, unsigned int __B)
4592 (__v2di)_mm_slli_epi64(__A, (int)__B),
4597 _mm_maskz_slli_epi64(__mmask8 __U, __m128i __A, unsigned int __B)
4600 (__v2di)_mm_slli_epi64(__A, (int)__B),
4605 _mm256_mask_slli_epi64(__m256i __W, __mmask8 __U, __m256i __A, unsigned int __B)
4608 (__v4di)_mm256_slli_epi64(__A, (int)__B),
4613 _mm256_maskz_slli_epi64(__mmask8 __U, __m256i __A, unsigned int __B)
4616 (__v4di)_mm256_slli_epi64(__A, (int)__B),
4621 _mm_rorv_epi32 (__m128i __A, __m128i __B)
4623 return (__m128i)__builtin_ia32_prorvd128((__v4si)__A, (__v4si)__B);
4627 _mm_mask_rorv_epi32 (__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
4630 (__v4si)_mm_rorv_epi32(__A, __B),
4635 _mm_maskz_rorv_epi32 (__mmask8 __U, __m128i __A, __m128i __B)
4638 (__v4si)_mm_rorv_epi32(__A, __B),
4643 _mm256_rorv_epi32 (__m256i __A, __m256i __B)
4645 return (__m256i)__builtin_ia32_prorvd256((__v8si)__A, (__v8si)__B);
4649 _mm256_mask_rorv_epi32 (__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)
4652 (__v8si)_mm256_rorv_epi32(__A, __B),
4657 _mm256_maskz_rorv_epi32 (__mmask8 __U, __m256i __A, __m256i __B)
4660 (__v8si)_mm256_rorv_epi32(__A, __B),
4665 _mm_rorv_epi64 (__m128i __A, __m128i __B)
4667 return (__m128i)__builtin_ia32_prorvq128((__v2di)__A, (__v2di)__B);
4671 _mm_mask_rorv_epi64 (__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
4674 (__v2di)_mm_rorv_epi64(__A, __B),
4679 _mm_maskz_rorv_epi64 (__mmask8 __U, __m128i __A, __m128i __B)
4682 (__v2di)_mm_rorv_epi64(__A, __B),
4687 _mm256_rorv_epi64 (__m256i __A, __m256i __B)
4689 return (__m256i)__builtin_ia32_prorvq256((__v4di)__A, (__v4di)__B);
4693 _mm256_mask_rorv_epi64 (__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)
4696 (__v4di)_mm256_rorv_epi64(__A, __B),
4701 _mm256_maskz_rorv_epi64 (__mmask8 __U, __m256i __A, __m256i __B)
4704 (__v4di)_mm256_rorv_epi64(__A, __B),
4837 _mm_mask_srl_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
4840 (__v4si)_mm_srl_epi32(__A, __B),
4845 _mm_maskz_srl_epi32(__mmask8 __U, __m128i __A, __m128i __B)
4848 (__v4si)_mm_srl_epi32(__A, __B),
4853 _mm256_mask_srl_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m128i __B)
4856 (__v8si)_mm256_srl_epi32(__A, __B),
4861 _mm256_maskz_srl_epi32(__mmask8 __U, __m256i __A, __m128i __B)
4864 (__v8si)_mm256_srl_epi32(__A, __B),
4869 _mm_mask_srli_epi32(__m128i __W, __mmask8 __U, __m128i __A, unsigned int __B)
4872 (__v4si)_mm_srli_epi32(__A, (int)__B),
4877 _mm_maskz_srli_epi32(__mmask8 __U, __m128i __A, unsigned int __B)
4880 (__v4si)_mm_srli_epi32(__A, (int)__B),
4885 _mm256_mask_srli_epi32(__m256i __W, __mmask8 __U, __m256i __A, unsigned int __B)
4888 (__v8si)_mm256_srli_epi32(__A, (int)__B),
4893 _mm256_maskz_srli_epi32(__mmask8 __U, __m256i __A, unsigned int __B)
4896 (__v8si)_mm256_srli_epi32(__A, (int)__B),
4901 _mm_mask_srl_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
4904 (__v2di)_mm_srl_epi64(__A, __B),
4909 _mm_maskz_srl_epi64(__mmask8 __U, __m128i __A, __m128i __B)
4912 (__v2di)_mm_srl_epi64(__A, __B),
4917 _mm256_mask_srl_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m128i __B)
4920 (__v4di)_mm256_srl_epi64(__A, __B),
4925 _mm256_maskz_srl_epi64(__mmask8 __U, __m256i __A, __m128i __B)
4928 (__v4di)_mm256_srl_epi64(__A, __B),
4933 _mm_mask_srli_epi64(__m128i __W, __mmask8 __U, __m128i __A, unsigned int __B)
4936 (__v2di)_mm_srli_epi64(__A, (int)__B),
4941 _mm_maskz_srli_epi64(__mmask8 __U, __m128i __A, unsigned int __B)
4944 (__v2di)_mm_srli_epi64(__A, (int)__B),
4949 _mm256_mask_srli_epi64(__m256i __W, __mmask8 __U, __m256i __A, unsigned int __B)
4952 (__v4di)_mm256_srli_epi64(__A, (int)__B),
4957 _mm256_maskz_srli_epi64(__mmask8 __U, __m256i __A, unsigned int __B)
4960 (__v4di)_mm256_srli_epi64(__A, (int)__B),
5041 _mm_mask_mov_epi32 (__m128i __W, __mmask8 __U, __m128i __A)
5044 (__v4si) __A,
5049 _mm_maskz_mov_epi32 (__mmask8 __U, __m128i __A)
5052 (__v4si) __A,
5058 _mm256_mask_mov_epi32 (__m256i __W, __mmask8 __U, __m256i __A)
5061 (__v8si) __A,
5066 _mm256_maskz_mov_epi32 (__mmask8 __U, __m256i __A)
5069 (__v8si) __A,
5124 _mm_store_epi32 (void *__P, __m128i __A)
5126 *(__m128i *) __P = __A;
5130 _mm_mask_store_epi32 (void *__P, __mmask8 __U, __m128i __A)
5133 (__v4si) __A,
5138 _mm256_store_epi32 (void *__P, __m256i __A)
5140 *(__m256i *) __P = __A;
5144 _mm256_mask_store_epi32 (void *__P, __mmask8 __U, __m256i __A)
5147 (__v8si) __A,
5152 _mm_mask_mov_epi64 (__m128i __W, __mmask8 __U, __m128i __A)
5155 (__v2di) __A,
5160 _mm_maskz_mov_epi64 (__mmask8 __U, __m128i __A)
5163 (__v2di) __A,
5168 _mm256_mask_mov_epi64 (__m256i __W, __mmask8 __U, __m256i __A)
5171 (__v4di) __A,
5176 _mm256_maskz_mov_epi64 (__mmask8 __U, __m256i __A)
5179 (__v4di) __A,
5234 _mm_store_epi64 (void *__P, __m128i __A)
5236 *(__m128i *) __P = __A;
5240 _mm_mask_store_epi64 (void *__P, __mmask8 __U, __m128i __A)
5243 (__v2di) __A,
5248 _mm256_store_epi64 (void *__P, __m256i __A)
5250 *(__m256i *) __P = __A;
5254 _mm256_mask_store_epi64 (void *__P, __mmask8 __U, __m256i __A)
5257 (__v4di) __A,
5262 _mm_mask_movedup_pd (__m128d __W, __mmask8 __U, __m128d __A)
5265 (__v2df)_mm_movedup_pd(__A),
5270 _mm_maskz_movedup_pd (__mmask8 __U, __m128d __A)
5273 (__v2df)_mm_movedup_pd(__A),
5278 _mm256_mask_movedup_pd (__m256d __W, __mmask8 __U, __m256d __A)
5281 (__v4df)_mm256_movedup_pd(__A),
5286 _mm256_maskz_movedup_pd (__mmask8 __U, __m256d __A)
5289 (__v4df)_mm256_movedup_pd(__A),
5294 _mm_mask_set1_epi32(__m128i __O, __mmask8 __M, int __A)
5297 (__v4si) _mm_set1_epi32(__A),
5302 _mm_maskz_set1_epi32( __mmask8 __M, int __A)
5305 (__v4si) _mm_set1_epi32(__A),
5310 _mm256_mask_set1_epi32(__m256i __O, __mmask8 __M, int __A)
5313 (__v8si) _mm256_set1_epi32(__A),
5318 _mm256_maskz_set1_epi32( __mmask8 __M, int __A)
5321 (__v8si) _mm256_set1_epi32(__A),
5327 _mm_mask_set1_epi64 (__m128i __O, __mmask8 __M, long long __A)
5330 (__v2di) _mm_set1_epi64x(__A),
5335 _mm_maskz_set1_epi64 (__mmask8 __M, long long __A)
5338 (__v2di) _mm_set1_epi64x(__A),
5343 _mm256_mask_set1_epi64 (__m256i __O, __mmask8 __M, long long __A)
5346 (__v4di) _mm256_set1_epi64x(__A),
5351 _mm256_maskz_set1_epi64 (__mmask8 __M, long long __A)
5354 (__v4di) _mm256_set1_epi64x(__A),
5671 _mm_mask_store_pd (void *__P, __mmask8 __U, __m128d __A)
5674 (__v2df) __A,
5679 _mm256_mask_store_pd (void *__P, __mmask8 __U, __m256d __A)
5682 (__v4df) __A,
5687 _mm_mask_store_ps (void *__P, __mmask8 __U, __m128 __A)
5690 (__v4sf) __A,
5695 _mm256_mask_store_ps (void *__P, __mmask8 __U, __m256 __A)
5698 (__v8sf) __A,
5703 _mm_storeu_epi64 (void *__P, __m128i __A)
5708 ((struct __storeu_epi64*)__P)->__v = __A;
5712 _mm_mask_storeu_epi64 (void *__P, __mmask8 __U, __m128i __A)
5715 (__v2di) __A,
5720 _mm256_storeu_epi64 (void *__P, __m256i __A)
5725 ((struct __storeu_epi64*)__P)->__v = __A;
5729 _mm256_mask_storeu_epi64 (void *__P, __mmask8 __U, __m256i __A)
5732 (__v4di) __A,
5737 _mm_storeu_epi32 (void *__P, __m128i __A)
5742 ((struct __storeu_epi32*)__P)->__v = __A;
5746 _mm_mask_storeu_epi32 (void *__P, __mmask8 __U, __m128i __A)
5749 (__v4si) __A,
5754 _mm256_storeu_epi32 (void *__P, __m256i __A)
5759 ((struct __storeu_epi32*)__P)->__v = __A;
5763 _mm256_mask_storeu_epi32 (void *__P, __mmask8 __U, __m256i __A)
5766 (__v8si) __A,
5771 _mm_mask_storeu_pd (void *__P, __mmask8 __U, __m128d __A)
5774 (__v2df) __A,
5779 _mm256_mask_storeu_pd (void *__P, __mmask8 __U, __m256d __A)
5782 (__v4df) __A,
5787 _mm_mask_storeu_ps (void *__P, __mmask8 __U, __m128 __A)
5790 (__v4sf) __A,
5795 _mm256_mask_storeu_ps (void *__P, __mmask8 __U, __m256 __A)
5798 (__v8sf) __A,
5804 _mm_mask_unpackhi_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B)
5807 (__v2df)_mm_unpackhi_pd(__A, __B),
5812 _mm_maskz_unpackhi_pd(__mmask8 __U, __m128d __A, __m128d __B)
5815 (__v2df)_mm_unpackhi_pd(__A, __B),
5820 _mm256_mask_unpackhi_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B)
5823 (__v4df)_mm256_unpackhi_pd(__A, __B),
5828 _mm256_maskz_unpackhi_pd(__mmask8 __U, __m256d __A, __m256d __B)
5831 (__v4df)_mm256_unpackhi_pd(__A, __B),
5836 _mm_mask_unpackhi_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B)
5839 (__v4sf)_mm_unpackhi_ps(__A, __B),
5844 _mm_maskz_unpackhi_ps(__mmask8 __U, __m128 __A, __m128 __B)
5847 (__v4sf)_mm_unpackhi_ps(__A, __B),
5852 _mm256_mask_unpackhi_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B)
5855 (__v8sf)_mm256_unpackhi_ps(__A, __B),
5860 _mm256_maskz_unpackhi_ps(__mmask8 __U, __m256 __A, __m256 __B)
5863 (__v8sf)_mm256_unpackhi_ps(__A, __B),
5868 _mm_mask_unpacklo_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128d __B)
5871 (__v2df)_mm_unpacklo_pd(__A, __B),
5876 _mm_maskz_unpacklo_pd(__mmask8 __U, __m128d __A, __m128d __B)
5879 (__v2df)_mm_unpacklo_pd(__A, __B),
5884 _mm256_mask_unpacklo_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256d __B)
5887 (__v4df)_mm256_unpacklo_pd(__A, __B),
5892 _mm256_maskz_unpacklo_pd(__mmask8 __U, __m256d __A, __m256d __B)
5895 (__v4df)_mm256_unpacklo_pd(__A, __B),
5900 _mm_mask_unpacklo_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128 __B)
5903 (__v4sf)_mm_unpacklo_ps(__A, __B),
5908 _mm_maskz_unpacklo_ps(__mmask8 __U, __m128 __A, __m128 __B)
5911 (__v4sf)_mm_unpacklo_ps(__A, __B),
5916 _mm256_mask_unpacklo_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256 __B)
5919 (__v8sf)_mm256_unpacklo_ps(__A, __B),
5924 _mm256_maskz_unpacklo_ps(__mmask8 __U, __m256 __A, __m256 __B)
5927 (__v8sf)_mm256_unpacklo_ps(__A, __B),
5932 _mm_rcp14_pd (__m128d __A)
5934 return (__m128d) __builtin_ia32_rcp14pd128_mask ((__v2df) __A,
5941 _mm_mask_rcp14_pd (__m128d __W, __mmask8 __U, __m128d __A)
5943 return (__m128d) __builtin_ia32_rcp14pd128_mask ((__v2df) __A,
5949 _mm_maskz_rcp14_pd (__mmask8 __U, __m128d __A)
5951 return (__m128d) __builtin_ia32_rcp14pd128_mask ((__v2df) __A,
5958 _mm256_rcp14_pd (__m256d __A)
5960 return (__m256d) __builtin_ia32_rcp14pd256_mask ((__v4df) __A,
5967 _mm256_mask_rcp14_pd (__m256d __W, __mmask8 __U, __m256d __A)
5969 return (__m256d) __builtin_ia32_rcp14pd256_mask ((__v4df) __A,
5975 _mm256_maskz_rcp14_pd (__mmask8 __U, __m256d __A)
5977 return (__m256d) __builtin_ia32_rcp14pd256_mask ((__v4df) __A,
5984 _mm_rcp14_ps (__m128 __A)
5986 return (__m128) __builtin_ia32_rcp14ps128_mask ((__v4sf) __A,
5993 _mm_mask_rcp14_ps (__m128 __W, __mmask8 __U, __m128 __A)
5995 return (__m128) __builtin_ia32_rcp14ps128_mask ((__v4sf) __A,
6001 _mm_maskz_rcp14_ps (__mmask8 __U, __m128 __A)
6003 return (__m128) __builtin_ia32_rcp14ps128_mask ((__v4sf) __A,
6010 _mm256_rcp14_ps (__m256 __A)
6012 return (__m256) __builtin_ia32_rcp14ps256_mask ((__v8sf) __A,
6019 _mm256_mask_rcp14_ps (__m256 __W, __mmask8 __U, __m256 __A)
6021 return (__m256) __builtin_ia32_rcp14ps256_mask ((__v8sf) __A,
6027 _mm256_maskz_rcp14_ps (__mmask8 __U, __m256 __A)
6029 return (__m256) __builtin_ia32_rcp14ps256_mask ((__v8sf) __A,
6076 _mm_mask_permutevar_pd(__m128d __W, __mmask8 __U, __m128d __A, __m128i __C)
6079 (__v2df)_mm_permutevar_pd(__A, __C),
6084 _mm_maskz_permutevar_pd(__mmask8 __U, __m128d __A, __m128i __C)
6087 (__v2df)_mm_permutevar_pd(__A, __C),
6092 _mm256_mask_permutevar_pd(__m256d __W, __mmask8 __U, __m256d __A, __m256i __C)
6095 (__v4df)_mm256_permutevar_pd(__A, __C),
6100 _mm256_maskz_permutevar_pd(__mmask8 __U, __m256d __A, __m256i __C)
6103 (__v4df)_mm256_permutevar_pd(__A, __C),
6108 _mm_mask_permutevar_ps(__m128 __W, __mmask8 __U, __m128 __A, __m128i __C)
6111 (__v4sf)_mm_permutevar_ps(__A, __C),
6116 _mm_maskz_permutevar_ps(__mmask8 __U, __m128 __A, __m128i __C)
6119 (__v4sf)_mm_permutevar_ps(__A, __C),
6124 _mm256_mask_permutevar_ps(__m256 __W, __mmask8 __U, __m256 __A, __m256i __C)
6127 (__v8sf)_mm256_permutevar_ps(__A, __C),
6132 _mm256_maskz_permutevar_ps(__mmask8 __U, __m256 __A, __m256i __C)
6135 (__v8sf)_mm256_permutevar_ps(__A, __C),
6140 _mm_test_epi32_mask (__m128i __A, __m128i __B)
6142 return _mm_cmpneq_epi32_mask (_mm_and_si128 (__A, __B), _mm_setzero_si128());
6146 _mm_mask_test_epi32_mask (__mmask8 __U, __m128i __A, __m128i __B)
6148 return _mm_mask_cmpneq_epi32_mask (__U, _mm_and_si128 (__A, __B),
6153 _mm256_test_epi32_mask (__m256i __A, __m256i __B)
6155 return _mm256_cmpneq_epi32_mask (_mm256_and_si256 (__A, __B),
6160 _mm256_mask_test_epi32_mask (__mmask8 __U, __m256i __A, __m256i __B)
6162 return _mm256_mask_cmpneq_epi32_mask (__U, _mm256_and_si256 (__A, __B),
6167 _mm_test_epi64_mask (__m128i __A, __m128i __B)
6169 return _mm_cmpneq_epi64_mask (_mm_and_si128 (__A, __B), _mm_setzero_si128());
6173 _mm_mask_test_epi64_mask (__mmask8 __U, __m128i __A, __m128i __B)
6175 return _mm_mask_cmpneq_epi64_mask (__U, _mm_and_si128 (__A, __B),
6180 _mm256_test_epi64_mask (__m256i __A, __m256i __B)
6182 return _mm256_cmpneq_epi64_mask (_mm256_and_si256 (__A, __B),
6187 _mm256_mask_test_epi64_mask (__mmask8 __U, __m256i __A, __m256i __B)
6189 return _mm256_mask_cmpneq_epi64_mask (__U, _mm256_and_si256 (__A, __B),
6194 _mm_testn_epi32_mask (__m128i __A, __m128i __B)
6196 return _mm_cmpeq_epi32_mask (_mm_and_si128 (__A, __B), _mm_setzero_si128());
6200 _mm_mask_testn_epi32_mask (__mmask8 __U, __m128i __A, __m128i __B)
6202 return _mm_mask_cmpeq_epi32_mask (__U, _mm_and_si128 (__A, __B),
6207 _mm256_testn_epi32_mask (__m256i __A, __m256i __B)
6209 return _mm256_cmpeq_epi32_mask (_mm256_and_si256 (__A, __B),
6214 _mm256_mask_testn_epi32_mask (__mmask8 __U, __m256i __A, __m256i __B)
6216 return _mm256_mask_cmpeq_epi32_mask (__U, _mm256_and_si256 (__A, __B),
6221 _mm_testn_epi64_mask (__m128i __A, __m128i __B)
6223 return _mm_cmpeq_epi64_mask (_mm_and_si128 (__A, __B), _mm_setzero_si128());
6227 _mm_mask_testn_epi64_mask (__mmask8 __U, __m128i __A, __m128i __B)
6229 return _mm_mask_cmpeq_epi64_mask (__U, _mm_and_si128 (__A, __B),
6234 _mm256_testn_epi64_mask (__m256i __A, __m256i __B)
6236 return _mm256_cmpeq_epi64_mask (_mm256_and_si256 (__A, __B),
6241 _mm256_mask_testn_epi64_mask (__mmask8 __U, __m256i __A, __m256i __B)
6243 return _mm256_mask_cmpeq_epi64_mask (__U, _mm256_and_si256 (__A, __B),
6248 _mm_mask_unpackhi_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
6251 (__v4si)_mm_unpackhi_epi32(__A, __B),
6256 _mm_maskz_unpackhi_epi32(__mmask8 __U, __m128i __A, __m128i __B)
6259 (__v4si)_mm_unpackhi_epi32(__A, __B),
6264 _mm256_mask_unpackhi_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)
6267 (__v8si)_mm256_unpackhi_epi32(__A, __B),
6272 _mm256_maskz_unpackhi_epi32(__mmask8 __U, __m256i __A, __m256i __B)
6275 (__v8si)_mm256_unpackhi_epi32(__A, __B),
6280 _mm_mask_unpackhi_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
6283 (__v2di)_mm_unpackhi_epi64(__A, __B),
6288 _mm_maskz_unpackhi_epi64(__mmask8 __U, __m128i __A, __m128i __B)
6291 (__v2di)_mm_unpackhi_epi64(__A, __B),
6296 _mm256_mask_unpackhi_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)
6299 (__v4di)_mm256_unpackhi_epi64(__A, __B),
6304 _mm256_maskz_unpackhi_epi64(__mmask8 __U, __m256i __A, __m256i __B)
6307 (__v4di)_mm256_unpackhi_epi64(__A, __B),
6312 _mm_mask_unpacklo_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
6315 (__v4si)_mm_unpacklo_epi32(__A, __B),
6320 _mm_maskz_unpacklo_epi32(__mmask8 __U, __m128i __A, __m128i __B)
6323 (__v4si)_mm_unpacklo_epi32(__A, __B),
6328 _mm256_mask_unpacklo_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)
6331 (__v8si)_mm256_unpacklo_epi32(__A, __B),
6336 _mm256_maskz_unpacklo_epi32(__mmask8 __U, __m256i __A, __m256i __B)
6339 (__v8si)_mm256_unpacklo_epi32(__A, __B),
6344 _mm_mask_unpacklo_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
6347 (__v2di)_mm_unpacklo_epi64(__A, __B),
6352 _mm_maskz_unpacklo_epi64(__mmask8 __U, __m128i __A, __m128i __B)
6355 (__v2di)_mm_unpacklo_epi64(__A, __B),
6360 _mm256_mask_unpacklo_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m256i __B)
6363 (__v4di)_mm256_unpacklo_epi64(__A, __B),
6368 _mm256_maskz_unpacklo_epi64(__mmask8 __U, __m256i __A, __m256i __B)
6371 (__v4di)_mm256_unpacklo_epi64(__A, __B),
6376 _mm_mask_sra_epi32(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
6379 (__v4si)_mm_sra_epi32(__A, __B),
6384 _mm_maskz_sra_epi32(__mmask8 __U, __m128i __A, __m128i __B)
6387 (__v4si)_mm_sra_epi32(__A, __B),
6392 _mm256_mask_sra_epi32(__m256i __W, __mmask8 __U, __m256i __A, __m128i __B)
6395 (__v8si)_mm256_sra_epi32(__A, __B),
6400 _mm256_maskz_sra_epi32(__mmask8 __U, __m256i __A, __m128i __B)
6403 (__v8si)_mm256_sra_epi32(__A, __B),
6408 _mm_mask_srai_epi32(__m128i __W, __mmask8 __U, __m128i __A, unsigned int __B)
6411 (__v4si)_mm_srai_epi32(__A, (int)__B),
6416 _mm_maskz_srai_epi32(__mmask8 __U, __m128i __A, unsigned int __B)
6419 (__v4si)_mm_srai_epi32(__A, (int)__B),
6424 _mm256_mask_srai_epi32(__m256i __W, __mmask8 __U, __m256i __A, unsigned int __B)
6427 (__v8si)_mm256_srai_epi32(__A, (int)__B),
6432 _mm256_maskz_srai_epi32(__mmask8 __U, __m256i __A, unsigned int __B)
6435 (__v8si)_mm256_srai_epi32(__A, (int)__B),
6440 _mm_sra_epi64(__m128i __A, __m128i __B)
6442 return (__m128i)__builtin_ia32_psraq128((__v2di)__A, (__v2di)__B);
6446 _mm_mask_sra_epi64(__m128i __W, __mmask8 __U, __m128i __A, __m128i __B)
6449 (__v2di)_mm_sra_epi64(__A, __B), \
6454 _mm_maskz_sra_epi64(__mmask8 __U, __m128i __A, __m128i __B)
6457 (__v2di)_mm_sra_epi64(__A, __B), \
6462 _mm256_sra_epi64(__m256i __A, __m128i __B)
6464 return (__m256i)__builtin_ia32_psraq256((__v4di) __A, (__v2di) __B);
6468 _mm256_mask_sra_epi64(__m256i __W, __mmask8 __U, __m256i __A, __m128i __B)
6471 (__v4di)_mm256_sra_epi64(__A, __B), \
6476 _mm256_maskz_sra_epi64(__mmask8 __U, __m256i __A, __m128i __B)
6479 (__v4di)_mm256_sra_epi64(__A, __B), \
6484 _mm_srai_epi64(__m128i __A, unsigned int __imm)
6486 return (__m128i)__builtin_ia32_psraqi128((__v2di)__A, (int)__imm);
6490 _mm_mask_srai_epi64(__m128i __W, __mmask8 __U, __m128i __A, unsigned int __imm)
6493 (__v2di)_mm_srai_epi64(__A, __imm), \
6498 _mm_maskz_srai_epi64(__mmask8 __U, __m128i __A, unsigned int __imm)
6501 (__v2di)_mm_srai_epi64(__A, __imm), \
6506 _mm256_srai_epi64(__m256i __A, unsigned int __imm)
6508 return (__m256i)__builtin_ia32_psraqi256((__v4di)__A, (int)__imm);
6512 _mm256_mask_srai_epi64(__m256i __W, __mmask8 __U, __m256i __A,
6516 (__v4di)_mm256_srai_epi64(__A, __imm), \
6521 _mm256_maskz_srai_epi64(__mmask8 __U, __m256i __A, unsigned int __imm)
6524 (__v4di)_mm256_srai_epi64(__A, __imm), \
6686 _mm_rsqrt14_pd (__m128d __A)
6688 return (__m128d) __builtin_ia32_rsqrt14pd128_mask ((__v2df) __A,
6695 _mm_mask_rsqrt14_pd (__m128d __W, __mmask8 __U, __m128d __A)
6697 return (__m128d) __builtin_ia32_rsqrt14pd128_mask ((__v2df) __A,
6703 _mm_maskz_rsqrt14_pd (__mmask8 __U, __m128d __A)
6705 return (__m128d) __builtin_ia32_rsqrt14pd128_mask ((__v2df) __A,
6712 _mm256_rsqrt14_pd (__m256d __A)
6714 return (__m256d) __builtin_ia32_rsqrt14pd256_mask ((__v4df) __A,
6721 _mm256_mask_rsqrt14_pd (__m256d __W, __mmask8 __U, __m256d __A)
6723 return (__m256d) __builtin_ia32_rsqrt14pd256_mask ((__v4df) __A,
6729 _mm256_maskz_rsqrt14_pd (__mmask8 __U, __m256d __A)
6731 return (__m256d) __builtin_ia32_rsqrt14pd256_mask ((__v4df) __A,
6738 _mm_rsqrt14_ps (__m128 __A)
6740 return (__m128) __builtin_ia32_rsqrt14ps128_mask ((__v4sf) __A,
6747 _mm_mask_rsqrt14_ps (__m128 __W, __mmask8 __U, __m128 __A)
6749 return (__m128) __builtin_ia32_rsqrt14ps128_mask ((__v4sf) __A,
6755 _mm_maskz_rsqrt14_ps (__mmask8 __U, __m128 __A)
6757 return (__m128) __builtin_ia32_rsqrt14ps128_mask ((__v4sf) __A,
6764 _mm256_rsqrt14_ps (__m256 __A)
6766 return (__m256) __builtin_ia32_rsqrt14ps256_mask ((__v8sf) __A,
6773 _mm256_mask_rsqrt14_ps (__m256 __W, __mmask8 __U, __m256 __A)
6775 return (__m256) __builtin_ia32_rsqrt14ps256_mask ((__v8sf) __A,
6781 _mm256_maskz_rsqrt14_ps (__mmask8 __U, __m256 __A)
6783 return (__m256) __builtin_ia32_rsqrt14ps256_mask ((__v8sf) __A,
6790 _mm256_broadcast_f32x4(__m128 __A)
6792 return (__m256)__builtin_shufflevector((__v4sf)__A, (__v4sf)__A,
6797 _mm256_mask_broadcast_f32x4(__m256 __O, __mmask8 __M, __m128 __A)
6800 (__v8sf)_mm256_broadcast_f32x4(__A),
6805 _mm256_maskz_broadcast_f32x4 (__mmask8 __M, __m128 __A)
6808 (__v8sf)_mm256_broadcast_f32x4(__A),
6813 _mm256_broadcast_i32x4(__m128i __A)
6815 return (__m256i)__builtin_shufflevector((__v4si)__A, (__v4si)__A,
6820 _mm256_mask_broadcast_i32x4(__m256i __O, __mmask8 __M, __m128i __A)
6823 (__v8si)_mm256_broadcast_i32x4(__A),
6828 _mm256_maskz_broadcast_i32x4(__mmask8 __M, __m128i __A)
6831 (__v8si)_mm256_broadcast_i32x4(__A),
6836 _mm256_mask_broadcastsd_pd (__m256d __O, __mmask8 __M, __m128d __A)
6839 (__v4df) _mm256_broadcastsd_pd(__A),
6844 _mm256_maskz_broadcastsd_pd (__mmask8 __M, __m128d __A)
6847 (__v4df) _mm256_broadcastsd_pd(__A),
6852 _mm_mask_broadcastss_ps (__m128 __O, __mmask8 __M, __m128 __A)
6855 (__v4sf) _mm_broadcastss_ps(__A),
6860 _mm_maskz_broadcastss_ps (__mmask8 __M, __m128 __A)
6863 (__v4sf) _mm_broadcastss_ps(__A),
6868 _mm256_mask_broadcastss_ps (__m256 __O, __mmask8 __M, __m128 __A)
6871 (__v8sf) _mm256_broadcastss_ps(__A),
6876 _mm256_maskz_broadcastss_ps (__mmask8 __M, __m128 __A)
6879 (__v8sf) _mm256_broadcastss_ps(__A),
6884 _mm_mask_broadcastd_epi32 (__m128i __O, __mmask8 __M, __m128i __A)
6887 (__v4si) _mm_broadcastd_epi32(__A),
6892 _mm_maskz_broadcastd_epi32 (__mmask8 __M, __m128i __A)
6895 (__v4si) _mm_broadcastd_epi32(__A),
6900 _mm256_mask_broadcastd_epi32 (__m256i __O, __mmask8 __M, __m128i __A)
6903 (__v8si) _mm256_broadcastd_epi32(__A),
6908 _mm256_maskz_broadcastd_epi32 (__mmask8 __M, __m128i __A)
6911 (__v8si) _mm256_broadcastd_epi32(__A),
6916 _mm_mask_broadcastq_epi64 (__m128i __O, __mmask8 __M, __m128i __A)
6919 (__v2di) _mm_broadcastq_epi64(__A),
6924 _mm_maskz_broadcastq_epi64 (__mmask8 __M, __m128i __A)
6927 (__v2di) _mm_broadcastq_epi64(__A),
6932 _mm256_mask_broadcastq_epi64 (__m256i __O, __mmask8 __M, __m128i __A)
6935 (__v4di) _mm256_broadcastq_epi64(__A),
6940 _mm256_maskz_broadcastq_epi64 (__mmask8 __M, __m128i __A)
6943 (__v4di) _mm256_broadcastq_epi64(__A),
6948 _mm_cvtsepi32_epi8 (__m128i __A)
6950 return (__m128i) __builtin_ia32_pmovsdb128_mask ((__v4si) __A,
6956 _mm_mask_cvtsepi32_epi8 (__m128i __O, __mmask8 __M, __m128i __A)
6958 return (__m128i) __builtin_ia32_pmovsdb128_mask ((__v4si) __A,
6963 _mm_maskz_cvtsepi32_epi8 (__mmask8 __M, __m128i __A)
6965 return (__m128i) __builtin_ia32_pmovsdb128_mask ((__v4si) __A,
6971 _mm_mask_cvtsepi32_storeu_epi8 (void * __P, __mmask8 __M, __m128i __A)
6973 __builtin_ia32_pmovsdb128mem_mask ((__v16qi *) __P, (__v4si) __A, __M);
6977 _mm256_cvtsepi32_epi8 (__m256i __A)
6979 return (__m128i) __builtin_ia32_pmovsdb256_mask ((__v8si) __A,
6985 _mm256_mask_cvtsepi32_epi8 (__m128i __O, __mmask8 __M, __m256i __A)
6987 return (__m128i) __builtin_ia32_pmovsdb256_mask ((__v8si) __A,
6992 _mm256_maskz_cvtsepi32_epi8 (__mmask8 __M, __m256i __A)
6994 return (__m128i) __builtin_ia32_pmovsdb256_mask ((__v8si) __A,
7000 _mm256_mask_cvtsepi32_storeu_epi8 (void * __P, __mmask8 __M, __m256i __A)
7002 __builtin_ia32_pmovsdb256mem_mask ((__v16qi *) __P, (__v8si) __A, __M);
7006 _mm_cvtsepi32_epi16 (__m128i __A)
7008 return (__m128i) __builtin_ia32_pmovsdw128_mask ((__v4si) __A,
7014 _mm_mask_cvtsepi32_epi16 (__m128i __O, __mmask8 __M, __m128i __A)
7016 return (__m128i) __builtin_ia32_pmovsdw128_mask ((__v4si) __A,
7022 _mm_maskz_cvtsepi32_epi16 (__mmask8 __M, __m128i __A)
7024 return (__m128i) __builtin_ia32_pmovsdw128_mask ((__v4si) __A,
7030 _mm_mask_cvtsepi32_storeu_epi16 (void * __P, __mmask8 __M, __m128i __A)
7032 __builtin_ia32_pmovsdw128mem_mask ((__v8hi *) __P, (__v4si) __A, __M);
7036 _mm256_cvtsepi32_epi16 (__m256i __A)
7038 return (__m128i) __builtin_ia32_pmovsdw256_mask ((__v8si) __A,
7044 _mm256_mask_cvtsepi32_epi16 (__m128i __O, __mmask8 __M, __m256i __A)
7046 return (__m128i) __builtin_ia32_pmovsdw256_mask ((__v8si) __A,
7051 _mm256_maskz_cvtsepi32_epi16 (__mmask8 __M, __m256i __A)
7053 return (__m128i) __builtin_ia32_pmovsdw256_mask ((__v8si) __A,
7059 _mm256_mask_cvtsepi32_storeu_epi16 (void * __P, __mmask8 __M, __m256i __A)
7061 __builtin_ia32_pmovsdw256mem_mask ((__v8hi *) __P, (__v8si) __A, __M);
7065 _mm_cvtsepi64_epi8 (__m128i __A)
7067 return (__m128i) __builtin_ia32_pmovsqb128_mask ((__v2di) __A,
7073 _mm_mask_cvtsepi64_epi8 (__m128i __O, __mmask8 __M, __m128i __A)
7075 return (__m128i) __builtin_ia32_pmovsqb128_mask ((__v2di) __A,
7080 _mm_maskz_cvtsepi64_epi8 (__mmask8 __M, __m128i __A)
7082 return (__m128i) __builtin_ia32_pmovsqb128_mask ((__v2di) __A,
7088 _mm_mask_cvtsepi64_storeu_epi8 (void * __P, __mmask8 __M, __m128i __A)
7090 __builtin_ia32_pmovsqb128mem_mask ((__v16qi *) __P, (__v2di) __A, __M);
7094 _mm256_cvtsepi64_epi8 (__m256i __A)
7096 return (__m128i) __builtin_ia32_pmovsqb256_mask ((__v4di) __A,
7102 _mm256_mask_cvtsepi64_epi8 (__m128i __O, __mmask8 __M, __m256i __A)
7104 return (__m128i) __builtin_ia32_pmovsqb256_mask ((__v4di) __A,
7109 _mm256_maskz_cvtsepi64_epi8 (__mmask8 __M, __m256i __A)
7111 return (__m128i) __builtin_ia32_pmovsqb256_mask ((__v4di) __A,
7117 _mm256_mask_cvtsepi64_storeu_epi8 (void * __P, __mmask8 __M, __m256i __A)
7119 __builtin_ia32_pmovsqb256mem_mask ((__v16qi *) __P, (__v4di) __A, __M);
7123 _mm_cvtsepi64_epi32 (__m128i __A)
7125 return (__m128i) __builtin_ia32_pmovsqd128_mask ((__v2di) __A,
7131 _mm_mask_cvtsepi64_epi32 (__m128i __O, __mmask8 __M, __m128i __A)
7133 return (__m128i) __builtin_ia32_pmovsqd128_mask ((__v2di) __A,
7138 _mm_maskz_cvtsepi64_epi32 (__mmask8 __M, __m128i __A)
7140 return (__m128i) __builtin_ia32_pmovsqd128_mask ((__v2di) __A,
7146 _mm_mask_cvtsepi64_storeu_epi32 (void * __P, __mmask8 __M, __m128i __A)
7148 __builtin_ia32_pmovsqd128mem_mask ((__v4si *) __P, (__v2di) __A, __M);
7152 _mm256_cvtsepi64_epi32 (__m256i __A)
7154 return (__m128i) __builtin_ia32_pmovsqd256_mask ((__v4di) __A,
7160 _mm256_mask_cvtsepi64_epi32 (__m128i __O, __mmask8 __M, __m256i __A)
7162 return (__m128i) __builtin_ia32_pmovsqd256_mask ((__v4di) __A,
7168 _mm256_maskz_cvtsepi64_epi32 (__mmask8 __M, __m256i __A)
7170 return (__m128i) __builtin_ia32_pmovsqd256_mask ((__v4di) __A,
7176 _mm256_mask_cvtsepi64_storeu_epi32 (void * __P, __mmask8 __M, __m256i __A)
7178 __builtin_ia32_pmovsqd256mem_mask ((__v4si *) __P, (__v4di) __A, __M);
7182 _mm_cvtsepi64_epi16 (__m128i __A)
7184 return (__m128i) __builtin_ia32_pmovsqw128_mask ((__v2di) __A,
7190 _mm_mask_cvtsepi64_epi16 (__m128i __O, __mmask8 __M, __m128i __A)
7192 return (__m128i) __builtin_ia32_pmovsqw128_mask ((__v2di) __A,
7197 _mm_maskz_cvtsepi64_epi16 (__mmask8 __M, __m128i __A)
7199 return (__m128i) __builtin_ia32_pmovsqw128_mask ((__v2di) __A,
7205 _mm_mask_cvtsepi64_storeu_epi16 (void * __P, __mmask8 __M, __m128i __A)
7207 __builtin_ia32_pmovsqw128mem_mask ((__v8hi *) __P, (__v2di) __A, __M);
7211 _mm256_cvtsepi64_epi16 (__m256i __A)
7213 return (__m128i) __builtin_ia32_pmovsqw256_mask ((__v4di) __A,
7219 _mm256_mask_cvtsepi64_epi16 (__m128i __O, __mmask8 __M, __m256i __A)
7221 return (__m128i) __builtin_ia32_pmovsqw256_mask ((__v4di) __A,
7226 _mm256_maskz_cvtsepi64_epi16 (__mmask8 __M, __m256i __A)
7228 return (__m128i) __builtin_ia32_pmovsqw256_mask ((__v4di) __A,
7234 _mm256_mask_cvtsepi64_storeu_epi16 (void * __P, __mmask8 __M, __m256i __A)
7236 __builtin_ia32_pmovsqw256mem_mask ((__v8hi *) __P, (__v4di) __A, __M);
7240 _mm_cvtusepi32_epi8 (__m128i __A)
7242 return (__m128i) __builtin_ia32_pmovusdb128_mask ((__v4si) __A,
7248 _mm_mask_cvtusepi32_epi8 (__m128i __O, __mmask8 __M, __m128i __A)
7250 return (__m128i) __builtin_ia32_pmovusdb128_mask ((__v4si) __A,
7256 _mm_maskz_cvtusepi32_epi8 (__mmask8 __M, __m128i __A)
7258 return (__m128i) __builtin_ia32_pmovusdb128_mask ((__v4si) __A,
7264 _mm_mask_cvtusepi32_storeu_epi8 (void * __P, __mmask8 __M, __m128i __A)
7266 __builtin_ia32_pmovusdb128mem_mask ((__v16qi *) __P, (__v4si) __A, __M);
7270 _mm256_cvtusepi32_epi8 (__m256i __A)
7272 return (__m128i) __builtin_ia32_pmovusdb256_mask ((__v8si) __A,
7278 _mm256_mask_cvtusepi32_epi8 (__m128i __O, __mmask8 __M, __m256i __A)
7280 return (__m128i) __builtin_ia32_pmovusdb256_mask ((__v8si) __A,
7286 _mm256_maskz_cvtusepi32_epi8 (__mmask8 __M, __m256i __A)
7288 return (__m128i) __builtin_ia32_pmovusdb256_mask ((__v8si) __A,
7294 _mm256_mask_cvtusepi32_storeu_epi8 (void * __P, __mmask8 __M, __m256i __A)
7296 __builtin_ia32_pmovusdb256mem_mask ((__v16qi*) __P, (__v8si) __A, __M);
7300 _mm_cvtusepi32_epi16 (__m128i __A)
7302 return (__m128i) __builtin_ia32_pmovusdw128_mask ((__v4si) __A,
7308 _mm_mask_cvtusepi32_epi16 (__m128i __O, __mmask8 __M, __m128i __A)
7310 return (__m128i) __builtin_ia32_pmovusdw128_mask ((__v4si) __A,
7315 _mm_maskz_cvtusepi32_epi16 (__mmask8 __M, __m128i __A)
7317 return (__m128i) __builtin_ia32_pmovusdw128_mask ((__v4si) __A,
7323 _mm_mask_cvtusepi32_storeu_epi16 (void * __P, __mmask8 __M, __m128i __A)
7325 __builtin_ia32_pmovusdw128mem_mask ((__v8hi *) __P, (__v4si) __A, __M);
7329 _mm256_cvtusepi32_epi16 (__m256i __A)
7331 return (__m128i) __builtin_ia32_pmovusdw256_mask ((__v8si) __A,
7337 _mm256_mask_cvtusepi32_epi16 (__m128i __O, __mmask8 __M, __m256i __A)
7339 return (__m128i) __builtin_ia32_pmovusdw256_mask ((__v8si) __A,
7344 _mm256_maskz_cvtusepi32_epi16 (__mmask8 __M, __m256i __A)
7346 return (__m128i) __builtin_ia32_pmovusdw256_mask ((__v8si) __A,
7352 _mm256_mask_cvtusepi32_storeu_epi16 (void * __P, __mmask8 __M, __m256i __A)
7354 __builtin_ia32_pmovusdw256mem_mask ((__v8hi *) __P, (__v8si) __A, __M);
7358 _mm_cvtusepi64_epi8 (__m128i __A)
7360 return (__m128i) __builtin_ia32_pmovusqb128_mask ((__v2di) __A,
7366 _mm_mask_cvtusepi64_epi8 (__m128i __O, __mmask8 __M, __m128i __A)
7368 return (__m128i) __builtin_ia32_pmovusqb128_mask ((__v2di) __A,
7374 _mm_maskz_cvtusepi64_epi8 (__mmask8 __M, __m128i __A)
7376 return (__m128i) __builtin_ia32_pmovusqb128_mask ((__v2di) __A,
7382 _mm_mask_cvtusepi64_storeu_epi8 (void * __P, __mmask8 __M, __m128i __A)
7384 __builtin_ia32_pmovusqb128mem_mask ((__v16qi *) __P, (__v2di) __A, __M);
7388 _mm256_cvtusepi64_epi8 (__m256i __A)
7390 return (__m128i) __builtin_ia32_pmovusqb256_mask ((__v4di) __A,
7396 _mm256_mask_cvtusepi64_epi8 (__m128i __O, __mmask8 __M, __m256i __A)
7398 return (__m128i) __builtin_ia32_pmovusqb256_mask ((__v4di) __A,
7404 _mm256_maskz_cvtusepi64_epi8 (__mmask8 __M, __m256i __A)
7406 return (__m128i) __builtin_ia32_pmovusqb256_mask ((__v4di) __A,
7412 _mm256_mask_cvtusepi64_storeu_epi8 (void * __P, __mmask8 __M, __m256i __A)
7414 __builtin_ia32_pmovusqb256mem_mask ((__v16qi *) __P, (__v4di) __A, __M);
7418 _mm_cvtusepi64_epi32 (__m128i __A)
7420 return (__m128i) __builtin_ia32_pmovusqd128_mask ((__v2di) __A,
7426 _mm_mask_cvtusepi64_epi32 (__m128i __O, __mmask8 __M, __m128i __A)
7428 return (__m128i) __builtin_ia32_pmovusqd128_mask ((__v2di) __A,
7433 _mm_maskz_cvtusepi64_epi32 (__mmask8 __M, __m128i __A)
7435 return (__m128i) __builtin_ia32_pmovusqd128_mask ((__v2di) __A,
7441 _mm_mask_cvtusepi64_storeu_epi32 (void * __P, __mmask8 __M, __m128i __A)
7443 __builtin_ia32_pmovusqd128mem_mask ((__v4si *) __P, (__v2di) __A, __M);
7447 _mm256_cvtusepi64_epi32 (__m256i __A)
7449 return (__m128i) __builtin_ia32_pmovusqd256_mask ((__v4di) __A,
7455 _mm256_mask_cvtusepi64_epi32 (__m128i __O, __mmask8 __M, __m256i __A)
7457 return (__m128i) __builtin_ia32_pmovusqd256_mask ((__v4di) __A,
7462 _mm256_maskz_cvtusepi64_epi32 (__mmask8 __M, __m256i __A)
7464 return (__m128i) __builtin_ia32_pmovusqd256_mask ((__v4di) __A,
7470 _mm256_mask_cvtusepi64_storeu_epi32 (void * __P, __mmask8 __M, __m256i __A)
7472 __builtin_ia32_pmovusqd256mem_mask ((__v4si *) __P, (__v4di) __A, __M);
7476 _mm_cvtusepi64_epi16 (__m128i __A)
7478 return (__m128i) __builtin_ia32_pmovusqw128_mask ((__v2di) __A,
7484 _mm_mask_cvtusepi64_epi16 (__m128i __O, __mmask8 __M, __m128i __A)
7486 return (__m128i) __builtin_ia32_pmovusqw128_mask ((__v2di) __A,
7491 _mm_maskz_cvtusepi64_epi16 (__mmask8 __M, __m128i __A)
7493 return (__m128i) __builtin_ia32_pmovusqw128_mask ((__v2di) __A,
7499 _mm_mask_cvtusepi64_storeu_epi16 (void * __P, __mmask8 __M, __m128i __A)
7501 __builtin_ia32_pmovusqw128mem_mask ((__v8hi *) __P, (__v2di) __A, __M);
7505 _mm256_cvtusepi64_epi16 (__m256i __A)
7507 return (__m128i) __builtin_ia32_pmovusqw256_mask ((__v4di) __A,
7513 _mm256_mask_cvtusepi64_epi16 (__m128i __O, __mmask8 __M, __m256i __A)
7515 return (__m128i) __builtin_ia32_pmovusqw256_mask ((__v4di) __A,
7520 _mm256_maskz_cvtusepi64_epi16 (__mmask8 __M, __m256i __A)
7522 return (__m128i) __builtin_ia32_pmovusqw256_mask ((__v4di) __A,
7528 _mm256_mask_cvtusepi64_storeu_epi16 (void * __P, __mmask8 __M, __m256i __A)
7530 __builtin_ia32_pmovusqw256mem_mask ((__v8hi *) __P, (__v4di) __A, __M);
7534 _mm_cvtepi32_epi8 (__m128i __A)
7537 __builtin_convertvector((__v4si)__A, __v4qi), (__v4qi){0, 0, 0, 0}, 0, 1,
7542 _mm_mask_cvtepi32_epi8 (__m128i __O, __mmask8 __M, __m128i __A)
7544 return (__m128i) __builtin_ia32_pmovdb128_mask ((__v4si) __A,
7549 _mm_maskz_cvtepi32_epi8 (__mmask8 __M, __m128i __A)
7551 return (__m128i) __builtin_ia32_pmovdb128_mask ((__v4si) __A,
7558 _mm_mask_cvtepi32_storeu_epi8 (void * __P, __mmask8 __M, __m128i __A)
7560 __builtin_ia32_pmovdb128mem_mask ((__v16qi *) __P, (__v4si) __A, __M);
7564 _mm256_cvtepi32_epi8 (__m256i __A)
7567 __builtin_convertvector((__v8si)__A, __v8qi),
7573 _mm256_mask_cvtepi32_epi8 (__m128i __O, __mmask8 __M, __m256i __A)
7575 return (__m128i) __builtin_ia32_pmovdb256_mask ((__v8si) __A,
7580 _mm256_maskz_cvtepi32_epi8 (__mmask8 __M, __m256i __A)
7582 return (__m128i) __builtin_ia32_pmovdb256_mask ((__v8si) __A,
7588 _mm256_mask_cvtepi32_storeu_epi8 (void * __P, __mmask8 __M, __m256i __A)
7590 __builtin_ia32_pmovdb256mem_mask ((__v16qi *) __P, (__v8si) __A, __M);
7594 _mm_cvtepi32_epi16 (__m128i __A)
7597 __builtin_convertvector((__v4si)__A, __v4hi), (__v4hi){0, 0, 0, 0}, 0, 1,
7602 _mm_mask_cvtepi32_epi16 (__m128i __O, __mmask8 __M, __m128i __A)
7604 return (__m128i) __builtin_ia32_pmovdw128_mask ((__v4si) __A,
7609 _mm_maskz_cvtepi32_epi16 (__mmask8 __M, __m128i __A)
7611 return (__m128i) __builtin_ia32_pmovdw128_mask ((__v4si) __A,
7617 _mm_mask_cvtepi32_storeu_epi16 (void * __P, __mmask8 __M, __m128i __A)
7619 __builtin_ia32_pmovdw128mem_mask ((__v8hi *) __P, (__v4si) __A, __M);
7623 _mm256_cvtepi32_epi16 (__m256i __A)
7625 return (__m128i)__builtin_convertvector((__v8si)__A, __v8hi);
7629 _mm256_mask_cvtepi32_epi16 (__m128i __O, __mmask8 __M, __m256i __A)
7631 return (__m128i) __builtin_ia32_pmovdw256_mask ((__v8si) __A,
7636 _mm256_maskz_cvtepi32_epi16 (__mmask8 __M, __m256i __A)
7638 return (__m128i) __builtin_ia32_pmovdw256_mask ((__v8si) __A,
7644 _mm256_mask_cvtepi32_storeu_epi16 (void * __P, __mmask8 __M, __m256i __A)
7646 __builtin_ia32_pmovdw256mem_mask ((__v8hi *) __P, (__v8si) __A, __M);
7650 _mm_cvtepi64_epi8 (__m128i __A)
7653 __builtin_convertvector((__v2di)__A, __v2qi), (__v2qi){0, 0}, 0, 1, 2, 3,
7658 _mm_mask_cvtepi64_epi8 (__m128i __O, __mmask8 __M, __m128i __A)
7660 return (__m128i) __builtin_ia32_pmovqb128_mask ((__v2di) __A,
7665 _mm_maskz_cvtepi64_epi8 (__mmask8 __M, __m128i __A)
7667 return (__m128i) __builtin_ia32_pmovqb128_mask ((__v2di) __A,
7673 _mm_mask_cvtepi64_storeu_epi8 (void * __P, __mmask8 __M, __m128i __A)
7675 __builtin_ia32_pmovqb128mem_mask ((__v16qi *) __P, (__v2di) __A, __M);
7679 _mm256_cvtepi64_epi8 (__m256i __A)
7682 __builtin_convertvector((__v4di)__A, __v4qi), (__v4qi){0, 0, 0, 0}, 0, 1,
7687 _mm256_mask_cvtepi64_epi8 (__m128i __O, __mmask8 __M, __m256i __A)
7689 return (__m128i) __builtin_ia32_pmovqb256_mask ((__v4di) __A,
7694 _mm256_maskz_cvtepi64_epi8 (__mmask8 __M, __m256i __A)
7696 return (__m128i) __builtin_ia32_pmovqb256_mask ((__v4di) __A,
7702 _mm256_mask_cvtepi64_storeu_epi8 (void * __P, __mmask8 __M, __m256i __A)
7704 __builtin_ia32_pmovqb256mem_mask ((__v16qi *) __P, (__v4di) __A, __M);
7708 _mm_cvtepi64_epi32 (__m128i __A)
7711 __builtin_convertvector((__v2di)__A, __v2si), (__v2si){0, 0}, 0, 1, 2, 3);
7715 _mm_mask_cvtepi64_epi32 (__m128i __O, __mmask8 __M, __m128i __A)
7717 return (__m128i) __builtin_ia32_pmovqd128_mask ((__v2di) __A,
7722 _mm_maskz_cvtepi64_epi32 (__mmask8 __M, __m128i __A)
7724 return (__m128i) __builtin_ia32_pmovqd128_mask ((__v2di) __A,
7730 _mm_mask_cvtepi64_storeu_epi32 (void * __P, __mmask8 __M, __m128i __A)
7732 __builtin_ia32_pmovqd128mem_mask ((__v4si *) __P, (__v2di) __A, __M);
7736 _mm256_cvtepi64_epi32 (__m256i __A)
7738 return (__m128i)__builtin_convertvector((__v4di)__A, __v4si);
7742 _mm256_mask_cvtepi64_epi32 (__m128i __O, __mmask8 __M, __m256i __A)
7745 (__v4si)_mm256_cvtepi64_epi32(__A),
7750 _mm256_maskz_cvtepi64_epi32 (__mmask8 __M, __m256i __A)
7753 (__v4si)_mm256_cvtepi64_epi32(__A),
7758 _mm256_mask_cvtepi64_storeu_epi32 (void * __P, __mmask8 __M, __m256i __A)
7760 __builtin_ia32_pmovqd256mem_mask ((__v4si *) __P, (__v4di) __A, __M);
7764 _mm_cvtepi64_epi16 (__m128i __A)
7767 __builtin_convertvector((__v2di)__A, __v2hi), (__v2hi){0, 0}, 0, 1, 2, 3,
7772 _mm_mask_cvtepi64_epi16 (__m128i __O, __mmask8 __M, __m128i __A)
7774 return (__m128i) __builtin_ia32_pmovqw128_mask ((__v2di) __A,
7780 _mm_maskz_cvtepi64_epi16 (__mmask8 __M, __m128i __A)
7782 return (__m128i) __builtin_ia32_pmovqw128_mask ((__v2di) __A,
7788 _mm_mask_cvtepi64_storeu_epi16 (void * __P, __mmask8 __M, __m128i __A)
7790 __builtin_ia32_pmovqw128mem_mask ((__v8hi *) __P, (__v2di) __A, __M);
7794 _mm256_cvtepi64_epi16 (__m256i __A)
7797 __builtin_convertvector((__v4di)__A, __v4hi), (__v4hi){0, 0, 0, 0}, 0, 1,
7802 _mm256_mask_cvtepi64_epi16 (__m128i __O, __mmask8 __M, __m256i __A)
7804 return (__m128i) __builtin_ia32_pmovqw256_mask ((__v4di) __A,
7809 _mm256_maskz_cvtepi64_epi16 (__mmask8 __M, __m256i __A)
7811 return (__m128i) __builtin_ia32_pmovqw256_mask ((__v4di) __A,
7817 _mm256_mask_cvtepi64_storeu_epi16 (void * __P, __mmask8 __M, __m256i __A)
7819 __builtin_ia32_pmovqw256mem_mask ((__v8hi *) __P, (__v4di) __A, __M);
8220 _mm_mask_movehdup_ps (__m128 __W, __mmask8 __U, __m128 __A)
8223 (__v4sf)_mm_movehdup_ps(__A),
8228 _mm_maskz_movehdup_ps (__mmask8 __U, __m128 __A)
8231 (__v4sf)_mm_movehdup_ps(__A),
8236 _mm256_mask_movehdup_ps (__m256 __W, __mmask8 __U, __m256 __A)
8239 (__v8sf)_mm256_movehdup_ps(__A),
8244 _mm256_maskz_movehdup_ps (__mmask8 __U, __m256 __A)
8247 (__v8sf)_mm256_movehdup_ps(__A),
8252 _mm_mask_moveldup_ps (__m128 __W, __mmask8 __U, __m128 __A)
8255 (__v4sf)_mm_moveldup_ps(__A),
8260 _mm_maskz_moveldup_ps (__mmask8 __U, __m128 __A)
8263 (__v4sf)_mm_moveldup_ps(__A),
8268 _mm256_mask_moveldup_ps (__m256 __W, __mmask8 __U, __m256 __A)
8271 (__v8sf)_mm256_moveldup_ps(__A),
8276 _mm256_maskz_moveldup_ps (__mmask8 __U, __m256 __A)
8279 (__v8sf)_mm256_moveldup_ps(__A),
8304 _mm_mask_mov_pd (__m128d __W, __mmask8 __U, __m128d __A)
8307 (__v2df) __A,
8312 _mm_maskz_mov_pd (__mmask8 __U, __m128d __A)
8315 (__v2df) __A,
8320 _mm256_mask_mov_pd (__m256d __W, __mmask8 __U, __m256d __A)
8323 (__v4df) __A,
8328 _mm256_maskz_mov_pd (__mmask8 __U, __m256d __A)
8331 (__v4df) __A,
8336 _mm_mask_mov_ps (__m128 __W, __mmask8 __U, __m128 __A)
8339 (__v4sf) __A,
8344 _mm_maskz_mov_ps (__mmask8 __U, __m128 __A)
8347 (__v4sf) __A,
8352 _mm256_mask_mov_ps (__m256 __W, __mmask8 __U, __m256 __A)
8355 (__v8sf) __A,
8360 _mm256_maskz_mov_ps (__mmask8 __U, __m256 __A)
8363 (__v8sf) __A,
8368 _mm_mask_cvtph_ps (__m128 __W, __mmask8 __U, __m128i __A)
8370 return (__m128) __builtin_ia32_vcvtph2ps_mask ((__v8hi) __A,
8376 _mm_maskz_cvtph_ps (__mmask8 __U, __m128i __A)
8378 return (__m128) __builtin_ia32_vcvtph2ps_mask ((__v8hi) __A,
8385 _mm256_mask_cvtph_ps (__m256 __W, __mmask8 __U, __m128i __A)
8387 return (__m256) __builtin_ia32_vcvtph2ps256_mask ((__v8hi) __A,
8393 _mm256_maskz_cvtph_ps (__mmask8 __U, __m128i __A)
8395 return (__m256) __builtin_ia32_vcvtph2ps256_mask ((__v8hi) __A,