Lines Matching defs:__m256

34 typedef float __m256 __attribute__ ((__vector_size__ (32), __aligned__(32)));
87 static __inline __m256 __DEFAULT_FN_ATTRS
88 _mm256_add_ps(__m256 __a, __m256 __b)
90 return (__m256)((__v8sf)__a+(__v8sf)__b);
123 static __inline __m256 __DEFAULT_FN_ATTRS
124 _mm256_sub_ps(__m256 __a, __m256 __b)
126 return (__m256)((__v8sf)__a-(__v8sf)__b);
161 static __inline __m256 __DEFAULT_FN_ATTRS
162 _mm256_addsub_ps(__m256 __a, __m256 __b)
164 return (__m256)__builtin_ia32_addsubps256((__v8sf)__a, (__v8sf)__b);
197 static __inline __m256 __DEFAULT_FN_ATTRS
198 _mm256_div_ps(__m256 __a, __m256 __b)
200 return (__m256)((__v8sf)__a/(__v8sf)__b);
235 static __inline __m256 __DEFAULT_FN_ATTRS
236 _mm256_max_ps(__m256 __a, __m256 __b)
238 return (__m256)__builtin_ia32_maxps256((__v8sf)__a, (__v8sf)__b);
273 static __inline __m256 __DEFAULT_FN_ATTRS
274 _mm256_min_ps(__m256 __a, __m256 __b)
276 return (__m256)__builtin_ia32_minps256((__v8sf)__a, (__v8sf)__b);
309 static __inline __m256 __DEFAULT_FN_ATTRS
310 _mm256_mul_ps(__m256 __a, __m256 __b)
312 return (__m256)((__v8sf)__a * (__v8sf)__b);
343 static __inline __m256 __DEFAULT_FN_ATTRS
344 _mm256_sqrt_ps(__m256 __a)
346 return (__m256)__builtin_ia32_sqrtps256((__v8sf)__a);
360 static __inline __m256 __DEFAULT_FN_ATTRS
361 _mm256_rsqrt_ps(__m256 __a)
363 return (__m256)__builtin_ia32_rsqrtps256((__v8sf)__a);
377 static __inline __m256 __DEFAULT_FN_ATTRS
378 _mm256_rcp_ps(__m256 __a)
380 return (__m256)__builtin_ia32_rcpps256((__v8sf)__a);
422 /// __m256 _mm256_round_ps(__m256 V, const int M);
445 ((__m256)__builtin_ia32_roundps256((__v8sf)(__m256)(V), (M)))
489 /// __m256 _mm256_ceil_ps(__m256 V);
506 /// __m256 _mm256_floor_ps(__m256 V);
547 static __inline __m256 __DEFAULT_FN_ATTRS
548 _mm256_and_ps(__m256 __a, __m256 __b)
550 return (__m256)((__v8su)__a & (__v8su)__b);
589 static __inline __m256 __DEFAULT_FN_ATTRS
590 _mm256_andnot_ps(__m256 __a, __m256 __b)
592 return (__m256)(~(__v8su)__a & (__v8su)__b);
625 static __inline __m256 __DEFAULT_FN_ATTRS
626 _mm256_or_ps(__m256 __a, __m256 __b)
628 return (__m256)((__v8su)__a | (__v8su)__b);
661 static __inline __m256 __DEFAULT_FN_ATTRS
662 _mm256_xor_ps(__m256 __a, __m256 __b)
664 return (__m256)((__v8su)__a ^ (__v8su)__b);
708 static __inline __m256 __DEFAULT_FN_ATTRS
709 _mm256_hadd_ps(__m256 __a, __m256 __b)
711 return (__m256)__builtin_ia32_haddps256((__v8sf)__a, (__v8sf)__b);
754 static __inline __m256 __DEFAULT_FN_ATTRS
755 _mm256_hsub_ps(__m256 __a, __m256 __b)
757 return (__m256)__builtin_ia32_hsubps256((__v8sf)__a, (__v8sf)__b);
968 static __inline __m256 __DEFAULT_FN_ATTRS
969 _mm256_permutevar_ps(__m256 __a, __m256i __c)
971 return (__m256)__builtin_ia32_vpermilvarps256((__v8sf)__a, (__v8si)__c);
1106 /// __m256 _mm256_permute_ps(__m256 A, const int C);
1190 ((__m256)__builtin_ia32_vpermilps256((__v8sf)(__m256)(A), (int)(C)))
1239 /// __m256 _mm256_permute2f128_ps(__m256 V1, __m256 V2, const int M);
1271 ((__m256)__builtin_ia32_vperm2f128_ps256((__v8sf)(__m256)(V1), \
1272 (__v8sf)(__m256)(V2), (int)(M)))
1350 /// __m256 _mm256_blend_ps(__m256 V1, __m256 V2, const int M);
1368 ((__m256)__builtin_ia32_blendps256((__v8sf)(__m256)(V1), \
1369 (__v8sf)(__m256)(V2), (int)(M)))
1420 static __inline __m256 __DEFAULT_FN_ATTRS
1421 _mm256_blendv_ps(__m256 __a, __m256 __b, __m256 __c)
1423 return (__m256)__builtin_ia32_blendvps256(
1442 /// __m256 _mm256_dp_ps(__m256 V1, __m256 V2, const int M);
1466 ((__m256)__builtin_ia32_dpps256((__v8sf)(__m256)(V1), \
1467 (__v8sf)(__m256)(V2), (M)))
1485 /// __m256 _mm256_shuffle_ps(__m256 a, __m256 b, const int mask);
1523 ((__m256)__builtin_ia32_shufps256((__v8sf)(__m256)(a), \
1524 (__v8sf)(__m256)(b), (int)(mask)))
1797 /// __m256 _mm256_cmp_ps(__m256 a, __m256 b, const int c);
1843 ((__m256)__builtin_ia32_cmpps256((__v8sf)(__m256)(a), \
1844 (__v8sf)(__m256)(b), (c)))
2188 static __inline __m256 __DEFAULT_FN_ATTRS
2191 return (__m256)__builtin_convertvector((__v8si)__a, __v8sf);
2220 _mm256_cvtps_epi32(__m256 __a)
2286 _mm256_cvttps_epi32(__m256 __a)
2335 _mm256_cvtss_f32(__m256 __a)
2360 static __inline __m256 __DEFAULT_FN_ATTRS
2361 _mm256_movehdup_ps(__m256 __a)
2385 static __inline __m256 __DEFAULT_FN_ATTRS
2386 _mm256_moveldup_ps(__m256 __a)
2479 static __inline __m256 __DEFAULT_FN_ATTRS
2480 _mm256_unpackhi_ps(__m256 __a, __m256 __b)
2506 static __inline __m256 __DEFAULT_FN_ATTRS
2507 _mm256_unpacklo_ps(__m256 __a, __m256 __b)
2801 _mm256_testz_ps(__m256 __a, __m256 __b)
2830 _mm256_testc_ps(__m256 __a, __m256 __b)
2860 _mm256_testnzc_ps(__m256 __a, __m256 __b)
2976 _mm256_movemask_ps(__m256 __a)
3055 static __inline __m256 __DEFAULT_FN_ATTRS
3059 return __extension__ (__m256)(__v8sf){ __f, __f, __f, __f, __f, __f, __f, __f };
3094 static __inline __m256 __DEFAULT_FN_ATTRS
3098 return (__m256)__builtin_shufflevector((__v4sf)__b, (__v4sf)__b,
3130 static __inline __m256 __DEFAULT_FN_ATTRS
3133 return *(const __m256 *)__p;
3167 static __inline __m256 __DEFAULT_FN_ATTRS
3263 _mm256_store_ps(float *__p, __m256 __a)
3265 *(__m256 *)__p = __a;
3301 _mm256_storeu_ps(float *__p, __m256 __a)
3439 static __inline __m256 __DEFAULT_FN_ATTRS
3442 return (__m256)__builtin_ia32_maskloadps256((const __v8sf *)__p, (__v8si)__m);
3465 _mm256_maskstore_ps(float *__p, __m256i __m, __m256 __a)
3598 _mm256_stream_ps(float *__p, __m256 __a)
3625 static __inline__ __m256 __DEFAULT_FN_ATTRS
3628 return (__m256)__builtin_ia32_undef256();
3704 static __inline __m256 __DEFAULT_FN_ATTRS
3708 return __extension__ (__m256){ __h, __g, __f, __e, __d, __c, __b, __a };
3971 static __inline __m256 __DEFAULT_FN_ATTRS
4207 static __inline __m256 __DEFAULT_FN_ATTRS
4312 static __inline __m256 __DEFAULT_FN_ATTRS
4315 return __extension__ (__m256){ 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f, 0.0f };
4343 static __inline __m256 __DEFAULT_FN_ATTRS
4346 return (__m256)__a;
4378 _mm256_castps_pd(__m256 __a)
4395 _mm256_castps_si256(__m256 __a)
4411 static __inline __m256 __DEFAULT_FN_ATTRS
4414 return (__m256)__a;
4463 _mm256_castps256_ps128(__m256 __a)
4520 static __inline __m256 __DEFAULT_FN_ATTRS
4576 static __inline __m256 __DEFAULT_FN_ATTRS
4616 /// __m256 _mm256_insertf128_ps(__m256 V1, __m128 V2, const int M);
4640 ((__m256)__builtin_ia32_vinsertf128_ps256((__v8sf)(__m256)(V1), \
4731 /// __m128 _mm256_extractf128_ps(__m256 V, const int M);
4746 ((__m128)__builtin_ia32_vextractf128_ps256((__v8sf)(__m256)(V), (int)(M)))
4811 static __inline __m256 __DEFAULT_FN_ATTRS
4814 return (__m256) __builtin_shufflevector((__v4sf)__lo, (__v4sf)__hi, 0, 1, 2, 3, 4, 5, 6, 7);
4875 static __inline __m256 __DEFAULT_FN_ATTRS
4947 static __inline __m256 __DEFAULT_FN_ATTRS
5024 _mm256_storeu2_m128(float *__addr_hi, float *__addr_lo, __m256 __a)