Lines Matching refs:W8

67 	1. W0 = rotate_left(left_shift(W4,32) ^ W8 ^ left_shift(concatenate(W16,W12),64) ^ W16,1);
73 1. W0 = rotate_left(left_shift(concatenate(W8,W4),64) ^ W16 ^ W28 ^ W32, 2);
86 b. palignr is used to simplify the computation of left_shift(concatenate(W12,W8),64)
127 #define W8 %xmm4
213 .macro W_PRECALC_00_15_1_ssse3 // input argument $0 : current 16-bytes in the circular buffer, one of W0,W4,W8,...,W28
267 .macro W_PRECALC_00_15_1_nossse3 // input argument $0 : current 16-bytes in the circular buffer, one of W0,W4,W8,...,W28
283 0. W_tmp = W3; W = W14 ^ W8
284 1. W = W3 ^ W8 ^ W14 ^ W16; W_TMP = W; W_TMP2 = (W[i] 0 0 0);
285 2. W_TMP = (W3 ^ W8 ^ W14 ^ W16) rol 1; split (W[i] 0 0 0) rol 2 in W_TMP2 and W
286 3. W = W_TMP = W_TMP ^ W_TMP2 ^ W = (W3 ^ W8 ^ W14 ^ W16) rol 1 ^ (W[i] 0 0 0) rol 2; WK = W _TMP+K;
290 .macro W_PRECALC_16_31_0_ssse3 // input arguments : W16,W12,W8,W4,W
295 pxor $2, $4 // W = W8 ^ W14
300 pxor W_TMP, $1 // W = W3 ^ W16 ^ W8 ^ W14
301 xmov $1, W_TMP2 // W_TMP2 = W3 ^ W16 ^ W8 ^ W14
302 xmov $1, W_TMP // W_TMP = W3 ^ W16 ^ W8 ^ W14
307 psrld $$31, $0 // (W3 ^ W16 ^ W8 ^ W14)>>31
308 pslld $$1, W_TMP // (W3 ^ W16 ^ W8 ^ W14)<<1
309 por $0, W_TMP // W_TMP = (W3 ^ W16 ^ W8 ^ W14) rol 1
320 pxor W_TMP2, W_TMP // W_TMP = (W3 ^ W16 ^ W8 ^ W14) rol 1 ^ (W[i] 0 0 0) rol 2
332 .macro W_PRECALC_16_31_0_nossse3 // input arguments : W16,W12,W8,W4,W
343 pxor $2, $4 // W = W8 ^ W14
348 W = rotate_left(left_shift(concatenate(W8,W4),64) ^ W16 ^ W28 ^ W32, 2);
350 where left_shift(concatenate(W8,W4),64) is equivalent to W6. Note also that W32 and W use the same register.
361 .macro W_PRECALC_32_79_0_ssse3 // inputr arguments : W28,W8,W4,W
368 .macro W_PRECALC_32_79_0_nossse3 // input arguments : W28,W8,W4,W
378 .macro W_PRECALC_32_79_0_i386_ssse3 // input arguments : W28,W8,W4,W
387 .macro W_PRECALC_32_79_0_i386_nossse3 // input arguments : W28,W8,W4,W
392 xmov $1, W_TMP2 // W8 = (w5 w6 w7 w8)
530 // i=0 : W28,W24,W20,W16,W12,W8,W4,W0
536 // i=4 : W24,W20,W16,W12,W8,W4,W0,W28
542 // i=8 : W20,W16,W12,W8,W4,W0,W28,W24
548 // i=12 : W16,W12,W8,W4,W0,W28,W24,W20
559 // i=16 : W12,W8,W4,W0,W28,W24,W20,W16
569 // i=20 : W8,W4,W0,W28,W24,W20,W16,W12
579 // i=24 : W4,W0,W28,W24,W20,W16,W12,W8
580 W_PRECALC_16_31_0 W24,W20,W16,W12,W8
582 W_PRECALC_16_31_1 W24,W8
584 W_PRECALC_16_31_2 W8
586 W_PRECALC_16_31_3 W8,10,16
589 // i=28 : W0,W28,W24,W20,W16,W12,W8,W4
590 W_PRECALC_16_31_0 W20,W16,W12,W8,W4
599 // i=32 : W28,W24,W20,W16,W12,W8,W4,W0
600 W_PRECALC_32_79_0 W28,W8,W4,W0
611 // i=36 : W24,W20,W16,W12,W8,W4,W0,W28
629 // i=40 : W20,W16,W12,W8,W4,W0,W28,W24
638 W_PRECALC_32_79_1 W8,W24
649 // i=44 : W16,W12,W8,W4,W0,W28,W24,W20
659 // i=48 : W12,W8,W4,W0,W28,W24,W20,W16
669 // i=52 : W8,W4,W0,W28,W24,W20,W16,W12
670 W_PRECALC_32_79_0 W8,W20,W16,W12
681 // i=56 : W4,W0,W28,W24,W20,W16,W12,W8
682 W_PRECALC_32_79_0 W4,W16,W12,W8
684 W_PRECALC_32_79_1 W24,W8
686 W_PRECALC_32_79_2 W8
688 W_PRECALC_32_79_3 W8,42,K_XMM
691 // i=60 : W0,W28,W24,W20,W16,W12,W8,W4
694 W_PRECALC_32_79_0 W0,W12,W8,W4
703 // i=64 : W28,W24,W20,W16,W12,W8,W4,W0
704 W_PRECALC_32_79_0 W28,W8,W4,W0
713 // i=68 : W24,W20,W16,W12,W8,W4,W0,W28
731 // i=72 : W20,W16,W12,W8,W4,W0,W28,W24
738 W_PRECALC_32_79_1 W8,W24
751 // i=76 : W16,W12,W8,W4,W0,W28,W24,W20
764 // i=0 : W28,W24,W20,W16,W12,W8,W4,W0
774 // i=4 : W24,W20,W16,W12,W8,W4,W0,W28
784 // i=8 : W20,W16,W12,W8,W4,W0,W28,W24
794 // i=12 : W16,W12,W8,W4,W0,W28,W24,W20
835 // i=0 : W28,W24,W20,W16,W12,W8,W4,W0
841 // i=4 : W24,W20,W16,W12,W8,W4,W0,W28
847 // i=8 : W20,W16,W12,W8,W4,W0,W28,W24
853 // i=12 : W16,W12,W8,W4,W0,W28,W24,W20
864 // circular buffer : W12,W8,W4,W0,W28,W24,W20,W16
875 // W8,W4,W0,W28,W24,W20,W16,W12
887 // W4,W0,W28,W24,W20,W16,W12,W8
888 W_PRECALC_16_31_0 W24,W20,W16,W12,W8
890 W_PRECALC_16_31_1 W24,W8
893 W_PRECALC_16_31_2 W8
895 W_PRECALC_16_31_3 W8,10,16
899 // W0,W28,W24,W20,W16,W12,W8,W4
900 W_PRECALC_16_31_0 W20,W16,W12,W8,W4
911 // W28,W24,W20,W16,W12,W8,W4,W0
912 W_PRECALC_32_79_0 W28,W8,W4,W0
922 // W24,W20,W16,W12,W8,W4,W0,W28
943 // W20,W16,W12,W8,W4,W0,W28,W24
950 W_PRECALC_32_79_1 W8,W24
962 // W16,W12,W8,W4,W0,W28,W24,W20
973 // W12,W8,W4,W0,W28,W24,W20,W16
984 // W8,W4,W0,W28,W24,W20,W16,W12
985 W_PRECALC_32_79_0 W8,W20,W16,W12
995 // W4,W0,W28,W24,W20,W16,W12,W8
996 W_PRECALC_32_79_0 W4,W16,W12,W8
998 W_PRECALC_32_79_1 W24,W8
1000 W_PRECALC_32_79_2 W8
1002 W_PRECALC_32_79_3 W8,42,K_XMM
1008 // W0,W28,W24,W20,W16,W12,W8,W4
1009 W_PRECALC_32_79_0 W0,W12,W8,W4
1019 // W28,W24,W20,W16,W12,W8,W4,W0
1020 W_PRECALC_32_79_0 W28,W8,W4,W0
1030 // W24,W20,W16,W12,W8,W4,W0,W28
1049 // W20,W16,W12,W8,W4,W0,W28,W24
1056 W_PRECALC_32_79_1 W8,W24
1070 // W16,W12,W8,W4,W0,W28,W24,W20
1083 // i=0 : W28,W24,W20,W16,W12,W8,W4,W0
1093 // i=4 : W24,W20,W16,W12,W8,W4,W0,W28
1103 // i=8 : W20,W16,W12,W8,W4,W0,W28,W24
1113 // i=12 : W16,W12,W8,W4,W0,W28,W24,W20