Lines Matching refs:W4

64 	Let W0 = {W[i] W[i+1] W[i+2] W[i+3]} be the current W-vector to be computed, W4 = {W[i-4] W[i-3] W[i-2] W[i-1]} be the previous vector, and so on
67 1. W0 = rotate_left(left_shift(W4,32) ^ W8 ^ left_shift(concatenate(W16,W12),64) ^ W16,1);
73 1. W0 = rotate_left(left_shift(concatenate(W8,W4),64) ^ W16 ^ W28 ^ W32, 2);
76 1. In total, we need 8 16-byte registers or memory for W0,W4,...,W28. W0 and W32 can be the same register or memory.
121 // symbolizing registers or stack memory with algorithmic variables W0,W4,...,W28 + W_TMP, W_TMP2, and XMM_SHUFB_BSWAP for code with ssse3 support
126 #define W4 %xmm3
213 .macro W_PRECALC_00_15_1_ssse3 // input argument $0 : current 16-bytes in the circular buffer, one of W0,W4,W8,...,W28
267 .macro W_PRECALC_00_15_1_nossse3 // input argument $0 : current 16-bytes in the circular buffer, one of W0,W4,W8,...,W28
290 .macro W_PRECALC_16_31_0_ssse3 // input arguments : W16,W12,W8,W4,W
293 xmov $3, W_TMP // W_TMP = W4
332 .macro W_PRECALC_16_31_0_nossse3 // input arguments : W16,W12,W8,W4,W
341 xmov $3, W_TMP // W_TMP = W4 = (w1 w2 w3 w4)
348 W = rotate_left(left_shift(concatenate(W8,W4),64) ^ W16 ^ W28 ^ W32, 2);
350 where left_shift(concatenate(W8,W4),64) is equivalent to W6. Note also that W32 and W use the same register.
361 .macro W_PRECALC_32_79_0_ssse3 // inputr arguments : W28,W8,W4,W
368 .macro W_PRECALC_32_79_0_nossse3 // input arguments : W28,W8,W4,W
378 .macro W_PRECALC_32_79_0_i386_ssse3 // input arguments : W28,W8,W4,W
382 xmov $2, W_TMP // W4
387 .macro W_PRECALC_32_79_0_i386_nossse3 // input arguments : W28,W8,W4,W
391 xmov $2, W_TMP // W4 = (w1 w2 w3 w4)
530 // i=0 : W28,W24,W20,W16,W12,W8,W4,W0
536 // i=4 : W24,W20,W16,W12,W8,W4,W0,W28
542 // i=8 : W20,W16,W12,W8,W4,W0,W28,W24
548 // i=12 : W16,W12,W8,W4,W0,W28,W24,W20
559 // i=16 : W12,W8,W4,W0,W28,W24,W20,W16
569 // i=20 : W8,W4,W0,W28,W24,W20,W16,W12
579 // i=24 : W4,W0,W28,W24,W20,W16,W12,W8
589 // i=28 : W0,W28,W24,W20,W16,W12,W8,W4
590 W_PRECALC_16_31_0 W20,W16,W12,W8,W4
592 W_PRECALC_16_31_1 W20,W4
594 W_PRECALC_16_31_2 W4
596 W_PRECALC_16_31_3 W4,14,16
599 // i=32 : W28,W24,W20,W16,W12,W8,W4,W0
600 W_PRECALC_32_79_0 W28,W8,W4,W0
611 // i=36 : W24,W20,W16,W12,W8,W4,W0,W28
613 W_PRECALC_32_79_0 W24,W4,W0,W28
615 W_PRECALC_32_79_0_i386 W24,W4,W0,W28
629 // i=40 : W20,W16,W12,W8,W4,W0,W28,W24
649 // i=44 : W16,W12,W8,W4,W0,W28,W24,W20
652 W_PRECALC_32_79_1 W4,W20
659 // i=48 : W12,W8,W4,W0,W28,W24,W20,W16
669 // i=52 : W8,W4,W0,W28,W24,W20,W16,W12
681 // i=56 : W4,W0,W28,W24,W20,W16,W12,W8
682 W_PRECALC_32_79_0 W4,W16,W12,W8
691 // i=60 : W0,W28,W24,W20,W16,W12,W8,W4
694 W_PRECALC_32_79_0 W0,W12,W8,W4
696 W_PRECALC_32_79_1 W20,W4
698 W_PRECALC_32_79_2 W4
700 W_PRECALC_32_79_3 W4,46,K_XMM
703 // i=64 : W28,W24,W20,W16,W12,W8,W4,W0
704 W_PRECALC_32_79_0 W28,W8,W4,W0
713 // i=68 : W24,W20,W16,W12,W8,W4,W0,W28
715 W_PRECALC_32_79_0 W24,W4,W0,W28
717 W_PRECALC_32_79_0_i386 W24,W4,W0,W28
731 // i=72 : W20,W16,W12,W8,W4,W0,W28,W24
751 // i=76 : W16,W12,W8,W4,W0,W28,W24,W20
754 W_PRECALC_32_79_1 W4,W20
764 // i=0 : W28,W24,W20,W16,W12,W8,W4,W0
774 // i=4 : W24,W20,W16,W12,W8,W4,W0,W28
784 // i=8 : W20,W16,W12,W8,W4,W0,W28,W24
794 // i=12 : W16,W12,W8,W4,W0,W28,W24,W20
835 // i=0 : W28,W24,W20,W16,W12,W8,W4,W0
841 // i=4 : W24,W20,W16,W12,W8,W4,W0,W28
847 // i=8 : W20,W16,W12,W8,W4,W0,W28,W24
853 // i=12 : W16,W12,W8,W4,W0,W28,W24,W20
864 // circular buffer : W12,W8,W4,W0,W28,W24,W20,W16
875 // W8,W4,W0,W28,W24,W20,W16,W12
887 // W4,W0,W28,W24,W20,W16,W12,W8
899 // W0,W28,W24,W20,W16,W12,W8,W4
900 W_PRECALC_16_31_0 W20,W16,W12,W8,W4
902 W_PRECALC_16_31_1 W20,W4
905 W_PRECALC_16_31_2 W4
907 W_PRECALC_16_31_3 W4,14,16
911 // W28,W24,W20,W16,W12,W8,W4,W0
912 W_PRECALC_32_79_0 W28,W8,W4,W0
922 // W24,W20,W16,W12,W8,W4,W0,W28
924 W_PRECALC_32_79_0 W24,W4,W0,W28
926 W_PRECALC_32_79_0_i386 W24,W4,W0,W28
943 // W20,W16,W12,W8,W4,W0,W28,W24
962 // W16,W12,W8,W4,W0,W28,W24,W20
965 W_PRECALC_32_79_1 W4,W20
973 // W12,W8,W4,W0,W28,W24,W20,W16
984 // W8,W4,W0,W28,W24,W20,W16,W12
995 // W4,W0,W28,W24,W20,W16,W12,W8
996 W_PRECALC_32_79_0 W4,W16,W12,W8
1008 // W0,W28,W24,W20,W16,W12,W8,W4
1009 W_PRECALC_32_79_0 W0,W12,W8,W4
1011 W_PRECALC_32_79_1 W20,W4
1013 W_PRECALC_32_79_2 W4
1015 W_PRECALC_32_79_3 W4,46,K_XMM
1019 // W28,W24,W20,W16,W12,W8,W4,W0
1020 W_PRECALC_32_79_0 W28,W8,W4,W0
1030 // W24,W20,W16,W12,W8,W4,W0,W28
1032 W_PRECALC_32_79_0 W24,W4,W0,W28
1034 W_PRECALC_32_79_0_i386 W24,W4,W0,W28
1049 // W20,W16,W12,W8,W4,W0,W28,W24
1070 // W16,W12,W8,W4,W0,W28,W24,W20
1073 W_PRECALC_32_79_1 W4,W20
1083 // i=0 : W28,W24,W20,W16,W12,W8,W4,W0
1093 // i=4 : W24,W20,W16,W12,W8,W4,W0,W28
1103 // i=8 : W20,W16,W12,W8,W4,W0,W28,W24
1113 // i=12 : W16,W12,W8,W4,W0,W28,W24,W20