Target/R600/AMDILISelLowering.cpp

249259Sdim//===-- AMDILISelLowering.cpp - AMDIL DAG Lowering Implementation ---------===//
249259Sdim//
249259Sdim//                     The LLVM Compiler Infrastructure
249259Sdim//
249259Sdim// This file is distributed under the University of Illinois Open Source
249259Sdim// License. See LICENSE.TXT for details.
249259Sdim//
249259Sdim//==-----------------------------------------------------------------------===//
249259Sdim//
249259Sdim/// \file
249259Sdim/// \brief TargetLowering functions borrowed from AMDIL.
249259Sdim//
249259Sdim//===----------------------------------------------------------------------===//
249259Sdim
249259Sdim#include "AMDGPUISelLowering.h"
249259Sdim#include "AMDGPURegisterInfo.h"
249259Sdim#include "AMDGPUSubtarget.h"
249259Sdim#include "AMDILIntrinsicInfo.h"
249259Sdim#include "llvm/CodeGen/MachineFrameInfo.h"
249259Sdim#include "llvm/CodeGen/MachineRegisterInfo.h"
249259Sdim#include "llvm/CodeGen/PseudoSourceValue.h"
249259Sdim#include "llvm/CodeGen/SelectionDAG.h"
249259Sdim#include "llvm/CodeGen/SelectionDAGNodes.h"
249259Sdim#include "llvm/CodeGen/TargetLoweringObjectFileImpl.h"
249259Sdim#include "llvm/IR/CallingConv.h"
249259Sdim#include "llvm/IR/DerivedTypes.h"
249259Sdim#include "llvm/IR/Instructions.h"
249259Sdim#include "llvm/IR/Intrinsics.h"
249259Sdim#include "llvm/Support/raw_ostream.h"
249259Sdim#include "llvm/Target/TargetInstrInfo.h"
249259Sdim#include "llvm/Target/TargetOptions.h"
249259Sdim
249259Sdimusing namespace llvm;
249259Sdim//===----------------------------------------------------------------------===//
249259Sdim// TargetLowering Implementation Help Functions End
249259Sdim//===----------------------------------------------------------------------===//
249259Sdim
249259Sdim//===----------------------------------------------------------------------===//
249259Sdim// TargetLowering Class Implementation Begins
249259Sdim//===----------------------------------------------------------------------===//
249259Sdimvoid AMDGPUTargetLowering::InitAMDILLowering() {
263509Sdim  static const int types[] = {
249259Sdim    (int)MVT::i8,
249259Sdim    (int)MVT::i16,
249259Sdim    (int)MVT::i32,
249259Sdim    (int)MVT::f32,
249259Sdim    (int)MVT::f64,
249259Sdim    (int)MVT::i64,
249259Sdim    (int)MVT::v2i8,
249259Sdim    (int)MVT::v4i8,
249259Sdim    (int)MVT::v2i16,
249259Sdim    (int)MVT::v4i16,
249259Sdim    (int)MVT::v4f32,
249259Sdim    (int)MVT::v4i32,
249259Sdim    (int)MVT::v2f32,
249259Sdim    (int)MVT::v2i32,
249259Sdim    (int)MVT::v2f64,
249259Sdim    (int)MVT::v2i64
249259Sdim  };
249259Sdim
263509Sdim  static const int IntTypes[] = {
249259Sdim    (int)MVT::i8,
249259Sdim    (int)MVT::i16,
249259Sdim    (int)MVT::i32,
249259Sdim    (int)MVT::i64
249259Sdim  };
249259Sdim
263509Sdim  static const int FloatTypes[] = {
249259Sdim    (int)MVT::f32,
249259Sdim    (int)MVT::f64
249259Sdim  };
249259Sdim
263509Sdim  static const int VectorTypes[] = {
249259Sdim    (int)MVT::v2i8,
249259Sdim    (int)MVT::v4i8,
249259Sdim    (int)MVT::v2i16,
249259Sdim    (int)MVT::v4i16,
249259Sdim    (int)MVT::v4f32,
249259Sdim    (int)MVT::v4i32,
249259Sdim    (int)MVT::v2f32,
249259Sdim    (int)MVT::v2i32,
249259Sdim    (int)MVT::v2f64,
249259Sdim    (int)MVT::v2i64
249259Sdim  };
263509Sdim  const size_t NumTypes = array_lengthof(types);
263509Sdim  const size_t NumFloatTypes = array_lengthof(FloatTypes);
263509Sdim  const size_t NumIntTypes = array_lengthof(IntTypes);
263509Sdim  const size_t NumVectorTypes = array_lengthof(VectorTypes);
249259Sdim
249259Sdim  const AMDGPUSubtarget &STM = getTargetMachine().getSubtarget<AMDGPUSubtarget>();
249259Sdim  // These are the current register classes that are
249259Sdim  // supported
249259Sdim
249259Sdim  for (unsigned int x  = 0; x < NumTypes; ++x) {
249259Sdim    MVT::SimpleValueType VT = (MVT::SimpleValueType)types[x];
249259Sdim
249259Sdim    //FIXME: SIGN_EXTEND_INREG is not meaningful for floating point types
249259Sdim    // We cannot sextinreg, expand to shifts
249259Sdim    setOperationAction(ISD::SIGN_EXTEND_INREG, VT, Custom);
249259Sdim    setOperationAction(ISD::SUBE, VT, Expand);
249259Sdim    setOperationAction(ISD::SUBC, VT, Expand);
249259Sdim    setOperationAction(ISD::ADDE, VT, Expand);
249259Sdim    setOperationAction(ISD::ADDC, VT, Expand);
249259Sdim    setOperationAction(ISD::BRCOND, VT, Custom);
249259Sdim    setOperationAction(ISD::BR_JT, VT, Expand);
249259Sdim    setOperationAction(ISD::BRIND, VT, Expand);
249259Sdim    // TODO: Implement custom UREM/SREM routines
249259Sdim    setOperationAction(ISD::SREM, VT, Expand);
249259Sdim    setOperationAction(ISD::SMUL_LOHI, VT, Expand);
249259Sdim    setOperationAction(ISD::UMUL_LOHI, VT, Expand);
249259Sdim    if (VT != MVT::i64 && VT != MVT::v2i64) {
249259Sdim      setOperationAction(ISD::SDIV, VT, Custom);
249259Sdim    }
249259Sdim  }
249259Sdim  for (unsigned int x = 0; x < NumFloatTypes; ++x) {
249259Sdim    MVT::SimpleValueType VT = (MVT::SimpleValueType)FloatTypes[x];
249259Sdim
249259Sdim    // IL does not have these operations for floating point types
249259Sdim    setOperationAction(ISD::FP_ROUND_INREG, VT, Expand);
249259Sdim    setOperationAction(ISD::SETOLT, VT, Expand);
249259Sdim    setOperationAction(ISD::SETOGE, VT, Expand);
249259Sdim    setOperationAction(ISD::SETOGT, VT, Expand);
249259Sdim    setOperationAction(ISD::SETOLE, VT, Expand);
249259Sdim    setOperationAction(ISD::SETULT, VT, Expand);
249259Sdim    setOperationAction(ISD::SETUGE, VT, Expand);
249259Sdim    setOperationAction(ISD::SETUGT, VT, Expand);
249259Sdim    setOperationAction(ISD::SETULE, VT, Expand);
249259Sdim  }
249259Sdim
249259Sdim  for (unsigned int x = 0; x < NumIntTypes; ++x) {
249259Sdim    MVT::SimpleValueType VT = (MVT::SimpleValueType)IntTypes[x];
249259Sdim
249259Sdim    // GPU also does not have divrem function for signed or unsigned
249259Sdim    setOperationAction(ISD::SDIVREM, VT, Expand);
249259Sdim
249259Sdim    // GPU does not have [S|U]MUL_LOHI functions as a single instruction
249259Sdim    setOperationAction(ISD::SMUL_LOHI, VT, Expand);
249259Sdim    setOperationAction(ISD::UMUL_LOHI, VT, Expand);
249259Sdim
249259Sdim    setOperationAction(ISD::BSWAP, VT, Expand);
249259Sdim
249259Sdim    // GPU doesn't have any counting operators
249259Sdim    setOperationAction(ISD::CTPOP, VT, Expand);
249259Sdim    setOperationAction(ISD::CTTZ, VT, Expand);
249259Sdim    setOperationAction(ISD::CTLZ, VT, Expand);
249259Sdim  }
249259Sdim
249259Sdim  for (unsigned int ii = 0; ii < NumVectorTypes; ++ii) {
249259Sdim    MVT::SimpleValueType VT = (MVT::SimpleValueType)VectorTypes[ii];
249259Sdim
249259Sdim    setOperationAction(ISD::VECTOR_SHUFFLE, VT, Expand);
249259Sdim    setOperationAction(ISD::SDIVREM, VT, Expand);
249259Sdim    setOperationAction(ISD::SMUL_LOHI, VT, Expand);
249259Sdim    // setOperationAction(ISD::VSETCC, VT, Expand);
249259Sdim    setOperationAction(ISD::SELECT_CC, VT, Expand);
249259Sdim
249259Sdim  }
263509Sdim  setOperationAction(ISD::MULHU, MVT::i64, Expand);
263509Sdim  setOperationAction(ISD::MULHU, MVT::v2i64, Expand);
263509Sdim  setOperationAction(ISD::MULHS, MVT::i64, Expand);
263509Sdim  setOperationAction(ISD::MULHS, MVT::v2i64, Expand);
263509Sdim  setOperationAction(ISD::ADD, MVT::v2i64, Expand);
263509Sdim  setOperationAction(ISD::SREM, MVT::v2i64, Expand);
263509Sdim  setOperationAction(ISD::Constant          , MVT::i64  , Legal);
263509Sdim  setOperationAction(ISD::SDIV, MVT::v2i64, Expand);
263509Sdim  setOperationAction(ISD::TRUNCATE, MVT::v2i64, Expand);
263509Sdim  setOperationAction(ISD::SIGN_EXTEND, MVT::v2i64, Expand);
263509Sdim  setOperationAction(ISD::ZERO_EXTEND, MVT::v2i64, Expand);
263509Sdim  setOperationAction(ISD::ANY_EXTEND, MVT::v2i64, Expand);
263509Sdim  if (STM.hasHWFP64()) {
249259Sdim    // we support loading/storing v2f64 but not operations on the type
249259Sdim    setOperationAction(ISD::FADD, MVT::v2f64, Expand);
249259Sdim    setOperationAction(ISD::FSUB, MVT::v2f64, Expand);
249259Sdim    setOperationAction(ISD::FMUL, MVT::v2f64, Expand);
249259Sdim    setOperationAction(ISD::FP_ROUND_INREG, MVT::v2f64, Expand);
249259Sdim    setOperationAction(ISD::FP_EXTEND, MVT::v2f64, Expand);
249259Sdim    setOperationAction(ISD::ConstantFP        , MVT::f64  , Legal);
249259Sdim    // We want to expand vector conversions into their scalar
249259Sdim    // counterparts.
249259Sdim    setOperationAction(ISD::TRUNCATE, MVT::v2f64, Expand);
249259Sdim    setOperationAction(ISD::SIGN_EXTEND, MVT::v2f64, Expand);
249259Sdim    setOperationAction(ISD::ZERO_EXTEND, MVT::v2f64, Expand);
249259Sdim    setOperationAction(ISD::ANY_EXTEND, MVT::v2f64, Expand);
249259Sdim    setOperationAction(ISD::FABS, MVT::f64, Expand);
249259Sdim    setOperationAction(ISD::FABS, MVT::v2f64, Expand);
249259Sdim  }
249259Sdim  // TODO: Fix the UDIV24 algorithm so it works for these
249259Sdim  // types correctly. This needs vector comparisons
249259Sdim  // for this to work correctly.
249259Sdim  setOperationAction(ISD::UDIV, MVT::v2i8, Expand);
249259Sdim  setOperationAction(ISD::UDIV, MVT::v4i8, Expand);
249259Sdim  setOperationAction(ISD::UDIV, MVT::v2i16, Expand);
249259Sdim  setOperationAction(ISD::UDIV, MVT::v4i16, Expand);
249259Sdim  setOperationAction(ISD::SIGN_EXTEND_INREG, MVT::i1, Custom);
249259Sdim  setOperationAction(ISD::SUBC, MVT::Other, Expand);
249259Sdim  setOperationAction(ISD::ADDE, MVT::Other, Expand);
249259Sdim  setOperationAction(ISD::ADDC, MVT::Other, Expand);
249259Sdim  setOperationAction(ISD::BRCOND, MVT::Other, Custom);
249259Sdim  setOperationAction(ISD::BR_JT, MVT::Other, Expand);
249259Sdim  setOperationAction(ISD::BRIND, MVT::Other, Expand);
249259Sdim  setOperationAction(ISD::SIGN_EXTEND_INREG, MVT::Other, Expand);
249259Sdim
249259Sdim
249259Sdim  // Use the default implementation.
249259Sdim  setOperationAction(ISD::ConstantFP        , MVT::f32    , Legal);
249259Sdim  setOperationAction(ISD::Constant          , MVT::i32    , Legal);
249259Sdim
249259Sdim  setSchedulingPreference(Sched::RegPressure);
249259Sdim  setPow2DivIsCheap(false);
249259Sdim  setSelectIsExpensive(true);
249259Sdim  setJumpIsExpensive(true);
249259Sdim
249259Sdim  MaxStoresPerMemcpy  = 4096;
249259Sdim  MaxStoresPerMemmove = 4096;
249259Sdim  MaxStoresPerMemset  = 4096;
249259Sdim
249259Sdim}
249259Sdim
249259Sdimbool
249259SdimAMDGPUTargetLowering::getTgtMemIntrinsic(IntrinsicInfo &Info,
249259Sdim    const CallInst &I, unsigned Intrinsic) const {
249259Sdim  return false;
249259Sdim}
249259Sdim
249259Sdim// The backend supports 32 and 64 bit floating point immediates
249259Sdimbool
249259SdimAMDGPUTargetLowering::isFPImmLegal(const APFloat &Imm, EVT VT) const {
249259Sdim  if (VT.getScalarType().getSimpleVT().SimpleTy == MVT::f32
249259Sdim      || VT.getScalarType().getSimpleVT().SimpleTy == MVT::f64) {
249259Sdim    return true;
249259Sdim  } else {
249259Sdim    return false;
249259Sdim  }
249259Sdim}
249259Sdim
249259Sdimbool
249259SdimAMDGPUTargetLowering::ShouldShrinkFPConstant(EVT VT) const {
249259Sdim  if (VT.getScalarType().getSimpleVT().SimpleTy == MVT::f32
249259Sdim      || VT.getScalarType().getSimpleVT().SimpleTy == MVT::f64) {
249259Sdim    return false;
249259Sdim  } else {
249259Sdim    return true;
249259Sdim  }
249259Sdim}
249259Sdim
249259Sdim
249259Sdim// isMaskedValueZeroForTargetNode - Return true if 'Op & Mask' is known to
249259Sdim// be zero. Op is expected to be a target specific node. Used by DAG
249259Sdim// combiner.
249259Sdim
249259Sdimvoid
249259SdimAMDGPUTargetLowering::computeMaskedBitsForTargetNode(
249259Sdim    const SDValue Op,
249259Sdim    APInt &KnownZero,
249259Sdim    APInt &KnownOne,
249259Sdim    const SelectionDAG &DAG,
249259Sdim    unsigned Depth) const {
249259Sdim  APInt KnownZero2;
249259Sdim  APInt KnownOne2;
249259Sdim  KnownZero = KnownOne = APInt(KnownOne.getBitWidth(), 0); // Don't know anything
249259Sdim  switch (Op.getOpcode()) {
249259Sdim    default: break;
249259Sdim    case ISD::SELECT_CC:
249259Sdim             DAG.ComputeMaskedBits(
249259Sdim                 Op.getOperand(1),
249259Sdim                 KnownZero,
249259Sdim                 KnownOne,
249259Sdim                 Depth + 1
249259Sdim                 );
249259Sdim             DAG.ComputeMaskedBits(
249259Sdim                 Op.getOperand(0),
249259Sdim                 KnownZero2,
249259Sdim                 KnownOne2
249259Sdim                 );
249259Sdim             assert((KnownZero & KnownOne) == 0
249259Sdim                 && "Bits known to be one AND zero?");
249259Sdim             assert((KnownZero2 & KnownOne2) == 0
249259Sdim                 && "Bits known to be one AND zero?");
249259Sdim             // Only known if known in both the LHS and RHS
249259Sdim             KnownOne &= KnownOne2;
249259Sdim             KnownZero &= KnownZero2;
249259Sdim             break;
249259Sdim  };
249259Sdim}
249259Sdim
249259Sdim//===----------------------------------------------------------------------===//
249259Sdim//                           Other Lowering Hooks
249259Sdim//===----------------------------------------------------------------------===//
249259Sdim
249259SdimSDValue
249259SdimAMDGPUTargetLowering::LowerSDIV(SDValue Op, SelectionDAG &DAG) const {
249259Sdim  EVT OVT = Op.getValueType();
249259Sdim  SDValue DST;
249259Sdim  if (OVT.getScalarType() == MVT::i64) {
249259Sdim    DST = LowerSDIV64(Op, DAG);
249259Sdim  } else if (OVT.getScalarType() == MVT::i32) {
249259Sdim    DST = LowerSDIV32(Op, DAG);
249259Sdim  } else if (OVT.getScalarType() == MVT::i16
249259Sdim      || OVT.getScalarType() == MVT::i8) {
249259Sdim    DST = LowerSDIV24(Op, DAG);
249259Sdim  } else {
249259Sdim    DST = SDValue(Op.getNode(), 0);
249259Sdim  }
249259Sdim  return DST;
249259Sdim}
249259Sdim
249259SdimSDValue
249259SdimAMDGPUTargetLowering::LowerSREM(SDValue Op, SelectionDAG &DAG) const {
249259Sdim  EVT OVT = Op.getValueType();
249259Sdim  SDValue DST;
249259Sdim  if (OVT.getScalarType() == MVT::i64) {
249259Sdim    DST = LowerSREM64(Op, DAG);
249259Sdim  } else if (OVT.getScalarType() == MVT::i32) {
249259Sdim    DST = LowerSREM32(Op, DAG);
249259Sdim  } else if (OVT.getScalarType() == MVT::i16) {
249259Sdim    DST = LowerSREM16(Op, DAG);
249259Sdim  } else if (OVT.getScalarType() == MVT::i8) {
249259Sdim    DST = LowerSREM8(Op, DAG);
249259Sdim  } else {
249259Sdim    DST = SDValue(Op.getNode(), 0);
249259Sdim  }
249259Sdim  return DST;
249259Sdim}
249259Sdim
249259SdimSDValue
249259SdimAMDGPUTargetLowering::LowerSIGN_EXTEND_INREG(SDValue Op, SelectionDAG &DAG) const {
249259Sdim  SDValue Data = Op.getOperand(0);
249259Sdim  VTSDNode *BaseType = cast<VTSDNode>(Op.getOperand(1));
263509Sdim  SDLoc DL(Op);
249259Sdim  EVT DVT = Data.getValueType();
249259Sdim  EVT BVT = BaseType->getVT();
249259Sdim  unsigned baseBits = BVT.getScalarType().getSizeInBits();
249259Sdim  unsigned srcBits = DVT.isSimple() ? DVT.getScalarType().getSizeInBits() : 1;
249259Sdim  unsigned shiftBits = srcBits - baseBits;
249259Sdim  if (srcBits < 32) {
249259Sdim    // If the op is less than 32 bits, then it needs to extend to 32bits
249259Sdim    // so it can properly keep the upper bits valid.
249259Sdim    EVT IVT = genIntType(32, DVT.isVector() ? DVT.getVectorNumElements() : 1);
249259Sdim    Data = DAG.getNode(ISD::ZERO_EXTEND, DL, IVT, Data);
249259Sdim    shiftBits = 32 - baseBits;
249259Sdim    DVT = IVT;
249259Sdim  }
249259Sdim  SDValue Shift = DAG.getConstant(shiftBits, DVT);
249259Sdim  // Shift left by 'Shift' bits.
249259Sdim  Data = DAG.getNode(ISD::SHL, DL, DVT, Data, Shift);
249259Sdim  // Signed shift Right by 'Shift' bits.
249259Sdim  Data = DAG.getNode(ISD::SRA, DL, DVT, Data, Shift);
249259Sdim  if (srcBits < 32) {
249259Sdim    // Once the sign extension is done, the op needs to be converted to
249259Sdim    // its original type.
249259Sdim    Data = DAG.getSExtOrTrunc(Data, DL, Op.getOperand(0).getValueType());
249259Sdim  }
249259Sdim  return Data;
249259Sdim}
249259SdimEVT
249259SdimAMDGPUTargetLowering::genIntType(uint32_t size, uint32_t numEle) const {
249259Sdim  int iSize = (size * numEle);
249259Sdim  int vEle = (iSize >> ((size == 64) ? 6 : 5));
249259Sdim  if (!vEle) {
249259Sdim    vEle = 1;
249259Sdim  }
249259Sdim  if (size == 64) {
249259Sdim    if (vEle == 1) {
249259Sdim      return EVT(MVT::i64);
249259Sdim    } else {
249259Sdim      return EVT(MVT::getVectorVT(MVT::i64, vEle));
249259Sdim    }
249259Sdim  } else {
249259Sdim    if (vEle == 1) {
249259Sdim      return EVT(MVT::i32);
249259Sdim    } else {
249259Sdim      return EVT(MVT::getVectorVT(MVT::i32, vEle));
249259Sdim    }
249259Sdim  }
249259Sdim}
249259Sdim
249259SdimSDValue
249259SdimAMDGPUTargetLowering::LowerBRCOND(SDValue Op, SelectionDAG &DAG) const {
249259Sdim  SDValue Chain = Op.getOperand(0);
249259Sdim  SDValue Cond  = Op.getOperand(1);
249259Sdim  SDValue Jump  = Op.getOperand(2);
249259Sdim  SDValue Result;
249259Sdim  Result = DAG.getNode(
249259Sdim      AMDGPUISD::BRANCH_COND,
263509Sdim      SDLoc(Op),
249259Sdim      Op.getValueType(),
249259Sdim      Chain, Jump, Cond);
249259Sdim  return Result;
249259Sdim}
249259Sdim
249259SdimSDValue
249259SdimAMDGPUTargetLowering::LowerSDIV24(SDValue Op, SelectionDAG &DAG) const {
263509Sdim  SDLoc DL(Op);
249259Sdim  EVT OVT = Op.getValueType();
249259Sdim  SDValue LHS = Op.getOperand(0);
249259Sdim  SDValue RHS = Op.getOperand(1);
249259Sdim  MVT INTTY;
249259Sdim  MVT FLTTY;
249259Sdim  if (!OVT.isVector()) {
249259Sdim    INTTY = MVT::i32;
249259Sdim    FLTTY = MVT::f32;
249259Sdim  } else if (OVT.getVectorNumElements() == 2) {
249259Sdim    INTTY = MVT::v2i32;
249259Sdim    FLTTY = MVT::v2f32;
249259Sdim  } else if (OVT.getVectorNumElements() == 4) {
249259Sdim    INTTY = MVT::v4i32;
249259Sdim    FLTTY = MVT::v4f32;
249259Sdim  }
249259Sdim  unsigned bitsize = OVT.getScalarType().getSizeInBits();
249259Sdim  // char|short jq = ia ^ ib;
249259Sdim  SDValue jq = DAG.getNode(ISD::XOR, DL, OVT, LHS, RHS);
249259Sdim
249259Sdim  // jq = jq >> (bitsize - 2)
249259Sdim  jq = DAG.getNode(ISD::SRA, DL, OVT, jq, DAG.getConstant(bitsize - 2, OVT));
249259Sdim
249259Sdim  // jq = jq | 0x1
249259Sdim  jq = DAG.getNode(ISD::OR, DL, OVT, jq, DAG.getConstant(1, OVT));
249259Sdim
249259Sdim  // jq = (int)jq
249259Sdim  jq = DAG.getSExtOrTrunc(jq, DL, INTTY);
249259Sdim
249259Sdim  // int ia = (int)LHS;
249259Sdim  SDValue ia = DAG.getSExtOrTrunc(LHS, DL, INTTY);
249259Sdim
249259Sdim  // int ib, (int)RHS;
249259Sdim  SDValue ib = DAG.getSExtOrTrunc(RHS, DL, INTTY);
249259Sdim
249259Sdim  // float fa = (float)ia;
249259Sdim  SDValue fa = DAG.getNode(ISD::SINT_TO_FP, DL, FLTTY, ia);
249259Sdim
249259Sdim  // float fb = (float)ib;
249259Sdim  SDValue fb = DAG.getNode(ISD::SINT_TO_FP, DL, FLTTY, ib);
249259Sdim
249259Sdim  // float fq = native_divide(fa, fb);
249259Sdim  SDValue fq = DAG.getNode(AMDGPUISD::DIV_INF, DL, FLTTY, fa, fb);
249259Sdim
249259Sdim  // fq = trunc(fq);
249259Sdim  fq = DAG.getNode(ISD::FTRUNC, DL, FLTTY, fq);
249259Sdim
249259Sdim  // float fqneg = -fq;
249259Sdim  SDValue fqneg = DAG.getNode(ISD::FNEG, DL, FLTTY, fq);
249259Sdim
249259Sdim  // float fr = mad(fqneg, fb, fa);
249259Sdim  SDValue fr = DAG.getNode(ISD::FADD, DL, FLTTY,
249259Sdim      DAG.getNode(ISD::MUL, DL, FLTTY, fqneg, fb), fa);
249259Sdim
249259Sdim  // int iq = (int)fq;
249259Sdim  SDValue iq = DAG.getNode(ISD::FP_TO_SINT, DL, INTTY, fq);
249259Sdim
249259Sdim  // fr = fabs(fr);
249259Sdim  fr = DAG.getNode(ISD::FABS, DL, FLTTY, fr);
249259Sdim
249259Sdim  // fb = fabs(fb);
249259Sdim  fb = DAG.getNode(ISD::FABS, DL, FLTTY, fb);
249259Sdim
249259Sdim  // int cv = fr >= fb;
249259Sdim  SDValue cv;
249259Sdim  if (INTTY == MVT::i32) {
249259Sdim    cv = DAG.getSetCC(DL, INTTY, fr, fb, ISD::SETOGE);
249259Sdim  } else {
249259Sdim    cv = DAG.getSetCC(DL, INTTY, fr, fb, ISD::SETOGE);
249259Sdim  }
249259Sdim  // jq = (cv ? jq : 0);
249259Sdim  jq = DAG.getNode(ISD::SELECT, DL, OVT, cv, jq,
249259Sdim      DAG.getConstant(0, OVT));
249259Sdim  // dst = iq + jq;
249259Sdim  iq = DAG.getSExtOrTrunc(iq, DL, OVT);
249259Sdim  iq = DAG.getNode(ISD::ADD, DL, OVT, iq, jq);
249259Sdim  return iq;
249259Sdim}
249259Sdim
249259SdimSDValue
249259SdimAMDGPUTargetLowering::LowerSDIV32(SDValue Op, SelectionDAG &DAG) const {
263509Sdim  SDLoc DL(Op);
249259Sdim  EVT OVT = Op.getValueType();
249259Sdim  SDValue LHS = Op.getOperand(0);
249259Sdim  SDValue RHS = Op.getOperand(1);
249259Sdim  // The LowerSDIV32 function generates equivalent to the following IL.
249259Sdim  // mov r0, LHS
249259Sdim  // mov r1, RHS
249259Sdim  // ilt r10, r0, 0
249259Sdim  // ilt r11, r1, 0
249259Sdim  // iadd r0, r0, r10
249259Sdim  // iadd r1, r1, r11
249259Sdim  // ixor r0, r0, r10
249259Sdim  // ixor r1, r1, r11
249259Sdim  // udiv r0, r0, r1
249259Sdim  // ixor r10, r10, r11
249259Sdim  // iadd r0, r0, r10
249259Sdim  // ixor DST, r0, r10
249259Sdim
249259Sdim  // mov r0, LHS
249259Sdim  SDValue r0 = LHS;
249259Sdim
249259Sdim  // mov r1, RHS
249259Sdim  SDValue r1 = RHS;
249259Sdim
249259Sdim  // ilt r10, r0, 0
249259Sdim  SDValue r10 = DAG.getSelectCC(DL,
249259Sdim      r0, DAG.getConstant(0, OVT),
249259Sdim      DAG.getConstant(-1, MVT::i32),
249259Sdim      DAG.getConstant(0, MVT::i32),
249259Sdim      ISD::SETLT);
249259Sdim
249259Sdim  // ilt r11, r1, 0
249259Sdim  SDValue r11 = DAG.getSelectCC(DL,
249259Sdim      r1, DAG.getConstant(0, OVT),
249259Sdim      DAG.getConstant(-1, MVT::i32),
249259Sdim      DAG.getConstant(0, MVT::i32),
249259Sdim      ISD::SETLT);
249259Sdim
249259Sdim  // iadd r0, r0, r10
249259Sdim  r0 = DAG.getNode(ISD::ADD, DL, OVT, r0, r10);
249259Sdim
249259Sdim  // iadd r1, r1, r11
249259Sdim  r1 = DAG.getNode(ISD::ADD, DL, OVT, r1, r11);
249259Sdim
249259Sdim  // ixor r0, r0, r10
249259Sdim  r0 = DAG.getNode(ISD::XOR, DL, OVT, r0, r10);
249259Sdim
249259Sdim  // ixor r1, r1, r11
249259Sdim  r1 = DAG.getNode(ISD::XOR, DL, OVT, r1, r11);
249259Sdim
249259Sdim  // udiv r0, r0, r1
249259Sdim  r0 = DAG.getNode(ISD::UDIV, DL, OVT, r0, r1);
249259Sdim
249259Sdim  // ixor r10, r10, r11
249259Sdim  r10 = DAG.getNode(ISD::XOR, DL, OVT, r10, r11);
249259Sdim
249259Sdim  // iadd r0, r0, r10
249259Sdim  r0 = DAG.getNode(ISD::ADD, DL, OVT, r0, r10);
249259Sdim
249259Sdim  // ixor DST, r0, r10
249259Sdim  SDValue DST = DAG.getNode(ISD::XOR, DL, OVT, r0, r10);
249259Sdim  return DST;
249259Sdim}
249259Sdim
249259SdimSDValue
249259SdimAMDGPUTargetLowering::LowerSDIV64(SDValue Op, SelectionDAG &DAG) const {
249259Sdim  return SDValue(Op.getNode(), 0);
249259Sdim}
249259Sdim
249259SdimSDValue
249259SdimAMDGPUTargetLowering::LowerSREM8(SDValue Op, SelectionDAG &DAG) const {
263509Sdim  SDLoc DL(Op);
249259Sdim  EVT OVT = Op.getValueType();
249259Sdim  MVT INTTY = MVT::i32;
249259Sdim  if (OVT == MVT::v2i8) {
249259Sdim    INTTY = MVT::v2i32;
249259Sdim  } else if (OVT == MVT::v4i8) {
249259Sdim    INTTY = MVT::v4i32;
249259Sdim  }
249259Sdim  SDValue LHS = DAG.getSExtOrTrunc(Op.getOperand(0), DL, INTTY);
249259Sdim  SDValue RHS = DAG.getSExtOrTrunc(Op.getOperand(1), DL, INTTY);
249259Sdim  LHS = DAG.getNode(ISD::SREM, DL, INTTY, LHS, RHS);
249259Sdim  LHS = DAG.getSExtOrTrunc(LHS, DL, OVT);
249259Sdim  return LHS;
249259Sdim}
249259Sdim
249259SdimSDValue
249259SdimAMDGPUTargetLowering::LowerSREM16(SDValue Op, SelectionDAG &DAG) const {
263509Sdim  SDLoc DL(Op);
249259Sdim  EVT OVT = Op.getValueType();
249259Sdim  MVT INTTY = MVT::i32;
249259Sdim  if (OVT == MVT::v2i16) {
249259Sdim    INTTY = MVT::v2i32;
249259Sdim  } else if (OVT == MVT::v4i16) {
249259Sdim    INTTY = MVT::v4i32;
249259Sdim  }
249259Sdim  SDValue LHS = DAG.getSExtOrTrunc(Op.getOperand(0), DL, INTTY);
249259Sdim  SDValue RHS = DAG.getSExtOrTrunc(Op.getOperand(1), DL, INTTY);
249259Sdim  LHS = DAG.getNode(ISD::SREM, DL, INTTY, LHS, RHS);
249259Sdim  LHS = DAG.getSExtOrTrunc(LHS, DL, OVT);
249259Sdim  return LHS;
249259Sdim}
249259Sdim
249259SdimSDValue
249259SdimAMDGPUTargetLowering::LowerSREM32(SDValue Op, SelectionDAG &DAG) const {
263509Sdim  SDLoc DL(Op);
249259Sdim  EVT OVT = Op.getValueType();
249259Sdim  SDValue LHS = Op.getOperand(0);
249259Sdim  SDValue RHS = Op.getOperand(1);
249259Sdim  // The LowerSREM32 function generates equivalent to the following IL.
249259Sdim  // mov r0, LHS
249259Sdim  // mov r1, RHS
249259Sdim  // ilt r10, r0, 0
249259Sdim  // ilt r11, r1, 0
249259Sdim  // iadd r0, r0, r10
249259Sdim  // iadd r1, r1, r11
249259Sdim  // ixor r0, r0, r10
249259Sdim  // ixor r1, r1, r11
249259Sdim  // udiv r20, r0, r1
249259Sdim  // umul r20, r20, r1
249259Sdim  // sub r0, r0, r20
249259Sdim  // iadd r0, r0, r10
249259Sdim  // ixor DST, r0, r10
249259Sdim
249259Sdim  // mov r0, LHS
249259Sdim  SDValue r0 = LHS;
249259Sdim
249259Sdim  // mov r1, RHS
249259Sdim  SDValue r1 = RHS;
249259Sdim
249259Sdim  // ilt r10, r0, 0
249259Sdim  SDValue r10 = DAG.getSetCC(DL, OVT, r0, DAG.getConstant(0, OVT), ISD::SETLT);
249259Sdim
249259Sdim  // ilt r11, r1, 0
249259Sdim  SDValue r11 = DAG.getSetCC(DL, OVT, r1, DAG.getConstant(0, OVT), ISD::SETLT);
249259Sdim
249259Sdim  // iadd r0, r0, r10
249259Sdim  r0 = DAG.getNode(ISD::ADD, DL, OVT, r0, r10);
249259Sdim
249259Sdim  // iadd r1, r1, r11
249259Sdim  r1 = DAG.getNode(ISD::ADD, DL, OVT, r1, r11);
249259Sdim
249259Sdim  // ixor r0, r0, r10
249259Sdim  r0 = DAG.getNode(ISD::XOR, DL, OVT, r0, r10);
249259Sdim
249259Sdim  // ixor r1, r1, r11
249259Sdim  r1 = DAG.getNode(ISD::XOR, DL, OVT, r1, r11);
249259Sdim
249259Sdim  // udiv r20, r0, r1
249259Sdim  SDValue r20 = DAG.getNode(ISD::UREM, DL, OVT, r0, r1);
249259Sdim
249259Sdim  // umul r20, r20, r1
249259Sdim  r20 = DAG.getNode(AMDGPUISD::UMUL, DL, OVT, r20, r1);
249259Sdim
249259Sdim  // sub r0, r0, r20
249259Sdim  r0 = DAG.getNode(ISD::SUB, DL, OVT, r0, r20);
249259Sdim
249259Sdim  // iadd r0, r0, r10
249259Sdim  r0 = DAG.getNode(ISD::ADD, DL, OVT, r0, r10);
249259Sdim
249259Sdim  // ixor DST, r0, r10
249259Sdim  SDValue DST = DAG.getNode(ISD::XOR, DL, OVT, r0, r10);
249259Sdim  return DST;
249259Sdim}
249259Sdim
249259SdimSDValue
249259SdimAMDGPUTargetLowering::LowerSREM64(SDValue Op, SelectionDAG &DAG) const {
249259Sdim  return SDValue(Op.getNode(), 0);
249259Sdim}