Target/R600/AMDGPUISelLowering.h

249259Sdim//===-- AMDGPUISelLowering.h - AMDGPU Lowering Interface --------*- C++ -*-===//
249259Sdim//
249259Sdim//                     The LLVM Compiler Infrastructure
249259Sdim//
249259Sdim// This file is distributed under the University of Illinois Open Source
249259Sdim// License. See LICENSE.TXT for details.
249259Sdim//
249259Sdim//===----------------------------------------------------------------------===//
249259Sdim//
249259Sdim/// \file
249259Sdim/// \brief Interface definition of the TargetLowering class that is common
249259Sdim/// to all AMD GPUs.
249259Sdim//
249259Sdim//===----------------------------------------------------------------------===//
249259Sdim
249259Sdim#ifndef AMDGPUISELLOWERING_H
249259Sdim#define AMDGPUISELLOWERING_H
249259Sdim
249259Sdim#include "llvm/Target/TargetLowering.h"
249259Sdim
249259Sdimnamespace llvm {
249259Sdim
263508Sdimclass AMDGPUMachineFunction;
249259Sdimclass MachineRegisterInfo;
249259Sdim
249259Sdimclass AMDGPUTargetLowering : public TargetLowering {
249259Sdimprivate:
263508Sdim  void ExtractVectorElements(SDValue Op, SelectionDAG &DAG,
263508Sdim                             SmallVectorImpl<SDValue> &Args,
263508Sdim                             unsigned Start, unsigned Count) const;
263508Sdim  SDValue LowerFrameIndex(SDValue Op, SelectionDAG &DAG) const;
263508Sdim  SDValue LowerEXTRACT_SUBVECTOR(SDValue Op, SelectionDAG &DAG) const;
263508Sdim  SDValue LowerCONCAT_VECTORS(SDValue Op, SelectionDAG &DAG) const;
249259Sdim  SDValue LowerINTRINSIC_WO_CHAIN(SDValue Op, SelectionDAG &DAG) const;
263508Sdim  /// \brief Lower vector stores by merging the vector elements into an integer
263508Sdim  /// of the same bitwidth.
263508Sdim  SDValue MergeVectorStore(const SDValue &Op, SelectionDAG &DAG) const;
263508Sdim  /// \brief Split a vector store into multiple scalar stores.
263508Sdim  /// \returns The resulting chain.
249259Sdim  SDValue LowerUDIVREM(SDValue Op, SelectionDAG &DAG) const;
263508Sdim  SDValue LowerUINT_TO_FP(SDValue Op, SelectionDAG &DAG) const;
249259Sdim
249259Sdimprotected:
249259Sdim
249259Sdim  /// \brief Helper function that adds Reg to the LiveIn list of the DAG's
249259Sdim  /// MachineFunction.
249259Sdim  ///
249259Sdim  /// \returns a RegisterSDNode representing Reg.
263508Sdim  virtual SDValue CreateLiveInRegister(SelectionDAG &DAG,
263508Sdim                                       const TargetRegisterClass *RC,
263508Sdim                                       unsigned Reg, EVT VT) const;
263508Sdim  SDValue LowerGlobalAddress(AMDGPUMachineFunction *MFI, SDValue Op,
263508Sdim                             SelectionDAG &DAG) const;
263508Sdim  /// \brief Split a vector load into multiple scalar loads.
263508Sdim  SDValue SplitVectorLoad(const SDValue &Op, SelectionDAG &DAG) const;
263508Sdim  SDValue SplitVectorStore(SDValue Op, SelectionDAG &DAG) const;
263508Sdim  SDValue LowerSTORE(SDValue Op, SelectionDAG &DAG) const;
249259Sdim  bool isHWTrueValue(SDValue Op) const;
249259Sdim  bool isHWFalseValue(SDValue Op) const;
249259Sdim
263508Sdim  /// The SelectionDAGBuilder will automatically promote function arguments
263508Sdim  /// with illegal types.  However, this does not work for the AMDGPU targets
263508Sdim  /// since the function arguments are stored in memory as these illegal types.
263508Sdim  /// In order to handle this properly we need to get the origianl types sizes
263508Sdim  /// from the LLVM IR Function and fixup the ISD:InputArg values before
263508Sdim  /// passing them to AnalyzeFormalArguments()
263508Sdim  void getOriginalFunctionArgs(SelectionDAG &DAG,
263508Sdim                               const Function *F,
263508Sdim                               const SmallVectorImpl<ISD::InputArg> &Ins,
263508Sdim                               SmallVectorImpl<ISD::InputArg> &OrigIns) const;
249259Sdim  void AnalyzeFormalArguments(CCState &State,
249259Sdim                              const SmallVectorImpl<ISD::InputArg> &Ins) const;
249259Sdim
249259Sdimpublic:
249259Sdim  AMDGPUTargetLowering(TargetMachine &TM);
249259Sdim
263508Sdim  virtual bool isFAbsFree(EVT VT) const;
263508Sdim  virtual bool isFNegFree(EVT VT) const;
263508Sdim  virtual MVT getVectorIdxTy() const;
263508Sdim  virtual bool isLoadBitCastBeneficial(EVT, EVT) const LLVM_OVERRIDE;
249259Sdim  virtual SDValue LowerReturn(SDValue Chain, CallingConv::ID CallConv,
249259Sdim                              bool isVarArg,
249259Sdim                              const SmallVectorImpl<ISD::OutputArg> &Outs,
249259Sdim                              const SmallVectorImpl<SDValue> &OutVals,
263508Sdim                              SDLoc DL, SelectionDAG &DAG) const;
249259Sdim  virtual SDValue LowerCall(CallLoweringInfo &CLI,
249259Sdim                            SmallVectorImpl<SDValue> &InVals) const {
249259Sdim    CLI.Callee.dump();
249259Sdim    llvm_unreachable("Undefined function");
249259Sdim  }
249259Sdim
249259Sdim  virtual SDValue LowerOperation(SDValue Op, SelectionDAG &DAG) const;
249259Sdim  SDValue LowerIntrinsicIABS(SDValue Op, SelectionDAG &DAG) const;
249259Sdim  SDValue LowerIntrinsicLRP(SDValue Op, SelectionDAG &DAG) const;
249259Sdim  SDValue LowerMinMax(SDValue Op, SelectionDAG &DAG) const;
249259Sdim  virtual const char* getTargetNodeName(unsigned Opcode) const;
249259Sdim
249259Sdim  virtual SDNode *PostISelFolding(MachineSDNode *N, SelectionDAG &DAG) const {
249259Sdim    return N;
249259Sdim  }
249259Sdim
249259Sdim// Functions defined in AMDILISelLowering.cpp
249259Sdimpublic:
249259Sdim
249259Sdim  /// \brief Determine which of the bits specified in \p Mask are known to be
249259Sdim  /// either zero or one and return them in the \p KnownZero and \p KnownOne
249259Sdim  /// bitsets.
249259Sdim  virtual void computeMaskedBitsForTargetNode(const SDValue Op,
249259Sdim                                              APInt &KnownZero,
249259Sdim                                              APInt &KnownOne,
249259Sdim                                              const SelectionDAG &DAG,
249259Sdim                                              unsigned Depth = 0) const;
249259Sdim
249259Sdim  virtual bool getTgtMemIntrinsic(IntrinsicInfo &Info,
249259Sdim                                  const CallInst &I, unsigned Intrinsic) const;
249259Sdim
249259Sdim  /// We want to mark f32/f64 floating point values as legal.
249259Sdim  bool isFPImmLegal(const APFloat &Imm, EVT VT) const;
249259Sdim
249259Sdim  /// We don't want to shrink f64/f32 constants.
249259Sdim  bool ShouldShrinkFPConstant(EVT VT) const;
249259Sdim
249259Sdimprivate:
249259Sdim  void InitAMDILLowering();
249259Sdim  SDValue LowerSREM(SDValue Op, SelectionDAG &DAG) const;
249259Sdim  SDValue LowerSREM8(SDValue Op, SelectionDAG &DAG) const;
249259Sdim  SDValue LowerSREM16(SDValue Op, SelectionDAG &DAG) const;
249259Sdim  SDValue LowerSREM32(SDValue Op, SelectionDAG &DAG) const;
249259Sdim  SDValue LowerSREM64(SDValue Op, SelectionDAG &DAG) const;
249259Sdim  SDValue LowerSDIV(SDValue Op, SelectionDAG &DAG) const;
249259Sdim  SDValue LowerSDIV24(SDValue Op, SelectionDAG &DAG) const;
249259Sdim  SDValue LowerSDIV32(SDValue Op, SelectionDAG &DAG) const;
249259Sdim  SDValue LowerSDIV64(SDValue Op, SelectionDAG &DAG) const;
249259Sdim  SDValue LowerSIGN_EXTEND_INREG(SDValue Op, SelectionDAG &DAG) const;
249259Sdim  EVT genIntType(uint32_t size = 32, uint32_t numEle = 1) const;
249259Sdim  SDValue LowerBRCOND(SDValue Op, SelectionDAG &DAG) const;
249259Sdim  SDValue LowerFP_ROUND(SDValue Op, SelectionDAG &DAG) const;
249259Sdim};
249259Sdim
249259Sdimnamespace AMDGPUISD {
249259Sdim
249259Sdimenum {
249259Sdim  // AMDIL ISD Opcodes
249259Sdim  FIRST_NUMBER = ISD::BUILTIN_OP_END,
249259Sdim  CALL,        // Function call based on a single integer
249259Sdim  UMUL,        // 32bit unsigned multiplication
249259Sdim  DIV_INF,      // Divide with infinity returned on zero divisor
249259Sdim  RET_FLAG,
249259Sdim  BRANCH_COND,
249259Sdim  // End AMDIL ISD Opcodes
249259Sdim  DWORDADDR,
249259Sdim  FRACT,
263508Sdim  COS_HW,
263508Sdim  SIN_HW,
249259Sdim  FMAX,
249259Sdim  SMAX,
249259Sdim  UMAX,
249259Sdim  FMIN,
249259Sdim  SMIN,
249259Sdim  UMIN,
249259Sdim  URECIP,
263508Sdim  DOT4,
263508Sdim  TEXTURE_FETCH,
249259Sdim  EXPORT,
249259Sdim  CONST_ADDRESS,
249259Sdim  REGISTER_LOAD,
249259Sdim  REGISTER_STORE,
263508Sdim  LOAD_INPUT,
263508Sdim  SAMPLE,
263508Sdim  SAMPLEB,
263508Sdim  SAMPLED,
263508Sdim  SAMPLEL,
263508Sdim  FIRST_MEM_OPCODE_NUMBER = ISD::FIRST_TARGET_MEMORY_OPCODE,
263508Sdim  STORE_MSKOR,
263508Sdim  LOAD_CONSTANT,
263508Sdim  TBUFFER_STORE_FORMAT,
249259Sdim  LAST_AMDGPU_ISD_NUMBER
249259Sdim};
249259Sdim
249259Sdim
249259Sdim} // End namespace AMDGPUISD
249259Sdim
249259Sdim} // End namespace llvm
249259Sdim
249259Sdim#endif // AMDGPUISELLOWERING_H