Target/R600/AMDGPUInstrInfo.cpp

249259Sdim//===-- AMDGPUInstrInfo.cpp - Base class for AMD GPU InstrInfo ------------===//
249259Sdim//
249259Sdim//                     The LLVM Compiler Infrastructure
249259Sdim//
249259Sdim// This file is distributed under the University of Illinois Open Source
249259Sdim// License. See LICENSE.TXT for details.
249259Sdim//
249259Sdim//===----------------------------------------------------------------------===//
249259Sdim//
249259Sdim/// \file
249259Sdim/// \brief Implementation of the TargetInstrInfo class that is common to all
249259Sdim/// AMD GPUs.
249259Sdim//
249259Sdim//===----------------------------------------------------------------------===//
249259Sdim
249259Sdim#include "AMDGPUInstrInfo.h"
249259Sdim#include "AMDGPURegisterInfo.h"
249259Sdim#include "AMDGPUTargetMachine.h"
249259Sdim#include "llvm/CodeGen/MachineFrameInfo.h"
249259Sdim#include "llvm/CodeGen/MachineInstrBuilder.h"
249259Sdim#include "llvm/CodeGen/MachineRegisterInfo.h"
249259Sdim
263508Sdim#define GET_INSTRINFO_CTOR_DTOR
263508Sdim#define GET_INSTRINFO_NAMED_OPS
249259Sdim#define GET_INSTRMAP_INFO
249259Sdim#include "AMDGPUGenInstrInfo.inc"
249259Sdim
249259Sdimusing namespace llvm;
249259Sdim
263508Sdim
263508Sdim// Pin the vtable to this file.
263508Sdimvoid AMDGPUInstrInfo::anchor() {}
263508Sdim
249259SdimAMDGPUInstrInfo::AMDGPUInstrInfo(TargetMachine &tm)
263508Sdim  : AMDGPUGenInstrInfo(-1,-1), RI(tm), TM(tm) { }
249259Sdim
249259Sdimconst AMDGPURegisterInfo &AMDGPUInstrInfo::getRegisterInfo() const {
249259Sdim  return RI;
249259Sdim}
249259Sdim
249259Sdimbool AMDGPUInstrInfo::isCoalescableExtInstr(const MachineInstr &MI,
249259Sdim                                           unsigned &SrcReg, unsigned &DstReg,
249259Sdim                                           unsigned &SubIdx) const {
249259Sdim// TODO: Implement this function
249259Sdim  return false;
249259Sdim}
249259Sdim
249259Sdimunsigned AMDGPUInstrInfo::isLoadFromStackSlot(const MachineInstr *MI,
249259Sdim                                             int &FrameIndex) const {
249259Sdim// TODO: Implement this function
249259Sdim  return 0;
249259Sdim}
249259Sdim
249259Sdimunsigned AMDGPUInstrInfo::isLoadFromStackSlotPostFE(const MachineInstr *MI,
249259Sdim                                                   int &FrameIndex) const {
249259Sdim// TODO: Implement this function
249259Sdim  return 0;
249259Sdim}
249259Sdim
249259Sdimbool AMDGPUInstrInfo::hasLoadFromStackSlot(const MachineInstr *MI,
249259Sdim                                          const MachineMemOperand *&MMO,
249259Sdim                                          int &FrameIndex) const {
249259Sdim// TODO: Implement this function
249259Sdim  return false;
249259Sdim}
249259Sdimunsigned AMDGPUInstrInfo::isStoreFromStackSlot(const MachineInstr *MI,
249259Sdim                                              int &FrameIndex) const {
249259Sdim// TODO: Implement this function
249259Sdim  return 0;
249259Sdim}
249259Sdimunsigned AMDGPUInstrInfo::isStoreFromStackSlotPostFE(const MachineInstr *MI,
249259Sdim                                                    int &FrameIndex) const {
249259Sdim// TODO: Implement this function
249259Sdim  return 0;
249259Sdim}
249259Sdimbool AMDGPUInstrInfo::hasStoreFromStackSlot(const MachineInstr *MI,
249259Sdim                                           const MachineMemOperand *&MMO,
249259Sdim                                           int &FrameIndex) const {
249259Sdim// TODO: Implement this function
249259Sdim  return false;
249259Sdim}
249259Sdim
249259SdimMachineInstr *
249259SdimAMDGPUInstrInfo::convertToThreeAddress(MachineFunction::iterator &MFI,
249259Sdim                                      MachineBasicBlock::iterator &MBBI,
249259Sdim                                      LiveVariables *LV) const {
249259Sdim// TODO: Implement this function
249259Sdim  return NULL;
249259Sdim}
249259Sdimbool AMDGPUInstrInfo::getNextBranchInstr(MachineBasicBlock::iterator &iter,
249259Sdim                                        MachineBasicBlock &MBB) const {
249259Sdim  while (iter != MBB.end()) {
249259Sdim    switch (iter->getOpcode()) {
249259Sdim    default:
249259Sdim      break;
249259Sdim    case AMDGPU::BRANCH_COND_i32:
249259Sdim    case AMDGPU::BRANCH_COND_f32:
249259Sdim    case AMDGPU::BRANCH:
249259Sdim      return true;
249259Sdim    };
249259Sdim    ++iter;
249259Sdim  }
249259Sdim  return false;
249259Sdim}
249259Sdim
249259Sdimvoid
249259SdimAMDGPUInstrInfo::storeRegToStackSlot(MachineBasicBlock &MBB,
249259Sdim                                    MachineBasicBlock::iterator MI,
249259Sdim                                    unsigned SrcReg, bool isKill,
249259Sdim                                    int FrameIndex,
249259Sdim                                    const TargetRegisterClass *RC,
249259Sdim                                    const TargetRegisterInfo *TRI) const {
249259Sdim  assert(!"Not Implemented");
249259Sdim}
249259Sdim
249259Sdimvoid
249259SdimAMDGPUInstrInfo::loadRegFromStackSlot(MachineBasicBlock &MBB,
249259Sdim                                     MachineBasicBlock::iterator MI,
249259Sdim                                     unsigned DestReg, int FrameIndex,
249259Sdim                                     const TargetRegisterClass *RC,
249259Sdim                                     const TargetRegisterInfo *TRI) const {
249259Sdim  assert(!"Not Implemented");
249259Sdim}
249259Sdim
263508Sdimbool AMDGPUInstrInfo::expandPostRAPseudo (MachineBasicBlock::iterator MI) const {
263508Sdim  MachineBasicBlock *MBB = MI->getParent();
263508Sdim   int OffsetOpIdx =
263508Sdim       AMDGPU::getNamedOperandIdx(MI->getOpcode(), AMDGPU::OpName::addr);
263508Sdim   // addr is a custom operand with multiple MI operands, and only the
263508Sdim   // first MI operand is given a name.
263508Sdim  int RegOpIdx = OffsetOpIdx + 1;
263508Sdim  int ChanOpIdx =
263508Sdim      AMDGPU::getNamedOperandIdx(MI->getOpcode(), AMDGPU::OpName::chan);
263508Sdim
263508Sdim  if (isRegisterLoad(*MI)) {
263508Sdim    int DstOpIdx =
263508Sdim        AMDGPU::getNamedOperandIdx(MI->getOpcode(), AMDGPU::OpName::dst);
263508Sdim    unsigned RegIndex = MI->getOperand(RegOpIdx).getImm();
263508Sdim    unsigned Channel = MI->getOperand(ChanOpIdx).getImm();
263508Sdim    unsigned Address = calculateIndirectAddress(RegIndex, Channel);
263508Sdim    unsigned OffsetReg = MI->getOperand(OffsetOpIdx).getReg();
263508Sdim    if (OffsetReg == AMDGPU::INDIRECT_BASE_ADDR) {
263508Sdim      buildMovInstr(MBB, MI, MI->getOperand(DstOpIdx).getReg(),
263508Sdim                    getIndirectAddrRegClass()->getRegister(Address));
263508Sdim    } else {
263508Sdim      buildIndirectRead(MBB, MI, MI->getOperand(DstOpIdx).getReg(),
263508Sdim                        Address, OffsetReg);
263508Sdim    }
263508Sdim  } else if (isRegisterStore(*MI)) {
263508Sdim    int ValOpIdx =
263508Sdim        AMDGPU::getNamedOperandIdx(MI->getOpcode(), AMDGPU::OpName::val);
263508Sdim    AMDGPU::getNamedOperandIdx(MI->getOpcode(), AMDGPU::OpName::dst);
263508Sdim    unsigned RegIndex = MI->getOperand(RegOpIdx).getImm();
263508Sdim    unsigned Channel = MI->getOperand(ChanOpIdx).getImm();
263508Sdim    unsigned Address = calculateIndirectAddress(RegIndex, Channel);
263508Sdim    unsigned OffsetReg = MI->getOperand(OffsetOpIdx).getReg();
263508Sdim    if (OffsetReg == AMDGPU::INDIRECT_BASE_ADDR) {
263508Sdim      buildMovInstr(MBB, MI, getIndirectAddrRegClass()->getRegister(Address),
263508Sdim                    MI->getOperand(ValOpIdx).getReg());
263508Sdim    } else {
263508Sdim      buildIndirectWrite(MBB, MI, MI->getOperand(ValOpIdx).getReg(),
263508Sdim                         calculateIndirectAddress(RegIndex, Channel),
263508Sdim                         OffsetReg);
263508Sdim    }
263508Sdim  } else {
263508Sdim    return false;
263508Sdim  }
263508Sdim
263508Sdim  MBB->erase(MI);
263508Sdim  return true;
263508Sdim}
263508Sdim
263508Sdim
249259SdimMachineInstr *
249259SdimAMDGPUInstrInfo::foldMemoryOperandImpl(MachineFunction &MF,
249259Sdim                                      MachineInstr *MI,
249259Sdim                                      const SmallVectorImpl<unsigned> &Ops,
249259Sdim                                      int FrameIndex) const {
249259Sdim// TODO: Implement this function
249259Sdim  return 0;
249259Sdim}
249259SdimMachineInstr*
249259SdimAMDGPUInstrInfo::foldMemoryOperandImpl(MachineFunction &MF,
249259Sdim                                      MachineInstr *MI,
249259Sdim                                      const SmallVectorImpl<unsigned> &Ops,
249259Sdim                                      MachineInstr *LoadMI) const {
249259Sdim  // TODO: Implement this function
249259Sdim  return 0;
249259Sdim}
249259Sdimbool
249259SdimAMDGPUInstrInfo::canFoldMemoryOperand(const MachineInstr *MI,
249259Sdim                                     const SmallVectorImpl<unsigned> &Ops) const {
249259Sdim  // TODO: Implement this function
249259Sdim  return false;
249259Sdim}
249259Sdimbool
249259SdimAMDGPUInstrInfo::unfoldMemoryOperand(MachineFunction &MF, MachineInstr *MI,
249259Sdim                                 unsigned Reg, bool UnfoldLoad,
249259Sdim                                 bool UnfoldStore,
249259Sdim                                 SmallVectorImpl<MachineInstr*> &NewMIs) const {
249259Sdim  // TODO: Implement this function
249259Sdim  return false;
249259Sdim}
249259Sdim
249259Sdimbool
249259SdimAMDGPUInstrInfo::unfoldMemoryOperand(SelectionDAG &DAG, SDNode *N,
249259Sdim                                    SmallVectorImpl<SDNode*> &NewNodes) const {
249259Sdim  // TODO: Implement this function
249259Sdim  return false;
249259Sdim}
249259Sdim
249259Sdimunsigned
249259SdimAMDGPUInstrInfo::getOpcodeAfterMemoryUnfold(unsigned Opc,
249259Sdim                                           bool UnfoldLoad, bool UnfoldStore,
249259Sdim                                           unsigned *LoadRegIndex) const {
249259Sdim  // TODO: Implement this function
249259Sdim  return 0;
249259Sdim}
249259Sdim
249259Sdimbool AMDGPUInstrInfo::shouldScheduleLoadsNear(SDNode *Load1, SDNode *Load2,
249259Sdim                                             int64_t Offset1, int64_t Offset2,
249259Sdim                                             unsigned NumLoads) const {
249259Sdim  assert(Offset2 > Offset1
249259Sdim         && "Second offset should be larger than first offset!");
249259Sdim  // If we have less than 16 loads in a row, and the offsets are within 16,
249259Sdim  // then schedule together.
249259Sdim  // TODO: Make the loads schedule near if it fits in a cacheline
249259Sdim  return (NumLoads < 16 && (Offset2 - Offset1) < 16);
249259Sdim}
249259Sdim
249259Sdimbool
249259SdimAMDGPUInstrInfo::ReverseBranchCondition(SmallVectorImpl<MachineOperand> &Cond)
249259Sdim  const {
249259Sdim  // TODO: Implement this function
249259Sdim  return true;
249259Sdim}
249259Sdimvoid AMDGPUInstrInfo::insertNoop(MachineBasicBlock &MBB,
249259Sdim                                MachineBasicBlock::iterator MI) const {
249259Sdim  // TODO: Implement this function
249259Sdim}
249259Sdim
249259Sdimbool AMDGPUInstrInfo::isPredicated(const MachineInstr *MI) const {
249259Sdim  // TODO: Implement this function
249259Sdim  return false;
249259Sdim}
249259Sdimbool
249259SdimAMDGPUInstrInfo::SubsumesPredicate(const SmallVectorImpl<MachineOperand> &Pred1,
249259Sdim                                  const SmallVectorImpl<MachineOperand> &Pred2)
249259Sdim  const {
249259Sdim  // TODO: Implement this function
249259Sdim  return false;
249259Sdim}
249259Sdim
249259Sdimbool AMDGPUInstrInfo::DefinesPredicate(MachineInstr *MI,
249259Sdim                                      std::vector<MachineOperand> &Pred) const {
249259Sdim  // TODO: Implement this function
249259Sdim  return false;
249259Sdim}
249259Sdim
249259Sdimbool AMDGPUInstrInfo::isPredicable(MachineInstr *MI) const {
249259Sdim  // TODO: Implement this function
249259Sdim  return MI->getDesc().isPredicable();
249259Sdim}
249259Sdim
249259Sdimbool
249259SdimAMDGPUInstrInfo::isSafeToMoveRegClassDefs(const TargetRegisterClass *RC) const {
249259Sdim  // TODO: Implement this function
249259Sdim  return true;
249259Sdim}
249259Sdim
249259Sdimbool AMDGPUInstrInfo::isRegisterStore(const MachineInstr &MI) const {
249259Sdim  return get(MI.getOpcode()).TSFlags & AMDGPU_FLAG_REGISTER_STORE;
249259Sdim}
249259Sdim
249259Sdimbool AMDGPUInstrInfo::isRegisterLoad(const MachineInstr &MI) const {
249259Sdim  return get(MI.getOpcode()).TSFlags & AMDGPU_FLAG_REGISTER_LOAD;
249259Sdim}
249259Sdim
263508Sdimint AMDGPUInstrInfo::getIndirectIndexBegin(const MachineFunction &MF) const {
263508Sdim  const MachineRegisterInfo &MRI = MF.getRegInfo();
263508Sdim  const MachineFrameInfo *MFI = MF.getFrameInfo();
263508Sdim  int Offset = -1;
249259Sdim
263508Sdim  if (MFI->getNumObjects() == 0) {
263508Sdim    return -1;
263508Sdim  }
263508Sdim
263508Sdim  if (MRI.livein_empty()) {
263508Sdim    return 0;
263508Sdim  }
263508Sdim
263508Sdim  const TargetRegisterClass *IndirectRC = getIndirectAddrRegClass();
263508Sdim  for (MachineRegisterInfo::livein_iterator LI = MRI.livein_begin(),
263508Sdim                                            LE = MRI.livein_end();
263508Sdim                                            LI != LE; ++LI) {
263508Sdim    unsigned Reg = LI->first;
263508Sdim    if (TargetRegisterInfo::isVirtualRegister(Reg) ||
263508Sdim        !IndirectRC->contains(Reg))
263508Sdim      continue;
263508Sdim
263508Sdim    unsigned RegIndex;
263508Sdim    unsigned RegEnd;
263508Sdim    for (RegIndex = 0, RegEnd = IndirectRC->getNumRegs(); RegIndex != RegEnd;
263508Sdim                                                          ++RegIndex) {
263508Sdim      if (IndirectRC->getRegister(RegIndex) == Reg)
263508Sdim        break;
263508Sdim    }
263508Sdim    Offset = std::max(Offset, (int)RegIndex);
263508Sdim  }
263508Sdim
263508Sdim  return Offset + 1;
263508Sdim}
263508Sdim
263508Sdimint AMDGPUInstrInfo::getIndirectIndexEnd(const MachineFunction &MF) const {
263508Sdim  int Offset = 0;
263508Sdim  const MachineFrameInfo *MFI = MF.getFrameInfo();
263508Sdim
263508Sdim  // Variable sized objects are not supported
263508Sdim  assert(!MFI->hasVarSizedObjects());
263508Sdim
263508Sdim  if (MFI->getNumObjects() == 0) {
263508Sdim    return -1;
263508Sdim  }
263508Sdim
263508Sdim  Offset = TM.getFrameLowering()->getFrameIndexOffset(MF, -1);
263508Sdim
263508Sdim  return getIndirectIndexBegin(MF) + Offset;
263508Sdim}
263508Sdim
263508Sdim
249259Sdimvoid AMDGPUInstrInfo::convertToISA(MachineInstr & MI, MachineFunction &MF,
249259Sdim    DebugLoc DL) const {
249259Sdim  MachineRegisterInfo &MRI = MF.getRegInfo();
249259Sdim  const AMDGPURegisterInfo & RI = getRegisterInfo();
249259Sdim
249259Sdim  for (unsigned i = 0; i < MI.getNumOperands(); i++) {
249259Sdim    MachineOperand &MO = MI.getOperand(i);
249259Sdim    // Convert dst regclass to one that is supported by the ISA
249259Sdim    if (MO.isReg() && MO.isDef()) {
249259Sdim      if (TargetRegisterInfo::isVirtualRegister(MO.getReg())) {
249259Sdim        const TargetRegisterClass * oldRegClass = MRI.getRegClass(MO.getReg());
249259Sdim        const TargetRegisterClass * newRegClass = RI.getISARegClass(oldRegClass);
249259Sdim
249259Sdim        assert(newRegClass);
249259Sdim
249259Sdim        MRI.setRegClass(MO.getReg(), newRegClass);
249259Sdim      }
249259Sdim    }
249259Sdim  }
249259Sdim}
263508Sdim
263508Sdimint AMDGPUInstrInfo::getMaskedMIMGOp(uint16_t Opcode, unsigned Channels) const {
263508Sdim  switch (Channels) {
263508Sdim  default: return Opcode;
263508Sdim  case 1: return AMDGPU::getMaskedMIMGOp(Opcode, AMDGPU::Channels_1);
263508Sdim  case 2: return AMDGPU::getMaskedMIMGOp(Opcode, AMDGPU::Channels_2);
263508Sdim  case 3: return AMDGPU::getMaskedMIMGOp(Opcode, AMDGPU::Channels_3);
263508Sdim  }
263508Sdim}