Target/AMDGPU/SIMachineFunctionInfo.cpp

284677Sdim//===-- SIMachineFunctionInfo.cpp - SI Machine Function Info -------===//
284677Sdim//
284677Sdim//                     The LLVM Compiler Infrastructure
284677Sdim//
284677Sdim// This file is distributed under the University of Illinois Open Source
284677Sdim// License. See LICENSE.TXT for details.
284677Sdim//
284677Sdim/// \file
284677Sdim//===----------------------------------------------------------------------===//
284677Sdim
284677Sdim
284677Sdim#include "SIMachineFunctionInfo.h"
284677Sdim#include "AMDGPUSubtarget.h"
284677Sdim#include "SIInstrInfo.h"
284677Sdim#include "llvm/CodeGen/MachineInstrBuilder.h"
284677Sdim#include "llvm/CodeGen/MachineFrameInfo.h"
284677Sdim#include "llvm/CodeGen/MachineRegisterInfo.h"
284677Sdim#include "llvm/IR/Function.h"
284677Sdim#include "llvm/IR/LLVMContext.h"
284677Sdim
284677Sdim#define MAX_LANES 64
284677Sdim
284677Sdimusing namespace llvm;
284677Sdim
284677Sdim
284677Sdim// Pin the vtable to this file.
284677Sdimvoid SIMachineFunctionInfo::anchor() {}
284677Sdim
284677SdimSIMachineFunctionInfo::SIMachineFunctionInfo(const MachineFunction &MF)
284677Sdim  : AMDGPUMachineFunction(MF),
284677Sdim    TIDReg(AMDGPU::NoRegister),
296417Sdim    ScratchRSrcReg(AMDGPU::NoRegister),
296417Sdim    ScratchWaveOffsetReg(AMDGPU::NoRegister),
296417Sdim    PrivateSegmentBufferUserSGPR(AMDGPU::NoRegister),
296417Sdim    DispatchPtrUserSGPR(AMDGPU::NoRegister),
296417Sdim    QueuePtrUserSGPR(AMDGPU::NoRegister),
296417Sdim    KernargSegmentPtrUserSGPR(AMDGPU::NoRegister),
296417Sdim    DispatchIDUserSGPR(AMDGPU::NoRegister),
296417Sdim    FlatScratchInitUserSGPR(AMDGPU::NoRegister),
296417Sdim    PrivateSegmentSizeUserSGPR(AMDGPU::NoRegister),
296417Sdim    GridWorkGroupCountXUserSGPR(AMDGPU::NoRegister),
296417Sdim    GridWorkGroupCountYUserSGPR(AMDGPU::NoRegister),
296417Sdim    GridWorkGroupCountZUserSGPR(AMDGPU::NoRegister),
296417Sdim    WorkGroupIDXSystemSGPR(AMDGPU::NoRegister),
296417Sdim    WorkGroupIDYSystemSGPR(AMDGPU::NoRegister),
296417Sdim    WorkGroupIDZSystemSGPR(AMDGPU::NoRegister),
296417Sdim    WorkGroupInfoSystemSGPR(AMDGPU::NoRegister),
296417Sdim    PrivateSegmentWaveByteOffsetSystemSGPR(AMDGPU::NoRegister),
284677Sdim    PSInputAddr(0),
296417Sdim    ReturnsVoid(true),
296417Sdim    LDSWaveSpillSize(0),
296417Sdim    PSInputEna(0),
284677Sdim    NumUserSGPRs(0),
296417Sdim    NumSystemSGPRs(0),
296417Sdim    HasSpilledSGPRs(false),
296417Sdim    HasSpilledVGPRs(false),
296417Sdim    PrivateSegmentBuffer(false),
296417Sdim    DispatchPtr(false),
296417Sdim    QueuePtr(false),
296417Sdim    DispatchID(false),
296417Sdim    KernargSegmentPtr(false),
296417Sdim    FlatScratchInit(false),
296417Sdim    GridWorkgroupCountX(false),
296417Sdim    GridWorkgroupCountY(false),
296417Sdim    GridWorkgroupCountZ(false),
296417Sdim    WorkGroupIDX(true),
296417Sdim    WorkGroupIDY(false),
296417Sdim    WorkGroupIDZ(false),
296417Sdim    WorkGroupInfo(false),
296417Sdim    PrivateSegmentWaveByteOffset(false),
296417Sdim    WorkItemIDX(true),
296417Sdim    WorkItemIDY(false),
296417Sdim    WorkItemIDZ(false) {
296417Sdim  const AMDGPUSubtarget &ST = MF.getSubtarget<AMDGPUSubtarget>();
296417Sdim  const Function *F = MF.getFunction();
284677Sdim
296417Sdim  PSInputAddr = AMDGPU::getInitialPSInputAddr(*F);
296417Sdim
296417Sdim  const MachineFrameInfo *FrameInfo = MF.getFrameInfo();
296417Sdim
296417Sdim  if (getShaderType() == ShaderType::COMPUTE)
296417Sdim    KernargSegmentPtr = true;
296417Sdim
296417Sdim  if (F->hasFnAttribute("amdgpu-work-group-id-y"))
296417Sdim    WorkGroupIDY = true;
296417Sdim
296417Sdim  if (F->hasFnAttribute("amdgpu-work-group-id-z"))
296417Sdim    WorkGroupIDZ = true;
296417Sdim
296417Sdim  if (F->hasFnAttribute("amdgpu-work-item-id-y"))
296417Sdim    WorkItemIDY = true;
296417Sdim
296417Sdim  if (F->hasFnAttribute("amdgpu-work-item-id-z"))
296417Sdim    WorkItemIDZ = true;
296417Sdim
296417Sdim  bool MaySpill = ST.isVGPRSpillingEnabled(this);
296417Sdim  bool HasStackObjects = FrameInfo->hasStackObjects();
296417Sdim
296417Sdim  if (HasStackObjects || MaySpill)
296417Sdim    PrivateSegmentWaveByteOffset = true;
296417Sdim
296417Sdim  if (ST.isAmdHsaOS()) {
296417Sdim    if (HasStackObjects || MaySpill)
296417Sdim      PrivateSegmentBuffer = true;
296417Sdim
296417Sdim    if (F->hasFnAttribute("amdgpu-dispatch-ptr"))
296417Sdim      DispatchPtr = true;
296417Sdim  }
296417Sdim
296417Sdim  // X, XY, and XYZ are the only supported combinations, so make sure Y is
296417Sdim  // enabled if Z is.
296417Sdim  if (WorkItemIDZ)
296417Sdim    WorkItemIDY = true;
296417Sdim}
296417Sdim
296417Sdimunsigned SIMachineFunctionInfo::addPrivateSegmentBuffer(
296417Sdim  const SIRegisterInfo &TRI) {
296417Sdim  PrivateSegmentBufferUserSGPR = TRI.getMatchingSuperReg(
296417Sdim    getNextUserSGPR(), AMDGPU::sub0, &AMDGPU::SReg_128RegClass);
296417Sdim  NumUserSGPRs += 4;
296417Sdim  return PrivateSegmentBufferUserSGPR;
296417Sdim}
296417Sdim
296417Sdimunsigned SIMachineFunctionInfo::addDispatchPtr(const SIRegisterInfo &TRI) {
296417Sdim  DispatchPtrUserSGPR = TRI.getMatchingSuperReg(
296417Sdim    getNextUserSGPR(), AMDGPU::sub0, &AMDGPU::SReg_64RegClass);
296417Sdim  NumUserSGPRs += 2;
296417Sdim  return DispatchPtrUserSGPR;
296417Sdim}
296417Sdim
296417Sdimunsigned SIMachineFunctionInfo::addQueuePtr(const SIRegisterInfo &TRI) {
296417Sdim  QueuePtrUserSGPR = TRI.getMatchingSuperReg(
296417Sdim    getNextUserSGPR(), AMDGPU::sub0, &AMDGPU::SReg_64RegClass);
296417Sdim  NumUserSGPRs += 2;
296417Sdim  return QueuePtrUserSGPR;
296417Sdim}
296417Sdim
296417Sdimunsigned SIMachineFunctionInfo::addKernargSegmentPtr(const SIRegisterInfo &TRI) {
296417Sdim  KernargSegmentPtrUserSGPR = TRI.getMatchingSuperReg(
296417Sdim    getNextUserSGPR(), AMDGPU::sub0, &AMDGPU::SReg_64RegClass);
296417Sdim  NumUserSGPRs += 2;
296417Sdim  return KernargSegmentPtrUserSGPR;
296417Sdim}
296417Sdim
284677SdimSIMachineFunctionInfo::SpilledReg SIMachineFunctionInfo::getSpilledReg(
284677Sdim                                                       MachineFunction *MF,
284677Sdim                                                       unsigned FrameIndex,
284677Sdim                                                       unsigned SubIdx) {
284677Sdim  const MachineFrameInfo *FrameInfo = MF->getFrameInfo();
284677Sdim  const SIRegisterInfo *TRI = static_cast<const SIRegisterInfo *>(
284677Sdim      MF->getSubtarget<AMDGPUSubtarget>().getRegisterInfo());
284677Sdim  MachineRegisterInfo &MRI = MF->getRegInfo();
284677Sdim  int64_t Offset = FrameInfo->getObjectOffset(FrameIndex);
284677Sdim  Offset += SubIdx * 4;
284677Sdim
284677Sdim  unsigned LaneVGPRIdx = Offset / (64 * 4);
284677Sdim  unsigned Lane = (Offset / 4) % 64;
284677Sdim
284677Sdim  struct SpilledReg Spill;
284677Sdim
284677Sdim  if (!LaneVGPRs.count(LaneVGPRIdx)) {
284677Sdim    unsigned LaneVGPR = TRI->findUnusedRegister(MRI, &AMDGPU::VGPR_32RegClass);
296417Sdim
296417Sdim    if (LaneVGPR == AMDGPU::NoRegister) {
296417Sdim      LLVMContext &Ctx = MF->getFunction()->getContext();
296417Sdim      Ctx.emitError("Ran out of VGPRs for spilling SGPR");
296417Sdim
296417Sdim      // When compiling from inside Mesa, the compilation continues.
296417Sdim      // Select an arbitrary register to avoid triggering assertions
296417Sdim      // during subsequent passes.
296417Sdim      LaneVGPR = AMDGPU::VGPR0;
296417Sdim    }
296417Sdim
284677Sdim    LaneVGPRs[LaneVGPRIdx] = LaneVGPR;
284677Sdim
284677Sdim    // Add this register as live-in to all blocks to avoid machine verifer
284677Sdim    // complaining about use of an undefined physical register.
284677Sdim    for (MachineFunction::iterator BI = MF->begin(), BE = MF->end();
284677Sdim         BI != BE; ++BI) {
284677Sdim      BI->addLiveIn(LaneVGPR);
284677Sdim    }
284677Sdim  }
284677Sdim
284677Sdim  Spill.VGPR = LaneVGPRs[LaneVGPRIdx];
284677Sdim  Spill.Lane = Lane;
284677Sdim  return Spill;
284677Sdim}
284677Sdim
284677Sdimunsigned SIMachineFunctionInfo::getMaximumWorkGroupSize(
284677Sdim                                              const MachineFunction &MF) const {
284677Sdim  const AMDGPUSubtarget &ST = MF.getSubtarget<AMDGPUSubtarget>();
284677Sdim  // FIXME: We should get this information from kernel attributes if it
284677Sdim  // is available.
284677Sdim  return getShaderType() == ShaderType::COMPUTE ? 256 : ST.getWavefrontSize();
284677Sdim}