Target/AMDGPU/SIMachineFunctionInfo.cpp

327952Sdim//===- SIMachineFunctionInfo.cpp - SI Machine Function Info ---------------===//
284677Sdim//
353358Sdim// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
353358Sdim// See https://llvm.org/LICENSE.txt for license information.
353358Sdim// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
284677Sdim//
284677Sdim//===----------------------------------------------------------------------===//
284677Sdim
284677Sdim#include "SIMachineFunctionInfo.h"
327952Sdim#include "AMDGPUArgumentUsageInfo.h"
284677Sdim#include "AMDGPUSubtarget.h"
327952Sdim#include "SIRegisterInfo.h"
341825Sdim#include "MCTargetDesc/AMDGPUMCTargetDesc.h"
327952Sdim#include "Utils/AMDGPUBaseInfo.h"
327952Sdim#include "llvm/ADT/Optional.h"
327952Sdim#include "llvm/CodeGen/MachineBasicBlock.h"
309124Sdim#include "llvm/CodeGen/MachineFrameInfo.h"
327952Sdim#include "llvm/CodeGen/MachineFunction.h"
284677Sdim#include "llvm/CodeGen/MachineRegisterInfo.h"
327952Sdim#include "llvm/IR/CallingConv.h"
284677Sdim#include "llvm/IR/Function.h"
327952Sdim#include <cassert>
327952Sdim#include <vector>
284677Sdim
284677Sdim#define MAX_LANES 64
284677Sdim
284677Sdimusing namespace llvm;
284677Sdim
284677SdimSIMachineFunctionInfo::SIMachineFunctionInfo(const MachineFunction &MF)
284677Sdim  : AMDGPUMachineFunction(MF),
296417Sdim    PrivateSegmentBuffer(false),
296417Sdim    DispatchPtr(false),
296417Sdim    QueuePtr(false),
314564Sdim    KernargSegmentPtr(false),
296417Sdim    DispatchID(false),
296417Sdim    FlatScratchInit(false),
309124Sdim    WorkGroupIDX(false),
296417Sdim    WorkGroupIDY(false),
296417Sdim    WorkGroupIDZ(false),
296417Sdim    WorkGroupInfo(false),
296417Sdim    PrivateSegmentWaveByteOffset(false),
309124Sdim    WorkItemIDX(false),
296417Sdim    WorkItemIDY(false),
314564Sdim    WorkItemIDZ(false),
327952Sdim    ImplicitBufferPtr(false),
327952Sdim    ImplicitArgPtr(false),
341825Sdim    GITPtrHigh(0xffffffff),
353358Sdim    HighBitsOf32BitAddress(0),
353358Sdim    GDSSize(0) {
341825Sdim  const GCNSubtarget &ST = MF.getSubtarget<GCNSubtarget>();
327952Sdim  const Function &F = MF.getFunction();
327952Sdim  FlatWorkGroupSizes = ST.getFlatWorkGroupSizes(F);
327952Sdim  WavesPerEU = ST.getWavesPerEU(F);
284677Sdim
360784Sdim  Occupancy = ST.computeOccupancy(MF, getLDSSize());
341825Sdim  CallingConv::ID CC = F.getCallingConv();
341825Sdim
341825Sdim  if (CC == CallingConv::AMDGPU_KERNEL || CC == CallingConv::SPIR_KERNEL) {
341825Sdim    if (!F.arg_empty())
341825Sdim      KernargSegmentPtr = true;
341825Sdim    WorkGroupIDX = true;
341825Sdim    WorkItemIDX = true;
341825Sdim  } else if (CC == CallingConv::AMDGPU_PS) {
341825Sdim    PSInputAddr = AMDGPU::getInitialPSInputAddr(F);
341825Sdim  }
341825Sdim
321369Sdim  if (!isEntryFunction()) {
321369Sdim    // Non-entry functions have no special inputs for now, other registers
321369Sdim    // required for scratch access.
321369Sdim    ScratchRSrcReg = AMDGPU::SGPR0_SGPR1_SGPR2_SGPR3;
353358Sdim    ScratchWaveOffsetReg = AMDGPU::SGPR33;
353358Sdim
353358Sdim    // TODO: Pick a high register, and shift down, similar to a kernel.
353358Sdim    FrameOffsetReg = AMDGPU::SGPR34;
321369Sdim    StackPtrOffsetReg = AMDGPU::SGPR32;
296417Sdim
327952Sdim    ArgInfo.PrivateSegmentBuffer =
327952Sdim      ArgDescriptor::createRegister(ScratchRSrcReg);
327952Sdim    ArgInfo.PrivateSegmentWaveByteOffset =
327952Sdim      ArgDescriptor::createRegister(ScratchWaveOffsetReg);
327952Sdim
327952Sdim    if (F.hasFnAttribute("amdgpu-implicitarg-ptr"))
327952Sdim      ImplicitArgPtr = true;
327952Sdim  } else {
341825Sdim    if (F.hasFnAttribute("amdgpu-implicitarg-ptr")) {
327952Sdim      KernargSegmentPtr = true;
341825Sdim      MaxKernArgAlign = std::max(ST.getAlignmentForImplicitArgPtr(),
341825Sdim                                 MaxKernArgAlign);
341825Sdim    }
321369Sdim  }
296417Sdim
353358Sdim  if (F.hasFnAttribute("amdgpu-work-group-id-x"))
321369Sdim    WorkGroupIDX = true;
353358Sdim
353358Sdim  if (F.hasFnAttribute("amdgpu-work-group-id-y"))
296417Sdim    WorkGroupIDY = true;
353358Sdim
353358Sdim  if (F.hasFnAttribute("amdgpu-work-group-id-z"))
296417Sdim    WorkGroupIDZ = true;
353358Sdim
353358Sdim  if (F.hasFnAttribute("amdgpu-work-item-id-x"))
321369Sdim    WorkItemIDX = true;
353358Sdim
353358Sdim  if (F.hasFnAttribute("amdgpu-work-item-id-y"))
296417Sdim    WorkItemIDY = true;
353358Sdim
353358Sdim  if (F.hasFnAttribute("amdgpu-work-item-id-z"))
296417Sdim    WorkItemIDZ = true;
296417Sdim
321369Sdim  const MachineFrameInfo &FrameInfo = MF.getFrameInfo();
314564Sdim  bool HasStackObjects = FrameInfo.hasStackObjects();
296417Sdim
321369Sdim  if (isEntryFunction()) {
321369Sdim    // X, XY, and XYZ are the only supported combinations, so make sure Y is
321369Sdim    // enabled if Z is.
321369Sdim    if (WorkItemIDZ)
321369Sdim      WorkItemIDY = true;
296417Sdim
344779Sdim    PrivateSegmentWaveByteOffset = true;
321369Sdim
327952Sdim    // HS and GS always have the scratch wave offset in SGPR5 on GFX9.
327952Sdim    if (ST.getGeneration() >= AMDGPUSubtarget::GFX9 &&
327952Sdim        (CC == CallingConv::AMDGPU_HS || CC == CallingConv::AMDGPU_GS))
344779Sdim      ArgInfo.PrivateSegmentWaveByteOffset =
344779Sdim          ArgDescriptor::createRegister(AMDGPU::SGPR5);
321369Sdim  }
321369Sdim
344779Sdim  bool isAmdHsaOrMesa = ST.isAmdHsaOrMesa(F);
344779Sdim  if (isAmdHsaOrMesa) {
344779Sdim    PrivateSegmentBuffer = true;
296417Sdim
327952Sdim    if (F.hasFnAttribute("amdgpu-dispatch-ptr"))
296417Sdim      DispatchPtr = true;
309124Sdim
327952Sdim    if (F.hasFnAttribute("amdgpu-queue-ptr"))
309124Sdim      QueuePtr = true;
314564Sdim
327952Sdim    if (F.hasFnAttribute("amdgpu-dispatch-id"))
314564Sdim      DispatchID = true;
341825Sdim  } else if (ST.isMesaGfxShader(F)) {
344779Sdim    ImplicitBufferPtr = true;
296417Sdim  }
296417Sdim
327952Sdim  if (F.hasFnAttribute("amdgpu-kernarg-segment-ptr"))
321369Sdim    KernargSegmentPtr = true;
309124Sdim
344779Sdim  if (ST.hasFlatAddressSpace() && isEntryFunction() && isAmdHsaOrMesa) {
353358Sdim    auto hasNonSpillStackObjects = [&]() {
353358Sdim      // Avoid expensive checking if there's no stack objects.
353358Sdim      if (!HasStackObjects)
353358Sdim        return false;
353358Sdim      for (auto OI = FrameInfo.getObjectIndexBegin(),
353358Sdim                OE = FrameInfo.getObjectIndexEnd(); OI != OE; ++OI)
353358Sdim        if (!FrameInfo.isSpillSlotObjectIndex(OI))
353358Sdim          return true;
353358Sdim      // All stack objects are spill slots.
353358Sdim      return false;
353358Sdim    };
321369Sdim    // TODO: This could be refined a lot. The attribute is a poor way of
321369Sdim    // detecting calls that may require it before argument lowering.
353358Sdim    if (hasNonSpillStackObjects() || F.hasFnAttribute("amdgpu-flat-scratch"))
321369Sdim      FlatScratchInit = true;
321369Sdim  }
327952Sdim
327952Sdim  Attribute A = F.getFnAttribute("amdgpu-git-ptr-high");
327952Sdim  StringRef S = A.getValueAsString();
327952Sdim  if (!S.empty())
327952Sdim    S.consumeInteger(0, GITPtrHigh);
341825Sdim
341825Sdim  A = F.getFnAttribute("amdgpu-32bit-address-high-bits");
341825Sdim  S = A.getValueAsString();
341825Sdim  if (!S.empty())
341825Sdim    S.consumeInteger(0, HighBitsOf32BitAddress);
353358Sdim
353358Sdim  S = F.getFnAttribute("amdgpu-gds-size").getValueAsString();
353358Sdim  if (!S.empty())
353358Sdim    S.consumeInteger(0, GDSSize);
296417Sdim}
296417Sdim
341825Sdimvoid SIMachineFunctionInfo::limitOccupancy(const MachineFunction &MF) {
341825Sdim  limitOccupancy(getMaxWavesPerEU());
341825Sdim  const GCNSubtarget& ST = MF.getSubtarget<GCNSubtarget>();
341825Sdim  limitOccupancy(ST.getOccupancyWithLocalMemSize(getLDSSize(),
341825Sdim                 MF.getFunction()));
341825Sdim}
341825Sdim
296417Sdimunsigned SIMachineFunctionInfo::addPrivateSegmentBuffer(
296417Sdim  const SIRegisterInfo &TRI) {
327952Sdim  ArgInfo.PrivateSegmentBuffer =
327952Sdim    ArgDescriptor::createRegister(TRI.getMatchingSuperReg(
360784Sdim    getNextUserSGPR(), AMDGPU::sub0, &AMDGPU::SGPR_128RegClass));
296417Sdim  NumUserSGPRs += 4;
327952Sdim  return ArgInfo.PrivateSegmentBuffer.getRegister();
296417Sdim}
296417Sdim
296417Sdimunsigned SIMachineFunctionInfo::addDispatchPtr(const SIRegisterInfo &TRI) {
327952Sdim  ArgInfo.DispatchPtr = ArgDescriptor::createRegister(TRI.getMatchingSuperReg(
327952Sdim    getNextUserSGPR(), AMDGPU::sub0, &AMDGPU::SReg_64RegClass));
296417Sdim  NumUserSGPRs += 2;
327952Sdim  return ArgInfo.DispatchPtr.getRegister();
296417Sdim}
296417Sdim
296417Sdimunsigned SIMachineFunctionInfo::addQueuePtr(const SIRegisterInfo &TRI) {
327952Sdim  ArgInfo.QueuePtr = ArgDescriptor::createRegister(TRI.getMatchingSuperReg(
327952Sdim    getNextUserSGPR(), AMDGPU::sub0, &AMDGPU::SReg_64RegClass));
296417Sdim  NumUserSGPRs += 2;
327952Sdim  return ArgInfo.QueuePtr.getRegister();
296417Sdim}
296417Sdim
296417Sdimunsigned SIMachineFunctionInfo::addKernargSegmentPtr(const SIRegisterInfo &TRI) {
327952Sdim  ArgInfo.KernargSegmentPtr
327952Sdim    = ArgDescriptor::createRegister(TRI.getMatchingSuperReg(
327952Sdim    getNextUserSGPR(), AMDGPU::sub0, &AMDGPU::SReg_64RegClass));
296417Sdim  NumUserSGPRs += 2;
327952Sdim  return ArgInfo.KernargSegmentPtr.getRegister();
296417Sdim}
296417Sdim
314564Sdimunsigned SIMachineFunctionInfo::addDispatchID(const SIRegisterInfo &TRI) {
327952Sdim  ArgInfo.DispatchID = ArgDescriptor::createRegister(TRI.getMatchingSuperReg(
327952Sdim    getNextUserSGPR(), AMDGPU::sub0, &AMDGPU::SReg_64RegClass));
314564Sdim  NumUserSGPRs += 2;
327952Sdim  return ArgInfo.DispatchID.getRegister();
314564Sdim}
314564Sdim
309124Sdimunsigned SIMachineFunctionInfo::addFlatScratchInit(const SIRegisterInfo &TRI) {
327952Sdim  ArgInfo.FlatScratchInit = ArgDescriptor::createRegister(TRI.getMatchingSuperReg(
327952Sdim    getNextUserSGPR(), AMDGPU::sub0, &AMDGPU::SReg_64RegClass));
309124Sdim  NumUserSGPRs += 2;
327952Sdim  return ArgInfo.FlatScratchInit.getRegister();
309124Sdim}
309124Sdim
321369Sdimunsigned SIMachineFunctionInfo::addImplicitBufferPtr(const SIRegisterInfo &TRI) {
327952Sdim  ArgInfo.ImplicitBufferPtr = ArgDescriptor::createRegister(TRI.getMatchingSuperReg(
327952Sdim    getNextUserSGPR(), AMDGPU::sub0, &AMDGPU::SReg_64RegClass));
314564Sdim  NumUserSGPRs += 2;
327952Sdim  return ArgInfo.ImplicitBufferPtr.getRegister();
314564Sdim}
314564Sdim
327952Sdimstatic bool isCalleeSavedReg(const MCPhysReg *CSRegs, MCPhysReg Reg) {
327952Sdim  for (unsigned I = 0; CSRegs[I]; ++I) {
327952Sdim    if (CSRegs[I] == Reg)
327952Sdim      return true;
327952Sdim  }
327952Sdim
327952Sdim  return false;
327952Sdim}
327952Sdim
353358Sdim/// \p returns true if \p NumLanes slots are available in VGPRs already used for
353358Sdim/// SGPR spilling.
353358Sdim//
353358Sdim// FIXME: This only works after processFunctionBeforeFrameFinalized
353358Sdimbool SIMachineFunctionInfo::haveFreeLanesForSGPRSpill(const MachineFunction &MF,
353358Sdim                                                      unsigned NumNeed) const {
353358Sdim  const GCNSubtarget &ST = MF.getSubtarget<GCNSubtarget>();
353358Sdim  unsigned WaveSize = ST.getWavefrontSize();
353358Sdim  return NumVGPRSpillLanes + NumNeed <= WaveSize * SpillVGPRs.size();
353358Sdim}
353358Sdim
321369Sdim/// Reserve a slice of a VGPR to support spilling for FrameIndex \p FI.
321369Sdimbool SIMachineFunctionInfo::allocateSGPRSpillToVGPR(MachineFunction &MF,
321369Sdim                                                    int FI) {
321369Sdim  std::vector<SpilledReg> &SpillLanes = SGPRToVGPRSpills[FI];
309124Sdim
321369Sdim  // This has already been allocated.
321369Sdim  if (!SpillLanes.empty())
321369Sdim    return true;
321369Sdim
341825Sdim  const GCNSubtarget &ST = MF.getSubtarget<GCNSubtarget>();
309124Sdim  const SIRegisterInfo *TRI = ST.getRegisterInfo();
321369Sdim  MachineFrameInfo &FrameInfo = MF.getFrameInfo();
321369Sdim  MachineRegisterInfo &MRI = MF.getRegInfo();
321369Sdim  unsigned WaveSize = ST.getWavefrontSize();
309124Sdim
321369Sdim  unsigned Size = FrameInfo.getObjectSize(FI);
321369Sdim  assert(Size >= 4 && Size <= 64 && "invalid sgpr spill size");
321369Sdim  assert(TRI->spillSGPRToVGPR() && "not spilling SGPRs to VGPRs");
284677Sdim
321369Sdim  int NumLanes = Size / 4;
284677Sdim
353358Sdim  const MCPhysReg *CSRegs = MRI.getCalleeSavedRegs();
327952Sdim
321369Sdim  // Make sure to handle the case where a wide SGPR spill may span between two
321369Sdim  // VGPRs.
321369Sdim  for (int I = 0; I < NumLanes; ++I, ++NumVGPRSpillLanes) {
321369Sdim    unsigned LaneVGPR;
321369Sdim    unsigned VGPRIndex = (NumVGPRSpillLanes % WaveSize);
284677Sdim
321369Sdim    if (VGPRIndex == 0) {
321369Sdim      LaneVGPR = TRI->findUnusedRegister(MRI, &AMDGPU::VGPR_32RegClass, MF);
321369Sdim      if (LaneVGPR == AMDGPU::NoRegister) {
327952Sdim        // We have no VGPRs left for spilling SGPRs. Reset because we will not
321369Sdim        // partially spill the SGPR to VGPRs.
321369Sdim        SGPRToVGPRSpills.erase(FI);
321369Sdim        NumVGPRSpillLanes -= I;
321369Sdim        return false;
321369Sdim      }
296417Sdim
327952Sdim      Optional<int> CSRSpillFI;
341825Sdim      if ((FrameInfo.hasCalls() || !isEntryFunction()) && CSRegs &&
341825Sdim          isCalleeSavedReg(CSRegs, LaneVGPR)) {
341825Sdim        CSRSpillFI = FrameInfo.CreateSpillStackObject(4, 4);
327952Sdim      }
296417Sdim
327952Sdim      SpillVGPRs.push_back(SGPRSpillVGPRCSR(LaneVGPR, CSRSpillFI));
327952Sdim
321369Sdim      // Add this register as live-in to all blocks to avoid machine verifer
321369Sdim      // complaining about use of an undefined physical register.
321369Sdim      for (MachineBasicBlock &BB : MF)
321369Sdim        BB.addLiveIn(LaneVGPR);
321369Sdim    } else {
327952Sdim      LaneVGPR = SpillVGPRs.back().VGPR;
321369Sdim    }
284677Sdim
321369Sdim    SpillLanes.push_back(SpilledReg(LaneVGPR, VGPRIndex));
284677Sdim  }
284677Sdim
321369Sdim  return true;
284677Sdim}
321369Sdim
353358Sdim/// Reserve AGPRs or VGPRs to support spilling for FrameIndex \p FI.
353358Sdim/// Either AGPR is spilled to VGPR to vice versa.
353358Sdim/// Returns true if a \p FI can be eliminated completely.
353358Sdimbool SIMachineFunctionInfo::allocateVGPRSpillToAGPR(MachineFunction &MF,
353358Sdim                                                    int FI,
353358Sdim                                                    bool isAGPRtoVGPR) {
353358Sdim  MachineRegisterInfo &MRI = MF.getRegInfo();
353358Sdim  MachineFrameInfo &FrameInfo = MF.getFrameInfo();
353358Sdim  const GCNSubtarget &ST =  MF.getSubtarget<GCNSubtarget>();
353358Sdim
353358Sdim  assert(ST.hasMAIInsts() && FrameInfo.isSpillSlotObjectIndex(FI));
353358Sdim
353358Sdim  auto &Spill = VGPRToAGPRSpills[FI];
353358Sdim
353358Sdim  // This has already been allocated.
353358Sdim  if (!Spill.Lanes.empty())
353358Sdim    return Spill.FullyAllocated;
353358Sdim
353358Sdim  unsigned Size = FrameInfo.getObjectSize(FI);
353358Sdim  unsigned NumLanes = Size / 4;
353358Sdim  Spill.Lanes.resize(NumLanes, AMDGPU::NoRegister);
353358Sdim
353358Sdim  const TargetRegisterClass &RC =
353358Sdim      isAGPRtoVGPR ? AMDGPU::VGPR_32RegClass : AMDGPU::AGPR_32RegClass;
353358Sdim  auto Regs = RC.getRegisters();
353358Sdim
353358Sdim  auto &SpillRegs = isAGPRtoVGPR ? SpillAGPR : SpillVGPR;
353358Sdim  const SIRegisterInfo *TRI = ST.getRegisterInfo();
353358Sdim  Spill.FullyAllocated = true;
353358Sdim
353358Sdim  // FIXME: Move allocation logic out of MachineFunctionInfo and initialize
353358Sdim  // once.
353358Sdim  BitVector OtherUsedRegs;
353358Sdim  OtherUsedRegs.resize(TRI->getNumRegs());
353358Sdim
353358Sdim  const uint32_t *CSRMask =
353358Sdim      TRI->getCallPreservedMask(MF, MF.getFunction().getCallingConv());
353358Sdim  if (CSRMask)
353358Sdim    OtherUsedRegs.setBitsInMask(CSRMask);
353358Sdim
353358Sdim  // TODO: Should include register tuples, but doesn't matter with current
353358Sdim  // usage.
353358Sdim  for (MCPhysReg Reg : SpillAGPR)
353358Sdim    OtherUsedRegs.set(Reg);
353358Sdim  for (MCPhysReg Reg : SpillVGPR)
353358Sdim    OtherUsedRegs.set(Reg);
353358Sdim
353358Sdim  SmallVectorImpl<MCPhysReg>::const_iterator NextSpillReg = Regs.begin();
353358Sdim  for (unsigned I = 0; I < NumLanes; ++I) {
353358Sdim    NextSpillReg = std::find_if(
353358Sdim        NextSpillReg, Regs.end(), [&MRI, &OtherUsedRegs](MCPhysReg Reg) {
353358Sdim          return MRI.isAllocatable(Reg) && !MRI.isPhysRegUsed(Reg) &&
353358Sdim                 !OtherUsedRegs[Reg];
353358Sdim        });
353358Sdim
353358Sdim    if (NextSpillReg == Regs.end()) { // Registers exhausted
353358Sdim      Spill.FullyAllocated = false;
353358Sdim      break;
353358Sdim    }
353358Sdim
353358Sdim    OtherUsedRegs.set(*NextSpillReg);
353358Sdim    SpillRegs.push_back(*NextSpillReg);
353358Sdim    Spill.Lanes[I] = *NextSpillReg++;
353358Sdim  }
353358Sdim
353358Sdim  return Spill.FullyAllocated;
321369Sdim}
341825Sdim
353358Sdimvoid SIMachineFunctionInfo::removeDeadFrameIndices(MachineFrameInfo &MFI) {
353358Sdim  // The FP spill hasn't been inserted yet, so keep it around.
353358Sdim  for (auto &R : SGPRToVGPRSpills) {
353358Sdim    if (R.first != FramePointerSaveIndex)
353358Sdim      MFI.RemoveStackObject(R.first);
353358Sdim  }
341825Sdim
353358Sdim  // All other SPGRs must be allocated on the default stack, so reset the stack
353358Sdim  // ID.
353358Sdim  for (int i = MFI.getObjectIndexBegin(), e = MFI.getObjectIndexEnd(); i != e;
353358Sdim       ++i)
353358Sdim    if (i != FramePointerSaveIndex)
353358Sdim      MFI.setStackID(i, TargetStackID::Default);
353358Sdim
353358Sdim  for (auto &R : VGPRToAGPRSpills) {
353358Sdim    if (R.second.FullyAllocated)
353358Sdim      MFI.RemoveStackObject(R.first);
341825Sdim  }
341825Sdim}
341825Sdim
341825SdimMCPhysReg SIMachineFunctionInfo::getNextUserSGPR() const {
341825Sdim  assert(NumSystemSGPRs == 0 && "System SGPRs must be added after user SGPRs");
341825Sdim  return AMDGPU::SGPR0 + NumUserSGPRs;
341825Sdim}
341825Sdim
341825SdimMCPhysReg SIMachineFunctionInfo::getNextSystemSGPR() const {
341825Sdim  return AMDGPU::SGPR0 + NumUserSGPRs + NumSystemSGPRs;
341825Sdim}
353358Sdim
353358Sdimstatic yaml::StringValue regToString(unsigned Reg,
353358Sdim                                     const TargetRegisterInfo &TRI) {
353358Sdim  yaml::StringValue Dest;
353358Sdim  {
353358Sdim    raw_string_ostream OS(Dest.Value);
353358Sdim    OS << printReg(Reg, &TRI);
353358Sdim  }
353358Sdim  return Dest;
353358Sdim}
353358Sdim
353358Sdimstatic Optional<yaml::SIArgumentInfo>
353358SdimconvertArgumentInfo(const AMDGPUFunctionArgInfo &ArgInfo,
353358Sdim                    const TargetRegisterInfo &TRI) {
353358Sdim  yaml::SIArgumentInfo AI;
353358Sdim
353358Sdim  auto convertArg = [&](Optional<yaml::SIArgument> &A,
353358Sdim                        const ArgDescriptor &Arg) {
353358Sdim    if (!Arg)
353358Sdim      return false;
353358Sdim
353358Sdim    // Create a register or stack argument.
353358Sdim    yaml::SIArgument SA = yaml::SIArgument::createArgument(Arg.isRegister());
353358Sdim    if (Arg.isRegister()) {
353358Sdim      raw_string_ostream OS(SA.RegisterName.Value);
353358Sdim      OS << printReg(Arg.getRegister(), &TRI);
353358Sdim    } else
353358Sdim      SA.StackOffset = Arg.getStackOffset();
353358Sdim    // Check and update the optional mask.
353358Sdim    if (Arg.isMasked())
353358Sdim      SA.Mask = Arg.getMask();
353358Sdim
353358Sdim    A = SA;
353358Sdim    return true;
353358Sdim  };
353358Sdim
353358Sdim  bool Any = false;
353358Sdim  Any |= convertArg(AI.PrivateSegmentBuffer, ArgInfo.PrivateSegmentBuffer);
353358Sdim  Any |= convertArg(AI.DispatchPtr, ArgInfo.DispatchPtr);
353358Sdim  Any |= convertArg(AI.QueuePtr, ArgInfo.QueuePtr);
353358Sdim  Any |= convertArg(AI.KernargSegmentPtr, ArgInfo.KernargSegmentPtr);
353358Sdim  Any |= convertArg(AI.DispatchID, ArgInfo.DispatchID);
353358Sdim  Any |= convertArg(AI.FlatScratchInit, ArgInfo.FlatScratchInit);
353358Sdim  Any |= convertArg(AI.PrivateSegmentSize, ArgInfo.PrivateSegmentSize);
353358Sdim  Any |= convertArg(AI.WorkGroupIDX, ArgInfo.WorkGroupIDX);
353358Sdim  Any |= convertArg(AI.WorkGroupIDY, ArgInfo.WorkGroupIDY);
353358Sdim  Any |= convertArg(AI.WorkGroupIDZ, ArgInfo.WorkGroupIDZ);
353358Sdim  Any |= convertArg(AI.WorkGroupInfo, ArgInfo.WorkGroupInfo);
353358Sdim  Any |= convertArg(AI.PrivateSegmentWaveByteOffset,
353358Sdim                    ArgInfo.PrivateSegmentWaveByteOffset);
353358Sdim  Any |= convertArg(AI.ImplicitArgPtr, ArgInfo.ImplicitArgPtr);
353358Sdim  Any |= convertArg(AI.ImplicitBufferPtr, ArgInfo.ImplicitBufferPtr);
353358Sdim  Any |= convertArg(AI.WorkItemIDX, ArgInfo.WorkItemIDX);
353358Sdim  Any |= convertArg(AI.WorkItemIDY, ArgInfo.WorkItemIDY);
353358Sdim  Any |= convertArg(AI.WorkItemIDZ, ArgInfo.WorkItemIDZ);
353358Sdim
353358Sdim  if (Any)
353358Sdim    return AI;
353358Sdim
353358Sdim  return None;
353358Sdim}
353358Sdim
353358Sdimyaml::SIMachineFunctionInfo::SIMachineFunctionInfo(
353358Sdim  const llvm::SIMachineFunctionInfo& MFI,
353358Sdim  const TargetRegisterInfo &TRI)
353358Sdim  : ExplicitKernArgSize(MFI.getExplicitKernArgSize()),
353358Sdim    MaxKernArgAlign(MFI.getMaxKernArgAlign()),
353358Sdim    LDSSize(MFI.getLDSSize()),
353358Sdim    IsEntryFunction(MFI.isEntryFunction()),
353358Sdim    NoSignedZerosFPMath(MFI.hasNoSignedZerosFPMath()),
353358Sdim    MemoryBound(MFI.isMemoryBound()),
353358Sdim    WaveLimiter(MFI.needsWaveLimiter()),
360784Sdim    HighBitsOf32BitAddress(MFI.get32BitAddressHighBits()),
353358Sdim    ScratchRSrcReg(regToString(MFI.getScratchRSrcReg(), TRI)),
353358Sdim    ScratchWaveOffsetReg(regToString(MFI.getScratchWaveOffsetReg(), TRI)),
353358Sdim    FrameOffsetReg(regToString(MFI.getFrameOffsetReg(), TRI)),
353358Sdim    StackPtrOffsetReg(regToString(MFI.getStackPtrOffsetReg(), TRI)),
353358Sdim    ArgInfo(convertArgumentInfo(MFI.getArgInfo(), TRI)),
353358Sdim    Mode(MFI.getMode()) {}
353358Sdim
353358Sdimvoid yaml::SIMachineFunctionInfo::mappingImpl(yaml::IO &YamlIO) {
353358Sdim  MappingTraits<SIMachineFunctionInfo>::mapping(YamlIO, *this);
353358Sdim}
353358Sdim
353358Sdimbool SIMachineFunctionInfo::initializeBaseYamlFields(
353358Sdim  const yaml::SIMachineFunctionInfo &YamlMFI) {
353358Sdim  ExplicitKernArgSize = YamlMFI.ExplicitKernArgSize;
360784Sdim  MaxKernArgAlign = assumeAligned(YamlMFI.MaxKernArgAlign);
353358Sdim  LDSSize = YamlMFI.LDSSize;
360784Sdim  HighBitsOf32BitAddress = YamlMFI.HighBitsOf32BitAddress;
353358Sdim  IsEntryFunction = YamlMFI.IsEntryFunction;
353358Sdim  NoSignedZerosFPMath = YamlMFI.NoSignedZerosFPMath;
353358Sdim  MemoryBound = YamlMFI.MemoryBound;
353358Sdim  WaveLimiter = YamlMFI.WaveLimiter;
353358Sdim  return false;
353358Sdim}