doxygen/AMDGPUTargetStreamer_8cpp_source.html

//===-- AMDGPUTargetStreamer.cpp - Mips Target Streamer Methods -----------===//

//

// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.

// See https://llvm.org/LICENSE.txt for license information.

// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception

//

//===----------------------------------------------------------------------===//

//

// This file provides AMDGPU specific target streamer methods.

//

//===----------------------------------------------------------------------===//


#include "AMDGPUTargetStreamer.h"

#include "AMDGPUMCExpr.h"

#include "AMDGPUMCKernelDescriptor.h"

#include "AMDGPUMCTargetDesc.h"

#include "AMDGPUPTNote.h"

#include "Utils/AMDGPUBaseInfo.h"

#include "Utils/AMDKernelCodeTUtils.h"

#include "llvm/BinaryFormat/AMDGPUMetadataVerifier.h"

#include "llvm/BinaryFormat/ELF.h"

#include "llvm/MC/MCAsmInfo.h"

#include "llvm/MC/MCAssembler.h"

#include "llvm/MC/MCContext.h"

#include "llvm/MC/MCELFObjectWriter.h"

#include "llvm/MC/MCELFStreamer.h"

#include "llvm/MC/MCSubtargetInfo.h"

#include "llvm/MC/StringTableBuilder.h"

#include "llvm/Support/AMDGPUMetadata.h"

#include "llvm/Support/AMDGPUObjLinkingInfo.h"

#include "llvm/Support/AMDHSAKernelDescriptor.h"

#include "llvm/Support/CommandLine.h"

#include "llvm/Support/FormattedStream.h"

#include "llvm/TargetParser/AMDGPUTargetParser.h"


using namespace llvm;

using namespace llvm::AMDGPU;


//===----------------------------------------------------------------------===//

// AMDGPUTargetStreamer

//===----------------------------------------------------------------------===//


static cl::opt<unsigned>

    ForceGenericVersion("amdgpu-force-generic-version",

                        cl::desc("Force a specific generic_v<N> flag to be "

                                 "added. For testing purposes only."),

                        cl::ReallyHidden, cl::init(0));


bool AMDGPUTargetStreamer::EmitHSAMetadataV3(StringRef HSAMetadataString) {

  msgpack::Document HSAMetadataDoc;

  if (!HSAMetadataDoc.fromYAML(HSAMetadataString))

    return false;

  return EmitHSAMetadata(HSAMetadataDoc, false);

}


StringRef AMDGPUTargetStreamer::getArchNameFromElfMach(unsigned ElfMach) {

  AMDGPU::GPUKind AK;


  // clang-format off

  switch (ElfMach) {

  case ELF::EF_AMDGPU_MACH_R600_R600:      AK = GK_R600;    break;

  case ELF::EF_AMDGPU_MACH_R600_R630:      AK = GK_R630;    break;

  case ELF::EF_AMDGPU_MACH_R600_RS880:     AK = GK_RS880;   break;

  case ELF::EF_AMDGPU_MACH_R600_RV670:     AK = GK_RV670;   break;

  case ELF::EF_AMDGPU_MACH_R600_RV710:     AK = GK_RV710;   break;

  case ELF::EF_AMDGPU_MACH_R600_RV730:     AK = GK_RV730;   break;

  case ELF::EF_AMDGPU_MACH_R600_RV770:     AK = GK_RV770;   break;

  case ELF::EF_AMDGPU_MACH_R600_CEDAR:     AK = GK_CEDAR;   break;

  case ELF::EF_AMDGPU_MACH_R600_CYPRESS:   AK = GK_CYPRESS; break;

  case ELF::EF_AMDGPU_MACH_R600_JUNIPER:   AK = GK_JUNIPER; break;

  case ELF::EF_AMDGPU_MACH_R600_REDWOOD:   AK = GK_REDWOOD; break;

  case ELF::EF_AMDGPU_MACH_R600_SUMO:      AK = GK_SUMO;    break;

  case ELF::EF_AMDGPU_MACH_R600_BARTS:     AK = GK_BARTS;   break;

  case ELF::EF_AMDGPU_MACH_R600_CAICOS:    AK = GK_CAICOS;  break;

  case ELF::EF_AMDGPU_MACH_R600_CAYMAN:    AK = GK_CAYMAN;  break;

  case ELF::EF_AMDGPU_MACH_R600_TURKS:     AK = GK_TURKS;   break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX600:  AK = GK_GFX600;  break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX601:  AK = GK_GFX601;  break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX602:  AK = GK_GFX602;  break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX700:  AK = GK_GFX700;  break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX701:  AK = GK_GFX701;  break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX702:  AK = GK_GFX702;  break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX703:  AK = GK_GFX703;  break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX704:  AK = GK_GFX704;  break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX705:  AK = GK_GFX705;  break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX801:  AK = GK_GFX801;  break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX802:  AK = GK_GFX802;  break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX803:  AK = GK_GFX803;  break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX805:  AK = GK_GFX805;  break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX810:  AK = GK_GFX810;  break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX900:  AK = GK_GFX900;  break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX902:  AK = GK_GFX902;  break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX904:  AK = GK_GFX904;  break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX906:  AK = GK_GFX906;  break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX908:  AK = GK_GFX908;  break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX909:  AK = GK_GFX909;  break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX90A:  AK = GK_GFX90A;  break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX90C:  AK = GK_GFX90C;  break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX942:  AK = GK_GFX942;  break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX950:  AK = GK_GFX950;  break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX1010: AK = GK_GFX1010; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX1011: AK = GK_GFX1011; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX1012: AK = GK_GFX1012; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX1013: AK = GK_GFX1013; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX1030: AK = GK_GFX1030; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX1031: AK = GK_GFX1031; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX1032: AK = GK_GFX1032; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX1033: AK = GK_GFX1033; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX1034: AK = GK_GFX1034; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX1035: AK = GK_GFX1035; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX1036: AK = GK_GFX1036; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX1100: AK = GK_GFX1100; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX1101: AK = GK_GFX1101; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX1102: AK = GK_GFX1102; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX1103: AK = GK_GFX1103; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX1150: AK = GK_GFX1150; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX1151: AK = GK_GFX1151; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX1152: AK = GK_GFX1152; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX1153: AK = GK_GFX1153; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX1170: AK = GK_GFX1170; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX1171: AK = GK_GFX1171; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX1172: AK = GK_GFX1172; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX1200: AK = GK_GFX1200; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX1201: AK = GK_GFX1201; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX1250: AK = GK_GFX1250; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX1251: AK = GK_GFX1251; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX1310: AK = GK_GFX1310; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX9_GENERIC:     AK = GK_GFX9_GENERIC; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX9_4_GENERIC:   AK = GK_GFX9_4_GENERIC; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX10_1_GENERIC:  AK = GK_GFX10_1_GENERIC; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX10_3_GENERIC:  AK = GK_GFX10_3_GENERIC; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX11_GENERIC:    AK = GK_GFX11_GENERIC; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX12_GENERIC:    AK = GK_GFX12_GENERIC; break;

  case ELF::EF_AMDGPU_MACH_AMDGCN_GFX12_5_GENERIC:  AK = GK_GFX12_5_GENERIC; break;

  case ELF::EF_AMDGPU_MACH_NONE:           AK = GK_NONE;    break;

  default:                                 AK = GK_NONE;    break;

  }

  // clang-format on


  StringRef GPUName = getArchNameAMDGCN(AK);

  if (GPUName != "")

    return GPUName;

  return getArchNameR600(AK);

}


unsigned AMDGPUTargetStreamer::getElfMach(StringRef GPU) {

  AMDGPU::GPUKind AK = parseArchAMDGCN(GPU);

  if (AK == AMDGPU::GPUKind::GK_NONE)

    AK = parseArchR600(GPU);


  // clang-format off

  switch (AK) {

  case GK_R600:    return ELF::EF_AMDGPU_MACH_R600_R600;

  case GK_R630:    return ELF::EF_AMDGPU_MACH_R600_R630;

  case GK_RS880:   return ELF::EF_AMDGPU_MACH_R600_RS880;

  case GK_RV670:   return ELF::EF_AMDGPU_MACH_R600_RV670;

  case GK_RV710:   return ELF::EF_AMDGPU_MACH_R600_RV710;

  case GK_RV730:   return ELF::EF_AMDGPU_MACH_R600_RV730;

  case GK_RV770:   return ELF::EF_AMDGPU_MACH_R600_RV770;

  case GK_CEDAR:   return ELF::EF_AMDGPU_MACH_R600_CEDAR;

  case GK_CYPRESS: return ELF::EF_AMDGPU_MACH_R600_CYPRESS;

  case GK_JUNIPER: return ELF::EF_AMDGPU_MACH_R600_JUNIPER;

  case GK_REDWOOD: return ELF::EF_AMDGPU_MACH_R600_REDWOOD;

  case GK_SUMO:    return ELF::EF_AMDGPU_MACH_R600_SUMO;

  case GK_BARTS:   return ELF::EF_AMDGPU_MACH_R600_BARTS;

  case GK_CAICOS:  return ELF::EF_AMDGPU_MACH_R600_CAICOS;

  case GK_CAYMAN:  return ELF::EF_AMDGPU_MACH_R600_CAYMAN;

  case GK_TURKS:   return ELF::EF_AMDGPU_MACH_R600_TURKS;

  case GK_GFX600:  return ELF::EF_AMDGPU_MACH_AMDGCN_GFX600;

  case GK_GFX601:  return ELF::EF_AMDGPU_MACH_AMDGCN_GFX601;

  case GK_GFX602:  return ELF::EF_AMDGPU_MACH_AMDGCN_GFX602;

  case GK_GFX700:  return ELF::EF_AMDGPU_MACH_AMDGCN_GFX700;

  case GK_GFX701:  return ELF::EF_AMDGPU_MACH_AMDGCN_GFX701;

  case GK_GFX702:  return ELF::EF_AMDGPU_MACH_AMDGCN_GFX702;

  case GK_GFX703:  return ELF::EF_AMDGPU_MACH_AMDGCN_GFX703;

  case GK_GFX704:  return ELF::EF_AMDGPU_MACH_AMDGCN_GFX704;

  case GK_GFX705:  return ELF::EF_AMDGPU_MACH_AMDGCN_GFX705;

  case GK_GFX801:  return ELF::EF_AMDGPU_MACH_AMDGCN_GFX801;

  case GK_GFX802:  return ELF::EF_AMDGPU_MACH_AMDGCN_GFX802;

  case GK_GFX803:  return ELF::EF_AMDGPU_MACH_AMDGCN_GFX803;

  case GK_GFX805:  return ELF::EF_AMDGPU_MACH_AMDGCN_GFX805;

  case GK_GFX810:  return ELF::EF_AMDGPU_MACH_AMDGCN_GFX810;

  case GK_GFX900:  return ELF::EF_AMDGPU_MACH_AMDGCN_GFX900;

  case GK_GFX902:  return ELF::EF_AMDGPU_MACH_AMDGCN_GFX902;

  case GK_GFX904:  return ELF::EF_AMDGPU_MACH_AMDGCN_GFX904;

  case GK_GFX906:  return ELF::EF_AMDGPU_MACH_AMDGCN_GFX906;

  case GK_GFX908:  return ELF::EF_AMDGPU_MACH_AMDGCN_GFX908;

  case GK_GFX909:  return ELF::EF_AMDGPU_MACH_AMDGCN_GFX909;

  case GK_GFX90A:  return ELF::EF_AMDGPU_MACH_AMDGCN_GFX90A;

  case GK_GFX90C:  return ELF::EF_AMDGPU_MACH_AMDGCN_GFX90C;

  case GK_GFX942:  return ELF::EF_AMDGPU_MACH_AMDGCN_GFX942;

  case GK_GFX950:  return ELF::EF_AMDGPU_MACH_AMDGCN_GFX950;

  case GK_GFX1010: return ELF::EF_AMDGPU_MACH_AMDGCN_GFX1010;

  case GK_GFX1011: return ELF::EF_AMDGPU_MACH_AMDGCN_GFX1011;

  case GK_GFX1012: return ELF::EF_AMDGPU_MACH_AMDGCN_GFX1012;

  case GK_GFX1013: return ELF::EF_AMDGPU_MACH_AMDGCN_GFX1013;

  case GK_GFX1030: return ELF::EF_AMDGPU_MACH_AMDGCN_GFX1030;

  case GK_GFX1031: return ELF::EF_AMDGPU_MACH_AMDGCN_GFX1031;

  case GK_GFX1032: return ELF::EF_AMDGPU_MACH_AMDGCN_GFX1032;

  case GK_GFX1033: return ELF::EF_AMDGPU_MACH_AMDGCN_GFX1033;

  case GK_GFX1034: return ELF::EF_AMDGPU_MACH_AMDGCN_GFX1034;

  case GK_GFX1035: return ELF::EF_AMDGPU_MACH_AMDGCN_GFX1035;

  case GK_GFX1036: return ELF::EF_AMDGPU_MACH_AMDGCN_GFX1036;

  case GK_GFX1100: return ELF::EF_AMDGPU_MACH_AMDGCN_GFX1100;

  case GK_GFX1101: return ELF::EF_AMDGPU_MACH_AMDGCN_GFX1101;

  case GK_GFX1102: return ELF::EF_AMDGPU_MACH_AMDGCN_GFX1102;

  case GK_GFX1103: return ELF::EF_AMDGPU_MACH_AMDGCN_GFX1103;

  case GK_GFX1150: return ELF::EF_AMDGPU_MACH_AMDGCN_GFX1150;

  case GK_GFX1151: return ELF::EF_AMDGPU_MACH_AMDGCN_GFX1151;

  case GK_GFX1152: return ELF::EF_AMDGPU_MACH_AMDGCN_GFX1152;

  case GK_GFX1153: return ELF::EF_AMDGPU_MACH_AMDGCN_GFX1153;

  case GK_GFX1170: return ELF::EF_AMDGPU_MACH_AMDGCN_GFX1170;

  case GK_GFX1171: return ELF::EF_AMDGPU_MACH_AMDGCN_GFX1171;

  case GK_GFX1172: return ELF::EF_AMDGPU_MACH_AMDGCN_GFX1172;

  case GK_GFX1200: return ELF::EF_AMDGPU_MACH_AMDGCN_GFX1200;

  case GK_GFX1201: return ELF::EF_AMDGPU_MACH_AMDGCN_GFX1201;

  case GK_GFX1250: return ELF::EF_AMDGPU_MACH_AMDGCN_GFX1250;

  case GK_GFX1251: return ELF::EF_AMDGPU_MACH_AMDGCN_GFX1251;

  case GK_GFX1310: return ELF::EF_AMDGPU_MACH_AMDGCN_GFX1310;

  case GK_GFX9_GENERIC:     return ELF::EF_AMDGPU_MACH_AMDGCN_GFX9_GENERIC;

  case GK_GFX9_4_GENERIC:   return ELF::EF_AMDGPU_MACH_AMDGCN_GFX9_4_GENERIC;

  case GK_GFX10_1_GENERIC:  return ELF::EF_AMDGPU_MACH_AMDGCN_GFX10_1_GENERIC;

  case GK_GFX10_3_GENERIC:  return ELF::EF_AMDGPU_MACH_AMDGCN_GFX10_3_GENERIC;

  case GK_GFX11_GENERIC:    return ELF::EF_AMDGPU_MACH_AMDGCN_GFX11_GENERIC;

  case GK_GFX12_GENERIC:    return ELF::EF_AMDGPU_MACH_AMDGCN_GFX12_GENERIC;

  case GK_GFX12_5_GENERIC:  return ELF::EF_AMDGPU_MACH_AMDGCN_GFX12_5_GENERIC;

  case GK_NONE:    return ELF::EF_AMDGPU_MACH_NONE;

  }

  // clang-format on


  llvm_unreachable("unknown GPU");

}


//===----------------------------------------------------------------------===//

// AMDGPUTargetAsmStreamer

//===----------------------------------------------------------------------===//


AMDGPUTargetAsmStreamer::AMDGPUTargetAsmStreamer(MCStreamer &S,

                                                 formatted_raw_ostream &OS)

    : AMDGPUTargetStreamer(S), OS(OS) {}


// A hook for emitting stuff at the end.

// We use it for emitting the accumulated PAL metadata as directives.

// The PAL metadata is reset after it is emitted.


void AMDGPUTargetAsmStreamer::finish() {

  std::string S;

  getPALMetadata()->toString(S);

  OS << S;


  // Reset the pal metadata so its data will not affect a compilation that

  // reuses this object.

  getPALMetadata()->reset();

}


void AMDGPUTargetAsmStreamer::EmitDirectiveAMDGCNTarget() {

  OS << "\t.amdgcn_target \"" << *getTargetID() << "\"\n";

}


void AMDGPUTargetAsmStreamer::EmitDirectiveAMDHSACodeObjectVersion(

    unsigned COV) {

  AMDGPUTargetStreamer::EmitDirectiveAMDHSACodeObjectVersion(COV);

  OS << "\t.amdhsa_code_object_version " << COV << '\n';

}


void AMDGPUTargetAsmStreamer::EmitAMDKernelCodeT(AMDGPUMCKernelCodeT &Header) {

  auto FoldAndPrint = [&](const MCExpr *Expr, raw_ostream &OS,

                          const MCAsmInfo *MAI) {

    printAMDGPUMCExpr(foldAMDGPUMCExpr(Expr, getContext()), OS, MAI);

  };


  OS << "\t.amd_kernel_code_t\n";

  Header.EmitKernelCodeT(OS, getContext(), FoldAndPrint);

  OS << "\t.end_amd_kernel_code_t\n";

}


void AMDGPUTargetAsmStreamer::EmitAMDGPUSymbolType(StringRef SymbolName,

                                                   unsigned Type) {

  switch (Type) {

  default:

    llvm_unreachable("Invalid AMDGPU symbol type");

  case ELF::STT_AMDGPU_HSA_KERNEL:

    OS << "\t.amdgpu_hsa_kernel " << SymbolName << '\n';

    break;

  }

}


void AMDGPUTargetAsmStreamer::emitAMDGPULDS(MCSymbol *Symbol, unsigned Size,

                                            Align Alignment) {

  OS << "\t.amdgpu_lds " << Symbol->getName() << ", " << Size << ", "

     << Alignment.value() << '\n';

}


void AMDGPUTargetAsmStreamer::EmitMCResourceInfo(

    const MCSymbol *NumVGPR, const MCSymbol *NumAGPR,

    const MCSymbol *NumExplicitSGPR, const MCSymbol *NumNamedBarrier,

    const MCSymbol *PrivateSegmentSize, const MCSymbol *UsesVCC,

    const MCSymbol *UsesFlatScratch, const MCSymbol *HasDynamicallySizedStack,

    const MCSymbol *HasRecursion, const MCSymbol *HasIndirectCall) {

#define PRINT_RES_INFO(ARG)                                                    \

  OS << "\t.set ";                                                             \

  ARG->print(OS, &getContext().getAsmInfo());                                  \

  OS << ", ";                                                                  \

  getContext().getAsmInfo().printExpr(OS, *ARG->getVariableValue());           \

  Streamer.addBlankLine();


  PRINT_RES_INFO(NumVGPR);

  PRINT_RES_INFO(NumAGPR);

  PRINT_RES_INFO(NumExplicitSGPR);

  PRINT_RES_INFO(NumNamedBarrier);

  PRINT_RES_INFO(PrivateSegmentSize);

  PRINT_RES_INFO(UsesVCC);

  PRINT_RES_INFO(UsesFlatScratch);

  PRINT_RES_INFO(HasDynamicallySizedStack);

  PRINT_RES_INFO(HasRecursion);

  PRINT_RES_INFO(HasIndirectCall);

#undef PRINT_RES_INFO

}


void AMDGPUTargetAsmStreamer::EmitMCResourceMaximums(

    const MCSymbol *MaxVGPR, const MCSymbol *MaxAGPR, const MCSymbol *MaxSGPR,

    const MCSymbol *MaxNamedBarrier) {

#define PRINT_RES_INFO(ARG)                                                    \

  OS << "\t.set ";                                                             \

  ARG->print(OS, &getContext().getAsmInfo());                                  \

  OS << ", ";                                                                  \

  getContext().getAsmInfo().printExpr(OS, *ARG->getVariableValue());           \

  Streamer.addBlankLine();


  PRINT_RES_INFO(MaxVGPR);

  PRINT_RES_INFO(MaxAGPR);

  PRINT_RES_INFO(MaxSGPR);

  PRINT_RES_INFO(MaxNamedBarrier);

#undef PRINT_RES_INFO

}


bool AMDGPUTargetAsmStreamer::EmitISAVersion() {

  OS << "\t.amd_amdgpu_isa \"" << getTargetID() << "\"\n";

  return true;

}


bool AMDGPUTargetAsmStreamer::EmitHSAMetadata(msgpack::Document &HSAMetadataDoc,

                                              bool Strict) {

  HSAMD::V3::MetadataVerifier Verifier(Strict);

  if (!Verifier.verify(HSAMetadataDoc.getRoot()))

    return false;


  std::string HSAMetadataString;

  raw_string_ostream StrOS(HSAMetadataString);

  HSAMetadataDoc.toYAML(StrOS);


  OS << '\t' << HSAMD::V3::AssemblerDirectiveBegin << '\n';

  OS << StrOS.str() << '\n';

  OS << '\t' << HSAMD::V3::AssemblerDirectiveEnd << '\n';

  return true;

}


bool AMDGPUTargetAsmStreamer::EmitCodeEnd(const MCSubtargetInfo &STI) {

  const uint32_t Encoded_s_code_end = 0xbf9f0000;

  const uint32_t Encoded_s_nop = 0xbf800000;

  uint32_t Encoded_pad = Encoded_s_code_end;


  // Instruction cache line size in bytes.

  const unsigned Log2CacheLineSize = AMDGPU::isGFX11Plus(STI) ? 7 : 6;

  const unsigned CacheLineSize = 1u << Log2CacheLineSize;


  // Extra padding amount in bytes to support prefetch mode 3.

  unsigned FillSize = 3 * CacheLineSize;


  if (AMDGPU::isGFX90A(STI)) {

    Encoded_pad = Encoded_s_nop;

    FillSize = 16 * CacheLineSize;

  }


  OS << "\t.p2alignl " << Log2CacheLineSize << ", " << Encoded_pad << '\n';

  OS << "\t.fill " << (FillSize / 4) << ", 4, " << Encoded_pad << '\n';

  return true;

}


void AMDGPUTargetAsmStreamer::EmitAmdhsaKernelDescriptor(

    const MCSubtargetInfo &STI, StringRef KernelName,

    const MCKernelDescriptor &KD, const MCExpr *NextVGPR,

    const MCExpr *NextSGPR, const MCExpr *ReserveVCC,

    const MCExpr *ReserveFlatScr) {

  IsaVersion IVersion = getIsaVersion(STI.getCPU());

  const MCAsmInfo &MAI = getContext().getAsmInfo();


  OS << "\t.amdhsa_kernel " << KernelName << '\n';


  auto PrintField = [&](const MCExpr *Expr, uint32_t Shift, uint32_t Mask,

                        StringRef Directive) {

    OS << "\t\t" << Directive << ' ';

    const MCExpr *ShiftedAndMaskedExpr =

        MCKernelDescriptor::bits_get(Expr, Shift, Mask, getContext());

    const MCExpr *New = foldAMDGPUMCExpr(ShiftedAndMaskedExpr, getContext());

    printAMDGPUMCExpr(New, OS, &MAI);

    OS << '\n';

  };


  auto EmitMCExpr = [&](const MCExpr *Value) {

    const MCExpr *NewExpr = foldAMDGPUMCExpr(Value, getContext());

    printAMDGPUMCExpr(NewExpr, OS, &MAI);

  };


  OS << "\t\t.amdhsa_group_segment_fixed_size ";

  EmitMCExpr(KD.group_segment_fixed_size);

  OS << '\n';


  OS << "\t\t.amdhsa_private_segment_fixed_size ";

  EmitMCExpr(KD.private_segment_fixed_size);

  OS << '\n';


  OS << "\t\t.amdhsa_kernarg_size ";

  EmitMCExpr(KD.kernarg_size);

  OS << '\n';


  if (isGFX1250Plus(STI)) {

    PrintField(KD.compute_pgm_rsrc2,

               amdhsa::COMPUTE_PGM_RSRC2_GFX125_USER_SGPR_COUNT_SHIFT,

               amdhsa::COMPUTE_PGM_RSRC2_GFX125_USER_SGPR_COUNT,

               ".amdhsa_user_sgpr_count");

  } else {

    PrintField(KD.compute_pgm_rsrc2,

               amdhsa::COMPUTE_PGM_RSRC2_GFX6_GFX120_USER_SGPR_COUNT_SHIFT,

               amdhsa::COMPUTE_PGM_RSRC2_GFX6_GFX120_USER_SGPR_COUNT,

               ".amdhsa_user_sgpr_count");

  }


  if (!hasArchitectedFlatScratch(STI))

    PrintField(

        KD.kernel_code_properties,

        amdhsa::KERNEL_CODE_PROPERTY_ENABLE_SGPR_PRIVATE_SEGMENT_BUFFER_SHIFT,

        amdhsa::KERNEL_CODE_PROPERTY_ENABLE_SGPR_PRIVATE_SEGMENT_BUFFER,

        ".amdhsa_user_sgpr_private_segment_buffer");

  PrintField(KD.kernel_code_properties,

             amdhsa::KERNEL_CODE_PROPERTY_ENABLE_SGPR_DISPATCH_PTR_SHIFT,

             amdhsa::KERNEL_CODE_PROPERTY_ENABLE_SGPR_DISPATCH_PTR,

             ".amdhsa_user_sgpr_dispatch_ptr");

  PrintField(KD.kernel_code_properties,

             amdhsa::KERNEL_CODE_PROPERTY_ENABLE_SGPR_QUEUE_PTR_SHIFT,

             amdhsa::KERNEL_CODE_PROPERTY_ENABLE_SGPR_QUEUE_PTR,

             ".amdhsa_user_sgpr_queue_ptr");

  PrintField(KD.kernel_code_properties,

             amdhsa::KERNEL_CODE_PROPERTY_ENABLE_SGPR_KERNARG_SEGMENT_PTR_SHIFT,

             amdhsa::KERNEL_CODE_PROPERTY_ENABLE_SGPR_KERNARG_SEGMENT_PTR,

             ".amdhsa_user_sgpr_kernarg_segment_ptr");

  PrintField(KD.kernel_code_properties,

             amdhsa::KERNEL_CODE_PROPERTY_ENABLE_SGPR_DISPATCH_ID_SHIFT,

             amdhsa::KERNEL_CODE_PROPERTY_ENABLE_SGPR_DISPATCH_ID,

             ".amdhsa_user_sgpr_dispatch_id");

  if (!hasArchitectedFlatScratch(STI))

    PrintField(KD.kernel_code_properties,

               amdhsa::KERNEL_CODE_PROPERTY_ENABLE_SGPR_FLAT_SCRATCH_INIT_SHIFT,

               amdhsa::KERNEL_CODE_PROPERTY_ENABLE_SGPR_FLAT_SCRATCH_INIT,

               ".amdhsa_user_sgpr_flat_scratch_init");

  if (hasKernargPreload(STI)) {

    PrintField(KD.kernarg_preload, amdhsa::KERNARG_PRELOAD_SPEC_LENGTH_SHIFT,

               amdhsa::KERNARG_PRELOAD_SPEC_LENGTH,

               ".amdhsa_user_sgpr_kernarg_preload_length");

    PrintField(KD.kernarg_preload, amdhsa::KERNARG_PRELOAD_SPEC_OFFSET_SHIFT,

               amdhsa::KERNARG_PRELOAD_SPEC_OFFSET,

               ".amdhsa_user_sgpr_kernarg_preload_offset");

  }

  PrintField(

      KD.kernel_code_properties,

      amdhsa::KERNEL_CODE_PROPERTY_ENABLE_SGPR_PRIVATE_SEGMENT_SIZE_SHIFT,

      amdhsa::KERNEL_CODE_PROPERTY_ENABLE_SGPR_PRIVATE_SEGMENT_SIZE,

      ".amdhsa_user_sgpr_private_segment_size");

  if (IVersion.Major >= 10)

    PrintField(KD.kernel_code_properties,

               amdhsa::KERNEL_CODE_PROPERTY_ENABLE_WAVEFRONT_SIZE32_SHIFT,

               amdhsa::KERNEL_CODE_PROPERTY_ENABLE_WAVEFRONT_SIZE32,

               ".amdhsa_wavefront_size32");

  if (CodeObjectVersion >= AMDGPU::AMDHSA_COV5)

    PrintField(KD.kernel_code_properties,

               amdhsa::KERNEL_CODE_PROPERTY_USES_DYNAMIC_STACK_SHIFT,

               amdhsa::KERNEL_CODE_PROPERTY_USES_DYNAMIC_STACK,

               ".amdhsa_uses_dynamic_stack");

  PrintField(KD.compute_pgm_rsrc2,

             amdhsa::COMPUTE_PGM_RSRC2_ENABLE_PRIVATE_SEGMENT_SHIFT,

             amdhsa::COMPUTE_PGM_RSRC2_ENABLE_PRIVATE_SEGMENT,

             (hasArchitectedFlatScratch(STI)

                  ? ".amdhsa_enable_private_segment"

                  : ".amdhsa_system_sgpr_private_segment_wavefront_offset"));

  PrintField(KD.compute_pgm_rsrc2,

             amdhsa::COMPUTE_PGM_RSRC2_ENABLE_SGPR_WORKGROUP_ID_X_SHIFT,

             amdhsa::COMPUTE_PGM_RSRC2_ENABLE_SGPR_WORKGROUP_ID_X,

             ".amdhsa_system_sgpr_workgroup_id_x");

  PrintField(KD.compute_pgm_rsrc2,

             amdhsa::COMPUTE_PGM_RSRC2_ENABLE_SGPR_WORKGROUP_ID_Y_SHIFT,

             amdhsa::COMPUTE_PGM_RSRC2_ENABLE_SGPR_WORKGROUP_ID_Y,

             ".amdhsa_system_sgpr_workgroup_id_y");

  PrintField(KD.compute_pgm_rsrc2,

             amdhsa::COMPUTE_PGM_RSRC2_ENABLE_SGPR_WORKGROUP_ID_Z_SHIFT,

             amdhsa::COMPUTE_PGM_RSRC2_ENABLE_SGPR_WORKGROUP_ID_Z,

             ".amdhsa_system_sgpr_workgroup_id_z");

  PrintField(KD.compute_pgm_rsrc2,

             amdhsa::COMPUTE_PGM_RSRC2_ENABLE_SGPR_WORKGROUP_INFO_SHIFT,

             amdhsa::COMPUTE_PGM_RSRC2_ENABLE_SGPR_WORKGROUP_INFO,

             ".amdhsa_system_sgpr_workgroup_info");

  PrintField(KD.compute_pgm_rsrc2,

             amdhsa::COMPUTE_PGM_RSRC2_ENABLE_VGPR_WORKITEM_ID_SHIFT,

             amdhsa::COMPUTE_PGM_RSRC2_ENABLE_VGPR_WORKITEM_ID,

             ".amdhsa_system_vgpr_workitem_id");


  // These directives are required.

  OS << "\t\t.amdhsa_next_free_vgpr ";

  EmitMCExpr(NextVGPR);

  OS << '\n';


  OS << "\t\t.amdhsa_next_free_sgpr ";

  EmitMCExpr(NextSGPR);

  OS << '\n';


  if (AMDGPU::isGFX90A(STI)) {

    // MCExpr equivalent of taking the (accum_offset + 1) * 4.

    const MCExpr *accum_bits = MCKernelDescriptor::bits_get(

        KD.compute_pgm_rsrc3,

        amdhsa::COMPUTE_PGM_RSRC3_GFX90A_ACCUM_OFFSET_SHIFT,

        amdhsa::COMPUTE_PGM_RSRC3_GFX90A_ACCUM_OFFSET, getContext());

    accum_bits = MCBinaryExpr::createAdd(

        accum_bits, MCConstantExpr::create(1, getContext()), getContext());

    accum_bits = MCBinaryExpr::createMul(

        accum_bits, MCConstantExpr::create(4, getContext()), getContext());

    OS << "\t\t.amdhsa_accum_offset ";

    const MCExpr *New = foldAMDGPUMCExpr(accum_bits, getContext());

    printAMDGPUMCExpr(New, OS, &MAI);

    OS << '\n';

  }


  if (isGFX1250Plus(STI))

    PrintField(KD.compute_pgm_rsrc3,

               amdhsa::COMPUTE_PGM_RSRC3_GFX125_NAMED_BAR_CNT_SHIFT,

               amdhsa::COMPUTE_PGM_RSRC3_GFX125_NAMED_BAR_CNT,

               ".amdhsa_named_barrier_count");


  OS << "\t\t.amdhsa_reserve_vcc ";

  EmitMCExpr(ReserveVCC);

  OS << '\n';


  if (IVersion.Major >= 7 && !hasArchitectedFlatScratch(STI)) {

    OS << "\t\t.amdhsa_reserve_flat_scratch ";

    EmitMCExpr(ReserveFlatScr);

    OS << '\n';

  }


  switch (CodeObjectVersion) {

  default:

    break;

  case AMDGPU::AMDHSA_COV4:

  case AMDGPU::AMDHSA_COV5:

    if (getTargetID()->isXnackSupported())

      OS << "\t\t.amdhsa_reserve_xnack_mask " << getTargetID()->isXnackOnOrAny()

         << '\n';

    break;

  }


  PrintField(KD.compute_pgm_rsrc1,

             amdhsa::COMPUTE_PGM_RSRC1_FLOAT_ROUND_MODE_32_SHIFT,

             amdhsa::COMPUTE_PGM_RSRC1_FLOAT_ROUND_MODE_32,

             ".amdhsa_float_round_mode_32");

  PrintField(KD.compute_pgm_rsrc1,

             amdhsa::COMPUTE_PGM_RSRC1_FLOAT_ROUND_MODE_16_64_SHIFT,

             amdhsa::COMPUTE_PGM_RSRC1_FLOAT_ROUND_MODE_16_64,

             ".amdhsa_float_round_mode_16_64");

  PrintField(KD.compute_pgm_rsrc1,

             amdhsa::COMPUTE_PGM_RSRC1_FLOAT_DENORM_MODE_32_SHIFT,

             amdhsa::COMPUTE_PGM_RSRC1_FLOAT_DENORM_MODE_32,

             ".amdhsa_float_denorm_mode_32");

  PrintField(KD.compute_pgm_rsrc1,

             amdhsa::COMPUTE_PGM_RSRC1_FLOAT_DENORM_MODE_16_64_SHIFT,

             amdhsa::COMPUTE_PGM_RSRC1_FLOAT_DENORM_MODE_16_64,

             ".amdhsa_float_denorm_mode_16_64");

  if (STI.hasFeature(AMDGPU::FeatureDX10ClampAndIEEEMode)) {

    PrintField(KD.compute_pgm_rsrc1,

               amdhsa::COMPUTE_PGM_RSRC1_GFX6_GFX11_ENABLE_DX10_CLAMP_SHIFT,

               amdhsa::COMPUTE_PGM_RSRC1_GFX6_GFX11_ENABLE_DX10_CLAMP,

               ".amdhsa_dx10_clamp");

    PrintField(KD.compute_pgm_rsrc1,

               amdhsa::COMPUTE_PGM_RSRC1_GFX6_GFX11_ENABLE_IEEE_MODE_SHIFT,

               amdhsa::COMPUTE_PGM_RSRC1_GFX6_GFX11_ENABLE_IEEE_MODE,

               ".amdhsa_ieee_mode");

  }

  if (IVersion.Major >= 9) {

    PrintField(KD.compute_pgm_rsrc1,

               amdhsa::COMPUTE_PGM_RSRC1_GFX9_PLUS_FP16_OVFL_SHIFT,

               amdhsa::COMPUTE_PGM_RSRC1_GFX9_PLUS_FP16_OVFL,

               ".amdhsa_fp16_overflow");

  }

  if (AMDGPU::isGFX90A(STI))

    PrintField(KD.compute_pgm_rsrc3,

               amdhsa::COMPUTE_PGM_RSRC3_GFX90A_TG_SPLIT_SHIFT,

               amdhsa::COMPUTE_PGM_RSRC3_GFX90A_TG_SPLIT, ".amdhsa_tg_split");

  if (AMDGPU::supportsWGP(STI))

    PrintField(KD.compute_pgm_rsrc1,

               amdhsa::COMPUTE_PGM_RSRC1_GFX10_PLUS_WGP_MODE_SHIFT,

               amdhsa::COMPUTE_PGM_RSRC1_GFX10_PLUS_WGP_MODE,

               ".amdhsa_workgroup_processor_mode");

  if (IVersion.Major >= 10) {

    PrintField(KD.compute_pgm_rsrc1,

               amdhsa::COMPUTE_PGM_RSRC1_GFX10_PLUS_MEM_ORDERED_SHIFT,

               amdhsa::COMPUTE_PGM_RSRC1_GFX10_PLUS_MEM_ORDERED,

               ".amdhsa_memory_ordered");

    PrintField(KD.compute_pgm_rsrc1,

               amdhsa::COMPUTE_PGM_RSRC1_GFX10_PLUS_FWD_PROGRESS_SHIFT,

               amdhsa::COMPUTE_PGM_RSRC1_GFX10_PLUS_FWD_PROGRESS,

               ".amdhsa_forward_progress");

  }

  if (IVersion.Major >= 10 && IVersion.Major < 12) {

    PrintField(KD.compute_pgm_rsrc3,

               amdhsa::COMPUTE_PGM_RSRC3_GFX10_GFX11_SHARED_VGPR_COUNT_SHIFT,

               amdhsa::COMPUTE_PGM_RSRC3_GFX10_GFX11_SHARED_VGPR_COUNT,

               ".amdhsa_shared_vgpr_count");

  }

  if (IVersion.Major == 11) {

    PrintField(KD.compute_pgm_rsrc3,

               amdhsa::COMPUTE_PGM_RSRC3_GFX11_INST_PREF_SIZE_SHIFT,

               amdhsa::COMPUTE_PGM_RSRC3_GFX11_INST_PREF_SIZE,

               ".amdhsa_inst_pref_size");

  }

  if (IVersion.Major >= 12) {

    PrintField(KD.compute_pgm_rsrc3,

               amdhsa::COMPUTE_PGM_RSRC3_GFX12_PLUS_INST_PREF_SIZE_SHIFT,

               amdhsa::COMPUTE_PGM_RSRC3_GFX12_PLUS_INST_PREF_SIZE,

               ".amdhsa_inst_pref_size");

    PrintField(KD.compute_pgm_rsrc1,

               amdhsa::COMPUTE_PGM_RSRC1_GFX12_PLUS_ENABLE_WG_RR_EN_SHIFT,

               amdhsa::COMPUTE_PGM_RSRC1_GFX12_PLUS_ENABLE_WG_RR_EN,

               ".amdhsa_round_robin_scheduling");

  }

  PrintField(

      KD.compute_pgm_rsrc2,

      amdhsa::

          COMPUTE_PGM_RSRC2_ENABLE_EXCEPTION_IEEE_754_FP_INVALID_OPERATION_SHIFT,

      amdhsa::COMPUTE_PGM_RSRC2_ENABLE_EXCEPTION_IEEE_754_FP_INVALID_OPERATION,

      ".amdhsa_exception_fp_ieee_invalid_op");

  PrintField(

      KD.compute_pgm_rsrc2,

      amdhsa::COMPUTE_PGM_RSRC2_ENABLE_EXCEPTION_FP_DENORMAL_SOURCE_SHIFT,

      amdhsa::COMPUTE_PGM_RSRC2_ENABLE_EXCEPTION_FP_DENORMAL_SOURCE,

      ".amdhsa_exception_fp_denorm_src");

  PrintField(

      KD.compute_pgm_rsrc2,

      amdhsa::

          COMPUTE_PGM_RSRC2_ENABLE_EXCEPTION_IEEE_754_FP_DIVISION_BY_ZERO_SHIFT,

      amdhsa::COMPUTE_PGM_RSRC2_ENABLE_EXCEPTION_IEEE_754_FP_DIVISION_BY_ZERO,

      ".amdhsa_exception_fp_ieee_div_zero");

  PrintField(

      KD.compute_pgm_rsrc2,

      amdhsa::COMPUTE_PGM_RSRC2_ENABLE_EXCEPTION_IEEE_754_FP_OVERFLOW_SHIFT,

      amdhsa::COMPUTE_PGM_RSRC2_ENABLE_EXCEPTION_IEEE_754_FP_OVERFLOW,

      ".amdhsa_exception_fp_ieee_overflow");

  PrintField(

      KD.compute_pgm_rsrc2,

      amdhsa::COMPUTE_PGM_RSRC2_ENABLE_EXCEPTION_IEEE_754_FP_UNDERFLOW_SHIFT,

      amdhsa::COMPUTE_PGM_RSRC2_ENABLE_EXCEPTION_IEEE_754_FP_UNDERFLOW,

      ".amdhsa_exception_fp_ieee_underflow");

  PrintField(

      KD.compute_pgm_rsrc2,

      amdhsa::COMPUTE_PGM_RSRC2_ENABLE_EXCEPTION_IEEE_754_FP_INEXACT_SHIFT,

      amdhsa::COMPUTE_PGM_RSRC2_ENABLE_EXCEPTION_IEEE_754_FP_INEXACT,

      ".amdhsa_exception_fp_ieee_inexact");

  PrintField(

      KD.compute_pgm_rsrc2,

      amdhsa::COMPUTE_PGM_RSRC2_ENABLE_EXCEPTION_INT_DIVIDE_BY_ZERO_SHIFT,

      amdhsa::COMPUTE_PGM_RSRC2_ENABLE_EXCEPTION_INT_DIVIDE_BY_ZERO,

      ".amdhsa_exception_int_div_zero");


  OS << "\t.end_amdhsa_kernel\n";

}


namespace {

/// Callback type invoked by \c forEachInfoScope for each function scope in

/// the canonical iteration order. The scope is emitted exactly once per

/// unique \p Sym regardless of how many flat entries reference it.

using InfoScopeEmitter = function_ref<void(

    MCSymbol *Sym, const AMDGPU::FuncInfo *Info, ArrayRef<MCSymbol *> Uses,

    ArrayRef<MCSymbol *> Calls, ArrayRef<StringRef> IndirectCallTypeIds,

    ArrayRef<StringRef> TypeIds)>;


/// Group the flat edge lists in \p Data by source function symbol and drive

/// per-scope emission. A scope is opened for every function with attached

/// info and for every function that appears only as an edge source; each

/// scope is emitted exactly once. Both the asm and ELF streamers share this

/// iteration logic and only differ in the per-scope emission callback.

static void forEachInfoScope(const AMDGPU::InfoSectionData &Data,

                             InfoScopeEmitter Emit) {

  DenseMap<MCSymbol *, SmallVector<MCSymbol *, 2>> FuncUses;

  DenseMap<MCSymbol *, SmallVector<MCSymbol *, 4>> FuncCalls;

  DenseMap<MCSymbol *, SmallVector<StringRef, 2>> FuncIndirectCalls;

  DenseMap<MCSymbol *, SmallVector<StringRef, 1>> FuncTypeIds;

  for (const auto &[Func, Res] : Data.Uses)

    FuncUses[Func].push_back(Res);

  for (const auto &[Src, Dst] : Data.Calls)

    FuncCalls[Src].push_back(Dst);

  for (const auto &[Func, TypeId] : Data.IndirectCalls)

    FuncIndirectCalls[Func].push_back(TypeId);

  for (const auto &[Sym, TypeId] : Data.TypeIds)

    FuncTypeIds[Sym].push_back(TypeId);


  DenseSet<MCSymbol *> Emitted;

  auto EmitIfNew = [&](MCSymbol *Sym, const AMDGPU::FuncInfo *Info) {

    if (!Emitted.insert(Sym).second)

      return;

    ArrayRef<MCSymbol *> Uses, Calls;

    ArrayRef<StringRef> IndirectCallTypeIds, TypeIds;

    if (auto It = FuncUses.find(Sym); It != FuncUses.end())

      Uses = It->second;

    if (auto It = FuncCalls.find(Sym); It != FuncCalls.end())

      Calls = It->second;

    if (auto It = FuncIndirectCalls.find(Sym); It != FuncIndirectCalls.end())

      IndirectCallTypeIds = It->second;

    if (auto It = FuncTypeIds.find(Sym); It != FuncTypeIds.end())

      TypeIds = It->second;

    Emit(Sym, Info, Uses, Calls, IndirectCallTypeIds, TypeIds);

  };


  for (const AMDGPU::FuncInfo &Func : Data.Funcs)

    EmitIfNew(Func.Sym, &Func);

  // Emit scopes for functions that only appear as edge sources (e.g. typeid

  // tags on address-taken declarations, or callers of external functions).

  for (const auto &[Sym, TypeId] : Data.TypeIds)

    EmitIfNew(Sym, nullptr);

  for (const auto &[Sym, Res] : Data.Uses)

    EmitIfNew(Sym, nullptr);

  for (const auto &[Sym, Dst] : Data.Calls)

    EmitIfNew(Sym, nullptr);

  for (const auto &[Sym, TypeId] : Data.IndirectCalls)

    EmitIfNew(Sym, nullptr);

}

} // namespace


void AMDGPUTargetAsmStreamer::emitAMDGPUInfo(

    const AMDGPU::InfoSectionData &Data) {

  forEachInfoScope(Data, [&](MCSymbol *Sym, const AMDGPU::FuncInfo *Info,

                             ArrayRef<MCSymbol *> Uses,

                             ArrayRef<MCSymbol *> Calls,

                             ArrayRef<StringRef> IndirectCallTypeIds,

                             ArrayRef<StringRef> TypeIds) {

    OS << "\t.amdgpu_info " << Sym->getName() << '\n';

    if (Info) {

      AMDGPU::FuncInfoFlags Flags{};

      if (Info->UsesVCC)

        Flags |= AMDGPU::FuncInfoFlags::FUNC_USES_VCC;

      if (Info->UsesFlatScratch)

        Flags |= AMDGPU::FuncInfoFlags::FUNC_USES_FLAT_SCRATCH;

      if (Info->HasDynStack)

        Flags |= AMDGPU::FuncInfoFlags::FUNC_HAS_DYN_STACK;

      OS << "\t\t.amdgpu_flags " << llvm::to_underlying(Flags) << '\n';

      OS << "\t\t.amdgpu_num_sgpr " << Info->NumSGPR << '\n';

      OS << "\t\t.amdgpu_num_vgpr " << Info->NumArchVGPR << '\n';

      if (Info->NumAccVGPR)

        OS << "\t\t.amdgpu_num_agpr " << Info->NumAccVGPR << '\n';

      OS << "\t\t.amdgpu_private_segment_size " << Info->PrivateSegmentSize

         << '\n';

    }

    for (MCSymbol *Res : Uses)

      OS << "\t\t.amdgpu_use " << Res->getName() << '\n';

    for (MCSymbol *Dst : Calls)

      OS << "\t\t.amdgpu_call " << Dst->getName() << '\n';

    for (StringRef TypeId : IndirectCallTypeIds)

      OS << "\t\t.amdgpu_indirect_call \"" << TypeId << "\"\n";

    for (StringRef TypeId : TypeIds)

      OS << "\t\t.amdgpu_typeid \"" << TypeId << "\"\n";

    OS << "\t.end_amdgpu_info\n\n";

  });

}


//===----------------------------------------------------------------------===//

// AMDGPUTargetELFStreamer

//===----------------------------------------------------------------------===//


AMDGPUTargetELFStreamer::AMDGPUTargetELFStreamer(MCStreamer &S,

                                                 const MCSubtargetInfo &STI)

    : AMDGPUTargetStreamer(S), STI(STI), Streamer(S) {}


MCELFStreamer &AMDGPUTargetELFStreamer::getStreamer() {

  return static_cast<MCELFStreamer &>(Streamer);

}


// A hook for emitting stuff at the end.

// We use it for emitting the accumulated PAL metadata as a .note record.

// The PAL metadata is reset after it is emitted.


void AMDGPUTargetELFStreamer::finish() {

  ELFObjectWriter &W = getStreamer().getWriter();

  W.setELFHeaderEFlags(getEFlags());

  W.setOverrideABIVersion(

      getELFABIVersion(STI.getTargetTriple(), CodeObjectVersion));


  std::string Blob;

  const char *Vendor = getPALMetadata()->getVendor();

  unsigned Type = getPALMetadata()->getType();

  getPALMetadata()->toBlob(Type, Blob);

  if (Blob.empty())

    return;

  EmitNote(Vendor, MCConstantExpr::create(Blob.size(), getContext()), Type,

           [&](MCELFStreamer &OS) { OS.emitBytes(Blob); });


  // Reset the pal metadata so its data will not affect a compilation that

  // reuses this object.

  getPALMetadata()->reset();

}


void AMDGPUTargetELFStreamer::EmitNote(

    StringRef Name, const MCExpr *DescSZ, unsigned NoteType,

    function_ref<void(MCELFStreamer &)> EmitDesc) {

  auto &S = getStreamer();

  auto &Context = S.getContext();


  auto NameSZ = Name.size() + 1;


  unsigned NoteFlags = 0;

  // TODO Apparently, this is currently needed for OpenCL as mentioned in

  // https://reviews.llvm.org/D74995

  if (isHsaAbi(STI))

    NoteFlags = ELF::SHF_ALLOC;


  S.pushSection();

  S.switchSection(

      Context.getELFSection(ElfNote::SectionName, ELF::SHT_NOTE, NoteFlags));

  S.emitInt32(NameSZ);                       // namesz

  S.emitValue(DescSZ, 4);                    // descz

  S.emitInt32(NoteType);                     // type

  S.emitBytes(Name);                         // name

  S.emitInt8(0);                             // null terminator

  S.emitValueToAlignment(Align(4), 0, 1, 0); // padding 0

  EmitDesc(S);                               // desc

  S.emitValueToAlignment(Align(4), 0, 1, 0); // padding 0

  S.popSection();

}


unsigned AMDGPUTargetELFStreamer::getEFlags() {

  switch (STI.getTargetTriple().getArch()) {

  default:

    llvm_unreachable("Unsupported Arch");

  case Triple::r600:

    return getEFlagsR600();

  case Triple::amdgcn:

    return getEFlagsAMDGCN();

  }

}


unsigned AMDGPUTargetELFStreamer::getEFlagsR600() {

  assert(STI.getTargetTriple().getArch() == Triple::r600);


  return getElfMach(STI.getCPU());

}


unsigned AMDGPUTargetELFStreamer::getEFlagsAMDGCN() {

  assert(STI.getTargetTriple().isAMDGCN());


  switch (STI.getTargetTriple().getOS()) {

  default:

    // TODO: Why are some tests have "mingw" listed as OS?

    // llvm_unreachable("Unsupported OS");

  case Triple::UnknownOS:

    return getEFlagsUnknownOS();

  case Triple::AMDHSA:

    return getEFlagsAMDHSA();

  case Triple::AMDPAL:

    return getEFlagsAMDPAL();

  case Triple::Mesa3D:

    return getEFlagsMesa3D();

  }

}


unsigned AMDGPUTargetELFStreamer::getEFlagsUnknownOS() {

  // TODO: Why are some tests have "mingw" listed as OS?

  // assert(STI.getTargetTriple().getOS() == Triple::UnknownOS);


  return getEFlagsV3();

}


unsigned AMDGPUTargetELFStreamer::getEFlagsAMDHSA() {

  assert(isHsaAbi(STI));


  if (CodeObjectVersion >= 6)

    return getEFlagsV6();

  return getEFlagsV4();

}


unsigned AMDGPUTargetELFStreamer::getEFlagsAMDPAL() {

  assert(STI.getTargetTriple().getOS() == Triple::AMDPAL);


  return getEFlagsV3();

}


unsigned AMDGPUTargetELFStreamer::getEFlagsMesa3D() {

  assert(STI.getTargetTriple().getOS() == Triple::Mesa3D);


  return getEFlagsV3();

}


unsigned AMDGPUTargetELFStreamer::getEFlagsV3() {

  unsigned EFlagsV3 = 0;


  // mach.

  EFlagsV3 |= getElfMach(STI.getCPU());


  // xnack.

  if (getTargetID()->isXnackOnOrAny())

    EFlagsV3 |= ELF::EF_AMDGPU_FEATURE_XNACK_V3;

  // sramecc.

  if (getTargetID()->isSramEccOnOrAny())

    EFlagsV3 |= ELF::EF_AMDGPU_FEATURE_SRAMECC_V3;


  return EFlagsV3;

}


unsigned AMDGPUTargetELFStreamer::getEFlagsV4() {

  unsigned EFlagsV4 = 0;


  // mach.

  EFlagsV4 |= getElfMach(STI.getCPU());


  // xnack.

  switch (getTargetID()->getXnackSetting()) {

  case AMDGPU::IsaInfo::TargetIDSetting::Unsupported:

    EFlagsV4 |= ELF::EF_AMDGPU_FEATURE_XNACK_UNSUPPORTED_V4;

    break;

  case AMDGPU::IsaInfo::TargetIDSetting::Any:

    EFlagsV4 |= ELF::EF_AMDGPU_FEATURE_XNACK_ANY_V4;

    break;

  case AMDGPU::IsaInfo::TargetIDSetting::Off:

    EFlagsV4 |= ELF::EF_AMDGPU_FEATURE_XNACK_OFF_V4;

    break;

  case AMDGPU::IsaInfo::TargetIDSetting::On:

    EFlagsV4 |= ELF::EF_AMDGPU_FEATURE_XNACK_ON_V4;

    break;

  }

  // sramecc.

  switch (getTargetID()->getSramEccSetting()) {

  case AMDGPU::IsaInfo::TargetIDSetting::Unsupported:

    EFlagsV4 |= ELF::EF_AMDGPU_FEATURE_SRAMECC_UNSUPPORTED_V4;

    break;

  case AMDGPU::IsaInfo::TargetIDSetting::Any:

    EFlagsV4 |= ELF::EF_AMDGPU_FEATURE_SRAMECC_ANY_V4;

    break;

  case AMDGPU::IsaInfo::TargetIDSetting::Off:

    EFlagsV4 |= ELF::EF_AMDGPU_FEATURE_SRAMECC_OFF_V4;

    break;

  case AMDGPU::IsaInfo::TargetIDSetting::On:

    EFlagsV4 |= ELF::EF_AMDGPU_FEATURE_SRAMECC_ON_V4;

    break;

  }


  return EFlagsV4;

}


unsigned AMDGPUTargetELFStreamer::getEFlagsV6() {

  unsigned Flags = getEFlagsV4();


  unsigned Version = ForceGenericVersion;

  if (!Version) {

    switch (parseArchAMDGCN(STI.getCPU())) {

    case AMDGPU::GK_GFX9_GENERIC:

      Version = GenericVersion::GFX9;

      break;

    case AMDGPU::GK_GFX9_4_GENERIC:

      Version = GenericVersion::GFX9_4;

      break;

    case AMDGPU::GK_GFX10_1_GENERIC:

      Version = GenericVersion::GFX10_1;

      break;

    case AMDGPU::GK_GFX10_3_GENERIC:

      Version = GenericVersion::GFX10_3;

      break;

    case AMDGPU::GK_GFX11_GENERIC:

      Version = GenericVersion::GFX11;

      break;

    case AMDGPU::GK_GFX12_GENERIC:

      Version = GenericVersion::GFX12;

      break;

    case AMDGPU::GK_GFX12_5_GENERIC:

      Version = GenericVersion::GFX12_5;

      break;

    default:

      break;

    }

  }


  // Versions start at 1.

  if (Version) {

    if (Version > ELF::EF_AMDGPU_GENERIC_VERSION_MAX)

      report_fatal_error("Cannot encode generic code object version " +

                         Twine(Version) +

                         " - no ELF flag can represent this version!");

    Flags |= (Version << ELF::EF_AMDGPU_GENERIC_VERSION_OFFSET);

  }


  return Flags;

}


void AMDGPUTargetELFStreamer::EmitDirectiveAMDGCNTarget() {}


void AMDGPUTargetELFStreamer::EmitAMDKernelCodeT(AMDGPUMCKernelCodeT &Header) {

  MCStreamer &OS = getStreamer();

  OS.pushSection();

  Header.EmitKernelCodeT(OS, getContext());

  OS.popSection();

}


void AMDGPUTargetELFStreamer::EmitAMDGPUSymbolType(StringRef SymbolName,

                                                   unsigned Type) {

  auto *Symbol = static_cast<MCSymbolELF *>(

      getStreamer().getContext().getOrCreateSymbol(SymbolName));

  Symbol->setType(Type);

}


void AMDGPUTargetELFStreamer::emitAMDGPULDS(MCSymbol *Symbol, unsigned Size,

                                            Align Alignment) {

  auto *SymbolELF = static_cast<MCSymbolELF *>(Symbol);

  SymbolELF->setType(ELF::STT_OBJECT);


  if (!SymbolELF->isBindingSet())

    SymbolELF->setBinding(ELF::STB_GLOBAL);


  if (SymbolELF->declareCommon(Size, Alignment)) {

    report_fatal_error("Symbol: " + Symbol->getName() +

                       " redeclared as different type");

  }


  SymbolELF->setIndex(ELF::SHN_AMDGPU_LDS);

  SymbolELF->setSize(MCConstantExpr::create(Size, getContext()));

}


bool AMDGPUTargetELFStreamer::EmitISAVersion() {

  // Create two labels to mark the beginning and end of the desc field

  // and a MCExpr to calculate the size of the desc field.

  auto &Context = getContext();

  auto *DescBegin = Context.createTempSymbol();

  auto *DescEnd = Context.createTempSymbol();

  auto *DescSZ = MCBinaryExpr::createSub(

      MCSymbolRefExpr::create(DescEnd, Context),

      MCSymbolRefExpr::create(DescBegin, Context), Context);


  EmitNote(ElfNote::NoteNameV2, DescSZ, ELF::NT_AMD_HSA_ISA_NAME,

           [&](MCELFStreamer &OS) {

             OS.emitLabel(DescBegin);


             SmallString<32> Str;

             raw_svector_ostream StrOS(Str);

             StrOS << *getTargetID();


             OS.emitBytes(StrOS.str());

             OS.emitLabel(DescEnd);

           });

  return true;

}


bool AMDGPUTargetELFStreamer::EmitHSAMetadata(msgpack::Document &HSAMetadataDoc,

                                              bool Strict) {

  HSAMD::V3::MetadataVerifier Verifier(Strict);

  if (!Verifier.verify(HSAMetadataDoc.getRoot()))

    return false;


  std::string HSAMetadataString;

  HSAMetadataDoc.writeToBlob(HSAMetadataString);


  // Create two labels to mark the beginning and end of the desc field

  // and a MCExpr to calculate the size of the desc field.

  auto &Context = getContext();

  auto *DescBegin = Context.createTempSymbol();

  auto *DescEnd = Context.createTempSymbol();

  auto *DescSZ = MCBinaryExpr::createSub(

      MCSymbolRefExpr::create(DescEnd, Context),

      MCSymbolRefExpr::create(DescBegin, Context), Context);


  EmitNote(ElfNote::NoteNameV3, DescSZ, ELF::NT_AMDGPU_METADATA,

           [&](MCELFStreamer &OS) {

             OS.emitLabel(DescBegin);

             OS.emitBytes(HSAMetadataString);

             OS.emitLabel(DescEnd);

           });

  return true;

}


bool AMDGPUTargetELFStreamer::EmitCodeEnd(const MCSubtargetInfo &STI) {

  const uint32_t Encoded_s_code_end = 0xbf9f0000;

  const uint32_t Encoded_s_nop = 0xbf800000;

  uint32_t Encoded_pad = Encoded_s_code_end;


  // Instruction cache line size in bytes.

  const unsigned Log2CacheLineSize = AMDGPU::isGFX11Plus(STI) ? 7 : 6;

  const unsigned CacheLineSize = 1u << Log2CacheLineSize;


  // Extra padding amount in bytes to support prefetch mode 3.

  unsigned FillSize = 3 * CacheLineSize;


  if (AMDGPU::isGFX90A(STI)) {

    Encoded_pad = Encoded_s_nop;

    FillSize = 16 * CacheLineSize;

  }


  MCStreamer &OS = getStreamer();

  OS.pushSection();

  OS.emitValueToAlignment(Align(CacheLineSize), Encoded_pad, 4);

  for (unsigned I = 0; I < FillSize; I += 4)

    OS.emitInt32(Encoded_pad);

  OS.popSection();

  return true;

}


void AMDGPUTargetELFStreamer::EmitAmdhsaKernelDescriptor(

    const MCSubtargetInfo &STI, StringRef KernelName,

    const MCKernelDescriptor &KernelDescriptor, const MCExpr *NextVGPR,

    const MCExpr *NextSGPR, const MCExpr *ReserveVCC,

    const MCExpr *ReserveFlatScr) {

  auto &Streamer = getStreamer();

  auto &Context = Streamer.getContext();


  auto *KernelCodeSymbol =

      static_cast<MCSymbolELF *>(Context.getOrCreateSymbol(Twine(KernelName)));

  auto *KernelDescriptorSymbol = static_cast<MCSymbolELF *>(

      Context.getOrCreateSymbol(Twine(KernelName) + Twine(".kd")));


  // Copy kernel descriptor symbol's binding, other and visibility from the

  // kernel code symbol.

  KernelDescriptorSymbol->setBinding(KernelCodeSymbol->getBinding());

  KernelDescriptorSymbol->setOther(KernelCodeSymbol->getOther());

  KernelDescriptorSymbol->setVisibility(KernelCodeSymbol->getVisibility());

  // Kernel descriptor symbol's type and size are fixed.

  KernelDescriptorSymbol->setType(ELF::STT_OBJECT);

  KernelDescriptorSymbol->setSize(

      MCConstantExpr::create(sizeof(amdhsa::kernel_descriptor_t), Context));


  // The visibility of the kernel code symbol must be protected or less to allow

  // static relocations from the kernel descriptor to be used.

  if (KernelCodeSymbol->getVisibility() == ELF::STV_DEFAULT)

    KernelCodeSymbol->setVisibility(ELF::STV_PROTECTED);


  Streamer.emitLabel(KernelDescriptorSymbol);

  Streamer.emitValue(

      KernelDescriptor.group_segment_fixed_size,

      sizeof(amdhsa::kernel_descriptor_t::group_segment_fixed_size));

  Streamer.emitValue(

      KernelDescriptor.private_segment_fixed_size,

      sizeof(amdhsa::kernel_descriptor_t::private_segment_fixed_size));

  Streamer.emitValue(KernelDescriptor.kernarg_size,

                     sizeof(amdhsa::kernel_descriptor_t::kernarg_size));


  for (uint32_t i = 0; i < sizeof(amdhsa::kernel_descriptor_t::reserved0); ++i)

    Streamer.emitInt8(0u);


  // FIXME: Remove the use of VK_AMDGPU_REL64 in the expression below. The

  // expression being created is:

  //   (start of kernel code) - (start of kernel descriptor)

  // It implies R_AMDGPU_REL64, but ends up being R_AMDGPU_ABS64.

  Streamer.emitValue(

      MCBinaryExpr::createSub(

          MCSymbolRefExpr::create(KernelCodeSymbol, AMDGPUMCExpr::S_REL64,

                                  Context),

          MCSymbolRefExpr::create(KernelDescriptorSymbol, Context), Context),

      sizeof(amdhsa::kernel_descriptor_t::kernel_code_entry_byte_offset));

  for (uint32_t i = 0; i < sizeof(amdhsa::kernel_descriptor_t::reserved1); ++i)

    Streamer.emitInt8(0u);

  Streamer.emitValue(KernelDescriptor.compute_pgm_rsrc3,

                     sizeof(amdhsa::kernel_descriptor_t::compute_pgm_rsrc3));

  Streamer.emitValue(KernelDescriptor.compute_pgm_rsrc1,

                     sizeof(amdhsa::kernel_descriptor_t::compute_pgm_rsrc1));

  Streamer.emitValue(KernelDescriptor.compute_pgm_rsrc2,

                     sizeof(amdhsa::kernel_descriptor_t::compute_pgm_rsrc2));

  Streamer.emitValue(

      KernelDescriptor.kernel_code_properties,

      sizeof(amdhsa::kernel_descriptor_t::kernel_code_properties));

  Streamer.emitValue(KernelDescriptor.kernarg_preload,

                     sizeof(amdhsa::kernel_descriptor_t::kernarg_preload));

  for (uint32_t i = 0; i < sizeof(amdhsa::kernel_descriptor_t::reserved3); ++i)

    Streamer.emitInt8(0u);

}


void AMDGPUTargetELFStreamer::emitAMDGPUInfo(

    const AMDGPU::InfoSectionData &Data) {

  MCELFStreamer &S = getStreamer();

  MCContext &Context = S.getContext();


  StringTableBuilder StrTab(StringTableBuilder::ELF);

  auto getOrAddString = [&](StringRef Str) -> uint32_t {

    if (Str.empty())

      return UINT32_MAX;

    return StrTab.add(Str);

  };


  auto EmitU32Entry = [&](AMDGPU::InfoKind Kind, uint32_t Val) {

    S.emitInt8(static_cast<uint8_t>(Kind));

    S.emitInt8(4);

    S.emitInt32(Val);

  };

  auto EmitSymEntry = [&](AMDGPU::InfoKind Kind, MCSymbol *Sym) {

    S.emitInt8(static_cast<uint8_t>(Kind));

    S.emitInt8(8);

    S.emitValue(MCSymbolRefExpr::create(Sym, Context), 8);

  };


  S.pushSection();

  MCSectionELF *InfoSec = Context.getELFSection(

      ".amdgpu.info", ELF::SHT_PROGBITS, ELF::SHF_EXCLUDE);

  S.switchSection(InfoSec);


  forEachInfoScope(Data, [&](MCSymbol *Sym, const AMDGPU::FuncInfo *Info,

                             ArrayRef<MCSymbol *> Uses,

                             ArrayRef<MCSymbol *> Calls,

                             ArrayRef<StringRef> IndirectCallTypeIds,

                             ArrayRef<StringRef> TypeIds) {

    EmitSymEntry(AMDGPU::InfoKind::INFO_FUNC, Sym);


    if (Info) {

      AMDGPU::FuncInfoFlags Flags{};

      if (Info->UsesVCC)

        Flags |= AMDGPU::FuncInfoFlags::FUNC_USES_VCC;

      if (Info->UsesFlatScratch)

        Flags |= AMDGPU::FuncInfoFlags::FUNC_USES_FLAT_SCRATCH;

      if (Info->HasDynStack)

        Flags |= AMDGPU::FuncInfoFlags::FUNC_HAS_DYN_STACK;

      EmitU32Entry(AMDGPU::InfoKind::INFO_FLAGS, llvm::to_underlying(Flags));

      EmitU32Entry(AMDGPU::InfoKind::INFO_NUM_SGPR, Info->NumSGPR);

      EmitU32Entry(AMDGPU::InfoKind::INFO_NUM_VGPR, Info->NumArchVGPR);

      // INFO_NUM_AGPR is only emitted when the function actually uses AGPRs,

      // since AGPRs are not available on all architectures.

      if (Info->NumAccVGPR)

        EmitU32Entry(AMDGPU::InfoKind::INFO_NUM_AGPR, Info->NumAccVGPR);

      EmitU32Entry(AMDGPU::InfoKind::INFO_PRIVATE_SEGMENT_SIZE,

                   Info->PrivateSegmentSize);

    }


    for (MCSymbol *Res : Uses)

      EmitSymEntry(AMDGPU::InfoKind::INFO_USE, Res);

    for (MCSymbol *Dst : Calls)

      EmitSymEntry(AMDGPU::InfoKind::INFO_CALL, Dst);

    for (StringRef TypeId : IndirectCallTypeIds) {

      EmitU32Entry(AMDGPU::InfoKind::INFO_INDIRECT_CALL,

                   getOrAddString(TypeId));

    }

    for (StringRef TypeId : TypeIds)

      EmitU32Entry(AMDGPU::InfoKind::INFO_TYPEID, getOrAddString(TypeId));

  });


  if (!StrTab.empty()) {

    StrTab.finalizeInOrder();

    MCSectionELF *Sec = Context.getELFSection(".amdgpu.strtab", ELF::SHT_STRTAB,

                                              ELF::SHF_EXCLUDE);

    S.switchSection(Sec);

    SmallString<128> Buf;

    raw_svector_ostream OS(Buf);

    StrTab.write(OS);

    S.emitBytes(Buf);

  }


  S.popSection();

}


assert
assert(UImm &&(UImm !=~static_cast< T >(0)) &&"Invalid immediate!")

AMDGPUBaseInfo.h

AMDGPUMCExpr.h

AMDGPUMCKernelDescriptor.h
AMDHSA kernel descriptor MCExpr struct for use in MC layer.

AMDGPUMCTargetDesc.h
Provides AMDGPU specific target descriptions.

AMDGPUMetadataVerifier.h
This is a verifier for AMDGPU HSA metadata, which can verify both well-typed metadata and untyped met...

AMDGPUMetadata.h
AMDGPU metadata definitions and in-memory representations.

AMDGPUObjLinkingInfo.h
Enums shared between the AMDGPU backend (LLVM) and the ELF linker (LLD) for the .amdgpu....

AMDGPUPTNote.h
Enums and constants for AMDGPU PT_NOTE sections.

OOBFlagValue::Strict
@ Strict
Definition AMDGPUTargetMachine.cpp:1252

AMDGPUTargetParser.h

ForceGenericVersion
static cl::opt< unsigned > ForceGenericVersion("amdgpu-force-generic-version", cl::desc("Force a specific generic_v<N> flag to be " "added. For testing purposes only."), cl::ReallyHidden, cl::init(0))

PRINT_RES_INFO
#define PRINT_RES_INFO(ARG)

AMDGPUTargetStreamer.h

AMDHSAKernelDescriptor.h
AMDHSA kernel descriptor definitions.

AMDKernelCodeTUtils.h
MC layer struct for AMDGPUMCKernelCodeT, provides MCExpr functionality where required.

ELF.h

CommandLine.h

FormattedStream.h

InlinePriorityMode::Size
@ Size
Definition InlineOrder.cpp:25

MCAsmInfo.h

MCAssembler.h

MCContext.h

MCELFObjectWriter.h

MCELFStreamer.h

MCSubtargetInfo.h

I
#define I(x, y, z)
Definition MD5.cpp:57

Uses
Remove Loads Into Fake Uses
Definition RemoveLoadsIntoFakeUses.cpp:78

Verifier
verify safepoint Safepoint IR Verifier
Definition SafepointIRVerifier.cpp:246

StringTableBuilder.h

CacheLineSize
static cl::opt< unsigned > CacheLineSize("cache-line-size", cl::init(0), cl::Hidden, cl::desc("Use this to override the target cache line size when " "specified by the user."))

NewExpr
Definition ItaniumDemangle.h:2142

PrintField
Definition AMDKernelCodeTUtils.cpp:208

llvm::AMDGPUMCExpr::S_REL64
@ S_REL64
Definition AMDGPUMCExpr.h:57

llvm::AMDGPUPALMetadata::getVendor
const char * getVendor() const
Definition AMDGPUPALMetadata.cpp:1018

llvm::AMDGPUPALMetadata::getType
unsigned getType() const
Definition AMDGPUPALMetadata.cpp:1026

llvm::AMDGPUPALMetadata::toBlob
void toBlob(unsigned Type, std::string &S)
Definition AMDGPUPALMetadata.cpp:868

llvm::AMDGPUPALMetadata::reset
void reset()
Definition AMDGPUPALMetadata.cpp:1041

llvm::AMDGPUPALMetadata::toString
void toString(std::string &S)
Definition AMDGPUPALMetadata.cpp:815

llvm::AMDGPUTargetAsmStreamer::emitAMDGPUInfo
void emitAMDGPUInfo(const AMDGPU::InfoSectionData &Data) override
Definition AMDGPUTargetStreamer.cpp:732

llvm::AMDGPUTargetAsmStreamer::AMDGPUTargetAsmStreamer
AMDGPUTargetAsmStreamer(MCStreamer &S, formatted_raw_ostream &OS)
Definition AMDGPUTargetStreamer.cpp:238

llvm::AMDGPUTargetAsmStreamer::EmitHSAMetadata
bool EmitHSAMetadata(msgpack::Document &HSAMetadata, bool Strict) override
Definition AMDGPUTargetStreamer.cpp:341

llvm::AMDGPUTargetAsmStreamer::EmitAMDGPUSymbolType
void EmitAMDGPUSymbolType(StringRef SymbolName, unsigned Type) override
Definition AMDGPUTargetStreamer.cpp:276

llvm::AMDGPUTargetAsmStreamer::EmitISAVersion
bool EmitISAVersion() override
Definition AMDGPUTargetStreamer.cpp:336

llvm::AMDGPUTargetAsmStreamer::EmitDirectiveAMDHSACodeObjectVersion
void EmitDirectiveAMDHSACodeObjectVersion(unsigned COV) override
Definition AMDGPUTargetStreamer.cpp:259

llvm::AMDGPUTargetAsmStreamer::EmitDirectiveAMDGCNTarget
void EmitDirectiveAMDGCNTarget() override
Definition AMDGPUTargetStreamer.cpp:255

llvm::AMDGPUTargetAsmStreamer::EmitMCResourceMaximums
void EmitMCResourceMaximums(const MCSymbol *MaxVGPR, const MCSymbol *MaxAGPR, const MCSymbol *MaxSGPR, const MCSymbol *MaxNamedBarrier) override
Definition AMDGPUTargetStreamer.cpp:319

llvm::AMDGPUTargetAsmStreamer::EmitAMDKernelCodeT
void EmitAMDKernelCodeT(AMDGPU::AMDGPUMCKernelCodeT &Header) override
Definition AMDGPUTargetStreamer.cpp:265

llvm::AMDGPUTargetAsmStreamer::EmitAmdhsaKernelDescriptor
void EmitAmdhsaKernelDescriptor(const MCSubtargetInfo &STI, StringRef KernelName, const AMDGPU::MCKernelDescriptor &KernelDescriptor, const MCExpr *NextVGPR, const MCExpr *NextSGPR, const MCExpr *ReserveVCC, const MCExpr *ReserveFlatScr) override
Definition AMDGPUTargetStreamer.cpp:379

llvm::AMDGPUTargetAsmStreamer::EmitMCResourceInfo
void EmitMCResourceInfo(const MCSymbol *NumVGPR, const MCSymbol *NumAGPR, const MCSymbol *NumExplicitSGPR, const MCSymbol *NumNamedBarrier, const MCSymbol *PrivateSegmentSize, const MCSymbol *UsesVCC, const MCSymbol *UsesFlatScratch, const MCSymbol *HasDynamicallySizedStack, const MCSymbol *HasRecursion, const MCSymbol *HasIndirectCall) override
Definition AMDGPUTargetStreamer.cpp:293

llvm::AMDGPUTargetAsmStreamer::finish
void finish() override
Definition AMDGPUTargetStreamer.cpp:245

llvm::AMDGPUTargetAsmStreamer::EmitCodeEnd
bool EmitCodeEnd(const MCSubtargetInfo &STI) override
Definition AMDGPUTargetStreamer.cpp:357

llvm::AMDGPUTargetAsmStreamer::emitAMDGPULDS
void emitAMDGPULDS(MCSymbol *Sym, unsigned Size, Align Alignment) override
Definition AMDGPUTargetStreamer.cpp:287

llvm::AMDGPUTargetELFStreamer::EmitDirectiveAMDGCNTarget
void EmitDirectiveAMDGCNTarget() override
Definition AMDGPUTargetStreamer.cpp:993

llvm::AMDGPUTargetELFStreamer::EmitCodeEnd
bool EmitCodeEnd(const MCSubtargetInfo &STI) override
Definition AMDGPUTargetStreamer.cpp:1077

llvm::AMDGPUTargetELFStreamer::EmitAMDKernelCodeT
void EmitAMDKernelCodeT(AMDGPU::AMDGPUMCKernelCodeT &Header) override
Definition AMDGPUTargetStreamer.cpp:995

llvm::AMDGPUTargetELFStreamer::finish
void finish() override
Definition AMDGPUTargetStreamer.cpp:783

llvm::AMDGPUTargetELFStreamer::EmitHSAMetadata
bool EmitHSAMetadata(msgpack::Document &HSAMetadata, bool Strict) override
Definition AMDGPUTargetStreamer.cpp:1050

llvm::AMDGPUTargetELFStreamer::AMDGPUTargetELFStreamer
AMDGPUTargetELFStreamer(MCStreamer &S, const MCSubtargetInfo &STI)
Definition AMDGPUTargetStreamer.cpp:772

llvm::AMDGPUTargetELFStreamer::emitAMDGPULDS
void emitAMDGPULDS(MCSymbol *Sym, unsigned Size, Align Alignment) override
Definition AMDGPUTargetStreamer.cpp:1009

llvm::AMDGPUTargetELFStreamer::EmitAmdhsaKernelDescriptor
void EmitAmdhsaKernelDescriptor(const MCSubtargetInfo &STI, StringRef KernelName, const AMDGPU::MCKernelDescriptor &KernelDescriptor, const MCExpr *NextVGPR, const MCExpr *NextSGPR, const MCExpr *ReserveVCC, const MCExpr *ReserveFlatScr) override
Definition AMDGPUTargetStreamer.cpp:1103

llvm::AMDGPUTargetELFStreamer::getStreamer
MCELFStreamer & getStreamer()
Definition AMDGPUTargetStreamer.cpp:776

llvm::AMDGPUTargetELFStreamer::EmitAMDGPUSymbolType
void EmitAMDGPUSymbolType(StringRef SymbolName, unsigned Type) override
Definition AMDGPUTargetStreamer.cpp:1002

llvm::AMDGPUTargetELFStreamer::emitAMDGPUInfo
void emitAMDGPUInfo(const AMDGPU::InfoSectionData &Data) override
Definition AMDGPUTargetStreamer.cpp:1171

llvm::AMDGPUTargetELFStreamer::EmitISAVersion
bool EmitISAVersion() override
Definition AMDGPUTargetStreamer.cpp:1026

llvm::AMDGPUTargetStreamer::EmitHSAMetadata
virtual bool EmitHSAMetadata(msgpack::Document &HSAMetadata, bool Strict)
Emit HSA Metadata.
Definition AMDGPUTargetStreamer.h:112

llvm::AMDGPUTargetStreamer::getPALMetadata
AMDGPUPALMetadata * getPALMetadata()
Definition AMDGPUTargetStreamer.h:72

llvm::AMDGPUTargetStreamer::AMDGPUTargetStreamer
AMDGPUTargetStreamer(MCStreamer &S)
Definition AMDGPUTargetStreamer.h:66

llvm::AMDGPUTargetStreamer::EmitDirectiveAMDHSACodeObjectVersion
virtual void EmitDirectiveAMDHSACodeObjectVersion(unsigned COV)
Definition AMDGPUTargetStreamer.h:76

llvm::AMDGPUTargetStreamer::EmitHSAMetadataV3
virtual bool EmitHSAMetadataV3(StringRef HSAMetadataString)
Definition AMDGPUTargetStreamer.cpp:49

llvm::AMDGPUTargetStreamer::getElfMach
static unsigned getElfMach(StringRef GPU)
Definition AMDGPUTargetStreamer.cpp:146

llvm::AMDGPUTargetStreamer::getContext
MCContext & getContext() const
Definition AMDGPUTargetStreamer.h:63

llvm::AMDGPUTargetStreamer::getArchNameFromElfMach
static StringRef getArchNameFromElfMach(unsigned ElfMach)
Definition AMDGPUTargetStreamer.cpp:56

llvm::AMDGPUTargetStreamer::getTargetID
const std::optional< AMDGPU::IsaInfo::AMDGPUTargetID > & getTargetID() const
Definition AMDGPUTargetStreamer.h:136

llvm::AMDGPUTargetStreamer::CodeObjectVersion
unsigned CodeObjectVersion
Definition AMDGPUTargetStreamer.h:61

llvm::AMDGPU::HSAMD::V3::MetadataVerifier
Verifier for AMDGPU HSA metadata.
Definition AMDGPUMetadataVerifier.h:45

llvm::ArrayRef
Represent a constant reference to an array (0 or more elements consecutively in memory),...
Definition ArrayRef.h:40

llvm::DenseMapBase::find
iterator find(const_arg_type_t< KeyT > Val)
Definition DenseMap.h:225

llvm::DenseMapBase::end
iterator end()
Definition DenseMap.h:143

llvm::DenseMap
Definition DenseMap.h:834

llvm::DenseSet
Implements a dense probed hash-table based set.
Definition DenseSet.h:289

llvm::Directive
Definition DirectiveEmitter.h:231

llvm::ELFObjectWriter
Definition MCELFObjectWriter.h:142

llvm::MCAsmInfo
This class is intended to be used as a base class for asm properties and features specific to the tar...
Definition MCAsmInfo.h:66

llvm::MCBinaryExpr::createAdd
static const MCBinaryExpr * createAdd(const MCExpr *LHS, const MCExpr *RHS, MCContext &Ctx, SMLoc Loc=SMLoc())
Definition MCExpr.h:343

llvm::MCBinaryExpr::createMul
static const MCBinaryExpr * createMul(const MCExpr *LHS, const MCExpr *RHS, MCContext &Ctx)
Definition MCExpr.h:398

llvm::MCBinaryExpr::createSub
static const MCBinaryExpr * createSub(const MCExpr *LHS, const MCExpr *RHS, MCContext &Ctx)
Definition MCExpr.h:428

llvm::MCConstantExpr::create
static LLVM_ABI const MCConstantExpr * create(int64_t Value, MCContext &Ctx, bool PrintInHex=false, unsigned SizeInBytes=0)
Definition MCExpr.cpp:212

llvm::MCContext
Context object for machine code objects.
Definition MCContext.h:83

llvm::MCContext::getOrCreateSymbol
LLVM_ABI MCSymbol * getOrCreateSymbol(const Twine &Name)
Lookup the symbol inside with the specified Name.
Definition MCContext.cpp:208

llvm::MCContext::getAsmInfo
const MCAsmInfo & getAsmInfo() const
Definition MCContext.h:409

llvm::MCELFStreamer
Definition MCELFStreamer.h:31

llvm::MCELFStreamer::getWriter
ELFObjectWriter & getWriter()
Definition MCELFStreamer.cpp:49

llvm::MCELFStreamer::emitLabel
void emitLabel(MCSymbol *Symbol, SMLoc Loc=SMLoc()) override
Emit a label for Symbol into the current section.
Definition MCELFStreamer.cpp:60

llvm::MCExpr
Base class for the full range of assembler expressions which are needed for parsing.
Definition MCExpr.h:34

llvm::MCObjectStreamer::emitBytes
void emitBytes(StringRef Data) override
Emit the bytes in Data into the output.
Definition MCObjectStreamer.cpp:667

llvm::MCSectionELF
This represents a section on linux, lots of unix variants and some bare metal systems.
Definition MCSectionELF.h:27

llvm::MCStreamer
Streaming machine code generation interface.
Definition MCStreamer.h:222

llvm::MCStreamer::popSection
virtual bool popSection()
Restore the current and previous section from the section stack.
Definition MCStreamer.cpp:1426

llvm::MCStreamer::getContext
MCContext & getContext() const
Definition MCStreamer.h:323

llvm::MCStreamer::emitValue
void emitValue(const MCExpr *Value, unsigned Size, SMLoc Loc=SMLoc())
Definition MCStreamer.cpp:176

llvm::MCStreamer::emitValueToAlignment
virtual void emitValueToAlignment(Align Alignment, int64_t Fill=0, uint8_t FillLen=1, unsigned MaxBytesToEmit=0)
Emit some number of copies of Value until the byte alignment ByteAlignment is reached.
Definition MCStreamer.cpp:1417

llvm::MCStreamer::pushSection
void pushSection()
Save the current and previous section on the section stack.
Definition MCStreamer.h:450

llvm::MCStreamer::switchSection
virtual void switchSection(MCSection *Section, uint32_t Subsec=0)
Set the current section where code is being emitted to Section.
Definition MCStreamer.cpp:1441

llvm::MCStreamer::emitInt32
void emitInt32(uint64_t Value)
Definition MCStreamer.h:757

llvm::MCStreamer::emitInt8
void emitInt8(uint64_t Value)
Definition MCStreamer.h:755

llvm::MCSubtargetInfo
Generic base class for all target subtargets.
Definition MCSubtargetInfo.h:77

llvm::MCSubtargetInfo::hasFeature
bool hasFeature(unsigned Feature) const
Definition MCSubtargetInfo.h:122

llvm::MCSubtargetInfo::getTargetTriple
const Triple & getTargetTriple() const
Definition MCSubtargetInfo.h:111

llvm::MCSubtargetInfo::getCPU
StringRef getCPU() const
Definition MCSubtargetInfo.h:112

llvm::MCSymbolELF
Definition MCSymbolELF.h:15

llvm::MCSymbolELF::setBinding
void setBinding(unsigned Binding) const
Definition MCSymbolELF.cpp:43

llvm::MCSymbolELF::setType
void setType(unsigned Type) const
Definition MCSymbolELF.cpp:92

llvm::MCSymbolRefExpr::create
static const MCSymbolRefExpr * create(const MCSymbol *Symbol, MCContext &Ctx, SMLoc Loc=SMLoc())
Definition MCExpr.h:214

llvm::MCSymbol
MCSymbol - Instances of this class represent a symbol name in the MC file, and MCSymbols are created ...
Definition MCSymbol.h:42

llvm::MCSymbol::getName
StringRef getName() const
getName - Get the symbol name.
Definition MCSymbol.h:188

llvm::SmallString
SmallString - A SmallString is just a SmallVector with methods and accessors that make it work better...
Definition SmallString.h:26

llvm::StringRef
Represent a constant reference to a string, i.e.
Definition StringRef.h:56

llvm::StringTableBuilder
Utility for building string tables with deduplicated suffixes.
Definition StringTableBuilder.h:25

llvm::StringTableBuilder::finalizeInOrder
LLVM_ABI void finalizeInOrder()
Finalize the string table without reording it.
Definition StringTableBuilder.cpp:134

llvm::StringTableBuilder::empty
bool empty() const
Definition StringTableBuilder.h:88

llvm::StringTableBuilder::ELF
@ ELF
Definition StringTableBuilder.h:28

llvm::StringTableBuilder::add
LLVM_ABI size_t add(CachedHashStringRef S, uint8_t Priority=0)
Add a string to the builder.
Definition StringTableBuilder.cpp:220

llvm::StringTableBuilder::write
LLVM_ABI void write(raw_ostream &OS) const
Definition StringTableBuilder.cpp:61

llvm::Triple::AMDHSA
@ AMDHSA
Definition Triple.h:236

llvm::Triple::UnknownOS
@ UnknownOS
Definition Triple.h:213

llvm::Triple::AMDPAL
@ AMDPAL
Definition Triple.h:246

llvm::Triple::Mesa3D
@ Mesa3D
Definition Triple.h:245

llvm::Triple::r600
@ r600
Definition Triple.h:76

llvm::Triple::amdgcn
@ amdgcn
Definition Triple.h:77

llvm::Triple::getArch
ArchType getArch() const
Get the parsed architecture type of this triple.
Definition Triple.h:436

llvm::Twine
Twine - A lightweight data structure for efficiently representing the concatenation of temporary valu...
Definition Twine.h:82

llvm::Type
The instances of the Type class are immutable: once they are created, they are never changed.
Definition Type.h:46

llvm::Value
LLVM Value Representation.
Definition Value.h:75

llvm::cl::opt
Definition CommandLine.h:1454

llvm::formatted_raw_ostream
formatted_raw_ostream - A raw_ostream that wraps another one and keeps track of line and column posit...
Definition FormattedStream.h:31

llvm::function_ref
An efficient, type-erasing, non-owning reference to a callable.
Definition STLFunctionalExtras.h:37

llvm::msgpack::Document
Simple in-memory representation of a document of msgpack objects with ability to find and create arra...
Definition MsgPackDocument.h:293

llvm::msgpack::Document::getRoot
DocNode & getRoot()
Get ref to the document's root element.
Definition MsgPackDocument.h:317

llvm::msgpack::Document::toYAML
LLVM_ABI void toYAML(raw_ostream &OS)
Convert MsgPack Document to YAML text.
Definition MsgPackDocumentYAML.cpp:247

llvm::msgpack::Document::writeToBlob
LLVM_ABI void writeToBlob(std::string &Blob)
Write a MsgPack document to a binary MsgPack blob.
Definition MsgPackDocument.cpp:355

llvm::msgpack::Document::fromYAML
LLVM_ABI bool fromYAML(StringRef S)
Read YAML text into the MsgPack document. Returns false on failure.
Definition MsgPackDocumentYAML.cpp:253

llvm::raw_ostream
This class implements an extremely fast bulk output stream that can only output to a stream.
Definition raw_ostream.h:53

llvm::raw_string_ostream
A raw_ostream that writes to an std::string.
Definition raw_ostream.h:662

llvm::raw_string_ostream::str
std::string & str()
Returns the string's reference.
Definition raw_ostream.h:680

llvm::raw_svector_ostream
A raw_ostream that writes to an SmallVector or SmallString.
Definition raw_ostream.h:692

llvm::raw_svector_ostream::str
StringRef str() const
Return a StringRef for the vector contents.
Definition raw_ostream.h:721

uint32_t

uint8_t

llvm_unreachable
#define llvm_unreachable(msg)
Marks that the current location is not supposed to be reachable.
Definition ErrorHandling.h:164

llvm::AMDGPU::ElfNote::NoteNameV2
const char NoteNameV2[]
Definition AMDGPUPTNote.h:26

llvm::AMDGPU::ElfNote::SectionName
const char SectionName[]
Definition AMDGPUPTNote.h:24

llvm::AMDGPU::ElfNote::NoteNameV3
const char NoteNameV3[]
Definition AMDGPUPTNote.h:27

llvm::AMDGPU::GenericVersion::GFX12_5
static constexpr unsigned GFX12_5
Definition AMDGPUBaseInfo.h:61

llvm::AMDGPU::GenericVersion::GFX9_4
static constexpr unsigned GFX9_4
Definition AMDGPUBaseInfo.h:56

llvm::AMDGPU::GenericVersion::GFX10_1
static constexpr unsigned GFX10_1
Definition AMDGPUBaseInfo.h:57

llvm::AMDGPU::GenericVersion::GFX10_3
static constexpr unsigned GFX10_3
Definition AMDGPUBaseInfo.h:58

llvm::AMDGPU::GenericVersion::GFX11
static constexpr unsigned GFX11
Definition AMDGPUBaseInfo.h:59

llvm::AMDGPU::GenericVersion::GFX9
static constexpr unsigned GFX9
Definition AMDGPUBaseInfo.h:55

llvm::AMDGPU::GenericVersion::GFX12
static constexpr unsigned GFX12
Definition AMDGPUBaseInfo.h:60

llvm::AMDGPU::HSAMD::V3::AssemblerDirectiveBegin
constexpr char AssemblerDirectiveBegin[]
HSA metadata beginning assembler directive.
Definition AMDGPUMetadata.h:466

llvm::AMDGPU::HSAMD::V3::AssemblerDirectiveEnd
constexpr char AssemblerDirectiveEnd[]
HSA metadata ending assembler directive.
Definition AMDGPUMetadata.h:468

llvm::AMDGPU::IsaInfo::TargetIDSetting::On
@ On
Definition AMDGPUBaseInfo.h:154

llvm::AMDGPU::IsaInfo::TargetIDSetting::Unsupported
@ Unsupported
Definition AMDGPUBaseInfo.h:154

llvm::AMDGPU::IsaInfo::TargetIDSetting::Off
@ Off
Definition AMDGPUBaseInfo.h:154

llvm::AMDGPU::IsaInfo::TargetIDSetting::Any
@ Any
Definition AMDGPUBaseInfo.h:154

llvm::AMDGPU
Definition AMDGPUMetadataVerifier.h:34

llvm::AMDGPU::getArchNameR600
LLVM_ABI StringRef getArchNameR600(GPUKind AK)
Definition AMDGPUTargetParser.cpp:45

llvm::AMDGPU::FuncInfoFlags
FuncInfoFlags
Per-function flags packed into INFO_FLAGS entries.
Definition AMDGPUObjLinkingInfo.h:64

llvm::AMDGPU::FuncInfoFlags::FUNC_USES_VCC
@ FUNC_USES_VCC
Definition AMDGPUObjLinkingInfo.h:65

llvm::AMDGPU::FuncInfoFlags::FUNC_USES_FLAT_SCRATCH
@ FUNC_USES_FLAT_SCRATCH
Definition AMDGPUObjLinkingInfo.h:66

llvm::AMDGPU::FuncInfoFlags::FUNC_HAS_DYN_STACK
@ FUNC_HAS_DYN_STACK
Definition AMDGPUObjLinkingInfo.h:67

llvm::AMDGPU::GPUKind
GPUKind
GPU kinds supported by the AMDGPU target.
Definition AMDGPUTargetParser.h:30

llvm::AMDGPU::GK_NONE
@ GK_NONE
Definition AMDGPUTargetParser.h:32

llvm::AMDGPU::printAMDGPUMCExpr
void printAMDGPUMCExpr(const MCExpr *Expr, raw_ostream &OS, const MCAsmInfo *MAI)
Definition AMDGPUMCExpr.cpp:719

llvm::AMDGPU::AMDHSA_COV4
@ AMDHSA_COV4
Definition AMDGPUBaseInfo.h:64

llvm::AMDGPU::AMDHSA_COV5
@ AMDHSA_COV5
Definition AMDGPUBaseInfo.h:64

llvm::AMDGPU::isHsaAbi
bool isHsaAbi(const MCSubtargetInfo &STI)
Definition AMDGPUBaseInfo.cpp:209

llvm::AMDGPU::getIsaVersion
LLVM_ABI IsaVersion getIsaVersion(StringRef GPU)
Definition AMDGPUTargetParser.cpp:111

llvm::AMDGPU::isGFX90A
bool isGFX90A(const MCSubtargetInfo &STI)
Definition AMDGPUBaseInfo.cpp:2703

llvm::AMDGPU::parseArchAMDGCN
LLVM_ABI GPUKind parseArchAMDGCN(StringRef CPU)
Definition AMDGPUTargetParser.cpp:56

llvm::AMDGPU::hasArchitectedFlatScratch
bool hasArchitectedFlatScratch(const MCSubtargetInfo &STI)
Definition AMDGPUBaseInfo.cpp:2711

llvm::AMDGPU::isGFX11Plus
bool isGFX11Plus(const MCSubtargetInfo &STI)
Definition AMDGPUBaseInfo.cpp:2639

llvm::AMDGPU::foldAMDGPUMCExpr
const MCExpr * foldAMDGPUMCExpr(const MCExpr *Expr, MCContext &Ctx)
Definition AMDGPUMCExpr.cpp:710

llvm::AMDGPU::InfoKind
InfoKind
Entry kind values for the .amdgpu.info section.
Definition AMDGPUObjLinkingInfo.h:32

llvm::AMDGPU::InfoKind::INFO_INDIRECT_CALL
@ INFO_INDIRECT_CALL
Indirect call edge: the function contains an indirect call whose callee is expected to match the type...
Definition AMDGPUObjLinkingInfo.h:56

llvm::AMDGPU::InfoKind::INFO_FLAGS
@ INFO_FLAGS
Bitfield of FuncInfoFlags properties for the function. [u32].
Definition AMDGPUObjLinkingInfo.h:38

llvm::AMDGPU::InfoKind::INFO_FUNC
@ INFO_FUNC
Opens a new function scope.
Definition AMDGPUObjLinkingInfo.h:36

llvm::AMDGPU::InfoKind::INFO_NUM_SGPR
@ INFO_NUM_SGPR
Number of SGPRs explicitly used by the function. [u32].
Definition AMDGPUObjLinkingInfo.h:40

llvm::AMDGPU::InfoKind::INFO_NUM_VGPR
@ INFO_NUM_VGPR
Number of architectural VGPRs used by the function. [u32].
Definition AMDGPUObjLinkingInfo.h:42

llvm::AMDGPU::InfoKind::INFO_CALL
@ INFO_CALL
Direct call edge: the function calls the callee identified by the 8-byte relocated symbol.
Definition AMDGPUObjLinkingInfo.h:52

llvm::AMDGPU::InfoKind::INFO_NUM_AGPR
@ INFO_NUM_AGPR
Number of accumulator VGPRs (AGPRs) used by the function. [u32].
Definition AMDGPUObjLinkingInfo.h:44

llvm::AMDGPU::InfoKind::INFO_TYPEID
@ INFO_TYPEID
Function type ID: tags an address-taken function with a type-ID string (at the given ....
Definition AMDGPUObjLinkingInfo.h:60

llvm::AMDGPU::InfoKind::INFO_PRIVATE_SEGMENT_SIZE
@ INFO_PRIVATE_SEGMENT_SIZE
Private (scratch) memory size in bytes required by the function. [u32].
Definition AMDGPUObjLinkingInfo.h:46

llvm::AMDGPU::InfoKind::INFO_USE
@ INFO_USE
Dependency edge: the function uses the resource identified by the 8-byte relocated symbol (e....
Definition AMDGPUObjLinkingInfo.h:49

llvm::AMDGPU::getArchNameAMDGCN
LLVM_ABI StringRef getArchNameAMDGCN(GPUKind AK)
Definition AMDGPUTargetParser.cpp:34

llvm::AMDGPU::hasKernargPreload
unsigned hasKernargPreload(const MCSubtargetInfo &STI)
Definition AMDGPUBaseInfo.cpp:2727

llvm::AMDGPU::supportsWGP
bool supportsWGP(const MCSubtargetInfo &STI)
Definition AMDGPUBaseInfo.cpp:2667

llvm::AMDGPU::isGFX1250Plus
bool isGFX1250Plus(const MCSubtargetInfo &STI)
Definition AMDGPUBaseInfo.cpp:2657

llvm::AMDGPU::getELFABIVersion
uint8_t getELFABIVersion(const Triple &T, unsigned CodeObjectVersion)
Definition AMDGPUBaseInfo.cpp:239

llvm::AMDGPU::parseArchR600
LLVM_ABI GPUKind parseArchR600(StringRef CPU)
Definition AMDGPUTargetParser.cpp:64

llvm::ELF::NT_AMDGPU_METADATA
@ NT_AMDGPU_METADATA
Definition ELF.h:1989

llvm::ELF::SHN_AMDGPU_LDS
@ SHN_AMDGPU_LDS
Definition ELF.h:1972

llvm::ELF::SHF_EXCLUDE
@ SHF_EXCLUDE
Definition ELF.h:1285

llvm::ELF::SHF_ALLOC
@ SHF_ALLOC
Definition ELF.h:1251

llvm::ELF::SHT_STRTAB
@ SHT_STRTAB
Definition ELF.h:1152

llvm::ELF::SHT_PROGBITS
@ SHT_PROGBITS
Definition ELF.h:1150

llvm::ELF::SHT_NOTE
@ SHT_NOTE
Definition ELF.h:1156

llvm::ELF::STB_GLOBAL
@ STB_GLOBAL
Definition ELF.h:1408

llvm::ELF::STT_AMDGPU_HSA_KERNEL
@ STT_AMDGPU_HSA_KERNEL
Definition ELF.h:1433

llvm::ELF::STT_OBJECT
@ STT_OBJECT
Definition ELF.h:1420

llvm::ELF::EF_AMDGPU_GENERIC_VERSION_MAX
@ EF_AMDGPU_GENERIC_VERSION_MAX
Definition ELF.h:927

llvm::ELF::EF_AMDGPU_FEATURE_XNACK_ANY_V4
@ EF_AMDGPU_FEATURE_XNACK_ANY_V4
Definition ELF.h:904

llvm::ELF::EF_AMDGPU_FEATURE_SRAMECC_V3
@ EF_AMDGPU_FEATURE_SRAMECC_V3
Definition ELF.h:895

llvm::ELF::EF_AMDGPU_GENERIC_VERSION_OFFSET
@ EF_AMDGPU_GENERIC_VERSION_OFFSET
Definition ELF.h:925

llvm::ELF::EF_AMDGPU_FEATURE_SRAMECC_UNSUPPORTED_V4
@ EF_AMDGPU_FEATURE_SRAMECC_UNSUPPORTED_V4
Definition ELF.h:915

llvm::ELF::EF_AMDGPU_FEATURE_SRAMECC_OFF_V4
@ EF_AMDGPU_FEATURE_SRAMECC_OFF_V4
Definition ELF.h:919

llvm::ELF::EF_AMDGPU_FEATURE_XNACK_UNSUPPORTED_V4
@ EF_AMDGPU_FEATURE_XNACK_UNSUPPORTED_V4
Definition ELF.h:902

llvm::ELF::EF_AMDGPU_FEATURE_XNACK_OFF_V4
@ EF_AMDGPU_FEATURE_XNACK_OFF_V4
Definition ELF.h:906

llvm::ELF::EF_AMDGPU_FEATURE_XNACK_V3
@ EF_AMDGPU_FEATURE_XNACK_V3
Definition ELF.h:890

llvm::ELF::EF_AMDGPU_FEATURE_XNACK_ON_V4
@ EF_AMDGPU_FEATURE_XNACK_ON_V4
Definition ELF.h:908

llvm::ELF::EF_AMDGPU_MACH_NONE
@ EF_AMDGPU_MACH_NONE
Definition ELF.h:851

llvm::ELF::EF_AMDGPU_FEATURE_SRAMECC_ANY_V4
@ EF_AMDGPU_FEATURE_SRAMECC_ANY_V4
Definition ELF.h:917

llvm::ELF::EF_AMDGPU_FEATURE_SRAMECC_ON_V4
@ EF_AMDGPU_FEATURE_SRAMECC_ON_V4
Definition ELF.h:921

llvm::ELF::NT_AMD_HSA_ISA_NAME
@ NT_AMD_HSA_ISA_NAME
Definition ELF.h:1982

llvm::ELF::STV_PROTECTED
@ STV_PROTECTED
Definition ELF.h:1440

llvm::ELF::STV_DEFAULT
@ STV_DEFAULT
Definition ELF.h:1437

llvm::amdhsa
Definition AMDHSAKernelDescriptor.h:53

llvm::cl::ReallyHidden
@ ReallyHidden
Definition CommandLine.h:139

llvm::cl::init
initializer< Ty > init(const Ty &Val)
Definition CommandLine.h:444

llvm::sframe::Flags
Flags
Definition SFrame.h:39

llvm
This is an optimization pass for GlobalISel generic memory operations.
Definition FunctionInfo.h:25

llvm::Version
FunctionAddr VTableAddr uintptr_t uintptr_t Version
Definition InstrProf.h:334

llvm::report_fatal_error
LLVM_ABI void report_fatal_error(Error Err, bool gen_crash_diag=true)
Definition Error.cpp:163

llvm::to_underlying
constexpr std::underlying_type_t< Enum > to_underlying(Enum E)
Returns underlying integer value of an enum.
Definition STLForwardCompat.h:198

llvm::Data
FunctionAddr VTableAddr uintptr_t uintptr_t Data
Definition InstrProf.h:221

llvm::AMDGPU::AMDGPUMCKernelCodeT
Definition AMDKernelCodeTUtils.h:33

llvm::AMDGPU::FuncInfo
Definition AMDGPUTargetStreamer.h:33

llvm::AMDGPU::InfoSectionData
Definition AMDGPUTargetStreamer.h:45

llvm::AMDGPU::IsaVersion
Instruction set architecture version.
Definition AMDGPUTargetParser.h:43

llvm::AMDGPU::IsaVersion::Major
unsigned Major
Definition AMDGPUTargetParser.h:44

llvm::AMDGPU::MCKernelDescriptor
Definition AMDGPUMCKernelDescriptor.h:27

llvm::AMDGPU::MCKernelDescriptor::compute_pgm_rsrc2
const MCExpr * compute_pgm_rsrc2
Definition AMDGPUMCKernelDescriptor.h:33

llvm::AMDGPU::MCKernelDescriptor::kernarg_size
const MCExpr * kernarg_size
Definition AMDGPUMCKernelDescriptor.h:30

llvm::AMDGPU::MCKernelDescriptor::kernarg_preload
const MCExpr * kernarg_preload
Definition AMDGPUMCKernelDescriptor.h:35

llvm::AMDGPU::MCKernelDescriptor::compute_pgm_rsrc3
const MCExpr * compute_pgm_rsrc3
Definition AMDGPUMCKernelDescriptor.h:31

llvm::AMDGPU::MCKernelDescriptor::private_segment_fixed_size
const MCExpr * private_segment_fixed_size
Definition AMDGPUMCKernelDescriptor.h:29

llvm::AMDGPU::MCKernelDescriptor::bits_get
static const MCExpr * bits_get(const MCExpr *Src, uint32_t Shift, uint32_t Mask, MCContext &Ctx)
Definition AMDGPUMCKernelDescriptor.cpp:97

llvm::AMDGPU::MCKernelDescriptor::compute_pgm_rsrc1
const MCExpr * compute_pgm_rsrc1
Definition AMDGPUMCKernelDescriptor.h:32

llvm::AMDGPU::MCKernelDescriptor::group_segment_fixed_size
const MCExpr * group_segment_fixed_size
Definition AMDGPUMCKernelDescriptor.h:28

llvm::AMDGPU::MCKernelDescriptor::kernel_code_properties
const MCExpr * kernel_code_properties
Definition AMDGPUMCKernelDescriptor.h:34

llvm::Align
This struct is a compact representation of a valid (non-zero power of two) alignment.
Definition Alignment.h:39

llvm::Align::value
constexpr uint64_t value() const
This is a hole in the type system and should not be abused.
Definition Alignment.h:77

llvm::amdhsa::kernel_descriptor_t
Definition AMDHSAKernelDescriptor.h:267

llvm::amdhsa::kernel_descriptor_t::group_segment_fixed_size
uint32_t group_segment_fixed_size
Definition AMDHSAKernelDescriptor.h:268

llvm::amdhsa::kernel_descriptor_t::reserved3
uint8_t reserved3[4]
Definition AMDHSAKernelDescriptor.h:279

llvm::amdhsa::kernel_descriptor_t::reserved1
uint8_t reserved1[20]
Definition AMDHSAKernelDescriptor.h:273

llvm::amdhsa::kernel_descriptor_t::compute_pgm_rsrc1
uint32_t compute_pgm_rsrc1
Definition AMDHSAKernelDescriptor.h:275

llvm::amdhsa::kernel_descriptor_t::private_segment_fixed_size
uint32_t private_segment_fixed_size
Definition AMDHSAKernelDescriptor.h:269

llvm::amdhsa::kernel_descriptor_t::kernarg_size
uint32_t kernarg_size
Definition AMDHSAKernelDescriptor.h:270

llvm::amdhsa::kernel_descriptor_t::kernarg_preload
uint16_t kernarg_preload
Definition AMDHSAKernelDescriptor.h:278

llvm::amdhsa::kernel_descriptor_t::reserved0
uint8_t reserved0[4]
Definition AMDHSAKernelDescriptor.h:271

llvm::amdhsa::kernel_descriptor_t::compute_pgm_rsrc2
uint32_t compute_pgm_rsrc2
Definition AMDHSAKernelDescriptor.h:276

llvm::amdhsa::kernel_descriptor_t::kernel_code_properties
uint16_t kernel_code_properties
Definition AMDHSAKernelDescriptor.h:277

llvm::amdhsa::kernel_descriptor_t::compute_pgm_rsrc3
uint32_t compute_pgm_rsrc3
Definition AMDHSAKernelDescriptor.h:274

llvm::amdhsa::kernel_descriptor_t::kernel_code_entry_byte_offset
int64_t kernel_code_entry_byte_offset
Definition AMDHSAKernelDescriptor.h:272

llvm::cl::desc
Definition CommandLine.h:410