Target/AArch64/AArch64Subtarget.cpp

06f32e7eSjoerg//===-- AArch64Subtarget.cpp - AArch64 Subtarget Information ----*- C++ -*-===//
06f32e7eSjoerg//
06f32e7eSjoerg// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
06f32e7eSjoerg// See https://llvm.org/LICENSE.txt for license information.
06f32e7eSjoerg// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
06f32e7eSjoerg//
06f32e7eSjoerg//===----------------------------------------------------------------------===//
06f32e7eSjoerg//
06f32e7eSjoerg// This file implements the AArch64 specific subclass of TargetSubtarget.
06f32e7eSjoerg//
06f32e7eSjoerg//===----------------------------------------------------------------------===//
06f32e7eSjoerg
06f32e7eSjoerg#include "AArch64Subtarget.h"
06f32e7eSjoerg
06f32e7eSjoerg#include "AArch64.h"
06f32e7eSjoerg#include "AArch64InstrInfo.h"
06f32e7eSjoerg#include "AArch64PBQPRegAlloc.h"
06f32e7eSjoerg#include "AArch64TargetMachine.h"
*da58b97aSjoerg#include "GISel/AArch64CallLowering.h"
*da58b97aSjoerg#include "GISel/AArch64LegalizerInfo.h"
*da58b97aSjoerg#include "GISel/AArch64RegisterBankInfo.h"
06f32e7eSjoerg#include "MCTargetDesc/AArch64AddressingModes.h"
06f32e7eSjoerg#include "llvm/CodeGen/GlobalISel/InstructionSelect.h"
06f32e7eSjoerg#include "llvm/CodeGen/MachineScheduler.h"
06f32e7eSjoerg#include "llvm/IR/GlobalValue.h"
06f32e7eSjoerg#include "llvm/Support/TargetParser.h"
06f32e7eSjoerg
06f32e7eSjoergusing namespace llvm;
06f32e7eSjoerg
06f32e7eSjoerg#define DEBUG_TYPE "aarch64-subtarget"
06f32e7eSjoerg
06f32e7eSjoerg#define GET_SUBTARGETINFO_CTOR
06f32e7eSjoerg#define GET_SUBTARGETINFO_TARGET_DESC
06f32e7eSjoerg#include "AArch64GenSubtargetInfo.inc"
06f32e7eSjoerg
06f32e7eSjoergstatic cl::opt<bool>
06f32e7eSjoergEnableEarlyIfConvert("aarch64-early-ifcvt", cl::desc("Enable the early if "
06f32e7eSjoerg                     "converter pass"), cl::init(true), cl::Hidden);
06f32e7eSjoerg
06f32e7eSjoerg// If OS supports TBI, use this flag to enable it.
06f32e7eSjoergstatic cl::opt<bool>
06f32e7eSjoergUseAddressTopByteIgnored("aarch64-use-tbi", cl::desc("Assume that top byte of "
06f32e7eSjoerg                         "an address is ignored"), cl::init(false), cl::Hidden);
06f32e7eSjoerg
06f32e7eSjoergstatic cl::opt<bool>
06f32e7eSjoerg    UseNonLazyBind("aarch64-enable-nonlazybind",
06f32e7eSjoerg                   cl::desc("Call nonlazybind functions via direct GOT load"),
06f32e7eSjoerg                   cl::init(false), cl::Hidden);
06f32e7eSjoerg
*da58b97aSjoergstatic cl::opt<unsigned> SVEVectorBitsMax(
*da58b97aSjoerg    "aarch64-sve-vector-bits-max",
*da58b97aSjoerg    cl::desc("Assume SVE vector registers are at most this big, "
*da58b97aSjoerg             "with zero meaning no maximum size is assumed."),
*da58b97aSjoerg    cl::init(0), cl::Hidden);
*da58b97aSjoerg
*da58b97aSjoergstatic cl::opt<unsigned> SVEVectorBitsMin(
*da58b97aSjoerg    "aarch64-sve-vector-bits-min",
*da58b97aSjoerg    cl::desc("Assume SVE vector registers are at least this big, "
*da58b97aSjoerg             "with zero meaning no minimum size is assumed."),
*da58b97aSjoerg    cl::init(0), cl::Hidden);
*da58b97aSjoerg
*da58b97aSjoergstatic cl::opt<bool> UseAA("aarch64-use-aa", cl::init(true),
*da58b97aSjoerg                           cl::desc("Enable the use of AA during codegen."));
*da58b97aSjoerg
06f32e7eSjoergAArch64Subtarget &
06f32e7eSjoergAArch64Subtarget::initializeSubtargetDependencies(StringRef FS,
06f32e7eSjoerg                                                  StringRef CPUString) {
06f32e7eSjoerg  // Determine default and user-specified characteristics
06f32e7eSjoerg
06f32e7eSjoerg  if (CPUString.empty())
06f32e7eSjoerg    CPUString = "generic";
06f32e7eSjoerg
*da58b97aSjoerg  ParseSubtargetFeatures(CPUString, /*TuneCPU*/ CPUString, FS);
06f32e7eSjoerg  initializeProperties();
06f32e7eSjoerg
06f32e7eSjoerg  return *this;
06f32e7eSjoerg}
06f32e7eSjoerg
06f32e7eSjoergvoid AArch64Subtarget::initializeProperties() {
06f32e7eSjoerg  // Initialize CPU specific properties. We should add a tablegen feature for
06f32e7eSjoerg  // this in the future so we can specify it together with the subtarget
06f32e7eSjoerg  // features.
06f32e7eSjoerg  switch (ARMProcFamily) {
06f32e7eSjoerg  case Others:
06f32e7eSjoerg    break;
*da58b97aSjoerg  case Carmel:
*da58b97aSjoerg    CacheLineSize = 64;
*da58b97aSjoerg    break;
06f32e7eSjoerg  case CortexA35:
06f32e7eSjoerg    break;
06f32e7eSjoerg  case CortexA53:
06f32e7eSjoerg  case CortexA55:
*da58b97aSjoerg    PrefFunctionLogAlignment = 4;
06f32e7eSjoerg    break;
06f32e7eSjoerg  case CortexA57:
06f32e7eSjoerg    MaxInterleaveFactor = 4;
06f32e7eSjoerg    PrefFunctionLogAlignment = 4;
06f32e7eSjoerg    break;
06f32e7eSjoerg  case CortexA65:
06f32e7eSjoerg    PrefFunctionLogAlignment = 3;
06f32e7eSjoerg    break;
06f32e7eSjoerg  case CortexA72:
06f32e7eSjoerg  case CortexA73:
06f32e7eSjoerg  case CortexA75:
06f32e7eSjoerg  case CortexA76:
*da58b97aSjoerg  case CortexA77:
*da58b97aSjoerg  case CortexA78:
*da58b97aSjoerg  case CortexA78C:
*da58b97aSjoerg  case CortexR82:
*da58b97aSjoerg  case CortexX1:
06f32e7eSjoerg    PrefFunctionLogAlignment = 4;
06f32e7eSjoerg    break;
*da58b97aSjoerg  case A64FX:
*da58b97aSjoerg    CacheLineSize = 256;
*da58b97aSjoerg    PrefFunctionLogAlignment = 3;
*da58b97aSjoerg    PrefLoopLogAlignment = 2;
*da58b97aSjoerg    MaxInterleaveFactor = 4;
*da58b97aSjoerg    PrefetchDistance = 128;
*da58b97aSjoerg    MinPrefetchStride = 1024;
*da58b97aSjoerg    MaxPrefetchIterationsAhead = 4;
*da58b97aSjoerg    break;
*da58b97aSjoerg  case AppleA7:
*da58b97aSjoerg  case AppleA10:
*da58b97aSjoerg  case AppleA11:
*da58b97aSjoerg  case AppleA12:
*da58b97aSjoerg  case AppleA13:
*da58b97aSjoerg  case AppleA14:
06f32e7eSjoerg    CacheLineSize = 64;
06f32e7eSjoerg    PrefetchDistance = 280;
06f32e7eSjoerg    MinPrefetchStride = 2048;
06f32e7eSjoerg    MaxPrefetchIterationsAhead = 3;
06f32e7eSjoerg    break;
06f32e7eSjoerg  case ExynosM3:
06f32e7eSjoerg    MaxInterleaveFactor = 4;
06f32e7eSjoerg    MaxJumpTableSize = 20;
06f32e7eSjoerg    PrefFunctionLogAlignment = 5;
06f32e7eSjoerg    PrefLoopLogAlignment = 4;
06f32e7eSjoerg    break;
06f32e7eSjoerg  case Falkor:
06f32e7eSjoerg    MaxInterleaveFactor = 4;
06f32e7eSjoerg    // FIXME: remove this to enable 64-bit SLP if performance looks good.
06f32e7eSjoerg    MinVectorRegisterBitWidth = 128;
06f32e7eSjoerg    CacheLineSize = 128;
06f32e7eSjoerg    PrefetchDistance = 820;
06f32e7eSjoerg    MinPrefetchStride = 2048;
06f32e7eSjoerg    MaxPrefetchIterationsAhead = 8;
06f32e7eSjoerg    break;
06f32e7eSjoerg  case Kryo:
06f32e7eSjoerg    MaxInterleaveFactor = 4;
06f32e7eSjoerg    VectorInsertExtractBaseCost = 2;
06f32e7eSjoerg    CacheLineSize = 128;
06f32e7eSjoerg    PrefetchDistance = 740;
06f32e7eSjoerg    MinPrefetchStride = 1024;
06f32e7eSjoerg    MaxPrefetchIterationsAhead = 11;
06f32e7eSjoerg    // FIXME: remove this to enable 64-bit SLP if performance looks good.
06f32e7eSjoerg    MinVectorRegisterBitWidth = 128;
06f32e7eSjoerg    break;
06f32e7eSjoerg  case NeoverseE1:
06f32e7eSjoerg    PrefFunctionLogAlignment = 3;
06f32e7eSjoerg    break;
06f32e7eSjoerg  case NeoverseN1:
*da58b97aSjoerg  case NeoverseN2:
*da58b97aSjoerg  case NeoverseV1:
06f32e7eSjoerg    PrefFunctionLogAlignment = 4;
06f32e7eSjoerg    break;
06f32e7eSjoerg  case Saphira:
06f32e7eSjoerg    MaxInterleaveFactor = 4;
06f32e7eSjoerg    // FIXME: remove this to enable 64-bit SLP if performance looks good.
06f32e7eSjoerg    MinVectorRegisterBitWidth = 128;
06f32e7eSjoerg    break;
06f32e7eSjoerg  case ThunderX2T99:
06f32e7eSjoerg    CacheLineSize = 64;
06f32e7eSjoerg    PrefFunctionLogAlignment = 3;
06f32e7eSjoerg    PrefLoopLogAlignment = 2;
06f32e7eSjoerg    MaxInterleaveFactor = 4;
06f32e7eSjoerg    PrefetchDistance = 128;
06f32e7eSjoerg    MinPrefetchStride = 1024;
06f32e7eSjoerg    MaxPrefetchIterationsAhead = 4;
06f32e7eSjoerg    // FIXME: remove this to enable 64-bit SLP if performance looks good.
06f32e7eSjoerg    MinVectorRegisterBitWidth = 128;
06f32e7eSjoerg    break;
06f32e7eSjoerg  case ThunderX:
06f32e7eSjoerg  case ThunderXT88:
06f32e7eSjoerg  case ThunderXT81:
06f32e7eSjoerg  case ThunderXT83:
06f32e7eSjoerg    CacheLineSize = 128;
06f32e7eSjoerg    PrefFunctionLogAlignment = 3;
06f32e7eSjoerg    PrefLoopLogAlignment = 2;
06f32e7eSjoerg    // FIXME: remove this to enable 64-bit SLP if performance looks good.
06f32e7eSjoerg    MinVectorRegisterBitWidth = 128;
06f32e7eSjoerg    break;
06f32e7eSjoerg  case TSV110:
06f32e7eSjoerg    CacheLineSize = 64;
06f32e7eSjoerg    PrefFunctionLogAlignment = 4;
06f32e7eSjoerg    PrefLoopLogAlignment = 2;
06f32e7eSjoerg    break;
*da58b97aSjoerg  case ThunderX3T110:
*da58b97aSjoerg    CacheLineSize = 64;
*da58b97aSjoerg    PrefFunctionLogAlignment = 4;
*da58b97aSjoerg    PrefLoopLogAlignment = 2;
*da58b97aSjoerg    MaxInterleaveFactor = 4;
*da58b97aSjoerg    PrefetchDistance = 128;
*da58b97aSjoerg    MinPrefetchStride = 1024;
*da58b97aSjoerg    MaxPrefetchIterationsAhead = 4;
*da58b97aSjoerg    // FIXME: remove this to enable 64-bit SLP if performance looks good.
*da58b97aSjoerg    MinVectorRegisterBitWidth = 128;
*da58b97aSjoerg    break;
06f32e7eSjoerg  }
06f32e7eSjoerg}
06f32e7eSjoerg
06f32e7eSjoergAArch64Subtarget::AArch64Subtarget(const Triple &TT, const std::string &CPU,
06f32e7eSjoerg                                   const std::string &FS,
06f32e7eSjoerg                                   const TargetMachine &TM, bool LittleEndian)
*da58b97aSjoerg    : AArch64GenSubtargetInfo(TT, CPU, /*TuneCPU*/ CPU, FS),
06f32e7eSjoerg      ReserveXRegister(AArch64::GPR64commonRegClass.getNumRegs()),
06f32e7eSjoerg      CustomCallSavedXRegs(AArch64::GPR64commonRegClass.getNumRegs()),
06f32e7eSjoerg      IsLittle(LittleEndian),
06f32e7eSjoerg      TargetTriple(TT), FrameLowering(),
06f32e7eSjoerg      InstrInfo(initializeSubtargetDependencies(FS, CPU)), TSInfo(),
06f32e7eSjoerg      TLInfo(TM, *this) {
06f32e7eSjoerg  if (AArch64::isX18ReservedByDefault(TT))
06f32e7eSjoerg    ReserveXRegister.set(18);
06f32e7eSjoerg
06f32e7eSjoerg  CallLoweringInfo.reset(new AArch64CallLowering(*getTargetLowering()));
*da58b97aSjoerg  InlineAsmLoweringInfo.reset(new InlineAsmLowering(getTargetLowering()));
06f32e7eSjoerg  Legalizer.reset(new AArch64LegalizerInfo(*this));
06f32e7eSjoerg
06f32e7eSjoerg  auto *RBI = new AArch64RegisterBankInfo(*getRegisterInfo());
06f32e7eSjoerg
06f32e7eSjoerg  // FIXME: At this point, we can't rely on Subtarget having RBI.
06f32e7eSjoerg  // It's awkward to mix passing RBI and the Subtarget; should we pass
06f32e7eSjoerg  // TII/TRI as well?
06f32e7eSjoerg  InstSelector.reset(createAArch64InstructionSelector(
06f32e7eSjoerg      *static_cast<const AArch64TargetMachine *>(&TM), *this, *RBI));
06f32e7eSjoerg
06f32e7eSjoerg  RegBankInfo.reset(RBI);
06f32e7eSjoerg}
06f32e7eSjoerg
06f32e7eSjoergconst CallLowering *AArch64Subtarget::getCallLowering() const {
06f32e7eSjoerg  return CallLoweringInfo.get();
06f32e7eSjoerg}
06f32e7eSjoerg
*da58b97aSjoergconst InlineAsmLowering *AArch64Subtarget::getInlineAsmLowering() const {
*da58b97aSjoerg  return InlineAsmLoweringInfo.get();
*da58b97aSjoerg}
*da58b97aSjoerg
06f32e7eSjoergInstructionSelector *AArch64Subtarget::getInstructionSelector() const {
06f32e7eSjoerg  return InstSelector.get();
06f32e7eSjoerg}
06f32e7eSjoerg
06f32e7eSjoergconst LegalizerInfo *AArch64Subtarget::getLegalizerInfo() const {
06f32e7eSjoerg  return Legalizer.get();
06f32e7eSjoerg}
06f32e7eSjoerg
06f32e7eSjoergconst RegisterBankInfo *AArch64Subtarget::getRegBankInfo() const {
06f32e7eSjoerg  return RegBankInfo.get();
06f32e7eSjoerg}
06f32e7eSjoerg
06f32e7eSjoerg/// Find the target operand flags that describe how a global value should be
06f32e7eSjoerg/// referenced for the current subtarget.
06f32e7eSjoergunsigned
06f32e7eSjoergAArch64Subtarget::ClassifyGlobalReference(const GlobalValue *GV,
06f32e7eSjoerg                                          const TargetMachine &TM) const {
06f32e7eSjoerg  // MachO large model always goes via a GOT, simply to get a single 8-byte
06f32e7eSjoerg  // absolute relocation on all global addresses.
06f32e7eSjoerg  if (TM.getCodeModel() == CodeModel::Large && isTargetMachO())
06f32e7eSjoerg    return AArch64II::MO_GOT;
06f32e7eSjoerg
06f32e7eSjoerg  if (!TM.shouldAssumeDSOLocal(*GV->getParent(), GV)) {
06f32e7eSjoerg    if (GV->hasDLLImportStorageClass())
06f32e7eSjoerg      return AArch64II::MO_GOT | AArch64II::MO_DLLIMPORT;
06f32e7eSjoerg    if (getTargetTriple().isOSWindows())
06f32e7eSjoerg      return AArch64II::MO_GOT | AArch64II::MO_COFFSTUB;
06f32e7eSjoerg    return AArch64II::MO_GOT;
06f32e7eSjoerg  }
06f32e7eSjoerg
06f32e7eSjoerg  // The small code model's direct accesses use ADRP, which cannot
06f32e7eSjoerg  // necessarily produce the value 0 (if the code is above 4GB).
06f32e7eSjoerg  // Same for the tiny code model, where we have a pc relative LDR.
06f32e7eSjoerg  if ((useSmallAddressing() || TM.getCodeModel() == CodeModel::Tiny) &&
06f32e7eSjoerg      GV->hasExternalWeakLinkage())
06f32e7eSjoerg    return AArch64II::MO_GOT;
06f32e7eSjoerg
06f32e7eSjoerg  // References to tagged globals are marked with MO_NC | MO_TAGGED to indicate
06f32e7eSjoerg  // that their nominal addresses are tagged and outside of the code model. In
06f32e7eSjoerg  // AArch64ExpandPseudo::expandMI we emit an additional instruction to set the
06f32e7eSjoerg  // tag if necessary based on MO_TAGGED.
06f32e7eSjoerg  if (AllowTaggedGlobals && !isa<FunctionType>(GV->getValueType()))
06f32e7eSjoerg    return AArch64II::MO_NC | AArch64II::MO_TAGGED;
06f32e7eSjoerg
06f32e7eSjoerg  return AArch64II::MO_NO_FLAG;
06f32e7eSjoerg}
06f32e7eSjoerg
06f32e7eSjoergunsigned AArch64Subtarget::classifyGlobalFunctionReference(
06f32e7eSjoerg    const GlobalValue *GV, const TargetMachine &TM) const {
06f32e7eSjoerg  // MachO large model always goes via a GOT, because we don't have the
06f32e7eSjoerg  // relocations available to do anything else..
06f32e7eSjoerg  if (TM.getCodeModel() == CodeModel::Large && isTargetMachO() &&
06f32e7eSjoerg      !GV->hasInternalLinkage())
06f32e7eSjoerg    return AArch64II::MO_GOT;
06f32e7eSjoerg
06f32e7eSjoerg  // NonLazyBind goes via GOT unless we know it's available locally.
06f32e7eSjoerg  auto *F = dyn_cast<Function>(GV);
06f32e7eSjoerg  if (UseNonLazyBind && F && F->hasFnAttribute(Attribute::NonLazyBind) &&
06f32e7eSjoerg      !TM.shouldAssumeDSOLocal(*GV->getParent(), GV))
06f32e7eSjoerg    return AArch64II::MO_GOT;
06f32e7eSjoerg
*da58b97aSjoerg  // Use ClassifyGlobalReference for setting MO_DLLIMPORT/MO_COFFSTUB.
*da58b97aSjoerg  if (getTargetTriple().isOSWindows())
*da58b97aSjoerg    return ClassifyGlobalReference(GV, TM);
*da58b97aSjoerg
06f32e7eSjoerg  return AArch64II::MO_NO_FLAG;
06f32e7eSjoerg}
06f32e7eSjoerg
06f32e7eSjoergvoid AArch64Subtarget::overrideSchedPolicy(MachineSchedPolicy &Policy,
06f32e7eSjoerg                                           unsigned NumRegionInstrs) const {
06f32e7eSjoerg  // LNT run (at least on Cyclone) showed reasonably significant gains for
06f32e7eSjoerg  // bi-directional scheduling. 253.perlbmk.
06f32e7eSjoerg  Policy.OnlyTopDown = false;
06f32e7eSjoerg  Policy.OnlyBottomUp = false;
06f32e7eSjoerg  // Enabling or Disabling the latency heuristic is a close call: It seems to
06f32e7eSjoerg  // help nearly no benchmark on out-of-order architectures, on the other hand
06f32e7eSjoerg  // it regresses register pressure on a few benchmarking.
06f32e7eSjoerg  Policy.DisableLatencyHeuristic = DisableLatencySchedHeuristic;
06f32e7eSjoerg}
06f32e7eSjoerg
06f32e7eSjoergbool AArch64Subtarget::enableEarlyIfConversion() const {
06f32e7eSjoerg  return EnableEarlyIfConvert;
06f32e7eSjoerg}
06f32e7eSjoerg
06f32e7eSjoergbool AArch64Subtarget::supportsAddressTopByteIgnored() const {
06f32e7eSjoerg  if (!UseAddressTopByteIgnored)
06f32e7eSjoerg    return false;
06f32e7eSjoerg
06f32e7eSjoerg  if (TargetTriple.isiOS()) {
06f32e7eSjoerg    unsigned Major, Minor, Micro;
06f32e7eSjoerg    TargetTriple.getiOSVersion(Major, Minor, Micro);
06f32e7eSjoerg    return Major >= 8;
06f32e7eSjoerg  }
06f32e7eSjoerg
06f32e7eSjoerg  return false;
06f32e7eSjoerg}
06f32e7eSjoerg
06f32e7eSjoergstd::unique_ptr<PBQPRAConstraint>
06f32e7eSjoergAArch64Subtarget::getCustomPBQPConstraints() const {
06f32e7eSjoerg  return balanceFPOps() ? std::make_unique<A57ChainingConstraint>() : nullptr;
06f32e7eSjoerg}
06f32e7eSjoerg
06f32e7eSjoergvoid AArch64Subtarget::mirFileLoaded(MachineFunction &MF) const {
06f32e7eSjoerg  // We usually compute max call frame size after ISel. Do the computation now
06f32e7eSjoerg  // if the .mir file didn't specify it. Note that this will probably give you
06f32e7eSjoerg  // bogus values after PEI has eliminated the callframe setup/destroy pseudo
06f32e7eSjoerg  // instructions, specify explicitly if you need it to be correct.
06f32e7eSjoerg  MachineFrameInfo &MFI = MF.getFrameInfo();
06f32e7eSjoerg  if (!MFI.isMaxCallFrameSizeComputed())
06f32e7eSjoerg    MFI.computeMaxCallFrameSize(MF);
06f32e7eSjoerg}
*da58b97aSjoerg
*da58b97aSjoergunsigned AArch64Subtarget::getMaxSVEVectorSizeInBits() const {
*da58b97aSjoerg  assert(HasSVE && "Tried to get SVE vector length without SVE support!");
*da58b97aSjoerg  assert(SVEVectorBitsMax % 128 == 0 &&
*da58b97aSjoerg         "SVE requires vector length in multiples of 128!");
*da58b97aSjoerg  assert((SVEVectorBitsMax >= SVEVectorBitsMin || SVEVectorBitsMax == 0) &&
*da58b97aSjoerg         "Minimum SVE vector size should not be larger than its maximum!");
*da58b97aSjoerg  if (SVEVectorBitsMax == 0)
*da58b97aSjoerg    return 0;
*da58b97aSjoerg  return (std::max(SVEVectorBitsMin, SVEVectorBitsMax) / 128) * 128;
*da58b97aSjoerg}
*da58b97aSjoerg
*da58b97aSjoergunsigned AArch64Subtarget::getMinSVEVectorSizeInBits() const {
*da58b97aSjoerg  assert(HasSVE && "Tried to get SVE vector length without SVE support!");
*da58b97aSjoerg  assert(SVEVectorBitsMin % 128 == 0 &&
*da58b97aSjoerg         "SVE requires vector length in multiples of 128!");
*da58b97aSjoerg  assert((SVEVectorBitsMax >= SVEVectorBitsMin || SVEVectorBitsMax == 0) &&
*da58b97aSjoerg         "Minimum SVE vector size should not be larger than its maximum!");
*da58b97aSjoerg  if (SVEVectorBitsMax == 0)
*da58b97aSjoerg    return (SVEVectorBitsMin / 128) * 128;
*da58b97aSjoerg  return (std::min(SVEVectorBitsMin, SVEVectorBitsMax) / 128) * 128;
*da58b97aSjoerg}
*da58b97aSjoerg
*da58b97aSjoergbool AArch64Subtarget::useSVEForFixedLengthVectors() const {
*da58b97aSjoerg  // Prefer NEON unless larger SVE registers are available.
*da58b97aSjoerg  return hasSVE() && getMinSVEVectorSizeInBits() >= 256;
*da58b97aSjoerg}
*da58b97aSjoerg
*da58b97aSjoergbool AArch64Subtarget::useAA() const { return UseAA; }