Cross Reference: /netbsd-current/external/apache2/llvm/dist/llvm/lib/Target/X86/

//===---------------------------------------------------------------------===//
// Random ideas for the X86 backend: FP stack related stuff
//===---------------------------------------------------------------------===//

//===---------------------------------------------------------------------===//

Some targets (e.g. athlons) prefer freep to fstp ST(0):
http://gcc.gnu.org/ml/gcc-patches/2004-04/msg00659.html

//===---------------------------------------------------------------------===//

This should use fiadd on chips where it is profitable:
double foo(double P, int *I) { return P+*I; }

We have fiadd patterns now but the followings have the same cost and
complexity. We need a way to specify the later is more profitable.

def FpADD32m  : FpI<(ops RFP:$dst, RFP:$src1, f32mem:$src2), OneArgFPRW,
                    [(set RFP:$dst, (fadd RFP:$src1,
                                     (extloadf64f32 addr:$src2)))]>;
                // ST(0) = ST(0) + [mem32]

def FpIADD32m : FpI<(ops RFP:$dst, RFP:$src1, i32mem:$src2), OneArgFPRW,
                    [(set RFP:$dst, (fadd RFP:$src1,
                                     (X86fild addr:$src2, i32)))]>;
                // ST(0) = ST(0) + [mem32int]

//===---------------------------------------------------------------------===//

The FP stackifier should handle simple permutates to reduce number of shuffle
instructions, e.g. turning:

fld P	->		fld Q
fld Q			fld P
fxch

or:

fxch	->		fucomi
fucomi			jl X
jg X

Ideas:
http://gcc.gnu.org/ml/gcc-patches/2004-11/msg02410.html


//===---------------------------------------------------------------------===//

Add a target specific hook to DAG combiner to handle SINT_TO_FP and
FP_TO_SINT when the source operand is already in memory.

//===---------------------------------------------------------------------===//

Open code rint,floor,ceil,trunc:
http://gcc.gnu.org/ml/gcc-patches/2004-08/msg02006.html
http://gcc.gnu.org/ml/gcc-patches/2004-08/msg02011.html

Opencode the sincos[f] libcall.

//===---------------------------------------------------------------------===//

None of the FPStack instructions are handled in
X86RegisterInfo::foldMemoryOperand, which prevents the spiller from
folding spill code into the instructions.

//===---------------------------------------------------------------------===//

Currently the x86 codegen isn't very good at mixing SSE and FPStack
code:

unsigned int foo(double x) { return x; }

foo:
	subl $20, %esp
	movsd 24(%esp), %xmm0
	movsd %xmm0, 8(%esp)
	fldl 8(%esp)
	fisttpll (%esp)
	movl (%esp), %eax
	addl $20, %esp
	ret

This just requires being smarter when custom expanding fptoui.

//===---------------------------------------------------------------------===//
Name		Date	Size
..		30-May-2021	31
AsmParser/	H	30-May-2021	7
CMakeLists.txt	H A D	30-May-2021	2.8 KiB
Disassembler/	H	30-May-2021	6
ImmutableGraph.h	H A D	29-May-2021	15.2 KiB
MCTargetDesc/	H	30-May-2021	29
README-FPStack.txt	H A D	08-Nov-2019	2.7 KiB
README-SSE.txt	H A D	08-Nov-2019	23.9 KiB
README-X86-64.txt	H A D	08-Nov-2019	6 KiB
README.txt	H A D	08-Nov-2019	47.1 KiB
TargetInfo/	H	30-May-2021	6
X86.h	H A D	30-May-2021	8.1 KiB
X86.td	H A D	30-May-2021	73.9 KiB
X86AsmPrinter.cpp	H A D	30-May-2021	27.3 KiB
X86AsmPrinter.h	H A D	30-May-2021	6 KiB
X86AvoidStoreForwardingBlocks.cpp	H A D	30-May-2021	27.9 KiB
X86AvoidTrailingCall.cpp	H A D	30-May-2021	4.9 KiB
X86CallFrameOptimization.cpp	H A D	30-May-2021	23.1 KiB
X86CallingConv.cpp	H A D	30-May-2021	13.6 KiB
X86CallingConv.h	H A D	08-Nov-2019	1.1 KiB
X86CallingConv.td	H A D	30-May-2021	47 KiB
X86CallLowering.cpp	H A D	30-May-2021	14.2 KiB
X86CallLowering.h	H A D	30-May-2021	1.5 KiB
X86CmovConversion.cpp	H A D	30-May-2021	34 KiB
X86DiscriminateMemOps.cpp	H A D	30-May-2021	7.1 KiB
X86DomainReassignment.cpp	H A D	30-May-2021	25.9 KiB
X86EvexToVex.cpp	H A D	30-May-2021	8.9 KiB
X86ExpandPseudo.cpp	H A D	30-May-2021	27.5 KiB
X86FastISel.cpp	H A D	30-May-2021	137.4 KiB
X86FastTileConfig.cpp	H A D	29-May-2021	9.6 KiB
X86FixupBWInsts.cpp	H A D	30-May-2021	18.1 KiB
X86FixupLEAs.cpp	H A D	30-May-2021	25 KiB
X86FixupSetCC.cpp	H A D	30-May-2021	4.6 KiB
X86FlagsCopyLowering.cpp	H A D	30-May-2021	40.4 KiB
X86FloatingPoint.cpp	H A D	30-May-2021	62.7 KiB
X86FrameLowering.cpp	H A D	30-May-2021	142.6 KiB
X86FrameLowering.h	H A D	30-May-2021	11.5 KiB
X86GenRegisterBankInfo.def	H A D	08-Nov-2019	3.3 KiB
X86IndirectBranchTracking.cpp	H A D	30-May-2021	6.2 KiB
X86IndirectThunks.cpp	H A D	29-May-2021	9.8 KiB
X86InsertPrefetch.cpp	H A D	30-May-2021	9.7 KiB
X86InsertWait.cpp	H A D	29-May-2021	4.4 KiB
X86InstCombineIntrinsic.cpp	H A D	29-May-2021	74 KiB
X86Instr3DNow.td	H A D	08-Nov-2019	5.2 KiB
X86InstrAMX.td	H A D	29-May-2021	8.7 KiB
X86InstrArithmetic.td	H A D	30-May-2021	76.1 KiB
X86InstrAVX512.td	H A D	30-May-2021	625 KiB
X86InstrBuilder.h	H A D	30-May-2021	8.5 KiB
X86InstrCMovSetCC.td	H A D	08-Nov-2019	5.8 KiB
X86InstrCompiler.td	H A D	30-May-2021	98.1 KiB
X86InstrControl.td	H A D	30-May-2021	21.1 KiB
X86InstrExtension.td	H A D	08-Nov-2019	11.6 KiB
X86InstrFMA.td	H A D	30-May-2021	33.3 KiB
X86InstrFMA3Info.cpp	H A D	30-May-2021	6.2 KiB
X86InstrFMA3Info.h	H A D	30-May-2021	3.2 KiB
X86InstrFoldTables.cpp	H A D	30-May-2021	394.1 KiB
X86InstrFoldTables.h	H A D	30-May-2021	3 KiB
X86InstrFormats.td	H A D	30-May-2021	41.4 KiB
X86InstrFPStack.td	H A D	30-May-2021	39.9 KiB
X86InstrFragmentsSIMD.td	H A D	30-May-2021	61.4 KiB
X86InstrInfo.cpp	H A D	30-May-2021	327.9 KiB
X86InstrInfo.h	H A D	30-May-2021	29.7 KiB
X86InstrInfo.td	H A D	30-May-2021	172.9 KiB
X86InstrKL.td	H A D	29-May-2021	4 KiB
X86InstrMMX.td	H A D	30-May-2021	29.6 KiB
X86InstrMPX.td	H A D	08-Nov-2019	3.6 KiB
X86InstrSGX.td	H A D	30-May-2021	1.1 KiB
X86InstrShiftRotate.td	H A D	30-May-2021	49.6 KiB
X86InstrSNP.td	H A D	29-May-2021	1.8 KiB
X86InstrSSE.td	H A D	30-May-2021	386.8 KiB
X86InstrSVM.td	H A D	30-May-2021	2.7 KiB
X86InstrSystem.td	H A D	30-May-2021	34.5 KiB
X86InstrTDX.td	H A D	29-May-2021	1.3 KiB
X86InstrTSX.td	H A D	30-May-2021	2.1 KiB
X86InstructionSelector.cpp	H A D	30-May-2021	59.4 KiB
X86InstrVecCompiler.td	H A D	08-Nov-2019	21.1 KiB
X86InstrVMX.td	H A D	30-May-2021	3.5 KiB
X86InstrXOP.td	H A D	30-May-2021	23.8 KiB
X86InterleavedAccess.cpp	H A D	30-May-2021	32.5 KiB
X86IntrinsicsInfo.h	H A D	30-May-2021	73.8 KiB
X86ISelDAGToDAG.cpp	H A D	30-May-2021	221.5 KiB
X86ISelLowering.cpp	H A D	30-May-2021	2 MiB
X86ISelLowering.h	H A D	30-May-2021	61.3 KiB
X86LegalizerInfo.cpp	H A D	30-May-2021	15.6 KiB
X86LegalizerInfo.h	H A D	30-May-2021	1.6 KiB
X86LoadValueInjectionLoadHardening.cpp	H A D	29-May-2021	31.9 KiB
X86LoadValueInjectionRetHardening.cpp	H A D	29-May-2021	4.1 KiB
X86LowerAMXIntrinsics.cpp	H A D	29-May-2021	27.6 KiB
X86LowerAMXType.cpp	H A D	29-May-2021	23.9 KiB
X86LowerTileCopy.cpp	H A D	29-May-2021	4.7 KiB
X86MachineFunctionInfo.cpp	H A D	08-Nov-2019	1.1 KiB
X86MachineFunctionInfo.h	H A D	30-May-2021	9.5 KiB
X86MacroFusion.cpp	H A D	30-May-2021	2.6 KiB
X86MacroFusion.h	H A D	30-May-2021	992
X86MCInstLower.cpp	H A D	30-May-2021	97 KiB
X86OptimizeLEAs.cpp	H A D	30-May-2021	28.8 KiB
X86PadShortFunction.cpp	H A D	30-May-2021	7.3 KiB
X86PartialReduction.cpp	H A D	29-May-2021	15.4 KiB
X86PfmCounters.td	H A D	30-May-2021	10.7 KiB
X86PreAMXConfig.cpp	H A D	29-May-2021	17.4 KiB
X86PreTileConfig.cpp	H A D	29-May-2021	14.8 KiB
X86RegisterBankInfo.cpp	H A D	30-May-2021	10.6 KiB
X86RegisterBankInfo.h	H A D	30-May-2021	2.9 KiB
X86RegisterBanks.td	H A D	08-Nov-2019	629
X86RegisterInfo.cpp	H A D	30-May-2021	33.3 KiB
X86RegisterInfo.h	H A D	30-May-2021	6.1 KiB
X86RegisterInfo.td	H A D	30-May-2021	26.2 KiB
X86SchedBroadwell.td	H A D	30-May-2021	69.6 KiB
X86SchedHaswell.td	H A D	30-May-2021	74 KiB
X86SchedPredicates.td	H A D	08-Nov-2019	4.2 KiB
X86SchedSandyBridge.td	H A D	30-May-2021	50.1 KiB
X86SchedSkylakeClient.td	H A D	30-May-2021	74.8 KiB
X86SchedSkylakeServer.td	H A D	30-May-2021	114 KiB
X86Schedule.td	H A D	30-May-2021	37 KiB
X86ScheduleAtom.td	H A D	30-May-2021	38.2 KiB
X86ScheduleBdVer2.td	H A D	30-May-2021	56.8 KiB
X86ScheduleBtVer2.td	H A D	30-May-2021	47 KiB
X86ScheduleSLM.td	H A D	30-May-2021	23 KiB
X86ScheduleZnver1.td	H A D	30-May-2021	48.8 KiB
X86ScheduleZnver2.td	H A D	29-May-2021	48 KiB
X86ScheduleZnver3.td	H A D	29-May-2021	75.8 KiB
X86SelectionDAGInfo.cpp	H A D	30-May-2021	12.3 KiB
X86SelectionDAGInfo.h	H A D	30-May-2021	1.8 KiB
X86ShuffleDecodeConstantPool.cpp	H A D	30-May-2021	9.5 KiB
X86ShuffleDecodeConstantPool.h	H A D	30-May-2021	1.7 KiB
X86SpeculativeExecutionSideEffectSuppression.cpp	H A D	29-May-2021	7 KiB
X86SpeculativeLoadHardening.cpp	H A D	30-May-2021	93.2 KiB
X86Subtarget.cpp	H A D	30-May-2021	12.3 KiB
X86Subtarget.h	H A D	30-May-2021	32.8 KiB
X86TargetMachine.cpp	H A D	30-May-2021	20.2 KiB
X86TargetMachine.h	H A D	30-May-2021	2.1 KiB
X86TargetObjectFile.cpp	H A D	30-May-2021	2.3 KiB
X86TargetObjectFile.h	H A D	30-May-2021	2.1 KiB
X86TargetTransformInfo.cpp	H A D	30-May-2021	210.8 KiB
X86TargetTransformInfo.h	H A D	30-May-2021	11.1 KiB
X86TileConfig.cpp	H A D	29-May-2021	6.9 KiB
X86VZeroUpper.cpp	H A D	30-May-2021	12.6 KiB
X86WinAllocaExpander.cpp	H A D	30-May-2021	9.5 KiB
X86WinEHState.cpp	H A D	30-May-2021	29 KiB