Add support for building Hwacha with reduced FP precision/no FDIV/no IDIV #29

jerryz123 · 2021-03-14T03:38:36Z

No description provided.

a0u

If unimplemented, the FMA instructions should be excluded from the decode tables so an illegal instruction assertion will be raised if used:

hwacha/src/main/scala/scalar-decode.scala

Lines 314 to 320 in f7e47e1

    
           VFMADD_D  ->(List[BitPat](Y,N,N,N,Y,RX,Y,Y,RX,Y,Y,RX,Y,Y,RX,Y,Y,IMM_X,FN_X,   DW__,A1_X,   A2_X,   Y,FPD,N,VM_X,M_X,      N,SM_X,MT_X, N,I_X,   N,    N,IM_X,   N,ID_X,   Y,FM_MADD, N,FD_X,   N,FC_X,    N,FV_X,    N,N) ++ FMADD_D), 
        
           VFMSUB_D  ->(List[BitPat](Y,N,N,N,Y,RX,Y,Y,RX,Y,Y,RX,Y,Y,RX,Y,Y,IMM_X,FN_X,   DW__,A1_X,   A2_X,   Y,FPD,N,VM_X,M_X,      N,SM_X,MT_X, N,I_X,   N,    N,IM_X,   N,ID_X,   Y,FM_MSUB, N,FD_X,   N,FC_X,    N,FV_X,    N,N) ++ FMSUB_D), 
        
           VFNMADD_D ->(List[BitPat](Y,N,N,N,Y,RX,Y,Y,RX,Y,Y,RX,Y,Y,RX,Y,Y,IMM_X,FN_X,   DW__,A1_X,   A2_X,   Y,FPD,N,VM_X,M_X,      N,SM_X,MT_X, N,I_X,   N,    N,IM_X,   N,ID_X,   Y,FM_NMADD,N,FD_X,   N,FC_X,    N,FV_X,    N,N) ++ FNMADD_D), 
        
           VFNMSUB_D ->(List[BitPat](Y,N,N,N,Y,RX,Y,Y,RX,Y,Y,RX,Y,Y,RX,Y,Y,IMM_X,FN_X,   DW__,A1_X,   A2_X,   Y,FPD,N,VM_X,M_X,      N,SM_X,MT_X, N,I_X,   N,    N,IM_X,   N,ID_X,   Y,FM_NMSUB,N,FD_X,   N,FC_X,    N,FV_X,    N,N) ++ FNMSUB_D), 
        
           VFADD_D   ->(List[BitPat](Y,N,N,N,Y,RX,Y,Y,RX,Y,Y,RX,Y,N,RX,N,Y,IMM_X,FN_X,   DW__,A1_X,   A2_X,   Y,FPD,N,VM_X,M_X,      N,SM_X,MT_X, N,I_X,   N,    N,IM_X,   N,ID_X,   Y,FM_ADD,  N,FD_X,   N,FC_X,    N,FV_X,    N,N) ++ FADD_D), 
        
           VFSUB_D   ->(List[BitPat](Y,N,N,N,Y,RX,Y,Y,RX,Y,Y,RX,Y,N,RX,N,Y,IMM_X,FN_X,   DW__,A1_X,   A2_X,   Y,FPD,N,VM_X,M_X,      N,SM_X,MT_X, N,I_X,   N,    N,IM_X,   N,ID_X,   Y,FM_SUB,  N,FD_X,   N,FC_X,    N,FV_X,    N,N) ++ FSUB_D), 
        
           VFMUL_D   ->(List[BitPat](Y,N,N,N,Y,RX,Y,Y,RX,Y,Y,RX,Y,N,RX,N,Y,IMM_X,FN_X,   DW__,A1_X,   A2_X,   Y,FPD,N,VM_X,M_X,      N,SM_X,MT_X, N,I_X,   N,    N,IM_X,   N,ID_X,   Y,FM_MUL,  N,FD_X,   N,FC_X,    N,FV_X,    N,N) ++ FMUL_D),

This should also apply to single and half precision for consistency.

src/main/scala/vfu-fma.scala

colinschmidt · 2021-03-14T16:43:38Z

I would suggest making all double precision operations illegal (the strange subset that exists when only DFMA is removed is unlikely to be useful) and then I would consider looking at all the other double precision functional units included (FDIV, FCMP, FCOMP) to see how much more area/power you could save.

jerryz123 · 2021-03-14T23:57:49Z

I've revised the PR to more thoroughly remove unused FP units, and explicitly throw illegal instruction exceptions for unsupported types.

jerryz123 requested review from a0u and colinschmidt March 14, 2021 03:38

a0u reviewed Mar 14, 2021

View reviewed changes

src/main/scala/vfu-fma.scala Show resolved Hide resolved

Add support for setting HwachaFLen

dc71b0f

jerryz123 force-pushed the nodfma branch from e7919df to dc71b0f Compare March 14, 2021 22:00

Add support for removing FDIV/IDIV units

418b70c

jerryz123 changed the title ~~Add support for building Hwacha with no DFMAs~~ Add support for building Hwacha with reduced FP precision/no FDIV/no IDIV Mar 17, 2021

jerryz123 added 2 commits April 6, 2021 12:44

Add support for sharing Tile TL port

dab532f

Remove extra reset elements from FConvSlice

82a2dd0

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Add support for building Hwacha with reduced FP precision/no FDIV/no IDIV #29

Add support for building Hwacha with reduced FP precision/no FDIV/no IDIV #29

jerryz123 commented Mar 14, 2021

a0u left a comment

colinschmidt commented Mar 14, 2021

jerryz123 commented Mar 14, 2021

	VFMADD_D ->(List[BitPat](Y,N,N,N,Y,RX,Y,Y,RX,Y,Y,RX,Y,Y,RX,Y,Y,IMM_X,FN_X, DW__,A1_X, A2_X, Y,FPD,N,VM_X,M_X, N,SM_X,MT_X, N,I_X, N, N,IM_X, N,ID_X, Y,FM_MADD, N,FD_X, N,FC_X, N,FV_X, N,N) ++ FMADD_D),
	VFMSUB_D ->(List[BitPat](Y,N,N,N,Y,RX,Y,Y,RX,Y,Y,RX,Y,Y,RX,Y,Y,IMM_X,FN_X, DW__,A1_X, A2_X, Y,FPD,N,VM_X,M_X, N,SM_X,MT_X, N,I_X, N, N,IM_X, N,ID_X, Y,FM_MSUB, N,FD_X, N,FC_X, N,FV_X, N,N) ++ FMSUB_D),
	VFNMADD_D ->(List[BitPat](Y,N,N,N,Y,RX,Y,Y,RX,Y,Y,RX,Y,Y,RX,Y,Y,IMM_X,FN_X, DW__,A1_X, A2_X, Y,FPD,N,VM_X,M_X, N,SM_X,MT_X, N,I_X, N, N,IM_X, N,ID_X, Y,FM_NMADD,N,FD_X, N,FC_X, N,FV_X, N,N) ++ FNMADD_D),
	VFNMSUB_D ->(List[BitPat](Y,N,N,N,Y,RX,Y,Y,RX,Y,Y,RX,Y,Y,RX,Y,Y,IMM_X,FN_X, DW__,A1_X, A2_X, Y,FPD,N,VM_X,M_X, N,SM_X,MT_X, N,I_X, N, N,IM_X, N,ID_X, Y,FM_NMSUB,N,FD_X, N,FC_X, N,FV_X, N,N) ++ FNMSUB_D),
	VFADD_D ->(List[BitPat](Y,N,N,N,Y,RX,Y,Y,RX,Y,Y,RX,Y,N,RX,N,Y,IMM_X,FN_X, DW__,A1_X, A2_X, Y,FPD,N,VM_X,M_X, N,SM_X,MT_X, N,I_X, N, N,IM_X, N,ID_X, Y,FM_ADD, N,FD_X, N,FC_X, N,FV_X, N,N) ++ FADD_D),
	VFSUB_D ->(List[BitPat](Y,N,N,N,Y,RX,Y,Y,RX,Y,Y,RX,Y,N,RX,N,Y,IMM_X,FN_X, DW__,A1_X, A2_X, Y,FPD,N,VM_X,M_X, N,SM_X,MT_X, N,I_X, N, N,IM_X, N,ID_X, Y,FM_SUB, N,FD_X, N,FC_X, N,FV_X, N,N) ++ FSUB_D),
	VFMUL_D ->(List[BitPat](Y,N,N,N,Y,RX,Y,Y,RX,Y,Y,RX,Y,N,RX,N,Y,IMM_X,FN_X, DW__,A1_X, A2_X, Y,FPD,N,VM_X,M_X, N,SM_X,MT_X, N,I_X, N, N,IM_X, N,ID_X, Y,FM_MUL, N,FD_X, N,FC_X, N,FV_X, N,N) ++ FMUL_D),

Add support for building Hwacha with reduced FP precision/no FDIV/no IDIV #29

Are you sure you want to change the base?

Add support for building Hwacha with reduced FP precision/no FDIV/no IDIV #29

Conversation

jerryz123 commented Mar 14, 2021

a0u left a comment

Choose a reason for hiding this comment

colinschmidt commented Mar 14, 2021

jerryz123 commented Mar 14, 2021