input1: (N,∗,Hin1) 其中 Hin1=in1_features 且 ∗ 表示任意数量的附加维度。除最后一个维度外,输入的其他维度必须相同。
input2: (N,∗,Hin2) 其中 Hin2=in2_features
weight: (out_features,in1_features,in2_features)
bias: (out_features)
output: (N,∗,Hout) 其中 Hout=out_features 并且除最后一个维度外,形状与输入相同。