Context Navigation

Changes between Version 25 and Version 26 of GcnInstrsVop2

Timestamp:: 06/10/17 10:00:25 (7 years ago)
Author:: trac
Comment:: --

Legend:

: Unmodified
: Added
: Removed
: Modified

GcnInstrsVop2

-                      v25
+                      v26
 NOTE: OMOD and CLAMP modifier affects only for instruction that output is
 floating point value.<br />
+NOTE: ABS and negation is applied to source operand for any instruction.</p>
+NOTE: ABS and negation is applied to source operand for any instruction.<br />
+OMOD: OMOD modifier doesn't work for half precision (FP16) instructions (except V_MAC_F16).</p>
 <p>Negation and absolute value can be combined: <code>-ABS(V0)</code>. Modifiers CLAMP and
 OMOD (MUL:2, MUL:4 and DIV:2) can be given in random order.</p>
 …
 <h3>Instruction set</h3>
 <p>Alphabetically sorted instruction list:</p>
+<h4>V_ADD_F16</h4>
+<p>Opcode VOP2: 31 (0x1f) for GCN 1.2<br />
+Opcode VOP3A: 287 (0x11f) for GCN 1.2<br />
+Syntax: V_ADD_F16 VDST, SRC0, SRC1<br />
+Description: Add two FP16 values from SRC0 and SRC1 and store result to VDST.<br />
+Operation:<br />
+<code>VDST = ASHALF(SRC0) + ASHALF(SRC1)</code></p>
 <h4>V_ADD_F32</h4>
 <p>Opcode VOP2: 3 (0x3) for GCN 1.0/1.1; 1 (0x1) for GCN 1.2<br />
 …
 Operation:<br />
 <code>VDST = SRC1 &gt;&gt; (SRC0&amp;31)</code></p>
+<h4>V_MAC_F16</h4>
+<p>Opcode VOP2: 35 (0x23) for GCN 1.2<br />
+Opcode VOP3A: 291 (0x123) for GCN 1.2<br />
+Syntax: V_MAC_F16 VDST, SRC0, SRC1<br />
+Description: Multiply FP16 value from SRC0 by FP16 value from SRC1 and add result to VDST.<br />
+Operation:<br />
+<code>VDST = ASHALF(SRC0) * ASHALF(SRC1) + ASHALF(VDST)</code></p>
 <h4>V_MAC_F32</h4>
 <p>Opcode VOP2: 31 (0x1f) for GCN 1.0/1.1; 22 (0x16) for GCN 1.2<br />
 …
 <code>if (ASFLOAT(SRC0)!=0.0 &amp;&amp; ASFLOAT(SRC1)!=0.0)
     VDST = ASFLOAT(SRC0) * ASFLOAT(SRC1) + ASFLOAT(VDST)</code></p>
+<h4>V_MADMK_F16</h4>
+<p>Opcode: 36 (0x24) for GCN 1.2<br />
+Opcode: 292 (0x124) for GCN 1.2<br />
+Syntax: V_MADMK_F16 VDST, SRC0, FLOAT16LIT, SRC1<br />
+Description: Multiply FP16 value from SRC0 with the constant literal FLOAT16LIT and add
+FP16 value from SRC1; and store result to VDST. Constant literal follows
+after instruction word. Use nearest-even rouding.<br />
+Operation:
+<code>VDST = ASHALF(SRC0) * ASHALF(FLOAT16LIT) + ASHALF(SRC1)</code></p>
 <h4>V_MADMK_F32</h4>
 <p>Opcode: VOP2: 32 (0x20) for GCN 1.0/1.1; 23 (0x17) for GCN 1.2<br />
 …
 Operation:
 <code>VDST = ASFLOAT(SRC0) * ASFLOAT(FLOATLIT) + ASFLOAT(SRC1)</code></p>
+<h4>V_MADAK_F16</h4>
+<p>Opcode: 37 (0x25) for GCN 1.2<br />
+Opcode: 293 (0x125) for GCN 1.2<br />
+Syntax: V_MADAK_F16 VDST, SRC0, SRC1, FLOAT16LIT<br />
+Description: Multiply FP16 value from SRC0 with FP16 value from SRC1 and add
+the constant literal FLOATLIT16; and store result to VDST. Constant literal follows
+after instruction word.<br />
+Operation:
+<code>VDST = ASHALF(SRC0) * ASHALF(SRC1) + ASHALF(FLOAT16LIT)</code></p>
 <h4>V_MADAK_F32</h4>
 <p>Opcode: VOP2: 33 (0x21) for GCN 1.0/1.1; 24 (0x18) for GCN 1.2<br />
 …
 else
     VDST = 0.0</code></p>
+<h4>V_MUL_F16</h4>
+<p>Opcode VOP2: 34 (0x22) for GCN 1.2<br />
+Opcode VOP3A: 290 (0x122) for GCN 1.2<br />
+Syntax: V_MUL_F16 VDST, SRC0, SRC1<br />
+Description: Multiply FP16 value from SRC0 by FP16 value from SRC1
+and store result to VDST.<br />
+Operation:<br />
+<code>VDST = ASHALF(SRC0) * ASHALF(SRC1)</code></p>
 <h4>V_MUL_F32</h4>
 <p>Opcode VOP2: 8 (0x8) for GCN 1.0/1.1; 5 (0x5) for GCN 1.2<br />
 …
 Operation:<br />
 <code>SDST = VSRC0[SSRC1 &amp; 63]</code></p>
+<h4>V_SUB_F16</h4>
+<p>Opcode VOP2: 32 (0x20) for GCN 1.2<br />
+Opcode VOP3A: 288 (0x120) for GCN 1.2<br />
+Syntax: V_SUB_F16 VDST, SRC0, SRC1<br />
+Description: Subtract FP16 value of SRC1 from FP16 value of SRC0 and store result to VDST.<br />
+Operation:<br />
+<code>VDST = ASHALF(SRC0) - ASHALF(SRC1)</code></p>
 <h4>V_SUB_F32</h4>
 <p>Opcode VOP2: 4 (0x4) for GCN 1.0/1.1; 2 (0x2) for GCN 1.2<br />
 …
 VDST = temp
 SDST = (SDST&amp;~mask) | ((temp &gt;&gt; 32) ? mask : 0)</code></p>
+<h4>V_SUBREV_F16</h4>
+<p>Opcode VOP2: 33 (0x21) for GCN 1.2<br />
+Opcode VOP3A: 289 (0x121) for GCN 1.2<br />
+Syntax: V_SUBREV_F16 VDST, SRC0, SRC1<br />
+Description: Subtract FP16 value of SRC0 from FP16 value of SRC1 and store result to VDST.<br />
+Operation:<br />
+<code>VDST = ASHALF(SRC1) - ASHALF(SRC0)</code></p>
 <h4>V_SUBREV_F32</h4>
 <p>Opcode VOP2: 5 (0x5) for GCN 1.0/1.1; 2 (0x3) for GCN 1.2<br />