Context Navigation

Changes between Version 4 and Version 5 of GcnInstrsVop3p

Timestamp:: 11/27/17 20:00:30 (6 years ago)
Author:: trac
Comment:: --

Legend:

: Unmodified
: Added
: Removed
: Modified

GcnInstrsVop3p

-                      v4
+                      v5
 Syntax: V_MAD_MIX_F32 VDST, SRC0, SRC1, SRC2<br />
 Description: Multiply single FP value from SRC0 by single FP value SRC1 and add
+single FP value from SRC2, and store result to VDST. NEG_HI changes meaning
+to absolute-value modifier. The OP_SEL_HI controls left-shifting of source operands by
+bits (???).<br />
+<code>UINT32 SS0 = OP_SEL_HI&amp;1 ? SRC0&lt;&lt;16 : SRC0
+UINT32 SS1 = OP_SEL_HI&amp;2 ? SRC1&lt;&lt;16 : SRC1
+UINT32 SS2 = OP_SEL_HI&amp;4 ? SRC2&lt;&lt;16 : SRC2
+FLOAT S0 = NEG_HI&amp;1 ? ABS(ASFLOAT(SS0)) : ASFLOAT(SS0)
+FLOAT S1 = NEG_HI&amp;2 ? ABS(ASFLOAT(SS1)) : ASFLOAT(SS1)
+FLOAT S2 = NEG_HI&amp;4 ? ABS(ASFLOAT(SS2)) : ASFLOAT(SS2)
+VDST = S0 * S1 + S2</code></p>
+single FP value from SRC2, and store result to VDST.
+OP_SEL and OP_SEL_HI controls type and place of sources:</p>
+<table>
+<thead>
+<tr>
+<th>OP_SEL</th>
+<th>OP_SEL_HI</th>
+<th>Meaning</th>
+</tr>
+</thead>
+<tbody>
+<tr>
+<td>0</td>
+<td>0</td>
+<td>FP32</td>
+</tr>
+<tr>
+<td>1</td>
+<td>0</td>
+<td>FP32</td>
+</tr>
+<tr>
+<td>0</td>
+<td>1</td>
+<td>FP16 in lower part</td>
+</tr>
+<tr>
+<td>1</td>
+<td>1</td>
+<td>FP32 in higher part</td>
+</tr>
+</tbody>
+</table>
+<p>NEG_HI changes meaning to absolute-value modifier.<br />
+```
+FLOAT getSource(UINT32 S, BYTE OP_SEL, BYTE OP_SEL_HI, SRCINDEX)
+{
+    BYTE mask = 1&lt;<SRCINDEX
+    if ((OP_SEL_HI&mask) == 0)
+        return ASFLOAT(S)
+    if ((OP_SEL&mask) == 0 && (OP_SEL_HI&mask) == 1)
+        return (FLOAT)ASHALF(S&0xffff)
+    else
+        return (FLOAT)ASHALF(S>&gt;16)
+}</p>
+<p>FLOAT SS0 = getSource(SRC0, OP_SEL, OP_SEL_HI, 0)
+FLOAT SS1 = getSource(SRC1, OP_SEL, OP_SEL_HI, 1)
+FLOAT SS2 = getSource(SRC2, OP_SEL, OP_SEL_HI, 2)
+FLOAT S0 = NEG_HI&amp;1 ? ABS(SS0) : SS0
+FLOAT S1 = NEG_HI&amp;2 ? ABS(SS1) : SS1
+FLOAT S2 = NEG_HI&amp;4 ? ABS(SS2) : SS2
+VDST = S0 * S1 + S2
+```</p>
 <h4>V_MAD_MIXLO_F16</h4>
 <p>Opcode: 33 (0x21)<br />
 Syntax: V_MAD_MIXLO_F16 VDST, SRC0, SRC1, SRC2<br />
+Description: Multiply half FP value from SRC0 by half FP value SRC1 and add
+half FP value from SRC2, and store result to lower 16-bit of VDST. NEG_HI changes meaning
+to absolute-value modifier.<br />
+<code>HALF S0 = NEG_HI&amp;1 ? ABS(ASHALF(SRC0)) : ASHALF(SRC0)
+HALF S1 = NEG_HI&amp;2 ? ABS(ASHALF(SRC1)) : ASHALF(SRC1)
+HALF S2 = NEG_HI&amp;4 ? ABS(ASHALF(SRC2)) : ASHALF(SRC2)
+VDST = (ASUINT16(S0 * S1 + S2)&amp;0xfff) | (VDST&amp;0xffff0000)</code></p>
+Description: Multiply FP value from SRC0 by FP value SRC1 and add
+half FP value from SRC2, and store result to lower 16-bit of VDST.
+OP_SEL and OP_SEL_HI controls type and place of sources:</p>
+<table>
+<thead>
+<tr>
+<th>OP_SEL</th>
+<th>OP_SEL_HI</th>
+<th>Meaning</th>
+</tr>
+</thead>
+<tbody>
+<tr>
+<td>0</td>
+<td>0</td>
+<td>FP32</td>
+</tr>
+<tr>
+<td>1</td>
+<td>0</td>
+<td>FP32</td>
+</tr>
+<tr>
+<td>0</td>
+<td>1</td>
+<td>FP16 in lower part</td>
+</tr>
+<tr>
+<td>1</td>
+<td>1</td>
+<td>FP32 in higher part</td>
+</tr>
+</tbody>
+</table>
+<p>NEG_HI changes meaning to absolute-value modifier.<br />
+```
+FLOAT getSource(UINT32 S, BYTE OP_SEL, BYTE OP_SEL_HI, SRCINDEX)
+{
+    BYTE mask = 1&lt;<SRCINDEX
+    if ((OP_SEL_HI&mask) == 0)
+        return ASFLOAT(S)
+    if ((OP_SEL&mask) == 0 && (OP_SEL_HI&mask) == 1)
+        return (FLOAT)ASHALF(S&0xffff)
+    else
+        return (FLOAT)ASHALF(S>&gt;16)
+}</p>
+<p>FLOAT SS0 = getSource(SRC0, OP_SEL, OP_SEL_HI, 0)
+FLOAT SS1 = getSource(SRC1, OP_SEL, OP_SEL_HI, 1)
+FLOAT SS2 = getSource(SRC2, OP_SEL, OP_SEL_HI, 2)
+FLOAT S0 = NEG_HI&amp;1 ? ABS(SS0) : SS0
+FLOAT S1 = NEG_HI&amp;2 ? ABS(SS1) : SS1
+FLOAT S2 = NEG_HI&amp;4 ? ABS(SS2) : SS2
+VDST = (ASUINT32((HALF)(S0 * S1 + S2))&amp;0xfff) | (VDST&amp;0xffff0000)
+```</p>
 <h4>V_MAD_MIXHI_F16</h4>
 <p>Opcode: 34 (0x22)<br />
 …
 Description: Multiply half FP value from SRC0 by half FP value SRC1 and add
 half FP value from SRC2, and store result to higher 16-bit part of VDST.
+NEG_HI changes meaning to absolute-value modifier.<br />
+<code>HALF S0 = NEG_HI&amp;1 ? ABS(ASHALF(SRC0)) : ASHALF(SRC0)
+HALF S1 = NEG_HI&amp;2 ? ABS(ASHALF(SRC1)) : ASHALF(SRC1)
+HALF S2 = NEG_HI&amp;4 ? ABS(ASHALF(SRC2)) : ASHALF(SRC2)
+VDST = (ASUINT16(S0 * S1 + S2)&lt;&lt;16)) | (VDST&amp;0xffff)</code></p>
+OP_SEL and OP_SEL_HI controls type and place of sources:</p>
+<table>
+<thead>
+<tr>
+<th>OP_SEL</th>
+<th>OP_SEL_HI</th>
+<th>Meaning</th>
+</tr>
+</thead>
+<tbody>
+<tr>
+<td>0</td>
+<td>0</td>
+<td>FP32</td>
+</tr>
+<tr>
+<td>1</td>
+<td>0</td>
+<td>FP32</td>
+</tr>
+<tr>
+<td>0</td>
+<td>1</td>
+<td>FP16 in lower part</td>
+</tr>
+<tr>
+<td>1</td>
+<td>1</td>
+<td>FP32 in higher part</td>
+</tr>
+</tbody>
+</table>
+<p>NEG_HI changes meaning to absolute-value modifier.<br />
+```
+FLOAT getSource(UINT32 S, BYTE OP_SEL, BYTE OP_SEL_HI, SRCINDEX)
+{
+    BYTE mask = 1&lt;<SRCINDEX
+    if ((OP_SEL_HI&mask) == 0)
+        return ASFLOAT(S)
+    if ((OP_SEL&mask) == 0 && (OP_SEL_HI&mask) == 1)
+        return (FLOAT)ASHALF(S&0xffff)
+    else
+        return (FLOAT)ASHALF(S>&gt;16)
+}</p>
+<p>FLOAT SS0 = getSource(SRC0, OP_SEL, OP_SEL_HI, 0)
+FLOAT SS1 = getSource(SRC1, OP_SEL, OP_SEL_HI, 1)
+FLOAT SS2 = getSource(SRC2, OP_SEL, OP_SEL_HI, 2)
+FLOAT S0 = NEG_HI&amp;1 ? ABS(SS0) : SS0
+FLOAT S1 = NEG_HI&amp;2 ? ABS(SS1) : SS1
+FLOAT S2 = NEG_HI&amp;4 ? ABS(SS2) : SS2
+VDST = (ASUINT32((HALF)(S0 * S1 + S2))&lt;&lt;16) | (VDST&amp;0xffff)
+```</p>
 <h4>V_PK_ADD_F16</h4>
 <p>Opcode: 15 (0xf)<br />