Context Navigation

Changes between Version 26 and Version 27 of GcnInstrsVop2

Timestamp:: 06/10/17 12:00:24 (7 years ago)
Author:: trac
Comment:: --

Legend:

: Unmodified
: Added
: Removed
: Modified

GcnInstrsVop2

-                      v26
+                      v27
 UINT64 mask = (1ULL&lt;&lt;LANEID)
 SDST = (SDST&amp;~mask) | ((temp &gt;&gt; 32) ? mask : 0)</code></p>
+<h4>V_ADD_U16</h4>
+<p>Opcode VOP2: 38 (0x26) for GCN 1.2<br />
+Opcode VOP3A: 294 (0x126) for GCN 1.2<br />
+Syntax: V_ADD_U16 VDST, SRC0, SRC1<br />
+Description: Add two 16-bit unsigned values from SRC0 and SRC1 and
+store 16-bit unsigned result to VDST.<br />
+Operation:<br />
+<code>VDST = (SRC0 + SRC1) &amp; 0xffff</code></p>
 <h4>V_ADDC_U32</h4>
 <p>Opcode VOP2: 40 (0x28) for GCN 1.0/1.1; 28 (0x1c) for GCN 1.2<br />
 …
 Operation:<br />
 <code>VDST = (INT32)SRC0 &gt;&gt; (SRC1&amp;31)</code></p>
+<h4>V_ASHRREV_B16</h4>
+<p>Opcode VOP2: 44 (0x2c) for GCN 1.2<br />
+Opcode VOP3A: 300 (0x12c) for GCN 1.2<br />
+Syntax: V_ASHRREV_B16 VDST, SRC0, SRC1<br />
+Description: Shift right signed 16-bit value from SRC1 by (SRC0&amp;15) bits and
+store 16-bit signed result into VDST.<br />
+Operation:<br />
+<code>VDST = ((INT16)SRC1 &gt;&gt; (SRC0&amp;15)) &amp; 0xffff</code></p>
 <h4>V_ASHRREV_I32</h4>
 <p>Opcode VOP2: 24 (0x18) for GCN 1.0/1.1; 16 (0x11) for GCN 1.2<br />
 …
 UINT16 D1 = ASINT16(CVT_HALF_RTZ(ASFLOAT(SRC1)))
 VDST = D0 | (((UINT32)D1) &lt;&lt; 16)</code></p>
+<h4>V_LDEXP_F16</h4>
+<p>Opcode VOP2: 51 (0x33) for GCN 1.2<br />
+Opcode VOP3A: 307 (0x133) for GCN 1.2<br />
+Syntax: V_LDEXP_F16 VDST, SRC0, SRC1<br />
+Description: Do ldexp operation on SRC0 and SRC1 (multiply SRC0 by 2**(SRC1)).
+SRC1 is signed integer, SRC0 is half floating point value.<br />
+Operation:<br />
+<code>VDST = ASHALF(SRC0) * POW(2.0, (INT32)SRC1)</code></p>
 <h4>V_LDEXP_F32</h4>
 <p>Opcode VOP2: 43 (0x2b) for GCN 1.0/1.1<br />
 …
 Operation:<br />
 <code>VDST = SRC0 &lt;&lt; (SRC1&amp;31)</code></p>
+<h4>V_LSHLREV_B16</h4>
+<p>Opcode VOP2: 42 (0x2a) for GCN 1.2<br />
+Opcode VOP3A: 298 (0x12a) for GCN 1.2<br />
+Syntax: V_LSHLREV_B16 VDST, SRC0, SRC1<br />
+Description: Shift left unsigned 16-bit value from SRC1 by (SRC0&amp;15) bits and
+store 16-bit unsigned result into VDST.<br />
+Operation:<br />
+<code>VDST = (SRC1 &lt;&lt; (SRC0&amp;15)) &amp; 0xffff</code></p>
 <h4>V_LSHLREV_B32</h4>
 <p>Opcode VOP2: 26 (0x1a) for GCN 1.0/1.1; 18 (0x12) for GCN 1.2<br />
 …
 Operation:<br />
 <code>VDST = SRC0 &gt;&gt; (SRC1&amp;31)</code></p>
+<h4>V_LSHRREV_B16</h4>
+<p>Opcode VOP2: 43 (0x2b) for GCN 1.2<br />
+Opcode VOP3A: 299 (0x12b) for GCN 1.2<br />
+Syntax: V_LSHRREV_B16 VDST, SRC0, SRC1<br />
+Description: Shift right unsigned 16-bit value from SRC1 by (SRC0&amp;15) bits and
+store 16-bit unsigned result into VDST.<br />
+Operation:<br />
+<code>VDST = (SRC1 &gt;&gt; (SRC0&amp;15)) &amp; 0xffff</code></p>
 <h4>V_LSHRREV_B32</h4>
 <p>Opcode VOP2: 22 (0x16) for GCN 1.0/1.1; 16 (0x10) for GCN 1.2<br />
 …
 Opcode VOP3A: 291 (0x123) for GCN 1.2<br />
 Syntax: V_MAC_F16 VDST, SRC0, SRC1<br />
+Description: Multiply FP16 value from SRC0 by FP16 value from SRC1 and add result to VDST.<br />
+Description: Multiply FP16 value from SRC0 by FP16 value from SRC1 and
+add result to VDST. It applies OMOD modifier to result.<br />
 Operation:<br />
 <code>VDST = ASHALF(SRC0) * ASHALF(SRC1) + ASHALF(VDST)</code></p>
 …
 Operation:
 <code>VDST = ASFLOAT(SRC0) * ASFLOAT(SRC1) + ASFLOAT(FLOATLIT)</code></p>
+<h4>V_MAX_F16</h4>
+<p>Opcode VOP2: 45 (0x2d) for GCN 1.2<br />
+Opcode VOP3A: 301 (0x12d) for GCN 1.2<br />
+Syntax: V_MAX_F16 VDST, SRC0, SRC1<br />
+Description: Choose largest half floating point value from SRC0 and SRC1,
+and store result to VDST.<br />
+Operation:<br />
+<code>VDST = MAX(ASFHALF(SRC0), ASFHALF(SRC1))</code></p>
 <h4>V_MAX_F32</h4>
 <p>Opcode VOP2: 16 (0x10) for GCN 1.0/1.1; 11 (0xb) for GCN 1.2<br />
 …
 <code>UINT32 MASK = ((1ULL &lt;&lt; LANEID) - 1ULL) &amp; SRC0
 VDST = SRC1 + BITCOUNT(MASK)</code></p>
+<h4>V_MIN_F16</h4>
+<p>Opcode VOP2: 46 (0x2e) for GCN 1.2<br />
+Opcode VOP3A: 302 (0x12e) for GCN 1.2<br />
+Syntax: V_MIN_F16 VDST, SRC0, SRC1<br />
+Description: Choose smallest half floating point value from SRC0 and SRC1,
+and store result to VDST.<br />
+Operation:<br />
+<code>VDST = MIN(ASFHALF(SRC0), ASFHALF(SRC1))</code></p>
 <h4>V_MIN_F32</h4>
 <p>Opcode VOP2: 15 (0xf) for GCN 1.0/1.1; 10 (0xa) for GCN 1.2<br />
 …
 Operation:<br />
 <code>VDST = MIN(ASFLOAT(SRC0), ASFLOAT(SRC1))</code></p>
+<h4>V_MIN_i16</h4>
+<p>Opcode VOP2: 50 (0x32) for GCN 1.2<br />
+Opcode VOP3A: 306 (0x132) for GCN 1.2<br />
+Syntax: V_MIN_i16 VDST, SRC0, SRC1<br />
+Description: Choose smallest signed 16-bit value from SRC0 and SRC1,
+and store result to VDST.<br />
+Operation:<br />
+<code>VDST = MIN((INT16)SRC0, (INT16)SRC1)</code></p>
 <h4>V_MIN_I32</h4>
 <p>Opcode VOP2: 17 (0x11) for GCN 1.0/1.1; 12 (0xc) for GCN 1.2<br />
 …
 else
     VDST = NaN</code></p>
+<h4>V_MIN_U16</h4>
+<p>Opcode VOP2: 49 (0x31) for GCN 1.2<br />
+Opcode VOP3A: 305 (0x131) for GCN 1.2<br />
+Syntax: V_MIN_U16 VDST, SRC0, SRC1<br />
+Description: Choose smallest unsigned 16-bit value from SRC0 and SRC1,
+and store result to VDST.<br />
+Operation:<br />
+<code>VDST = MIN(SRC0&amp;0xffff, SRC1&amp;0xffff)</code></p>
 <h4>V_MIN_U32</h4>
 <p>Opcode VOP2: 19 (0x13) for GCN 1.0/1.1; 14 (0xe) for GCN 1.2<br />
 …
 INT32 V1 = (INT32)((SRC1&amp;0x7fffff) | (SSRC1&amp;0x800000 ? 0xff800000 : 0))
 VDST = V0 * V1</code></p>
+<h4>V_MUL_LO_U16</h4>
+<p>Opcode VOP2: 41 (0x29) for GCN 1.2<br />
+Opcode VOP3A: 297 (0x129) for GCN 1.2<br />
+Syntax: V_MUL_LO_U16 VDST, SRC0, SRC1<br />
+Description: Multiply 16-bit unsigned value from SRC0 by 16-bit unsigned value from SRC1
+and store 16-bit result to VDST.<br />
+Operation:<br />
+<code>VDST = ((SRC0&amp;0Xffff) * (SRC1&amp;0xffff)) &amp; 0xffff</code></p>
 <h4>V_MUL_U32_U24</h4>
 <p>Opcode VOP2: 11 (0xb) for GCN 1.0/1.1; 8 (0x8) for GCN 1.2<br />
 …
 Operation:<br />
 <code>VDST = ASFLOAT(SRC0) - ASFLOAT(SRC1)</code></p>
+<h4>V_SUB_U16</h4>
+<p>Opcode VOP2: 39 (0x27) for GCN 1.2<br />
+Opcode VOP3A: 295 (0x127) for GCN 1.2<br />
+Syntax: V_SUB_U16 VDST, SRC0, SRC1<br />
+Description: Subtract unsigned 16-bit value of SRC1 from SRC0 and store
+-bit unsigned result to VDST.<br />
+Operation:<br />
+<code>VDST = (SRC0 - SRC1) &amp; 0xffff</code></p>
 <h4>V_SUB_I32, V_SUB_U32</h4>
 <p>Opcode VOP2: 38 (0x26) for GCN 1.0/1.1; 26 (0x1a) for GCN 1.2<br />
 …
 UINT64 mask = (1ULL&lt;&lt;LANEID)
 SDST = (SDST&amp;~mask) | ((temp&gt;&gt;32) ? mask : 0)</code></p>
+<h4>V_SUBREV_U16</h4>
+<p>Opcode VOP2: 40 (0x28) for GCN 1.2<br />
+Opcode VOP3A: 296 (0x128) for GCN 1.2<br />
+Syntax: V_SUBREV_U16 VDST, SRC0, SRC1<br />
+Description: Subtract unsigned 16-bit value of SRC0 from SRC1 and store
+-bit unsigned result to VDST.<br />
+Operation:<br />
+<code>VDST = (SRC1 - SRC0) &amp; 0xffff</code></p>
 <h4>V_XOR_B32</h4>
 <p>Opcode: VOP2: 29 (0x1d) for GCN 1.0/1.1; 21 (0x15) for GCN 1.2<br />