Context Navigation

Changes between Version 3 and Version 4 of GcnInstrsFlat

Timestamp:: 05/03/16 00:00:24 (8 years ago)
Author:: trac
Comment:: --

Legend:

: Unmodified
: Added
: Removed
: Modified

GcnInstrsFlat

-                      v3
+                      v4
 <p>Alphabetically sorted instruction list:</p>
 <h4>FLAT_ATOMIC_ADD</h4>
 <p>Opcode: 50 (0x32) for GCN 1.0/1.1; 66 (0x42) for GCN 1.2<br />
+<p>Opcode: 50 (0x32) for GCN 1.1; 66 (0x42) for GCN 1.2<br />
 Syntax: FLAT_ATOMIC_ADD VDST, VADDR(2), VDATA<br />
 Description: Add VDATA to value of VADDR address, and store result to this address.
 …
 UINT32 P = *VM; *VM = *VM + VDATA; VDST = (GLC) ? P : VDST // atomic</code></p>
 <h4>FLAT_ATOMIC_ADD_X2</h4>
 <p>Opcode: 82 (0x52) for GCN 1.0/1.1; 98 (0x62) for GCN 1.2<br />
+<p>Opcode: 82 (0x52) for GCN 1.1; 98 (0x62) for GCN 1.2<br />
 Syntax: FLAT_ATOMIC_ADD_X2 VDST(2), VADDR(2), VDATA(2)<br />
 Description: Add 64-bit VDATA to 64-bit value of VADDR address, and store result
 …
 UINT64 P = *VM; *VM = *VM + VDATA; VDST = (GLC) ? P : VDST // atomic</code></p>
 <h4>FLAT_ATOMIC_AND</h4>
 <p>Opcode: 57 (0x39) for GCN 1.0/1.1; 72 (0x48) for GCN 1.2<br />
+<p>Opcode: 57 (0x39) for GCN 1.1; 72 (0x48) for GCN 1.2<br />
 Syntax: FLAT_ATOMIC_AND VDST, VADDR(2), VDATA<br />
 Description: Do bitwise AND on VDATA and value of VADDR address,
 …
 UINT32 P = *VM; *VM = *VM &amp; VDATA; VDST = (GLC) ? P : VDST // atomic</code></p>
 <h4>FLAT_ATOMIC_AND_X2</h4>
 <p>Opcode: 89 (0x59) for GCN 1.0/1.1; 104 (0x68) for GCN 1.2<br />
+<p>Opcode: 89 (0x59) for GCN 1.1; 104 (0x68) for GCN 1.2<br />
 Syntax: FLAT_ATOMIC_AND_X2 VDST(2), VADDR(2), VDATA(2)<br />
 Description: Do 64-bit bitwise AND on VDATA and value of VADDR address,
 …
 UINT64 P = *VM; *VM = *VM &amp; VDATA; VDST = (GLC) ? P : VDST // atomic</code></p>
 <h4>FLAT_ATOMIC_CMPSWAP</h4>
 <p>Opcode: 49 (0x31) for GCN 1.0/1.1; 65 (0x41) for GCN 1.2<br />
+<p>Opcode: 49 (0x31) for GCN 1.1; 65 (0x41) for GCN 1.2<br />
 Syntax: FLAT_ATOMIC_CMPSWAP VDST, VADDR(2), VDATA(2)<br />
 Description: Store lower VDATA dword into VADDR address  if previous value
 …
 VDST = (GLC) ? P : VDST // last part of atomic</code></p>
 <h4>FLAT_ATOMIC_CMPSWAP_X2</h4>
 <p>Opcode: 81 (0x51) for GCN 1.0/1.1; 97 (0x61) for GCN 1.2<br />
+<p>Opcode: 81 (0x51) for GCN 1.1; 97 (0x61) for GCN 1.2<br />
 Syntax: FLAT_ATOMIC_CMPSWAP_X2 VDST(2), VADDR(2), VDATA(4)<br />
 Description: Store lower VDATA 64-bit word into VADDR address if previous value
 …
 UINT64 P = *VM; *VM = *VM==(VDATA[2:3]) ? VDATA[0:1] : *VM // part of atomic
 VDST = (GLC) ? P : VDST // last part of atomic</code></p>
+<h4>FLAT_ATOMIC_DEC</h4>
+<p>Opcode: 61 (0x3d) for GCN 1.1; 76 (0x4c) for GCN 1.2<br />
+Syntax: FLAT_ATOMIC_DEC VDST, VADDR(2), VDATA<br />
+Description: Compare value from VADDR address and if less or equal than VDATA
+and this value is not zero, then decrement value from VADDR address,
+otherwise store VDATA to this address. If GLC flag is set then return previous value
+from this address to VDST, otherwise keep VDST value. Operation is atomic.<br />
+Operation:<br />
+<code>UINT32* VM = (UINT32*)VADDR
+UINT32 P = *VM; *VM = (*VM &lt;= VDATA &amp;&amp; *VM!=0) ? *VM-1 : VDATA // atomic
+VDST = (GLC) ? P : VDST // atomic</code></p>
+<h4>FLAT_ATOMIC_DEC_X2</h4>
+<p>Opcode: 93 (0x5d) for GCN 1.1; 108 (0x6c) for GCN 1.2<br />
+Syntax: FLAT_ATOMIC_DEC_X2 VDST(2), VADDR(2), VDATA(2)<br />
+Description: Compare 64-bit value from VADDR address and if less or equal than VDATA
+and this value is not zero, then decrement value from VADDR address,
+otherwise store VDATA to this address. If GLC flag is set then return previous value
+from this address to VDST, otherwise keep VDST value. Operation is atomic.<br />
+Operation:<br />
+<code>UINT64* VM = (UINT64*)VADDR
+UINT64 P = *VM; *VM = (*VM &lt;= VDATA &amp;&amp; *VM!=0) ? *VM-1 : VDATA // atomic
+VDST = (GLC) ? P : VDST // atomic</code></p>
+<h4>BUFFER_ATOMIC_FCMPSWAP</h4>
+<p>Opcode: 62 (0x3e) for GCN 1.1<br />
+Syntax: FLAT_ATOMIC_FCMPSWAP VDST, VADDR(1:2), VDATA(2)<br />
+Description: Store lower VDATA dword into VADDR address if previous single floating point
+value from address is equal singe floating point value VDATA&gt;&gt;32,
+otherwise keep old value from VADDR address.
+If GLC flag is set then return previous value from this address to VDST,
+otherwise keep VDST value. Operation is atomic.<br />
+Operation:<br />
+<code>FLOAT* VM = (FLOAT*)VADDR
+FLOAT P = *VM; *VM = *VM==ASFLOAT(VDATA&gt;&gt;32) ? VDATA&amp;0xffffffff : *VM // part of atomic
+VDST[0] = (GLC) ? P : VDST // last part of atomic</code></p>
+<h4>FLAT_ATOMIC_FCMPSWAP_X2</h4>
+<p>Opcode: 94 (0x5e) for GCN 1.1<br />
+Syntax: FLAT_ATOMIC_FCMPSWAP_X2 VDATA(2), VADDR(2), SRSRC(4), SOFFSET<br />
+Description: Store lower VDATA 64-bit word into VADDR address if previous double
+floating point value from address is equal singe floating point value VDATA&gt;&gt;32,
+otherwise keep old value from VADDR address.
+If GLC flag is set then return previous value from address to VDST, otherwise keep
+VDST value. Operation is atomic.<br />
+Operation:<br />
+<code>DOUBLE* VM = (DOUBLE*)VMADDR
+DOUBLE P = *VM; *VM = *VM==ASDOUBLE(VDATA[2:3]) ? VDATA[0:1] : *VM // part of atomic
+VDST = (GLC) ? P : VDST // last part of atomic</code></p>
+<h4>FLAT_ATOMIC_FMAX</h4>
+<p>Opcode: 64 (0x40) for GCN 1.1<br />
+Syntax: FLAT_ATOMIC_FMAX VDST, VADDR(2), VDATA<br />
+Description: Choose greatest single floating point value from VDATA and from
+VADDR address, and store result to this address.
+If GLC flag is set then return previous value from address to VDST, otherwise keep
+VDST value. Operation is atomic.<br />
+Operation:<br />
+<code>FLOAT* VM = (FLOAT*)VADDR
+UINT32 P = *VM; *VM = MAX(*VM, ASFLOAT(VDATA)); VDST = (GLC) ? P : VDST // atomic</code></p>
+<h4>BUFFER_ATOMIC_FMAX_X2</h4>
+<p>Opcode: 96 (0x60) for GCN 1.1<br />
+Syntax: FLAT_ATOMIC_FMAX_X2 VDST(2), VADDR(2), VDATA(2)<br />
+Description: Choose greatest double floating point value from VDATA and from
+VADDR address, and store result to this address.
+If GLC flag is set then return previous value from address to VDST,
+otherwise keep VDST value. Operation is atomic.<br />
+Operation:<br />
+<code>DOUBLE* VM = (DOUBLE*)VADDR
+UINT64 P = *VM; *VM = MAX(*VM, ASDOUBLE(VDATA)); VDST = (GLC) ? P : VDST // atomic</code></p>
+<h4>FLAT_ATOMIC_FMIN</h4>
+<p>Opcode: 63 (0x3f) for GCN 1.1<br />
+Syntax: FLAT_ATOMIC_FMIN VDST, VADDR(2), VDATA<br />
+Description: Choose smallest single floating point value from VDATA and from
+VADDR address, and store result to this address.
+If GLC flag is set then return previous value from address to VDST, otherwise keep
+VDST value. Operation is atomic.<br />
+Operation:<br />
+<code>FLOAT* VM = (FLOAT*)VADDR
+UINT32 P = *VM; *VM = MIN(*VM, ASFLOAT(VDATA)); VDST = (GLC) ? P : VDST // atomic</code></p>
+<h4>BUFFER_ATOMIC_FMIN_X2</h4>
+<p>Opcode: 95 (0x5f) for GCN 1.1<br />
+Syntax: FLAT_ATOMIC_FMIN_X2 VDST(2), VADDR(2), VDATA(2)<br />
+Description: Choose smallest double floating point value from VDATA and from
+VADDR address, and store result to this address.
+If GLC flag is set then return previous value from address to VDST,
+otherwise keep VDST value. Operation is atomic.<br />
+Operation:<br />
+<code>DOUBLE* VM = (DOUBLE*)VADDR
+UINT64 P = *VM; *VM = MIN(*VM, ASDOUBLE(VDATA)); VDST = (GLC) ? P : VDST // atomic</code></p>
+<h4>FLAT_ATOMIC_INC</h4>
+<p>Opcode: 60 (0x3c) for GCN 1.1; 75 (0x4b) for GCN 1.2<br />
+Syntax: FLT_ATOMIC_INC VDST, VADDR(2), VDATA<br />
+Description: Compare value from VADDR address and if less than VDATA,
+then increment value from address, otherwise store zero to address.
+If GLC flag is set then return previous value from this address to VDST,
+otherwise keep VDST value. Operation is atomic.<br />
+Operation:<br />
+<code>UINT32* VM = (UINT32*)VADDR
+UINT32 P = *VM; *VM = (*VM &lt; VDATA) ? *VM+1 : 0; VDST = (GLC) ? P : VDST // atomic</code></p>
+<h4>FLAT_ATOMIC_INC_X2</h4>
+<p>Opcode: 92 (0x5c) for GCN 1.1; 107 (0x9b) for GCN 1.2<br />
+Syntax: FLAT_ATOMIC_INC_X2 VDST(2), VADDR(2), VADDR(2)<br />
+Description: Compare 64-bit value from VADDR address and if less than VDATA,
+then increment value from address, otherwise store zero to address.
+If GLC flag is set then return previous value from this address to VDST,
+otherwise keep VDST value. Operation is atomic.<br />
+Operation:<br />
+<code>UINT64* VM = (UINT64*)VADDR
+UINT64 P = *VM; *VM = (*VM &lt; VDATA) ? *VM+1 : 0; VDST = (GLC) ? P : VDST // atomic</code></p>
 <h4>FLAT_ATOMIC_OR</h4>
 <p>Opcode: 58 (0x3a) for GCN 1.0/1.1; 73 (0x49) for GCN 1.2<br />
+<p>Opcode: 58 (0x3a) for GCN 1.1; 73 (0x49) for GCN 1.2<br />
 Syntax: FLAT_ATOMIC_OR VDST, VADDR(2), VDATA<br />
 Description: Do bitwise OR on VDATA and value of VADDR address,
 …
 UINT32 P = *VM; *VM = *VM | VDATA; VDST = (GLC) ? P : VDST // atomic</code></p>
 <h4>FLAT_ATOMIC_OR_X2</h4>
 <p>Opcode: 90 (0x5a) for GCN 1.0/1.1; 105 (0x69) for GCN 1.2<br />
+<p>Opcode: 90 (0x5a) for GCN 1.1; 105 (0x69) for GCN 1.2<br />
 Syntax: FLAT_ATOMIC_OR_X2 VDST(2), VADDR(2), VDATA(2)<br />
 Description: Do 64-bit bitwise OR on VDATA and value of VADDR address,
 …
 UINT64 P = *VM; *VM = *VM | VDATA; VDST = (GLC) ? P : VDST // atomic</code></p>
 <h4>FLAT_ATOMIC_SMAX</h4>
 <p>Opcode: 55 (0x37) for GCN 1.0/1.1; 70 (0x46) for GCN 1.2<br />
+<p>Opcode: 55 (0x37) for GCN 1.1; 70 (0x46) for GCN 1.2<br />
 Syntax: FLAT_ATOMIC_SMAX VDST, VADDR(2), VDATA<br />
 Description: Choose greatest signed 32-bit value from VDATA and from VADDR address,
 …
 UINT32 P = *VM; *VM = MAX(*VM, (INT32)VDATA); VDST = (GLC) ? P : VDST // atomic</code></p>
 <h4>FLAT_ATOMIC_SMAX_X2</h4>
 <p>Opcode: 87 (0x57) for GCN 1.0/1.1; 102 (0x66) for GCN 1.2<br />
+<p>Opcode: 87 (0x57) for GCN 1.1; 102 (0x66) for GCN 1.2<br />
 Syntax: FLAT_ATOMIC_SMAX_X2 VDST(2), VADDR(2), VDATA(2)<br />
 Description: Choose greatest signed 64-bit value from VDATA and from VADDR address,
 …
 UINT64 P = *VM; *VM = MAX(*VM, (INT64)VDATA); VDST = (GLC) ? P : VDST // atomic</code></p>
 <h4>FLAT_ATOMIC_SMIN</h4>
 <p>Opcode: 53 (0x35) for GCN 1.0/1.1; 68 (0x44) for GCN 1.2<br />
+<p>Opcode: 53 (0x35) for GCN 1.1; 68 (0x44) for GCN 1.2<br />
 Syntax: FLAT_ATOMIC_SMIN VDST, VADDR(2), VDATA<br />
 Description: Choose smallest signed 32-bit value from VDATA and from VADDR address,
 …
 UINT32 P = *VM; *VM = MIN(*VM, (INT32)VDATA); VDST = (GLC) ? P : VDST // atomic</code></p>
 <h4>FLAT_ATOMIC_SMIN_X2</h4>
 <p>Opcode: 85 (0x55) for GCN 1.0/1.1; 100 (0x64) for GCN 1.2<br />
+<p>Opcode: 85 (0x55) for GCN 1.1; 100 (0x64) for GCN 1.2<br />
 Syntax: FLAT_ATOMIC_SMIN_X2 VDST(2), VADDR(2), VDATA(2)<br />
 Description: Choose smallest signed 64-bit value from VDATA and from VADDR address,
 …
 UINT64 P = *VM; *VM = MIN(*VM, (INT64)VDATA); VDST = (GLC) ? P : VDST // atomic</code></p>
 <h4>FLAT_ATOMIC_SUB</h4>
 <p>Opcode: 51 (0x33) for GCN 1.0/1.1; 67 (0x43) for GCN 1.2<br />
+<p>Opcode: 51 (0x33) for GCN 1.1; 67 (0x43) for GCN 1.2<br />
 Syntax: FLAT_ATOMIC_SUB VDST, VADDR(2), VDATA<br />
 Description: Subtract VDATA from value of VADDR address, and store result to this address.
 …
 UINT32 P = *VM; *VM = *VM - VDATA; VDST = (GLC) ? P : VDST // atomic</code></p>
 <h4>FLAT_ATOMIC_SUB_X2</h4>
 <p>Opcode: 83 (0x53) for GCN 1.0/1.1; 99 (0x63) for GCN 1.2<br />
+<p>Opcode: 83 (0x53) for GCN 1.1; 99 (0x63) for GCN 1.2<br />
 Syntax: FLAT_ATOMIC_SUB_X2 VDST(2), VADDR(2), VDATA(2)<br />
 Description: Subtract 64-bit VDATA from 64-bit value of VADDR address, and store result
 …
 UINT64 P = *VM; *VM = *VM - VDATA; VDST = (GLC) ? P : VDST // atomic</code></p>
 <h4>FLAT_ATOMIC_SWAP</h4>
 <p>Opcode: 48 (0x30) for GCN 1.0/1.1; 64 (0x40) for GCN 1.2<br />
+<p>Opcode: 48 (0x30) for GCN 1.1; 64 (0x40) for GCN 1.2<br />
 Syntax: FLAT_ATOMIC_SWAP VDST, VADDR(2), VDATA
 Description: Store VDATA dword into VADDR address. If GLC flag is set then
 …
 UINT32 P = *VM; *VM = VDATA; VDST = (GLC) ? P : VDST // atomic</code></p>
 <h4>FLAT_ATOMIC_SWAP_X2</h4>
 <p>Opcode: 80 (0x50) for GCN 1.0/1.1; 96 (0x60) for GCN 1.2<br />
+<p>Opcode: 80 (0x50) for GCN 1.1; 96 (0x60) for GCN 1.2<br />
 Syntax: FLAT_ATOMIC_SWAP_X2 VDST(2), VADDR(2), VDATA(2)
 Description: Store VDATA 64-bit word into VADDR address. If GLC flag is set then
 …
 UINT64 P = *VM; *VM = VDATA; VDST = (GLC) ? P : VDST // atomic</code></p>
 <h4>FLAT_ATOMIC_UMAX</h4>
 <p>Opcode: 56 (0x38) for GCN 1.0/1.1; 71 (0x47) for GCN 1.2<br />
+<p>Opcode: 56 (0x38) for GCN 1.1; 71 (0x47) for GCN 1.2<br />
 Syntax: FLAT_ATOMIC_UMAX VDST, VADDR(2), VDATA<br />
 Description: Choose greatest unsigned 32-bit value from VDATA and from VADDR address,
 …
 UINT32 P = *VM; *VM = MAX(*VM, (UINT32)VDATA); VDST = (GLC) ? P : VDST // atomic</code></p>
 <h4>FLAT_ATOMIC_UMAX_X2</h4>
 <p>Opcode: 88 (0x58) for GCN 1.0/1.1; 103 (0x67) for GCN 1.2<br />
+<p>Opcode: 88 (0x58) for GCN 1.1; 103 (0x67) for GCN 1.2<br />
 Syntax: FLAT_ATOMIC_UMAX_X2 VDST(2), VADDR(2), VDATA(2)<br />
 Description: Choose greatest unsigned 64-bit value from VDATA and from VADDR address,
 …
 UINT64 P = *VM; *VM = MAX(*VM, (UINT64)VDATA); VDST = (GLC) ? P : VDST // atomic</code></p>
 <h4>FLAT_ATOMIC_UMIN</h4>
 <p>Opcode: 54 (0x36) for GCN 1.0/1.1; 69 (0x45) for GCN 1.2<br />
+<p>Opcode: 54 (0x36) for GCN 1.1; 69 (0x45) for GCN 1.2<br />
 Syntax: FLAT_ATOMIC_UMIN VDST, VADDR(2), VDATA<br />
 Description: Choose smallest unsigned 32-bit value from VDATA and from VADDR address,
 …
 UINT32 P = *VM; *VM = MIN(*VM, (UINT32)VDATA); VDST = (GLC) ? P : VDST // atomic</code></p>
 <h4>FLAT_ATOMIC_UMIN_X2</h4>
 <p>Opcode: 86 (0x56) for GCN 1.0/1.1; 101 (0x65) for GCN 1.2<br />
+<p>Opcode: 86 (0x56) for GCN 1.1; 101 (0x65) for GCN 1.2<br />
 Syntax: FLAT_ATOMIC_UMIN_X2 VDST(2), VADDR(2), VDATA(2)<br />
 Description: Choose smallest unsigned 64-bit value from VDATA and from VADDR address,
 …
 UINT64 P = *VM; *VM = MIN(*VM, (UINT64)VDATA); VDST = (GLC) ? P : VDST // atomic</code></p>
 <h4>FLAT_ATOMIC_XOR</h4>
 <p>Opcode: 59 (0x3b) for GCN 1.0/1.1; 73 (0x4a) for GCN 1.2<br />
+<p>Opcode: 59 (0x3b) for GCN 1.1; 73 (0x4a) for GCN 1.2<br />
 Syntax: FLAT_ATOMIC_XOR VDST, VADDR(2), VDATA<br />
 Description: Do bitwise XOR on VDATA and value of VADDR address,
 …
 UINT32 P = *VM; *VM = *VM ^ VDATA; VDST = (GLC) ? P : VDST // atomic</code></p>
 <h4>FLAT_ATOMIC_XOR_X2</h4>
 <p>Opcode: 91 (0x5b) for GCN 1.0/1.1; 106 (0x6a) for GCN 1.2<br />
+<p>Opcode: 91 (0x5b) for GCN 1.1; 106 (0x6a) for GCN 1.2<br />
 Syntax: FLAT_ATOMIC_XOR_X2 VDST(2), VADDR(2), VDATA(2)<br />
 Description: Do 64-bit bitwise XOR on VDATA and value of VADDR address,
 …
 <p>Opcode: 30 (0x1e) for GCN 1.1; 31 (0x1d) for GCN 1.2<br />
 Syntax: FLAT_STORE_DWORDX4 VADDR(2), VDATA(4)<br />
 Description: Store three dwords from VDATA to VADDR address.<br />
+Description: Store four dwords from VDATA to VADDR address.<br />
 Operation:<br />
 <code>*(UINT32*)(VADDR) = VDATA[0]