doxygen/html/miopen_8h_source.html

 /*******************************************************************************

  *

  * MIT License

  *

  * Copyright (c) 2023 Advanced Micro Devices, Inc.

  *

  * Permission is hereby granted, free of charge, to any person obtaining a copy

  * of this software and associated documentation files (the "Software"), to deal

  * in the Software without restriction, including without limitation the rights

  * to use, copy, modify, merge, publish, distribute, sublicense, and/or sell

  * copies of the Software, and to permit persons to whom the Software is

  * furnished to do so, subject to the following conditions:

  *

  * The above copyright notice and this permission notice shall be included in all

  * copies or substantial portions of the Software.

  *

  * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR

  * IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,

  * FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE

  * AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER

  * LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,

  * OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE

  * SOFTWARE.

  *

  *******************************************************************************/

 #ifndef MIOPEN_GUARD_MIOPEN_H_

 #define MIOPEN_GUARD_MIOPEN_H_


 #ifdef __clang__

 #pragma clang diagnostic push

 #pragma clang diagnostic ignored "-Wextern-c-compat"

 #endif


 #include <stddef.h>

 #include <stdbool.h>

 #include <miopen/config.h>

 #include <miopen/export.h>


 #if MIOPEN_BACKEND_OPENCL

 #define CL_TARGET_OPENCL_VERSION 120

 #if defined(__APPLE__) || defined(__MACOSX)

 #include <OpenCL/cl.h>

 #else

 #define CL_USE_DEPRECATED_OPENCL_1_2_APIS

 #include <CL/cl.h>

 #endif


 #elif MIOPEN_BACKEND_HIP

 #include <hip/hip_runtime_api.h>

 #endif


 /*

  * @defgroup convolutions

  * @defgroup pooling

  * @defgroup handle

  * @defgroup layernorm

  * @defgroup LRN

  * @defgroup batchnorm

  * @defgroup activation

  * @defgroup tensor

  * @defgroup softmax

  * @defgroup RNN

  * @defgroup fusion

  * @defgroup LossFunction

  * @defgroup TensorReduce

  * @defgroup find2

  * @defgroup ReduceExtreme

  * @defgroup groupnorm

  * @defgroup cat

  * @defgroup SGD

  * @defgroup getitem

  * @defgroup ReduceCalculation

  * @defgroup RotaryPositionalEmbeddings

  * @defgroup ReLU

  *

  */


 #define MIOPEN_DECLARE_OBJECT(name) \

     struct name                     \

     {                               \

     };                              \

     typedef struct name* name##_t;


 #ifdef __cplusplus

 extern "C" {

 #endif


 #if MIOPEN_BACKEND_OPENCL

 typedef cl_command_queue miopenAcceleratorQueue_t;

 #elif MIOPEN_BACKEND_HIP

 typedef hipStream_t miopenAcceleratorQueue_t;

 #endif


 MIOPEN_DECLARE_OBJECT(miopenHandle);


 typedef enum

 {

     miopenStatusSuccess              = 0,

     miopenStatusNotInitialized       = 1,

     miopenStatusInvalidValue         = 2,

     miopenStatusBadParm              = 3,

     miopenStatusAllocFailed          = 4,

     miopenStatusInternalError        = 5,

     miopenStatusNotImplemented       = 6,

     miopenStatusUnknownError         = 7,

     miopenStatusUnsupportedOp        = 8,

     miopenStatusGpuOperationsSkipped = 9,

     miopenStatusVersionMismatch = 10,

 } miopenStatus_t;


 typedef enum

 {

     // TODO:(LYM) temporary use Pedantic as default until TF32 is fully supported

     miopenMathDefault = 0,

     miopenMathPedantic =

         1,

 } miopenMathType_t;


 #ifdef MIOPEN_BETA_API

 typedef enum

 {

     miopenF8RoundingModeStandard   = 0,

     miopenF8RoundingModeStochastic = 1,

 } miopenF8RoundingMode_t;

 #endif


 MIOPEN_EXPORT const char* miopenGetErrorString(miopenStatus_t error);


 typedef void* (*miopenAllocatorFunction)(void* context, size_t sizeBytes);


 typedef void (*miopenDeallocatorFunction)(void* context, void* memory);


 MIOPEN_EXPORT miopenStatus_t miopenGetVersion(size_t* major, size_t* minor, size_t* patch);


 MIOPEN_EXPORT miopenStatus_t miopenCreate(miopenHandle_t* handle);


 MIOPEN_EXPORT miopenStatus_t miopenCreateWithStream(miopenHandle_t* handle,

                                                     miopenAcceleratorQueue_t stream);


 MIOPEN_EXPORT miopenStatus_t miopenDestroy(miopenHandle_t handle);


 MIOPEN_EXPORT miopenStatus_t miopenSetStream(miopenHandle_t handle,

                                              miopenAcceleratorQueue_t streamID);


 MIOPEN_EXPORT miopenStatus_t miopenGetStream(miopenHandle_t handle,

                                              miopenAcceleratorQueue_t* streamID);


 MIOPEN_EXPORT miopenStatus_t miopenSetAllocator(miopenHandle_t handle,

                                                 miopenAllocatorFunction allocator,

                                                 miopenDeallocatorFunction deallocator,

                                                 void* allocatorContext);


 MIOPEN_EXPORT miopenStatus_t miopenGetKernelTime(miopenHandle_t handle, float* time);


 MIOPEN_EXPORT miopenStatus_t miopenEnableProfiling(miopenHandle_t handle, bool enable);

 // CLOSEOUT HANDLE DOXYGEN GROUP


 MIOPEN_DECLARE_OBJECT(miopenFusionOpDescriptor);


 MIOPEN_DECLARE_OBJECT(miopenTensorDescriptor);


 MIOPEN_DECLARE_OBJECT(miopenSeqTensorDescriptor);


 MIOPEN_DECLARE_OBJECT(miopenConvolutionDescriptor);


 MIOPEN_DECLARE_OBJECT(miopenPoolingDescriptor);


 MIOPEN_DECLARE_OBJECT(miopenLRNDescriptor);


 MIOPEN_DECLARE_OBJECT(miopenActivationDescriptor);


 MIOPEN_DECLARE_OBJECT(miopenRNNDescriptor);


 MIOPEN_DECLARE_OBJECT(miopenCTCLossDescriptor);


 MIOPEN_DECLARE_OBJECT(miopenDropoutDescriptor);


 MIOPEN_DECLARE_OBJECT(miopenReduceTensorDescriptor);


 MIOPEN_DECLARE_OBJECT(miopenMhaDescriptor);


 MIOPEN_DECLARE_OBJECT(miopenSoftmaxDescriptor);


 typedef enum

 {

     miopenHalf  = 0,

     miopenFloat = 1,

     miopenInt32 = 2,

     miopenInt8  = 3,

     // miopenInt8x4   = 4, /*!< Pack of 4x Int8 in NCHW_VECT_C format (Support discontinued) */

     miopenBFloat16 = 5,

     miopenDouble       = 6,

     miopenFloat8_fnuz  = 7,

     miopenBFloat8_fnuz = 8,

     miopenInt64        = 9,

 } miopenDataType_t;


 typedef enum

 {

     miopenTensorNCHW   = 0,

     miopenTensorNHWC   = 1,

     miopenTensorCHWN   = 2,

     miopenTensorNCHWc4 = 3,

     miopenTensorNCHWc8 = 4,

     miopenTensorCHWNc4 = 5,

     miopenTensorCHWNc8 = 6,

     miopenTensorNCDHW  = 7,

     miopenTensorNDHWC  = 8,

 } miopenTensorLayout_t;


 typedef enum

 {

     miopenIndexUint8  = 0,

     miopenIndexUint16 = 1,

     miopenIndexUint32 = 2,

     miopenIndexUint64 = 3,

 } miopenIndexType_t;


 typedef enum

 {

     miopenTensorOpAdd = 0,

     miopenTensorOpMul = 1,

     miopenTensorOpMin = 2,

     miopenTensorOpMax = 3,

 } miopenTensorOp_t;


 typedef enum

 {

     miopenConvolution = 0,

     miopenTranspose   = 1,

     miopenGroupConv   = 2,

     miopenDepthwise   = 3,

 } miopenConvolutionMode_t;


 typedef enum

 {

     miopenPaddingDefault = 0,

     miopenPaddingSame    = 1,

     miopenPaddingValid   = 2,

 } miopenPaddingMode_t;


 typedef enum

 {

     miopenPoolingMax              = 0,

     miopenPoolingAverage          = 1,

     miopenPoolingAverageInclusive = 2,

 } miopenPoolingMode_t;


 typedef enum

 {

     miopenPoolingWorkspaceIndexMask  = 0,

     miopenPoolingWorkspaceIndexImage = 1,

 } miopenPoolingWorkspaceIndexMode_t;


 typedef enum

 {

     miopenLRNWithinChannel = 0,

     miopenLRNCrossChannel  = 1,

 } miopenLRNMode_t;

 #ifdef MIOPEN_BETA_API

 typedef enum

 {

     MIOPEN_ELEMENTWISE_AFFINE = 0,

     MIOPEN_WEIGHT_BIAS =

         1,

     MIOPEN_ELEMENTWISE_AFFINE_FUSED_ADD =

         2,

     MIOPEN_WEIGHT_BIAS_FUSED_ADD = 3,

     MIOPEN_ELEMENTWISE_AFFINE_T5 =

         4,

     MIOPEN_WEIGHT_BIAS_T5 = 5,

 } miopenNormMode_t;

 #endif

 typedef enum

 {

     miopenBNPerActivation = 0,

     miopenBNSpatial       = 1,

 } miopenBatchNormMode_t;


 typedef enum

 {

     miopenActivationPASTHRU  = 0,

     miopenActivationLOGISTIC = 1,

     miopenActivationTANH     = 2,

     miopenActivationRELU     = 3,

     miopenActivationSOFTRELU = 4,

     miopenActivationABS      = 5,

     miopenActivationPOWER = 6,

     miopenActivationCLIPPEDRELU =

         7,

     miopenActivationLEAKYRELU =

         8,

     miopenActivationELU =

         9,

     miopenActivationCLAMP = 10,

 } miopenActivationMode_t;


 typedef enum

 {

     MIOPEN_SOFTMAX_FAST     = 0,

     MIOPEN_SOFTMAX_ACCURATE = 1,

     MIOPEN_SOFTMAX_LOG      = 2,

 } miopenSoftmaxAlgorithm_t;


 typedef enum

 {

     MIOPEN_SOFTMAX_MODE_INSTANCE = 0,

     MIOPEN_SOFTMAX_MODE_CHANNEL =

         1,

 } miopenSoftmaxMode_t;


 #define MIOPEN_API_VERSION_REDUCE_TENSOR 1


 typedef enum

 {

     MIOPEN_REDUCE_TENSOR_ADD = 0,

     MIOPEN_REDUCE_TENSOR_MUL =

         1,

     MIOPEN_REDUCE_TENSOR_MIN =

         2,

     MIOPEN_REDUCE_TENSOR_MAX =

         3,

     MIOPEN_REDUCE_TENSOR_AMAX =

         4,

     MIOPEN_REDUCE_TENSOR_AVG =

         5,

     MIOPEN_REDUCE_TENSOR_NORM1 =

         6,

     MIOPEN_REDUCE_TENSOR_NORM2 = 7,

     // MIOPEN_REDUCE_TENSOR_MUL_NO_ZEROS =

     //    8, /*!< the operation is same as MUL, but does not have the zero values considered */

 } miopenReduceTensorOp_t;


 typedef enum

 {

     MIOPEN_NOT_PROPAGATE_NAN = 0,

     MIOPEN_PROPAGATE_NAN     = 1,

 } miopenNanPropagation_t;


 typedef enum

 {

     MIOPEN_REDUCE_TENSOR_NO_INDICES        = 0,

     MIOPEN_REDUCE_TENSOR_FLATTENED_INDICES = 1,

 } miopenReduceTensorIndices_t;


 typedef enum

 {

     MIOPEN_32BIT_INDICES = 0,

     MIOPEN_64BIT_INDICES = 1,

     MIOPEN_16BIT_INDICES = 2,

     MIOPEN_8BIT_INDICES  = 3,

 } miopenIndicesType_t;


 typedef enum

 {

     MIOPEN_CONVOLUTION_ATTRIB_FP16_ALT_IMPL =

         0,

     MIOPEN_CONVOLUTION_ATTRIB_DETERMINISTIC =

         1,

 #ifdef MIOPEN_BETA_API

     MIOPEN_CONVOLUTION_ATTRIB_FP8_ROUNDING_MODE =

         2,

 #else

 // miopenReserved1 = 2,

 #endif

     // TODO:(LYM) temporarily use Pedantic as default until TF32 is fully supported

     MIOPEN_CONVOLUTION_ATTRIB_MATH_TYPE =

         3,

 } miopenConvolutionAttrib_t;


 typedef enum

 {

     miopenConvolutionFindModeNormal =

         1,

     miopenConvolutionFindModeFast =

         2,

     miopenConvolutionFindModeHybrid =

         3,

     // miopenConvolutionFindModeReserved_4 = 4, /*!< Reserved - do not use */

     miopenConvolutionFindModeDynamicHybrid =

         5,

     miopenConvolutionFindModeTrustVerify     = 6,

     miopenConvolutionFindModeTrustVerifyFull = 7,

     miopenConvolutionFindModeDefault =

         miopenConvolutionFindModeDynamicHybrid

 } miopenConvolutionFindMode_t;


 MIOPEN_EXPORT miopenStatus_t miopenCreateTensorDescriptor(miopenTensorDescriptor_t* tensorDesc);


 MIOPEN_EXPORT miopenStatus_t miopenSet4dTensorDescriptor(

     miopenTensorDescriptor_t tensorDesc, miopenDataType_t dataType, int n, int c, int h, int w);


 MIOPEN_EXPORT miopenStatus_t

 miopenSetNdTensorDescriptorWithLayout(miopenTensorDescriptor_t tensorDesc,

                                       miopenDataType_t dataType,

                                       miopenTensorLayout_t tensorLayout,

                                       const int* lens,

                                       int num_lens);

 MIOPEN_EXPORT miopenStatus_t miopenSet4dTensorDescriptorEx(miopenTensorDescriptor_t tensorDesc,

                                                            miopenDataType_t dataType,

                                                            int n,

                                                            int c,

                                                            int h,

                                                            int w,

                                                            int nStride,

                                                            int cStride,

                                                            int hStride,

                                                            int wStride);


 MIOPEN_EXPORT miopenStatus_t miopenGet4dTensorDescriptor(miopenTensorDescriptor_t tensorDesc,

                                                          miopenDataType_t* dataType,

                                                          int* n,

                                                          int* c,

                                                          int* h,

                                                          int* w,

                                                          int* nStride,

                                                          int* cStride,

                                                          int* hStride,

                                                          int* wStride);


 MIOPEN_EXPORT miopenStatus_t miopenSetTensorDescriptor(miopenTensorDescriptor_t tensorDesc,

                                                        miopenDataType_t dataType,

                                                        int nbDims,

                                                        const int* dimsA,

                                                        const int* stridesA);


 #ifdef MIOPEN_BETA_API

 MIOPEN_EXPORT miopenStatus_t miopenSetTensorDescriptorV2(miopenTensorDescriptor_t tensorDesc,

                                                          miopenDataType_t dataType,

                                                          int nbDims,

                                                          const size_t* dimsA,

                                                          const size_t* stridesA);

 #endif


 #ifdef MIOPEN_BETA_API

 MIOPEN_EXPORT miopenStatus_t miopenSetTensorCastType(miopenTensorDescriptor_t tensorDesc,

                                                      miopenDataType_t cast_type);

 #endif


 MIOPEN_EXPORT miopenStatus_t miopenGetTensorDescriptorSize(miopenTensorDescriptor_t tensorDesc,

                                                            int* size);


 MIOPEN_EXPORT miopenStatus_t miopenGetTensorDescriptor(miopenTensorDescriptor_t tensorDesc,

                                                        miopenDataType_t* dataType,

                                                        int* dimsA,

                                                        int* stridesA);


 MIOPEN_EXPORT miopenStatus_t miopenDestroyTensorDescriptor(miopenTensorDescriptor_t tensorDesc);


 MIOPEN_EXPORT miopenStatus_t

 miopenCreateSeqTensorDescriptor(miopenSeqTensorDescriptor_t* tensorDesc);


 MIOPEN_EXPORT miopenStatus_t

 miopenDestroySeqTensorDescriptor(miopenSeqTensorDescriptor_t tensorDesc);


 MIOPEN_EXPORT miopenStatus_t miopenOpTensor(miopenHandle_t handle,

                                             miopenTensorOp_t tensorOp,

                                             const void* alpha1,

                                             const miopenTensorDescriptor_t aDesc,

                                             const void* A,

                                             const void* alpha2,

                                             const miopenTensorDescriptor_t bDesc,

                                             const void* B,

                                             const void* beta,

                                             const miopenTensorDescriptor_t cDesc,

                                             void* C);


 MIOPEN_EXPORT miopenStatus_t miopenSetTensor(miopenHandle_t handle,

                                              const miopenTensorDescriptor_t yDesc,

                                              void* y,

                                              const void* alpha);


 MIOPEN_EXPORT miopenStatus_t miopenScaleTensor(miopenHandle_t handle,

                                                const miopenTensorDescriptor_t yDesc,

                                                void* y,

                                                const void* alpha);


 MIOPEN_EXPORT miopenStatus_t miopenGetTensorNumBytes(miopenTensorDescriptor_t tensorDesc,

                                                      size_t* numBytes);


 MIOPEN_EXPORT miopenStatus_t miopenTransformTensor(miopenHandle_t handle,

                                                    const void* alpha,

                                                    const miopenTensorDescriptor_t xDesc,

                                                    const void* x,

                                                    const void* beta,

                                                    const miopenTensorDescriptor_t yDesc,

                                                    void* y);


 // CLOSEOUT TENSOR DOXYGEN GROUP


 MIOPEN_EXPORT miopenStatus_t

 miopenCreateConvolutionDescriptor(miopenConvolutionDescriptor_t* convDesc);


 MIOPEN_EXPORT miopenStatus_t miopenInitConvolutionDescriptor(miopenConvolutionDescriptor_t convDesc,

                                                              miopenConvolutionMode_t c_mode,

                                                              int pad_h,

                                                              int pad_w,

                                                              int stride_h,

                                                              int stride_w,

                                                              int dilation_h,

                                                              int dilation_w);


 MIOPEN_EXPORT miopenStatus_t

 miopenInitConvolutionNdDescriptor(miopenConvolutionDescriptor_t convDesc,

                                   int spatialDim,

                                   const int* padA,

                                   const int* strideA,

                                   const int* dilationA,

                                   miopenConvolutionMode_t c_mode);


 MIOPEN_EXPORT miopenStatus_t miopenGetConvolutionSpatialDim(miopenConvolutionDescriptor_t convDesc,

                                                             int* spatialDim);


 MIOPEN_EXPORT miopenStatus_t miopenGetConvolutionDescriptor(miopenConvolutionDescriptor_t convDesc,

                                                             miopenConvolutionMode_t* c_mode,

                                                             int* pad_h,

                                                             int* pad_w,

                                                             int* stride_h,

                                                             int* stride_w,

                                                             int* dilation_h,

                                                             int* dilation_w);


 MIOPEN_EXPORT miopenStatus_t

 miopenGetConvolutionNdDescriptor(miopenConvolutionDescriptor_t convDesc,

                                  int requestedSpatialDim,

                                  int* spatialDim,

                                  int* padA,

                                  int* strideA,

                                  int* dilationA,

                                  miopenConvolutionMode_t* c_mode);


 MIOPEN_EXPORT miopenStatus_t miopenGetConvolutionGroupCount(miopenConvolutionDescriptor_t convDesc,

                                                             int* groupCount);


 MIOPEN_EXPORT miopenStatus_t miopenSetConvolutionGroupCount(miopenConvolutionDescriptor_t convDesc,

                                                             int groupCount);


 MIOPEN_EXPORT miopenStatus_t

 miopenSetTransposeConvOutputPadding(miopenConvolutionDescriptor_t convDesc, int adj_h, int adj_w);


 MIOPEN_EXPORT miopenStatus_t miopenSetTransposeConvNdOutputPadding(

     miopenConvolutionDescriptor_t convDesc, int spatialDim, const int* adjA);


 MIOPEN_EXPORT miopenStatus_t

 miopenGetConvolutionForwardOutputDim(miopenConvolutionDescriptor_t convDesc,

                                      const miopenTensorDescriptor_t inputTensorDesc,

                                      const miopenTensorDescriptor_t filterDesc,

                                      int* n,

                                      int* c,

                                      int* h,

                                      int* w);


 MIOPEN_EXPORT miopenStatus_t

 miopenGetConvolutionNdForwardOutputDim(miopenConvolutionDescriptor_t convDesc,

                                        const miopenTensorDescriptor_t inputTensorDesc,

                                        const miopenTensorDescriptor_t filterDesc,

                                        int* nDim,

                                        int* outputTensorDimA);


 MIOPEN_EXPORT miopenStatus_t

 miopenDestroyConvolutionDescriptor(miopenConvolutionDescriptor_t convDesc);


 MIOPEN_EXPORT miopenStatus_t miopenSetConvolutionAttribute(miopenConvolutionDescriptor_t convDesc,

                                                            const miopenConvolutionAttrib_t attr,

                                                            int value);


 MIOPEN_EXPORT miopenStatus_t miopenGetConvolutionAttribute(miopenConvolutionDescriptor_t convDesc,

                                                            const miopenConvolutionAttrib_t attr,

                                                            int* value);


 MIOPEN_EXPORT miopenStatus_t miopenSetConvolutionFindMode(miopenConvolutionDescriptor_t convDesc,

                                                           miopenConvolutionFindMode_t findMode);


 MIOPEN_EXPORT miopenStatus_t miopenGetConvolutionFindMode(

     const miopenConvolutionDescriptor_t convDesc, miopenConvolutionFindMode_t* findMode);


 typedef enum

 {

     miopenConvolutionFwdAlgoGEMM         = 0,

     miopenConvolutionFwdAlgoDirect       = 1,

     miopenConvolutionFwdAlgoFFT          = 2,

     miopenConvolutionFwdAlgoWinograd     = 3,

     miopenConvolutionFwdAlgoImplicitGEMM = 5,

 } miopenConvFwdAlgorithm_t;


 typedef enum

 {

     miopenConvolutionBwdWeightsAlgoGEMM         = 0,

     miopenConvolutionBwdWeightsAlgoDirect       = 1,

     miopenConvolutionBwdWeightsAlgoWinograd     = 3,

     miopenConvolutionBwdWeightsAlgoImplicitGEMM = 5,

 } miopenConvBwdWeightsAlgorithm_t;


 typedef enum

 {

     miopenConvolutionBwdDataAlgoGEMM     = 0,

     miopenConvolutionBwdDataAlgoDirect   = 1,

     miopenConvolutionBwdDataAlgoFFT      = 2,

     miopenConvolutionBwdDataAlgoWinograd = 3,

     miopenTransposeBwdDataAlgoGEMM =

         4,

     miopenConvolutionBwdDataAlgoImplicitGEMM = 5,

 } miopenConvBwdDataAlgorithm_t;


 typedef enum

 {

     miopenConvolutionAlgoGEMM         = 0,

     miopenConvolutionAlgoDirect       = 1,

     miopenConvolutionAlgoFFT          = 2,

     miopenConvolutionAlgoWinograd     = 3,

     miopenConvolutionAlgoImplicitGEMM = 5,

 } miopenConvAlgorithm_t;


 typedef struct

 {

     union

     {

         miopenConvFwdAlgorithm_t fwd_algo;

         miopenConvBwdWeightsAlgorithm_t bwd_weights_algo;

         miopenConvBwdDataAlgorithm_t

             bwd_data_algo;

     };


     float time;

     size_t memory;

 } miopenConvAlgoPerf_t;


 typedef struct

 {

     float time;

     size_t workspace_size;

     uint64_t solution_id;

     miopenConvAlgorithm_t algorithm;

 } miopenConvSolution_t;


 MIOPEN_EXPORT miopenStatus_t

 miopenConvolutionForwardGetSolutionCount(miopenHandle_t handle,

                                          const miopenTensorDescriptor_t wDesc,

                                          const miopenTensorDescriptor_t xDesc,

                                          const miopenConvolutionDescriptor_t convDesc,

                                          const miopenTensorDescriptor_t yDesc,

                                          size_t* solutionCount);


 MIOPEN_EXPORT miopenStatus_t

 miopenConvolutionForwardGetSolution(miopenHandle_t handle,

                                     const miopenTensorDescriptor_t wDesc,

                                     const miopenTensorDescriptor_t xDesc,

                                     const miopenConvolutionDescriptor_t convDesc,

                                     const miopenTensorDescriptor_t yDesc,

                                     const size_t maxSolutionCount,

                                     size_t* solutionCount,

                                     miopenConvSolution_t* solutions);


 MIOPEN_EXPORT miopenStatus_t

 miopenConvolutionForwardGetSolutionWorkspaceSize(miopenHandle_t handle,

                                                  const miopenTensorDescriptor_t wDesc,

                                                  const miopenTensorDescriptor_t xDesc,

                                                  const miopenConvolutionDescriptor_t convDesc,

                                                  const miopenTensorDescriptor_t yDesc,

                                                  const uint64_t solution_id,

                                                  size_t* workSpaceSize);


 MIOPEN_EXPORT miopenStatus_t

 miopenConvolutionForwardCompileSolution(miopenHandle_t handle,

                                         const miopenTensorDescriptor_t wDesc,

                                         const miopenTensorDescriptor_t xDesc,

                                         const miopenConvolutionDescriptor_t convDesc,

                                         const miopenTensorDescriptor_t yDesc,

                                         const uint64_t solution_id);


 MIOPEN_EXPORT miopenStatus_t

 miopenConvolutionForwardImmediate(miopenHandle_t handle,

                                   const miopenTensorDescriptor_t wDesc,

                                   const void* w,

                                   const miopenTensorDescriptor_t xDesc,

                                   const void* x,

                                   const miopenConvolutionDescriptor_t convDesc,

                                   const miopenTensorDescriptor_t yDesc,

                                   void* y,

                                   void* workSpace,

                                   size_t workSpaceSize,

                                   const uint64_t solution_id);


 MIOPEN_EXPORT miopenStatus_t

 miopenConvolutionBackwardDataGetSolutionCount(miopenHandle_t handle,

                                               const miopenTensorDescriptor_t dyDesc,

                                               const miopenTensorDescriptor_t wDesc,

                                               const miopenConvolutionDescriptor_t convDesc,

                                               const miopenTensorDescriptor_t dxDesc,

                                               size_t* solutionCount);


 MIOPEN_EXPORT miopenStatus_t

 miopenConvolutionBackwardDataGetSolution(miopenHandle_t handle,

                                          const miopenTensorDescriptor_t dyDesc,

                                          const miopenTensorDescriptor_t wDesc,

                                          const miopenConvolutionDescriptor_t convDesc,

                                          const miopenTensorDescriptor_t dxDesc,

                                          const size_t maxSolutionCount,

                                          size_t* solutionCount,

                                          miopenConvSolution_t* solutions);


 MIOPEN_EXPORT miopenStatus_t

 miopenConvolutionBackwardDataGetSolutionWorkspaceSize(miopenHandle_t handle,

                                                       const miopenTensorDescriptor_t dyDesc,

                                                       const miopenTensorDescriptor_t wDesc,

                                                       const miopenConvolutionDescriptor_t convDesc,

                                                       const miopenTensorDescriptor_t dxDesc,

                                                       const uint64_t solution_id,

                                                       size_t* workSpaceSize);


 MIOPEN_EXPORT miopenStatus_t

 miopenConvolutionBackwardDataCompileSolution(miopenHandle_t handle,

                                              const miopenTensorDescriptor_t dyDesc,

                                              const miopenTensorDescriptor_t wDesc,

                                              const miopenConvolutionDescriptor_t convDesc,

                                              const miopenTensorDescriptor_t dxDesc,

                                              const uint64_t solution_id);


 MIOPEN_EXPORT miopenStatus_t

 miopenConvolutionBackwardDataImmediate(miopenHandle_t handle,

                                        const miopenTensorDescriptor_t dyDesc,

                                        const void* dy,

                                        const miopenTensorDescriptor_t wDesc,

                                        const void* w,

                                        const miopenConvolutionDescriptor_t convDesc,

                                        const miopenTensorDescriptor_t dxDesc,

                                        void* dx,

                                        void* workSpace,

                                        size_t workSpaceSize,

                                        const uint64_t solution_id);


 MIOPEN_EXPORT miopenStatus_t

 miopenConvolutionBackwardWeightsGetSolutionCount(miopenHandle_t handle,

                                                  const miopenTensorDescriptor_t dyDesc,

                                                  const miopenTensorDescriptor_t xDesc,

                                                  const miopenConvolutionDescriptor_t convDesc,

                                                  const miopenTensorDescriptor_t dwDesc,

                                                  size_t* solutionCount);


 MIOPEN_EXPORT miopenStatus_t

 miopenConvolutionBackwardWeightsGetSolution(miopenHandle_t handle,

                                             const miopenTensorDescriptor_t dyDesc,

                                             const miopenTensorDescriptor_t xDesc,

                                             const miopenConvolutionDescriptor_t convDesc,

                                             const miopenTensorDescriptor_t dwDesc,

                                             const size_t maxSolutionCount,

                                             size_t* solutionCount,

                                             miopenConvSolution_t* solutions);


 MIOPEN_EXPORT miopenStatus_t miopenConvolutionBackwardWeightsGetSolutionWorkspaceSize(

     miopenHandle_t handle,

     const miopenTensorDescriptor_t dyDesc,

     const miopenTensorDescriptor_t xDesc,

     const miopenConvolutionDescriptor_t convDesc,

     const miopenTensorDescriptor_t dwDesc,

     const uint64_t solution_id,

     size_t* workSpaceSize);


 MIOPEN_EXPORT miopenStatus_t

 miopenConvolutionBackwardWeightsCompileSolution(miopenHandle_t handle,

                                                 const miopenTensorDescriptor_t dyDesc,

                                                 const miopenTensorDescriptor_t xDesc,

                                                 const miopenConvolutionDescriptor_t convDesc,

                                                 const miopenTensorDescriptor_t dwDesc,

                                                 const uint64_t solution_id);


 MIOPEN_EXPORT miopenStatus_t

 miopenConvolutionBackwardWeightsImmediate(miopenHandle_t handle,

                                           const miopenTensorDescriptor_t dyDesc,

                                           const void* dy,

                                           const miopenTensorDescriptor_t xDesc,

                                           const void* x,

                                           const miopenConvolutionDescriptor_t convDesc,

                                           const miopenTensorDescriptor_t dwDesc,

                                           void* dw,

                                           void* workSpace,

                                           size_t workSpaceSize,

                                           const uint64_t solution_id);


 MIOPEN_EXPORT miopenStatus_t

 miopenConvolutionForwardGetWorkSpaceSize(miopenHandle_t handle,

                                          const miopenTensorDescriptor_t wDesc,

                                          const miopenTensorDescriptor_t xDesc,

                                          const miopenConvolutionDescriptor_t convDesc,

                                          const miopenTensorDescriptor_t yDesc,

                                          size_t* workSpaceSize);


 MIOPEN_EXPORT miopenStatus_t

 miopenFindConvolutionForwardAlgorithm(miopenHandle_t handle,

                                       const miopenTensorDescriptor_t xDesc,

                                       const void* x,

                                       const miopenTensorDescriptor_t wDesc,

                                       const void* w,

                                       const miopenConvolutionDescriptor_t convDesc,

                                       const miopenTensorDescriptor_t yDesc,

                                       void* y,

                                       const int requestAlgoCount,

                                       int* returnedAlgoCount,

                                       miopenConvAlgoPerf_t* perfResults,

                                       void* workSpace,

                                       size_t workSpaceSize,

                                       bool exhaustiveSearch);


 MIOPEN_EXPORT miopenStatus_t miopenConvolutionForward(miopenHandle_t handle,

                                                       const void* alpha,

                                                       const miopenTensorDescriptor_t xDesc,

                                                       const void* x,

                                                       const miopenTensorDescriptor_t wDesc,

                                                       const void* w,

                                                       const miopenConvolutionDescriptor_t convDesc,

                                                       miopenConvFwdAlgorithm_t algo,

                                                       const void* beta,

                                                       const miopenTensorDescriptor_t yDesc,

                                                       void* y,

                                                       void* workSpace,

                                                       size_t workSpaceSize);


 MIOPEN_EXPORT miopenStatus_t miopenConvolutionForwardBias(miopenHandle_t handle,

                                                           const void* alpha,

                                                           const miopenTensorDescriptor_t bDesc,

                                                           const void* b,

                                                           const void* beta,

                                                           const miopenTensorDescriptor_t yDesc,

                                                           void* y);


 MIOPEN_EXPORT miopenStatus_t

 miopenConvolutionBackwardDataGetWorkSpaceSize(miopenHandle_t handle,

                                               const miopenTensorDescriptor_t dyDesc,

                                               const miopenTensorDescriptor_t wDesc,

                                               const miopenConvolutionDescriptor_t convDesc,

                                               const miopenTensorDescriptor_t dxDesc,

                                               size_t* workSpaceSize);


 MIOPEN_EXPORT miopenStatus_t

 miopenFindConvolutionBackwardDataAlgorithm(miopenHandle_t handle,

                                            const miopenTensorDescriptor_t dyDesc,

                                            const void* dy,

                                            const miopenTensorDescriptor_t wDesc,

                                            const void* w,

                                            const miopenConvolutionDescriptor_t convDesc,

                                            const miopenTensorDescriptor_t dxDesc,

                                            void* dx,

                                            const int requestAlgoCount,

                                            int* returnedAlgoCount,

                                            miopenConvAlgoPerf_t* perfResults,

                                            void* workSpace,

                                            size_t workSpaceSize,

                                            bool exhaustiveSearch);


 MIOPEN_EXPORT miopenStatus_t

 miopenConvolutionBackwardData(miopenHandle_t handle,

                               const void* alpha,

                               const miopenTensorDescriptor_t dyDesc,

                               const void* dy,

                               const miopenTensorDescriptor_t wDesc,

                               const void* w,

                               const miopenConvolutionDescriptor_t convDesc,

                               miopenConvBwdDataAlgorithm_t algo,

                               const void* beta,

                               const miopenTensorDescriptor_t dxDesc,

                               void* dx,

                               void* workSpace,

                               size_t workSpaceSize);


 MIOPEN_EXPORT miopenStatus_t

 miopenConvolutionBackwardWeightsGetWorkSpaceSize(miopenHandle_t handle,

                                                  const miopenTensorDescriptor_t dyDesc,

                                                  const miopenTensorDescriptor_t xDesc,

                                                  const miopenConvolutionDescriptor_t convDesc,

                                                  const miopenTensorDescriptor_t dwDesc,

                                                  size_t* workSpaceSize);


 MIOPEN_EXPORT miopenStatus_t

 miopenFindConvolutionBackwardWeightsAlgorithm(miopenHandle_t handle,

                                               const miopenTensorDescriptor_t dyDesc,

                                               const void* dy,

                                               const miopenTensorDescriptor_t xDesc,

                                               const void* x,

                                               const miopenConvolutionDescriptor_t convDesc,

                                               const miopenTensorDescriptor_t dwDesc,

                                               void* dw,

                                               const int requestAlgoCount,

                                               int* returnedAlgoCount,

                                               miopenConvAlgoPerf_t* perfResults,

                                               void* workSpace,

                                               size_t workSpaceSize,

                                               bool exhaustiveSearch);


 MIOPEN_EXPORT miopenStatus_t

 miopenConvolutionBackwardWeights(miopenHandle_t handle,

                                  const void* alpha,

                                  const miopenTensorDescriptor_t dyDesc,

                                  const void* dy,

                                  const miopenTensorDescriptor_t xDesc,

                                  const void* x,

                                  const miopenConvolutionDescriptor_t convDesc,

                                  miopenConvBwdWeightsAlgorithm_t algo,

                                  const void* beta,

                                  const miopenTensorDescriptor_t dwDesc,

                                  void* dw,

                                  void* workSpace,

                                  size_t workSpaceSize);


 MIOPEN_EXPORT miopenStatus_t miopenConvolutionBackwardBias(miopenHandle_t handle,

                                                            const void* alpha,

                                                            const miopenTensorDescriptor_t dyDesc,

                                                            const void* dy,

                                                            const void* beta,

                                                            const miopenTensorDescriptor_t dbDesc,

                                                            void* db);


 // CLOSEOUT CONVOLUTIONS DOXYGEN GROUP


 // Pooling APIs

 MIOPEN_EXPORT miopenStatus_t miopenCreatePoolingDescriptor(miopenPoolingDescriptor_t* poolDesc);


 MIOPEN_EXPORT miopenStatus_t miopenSetPoolingIndexType(miopenPoolingDescriptor_t poolDesc,

                                                        miopenIndexType_t index_type);


 MIOPEN_EXPORT miopenStatus_t miopenGetPoolingIndexType(miopenPoolingDescriptor_t poolDesc,

                                                        miopenIndexType_t* index_type);


 MIOPEN_EXPORT miopenStatus_t miopenSetPoolingWorkSpaceIndexMode(

     miopenPoolingDescriptor_t poolDesc, miopenPoolingWorkspaceIndexMode_t workspace_index);


 MIOPEN_EXPORT miopenStatus_t miopenGetPoolingWorkSpaceIndexMode(

     miopenPoolingDescriptor_t poolDesc, miopenPoolingWorkspaceIndexMode_t* workspace_index);


 MIOPEN_EXPORT miopenStatus_t miopenSet2dPoolingDescriptor(miopenPoolingDescriptor_t poolDesc,

                                                           miopenPoolingMode_t mode,

                                                           int windowHeight,

                                                           int windowWidth,

                                                           int pad_h,

                                                           int pad_w,

                                                           int stride_h,

                                                           int stride_w);


 MIOPEN_EXPORT miopenStatus_t miopenGet2dPoolingDescriptor(const miopenPoolingDescriptor_t poolDesc,

                                                           miopenPoolingMode_t* mode,

                                                           int* windowHeight,

                                                           int* windowWidth,

                                                           int* pad_h,

                                                           int* pad_w,

                                                           int* stride_h,

                                                           int* stride_w);


 MIOPEN_EXPORT miopenStatus_t

 miopenGetPoolingForwardOutputDim(const miopenPoolingDescriptor_t poolDesc,

                                  const miopenTensorDescriptor_t tensorDesc,

                                  int* n,

                                  int* c,

                                  int* h,

                                  int* w);


 MIOPEN_EXPORT miopenStatus_t miopenSetNdPoolingDescriptor(miopenPoolingDescriptor_t poolDesc,

                                                           const miopenPoolingMode_t mode,

                                                           int nbDims,

                                                           const int* windowDimA,

                                                           const int* padA,

                                                           const int* stridesA);


 MIOPEN_EXPORT miopenStatus_t miopenGetNdPoolingDescriptor(const miopenPoolingDescriptor_t poolDesc,

                                                           int nbDimsRequested,

                                                           miopenPoolingMode_t* mode,

                                                           int* nbDims,

                                                           int* windowDimA,

                                                           int* padA,

                                                           int* stridesA);


 MIOPEN_EXPORT miopenStatus_t

 miopenGetPoolingNdForwardOutputDim(const miopenPoolingDescriptor_t poolDesc,

                                    const miopenTensorDescriptor_t tensorDesc,

                                    int dims,

                                    int* tensorDimArr);


 MIOPEN_EXPORT miopenStatus_t miopenPoolingGetWorkSpaceSize(const miopenTensorDescriptor_t yDesc,

                                                            size_t* workSpaceSize);


 MIOPEN_EXPORT miopenStatus_t

 miopenPoolingGetWorkSpaceSizeV2(const miopenPoolingDescriptor_t poolDesc,

                                 const miopenTensorDescriptor_t yDesc,

                                 size_t* workSpaceSize);


 MIOPEN_EXPORT miopenStatus_t miopenPoolingForward(miopenHandle_t handle,

                                                   const miopenPoolingDescriptor_t poolDesc,

                                                   const void* alpha,

                                                   const miopenTensorDescriptor_t xDesc,

                                                   const void* x,

                                                   const void* beta,

                                                   const miopenTensorDescriptor_t yDesc,

                                                   void* y,

                                                   bool do_backward,

                                                   void* workSpace,

                                                   size_t workSpaceSize);


 MIOPEN_EXPORT miopenStatus_t miopenPoolingBackward(miopenHandle_t handle,

                                                    const miopenPoolingDescriptor_t poolDesc,

                                                    const void* alpha,

                                                    const miopenTensorDescriptor_t yDesc,

                                                    const void* y,

                                                    const miopenTensorDescriptor_t dyDesc,

                                                    const void* dy,

                                                    const miopenTensorDescriptor_t xDesc,

                                                    const void* x,

                                                    const void* beta,

                                                    const miopenTensorDescriptor_t dxDesc,

                                                    void* dx,

                                                    void* workSpace);


 MIOPEN_EXPORT miopenStatus_t miopenDestroyPoolingDescriptor(miopenPoolingDescriptor_t poolDesc);


 // CLOSEOUT POOLING DOXYGEN GROUP


 // LRN APIs

 MIOPEN_EXPORT miopenStatus_t miopenCreateLRNDescriptor(miopenLRNDescriptor_t* lrnDesc);


 MIOPEN_EXPORT miopenStatus_t miopenSetLRNDescriptor(const miopenLRNDescriptor_t lrnDesc,

                                                     miopenLRNMode_t mode,

                                                     unsigned int lrnN,

                                                     double lrnAlpha,

                                                     double lrnBeta,

                                                     double lrnK);


 MIOPEN_EXPORT miopenStatus_t miopenGetLRNDescriptor(const miopenLRNDescriptor_t lrnDesc,

                                                     miopenLRNMode_t* mode,

                                                     unsigned int* lrnN,

                                                     double* lrnAlpha,

                                                     double* lrnBeta,

                                                     double* lrnK);


 MIOPEN_EXPORT miopenStatus_t miopenLRNGetWorkSpaceSize(const miopenTensorDescriptor_t yDesc,

                                                        size_t* workSpaceSize);


 MIOPEN_EXPORT miopenStatus_t miopenLRNForward(miopenHandle_t handle,

                                               const miopenLRNDescriptor_t lrnDesc,

                                               const void* alpha,

                                               const miopenTensorDescriptor_t xDesc,

                                               const void* x,

                                               const void* beta,

                                               const miopenTensorDescriptor_t yDesc,

                                               void* y,

                                               bool do_backward,

                                               void* workSpace);


 MIOPEN_EXPORT miopenStatus_t miopenLRNBackward(miopenHandle_t handle,

                                                const miopenLRNDescriptor_t lrnDesc,

                                                const void* alpha,

                                                const miopenTensorDescriptor_t yDesc,

                                                const void* y,

                                                const miopenTensorDescriptor_t dyDesc,

                                                const void* dy,

                                                const miopenTensorDescriptor_t xDesc,

                                                const void* x,

                                                const void* beta,

                                                const miopenTensorDescriptor_t dxDesc,

                                                void* dx,

                                                const void* workSpace);


 MIOPEN_EXPORT miopenStatus_t miopenDestroyLRNDescriptor(miopenLRNDescriptor_t lrnDesc);


 // CLOSEOUT LRN DOXYGEN GROUP


 #ifdef MIOPEN_BETA_API

 // LayerNorm APIs

 MIOPEN_EXPORT miopenStatus_t miopenLayerNormForward(miopenHandle_t handle,

                                                     miopenNormMode_t mode,

                                                     const miopenTensorDescriptor_t xDesc,

                                                     const void* x,

                                                     const miopenTensorDescriptor_t weightDesc,

                                                     const void* weight,

                                                     const miopenTensorDescriptor_t biasDesc,

                                                     const void* bias,

                                                     const float epsilon,

                                                     const int32_t normalized_dim,

                                                     const miopenTensorDescriptor_t yDesc,

                                                     void* y,

                                                     const miopenTensorDescriptor_t meanDesc,

                                                     void* mean,

                                                     const miopenTensorDescriptor_t rstdDesc,

                                                     void* rstd);


 MIOPEN_EXPORT miopenStatus_t

 miopenGetLayerNormBackwardWorkspaceSize(miopenHandle_t handle,

                                         miopenNormMode_t mode,

                                         const miopenTensorDescriptor_t dyDesc,

                                         const miopenTensorDescriptor_t xDesc,

                                         const miopenTensorDescriptor_t weightDesc,

                                         const miopenTensorDescriptor_t meanDesc,

                                         const miopenTensorDescriptor_t rstdDesc,

                                         const int32_t normalized_dim,

                                         const miopenTensorDescriptor_t dxDesc,

                                         const miopenTensorDescriptor_t dwDesc,

                                         const miopenTensorDescriptor_t dbDesc,

                                         size_t* sizeInBytes);


 MIOPEN_EXPORT miopenStatus_t miopenLayerNormBackward(miopenHandle_t handle,

                                                      miopenNormMode_t mode,

                                                      void* workspace,

                                                      size_t workspaceSizeInBytes,

                                                      const miopenTensorDescriptor_t dyDesc,

                                                      const void* dy,

                                                      const miopenTensorDescriptor_t xDesc,

                                                      const void* x,

                                                      const miopenTensorDescriptor_t weightDesc,

                                                      const void* weight,

                                                      const miopenTensorDescriptor_t meanDesc,

                                                      const void* mean,

                                                      const miopenTensorDescriptor_t rstdDesc,

                                                      const void* rstd,

                                                      const int32_t normalized_dim,

                                                      const miopenTensorDescriptor_t dxDesc,

                                                      void* dx,

                                                      const miopenTensorDescriptor_t dwDesc,

                                                      void* dw,

                                                      const miopenTensorDescriptor_t dbDesc,

                                                      void* db);


 // CLOSEOUT LAYERNORM DOXYGEN GROUP

 #endif


 #ifdef MIOPEN_BETA_API

 // Cat APIs

 MIOPEN_EXPORT miopenStatus_t miopenCatForward(miopenHandle_t handle,

                                               const int32_t xCount,

                                               const miopenTensorDescriptor_t* xDescs,

                                               const void* const* xs,

                                               const miopenTensorDescriptor_t yDesc,

                                               void* y,

                                               const int32_t dim);


 // CLOSEOUT CAT DOXYGEN GROUP

 #endif


 // Batch-Normalization APIs

 MIOPEN_EXPORT miopenStatus_t miopenDeriveBNTensorDescriptor(miopenTensorDescriptor_t derivedBnDesc,

                                                             const miopenTensorDescriptor_t xDesc,

                                                             miopenBatchNormMode_t bn_mode);


 MIOPEN_EXPORT miopenStatus_t

 miopenBatchNormalizationForwardTraining(miopenHandle_t handle,

                                         miopenBatchNormMode_t bn_mode,

                                         void* alpha,

                                         void* beta,

                                         const miopenTensorDescriptor_t xDesc,

                                         const void* x,

                                         const miopenTensorDescriptor_t yDesc,

                                         void* y,

                                         const miopenTensorDescriptor_t bnScaleBiasMeanVarDesc,

                                         void* bnScale,

                                         void* bnBias,

                                         double expAvgFactor,

                                         void* resultRunningMean,

                                         void* resultRunningVariance,

                                         double epsilon,

                                         void* resultSaveMean,

                                         void* resultSaveInvVariance);

 MIOPEN_EXPORT miopenStatus_t

 miopenBatchNormalizationForwardTraining_V2(miopenHandle_t handle,

                                            miopenBatchNormMode_t bn_mode,

                                            void* alpha,

                                            void* beta,

                                            const miopenTensorDescriptor_t xDesc,

                                            const void* x,

                                            const miopenTensorDescriptor_t yDesc,

                                            void* y,

                                            const miopenTensorDescriptor_t scaleDesc,

                                            const miopenTensorDescriptor_t biasVarDesc,

                                            const miopenTensorDescriptor_t savedMeanDesc,

                                            const miopenTensorDescriptor_t savedVarDesc,

                                            void* bnScale,

                                            void* bnBias,

                                            double expAvgFactor,

                                            void* resultRunningMean,

                                            void* resultRunningVariance,

                                            double epsilon,

                                            void* resultSaveMean,

                                            void* resultSaveInvVariance);

 MIOPEN_EXPORT miopenStatus_t

 miopenBatchNormalizationForwardTraining_V3(miopenHandle_t handle,

                                            miopenBatchNormMode_t bn_mode,

                                            void* alpha,

                                            void* beta,

                                            const miopenTensorDescriptor_t xDesc,

                                            const void* x,

                                            const miopenTensorDescriptor_t yDesc,

                                            void* y,

                                            const miopenTensorDescriptor_t scaleDesc,

                                            const miopenTensorDescriptor_t biasVarDesc,

                                            const miopenTensorDescriptor_t savedMeanDesc,

                                            const miopenTensorDescriptor_t savedVarDesc,

                                            void* bnScale,

                                            void* bnBias,

                                            double expAvgFactor,

                                            const void* prevResultRunningMean,

                                            const void* prevResultRunningVariance,

                                            void* nextResultRunningMean,

                                            void* nextResultRunningVariance,

                                            double epsilon,

                                            void* resultSaveMean,

                                            void* resultSaveInvVariance);

 MIOPEN_EXPORT miopenStatus_t

 miopenBatchNormForwardTrainingActivation(miopenHandle_t handle,

                                          miopenBatchNormMode_t bn_mode,

                                          void* alpha,

                                          void* beta,

                                          const miopenTensorDescriptor_t xDesc,

                                          const void* x,

                                          const miopenTensorDescriptor_t yDesc,

                                          void* y,

                                          const miopenTensorDescriptor_t scaleDesc,

                                          const miopenTensorDescriptor_t biasVarDesc,

                                          const miopenTensorDescriptor_t savedMeanDesc,

                                          const miopenTensorDescriptor_t savedVarDesc,

                                          void* bnScale,

                                          void* bnBias,

                                          double expAvgFactor,

                                          void* resultRunningMean,

                                          void* resultRunningVariance,

                                          double epsilon,

                                          void* resultSaveMean,

                                          void* resultSaveInvVariance,

                                          const miopenActivationDescriptor_t activDesc);


 MIOPEN_EXPORT miopenStatus_t

 miopenBatchNormForwardTrainingActivation_V2(miopenHandle_t handle,

                                             miopenBatchNormMode_t bn_mode,

                                             void* alpha,

                                             void* beta,

                                             const miopenTensorDescriptor_t xDesc,

                                             const void* x,

                                             const miopenTensorDescriptor_t yDesc,

                                             void* y,

                                             const miopenTensorDescriptor_t scaleDesc,

                                             const miopenTensorDescriptor_t biasVarDesc,

                                             const miopenTensorDescriptor_t savedMeanDesc,

                                             const miopenTensorDescriptor_t savedVarDesc,

                                             void* bnScale,

                                             void* bnBias,

                                             double expAvgFactor,

                                             const void* prevResultRunningMean,

                                             const void* prevResultRunningVariance,

                                             void* nextResultRunningMean,

                                             void* nextResultRunningVariance,

                                             double epsilon,

                                             void* resultSaveMean,

                                             void* resultSaveInvVariance,

                                             const miopenActivationDescriptor_t activDesc);


 MIOPEN_EXPORT miopenStatus_t

 miopenBatchNormalizationForwardInference(miopenHandle_t handle,

                                          miopenBatchNormMode_t bn_mode,

                                          void* alpha,

                                          void* beta,

                                          const miopenTensorDescriptor_t xDesc,

                                          const void* x,

                                          const miopenTensorDescriptor_t yDesc,

                                          void* y,

                                          const miopenTensorDescriptor_t bnScaleBiasMeanVarDesc,

                                          void* bnScale,

                                          void* bnBias,

                                          void* estimatedMean,

                                          void* estimatedVariance,

                                          double epsilon);


 MIOPEN_EXPORT miopenStatus_t

 miopenBatchNormalizationForwardInference_V2(miopenHandle_t handle,

                                             miopenBatchNormMode_t bn_mode,

                                             void* alpha,

                                             void* beta,

                                             const miopenTensorDescriptor_t xDesc,

                                             const void* x,

                                             const miopenTensorDescriptor_t yDesc,

                                             void* y,

                                             const miopenTensorDescriptor_t scaleDesc,

                                             const miopenTensorDescriptor_t biasDesc,

                                             const miopenTensorDescriptor_t estMeanDesc,

                                             const miopenTensorDescriptor_t estVarianceDesc,

                                             void* bnScale,

                                             void* bnBias,

                                             void* estimatedMean,

                                             void* estimatedVariance,

                                             double epsilon);


 MIOPEN_EXPORT miopenStatus_t miopenBatchNormalizationForwardInferenceInvVariance(

     miopenHandle_t handle,

     miopenBatchNormMode_t bn_mode,

     void* alpha,

     void* beta,

     const miopenTensorDescriptor_t xDesc,

     const void* x,

     const miopenTensorDescriptor_t yDesc,

     void* y,

     const miopenTensorDescriptor_t scaleDesc,

     const miopenTensorDescriptor_t biasDesc,

     const miopenTensorDescriptor_t estMeanDesc,

     const miopenTensorDescriptor_t estInvVarianceDesc,

     void* bnScale,

     void* bnBias,

     void* estimatedMean,

     void* estimatedInvVariance);


 MIOPEN_EXPORT miopenStatus_t miopenBatchNormForwardInferenceActivationInvVariance(

     miopenHandle_t handle,

     miopenBatchNormMode_t bn_mode,

     void* alpha,

     void* beta,

     const miopenTensorDescriptor_t xDesc,

     const void* x,

     const miopenTensorDescriptor_t yDesc,

     void* y,

     const miopenTensorDescriptor_t scaleDesc,

     const miopenTensorDescriptor_t biasDesc,

     const miopenTensorDescriptor_t estMeanDesc,

     const miopenTensorDescriptor_t estInvVarianceDesc,

     void* bnScale,

     void* bnBias,

     void* estimatedMean,

     void* estimatedInvVariance,

     const miopenActivationDescriptor_t activDesc);


 MIOPEN_EXPORT miopenStatus_t

 miopenBatchNormForwardInferenceActivation(miopenHandle_t handle,

                                           miopenBatchNormMode_t bn_mode,

                                           void* alpha,

                                           void* beta,

                                           const miopenTensorDescriptor_t xDesc,

                                           const void* x,

                                           const miopenTensorDescriptor_t yDesc,

                                           void* y,

                                           const miopenTensorDescriptor_t scaleDesc,

                                           const miopenTensorDescriptor_t biasDesc,

                                           const miopenTensorDescriptor_t estMeanDesc,

                                           const miopenTensorDescriptor_t estVarianceDesc,

                                           void* bnScale,

                                           void* bnBias,

                                           void* estimatedMean,

                                           void* estimatedVariance,

                                           double epsilon,

                                           const miopenActivationDescriptor_t activDesc);


 MIOPEN_EXPORT miopenStatus_t

 miopenBatchNormalizationBackward(miopenHandle_t handle,

                                  miopenBatchNormMode_t bn_mode,

                                  const void* alphaDataDiff,

                                  const void* betaDataDiff,

                                  const void* alphaParamDiff,

                                  const void* betaParamDiff,

                                  const miopenTensorDescriptor_t xDesc,

                                  const void* x,

                                  const miopenTensorDescriptor_t dyDesc,

                                  const void* dy,

                                  const miopenTensorDescriptor_t dxDesc,

                                  void* dx,

                                  const miopenTensorDescriptor_t bnScaleBiasDiffDesc,

                                  const void* bnScale,

                                  void* resultBnScaleDiff,

                                  void* resultBnBiasDiff,

                                  double epsilon,

                                  const void* savedMean,

                                  const void* savedInvVariance);


 MIOPEN_EXPORT miopenStatus_t

 miopenBatchNormalizationBackward_V2(miopenHandle_t handle,

                                     miopenBatchNormMode_t bn_mode,

                                     const void* alphaDataDiff,

                                     const void* betaDataDiff,

                                     const void* alphaParamDiff,

                                     const void* betaParamDiff,

                                     const miopenTensorDescriptor_t xDesc,

                                     const void* x,

                                     const miopenTensorDescriptor_t dyDesc,

                                     const void* dy,

                                     const miopenTensorDescriptor_t dxDesc,

                                     void* dx,

                                     const miopenTensorDescriptor_t scaleDesc,

                                     const miopenTensorDescriptor_t biasDesc,

                                     const miopenTensorDescriptor_t savedMeanDesc,

                                     const miopenTensorDescriptor_t savedVarDesc,

                                     const void* bnScale,

                                     void* resultBnScaleDiff,

                                     void* resultBnBiasDiff,

                                     double epsilon,

                                     const void* savedMean,

                                     const void* savedInvVariance);


 MIOPEN_EXPORT miopenStatus_t

 miopenBatchNormBackwardActivation(miopenHandle_t handle,

                                   miopenBatchNormMode_t bn_mode,

                                   const void* alphaDataDiff,

                                   const void* betaDataDiff,

                                   const void* alphaParamDiff,

                                   const void* betaParamDiff,

                                   const miopenTensorDescriptor_t xDesc,

                                   const void* x,

                                   const miopenTensorDescriptor_t dyDesc,

                                   const void* dy,

                                   const miopenTensorDescriptor_t dxDesc,

                                   void* dx,

                                   const miopenTensorDescriptor_t scaleDesc,

                                   const miopenTensorDescriptor_t biasDesc,

                                   const miopenTensorDescriptor_t savedMeanDesc,

                                   const miopenTensorDescriptor_t savedVarianceDesc,

                                   const void* bnScale,

                                   const void* bnBias,

                                   void* resultBnScaleDiff,

                                   void* resultBnBiasDiff,

                                   double epsilon,

                                   const void* savedMean,

                                   const void* savedInvVariance,

                                   const miopenActivationDescriptor_t activDesc);

 // CLOSEOUT BATCHNORM DOXYGEN GROUP


 // Activation APIs

 MIOPEN_EXPORT miopenStatus_t

 miopenCreateActivationDescriptor(miopenActivationDescriptor_t* activDesc);


 MIOPEN_EXPORT miopenStatus_t

 miopenSetActivationDescriptor(const miopenActivationDescriptor_t activDesc,

                               miopenActivationMode_t mode,

                               double activAlpha,

                               double activBeta,

                               double activGamma);


 MIOPEN_EXPORT miopenStatus_t

 miopenGetActivationDescriptor(const miopenActivationDescriptor_t activDesc,

                               miopenActivationMode_t* mode,

                               double* activAlpha,

                               double* activBeta,

                               double* activGamma);


 MIOPEN_EXPORT miopenStatus_t miopenActivationForward(miopenHandle_t handle,

                                                      const miopenActivationDescriptor_t activDesc,

                                                      const void* alpha,

                                                      const miopenTensorDescriptor_t xDesc,

                                                      const void* x,

                                                      const void* beta,

                                                      const miopenTensorDescriptor_t yDesc,

                                                      void* y);


 MIOPEN_EXPORT miopenStatus_t miopenActivationBackward(miopenHandle_t handle,

                                                       const miopenActivationDescriptor_t activDesc,

                                                       const void* alpha,

                                                       const miopenTensorDescriptor_t yDesc,

                                                       const void* y,

                                                       const miopenTensorDescriptor_t dyDesc,

                                                       const void* dy,

                                                       const miopenTensorDescriptor_t xDesc,

                                                       const void* x,

                                                       const void* beta,

                                                       const miopenTensorDescriptor_t dxDesc,

                                                       void* dx);


 MIOPEN_EXPORT miopenStatus_t

 miopenDestroyActivationDescriptor(miopenActivationDescriptor_t activDesc);


 // CLOSEOUT ACTIVATION DOXYGEN GROUP


 #ifdef MIOPEN_BETA_API

 MIOPEN_EXPORT miopenStatus_t miopenGLUForward(miopenHandle_t handle,

                                               const miopenTensorDescriptor_t inputDesc,

                                               const void* input,

                                               const miopenTensorDescriptor_t outputDesc,

                                               void* output,

                                               const uint32_t dim);


 MIOPEN_EXPORT miopenStatus_t miopenGLUBackward(miopenHandle_t handle,

                                                const miopenTensorDescriptor_t inputDesc,

                                                const void* input,

                                                const miopenTensorDescriptor_t outputGradDesc,

                                                const void* outputGrad,

                                                const miopenTensorDescriptor_t inputGradDesc,

                                                void* inputGrad,

                                                const uint32_t dim);


 // CLOSEOUT ACTIVATION DOXYGEN GROUP

 #endif // MIOPEN_BETA_API


 // Softmax APIs

 MIOPEN_EXPORT miopenStatus_t miopenSoftmaxForward(miopenHandle_t handle,

                                                   const void* alpha,

                                                   const miopenTensorDescriptor_t xDesc,

                                                   const void* x,

                                                   const void* beta,

                                                   const miopenTensorDescriptor_t yDesc,

                                                   void* y);


 MIOPEN_EXPORT miopenStatus_t miopenSoftmaxBackward(miopenHandle_t handle,

                                                    const void* alpha,

                                                    const miopenTensorDescriptor_t yDesc,

                                                    const void* y,

                                                    const miopenTensorDescriptor_t dyDesc,

                                                    const void* dy,

                                                    const void* beta,

                                                    const miopenTensorDescriptor_t dxDesc,

                                                    void* dx);


 MIOPEN_EXPORT miopenStatus_t miopenSoftmaxForward_V2(miopenHandle_t handle,

                                                      const void* alpha,

                                                      const miopenTensorDescriptor_t xDesc,

                                                      const void* x,

                                                      const void* beta,

                                                      const miopenTensorDescriptor_t yDesc,

                                                      void* y,

                                                      miopenSoftmaxAlgorithm_t algorithm,

                                                      miopenSoftmaxMode_t mode);


 MIOPEN_EXPORT miopenStatus_t miopenSoftmaxBackward_V2(miopenHandle_t handle,

                                                       const void* alpha,

                                                       const miopenTensorDescriptor_t yDesc,

                                                       const void* y,

                                                       const miopenTensorDescriptor_t dyDesc,

                                                       const void* dy,

                                                       const void* beta,

                                                       const miopenTensorDescriptor_t dxDesc,

                                                       void* dx,

                                                       miopenSoftmaxAlgorithm_t algorithm,

                                                       miopenSoftmaxMode_t mode);


 // CLOSEOUT SOFTMAX DOXYGEN GROUP


 MIOPEN_DECLARE_OBJECT(miopenFusionPlanDescriptor);

 MIOPEN_DECLARE_OBJECT(miopenOperatorDescriptor);

 MIOPEN_DECLARE_OBJECT(miopenOperatorArgs);


 typedef enum

 {

     miopenVerticalFusion   = 0,

     miopenHorizontalFusion = 1,

 } miopenFusionDirection_t;


 MIOPEN_EXPORT miopenStatus_t miopenCreateFusionPlan(miopenFusionPlanDescriptor_t* fusePlanDesc,

                                                     const miopenFusionDirection_t fuseDirection,

                                                     const miopenTensorDescriptor_t inputDesc);


 MIOPEN_EXPORT miopenStatus_t miopenDestroyFusionPlan(miopenFusionPlanDescriptor_t fusePlanDesc);


 MIOPEN_EXPORT miopenStatus_t miopenCompileFusionPlan(miopenHandle_t handle,

                                                      miopenFusionPlanDescriptor_t fusePlanDesc);


 MIOPEN_EXPORT miopenStatus_t miopenFusionPlanGetOp(miopenFusionPlanDescriptor_t fusePlanDesc,

                                                    const int op_idx,

                                                    miopenFusionOpDescriptor_t* op);


 MIOPEN_EXPORT miopenStatus_t

 miopenFusionPlanGetWorkSpaceSize(miopenHandle_t handle,

                                  miopenFusionPlanDescriptor_t fusePlanDesc,

                                  size_t* workSpaceSize,

                                  miopenConvFwdAlgorithm_t algo);


 MIOPEN_EXPORT miopenStatus_t

 miopenFusionPlanConvolutionGetAlgo(miopenFusionPlanDescriptor_t fusePlanDesc,

                                    const int requestAlgoCount,

                                    int* returnedAlgoCount,

                                    miopenConvFwdAlgorithm_t* returnedAlgos);


 MIOPEN_EXPORT miopenStatus_t miopenFusionPlanConvolutionSetAlgo(

     miopenFusionPlanDescriptor_t fusePlanDesc, miopenConvFwdAlgorithm_t algo);


 MIOPEN_EXPORT miopenStatus_t miopenCreateOpConvForward(miopenFusionPlanDescriptor_t fusePlanDesc,

                                                        miopenFusionOpDescriptor_t* convOp,

                                                        miopenConvolutionDescriptor_t convDesc,

                                                        const miopenTensorDescriptor_t wDesc);


 //---


 // Activation forward create ops ---

 MIOPEN_EXPORT miopenStatus_t

 miopenCreateOpActivationForward(miopenFusionPlanDescriptor_t fusePlanDesc,

                                 miopenFusionOpDescriptor_t* activFwdOp,

                                 miopenActivationMode_t mode);


 // Activation backward create ops ---

 MIOPEN_EXPORT miopenStatus_t

 miopenCreateOpActivationBackward(miopenFusionPlanDescriptor_t fusePlanDesc,

                                  miopenFusionOpDescriptor_t* activBwdOp,

                                  miopenActivationMode_t mode);


 // Bias create ops ---

 MIOPEN_EXPORT miopenStatus_t miopenCreateOpBiasForward(miopenFusionPlanDescriptor_t fusePlanDesc,

                                                        miopenFusionOpDescriptor_t* biasOp,

                                                        const miopenTensorDescriptor_t bDesc);


 // Batch normalization create ops ---

 MIOPEN_EXPORT miopenStatus_t

 miopenCreateOpBatchNormInference(miopenFusionPlanDescriptor_t fusePlanDesc,

                                  miopenFusionOpDescriptor_t* bnOp,

                                  const miopenBatchNormMode_t bn_mode,

                                  const miopenTensorDescriptor_t bnScaleBiasMeanVarDesc);


 MIOPEN_EXPORT miopenStatus_t

 miopenCreateOpBatchNormForward(miopenFusionPlanDescriptor_t fusePlanDesc,

                                miopenFusionOpDescriptor_t* bnFwdOp,

                                const miopenBatchNormMode_t bn_mode,

                                bool runningMeanVariance);


 MIOPEN_EXPORT miopenStatus_t

 miopenCreateOpBatchNormBackward(miopenFusionPlanDescriptor_t fusePlanDesc,

                                 miopenFusionOpDescriptor_t* bnBwdOp,

                                 const miopenBatchNormMode_t bn_mode);


 //---

 MIOPEN_EXPORT miopenStatus_t miopenCreateOperatorArgs(miopenOperatorArgs_t* args);


 MIOPEN_EXPORT miopenStatus_t miopenDestroyOperatorArgs(miopenOperatorArgs_t args);


 // Convolution set arguments ---

 MIOPEN_EXPORT miopenStatus_t miopenSetOpArgsConvForward(miopenOperatorArgs_t args,

                                                         const miopenFusionOpDescriptor_t convOp,

                                                         const void* alpha,

                                                         const void* beta,

                                                         const void* w);

 // Activation set arguments ---

 MIOPEN_EXPORT miopenStatus_t

 miopenSetOpArgsActivForward(miopenOperatorArgs_t args,

                             const miopenFusionOpDescriptor_t activFwdOp,

                             const void* alpha,

                             const void* beta,

                             double activAlpha,

                             double activBeta,

                             double activGamma);


 MIOPEN_EXPORT miopenStatus_t

 miopenSetOpArgsActivBackward(miopenOperatorArgs_t args,

                              const miopenFusionOpDescriptor_t activBwdOp,

                              const void* alpha,

                              const void* beta,

                              const void* y,

                              const void* reserved,

                              double activAlpha,

                              double activBeta,

                              double activGamma);


 // Batch Normalization set arguments ---

 MIOPEN_EXPORT miopenStatus_t

 miopenSetOpArgsBatchNormInference(miopenOperatorArgs_t args,

                                   const miopenFusionOpDescriptor_t bnOp,

                                   const void* alpha,

                                   const void* beta,

                                   const void* bnScale,

                                   const void* bnBias,

                                   const void* estimatedMean,

                                   const void* estimatedVariance,

                                   double epsilon);


 MIOPEN_EXPORT miopenStatus_t miopenSetOpArgsBatchNormForward(miopenOperatorArgs_t args,

                                                              const miopenFusionOpDescriptor_t bnOp,

                                                              const void* alpha,

                                                              const void* beta,

                                                              const void* bnScale,

                                                              const void* bnBias,

                                                              void* savedMean,

                                                              void* savedInvVariance,

                                                              void* runningMean,

                                                              void* runningVariance,

                                                              double expAvgFactor,

                                                              double epsilon);


 MIOPEN_EXPORT miopenStatus_t miopenSetOpArgsBatchNormBackward(miopenOperatorArgs_t args,

                                                               const miopenFusionOpDescriptor_t bnOp,

                                                               const void* alpha,

                                                               const void* beta,

                                                               const void* x,

                                                               const void* bnScale,

                                                               const void* bnBias,

                                                               void* resultBnScaleDiff,

                                                               void* resultBnBiasDiff,

                                                               const void* savedMean,

                                                               const void* savedInvVariance);


 // Bias forward set arguments ---

 MIOPEN_EXPORT miopenStatus_t miopenSetOpArgsBiasForward(miopenOperatorArgs_t args,

                                                         const miopenFusionOpDescriptor_t biasOp,

                                                         const void* alpha,

                                                         const void* beta,

                                                         const void* bias);


 MIOPEN_EXPORT miopenStatus_t

 miopenExecuteFusionPlan(const miopenHandle_t handle,

                         const miopenFusionPlanDescriptor_t fusePlanDesc,

                         const miopenTensorDescriptor_t inputDesc,

                         const void* input,

                         const miopenTensorDescriptor_t outputDesc,

                         void* output,

                         miopenOperatorArgs_t args);


 MIOPEN_EXPORT miopenStatus_t

 miopenExecuteFusionPlan_v2(const miopenHandle_t handle,

                            const miopenFusionPlanDescriptor_t fusePlanDesc,

                            const miopenTensorDescriptor_t inputDesc,

                            const void* input,

                            const miopenTensorDescriptor_t outputDesc,

                            void* output,

                            miopenOperatorArgs_t args,

                            void* workspace,

                            size_t workspaceSize);


 MIOPEN_EXPORT miopenStatus_t

 miopenConvolutionBiasActivationForward(miopenHandle_t handle,

                                        const void* alpha1,

                                        const miopenTensorDescriptor_t xDesc,

                                        const void* x,

                                        const miopenTensorDescriptor_t wDesc,

                                        const void* w,

                                        const miopenConvolutionDescriptor_t convDesc,

                                        miopenConvFwdAlgorithm_t algo,

                                        void* workspace,

                                        size_t workspaceSizeInBytes,

                                        const void* alpha2,

                                        const miopenTensorDescriptor_t zDesc,

                                        const void* z,

                                        const miopenTensorDescriptor_t biasDesc,

                                        const void* bias,

                                        const miopenActivationDescriptor_t activationDesc,

                                        const miopenTensorDescriptor_t yDesc,

                                        void* y);

 // CLOSEOUT FUSION DOXYGEN GROUP


 typedef enum

 {

     miopenRNNRELU = 0,

     miopenRNNTANH = 1,

     miopenLSTM    = 2,

     miopenGRU     = 3,

 } miopenRNNMode_t;


 typedef enum

 {

     miopenRNNlinear = 0,

     miopenRNNskip   = 1,

 } miopenRNNInputMode_t;


 typedef enum

 {

     miopenRNNdefault = 0,

     miopenRNNfundamental = 1,

     miopenRNNroundedDynamic = 2,

 } miopenRNNAlgo_t;


 typedef enum

 {

     miopenRNNunidirection = 0,

     miopenRNNbidirection  = 1,

 } miopenRNNDirectionMode_t;


 typedef enum

 {

     miopenRNNNoBias   = 0,

     miopenRNNwithBias = 1,

 } miopenRNNBiasMode_t;


 typedef enum

 {

     miopenRNNAlgoGEMM = 0,

 } miopenRNNGEMMalgoMode_t;


 typedef enum

 {

     miopenRNNIONotPadded   = 0,

     miopenRNNIOWithPadding = 1,

 } miopenRNNPaddingMode_t;


 typedef enum

 {

     miopenRNNTraining  = 0,

     miopenRNNInference = 1,

 } miopenRNNFWDMode_t;


 typedef enum

 {

     miopenRNNDataUnknownLayout     = 0,

     miopenRNNDataSeqMajorNotPadded = 1,

     miopenRNNDataSeqMajorPadded    = 2,

     miopenRNNDataBatchMajorPadded  = 3,

 } miopenRNNBaseLayout_t;


 MIOPEN_EXPORT miopenStatus_t miopenCreateRNNDescriptor(miopenRNNDescriptor_t* rnnDesc);


 MIOPEN_EXPORT miopenStatus_t miopenGetRNNDescriptor(miopenRNNDescriptor_t rnnDesc,

                                                     miopenRNNMode_t* rnnMode,

                                                     miopenRNNAlgo_t* algoMode,

                                                     miopenRNNInputMode_t* inputMode,

                                                     miopenRNNDirectionMode_t* dirMode,

                                                     miopenRNNBiasMode_t* biasMode,

                                                     int* hiddenSize,

                                                     int* layer);


 MIOPEN_EXPORT miopenStatus_t miopenGetRNNDescriptor_V2(miopenRNNDescriptor_t rnnDesc,

                                                        int* hiddenSize,

                                                        int* layer,

                                                        miopenDropoutDescriptor_t* dropoutDesc,

                                                        miopenRNNInputMode_t* inputMode,

                                                        miopenRNNDirectionMode_t* dirMode,

                                                        miopenRNNMode_t* rnnMode,

                                                        miopenRNNBiasMode_t* biasMode,

                                                        miopenRNNAlgo_t* algoMode,

                                                        miopenDataType_t* dataType);


 MIOPEN_EXPORT miopenStatus_t miopenDestroyRNNDescriptor(miopenRNNDescriptor_t rnnDesc);


 MIOPEN_EXPORT miopenStatus_t miopenSetRNNDescriptor(miopenRNNDescriptor_t rnnDesc,

                                                     const int hsize,

                                                     const int nlayers,

                                                     miopenRNNInputMode_t inMode,

                                                     miopenRNNDirectionMode_t direction,

                                                     miopenRNNMode_t rnnMode,

                                                     miopenRNNBiasMode_t biasMode,

                                                     miopenRNNAlgo_t algo,

                                                     miopenDataType_t dataType);


 MIOPEN_EXPORT miopenStatus_t miopenSetRNNDescriptor_V2(miopenRNNDescriptor_t rnnDesc,

                                                        const int hsize,

                                                        const int nlayers,

                                                        miopenDropoutDescriptor_t dropoutDesc,

                                                        miopenRNNInputMode_t inMode,

                                                        miopenRNNDirectionMode_t direction,

                                                        miopenRNNMode_t rnnMode,

                                                        miopenRNNBiasMode_t biasMode,

                                                        miopenRNNAlgo_t algo,

                                                        miopenDataType_t dataType);


 MIOPEN_EXPORT miopenStatus_t

 miopenSetRNNDataSeqTensorDescriptor(miopenSeqTensorDescriptor_t seqTensorDesc,

                                     miopenDataType_t dataType,

                                     miopenRNNBaseLayout_t layout,

                                     int maxSequenceLen,

                                     int batchSize,

                                     int vectorSize,

                                     const int* sequenceLenArray,

                                     void* paddingMarker);


 MIOPEN_EXPORT miopenStatus_t

 miopenGetRNNDataSeqTensorDescriptor(miopenSeqTensorDescriptor_t seqTensorDesc,

                                     miopenDataType_t* dataType,

                                     miopenRNNBaseLayout_t* layout,

                                     int* maxSequenceLen,

                                     int* batchSize,

                                     int* vectorSize,

                                     int sequenceLenArrayLimit,

                                     int* sequenceLenArray,

                                     void* paddingMarker);


 MIOPEN_EXPORT miopenStatus_t miopenGetRNNWorkspaceSize(miopenHandle_t handle,

                                                        const miopenRNNDescriptor_t rnnDesc,

                                                        const int sequenceLen,

                                                        const miopenTensorDescriptor_t* xDesc,

                                                        size_t* numBytes);


 MIOPEN_EXPORT miopenStatus_t miopenGetRNNTrainingReserveSize(miopenHandle_t handle,

                                                              miopenRNNDescriptor_t rnnDesc,

                                                              const int sequenceLen,

                                                              const miopenTensorDescriptor_t* xDesc,

                                                              size_t* numBytes);


 MIOPEN_EXPORT miopenStatus_t miopenGetRNNTempSpaceSizes(miopenHandle_t handle,

                                                         miopenRNNDescriptor_t rnnDesc,

                                                         miopenSeqTensorDescriptor_t xDesc,

                                                         miopenRNNFWDMode_t fwdMode,

                                                         size_t* workSpaceSize,

                                                         size_t* reserveSpaceSize);


 MIOPEN_EXPORT miopenStatus_t miopenGetRNNParamsSize(miopenHandle_t handle,

                                                     miopenRNNDescriptor_t rnnDesc,

                                                     miopenTensorDescriptor_t xDesc,

                                                     size_t* numBytes,

                                                     miopenDataType_t dtype);


 MIOPEN_EXPORT miopenStatus_t miopenGetRNNParamsDescriptor(miopenHandle_t handle,

                                                           miopenRNNDescriptor_t rnnDesc,

                                                           miopenTensorDescriptor_t xDesc,

                                                           miopenTensorDescriptor_t wDesc,

                                                           miopenDataType_t dtype);


 MIOPEN_EXPORT miopenStatus_t miopenGetRNNInputTensorSize(miopenHandle_t handle,

                                                          miopenRNNDescriptor_t rnnDesc,

                                                          const int seqLen,

                                                          miopenTensorDescriptor_t* xDesc,

                                                          size_t* numBytes);


 MIOPEN_EXPORT miopenStatus_t miopenGetRNNHiddenTensorSize(miopenHandle_t handle,

                                                           miopenRNNDescriptor_t rnnDesc,

                                                           const int seqLen,

                                                           miopenTensorDescriptor_t* xDesc,

                                                           size_t* numBytes);


 MIOPEN_EXPORT miopenStatus_t miopenGetRNNLayerParamSize(miopenHandle_t handle,

                                                         miopenRNNDescriptor_t rnnDesc,

                                                         const int layer,

                                                         miopenTensorDescriptor_t xDesc,

                                                         const int paramID,

                                                         size_t* numBytes);


 MIOPEN_EXPORT miopenStatus_t miopenGetRNNLayerBiasSize(miopenHandle_t handle,

                                                        miopenRNNDescriptor_t rnnDesc,

                                                        const int layer,

                                                        const int biasID,

                                                        size_t* numBytes);


 MIOPEN_EXPORT miopenStatus_t miopenGetRNNLayerParam(miopenHandle_t handle,

                                                     miopenRNNDescriptor_t rnnDesc,

                                                     const int layer,

                                                     miopenTensorDescriptor_t xDesc,

                                                     miopenTensorDescriptor_t wDesc,

                                                     const void* w,

                                                     const int paramID,

                                                     miopenTensorDescriptor_t paramDesc,

                                                     void* layerParam);


 MIOPEN_EXPORT miopenStatus_t miopenGetRNNLayerBias(miopenHandle_t handle,

                                                    miopenRNNDescriptor_t rnnDesc,

                                                    const int layer,

                                                    miopenTensorDescriptor_t xDesc,

                                                    miopenTensorDescriptor_t wDesc,

                                                    const void* w,

                                                    const int biasID,

                                                    miopenTensorDescriptor_t biasDesc,

                                                    void* layerBias);


 MIOPEN_EXPORT miopenStatus_t miopenGetRNNLayerParamOffset(miopenRNNDescriptor_t rnnDesc,

                                                           const int layer,

                                                           miopenTensorDescriptor_t xDesc,

                                                           const int paramID,

                                                           miopenTensorDescriptor_t paramDesc,

                                                           size_t* layerParamOffset);


 MIOPEN_EXPORT miopenStatus_t miopenGetRNNLayerBiasOffset(miopenRNNDescriptor_t rnnDesc,

                                                          const int layer,

                                                          miopenTensorDescriptor_t xDesc,

                                                          const int biasID,

                                                          miopenTensorDescriptor_t biasDesc,

                                                          size_t* layerBiasOffset);


 MIOPEN_EXPORT miopenStatus_t miopenSetRNNLayerParam(miopenHandle_t handle,

                                                     miopenRNNDescriptor_t rnnDesc,

                                                     const int layer,

                                                     miopenTensorDescriptor_t xDesc,

                                                     miopenTensorDescriptor_t wDesc,

                                                     void* w,

                                                     const int paramID,

                                                     miopenTensorDescriptor_t paramDesc,

                                                     const void* layerParam);


 MIOPEN_EXPORT miopenStatus_t miopenSetRNNLayerBias(miopenHandle_t handle,

                                                    miopenRNNDescriptor_t rnnDesc,

                                                    const int layer,

                                                    miopenTensorDescriptor_t xDesc,

                                                    miopenTensorDescriptor_t wDesc,

                                                    void* w,

                                                    const int biasID,

                                                    miopenTensorDescriptor_t biasDesc,

                                                    const void* layerBias);


 MIOPEN_EXPORT miopenStatus_t miopenSetRNNPaddingMode(miopenRNNDescriptor_t rnnDesc,

                                                      miopenRNNPaddingMode_t paddingMode);


 MIOPEN_EXPORT miopenStatus_t miopenGetRNNPaddingMode(miopenRNNDescriptor_t rnnDesc,

                                                      miopenRNNPaddingMode_t* paddingMode);


 MIOPEN_EXPORT miopenStatus_t miopenRNNForward(miopenHandle_t handle,

                                               const miopenRNNDescriptor_t rnnDesc,

                                               miopenRNNFWDMode_t fwdMode,

                                               const miopenSeqTensorDescriptor_t xDesc,

                                               const void* x,

                                               const miopenTensorDescriptor_t hDesc,

                                               const void* hx,

                                               void* hy,

                                               const miopenTensorDescriptor_t cDesc,

                                               const void* cx,

                                               void* cy,

                                               const miopenSeqTensorDescriptor_t yDesc,

                                               void* y,

                                               const void* w,

                                               size_t weightSpaceSize,

                                               void* workSpace,

                                               size_t workSpaceNumBytes,

                                               void* reserveSpace,

                                               size_t reserveSpaceNumBytes);


 MIOPEN_EXPORT miopenStatus_t miopenRNNBackwardSeqData(miopenHandle_t handle,

                                                       const miopenRNNDescriptor_t rnnDesc,

                                                       const miopenSeqTensorDescriptor_t yDesc,

                                                       const void* y,

                                                       const void* dy,

                                                       const miopenTensorDescriptor_t hDesc,

                                                       const void* hx,

                                                       const void* dhy,

                                                       void* dhx,

                                                       const miopenTensorDescriptor_t cDesc,

                                                       const void* cx,

                                                       const void* dcy,

                                                       void* dcx,

                                                       const miopenSeqTensorDescriptor_t xDesc,

                                                       void* dx,

                                                       const void* w,

                                                       size_t weightSpaceSize,

                                                       void* workSpace,

                                                       size_t workSpaceNumBytes,

                                                       void* reserveSpace,

                                                       size_t reserveSpaceNumBytes);


 MIOPEN_EXPORT miopenStatus_t

 miopenRNNBackwardWeightsSeqTensor(miopenHandle_t handle,

                                   const miopenRNNDescriptor_t rnnDesc,

                                   const miopenSeqTensorDescriptor_t xDesc,

                                   const void* x,

                                   const miopenTensorDescriptor_t hDesc,

                                   const void* hx,

                                   const miopenSeqTensorDescriptor_t yDesc,

                                   const void* y,

                                   void* dw,

                                   size_t weightSpaceSize,

                                   void* workSpace,

                                   size_t workSpaceNumBytes,

                                   const void* reserveSpace,

                                   size_t reserveSpaceNumBytes);


 MIOPEN_EXPORT miopenStatus_t miopenRNNForwardTraining(miopenHandle_t handle,

                                                       const miopenRNNDescriptor_t rnnDesc,

                                                       const int sequenceLen,

                                                       const miopenTensorDescriptor_t* xDesc,

                                                       const void* x,

                                                       const miopenTensorDescriptor_t hxDesc,

                                                       const void* hx,

                                                       const miopenTensorDescriptor_t cxDesc,

                                                       const void* cx,

                                                       const miopenTensorDescriptor_t wDesc,

                                                       const void* w,

                                                       const miopenTensorDescriptor_t* yDesc,

                                                       void* y,

                                                       const miopenTensorDescriptor_t hyDesc,

                                                       void* hy,

                                                       const miopenTensorDescriptor_t cyDesc,

                                                       void* cy,

                                                       void* workSpace,

                                                       size_t workSpaceNumBytes,

                                                       void* reserveSpace,

                                                       size_t reserveSpaceNumBytes);


 MIOPEN_EXPORT miopenStatus_t miopenRNNBackwardData(miopenHandle_t handle,

                                                    const miopenRNNDescriptor_t rnnDesc,

                                                    const int sequenceLen,

                                                    const miopenTensorDescriptor_t* yDesc,

                                                    const void* y,

                                                    const miopenTensorDescriptor_t* dyDesc,

                                                    const void* dy,

                                                    const miopenTensorDescriptor_t dhyDesc,

                                                    const void* dhy,

                                                    const miopenTensorDescriptor_t dcyDesc,

                                                    const void* dcy,

                                                    const miopenTensorDescriptor_t wDesc,

                                                    const void* w,

                                                    const miopenTensorDescriptor_t hxDesc,

                                                    const void* hx,

                                                    const miopenTensorDescriptor_t cxDesc,

                                                    const void* cx,

                                                    const miopenTensorDescriptor_t* dxDesc,

                                                    void* dx,

                                                    const miopenTensorDescriptor_t dhxDesc,

                                                    void* dhx,

                                                    const miopenTensorDescriptor_t dcxDesc,

                                                    void* dcx,

                                                    void* workSpace,

                                                    size_t workSpaceNumBytes,

                                                    void* reserveSpace,

                                                    size_t reserveSpaceNumBytes);


 MIOPEN_EXPORT miopenStatus_t miopenRNNBackwardWeights(miopenHandle_t handle,

                                                       const miopenRNNDescriptor_t rnnDesc,

                                                       const int sequenceLen,

                                                       const miopenTensorDescriptor_t* xDesc,

                                                       const void* x,

                                                       const miopenTensorDescriptor_t hxDesc,

                                                       const void* hx,

                                                       const miopenTensorDescriptor_t* yDesc,

                                                       const void* y,

                                                       const miopenTensorDescriptor_t dwDesc,

                                                       void* dw,

                                                       void* workSpace,

                                                       size_t workSpaceNumBytes,

                                                       const void* reserveSpace,

                                                       size_t reserveSpaceNumBytes);


 MIOPEN_EXPORT miopenStatus_t miopenRNNForwardInference(miopenHandle_t handle,

                                                        miopenRNNDescriptor_t rnnDesc,

                                                        const int sequenceLen,

                                                        const miopenTensorDescriptor_t* xDesc,

                                                        const void* x,

                                                        const miopenTensorDescriptor_t hxDesc,

                                                        const void* hx,

                                                        const miopenTensorDescriptor_t cxDesc,

                                                        const void* cx,

                                                        const miopenTensorDescriptor_t wDesc,

                                                        const void* w,

                                                        const miopenTensorDescriptor_t* yDesc,

                                                        void* y,

                                                        const miopenTensorDescriptor_t hyDesc,

                                                        void* hy,

                                                        const miopenTensorDescriptor_t cyDesc,

                                                        void* cy,

                                                        void* workSpace,

                                                        size_t workSpaceNumBytes);


 // CLOSEOUT RNN DOXYGEN GROUP


 typedef enum

 {

     MIOPEN_CTC_LOSS_ALGO_DETERMINISTIC = 0,

 } miopenCTCLossAlgo_t;


 MIOPEN_EXPORT miopenStatus_t miopenCreateCTCLossDescriptor(miopenCTCLossDescriptor_t* ctcLossDesc);


 MIOPEN_EXPORT miopenStatus_t miopenGetCTCLossDescriptor(miopenCTCLossDescriptor_t ctcLossDesc,

                                                         miopenDataType_t* dataType,

                                                         int* blank_label_id,

                                                         bool* apply_softmax_layer);


 MIOPEN_EXPORT miopenStatus_t miopenDestroyCTCLossDescriptor(miopenCTCLossDescriptor_t ctcLossDesc);


 MIOPEN_EXPORT miopenStatus_t miopenSetCTCLossDescriptor(miopenCTCLossDescriptor_t ctcLossDesc,

                                                         miopenDataType_t dataType,

                                                         const int blank_label_id,

                                                         bool apply_softmax_layer);


 MIOPEN_EXPORT miopenStatus_t

 miopenGetCTCLossWorkspaceSize(miopenHandle_t handle,

                               const miopenTensorDescriptor_t probsDesc,

                               const miopenTensorDescriptor_t gradientsDesc,

                               const int* labels,

                               const int* labelLengths,

                               const int* inputLengths,

                               miopenCTCLossAlgo_t algo,

                               const miopenCTCLossDescriptor_t ctcLossDesc,

                               size_t* workSpaceSize);


 MIOPEN_EXPORT miopenStatus_t miopenCTCLoss(miopenHandle_t handle,

                                            const miopenTensorDescriptor_t probsDesc,

                                            const void* probs,

                                            const int* labels,

                                            const int* labelLengths,

                                            const int* inputLengths,

                                            void* losses,

                                            const miopenTensorDescriptor_t gradientsDesc,

                                            void* gradients,

                                            miopenCTCLossAlgo_t algo,

                                            const miopenCTCLossDescriptor_t ctcLossDesc,

                                            void* workSpace,

                                            size_t workSpaceSize);


 // CLOSEOUT LossFunction DOXYGEN GROUP


 // Dropout APIs

 typedef enum

 {

     MIOPEN_RNG_PSEUDO_XORWOW = 0,

 } miopenRNGType_t;


 MIOPEN_EXPORT miopenStatus_t miopenCreateDropoutDescriptor(miopenDropoutDescriptor_t* dropoutDesc);


 MIOPEN_EXPORT miopenStatus_t miopenDestroyDropoutDescriptor(miopenDropoutDescriptor_t dropoutDesc);


 MIOPEN_EXPORT miopenStatus_t miopenDropoutGetReserveSpaceSize(const miopenTensorDescriptor_t xDesc,

                                                               size_t* reserveSpaceSizeInBytes);


 MIOPEN_EXPORT miopenStatus_t miopenDropoutGetStatesSize(miopenHandle_t handle,

                                                         size_t* stateSizeInBytes);


 MIOPEN_EXPORT miopenStatus_t miopenGetDropoutDescriptor(miopenDropoutDescriptor_t dropoutDesc,

                                                         miopenHandle_t handle,

                                                         float* dropout,

                                                         void** states,

                                                         unsigned long long* seed,

                                                         bool* use_mask,

                                                         bool* state_evo,

                                                         miopenRNGType_t* rng_mode);


 MIOPEN_EXPORT miopenStatus_t miopenRestoreDropoutDescriptor(miopenDropoutDescriptor_t dropoutDesc,

                                                             miopenHandle_t handle,

                                                             float dropout,

                                                             void* states,

                                                             size_t stateSizeInBytes,

                                                             unsigned long long seed,

                                                             bool use_mask,

                                                             bool state_evo,

                                                             miopenRNGType_t rng_mode);


 MIOPEN_EXPORT miopenStatus_t miopenSetDropoutDescriptor(miopenDropoutDescriptor_t dropoutDesc,

                                                         miopenHandle_t handle,

                                                         float dropout,

                                                         void* states,

                                                         size_t stateSizeInBytes,

                                                         unsigned long long seed,

                                                         bool use_mask,

                                                         bool state_evo,

                                                         miopenRNGType_t rng_mode);


 MIOPEN_EXPORT miopenStatus_t miopenDropoutForward(miopenHandle_t handle,

                                                   const miopenDropoutDescriptor_t dropoutDesc,

                                                   const miopenTensorDescriptor_t noise_shape,

                                                   const miopenTensorDescriptor_t xDesc,

                                                   const void* x,

                                                   const miopenTensorDescriptor_t yDesc,

                                                   void* y,

                                                   void* reserveSpace,

                                                   size_t reserveSpaceSizeInBytes);


 MIOPEN_EXPORT miopenStatus_t miopenDropoutBackward(miopenHandle_t handle,

                                                    const miopenDropoutDescriptor_t dropoutDesc,

                                                    const miopenTensorDescriptor_t noise_shape,

                                                    const miopenTensorDescriptor_t dyDesc,

                                                    const void* dy,

                                                    const miopenTensorDescriptor_t dxDesc,

                                                    void* dx,

                                                    void* reserveSpace,

                                                    size_t reserveSpaceSizeInBytes);


 // CLOSEOUT DROPOUT DOXYGEN GROUP


 // TensorReduce APIs

 MIOPEN_EXPORT miopenStatus_t

 miopenCreateReduceTensorDescriptor(miopenReduceTensorDescriptor_t* reduceTensorDesc);


 MIOPEN_EXPORT miopenStatus_t

 miopenDestroyReduceTensorDescriptor(miopenReduceTensorDescriptor_t reduceTensorDesc);


 MIOPEN_EXPORT miopenStatus_t

 miopenSetReduceTensorDescriptor(miopenReduceTensorDescriptor_t reduceTensorDesc,

                                 miopenReduceTensorOp_t reduceTensorOp,

                                 miopenDataType_t reduceTensorCompType,

                                 miopenNanPropagation_t reduceTensorNanOpt,

                                 miopenReduceTensorIndices_t reduceTensorIndices,

                                 miopenIndicesType_t reduceTensorIndicesType);


 MIOPEN_EXPORT miopenStatus_t

 miopenGetReduceTensorDescriptor(const miopenReduceTensorDescriptor_t reduceTensorDesc,

                                 miopenReduceTensorOp_t* reduceTensorOp,

                                 miopenDataType_t* reduceTensorCompType,

                                 miopenNanPropagation_t* reduceTensorNanOpt,

                                 miopenReduceTensorIndices_t* reduceTensorIndices,

                                 miopenIndicesType_t* reduceTensorIndicesType);


 MIOPEN_EXPORT miopenStatus_t

 miopenGetReductionIndicesSize(miopenHandle_t handle,

                               const miopenReduceTensorDescriptor_t reduceTensorDesc,

                               const miopenTensorDescriptor_t aDesc,

                               const miopenTensorDescriptor_t cDesc,

                               size_t* sizeInBytes);


 MIOPEN_EXPORT miopenStatus_t

 miopenGetReductionWorkspaceSize(miopenHandle_t handle,

                                 const miopenReduceTensorDescriptor_t reduceTensorDesc,

                                 const miopenTensorDescriptor_t aDesc,

                                 const miopenTensorDescriptor_t cDesc,

                                 size_t* sizeInBytes);


 MIOPEN_EXPORT miopenStatus_t

 miopenReduceTensor(miopenHandle_t handle,

                    const miopenReduceTensorDescriptor_t reduceTensorDesc,

                    void* indices,

                    size_t indicesSizeInBytes,

                    void* workspace,

                    size_t workspaceSizeInBytes,

                    const void* alpha,

                    const miopenTensorDescriptor_t aDesc,

                    const void* A,

                    const void* beta,

                    const miopenTensorDescriptor_t cDesc,

                    void* C);


 // CLOSEOUT TensorReduce DOXYGEN GROUP


 // Find 2.0 API

 MIOPEN_DECLARE_OBJECT(miopenProblem);


 typedef enum

 {

     miopenProblemDirectionForward         = 0,

     miopenProblemDirectionBackward        = 1,

     miopenProblemDirectionBackwardWeights = 2,

 #ifdef MIOPEN_BETA_API

     miopenProblemDirectionInference = 4,

 #endif

 } miopenProblemDirection_t;


 typedef enum

 {

     miopenTensorArgumentIdInvalid = 0,

     miopenTensorConvolutionX      = 1,

     miopenTensorConvolutionW      = 2,

     miopenTensorConvolutionY      = 3,


     miopenTensorMhaK                  = 4,

     miopenTensorMhaQ                  = 5,

     miopenTensorMhaV                  = 6,

     miopenTensorMhaDescaleK           = 7,

     miopenTensorMhaDescaleQ           = 8,

     miopenTensorMhaDescaleV           = 9,

     miopenTensorMhaDescaleS           = 10,

     miopenTensorMhaScaleS             = 11,

     miopenTensorMhaScaleO             = 12,

     miopenTensorMhaDropoutProbability = 13,

     miopenTensorMhaDropoutSeed        = 14,

     miopenTensorMhaDropoutOffset      = 15,

     miopenTensorMhaO                  = 16,

     miopenTensorMhaAmaxO              = 17,

     miopenTensorMhaAmaxS              = 18,

     miopenTensorMhaM                  = 19,

     miopenTensorMhaZInv               = 20,

     miopenTensorMhaDO                 = 21,

     miopenTensorMhaDescaleO           = 22,

     miopenTensorMhaDescaleDO          = 23,

     miopenTensorMhaDescaleDS          = 24,

     miopenTensorMhaScaleDS            = 25,

     miopenTensorMhaScaleDQ            = 26,

     miopenTensorMhaScaleDK            = 27,

     miopenTensorMhaScaleDV            = 28,

     miopenTensorMhaDQ                 = 29,

     miopenTensorMhaDK                 = 30,

     miopenTensorMhaDV                 = 31,

     miopenTensorMhaAmaxDQ             = 32,

     miopenTensorMhaAmaxDK             = 33,

     miopenTensorMhaAmaxDV             = 34,

     miopenTensorMhaAmaxDS             = 35,

     miopenTensorMhaBias               = 36,


 #ifdef MIOPEN_BETA_API

     miopenTensorActivationX                = 37,

     miopenTensorActivationY                = 38,

     miopenTensorActivationDX               = 39,

     miopenTensorActivationDY               = 40,

     miopenTensorBiasX                      = 41,

     miopenTensorBiasY                      = 42,

     miopenTensorBias                       = 43,

     miopenTensorSoftmaxX                   = 44,

     miopenTensorSoftmaxY                   = 45,

     miopenTensorSoftmaxDX                  = 46,

     miopenTensorSoftmaxDY                  = 47,

     miopenTensorBatchnormX                 = 48,

     miopenTensorBatchnormY                 = 49,

     miopenTensorBatchnormRunningMean       = 50,

     miopenTensorBatchnormRunningVariance   = 51,

     miopenTensorBatchnormSavedMean         = 52,

     miopenTensorBatchnormSavedVariance     = 53,

     miopenTensorBatchnormScale             = 54,

     miopenTensorBatchnormScaleDiff         = 55,

     miopenTensorBatchnormEstimatedMean     = 56,

     miopenTensorBatchnormEstimatedVariance = 57,

     miopenTensorBatchnormBias              = 58,

     miopenTensorBatchnormBiasDiff          = 59,

     miopenTensorBatchnormDX                = 60,

     miopenTensorBatchnormDY                = 61,

 #endif


     miopenTensorArgumentIsScalar = 1U << 31,


     miopenTensorMhaMask = miopenTensorArgumentIsScalar | 1,

 #ifdef MIOPEN_BETA_API

     miopenScalarBatchnormExpAvgFactor = miopenTensorArgumentIsScalar | 2,

     miopenScalarBatchnormEpsilon      = miopenTensorArgumentIsScalar | 3,

 #endif

 } miopenTensorArgumentId_t;


 typedef enum

 {

     miopenFindResultsOrderByTime          = 0,

     miopenFindResultsOrderByWorkspaceSize = 1,

 } miopenFindResultsOrder_t;


 MIOPEN_EXPORT miopenStatus_t miopenCreateConvProblem(miopenProblem_t* problem,

                                                      miopenConvolutionDescriptor_t operatorDesc,

                                                      miopenProblemDirection_t direction);


 typedef enum

 {

     miopenMhaMaskNone   = 0,

     miopenMhaMaskCausal = 1,

 } miopenMhaMask_t;


 MIOPEN_EXPORT miopenStatus_t miopenCreateMhaProblem(miopenProblem_t* problem,

                                                     miopenMhaDescriptor_t operatorDesc,

                                                     miopenProblemDirection_t direction);


 MIOPEN_EXPORT miopenStatus_t miopenCreateMhaDescriptor(miopenMhaDescriptor_t* mhaDesc);


 MIOPEN_EXPORT miopenStatus_t miopenSetMhaDescriptor(miopenMhaDescriptor_t mhaDesc, float scale);


 MIOPEN_EXPORT miopenStatus_t miopenGetMhaDescriptor(miopenMhaDescriptor_t mhaDesc, float* scale);


 MIOPEN_EXPORT miopenStatus_t miopenCreateSoftmaxDescriptor(miopenSoftmaxDescriptor_t* softmaxDesc);


 MIOPEN_EXPORT miopenStatus_t miopenSetSoftmaxDescriptor(miopenSoftmaxDescriptor_t softmaxDesc,

                                                         float alpha,

                                                         float beta,

                                                         miopenSoftmaxAlgorithm_t algorithm,

                                                         miopenSoftmaxMode_t mode);


 MIOPEN_EXPORT miopenStatus_t miopenGetSoftmaxDescriptor(const miopenSoftmaxDescriptor_t softmaxDesc,

                                                         float* alpha,

                                                         float* beta,

                                                         miopenSoftmaxAlgorithm_t* algorithm,

                                                         miopenSoftmaxMode_t* mode);


 MIOPEN_EXPORT miopenStatus_t miopenDestroyProblem(miopenProblem_t problem);


 MIOPEN_EXPORT miopenStatus_t

 miopenSetProblemTensorDescriptor(miopenProblem_t problem,

                                  miopenTensorArgumentId_t id,

                                  const miopenTensorDescriptor_t descriptor);


 MIOPEN_DECLARE_OBJECT(miopenFindOptions);


 MIOPEN_EXPORT miopenStatus_t miopenCreateFindOptions(miopenFindOptions_t* options);


 MIOPEN_EXPORT miopenStatus_t miopenDestroyFindOptions(miopenFindOptions_t options);


 MIOPEN_EXPORT miopenStatus_t miopenSetFindOptionTuning(miopenFindOptions_t options, int value);


 MIOPEN_EXPORT miopenStatus_t miopenSetFindOptionResultsOrder(miopenFindOptions_t options,

                                                              miopenFindResultsOrder_t value);


 MIOPEN_EXPORT miopenStatus_t miopenSetFindOptionWorkspaceLimit(miopenFindOptions_t options,

                                                                size_t value);


 MIOPEN_EXPORT miopenStatus_t miopenSetFindOptionPreallocatedWorkspace(miopenFindOptions_t options,

                                                                       void* buffer,

                                                                       size_t size);


 MIOPEN_EXPORT miopenStatus_t miopenSetFindOptionPreallocatedTensor(miopenFindOptions_t options,

                                                                    miopenTensorArgumentId_t id,

                                                                    void* buffer);


 MIOPEN_EXPORT miopenStatus_t miopenSetFindOptionAttachBinaries(miopenFindOptions_t options,

                                                                unsigned attach);


 MIOPEN_DECLARE_OBJECT(miopenSolution);


 MIOPEN_EXPORT miopenStatus_t miopenFindSolutions(miopenHandle_t handle,

                                                  miopenProblem_t problem,

                                                  miopenFindOptions_t options,

                                                  miopenSolution_t* solutions,

                                                  size_t* numSolutions,

                                                  size_t maxSolutions);


 struct miopenTensorArgument_t

 {

     /* @brief Identifier of the tensor argument.

      */

     miopenTensorArgumentId_t id;

     /* @brief Tensor descriptor to override the value stored in the solution.

      *

      * Some solvers may support overriding input and output tensor descriptors, but right now there

      * is no way to tell from the API. Intended for the future use.

      */

     miopenTensorDescriptor_t* descriptor;

     /* @brief Pointer to the device memory buffer to use for the operation or to the host memory if

      * the value is scalar.

      */

     void* buffer;

 };


 MIOPEN_EXPORT miopenStatus_t miopenRunSolution(miopenHandle_t handle,

                                                miopenSolution_t solution,

                                                size_t nInputs,

                                                const miopenTensorArgument_t* tensors,

                                                void* workspace,

                                                size_t workspaceSize);


 MIOPEN_EXPORT miopenStatus_t miopenDestroySolution(miopenSolution_t solution);


 MIOPEN_EXPORT miopenStatus_t miopenLoadSolution(miopenSolution_t* solution,

                                                 const char* data,

                                                 size_t size);


 MIOPEN_EXPORT miopenStatus_t miopenSaveSolution(miopenSolution_t solution, char* data);


 MIOPEN_EXPORT miopenStatus_t miopenGetSolutionSize(miopenSolution_t solution, size_t* size);


 MIOPEN_EXPORT miopenStatus_t miopenGetSolutionWorkspaceSize(miopenSolution_t solution,

                                                             size_t* workspaceSize);


 MIOPEN_EXPORT miopenStatus_t miopenGetSolutionTime(miopenSolution_t solution, float* time);


 MIOPEN_EXPORT miopenStatus_t miopenGetSolutionSolverId(miopenSolution_t solution,

                                                        uint64_t* solverId);


 MIOPEN_EXPORT miopenStatus_t miopenGetSolverIdConvAlgorithm(uint64_t solverId,

                                                             miopenConvAlgorithm_t* result);


 #ifdef MIOPEN_BETA_API


 MIOPEN_EXPORT miopenStatus_t

 miopenCreateActivationProblem(miopenProblem_t* problem,

                               miopenActivationDescriptor_t operatorDesc,

                               miopenProblemDirection_t direction);


 MIOPEN_EXPORT miopenStatus_t miopenCreateBatchnormProblem(miopenProblem_t* problem,

                                                           miopenBatchNormMode_t mode,

                                                           bool runningMeanVariance,

                                                           miopenProblemDirection_t direction);


 MIOPEN_EXPORT miopenStatus_t miopenFuseProblems(miopenProblem_t problem1, miopenProblem_t problem2);


 MIOPEN_EXPORT miopenStatus_t miopenCreateBiasProblem(miopenProblem_t* problem,

                                                      miopenProblemDirection_t direction);


 MIOPEN_EXPORT miopenStatus_t miopenCreateSoftmaxProblem(miopenProblem_t* problem,

                                                         miopenSoftmaxDescriptor_t operatorDesc,

                                                         miopenProblemDirection_t direction);


 #endif


 // CLOSEOUT find2 DOXYGEN GROUP


 #ifdef MIOPEN_BETA_API


 typedef enum

 {

     MIOPEN_REDUCE_CALCULATION_NOT_PROPAGATE_NAN = 0,

     MIOPEN_REDUCE_CALCULATION_PROPAGATE_NAN =

         1,

 } miopenReduceCalculationNanPropagation_t;


 // ReduceCalculation APIs

 typedef enum

 {

     MIOPEN_REDUCE_CALCULATION_PROD =

         1,

     MIOPEN_REDUCE_CALCULATION_SUM =

         2,

 } miopenReduceCalculationOp_t;


 MIOPEN_EXPORT miopenStatus_t

 miopenGetReduceCalculationWorkspaceSize(miopenHandle_t handle,

                                         const miopenTensorDescriptor_t xDesc,

                                         const int32_t dim,

                                         const miopenReduceCalculationOp_t reduceCalculationOp,

                                         const miopenTensorDescriptor_t reduceDesc,

                                         size_t* sizeInBytes);


 MIOPEN_EXPORT miopenStatus_t

 miopenReduceCalculationForward(miopenHandle_t handle,

                                miopenReduceCalculationNanPropagation_t nanPropagation,

                                void* workspace,

                                size_t workspaceSizeInBytes,

                                const miopenTensorDescriptor_t xDesc,

                                const void* x,

                                const int32_t dim,

                                const miopenReduceCalculationOp_t reduceCalculationOp,

                                const miopenTensorDescriptor_t reduceDesc,

                                void* y);


 // CLOSEOUT REDUCE CALCULATION DOXYGEN GROUP

 #endif // MIOPEN_BETA_API


 #ifdef MIOPEN_BETA_API


 typedef enum

 {

     MIOPEN_REDUCE_EXTREME_ARGMIN =

         1,

     MIOPEN_REDUCE_EXTREME_ARGMAX =

         2,

     MIOPEN_REDUCE_EXTREME_MIN =

         3,

     MIOPEN_REDUCE_EXTREME_MAX =

         4,

 } miopenReduceExtremeOp_t;


 // ReduceExtreme APIs

 MIOPEN_EXPORT miopenStatus_t

 miopenReduceExtremeForward(miopenHandle_t handle,

                            const miopenTensorDescriptor_t xDesc,

                            const void* x,

                            const int32_t dim,

                            const miopenReduceExtremeOp_t reduceExtremeOp,

                            const miopenTensorDescriptor_t yDesc,

                            void* y,

                            const miopenTensorDescriptor_t indiceDesc,

                            void* indice);


 // CLOSEOUT REDUCEEXTREME DOXYGEN GROUP

 #endif // MIOPEN_BETA_API


 #ifdef MIOPEN_BETA_API

 // GroupNorm APIs

 MIOPEN_EXPORT miopenStatus_t miopenGroupNormForward(miopenHandle_t handle,

                                                     miopenNormMode_t mode,

                                                     const miopenTensorDescriptor_t xDesc,

                                                     const void* x,

                                                     const miopenTensorDescriptor_t weightDesc,

                                                     const void* weight,

                                                     const miopenTensorDescriptor_t biasDesc,

                                                     const void* bias,

                                                     const uint64_t num_groups,

                                                     const float epsilon,

                                                     const miopenTensorDescriptor_t yDesc,

                                                     void* y,

                                                     const miopenTensorDescriptor_t meanDesc,

                                                     void* mean,

                                                     const miopenTensorDescriptor_t rstdDesc,

                                                     void* rstd);


 // CLOSEOUT groupnorm DOXYGEN GROUP

 #endif // MIOPEN_BETA_API


 #ifdef MIOPEN_BETA_API

 // LayerNorm APIs

 MIOPEN_EXPORT miopenStatus_t miopenAddLayerNormForward(miopenHandle_t handle,

                                                        miopenNormMode_t mode,

                                                        const miopenTensorDescriptor_t xDesc,

                                                        const void* x,

                                                        const miopenTensorDescriptor_t x2Desc,

                                                        const void* x2,

                                                        const miopenTensorDescriptor_t weightDesc,

                                                        const void* weight,

                                                        const miopenTensorDescriptor_t biasDesc,

                                                        const void* bias,

                                                        const float epsilon,

                                                        const int32_t normalized_dim,

                                                        const miopenTensorDescriptor_t yDesc,

                                                        void* y,

                                                        const miopenTensorDescriptor_t meanDesc,

                                                        void* mean,

                                                        const miopenTensorDescriptor_t rstdDesc,

                                                        void* rstd);


 // CLOSEOUT LAYERNORM DOXYGEN GROUP

 #endif // MIOPEN_BETA_API


 #ifdef MIOPEN_BETA_API

 // LayerNorm APIs

 MIOPEN_EXPORT miopenStatus_t miopenT5LayerNormForward(miopenHandle_t handle,

                                                       miopenNormMode_t mode,

                                                       const miopenTensorDescriptor_t xDesc,

                                                       const void* x,

                                                       const miopenTensorDescriptor_t weightDesc,

                                                       const void* weight,

                                                       const float epsilon,

                                                       const miopenTensorDescriptor_t yDesc,

                                                       void* y,

                                                       const miopenTensorDescriptor_t rstdDesc,

                                                       void* rstd);


 MIOPEN_EXPORT miopenStatus_t

 miopenGetT5LayerNormBackwardWorkspaceSize(miopenHandle_t handle,

                                           miopenNormMode_t mode,

                                           const miopenTensorDescriptor_t dyDesc,

                                           const miopenTensorDescriptor_t xDesc,

                                           const miopenTensorDescriptor_t weightDesc,

                                           const miopenTensorDescriptor_t rstdDesc,

                                           const miopenTensorDescriptor_t dxDesc,

                                           const miopenTensorDescriptor_t dwDesc,

                                           size_t* sizeInBytes);


 MIOPEN_EXPORT miopenStatus_t miopenT5LayerNormBackward(miopenHandle_t handle,

                                                        miopenNormMode_t mode,

                                                        void* workspace,

                                                        size_t workspaceSizeInBytes,

                                                        const miopenTensorDescriptor_t dyDesc,

                                                        const void* dy,

                                                        const miopenTensorDescriptor_t xDesc,

                                                        const void* x,

                                                        const miopenTensorDescriptor_t weightDesc,

                                                        const void* weight,

                                                        const miopenTensorDescriptor_t rstdDesc,

                                                        const void* rstd,

                                                        const miopenTensorDescriptor_t dxDesc,

                                                        void* dx,

                                                        const miopenTensorDescriptor_t dwDesc,

                                                        void* dw);

 // CLOSEOUT LAYERNORM DOXYGEN GROUP

 #endif // MIOPEN_BETA_API


 #ifdef MIOPEN_BETA_API

 // Graph API

 typedef enum

 {

     MIOPEN_BACKEND_CONVOLUTION_DESCRIPTOR,

     MIOPEN_BACKEND_ENGINE_DESCRIPTOR,

     MIOPEN_BACKEND_ENGINECFG_DESCRIPTOR,

     MIOPEN_BACKEND_ENGINEHEUR_DESCRIPTOR,

     MIOPEN_BACKEND_EXECUTION_PLAN_DESCRIPTOR,

     MIOPEN_BACKEND_INTERMEDIATE_INFO_DESCRIPTOR,

     MIOPEN_BACKEND_KNOB_CHOICE_DESCRIPTOR,

     MIOPEN_BACKEND_KNOB_INFO_DESCRIPTOR,

     MIOPEN_BACKEND_LAYOUT_INFO_DESCRIPTOR,

     MIOPEN_BACKEND_MATMUL_DESCRIPTOR,

     MIOPEN_BACKEND_OPERATION_CONCAT_DESCRIPTOR,

     MIOPEN_BACKEND_OPERATION_CONVOLUTION_BACKWARD_DATA_DESCRIPTOR,

     MIOPEN_BACKEND_OPERATION_CONVOLUTION_BACKWARD_FILTER_DESCRIPTOR,

     MIOPEN_BACKEND_OPERATION_CONVOLUTION_FORWARD_DESCRIPTOR,

     MIOPEN_BACKEND_OPERATION_GEN_STATS_DESCRIPTOR,

     MIOPEN_BACKEND_OPERATION_MATMUL_DESCRIPTOR,

     MIOPEN_BACKEND_OPERATION_NORM_BACKWARD_DESCRIPTOR,

     MIOPEN_BACKEND_OPERATION_NORM_FORWARD_DESCRIPTOR,

     MIOPEN_BACKEND_OPERATION_POINTWISE_DESCRIPTOR,

     MIOPEN_BACKEND_OPERATION_REDUCTION_DESCRIPTOR,

     MIOPEN_BACKEND_OPERATION_RESAMPLE_BWD_DESCRIPTOR,

     MIOPEN_BACKEND_OPERATION_RESAMPLE_FWD_DESCRIPTOR,

     MIOPEN_BACKEND_OPERATION_RESHAPE_DESCRIPTOR,

     MIOPEN_BACKEND_OPERATION_RNG_DESCRIPTOR,

     MIOPEN_BACKEND_OPERATION_SIGNAL_DESCRIPTOR,

     MIOPEN_BACKEND_OPERATIONGRAPH_DESCRIPTOR,

     MIOPEN_BACKEND_POINTWISE_DESCRIPTOR,

     MIOPEN_BACKEND_REDUCTION_DESCRIPTOR,

     MIOPEN_BACKEND_RESAMPLE_DESCRIPTOR,

     MIOPEN_BACKEND_RNG_DESCRIPTOR,

     MIOPEN_BACKEND_TENSOR_DESCRIPTOR,

     MIOPEN_BACKEND_VARIANT_PACK_DESCRIPTOR,

 } miopenBackendDescriptorType_t;


 typedef enum

 {

     MIOPEN_ATTR_POINTWISE_MODE                  = 0,

     MIOPEN_ATTR_POINTWISE_MATH_PREC             = 1,

     MIOPEN_ATTR_POINTWISE_NAN_PROPAGATION       = 2,

     MIOPEN_ATTR_POINTWISE_RELU_LOWER_CLIP       = 3,

     MIOPEN_ATTR_POINTWISE_RELU_UPPER_CLIP       = 4,

     MIOPEN_ATTR_POINTWISE_RELU_LOWER_CLIP_SLOPE = 5,

     MIOPEN_ATTR_POINTWISE_ELU_ALPHA             = 6,

     MIOPEN_ATTR_POINTWISE_SOFTPLUS_BETA         = 7,

     MIOPEN_ATTR_POINTWISE_SWISH_BETA            = 8,

     MIOPEN_ATTR_POINTWISE_AXIS                  = 9,


     MIOPEN_ATTR_CONVOLUTION_COMP_TYPE      = 100,

     MIOPEN_ATTR_CONVOLUTION_CONV_MODE      = 101,

     MIOPEN_ATTR_CONVOLUTION_DILATIONS      = 102,

     MIOPEN_ATTR_CONVOLUTION_FILTER_STRIDES = 103,

     MIOPEN_ATTR_CONVOLUTION_POST_PADDINGS  = 104,

     MIOPEN_ATTR_CONVOLUTION_PRE_PADDINGS   = 105,

     MIOPEN_ATTR_CONVOLUTION_SPATIAL_DIMS   = 106,


     MIOPEN_ATTR_ENGINEHEUR_MODE            = 200,

     MIOPEN_ATTR_ENGINEHEUR_OPERATION_GRAPH = 201,

     MIOPEN_ATTR_ENGINEHEUR_RESULTS         = 202,

     MIOPEN_ATTR_ENGINEHEUR_SM_COUNT_TARGET = 203,


     MIOPEN_ATTR_ENGINECFG_ENGINE            = 300,

     MIOPEN_ATTR_ENGINECFG_INTERMEDIATE_INFO = 301,

     MIOPEN_ATTR_ENGINECFG_KNOB_CHOICES      = 302,


     MIOPEN_ATTR_EXECUTION_PLAN_HANDLE                     = 400,

     MIOPEN_ATTR_EXECUTION_PLAN_ENGINE_CONFIG              = 401,

     MIOPEN_ATTR_EXECUTION_PLAN_WORKSPACE_SIZE             = 402,

     MIOPEN_ATTR_EXECUTION_PLAN_COMPUTED_INTERMEDIATE_UIDS = 403,

     MIOPEN_ATTR_EXECUTION_PLAN_RUN_ONLY_INTERMEDIATE_UIDS = 404,

     MIOPEN_ATTR_EXECUTION_PLAN_JSON_REPRESENTATION        = 405,


     MIOPEN_ATTR_INTERMEDIATE_INFO_UNIQUE_ID            = 500,

     MIOPEN_ATTR_INTERMEDIATE_INFO_SIZE                 = 501,

     MIOPEN_ATTR_INTERMEDIATE_INFO_DEPENDENT_DATA_UIDS  = 502,

     MIOPEN_ATTR_INTERMEDIATE_INFO_DEPENDENT_ATTRIBUTES = 503,


     MIOPEN_ATTR_KNOB_CHOICE_KNOB_TYPE  = 600,

     MIOPEN_ATTR_KNOB_CHOICE_KNOB_VALUE = 601,


     MIOPEN_ATTR_OPERATION_CONVOLUTION_FORWARD_ALPHA        = 700,

     MIOPEN_ATTR_OPERATION_CONVOLUTION_FORWARD_BETA         = 701,

     MIOPEN_ATTR_OPERATION_CONVOLUTION_FORWARD_CONV_DESC    = 702,

     MIOPEN_ATTR_OPERATION_CONVOLUTION_FORWARD_W            = 703,

     MIOPEN_ATTR_OPERATION_CONVOLUTION_FORWARD_X            = 704,

     MIOPEN_ATTR_OPERATION_CONVOLUTION_FORWARD_Y            = 705,

     MIOPEN_ATTR_OPERATION_CONVOLUTION_BWD_DATA_ALPHA       = 706,

     MIOPEN_ATTR_OPERATION_CONVOLUTION_BWD_DATA_BETA        = 707,

     MIOPEN_ATTR_OPERATION_CONVOLUTION_BWD_DATA_CONV_DESC   = 708,

     MIOPEN_ATTR_OPERATION_CONVOLUTION_BWD_DATA_W           = 709,

     MIOPEN_ATTR_OPERATION_CONVOLUTION_BWD_DATA_DX          = 710,

     MIOPEN_ATTR_OPERATION_CONVOLUTION_BWD_DATA_DY          = 711,

     MIOPEN_ATTR_OPERATION_CONVOLUTION_BWD_FILTER_ALPHA     = 712,

     MIOPEN_ATTR_OPERATION_CONVOLUTION_BWD_FILTER_BETA      = 713,

     MIOPEN_ATTR_OPERATION_CONVOLUTION_BWD_FILTER_CONV_DESC = 714,

     MIOPEN_ATTR_OPERATION_CONVOLUTION_BWD_FILTER_DW        = 715,

     MIOPEN_ATTR_OPERATION_CONVOLUTION_BWD_FILTER_X         = 716,

     MIOPEN_ATTR_OPERATION_CONVOLUTION_BWD_FILTER_DY        = 717,

     MIOPEN_ATTR_OPERATION_POINTWISE_PW_DESCRIPTOR          = 750,

     MIOPEN_ATTR_OPERATION_POINTWISE_XDESC                  = 751,

     MIOPEN_ATTR_OPERATION_POINTWISE_BDESC                  = 752,

     MIOPEN_ATTR_OPERATION_POINTWISE_YDESC                  = 753,

     MIOPEN_ATTR_OPERATION_POINTWISE_ALPHA1                 = 754,

     MIOPEN_ATTR_OPERATION_POINTWISE_ALPHA2                 = 755,

     MIOPEN_ATTR_OPERATION_POINTWISE_DXDESC                 = 756,

     MIOPEN_ATTR_OPERATION_POINTWISE_DYDESC                 = 757,

     MIOPEN_ATTR_OPERATION_POINTWISE_TDESC                  = 758,


     MIOPEN_ATTR_OPERATION_GENSTATS_MODE      = 770,

     MIOPEN_ATTR_OPERATION_GENSTATS_MATH_PREC = 771,

     MIOPEN_ATTR_OPERATION_GENSTATS_XDESC     = 772,

     MIOPEN_ATTR_OPERATION_GENSTATS_SUMDESC   = 773,

     MIOPEN_ATTR_OPERATION_GENSTATS_SQSUMDESC = 774,


     MIOPEN_ATTR_OPERATION_BN_FINALIZE_STATS_MODE                = 780,

     MIOPEN_ATTR_OPERATION_BN_FINALIZE_MATH_PREC                 = 781,

     MIOPEN_ATTR_OPERATION_BN_FINALIZE_Y_SUM_DESC                = 782,

     MIOPEN_ATTR_OPERATION_BN_FINALIZE_Y_SQ_SUM_DESC             = 783,

     MIOPEN_ATTR_OPERATION_BN_FINALIZE_SCALE_DESC                = 784,

     MIOPEN_ATTR_OPERATION_BN_FINALIZE_BIAS_DESC                 = 785,

     MIOPEN_ATTR_OPERATION_BN_FINALIZE_PREV_RUNNING_MEAN_DESC    = 786,

     MIOPEN_ATTR_OPERATION_BN_FINALIZE_PREV_RUNNING_VAR_DESC     = 787,

     MIOPEN_ATTR_OPERATION_BN_FINALIZE_UPDATED_RUNNING_MEAN_DESC = 788,

     MIOPEN_ATTR_OPERATION_BN_FINALIZE_UPDATED_RUNNING_VAR_DESC  = 789,

     MIOPEN_ATTR_OPERATION_BN_FINALIZE_SAVED_MEAN_DESC           = 790,

     MIOPEN_ATTR_OPERATION_BN_FINALIZE_SAVED_INV_STD_DESC        = 791,

     MIOPEN_ATTR_OPERATION_BN_FINALIZE_EQ_SCALE_DESC             = 792,

     MIOPEN_ATTR_OPERATION_BN_FINALIZE_EQ_BIAS_DESC              = 793,

     MIOPEN_ATTR_OPERATION_BN_FINALIZE_ACCUM_COUNT_DESC          = 794,

     MIOPEN_ATTR_OPERATION_BN_FINALIZE_EPSILON_DESC              = 795,

     MIOPEN_ATTR_OPERATION_BN_FINALIZE_EXP_AVERATE_FACTOR_DESC   = 796,


     MIOPEN_ATTR_OPERATIONGRAPH_HANDLE              = 800,

     MIOPEN_ATTR_OPERATIONGRAPH_OPS                 = 801,

     MIOPEN_ATTR_OPERATIONGRAPH_ENGINE_GLOBAL_COUNT = 802,


     MIOPEN_ATTR_TENSOR_BYTE_ALIGNMENT       = 900,

     MIOPEN_ATTR_TENSOR_DATA_TYPE            = 901,

     MIOPEN_ATTR_TENSOR_DIMENSIONS           = 902,

     MIOPEN_ATTR_TENSOR_STRIDES              = 903,

     MIOPEN_ATTR_TENSOR_VECTOR_COUNT         = 904,

     MIOPEN_ATTR_TENSOR_VECTORIZED_DIMENSION = 905,

     MIOPEN_ATTR_TENSOR_UNIQUE_ID            = 906,

     MIOPEN_ATTR_TENSOR_IS_VIRTUAL           = 907,

     MIOPEN_ATTR_TENSOR_IS_BY_VALUE          = 908,

     MIOPEN_ATTR_TENSOR_REORDERING_MODE      = 909,

     MIOPEN_ATTR_TENSOR_RAGGED_OFFSET_DESC   = 910,


     MIOPEN_ATTR_VARIANT_PACK_UNIQUE_IDS    = 1000,

     MIOPEN_ATTR_VARIANT_PACK_DATA_POINTERS = 1001,

     MIOPEN_ATTR_VARIANT_PACK_INTERMEDIATES = 1002,

     MIOPEN_ATTR_VARIANT_PACK_WORKSPACE     = 1003,


     MIOPEN_ATTR_LAYOUT_INFO_TENSOR_UID = 1100,

     MIOPEN_ATTR_LAYOUT_INFO_TYPES      = 1101,


     MIOPEN_ATTR_KNOB_INFO_TYPE          = 1200,

     MIOPEN_ATTR_KNOB_INFO_MAXIMUM_VALUE = 1201,

     MIOPEN_ATTR_KNOB_INFO_MINIMUM_VALUE = 1202,

     MIOPEN_ATTR_KNOB_INFO_STRIDE        = 1203,


     MIOPEN_ATTR_ENGINE_OPERATION_GRAPH = 1300,

     MIOPEN_ATTR_ENGINE_GLOBAL_INDEX    = 1301,

     MIOPEN_ATTR_ENGINE_KNOB_INFO       = 1302,

     MIOPEN_ATTR_ENGINE_NUMERICAL_NOTE  = 1303,

     MIOPEN_ATTR_ENGINE_LAYOUT_INFO     = 1304,

     MIOPEN_ATTR_ENGINE_BEHAVIOR_NOTE   = 1305,

     MIOPEN_ATTR_ENGINE_SM_COUNT_TARGET = 1306,


     MIOPEN_ATTR_MATMUL_COMP_TYPE     = 1500,

     MIOPEN_ATTR_MATMUL_PADDING_VALUE = 1501,


     MIOPEN_ATTR_OPERATION_MATMUL_ADESC                           = 1520,

     MIOPEN_ATTR_OPERATION_MATMUL_BDESC                           = 1521,

     MIOPEN_ATTR_OPERATION_MATMUL_CDESC                           = 1522,

     MIOPEN_ATTR_OPERATION_MATMUL_DESC                            = 1523,

     MIOPEN_ATTR_OPERATION_MATMUL_IRREGULARLY_STRIDED_BATCH_COUNT = 1524,

     MIOPEN_ATTR_OPERATION_MATMUL_GEMM_M_OVERRIDE_DESC            = 1525,

     MIOPEN_ATTR_OPERATION_MATMUL_GEMM_N_OVERRIDE_DESC            = 1526,

     MIOPEN_ATTR_OPERATION_MATMUL_GEMM_K_OVERRIDE_DESC            = 1527,


     MIOPEN_ATTR_REDUCTION_OPERATOR  = 1600,

     MIOPEN_ATTR_REDUCTION_COMP_TYPE = 1601,


     MIOPEN_ATTR_OPERATION_REDUCTION_XDESC = 1610,

     MIOPEN_ATTR_OPERATION_REDUCTION_YDESC = 1611,

     MIOPEN_ATTR_OPERATION_REDUCTION_DESC  = 1612,


     MIOPEN_ATTR_OPERATION_BN_BWD_WEIGHTS_MATH_PREC        = 1620,

     MIOPEN_ATTR_OPERATION_BN_BWD_WEIGHTS_MEAN_DESC        = 1621,

     MIOPEN_ATTR_OPERATION_BN_BWD_WEIGHTS_INVSTD_DESC      = 1622,

     MIOPEN_ATTR_OPERATION_BN_BWD_WEIGHTS_BN_SCALE_DESC    = 1623,

     MIOPEN_ATTR_OPERATION_BN_BWD_WEIGHTS_X_DESC           = 1624,

     MIOPEN_ATTR_OPERATION_BN_BWD_WEIGHTS_DY_DESC          = 1625,

     MIOPEN_ATTR_OPERATION_BN_BWD_WEIGHTS_DBN_SCALE_DESC   = 1626,

     MIOPEN_ATTR_OPERATION_BN_BWD_WEIGHTS_DBN_BIAS_DESC    = 1627,

     MIOPEN_ATTR_OPERATION_BN_BWD_WEIGHTS_EQ_DY_SCALE_DESC = 1628,

     MIOPEN_ATTR_OPERATION_BN_BWD_WEIGHTS_EQ_X_SCALE_DESC  = 1629,

     MIOPEN_ATTR_OPERATION_BN_BWD_WEIGHTS_EQ_BIAS          = 1630,


     MIOPEN_ATTR_RESAMPLE_MODE            = 1700,

     MIOPEN_ATTR_RESAMPLE_COMP_TYPE       = 1701,

     MIOPEN_ATTR_RESAMPLE_SPATIAL_DIMS    = 1702,

     MIOPEN_ATTR_RESAMPLE_POST_PADDINGS   = 1703,

     MIOPEN_ATTR_RESAMPLE_PRE_PADDINGS    = 1704,

     MIOPEN_ATTR_RESAMPLE_STRIDES         = 1705,

     MIOPEN_ATTR_RESAMPLE_WINDOW_DIMS     = 1706,

     MIOPEN_ATTR_RESAMPLE_NAN_PROPAGATION = 1707,

     MIOPEN_ATTR_RESAMPLE_PADDING_MODE    = 1708,


     MIOPEN_ATTR_OPERATION_RESAMPLE_FWD_XDESC   = 1710,

     MIOPEN_ATTR_OPERATION_RESAMPLE_FWD_YDESC   = 1711,

     MIOPEN_ATTR_OPERATION_RESAMPLE_FWD_IDXDESC = 1712,

     MIOPEN_ATTR_OPERATION_RESAMPLE_FWD_ALPHA   = 1713,

     MIOPEN_ATTR_OPERATION_RESAMPLE_FWD_BETA    = 1714,

     MIOPEN_ATTR_OPERATION_RESAMPLE_FWD_DESC    = 1716,


     MIOPEN_ATTR_OPERATION_RESAMPLE_BWD_DXDESC  = 1720,

     MIOPEN_ATTR_OPERATION_RESAMPLE_BWD_DYDESC  = 1721,

     MIOPEN_ATTR_OPERATION_RESAMPLE_BWD_IDXDESC = 1722,

     MIOPEN_ATTR_OPERATION_RESAMPLE_BWD_ALPHA   = 1723,

     MIOPEN_ATTR_OPERATION_RESAMPLE_BWD_BETA    = 1724,

     MIOPEN_ATTR_OPERATION_RESAMPLE_BWD_DESC    = 1725,

     MIOPEN_ATTR_OPERATION_RESAMPLE_BWD_XDESC   = 1726,

     MIOPEN_ATTR_OPERATION_RESAMPLE_BWD_YDESC   = 1727,


     MIOPEN_ATTR_OPERATION_CONCAT_AXIS          = 1800,

     MIOPEN_ATTR_OPERATION_CONCAT_INPUT_DESCS   = 1801,

     MIOPEN_ATTR_OPERATION_CONCAT_INPLACE_INDEX = 1802,

     MIOPEN_ATTR_OPERATION_CONCAT_OUTPUT_DESC   = 1803,


     MIOPEN_ATTR_OPERATION_SIGNAL_MODE     = 1900,

     MIOPEN_ATTR_OPERATION_SIGNAL_FLAGDESC = 1901,

     MIOPEN_ATTR_OPERATION_SIGNAL_VALUE    = 1902,

     MIOPEN_ATTR_OPERATION_SIGNAL_XDESC    = 1903,

     MIOPEN_ATTR_OPERATION_SIGNAL_YDESC    = 1904,


     MIOPEN_ATTR_OPERATION_NORM_FWD_MODE                     = 2000,

     MIOPEN_ATTR_OPERATION_NORM_FWD_PHASE                    = 2001,

     MIOPEN_ATTR_OPERATION_NORM_FWD_XDESC                    = 2002,

     MIOPEN_ATTR_OPERATION_NORM_FWD_MEAN_DESC                = 2003,

     MIOPEN_ATTR_OPERATION_NORM_FWD_INV_VARIANCE_DESC        = 2004,

     MIOPEN_ATTR_OPERATION_NORM_FWD_SCALE_DESC               = 2005,

     MIOPEN_ATTR_OPERATION_NORM_FWD_BIAS_DESC                = 2006,

     MIOPEN_ATTR_OPERATION_NORM_FWD_EPSILON_DESC             = 2007,

     MIOPEN_ATTR_OPERATION_NORM_FWD_EXP_AVG_FACTOR_DESC      = 2008,

     MIOPEN_ATTR_OPERATION_NORM_FWD_INPUT_RUNNING_MEAN_DESC  = 2009,

     MIOPEN_ATTR_OPERATION_NORM_FWD_INPUT_RUNNING_VAR_DESC   = 2010,

     MIOPEN_ATTR_OPERATION_NORM_FWD_OUTPUT_RUNNING_MEAN_DESC = 2011,

     MIOPEN_ATTR_OPERATION_NORM_FWD_OUTPUT_RUNNING_VAR_DESC  = 2012,

     MIOPEN_ATTR_OPERATION_NORM_FWD_YDESC                    = 2013,

     MIOPEN_ATTR_OPERATION_NORM_FWD_PEER_STAT_DESCS          = 2014,


     MIOPEN_ATTR_OPERATION_NORM_BWD_MODE              = 2100,

     MIOPEN_ATTR_OPERATION_NORM_BWD_XDESC             = 2101,

     MIOPEN_ATTR_OPERATION_NORM_BWD_MEAN_DESC         = 2102,

     MIOPEN_ATTR_OPERATION_NORM_BWD_INV_VARIANCE_DESC = 2103,

     MIOPEN_ATTR_OPERATION_NORM_BWD_DYDESC            = 2104,

     MIOPEN_ATTR_OPERATION_NORM_BWD_SCALE_DESC        = 2105,

     MIOPEN_ATTR_OPERATION_NORM_BWD_EPSILON_DESC      = 2106,

     MIOPEN_ATTR_OPERATION_NORM_BWD_DSCALE_DESC       = 2107,

     MIOPEN_ATTR_OPERATION_NORM_BWD_DBIAS_DESC        = 2108,

     MIOPEN_ATTR_OPERATION_NORM_BWD_DXDESC            = 2109,

     MIOPEN_ATTR_OPERATION_NORM_BWD_PEER_STAT_DESCS   = 2110,


     MIOPEN_ATTR_OPERATION_RESHAPE_XDESC = 2200,

     MIOPEN_ATTR_OPERATION_RESHAPE_YDESC = 2201,


     MIOPEN_ATTR_RNG_DISTRIBUTION                   = 2300,

     MIOPEN_ATTR_RNG_NORMAL_DIST_MEAN               = 2301,

     MIOPEN_ATTR_RNG_NORMAL_DIST_STANDARD_DEVIATION = 2302,

     MIOPEN_ATTR_RNG_UNIFORM_DIST_MAXIMUM           = 2303,

     MIOPEN_ATTR_RNG_UNIFORM_DIST_MINIMUM           = 2304,

     MIOPEN_ATTR_RNG_BERNOULLI_DIST_PROBABILITY     = 2305,


     MIOPEN_ATTR_OPERATION_RNG_YDESC       = 2310,

     MIOPEN_ATTR_OPERATION_RNG_SEED        = 2311,

     MIOPEN_ATTR_OPERATION_RNG_DESC        = 2312,

     MIOPEN_ATTR_OPERATION_RNG_OFFSET_DESC = 2313,


 } miopenBackendAttributeName_t;


 typedef enum

 {

     MIOPEN_TYPE_HANDLE = 0,

     MIOPEN_TYPE_DATA_TYPE,

     MIOPEN_TYPE_BOOLEAN,

     MIOPEN_TYPE_INT64,

     MIOPEN_TYPE_FLOAT,

     MIOPEN_TYPE_DOUBLE,

     MIOPEN_TYPE_VOID_PTR,

     MIOPEN_TYPE_CONVOLUTION_MODE,

     MIOPEN_TYPE_HEUR_MODE,

     MIOPEN_TYPE_KNOB_TYPE,

     MIOPEN_TYPE_NAN_PROPOGATION,

     MIOPEN_TYPE_NUMERICAL_NOTE,

     MIOPEN_TYPE_LAYOUT_TYPE,

     MIOPEN_TYPE_ATTRIB_NAME,

     MIOPEN_TYPE_POINTWISE_MODE,

     MIOPEN_TYPE_BACKEND_DESCRIPTOR,

     MIOPEN_TYPE_GENSTATS_MODE,

     MIOPEN_TYPE_BN_FINALIZE_STATS_MODE,

     MIOPEN_TYPE_REDUCTION_OPERATOR_TYPE,

     MIOPEN_TYPE_BEHAVIOR_NOTE,

     MIOPEN_TYPE_TENSOR_REORDERING_MODE,

     MIOPEN_TYPE_RESAMPLE_MODE,

     MIOPEN_TYPE_PADDING_MODE,

     MIOPEN_TYPE_INT32,

     MIOPEN_TYPE_CHAR,

     MIOPEN_TYPE_SIGNAL_MODE,

     MIOPEN_TYPE_FRACTION,

     MIOPEN_TYPE_NORM_MODE,

     MIOPEN_TYPE_NORM_FWD_PHASE,

     MIOPEN_TYPE_RNG_DISTRIBUTION

 } miopenBackendAttributeType_t;


 typedef enum

 {

     MIOPEN_POINTWISE_ADD,


     MIOPEN_POINTWISE_ADD_SQUARE,


     MIOPEN_POINTWISE_DIV,


     MIOPEN_POINTWISE_MAX,


     MIOPEN_POINTWISE_MIN,


     MIOPEN_POINTWISE_MOD,


     MIOPEN_POINTWISE_MUL,


     MIOPEN_POINTWISE_POW,


     MIOPEN_POINTWISE_SUB,


     MIOPEN_POINTWISE_ABS,


     MIOPEN_POINTWISE_CEIL,


     MIOPEN_POINTWISE_COS,


     MIOPEN_POINTWISE_EXP,


     MIOPEN_POINTWISE_FLOOR,


     MIOPEN_POINTWISE_LOG,


     MIOPEN_POINTWISE_NEG,


     MIOPEN_POINTWISE_RSQRT,


     MIOPEN_POINTWISE_SIN,


     MIOPEN_POINTWISE_SQRT,


     MIOPEN_POINTWISE_TAN,


     MIOPEN_POINTWISE_ERF,


     MIOPEN_POINTWISE_IDENTITY,


     MIOPEN_POINTWISE_RELU_FWD,


     MIOPEN_POINTWISE_TANH_FWD,


     MIOPEN_POINTWISE_SIGMOID_FWD,


     MIOPEN_POINTWISE_ELU_FWD,


     MIOPEN_POINTWISE_GELU_FWD,


     MIOPEN_POINTWISE_SOFTPLUS_FWD,


     MIOPEN_POINTWISE_SWISH_FWD,


     MIOPEN_POINTWISE_GELU_APPROX_TANH_FWD,


     MIOPEN_POINTWISE_RELU_BWD,


     MIOPEN_POINTWISE_TANH_BWD,


     MIOPEN_POINTWISE_SIGMOID_BWD,


     MIOPEN_POINTWISE_ELU_BWD,


     MIOPEN_POINTWISE_GELU_BWD,


     MIOPEN_POINTWISE_SOFTPLUS_BWD,


     MIOPEN_POINTWISE_SWISH_BWD,


     MIOPEN_POINTWISE_GELU_APPROX_TANH_BWD,


     MIOPEN_POINTWISE_CMP_EQ,


     MIOPEN_POINTWISE_CMP_NEQ,


     MIOPEN_POINTWISE_CMP_GT,


     MIOPEN_POINTWISE_CMP_GE,


     MIOPEN_POINTWISE_CMP_LT,


     MIOPEN_POINTWISE_CMP_LE,


     MIOPEN_POINTWISE_LOGICAL_AND,


     MIOPEN_POINTWISE_LOGICAL_OR,


     MIOPEN_POINTWISE_LOGICAL_NOT,


     MIOPEN_POINTWISE_GEN_INDEX,


     MIOPEN_POINTWISE_BINARY_SELECT,


     MIOPEN_POINTWISE_RECIPROCAL

 } miopenPointwiseMode_t;


 typedef enum

 {

     MIOPEN_RNG_DISTRIBUTION_BERNOULLI,

     MIOPEN_RNG_DISTRIBUTION_UNIFORM,

     MIOPEN_RNG_DISTRIBUTION_NORMAL,

 } miopenRngDistribution_t;


 typedef enum

 {

     /* IDENTITY      alpha = 1.0 and beta = 0.0 */

     /* SCALE         alpha = 4.2 and beta = 0.0 */

     /* BILINEAR      alpha = 3.2 and beta = 1.1 */

     /* ERROR_STATE   alpha = 0.0 and beta = 3.1 */


     DEFAULT     = 0, /* alpha = 1.0 and beta = 0.0.*/

     SCALE       = 1, /* alpha with some value and beta 0.0*/

     BILINEAR    = 2, /* both alpha and beta with some value*/

     ERROR_STATE = 3, /* alpha 0.0 and beta with some value, this should not occur.

                         But used to check for errors.*/

 } miopenAlphaBetaCase_t;

 typedef enum

 {

     MIOPEN_HEUR_MODE_INSTANT  = 0,

     MIOPEN_HEUR_MODE_B        = 1,

     MIOPEN_HEUR_MODE_FALLBACK = 2,

     MIOPEN_HEUR_MODE_A        = 3,

     MIOPEN_HEUR_MODES_COUNT   = 4,

 } miopenBackendHeurMode_t;


 MIOPEN_DECLARE_OBJECT(miopenBackendDescriptor)


 MIOPEN_EXPORT miopenStatus_t miopenBackendCreateDescriptor(

     miopenBackendDescriptorType_t descriptorType, miopenBackendDescriptor_t* descriptor);


 MIOPEN_EXPORT miopenStatus_t miopenBackendSetAttribute(miopenBackendDescriptor_t descriptor,

                                                        miopenBackendAttributeName_t attributeName,

                                                        miopenBackendAttributeType_t attributeType,

                                                        int64_t elementCount,

                                                        void* arrayOfElements);


 MIOPEN_EXPORT miopenStatus_t miopenBackendFinalize(miopenBackendDescriptor_t descriptor);


 MIOPEN_EXPORT miopenStatus_t miopenBackendGetAttribute(miopenBackendDescriptor_t descriptor,

                                                        miopenBackendAttributeName_t attributeName,

                                                        miopenBackendAttributeType_t attributeType,

                                                        int64_t requestedElementCount,

                                                        int64_t* elementCount,

                                                        void* arrayOfElements);


 MIOPEN_EXPORT miopenStatus_t miopenBackendExecute(miopenHandle_t handle,

                                                   miopenBackendDescriptor_t executionPlan,

                                                   miopenBackendDescriptor_t variantPack);


 MIOPEN_EXPORT miopenStatus_t miopenBackendDestroyDescriptor(miopenBackendDescriptor_t descriptor);


 MIOPEN_EXPORT miopenStatus_t miopenBackendInitialize(miopenBackendDescriptor_t descriptor,

                                                      miopenBackendDescriptorType_t descriptorType,

                                                      size_t sizeInBytes);


 // CLOSEOUT BackendAPI DOXYGEN GROUP

 #endif // MIOPEN_BETA_API


 #ifdef MIOPEN_BETA_API

 // FusedAdam APIs

 MIOPEN_EXPORT miopenStatus_t miopenFusedAdam(miopenHandle_t handle,

                                              const miopenTensorDescriptor_t paramDesc,

                                              void* param,

                                              const miopenTensorDescriptor_t gradDesc,

                                              const void* grad,

                                              const miopenTensorDescriptor_t expAvgDesc,

                                              void* expAvg,

                                              const miopenTensorDescriptor_t expAvgSqDesc,

                                              void* expAvgSq,

                                              const miopenTensorDescriptor_t maxExpAvgSqDesc,

                                              void* maxExpAvgSq,

                                              const miopenTensorDescriptor_t stateStepDesc,

                                              void* stateStep,

                                              const unsigned int state_step,

                                              const float lr,

                                              const float beta1,

                                              const float beta2,

                                              const float weight_decay,

                                              const float eps,

                                              const bool amsgrad,

                                              const bool maximize,

                                              const bool adamw,

                                              const miopenTensorDescriptor_t gradScaleDesc,

                                              const void* gradScale,

                                              const miopenTensorDescriptor_t foundInfDesc,

                                              const void* foundInf);


 MIOPEN_EXPORT miopenStatus_t

 miopenFusedAdamWithOutput(miopenHandle_t handle,

                           const miopenTensorDescriptor_t paramInDesc,

                           void* paramIn,

                           const miopenTensorDescriptor_t paramOutDesc,

                           void* paramOut,

                           const miopenTensorDescriptor_t paramOutFloat16Desc,

                           void* paramOutFloat16,

                           const miopenTensorDescriptor_t gradInDesc,

                           const void* gradIn,

                           const miopenTensorDescriptor_t expAvgInDesc,

                           void* expAvgIn,

                           const miopenTensorDescriptor_t expAvgOutDesc,

                           void* expAvgOut,

                           const miopenTensorDescriptor_t expAvgSqInDesc,

                           void* expAvgSqIn,

                           const miopenTensorDescriptor_t expAvgSqOutDesc,

                           void* expAvgSqOut,

                           const miopenTensorDescriptor_t maxExpAvgSqInDesc,

                           void* maxExpAvgSqIn,

                           const miopenTensorDescriptor_t maxExpAvgSqOutDesc,

                           void* maxExpAvgSqOut,

                           const miopenTensorDescriptor_t stateStepInDesc,

                           void* stateStepIn,

                           const miopenTensorDescriptor_t stateStepOutDesc,

                           void* stateStepOut,

                           const unsigned int state_step,

                           const float lr,

                           const float beta1,

                           const float beta2,

                           const float weight_decay,

                           const float eps,

                           const bool amsgrad,

                           const bool maximize,

                           const bool adamw,

                           const miopenTensorDescriptor_t gradScaleDesc,

                           const void* gradScale,

                           const miopenTensorDescriptor_t foundInfDesc,

                           const void* foundInf);


 // CLOSEOUT SGD DOXYGEN GROUP

 #endif // MIOPEN_BETA_API


 #ifdef MIOPEN_BETA_API

 // TransformersAdamW APIs

 MIOPEN_EXPORT miopenStatus_t miopenTransformersAdamW(miopenHandle_t handle,

                                                      const miopenTensorDescriptor_t paramDesc,

                                                      void* param,

                                                      const miopenTensorDescriptor_t gradDesc,

                                                      const void* grad,

                                                      const miopenTensorDescriptor_t expAvgDesc,

                                                      void* expAvg,

                                                      const miopenTensorDescriptor_t expAvgSqDesc,

                                                      void* expAvgSq,

                                                      const miopenTensorDescriptor_t stateStepDesc,

                                                      void* stateStep,

                                                      const unsigned int state_step,

                                                      const float lr,

                                                      const float beta1,

                                                      const float beta2,

                                                      const float weight_decay,

                                                      const float eps,

                                                      const bool correct_bias,

                                                      const miopenTensorDescriptor_t gradScaleDesc,

                                                      const void* gradScale,

                                                      const miopenTensorDescriptor_t foundInfDesc,

                                                      const void* foundInf);


 MIOPEN_EXPORT miopenStatus_t

 miopenTransformersAdamWWithOutput(miopenHandle_t handle,

                                   const miopenTensorDescriptor_t paramInDesc,

                                   void* paramIn,

                                   const miopenTensorDescriptor_t paramOutDesc,

                                   void* paramOut,

                                   const miopenTensorDescriptor_t paramOutFloat16Desc,

                                   void* paramOutFloat16,

                                   const miopenTensorDescriptor_t gradInDesc,

                                   const void* gradIn,

                                   const miopenTensorDescriptor_t expAvgInDesc,

                                   void* expAvgIn,

                                   const miopenTensorDescriptor_t expAvgOutDesc,

                                   void* expAvgOut,

                                   const miopenTensorDescriptor_t expAvgSqInDesc,

                                   void* expAvgSqIn,

                                   const miopenTensorDescriptor_t expAvgSqOutDesc,

                                   void* expAvgSqOut,

                                   const miopenTensorDescriptor_t stateStepInDesc,

                                   void* stateStepIn,

                                   const miopenTensorDescriptor_t stateStepOutDesc,

                                   void* stateStepOut,

                                   const unsigned int state_step,

                                   const float lr,

                                   const float beta1,

                                   const float beta2,

                                   const float weight_decay,

                                   const float eps,

                                   const float step_size,

                                   const bool correct_bias,

                                   const miopenTensorDescriptor_t gradScaleDesc,

                                   const void* gradScale,

                                   const miopenTensorDescriptor_t foundInfDesc,

                                   const void* foundInf);


 // CLOSEOUT SGD DOXYGEN GROUP

 #endif // MIOPEN_BETA_API


 #ifdef MIOPEN_BETA_API

 // GetItem APIs

 MIOPEN_EXPORT miopenStatus_t

 miopenGetGetitemWorkspaceSize(miopenHandle_t handle,

                               uint32_t indexCount,

                               const miopenTensorDescriptor_t* indexDescs,

                               size_t* sizeInBytes);


 MIOPEN_EXPORT miopenStatus_t miopenGetitemBackward(miopenHandle_t handle,

                                                    void* workspace,

                                                    size_t workspaceSizeInBytes,

                                                    const miopenTensorDescriptor_t dyDesc,

                                                    const void* dy,

                                                    uint32_t indexCount,

                                                    const miopenTensorDescriptor_t* indexDescs,

                                                    const void* const* indexs,

                                                    const miopenTensorDescriptor_t dxDesc,

                                                    void* dx,

                                                    const miopenTensorDescriptor_t errorDesc,

                                                    void* error,

                                                    uint32_t dimCount,

                                                    const int32_t* dims,

                                                    uint32_t sliceCount,

                                                    const int32_t* slices,

                                                    uint32_t offset);


 // CLOSEOUT GETITEM DOXYGEN GROUP

 #endif // MIOPEN_BETA_API


 #ifdef MIOPEN_BETA_API

 // RotaryPositionalEmbeddings APIs

 MIOPEN_EXPORT miopenStatus_t miopenRoPEForward(miopenHandle_t handle,

                                                const miopenTensorDescriptor_t xDesc,

                                                const void* x,

                                                const miopenTensorDescriptor_t cosDesc,

                                                const void* cos,

                                                const miopenTensorDescriptor_t sinDesc,

                                                const void* sin,

                                                const miopenTensorDescriptor_t yDesc,

                                                void* y);


 MIOPEN_EXPORT miopenStatus_t miopenRoPEBackward(miopenHandle_t handle,

                                                 const miopenTensorDescriptor_t dyDesc,

                                                 const void* dy,

                                                 const miopenTensorDescriptor_t cosDesc,

                                                 const void* cos,

                                                 const miopenTensorDescriptor_t sinDesc,

                                                 const void* sin,

                                                 const miopenTensorDescriptor_t dxDesc,

                                                 void* dx);

 // CLOSEOUT ROPE DOXYGEN GROUP

 // kthvalue APIs

 MIOPEN_EXPORT miopenStatus_t miopenKthvalueForward(miopenHandle_t handle,

                                                    miopenTensorDescriptor_t inputDesc,

                                                    const void* input,

                                                    miopenTensorDescriptor_t outputDesc,

                                                    void* output,

                                                    miopenTensorDescriptor_t indicesDesc,

                                                    size_t* indices,

                                                    size_t k,

                                                    int32_t dim  = -1,

                                                    bool keepDim = false);


 // CLOSEOUT kthvalue DOXYGEN GROUP

 #endif // MIOPEN_BETA_API


 #ifdef MIOPEN_BETA_API

 MIOPEN_EXPORT miopenStatus_t

 miopenGetPReLUBackwardWorkspaceSize(miopenHandle_t handle,

                                     miopenTensorDescriptor_t inputDesc,

                                     miopenTensorDescriptor_t weightDesc,

                                     size_t* sizeInBytes);


 MIOPEN_EXPORT miopenStatus_t miopenPReLUBackward(miopenHandle_t handle,

                                                  void* workspace,

                                                  size_t workspaceSizeInBytes,

                                                  miopenTensorDescriptor_t inputDesc,

                                                  const void* input,

                                                  miopenTensorDescriptor_t weightDesc,

                                                  const void* weight,

                                                  miopenTensorDescriptor_t doutputDesc,

                                                  const void* doutput,

                                                  miopenTensorDescriptor_t dinputDesc,

                                                  void* dinput,

                                                  miopenTensorDescriptor_t dweightDesc,

                                                  void* dweight);


 // CLOSEOUT RELU DOXYGEN GROUP

 #endif // MIOPEN_BETA_API


 #ifdef MIOPEN_BETA_API


 typedef enum

 {

     MIOPEN_LOSS_REDUCTION_NONE = 0,

     MIOPEN_LOSS_REDUCTION_SUM  = 1,

     MIOPEN_LOSS_REDUCTION_MEAN = 2,

 } miopenLossReductionMode_t;


 // SoftMarginLoss APIs

 MIOPEN_EXPORT miopenStatus_t

 miopenGetSoftMarginLossForwardWorkspaceSize(miopenHandle_t handle,

                                             miopenTensorDescriptor_t inputDesc,

                                             miopenTensorDescriptor_t targetDesc,

                                             miopenTensorDescriptor_t outputDesc,

                                             miopenLossReductionMode_t reduction,

                                             size_t* sizeInBytes);


 MIOPEN_EXPORT miopenStatus_t miopenSoftMarginLossForward(miopenHandle_t handle,

                                                          miopenTensorDescriptor_t inputDesc,

                                                          const void* input,

                                                          miopenTensorDescriptor_t targetDesc,

                                                          const void* target,

                                                          miopenTensorDescriptor_t outputDesc,

                                                          void* output,

                                                          miopenLossReductionMode_t reduction,

                                                          void* workspace             = nullptr,

                                                          size_t workspaceSizeInBytes = 0);


 MIOPEN_EXPORT miopenStatus_t miopenSoftMarginLossBackward(miopenHandle_t handle,

                                                           miopenTensorDescriptor_t inputDesc,

                                                           const void* input,

                                                           miopenTensorDescriptor_t targetDesc,

                                                           const void* target,

                                                           miopenTensorDescriptor_t doutputDesc,

                                                           const void* doutput,

                                                           miopenTensorDescriptor_t dinputDesc,

                                                           void* dinput,

                                                           miopenLossReductionMode_t reduction);


 // CLOSEOUT LossFunction DOXYGEN GROUP

 #endif


 #ifdef MIOPEN_BETA_API

 // MultiMarginLoss APIs

 MIOPEN_EXPORT miopenStatus_t

 miopenGetMultiMarginLossForwardWorkspaceSize(miopenHandle_t handle,

                                              miopenTensorDescriptor_t inputDesc,

                                              miopenTensorDescriptor_t targetDesc,

                                              miopenTensorDescriptor_t weightDesc,

                                              miopenTensorDescriptor_t outputDesc,

                                              long p,

                                              float margin,

                                              miopenLossReductionMode_t reduction,

                                              size_t* sizeInBytes);


 MIOPEN_EXPORT miopenStatus_t miopenMultiMarginLossForward(miopenHandle_t handle,

                                                           miopenTensorDescriptor_t inputDesc,

                                                           const void* input,

                                                           miopenTensorDescriptor_t targetDesc,

                                                           const void* target,

                                                           miopenTensorDescriptor_t weightDesc,

                                                           const void* weight,

                                                           miopenTensorDescriptor_t outputDesc,

                                                           void* output,

                                                           long p,

                                                           float margin,

                                                           miopenLossReductionMode_t reduction,

                                                           void* workspace,

                                                           size_t workspaceSizeInBytes);


 // CLOSEOUT LossFunction DOXYGEN GROUP

 #endif // MIOPEN_BETA_API


 typedef enum

 {

     miopenTuningPolicyNone     = 1,

     miopenTuningPolicyDbUpdate = 2,

     miopenTuningPolicySearch =

         3,

     miopenTuningPolicySearchDbUpdate = 4,

     miopenTuningPolicyDbClean        = 5,

 } miopenTuningPolicy_t;


 MIOPEN_EXPORT miopenStatus_t miopenSetTuningPolicy(miopenHandle_t handle,

                                                    miopenTuningPolicy_t newValue);


 MIOPEN_EXPORT miopenStatus_t miopenGetTuningPolicy(miopenHandle_t handle,

                                                    miopenTuningPolicy_t* value);


 #ifdef __cplusplus

 }

 #endif


 #ifdef __clang__

 #pragma clang diagnostic pop

 #endif


 #endif // MIOPEN_GUARD_MIOPEN_H_

miopenCreateOpActivationBackward
miopenStatus_t miopenCreateOpActivationBackward(miopenFusionPlanDescriptor_t fusePlanDesc, miopenFusionOpDescriptor_t *activBwdOp, miopenActivationMode_t mode)
Creates a backward activation operator.

miopenCreateOpBatchNormForward
miopenStatus_t miopenCreateOpBatchNormForward(miopenFusionPlanDescriptor_t fusePlanDesc, miopenFusionOpDescriptor_t *bnFwdOp, const miopenBatchNormMode_t bn_mode, bool runningMeanVariance)
Creates a forward training batch normalization operator.

miopenFusionPlanConvolutionGetAlgo
miopenStatus_t miopenFusionPlanConvolutionGetAlgo(miopenFusionPlanDescriptor_t fusePlanDesc, const int requestAlgoCount, int *returnedAlgoCount, miopenConvFwdAlgorithm_t *returnedAlgos)
Returns the supported algorithms for the convolution operator in the Fusion Plan.

miopenFusionPlanGetWorkSpaceSize
miopenStatus_t miopenFusionPlanGetWorkSpaceSize(miopenHandle_t handle, miopenFusionPlanDescriptor_t fusePlanDesc, size_t *workSpaceSize, miopenConvFwdAlgorithm_t algo)
Query the workspace size required for the fusion plan.

miopenFusionPlanConvolutionSetAlgo
miopenStatus_t miopenFusionPlanConvolutionSetAlgo(miopenFusionPlanDescriptor_t fusePlanDesc, miopenConvFwdAlgorithm_t algo)
Requests the fusion runtime to choose a particular algorithm for the added convolution operation.

miopenCreateOpBatchNormInference
miopenStatus_t miopenCreateOpBatchNormInference(miopenFusionPlanDescriptor_t fusePlanDesc, miopenFusionOpDescriptor_t *bnOp, const miopenBatchNormMode_t bn_mode, const miopenTensorDescriptor_t bnScaleBiasMeanVarDesc)
Creates a forward inference batch normalization operator.

miopenSetOpArgsBiasForward
miopenStatus_t miopenSetOpArgsBiasForward(miopenOperatorArgs_t args, const miopenFusionOpDescriptor_t biasOp, const void *alpha, const void *beta, const void *bias)
Sets the arguments for forward bias op.

miopenCreateOpConvForward
miopenStatus_t miopenCreateOpConvForward(miopenFusionPlanDescriptor_t fusePlanDesc, miopenFusionOpDescriptor_t *convOp, miopenConvolutionDescriptor_t convDesc, const miopenTensorDescriptor_t wDesc)
Creates forward convolution operator.

miopenSetOpArgsBatchNormInference
miopenStatus_t miopenSetOpArgsBatchNormInference(miopenOperatorArgs_t args, const miopenFusionOpDescriptor_t bnOp, const void *alpha, const void *beta, const void *bnScale, const void *bnBias, const void *estimatedMean, const void *estimatedVariance, double epsilon)
Sets the arguments for inference batch normalization op.

miopenSetOpArgsBatchNormForward
miopenStatus_t miopenSetOpArgsBatchNormForward(miopenOperatorArgs_t args, const miopenFusionOpDescriptor_t bnOp, const void *alpha, const void *beta, const void *bnScale, const void *bnBias, void *savedMean, void *savedInvVariance, void *runningMean, void *runningVariance, double expAvgFactor, double epsilon)
Sets the arguments for forward batch normalization op.

miopenExecuteFusionPlan
miopenStatus_t miopenExecuteFusionPlan(const miopenHandle_t handle, const miopenFusionPlanDescriptor_t fusePlanDesc, const miopenTensorDescriptor_t inputDesc, const void *input, const miopenTensorDescriptor_t outputDesc, void *output, miopenOperatorArgs_t args)
Executes the fusion plan. Only compatible with NHWC/NDHWC tensor layouts.

miopenFusionPlanGetOp
miopenStatus_t miopenFusionPlanGetOp(miopenFusionPlanDescriptor_t fusePlanDesc, const int op_idx, miopenFusionOpDescriptor_t *op)
Allows access to the operators in a fusion plan.

miopenDestroyFusionPlan
miopenStatus_t miopenDestroyFusionPlan(miopenFusionPlanDescriptor_t fusePlanDesc)
Destroy the fusion plan descriptor object.

miopenCreateOpActivationForward
miopenStatus_t miopenCreateOpActivationForward(miopenFusionPlanDescriptor_t fusePlanDesc, miopenFusionOpDescriptor_t *activFwdOp, miopenActivationMode_t mode)
Creates a forward activation operator.

miopenExecuteFusionPlan_v2
miopenStatus_t miopenExecuteFusionPlan_v2(const miopenHandle_t handle, const miopenFusionPlanDescriptor_t fusePlanDesc, const miopenTensorDescriptor_t inputDesc, const void *input, const miopenTensorDescriptor_t outputDesc, void *output, miopenOperatorArgs_t args, void *workspace, size_t workspaceSize)
Executes the fusion plan with a workspace buffer for layout transformations.

miopenFusionDirection_t
miopenFusionDirection_t
Kernel fusion direction in the network.
Definition: miopen.h:3843

miopenSetOpArgsActivBackward
miopenStatus_t miopenSetOpArgsActivBackward(miopenOperatorArgs_t args, const miopenFusionOpDescriptor_t activBwdOp, const void *alpha, const void *beta, const void *y, const void *reserved, double activAlpha, double activBeta, double activGamma)
Sets the arguments for backward activation op.

miopenCompileFusionPlan
miopenStatus_t miopenCompileFusionPlan(miopenHandle_t handle, miopenFusionPlanDescriptor_t fusePlanDesc)
Compiles the fusion plan.

miopenSetOpArgsBatchNormBackward
miopenStatus_t miopenSetOpArgsBatchNormBackward(miopenOperatorArgs_t args, const miopenFusionOpDescriptor_t bnOp, const void *alpha, const void *beta, const void *x, const void *bnScale, const void *bnBias, void *resultBnScaleDiff, void *resultBnBiasDiff, const void *savedMean, const void *savedInvVariance)
Sets the arguments for backward batch normalization op.

miopenSetOpArgsActivForward
miopenStatus_t miopenSetOpArgsActivForward(miopenOperatorArgs_t args, const miopenFusionOpDescriptor_t activFwdOp, const void *alpha, const void *beta, double activAlpha, double activBeta, double activGamma)
Sets the arguments for forward activation op.

miopenDestroyOperatorArgs
miopenStatus_t miopenDestroyOperatorArgs(miopenOperatorArgs_t args)
Destroys an operator argument object.

miopenCreateOpBatchNormBackward
miopenStatus_t miopenCreateOpBatchNormBackward(miopenFusionPlanDescriptor_t fusePlanDesc, miopenFusionOpDescriptor_t *bnBwdOp, const miopenBatchNormMode_t bn_mode)
Creates a back propagation batch normalization operator.

miopenCreateOperatorArgs
miopenStatus_t miopenCreateOperatorArgs(miopenOperatorArgs_t *args)
Creates an operator argument object.

miopenSetOpArgsConvForward
miopenStatus_t miopenSetOpArgsConvForward(miopenOperatorArgs_t args, const miopenFusionOpDescriptor_t convOp, const void *alpha, const void *beta, const void *w)
Sets the arguments for forward convolution op.

miopenConvolutionBiasActivationForward
miopenStatus_t miopenConvolutionBiasActivationForward(miopenHandle_t handle, const void *alpha1, const miopenTensorDescriptor_t xDesc, const void *x, const miopenTensorDescriptor_t wDesc, const void *w, const miopenConvolutionDescriptor_t convDesc, miopenConvFwdAlgorithm_t algo, void *workspace, size_t workspaceSizeInBytes, const void *alpha2, const miopenTensorDescriptor_t zDesc, const void *z, const miopenTensorDescriptor_t biasDesc, const void *bias, const miopenActivationDescriptor_t activationDesc, const miopenTensorDescriptor_t yDesc, void *y)
Prepares and executes the Convlution+Bias+Activation Fusion.

miopenCreateFusionPlan
miopenStatus_t miopenCreateFusionPlan(miopenFusionPlanDescriptor_t *fusePlanDesc, const miopenFusionDirection_t fuseDirection, const miopenTensorDescriptor_t inputDesc)
Creates the kenrel fusion plan descriptor object.

miopenCreateOpBiasForward
miopenStatus_t miopenCreateOpBiasForward(miopenFusionPlanDescriptor_t fusePlanDesc, miopenFusionOpDescriptor_t *biasOp, const miopenTensorDescriptor_t bDesc)
Creates a forward bias operator.

miopenHorizontalFusion
@ miopenHorizontalFusion
Definition: miopen.h:3845

miopenVerticalFusion
@ miopenVerticalFusion
Definition: miopen.h:3844

miopenBackendExecute
miopenStatus_t miopenBackendExecute(miopenHandle_t handle, miopenBackendDescriptor_t executionPlan, miopenBackendDescriptor_t variantPack)
Executes a graph.

miopenBackendHeurMode_t
miopenBackendHeurMode_t
Operation mode of CUDNN_BACKEND_ENGINEHEUR_DESCRIPTOR.
Definition: miopen.h:7537

miopenPointwiseMode_t
miopenPointwiseMode_t
Intended pointwise math operation for a pointwise operation descriptor.
Definition: miopen.h:7337

miopenBackendFinalize
miopenStatus_t miopenBackendFinalize(miopenBackendDescriptor_t descriptor)
Finalizes a backend descriptor.

miopenBackendInitialize
miopenStatus_t miopenBackendInitialize(miopenBackendDescriptor_t descriptor, miopenBackendDescriptorType_t descriptorType, size_t sizeInBytes)
Repurposes an instance of miopenBackendDescriptor_t.

miopenBackendAttributeName_t
miopenBackendAttributeName_t
Backend Descriptor's Attribute.
Definition: miopen.h:7044

miopenRngDistribution_t
miopenRngDistribution_t
Distribution for random number generation.
Definition: miopen.h:7513

miopenBackendDescriptorType_t
miopenBackendDescriptorType_t
Descriptor type.
Definition: miopen.h:7001

miopenBackendSetAttribute
miopenStatus_t miopenBackendSetAttribute(miopenBackendDescriptor_t descriptor, miopenBackendAttributeName_t attributeName, miopenBackendAttributeType_t attributeType, int64_t elementCount, void *arrayOfElements)
Sets an attribute of a descriptor.

miopenBackendGetAttribute
miopenStatus_t miopenBackendGetAttribute(miopenBackendDescriptor_t descriptor, miopenBackendAttributeName_t attributeName, miopenBackendAttributeType_t attributeType, int64_t requestedElementCount, int64_t *elementCount, void *arrayOfElements)
Retrieves backend descriptor's attribute.

miopenBackendCreateDescriptor
miopenStatus_t miopenBackendCreateDescriptor(miopenBackendDescriptorType_t descriptorType, miopenBackendDescriptor_t *descriptor)
Backend descriptor.

miopenAlphaBetaCase_t
miopenAlphaBetaCase_t
Definition: miopen.h:7520

miopenBackendDestroyDescriptor
miopenStatus_t miopenBackendDestroyDescriptor(miopenBackendDescriptor_t descriptor)
Destroys an instance of miopenBackendDescriptor_t.

miopenBackendAttributeType_t
miopenBackendAttributeType_t
Data type of an attribute of a backend descriptor.
Definition: miopen.h:7298

MIOPEN_HEUR_MODE_INSTANT
@ MIOPEN_HEUR_MODE_INSTANT
Definition: miopen.h:7538

MIOPEN_HEUR_MODE_A
@ MIOPEN_HEUR_MODE_A
Definition: miopen.h:7541

MIOPEN_HEUR_MODE_B
@ MIOPEN_HEUR_MODE_B
Definition: miopen.h:7539

MIOPEN_HEUR_MODES_COUNT
@ MIOPEN_HEUR_MODES_COUNT
Definition: miopen.h:7542

MIOPEN_HEUR_MODE_FALLBACK
@ MIOPEN_HEUR_MODE_FALLBACK
Definition: miopen.h:7540

MIOPEN_POINTWISE_SOFTPLUS_FWD
@ MIOPEN_POINTWISE_SOFTPLUS_FWD
Definition: miopen.h:7425

MIOPEN_POINTWISE_ELU_FWD
@ MIOPEN_POINTWISE_ELU_FWD
Definition: miopen.h:7418

MIOPEN_POINTWISE_RELU_FWD
@ MIOPEN_POINTWISE_RELU_FWD
Definition: miopen.h:7409

MIOPEN_POINTWISE_DIV
@ MIOPEN_POINTWISE_DIV
Definition: miopen.h:7346

MIOPEN_POINTWISE_SIGMOID_BWD
@ MIOPEN_POINTWISE_SIGMOID_BWD
Definition: miopen.h:7443

MIOPEN_POINTWISE_POW
@ MIOPEN_POINTWISE_POW
Definition: miopen.h:7362

MIOPEN_POINTWISE_MOD
@ MIOPEN_POINTWISE_MOD
Definition: miopen.h:7356

MIOPEN_POINTWISE_SQRT
@ MIOPEN_POINTWISE_SQRT
Definition: miopen.h:7395

MIOPEN_POINTWISE_BINARY_SELECT
@ MIOPEN_POINTWISE_BINARY_SELECT
Definition: miopen.h:7500

MIOPEN_POINTWISE_GELU_BWD
@ MIOPEN_POINTWISE_GELU_BWD
Definition: miopen.h:7451

MIOPEN_POINTWISE_MIN
@ MIOPEN_POINTWISE_MIN
Definition: miopen.h:7352

MIOPEN_POINTWISE_CMP_NEQ
@ MIOPEN_POINTWISE_CMP_NEQ
Definition: miopen.h:7470

MIOPEN_POINTWISE_FLOOR
@ MIOPEN_POINTWISE_FLOOR
Definition: miopen.h:7380

MIOPEN_POINTWISE_RSQRT
@ MIOPEN_POINTWISE_RSQRT
Definition: miopen.h:7389

MIOPEN_POINTWISE_CMP_EQ
@ MIOPEN_POINTWISE_CMP_EQ
Definition: miopen.h:7467

MIOPEN_POINTWISE_CMP_GE
@ MIOPEN_POINTWISE_CMP_GE
Definition: miopen.h:7477

MIOPEN_POINTWISE_ADD_SQUARE
@ MIOPEN_POINTWISE_ADD_SQUARE
Definition: miopen.h:7343

MIOPEN_POINTWISE_ERF
@ MIOPEN_POINTWISE_ERF
Definition: miopen.h:7401

MIOPEN_POINTWISE_SWISH_FWD
@ MIOPEN_POINTWISE_SWISH_FWD
Definition: miopen.h:7428

MIOPEN_POINTWISE_LOG
@ MIOPEN_POINTWISE_LOG
Definition: miopen.h:7383

MIOPEN_POINTWISE_SUB
@ MIOPEN_POINTWISE_SUB
Definition: miopen.h:7365

MIOPEN_POINTWISE_NEG
@ MIOPEN_POINTWISE_NEG
Definition: miopen.h:7386

MIOPEN_POINTWISE_LOGICAL_AND
@ MIOPEN_POINTWISE_LOGICAL_AND
Definition: miopen.h:7487

MIOPEN_POINTWISE_SWISH_BWD
@ MIOPEN_POINTWISE_SWISH_BWD
Definition: miopen.h:7457

MIOPEN_POINTWISE_GELU_APPROX_TANH_FWD
@ MIOPEN_POINTWISE_GELU_APPROX_TANH_FWD
Definition: miopen.h:7433

MIOPEN_POINTWISE_SIN
@ MIOPEN_POINTWISE_SIN
Definition: miopen.h:7392

MIOPEN_POINTWISE_RECIPROCAL
@ MIOPEN_POINTWISE_RECIPROCAL
Definition: miopen.h:7504

MIOPEN_POINTWISE_GELU_APPROX_TANH_BWD
@ MIOPEN_POINTWISE_GELU_APPROX_TANH_BWD
Definition: miopen.h:7464

MIOPEN_POINTWISE_GELU_FWD
@ MIOPEN_POINTWISE_GELU_FWD
Definition: miopen.h:7422

MIOPEN_POINTWISE_ABS
@ MIOPEN_POINTWISE_ABS
Definition: miopen.h:7368

MIOPEN_POINTWISE_CMP_LT
@ MIOPEN_POINTWISE_CMP_LT
Definition: miopen.h:7480

MIOPEN_POINTWISE_EXP
@ MIOPEN_POINTWISE_EXP
Definition: miopen.h:7377

MIOPEN_POINTWISE_GEN_INDEX
@ MIOPEN_POINTWISE_GEN_INDEX
Definition: miopen.h:7496

MIOPEN_POINTWISE_CEIL
@ MIOPEN_POINTWISE_CEIL
Definition: miopen.h:7371

MIOPEN_POINTWISE_LOGICAL_NOT
@ MIOPEN_POINTWISE_LOGICAL_NOT
Definition: miopen.h:7493

MIOPEN_POINTWISE_SIGMOID_FWD
@ MIOPEN_POINTWISE_SIGMOID_FWD
Definition: miopen.h:7415

MIOPEN_POINTWISE_SOFTPLUS_BWD
@ MIOPEN_POINTWISE_SOFTPLUS_BWD
Definition: miopen.h:7454

MIOPEN_POINTWISE_LOGICAL_OR
@ MIOPEN_POINTWISE_LOGICAL_OR
Definition: miopen.h:7490

MIOPEN_POINTWISE_TAN
@ MIOPEN_POINTWISE_TAN
Definition: miopen.h:7398

MIOPEN_POINTWISE_ELU_BWD
@ MIOPEN_POINTWISE_ELU_BWD
Definition: miopen.h:7447

MIOPEN_POINTWISE_IDENTITY
@ MIOPEN_POINTWISE_IDENTITY
Definition: miopen.h:7406

MIOPEN_POINTWISE_CMP_LE
@ MIOPEN_POINTWISE_CMP_LE
Definition: miopen.h:7484

MIOPEN_POINTWISE_COS
@ MIOPEN_POINTWISE_COS
Definition: miopen.h:7374

MIOPEN_POINTWISE_TANH_BWD
@ MIOPEN_POINTWISE_TANH_BWD
Definition: miopen.h:7440

MIOPEN_POINTWISE_MUL
@ MIOPEN_POINTWISE_MUL
Definition: miopen.h:7359

MIOPEN_POINTWISE_TANH_FWD
@ MIOPEN_POINTWISE_TANH_FWD
Definition: miopen.h:7412

MIOPEN_POINTWISE_RELU_BWD
@ MIOPEN_POINTWISE_RELU_BWD
Definition: miopen.h:7437

MIOPEN_POINTWISE_ADD
@ MIOPEN_POINTWISE_ADD
Definition: miopen.h:7339

MIOPEN_POINTWISE_MAX
@ MIOPEN_POINTWISE_MAX
Definition: miopen.h:7349

MIOPEN_POINTWISE_CMP_GT
@ MIOPEN_POINTWISE_CMP_GT
Definition: miopen.h:7473

MIOPEN_ATTR_OPERATION_NORM_BWD_MODE
@ MIOPEN_ATTR_OPERATION_NORM_BWD_MODE
Definition: miopen.h:7261

MIOPEN_ATTR_OPERATION_CONVOLUTION_FORWARD_W
@ MIOPEN_ATTR_OPERATION_CONVOLUTION_FORWARD_W
Definition: miopen.h:7091

MIOPEN_ATTR_RESAMPLE_NAN_PROPAGATION
@ MIOPEN_ATTR_RESAMPLE_NAN_PROPAGATION
Definition: miopen.h:7215

MIOPEN_ATTR_OPERATION_RESAMPLE_FWD_XDESC
@ MIOPEN_ATTR_OPERATION_RESAMPLE_FWD_XDESC
Definition: miopen.h:7218

MIOPEN_ATTR_OPERATION_CONVOLUTION_BWD_DATA_W
@ MIOPEN_ATTR_OPERATION_CONVOLUTION_BWD_DATA_W
Definition: miopen.h:7097

MIOPEN_ATTR_OPERATION_CONVOLUTION_FORWARD_ALPHA
@ MIOPEN_ATTR_OPERATION_CONVOLUTION_FORWARD_ALPHA
Definition: miopen.h:7088

MIOPEN_ATTR_OPERATION_SIGNAL_MODE
@ MIOPEN_ATTR_OPERATION_SIGNAL_MODE
Definition: miopen.h:7239

MIOPEN_ATTR_OPERATION_RNG_DESC
@ MIOPEN_ATTR_OPERATION_RNG_DESC
Definition: miopen.h:7285

MIOPEN_ATTR_OPERATION_CONVOLUTION_FORWARD_BETA
@ MIOPEN_ATTR_OPERATION_CONVOLUTION_FORWARD_BETA
Definition: miopen.h:7089

MIOPEN_ATTR_OPERATION_BN_BWD_WEIGHTS_DBN_SCALE_DESC
@ MIOPEN_ATTR_OPERATION_BN_BWD_WEIGHTS_DBN_SCALE_DESC
Definition: miopen.h:7202

MIOPEN_ATTR_OPERATION_NORM_BWD_INV_VARIANCE_DESC
@ MIOPEN_ATTR_OPERATION_NORM_BWD_INV_VARIANCE_DESC
Definition: miopen.h:7264

MIOPEN_ATTR_OPERATION_NORM_FWD_EPSILON_DESC
@ MIOPEN_ATTR_OPERATION_NORM_FWD_EPSILON_DESC
Definition: miopen.h:7252

MIOPEN_ATTR_OPERATIONGRAPH_OPS
@ MIOPEN_ATTR_OPERATIONGRAPH_OPS
Definition: miopen.h:7141

MIOPEN_ATTR_KNOB_INFO_MAXIMUM_VALUE
@ MIOPEN_ATTR_KNOB_INFO_MAXIMUM_VALUE
Definition: miopen.h:7165

MIOPEN_ATTR_CONVOLUTION_POST_PADDINGS
@ MIOPEN_ATTR_CONVOLUTION_POST_PADDINGS
Definition: miopen.h:7060

MIOPEN_ATTR_OPERATION_SIGNAL_YDESC
@ MIOPEN_ATTR_OPERATION_SIGNAL_YDESC
Definition: miopen.h:7243

MIOPEN_ATTR_OPERATION_NORM_BWD_DSCALE_DESC
@ MIOPEN_ATTR_OPERATION_NORM_BWD_DSCALE_DESC
Definition: miopen.h:7268

MIOPEN_ATTR_OPERATION_NORM_BWD_PEER_STAT_DESCS
@ MIOPEN_ATTR_OPERATION_NORM_BWD_PEER_STAT_DESCS
Definition: miopen.h:7271

MIOPEN_ATTR_OPERATION_RESAMPLE_BWD_YDESC
@ MIOPEN_ATTR_OPERATION_RESAMPLE_BWD_YDESC
Definition: miopen.h:7232

MIOPEN_ATTR_CONVOLUTION_PRE_PADDINGS
@ MIOPEN_ATTR_CONVOLUTION_PRE_PADDINGS
Definition: miopen.h:7061

MIOPEN_ATTR_REDUCTION_OPERATOR
@ MIOPEN_ATTR_REDUCTION_OPERATOR
Definition: miopen.h:7189

MIOPEN_ATTR_OPERATION_MATMUL_DESC
@ MIOPEN_ATTR_OPERATION_MATMUL_DESC
Definition: miopen.h:7183

MIOPEN_ATTR_CONVOLUTION_DILATIONS
@ MIOPEN_ATTR_CONVOLUTION_DILATIONS
Definition: miopen.h:7058

MIOPEN_ATTR_OPERATION_RESAMPLE_BWD_DYDESC
@ MIOPEN_ATTR_OPERATION_RESAMPLE_BWD_DYDESC
Definition: miopen.h:7226

MIOPEN_ATTR_OPERATION_POINTWISE_ALPHA1
@ MIOPEN_ATTR_OPERATION_POINTWISE_ALPHA1
Definition: miopen.h:7110

MIOPEN_ATTR_RESAMPLE_SPATIAL_DIMS
@ MIOPEN_ATTR_RESAMPLE_SPATIAL_DIMS
Definition: miopen.h:7210

MIOPEN_ATTR_EXECUTION_PLAN_COMPUTED_INTERMEDIATE_UIDS
@ MIOPEN_ATTR_EXECUTION_PLAN_COMPUTED_INTERMEDIATE_UIDS
Definition: miopen.h:7076

MIOPEN_ATTR_OPERATION_NORM_FWD_MEAN_DESC
@ MIOPEN_ATTR_OPERATION_NORM_FWD_MEAN_DESC
Definition: miopen.h:7248

MIOPEN_ATTR_OPERATION_BN_FINALIZE_UPDATED_RUNNING_MEAN_DESC
@ MIOPEN_ATTR_OPERATION_BN_FINALIZE_UPDATED_RUNNING_MEAN_DESC
Definition: miopen.h:7130

MIOPEN_ATTR_OPERATION_BN_BWD_WEIGHTS_INVSTD_DESC
@ MIOPEN_ATTR_OPERATION_BN_BWD_WEIGHTS_INVSTD_DESC
Definition: miopen.h:7198

MIOPEN_ATTR_KNOB_INFO_TYPE
@ MIOPEN_ATTR_KNOB_INFO_TYPE
Definition: miopen.h:7164

MIOPEN_ATTR_LAYOUT_INFO_TYPES
@ MIOPEN_ATTR_LAYOUT_INFO_TYPES
Definition: miopen.h:7162

MIOPEN_ATTR_OPERATION_BN_FINALIZE_Y_SUM_DESC
@ MIOPEN_ATTR_OPERATION_BN_FINALIZE_Y_SUM_DESC
Definition: miopen.h:7124

MIOPEN_ATTR_OPERATIONGRAPH_HANDLE
@ MIOPEN_ATTR_OPERATIONGRAPH_HANDLE
Definition: miopen.h:7140

MIOPEN_ATTR_OPERATION_NORM_BWD_DYDESC
@ MIOPEN_ATTR_OPERATION_NORM_BWD_DYDESC
Definition: miopen.h:7265

MIOPEN_ATTR_RNG_UNIFORM_DIST_MINIMUM
@ MIOPEN_ATTR_RNG_UNIFORM_DIST_MINIMUM
Definition: miopen.h:7280

MIOPEN_ATTR_POINTWISE_MATH_PREC
@ MIOPEN_ATTR_POINTWISE_MATH_PREC
Definition: miopen.h:7046

MIOPEN_ATTR_OPERATION_MATMUL_GEMM_N_OVERRIDE_DESC
@ MIOPEN_ATTR_OPERATION_MATMUL_GEMM_N_OVERRIDE_DESC
Definition: miopen.h:7186

MIOPEN_ATTR_OPERATION_GENSTATS_MODE
@ MIOPEN_ATTR_OPERATION_GENSTATS_MODE
Definition: miopen.h:7116

MIOPEN_ATTR_KNOB_CHOICE_KNOB_VALUE
@ MIOPEN_ATTR_KNOB_CHOICE_KNOB_VALUE
Definition: miopen.h:7086

MIOPEN_ATTR_VARIANT_PACK_INTERMEDIATES
@ MIOPEN_ATTR_VARIANT_PACK_INTERMEDIATES
Definition: miopen.h:7158

MIOPEN_ATTR_OPERATION_REDUCTION_YDESC
@ MIOPEN_ATTR_OPERATION_REDUCTION_YDESC
Definition: miopen.h:7193

MIOPEN_ATTR_OPERATION_CONVOLUTION_BWD_FILTER_BETA
@ MIOPEN_ATTR_OPERATION_CONVOLUTION_BWD_FILTER_BETA
Definition: miopen.h:7101

MIOPEN_ATTR_VARIANT_PACK_WORKSPACE
@ MIOPEN_ATTR_VARIANT_PACK_WORKSPACE
Definition: miopen.h:7159

MIOPEN_ATTR_TENSOR_IS_BY_VALUE
@ MIOPEN_ATTR_TENSOR_IS_BY_VALUE
Definition: miopen.h:7152

MIOPEN_ATTR_OPERATION_NORM_FWD_MODE
@ MIOPEN_ATTR_OPERATION_NORM_FWD_MODE
Definition: miopen.h:7245

MIOPEN_ATTR_OPERATION_CONVOLUTION_FORWARD_CONV_DESC
@ MIOPEN_ATTR_OPERATION_CONVOLUTION_FORWARD_CONV_DESC
Definition: miopen.h:7090

MIOPEN_ATTR_OPERATION_BN_FINALIZE_STATS_MODE
@ MIOPEN_ATTR_OPERATION_BN_FINALIZE_STATS_MODE
Definition: miopen.h:7122

MIOPEN_ATTR_OPERATION_NORM_FWD_INPUT_RUNNING_VAR_DESC
@ MIOPEN_ATTR_OPERATION_NORM_FWD_INPUT_RUNNING_VAR_DESC
Definition: miopen.h:7255

MIOPEN_ATTR_OPERATION_RESHAPE_XDESC
@ MIOPEN_ATTR_OPERATION_RESHAPE_XDESC
Definition: miopen.h:7273

MIOPEN_ATTR_OPERATION_RESAMPLE_BWD_XDESC
@ MIOPEN_ATTR_OPERATION_RESAMPLE_BWD_XDESC
Definition: miopen.h:7231

MIOPEN_ATTR_OPERATION_POINTWISE_XDESC
@ MIOPEN_ATTR_OPERATION_POINTWISE_XDESC
Definition: miopen.h:7107

MIOPEN_ATTR_VARIANT_PACK_UNIQUE_IDS
@ MIOPEN_ATTR_VARIANT_PACK_UNIQUE_IDS
Definition: miopen.h:7156

MIOPEN_ATTR_OPERATION_BN_BWD_WEIGHTS_DY_DESC
@ MIOPEN_ATTR_OPERATION_BN_BWD_WEIGHTS_DY_DESC
Definition: miopen.h:7201

MIOPEN_ATTR_OPERATION_RESAMPLE_FWD_ALPHA
@ MIOPEN_ATTR_OPERATION_RESAMPLE_FWD_ALPHA
Definition: miopen.h:7221

MIOPEN_ATTR_OPERATION_BN_FINALIZE_SCALE_DESC
@ MIOPEN_ATTR_OPERATION_BN_FINALIZE_SCALE_DESC
Definition: miopen.h:7126

MIOPEN_ATTR_OPERATION_SIGNAL_VALUE
@ MIOPEN_ATTR_OPERATION_SIGNAL_VALUE
Definition: miopen.h:7241

MIOPEN_ATTR_OPERATION_SIGNAL_FLAGDESC
@ MIOPEN_ATTR_OPERATION_SIGNAL_FLAGDESC
Definition: miopen.h:7240

MIOPEN_ATTR_OPERATION_POINTWISE_TDESC
@ MIOPEN_ATTR_OPERATION_POINTWISE_TDESC
Definition: miopen.h:7114

MIOPEN_ATTR_ENGINEHEUR_RESULTS
@ MIOPEN_ATTR_ENGINEHEUR_RESULTS
Definition: miopen.h:7066

MIOPEN_ATTR_TENSOR_BYTE_ALIGNMENT
@ MIOPEN_ATTR_TENSOR_BYTE_ALIGNMENT
Definition: miopen.h:7144

MIOPEN_ATTR_OPERATION_CONVOLUTION_BWD_FILTER_X
@ MIOPEN_ATTR_OPERATION_CONVOLUTION_BWD_FILTER_X
Definition: miopen.h:7104

MIOPEN_ATTR_OPERATION_BN_FINALIZE_ACCUM_COUNT_DESC
@ MIOPEN_ATTR_OPERATION_BN_FINALIZE_ACCUM_COUNT_DESC
Definition: miopen.h:7136

MIOPEN_ATTR_OPERATION_BN_BWD_WEIGHTS_EQ_BIAS
@ MIOPEN_ATTR_OPERATION_BN_BWD_WEIGHTS_EQ_BIAS
Definition: miopen.h:7206

MIOPEN_ATTR_OPERATION_GENSTATS_MATH_PREC
@ MIOPEN_ATTR_OPERATION_GENSTATS_MATH_PREC
Definition: miopen.h:7117

MIOPEN_ATTR_OPERATION_NORM_FWD_INPUT_RUNNING_MEAN_DESC
@ MIOPEN_ATTR_OPERATION_NORM_FWD_INPUT_RUNNING_MEAN_DESC
Definition: miopen.h:7254

MIOPEN_ATTR_OPERATION_BN_FINALIZE_EQ_SCALE_DESC
@ MIOPEN_ATTR_OPERATION_BN_FINALIZE_EQ_SCALE_DESC
Definition: miopen.h:7134

MIOPEN_ATTR_EXECUTION_PLAN_HANDLE
@ MIOPEN_ATTR_EXECUTION_PLAN_HANDLE
Definition: miopen.h:7073

MIOPEN_ATTR_OPERATION_BN_BWD_WEIGHTS_X_DESC
@ MIOPEN_ATTR_OPERATION_BN_BWD_WEIGHTS_X_DESC
Definition: miopen.h:7200

MIOPEN_ATTR_OPERATION_CONCAT_OUTPUT_DESC
@ MIOPEN_ATTR_OPERATION_CONCAT_OUTPUT_DESC
Definition: miopen.h:7237

MIOPEN_ATTR_OPERATION_NORM_BWD_EPSILON_DESC
@ MIOPEN_ATTR_OPERATION_NORM_BWD_EPSILON_DESC
Definition: miopen.h:7267

MIOPEN_ATTR_OPERATION_CONVOLUTION_BWD_DATA_BETA
@ MIOPEN_ATTR_OPERATION_CONVOLUTION_BWD_DATA_BETA
Definition: miopen.h:7095

MIOPEN_ATTR_EXECUTION_PLAN_WORKSPACE_SIZE
@ MIOPEN_ATTR_EXECUTION_PLAN_WORKSPACE_SIZE
Definition: miopen.h:7075

MIOPEN_ATTR_OPERATION_CONVOLUTION_BWD_DATA_DX
@ MIOPEN_ATTR_OPERATION_CONVOLUTION_BWD_DATA_DX
Definition: miopen.h:7098

MIOPEN_ATTR_TENSOR_VECTOR_COUNT
@ MIOPEN_ATTR_TENSOR_VECTOR_COUNT
Definition: miopen.h:7148

MIOPEN_ATTR_OPERATION_MATMUL_CDESC
@ MIOPEN_ATTR_OPERATION_MATMUL_CDESC
Definition: miopen.h:7182

MIOPEN_ATTR_REDUCTION_COMP_TYPE
@ MIOPEN_ATTR_REDUCTION_COMP_TYPE
Definition: miopen.h:7190

MIOPEN_ATTR_OPERATION_RESAMPLE_BWD_BETA
@ MIOPEN_ATTR_OPERATION_RESAMPLE_BWD_BETA
Definition: miopen.h:7229

MIOPEN_ATTR_TENSOR_VECTORIZED_DIMENSION
@ MIOPEN_ATTR_TENSOR_VECTORIZED_DIMENSION
Definition: miopen.h:7149

MIOPEN_ATTR_TENSOR_DIMENSIONS
@ MIOPEN_ATTR_TENSOR_DIMENSIONS
Definition: miopen.h:7146

MIOPEN_ATTR_OPERATION_GENSTATS_SUMDESC
@ MIOPEN_ATTR_OPERATION_GENSTATS_SUMDESC
Definition: miopen.h:7119

MIOPEN_ATTR_OPERATION_CONCAT_INPLACE_INDEX
@ MIOPEN_ATTR_OPERATION_CONCAT_INPLACE_INDEX
Definition: miopen.h:7236

MIOPEN_ATTR_OPERATION_POINTWISE_ALPHA2
@ MIOPEN_ATTR_OPERATION_POINTWISE_ALPHA2
Definition: miopen.h:7111

MIOPEN_ATTR_ENGINE_NUMERICAL_NOTE
@ MIOPEN_ATTR_ENGINE_NUMERICAL_NOTE
Definition: miopen.h:7172

MIOPEN_ATTR_ENGINE_BEHAVIOR_NOTE
@ MIOPEN_ATTR_ENGINE_BEHAVIOR_NOTE
Definition: miopen.h:7174

MIOPEN_ATTR_EXECUTION_PLAN_JSON_REPRESENTATION
@ MIOPEN_ATTR_EXECUTION_PLAN_JSON_REPRESENTATION
Definition: miopen.h:7078

MIOPEN_ATTR_RESAMPLE_STRIDES
@ MIOPEN_ATTR_RESAMPLE_STRIDES
Definition: miopen.h:7213

MIOPEN_ATTR_POINTWISE_ELU_ALPHA
@ MIOPEN_ATTR_POINTWISE_ELU_ALPHA
Definition: miopen.h:7051

MIOPEN_ATTR_OPERATION_NORM_FWD_OUTPUT_RUNNING_VAR_DESC
@ MIOPEN_ATTR_OPERATION_NORM_FWD_OUTPUT_RUNNING_VAR_DESC
Definition: miopen.h:7257

MIOPEN_ATTR_OPERATION_RESAMPLE_BWD_IDXDESC
@ MIOPEN_ATTR_OPERATION_RESAMPLE_BWD_IDXDESC
Definition: miopen.h:7227

MIOPEN_ATTR_OPERATION_RNG_SEED
@ MIOPEN_ATTR_OPERATION_RNG_SEED
Definition: miopen.h:7284

MIOPEN_ATTR_OPERATION_NORM_BWD_XDESC
@ MIOPEN_ATTR_OPERATION_NORM_BWD_XDESC
Definition: miopen.h:7262

MIOPEN_ATTR_OPERATION_POINTWISE_DXDESC
@ MIOPEN_ATTR_OPERATION_POINTWISE_DXDESC
Definition: miopen.h:7112

MIOPEN_ATTR_OPERATION_CONCAT_INPUT_DESCS
@ MIOPEN_ATTR_OPERATION_CONCAT_INPUT_DESCS
Definition: miopen.h:7235

MIOPEN_ATTR_RESAMPLE_MODE
@ MIOPEN_ATTR_RESAMPLE_MODE
Definition: miopen.h:7208

MIOPEN_ATTR_RNG_DISTRIBUTION
@ MIOPEN_ATTR_RNG_DISTRIBUTION
Definition: miopen.h:7276

MIOPEN_ATTR_OPERATION_NORM_BWD_MEAN_DESC
@ MIOPEN_ATTR_OPERATION_NORM_BWD_MEAN_DESC
Definition: miopen.h:7263

MIOPEN_ATTR_OPERATION_MATMUL_GEMM_M_OVERRIDE_DESC
@ MIOPEN_ATTR_OPERATION_MATMUL_GEMM_M_OVERRIDE_DESC
Definition: miopen.h:7185

MIOPEN_ATTR_OPERATION_NORM_FWD_PHASE
@ MIOPEN_ATTR_OPERATION_NORM_FWD_PHASE
Definition: miopen.h:7246

MIOPEN_ATTR_POINTWISE_RELU_LOWER_CLIP_SLOPE
@ MIOPEN_ATTR_POINTWISE_RELU_LOWER_CLIP_SLOPE
Definition: miopen.h:7050

MIOPEN_ATTR_OPERATION_RESHAPE_YDESC
@ MIOPEN_ATTR_OPERATION_RESHAPE_YDESC
Definition: miopen.h:7274

MIOPEN_ATTR_VARIANT_PACK_DATA_POINTERS
@ MIOPEN_ATTR_VARIANT_PACK_DATA_POINTERS
Definition: miopen.h:7157

MIOPEN_ATTR_POINTWISE_AXIS
@ MIOPEN_ATTR_POINTWISE_AXIS
Definition: miopen.h:7054

MIOPEN_ATTR_OPERATION_NORM_FWD_YDESC
@ MIOPEN_ATTR_OPERATION_NORM_FWD_YDESC
Definition: miopen.h:7258

MIOPEN_ATTR_POINTWISE_RELU_LOWER_CLIP
@ MIOPEN_ATTR_POINTWISE_RELU_LOWER_CLIP
Definition: miopen.h:7048

MIOPEN_ATTR_ENGINE_OPERATION_GRAPH
@ MIOPEN_ATTR_ENGINE_OPERATION_GRAPH
Definition: miopen.h:7169

MIOPEN_ATTR_OPERATION_MATMUL_BDESC
@ MIOPEN_ATTR_OPERATION_MATMUL_BDESC
Definition: miopen.h:7181

MIOPEN_ATTR_TENSOR_DATA_TYPE
@ MIOPEN_ATTR_TENSOR_DATA_TYPE
Definition: miopen.h:7145

MIOPEN_ATTR_OPERATION_SIGNAL_XDESC
@ MIOPEN_ATTR_OPERATION_SIGNAL_XDESC
Definition: miopen.h:7242

MIOPEN_ATTR_KNOB_INFO_MINIMUM_VALUE
@ MIOPEN_ATTR_KNOB_INFO_MINIMUM_VALUE
Definition: miopen.h:7166

MIOPEN_ATTR_OPERATION_NORM_FWD_BIAS_DESC
@ MIOPEN_ATTR_OPERATION_NORM_FWD_BIAS_DESC
Definition: miopen.h:7251

MIOPEN_ATTR_OPERATION_RESAMPLE_FWD_DESC
@ MIOPEN_ATTR_OPERATION_RESAMPLE_FWD_DESC
Definition: miopen.h:7223

MIOPEN_ATTR_RESAMPLE_PRE_PADDINGS
@ MIOPEN_ATTR_RESAMPLE_PRE_PADDINGS
Definition: miopen.h:7212

MIOPEN_ATTR_MATMUL_COMP_TYPE
@ MIOPEN_ATTR_MATMUL_COMP_TYPE
Definition: miopen.h:7177

MIOPEN_ATTR_TENSOR_UNIQUE_ID
@ MIOPEN_ATTR_TENSOR_UNIQUE_ID
Definition: miopen.h:7150

MIOPEN_ATTR_OPERATION_BN_BWD_WEIGHTS_EQ_DY_SCALE_DESC
@ MIOPEN_ATTR_OPERATION_BN_BWD_WEIGHTS_EQ_DY_SCALE_DESC
Definition: miopen.h:7204

MIOPEN_ATTR_OPERATION_CONCAT_AXIS
@ MIOPEN_ATTR_OPERATION_CONCAT_AXIS
Definition: miopen.h:7234

MIOPEN_ATTR_OPERATION_RNG_YDESC
@ MIOPEN_ATTR_OPERATION_RNG_YDESC
Definition: miopen.h:7283

MIOPEN_ATTR_ENGINE_GLOBAL_INDEX
@ MIOPEN_ATTR_ENGINE_GLOBAL_INDEX
Definition: miopen.h:7170

MIOPEN_ATTR_OPERATION_CONVOLUTION_BWD_DATA_CONV_DESC
@ MIOPEN_ATTR_OPERATION_CONVOLUTION_BWD_DATA_CONV_DESC
Definition: miopen.h:7096

MIOPEN_ATTR_ENGINEHEUR_OPERATION_GRAPH
@ MIOPEN_ATTR_ENGINEHEUR_OPERATION_GRAPH
Definition: miopen.h:7065

MIOPEN_ATTR_TENSOR_RAGGED_OFFSET_DESC
@ MIOPEN_ATTR_TENSOR_RAGGED_OFFSET_DESC
Definition: miopen.h:7154

MIOPEN_ATTR_POINTWISE_SOFTPLUS_BETA
@ MIOPEN_ATTR_POINTWISE_SOFTPLUS_BETA
Definition: miopen.h:7052

MIOPEN_ATTR_TENSOR_IS_VIRTUAL
@ MIOPEN_ATTR_TENSOR_IS_VIRTUAL
Definition: miopen.h:7151

MIOPEN_ATTR_ENGINECFG_KNOB_CHOICES
@ MIOPEN_ATTR_ENGINECFG_KNOB_CHOICES
Definition: miopen.h:7071

MIOPEN_ATTR_MATMUL_PADDING_VALUE
@ MIOPEN_ATTR_MATMUL_PADDING_VALUE
Definition: miopen.h:7178

MIOPEN_ATTR_OPERATION_BN_FINALIZE_EXP_AVERATE_FACTOR_DESC
@ MIOPEN_ATTR_OPERATION_BN_FINALIZE_EXP_AVERATE_FACTOR_DESC
Definition: miopen.h:7138

MIOPEN_ATTR_OPERATION_BN_FINALIZE_SAVED_INV_STD_DESC
@ MIOPEN_ATTR_OPERATION_BN_FINALIZE_SAVED_INV_STD_DESC
Definition: miopen.h:7133

MIOPEN_ATTR_OPERATION_CONVOLUTION_FORWARD_X
@ MIOPEN_ATTR_OPERATION_CONVOLUTION_FORWARD_X
Definition: miopen.h:7092

MIOPEN_ATTR_KNOB_INFO_STRIDE
@ MIOPEN_ATTR_KNOB_INFO_STRIDE
Definition: miopen.h:7167

MIOPEN_ATTR_RESAMPLE_WINDOW_DIMS
@ MIOPEN_ATTR_RESAMPLE_WINDOW_DIMS
Definition: miopen.h:7214

MIOPEN_ATTR_OPERATION_POINTWISE_YDESC
@ MIOPEN_ATTR_OPERATION_POINTWISE_YDESC
Definition: miopen.h:7109

MIOPEN_ATTR_OPERATION_RESAMPLE_FWD_YDESC
@ MIOPEN_ATTR_OPERATION_RESAMPLE_FWD_YDESC
Definition: miopen.h:7219

MIOPEN_ATTR_OPERATION_BN_BWD_WEIGHTS_BN_SCALE_DESC
@ MIOPEN_ATTR_OPERATION_BN_BWD_WEIGHTS_BN_SCALE_DESC
Definition: miopen.h:7199

MIOPEN_ATTR_OPERATION_CONVOLUTION_BWD_DATA_DY
@ MIOPEN_ATTR_OPERATION_CONVOLUTION_BWD_DATA_DY
Definition: miopen.h:7099

MIOPEN_ATTR_CONVOLUTION_CONV_MODE
@ MIOPEN_ATTR_CONVOLUTION_CONV_MODE
Definition: miopen.h:7057

MIOPEN_ATTR_OPERATION_REDUCTION_XDESC
@ MIOPEN_ATTR_OPERATION_REDUCTION_XDESC
Definition: miopen.h:7192

MIOPEN_ATTR_EXECUTION_PLAN_RUN_ONLY_INTERMEDIATE_UIDS
@ MIOPEN_ATTR_EXECUTION_PLAN_RUN_ONLY_INTERMEDIATE_UIDS
Definition: miopen.h:7077

MIOPEN_ATTR_OPERATION_BN_FINALIZE_MATH_PREC
@ MIOPEN_ATTR_OPERATION_BN_FINALIZE_MATH_PREC
Definition: miopen.h:7123

MIOPEN_ATTR_ENGINE_SM_COUNT_TARGET
@ MIOPEN_ATTR_ENGINE_SM_COUNT_TARGET
Definition: miopen.h:7175

MIOPEN_ATTR_OPERATION_BN_FINALIZE_EQ_BIAS_DESC
@ MIOPEN_ATTR_OPERATION_BN_FINALIZE_EQ_BIAS_DESC
Definition: miopen.h:7135

MIOPEN_ATTR_KNOB_CHOICE_KNOB_TYPE
@ MIOPEN_ATTR_KNOB_CHOICE_KNOB_TYPE
Definition: miopen.h:7085

MIOPEN_ATTR_OPERATION_RESAMPLE_BWD_DXDESC
@ MIOPEN_ATTR_OPERATION_RESAMPLE_BWD_DXDESC
Definition: miopen.h:7225

MIOPEN_ATTR_OPERATION_BN_FINALIZE_PREV_RUNNING_MEAN_DESC
@ MIOPEN_ATTR_OPERATION_BN_FINALIZE_PREV_RUNNING_MEAN_DESC
Definition: miopen.h:7128

MIOPEN_ATTR_OPERATION_POINTWISE_DYDESC
@ MIOPEN_ATTR_OPERATION_POINTWISE_DYDESC
Definition: miopen.h:7113

MIOPEN_ATTR_OPERATION_NORM_FWD_EXP_AVG_FACTOR_DESC
@ MIOPEN_ATTR_OPERATION_NORM_FWD_EXP_AVG_FACTOR_DESC
Definition: miopen.h:7253

MIOPEN_ATTR_OPERATION_BN_BWD_WEIGHTS_EQ_X_SCALE_DESC
@ MIOPEN_ATTR_OPERATION_BN_BWD_WEIGHTS_EQ_X_SCALE_DESC
Definition: miopen.h:7205

MIOPEN_ATTR_OPERATION_RNG_OFFSET_DESC
@ MIOPEN_ATTR_OPERATION_RNG_OFFSET_DESC
Definition: miopen.h:7286

MIOPEN_ATTR_OPERATION_CONVOLUTION_FORWARD_Y
@ MIOPEN_ATTR_OPERATION_CONVOLUTION_FORWARD_Y
Definition: miopen.h:7093

MIOPEN_ATTR_OPERATION_BN_FINALIZE_PREV_RUNNING_VAR_DESC
@ MIOPEN_ATTR_OPERATION_BN_FINALIZE_PREV_RUNNING_VAR_DESC
Definition: miopen.h:7129

MIOPEN_ATTR_ENGINE_LAYOUT_INFO
@ MIOPEN_ATTR_ENGINE_LAYOUT_INFO
Definition: miopen.h:7173

MIOPEN_ATTR_INTERMEDIATE_INFO_UNIQUE_ID
@ MIOPEN_ATTR_INTERMEDIATE_INFO_UNIQUE_ID
Definition: miopen.h:7080

MIOPEN_ATTR_CONVOLUTION_COMP_TYPE
@ MIOPEN_ATTR_CONVOLUTION_COMP_TYPE
Definition: miopen.h:7056

MIOPEN_ATTR_RESAMPLE_COMP_TYPE
@ MIOPEN_ATTR_RESAMPLE_COMP_TYPE
Definition: miopen.h:7209

MIOPEN_ATTR_ENGINECFG_ENGINE
@ MIOPEN_ATTR_ENGINECFG_ENGINE
Definition: miopen.h:7069

MIOPEN_ATTR_RESAMPLE_POST_PADDINGS
@ MIOPEN_ATTR_RESAMPLE_POST_PADDINGS
Definition: miopen.h:7211

MIOPEN_ATTR_RESAMPLE_PADDING_MODE
@ MIOPEN_ATTR_RESAMPLE_PADDING_MODE
Definition: miopen.h:7216

MIOPEN_ATTR_CONVOLUTION_SPATIAL_DIMS
@ MIOPEN_ATTR_CONVOLUTION_SPATIAL_DIMS
Definition: miopen.h:7062

MIOPEN_ATTR_OPERATION_NORM_FWD_OUTPUT_RUNNING_MEAN_DESC
@ MIOPEN_ATTR_OPERATION_NORM_FWD_OUTPUT_RUNNING_MEAN_DESC
Definition: miopen.h:7256

MIOPEN_ATTR_OPERATION_GENSTATS_XDESC
@ MIOPEN_ATTR_OPERATION_GENSTATS_XDESC
Definition: miopen.h:7118

MIOPEN_ATTR_OPERATION_NORM_FWD_INV_VARIANCE_DESC
@ MIOPEN_ATTR_OPERATION_NORM_FWD_INV_VARIANCE_DESC
Definition: miopen.h:7249

MIOPEN_ATTR_OPERATION_BN_FINALIZE_Y_SQ_SUM_DESC
@ MIOPEN_ATTR_OPERATION_BN_FINALIZE_Y_SQ_SUM_DESC
Definition: miopen.h:7125

MIOPEN_ATTR_ENGINE_KNOB_INFO
@ MIOPEN_ATTR_ENGINE_KNOB_INFO
Definition: miopen.h:7171

MIOPEN_ATTR_OPERATION_MATMUL_IRREGULARLY_STRIDED_BATCH_COUNT
@ MIOPEN_ATTR_OPERATION_MATMUL_IRREGULARLY_STRIDED_BATCH_COUNT
Definition: miopen.h:7184

MIOPEN_ATTR_OPERATION_CONVOLUTION_BWD_FILTER_DW
@ MIOPEN_ATTR_OPERATION_CONVOLUTION_BWD_FILTER_DW
Definition: miopen.h:7103

MIOPEN_ATTR_TENSOR_REORDERING_MODE
@ MIOPEN_ATTR_TENSOR_REORDERING_MODE
Definition: miopen.h:7153

MIOPEN_ATTR_INTERMEDIATE_INFO_SIZE
@ MIOPEN_ATTR_INTERMEDIATE_INFO_SIZE
Definition: miopen.h:7081

MIOPEN_ATTR_OPERATION_MATMUL_GEMM_K_OVERRIDE_DESC
@ MIOPEN_ATTR_OPERATION_MATMUL_GEMM_K_OVERRIDE_DESC
Definition: miopen.h:7187

MIOPEN_ATTR_OPERATION_POINTWISE_PW_DESCRIPTOR
@ MIOPEN_ATTR_OPERATION_POINTWISE_PW_DESCRIPTOR
Definition: miopen.h:7106

MIOPEN_ATTR_RNG_NORMAL_DIST_STANDARD_DEVIATION
@ MIOPEN_ATTR_RNG_NORMAL_DIST_STANDARD_DEVIATION
Definition: miopen.h:7278

MIOPEN_ATTR_INTERMEDIATE_INFO_DEPENDENT_DATA_UIDS
@ MIOPEN_ATTR_INTERMEDIATE_INFO_DEPENDENT_DATA_UIDS
Definition: miopen.h:7082

MIOPEN_ATTR_LAYOUT_INFO_TENSOR_UID
@ MIOPEN_ATTR_LAYOUT_INFO_TENSOR_UID
Definition: miopen.h:7161

MIOPEN_ATTR_ENGINEHEUR_MODE
@ MIOPEN_ATTR_ENGINEHEUR_MODE
Definition: miopen.h:7064

MIOPEN_ATTR_OPERATION_RESAMPLE_BWD_ALPHA
@ MIOPEN_ATTR_OPERATION_RESAMPLE_BWD_ALPHA
Definition: miopen.h:7228

MIOPEN_ATTR_OPERATION_RESAMPLE_BWD_DESC
@ MIOPEN_ATTR_OPERATION_RESAMPLE_BWD_DESC
Definition: miopen.h:7230

MIOPEN_ATTR_OPERATION_BN_FINALIZE_EPSILON_DESC
@ MIOPEN_ATTR_OPERATION_BN_FINALIZE_EPSILON_DESC
Definition: miopen.h:7137

MIOPEN_ATTR_OPERATION_POINTWISE_BDESC
@ MIOPEN_ATTR_OPERATION_POINTWISE_BDESC
Definition: miopen.h:7108

MIOPEN_ATTR_POINTWISE_MODE
@ MIOPEN_ATTR_POINTWISE_MODE
Definition: miopen.h:7045

MIOPEN_ATTR_ENGINECFG_INTERMEDIATE_INFO
@ MIOPEN_ATTR_ENGINECFG_INTERMEDIATE_INFO
Definition: miopen.h:7070

MIOPEN_ATTR_OPERATION_CONVOLUTION_BWD_FILTER_DY
@ MIOPEN_ATTR_OPERATION_CONVOLUTION_BWD_FILTER_DY
Definition: miopen.h:7105

MIOPEN_ATTR_OPERATION_NORM_BWD_DXDESC
@ MIOPEN_ATTR_OPERATION_NORM_BWD_DXDESC
Definition: miopen.h:7270

MIOPEN_ATTR_POINTWISE_NAN_PROPAGATION
@ MIOPEN_ATTR_POINTWISE_NAN_PROPAGATION
Definition: miopen.h:7047

MIOPEN_ATTR_INTERMEDIATE_INFO_DEPENDENT_ATTRIBUTES
@ MIOPEN_ATTR_INTERMEDIATE_INFO_DEPENDENT_ATTRIBUTES
Definition: miopen.h:7083

MIOPEN_ATTR_POINTWISE_RELU_UPPER_CLIP
@ MIOPEN_ATTR_POINTWISE_RELU_UPPER_CLIP
Definition: miopen.h:7049

MIOPEN_ATTR_OPERATION_BN_BWD_WEIGHTS_DBN_BIAS_DESC
@ MIOPEN_ATTR_OPERATION_BN_BWD_WEIGHTS_DBN_BIAS_DESC
Definition: miopen.h:7203

MIOPEN_ATTR_RNG_BERNOULLI_DIST_PROBABILITY
@ MIOPEN_ATTR_RNG_BERNOULLI_DIST_PROBABILITY
Definition: miopen.h:7281

MIOPEN_ATTR_ENGINEHEUR_SM_COUNT_TARGET
@ MIOPEN_ATTR_ENGINEHEUR_SM_COUNT_TARGET
Definition: miopen.h:7067

MIOPEN_ATTR_OPERATION_BN_FINALIZE_BIAS_DESC
@ MIOPEN_ATTR_OPERATION_BN_FINALIZE_BIAS_DESC
Definition: miopen.h:7127

MIOPEN_ATTR_OPERATION_BN_FINALIZE_UPDATED_RUNNING_VAR_DESC
@ MIOPEN_ATTR_OPERATION_BN_FINALIZE_UPDATED_RUNNING_VAR_DESC
Definition: miopen.h:7131

MIOPEN_ATTR_RNG_NORMAL_DIST_MEAN
@ MIOPEN_ATTR_RNG_NORMAL_DIST_MEAN
Definition: miopen.h:7277

MIOPEN_ATTR_OPERATION_BN_BWD_WEIGHTS_MATH_PREC
@ MIOPEN_ATTR_OPERATION_BN_BWD_WEIGHTS_MATH_PREC
Definition: miopen.h:7196

MIOPEN_ATTR_OPERATION_BN_BWD_WEIGHTS_MEAN_DESC
@ MIOPEN_ATTR_OPERATION_BN_BWD_WEIGHTS_MEAN_DESC
Definition: miopen.h:7197

MIOPEN_ATTR_OPERATION_NORM_FWD_PEER_STAT_DESCS
@ MIOPEN_ATTR_OPERATION_NORM_FWD_PEER_STAT_DESCS
Definition: miopen.h:7259

MIOPEN_ATTR_OPERATION_NORM_FWD_SCALE_DESC
@ MIOPEN_ATTR_OPERATION_NORM_FWD_SCALE_DESC
Definition: miopen.h:7250

MIOPEN_ATTR_OPERATION_GENSTATS_SQSUMDESC
@ MIOPEN_ATTR_OPERATION_GENSTATS_SQSUMDESC
Definition: miopen.h:7120

MIOPEN_ATTR_EXECUTION_PLAN_ENGINE_CONFIG
@ MIOPEN_ATTR_EXECUTION_PLAN_ENGINE_CONFIG
Definition: miopen.h:7074

MIOPEN_ATTR_OPERATION_RESAMPLE_FWD_BETA
@ MIOPEN_ATTR_OPERATION_RESAMPLE_FWD_BETA
Definition: miopen.h:7222

MIOPEN_ATTR_OPERATION_NORM_BWD_DBIAS_DESC
@ MIOPEN_ATTR_OPERATION_NORM_BWD_DBIAS_DESC
Definition: miopen.h:7269

MIOPEN_ATTR_OPERATION_NORM_BWD_SCALE_DESC
@ MIOPEN_ATTR_OPERATION_NORM_BWD_SCALE_DESC
Definition: miopen.h:7266

MIOPEN_ATTR_OPERATION_CONVOLUTION_BWD_DATA_ALPHA
@ MIOPEN_ATTR_OPERATION_CONVOLUTION_BWD_DATA_ALPHA
Definition: miopen.h:7094

MIOPEN_ATTR_RNG_UNIFORM_DIST_MAXIMUM
@ MIOPEN_ATTR_RNG_UNIFORM_DIST_MAXIMUM
Definition: miopen.h:7279

MIOPEN_ATTR_OPERATION_CONVOLUTION_BWD_FILTER_CONV_DESC
@ MIOPEN_ATTR_OPERATION_CONVOLUTION_BWD_FILTER_CONV_DESC
Definition: miopen.h:7102

MIOPEN_ATTR_TENSOR_STRIDES
@ MIOPEN_ATTR_TENSOR_STRIDES
Definition: miopen.h:7147

MIOPEN_ATTR_CONVOLUTION_FILTER_STRIDES
@ MIOPEN_ATTR_CONVOLUTION_FILTER_STRIDES
Definition: miopen.h:7059

MIOPEN_ATTR_OPERATION_CONVOLUTION_BWD_FILTER_ALPHA
@ MIOPEN_ATTR_OPERATION_CONVOLUTION_BWD_FILTER_ALPHA
Definition: miopen.h:7100

MIOPEN_ATTR_POINTWISE_SWISH_BETA
@ MIOPEN_ATTR_POINTWISE_SWISH_BETA
Definition: miopen.h:7053

MIOPEN_ATTR_OPERATION_RESAMPLE_FWD_IDXDESC
@ MIOPEN_ATTR_OPERATION_RESAMPLE_FWD_IDXDESC
Definition: miopen.h:7220

MIOPEN_ATTR_OPERATION_REDUCTION_DESC
@ MIOPEN_ATTR_OPERATION_REDUCTION_DESC
Definition: miopen.h:7194

MIOPEN_ATTR_OPERATION_NORM_FWD_XDESC
@ MIOPEN_ATTR_OPERATION_NORM_FWD_XDESC
Definition: miopen.h:7247

MIOPEN_ATTR_OPERATION_MATMUL_ADESC
@ MIOPEN_ATTR_OPERATION_MATMUL_ADESC
Definition: miopen.h:7180

MIOPEN_ATTR_OPERATIONGRAPH_ENGINE_GLOBAL_COUNT
@ MIOPEN_ATTR_OPERATIONGRAPH_ENGINE_GLOBAL_COUNT
Definition: miopen.h:7142

MIOPEN_ATTR_OPERATION_BN_FINALIZE_SAVED_MEAN_DESC
@ MIOPEN_ATTR_OPERATION_BN_FINALIZE_SAVED_MEAN_DESC
Definition: miopen.h:7132

MIOPEN_RNG_DISTRIBUTION_BERNOULLI
@ MIOPEN_RNG_DISTRIBUTION_BERNOULLI
Definition: miopen.h:7514

MIOPEN_RNG_DISTRIBUTION_UNIFORM
@ MIOPEN_RNG_DISTRIBUTION_UNIFORM
Definition: miopen.h:7515

MIOPEN_RNG_DISTRIBUTION_NORMAL
@ MIOPEN_RNG_DISTRIBUTION_NORMAL
Definition: miopen.h:7516

MIOPEN_BACKEND_OPERATION_CONCAT_DESCRIPTOR
@ MIOPEN_BACKEND_OPERATION_CONCAT_DESCRIPTOR
Definition: miopen.h:7012

MIOPEN_BACKEND_RESAMPLE_DESCRIPTOR
@ MIOPEN_BACKEND_RESAMPLE_DESCRIPTOR
Definition: miopen.h:7030

MIOPEN_BACKEND_ENGINECFG_DESCRIPTOR
@ MIOPEN_BACKEND_ENGINECFG_DESCRIPTOR
Definition: miopen.h:7004

MIOPEN_BACKEND_POINTWISE_DESCRIPTOR
@ MIOPEN_BACKEND_POINTWISE_DESCRIPTOR
Definition: miopen.h:7028

MIOPEN_BACKEND_OPERATION_RESAMPLE_FWD_DESCRIPTOR
@ MIOPEN_BACKEND_OPERATION_RESAMPLE_FWD_DESCRIPTOR
Definition: miopen.h:7023

MIOPEN_BACKEND_CONVOLUTION_DESCRIPTOR
@ MIOPEN_BACKEND_CONVOLUTION_DESCRIPTOR
Definition: miopen.h:7002

MIOPEN_BACKEND_OPERATION_RNG_DESCRIPTOR
@ MIOPEN_BACKEND_OPERATION_RNG_DESCRIPTOR
Definition: miopen.h:7025

MIOPEN_BACKEND_KNOB_INFO_DESCRIPTOR
@ MIOPEN_BACKEND_KNOB_INFO_DESCRIPTOR
Definition: miopen.h:7009

MIOPEN_BACKEND_RNG_DESCRIPTOR
@ MIOPEN_BACKEND_RNG_DESCRIPTOR
Definition: miopen.h:7031

MIOPEN_BACKEND_OPERATION_POINTWISE_DESCRIPTOR
@ MIOPEN_BACKEND_OPERATION_POINTWISE_DESCRIPTOR
Definition: miopen.h:7020

MIOPEN_BACKEND_OPERATION_NORM_FORWARD_DESCRIPTOR
@ MIOPEN_BACKEND_OPERATION_NORM_FORWARD_DESCRIPTOR
Definition: miopen.h:7019

MIOPEN_BACKEND_ENGINEHEUR_DESCRIPTOR
@ MIOPEN_BACKEND_ENGINEHEUR_DESCRIPTOR
Definition: miopen.h:7005

MIOPEN_BACKEND_OPERATION_RESHAPE_DESCRIPTOR
@ MIOPEN_BACKEND_OPERATION_RESHAPE_DESCRIPTOR
Definition: miopen.h:7024

MIOPEN_BACKEND_LAYOUT_INFO_DESCRIPTOR
@ MIOPEN_BACKEND_LAYOUT_INFO_DESCRIPTOR
Definition: miopen.h:7010

MIOPEN_BACKEND_OPERATION_REDUCTION_DESCRIPTOR
@ MIOPEN_BACKEND_OPERATION_REDUCTION_DESCRIPTOR
Definition: miopen.h:7021

MIOPEN_BACKEND_TENSOR_DESCRIPTOR
@ MIOPEN_BACKEND_TENSOR_DESCRIPTOR
Definition: miopen.h:7032

MIOPEN_BACKEND_OPERATION_RESAMPLE_BWD_DESCRIPTOR
@ MIOPEN_BACKEND_OPERATION_RESAMPLE_BWD_DESCRIPTOR
Definition: miopen.h:7022

MIOPEN_BACKEND_OPERATIONGRAPH_DESCRIPTOR
@ MIOPEN_BACKEND_OPERATIONGRAPH_DESCRIPTOR
Definition: miopen.h:7027

MIOPEN_BACKEND_OPERATION_CONVOLUTION_FORWARD_DESCRIPTOR
@ MIOPEN_BACKEND_OPERATION_CONVOLUTION_FORWARD_DESCRIPTOR
Definition: miopen.h:7015

MIOPEN_BACKEND_OPERATION_CONVOLUTION_BACKWARD_FILTER_DESCRIPTOR
@ MIOPEN_BACKEND_OPERATION_CONVOLUTION_BACKWARD_FILTER_DESCRIPTOR
Definition: miopen.h:7014

MIOPEN_BACKEND_INTERMEDIATE_INFO_DESCRIPTOR
@ MIOPEN_BACKEND_INTERMEDIATE_INFO_DESCRIPTOR
Definition: miopen.h:7007

MIOPEN_BACKEND_ENGINE_DESCRIPTOR
@ MIOPEN_BACKEND_ENGINE_DESCRIPTOR
Definition: miopen.h:7003

MIOPEN_BACKEND_MATMUL_DESCRIPTOR
@ MIOPEN_BACKEND_MATMUL_DESCRIPTOR
Definition: miopen.h:7011

MIOPEN_BACKEND_OPERATION_GEN_STATS_DESCRIPTOR
@ MIOPEN_BACKEND_OPERATION_GEN_STATS_DESCRIPTOR
Definition: miopen.h:7016

MIOPEN_BACKEND_VARIANT_PACK_DESCRIPTOR
@ MIOPEN_BACKEND_VARIANT_PACK_DESCRIPTOR
Definition: miopen.h:7033

MIOPEN_BACKEND_REDUCTION_DESCRIPTOR
@ MIOPEN_BACKEND_REDUCTION_DESCRIPTOR
Definition: miopen.h:7029

MIOPEN_BACKEND_OPERATION_CONVOLUTION_BACKWARD_DATA_DESCRIPTOR
@ MIOPEN_BACKEND_OPERATION_CONVOLUTION_BACKWARD_DATA_DESCRIPTOR
Definition: miopen.h:7013

MIOPEN_BACKEND_OPERATION_MATMUL_DESCRIPTOR
@ MIOPEN_BACKEND_OPERATION_MATMUL_DESCRIPTOR
Definition: miopen.h:7017

MIOPEN_BACKEND_OPERATION_NORM_BACKWARD_DESCRIPTOR
@ MIOPEN_BACKEND_OPERATION_NORM_BACKWARD_DESCRIPTOR
Definition: miopen.h:7018

MIOPEN_BACKEND_OPERATION_SIGNAL_DESCRIPTOR
@ MIOPEN_BACKEND_OPERATION_SIGNAL_DESCRIPTOR
Definition: miopen.h:7026

MIOPEN_BACKEND_EXECUTION_PLAN_DESCRIPTOR
@ MIOPEN_BACKEND_EXECUTION_PLAN_DESCRIPTOR
Definition: miopen.h:7006

MIOPEN_BACKEND_KNOB_CHOICE_DESCRIPTOR
@ MIOPEN_BACKEND_KNOB_CHOICE_DESCRIPTOR
Definition: miopen.h:7008

SCALE
@ SCALE
Definition: miopen.h:7527

BILINEAR
@ BILINEAR
Definition: miopen.h:7528

DEFAULT
@ DEFAULT
Definition: miopen.h:7526

ERROR_STATE
@ ERROR_STATE
Definition: miopen.h:7529

MIOPEN_TYPE_RNG_DISTRIBUTION
@ MIOPEN_TYPE_RNG_DISTRIBUTION
Definition: miopen.h:7328

MIOPEN_TYPE_FLOAT
@ MIOPEN_TYPE_FLOAT
Definition: miopen.h:7303

MIOPEN_TYPE_NUMERICAL_NOTE
@ MIOPEN_TYPE_NUMERICAL_NOTE
Definition: miopen.h:7310

MIOPEN_TYPE_RESAMPLE_MODE
@ MIOPEN_TYPE_RESAMPLE_MODE
Definition: miopen.h:7320

MIOPEN_TYPE_INT32
@ MIOPEN_TYPE_INT32
Definition: miopen.h:7322

MIOPEN_TYPE_POINTWISE_MODE
@ MIOPEN_TYPE_POINTWISE_MODE
Definition: miopen.h:7313

MIOPEN_TYPE_HANDLE
@ MIOPEN_TYPE_HANDLE
Definition: miopen.h:7299

MIOPEN_TYPE_HEUR_MODE
@ MIOPEN_TYPE_HEUR_MODE
Definition: miopen.h:7307

MIOPEN_TYPE_CONVOLUTION_MODE
@ MIOPEN_TYPE_CONVOLUTION_MODE
Definition: miopen.h:7306

MIOPEN_TYPE_TENSOR_REORDERING_MODE
@ MIOPEN_TYPE_TENSOR_REORDERING_MODE
Definition: miopen.h:7319

MIOPEN_TYPE_BOOLEAN
@ MIOPEN_TYPE_BOOLEAN
Definition: miopen.h:7301

MIOPEN_TYPE_NORM_MODE
@ MIOPEN_TYPE_NORM_MODE
Definition: miopen.h:7326

MIOPEN_TYPE_FRACTION
@ MIOPEN_TYPE_FRACTION
Definition: miopen.h:7325

MIOPEN_TYPE_BACKEND_DESCRIPTOR
@ MIOPEN_TYPE_BACKEND_DESCRIPTOR
Definition: miopen.h:7314

MIOPEN_TYPE_ATTRIB_NAME
@ MIOPEN_TYPE_ATTRIB_NAME
Definition: miopen.h:7312

MIOPEN_TYPE_BEHAVIOR_NOTE
@ MIOPEN_TYPE_BEHAVIOR_NOTE
Definition: miopen.h:7318

MIOPEN_TYPE_DATA_TYPE
@ MIOPEN_TYPE_DATA_TYPE
Definition: miopen.h:7300

MIOPEN_TYPE_NAN_PROPOGATION
@ MIOPEN_TYPE_NAN_PROPOGATION
Definition: miopen.h:7309

MIOPEN_TYPE_DOUBLE
@ MIOPEN_TYPE_DOUBLE
Definition: miopen.h:7304

MIOPEN_TYPE_SIGNAL_MODE
@ MIOPEN_TYPE_SIGNAL_MODE
Definition: miopen.h:7324

MIOPEN_TYPE_CHAR
@ MIOPEN_TYPE_CHAR
Definition: miopen.h:7323

MIOPEN_TYPE_PADDING_MODE
@ MIOPEN_TYPE_PADDING_MODE
Definition: miopen.h:7321

MIOPEN_TYPE_INT64
@ MIOPEN_TYPE_INT64
Definition: miopen.h:7302

MIOPEN_TYPE_REDUCTION_OPERATOR_TYPE
@ MIOPEN_TYPE_REDUCTION_OPERATOR_TYPE
Definition: miopen.h:7317

MIOPEN_TYPE_LAYOUT_TYPE
@ MIOPEN_TYPE_LAYOUT_TYPE
Definition: miopen.h:7311

MIOPEN_TYPE_GENSTATS_MODE
@ MIOPEN_TYPE_GENSTATS_MODE
Definition: miopen.h:7315

MIOPEN_TYPE_VOID_PTR
@ MIOPEN_TYPE_VOID_PTR
Definition: miopen.h:7305

MIOPEN_TYPE_BN_FINALIZE_STATS_MODE
@ MIOPEN_TYPE_BN_FINALIZE_STATS_MODE
Definition: miopen.h:7316

MIOPEN_TYPE_KNOB_TYPE
@ MIOPEN_TYPE_KNOB_TYPE
Definition: miopen.h:7308

MIOPEN_TYPE_NORM_FWD_PHASE
@ MIOPEN_TYPE_NORM_FWD_PHASE
Definition: miopen.h:7327

miopenSetLRNDescriptor
miopenStatus_t miopenSetLRNDescriptor(const miopenLRNDescriptor_t lrnDesc, miopenLRNMode_t mode, unsigned int lrnN, double lrnAlpha, double lrnBeta, double lrnK)
Sets a LRN layer descriptor details.

miopenCreateLRNDescriptor
miopenStatus_t miopenCreateLRNDescriptor(miopenLRNDescriptor_t *lrnDesc)
Creates a local response normalization (LRN) layer descriptor.

miopenGetLRNDescriptor
miopenStatus_t miopenGetLRNDescriptor(const miopenLRNDescriptor_t lrnDesc, miopenLRNMode_t *mode, unsigned int *lrnN, double *lrnAlpha, double *lrnBeta, double *lrnK)
Gets a LRN layer descriptor details.

miopenLRNBackward
miopenStatus_t miopenLRNBackward(miopenHandle_t handle, const miopenLRNDescriptor_t lrnDesc, const void *alpha, const miopenTensorDescriptor_t yDesc, const void *y, const miopenTensorDescriptor_t dyDesc, const void *dy, const miopenTensorDescriptor_t xDesc, const void *x, const void *beta, const miopenTensorDescriptor_t dxDesc, void *dx, const void *workSpace)
Execute a LRN backward layer.

miopenLRNGetWorkSpaceSize
miopenStatus_t miopenLRNGetWorkSpaceSize(const miopenTensorDescriptor_t yDesc, size_t *workSpaceSize)
Determine the workspace requirements.

miopenLRNMode_t
miopenLRNMode_t
Definition: miopen.h:483

miopenLRNForward
miopenStatus_t miopenLRNForward(miopenHandle_t handle, const miopenLRNDescriptor_t lrnDesc, const void *alpha, const miopenTensorDescriptor_t xDesc, const void *x, const void *beta, const miopenTensorDescriptor_t yDesc, void *y, bool do_backward, void *workSpace)
Execute a LRN forward layer.

miopenDestroyLRNDescriptor
miopenStatus_t miopenDestroyLRNDescriptor(miopenLRNDescriptor_t lrnDesc)
Destroys the LRN descriptor object.

miopenGetCTCLossWorkspaceSize
miopenStatus_t miopenGetCTCLossWorkspaceSize(miopenHandle_t handle, const miopenTensorDescriptor_t probsDesc, const miopenTensorDescriptor_t gradientsDesc, const int *labels, const int *labelLengths, const int *inputLengths, miopenCTCLossAlgo_t algo, const miopenCTCLossDescriptor_t ctcLossDesc, size_t *workSpaceSize)
Query the amount of memory required to execute miopenCTCLoss.

miopenGetSoftMarginLossForwardWorkspaceSize
miopenStatus_t miopenGetSoftMarginLossForwardWorkspaceSize(miopenHandle_t handle, miopenTensorDescriptor_t inputDesc, miopenTensorDescriptor_t targetDesc, miopenTensorDescriptor_t outputDesc, miopenLossReductionMode_t reduction, size_t *sizeInBytes)
Helper function to query the minimum workspace size required by the SoftMarginLossForward call.

miopenLossReductionMode_t
miopenLossReductionMode_t
Definition: miopen.h:8586

miopenGetMultiMarginLossForwardWorkspaceSize
miopenStatus_t miopenGetMultiMarginLossForwardWorkspaceSize(miopenHandle_t handle, miopenTensorDescriptor_t inputDesc, miopenTensorDescriptor_t targetDesc, miopenTensorDescriptor_t weightDesc, miopenTensorDescriptor_t outputDesc, long p, float margin, miopenLossReductionMode_t reduction, size_t *sizeInBytes)
Helper function to query the minimum workspace size required by the MultiMarginLossForward call.

miopenCTCLossAlgo_t
miopenCTCLossAlgo_t
Definition: miopen.h:5701

miopenSetCTCLossDescriptor
miopenStatus_t miopenSetCTCLossDescriptor(miopenCTCLossDescriptor_t ctcLossDesc, miopenDataType_t dataType, const int blank_label_id, bool apply_softmax_layer)
Set the details of a CTC loss function descriptor.

miopenCTCLoss
miopenStatus_t miopenCTCLoss(miopenHandle_t handle, const miopenTensorDescriptor_t probsDesc, const void *probs, const int *labels, const int *labelLengths, const int *inputLengths, void *losses, const miopenTensorDescriptor_t gradientsDesc, void *gradients, miopenCTCLossAlgo_t algo, const miopenCTCLossDescriptor_t ctcLossDesc, void *workSpace, size_t workSpaceSize)
Execute forward inference for CTCLoss layer.

miopenGetCTCLossDescriptor
miopenStatus_t miopenGetCTCLossDescriptor(miopenCTCLossDescriptor_t ctcLossDesc, miopenDataType_t *dataType, int *blank_label_id, bool *apply_softmax_layer)
Retrieves a CTC loss function descriptor's details.

miopenCreateCTCLossDescriptor
miopenStatus_t miopenCreateCTCLossDescriptor(miopenCTCLossDescriptor_t *ctcLossDesc)
Create a CTC loss function Descriptor.

miopenMultiMarginLossForward
miopenStatus_t miopenMultiMarginLossForward(miopenHandle_t handle, miopenTensorDescriptor_t inputDesc, const void *input, miopenTensorDescriptor_t targetDesc, const void *target, miopenTensorDescriptor_t weightDesc, const void *weight, miopenTensorDescriptor_t outputDesc, void *output, long p, float margin, miopenLossReductionMode_t reduction, void *workspace, size_t workspaceSizeInBytes)
Execute a MultiMarginLoss forward layer.

miopenSoftMarginLossBackward
miopenStatus_t miopenSoftMarginLossBackward(miopenHandle_t handle, miopenTensorDescriptor_t inputDesc, const void *input, miopenTensorDescriptor_t targetDesc, const void *target, miopenTensorDescriptor_t doutputDesc, const void *doutput, miopenTensorDescriptor_t dinputDesc, void *dinput, miopenLossReductionMode_t reduction)
Execute a SoftMarginLoss backward layer.

miopenSoftMarginLossForward
miopenStatus_t miopenSoftMarginLossForward(miopenHandle_t handle, miopenTensorDescriptor_t inputDesc, const void *input, miopenTensorDescriptor_t targetDesc, const void *target, miopenTensorDescriptor_t outputDesc, void *output, miopenLossReductionMode_t reduction, void *workspace=nullptr, size_t workspaceSizeInBytes=0)
Execute a SoftMarginLoss forward layer.

miopenDestroyCTCLossDescriptor
miopenStatus_t miopenDestroyCTCLossDescriptor(miopenCTCLossDescriptor_t ctcLossDesc)
Destroys a CTC loss function descriptor object.

MIOPEN_CTC_LOSS_ALGO_DETERMINISTIC
@ MIOPEN_CTC_LOSS_ALGO_DETERMINISTIC
Definition: miopen.h:5702

miopenRNNMode_t
miopenRNNMode_t
Definition: miopen.h:4306

miopenGetRNNDescriptor_V2
miopenStatus_t miopenGetRNNDescriptor_V2(miopenRNNDescriptor_t rnnDesc, int *hiddenSize, int *layer, miopenDropoutDescriptor_t *dropoutDesc, miopenRNNInputMode_t *inputMode, miopenRNNDirectionMode_t *dirMode, miopenRNNMode_t *rnnMode, miopenRNNBiasMode_t *biasMode, miopenRNNAlgo_t *algoMode, miopenDataType_t *dataType)
Retrieves a RNN layer descriptor's details version 2. This version enables retrieving information of ...

miopenRNNInputMode_t
miopenRNNInputMode_t
Definition: miopen.h:4317

miopenSetRNNLayerBias
miopenStatus_t miopenSetRNNLayerBias(miopenHandle_t handle, miopenRNNDescriptor_t rnnDesc, const int layer, miopenTensorDescriptor_t xDesc, miopenTensorDescriptor_t wDesc, void *w, const int biasID, miopenTensorDescriptor_t biasDesc, const void *layerBias)
Sets a bias for a specific layer in an RNN stack.

miopenRNNBackwardWeightsSeqTensor
miopenStatus_t miopenRNNBackwardWeightsSeqTensor(miopenHandle_t handle, const miopenRNNDescriptor_t rnnDesc, const miopenSeqTensorDescriptor_t xDesc, const void *x, const miopenTensorDescriptor_t hDesc, const void *hx, const miopenSeqTensorDescriptor_t yDesc, const void *y, void *dw, size_t weightSpaceSize, void *workSpace, size_t workSpaceNumBytes, const void *reserveSpace, size_t reserveSpaceNumBytes)
Execute backward weights for recurrent layer.

miopenGetRNNParamsSize
miopenStatus_t miopenGetRNNParamsSize(miopenHandle_t handle, miopenRNNDescriptor_t rnnDesc, miopenTensorDescriptor_t xDesc, size_t *numBytes, miopenDataType_t dtype)
Query the amount of parameter memory required for RNN training.

miopenGetRNNLayerBiasOffset
miopenStatus_t miopenGetRNNLayerBiasOffset(miopenRNNDescriptor_t rnnDesc, const int layer, miopenTensorDescriptor_t xDesc, const int biasID, miopenTensorDescriptor_t biasDesc, size_t *layerBiasOffset)
Gets a bias index offset for a specific layer in an RNN stack.

miopenGetRNNLayerParamOffset
miopenStatus_t miopenGetRNNLayerParamOffset(miopenRNNDescriptor_t rnnDesc, const int layer, miopenTensorDescriptor_t xDesc, const int paramID, miopenTensorDescriptor_t paramDesc, size_t *layerParamOffset)
Gets an index offset for a specific weight matrix for a layer in the RNN stack.

miopenRNNDirectionMode_t
miopenRNNDirectionMode_t
Definition: miopen.h:4339

miopenRNNBackwardSeqData
miopenStatus_t miopenRNNBackwardSeqData(miopenHandle_t handle, const miopenRNNDescriptor_t rnnDesc, const miopenSeqTensorDescriptor_t yDesc, const void *y, const void *dy, const miopenTensorDescriptor_t hDesc, const void *hx, const void *dhy, void *dhx, const miopenTensorDescriptor_t cDesc, const void *cx, const void *dcy, void *dcx, const miopenSeqTensorDescriptor_t xDesc, void *dx, const void *w, size_t weightSpaceSize, void *workSpace, size_t workSpaceNumBytes, void *reserveSpace, size_t reserveSpaceNumBytes)
Execute backward data for recurrent layer.

miopenRNNBiasMode_t
miopenRNNBiasMode_t
Definition: miopen.h:4348

miopenGetRNNLayerBias
miopenStatus_t miopenGetRNNLayerBias(miopenHandle_t handle, miopenRNNDescriptor_t rnnDesc, const int layer, miopenTensorDescriptor_t xDesc, miopenTensorDescriptor_t wDesc, const void *w, const int biasID, miopenTensorDescriptor_t biasDesc, void *layerBias)
Gets a bias for a specific layer in an RNN stack.

miopenRNNBackwardWeights
miopenStatus_t miopenRNNBackwardWeights(miopenHandle_t handle, const miopenRNNDescriptor_t rnnDesc, const int sequenceLen, const miopenTensorDescriptor_t *xDesc, const void *x, const miopenTensorDescriptor_t hxDesc, const void *hx, const miopenTensorDescriptor_t *yDesc, const void *y, const miopenTensorDescriptor_t dwDesc, void *dw, void *workSpace, size_t workSpaceNumBytes, const void *reserveSpace, size_t reserveSpaceNumBytes)
Execute backward weights for recurrent layer.

miopenGetRNNTrainingReserveSize
miopenStatus_t miopenGetRNNTrainingReserveSize(miopenHandle_t handle, miopenRNNDescriptor_t rnnDesc, const int sequenceLen, const miopenTensorDescriptor_t *xDesc, size_t *numBytes)
Query the amount of memory required for RNN training.

miopenGetRNNLayerBiasSize
miopenStatus_t miopenGetRNNLayerBiasSize(miopenHandle_t handle, miopenRNNDescriptor_t rnnDesc, const int layer, const int biasID, size_t *numBytes)
Gets the number of bytes of a bias.

miopenSetRNNDescriptor
miopenStatus_t miopenSetRNNDescriptor(miopenRNNDescriptor_t rnnDesc, const int hsize, const int nlayers, miopenRNNInputMode_t inMode, miopenRNNDirectionMode_t direction, miopenRNNMode_t rnnMode, miopenRNNBiasMode_t biasMode, miopenRNNAlgo_t algo, miopenDataType_t dataType)
Set the details of the RNN descriptor.

miopenRNNBaseLayout_t
miopenRNNBaseLayout_t
Definition: miopen.h:4383

miopenRNNBackwardData
miopenStatus_t miopenRNNBackwardData(miopenHandle_t handle, const miopenRNNDescriptor_t rnnDesc, const int sequenceLen, const miopenTensorDescriptor_t *yDesc, const void *y, const miopenTensorDescriptor_t *dyDesc, const void *dy, const miopenTensorDescriptor_t dhyDesc, const void *dhy, const miopenTensorDescriptor_t dcyDesc, const void *dcy, const miopenTensorDescriptor_t wDesc, const void *w, const miopenTensorDescriptor_t hxDesc, const void *hx, const miopenTensorDescriptor_t cxDesc, const void *cx, const miopenTensorDescriptor_t *dxDesc, void *dx, const miopenTensorDescriptor_t dhxDesc, void *dhx, const miopenTensorDescriptor_t dcxDesc, void *dcx, void *workSpace, size_t workSpaceNumBytes, void *reserveSpace, size_t reserveSpaceNumBytes)
Execute backward data for recurrent layer.

miopenGetRNNDescriptor
miopenStatus_t miopenGetRNNDescriptor(miopenRNNDescriptor_t rnnDesc, miopenRNNMode_t *rnnMode, miopenRNNAlgo_t *algoMode, miopenRNNInputMode_t *inputMode, miopenRNNDirectionMode_t *dirMode, miopenRNNBiasMode_t *biasMode, int *hiddenSize, int *layer)
Retrieves a RNN layer descriptor's details.

miopenRNNAlgo_t
miopenRNNAlgo_t
Definition: miopen.h:4326

miopenGetRNNTempSpaceSizes
miopenStatus_t miopenGetRNNTempSpaceSizes(miopenHandle_t handle, miopenRNNDescriptor_t rnnDesc, miopenSeqTensorDescriptor_t xDesc, miopenRNNFWDMode_t fwdMode, size_t *workSpaceSize, size_t *reserveSpaceSize)
Query the amount of additional memory required for this RNN layer execution.

miopenGetRNNPaddingMode
miopenStatus_t miopenGetRNNPaddingMode(miopenRNNDescriptor_t rnnDesc, miopenRNNPaddingMode_t *paddingMode)
This function retrieves the RNN padding mode from the RNN descriptor.

miopenRNNForward
miopenStatus_t miopenRNNForward(miopenHandle_t handle, const miopenRNNDescriptor_t rnnDesc, miopenRNNFWDMode_t fwdMode, const miopenSeqTensorDescriptor_t xDesc, const void *x, const miopenTensorDescriptor_t hDesc, const void *hx, void *hy, const miopenTensorDescriptor_t cDesc, const void *cx, void *cy, const miopenSeqTensorDescriptor_t yDesc, void *y, const void *w, size_t weightSpaceSize, void *workSpace, size_t workSpaceNumBytes, void *reserveSpace, size_t reserveSpaceNumBytes)
Execute forward training for recurrent layer.

miopenGetRNNDataSeqTensorDescriptor
miopenStatus_t miopenGetRNNDataSeqTensorDescriptor(miopenSeqTensorDescriptor_t seqTensorDesc, miopenDataType_t *dataType, miopenRNNBaseLayout_t *layout, int *maxSequenceLen, int *batchSize, int *vectorSize, int sequenceLenArrayLimit, int *sequenceLenArray, void *paddingMarker)
Get shape of RNN seqData tensor.

miopenGetRNNInputTensorSize
miopenStatus_t miopenGetRNNInputTensorSize(miopenHandle_t handle, miopenRNNDescriptor_t rnnDesc, const int seqLen, miopenTensorDescriptor_t *xDesc, size_t *numBytes)
Obtain the size in bytes of the RNN input tensor.

miopenRNNFWDMode_t
miopenRNNFWDMode_t
Definition: miopen.h:4374

miopenSetRNNLayerParam
miopenStatus_t miopenSetRNNLayerParam(miopenHandle_t handle, miopenRNNDescriptor_t rnnDesc, const int layer, miopenTensorDescriptor_t xDesc, miopenTensorDescriptor_t wDesc, void *w, const int paramID, miopenTensorDescriptor_t paramDesc, const void *layerParam)
Sets a weight matrix for a specific layer in an RNN stack.

miopenGetRNNLayerParamSize
miopenStatus_t miopenGetRNNLayerParamSize(miopenHandle_t handle, miopenRNNDescriptor_t rnnDesc, const int layer, miopenTensorDescriptor_t xDesc, const int paramID, size_t *numBytes)
Gets the number of bytes of a parameter matrix.

miopenCreateRNNDescriptor
miopenStatus_t miopenCreateRNNDescriptor(miopenRNNDescriptor_t *rnnDesc)
Create a RNN layer Descriptor.

miopenRNNGEMMalgoMode_t
miopenRNNGEMMalgoMode_t
Definition: miopen.h:4357

miopenGetRNNLayerParam
miopenStatus_t miopenGetRNNLayerParam(miopenHandle_t handle, miopenRNNDescriptor_t rnnDesc, const int layer, miopenTensorDescriptor_t xDesc, miopenTensorDescriptor_t wDesc, const void *w, const int paramID, miopenTensorDescriptor_t paramDesc, void *layerParam)
Gets a weight matrix for a specific layer in an RNN stack.

miopenGetRNNWorkspaceSize
miopenStatus_t miopenGetRNNWorkspaceSize(miopenHandle_t handle, const miopenRNNDescriptor_t rnnDesc, const int sequenceLen, const miopenTensorDescriptor_t *xDesc, size_t *numBytes)
Query the amount of memory required to execute the RNN layer.

miopenSetRNNDataSeqTensorDescriptor
miopenStatus_t miopenSetRNNDataSeqTensorDescriptor(miopenSeqTensorDescriptor_t seqTensorDesc, miopenDataType_t dataType, miopenRNNBaseLayout_t layout, int maxSequenceLen, int batchSize, int vectorSize, const int *sequenceLenArray, void *paddingMarker)
Set shape of RNN seqData tensor.

miopenGetRNNParamsDescriptor
miopenStatus_t miopenGetRNNParamsDescriptor(miopenHandle_t handle, miopenRNNDescriptor_t rnnDesc, miopenTensorDescriptor_t xDesc, miopenTensorDescriptor_t wDesc, miopenDataType_t dtype)
Obtain a weight tensor descriptor for RNNs.

miopenRNNForwardTraining
miopenStatus_t miopenRNNForwardTraining(miopenHandle_t handle, const miopenRNNDescriptor_t rnnDesc, const int sequenceLen, const miopenTensorDescriptor_t *xDesc, const void *x, const miopenTensorDescriptor_t hxDesc, const void *hx, const miopenTensorDescriptor_t cxDesc, const void *cx, const miopenTensorDescriptor_t wDesc, const void *w, const miopenTensorDescriptor_t *yDesc, void *y, const miopenTensorDescriptor_t hyDesc, void *hy, const miopenTensorDescriptor_t cyDesc, void *cy, void *workSpace, size_t workSpaceNumBytes, void *reserveSpace, size_t reserveSpaceNumBytes)
Execute forward training for recurrent layer.

miopenRNNPaddingMode_t
miopenRNNPaddingMode_t
Definition: miopen.h:4365

miopenSetRNNDescriptor_V2
miopenStatus_t miopenSetRNNDescriptor_V2(miopenRNNDescriptor_t rnnDesc, const int hsize, const int nlayers, miopenDropoutDescriptor_t dropoutDesc, miopenRNNInputMode_t inMode, miopenRNNDirectionMode_t direction, miopenRNNMode_t rnnMode, miopenRNNBiasMode_t biasMode, miopenRNNAlgo_t algo, miopenDataType_t dataType)
Set the details of the RNN descriptor version 2. This version enables the use of dropout in rnn.

miopenDestroyRNNDescriptor
miopenStatus_t miopenDestroyRNNDescriptor(miopenRNNDescriptor_t rnnDesc)
Destroys the tensor descriptor object.

miopenGetRNNHiddenTensorSize
miopenStatus_t miopenGetRNNHiddenTensorSize(miopenHandle_t handle, miopenRNNDescriptor_t rnnDesc, const int seqLen, miopenTensorDescriptor_t *xDesc, size_t *numBytes)
Obtain the size in bytes of the RNN hidden tensor.

miopenSetRNNPaddingMode
miopenStatus_t miopenSetRNNPaddingMode(miopenRNNDescriptor_t rnnDesc, miopenRNNPaddingMode_t paddingMode)
Sets a bias for a specific layer in an RNN stack.

miopenRNNForwardInference
miopenStatus_t miopenRNNForwardInference(miopenHandle_t handle, miopenRNNDescriptor_t rnnDesc, const int sequenceLen, const miopenTensorDescriptor_t *xDesc, const void *x, const miopenTensorDescriptor_t hxDesc, const void *hx, const miopenTensorDescriptor_t cxDesc, const void *cx, const miopenTensorDescriptor_t wDesc, const void *w, const miopenTensorDescriptor_t *yDesc, void *y, const miopenTensorDescriptor_t hyDesc, void *hy, const miopenTensorDescriptor_t cyDesc, void *cy, void *workSpace, size_t workSpaceNumBytes)
Execute forward inference for RNN layer.

miopenRNNTANH
@ miopenRNNTANH
Definition: miopen.h:4308

miopenLSTM
@ miopenLSTM
Definition: miopen.h:4309

miopenGRU
@ miopenGRU
Definition: miopen.h:4310

miopenRNNRELU
@ miopenRNNRELU
Definition: miopen.h:4307

miopenRNNlinear
@ miopenRNNlinear
Definition: miopen.h:4318

miopenRNNskip
@ miopenRNNskip
Definition: miopen.h:4319

miopenRNNbidirection
@ miopenRNNbidirection
Definition: miopen.h:4341

miopenRNNunidirection
@ miopenRNNunidirection
Definition: miopen.h:4340

miopenRNNwithBias
@ miopenRNNwithBias
Definition: miopen.h:4350

miopenRNNNoBias
@ miopenRNNNoBias
Definition: miopen.h:4349

miopenRNNDataSeqMajorPadded
@ miopenRNNDataSeqMajorPadded
Definition: miopen.h:4386

miopenRNNDataSeqMajorNotPadded
@ miopenRNNDataSeqMajorNotPadded
Definition: miopen.h:4385

miopenRNNDataBatchMajorPadded
@ miopenRNNDataBatchMajorPadded
Definition: miopen.h:4387

miopenRNNDataUnknownLayout
@ miopenRNNDataUnknownLayout
Definition: miopen.h:4384

miopenRNNroundedDynamic
@ miopenRNNroundedDynamic
Definition: miopen.h:4331

miopenRNNfundamental
@ miopenRNNfundamental
Definition: miopen.h:4329

miopenRNNdefault
@ miopenRNNdefault
Definition: miopen.h:4327

miopenRNNTraining
@ miopenRNNTraining
Definition: miopen.h:4375

miopenRNNInference
@ miopenRNNInference
Definition: miopen.h:4376

miopenRNNAlgoGEMM
@ miopenRNNAlgoGEMM
Definition: miopen.h:4358

miopenRNNIOWithPadding
@ miopenRNNIOWithPadding
Definition: miopen.h:4367

miopenRNNIONotPadded
@ miopenRNNIONotPadded
Definition: miopen.h:4366

miopenGetPReLUBackwardWorkspaceSize
miopenStatus_t miopenGetPReLUBackwardWorkspaceSize(miopenHandle_t handle, miopenTensorDescriptor_t inputDesc, miopenTensorDescriptor_t weightDesc, size_t *sizeInBytes)
Helper function to query the minimum workspace size required by the PReLU backward call.

miopenPReLUBackward
miopenStatus_t miopenPReLUBackward(miopenHandle_t handle, void *workspace, size_t workspaceSizeInBytes, miopenTensorDescriptor_t inputDesc, const void *input, miopenTensorDescriptor_t weightDesc, const void *weight, miopenTensorDescriptor_t doutputDesc, const void *doutput, miopenTensorDescriptor_t dinputDesc, void *dinput, miopenTensorDescriptor_t dweightDesc, void *dweight)
Execute a PReLU backward layer.

miopenReduceExtremeForward
miopenStatus_t miopenReduceExtremeForward(miopenHandle_t handle, const miopenTensorDescriptor_t xDesc, const void *x, const int32_t dim, const miopenReduceExtremeOp_t reduceExtremeOp, const miopenTensorDescriptor_t yDesc, void *y, const miopenTensorDescriptor_t indiceDesc, void *indice)
Find the the extreme (minimum, maximum) value and index of a tensor across Dimension.

miopenReduceExtremeOp_t
miopenReduceExtremeOp_t
Definition: miopen.h:6745

miopenRoPEBackward
miopenStatus_t miopenRoPEBackward(miopenHandle_t handle, const miopenTensorDescriptor_t dyDesc, const void *dy, const miopenTensorDescriptor_t cosDesc, const void *cos, const miopenTensorDescriptor_t sinDesc, const void *sin, const miopenTensorDescriptor_t dxDesc, void *dx)
Execute a rope backward layer.

miopenRoPEForward
miopenStatus_t miopenRoPEForward(miopenHandle_t handle, const miopenTensorDescriptor_t xDesc, const void *x, const miopenTensorDescriptor_t cosDesc, const void *cos, const miopenTensorDescriptor_t sinDesc, const void *sin, const miopenTensorDescriptor_t yDesc, void *y)
Execute a rope forward layer.

miopenFusedAdam
miopenStatus_t miopenFusedAdam(miopenHandle_t handle, const miopenTensorDescriptor_t paramDesc, void *param, const miopenTensorDescriptor_t gradDesc, const void *grad, const miopenTensorDescriptor_t expAvgDesc, void *expAvg, const miopenTensorDescriptor_t expAvgSqDesc, void *expAvgSq, const miopenTensorDescriptor_t maxExpAvgSqDesc, void *maxExpAvgSq, const miopenTensorDescriptor_t stateStepDesc, void *stateStep, const unsigned int state_step, const float lr, const float beta1, const float beta2, const float weight_decay, const float eps, const bool amsgrad, const bool maximize, const bool adamw, const miopenTensorDescriptor_t gradScaleDesc, const void *gradScale, const miopenTensorDescriptor_t foundInfDesc, const void *foundInf)
Perform Fused Adam optimization for a single tensor (Adaptive Moment Estimation).

miopenTransformersAdamW
miopenStatus_t miopenTransformersAdamW(miopenHandle_t handle, const miopenTensorDescriptor_t paramDesc, void *param, const miopenTensorDescriptor_t gradDesc, const void *grad, const miopenTensorDescriptor_t expAvgDesc, void *expAvg, const miopenTensorDescriptor_t expAvgSqDesc, void *expAvgSq, const miopenTensorDescriptor_t stateStepDesc, void *stateStep, const unsigned int state_step, const float lr, const float beta1, const float beta2, const float weight_decay, const float eps, const bool correct_bias, const miopenTensorDescriptor_t gradScaleDesc, const void *gradScale, const miopenTensorDescriptor_t foundInfDesc, const void *foundInf)
Implements Adam algorithm with weight decay fix as introduced in Decoupled Weight Decay Regularizatio...

miopenFusedAdamWithOutput
miopenStatus_t miopenFusedAdamWithOutput(miopenHandle_t handle, const miopenTensorDescriptor_t paramInDesc, void *paramIn, const miopenTensorDescriptor_t paramOutDesc, void *paramOut, const miopenTensorDescriptor_t paramOutFloat16Desc, void *paramOutFloat16, const miopenTensorDescriptor_t gradInDesc, const void *gradIn, const miopenTensorDescriptor_t expAvgInDesc, void *expAvgIn, const miopenTensorDescriptor_t expAvgOutDesc, void *expAvgOut, const miopenTensorDescriptor_t expAvgSqInDesc, void *expAvgSqIn, const miopenTensorDescriptor_t expAvgSqOutDesc, void *expAvgSqOut, const miopenTensorDescriptor_t maxExpAvgSqInDesc, void *maxExpAvgSqIn, const miopenTensorDescriptor_t maxExpAvgSqOutDesc, void *maxExpAvgSqOut, const miopenTensorDescriptor_t stateStepInDesc, void *stateStepIn, const miopenTensorDescriptor_t stateStepOutDesc, void *stateStepOut, const unsigned int state_step, const float lr, const float beta1, const float beta2, const float weight_decay, const float eps, const bool amsgrad, const bool maximize, const bool adamw, const miopenTensorDescriptor_t gradScaleDesc, const void *gradScale, const miopenTensorDescriptor_t foundInfDesc, const void *foundInf)
Execute single tensor Adam optimization and receive the result in a separate output tensor.

miopenTransformersAdamWWithOutput
miopenStatus_t miopenTransformersAdamWWithOutput(miopenHandle_t handle, const miopenTensorDescriptor_t paramInDesc, void *paramIn, const miopenTensorDescriptor_t paramOutDesc, void *paramOut, const miopenTensorDescriptor_t paramOutFloat16Desc, void *paramOutFloat16, const miopenTensorDescriptor_t gradInDesc, const void *gradIn, const miopenTensorDescriptor_t expAvgInDesc, void *expAvgIn, const miopenTensorDescriptor_t expAvgOutDesc, void *expAvgOut, const miopenTensorDescriptor_t expAvgSqInDesc, void *expAvgSqIn, const miopenTensorDescriptor_t expAvgSqOutDesc, void *expAvgSqOut, const miopenTensorDescriptor_t stateStepInDesc, void *stateStepIn, const miopenTensorDescriptor_t stateStepOutDesc, void *stateStepOut, const unsigned int state_step, const float lr, const float beta1, const float beta2, const float weight_decay, const float eps, const float step_size, const bool correct_bias, const miopenTensorDescriptor_t gradScaleDesc, const void *gradScale, const miopenTensorDescriptor_t foundInfDesc, const void *foundInf)
Execute single tensor Adam optimization and receive the result in a separate output tensor.

miopenReduceTensorIndices_t
miopenReduceTensorIndices_t
Definition: miopen.h:611

miopenSetReduceTensorDescriptor
miopenStatus_t miopenSetReduceTensorDescriptor(miopenReduceTensorDescriptor_t reduceTensorDesc, miopenReduceTensorOp_t reduceTensorOp, miopenDataType_t reduceTensorCompType, miopenNanPropagation_t reduceTensorNanOpt, miopenReduceTensorIndices_t reduceTensorIndices, miopenIndicesType_t reduceTensorIndicesType)
Initialize a ReduceTensor descriptor object.

miopenCreateReduceTensorDescriptor
miopenStatus_t miopenCreateReduceTensorDescriptor(miopenReduceTensorDescriptor_t *reduceTensorDesc)
Creates the ReduceTensor descriptor object.

miopenReduceTensorOp_t
miopenReduceTensorOp_t
Definition: miopen.h:576

miopenIndicesType_t
miopenIndicesType_t
Definition: miopen.h:621

miopenReduceTensor
miopenStatus_t miopenReduceTensor(miopenHandle_t handle, const miopenReduceTensorDescriptor_t reduceTensorDesc, void *indices, size_t indicesSizeInBytes, void *workspace, size_t workspaceSizeInBytes, const void *alpha, const miopenTensorDescriptor_t aDesc, const void *A, const void *beta, const miopenTensorDescriptor_t cDesc, void *C)
TensorReduce function doing reduction on tensor A by implementing C = alpha * reduceOp(A)

miopenGetReductionIndicesSize
miopenStatus_t miopenGetReductionIndicesSize(miopenHandle_t handle, const miopenReduceTensorDescriptor_t reduceTensorDesc, const miopenTensorDescriptor_t aDesc, const miopenTensorDescriptor_t cDesc, size_t *sizeInBytes)
Helper function to query the minimum index space size required by the ReduceTensor call.

miopenDestroyReduceTensorDescriptor
miopenStatus_t miopenDestroyReduceTensorDescriptor(miopenReduceTensorDescriptor_t reduceTensorDesc)
Destroy the ReduceTensor descriptor object.

miopenGetReductionWorkspaceSize
miopenStatus_t miopenGetReductionWorkspaceSize(miopenHandle_t handle, const miopenReduceTensorDescriptor_t reduceTensorDesc, const miopenTensorDescriptor_t aDesc, const miopenTensorDescriptor_t cDesc, size_t *sizeInBytes)
Helper function to query the minimum workspace size required by the ReduceTensor call.

miopenGetReduceTensorDescriptor
miopenStatus_t miopenGetReduceTensorDescriptor(const miopenReduceTensorDescriptor_t reduceTensorDesc, miopenReduceTensorOp_t *reduceTensorOp, miopenDataType_t *reduceTensorCompType, miopenNanPropagation_t *reduceTensorNanOpt, miopenReduceTensorIndices_t *reduceTensorIndices, miopenIndicesType_t *reduceTensorIndicesType)
Query a ReduceTensor descriptor object.

miopenActivationForward
miopenStatus_t miopenActivationForward(miopenHandle_t handle, const miopenActivationDescriptor_t activDesc, const void *alpha, const miopenTensorDescriptor_t xDesc, const void *x, const void *beta, const miopenTensorDescriptor_t yDesc, void *y)
Execute an activation forward layer.

miopenGLUBackward
miopenStatus_t miopenGLUBackward(miopenHandle_t handle, const miopenTensorDescriptor_t inputDesc, const void *input, const miopenTensorDescriptor_t outputGradDesc, const void *outputGrad, const miopenTensorDescriptor_t inputGradDesc, void *inputGrad, const uint32_t dim)
Execute a GLU backward layer.

miopenActivationBackward
miopenStatus_t miopenActivationBackward(miopenHandle_t handle, const miopenActivationDescriptor_t activDesc, const void *alpha, const miopenTensorDescriptor_t yDesc, const void *y, const miopenTensorDescriptor_t dyDesc, const void *dy, const miopenTensorDescriptor_t xDesc, const void *x, const void *beta, const miopenTensorDescriptor_t dxDesc, void *dx)
Execute a activation backwards layer.

miopenActivationMode_t
miopenActivationMode_t
Definition: miopen.h:522

miopenSetActivationDescriptor
miopenStatus_t miopenSetActivationDescriptor(const miopenActivationDescriptor_t activDesc, miopenActivationMode_t mode, double activAlpha, double activBeta, double activGamma)
Sets the activation layer descriptor details.

miopenCreateActivationDescriptor
miopenStatus_t miopenCreateActivationDescriptor(miopenActivationDescriptor_t *activDesc)
Creates the Activation descriptor object.

miopenGetActivationDescriptor
miopenStatus_t miopenGetActivationDescriptor(const miopenActivationDescriptor_t activDesc, miopenActivationMode_t *mode, double *activAlpha, double *activBeta, double *activGamma)
Gets the activation layer descriptor details.

miopenGLUForward
miopenStatus_t miopenGLUForward(miopenHandle_t handle, const miopenTensorDescriptor_t inputDesc, const void *input, const miopenTensorDescriptor_t outputDesc, void *output, const uint32_t dim)
Execute a GLU forward layer.

miopenDestroyActivationDescriptor
miopenStatus_t miopenDestroyActivationDescriptor(miopenActivationDescriptor_t activDesc)
Destroys the activation descriptor object.

miopenBatchNormalizationForwardInference
miopenStatus_t miopenBatchNormalizationForwardInference(miopenHandle_t handle, miopenBatchNormMode_t bn_mode, void *alpha, void *beta, const miopenTensorDescriptor_t xDesc, const void *x, const miopenTensorDescriptor_t yDesc, void *y, const miopenTensorDescriptor_t bnScaleBiasMeanVarDesc, void *bnScale, void *bnBias, void *estimatedMean, void *estimatedVariance, double epsilon)
Execute forward inference layer for batch normalization.

miopenBatchNormalizationForwardInference_V2
miopenStatus_t miopenBatchNormalizationForwardInference_V2(miopenHandle_t handle, miopenBatchNormMode_t bn_mode, void *alpha, void *beta, const miopenTensorDescriptor_t xDesc, const void *x, const miopenTensorDescriptor_t yDesc, void *y, const miopenTensorDescriptor_t scaleDesc, const miopenTensorDescriptor_t biasDesc, const miopenTensorDescriptor_t estMeanDesc, const miopenTensorDescriptor_t estVarianceDesc, void *bnScale, void *bnBias, void *estimatedMean, void *estimatedVariance, double epsilon)
Execute forward inference layer for batch normalization.

miopenBatchNormForwardTrainingActivation
miopenStatus_t miopenBatchNormForwardTrainingActivation(miopenHandle_t handle, miopenBatchNormMode_t bn_mode, void *alpha, void *beta, const miopenTensorDescriptor_t xDesc, const void *x, const miopenTensorDescriptor_t yDesc, void *y, const miopenTensorDescriptor_t scaleDesc, const miopenTensorDescriptor_t biasVarDesc, const miopenTensorDescriptor_t savedMeanDesc, const miopenTensorDescriptor_t savedVarDesc, void *bnScale, void *bnBias, double expAvgFactor, void *resultRunningMean, void *resultRunningVariance, double epsilon, void *resultSaveMean, void *resultSaveInvVariance, const miopenActivationDescriptor_t activDesc)
Execute forward training layer for batch normalization with fused activation.

miopenBatchNormBackwardActivation
miopenStatus_t miopenBatchNormBackwardActivation(miopenHandle_t handle, miopenBatchNormMode_t bn_mode, const void *alphaDataDiff, const void *betaDataDiff, const void *alphaParamDiff, const void *betaParamDiff, const miopenTensorDescriptor_t xDesc, const void *x, const miopenTensorDescriptor_t dyDesc, const void *dy, const miopenTensorDescriptor_t dxDesc, void *dx, const miopenTensorDescriptor_t scaleDesc, const miopenTensorDescriptor_t biasDesc, const miopenTensorDescriptor_t savedMeanDesc, const miopenTensorDescriptor_t savedVarianceDesc, const void *bnScale, const void *bnBias, void *resultBnScaleDiff, void *resultBnBiasDiff, double epsilon, const void *savedMean, const void *savedInvVariance, const miopenActivationDescriptor_t activDesc)
Execute backwards propagation layer for batch normalization with fused activation.

miopenBatchNormalizationForwardTraining_V3
miopenStatus_t miopenBatchNormalizationForwardTraining_V3(miopenHandle_t handle, miopenBatchNormMode_t bn_mode, void *alpha, void *beta, const miopenTensorDescriptor_t xDesc, const void *x, const miopenTensorDescriptor_t yDesc, void *y, const miopenTensorDescriptor_t scaleDesc, const miopenTensorDescriptor_t biasVarDesc, const miopenTensorDescriptor_t savedMeanDesc, const miopenTensorDescriptor_t savedVarDesc, void *bnScale, void *bnBias, double expAvgFactor, const void *prevResultRunningMean, const void *prevResultRunningVariance, void *nextResultRunningMean, void *nextResultRunningVariance, double epsilon, void *resultSaveMean, void *resultSaveInvVariance)
Execute forward training layer for batch normalization.

miopenBatchNormalizationForwardTraining
miopenStatus_t miopenBatchNormalizationForwardTraining(miopenHandle_t handle, miopenBatchNormMode_t bn_mode, void *alpha, void *beta, const miopenTensorDescriptor_t xDesc, const void *x, const miopenTensorDescriptor_t yDesc, void *y, const miopenTensorDescriptor_t bnScaleBiasMeanVarDesc, void *bnScale, void *bnBias, double expAvgFactor, void *resultRunningMean, void *resultRunningVariance, double epsilon, void *resultSaveMean, void *resultSaveInvVariance)
Execute forward training layer for batch normalization.

miopenBatchNormalizationForwardTraining_V2
miopenStatus_t miopenBatchNormalizationForwardTraining_V2(miopenHandle_t handle, miopenBatchNormMode_t bn_mode, void *alpha, void *beta, const miopenTensorDescriptor_t xDesc, const void *x, const miopenTensorDescriptor_t yDesc, void *y, const miopenTensorDescriptor_t scaleDesc, const miopenTensorDescriptor_t biasVarDesc, const miopenTensorDescriptor_t savedMeanDesc, const miopenTensorDescriptor_t savedVarDesc, void *bnScale, void *bnBias, double expAvgFactor, void *resultRunningMean, void *resultRunningVariance, double epsilon, void *resultSaveMean, void *resultSaveInvVariance)
Execute forward training layer for batch normalization.

miopenBatchNormalizationBackward_V2
miopenStatus_t miopenBatchNormalizationBackward_V2(miopenHandle_t handle, miopenBatchNormMode_t bn_mode, const void *alphaDataDiff, const void *betaDataDiff, const void *alphaParamDiff, const void *betaParamDiff, const miopenTensorDescriptor_t xDesc, const void *x, const miopenTensorDescriptor_t dyDesc, const void *dy, const miopenTensorDescriptor_t dxDesc, void *dx, const miopenTensorDescriptor_t scaleDesc, const miopenTensorDescriptor_t biasDesc, const miopenTensorDescriptor_t savedMeanDesc, const miopenTensorDescriptor_t savedVarDesc, const void *bnScale, void *resultBnScaleDiff, void *resultBnBiasDiff, double epsilon, const void *savedMean, const void *savedInvVariance)
Execute backwards propagation layer for batch normalization.

miopenBatchNormForwardTrainingActivation_V2
miopenStatus_t miopenBatchNormForwardTrainingActivation_V2(miopenHandle_t handle, miopenBatchNormMode_t bn_mode, void *alpha, void *beta, const miopenTensorDescriptor_t xDesc, const void *x, const miopenTensorDescriptor_t yDesc, void *y, const miopenTensorDescriptor_t scaleDesc, const miopenTensorDescriptor_t biasVarDesc, const miopenTensorDescriptor_t savedMeanDesc, const miopenTensorDescriptor_t savedVarDesc, void *bnScale, void *bnBias, double expAvgFactor, const void *prevResultRunningMean, const void *prevResultRunningVariance, void *nextResultRunningMean, void *nextResultRunningVariance, double epsilon, void *resultSaveMean, void *resultSaveInvVariance, const miopenActivationDescriptor_t activDesc)
Execute forward training layer for batch normalization with fused activation.

miopenBatchNormalizationForwardInferenceInvVariance
miopenStatus_t miopenBatchNormalizationForwardInferenceInvVariance(miopenHandle_t handle, miopenBatchNormMode_t bn_mode, void *alpha, void *beta, const miopenTensorDescriptor_t xDesc, const void *x, const miopenTensorDescriptor_t yDesc, void *y, const miopenTensorDescriptor_t scaleDesc, const miopenTensorDescriptor_t biasDesc, const miopenTensorDescriptor_t estMeanDesc, const miopenTensorDescriptor_t estInvVarianceDesc, void *bnScale, void *bnBias, void *estimatedMean, void *estimatedInvVariance)
Execute forward inference layer for batch normalization using inverse variance.

miopenBatchNormalizationBackward
miopenStatus_t miopenBatchNormalizationBackward(miopenHandle_t handle, miopenBatchNormMode_t bn_mode, const void *alphaDataDiff, const void *betaDataDiff, const void *alphaParamDiff, const void *betaParamDiff, const miopenTensorDescriptor_t xDesc, const void *x, const miopenTensorDescriptor_t dyDesc, const void *dy, const miopenTensorDescriptor_t dxDesc, void *dx, const miopenTensorDescriptor_t bnScaleBiasDiffDesc, const void *bnScale, void *resultBnScaleDiff, void *resultBnBiasDiff, double epsilon, const void *savedMean, const void *savedInvVariance)
Execute backwards propagation layer for batch normalization.

miopenBatchNormMode_t
miopenBatchNormMode_t
Definition: miopen.h:512

miopenBatchNormForwardInferenceActivation
miopenStatus_t miopenBatchNormForwardInferenceActivation(miopenHandle_t handle, miopenBatchNormMode_t bn_mode, void *alpha, void *beta, const miopenTensorDescriptor_t xDesc, const void *x, const miopenTensorDescriptor_t yDesc, void *y, const miopenTensorDescriptor_t scaleDesc, const miopenTensorDescriptor_t biasDesc, const miopenTensorDescriptor_t estMeanDesc, const miopenTensorDescriptor_t estVarianceDesc, void *bnScale, void *bnBias, void *estimatedMean, void *estimatedVariance, double epsilon, const miopenActivationDescriptor_t activDesc)
Execute forward inference layer for batch normalization with fused activation.

miopenBatchNormForwardInferenceActivationInvVariance
miopenStatus_t miopenBatchNormForwardInferenceActivationInvVariance(miopenHandle_t handle, miopenBatchNormMode_t bn_mode, void *alpha, void *beta, const miopenTensorDescriptor_t xDesc, const void *x, const miopenTensorDescriptor_t yDesc, void *y, const miopenTensorDescriptor_t scaleDesc, const miopenTensorDescriptor_t biasDesc, const miopenTensorDescriptor_t estMeanDesc, const miopenTensorDescriptor_t estInvVarianceDesc, void *bnScale, void *bnBias, void *estimatedMean, void *estimatedInvVariance, const miopenActivationDescriptor_t activDesc)
Execute forward inference layer for batch normalization with fused activation using inverse variance.

miopenDeriveBNTensorDescriptor
miopenStatus_t miopenDeriveBNTensorDescriptor(miopenTensorDescriptor_t derivedBnDesc, const miopenTensorDescriptor_t xDesc, miopenBatchNormMode_t bn_mode)
Derive tensor for gamma and beta from input tensor descriptor.

miopenCatForward
miopenStatus_t miopenCatForward(miopenHandle_t handle, const int32_t xCount, const miopenTensorDescriptor_t *xDescs, const void *const *xs, const miopenTensorDescriptor_t yDesc, void *y, const int32_t dim)
Execute a cat forward layer.

miopenInitConvolutionNdDescriptor
miopenStatus_t miopenInitConvolutionNdDescriptor(miopenConvolutionDescriptor_t convDesc, int spatialDim, const int *padA, const int *strideA, const int *dilationA, miopenConvolutionMode_t c_mode)
Creates a N-dimensional convolution layer descriptor.

miopenConvolutionForwardImmediate
miopenStatus_t miopenConvolutionForwardImmediate(miopenHandle_t handle, const miopenTensorDescriptor_t wDesc, const void *w, const miopenTensorDescriptor_t xDesc, const void *x, const miopenConvolutionDescriptor_t convDesc, const miopenTensorDescriptor_t yDesc, void *y, void *workSpace, size_t workSpaceSize, const uint64_t solution_id)
Executes the Forward convolution operation based on the provided solution ID.

miopenConvolutionBackwardDataCompileSolution
miopenStatus_t miopenConvolutionBackwardDataCompileSolution(miopenHandle_t handle, const miopenTensorDescriptor_t dyDesc, const miopenTensorDescriptor_t wDesc, const miopenConvolutionDescriptor_t convDesc, const miopenTensorDescriptor_t dxDesc, const uint64_t solution_id)
Compiles the solution provided by the user, this solution may be acquired by the miopenConvolutionBac...

miopenConvolutionForwardGetSolutionWorkspaceSize
miopenStatus_t miopenConvolutionForwardGetSolutionWorkspaceSize(miopenHandle_t handle, const miopenTensorDescriptor_t wDesc, const miopenTensorDescriptor_t xDesc, const miopenConvolutionDescriptor_t convDesc, const miopenTensorDescriptor_t yDesc, const uint64_t solution_id, size_t *workSpaceSize)
Returns the workspace size required for a particular solution id.

miopenConvolutionForward
miopenStatus_t miopenConvolutionForward(miopenHandle_t handle, const void *alpha, const miopenTensorDescriptor_t xDesc, const void *x, const miopenTensorDescriptor_t wDesc, const void *w, const miopenConvolutionDescriptor_t convDesc, miopenConvFwdAlgorithm_t algo, const void *beta, const miopenTensorDescriptor_t yDesc, void *y, void *workSpace, size_t workSpaceSize)
Execute a forward convolution layer.

miopenGetConvolutionGroupCount
miopenStatus_t miopenGetConvolutionGroupCount(miopenConvolutionDescriptor_t convDesc, int *groupCount)
Get the number of groups to be used in Group/Depthwise convolution.

miopenGetConvolutionFindMode
miopenStatus_t miopenGetConvolutionFindMode(const miopenConvolutionDescriptor_t convDesc, miopenConvolutionFindMode_t *findMode)
Reads the Find Mode attribute from the convolution descriptor.

miopenInitConvolutionDescriptor
miopenStatus_t miopenInitConvolutionDescriptor(miopenConvolutionDescriptor_t convDesc, miopenConvolutionMode_t c_mode, int pad_h, int pad_w, int stride_h, int stride_w, int dilation_h, int dilation_w)
Creates a 2-D convolution layer descriptor.

miopenConvAlgorithm_t
miopenConvAlgorithm_t
Definition: miopen.h:1276

miopenConvolutionBackwardData
miopenStatus_t miopenConvolutionBackwardData(miopenHandle_t handle, const void *alpha, const miopenTensorDescriptor_t dyDesc, const void *dy, const miopenTensorDescriptor_t wDesc, const void *w, const miopenConvolutionDescriptor_t convDesc, miopenConvBwdDataAlgorithm_t algo, const void *beta, const miopenTensorDescriptor_t dxDesc, void *dx, void *workSpace, size_t workSpaceSize)
Execute a backward data convolution layer.

miopenGetConvolutionAttribute
miopenStatus_t miopenGetConvolutionAttribute(miopenConvolutionDescriptor_t convDesc, const miopenConvolutionAttrib_t attr, int *value)
Get the attribute of the convolution descriptor.

miopenGetConvolutionNdForwardOutputDim
miopenStatus_t miopenGetConvolutionNdForwardOutputDim(miopenConvolutionDescriptor_t convDesc, const miopenTensorDescriptor_t inputTensorDesc, const miopenTensorDescriptor_t filterDesc, int *nDim, int *outputTensorDimA)
Get the shape of a resulting N-dimensional tensor from a (N-2)-dimensional convolution.

miopenConvolutionBackwardWeightsCompileSolution
miopenStatus_t miopenConvolutionBackwardWeightsCompileSolution(miopenHandle_t handle, const miopenTensorDescriptor_t dyDesc, const miopenTensorDescriptor_t xDesc, const miopenConvolutionDescriptor_t convDesc, const miopenTensorDescriptor_t dwDesc, const uint64_t solution_id)
Compiles the solution provided by the user, this solution may be acquired by the miopenConvolutionBac...

miopenFindConvolutionBackwardWeightsAlgorithm
miopenStatus_t miopenFindConvolutionBackwardWeightsAlgorithm(miopenHandle_t handle, const miopenTensorDescriptor_t dyDesc, const void *dy, const miopenTensorDescriptor_t xDesc, const void *x, const miopenConvolutionDescriptor_t convDesc, const miopenTensorDescriptor_t dwDesc, void *dw, const int requestAlgoCount, int *returnedAlgoCount, miopenConvAlgoPerf_t *perfResults, void *workSpace, size_t workSpaceSize, bool exhaustiveSearch)
Search and run the backwards weights convolutional algorithms and return a list of kernel times.

miopenGetConvolutionForwardOutputDim
miopenStatus_t miopenGetConvolutionForwardOutputDim(miopenConvolutionDescriptor_t convDesc, const miopenTensorDescriptor_t inputTensorDesc, const miopenTensorDescriptor_t filterDesc, int *n, int *c, int *h, int *w)
Get the shape of a resulting 4-D tensor from a 2-D convolution.

miopenConvFwdAlgorithm_t
miopenConvFwdAlgorithm_t
Definition: miopen.h:1239

miopenConvolutionForwardGetWorkSpaceSize
miopenStatus_t miopenConvolutionForwardGetWorkSpaceSize(miopenHandle_t handle, const miopenTensorDescriptor_t wDesc, const miopenTensorDescriptor_t xDesc, const miopenConvolutionDescriptor_t convDesc, const miopenTensorDescriptor_t yDesc, size_t *workSpaceSize)
Query the workspace size required for a forward convolution algorithm.

miopenCreateConvolutionDescriptor
miopenStatus_t miopenCreateConvolutionDescriptor(miopenConvolutionDescriptor_t *convDesc)
Creates a convolution layer descriptor.

miopenConvolutionBackwardWeightsGetSolution
miopenStatus_t miopenConvolutionBackwardWeightsGetSolution(miopenHandle_t handle, const miopenTensorDescriptor_t dyDesc, const miopenTensorDescriptor_t xDesc, const miopenConvolutionDescriptor_t convDesc, const miopenTensorDescriptor_t dwDesc, const size_t maxSolutionCount, size_t *solutionCount, miopenConvSolution_t *solutions)
Query the applicable solutions for a backward convolution w-r-t weights as described by input,...

miopenGetConvolutionNdDescriptor
miopenStatus_t miopenGetConvolutionNdDescriptor(miopenConvolutionDescriptor_t convDesc, int requestedSpatialDim, int *spatialDim, int *padA, int *strideA, int *dilationA, miopenConvolutionMode_t *c_mode)
Retrieves a N-dimensional convolution layer descriptor's details.

miopenConvBwdDataAlgorithm_t
miopenConvBwdDataAlgorithm_t
Definition: miopen.h:1262

miopenConvolutionAttrib_t
miopenConvolutionAttrib_t
Definition: miopen.h:633

miopenConvolutionBackwardWeightsGetWorkSpaceSize
miopenStatus_t miopenConvolutionBackwardWeightsGetWorkSpaceSize(miopenHandle_t handle, const miopenTensorDescriptor_t dyDesc, const miopenTensorDescriptor_t xDesc, const miopenConvolutionDescriptor_t convDesc, const miopenTensorDescriptor_t dwDesc, size_t *workSpaceSize)
Get the GPU memory required for the backward weights convolution algorithm.

miopenConvolutionBackwardWeightsImmediate
miopenStatus_t miopenConvolutionBackwardWeightsImmediate(miopenHandle_t handle, const miopenTensorDescriptor_t dyDesc, const void *dy, const miopenTensorDescriptor_t xDesc, const void *x, const miopenConvolutionDescriptor_t convDesc, const miopenTensorDescriptor_t dwDesc, void *dw, void *workSpace, size_t workSpaceSize, const uint64_t solution_id)
Executes the Backward convolution w-r-t weights operation based on the provided solution ID.

miopenFindConvolutionBackwardDataAlgorithm
miopenStatus_t miopenFindConvolutionBackwardDataAlgorithm(miopenHandle_t handle, const miopenTensorDescriptor_t dyDesc, const void *dy, const miopenTensorDescriptor_t wDesc, const void *w, const miopenConvolutionDescriptor_t convDesc, const miopenTensorDescriptor_t dxDesc, void *dx, const int requestAlgoCount, int *returnedAlgoCount, miopenConvAlgoPerf_t *perfResults, void *workSpace, size_t workSpaceSize, bool exhaustiveSearch)
Search and run the backwards data convolution algorithms and return a list of kernel times.

miopenConvolutionBackwardDataGetSolution
miopenStatus_t miopenConvolutionBackwardDataGetSolution(miopenHandle_t handle, const miopenTensorDescriptor_t dyDesc, const miopenTensorDescriptor_t wDesc, const miopenConvolutionDescriptor_t convDesc, const miopenTensorDescriptor_t dxDesc, const size_t maxSolutionCount, size_t *solutionCount, miopenConvSolution_t *solutions)
Query the applicable solutions for a backward convolution w-r-t data as described by input,...

miopenConvolutionForwardBias
miopenStatus_t miopenConvolutionForwardBias(miopenHandle_t handle, const void *alpha, const miopenTensorDescriptor_t bDesc, const void *b, const void *beta, const miopenTensorDescriptor_t yDesc, void *y)
Calculate element-wise scale and shift of a tensor via a bias tensor.

miopenConvolutionMode_t
miopenConvolutionMode_t
Definition: miopen.h:437

miopenSetConvolutionAttribute
miopenStatus_t miopenSetConvolutionAttribute(miopenConvolutionDescriptor_t convDesc, const miopenConvolutionAttrib_t attr, int value)
Set the attribute of the convolution descriptor.

miopenConvolutionBackwardDataImmediate
miopenStatus_t miopenConvolutionBackwardDataImmediate(miopenHandle_t handle, const miopenTensorDescriptor_t dyDesc, const void *dy, const miopenTensorDescriptor_t wDesc, const void *w, const miopenConvolutionDescriptor_t convDesc, const miopenTensorDescriptor_t dxDesc, void *dx, void *workSpace, size_t workSpaceSize, const uint64_t solution_id)
Executes the Backward convolution w-r-t data operation based on the provided solution ID.

miopenSetTransposeConvNdOutputPadding
miopenStatus_t miopenSetTransposeConvNdOutputPadding(miopenConvolutionDescriptor_t convDesc, int spatialDim, const int *adjA)
Set the output padding to be used in N-dimensional Transpose convolution.

miopenSetConvolutionFindMode
miopenStatus_t miopenSetConvolutionFindMode(miopenConvolutionDescriptor_t convDesc, miopenConvolutionFindMode_t findMode)
Sets the Find Mode attribute in the convolution descriptor.

miopenSetTransposeConvOutputPadding
miopenStatus_t miopenSetTransposeConvOutputPadding(miopenConvolutionDescriptor_t convDesc, int adj_h, int adj_w)
Set the output padding to be used in 2-D Transpose convolution.

miopenConvolutionFindMode_t
miopenConvolutionFindMode_t
Definition: miopen.h:662

miopenGetConvolutionSpatialDim
miopenStatus_t miopenGetConvolutionSpatialDim(miopenConvolutionDescriptor_t convDesc, int *spatialDim)
Retrieves the spatial dimension of a convolution layer descriptor.

miopenConvBwdWeightsAlgorithm_t
miopenConvBwdWeightsAlgorithm_t
Definition: miopen.h:1251

miopenConvolutionForwardCompileSolution
miopenStatus_t miopenConvolutionForwardCompileSolution(miopenHandle_t handle, const miopenTensorDescriptor_t wDesc, const miopenTensorDescriptor_t xDesc, const miopenConvolutionDescriptor_t convDesc, const miopenTensorDescriptor_t yDesc, const uint64_t solution_id)
Compiles the solution provided by the user, this solution may be acquired by the miopenConvolutionFor...

miopenConvolutionBackwardDataGetSolutionCount
miopenStatus_t miopenConvolutionBackwardDataGetSolutionCount(miopenHandle_t handle, const miopenTensorDescriptor_t dyDesc, const miopenTensorDescriptor_t wDesc, const miopenConvolutionDescriptor_t convDesc, const miopenTensorDescriptor_t dxDesc, size_t *solutionCount)
Query the maximum number of solutions applicable for the given input/output and weights tensor descri...

miopenConvolutionBackwardWeights
miopenStatus_t miopenConvolutionBackwardWeights(miopenHandle_t handle, const void *alpha, const miopenTensorDescriptor_t dyDesc, const void *dy, const miopenTensorDescriptor_t xDesc, const void *x, const miopenConvolutionDescriptor_t convDesc, miopenConvBwdWeightsAlgorithm_t algo, const void *beta, const miopenTensorDescriptor_t dwDesc, void *dw, void *workSpace, size_t workSpaceSize)
Execute a backward weights convolution layer.

miopenConvolutionBackwardDataGetWorkSpaceSize
miopenStatus_t miopenConvolutionBackwardDataGetWorkSpaceSize(miopenHandle_t handle, const miopenTensorDescriptor_t dyDesc, const miopenTensorDescriptor_t wDesc, const miopenConvolutionDescriptor_t convDesc, const miopenTensorDescriptor_t dxDesc, size_t *workSpaceSize)
Query the workspace size required for a backward data convolution algorithm.

miopenFindConvolutionForwardAlgorithm
miopenStatus_t miopenFindConvolutionForwardAlgorithm(miopenHandle_t handle, const miopenTensorDescriptor_t xDesc, const void *x, const miopenTensorDescriptor_t wDesc, const void *w, const miopenConvolutionDescriptor_t convDesc, const miopenTensorDescriptor_t yDesc, void *y, const int requestAlgoCount, int *returnedAlgoCount, miopenConvAlgoPerf_t *perfResults, void *workSpace, size_t workSpaceSize, bool exhaustiveSearch)
Search and run the forward convolutional algorithms and return a list of kernel times.

miopenDestroyConvolutionDescriptor
miopenStatus_t miopenDestroyConvolutionDescriptor(miopenConvolutionDescriptor_t convDesc)
Destroys the tensor descriptor object.

miopenConvolutionBackwardWeightsGetSolutionCount
miopenStatus_t miopenConvolutionBackwardWeightsGetSolutionCount(miopenHandle_t handle, const miopenTensorDescriptor_t dyDesc, const miopenTensorDescriptor_t xDesc, const miopenConvolutionDescriptor_t convDesc, const miopenTensorDescriptor_t dwDesc, size_t *solutionCount)
Query the maximum number of solutions applicable for the given input/output and weights tensor descri...

miopenSetConvolutionGroupCount
miopenStatus_t miopenSetConvolutionGroupCount(miopenConvolutionDescriptor_t convDesc, int groupCount)
Set the number of groups to be used in Group/Depthwise convolution.

miopenConvolutionBackwardWeightsGetSolutionWorkspaceSize
miopenStatus_t miopenConvolutionBackwardWeightsGetSolutionWorkspaceSize(miopenHandle_t handle, const miopenTensorDescriptor_t dyDesc, const miopenTensorDescriptor_t xDesc, const miopenConvolutionDescriptor_t convDesc, const miopenTensorDescriptor_t dwDesc, const uint64_t solution_id, size_t *workSpaceSize)
Returns the workspace size required for a particular solution id.

miopenConvolutionForwardGetSolution
miopenStatus_t miopenConvolutionForwardGetSolution(miopenHandle_t handle, const miopenTensorDescriptor_t wDesc, const miopenTensorDescriptor_t xDesc, const miopenConvolutionDescriptor_t convDesc, const miopenTensorDescriptor_t yDesc, const size_t maxSolutionCount, size_t *solutionCount, miopenConvSolution_t *solutions)
Query the applicable solutions for a convolution configuration described by input,...

miopenGetConvolutionDescriptor
miopenStatus_t miopenGetConvolutionDescriptor(miopenConvolutionDescriptor_t convDesc, miopenConvolutionMode_t *c_mode, int *pad_h, int *pad_w, int *stride_h, int *stride_w, int *dilation_h, int *dilation_w)
Retrieves a 2-D convolution layer descriptor's details.

miopenConvolutionForwardGetSolutionCount
miopenStatus_t miopenConvolutionForwardGetSolutionCount(miopenHandle_t handle, const miopenTensorDescriptor_t wDesc, const miopenTensorDescriptor_t xDesc, const miopenConvolutionDescriptor_t convDesc, const miopenTensorDescriptor_t yDesc, size_t *solutionCount)
Query the maximum number of solutions applicable for the given input/output and weights tensor descri...

miopenConvolutionBackwardDataGetSolutionWorkspaceSize
miopenStatus_t miopenConvolutionBackwardDataGetSolutionWorkspaceSize(miopenHandle_t handle, const miopenTensorDescriptor_t dyDesc, const miopenTensorDescriptor_t wDesc, const miopenConvolutionDescriptor_t convDesc, const miopenTensorDescriptor_t dxDesc, const uint64_t solution_id, size_t *workSpaceSize)
Returns the workspace size required for a particular solution id.

miopenConvolutionBackwardBias
miopenStatus_t miopenConvolutionBackwardBias(miopenHandle_t handle, const void *alpha, const miopenTensorDescriptor_t dyDesc, const void *dy, const void *beta, const miopenTensorDescriptor_t dbDesc, void *db)
Calculates the gradient with respect to the bias.

miopenConvolutionAlgoDirect
@ miopenConvolutionAlgoDirect
Definition: miopen.h:1278

miopenConvolutionAlgoWinograd
@ miopenConvolutionAlgoWinograd
Definition: miopen.h:1280

miopenConvolutionAlgoFFT
@ miopenConvolutionAlgoFFT
Definition: miopen.h:1279

miopenConvolutionAlgoImplicitGEMM
@ miopenConvolutionAlgoImplicitGEMM
Definition: miopen.h:1281

miopenConvolutionAlgoGEMM
@ miopenConvolutionAlgoGEMM
Definition: miopen.h:1277

miopenConvolutionFwdAlgoFFT
@ miopenConvolutionFwdAlgoFFT
Definition: miopen.h:1242

miopenConvolutionFwdAlgoImplicitGEMM
@ miopenConvolutionFwdAlgoImplicitGEMM
Definition: miopen.h:1244

miopenConvolutionFwdAlgoGEMM
@ miopenConvolutionFwdAlgoGEMM
Definition: miopen.h:1240

miopenConvolutionFwdAlgoWinograd
@ miopenConvolutionFwdAlgoWinograd
Definition: miopen.h:1243

miopenConvolutionFwdAlgoDirect
@ miopenConvolutionFwdAlgoDirect
Definition: miopen.h:1241

miopenTransposeBwdDataAlgoGEMM
@ miopenTransposeBwdDataAlgoGEMM
Definition: miopen.h:1267

miopenConvolutionBwdDataAlgoDirect
@ miopenConvolutionBwdDataAlgoDirect
Definition: miopen.h:1264

miopenConvolutionBwdDataAlgoGEMM
@ miopenConvolutionBwdDataAlgoGEMM
Definition: miopen.h:1263

miopenConvolutionBwdDataAlgoFFT
@ miopenConvolutionBwdDataAlgoFFT
Definition: miopen.h:1265

miopenConvolutionBwdDataAlgoWinograd
@ miopenConvolutionBwdDataAlgoWinograd
Definition: miopen.h:1266

miopenConvolutionBwdDataAlgoImplicitGEMM
@ miopenConvolutionBwdDataAlgoImplicitGEMM
Definition: miopen.h:1269

miopenConvolutionBwdWeightsAlgoGEMM
@ miopenConvolutionBwdWeightsAlgoGEMM
Definition: miopen.h:1252

miopenConvolutionBwdWeightsAlgoWinograd
@ miopenConvolutionBwdWeightsAlgoWinograd
Definition: miopen.h:1254

miopenConvolutionBwdWeightsAlgoDirect
@ miopenConvolutionBwdWeightsAlgoDirect
Definition: miopen.h:1253

miopenConvolutionBwdWeightsAlgoImplicitGEMM
@ miopenConvolutionBwdWeightsAlgoImplicitGEMM
Definition: miopen.h:1255

miopenDestroyDropoutDescriptor
miopenStatus_t miopenDestroyDropoutDescriptor(miopenDropoutDescriptor_t dropoutDesc)
Destroys the dropout descriptor object.

miopenRNGType_t
miopenRNGType_t
Definition: miopen.h:5821

miopenDropoutGetStatesSize
miopenStatus_t miopenDropoutGetStatesSize(miopenHandle_t handle, size_t *stateSizeInBytes)
Query the amount of memory required to store the states of the random number generators.

miopenDropoutGetReserveSpaceSize
miopenStatus_t miopenDropoutGetReserveSpaceSize(const miopenTensorDescriptor_t xDesc, size_t *reserveSpaceSizeInBytes)
Query the amount of memory required to run dropout.

miopenDropoutForward
miopenStatus_t miopenDropoutForward(miopenHandle_t handle, const miopenDropoutDescriptor_t dropoutDesc, const miopenTensorDescriptor_t noise_shape, const miopenTensorDescriptor_t xDesc, const void *x, const miopenTensorDescriptor_t yDesc, void *y, void *reserveSpace, size_t reserveSpaceSizeInBytes)
Execute forward dropout operation.

miopenGetDropoutDescriptor
miopenStatus_t miopenGetDropoutDescriptor(miopenDropoutDescriptor_t dropoutDesc, miopenHandle_t handle, float *dropout, void **states, unsigned long long *seed, bool *use_mask, bool *state_evo, miopenRNGType_t *rng_mode)
Get the details of the dropout descriptor.

miopenCreateDropoutDescriptor
miopenStatus_t miopenCreateDropoutDescriptor(miopenDropoutDescriptor_t *dropoutDesc)
Creates the dropout descriptor object.

miopenDropoutBackward
miopenStatus_t miopenDropoutBackward(miopenHandle_t handle, const miopenDropoutDescriptor_t dropoutDesc, const miopenTensorDescriptor_t noise_shape, const miopenTensorDescriptor_t dyDesc, const void *dy, const miopenTensorDescriptor_t dxDesc, void *dx, void *reserveSpace, size_t reserveSpaceSizeInBytes)
Execute backward dropout operation.

miopenRestoreDropoutDescriptor
miopenStatus_t miopenRestoreDropoutDescriptor(miopenDropoutDescriptor_t dropoutDesc, miopenHandle_t handle, float dropout, void *states, size_t stateSizeInBytes, unsigned long long seed, bool use_mask, bool state_evo, miopenRNGType_t rng_mode)
Restore the dropout descriptor to a saved state.

miopenSetDropoutDescriptor
miopenStatus_t miopenSetDropoutDescriptor(miopenDropoutDescriptor_t dropoutDesc, miopenHandle_t handle, float dropout, void *states, size_t stateSizeInBytes, unsigned long long seed, bool use_mask, bool state_evo, miopenRNGType_t rng_mode)
Initialize the dropout descriptor.

MIOPEN_RNG_PSEUDO_XORWOW
@ MIOPEN_RNG_PSEUDO_XORWOW
Definition: miopen.h:5822

miopenFindResultsOrder_t
miopenFindResultsOrder_t
Definition: miopen.h:6252

miopenGetSolutionSolverId
miopenStatus_t miopenGetSolutionSolverId(miopenSolution_t solution, uint64_t *solverId)
Reads id of the solver referred by the solution.

miopenSetSoftmaxDescriptor
miopenStatus_t miopenSetSoftmaxDescriptor(miopenSoftmaxDescriptor_t softmaxDesc, float alpha, float beta, miopenSoftmaxAlgorithm_t algorithm, miopenSoftmaxMode_t mode)
Sets the softmax descriptor details.

miopenGetSolutionTime
miopenStatus_t miopenGetSolutionTime(miopenSolution_t solution, float *time)
Reads the time spent to execute the solution the last it was run.

miopenGetMhaDescriptor
miopenStatus_t miopenGetMhaDescriptor(miopenMhaDescriptor_t mhaDesc, float *scale)
Gets the Mha descriptor details.

miopenMhaMask_t
miopenMhaMask_t
Initializes a problem object describing a Mha operation.
Definition: miopen.h:6280

miopenSetMhaDescriptor
miopenStatus_t miopenSetMhaDescriptor(miopenMhaDescriptor_t mhaDesc, float scale)
Sets the Mha descriptor details.

miopenSetFindOptionWorkspaceLimit
miopenStatus_t miopenSetFindOptionWorkspaceLimit(miopenFindOptions_t options, size_t value)
Sets the workspace limit find option. Default value is maximum of size_t.

miopenSetFindOptionPreallocatedTensor
miopenStatus_t miopenSetFindOptionPreallocatedTensor(miopenFindOptions_t options, miopenTensorArgumentId_t id, void *buffer)
Attaches a preallocated tensor to find options. If not used, buffers are allocated by MIOpen internal...

miopenCreateSoftmaxProblem
miopenStatus_t miopenCreateSoftmaxProblem(miopenProblem_t *problem, miopenSoftmaxDescriptor_t operatorDesc, miopenProblemDirection_t direction)
Initializes a problem object describing a softmax operation.

miopenDestroyFindOptions
miopenStatus_t miopenDestroyFindOptions(miopenFindOptions_t options)
Destroys miopenFindOptions object.

miopenSetFindOptionAttachBinaries
miopenStatus_t miopenSetFindOptionAttachBinaries(miopenFindOptions_t options, unsigned attach)
Forces library to attach kernel binaries to solutions for later saving. This allows zero lookup miope...

miopenFuseProblems
miopenStatus_t miopenFuseProblems(miopenProblem_t problem1, miopenProblem_t problem2)
Fuse two problems into a single one. Problems can be either regular, or fused. No problems are dispos...

miopenGetSolutionSize
miopenStatus_t miopenGetSolutionSize(miopenSolution_t solution, size_t *size)
Reads the expected size of a solution.

miopenTensorArgumentId_t
miopenTensorArgumentId_t
Definition: miopen.h:6171

miopenFindSolutions
miopenStatus_t miopenFindSolutions(miopenHandle_t handle, miopenProblem_t problem, miopenFindOptions_t options, miopenSolution_t *solutions, size_t *numSolutions, size_t maxSolutions)
Finds solutions to a problem by running different applicable solutions. Memory is automatically alloc...

miopenSetFindOptionTuning
miopenStatus_t miopenSetFindOptionTuning(miopenFindOptions_t options, int value)
Sets the tuning find option. Default value is zero.

miopenGetSolutionWorkspaceSize
miopenStatus_t miopenGetSolutionWorkspaceSize(miopenSolution_t solution, size_t *workspaceSize)
Reads the amount of workspace required to execute the solution.

miopenSetFindOptionResultsOrder
miopenStatus_t miopenSetFindOptionResultsOrder(miopenFindOptions_t options, miopenFindResultsOrder_t value)
Sets the results order find option. Default value is miopenFindResultsOrderByTime.

miopenRunSolution
miopenStatus_t miopenRunSolution(miopenHandle_t handle, miopenSolution_t solution, size_t nInputs, const miopenTensorArgument_t *tensors, void *workspace, size_t workspaceSize)
Runs the solution using the passed in buffers.

miopenCreateMhaProblem
miopenStatus_t miopenCreateMhaProblem(miopenProblem_t *problem, miopenMhaDescriptor_t operatorDesc, miopenProblemDirection_t direction)

miopenProblemDirection_t
miopenProblemDirection_t
Definition: miopen.h:6158

miopenCreateBatchnormProblem
miopenStatus_t miopenCreateBatchnormProblem(miopenProblem_t *problem, miopenBatchNormMode_t mode, bool runningMeanVariance, miopenProblemDirection_t direction)
Initializes a problem object describing an activation operation.

miopenCreateMhaDescriptor
miopenStatus_t miopenCreateMhaDescriptor(miopenMhaDescriptor_t *mhaDesc)
Creates the mha descriptor object.

miopenDestroySolution
miopenStatus_t miopenDestroySolution(miopenSolution_t solution)
Destroys solution object.

miopenLoadSolution
miopenStatus_t miopenLoadSolution(miopenSolution_t *solution, const char *data, size_t size)
Loads solution object from binary data.

miopenSaveSolution
miopenStatus_t miopenSaveSolution(miopenSolution_t solution, char *data)
Saves a solution object as binary data.

miopenGetSolverIdConvAlgorithm
miopenStatus_t miopenGetSolverIdConvAlgorithm(uint64_t solverId, miopenConvAlgorithm_t *result)
Gets the convolution algorithm implemented by a solver.

miopenSetFindOptionPreallocatedWorkspace
miopenStatus_t miopenSetFindOptionPreallocatedWorkspace(miopenFindOptions_t options, void *buffer, size_t size)
Attaches the preallocated workspace to find options. Allocated by the library by default.

miopenCreateActivationProblem
miopenStatus_t miopenCreateActivationProblem(miopenProblem_t *problem, miopenActivationDescriptor_t operatorDesc, miopenProblemDirection_t direction)
Initializes a problem object describing an activation operation.

miopenDestroyProblem
miopenStatus_t miopenDestroyProblem(miopenProblem_t problem)
Destroys a problem object.

miopenCreateFindOptions
miopenStatus_t miopenCreateFindOptions(miopenFindOptions_t *options)
Initializes miopenFindOptions object.

miopenGetSoftmaxDescriptor
miopenStatus_t miopenGetSoftmaxDescriptor(const miopenSoftmaxDescriptor_t softmaxDesc, float *alpha, float *beta, miopenSoftmaxAlgorithm_t *algorithm, miopenSoftmaxMode_t *mode)
Gets the softmax layer descriptor details.

miopenCreateConvProblem
miopenStatus_t miopenCreateConvProblem(miopenProblem_t *problem, miopenConvolutionDescriptor_t operatorDesc, miopenProblemDirection_t direction)
Initializes a problem object describing a convolution operation.

miopenCreateBiasProblem
miopenStatus_t miopenCreateBiasProblem(miopenProblem_t *problem, miopenProblemDirection_t direction)
Initializes a problem object describing an bias operation.

miopenSetProblemTensorDescriptor
miopenStatus_t miopenSetProblemTensorDescriptor(miopenProblem_t problem, miopenTensorArgumentId_t id, const miopenTensorDescriptor_t descriptor)
Sets a tensor descriptor for the specified argument.

miopenCreateSoftmaxDescriptor
miopenStatus_t miopenCreateSoftmaxDescriptor(miopenSoftmaxDescriptor_t *softmaxDesc)
Creates the Softmax descriptor object.

miopenFindResultsOrderByWorkspaceSize
@ miopenFindResultsOrderByWorkspaceSize
Definition: miopen.h:6254

miopenFindResultsOrderByTime
@ miopenFindResultsOrderByTime
Definition: miopen.h:6253

miopenMhaMaskCausal
@ miopenMhaMaskCausal
Definition: miopen.h:6282

miopenMhaMaskNone
@ miopenMhaMaskNone
Definition: miopen.h:6281

miopenTensorMhaDescaleS
@ miopenTensorMhaDescaleS
Definition: miopen.h:6183

miopenTensorMhaO
@ miopenTensorMhaO
Definition: miopen.h:6189

miopenTensorMhaAmaxDV
@ miopenTensorMhaAmaxDV
Definition: miopen.h:6207

miopenTensorBatchnormScaleDiff
@ miopenTensorBatchnormScaleDiff
Definition: miopen.h:6230

miopenTensorMhaMask
@ miopenTensorMhaMask
Definition: miopen.h:6241

miopenTensorMhaDescaleDS
@ miopenTensorMhaDescaleDS
Definition: miopen.h:6197

miopenTensorMhaDropoutSeed
@ miopenTensorMhaDropoutSeed
Definition: miopen.h:6187

miopenTensorBatchnormSavedMean
@ miopenTensorBatchnormSavedMean
Definition: miopen.h:6227

miopenTensorActivationDY
@ miopenTensorActivationDY
Definition: miopen.h:6215

miopenTensorBatchnormDX
@ miopenTensorBatchnormDX
Definition: miopen.h:6235

miopenTensorMhaDescaleV
@ miopenTensorMhaDescaleV
Definition: miopen.h:6182

miopenTensorMhaK
@ miopenTensorMhaK
Definition: miopen.h:6177

miopenTensorConvolutionX
@ miopenTensorConvolutionX
Definition: miopen.h:6173

miopenTensorMhaAmaxDK
@ miopenTensorMhaAmaxDK
Definition: miopen.h:6206

miopenTensorMhaScaleDS
@ miopenTensorMhaScaleDS
Definition: miopen.h:6198

miopenTensorBatchnormBias
@ miopenTensorBatchnormBias
Definition: miopen.h:6233

miopenTensorMhaM
@ miopenTensorMhaM
Definition: miopen.h:6192

miopenTensorBatchnormRunningMean
@ miopenTensorBatchnormRunningMean
Definition: miopen.h:6225

miopenTensorMhaDropoutProbability
@ miopenTensorMhaDropoutProbability
Definition: miopen.h:6186

miopenTensorSoftmaxY
@ miopenTensorSoftmaxY
Definition: miopen.h:6220

miopenTensorSoftmaxDY
@ miopenTensorSoftmaxDY
Definition: miopen.h:6222

miopenTensorMhaDescaleO
@ miopenTensorMhaDescaleO
Definition: miopen.h:6195

miopenTensorMhaScaleO
@ miopenTensorMhaScaleO
Definition: miopen.h:6185

miopenScalarBatchnormExpAvgFactor
@ miopenScalarBatchnormExpAvgFactor
Definition: miopen.h:6243

miopenTensorBatchnormScale
@ miopenTensorBatchnormScale
Definition: miopen.h:6229

miopenTensorBatchnormRunningVariance
@ miopenTensorBatchnormRunningVariance
Definition: miopen.h:6226

miopenTensorActivationDX
@ miopenTensorActivationDX
Definition: miopen.h:6214

miopenTensorMhaScaleDK
@ miopenTensorMhaScaleDK
Definition: miopen.h:6200

miopenTensorMhaV
@ miopenTensorMhaV
Definition: miopen.h:6179

miopenTensorMhaAmaxS
@ miopenTensorMhaAmaxS
Definition: miopen.h:6191

miopenTensorBatchnormBiasDiff
@ miopenTensorBatchnormBiasDiff
Definition: miopen.h:6234

miopenTensorBatchnormSavedVariance
@ miopenTensorBatchnormSavedVariance
Definition: miopen.h:6228

miopenTensorActivationX
@ miopenTensorActivationX
Definition: miopen.h:6212

miopenTensorMhaScaleDV
@ miopenTensorMhaScaleDV
Definition: miopen.h:6201

miopenTensorMhaAmaxO
@ miopenTensorMhaAmaxO
Definition: miopen.h:6190

miopenScalarBatchnormEpsilon
@ miopenScalarBatchnormEpsilon
Definition: miopen.h:6244

miopenTensorMhaScaleDQ
@ miopenTensorMhaScaleDQ
Definition: miopen.h:6199

miopenTensorSoftmaxDX
@ miopenTensorSoftmaxDX
Definition: miopen.h:6221

miopenTensorMhaAmaxDS
@ miopenTensorMhaAmaxDS
Definition: miopen.h:6208

miopenTensorMhaDV
@ miopenTensorMhaDV
Definition: miopen.h:6204

miopenTensorMhaQ
@ miopenTensorMhaQ
Definition: miopen.h:6178

miopenTensorMhaAmaxDQ
@ miopenTensorMhaAmaxDQ
Definition: miopen.h:6205

miopenTensorConvolutionY
@ miopenTensorConvolutionY
Definition: miopen.h:6175

miopenTensorBatchnormEstimatedMean
@ miopenTensorBatchnormEstimatedMean
Definition: miopen.h:6231

miopenTensorBatchnormDY
@ miopenTensorBatchnormDY
Definition: miopen.h:6236

miopenTensorMhaZInv
@ miopenTensorMhaZInv
Definition: miopen.h:6193

miopenTensorMhaDescaleQ
@ miopenTensorMhaDescaleQ
Definition: miopen.h:6181

miopenTensorMhaBias
@ miopenTensorMhaBias
Definition: miopen.h:6209

miopenTensorBatchnormEstimatedVariance
@ miopenTensorBatchnormEstimatedVariance
Definition: miopen.h:6232

miopenTensorArgumentIsScalar
@ miopenTensorArgumentIsScalar
Definition: miopen.h:6239

miopenTensorArgumentIdInvalid
@ miopenTensorArgumentIdInvalid
Definition: miopen.h:6172

miopenTensorMhaDO
@ miopenTensorMhaDO
Definition: miopen.h:6194

miopenTensorMhaDescaleDO
@ miopenTensorMhaDescaleDO
Definition: miopen.h:6196

miopenTensorConvolutionW
@ miopenTensorConvolutionW
Definition: miopen.h:6174

miopenTensorMhaDescaleK
@ miopenTensorMhaDescaleK
Definition: miopen.h:6180

miopenTensorMhaDropoutOffset
@ miopenTensorMhaDropoutOffset
Definition: miopen.h:6188

miopenTensorBiasY
@ miopenTensorBiasY
Definition: miopen.h:6217

miopenTensorMhaDQ
@ miopenTensorMhaDQ
Definition: miopen.h:6202

miopenTensorSoftmaxX
@ miopenTensorSoftmaxX
Definition: miopen.h:6219

miopenTensorBatchnormY
@ miopenTensorBatchnormY
Definition: miopen.h:6224

miopenTensorMhaScaleS
@ miopenTensorMhaScaleS
Definition: miopen.h:6184

miopenTensorBias
@ miopenTensorBias
Definition: miopen.h:6218

miopenTensorActivationY
@ miopenTensorActivationY
Definition: miopen.h:6213

miopenTensorBatchnormX
@ miopenTensorBatchnormX
Definition: miopen.h:6223

miopenTensorBiasX
@ miopenTensorBiasX
Definition: miopen.h:6216

miopenTensorMhaDK
@ miopenTensorMhaDK
Definition: miopen.h:6203

miopenProblemDirectionBackwardWeights
@ miopenProblemDirectionBackwardWeights
Definition: miopen.h:6161

miopenProblemDirectionInference
@ miopenProblemDirectionInference
Definition: miopen.h:6163

miopenProblemDirectionForward
@ miopenProblemDirectionForward
Definition: miopen.h:6159

miopenProblemDirectionBackward
@ miopenProblemDirectionBackward
Definition: miopen.h:6160

miopenGetGetitemWorkspaceSize
miopenStatus_t miopenGetGetitemWorkspaceSize(miopenHandle_t handle, uint32_t indexCount, const miopenTensorDescriptor_t *indexDescs, size_t *sizeInBytes)
Helper function to query the minimum workspace size required by the getitem call.

miopenGetitemBackward
miopenStatus_t miopenGetitemBackward(miopenHandle_t handle, void *workspace, size_t workspaceSizeInBytes, const miopenTensorDescriptor_t dyDesc, const void *dy, uint32_t indexCount, const miopenTensorDescriptor_t *indexDescs, const void *const *indexs, const miopenTensorDescriptor_t dxDesc, void *dx, const miopenTensorDescriptor_t errorDesc, void *error, uint32_t dimCount, const int32_t *dims, uint32_t sliceCount, const int32_t *slices, uint32_t offset)
Execute a getitem backward layer.

miopenGroupNormForward
miopenStatus_t miopenGroupNormForward(miopenHandle_t handle, miopenNormMode_t mode, const miopenTensorDescriptor_t xDesc, const void *x, const miopenTensorDescriptor_t weightDesc, const void *weight, const miopenTensorDescriptor_t biasDesc, const void *bias, const uint64_t num_groups, const float epsilon, const miopenTensorDescriptor_t yDesc, void *y, const miopenTensorDescriptor_t meanDesc, void *mean, const miopenTensorDescriptor_t rstdDesc, void *rstd)
Execute a groupnorm forward layer.

miopenCreateWithStream
miopenStatus_t miopenCreateWithStream(miopenHandle_t *handle, miopenAcceleratorQueue_t stream)
Create a MIOpen handle with an accelerator stream.

miopenDestroy
miopenStatus_t miopenDestroy(miopenHandle_t handle)
Destroys the MIOpen handle.

miopenTuningPolicy_t
miopenTuningPolicy_t
Definition: miopen.h:8769

miopenGetTuningPolicy
miopenStatus_t miopenGetTuningPolicy(miopenHandle_t handle, miopenTuningPolicy_t *value)
Get tuning policy from a handle.

miopenDeallocatorFunction
void(* miopenDeallocatorFunction)(void *context, void *memory)
Custom deallocator function.
Definition: miopen.h:166

miopenMathType_t
miopenMathType_t
Definition: miopen.h:124

miopenGetStream
miopenStatus_t miopenGetStream(miopenHandle_t handle, miopenAcceleratorQueue_t *streamID)
Get the previously created accelerator command queue.

miopenEnableProfiling
miopenStatus_t miopenEnableProfiling(miopenHandle_t handle, bool enable)
Enable profiling to retrieve kernel time.

miopenGetVersion
miopenStatus_t miopenGetVersion(size_t *major, size_t *minor, size_t *patch)
Method to return version of MIOpen.

miopenSetTuningPolicy
miopenStatus_t miopenSetTuningPolicy(miopenHandle_t handle, miopenTuningPolicy_t newValue)
Update tuning policy for a specific handle. API alternative for MIOPEN_FIND_ENFORCE environment varia...

miopenStatus_t
miopenStatus_t
Definition: miopen.h:109

miopenSetAllocator
miopenStatus_t miopenSetAllocator(miopenHandle_t handle, miopenAllocatorFunction allocator, miopenDeallocatorFunction deallocator, void *allocatorContext)
Set allocator for previously created miopenHandle.

miopenF8RoundingMode_t
miopenF8RoundingMode_t
Definition: miopen.h:133

miopenAllocatorFunction
void *(* miopenAllocatorFunction)(void *context, size_t sizeBytes)
Custom allocator function.
Definition: miopen.h:156

miopenGetErrorString
const char * miopenGetErrorString(miopenStatus_t error)
Get character string for an error code.

miopenCreate
miopenStatus_t miopenCreate(miopenHandle_t *handle)
Method to create the MIOpen handle object.

miopenGetKernelTime
miopenStatus_t miopenGetKernelTime(miopenHandle_t handle, float *time)
Get time for last kernel launched.

miopenSetStream
miopenStatus_t miopenSetStream(miopenHandle_t handle, miopenAcceleratorQueue_t streamID)
Set accelerator command queue previously created.

miopenMathDefault
@ miopenMathDefault
Definition: miopen.h:126

miopenMathPedantic
@ miopenMathPedantic
Definition: miopen.h:127

miopenStatusUnsupportedOp
@ miopenStatusUnsupportedOp
Definition: miopen.h:118

miopenStatusGpuOperationsSkipped
@ miopenStatusGpuOperationsSkipped
Definition: miopen.h:119

miopenStatusUnknownError
@ miopenStatusUnknownError
Definition: miopen.h:117

miopenStatusSuccess
@ miopenStatusSuccess
Definition: miopen.h:110

miopenStatusVersionMismatch
@ miopenStatusVersionMismatch
Definition: miopen.h:120

miopenStatusAllocFailed
@ miopenStatusAllocFailed
Definition: miopen.h:114

miopenStatusNotImplemented
@ miopenStatusNotImplemented
Definition: miopen.h:116

miopenStatusBadParm
@ miopenStatusBadParm
Definition: miopen.h:113

miopenStatusNotInitialized
@ miopenStatusNotInitialized
Definition: miopen.h:111

miopenStatusInternalError
@ miopenStatusInternalError
Definition: miopen.h:115

miopenStatusInvalidValue
@ miopenStatusInvalidValue
Definition: miopen.h:112

miopenF8RoundingModeStandard
@ miopenF8RoundingModeStandard
Definition: miopen.h:134

miopenF8RoundingModeStochastic
@ miopenF8RoundingModeStochastic
Definition: miopen.h:135

miopenKthvalueForward
miopenStatus_t miopenKthvalueForward(miopenHandle_t handle, miopenTensorDescriptor_t inputDesc, const void *input, miopenTensorDescriptor_t outputDesc, void *output, miopenTensorDescriptor_t indicesDesc, size_t *indices, size_t k, int32_t dim=-1, bool keepDim=false)
Execute a Kthvalue forward layer.

miopenLayerNormForward
miopenStatus_t miopenLayerNormForward(miopenHandle_t handle, miopenNormMode_t mode, const miopenTensorDescriptor_t xDesc, const void *x, const miopenTensorDescriptor_t weightDesc, const void *weight, const miopenTensorDescriptor_t biasDesc, const void *bias, const float epsilon, const int32_t normalized_dim, const miopenTensorDescriptor_t yDesc, void *y, const miopenTensorDescriptor_t meanDesc, void *mean, const miopenTensorDescriptor_t rstdDesc, void *rstd)
Execute a layernorm forward layer.

miopenT5LayerNormBackward
miopenStatus_t miopenT5LayerNormBackward(miopenHandle_t handle, miopenNormMode_t mode, void *workspace, size_t workspaceSizeInBytes, const miopenTensorDescriptor_t dyDesc, const void *dy, const miopenTensorDescriptor_t xDesc, const void *x, const miopenTensorDescriptor_t weightDesc, const void *weight, const miopenTensorDescriptor_t rstdDesc, const void *rstd, const miopenTensorDescriptor_t dxDesc, void *dx, const miopenTensorDescriptor_t dwDesc, void *dw)
Execute a T5layernorm backward layer.

miopenLayerNormBackward
miopenStatus_t miopenLayerNormBackward(miopenHandle_t handle, miopenNormMode_t mode, void *workspace, size_t workspaceSizeInBytes, const miopenTensorDescriptor_t dyDesc, const void *dy, const miopenTensorDescriptor_t xDesc, const void *x, const miopenTensorDescriptor_t weightDesc, const void *weight, const miopenTensorDescriptor_t meanDesc, const void *mean, const miopenTensorDescriptor_t rstdDesc, const void *rstd, const int32_t normalized_dim, const miopenTensorDescriptor_t dxDesc, void *dx, const miopenTensorDescriptor_t dwDesc, void *dw, const miopenTensorDescriptor_t dbDesc, void *db)
Execute a layernorm backward layer.

miopenT5LayerNormForward
miopenStatus_t miopenT5LayerNormForward(miopenHandle_t handle, miopenNormMode_t mode, const miopenTensorDescriptor_t xDesc, const void *x, const miopenTensorDescriptor_t weightDesc, const void *weight, const float epsilon, const miopenTensorDescriptor_t yDesc, void *y, const miopenTensorDescriptor_t rstdDesc, void *rstd)
Execute a T5layernorm forward layer.

miopenNormMode_t
miopenNormMode_t
Definition: miopen.h:493

miopenGetLayerNormBackwardWorkspaceSize
miopenStatus_t miopenGetLayerNormBackwardWorkspaceSize(miopenHandle_t handle, miopenNormMode_t mode, const miopenTensorDescriptor_t dyDesc, const miopenTensorDescriptor_t xDesc, const miopenTensorDescriptor_t weightDesc, const miopenTensorDescriptor_t meanDesc, const miopenTensorDescriptor_t rstdDesc, const int32_t normalized_dim, const miopenTensorDescriptor_t dxDesc, const miopenTensorDescriptor_t dwDesc, const miopenTensorDescriptor_t dbDesc, size_t *sizeInBytes)
Helper function to query the minimum workspace size required by the layernorm backward call.

miopenGetT5LayerNormBackwardWorkspaceSize
miopenStatus_t miopenGetT5LayerNormBackwardWorkspaceSize(miopenHandle_t handle, miopenNormMode_t mode, const miopenTensorDescriptor_t dyDesc, const miopenTensorDescriptor_t xDesc, const miopenTensorDescriptor_t weightDesc, const miopenTensorDescriptor_t rstdDesc, const miopenTensorDescriptor_t dxDesc, const miopenTensorDescriptor_t dwDesc, size_t *sizeInBytes)
Helper function to query the minimum workspace size required by the T5layernorm backward call.

miopenAddLayerNormForward
miopenStatus_t miopenAddLayerNormForward(miopenHandle_t handle, miopenNormMode_t mode, const miopenTensorDescriptor_t xDesc, const void *x, const miopenTensorDescriptor_t x2Desc, const void *x2, const miopenTensorDescriptor_t weightDesc, const void *weight, const miopenTensorDescriptor_t biasDesc, const void *bias, const float epsilon, const int32_t normalized_dim, const miopenTensorDescriptor_t yDesc, void *y, const miopenTensorDescriptor_t meanDesc, void *mean, const miopenTensorDescriptor_t rstdDesc, void *rstd)
Execute a add and layernorm forward layer.

miopenSet2dPoolingDescriptor
miopenStatus_t miopenSet2dPoolingDescriptor(miopenPoolingDescriptor_t poolDesc, miopenPoolingMode_t mode, int windowHeight, int windowWidth, int pad_h, int pad_w, int stride_h, int stride_w)
Sets a 2-D pooling layer descriptor details.

miopenSetPoolingWorkSpaceIndexMode
miopenStatus_t miopenSetPoolingWorkSpaceIndexMode(miopenPoolingDescriptor_t poolDesc, miopenPoolingWorkspaceIndexMode_t workspace_index)
Set workspace index mode for pooling layer. The default mode is miopenPoolingWorkSpaceIndexMask.

miopenGetPoolingForwardOutputDim
miopenStatus_t miopenGetPoolingForwardOutputDim(const miopenPoolingDescriptor_t poolDesc, const miopenTensorDescriptor_t tensorDesc, int *n, int *c, int *h, int *w)
Gets the shape of the output tensor for 2-D pooling.

miopenPoolingGetWorkSpaceSize
miopenStatus_t miopenPoolingGetWorkSpaceSize(const miopenTensorDescriptor_t yDesc, size_t *workSpaceSize)
Get the amount of GPU memory required for pooling.

miopenSetNdPoolingDescriptor
miopenStatus_t miopenSetNdPoolingDescriptor(miopenPoolingDescriptor_t poolDesc, const miopenPoolingMode_t mode, int nbDims, const int *windowDimA, const int *padA, const int *stridesA)
Set details of a N-D pooling layer descriptor.

miopenPoolingForward
miopenStatus_t miopenPoolingForward(miopenHandle_t handle, const miopenPoolingDescriptor_t poolDesc, const void *alpha, const miopenTensorDescriptor_t xDesc, const void *x, const void *beta, const miopenTensorDescriptor_t yDesc, void *y, bool do_backward, void *workSpace, size_t workSpaceSize)
Execute a forward pooling layer.

miopenPoolingMode_t
miopenPoolingMode_t
Definition: miopen.h:460

miopenPoolingGetWorkSpaceSizeV2
miopenStatus_t miopenPoolingGetWorkSpaceSizeV2(const miopenPoolingDescriptor_t poolDesc, const miopenTensorDescriptor_t yDesc, size_t *workSpaceSize)
Get the amount of GPU memory required for pooling.

miopenGetPoolingWorkSpaceIndexMode
miopenStatus_t miopenGetPoolingWorkSpaceIndexMode(miopenPoolingDescriptor_t poolDesc, miopenPoolingWorkspaceIndexMode_t *workspace_index)
Get workspace index mode for pooling layer.

miopenIndexType_t
miopenIndexType_t
Definition: miopen.h:413

miopenGetPoolingIndexType
miopenStatus_t miopenGetPoolingIndexType(miopenPoolingDescriptor_t poolDesc, miopenIndexType_t *index_type)
Get the index data type for pooling layer. The index type to any of the miopenIndexType_t sizes; 8,...

miopenPoolingWorkspaceIndexMode_t
miopenPoolingWorkspaceIndexMode_t
Definition: miopen.h:473

miopenGetPoolingNdForwardOutputDim
miopenStatus_t miopenGetPoolingNdForwardOutputDim(const miopenPoolingDescriptor_t poolDesc, const miopenTensorDescriptor_t tensorDesc, int dims, int *tensorDimArr)
Gets the shape of the output tensor for N-D pooling.

miopenGetNdPoolingDescriptor
miopenStatus_t miopenGetNdPoolingDescriptor(const miopenPoolingDescriptor_t poolDesc, int nbDimsRequested, miopenPoolingMode_t *mode, int *nbDims, int *windowDimA, int *padA, int *stridesA)
Get details of a N-D pooling layer descriptor.

miopenCreatePoolingDescriptor
miopenStatus_t miopenCreatePoolingDescriptor(miopenPoolingDescriptor_t *poolDesc)
Creates a pooling layer descriptor.

miopenSetPoolingIndexType
miopenStatus_t miopenSetPoolingIndexType(miopenPoolingDescriptor_t poolDesc, miopenIndexType_t index_type)
Set index data type for pooling layer. The default indexing type is uint8_t. Users can set the index ...

miopenGet2dPoolingDescriptor
miopenStatus_t miopenGet2dPoolingDescriptor(const miopenPoolingDescriptor_t poolDesc, miopenPoolingMode_t *mode, int *windowHeight, int *windowWidth, int *pad_h, int *pad_w, int *stride_h, int *stride_w)
Gets a 2-D pooling layer descriptor details.

miopenDestroyPoolingDescriptor
miopenStatus_t miopenDestroyPoolingDescriptor(miopenPoolingDescriptor_t poolDesc)
Destroys the pooling descriptor object.

miopenPoolingBackward
miopenStatus_t miopenPoolingBackward(miopenHandle_t handle, const miopenPoolingDescriptor_t poolDesc, const void *alpha, const miopenTensorDescriptor_t yDesc, const void *y, const miopenTensorDescriptor_t dyDesc, const void *dy, const miopenTensorDescriptor_t xDesc, const void *x, const void *beta, const miopenTensorDescriptor_t dxDesc, void *dx, void *workSpace)
Execute a backward pooling layer.

miopenReduceCalculationForward
miopenStatus_t miopenReduceCalculationForward(miopenHandle_t handle, miopenReduceCalculationNanPropagation_t nanPropagation, void *workspace, size_t workspaceSizeInBytes, const miopenTensorDescriptor_t xDesc, const void *x, const int32_t dim, const miopenReduceCalculationOp_t reduceCalculationOp, const miopenTensorDescriptor_t reduceDesc, void *y)
Execute a reducecalculation forward layer.

miopenReduceCalculationOp_t
miopenReduceCalculationOp_t
Definition: miopen.h:6685

miopenGetReduceCalculationWorkspaceSize
miopenStatus_t miopenGetReduceCalculationWorkspaceSize(miopenHandle_t handle, const miopenTensorDescriptor_t xDesc, const int32_t dim, const miopenReduceCalculationOp_t reduceCalculationOp, const miopenTensorDescriptor_t reduceDesc, size_t *sizeInBytes)
Helper function to query the minimum workspace size required by the ReduceTensor call.

MIOPEN_REDUCE_CALCULATION_PROD
@ MIOPEN_REDUCE_CALCULATION_PROD
Definition: miopen.h:6686

MIOPEN_REDUCE_CALCULATION_SUM
@ MIOPEN_REDUCE_CALCULATION_SUM
Definition: miopen.h:6688

miopenSoftmaxBackward_V2
miopenStatus_t miopenSoftmaxBackward_V2(miopenHandle_t handle, const void *alpha, const miopenTensorDescriptor_t yDesc, const void *y, const miopenTensorDescriptor_t dyDesc, const void *dy, const void *beta, const miopenTensorDescriptor_t dxDesc, void *dx, miopenSoftmaxAlgorithm_t algorithm, miopenSoftmaxMode_t mode)
Execute a softmax backwards layer with expanded modes and algorithms.

miopenSoftmaxForward
miopenStatus_t miopenSoftmaxForward(miopenHandle_t handle, const void *alpha, const miopenTensorDescriptor_t xDesc, const void *x, const void *beta, const miopenTensorDescriptor_t yDesc, void *y)
Execute a softmax forward layer.

miopenSoftmaxForward_V2
miopenStatus_t miopenSoftmaxForward_V2(miopenHandle_t handle, const void *alpha, const miopenTensorDescriptor_t xDesc, const void *x, const void *beta, const miopenTensorDescriptor_t yDesc, void *y, miopenSoftmaxAlgorithm_t algorithm, miopenSoftmaxMode_t mode)
Execute a softmax forward layer with expanded modes and algorithms.

miopenSoftmaxBackward
miopenStatus_t miopenSoftmaxBackward(miopenHandle_t handle, const void *alpha, const miopenTensorDescriptor_t yDesc, const void *y, const miopenTensorDescriptor_t dyDesc, const void *dy, const void *beta, const miopenTensorDescriptor_t dxDesc, void *dx)
Execute a softmax backwards layer.

miopenSoftmaxMode_t
miopenSoftmaxMode_t
Definition: miopen.h:556

miopenSoftmaxAlgorithm_t
miopenSoftmaxAlgorithm_t
Definition: miopen.h:545

miopenDestroySeqTensorDescriptor
miopenStatus_t miopenDestroySeqTensorDescriptor(miopenSeqTensorDescriptor_t tensorDesc)
Destroys the sequence data tensor descriptor.

miopenGetTensorDescriptor
miopenStatus_t miopenGetTensorDescriptor(miopenTensorDescriptor_t tensorDesc, miopenDataType_t *dataType, int *dimsA, int *stridesA)
Get the details of the N-dimensional tensor descriptor.

miopenSetNdTensorDescriptorWithLayout
miopenStatus_t miopenSetNdTensorDescriptorWithLayout(miopenTensorDescriptor_t tensorDesc, miopenDataType_t dataType, miopenTensorLayout_t tensorLayout, const int *lens, int num_lens)
Set shape of ND tensor with specific layout.

miopenSetTensor
miopenStatus_t miopenSetTensor(miopenHandle_t handle, const miopenTensorDescriptor_t yDesc, void *y, const void *alpha)
Fills a tensor with a single value.

miopenOpTensor
miopenStatus_t miopenOpTensor(miopenHandle_t handle, miopenTensorOp_t tensorOp, const void *alpha1, const miopenTensorDescriptor_t aDesc, const void *A, const void *alpha2, const miopenTensorDescriptor_t bDesc, const void *B, const void *beta, const miopenTensorDescriptor_t cDesc, void *C)
Execute element-wise tensor operations.

miopenGetTensorNumBytes
miopenStatus_t miopenGetTensorNumBytes(miopenTensorDescriptor_t tensorDesc, size_t *numBytes)
Returns number of bytes associated with tensor descriptor.

miopenGet4dTensorDescriptor
miopenStatus_t miopenGet4dTensorDescriptor(miopenTensorDescriptor_t tensorDesc, miopenDataType_t *dataType, int *n, int *c, int *h, int *w, int *nStride, int *cStride, int *hStride, int *wStride)
Get the details of the tensor descriptor.

miopenTensorLayout_t
miopenTensorLayout_t
Definition: miopen.h:396

miopenTransformTensor
miopenStatus_t miopenTransformTensor(miopenHandle_t handle, const void *alpha, const miopenTensorDescriptor_t xDesc, const void *x, const void *beta, const miopenTensorDescriptor_t yDesc, void *y)
Copies one tensor to another tensor with a different layout/scale.

miopenCreateTensorDescriptor
miopenStatus_t miopenCreateTensorDescriptor(miopenTensorDescriptor_t *tensorDesc)
Create a Tensor Descriptor.

miopenSetTensorDescriptorV2
miopenStatus_t miopenSetTensorDescriptorV2(miopenTensorDescriptor_t tensorDesc, miopenDataType_t dataType, int nbDims, const size_t *dimsA, const size_t *stridesA)
Set shape of N-dimensional tensor.

miopenScaleTensor
miopenStatus_t miopenScaleTensor(miopenHandle_t handle, const miopenTensorDescriptor_t yDesc, void *y, const void *alpha)
Scales all elements in a tensor by a single value.

miopenSetTensorCastType
miopenStatus_t miopenSetTensorCastType(miopenTensorDescriptor_t tensorDesc, miopenDataType_t cast_type)
Set the tensor cast type.

miopenSet4dTensorDescriptor
miopenStatus_t miopenSet4dTensorDescriptor(miopenTensorDescriptor_t tensorDesc, miopenDataType_t dataType, int n, int c, int h, int w)
Set shape of 4D tensor.

miopenSet4dTensorDescriptorEx
miopenStatus_t miopenSet4dTensorDescriptorEx(miopenTensorDescriptor_t tensorDesc, miopenDataType_t dataType, int n, int c, int h, int w, int nStride, int cStride, int hStride, int wStride)
Set shape and stride of 4D tensor.

miopenDataType_t
miopenDataType_t
Definition: miopen.h:376

miopenCreateSeqTensorDescriptor
miopenStatus_t miopenCreateSeqTensorDescriptor(miopenSeqTensorDescriptor_t *tensorDesc)
Create a Tensor Descriptor for sequence data.

miopenTensorOp_t
miopenTensorOp_t
Definition: miopen.h:425

miopenGetTensorDescriptorSize
miopenStatus_t miopenGetTensorDescriptorSize(miopenTensorDescriptor_t tensorDesc, int *size)
Set shape of N-dimensional tensor.

miopenDestroyTensorDescriptor
miopenStatus_t miopenDestroyTensorDescriptor(miopenTensorDescriptor_t tensorDesc)
Destroys the tensor descriptor.

miopenSetTensorDescriptor
miopenStatus_t miopenSetTensorDescriptor(miopenTensorDescriptor_t tensorDesc, miopenDataType_t dataType, int nbDims, const int *dimsA, const int *stridesA)
Set shape of N-dimensional tensor.

miopenPaddingMode_t
miopenPaddingMode_t
Definition: miopen.h:449

miopenPaddingDefault
@ miopenPaddingDefault
Definition: miopen.h:450

miopenPaddingSame
@ miopenPaddingSame
Definition: miopen.h:451

miopenPaddingValid
@ miopenPaddingValid
Definition: miopen.h:452

miopenReduceCalculationNanPropagation_t
miopenReduceCalculationNanPropagation_t
Definition: miopen.h:6669

MIOPEN_REDUCE_CALCULATION_PROPAGATE_NAN
@ MIOPEN_REDUCE_CALCULATION_PROPAGATE_NAN
Definition: miopen.h:6671

MIOPEN_REDUCE_CALCULATION_NOT_PROPAGATE_NAN
@ MIOPEN_REDUCE_CALCULATION_NOT_PROPAGATE_NAN
Definition: miopen.h:6670

MIOPEN_DECLARE_OBJECT
#define MIOPEN_DECLARE_OBJECT(name)
Definition: miopen.h:79

miopenNanPropagation_t
miopenNanPropagation_t
Definition: miopen.h:601

MIOPEN_PROPAGATE_NAN
@ MIOPEN_PROPAGATE_NAN
Definition: miopen.h:603

MIOPEN_NOT_PROPAGATE_NAN
@ MIOPEN_NOT_PROPAGATE_NAN
Definition: miopen.h:602

MIOPEN_LOSS_REDUCTION_MEAN
@ MIOPEN_LOSS_REDUCTION_MEAN
Definition: miopen.h:8589

MIOPEN_LOSS_REDUCTION_SUM
@ MIOPEN_LOSS_REDUCTION_SUM
Definition: miopen.h:8588

MIOPEN_LOSS_REDUCTION_NONE
@ MIOPEN_LOSS_REDUCTION_NONE
Definition: miopen.h:8587

miopenTuningPolicyDbClean
@ miopenTuningPolicyDbClean
Definition: miopen.h:8775

miopenTuningPolicyDbUpdate
@ miopenTuningPolicyDbUpdate
Definition: miopen.h:8771

miopenTuningPolicyNone
@ miopenTuningPolicyNone
Definition: miopen.h:8770

miopenTuningPolicySearch
@ miopenTuningPolicySearch
Definition: miopen.h:8772

miopenTuningPolicySearchDbUpdate
@ miopenTuningPolicySearchDbUpdate
Definition: miopen.h:8774

miopenPoolingAverage
@ miopenPoolingAverage
Definition: miopen.h:462

miopenPoolingAverageInclusive
@ miopenPoolingAverageInclusive
Definition: miopen.h:463

miopenPoolingMax
@ miopenPoolingMax
Definition: miopen.h:461

miopenTensorCHWN
@ miopenTensorCHWN
Definition: miopen.h:399

miopenTensorNHWC
@ miopenTensorNHWC
Definition: miopen.h:398

miopenTensorNDHWC
@ miopenTensorNDHWC
Definition: miopen.h:405

miopenTensorNCHW
@ miopenTensorNCHW
Definition: miopen.h:397

miopenTensorCHWNc4
@ miopenTensorCHWNc4
Definition: miopen.h:402

miopenTensorNCHWc8
@ miopenTensorNCHWc8
Definition: miopen.h:401

miopenTensorNCDHW
@ miopenTensorNCDHW
Definition: miopen.h:404

miopenTensorCHWNc8
@ miopenTensorCHWNc8
Definition: miopen.h:403

miopenTensorNCHWc4
@ miopenTensorNCHWc4
Definition: miopen.h:400

MIOPEN_REDUCE_TENSOR_FLATTENED_INDICES
@ MIOPEN_REDUCE_TENSOR_FLATTENED_INDICES
Definition: miopen.h:613

MIOPEN_REDUCE_TENSOR_NO_INDICES
@ MIOPEN_REDUCE_TENSOR_NO_INDICES
Definition: miopen.h:612

miopenActivationLEAKYRELU
@ miopenActivationLEAKYRELU
Definition: miopen.h:532

miopenActivationPASTHRU
@ miopenActivationPASTHRU
Definition: miopen.h:523

miopenActivationABS
@ miopenActivationABS
Definition: miopen.h:528

miopenActivationLOGISTIC
@ miopenActivationLOGISTIC
Definition: miopen.h:524

miopenActivationCLIPPEDRELU
@ miopenActivationCLIPPEDRELU
Definition: miopen.h:530

miopenActivationRELU
@ miopenActivationRELU
Definition: miopen.h:526

miopenActivationPOWER
@ miopenActivationPOWER
Definition: miopen.h:529

miopenActivationELU
@ miopenActivationELU
Definition: miopen.h:534

miopenActivationCLAMP
@ miopenActivationCLAMP
Definition: miopen.h:537

miopenActivationSOFTRELU
@ miopenActivationSOFTRELU
Definition: miopen.h:527

miopenActivationTANH
@ miopenActivationTANH
Definition: miopen.h:525

MIOPEN_REDUCE_TENSOR_MUL
@ MIOPEN_REDUCE_TENSOR_MUL
Definition: miopen.h:578

MIOPEN_REDUCE_TENSOR_MAX
@ MIOPEN_REDUCE_TENSOR_MAX
Definition: miopen.h:582

MIOPEN_REDUCE_TENSOR_AVG
@ MIOPEN_REDUCE_TENSOR_AVG
Definition: miopen.h:586

MIOPEN_REDUCE_TENSOR_NORM1
@ MIOPEN_REDUCE_TENSOR_NORM1
Definition: miopen.h:588

MIOPEN_REDUCE_TENSOR_AMAX
@ MIOPEN_REDUCE_TENSOR_AMAX
Definition: miopen.h:584

MIOPEN_REDUCE_TENSOR_MIN
@ MIOPEN_REDUCE_TENSOR_MIN
Definition: miopen.h:580

MIOPEN_REDUCE_TENSOR_ADD
@ MIOPEN_REDUCE_TENSOR_ADD
Definition: miopen.h:577

MIOPEN_REDUCE_TENSOR_NORM2
@ MIOPEN_REDUCE_TENSOR_NORM2
Definition: miopen.h:590

MIOPEN_CONVOLUTION_ATTRIB_DETERMINISTIC
@ MIOPEN_CONVOLUTION_ATTRIB_DETERMINISTIC
Definition: miopen.h:638

MIOPEN_CONVOLUTION_ATTRIB_FP8_ROUNDING_MODE
@ MIOPEN_CONVOLUTION_ATTRIB_FP8_ROUNDING_MODE
Definition: miopen.h:642

MIOPEN_CONVOLUTION_ATTRIB_MATH_TYPE
@ MIOPEN_CONVOLUTION_ATTRIB_MATH_TYPE
Definition: miopen.h:651

MIOPEN_CONVOLUTION_ATTRIB_FP16_ALT_IMPL
@ MIOPEN_CONVOLUTION_ATTRIB_FP16_ALT_IMPL
Definition: miopen.h:634

miopenIndexUint16
@ miopenIndexUint16
Definition: miopen.h:415

miopenIndexUint64
@ miopenIndexUint64
Definition: miopen.h:417

miopenIndexUint32
@ miopenIndexUint32
Definition: miopen.h:416

miopenIndexUint8
@ miopenIndexUint8
Definition: miopen.h:414

miopenFloat
@ miopenFloat
Definition: miopen.h:378

miopenBFloat8_fnuz
@ miopenBFloat8_fnuz
Definition: miopen.h:386

miopenBFloat16
@ miopenBFloat16
Definition: miopen.h:382

miopenInt8
@ miopenInt8
Definition: miopen.h:380

miopenInt32
@ miopenInt32
Definition: miopen.h:379

miopenHalf
@ miopenHalf
Definition: miopen.h:377

miopenInt64
@ miopenInt64
Definition: miopen.h:387

miopenDouble
@ miopenDouble
Definition: miopen.h:384

miopenFloat8_fnuz
@ miopenFloat8_fnuz
Definition: miopen.h:385

MIOPEN_8BIT_INDICES
@ MIOPEN_8BIT_INDICES
Definition: miopen.h:625

MIOPEN_32BIT_INDICES
@ MIOPEN_32BIT_INDICES
Definition: miopen.h:622

MIOPEN_16BIT_INDICES
@ MIOPEN_16BIT_INDICES
Definition: miopen.h:624

MIOPEN_64BIT_INDICES
@ MIOPEN_64BIT_INDICES
Definition: miopen.h:623

miopenPoolingWorkspaceIndexImage
@ miopenPoolingWorkspaceIndexImage
Definition: miopen.h:475

miopenPoolingWorkspaceIndexMask
@ miopenPoolingWorkspaceIndexMask
Definition: miopen.h:474

miopenDepthwise
@ miopenDepthwise
Definition: miopen.h:441

miopenGroupConv
@ miopenGroupConv
Definition: miopen.h:440

miopenTranspose
@ miopenTranspose
Definition: miopen.h:439

miopenConvolution
@ miopenConvolution
Definition: miopen.h:438

MIOPEN_ELEMENTWISE_AFFINE_FUSED_ADD
@ MIOPEN_ELEMENTWISE_AFFINE_FUSED_ADD
Definition: miopen.h:497

MIOPEN_WEIGHT_BIAS
@ MIOPEN_WEIGHT_BIAS
Definition: miopen.h:495

MIOPEN_ELEMENTWISE_AFFINE
@ MIOPEN_ELEMENTWISE_AFFINE
Definition: miopen.h:494

MIOPEN_WEIGHT_BIAS_T5
@ MIOPEN_WEIGHT_BIAS_T5
Definition: miopen.h:503

MIOPEN_ELEMENTWISE_AFFINE_T5
@ MIOPEN_ELEMENTWISE_AFFINE_T5
Definition: miopen.h:501

MIOPEN_WEIGHT_BIAS_FUSED_ADD
@ MIOPEN_WEIGHT_BIAS_FUSED_ADD
Definition: miopen.h:499

MIOPEN_REDUCE_EXTREME_ARGMAX
@ MIOPEN_REDUCE_EXTREME_ARGMAX
Definition: miopen.h:6748

MIOPEN_REDUCE_EXTREME_MIN
@ MIOPEN_REDUCE_EXTREME_MIN
Definition: miopen.h:6750

MIOPEN_REDUCE_EXTREME_MAX
@ MIOPEN_REDUCE_EXTREME_MAX
Definition: miopen.h:6752

MIOPEN_REDUCE_EXTREME_ARGMIN
@ MIOPEN_REDUCE_EXTREME_ARGMIN
Definition: miopen.h:6746

miopenTensorOpMin
@ miopenTensorOpMin
Definition: miopen.h:428

miopenTensorOpAdd
@ miopenTensorOpAdd
Definition: miopen.h:426

miopenTensorOpMul
@ miopenTensorOpMul
Definition: miopen.h:427

miopenTensorOpMax
@ miopenTensorOpMax
Definition: miopen.h:429

miopenBNSpatial
@ miopenBNSpatial
Definition: miopen.h:514

miopenBNPerActivation
@ miopenBNPerActivation
Definition: miopen.h:513

miopenConvolutionFindModeDynamicHybrid
@ miopenConvolutionFindModeDynamicHybrid
Definition: miopen.h:674

miopenConvolutionFindModeDefault
@ miopenConvolutionFindModeDefault
Definition: miopen.h:681

miopenConvolutionFindModeTrustVerifyFull
@ miopenConvolutionFindModeTrustVerifyFull
Definition: miopen.h:680

miopenConvolutionFindModeTrustVerify
@ miopenConvolutionFindModeTrustVerify
Definition: miopen.h:679

miopenConvolutionFindModeHybrid
@ miopenConvolutionFindModeHybrid
Definition: miopen.h:669

miopenConvolutionFindModeFast
@ miopenConvolutionFindModeFast
Definition: miopen.h:665

miopenConvolutionFindModeNormal
@ miopenConvolutionFindModeNormal
Definition: miopen.h:663

miopenLRNWithinChannel
@ miopenLRNWithinChannel
Definition: miopen.h:484

miopenLRNCrossChannel
@ miopenLRNCrossChannel
Definition: miopen.h:485

MIOPEN_SOFTMAX_MODE_INSTANCE
@ MIOPEN_SOFTMAX_MODE_INSTANCE
Definition: miopen.h:557

MIOPEN_SOFTMAX_MODE_CHANNEL
@ MIOPEN_SOFTMAX_MODE_CHANNEL
Definition: miopen.h:558

MIOPEN_SOFTMAX_FAST
@ MIOPEN_SOFTMAX_FAST
Definition: miopen.h:546

MIOPEN_SOFTMAX_ACCURATE
@ MIOPEN_SOFTMAX_ACCURATE
Definition: miopen.h:547

MIOPEN_SOFTMAX_LOG
@ MIOPEN_SOFTMAX_LOG
Definition: miopen.h:548

miopenConvAlgoPerf_t
Perf struct for forward, backward filter, or backward data algorithms.
Definition: miopen.h:1291

miopenConvAlgoPerf_t::fwd_algo
miopenConvFwdAlgorithm_t fwd_algo
Definition: miopen.h:1294

miopenConvAlgoPerf_t::bwd_data_algo
miopenConvBwdDataAlgorithm_t bwd_data_algo
Definition: miopen.h:1298

miopenConvAlgoPerf_t::memory
size_t memory
Definition: miopen.h:1302

miopenConvAlgoPerf_t::bwd_weights_algo
miopenConvBwdWeightsAlgorithm_t bwd_weights_algo
Definition: miopen.h:1295

miopenConvAlgoPerf_t::time
float time
Definition: miopen.h:1301

miopenConvSolution_t
Performance struct for forward, backward filter, or backward data algorithms in immediate mode.
Definition: miopen.h:1315

miopenConvSolution_t::algorithm
miopenConvAlgorithm_t algorithm
Definition: miopen.h:1322

miopenConvSolution_t::solution_id
uint64_t solution_id
Definition: miopen.h:1321

miopenConvSolution_t::workspace_size
size_t workspace_size
Definition: miopen.h:1319

miopenConvSolution_t::time
float time
Definition: miopen.h:1316

miopenTensorArgument_t
Values of a tensor or scalar argument for the miopenRunSolution function.
Definition: miopen.h:6483

miopenTensorArgument_t::id
miopenTensorArgumentId_t id
Definition: miopen.h:6486

miopenTensorArgument_t::buffer
void * buffer
Definition: miopen.h:6496

miopenTensorArgument_t::descriptor
miopenTensorDescriptor_t * descriptor
Definition: miopen.h:6492