/home/docs/checkouts/readthedocs.org/user_builds/advanced-micro-devices-miopen/checkouts/docs-6.1.2/include/miopen/miopen.h Source File

/home/docs/checkouts/readthedocs.org/user_builds/advanced-micro-devices-miopen/checkouts/docs-6.1.2/include/miopen/miopen.h Source File#

MIOpen: /home/docs/checkouts/readthedocs.org/user_builds/advanced-micro-devices-miopen/checkouts/docs-6.1.2/include/miopen/miopen.h Source File
Go to the documentation of this file.
 /*******************************************************************************
  *
  * MIT License
  *
  * Copyright (c) 2023 Advanced Micro Devices, Inc.
  *
  * Permission is hereby granted, free of charge, to any person obtaining a copy
  * of this software and associated documentation files (the "Software"), to deal
  * in the Software without restriction, including without limitation the rights
  * to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
  * copies of the Software, and to permit persons to whom the Software is
  * furnished to do so, subject to the following conditions:
  *
  * The above copyright notice and this permission notice shall be included in all
  * copies or substantial portions of the Software.
  *
  * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
  * IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
  * FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
  * AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
  * LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
  * OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
  * SOFTWARE.
  *
  *******************************************************************************/
 #ifndef MIOPEN_GUARD_MIOPEN_H_
 #define MIOPEN_GUARD_MIOPEN_H_
  
 #ifdef __clang__
 #pragma clang diagnostic push
 #pragma clang diagnostic ignored "-Wextern-c-compat"
 #endif
  
 #include <stddef.h>
 #include <stdbool.h>
 #include <miopen/config.h>
 #include <miopen/export.h>
  
 #if MIOPEN_BACKEND_OPENCL
 #define CL_TARGET_OPENCL_VERSION 120
 #if defined(__APPLE__) || defined(__MACOSX)
 #include <OpenCL/cl.h>
 #else
 #define CL_USE_DEPRECATED_OPENCL_1_2_APIS
 #include <CL/cl.h>
 #endif
  
 #elif MIOPEN_BACKEND_HIP
 #include <hip/hip_runtime_api.h>
 #endif
  
 /*
  * @defgroup convolutions
  * @defgroup pooling
  * @defgroup handle
  * @defgroup layernorm
  * @defgroup LRN
  * @defgroup batchnorm
  * @defgroup activation
  * @defgroup tensor
  * @defgroup softmax
  * @defgroup RNN
  * @defgroup fusion
  * @defgroup LossFunction
  * @defgroup TensorReduce
  * @defgroup find2
  * @defgroup sum
  * @defgroup argmax
  * @defgroup groupnorm
  * @defgroup cat
  *
  */
  
 #define MIOPEN_DECLARE_OBJECT(name) \
     struct name                     \
     {                               \
     };                              \
     typedef struct name* name##_t;
  
 #ifdef __cplusplus
 extern "C" {
 #endif
  
 #if MIOPEN_BACKEND_OPENCL
 typedef cl_command_queue miopenAcceleratorQueue_t;
 #elif MIOPEN_BACKEND_HIP
 typedef hipStream_t miopenAcceleratorQueue_t;
 #endif
  
 MIOPEN_DECLARE_OBJECT(miopenHandle);
  
 typedef enum
 {
     miopenStatusSuccess              = 0, 
     miopenStatusNotInitialized       = 1, 
     miopenStatusInvalidValue         = 2, 
     miopenStatusBadParm              = 3, 
     miopenStatusAllocFailed          = 4, 
     miopenStatusInternalError        = 5, 
     miopenStatusNotImplemented       = 6, 
     miopenStatusUnknownError         = 7, 
     miopenStatusUnsupportedOp        = 8, 
     miopenStatusGpuOperationsSkipped = 9, 
     miopenStatusVersionMismatch = 10, 
 } miopenStatus_t;
  
 #ifdef MIOPEN_BETA_API
 typedef enum
 {
     miopenF8RoundingModeStandard   = 0,
     miopenF8RoundingModeStochastic = 1,
 } miopenF8RoundingMode_t;
 #endif
  
 MIOPEN_EXPORT const char* miopenGetErrorString(miopenStatus_t error);
  
 typedef void* (*miopenAllocatorFunction)(void* context, size_t sizeBytes);
  
 typedef void (*miopenDeallocatorFunction)(void* context, void* memory);
  
 MIOPEN_EXPORT miopenStatus_t miopenGetVersion(size_t* major, size_t* minor, size_t* patch);
  
 MIOPEN_EXPORT miopenStatus_t miopenCreate(miopenHandle_t* handle);
  
 MIOPEN_EXPORT miopenStatus_t miopenCreateWithStream(miopenHandle_t* handle,
                                                     miopenAcceleratorQueue_t stream);
  
 MIOPEN_EXPORT miopenStatus_t miopenDestroy(miopenHandle_t handle);
  
 MIOPEN_EXPORT miopenStatus_t miopenSetStream(miopenHandle_t handle,
                                              miopenAcceleratorQueue_t streamID);
  
 MIOPEN_EXPORT miopenStatus_t miopenGetStream(miopenHandle_t handle,
                                              miopenAcceleratorQueue_t* streamID);
  
 MIOPEN_EXPORT miopenStatus_t miopenSetAllocator(miopenHandle_t handle,
                                                 miopenAllocatorFunction allocator,
                                                 miopenDeallocatorFunction deallocator,
                                                 void* allocatorContext);
  
 MIOPEN_EXPORT miopenStatus_t miopenGetKernelTime(miopenHandle_t handle, float* time);
  
 MIOPEN_EXPORT miopenStatus_t miopenEnableProfiling(miopenHandle_t handle, bool enable);
 // CLOSEOUT HANDLE DOXYGEN GROUP
  
 MIOPEN_DECLARE_OBJECT(miopenFusionOpDescriptor);
  
 MIOPEN_DECLARE_OBJECT(miopenTensorDescriptor);
  
 MIOPEN_DECLARE_OBJECT(miopenSeqTensorDescriptor);
  
 MIOPEN_DECLARE_OBJECT(miopenConvolutionDescriptor);
  
 MIOPEN_DECLARE_OBJECT(miopenPoolingDescriptor);
  
 MIOPEN_DECLARE_OBJECT(miopenLRNDescriptor);
  
 MIOPEN_DECLARE_OBJECT(miopenActivationDescriptor);
  
 MIOPEN_DECLARE_OBJECT(miopenRNNDescriptor);
  
 MIOPEN_DECLARE_OBJECT(miopenCTCLossDescriptor);
  
 MIOPEN_DECLARE_OBJECT(miopenDropoutDescriptor);
  
 MIOPEN_DECLARE_OBJECT(miopenReduceTensorDescriptor);
  
 typedef enum
 {
     miopenHalf  = 0, 
     miopenFloat = 1, 
     miopenInt32 = 2, 
     miopenInt8  = 3, 
     // miopenInt8x4   = 4, /*!< Pack of 4x Int8 in NCHW_VECT_C format (Support discontinued) */
     miopenBFloat16 = 5, 
     miopenDouble = 6,   
 #ifdef MIOPEN_BETA_API
     miopenFloat8  = 7,
     miopenBFloat8 = 8,
 #else
 // miopenReserved1 = 7,
 // miopenReserved2 = 8,
 #endif
 } miopenDataType_t;
  
 typedef enum
 {
     miopenTensorNCHW   = 0, 
     miopenTensorNHWC   = 1, 
     miopenTensorCHWN   = 2, 
     miopenTensorNCHWc4 = 3, 
     miopenTensorNCHWc8 = 4, 
     miopenTensorCHWNc4 = 5, 
     miopenTensorCHWNc8 = 6, 
     miopenTensorNCDHW  = 7, 
     miopenTensorNDHWC  = 8, 
 } miopenTensorLayout_t;
  
 typedef enum
 {
     miopenIndexUint8  = 0, 
     miopenIndexUint16 = 1, 
     miopenIndexUint32 = 2, 
     miopenIndexUint64 = 3, 
 } miopenIndexType_t;
  
 typedef enum
 {
     miopenTensorOpAdd = 0, 
     miopenTensorOpMul = 1, 
     miopenTensorOpMin = 2, 
     miopenTensorOpMax = 3, 
 } miopenTensorOp_t;
  
 typedef enum
 {
     miopenConvolution = 0, 
     miopenTranspose   = 1, 
     miopenGroupConv   = 2, 
     miopenDepthwise   = 3, 
 } miopenConvolutionMode_t;
  
 typedef enum
 {
     miopenPaddingDefault = 0, 
     miopenPaddingSame    = 1, 
     miopenPaddingValid   = 2, 
 } miopenPaddingMode_t;
  
 typedef enum
 {
     miopenPoolingMax              = 0, 
     miopenPoolingAverage          = 1, 
     miopenPoolingAverageInclusive = 2, 
 } miopenPoolingMode_t;
  
 typedef enum
 {
     miopenPoolingWorkspaceIndexMask  = 0, 
     miopenPoolingWorkspaceIndexImage = 1, 
 } miopenPoolingWorkspaceIndexMode_t;
  
 typedef enum
 {
     miopenLRNWithinChannel = 0, 
     miopenLRNCrossChannel  = 1, 
 } miopenLRNMode_t;
 #ifdef MIOPEN_BETA_API
 typedef enum
 {
     MIOPEN_ELEMENTWISE_AFFINE = 0, 
     MIOPEN_WEIGHT_BIAS =
         1, 
 } miopenNormMode_t;
 #endif
 typedef enum
 {
     miopenBNPerActivation = 0, 
     miopenBNSpatial       = 1, 
 } miopenBatchNormMode_t;
  
 typedef enum
 {
     miopenActivationPASTHRU  = 0, 
     miopenActivationLOGISTIC = 1, 
     miopenActivationTANH     = 2, 
     miopenActivationRELU     = 3, 
     miopenActivationSOFTRELU = 4, 
     miopenActivationABS      = 5, 
     miopenActivationPOWER = 6, 
     miopenActivationCLIPPEDRELU =
         7, 
     miopenActivationLEAKYRELU =
         8, 
     miopenActivationELU =
         9, 
 } miopenActivationMode_t;
  
 typedef enum
 {
     MIOPEN_SOFTMAX_FAST     = 0, 
     MIOPEN_SOFTMAX_ACCURATE = 1, 
     MIOPEN_SOFTMAX_LOG      = 2, 
 } miopenSoftmaxAlgorithm_t;
  
 typedef enum
 {
     MIOPEN_SOFTMAX_MODE_INSTANCE = 0, 
     MIOPEN_SOFTMAX_MODE_CHANNEL =
         1, 
 } miopenSoftmaxMode_t;
  
 #define MIOPEN_API_VERSION_REDUCE_TENSOR 1
  
 typedef enum
 {
     MIOPEN_REDUCE_TENSOR_ADD = 0, 
     MIOPEN_REDUCE_TENSOR_MUL =
         1, 
     MIOPEN_REDUCE_TENSOR_MIN =
         2, 
     MIOPEN_REDUCE_TENSOR_MAX =
         3, 
     MIOPEN_REDUCE_TENSOR_AMAX =
         4, 
     MIOPEN_REDUCE_TENSOR_AVG =
         5, 
     MIOPEN_REDUCE_TENSOR_NORM1 =
         6, 
     MIOPEN_REDUCE_TENSOR_NORM2 = 7, 
     // MIOPEN_REDUCE_TENSOR_MUL_NO_ZEROS =
     //    8, /*!< the operation is same as MUL, but does not have the zero values considered */
 } miopenReduceTensorOp_t;
  
 typedef enum
 {
     MIOPEN_NOT_PROPAGATE_NAN = 0, 
     MIOPEN_PROPAGATE_NAN     = 1, 
 } miopenNanPropagation_t;
  
 typedef enum
 {
     MIOPEN_REDUCE_TENSOR_NO_INDICES        = 0, 
     MIOPEN_REDUCE_TENSOR_FLATTENED_INDICES = 1, 
 } miopenReduceTensorIndices_t;
  
 typedef enum
 {
     MIOPEN_32BIT_INDICES = 0, 
     MIOPEN_64BIT_INDICES = 1, 
     MIOPEN_16BIT_INDICES = 2, 
     MIOPEN_8BIT_INDICES  = 3, 
 } miopenIndicesType_t;
  
 typedef enum
 {
     MIOPEN_CONVOLUTION_ATTRIB_FP16_ALT_IMPL =
         0, 
     MIOPEN_CONVOLUTION_ATTRIB_DETERMINISTIC =
         1, 
 #ifdef MIOPEN_BETA_API
     MIOPEN_CONVOLUTION_ATTRIB_FP8_ROUNDING_MODE =
         2, 
 #else
 // miopenReserved1 = 2,
 #endif
 } miopenConvolutionAttrib_t;
  
 MIOPEN_EXPORT miopenStatus_t miopenCreateTensorDescriptor(miopenTensorDescriptor_t* tensorDesc);
  
 MIOPEN_EXPORT miopenStatus_t miopenSet4dTensorDescriptor(
     miopenTensorDescriptor_t tensorDesc, miopenDataType_t dataType, int n, int c, int h, int w);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenSetNdTensorDescriptorWithLayout(miopenTensorDescriptor_t tensorDesc,
                                       miopenDataType_t dataType,
                                       miopenTensorLayout_t tensorLayout,
                                       const int* lens,
                                       int num_lens);
 MIOPEN_EXPORT miopenStatus_t miopenSet4dTensorDescriptorEx(miopenTensorDescriptor_t tensorDesc,
                                                            miopenDataType_t dataType,
                                                            int n,
                                                            int c,
                                                            int h,
                                                            int w,
                                                            int nStride,
                                                            int cStride,
                                                            int hStride,
                                                            int wStride);
  
 MIOPEN_EXPORT miopenStatus_t miopenGet4dTensorDescriptor(miopenTensorDescriptor_t tensorDesc,
                                                          miopenDataType_t* dataType,
                                                          int* n,
                                                          int* c,
                                                          int* h,
                                                          int* w,
                                                          int* nStride,
                                                          int* cStride,
                                                          int* hStride,
                                                          int* wStride);
  
 MIOPEN_EXPORT miopenStatus_t miopenSetTensorDescriptor(miopenTensorDescriptor_t tensorDesc,
                                                        miopenDataType_t dataType,
                                                        int nbDims,
                                                        const int* dimsA,
                                                        const int* stridesA);
  
 #ifdef MIOPEN_BETA_API
 MIOPEN_EXPORT miopenStatus_t miopenSetTensorCastType(miopenTensorDescriptor_t tensorDesc,
                                                      miopenDataType_t cast_type);
 #endif
  
 MIOPEN_EXPORT miopenStatus_t miopenGetTensorDescriptorSize(miopenTensorDescriptor_t tensorDesc,
                                                            int* size);
  
 MIOPEN_EXPORT miopenStatus_t miopenGetTensorDescriptor(miopenTensorDescriptor_t tensorDesc,
                                                        miopenDataType_t* dataType,
                                                        int* dimsA,
                                                        int* stridesA);
  
 MIOPEN_EXPORT miopenStatus_t miopenDestroyTensorDescriptor(miopenTensorDescriptor_t tensorDesc);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenCreateSeqTensorDescriptor(miopenSeqTensorDescriptor_t* tensorDesc);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenDestroySeqTensorDescriptor(miopenSeqTensorDescriptor_t tensorDesc);
  
 MIOPEN_EXPORT miopenStatus_t miopenOpTensor(miopenHandle_t handle,
                                             miopenTensorOp_t tensorOp,
                                             const void* alpha1,
                                             const miopenTensorDescriptor_t aDesc,
                                             const void* A,
                                             const void* alpha2,
                                             const miopenTensorDescriptor_t bDesc,
                                             const void* B,
                                             const void* beta,
                                             const miopenTensorDescriptor_t cDesc,
                                             void* C);
  
 MIOPEN_EXPORT miopenStatus_t miopenSetTensor(miopenHandle_t handle,
                                              const miopenTensorDescriptor_t yDesc,
                                              void* y,
                                              const void* alpha);
  
 MIOPEN_EXPORT miopenStatus_t miopenScaleTensor(miopenHandle_t handle,
                                                const miopenTensorDescriptor_t yDesc,
                                                void* y,
                                                const void* alpha);
  
 MIOPEN_EXPORT miopenStatus_t miopenGetTensorNumBytes(miopenTensorDescriptor_t tensorDesc,
                                                      size_t* numBytes);
  
 MIOPEN_EXPORT miopenStatus_t miopenTransformTensor(miopenHandle_t handle,
                                                    const void* alpha,
                                                    const miopenTensorDescriptor_t xDesc,
                                                    const void* x,
                                                    const void* beta,
                                                    const miopenTensorDescriptor_t yDesc,
                                                    void* y);
  
 // CLOSEOUT TENSOR DOXYGEN GROUP
  
 MIOPEN_EXPORT miopenStatus_t
 miopenCreateConvolutionDescriptor(miopenConvolutionDescriptor_t* convDesc);
  
 MIOPEN_EXPORT miopenStatus_t miopenInitConvolutionDescriptor(miopenConvolutionDescriptor_t convDesc,
                                                              miopenConvolutionMode_t c_mode,
                                                              int pad_h,
                                                              int pad_w,
                                                              int stride_h,
                                                              int stride_w,
                                                              int dilation_h,
                                                              int dilation_w);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenInitConvolutionNdDescriptor(miopenConvolutionDescriptor_t convDesc,
                                   int spatialDim,
                                   const int* padA,
                                   const int* strideA,
                                   const int* dilationA,
                                   miopenConvolutionMode_t c_mode);
  
 MIOPEN_EXPORT miopenStatus_t miopenGetConvolutionSpatialDim(miopenConvolutionDescriptor_t convDesc,
                                                             int* spatialDim);
  
 MIOPEN_EXPORT miopenStatus_t miopenGetConvolutionDescriptor(miopenConvolutionDescriptor_t convDesc,
                                                             miopenConvolutionMode_t* c_mode,
                                                             int* pad_h,
                                                             int* pad_w,
                                                             int* stride_h,
                                                             int* stride_w,
                                                             int* dilation_h,
                                                             int* dilation_w);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenGetConvolutionNdDescriptor(miopenConvolutionDescriptor_t convDesc,
                                  int requestedSpatialDim,
                                  int* spatialDim,
                                  int* padA,
                                  int* strideA,
                                  int* dilationA,
                                  miopenConvolutionMode_t* c_mode);
  
 MIOPEN_EXPORT miopenStatus_t miopenGetConvolutionGroupCount(miopenConvolutionDescriptor_t convDesc,
                                                             int* groupCount);
  
 MIOPEN_EXPORT miopenStatus_t miopenSetConvolutionGroupCount(miopenConvolutionDescriptor_t convDesc,
                                                             int groupCount);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenSetTransposeConvOutputPadding(miopenConvolutionDescriptor_t convDesc, int adj_h, int adj_w);
  
 MIOPEN_EXPORT miopenStatus_t miopenSetTransposeConvNdOutputPadding(
     miopenConvolutionDescriptor_t convDesc, int spatialDim, const int* adjA);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenGetConvolutionForwardOutputDim(miopenConvolutionDescriptor_t convDesc,
                                      const miopenTensorDescriptor_t inputTensorDesc,
                                      const miopenTensorDescriptor_t filterDesc,
                                      int* n,
                                      int* c,
                                      int* h,
                                      int* w);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenGetConvolutionNdForwardOutputDim(miopenConvolutionDescriptor_t convDesc,
                                        const miopenTensorDescriptor_t inputTensorDesc,
                                        const miopenTensorDescriptor_t filterDesc,
                                        int* nDim,
                                        int* outputTensorDimA);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenDestroyConvolutionDescriptor(miopenConvolutionDescriptor_t convDesc);
  
 MIOPEN_EXPORT miopenStatus_t miopenSetConvolutionAttribute(miopenConvolutionDescriptor_t convDesc,
                                                            const miopenConvolutionAttrib_t attr,
                                                            int value);
  
 MIOPEN_EXPORT miopenStatus_t miopenGetConvolutionAttribute(miopenConvolutionDescriptor_t convDesc,
                                                            const miopenConvolutionAttrib_t attr,
                                                            int* value);
  
 typedef enum
 {
     miopenConvolutionFwdAlgoGEMM         = 0, 
     miopenConvolutionFwdAlgoDirect       = 1, 
     miopenConvolutionFwdAlgoFFT          = 2, 
     miopenConvolutionFwdAlgoWinograd     = 3, 
     miopenConvolutionFwdAlgoImplicitGEMM = 5, 
 } miopenConvFwdAlgorithm_t;
  
 typedef enum
 {
     miopenConvolutionBwdWeightsAlgoGEMM         = 0, 
     miopenConvolutionBwdWeightsAlgoDirect       = 1, 
     miopenConvolutionBwdWeightsAlgoWinograd     = 3, 
     miopenConvolutionBwdWeightsAlgoImplicitGEMM = 5, 
 } miopenConvBwdWeightsAlgorithm_t;
  
 typedef enum
 {
     miopenConvolutionBwdDataAlgoGEMM     = 0, 
     miopenConvolutionBwdDataAlgoDirect   = 1, 
     miopenConvolutionBwdDataAlgoFFT      = 2, 
     miopenConvolutionBwdDataAlgoWinograd = 3, 
     miopenTransposeBwdDataAlgoGEMM =
         4, 
     miopenConvolutionBwdDataAlgoImplicitGEMM = 5, 
 } miopenConvBwdDataAlgorithm_t;
  
 typedef enum
 {
     miopenConvolutionAlgoGEMM         = 0, 
     miopenConvolutionAlgoDirect       = 1, 
     miopenConvolutionAlgoFFT          = 2, 
     miopenConvolutionAlgoWinograd     = 3, 
     miopenConvolutionAlgoImplicitGEMM = 5, 
 } miopenConvAlgorithm_t;
  
 typedef struct
 {
     union
     {
         miopenConvFwdAlgorithm_t fwd_algo; 
         miopenConvBwdWeightsAlgorithm_t bwd_weights_algo; 
         miopenConvBwdDataAlgorithm_t
             bwd_data_algo; 
     };
  
     float time;    
     size_t memory; 
 } miopenConvAlgoPerf_t;
  
 typedef struct
 {
     float time; 
     size_t workspace_size; 
     uint64_t solution_id;  
     miopenConvAlgorithm_t algorithm; 
 } miopenConvSolution_t;
  
 MIOPEN_EXPORT miopenStatus_t
 miopenConvolutionForwardGetSolutionCount(miopenHandle_t handle,
                                          const miopenTensorDescriptor_t wDesc,
                                          const miopenTensorDescriptor_t xDesc,
                                          const miopenConvolutionDescriptor_t convDesc,
                                          const miopenTensorDescriptor_t yDesc,
                                          size_t* solutionCount);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenConvolutionForwardGetSolution(miopenHandle_t handle,
                                     const miopenTensorDescriptor_t wDesc,
                                     const miopenTensorDescriptor_t xDesc,
                                     const miopenConvolutionDescriptor_t convDesc,
                                     const miopenTensorDescriptor_t yDesc,
                                     const size_t maxSolutionCount,
                                     size_t* solutionCount,
                                     miopenConvSolution_t* solutions);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenConvolutionForwardGetSolutionWorkspaceSize(miopenHandle_t handle,
                                                  const miopenTensorDescriptor_t wDesc,
                                                  const miopenTensorDescriptor_t xDesc,
                                                  const miopenConvolutionDescriptor_t convDesc,
                                                  const miopenTensorDescriptor_t yDesc,
                                                  const uint64_t solution_id,
                                                  size_t* workSpaceSize);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenConvolutionForwardCompileSolution(miopenHandle_t handle,
                                         const miopenTensorDescriptor_t wDesc,
                                         const miopenTensorDescriptor_t xDesc,
                                         const miopenConvolutionDescriptor_t convDesc,
                                         const miopenTensorDescriptor_t yDesc,
                                         const uint64_t solution_id);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenConvolutionForwardImmediate(miopenHandle_t handle,
                                   const miopenTensorDescriptor_t wDesc,
                                   const void* w,
                                   const miopenTensorDescriptor_t xDesc,
                                   const void* x,
                                   const miopenConvolutionDescriptor_t convDesc,
                                   const miopenTensorDescriptor_t yDesc,
                                   void* y,
                                   void* workSpace,
                                   size_t workSpaceSize,
                                   const uint64_t solution_id);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenConvolutionBackwardDataGetSolutionCount(miopenHandle_t handle,
                                               const miopenTensorDescriptor_t dyDesc,
                                               const miopenTensorDescriptor_t wDesc,
                                               const miopenConvolutionDescriptor_t convDesc,
                                               const miopenTensorDescriptor_t dxDesc,
                                               size_t* solutionCount);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenConvolutionBackwardDataGetSolution(miopenHandle_t handle,
                                          const miopenTensorDescriptor_t dyDesc,
                                          const miopenTensorDescriptor_t wDesc,
                                          const miopenConvolutionDescriptor_t convDesc,
                                          const miopenTensorDescriptor_t dxDesc,
                                          const size_t maxSolutionCount,
                                          size_t* solutionCount,
                                          miopenConvSolution_t* solutions);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenConvolutionBackwardDataGetSolutionWorkspaceSize(miopenHandle_t handle,
                                                       const miopenTensorDescriptor_t dyDesc,
                                                       const miopenTensorDescriptor_t wDesc,
                                                       const miopenConvolutionDescriptor_t convDesc,
                                                       const miopenTensorDescriptor_t dxDesc,
                                                       const uint64_t solution_id,
                                                       size_t* workSpaceSize);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenConvolutionBackwardDataCompileSolution(miopenHandle_t handle,
                                              const miopenTensorDescriptor_t dyDesc,
                                              const miopenTensorDescriptor_t wDesc,
                                              const miopenConvolutionDescriptor_t convDesc,
                                              const miopenTensorDescriptor_t dxDesc,
                                              const uint64_t solution_id);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenConvolutionBackwardDataImmediate(miopenHandle_t handle,
                                        const miopenTensorDescriptor_t dyDesc,
                                        const void* dy,
                                        const miopenTensorDescriptor_t wDesc,
                                        const void* w,
                                        const miopenConvolutionDescriptor_t convDesc,
                                        const miopenTensorDescriptor_t dxDesc,
                                        void* dx,
                                        void* workSpace,
                                        size_t workSpaceSize,
                                        const uint64_t solution_id);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenConvolutionBackwardWeightsGetSolutionCount(miopenHandle_t handle,
                                                  const miopenTensorDescriptor_t dyDesc,
                                                  const miopenTensorDescriptor_t xDesc,
                                                  const miopenConvolutionDescriptor_t convDesc,
                                                  const miopenTensorDescriptor_t dwDesc,
                                                  size_t* solutionCount);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenConvolutionBackwardWeightsGetSolution(miopenHandle_t handle,
                                             const miopenTensorDescriptor_t dyDesc,
                                             const miopenTensorDescriptor_t xDesc,
                                             const miopenConvolutionDescriptor_t convDesc,
                                             const miopenTensorDescriptor_t dwDesc,
                                             const size_t maxSolutionCount,
                                             size_t* solutionCount,
                                             miopenConvSolution_t* solutions);
  
 MIOPEN_EXPORT miopenStatus_t miopenConvolutionBackwardWeightsGetSolutionWorkspaceSize(
     miopenHandle_t handle,
     const miopenTensorDescriptor_t dyDesc,
     const miopenTensorDescriptor_t xDesc,
     const miopenConvolutionDescriptor_t convDesc,
     const miopenTensorDescriptor_t dwDesc,
     const uint64_t solution_id,
     size_t* workSpaceSize);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenConvolutionBackwardWeightsCompileSolution(miopenHandle_t handle,
                                                 const miopenTensorDescriptor_t dyDesc,
                                                 const miopenTensorDescriptor_t xDesc,
                                                 const miopenConvolutionDescriptor_t convDesc,
                                                 const miopenTensorDescriptor_t dwDesc,
                                                 const uint64_t solution_id);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenConvolutionBackwardWeightsImmediate(miopenHandle_t handle,
                                           const miopenTensorDescriptor_t dyDesc,
                                           const void* dy,
                                           const miopenTensorDescriptor_t xDesc,
                                           const void* x,
                                           const miopenConvolutionDescriptor_t convDesc,
                                           const miopenTensorDescriptor_t dwDesc,
                                           void* dw,
                                           void* workSpace,
                                           size_t workSpaceSize,
                                           const uint64_t solution_id);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenConvolutionForwardGetWorkSpaceSize(miopenHandle_t handle,
                                          const miopenTensorDescriptor_t wDesc,
                                          const miopenTensorDescriptor_t xDesc,
                                          const miopenConvolutionDescriptor_t convDesc,
                                          const miopenTensorDescriptor_t yDesc,
                                          size_t* workSpaceSize);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenFindConvolutionForwardAlgorithm(miopenHandle_t handle,
                                       const miopenTensorDescriptor_t xDesc,
                                       const void* x,
                                       const miopenTensorDescriptor_t wDesc,
                                       const void* w,
                                       const miopenConvolutionDescriptor_t convDesc,
                                       const miopenTensorDescriptor_t yDesc,
                                       void* y,
                                       const int requestAlgoCount,
                                       int* returnedAlgoCount,
                                       miopenConvAlgoPerf_t* perfResults,
                                       void* workSpace,
                                       size_t workSpaceSize,
                                       bool exhaustiveSearch);
  
 MIOPEN_EXPORT miopenStatus_t miopenConvolutionForward(miopenHandle_t handle,
                                                       const void* alpha,
                                                       const miopenTensorDescriptor_t xDesc,
                                                       const void* x,
                                                       const miopenTensorDescriptor_t wDesc,
                                                       const void* w,
                                                       const miopenConvolutionDescriptor_t convDesc,
                                                       miopenConvFwdAlgorithm_t algo,
                                                       const void* beta,
                                                       const miopenTensorDescriptor_t yDesc,
                                                       void* y,
                                                       void* workSpace,
                                                       size_t workSpaceSize);
  
 MIOPEN_EXPORT miopenStatus_t miopenConvolutionForwardBias(miopenHandle_t handle,
                                                           const void* alpha,
                                                           const miopenTensorDescriptor_t bDesc,
                                                           const void* b,
                                                           const void* beta,
                                                           const miopenTensorDescriptor_t yDesc,
                                                           void* y);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenConvolutionBackwardDataGetWorkSpaceSize(miopenHandle_t handle,
                                               const miopenTensorDescriptor_t dyDesc,
                                               const miopenTensorDescriptor_t wDesc,
                                               const miopenConvolutionDescriptor_t convDesc,
                                               const miopenTensorDescriptor_t dxDesc,
                                               size_t* workSpaceSize);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenFindConvolutionBackwardDataAlgorithm(miopenHandle_t handle,
                                            const miopenTensorDescriptor_t dyDesc,
                                            const void* dy,
                                            const miopenTensorDescriptor_t wDesc,
                                            const void* w,
                                            const miopenConvolutionDescriptor_t convDesc,
                                            const miopenTensorDescriptor_t dxDesc,
                                            void* dx,
                                            const int requestAlgoCount,
                                            int* returnedAlgoCount,
                                            miopenConvAlgoPerf_t* perfResults,
                                            void* workSpace,
                                            size_t workSpaceSize,
                                            bool exhaustiveSearch);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenConvolutionBackwardData(miopenHandle_t handle,
                               const void* alpha,
                               const miopenTensorDescriptor_t dyDesc,
                               const void* dy,
                               const miopenTensorDescriptor_t wDesc,
                               const void* w,
                               const miopenConvolutionDescriptor_t convDesc,
                               miopenConvBwdDataAlgorithm_t algo,
                               const void* beta,
                               const miopenTensorDescriptor_t dxDesc,
                               void* dx,
                               void* workSpace,
                               size_t workSpaceSize);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenConvolutionBackwardWeightsGetWorkSpaceSize(miopenHandle_t handle,
                                                  const miopenTensorDescriptor_t dyDesc,
                                                  const miopenTensorDescriptor_t xDesc,
                                                  const miopenConvolutionDescriptor_t convDesc,
                                                  const miopenTensorDescriptor_t dwDesc,
                                                  size_t* workSpaceSize);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenFindConvolutionBackwardWeightsAlgorithm(miopenHandle_t handle,
                                               const miopenTensorDescriptor_t dyDesc,
                                               const void* dy,
                                               const miopenTensorDescriptor_t xDesc,
                                               const void* x,
                                               const miopenConvolutionDescriptor_t convDesc,
                                               const miopenTensorDescriptor_t dwDesc,
                                               void* dw,
                                               const int requestAlgoCount,
                                               int* returnedAlgoCount,
                                               miopenConvAlgoPerf_t* perfResults,
                                               void* workSpace,
                                               size_t workSpaceSize,
                                               bool exhaustiveSearch);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenConvolutionBackwardWeights(miopenHandle_t handle,
                                  const void* alpha,
                                  const miopenTensorDescriptor_t dyDesc,
                                  const void* dy,
                                  const miopenTensorDescriptor_t xDesc,
                                  const void* x,
                                  const miopenConvolutionDescriptor_t convDesc,
                                  miopenConvBwdWeightsAlgorithm_t algo,
                                  const void* beta,
                                  const miopenTensorDescriptor_t dwDesc,
                                  void* dw,
                                  void* workSpace,
                                  size_t workSpaceSize);
  
 MIOPEN_EXPORT miopenStatus_t miopenConvolutionBackwardBias(miopenHandle_t handle,
                                                            const void* alpha,
                                                            const miopenTensorDescriptor_t dyDesc,
                                                            const void* dy,
                                                            const void* beta,
                                                            const miopenTensorDescriptor_t dbDesc,
                                                            void* db);
  
 // CLOSEOUT CONVOLUTIONS DOXYGEN GROUP
  
 // Pooling APIs
 MIOPEN_EXPORT miopenStatus_t miopenCreatePoolingDescriptor(miopenPoolingDescriptor_t* poolDesc);
  
 MIOPEN_EXPORT miopenStatus_t miopenSetPoolingIndexType(miopenPoolingDescriptor_t poolDesc,
                                                        miopenIndexType_t index_type);
  
 MIOPEN_EXPORT miopenStatus_t miopenGetPoolingIndexType(miopenPoolingDescriptor_t poolDesc,
                                                        miopenIndexType_t* index_type);
  
 MIOPEN_EXPORT miopenStatus_t miopenSetPoolingWorkSpaceIndexMode(
     miopenPoolingDescriptor_t poolDesc, miopenPoolingWorkspaceIndexMode_t workspace_index);
  
 MIOPEN_EXPORT miopenStatus_t miopenGetPoolingWorkSpaceIndexMode(
     miopenPoolingDescriptor_t poolDesc, miopenPoolingWorkspaceIndexMode_t* workspace_index);
  
 MIOPEN_EXPORT miopenStatus_t miopenSet2dPoolingDescriptor(miopenPoolingDescriptor_t poolDesc,
                                                           miopenPoolingMode_t mode,
                                                           int windowHeight,
                                                           int windowWidth,
                                                           int pad_h,
                                                           int pad_w,
                                                           int stride_h,
                                                           int stride_w);
  
 MIOPEN_EXPORT miopenStatus_t miopenGet2dPoolingDescriptor(const miopenPoolingDescriptor_t poolDesc,
                                                           miopenPoolingMode_t* mode,
                                                           int* windowHeight,
                                                           int* windowWidth,
                                                           int* pad_h,
                                                           int* pad_w,
                                                           int* stride_h,
                                                           int* stride_w);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenGetPoolingForwardOutputDim(const miopenPoolingDescriptor_t poolDesc,
                                  const miopenTensorDescriptor_t tensorDesc,
                                  int* n,
                                  int* c,
                                  int* h,
                                  int* w);
  
 MIOPEN_EXPORT miopenStatus_t miopenSetNdPoolingDescriptor(miopenPoolingDescriptor_t poolDesc,
                                                           const miopenPoolingMode_t mode,
                                                           int nbDims,
                                                           const int* windowDimA,
                                                           const int* padA,
                                                           const int* stridesA);
  
 MIOPEN_EXPORT miopenStatus_t miopenGetNdPoolingDescriptor(const miopenPoolingDescriptor_t poolDesc,
                                                           int nbDimsRequested,
                                                           miopenPoolingMode_t* mode,
                                                           int* nbDims,
                                                           int* windowDimA,
                                                           int* padA,
                                                           int* stridesA);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenGetPoolingNdForwardOutputDim(const miopenPoolingDescriptor_t poolDesc,
                                    const miopenTensorDescriptor_t tensorDesc,
                                    int dims,
                                    int* tensorDimArr);
  
 MIOPEN_EXPORT miopenStatus_t miopenPoolingGetWorkSpaceSize(const miopenTensorDescriptor_t yDesc,
                                                            size_t* workSpaceSize);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenPoolingGetWorkSpaceSizeV2(const miopenPoolingDescriptor_t poolDesc,
                                 const miopenTensorDescriptor_t yDesc,
                                 size_t* workSpaceSize);
  
 MIOPEN_EXPORT miopenStatus_t miopenPoolingForward(miopenHandle_t handle,
                                                   const miopenPoolingDescriptor_t poolDesc,
                                                   const void* alpha,
                                                   const miopenTensorDescriptor_t xDesc,
                                                   const void* x,
                                                   const void* beta,
                                                   const miopenTensorDescriptor_t yDesc,
                                                   void* y,
                                                   bool do_backward,
                                                   void* workSpace,
                                                   size_t workSpaceSize);
  
 MIOPEN_EXPORT miopenStatus_t miopenPoolingBackward(miopenHandle_t handle,
                                                    const miopenPoolingDescriptor_t poolDesc,
                                                    const void* alpha,
                                                    const miopenTensorDescriptor_t yDesc,
                                                    const void* y,
                                                    const miopenTensorDescriptor_t dyDesc,
                                                    const void* dy,
                                                    const miopenTensorDescriptor_t xDesc,
                                                    const void* x,
                                                    const void* beta,
                                                    const miopenTensorDescriptor_t dxDesc,
                                                    void* dx,
                                                    void* workSpace);
  
 MIOPEN_EXPORT miopenStatus_t miopenDestroyPoolingDescriptor(miopenPoolingDescriptor_t poolDesc);
  
 // CLOSEOUT POOLING DOXYGEN GROUP
  
 // LRN APIs
 MIOPEN_EXPORT miopenStatus_t miopenCreateLRNDescriptor(miopenLRNDescriptor_t* lrnDesc);
  
 MIOPEN_EXPORT miopenStatus_t miopenSetLRNDescriptor(const miopenLRNDescriptor_t lrnDesc,
                                                     miopenLRNMode_t mode,
                                                     unsigned int lrnN,
                                                     double lrnAlpha,
                                                     double lrnBeta,
                                                     double lrnK);
  
 MIOPEN_EXPORT miopenStatus_t miopenGetLRNDescriptor(const miopenLRNDescriptor_t lrnDesc,
                                                     miopenLRNMode_t* mode,
                                                     unsigned int* lrnN,
                                                     double* lrnAlpha,
                                                     double* lrnBeta,
                                                     double* lrnK);
  
 MIOPEN_EXPORT miopenStatus_t miopenLRNGetWorkSpaceSize(const miopenTensorDescriptor_t yDesc,
                                                        size_t* workSpaceSize);
  
 MIOPEN_EXPORT miopenStatus_t miopenLRNForward(miopenHandle_t handle,
                                               const miopenLRNDescriptor_t lrnDesc,
                                               const void* alpha,
                                               const miopenTensorDescriptor_t xDesc,
                                               const void* x,
                                               const void* beta,
                                               const miopenTensorDescriptor_t yDesc,
                                               void* y,
                                               bool do_backward,
                                               void* workSpace);
  
 MIOPEN_EXPORT miopenStatus_t miopenLRNBackward(miopenHandle_t handle,
                                                const miopenLRNDescriptor_t lrnDesc,
                                                const void* alpha,
                                                const miopenTensorDescriptor_t yDesc,
                                                const void* y,
                                                const miopenTensorDescriptor_t dyDesc,
                                                const void* dy,
                                                const miopenTensorDescriptor_t xDesc,
                                                const void* x,
                                                const void* beta,
                                                const miopenTensorDescriptor_t dxDesc,
                                                void* dx,
                                                const void* workSpace);
  
 MIOPEN_EXPORT miopenStatus_t miopenDestroyLRNDescriptor(miopenLRNDescriptor_t lrnDesc);
  
 // CLOSEOUT LRN DOXYGEN GROUP
  
 #ifdef MIOPEN_BETA_API
 // LayerNorm APIs
 MIOPEN_EXPORT miopenStatus_t miopenLayerNormForward(miopenHandle_t handle,
                                                     miopenNormMode_t mode,
                                                     const miopenTensorDescriptor_t xDesc,
                                                     const void* x,
                                                     const miopenTensorDescriptor_t weightDesc,
                                                     const void* weight,
                                                     const miopenTensorDescriptor_t biasDesc,
                                                     const void* bias,
                                                     const float epsilon,
                                                     const int32_t normalized_dim,
                                                     const miopenTensorDescriptor_t yDesc,
                                                     void* y,
                                                     const miopenTensorDescriptor_t meanDesc,
                                                     void* mean,
                                                     const miopenTensorDescriptor_t rstdDesc,
                                                     void* rstd);
  
 // CLOSEOUT LAYERNORM DOXYGEN GROUP
 #endif
  
 #ifdef MIOPEN_BETA_API
 // Cat APIs
 MIOPEN_EXPORT miopenStatus_t miopenCatForward(miopenHandle_t handle,
                                               const int32_t xCount,
                                               const miopenTensorDescriptor_t* xDescs,
                                               const void* const* xs,
                                               const miopenTensorDescriptor_t yDesc,
                                               void* y,
                                               const int32_t dim);
  
 // CLOSEOUT CAT DOXYGEN GROUP
 #endif
  
 // Batch-Normalization APIs
 MIOPEN_EXPORT miopenStatus_t miopenDeriveBNTensorDescriptor(miopenTensorDescriptor_t derivedBnDesc,
                                                             const miopenTensorDescriptor_t xDesc,
                                                             miopenBatchNormMode_t bn_mode);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenBatchNormalizationForwardTraining(miopenHandle_t handle,
                                         miopenBatchNormMode_t bn_mode,
                                         void* alpha,
                                         void* beta,
                                         const miopenTensorDescriptor_t xDesc,
                                         const void* x,
                                         const miopenTensorDescriptor_t yDesc,
                                         void* y,
                                         const miopenTensorDescriptor_t bnScaleBiasMeanVarDesc,
                                         void* bnScale,
                                         void* bnBias,
                                         double expAvgFactor,
                                         void* resultRunningMean,
                                         void* resultRunningVariance,
                                         double epsilon,
                                         void* resultSaveMean,
                                         void* resultSaveInvVariance);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenBatchNormalizationForwardInference(miopenHandle_t handle,
                                          miopenBatchNormMode_t bn_mode,
                                          void* alpha,
                                          void* beta,
                                          const miopenTensorDescriptor_t xDesc,
                                          const void* x,
                                          const miopenTensorDescriptor_t yDesc,
                                          void* y,
                                          const miopenTensorDescriptor_t bnScaleBiasMeanVarDesc,
                                          void* bnScale,
                                          void* bnBias,
                                          void* estimatedMean,
                                          void* estimatedVariance,
                                          double epsilon);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenBatchNormalizationBackward(miopenHandle_t handle,
                                  miopenBatchNormMode_t bn_mode,
                                  const void* alphaDataDiff,
                                  const void* betaDataDiff,
                                  const void* alphaParamDiff,
                                  const void* betaParamDiff,
                                  const miopenTensorDescriptor_t xDesc,
                                  const void* x,
                                  const miopenTensorDescriptor_t dyDesc,
                                  const void* dy,
                                  const miopenTensorDescriptor_t dxDesc,
                                  void* dx,
                                  const miopenTensorDescriptor_t bnScaleBiasDiffDesc,
                                  const void* bnScale,
                                  void* resultBnScaleDiff,
                                  void* resultBnBiasDiff,
                                  double epsilon,
                                  const void* savedMean,
                                  const void* savedInvVariance);
  
 // CLOSEOUT BATCHNORM DOXYGEN GROUP
  
 // Activation APIs
 MIOPEN_EXPORT miopenStatus_t
 miopenCreateActivationDescriptor(miopenActivationDescriptor_t* activDesc);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenSetActivationDescriptor(const miopenActivationDescriptor_t activDesc,
                               miopenActivationMode_t mode,
                               double activAlpha,
                               double activBeta,
                               double activGamma);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenGetActivationDescriptor(const miopenActivationDescriptor_t activDesc,
                               miopenActivationMode_t* mode,
                               double* activAlpha,
                               double* activBeta,
                               double* activGamma);
  
 MIOPEN_EXPORT miopenStatus_t miopenActivationForward(miopenHandle_t handle,
                                                      const miopenActivationDescriptor_t activDesc,
                                                      const void* alpha,
                                                      const miopenTensorDescriptor_t xDesc,
                                                      const void* x,
                                                      const void* beta,
                                                      const miopenTensorDescriptor_t yDesc,
                                                      void* y);
  
 MIOPEN_EXPORT miopenStatus_t miopenActivationBackward(miopenHandle_t handle,
                                                       const miopenActivationDescriptor_t activDesc,
                                                       const void* alpha,
                                                       const miopenTensorDescriptor_t yDesc,
                                                       const void* y,
                                                       const miopenTensorDescriptor_t dyDesc,
                                                       const void* dy,
                                                       const miopenTensorDescriptor_t xDesc,
                                                       const void* x,
                                                       const void* beta,
                                                       const miopenTensorDescriptor_t dxDesc,
                                                       void* dx);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenDestroyActivationDescriptor(miopenActivationDescriptor_t activDesc);
  
 // CLOSEOUT ACTIVATION DOXYGEN GROUP
  
 // Softmax APIs
 MIOPEN_EXPORT miopenStatus_t miopenSoftmaxForward(miopenHandle_t handle,
                                                   const void* alpha,
                                                   const miopenTensorDescriptor_t xDesc,
                                                   const void* x,
                                                   const void* beta,
                                                   const miopenTensorDescriptor_t yDesc,
                                                   void* y);
  
 MIOPEN_EXPORT miopenStatus_t miopenSoftmaxBackward(miopenHandle_t handle,
                                                    const void* alpha,
                                                    const miopenTensorDescriptor_t yDesc,
                                                    const void* y,
                                                    const miopenTensorDescriptor_t dyDesc,
                                                    const void* dy,
                                                    const void* beta,
                                                    const miopenTensorDescriptor_t dxDesc,
                                                    void* dx);
  
 MIOPEN_EXPORT miopenStatus_t miopenSoftmaxForward_V2(miopenHandle_t handle,
                                                      const void* alpha,
                                                      const miopenTensorDescriptor_t xDesc,
                                                      const void* x,
                                                      const void* beta,
                                                      const miopenTensorDescriptor_t yDesc,
                                                      void* y,
                                                      miopenSoftmaxAlgorithm_t algorithm,
                                                      miopenSoftmaxMode_t mode);
  
 MIOPEN_EXPORT miopenStatus_t miopenSoftmaxBackward_V2(miopenHandle_t handle,
                                                       const void* alpha,
                                                       const miopenTensorDescriptor_t yDesc,
                                                       const void* y,
                                                       const miopenTensorDescriptor_t dyDesc,
                                                       const void* dy,
                                                       const void* beta,
                                                       const miopenTensorDescriptor_t dxDesc,
                                                       void* dx,
                                                       miopenSoftmaxAlgorithm_t algorithm,
                                                       miopenSoftmaxMode_t mode);
  
 // CLOSEOUT SOFTMAX DOXYGEN GROUP
  
 MIOPEN_DECLARE_OBJECT(miopenFusionPlanDescriptor);
 MIOPEN_DECLARE_OBJECT(miopenOperatorDescriptor);
 MIOPEN_DECLARE_OBJECT(miopenOperatorArgs);
  
 typedef enum
 {
     miopenVerticalFusion   = 0, 
     miopenHorizontalFusion = 1, 
 } miopenFusionDirection_t;
  
 MIOPEN_EXPORT miopenStatus_t miopenCreateFusionPlan(miopenFusionPlanDescriptor_t* fusePlanDesc,
                                                     const miopenFusionDirection_t fuseDirection,
                                                     const miopenTensorDescriptor_t inputDesc);
  
 MIOPEN_EXPORT miopenStatus_t miopenDestroyFusionPlan(miopenFusionPlanDescriptor_t fusePlanDesc);
  
 MIOPEN_EXPORT miopenStatus_t miopenCompileFusionPlan(miopenHandle_t handle,
                                                      miopenFusionPlanDescriptor_t fusePlanDesc);
  
 MIOPEN_EXPORT miopenStatus_t miopenFusionPlanGetOp(miopenFusionPlanDescriptor_t fusePlanDesc,
                                                    const int op_idx,
                                                    miopenFusionOpDescriptor_t* op);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenFusionPlanGetWorkSpaceSize(miopenHandle_t handle,
                                  miopenFusionPlanDescriptor_t fusePlanDesc,
                                  size_t* workSpaceSize,
                                  miopenConvFwdAlgorithm_t algo);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenFusionPlanConvolutionGetAlgo(miopenFusionPlanDescriptor_t fusePlanDesc,
                                    const int requestAlgoCount,
                                    int* returnedAlgoCount,
                                    miopenConvFwdAlgorithm_t* returnedAlgos);
  
 MIOPEN_EXPORT miopenStatus_t miopenFusionPlanConvolutionSetAlgo(
     miopenFusionPlanDescriptor_t fusePlanDesc, miopenConvFwdAlgorithm_t algo);
  
 MIOPEN_EXPORT miopenStatus_t miopenCreateOpConvForward(miopenFusionPlanDescriptor_t fusePlanDesc,
                                                        miopenFusionOpDescriptor_t* convOp,
                                                        miopenConvolutionDescriptor_t convDesc,
                                                        const miopenTensorDescriptor_t wDesc);
  
 //---
  
 // Activation forward create ops ---
 MIOPEN_EXPORT miopenStatus_t
 miopenCreateOpActivationForward(miopenFusionPlanDescriptor_t fusePlanDesc,
                                 miopenFusionOpDescriptor_t* activFwdOp,
                                 miopenActivationMode_t mode);
  
 // Activation backward create ops ---
 MIOPEN_EXPORT miopenStatus_t
 miopenCreateOpActivationBackward(miopenFusionPlanDescriptor_t fusePlanDesc,
                                  miopenFusionOpDescriptor_t* activBwdOp,
                                  miopenActivationMode_t mode);
  
 // Bias create ops ---
 MIOPEN_EXPORT miopenStatus_t miopenCreateOpBiasForward(miopenFusionPlanDescriptor_t fusePlanDesc,
                                                        miopenFusionOpDescriptor_t* biasOp,
                                                        const miopenTensorDescriptor_t bDesc);
  
 // Batch normalization create ops ---
 MIOPEN_EXPORT miopenStatus_t
 miopenCreateOpBatchNormInference(miopenFusionPlanDescriptor_t fusePlanDesc,
                                  miopenFusionOpDescriptor_t* bnOp,
                                  const miopenBatchNormMode_t bn_mode,
                                  const miopenTensorDescriptor_t bnScaleBiasMeanVarDesc);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenCreateOpBatchNormForward(miopenFusionPlanDescriptor_t fusePlanDesc,
                                miopenFusionOpDescriptor_t* bnFwdOp,
                                const miopenBatchNormMode_t bn_mode,
                                bool runningMeanVariance);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenCreateOpBatchNormBackward(miopenFusionPlanDescriptor_t fusePlanDesc,
                                 miopenFusionOpDescriptor_t* bnBwdOp,
                                 const miopenBatchNormMode_t bn_mode);
  
 //---
 MIOPEN_EXPORT miopenStatus_t miopenCreateOperatorArgs(miopenOperatorArgs_t* args);
  
 MIOPEN_EXPORT miopenStatus_t miopenDestroyOperatorArgs(miopenOperatorArgs_t args);
  
 // Convolution set arguments ---
 MIOPEN_EXPORT miopenStatus_t miopenSetOpArgsConvForward(miopenOperatorArgs_t args,
                                                         const miopenFusionOpDescriptor_t convOp,
                                                         const void* alpha,
                                                         const void* beta,
                                                         const void* w);
 // Activation set arguments ---
 MIOPEN_EXPORT miopenStatus_t
 miopenSetOpArgsActivForward(miopenOperatorArgs_t args,
                             const miopenFusionOpDescriptor_t activFwdOp,
                             const void* alpha,
                             const void* beta,
                             double activAlpha,
                             double activBeta,
                             double activGamma);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenSetOpArgsActivBackward(miopenOperatorArgs_t args,
                              const miopenFusionOpDescriptor_t activBwdOp,
                              const void* alpha,
                              const void* beta,
                              const void* y,
                              const void* reserved,
                              double activAlpha,
                              double activBeta,
                              double activGamma);
  
 // Batch Normalization set arguments ---
 MIOPEN_EXPORT miopenStatus_t
 miopenSetOpArgsBatchNormInference(miopenOperatorArgs_t args,
                                   const miopenFusionOpDescriptor_t bnOp,
                                   const void* alpha,
                                   const void* beta,
                                   const void* bnScale,
                                   const void* bnBias,
                                   const void* estimatedMean,
                                   const void* estimatedVariance,
                                   double epsilon);
  
 MIOPEN_EXPORT miopenStatus_t miopenSetOpArgsBatchNormForward(miopenOperatorArgs_t args,
                                                              const miopenFusionOpDescriptor_t bnOp,
                                                              const void* alpha,
                                                              const void* beta,
                                                              const void* bnScale,
                                                              const void* bnBias,
                                                              void* savedMean,
                                                              void* savedInvVariance,
                                                              void* runningMean,
                                                              void* runningVariance,
                                                              double expAvgFactor,
                                                              double epsilon);
  
 MIOPEN_EXPORT miopenStatus_t miopenSetOpArgsBatchNormBackward(miopenOperatorArgs_t args,
                                                               const miopenFusionOpDescriptor_t bnOp,
                                                               const void* alpha,
                                                               const void* beta,
                                                               const void* x,
                                                               const void* bnScale,
                                                               const void* bnBias,
                                                               void* resultBnScaleDiff,
                                                               void* resultBnBiasDiff,
                                                               const void* savedMean,
                                                               const void* savedInvVariance);
  
 // Bias forward set arguments ---
 MIOPEN_EXPORT miopenStatus_t miopenSetOpArgsBiasForward(miopenOperatorArgs_t args,
                                                         const miopenFusionOpDescriptor_t biasOp,
                                                         const void* alpha,
                                                         const void* beta,
                                                         const void* bias);
 MIOPEN_EXPORT miopenStatus_t
 miopenExecuteFusionPlan(const miopenHandle_t handle,
                         const miopenFusionPlanDescriptor_t fusePlanDesc,
                         const miopenTensorDescriptor_t inputDesc,
                         const void* input,
                         const miopenTensorDescriptor_t outputDesc,
                         void* output,
                         miopenOperatorArgs_t args);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenConvolutionBiasActivationForward(miopenHandle_t handle,
                                        const void* alpha1,
                                        const miopenTensorDescriptor_t xDesc,
                                        const void* x,
                                        const miopenTensorDescriptor_t wDesc,
                                        const void* w,
                                        const miopenConvolutionDescriptor_t convDesc,
                                        miopenConvFwdAlgorithm_t algo,
                                        void* workspace,
                                        size_t workspaceSizeInBytes,
                                        const void* alpha2,
                                        const miopenTensorDescriptor_t zDesc,
                                        const void* z,
                                        const miopenTensorDescriptor_t biasDesc,
                                        const void* bias,
                                        const miopenActivationDescriptor_t activationDesc,
                                        const miopenTensorDescriptor_t yDesc,
                                        void* y);
 // CLOSEOUT FUSION DOXYGEN GROUP
  
 typedef enum
 {
     miopenRNNRELU = 0, 
     miopenRNNTANH = 1, 
     miopenLSTM    = 2, 
     miopenGRU     = 3, 
 } miopenRNNMode_t;
  
 typedef enum
 {
     miopenRNNlinear = 0, 
     miopenRNNskip   = 1, 
 } miopenRNNInputMode_t;
  
 typedef enum
 {
     miopenRNNdefault = 0, 
     miopenRNNfundamental =
         1, 
 } miopenRNNAlgo_t;
  
 typedef enum
 {
     miopenRNNunidirection = 0, 
     miopenRNNbidirection  = 1, 
 } miopenRNNDirectionMode_t;
  
 typedef enum
 {
     miopenRNNNoBias   = 0, 
     miopenRNNwithBias = 1, 
 } miopenRNNBiasMode_t;
  
 typedef enum
 {
     miopenRNNAlgoGEMM = 0,
 } miopenRNNGEMMalgoMode_t;
  
 typedef enum
 {
     miopenRNNIONotPadded   = 0, 
     miopenRNNIOWithPadding = 1, 
 } miopenRNNPaddingMode_t;
  
 typedef enum
 {
     miopenRNNTraining  = 0, 
     miopenRNNInference = 1, 
 } miopenRNNFWDMode_t;
  
 typedef enum
 {
     miopenRNNDataUnknownLayout     = 0,
     miopenRNNDataSeqMajorNotPadded = 1,
     miopenRNNDataSeqMajorPadded    = 2,
     miopenRNNDataBatchMajorPadded  = 3,
 } miopenRNNBaseLayout_t;
  
 MIOPEN_EXPORT miopenStatus_t miopenCreateRNNDescriptor(miopenRNNDescriptor_t* rnnDesc);
  
 MIOPEN_EXPORT miopenStatus_t miopenGetRNNDescriptor(miopenRNNDescriptor_t rnnDesc,
                                                     miopenRNNMode_t* rnnMode,
                                                     miopenRNNAlgo_t* algoMode,
                                                     miopenRNNInputMode_t* inputMode,
                                                     miopenRNNDirectionMode_t* dirMode,
                                                     miopenRNNBiasMode_t* biasMode,
                                                     int* hiddenSize,
                                                     int* layer);
  
 MIOPEN_EXPORT miopenStatus_t miopenGetRNNDescriptor_V2(miopenRNNDescriptor_t rnnDesc,
                                                        int* hiddenSize,
                                                        int* layer,
                                                        miopenDropoutDescriptor_t* dropoutDesc,
                                                        miopenRNNInputMode_t* inputMode,
                                                        miopenRNNDirectionMode_t* dirMode,
                                                        miopenRNNMode_t* rnnMode,
                                                        miopenRNNBiasMode_t* biasMode,
                                                        miopenRNNAlgo_t* algoMode,
                                                        miopenDataType_t* dataType);
  
 MIOPEN_EXPORT miopenStatus_t miopenDestroyRNNDescriptor(miopenRNNDescriptor_t rnnDesc);
  
 MIOPEN_EXPORT miopenStatus_t miopenSetRNNDescriptor(miopenRNNDescriptor_t rnnDesc,
                                                     const int hsize,
                                                     const int nlayers,
                                                     miopenRNNInputMode_t inMode,
                                                     miopenRNNDirectionMode_t direction,
                                                     miopenRNNMode_t rnnMode,
                                                     miopenRNNBiasMode_t biasMode,
                                                     miopenRNNAlgo_t algo,
                                                     miopenDataType_t dataType);
  
 MIOPEN_EXPORT miopenStatus_t miopenSetRNNDescriptor_V2(miopenRNNDescriptor_t rnnDesc,
                                                        const int hsize,
                                                        const int nlayers,
                                                        miopenDropoutDescriptor_t dropoutDesc,
                                                        miopenRNNInputMode_t inMode,
                                                        miopenRNNDirectionMode_t direction,
                                                        miopenRNNMode_t rnnMode,
                                                        miopenRNNBiasMode_t biasMode,
                                                        miopenRNNAlgo_t algo,
                                                        miopenDataType_t dataType);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenSetRNNDataSeqTensorDescriptor(miopenSeqTensorDescriptor_t seqTensorDesc,
                                     miopenDataType_t dataType,
                                     miopenRNNBaseLayout_t layout,
                                     int maxSequenceLen,
                                     int batchSize,
                                     int vectorSize,
                                     const int* sequenceLenArray,
                                     void* paddingMarker);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenGetRNNDataSeqTensorDescriptor(miopenSeqTensorDescriptor_t seqTensorDesc,
                                     miopenDataType_t* dataType,
                                     miopenRNNBaseLayout_t* layout,
                                     int* maxSequenceLen,
                                     int* batchSize,
                                     int* vectorSize,
                                     int sequenceLenArrayLimit,
                                     int* sequenceLenArray,
                                     void* paddingMarker);
  
 MIOPEN_EXPORT miopenStatus_t miopenGetRNNWorkspaceSize(miopenHandle_t handle,
                                                        const miopenRNNDescriptor_t rnnDesc,
                                                        const int sequenceLen,
                                                        const miopenTensorDescriptor_t* xDesc,
                                                        size_t* numBytes);
  
 MIOPEN_EXPORT miopenStatus_t miopenGetRNNTrainingReserveSize(miopenHandle_t handle,
                                                              miopenRNNDescriptor_t rnnDesc,
                                                              const int sequenceLen,
                                                              const miopenTensorDescriptor_t* xDesc,
                                                              size_t* numBytes);
  
 MIOPEN_EXPORT miopenStatus_t miopenGetRNNTempSpaceSizes(miopenHandle_t handle,
                                                         miopenRNNDescriptor_t rnnDesc,
                                                         miopenSeqTensorDescriptor_t xDesc,
                                                         miopenRNNFWDMode_t fwdMode,
                                                         size_t* workSpaceSize,
                                                         size_t* reserveSpaceSize);
  
 MIOPEN_EXPORT miopenStatus_t miopenGetRNNParamsSize(miopenHandle_t handle,
                                                     miopenRNNDescriptor_t rnnDesc,
                                                     miopenTensorDescriptor_t xDesc,
                                                     size_t* numBytes,
                                                     miopenDataType_t dtype);
  
 MIOPEN_EXPORT miopenStatus_t miopenGetRNNParamsDescriptor(miopenHandle_t handle,
                                                           miopenRNNDescriptor_t rnnDesc,
                                                           miopenTensorDescriptor_t xDesc,
                                                           miopenTensorDescriptor_t wDesc,
                                                           miopenDataType_t dtype);
  
 MIOPEN_EXPORT miopenStatus_t miopenGetRNNInputTensorSize(miopenHandle_t handle,
                                                          miopenRNNDescriptor_t rnnDesc,
                                                          const int seqLen,
                                                          miopenTensorDescriptor_t* xDesc,
                                                          size_t* numBytes);
  
 MIOPEN_EXPORT miopenStatus_t miopenGetRNNHiddenTensorSize(miopenHandle_t handle,
                                                           miopenRNNDescriptor_t rnnDesc,
                                                           const int seqLen,
                                                           miopenTensorDescriptor_t* xDesc,
                                                           size_t* numBytes);
  
 MIOPEN_EXPORT miopenStatus_t miopenGetRNNLayerParamSize(miopenHandle_t handle,
                                                         miopenRNNDescriptor_t rnnDesc,
                                                         const int layer,
                                                         miopenTensorDescriptor_t xDesc,
                                                         const int paramID,
                                                         size_t* numBytes);
  
 MIOPEN_EXPORT miopenStatus_t miopenGetRNNLayerBiasSize(miopenHandle_t handle,
                                                        miopenRNNDescriptor_t rnnDesc,
                                                        const int layer,
                                                        const int biasID,
                                                        size_t* numBytes);
  
 MIOPEN_EXPORT miopenStatus_t miopenGetRNNLayerParam(miopenHandle_t handle,
                                                     miopenRNNDescriptor_t rnnDesc,
                                                     const int layer,
                                                     miopenTensorDescriptor_t xDesc,
                                                     miopenTensorDescriptor_t wDesc,
                                                     const void* w,
                                                     const int paramID,
                                                     miopenTensorDescriptor_t paramDesc,
                                                     void* layerParam);
  
 MIOPEN_EXPORT miopenStatus_t miopenGetRNNLayerBias(miopenHandle_t handle,
                                                    miopenRNNDescriptor_t rnnDesc,
                                                    const int layer,
                                                    miopenTensorDescriptor_t xDesc,
                                                    miopenTensorDescriptor_t wDesc,
                                                    const void* w,
                                                    const int biasID,
                                                    miopenTensorDescriptor_t biasDesc,
                                                    void* layerBias);
  
 MIOPEN_EXPORT miopenStatus_t miopenGetRNNLayerParamOffset(miopenRNNDescriptor_t rnnDesc,
                                                           const int layer,
                                                           miopenTensorDescriptor_t xDesc,
                                                           const int paramID,
                                                           miopenTensorDescriptor_t paramDesc,
                                                           size_t* layerParamOffset);
  
 MIOPEN_EXPORT miopenStatus_t miopenGetRNNLayerBiasOffset(miopenRNNDescriptor_t rnnDesc,
                                                          const int layer,
                                                          miopenTensorDescriptor_t xDesc,
                                                          const int biasID,
                                                          miopenTensorDescriptor_t biasDesc,
                                                          size_t* layerBiasOffset);
  
 MIOPEN_EXPORT miopenStatus_t miopenSetRNNLayerParam(miopenHandle_t handle,
                                                     miopenRNNDescriptor_t rnnDesc,
                                                     const int layer,
                                                     miopenTensorDescriptor_t xDesc,
                                                     miopenTensorDescriptor_t wDesc,
                                                     void* w,
                                                     const int paramID,
                                                     miopenTensorDescriptor_t paramDesc,
                                                     const void* layerParam);
  
 MIOPEN_EXPORT miopenStatus_t miopenSetRNNLayerBias(miopenHandle_t handle,
                                                    miopenRNNDescriptor_t rnnDesc,
                                                    const int layer,
                                                    miopenTensorDescriptor_t xDesc,
                                                    miopenTensorDescriptor_t wDesc,
                                                    void* w,
                                                    const int biasID,
                                                    miopenTensorDescriptor_t biasDesc,
                                                    const void* layerBias);
  
 MIOPEN_EXPORT miopenStatus_t miopenSetRNNPaddingMode(miopenRNNDescriptor_t rnnDesc,
                                                      miopenRNNPaddingMode_t paddingMode);
  
 MIOPEN_EXPORT miopenStatus_t miopenGetRNNPaddingMode(miopenRNNDescriptor_t rnnDesc,
                                                      miopenRNNPaddingMode_t* paddingMode);
  
 MIOPEN_EXPORT miopenStatus_t miopenRNNForward(miopenHandle_t handle,
                                               const miopenRNNDescriptor_t rnnDesc,
                                               miopenRNNFWDMode_t fwdMode,
                                               const miopenSeqTensorDescriptor_t xDesc,
                                               const void* x,
                                               const miopenTensorDescriptor_t hDesc,
                                               const void* hx,
                                               void* hy,
                                               const miopenTensorDescriptor_t cDesc,
                                               const void* cx,
                                               void* cy,
                                               const miopenSeqTensorDescriptor_t yDesc,
                                               void* y,
                                               const void* w,
                                               size_t weightSpaceSize,
                                               void* workSpace,
                                               size_t workSpaceNumBytes,
                                               void* reserveSpace,
                                               size_t reserveSpaceNumBytes);
  
 MIOPEN_EXPORT miopenStatus_t miopenRNNBackwardSeqData(miopenHandle_t handle,
                                                       const miopenRNNDescriptor_t rnnDesc,
                                                       const miopenSeqTensorDescriptor_t yDesc,
                                                       const void* y,
                                                       const void* dy,
                                                       const miopenTensorDescriptor_t hDesc,
                                                       const void* hx,
                                                       const void* dhy,
                                                       void* dhx,
                                                       const miopenTensorDescriptor_t cDesc,
                                                       const void* cx,
                                                       const void* dcy,
                                                       void* dcx,
                                                       const miopenSeqTensorDescriptor_t xDesc,
                                                       void* dx,
                                                       const void* w,
                                                       size_t weightSpaceSize,
                                                       void* workSpace,
                                                       size_t workSpaceNumBytes,
                                                       void* reserveSpace,
                                                       size_t reserveSpaceNumBytes);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenRNNBackwardWeightsSeqTensor(miopenHandle_t handle,
                                   const miopenRNNDescriptor_t rnnDesc,
                                   const miopenSeqTensorDescriptor_t xDesc,
                                   const void* x,
                                   const miopenTensorDescriptor_t hDesc,
                                   const void* hx,
                                   const miopenSeqTensorDescriptor_t yDesc,
                                   const void* y,
                                   void* dw,
                                   size_t weightSpaceSize,
                                   void* workSpace,
                                   size_t workSpaceNumBytes,
                                   const void* reserveSpace,
                                   size_t reserveSpaceNumBytes);
  
 MIOPEN_EXPORT miopenStatus_t miopenRNNForwardTraining(miopenHandle_t handle,
                                                       const miopenRNNDescriptor_t rnnDesc,
                                                       const int sequenceLen,
                                                       const miopenTensorDescriptor_t* xDesc,
                                                       const void* x,
                                                       const miopenTensorDescriptor_t hxDesc,
                                                       const void* hx,
                                                       const miopenTensorDescriptor_t cxDesc,
                                                       const void* cx,
                                                       const miopenTensorDescriptor_t wDesc,
                                                       const void* w,
                                                       const miopenTensorDescriptor_t* yDesc,
                                                       void* y,
                                                       const miopenTensorDescriptor_t hyDesc,
                                                       void* hy,
                                                       const miopenTensorDescriptor_t cyDesc,
                                                       void* cy,
                                                       void* workSpace,
                                                       size_t workSpaceNumBytes,
                                                       void* reserveSpace,
                                                       size_t reserveSpaceNumBytes);
  
 MIOPEN_EXPORT miopenStatus_t miopenRNNBackwardData(miopenHandle_t handle,
                                                    const miopenRNNDescriptor_t rnnDesc,
                                                    const int sequenceLen,
                                                    const miopenTensorDescriptor_t* yDesc,
                                                    const void* y,
                                                    const miopenTensorDescriptor_t* dyDesc,
                                                    const void* dy,
                                                    const miopenTensorDescriptor_t dhyDesc,
                                                    const void* dhy,
                                                    const miopenTensorDescriptor_t dcyDesc,
                                                    const void* dcy,
                                                    const miopenTensorDescriptor_t wDesc,
                                                    const void* w,
                                                    const miopenTensorDescriptor_t hxDesc,
                                                    const void* hx,
                                                    const miopenTensorDescriptor_t cxDesc,
                                                    const void* cx,
                                                    const miopenTensorDescriptor_t* dxDesc,
                                                    void* dx,
                                                    const miopenTensorDescriptor_t dhxDesc,
                                                    void* dhx,
                                                    const miopenTensorDescriptor_t dcxDesc,
                                                    void* dcx,
                                                    void* workSpace,
                                                    size_t workSpaceNumBytes,
                                                    void* reserveSpace,
                                                    size_t reserveSpaceNumBytes);
  
 MIOPEN_EXPORT miopenStatus_t miopenRNNBackwardWeights(miopenHandle_t handle,
                                                       const miopenRNNDescriptor_t rnnDesc,
                                                       const int sequenceLen,
                                                       const miopenTensorDescriptor_t* xDesc,
                                                       const void* x,
                                                       const miopenTensorDescriptor_t hxDesc,
                                                       const void* hx,
                                                       const miopenTensorDescriptor_t* yDesc,
                                                       const void* y,
                                                       const miopenTensorDescriptor_t dwDesc,
                                                       void* dw,
                                                       void* workSpace,
                                                       size_t workSpaceNumBytes,
                                                       const void* reserveSpace,
                                                       size_t reserveSpaceNumBytes);
  
 MIOPEN_EXPORT miopenStatus_t miopenRNNForwardInference(miopenHandle_t handle,
                                                        miopenRNNDescriptor_t rnnDesc,
                                                        const int sequenceLen,
                                                        const miopenTensorDescriptor_t* xDesc,
                                                        const void* x,
                                                        const miopenTensorDescriptor_t hxDesc,
                                                        const void* hx,
                                                        const miopenTensorDescriptor_t cxDesc,
                                                        const void* cx,
                                                        const miopenTensorDescriptor_t wDesc,
                                                        const void* w,
                                                        const miopenTensorDescriptor_t* yDesc,
                                                        void* y,
                                                        const miopenTensorDescriptor_t hyDesc,
                                                        void* hy,
                                                        const miopenTensorDescriptor_t cyDesc,
                                                        void* cy,
                                                        void* workSpace,
                                                        size_t workSpaceNumBytes);
  
 // CLOSEOUT RNN DOXYGEN GROUP
  
 typedef enum
 {
     MIOPEN_CTC_LOSS_ALGO_DETERMINISTIC = 0, 
 } miopenCTCLossAlgo_t;
  
 MIOPEN_EXPORT miopenStatus_t miopenCreateCTCLossDescriptor(miopenCTCLossDescriptor_t* ctcLossDesc);
  
 MIOPEN_EXPORT miopenStatus_t miopenGetCTCLossDescriptor(miopenCTCLossDescriptor_t ctcLossDesc,
                                                         miopenDataType_t* dataType,
                                                         int* blank_label_id,
                                                         bool* apply_softmax_layer);
  
 MIOPEN_EXPORT miopenStatus_t miopenDestroyCTCLossDescriptor(miopenCTCLossDescriptor_t ctcLossDesc);
  
 MIOPEN_EXPORT miopenStatus_t miopenSetCTCLossDescriptor(miopenCTCLossDescriptor_t ctcLossDesc,
                                                         miopenDataType_t dataType,
                                                         const int blank_label_id,
                                                         bool apply_softmax_layer);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenGetCTCLossWorkspaceSize(miopenHandle_t handle,
                               const miopenTensorDescriptor_t probsDesc,
                               const miopenTensorDescriptor_t gradientsDesc,
                               const int* labels,
                               const int* labelLengths,
                               const int* inputLengths,
                               miopenCTCLossAlgo_t algo,
                               const miopenCTCLossDescriptor_t ctcLossDesc,
                               size_t* workSpaceSize);
  
 MIOPEN_EXPORT miopenStatus_t miopenCTCLoss(miopenHandle_t handle,
                                            const miopenTensorDescriptor_t probsDesc,
                                            const void* probs,
                                            const int* labels,
                                            const int* labelLengths,
                                            const int* inputLengths,
                                            void* losses,
                                            const miopenTensorDescriptor_t gradientsDesc,
                                            void* gradients,
                                            miopenCTCLossAlgo_t algo,
                                            const miopenCTCLossDescriptor_t ctcLossDesc,
                                            void* workSpace,
                                            size_t workSpaceSize);
  
 // CLOSEOUT LossFunction DOXYGEN GROUP
  
 // Dropout APIs
 typedef enum
 {
     MIOPEN_RNG_PSEUDO_XORWOW = 0, 
 } miopenRNGType_t;
  
 MIOPEN_EXPORT miopenStatus_t miopenCreateDropoutDescriptor(miopenDropoutDescriptor_t* dropoutDesc);
  
 MIOPEN_EXPORT miopenStatus_t miopenDestroyDropoutDescriptor(miopenDropoutDescriptor_t dropoutDesc);
  
 MIOPEN_EXPORT miopenStatus_t miopenDropoutGetReserveSpaceSize(const miopenTensorDescriptor_t xDesc,
                                                               size_t* reserveSpaceSizeInBytes);
  
 MIOPEN_EXPORT miopenStatus_t miopenDropoutGetStatesSize(miopenHandle_t handle,
                                                         size_t* stateSizeInBytes);
  
 MIOPEN_EXPORT miopenStatus_t miopenGetDropoutDescriptor(miopenDropoutDescriptor_t dropoutDesc,
                                                         miopenHandle_t handle,
                                                         float* dropout,
                                                         void** states,
                                                         unsigned long long* seed,
                                                         bool* use_mask,
                                                         bool* state_evo,
                                                         miopenRNGType_t* rng_mode);
  
 MIOPEN_EXPORT miopenStatus_t miopenRestoreDropoutDescriptor(miopenDropoutDescriptor_t dropoutDesc,
                                                             miopenHandle_t handle,
                                                             float dropout,
                                                             void* states,
                                                             size_t stateSizeInBytes,
                                                             unsigned long long seed,
                                                             bool use_mask,
                                                             bool state_evo,
                                                             miopenRNGType_t rng_mode);
  
 MIOPEN_EXPORT miopenStatus_t miopenSetDropoutDescriptor(miopenDropoutDescriptor_t dropoutDesc,
                                                         miopenHandle_t handle,
                                                         float dropout,
                                                         void* states,
                                                         size_t stateSizeInBytes,
                                                         unsigned long long seed,
                                                         bool use_mask,
                                                         bool state_evo,
                                                         miopenRNGType_t rng_mode);
  
 MIOPEN_EXPORT miopenStatus_t miopenDropoutForward(miopenHandle_t handle,
                                                   const miopenDropoutDescriptor_t dropoutDesc,
                                                   const miopenTensorDescriptor_t noise_shape,
                                                   const miopenTensorDescriptor_t xDesc,
                                                   const void* x,
                                                   const miopenTensorDescriptor_t yDesc,
                                                   void* y,
                                                   void* reserveSpace,
                                                   size_t reserveSpaceSizeInBytes);
  
 MIOPEN_EXPORT miopenStatus_t miopenDropoutBackward(miopenHandle_t handle,
                                                    const miopenDropoutDescriptor_t dropoutDesc,
                                                    const miopenTensorDescriptor_t noise_shape,
                                                    const miopenTensorDescriptor_t dyDesc,
                                                    const void* dy,
                                                    const miopenTensorDescriptor_t dxDesc,
                                                    void* dx,
                                                    void* reserveSpace,
                                                    size_t reserveSpaceSizeInBytes);
  
 // CLOSEOUT DROPOUT DOXYGEN GROUP
  
 // TensorReduce APIs
 MIOPEN_EXPORT miopenStatus_t
 miopenCreateReduceTensorDescriptor(miopenReduceTensorDescriptor_t* reduceTensorDesc);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenDestroyReduceTensorDescriptor(miopenReduceTensorDescriptor_t reduceTensorDesc);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenSetReduceTensorDescriptor(miopenReduceTensorDescriptor_t reduceTensorDesc,
                                 miopenReduceTensorOp_t reduceTensorOp,
                                 miopenDataType_t reduceTensorCompType,
                                 miopenNanPropagation_t reduceTensorNanOpt,
                                 miopenReduceTensorIndices_t reduceTensorIndices,
                                 miopenIndicesType_t reduceTensorIndicesType);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenGetReduceTensorDescriptor(const miopenReduceTensorDescriptor_t reduceTensorDesc,
                                 miopenReduceTensorOp_t* reduceTensorOp,
                                 miopenDataType_t* reduceTensorCompType,
                                 miopenNanPropagation_t* reduceTensorNanOpt,
                                 miopenReduceTensorIndices_t* reduceTensorIndices,
                                 miopenIndicesType_t* reduceTensorIndicesType);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenGetReductionIndicesSize(miopenHandle_t handle,
                               const miopenReduceTensorDescriptor_t reduceTensorDesc,
                               const miopenTensorDescriptor_t aDesc,
                               const miopenTensorDescriptor_t cDesc,
                               size_t* sizeInBytes);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenGetReductionWorkspaceSize(miopenHandle_t handle,
                                 const miopenReduceTensorDescriptor_t reduceTensorDesc,
                                 const miopenTensorDescriptor_t aDesc,
                                 const miopenTensorDescriptor_t cDesc,
                                 size_t* sizeInBytes);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenReduceTensor(miopenHandle_t handle,
                    const miopenReduceTensorDescriptor_t reduceTensorDesc,
                    void* indices,
                    size_t indicesSizeInBytes,
                    void* workspace,
                    size_t workspaceSizeInBytes,
                    const void* alpha,
                    const miopenTensorDescriptor_t aDesc,
                    const void* A,
                    const void* beta,
                    const miopenTensorDescriptor_t cDesc,
                    void* C);
  
 // CLOSEOUT TensorReduce DOXYGEN GROUP
  
 // Find 2.0 API
 MIOPEN_DECLARE_OBJECT(miopenProblem);
  
 typedef enum
 {
     miopenProblemDirectionForward         = 0,
     miopenProblemDirectionBackward        = 1,
     miopenProblemDirectionBackwardWeights = 2,
 } miopenProblemDirection_t;
  
 typedef enum
 {
     miopenTensorArgumentIdInvalid = 0,
     miopenTensorConvolutionX      = 1,
     miopenTensorConvolutionW      = 2,
     miopenTensorConvolutionY      = 3,
 #ifdef MIOPEN_BETA_API
     miopenTensorActivationX  = 4,
     miopenTensorActivationY  = 5,
     miopenTensorActivationDX = 6,
     miopenTensorActivationDY = 7,
     miopenTensorBiasX        = 8,
     miopenTensorBiasY        = 9,
     miopenTensorBias         = 10,
 #endif
 } miopenTensorArgumentId_t;
  
 typedef enum
 {
     miopenFindResultsOrderByTime          = 0,
     miopenFindResultsOrderByWorkspaceSize = 1,
 } miopenFindResultsOrder_t;
  
 MIOPEN_EXPORT miopenStatus_t miopenCreateConvProblem(miopenProblem_t* problem,
                                                      miopenConvolutionDescriptor_t operatorDesc,
                                                      miopenProblemDirection_t direction);
  
 MIOPEN_EXPORT miopenStatus_t miopenDestroyProblem(miopenProblem_t problem);
  
 MIOPEN_EXPORT miopenStatus_t
 miopenSetProblemTensorDescriptor(miopenProblem_t problem,
                                  miopenTensorArgumentId_t id,
                                  const miopenTensorDescriptor_t descriptor);
  
 MIOPEN_DECLARE_OBJECT(miopenFindOptions);
  
 MIOPEN_EXPORT miopenStatus_t miopenCreateFindOptions(miopenFindOptions_t* options);
  
 MIOPEN_EXPORT miopenStatus_t miopenDestroyFindOptions(miopenFindOptions_t options);
  
 MIOPEN_EXPORT miopenStatus_t miopenSetFindOptionTuning(miopenFindOptions_t options, int value);
  
 MIOPEN_EXPORT miopenStatus_t miopenSetFindOptionResultsOrder(miopenFindOptions_t options,
                                                              miopenFindResultsOrder_t value);
  
 MIOPEN_EXPORT miopenStatus_t miopenSetFindOptionWorkspaceLimit(miopenFindOptions_t options,
                                                                size_t value);
  
 MIOPEN_EXPORT miopenStatus_t miopenSetFindOptionPreallocatedWorkspace(miopenFindOptions_t options,
                                                                       void* buffer,
                                                                       size_t size);
  
 MIOPEN_EXPORT miopenStatus_t miopenSetFindOptionPreallocatedTensor(miopenFindOptions_t options,
                                                                    miopenTensorArgumentId_t id,
                                                                    void* buffer);
  
 MIOPEN_DECLARE_OBJECT(miopenSolution);
  
 MIOPEN_EXPORT miopenStatus_t miopenFindSolutions(miopenHandle_t handle,
                                                  miopenProblem_t problem,
                                                  miopenFindOptions_t options,
                                                  miopenSolution_t* solutions,
                                                  size_t* numSolutions,
                                                  size_t maxSolutions);
  
 struct miopenTensorArgument_t
 {
     /* @brief Identifier of the tensor argument.
      */
     miopenTensorArgumentId_t id;
     /* @brief Tensor descriptor to override the value stored in the solution.
      *
      * Some solvers may support overriding input and output tensor descriptors, but right now there
      * is no way to tell from the API. Intended for the future use.
      */
     miopenTensorDescriptor_t* descriptor;
     /* @brief Pointer to the device memory buffer to use for the operation.
      */
     void* buffer;
 };
  
 MIOPEN_EXPORT miopenStatus_t miopenRunSolution(miopenHandle_t handle,
                                                miopenSolution_t solution,
                                                size_t nInputs,
                                                const miopenTensorArgument_t* tensors,
                                                void* workspace,
                                                size_t workspaceSize);
  
 MIOPEN_EXPORT miopenStatus_t miopenDestroySolution(miopenSolution_t solution);
  
 MIOPEN_EXPORT miopenStatus_t miopenLoadSolution(miopenSolution_t* solution,
                                                 const char* data,
                                                 size_t size);
  
 MIOPEN_EXPORT miopenStatus_t miopenSaveSolution(miopenSolution_t solution, char* data);
  
 MIOPEN_EXPORT miopenStatus_t miopenGetSolutionSize(miopenSolution_t solution, size_t* size);
  
 MIOPEN_EXPORT miopenStatus_t miopenGetSolutionWorkspaceSize(miopenSolution_t solution,
                                                             size_t* workspaceSize);
  
 MIOPEN_EXPORT miopenStatus_t miopenGetSolutionTime(miopenSolution_t solution, float* time);
  
 MIOPEN_EXPORT miopenStatus_t miopenGetSolutionSolverId(miopenSolution_t solution,
                                                        uint64_t* solverId);
  
 MIOPEN_EXPORT miopenStatus_t miopenGetSolverIdConvAlgorithm(uint64_t solverId,
                                                             miopenConvAlgorithm_t* result);
  
 #ifdef MIOPEN_BETA_API
  
 MIOPEN_EXPORT miopenStatus_t
 miopenCreateActivationProblem(miopenProblem_t* problem,
                               miopenActivationDescriptor_t operatorDesc,
                               miopenProblemDirection_t direction);
  
 MIOPEN_EXPORT miopenStatus_t miopenFuseProblems(miopenProblem_t problem1, miopenProblem_t problem2);
  
 MIOPEN_EXPORT miopenStatus_t miopenCreateBiasProblem(miopenProblem_t* problem,
                                                      miopenProblemDirection_t direction);
  
 #endif
  
 // CLOSEOUT find2 DOXYGEN GROUP
  
 #ifdef MIOPEN_BETA_API
  
 typedef enum
 {
     MIOPEN_SUM_NOT_PROPAGATE_NAN = 0, 
     MIOPEN_SUM_PROPAGATE_NAN     = 1, 
 } miopenSumNanPropagation_t;
  
 // Sum APIs
 MIOPEN_EXPORT miopenStatus_t miopenGetSumWorkspaceSize(miopenHandle_t handle,
                                                        const miopenTensorDescriptor_t xDesc,
                                                        const int32_t dim,
                                                        const miopenTensorDescriptor_t yDesc,
                                                        size_t* sizeInBytes);
  
 MIOPEN_EXPORT miopenStatus_t miopenSumForward(miopenHandle_t handle,
                                               miopenSumNanPropagation_t nanPropagation,
                                               void* workspace,
                                               size_t workspaceSizeInBytes,
                                               const miopenTensorDescriptor_t xDesc,
                                               const void* x,
                                               const int32_t dim,
                                               const miopenTensorDescriptor_t yDesc,
                                               void* y);
  
 // CLOSEOUT SUM DOXYGEN GROUP
 #endif
  
 #ifdef MIOPEN_BETA_API
 // Argmax APIs
 MIOPEN_EXPORT miopenStatus_t miopenArgmaxForward(miopenHandle_t handle,
                                                  const miopenTensorDescriptor_t xDesc,
                                                  const void* x,
                                                  const int32_t dim,
                                                  const miopenTensorDescriptor_t yDesc,
                                                  void* y);
 #endif
  
 #ifdef MIOPEN_BETA_API
 // GroupNorm APIs
 MIOPEN_EXPORT miopenStatus_t miopenGroupNormForward(miopenHandle_t handle,
                                                     miopenNormMode_t mode,
                                                     const miopenTensorDescriptor_t xDesc,
                                                     const void* x,
                                                     const miopenTensorDescriptor_t weightDesc,
                                                     const void* weight,
                                                     const miopenTensorDescriptor_t biasDesc,
                                                     const void* bias,
                                                     const uint64_t num_groups,
                                                     const float epsilon,
                                                     const miopenTensorDescriptor_t yDesc,
                                                     void* y,
                                                     const miopenTensorDescriptor_t meanDesc,
                                                     void* mean,
                                                     const miopenTensorDescriptor_t rstdDesc,
                                                     void* rstd);
  
 // CLOSEOUT groupnorm DOXYGEN GROUP
 #endif
  
 #ifdef __cplusplus
 }
 #endif
  
 #ifdef __clang__
 #pragma clang diagnostic pop
 #endif
  
 #endif // MIOPEN_GUARD_MIOPEN_H_