/home/docs/checkouts/readthedocs.org/user_builds/advanced-micro-devices-composable-kernel/checkouts/docs-7.0.0/include/ck_tile/ops/batched_transpose/pipeline/batched_transpose_problem.hpp Source File

/home/docs/checkouts/readthedocs.org/user_builds/advanced-micro-devices-composable-kernel/checkouts/docs-7.0.0/include/ck_tile/ops/batched_transpose/pipeline/batched_transpose_problem.hpp Source File#

Composable Kernel: /home/docs/checkouts/readthedocs.org/user_builds/advanced-micro-devices-composable-kernel/checkouts/docs-7.0.0/include/ck_tile/ops/batched_transpose/pipeline/batched_transpose_problem.hpp Source File

Go to the documentation of this file.

 // SPDX-License-Identifier: MIT
 // Copyright (c) 2018-2025, Advanced Micro Devices, Inc. All rights reserved.
  
 #pragma once
  
 #include "ck_tile/core.hpp"
 #include <type_traits>
  
 #define VectorLoadSize 16
  
 namespace ck_tile {
  
 template <typename InputType_,
           typename BlockTile, // Sequence<...
           typename WarpTile,  // Sequence<...
           typename ThreadTile,
           bool kPadM_ = false,
           bool kPadN_ = false> // Sequence<...
 struct BatchedTransposeProblem
 {
     using InputType = remove_cvref_t<InputType_>;
  
     static constexpr index_t kMPerThread = ThreadTile::at(number<0>{});
     static constexpr index_t kNPerThread = ThreadTile::at(number<1>{});
  
     static constexpr index_t kMPerWarp = WarpTile::at(number<0>{});
     static constexpr index_t kNPerWarp = WarpTile::at(number<1>{});
  
     static constexpr index_t kMThreadPerWarp = kMPerWarp / kMPerThread;
     static constexpr index_t kNThreadPerWarp = kNPerWarp / kNPerThread;
  
     static constexpr index_t kMPerBlock = BlockTile::at(number<0>{});
     static constexpr index_t kNPerBlock = BlockTile::at(number<1>{});
  
     static constexpr index_t kMWarpPerBlock = kMPerBlock / kMPerWarp;
     static constexpr index_t kNWarpPerBlock = kNPerBlock / kNPerWarp;
  
     static constexpr index_t kBlockSize =
         kMThreadPerWarp * kNThreadPerWarp * kMWarpPerBlock * kNWarpPerBlock;
  
     static constexpr bool kPadM = kPadM_;
     static constexpr bool kPadN = kPadN_;
  
     static constexpr index_t VectorSizeInput  = kPadM ? 1 : VectorLoadSize / sizeof(InputType);
     static constexpr index_t VectorSizeOutput = kPadN ? 1 : VectorLoadSize / sizeof(InputType);
 };
 } // namespace ck_tile