diff --git a/bin/hipify-perl b/bin/hipify-perl index 36df3e77..d9354586 100755 --- a/bin/hipify-perl +++ b/bin/hipify-perl @@ -12617,20 +12617,66 @@ sub warnHipOnlyUnsupportedFunctions { "CUBLASLT_MATMUL_TILE_664x64", "CUBLASLT_MATMUL_TILE_656x64", "CUBLASLT_MATMUL_TILE_64x96", + "CUBLASLT_MATMUL_TILE_64x88", + "CUBLASLT_MATMUL_TILE_64x80", "CUBLASLT_MATMUL_TILE_64x8", "CUBLASLT_MATMUL_TILE_64x768", + "CUBLASLT_MATMUL_TILE_64x72", "CUBLASLT_MATMUL_TILE_64x704", "CUBLASLT_MATMUL_TILE_64x640", "CUBLASLT_MATMUL_TILE_64x64", "CUBLASLT_MATMUL_TILE_64x576", + "CUBLASLT_MATMUL_TILE_64x56", "CUBLASLT_MATMUL_TILE_64x512", + "CUBLASLT_MATMUL_TILE_64x48", "CUBLASLT_MATMUL_TILE_64x448", + "CUBLASLT_MATMUL_TILE_64x440", + "CUBLASLT_MATMUL_TILE_64x432", + "CUBLASLT_MATMUL_TILE_64x424", + "CUBLASLT_MATMUL_TILE_64x416", + "CUBLASLT_MATMUL_TILE_64x408", + "CUBLASLT_MATMUL_TILE_64x400", + "CUBLASLT_MATMUL_TILE_64x40", + "CUBLASLT_MATMUL_TILE_64x392", "CUBLASLT_MATMUL_TILE_64x384", + "CUBLASLT_MATMUL_TILE_64x376", + "CUBLASLT_MATMUL_TILE_64x368", + "CUBLASLT_MATMUL_TILE_64x360", + "CUBLASLT_MATMUL_TILE_64x352", + "CUBLASLT_MATMUL_TILE_64x344", + "CUBLASLT_MATMUL_TILE_64x336", + "CUBLASLT_MATMUL_TILE_64x328", "CUBLASLT_MATMUL_TILE_64x320", "CUBLASLT_MATMUL_TILE_64x32", + "CUBLASLT_MATMUL_TILE_64x312", + "CUBLASLT_MATMUL_TILE_64x304", + "CUBLASLT_MATMUL_TILE_64x296", + "CUBLASLT_MATMUL_TILE_64x288", + "CUBLASLT_MATMUL_TILE_64x280", + "CUBLASLT_MATMUL_TILE_64x272", + "CUBLASLT_MATMUL_TILE_64x264", "CUBLASLT_MATMUL_TILE_64x256", + "CUBLASLT_MATMUL_TILE_64x248", + "CUBLASLT_MATMUL_TILE_64x240", + "CUBLASLT_MATMUL_TILE_64x24", + "CUBLASLT_MATMUL_TILE_64x232", + "CUBLASLT_MATMUL_TILE_64x224", + "CUBLASLT_MATMUL_TILE_64x216", + "CUBLASLT_MATMUL_TILE_64x208", + "CUBLASLT_MATMUL_TILE_64x200", "CUBLASLT_MATMUL_TILE_64x192", + "CUBLASLT_MATMUL_TILE_64x184", + "CUBLASLT_MATMUL_TILE_64x176", + "CUBLASLT_MATMUL_TILE_64x168", + "CUBLASLT_MATMUL_TILE_64x160", + "CUBLASLT_MATMUL_TILE_64x16", + "CUBLASLT_MATMUL_TILE_64x152", + "CUBLASLT_MATMUL_TILE_64x144", + "CUBLASLT_MATMUL_TILE_64x136", "CUBLASLT_MATMUL_TILE_64x128", + "CUBLASLT_MATMUL_TILE_64x120", + "CUBLASLT_MATMUL_TILE_64x112", + "CUBLASLT_MATMUL_TILE_64x104", "CUBLASLT_MATMUL_TILE_648x64", "CUBLASLT_MATMUL_TILE_640x64", "CUBLASLT_MATMUL_TILE_632x64", @@ -14308,20 +14354,66 @@ sub warnRocOnlyUnsupportedFunctions { "CUBLASLT_MATMUL_TILE_664x64", "CUBLASLT_MATMUL_TILE_656x64", "CUBLASLT_MATMUL_TILE_64x96", + "CUBLASLT_MATMUL_TILE_64x88", + "CUBLASLT_MATMUL_TILE_64x80", "CUBLASLT_MATMUL_TILE_64x8", "CUBLASLT_MATMUL_TILE_64x768", + "CUBLASLT_MATMUL_TILE_64x72", "CUBLASLT_MATMUL_TILE_64x704", "CUBLASLT_MATMUL_TILE_64x640", "CUBLASLT_MATMUL_TILE_64x64", "CUBLASLT_MATMUL_TILE_64x576", + "CUBLASLT_MATMUL_TILE_64x56", "CUBLASLT_MATMUL_TILE_64x512", + "CUBLASLT_MATMUL_TILE_64x48", "CUBLASLT_MATMUL_TILE_64x448", + "CUBLASLT_MATMUL_TILE_64x440", + "CUBLASLT_MATMUL_TILE_64x432", + "CUBLASLT_MATMUL_TILE_64x424", + "CUBLASLT_MATMUL_TILE_64x416", + "CUBLASLT_MATMUL_TILE_64x408", + "CUBLASLT_MATMUL_TILE_64x400", + "CUBLASLT_MATMUL_TILE_64x40", + "CUBLASLT_MATMUL_TILE_64x392", "CUBLASLT_MATMUL_TILE_64x384", + "CUBLASLT_MATMUL_TILE_64x376", + "CUBLASLT_MATMUL_TILE_64x368", + "CUBLASLT_MATMUL_TILE_64x360", + "CUBLASLT_MATMUL_TILE_64x352", + "CUBLASLT_MATMUL_TILE_64x344", + "CUBLASLT_MATMUL_TILE_64x336", + "CUBLASLT_MATMUL_TILE_64x328", "CUBLASLT_MATMUL_TILE_64x320", "CUBLASLT_MATMUL_TILE_64x32", + "CUBLASLT_MATMUL_TILE_64x312", + "CUBLASLT_MATMUL_TILE_64x304", + "CUBLASLT_MATMUL_TILE_64x296", + "CUBLASLT_MATMUL_TILE_64x288", + "CUBLASLT_MATMUL_TILE_64x280", + "CUBLASLT_MATMUL_TILE_64x272", + "CUBLASLT_MATMUL_TILE_64x264", "CUBLASLT_MATMUL_TILE_64x256", + "CUBLASLT_MATMUL_TILE_64x248", + "CUBLASLT_MATMUL_TILE_64x240", + "CUBLASLT_MATMUL_TILE_64x24", + "CUBLASLT_MATMUL_TILE_64x232", + "CUBLASLT_MATMUL_TILE_64x224", + "CUBLASLT_MATMUL_TILE_64x216", + "CUBLASLT_MATMUL_TILE_64x208", + "CUBLASLT_MATMUL_TILE_64x200", "CUBLASLT_MATMUL_TILE_64x192", + "CUBLASLT_MATMUL_TILE_64x184", + "CUBLASLT_MATMUL_TILE_64x176", + "CUBLASLT_MATMUL_TILE_64x168", + "CUBLASLT_MATMUL_TILE_64x160", + "CUBLASLT_MATMUL_TILE_64x16", + "CUBLASLT_MATMUL_TILE_64x152", + "CUBLASLT_MATMUL_TILE_64x144", + "CUBLASLT_MATMUL_TILE_64x136", "CUBLASLT_MATMUL_TILE_64x128", + "CUBLASLT_MATMUL_TILE_64x120", + "CUBLASLT_MATMUL_TILE_64x112", + "CUBLASLT_MATMUL_TILE_64x104", "CUBLASLT_MATMUL_TILE_648x64", "CUBLASLT_MATMUL_TILE_640x64", "CUBLASLT_MATMUL_TILE_632x64", diff --git a/docs/tables/CUBLAS_API_supported_by_HIP.md b/docs/tables/CUBLAS_API_supported_by_HIP.md index 1993760e..53a9eb0c 100644 --- a/docs/tables/CUBLAS_API_supported_by_HIP.md +++ b/docs/tables/CUBLAS_API_supported_by_HIP.md @@ -552,20 +552,66 @@ |`CUBLASLT_MATMUL_TILE_632x64`|12.6| | | | | | | | | | |`CUBLASLT_MATMUL_TILE_640x64`|12.6| | | | | | | | | | |`CUBLASLT_MATMUL_TILE_648x64`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x104`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x112`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x120`|12.6| | | | | | | | | | |`CUBLASLT_MATMUL_TILE_64x128`|10.1| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x136`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x144`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x152`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x16`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x160`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x168`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x176`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x184`|12.6| | | | | | | | | | |`CUBLASLT_MATMUL_TILE_64x192`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x200`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x208`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x216`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x224`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x232`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x24`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x240`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x248`|12.6| | | | | | | | | | |`CUBLASLT_MATMUL_TILE_64x256`|10.1| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x264`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x272`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x280`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x288`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x296`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x304`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x312`|12.6| | | | | | | | | | |`CUBLASLT_MATMUL_TILE_64x32`|10.1| | | | | | | | | | |`CUBLASLT_MATMUL_TILE_64x320`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x328`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x336`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x344`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x352`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x360`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x368`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x376`|12.6| | | | | | | | | | |`CUBLASLT_MATMUL_TILE_64x384`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x392`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x40`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x400`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x408`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x416`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x424`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x432`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x440`|12.6| | | | | | | | | | |`CUBLASLT_MATMUL_TILE_64x448`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x48`|12.6| | | | | | | | | | |`CUBLASLT_MATMUL_TILE_64x512`|10.1| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x56`|12.6| | | | | | | | | | |`CUBLASLT_MATMUL_TILE_64x576`|12.6| | | | | | | | | | |`CUBLASLT_MATMUL_TILE_64x64`|10.1| | | | | | | | | | |`CUBLASLT_MATMUL_TILE_64x640`|12.6| | | | | | | | | | |`CUBLASLT_MATMUL_TILE_64x704`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x72`|12.6| | | | | | | | | | |`CUBLASLT_MATMUL_TILE_64x768`|12.6| | | | | | | | | | |`CUBLASLT_MATMUL_TILE_64x8`|10.1| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x80`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x88`|12.6| | | | | | | | | | |`CUBLASLT_MATMUL_TILE_64x96`|11.3| | | | | | | | | | |`CUBLASLT_MATMUL_TILE_656x64`|12.6| | | | | | | | | | |`CUBLASLT_MATMUL_TILE_664x64`|12.6| | | | | | | | | | diff --git a/docs/tables/CUBLAS_API_supported_by_HIP_and_ROC.md b/docs/tables/CUBLAS_API_supported_by_HIP_and_ROC.md index dc35c007..d8944098 100644 --- a/docs/tables/CUBLAS_API_supported_by_HIP_and_ROC.md +++ b/docs/tables/CUBLAS_API_supported_by_HIP_and_ROC.md @@ -552,20 +552,66 @@ |`CUBLASLT_MATMUL_TILE_632x64`|12.6| | | | | | | | | | | | | | | | |`CUBLASLT_MATMUL_TILE_640x64`|12.6| | | | | | | | | | | | | | | | |`CUBLASLT_MATMUL_TILE_648x64`|12.6| | | | | | | | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x104`|12.6| | | | | | | | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x112`|12.6| | | | | | | | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x120`|12.6| | | | | | | | | | | | | | | | |`CUBLASLT_MATMUL_TILE_64x128`|10.1| | | | | | | | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x136`|12.6| | | | | | | | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x144`|12.6| | | | | | | | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x152`|12.6| | | | | | | | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x16`|12.6| | | | | | | | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x160`|12.6| | | | | | | | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x168`|12.6| | | | | | | | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x176`|12.6| | | | | | | | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x184`|12.6| | | | | | | | | | | | | | | | |`CUBLASLT_MATMUL_TILE_64x192`|12.6| | | | | | | | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x200`|12.6| | | | | | | | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x208`|12.6| | | | | | | | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x216`|12.6| | | | | | | | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x224`|12.6| | | | | | | | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x232`|12.6| | | | | | | | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x24`|12.6| | | | | | | | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x240`|12.6| | | | | | | | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x248`|12.6| | | | | | | | | | | | | | | | |`CUBLASLT_MATMUL_TILE_64x256`|10.1| | | | | | | | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x264`|12.6| | | | | | | | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x272`|12.6| | | | | | | | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x280`|12.6| | | | | | | | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x288`|12.6| | | | | | | | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x296`|12.6| | | | | | | | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x304`|12.6| | | | | | | | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x312`|12.6| | | | | | | | | | | | | | | | |`CUBLASLT_MATMUL_TILE_64x32`|10.1| | | | | | | | | | | | | | | | |`CUBLASLT_MATMUL_TILE_64x320`|12.6| | | | | | | | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x328`|12.6| | | | | | | | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x336`|12.6| | | | | | | | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x344`|12.6| | | | | | | | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x352`|12.6| | | | | | | | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x360`|12.6| | | | | | | | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x368`|12.6| | | | | | | | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x376`|12.6| | | | | | | | | | | | | | | | |`CUBLASLT_MATMUL_TILE_64x384`|12.6| | | | | | | | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x392`|12.6| | | | | | | | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x40`|12.6| | | | | | | | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x400`|12.6| | | | | | | | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x408`|12.6| | | | | | | | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x416`|12.6| | | | | | | | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x424`|12.6| | | | | | | | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x432`|12.6| | | | | | | | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x440`|12.6| | | | | | | | | | | | | | | | |`CUBLASLT_MATMUL_TILE_64x448`|12.6| | | | | | | | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x48`|12.6| | | | | | | | | | | | | | | | |`CUBLASLT_MATMUL_TILE_64x512`|10.1| | | | | | | | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x56`|12.6| | | | | | | | | | | | | | | | |`CUBLASLT_MATMUL_TILE_64x576`|12.6| | | | | | | | | | | | | | | | |`CUBLASLT_MATMUL_TILE_64x64`|10.1| | | | | | | | | | | | | | | | |`CUBLASLT_MATMUL_TILE_64x640`|12.6| | | | | | | | | | | | | | | | |`CUBLASLT_MATMUL_TILE_64x704`|12.6| | | | | | | | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x72`|12.6| | | | | | | | | | | | | | | | |`CUBLASLT_MATMUL_TILE_64x768`|12.6| | | | | | | | | | | | | | | | |`CUBLASLT_MATMUL_TILE_64x8`|10.1| | | | | | | | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x80`|12.6| | | | | | | | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x88`|12.6| | | | | | | | | | | | | | | | |`CUBLASLT_MATMUL_TILE_64x96`|11.3| | | | | | | | | | | | | | | | |`CUBLASLT_MATMUL_TILE_656x64`|12.6| | | | | | | | | | | | | | | | |`CUBLASLT_MATMUL_TILE_664x64`|12.6| | | | | | | | | | | | | | | | diff --git a/docs/tables/CUBLAS_API_supported_by_ROC.md b/docs/tables/CUBLAS_API_supported_by_ROC.md index 48de2a84..fbfe9e72 100644 --- a/docs/tables/CUBLAS_API_supported_by_ROC.md +++ b/docs/tables/CUBLAS_API_supported_by_ROC.md @@ -552,20 +552,66 @@ |`CUBLASLT_MATMUL_TILE_632x64`|12.6| | | | | | | | | | |`CUBLASLT_MATMUL_TILE_640x64`|12.6| | | | | | | | | | |`CUBLASLT_MATMUL_TILE_648x64`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x104`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x112`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x120`|12.6| | | | | | | | | | |`CUBLASLT_MATMUL_TILE_64x128`|10.1| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x136`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x144`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x152`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x16`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x160`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x168`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x176`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x184`|12.6| | | | | | | | | | |`CUBLASLT_MATMUL_TILE_64x192`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x200`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x208`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x216`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x224`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x232`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x24`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x240`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x248`|12.6| | | | | | | | | | |`CUBLASLT_MATMUL_TILE_64x256`|10.1| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x264`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x272`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x280`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x288`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x296`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x304`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x312`|12.6| | | | | | | | | | |`CUBLASLT_MATMUL_TILE_64x32`|10.1| | | | | | | | | | |`CUBLASLT_MATMUL_TILE_64x320`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x328`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x336`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x344`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x352`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x360`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x368`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x376`|12.6| | | | | | | | | | |`CUBLASLT_MATMUL_TILE_64x384`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x392`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x40`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x400`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x408`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x416`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x424`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x432`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x440`|12.6| | | | | | | | | | |`CUBLASLT_MATMUL_TILE_64x448`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x48`|12.6| | | | | | | | | | |`CUBLASLT_MATMUL_TILE_64x512`|10.1| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x56`|12.6| | | | | | | | | | |`CUBLASLT_MATMUL_TILE_64x576`|12.6| | | | | | | | | | |`CUBLASLT_MATMUL_TILE_64x64`|10.1| | | | | | | | | | |`CUBLASLT_MATMUL_TILE_64x640`|12.6| | | | | | | | | | |`CUBLASLT_MATMUL_TILE_64x704`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x72`|12.6| | | | | | | | | | |`CUBLASLT_MATMUL_TILE_64x768`|12.6| | | | | | | | | | |`CUBLASLT_MATMUL_TILE_64x8`|10.1| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x80`|12.6| | | | | | | | | | +|`CUBLASLT_MATMUL_TILE_64x88`|12.6| | | | | | | | | | |`CUBLASLT_MATMUL_TILE_64x96`|11.3| | | | | | | | | | |`CUBLASLT_MATMUL_TILE_656x64`|12.6| | | | | | | | | | |`CUBLASLT_MATMUL_TILE_664x64`|12.6| | | | | | | | | | diff --git a/src/CUDA2HIP_BLAS_API_types.cpp b/src/CUDA2HIP_BLAS_API_types.cpp index b4c7aab3..d77ed8eb 100644 --- a/src/CUDA2HIP_BLAS_API_types.cpp +++ b/src/CUDA2HIP_BLAS_API_types.cpp @@ -515,6 +515,52 @@ const std::map CUDA_BLAS_TYPE_NAME_MAP { {"CUBLASLT_MATMUL_TILE_752x64", {"HIPBLASLT_MATMUL_TILE_752x64", "", CONV_NUMERIC_LITERAL, API_BLAS, SEC::BLAS_LT_DATA_TYPES, UNSUPPORTED}}, {"CUBLASLT_MATMUL_TILE_760x64", {"HIPBLASLT_MATMUL_TILE_760x64", "", CONV_NUMERIC_LITERAL, API_BLAS, SEC::BLAS_LT_DATA_TYPES, UNSUPPORTED}}, {"CUBLASLT_MATMUL_TILE_768x64", {"HIPBLASLT_MATMUL_TILE_768x64", "", CONV_NUMERIC_LITERAL, API_BLAS, SEC::BLAS_LT_DATA_TYPES, UNSUPPORTED}}, + {"CUBLASLT_MATMUL_TILE_64x16", {"HIPBLASLT_MATMUL_TILE_64x16", "", CONV_NUMERIC_LITERAL, API_BLAS, SEC::BLAS_LT_DATA_TYPES, UNSUPPORTED}}, + {"CUBLASLT_MATMUL_TILE_64x24", {"HIPBLASLT_MATMUL_TILE_64x24", "", CONV_NUMERIC_LITERAL, API_BLAS, SEC::BLAS_LT_DATA_TYPES, UNSUPPORTED}}, + {"CUBLASLT_MATMUL_TILE_64x40", {"HIPBLASLT_MATMUL_TILE_64x40", "", CONV_NUMERIC_LITERAL, API_BLAS, SEC::BLAS_LT_DATA_TYPES, UNSUPPORTED}}, + {"CUBLASLT_MATMUL_TILE_64x48", {"HIPBLASLT_MATMUL_TILE_64x48", "", CONV_NUMERIC_LITERAL, API_BLAS, SEC::BLAS_LT_DATA_TYPES, UNSUPPORTED}}, + {"CUBLASLT_MATMUL_TILE_64x56", {"HIPBLASLT_MATMUL_TILE_64x56", "", CONV_NUMERIC_LITERAL, API_BLAS, SEC::BLAS_LT_DATA_TYPES, UNSUPPORTED}}, + {"CUBLASLT_MATMUL_TILE_64x72", {"HIPBLASLT_MATMUL_TILE_64x72", "", CONV_NUMERIC_LITERAL, API_BLAS, SEC::BLAS_LT_DATA_TYPES, UNSUPPORTED}}, + {"CUBLASLT_MATMUL_TILE_64x80", {"HIPBLASLT_MATMUL_TILE_64x80", "", CONV_NUMERIC_LITERAL, API_BLAS, SEC::BLAS_LT_DATA_TYPES, UNSUPPORTED}}, + {"CUBLASLT_MATMUL_TILE_64x88", {"HIPBLASLT_MATMUL_TILE_64x88", "", CONV_NUMERIC_LITERAL, API_BLAS, SEC::BLAS_LT_DATA_TYPES, UNSUPPORTED}}, + {"CUBLASLT_MATMUL_TILE_64x104", {"HIPBLASLT_MATMUL_TILE_64x104", "", CONV_NUMERIC_LITERAL, API_BLAS, SEC::BLAS_LT_DATA_TYPES, UNSUPPORTED}}, + {"CUBLASLT_MATMUL_TILE_64x112", {"HIPBLASLT_MATMUL_TILE_64x112", "", CONV_NUMERIC_LITERAL, API_BLAS, SEC::BLAS_LT_DATA_TYPES, UNSUPPORTED}}, + {"CUBLASLT_MATMUL_TILE_64x120", {"HIPBLASLT_MATMUL_TILE_64x120", "", CONV_NUMERIC_LITERAL, API_BLAS, SEC::BLAS_LT_DATA_TYPES, UNSUPPORTED}}, + {"CUBLASLT_MATMUL_TILE_64x136", {"HIPBLASLT_MATMUL_TILE_64x136", "", CONV_NUMERIC_LITERAL, API_BLAS, SEC::BLAS_LT_DATA_TYPES, UNSUPPORTED}}, + {"CUBLASLT_MATMUL_TILE_64x144", {"HIPBLASLT_MATMUL_TILE_64x144", "", CONV_NUMERIC_LITERAL, API_BLAS, SEC::BLAS_LT_DATA_TYPES, UNSUPPORTED}}, + {"CUBLASLT_MATMUL_TILE_64x152", {"HIPBLASLT_MATMUL_TILE_64x152", "", CONV_NUMERIC_LITERAL, API_BLAS, SEC::BLAS_LT_DATA_TYPES, UNSUPPORTED}}, + {"CUBLASLT_MATMUL_TILE_64x160", {"HIPBLASLT_MATMUL_TILE_64x160", "", CONV_NUMERIC_LITERAL, API_BLAS, SEC::BLAS_LT_DATA_TYPES, UNSUPPORTED}}, + {"CUBLASLT_MATMUL_TILE_64x168", {"HIPBLASLT_MATMUL_TILE_64x168", "", CONV_NUMERIC_LITERAL, API_BLAS, SEC::BLAS_LT_DATA_TYPES, UNSUPPORTED}}, + {"CUBLASLT_MATMUL_TILE_64x176", {"HIPBLASLT_MATMUL_TILE_64x176", "", CONV_NUMERIC_LITERAL, API_BLAS, SEC::BLAS_LT_DATA_TYPES, UNSUPPORTED}}, + {"CUBLASLT_MATMUL_TILE_64x184", {"HIPBLASLT_MATMUL_TILE_64x184", "", CONV_NUMERIC_LITERAL, API_BLAS, SEC::BLAS_LT_DATA_TYPES, UNSUPPORTED}}, + {"CUBLASLT_MATMUL_TILE_64x200", {"HIPBLASLT_MATMUL_TILE_64x200", "", CONV_NUMERIC_LITERAL, API_BLAS, SEC::BLAS_LT_DATA_TYPES, UNSUPPORTED}}, + {"CUBLASLT_MATMUL_TILE_64x208", {"HIPBLASLT_MATMUL_TILE_64x208", "", CONV_NUMERIC_LITERAL, API_BLAS, SEC::BLAS_LT_DATA_TYPES, UNSUPPORTED}}, + {"CUBLASLT_MATMUL_TILE_64x216", {"HIPBLASLT_MATMUL_TILE_64x216", "", CONV_NUMERIC_LITERAL, API_BLAS, SEC::BLAS_LT_DATA_TYPES, UNSUPPORTED}}, + {"CUBLASLT_MATMUL_TILE_64x224", {"HIPBLASLT_MATMUL_TILE_64x224", "", CONV_NUMERIC_LITERAL, API_BLAS, SEC::BLAS_LT_DATA_TYPES, UNSUPPORTED}}, + {"CUBLASLT_MATMUL_TILE_64x232", {"HIPBLASLT_MATMUL_TILE_64x232", "", CONV_NUMERIC_LITERAL, API_BLAS, SEC::BLAS_LT_DATA_TYPES, UNSUPPORTED}}, + {"CUBLASLT_MATMUL_TILE_64x240", {"HIPBLASLT_MATMUL_TILE_64x240", "", CONV_NUMERIC_LITERAL, API_BLAS, SEC::BLAS_LT_DATA_TYPES, UNSUPPORTED}}, + {"CUBLASLT_MATMUL_TILE_64x248", {"HIPBLASLT_MATMUL_TILE_64x248", "", CONV_NUMERIC_LITERAL, API_BLAS, SEC::BLAS_LT_DATA_TYPES, UNSUPPORTED}}, + {"CUBLASLT_MATMUL_TILE_64x264", {"HIPBLASLT_MATMUL_TILE_64x264", "", CONV_NUMERIC_LITERAL, API_BLAS, SEC::BLAS_LT_DATA_TYPES, UNSUPPORTED}}, + {"CUBLASLT_MATMUL_TILE_64x272", {"HIPBLASLT_MATMUL_TILE_64x272", "", CONV_NUMERIC_LITERAL, API_BLAS, SEC::BLAS_LT_DATA_TYPES, UNSUPPORTED}}, + {"CUBLASLT_MATMUL_TILE_64x280", {"HIPBLASLT_MATMUL_TILE_64x280", "", CONV_NUMERIC_LITERAL, API_BLAS, SEC::BLAS_LT_DATA_TYPES, UNSUPPORTED}}, + {"CUBLASLT_MATMUL_TILE_64x288", {"HIPBLASLT_MATMUL_TILE_64x288", "", CONV_NUMERIC_LITERAL, API_BLAS, SEC::BLAS_LT_DATA_TYPES, UNSUPPORTED}}, + {"CUBLASLT_MATMUL_TILE_64x296", {"HIPBLASLT_MATMUL_TILE_64x296", "", CONV_NUMERIC_LITERAL, API_BLAS, SEC::BLAS_LT_DATA_TYPES, UNSUPPORTED}}, + {"CUBLASLT_MATMUL_TILE_64x304", {"HIPBLASLT_MATMUL_TILE_64x304", "", CONV_NUMERIC_LITERAL, API_BLAS, SEC::BLAS_LT_DATA_TYPES, UNSUPPORTED}}, + {"CUBLASLT_MATMUL_TILE_64x312", {"HIPBLASLT_MATMUL_TILE_64x312", "", CONV_NUMERIC_LITERAL, API_BLAS, SEC::BLAS_LT_DATA_TYPES, UNSUPPORTED}}, + {"CUBLASLT_MATMUL_TILE_64x328", {"HIPBLASLT_MATMUL_TILE_64x328", "", CONV_NUMERIC_LITERAL, API_BLAS, SEC::BLAS_LT_DATA_TYPES, UNSUPPORTED}}, + {"CUBLASLT_MATMUL_TILE_64x336", {"HIPBLASLT_MATMUL_TILE_64x336", "", CONV_NUMERIC_LITERAL, API_BLAS, SEC::BLAS_LT_DATA_TYPES, UNSUPPORTED}}, + {"CUBLASLT_MATMUL_TILE_64x344", {"HIPBLASLT_MATMUL_TILE_64x344", "", CONV_NUMERIC_LITERAL, API_BLAS, SEC::BLAS_LT_DATA_TYPES, UNSUPPORTED}}, + {"CUBLASLT_MATMUL_TILE_64x352", {"HIPBLASLT_MATMUL_TILE_64x352", "", CONV_NUMERIC_LITERAL, API_BLAS, SEC::BLAS_LT_DATA_TYPES, UNSUPPORTED}}, + {"CUBLASLT_MATMUL_TILE_64x360", {"HIPBLASLT_MATMUL_TILE_64x360", "", CONV_NUMERIC_LITERAL, API_BLAS, SEC::BLAS_LT_DATA_TYPES, UNSUPPORTED}}, + {"CUBLASLT_MATMUL_TILE_64x368", {"HIPBLASLT_MATMUL_TILE_64x368", "", CONV_NUMERIC_LITERAL, API_BLAS, SEC::BLAS_LT_DATA_TYPES, UNSUPPORTED}}, + {"CUBLASLT_MATMUL_TILE_64x376", {"HIPBLASLT_MATMUL_TILE_64x376", "", CONV_NUMERIC_LITERAL, API_BLAS, SEC::BLAS_LT_DATA_TYPES, UNSUPPORTED}}, + {"CUBLASLT_MATMUL_TILE_64x392", {"HIPBLASLT_MATMUL_TILE_64x392", "", CONV_NUMERIC_LITERAL, API_BLAS, SEC::BLAS_LT_DATA_TYPES, UNSUPPORTED}}, + {"CUBLASLT_MATMUL_TILE_64x400", {"HIPBLASLT_MATMUL_TILE_64x400", "", CONV_NUMERIC_LITERAL, API_BLAS, SEC::BLAS_LT_DATA_TYPES, UNSUPPORTED}}, + {"CUBLASLT_MATMUL_TILE_64x408", {"HIPBLASLT_MATMUL_TILE_64x408", "", CONV_NUMERIC_LITERAL, API_BLAS, SEC::BLAS_LT_DATA_TYPES, UNSUPPORTED}}, + {"CUBLASLT_MATMUL_TILE_64x416", {"HIPBLASLT_MATMUL_TILE_64x416", "", CONV_NUMERIC_LITERAL, API_BLAS, SEC::BLAS_LT_DATA_TYPES, UNSUPPORTED}}, + {"CUBLASLT_MATMUL_TILE_64x424", {"HIPBLASLT_MATMUL_TILE_64x424", "", CONV_NUMERIC_LITERAL, API_BLAS, SEC::BLAS_LT_DATA_TYPES, UNSUPPORTED}}, + {"CUBLASLT_MATMUL_TILE_64x432", {"HIPBLASLT_MATMUL_TILE_64x432", "", CONV_NUMERIC_LITERAL, API_BLAS, SEC::BLAS_LT_DATA_TYPES, UNSUPPORTED}}, + {"CUBLASLT_MATMUL_TILE_64x440", {"HIPBLASLT_MATMUL_TILE_64x440", "", CONV_NUMERIC_LITERAL, API_BLAS, SEC::BLAS_LT_DATA_TYPES, UNSUPPORTED}}, {"CUBLASLT_MATMUL_TILE_END", {"HIPBLASLT_MATMUL_TILE_END", "", CONV_NUMERIC_LITERAL, API_BLAS, SEC::BLAS_LT_DATA_TYPES, UNSUPPORTED}}, {"cublasLtMatmulStages_t", {"hipblasLtMatmulStages_t", "", CONV_TYPE, API_BLAS, SEC::BLAS_LT_DATA_TYPES, UNSUPPORTED}}, {"CUBLASLT_MATMUL_STAGES_UNDEFINED", {"HIPBLASLT_MATMUL_STAGES_UNDEFINED", "", CONV_NUMERIC_LITERAL, API_BLAS, SEC::BLAS_LT_DATA_TYPES, UNSUPPORTED}}, @@ -1447,6 +1493,52 @@ const std::map CUDA_BLAS_TYPE_NAME_VER_MAP { {"CUBLASLT_MATMUL_TILE_752x64", {CUDA_126, CUDA_0, CUDA_0 }}, // A: CUDA_VERSION 12062, CUBLAS_VERSION 120603, CUBLAS_VER_MAJOR 12 CUBLAS_VER_MINOR 6 CUBLAS_VER_PATCH 3 {"CUBLASLT_MATMUL_TILE_760x64", {CUDA_126, CUDA_0, CUDA_0 }}, // A: CUDA_VERSION 12062, CUBLAS_VERSION 120603, CUBLAS_VER_MAJOR 12 CUBLAS_VER_MINOR 6 CUBLAS_VER_PATCH 3 {"CUBLASLT_MATMUL_TILE_768x64", {CUDA_126, CUDA_0, CUDA_0 }}, // A: CUDA_VERSION 12062, CUBLAS_VERSION 120603, CUBLAS_VER_MAJOR 12 CUBLAS_VER_MINOR 6 CUBLAS_VER_PATCH 3 + {"CUBLASLT_MATMUL_TILE_64x16", {CUDA_126, CUDA_0, CUDA_0 }}, // A: CUDA_VERSION 12062, CUBLAS_VERSION 120603, CUBLAS_VER_MAJOR 12 CUBLAS_VER_MINOR 6 CUBLAS_VER_PATCH 3 + {"CUBLASLT_MATMUL_TILE_64x24", {CUDA_126, CUDA_0, CUDA_0 }}, // A: CUDA_VERSION 12062, CUBLAS_VERSION 120603, CUBLAS_VER_MAJOR 12 CUBLAS_VER_MINOR 6 CUBLAS_VER_PATCH 3 + {"CUBLASLT_MATMUL_TILE_64x40", {CUDA_126, CUDA_0, CUDA_0 }}, // A: CUDA_VERSION 12062, CUBLAS_VERSION 120603, CUBLAS_VER_MAJOR 12 CUBLAS_VER_MINOR 6 CUBLAS_VER_PATCH 3 + {"CUBLASLT_MATMUL_TILE_64x48", {CUDA_126, CUDA_0, CUDA_0 }}, // A: CUDA_VERSION 12062, CUBLAS_VERSION 120603, CUBLAS_VER_MAJOR 12 CUBLAS_VER_MINOR 6 CUBLAS_VER_PATCH 3 + {"CUBLASLT_MATMUL_TILE_64x56", {CUDA_126, CUDA_0, CUDA_0 }}, // A: CUDA_VERSION 12062, CUBLAS_VERSION 120603, CUBLAS_VER_MAJOR 12 CUBLAS_VER_MINOR 6 CUBLAS_VER_PATCH 3 + {"CUBLASLT_MATMUL_TILE_64x72", {CUDA_126, CUDA_0, CUDA_0 }}, // A: CUDA_VERSION 12062, CUBLAS_VERSION 120603, CUBLAS_VER_MAJOR 12 CUBLAS_VER_MINOR 6 CUBLAS_VER_PATCH 3 + {"CUBLASLT_MATMUL_TILE_64x80", {CUDA_126, CUDA_0, CUDA_0 }}, // A: CUDA_VERSION 12062, CUBLAS_VERSION 120603, CUBLAS_VER_MAJOR 12 CUBLAS_VER_MINOR 6 CUBLAS_VER_PATCH 3 + {"CUBLASLT_MATMUL_TILE_64x88", {CUDA_126, CUDA_0, CUDA_0 }}, // A: CUDA_VERSION 12062, CUBLAS_VERSION 120603, CUBLAS_VER_MAJOR 12 CUBLAS_VER_MINOR 6 CUBLAS_VER_PATCH 3 + {"CUBLASLT_MATMUL_TILE_64x104", {CUDA_126, CUDA_0, CUDA_0 }}, // A: CUDA_VERSION 12062, CUBLAS_VERSION 120603, CUBLAS_VER_MAJOR 12 CUBLAS_VER_MINOR 6 CUBLAS_VER_PATCH 3 + {"CUBLASLT_MATMUL_TILE_64x112", {CUDA_126, CUDA_0, CUDA_0 }}, // A: CUDA_VERSION 12062, CUBLAS_VERSION 120603, CUBLAS_VER_MAJOR 12 CUBLAS_VER_MINOR 6 CUBLAS_VER_PATCH 3 + {"CUBLASLT_MATMUL_TILE_64x120", {CUDA_126, CUDA_0, CUDA_0 }}, // A: CUDA_VERSION 12062, CUBLAS_VERSION 120603, CUBLAS_VER_MAJOR 12 CUBLAS_VER_MINOR 6 CUBLAS_VER_PATCH 3 + {"CUBLASLT_MATMUL_TILE_64x136", {CUDA_126, CUDA_0, CUDA_0 }}, // A: CUDA_VERSION 12062, CUBLAS_VERSION 120603, CUBLAS_VER_MAJOR 12 CUBLAS_VER_MINOR 6 CUBLAS_VER_PATCH 3 + {"CUBLASLT_MATMUL_TILE_64x144", {CUDA_126, CUDA_0, CUDA_0 }}, // A: CUDA_VERSION 12062, CUBLAS_VERSION 120603, CUBLAS_VER_MAJOR 12 CUBLAS_VER_MINOR 6 CUBLAS_VER_PATCH 3 + {"CUBLASLT_MATMUL_TILE_64x152", {CUDA_126, CUDA_0, CUDA_0 }}, // A: CUDA_VERSION 12062, CUBLAS_VERSION 120603, CUBLAS_VER_MAJOR 12 CUBLAS_VER_MINOR 6 CUBLAS_VER_PATCH 3 + {"CUBLASLT_MATMUL_TILE_64x160", {CUDA_126, CUDA_0, CUDA_0 }}, // A: CUDA_VERSION 12062, CUBLAS_VERSION 120603, CUBLAS_VER_MAJOR 12 CUBLAS_VER_MINOR 6 CUBLAS_VER_PATCH 3 + {"CUBLASLT_MATMUL_TILE_64x168", {CUDA_126, CUDA_0, CUDA_0 }}, // A: CUDA_VERSION 12062, CUBLAS_VERSION 120603, CUBLAS_VER_MAJOR 12 CUBLAS_VER_MINOR 6 CUBLAS_VER_PATCH 3 + {"CUBLASLT_MATMUL_TILE_64x176", {CUDA_126, CUDA_0, CUDA_0 }}, // A: CUDA_VERSION 12062, CUBLAS_VERSION 120603, CUBLAS_VER_MAJOR 12 CUBLAS_VER_MINOR 6 CUBLAS_VER_PATCH 3 + {"CUBLASLT_MATMUL_TILE_64x184", {CUDA_126, CUDA_0, CUDA_0 }}, // A: CUDA_VERSION 12062, CUBLAS_VERSION 120603, CUBLAS_VER_MAJOR 12 CUBLAS_VER_MINOR 6 CUBLAS_VER_PATCH 3 + {"CUBLASLT_MATMUL_TILE_64x200", {CUDA_126, CUDA_0, CUDA_0 }}, // A: CUDA_VERSION 12062, CUBLAS_VERSION 120603, CUBLAS_VER_MAJOR 12 CUBLAS_VER_MINOR 6 CUBLAS_VER_PATCH 3 + {"CUBLASLT_MATMUL_TILE_64x208", {CUDA_126, CUDA_0, CUDA_0 }}, // A: CUDA_VERSION 12062, CUBLAS_VERSION 120603, CUBLAS_VER_MAJOR 12 CUBLAS_VER_MINOR 6 CUBLAS_VER_PATCH 3 + {"CUBLASLT_MATMUL_TILE_64x216", {CUDA_126, CUDA_0, CUDA_0 }}, // A: CUDA_VERSION 12062, CUBLAS_VERSION 120603, CUBLAS_VER_MAJOR 12 CUBLAS_VER_MINOR 6 CUBLAS_VER_PATCH 3 + {"CUBLASLT_MATMUL_TILE_64x224", {CUDA_126, CUDA_0, CUDA_0 }}, // A: CUDA_VERSION 12062, CUBLAS_VERSION 120603, CUBLAS_VER_MAJOR 12 CUBLAS_VER_MINOR 6 CUBLAS_VER_PATCH 3 + {"CUBLASLT_MATMUL_TILE_64x232", {CUDA_126, CUDA_0, CUDA_0 }}, // A: CUDA_VERSION 12062, CUBLAS_VERSION 120603, CUBLAS_VER_MAJOR 12 CUBLAS_VER_MINOR 6 CUBLAS_VER_PATCH 3 + {"CUBLASLT_MATMUL_TILE_64x240", {CUDA_126, CUDA_0, CUDA_0 }}, // A: CUDA_VERSION 12062, CUBLAS_VERSION 120603, CUBLAS_VER_MAJOR 12 CUBLAS_VER_MINOR 6 CUBLAS_VER_PATCH 3 + {"CUBLASLT_MATMUL_TILE_64x248", {CUDA_126, CUDA_0, CUDA_0 }}, // A: CUDA_VERSION 12062, CUBLAS_VERSION 120603, CUBLAS_VER_MAJOR 12 CUBLAS_VER_MINOR 6 CUBLAS_VER_PATCH 3 + {"CUBLASLT_MATMUL_TILE_64x264", {CUDA_126, CUDA_0, CUDA_0 }}, // A: CUDA_VERSION 12062, CUBLAS_VERSION 120603, CUBLAS_VER_MAJOR 12 CUBLAS_VER_MINOR 6 CUBLAS_VER_PATCH 3 + {"CUBLASLT_MATMUL_TILE_64x272", {CUDA_126, CUDA_0, CUDA_0 }}, // A: CUDA_VERSION 12062, CUBLAS_VERSION 120603, CUBLAS_VER_MAJOR 12 CUBLAS_VER_MINOR 6 CUBLAS_VER_PATCH 3 + {"CUBLASLT_MATMUL_TILE_64x280", {CUDA_126, CUDA_0, CUDA_0 }}, // A: CUDA_VERSION 12062, CUBLAS_VERSION 120603, CUBLAS_VER_MAJOR 12 CUBLAS_VER_MINOR 6 CUBLAS_VER_PATCH 3 + {"CUBLASLT_MATMUL_TILE_64x288", {CUDA_126, CUDA_0, CUDA_0 }}, // A: CUDA_VERSION 12062, CUBLAS_VERSION 120603, CUBLAS_VER_MAJOR 12 CUBLAS_VER_MINOR 6 CUBLAS_VER_PATCH 3 + {"CUBLASLT_MATMUL_TILE_64x296", {CUDA_126, CUDA_0, CUDA_0 }}, // A: CUDA_VERSION 12062, CUBLAS_VERSION 120603, CUBLAS_VER_MAJOR 12 CUBLAS_VER_MINOR 6 CUBLAS_VER_PATCH 3 + {"CUBLASLT_MATMUL_TILE_64x304", {CUDA_126, CUDA_0, CUDA_0 }}, // A: CUDA_VERSION 12062, CUBLAS_VERSION 120603, CUBLAS_VER_MAJOR 12 CUBLAS_VER_MINOR 6 CUBLAS_VER_PATCH 3 + {"CUBLASLT_MATMUL_TILE_64x312", {CUDA_126, CUDA_0, CUDA_0 }}, // A: CUDA_VERSION 12062, CUBLAS_VERSION 120603, CUBLAS_VER_MAJOR 12 CUBLAS_VER_MINOR 6 CUBLAS_VER_PATCH 3 + {"CUBLASLT_MATMUL_TILE_64x328", {CUDA_126, CUDA_0, CUDA_0 }}, // A: CUDA_VERSION 12062, CUBLAS_VERSION 120603, CUBLAS_VER_MAJOR 12 CUBLAS_VER_MINOR 6 CUBLAS_VER_PATCH 3 + {"CUBLASLT_MATMUL_TILE_64x336", {CUDA_126, CUDA_0, CUDA_0 }}, // A: CUDA_VERSION 12062, CUBLAS_VERSION 120603, CUBLAS_VER_MAJOR 12 CUBLAS_VER_MINOR 6 CUBLAS_VER_PATCH 3 + {"CUBLASLT_MATMUL_TILE_64x344", {CUDA_126, CUDA_0, CUDA_0 }}, // A: CUDA_VERSION 12062, CUBLAS_VERSION 120603, CUBLAS_VER_MAJOR 12 CUBLAS_VER_MINOR 6 CUBLAS_VER_PATCH 3 + {"CUBLASLT_MATMUL_TILE_64x352", {CUDA_126, CUDA_0, CUDA_0 }}, // A: CUDA_VERSION 12062, CUBLAS_VERSION 120603, CUBLAS_VER_MAJOR 12 CUBLAS_VER_MINOR 6 CUBLAS_VER_PATCH 3 + {"CUBLASLT_MATMUL_TILE_64x360", {CUDA_126, CUDA_0, CUDA_0 }}, // A: CUDA_VERSION 12062, CUBLAS_VERSION 120603, CUBLAS_VER_MAJOR 12 CUBLAS_VER_MINOR 6 CUBLAS_VER_PATCH 3 + {"CUBLASLT_MATMUL_TILE_64x368", {CUDA_126, CUDA_0, CUDA_0 }}, // A: CUDA_VERSION 12062, CUBLAS_VERSION 120603, CUBLAS_VER_MAJOR 12 CUBLAS_VER_MINOR 6 CUBLAS_VER_PATCH 3 + {"CUBLASLT_MATMUL_TILE_64x376", {CUDA_126, CUDA_0, CUDA_0 }}, // A: CUDA_VERSION 12062, CUBLAS_VERSION 120603, CUBLAS_VER_MAJOR 12 CUBLAS_VER_MINOR 6 CUBLAS_VER_PATCH 3 + {"CUBLASLT_MATMUL_TILE_64x392", {CUDA_126, CUDA_0, CUDA_0 }}, // A: CUDA_VERSION 12062, CUBLAS_VERSION 120603, CUBLAS_VER_MAJOR 12 CUBLAS_VER_MINOR 6 CUBLAS_VER_PATCH 3 + {"CUBLASLT_MATMUL_TILE_64x400", {CUDA_126, CUDA_0, CUDA_0 }}, // A: CUDA_VERSION 12062, CUBLAS_VERSION 120603, CUBLAS_VER_MAJOR 12 CUBLAS_VER_MINOR 6 CUBLAS_VER_PATCH 3 + {"CUBLASLT_MATMUL_TILE_64x408", {CUDA_126, CUDA_0, CUDA_0 }}, // A: CUDA_VERSION 12062, CUBLAS_VERSION 120603, CUBLAS_VER_MAJOR 12 CUBLAS_VER_MINOR 6 CUBLAS_VER_PATCH 3 + {"CUBLASLT_MATMUL_TILE_64x416", {CUDA_126, CUDA_0, CUDA_0 }}, // A: CUDA_VERSION 12062, CUBLAS_VERSION 120603, CUBLAS_VER_MAJOR 12 CUBLAS_VER_MINOR 6 CUBLAS_VER_PATCH 3 + {"CUBLASLT_MATMUL_TILE_64x424", {CUDA_126, CUDA_0, CUDA_0 }}, // A: CUDA_VERSION 12062, CUBLAS_VERSION 120603, CUBLAS_VER_MAJOR 12 CUBLAS_VER_MINOR 6 CUBLAS_VER_PATCH 3 + {"CUBLASLT_MATMUL_TILE_64x432", {CUDA_126, CUDA_0, CUDA_0 }}, // A: CUDA_VERSION 12062, CUBLAS_VERSION 120603, CUBLAS_VER_MAJOR 12 CUBLAS_VER_MINOR 6 CUBLAS_VER_PATCH 3 + {"CUBLASLT_MATMUL_TILE_64x440", {CUDA_126, CUDA_0, CUDA_0 }}, // A: CUDA_VERSION 12062, CUBLAS_VERSION 120603, CUBLAS_VER_MAJOR 12 CUBLAS_VER_MINOR 6 CUBLAS_VER_PATCH 3 }; const std::map HIP_BLAS_TYPE_NAME_VER_MAP {