From 004c0fffd1a70a8e07510d3bf34ac856e3e4d46f Mon Sep 17 00:00:00 2001
From: Vladimir Paramuzov <vladimir.paramuzov@intel.com>
Date: Wed, 17 Apr 2024 12:18:57 +0400
Subject: [PATCH 1/2] [GPU] Global migration to new shape infer and multi-out
 approach

---
 .../include/intel_gpu/graph/program.hpp       |    3 -
 .../intel_gpu/plugin/program_builder.hpp      |    3 -
 .../intel_gpu/primitives/adaptive_pooling.hpp |   29 -
 .../intel_gpu/primitives/arg_max_min.hpp      |    6 -
 .../intel_gpu/primitives/batch_to_space.hpp   |   35 +-
 .../intel_gpu/primitives/broadcast.hpp        |   38 +-
 .../intel_gpu/primitives/embedding_bag.hpp    |    5 +-
 ...xperimental_detectron_detection_output.hpp |   57 +-
 ...ectron_generate_proposals_single_image.hpp |   33 +-
 .../primitives/extract_image_patches.hpp      |   10 +-
 .../include/intel_gpu/primitives/eye.hpp      |    7 +-
 .../primitives/generate_proposals.hpp         |   67 +-
 .../intel_gpu/primitives/matrix_nms.hpp       |   11 +-
 .../intel_gpu/primitives/multiclass_nms.hpp   |   36 +-
 .../primitives/non_max_suppression.hpp        |   68 +-
 .../include/intel_gpu/primitives/one_hot.hpp  |   25 -
 .../include/intel_gpu/primitives/pooling.hpp  |   18 +-
 .../include/intel_gpu/primitives/reverse.hpp  |   12 +-
 .../include/intel_gpu/primitives/roll.hpp     |   23 +-
 .../intel_gpu/primitives/space_to_batch.hpp   |   34 +-
 .../include/intel_gpu/primitives/swiglu.hpp   |    9 +-
 .../intel_gpu/runtime/internal_properties.hpp |    1 -
 .../intel_gpu/src/graph/activation.cpp        |   29 -
 .../intel_gpu/src/graph/adaptive_pooling.cpp  |    6 -
 .../intel_gpu/src/graph/arg_max_min.cpp       |   52 -
 src/plugins/intel_gpu/src/graph/assign.cpp    |    4 -
 .../intel_gpu/src/graph/batch_to_space.cpp    |   73 +-
 src/plugins/intel_gpu/src/graph/border.cpp    |   17 -
 src/plugins/intel_gpu/src/graph/broadcast.cpp |  101 +-
 src/plugins/intel_gpu/src/graph/bucketize.cpp |    6 -
 .../intel_gpu/src/graph/concatenation.cpp     |   29 -
 src/plugins/intel_gpu/src/graph/condition.cpp |   42 +-
 .../intel_gpu/src/graph/convert_color.cpp     |   26 -
 .../intel_gpu/src/graph/convolution.cpp       |    4 -
 src/plugins/intel_gpu/src/graph/crop.cpp      |   25 +-
 .../src/graph/ctc_greedy_decoder.cpp          |    8 -
 src/plugins/intel_gpu/src/graph/ctc_loss.cpp  |    7 -
 src/plugins/intel_gpu/src/graph/cum_sum.cpp   |    4 -
 .../intel_gpu/src/graph/deconvolution.cpp     |   83 -
 .../intel_gpu/src/graph/depth_to_space.cpp    |   35 -
 .../intel_gpu/src/graph/detection_output.cpp  |   43 -
 src/plugins/intel_gpu/src/graph/dft.cpp       |   26 -
 src/plugins/intel_gpu/src/graph/eltwise.cpp   |   93 +-
 .../intel_gpu/src/graph/embedding_bag.cpp     |   11 -
 ...xperimental_detectron_detection_output.cpp |    8 -
 ...tectron_generate_proposal_single_image.cpp |    8 -
 ...imental_detectron_prior_grid_generator.cpp |   18 -
 ...mental_detectron_roi_feature_extractor.cpp |   24 +-
 .../experimental_detectron_topk_rois.cpp      |   11 -
 .../src/graph/extract_image_patches.cpp       |   10 -
 src/plugins/intel_gpu/src/graph/eye.cpp       |    7 +-
 .../intel_gpu/src/graph/fully_connected.cpp   |  127 +-
 src/plugins/intel_gpu/src/graph/gather.cpp    |   55 -
 .../intel_gpu/src/graph/gather_elements.cpp   |   18 -
 src/plugins/intel_gpu/src/graph/gather_nd.cpp |   60 -
 .../intel_gpu/src/graph/gather_tree.cpp       |    7 -
 src/plugins/intel_gpu/src/graph/gemm.cpp      |   92 +-
 .../src/graph/generate_proposals.cpp          |    9 +-
 .../graph_optimizer/add_required_reorders.cpp |   18 -
 .../graph/graph_optimizer/handle_reshape.cpp  |    3 +-
 .../mark_shape_of_subgraphs.cpp               |    6 +-
 .../graph/graph_optimizer/prepare_padding.cpp |   91 +-
 .../prepare_primitive_fusing_through.cpp      |    2 +-
 .../remove_redundant_reorders.cpp             |    3 +-
 .../intel_gpu/src/graph/grid_sample.cpp       |   14 -
 src/plugins/intel_gpu/src/graph/grn.cpp       |    7 -
 .../src/graph/group_normalization.cpp         |   12 -
 .../intel_gpu/src/graph/impls/common/loop.cpp |    1 -
 .../graph/impls/cpu/non_max_suppression.cpp   |   12 -
 .../src/graph/impls/ocl/adaptive_pooling.cpp  |   21 +-
 .../src/graph/impls/ocl/arg_max_min.cpp       |   22 +-
 .../src/graph/impls/ocl/batch_to_space.cpp    |    7 +-
 .../src/graph/impls/ocl/broadcast.cpp         |   63 +-
 .../graph/impls/ocl/ctc_greedy_decoder.cpp    |   25 +-
 .../intel_gpu/src/graph/impls/ocl/dft.cpp     |   39 +-
 .../intel_gpu/src/graph/impls/ocl/eltwise.cpp |    3 +-
 .../src/graph/impls/ocl/embedding_bag.cpp     |   50 +-
 ...xperimental_detectron_detection_output.cpp |   35 +-
 ...ectron_generate_proposals_single_image.cpp |   41 +-
 ...mental_detectron_roi_feature_extractor.cpp |    1 +
 .../src/graph/impls/ocl/fully_connected.cpp   |   10 +-
 .../graph/impls/ocl/generate_proposals.cpp    |   38 +-
 .../graph/impls/ocl/kernel_selector_helper.h  |   19 +-
 .../src/graph/impls/ocl/matrix_nms.cpp        |   23 +-
 .../src/graph/impls/ocl/multiclass_nms.cpp    |   27 +-
 .../graph/impls/ocl/non_max_suppression.cpp   |   31 +-
 .../intel_gpu/src/graph/impls/ocl/pooling.cpp |   29 +-
 .../intel_gpu/src/graph/impls/ocl/reverse.cpp |    4 +-
 .../intel_gpu/src/graph/impls/ocl/roll.cpp    |   70 +-
 .../src/graph/impls/ocl/space_to_batch.cpp    |    8 +-
 .../impls/onednn/primitive_onednn_base.h      |    4 -
 .../src/graph/include/activation_inst.h       |    1 -
 .../src/graph/include/adaptive_pooling_inst.h |    1 -
 .../src/graph/include/arg_max_min_inst.h      |    1 -
 .../intel_gpu/src/graph/include/assign_inst.h |    2 -
 .../src/graph/include/batch_to_space_inst.h   |    1 -
 .../intel_gpu/src/graph/include/border_inst.h |    1 -
 .../src/graph/include/broadcast_inst.h        |    1 -
 .../src/graph/include/bucketize_inst.hpp      |    1 -
 .../src/graph/include/concatenation_inst.h    |    1 -
 .../src/graph/include/condition_inst.h        |    1 -
 .../src/graph/include/convert_color_inst.h    |    3 +-
 .../src/graph/include/convolution_inst.h      |    1 -
 .../intel_gpu/src/graph/include/crop_inst.h   |    1 -
 .../graph/include/ctc_greedy_decoder_inst.h   |    4 -
 .../src/graph/include/ctc_loss_inst.hpp       |    2 +-
 .../src/graph/include/cum_sum_inst.h          |    1 -
 .../graph/include/custom_gpu_primitive_inst.h |   14 -
 .../intel_gpu/src/graph/include/data_inst.h   |    4 -
 .../src/graph/include/deconvolution_inst.h    |    1 -
 .../src/graph/include/depth_to_space_inst.h   |    1 -
 .../src/graph/include/detection_output_inst.h |    1 -
 .../intel_gpu/src/graph/include/dft_inst.h    |    1 -
 .../src/graph/include/eltwise_inst.h          |    1 -
 .../src/graph/include/embedding_bag_inst.h    |    1 -
 ...mental_detectron_detection_output_inst.hpp |   15 -
 ...n_generate_proposals_single_image_inst.hpp |    1 -
 ...ntal_detectron_prior_grid_generator_inst.h |    1 -
 ...l_detectron_roi_feature_extractor_inst.hpp |    2 -
 .../experimental_detectron_topk_rois_inst.h   |    1 -
 .../include/extract_image_patches_inst.h      |    1 -
 .../intel_gpu/src/graph/include/eye_inst.h    |    2 +-
 .../src/graph/include/fully_connected_inst.h  |    1 -
 .../src/graph/include/gather_elements_inst.h  |    1 -
 .../intel_gpu/src/graph/include/gather_inst.h |    1 -
 .../src/graph/include/gather_nd_inst.h        |    1 -
 .../src/graph/include/gather_tree_inst.h      |    1 -
 .../intel_gpu/src/graph/include/gemm_inst.h   |    1 -
 .../graph/include/generate_proposals_inst.h   |    1 -
 .../src/graph/include/grid_sample_inst.hpp    |    1 -
 .../intel_gpu/src/graph/include/grn_inst.h    |    1 -
 .../graph/include/group_normalization_inst.h  |    1 -
 .../src/graph/include/input_layout_inst.h     |    3 -
 .../src/graph/include/kv_cache_inst.h         |    1 -
 .../intel_gpu/src/graph/include/loop_inst.h   |    1 -
 .../intel_gpu/src/graph/include/lrn_inst.h    |    1 -
 .../src/graph/include/lstm_elt_inst.h         |    1 -
 .../src/graph/include/matrix_nms_inst.h       |    8 -
 .../src/graph/include/multiclass_nms_inst.h   |   27 +-
 .../src/graph/include/multinomial_inst.h      |    1 -
 .../src/graph/include/mutable_data_inst.h     |    4 -
 .../intel_gpu/src/graph/include/mvn_inst.h    |    1 -
 .../graph/include/non_max_suppression_inst.h  |   60 +-
 .../src/graph/include/non_zero_inst.h         |    2 -
 .../src/graph/include/normalize_inst.h        |    1 -
 .../src/graph/include/one_hot_inst.h          |    1 -
 .../src/graph/include/permute_inst.h          |    1 -
 .../src/graph/include/pooling_inst.h          |    1 -
 .../src/graph/include/primitive_type.h        |    1 -
 .../src/graph/include/primitive_type_base.h   |   11 -
 .../src/graph/include/prior_box_inst.h        |    1 -
 .../src/graph/include/program_node.h          |    4 -
 .../src/graph/include/proposal_inst.h         |    1 -
 .../src/graph/include/quantize_inst.h         |    1 -
 .../src/graph/include/random_uniform_inst.h   |    1 -
 .../intel_gpu/src/graph/include/range_inst.h  |    1 -
 .../src/graph/include/read_value_inst.h       |    2 -
 .../intel_gpu/src/graph/include/reduce_inst.h |    1 -
 .../src/graph/include/region_yolo_inst.h      |    1 -
 .../src/graph/include/reorder_inst.h          |    1 -
 .../src/graph/include/reorg_yolo_inst.h       |    1 -
 .../src/graph/include/resample_inst.h         |    1 -
 .../src/graph/include/reshape_inst.h          |    1 -
 .../src/graph/include/reverse_inst.h          |    1 -
 .../src/graph/include/reverse_sequence_inst.h |    1 -
 .../intel_gpu/src/graph/include/rms_inst.h    |    1 -
 .../src/graph/include/roi_align_inst.h        |    1 -
 .../src/graph/include/roi_pooling_inst.h      |    1 -
 .../intel_gpu/src/graph/include/roll_inst.hpp |    1 -
 .../include/scatter_elements_update_inst.h    |    1 -
 .../graph/include/scatter_nd_update_inst.h    |    1 -
 .../src/graph/include/scatter_update_inst.h   |    1 -
 .../intel_gpu/src/graph/include/select_inst.h |    1 -
 .../src/graph/include/shape_of_inst.h         |    1 -
 .../src/graph/include/shuffle_channels_inst.h |    1 -
 .../intel_gpu/src/graph/include/slice_inst.h  |    3 +-
 .../src/graph/include/softmax_inst.h          |    1 -
 .../src/graph/include/space_to_batch_inst.h   |    1 -
 .../src/graph/include/space_to_depth_inst.h   |    1 -
 .../src/graph/include/strided_slice_inst.h    |    1 -
 .../intel_gpu/src/graph/include/swiglu_inst.h |    1 -
 .../intel_gpu/src/graph/include/tile_inst.h   |    1 -
 .../src/graph/include/unique_inst.hpp         |    2 -
 src/plugins/intel_gpu/src/graph/kv_cache.cpp  |    4 -
 .../intel_gpu/src/graph/layout_optimizer.cpp  |   81 +-
 src/plugins/intel_gpu/src/graph/loop.cpp      |   49 +-
 src/plugins/intel_gpu/src/graph/lrn.cpp       |   16 -
 src/plugins/intel_gpu/src/graph/lstm_elt.cpp  |   17 -
 .../intel_gpu/src/graph/matrix_nms.cpp        |   28 +-
 .../intel_gpu/src/graph/multiclass_nms.cpp    |   35 +-
 .../intel_gpu/src/graph/multinomial.cpp       |   17 -
 src/plugins/intel_gpu/src/graph/mvn.cpp       |   13 -
 .../src/graph/non_max_suppression.cpp         |   13 +-
 src/plugins/intel_gpu/src/graph/non_zero.cpp  |   18 -
 src/plugins/intel_gpu/src/graph/normalize.cpp |   15 -
 src/plugins/intel_gpu/src/graph/one_hot.cpp   |   65 +-
 src/plugins/intel_gpu/src/graph/permute.cpp   |   33 -
 src/plugins/intel_gpu/src/graph/pooling.cpp   |  161 --
 .../intel_gpu/src/graph/primitive_inst.cpp    |    1 -
 src/plugins/intel_gpu/src/graph/prior_box.cpp |   72 -
 src/plugins/intel_gpu/src/graph/program.cpp   |   37 +-
 .../intel_gpu/src/graph/program_node.cpp      |   37 +-
 src/plugins/intel_gpu/src/graph/proposal.cpp  |   11 -
 src/plugins/intel_gpu/src/graph/quantize.cpp  |   12 -
 .../intel_gpu/src/graph/random_uniform.cpp    |    7 -
 src/plugins/intel_gpu/src/graph/range.cpp     |    4 -
 .../intel_gpu/src/graph/read_value.cpp        |    4 -
 src/plugins/intel_gpu/src/graph/reduce.cpp    |   78 -
 .../intel_gpu/src/graph/region_yolo.cpp       |   24 -
 src/plugins/intel_gpu/src/graph/reorder.cpp   |  157 --
 .../intel_gpu/src/graph/reorg_yolo.cpp        |   17 -
 src/plugins/intel_gpu/src/graph/resample.cpp  |   18 -
 src/plugins/intel_gpu/src/graph/reshape.cpp   |   40 +-
 src/plugins/intel_gpu/src/graph/reverse.cpp   |    7 +-
 .../intel_gpu/src/graph/reverse_sequence.cpp  |    7 -
 src/plugins/intel_gpu/src/graph/rms.cpp       |    9 -
 src/plugins/intel_gpu/src/graph/roi_align.cpp |   11 -
 .../intel_gpu/src/graph/roi_pooling.cpp       |   16 +-
 src/plugins/intel_gpu/src/graph/roll.cpp      |    5 -
 .../src/graph/scatter_elements_update.cpp     |   22 -
 .../intel_gpu/src/graph/scatter_nd_update.cpp |   14 -
 .../intel_gpu/src/graph/scatter_update.cpp    |   16 -
 src/plugins/intel_gpu/src/graph/select.cpp    |   68 -
 src/plugins/intel_gpu/src/graph/shape_of.cpp  |    9 -
 .../intel_gpu/src/graph/shuffle_channels.cpp  |   29 -
 src/plugins/intel_gpu/src/graph/slice.cpp     |    4 -
 src/plugins/intel_gpu/src/graph/softmax.cpp   |   33 +-
 .../intel_gpu/src/graph/space_to_batch.cpp    |   63 +-
 .../intel_gpu/src/graph/space_to_depth.cpp    |   60 -
 .../intel_gpu/src/graph/strided_slice.cpp     |   17 -
 src/plugins/intel_gpu/src/graph/swiglu.cpp    |    9 -
 src/plugins/intel_gpu/src/graph/tile.cpp      |   17 -
 src/plugins/intel_gpu/src/graph/unique.cpp    |    8 -
 .../matrix_nms/matrix_nms_kernel_ref.cpp      |    7 +
 src/plugins/intel_gpu/src/plugin/graph.cpp    |    9 +-
 .../src/plugin/ops/adaptive_pooling.cpp       |   72 +-
 .../src/plugin/ops/batch_to_space.cpp         |   29 +-
 .../intel_gpu/src/plugin/ops/broadcast.cpp    |   38 -
 .../intel_gpu/src/plugin/ops/bucketize.cpp    |    1 -
 .../intel_gpu/src/plugin/ops/concat.cpp       |    1 -
 .../intel_gpu/src/plugin/ops/condition.cpp    |    1 -
 .../intel_gpu/src/plugin/ops/constant.cpp     |  213 +--
 .../intel_gpu/src/plugin/ops/convert.cpp      |    1 -
 .../src/plugin/ops/convert_color.cpp          |    1 -
 .../intel_gpu/src/plugin/ops/convolution.cpp  |    8 -
 .../src/plugin/ops/ctc_greedy_decoder.cpp     |  131 +-
 .../intel_gpu/src/plugin/ops/cum_sum.cpp      |    1 -
 .../intel_gpu/src/plugin/ops/custom.cpp       |    1 -
 src/plugins/intel_gpu/src/plugin/ops/dft.cpp  |    2 +-
 .../intel_gpu/src/plugin/ops/eltwise.cpp      |   44 +-
 .../src/plugin/ops/embedding_bag.cpp          |   79 +-
 ...xperimental_detectron_detection_output.cpp |   95 +-
 ...ectron_generate_proposals_single_image.cpp |   36 +-
 ...mental_detectron_roi_feature_extractor.cpp |   51 +-
 .../src/plugin/ops/extract_image_patches.cpp  |    3 +-
 src/plugins/intel_gpu/src/plugin/ops/eye.cpp  |   12 -
 .../src/plugin/ops/fully_connected.cpp        |   31 -
 .../intel_gpu/src/plugin/ops/gather.cpp       |   51 +-
 .../src/plugin/ops/gather_elements.cpp        |   13 +-
 .../src/plugin/ops/generate_proposals.cpp     |   61 +-
 .../intel_gpu/src/plugin/ops/interpolate.cpp  |  146 +-
 src/plugins/intel_gpu/src/plugin/ops/loop.cpp |  115 +-
 .../intel_gpu/src/plugin/ops/matmul.cpp       |   29 -
 .../intel_gpu/src/plugin/ops/matrix_nms.cpp   |   57 +-
 .../src/plugin/ops/multiclass_nms.cpp         |   65 +-
 .../intel_gpu/src/plugin/ops/multinomial.cpp  |    5 +-
 .../src/plugin/ops/non_max_suppression.cpp    |  165 +-
 .../intel_gpu/src/plugin/ops/normalize_l2.cpp |    2 +-
 .../intel_gpu/src/plugin/ops/one_hot.cpp      |    5 -
 src/plugins/intel_gpu/src/plugin/ops/pad.cpp  |    1 -
 .../intel_gpu/src/plugin/ops/parameter.cpp    |    4 -
 .../intel_gpu/src/plugin/ops/pooling.cpp      |   96 +-
 .../intel_gpu/src/plugin/ops/proposal.cpp     |  149 +-
 .../src/plugin/ops/random_uniform.cpp         |   31 +-
 .../intel_gpu/src/plugin/ops/range.cpp        |   15 +-
 .../intel_gpu/src/plugin/ops/reduce.cpp       |   46 -
 .../intel_gpu/src/plugin/ops/region_yolo.cpp  |    1 -
 .../intel_gpu/src/plugin/ops/reorg_yolo.cpp   |    1 -
 .../intel_gpu/src/plugin/ops/reshape.cpp      |   86 +-
 .../intel_gpu/src/plugin/ops/result.cpp       |    5 -
 .../intel_gpu/src/plugin/ops/reverse.cpp      |    7 +-
 .../src/plugin/ops/reverse_sequence.cpp       |    1 -
 src/plugins/intel_gpu/src/plugin/ops/rnn.cpp  |  181 +--
 .../intel_gpu/src/plugin/ops/roi_align.cpp    |    1 -
 .../intel_gpu/src/plugin/ops/roi_pooling.cpp  |    1 -
 src/plugins/intel_gpu/src/plugin/ops/roll.cpp |   39 +-
 .../plugin/ops/scatter_elements_update.cpp    |    1 -
 .../src/plugin/ops/scatter_nd_update.cpp      |    4 -
 .../src/plugin/ops/scatter_update.cpp         |    1 -
 .../intel_gpu/src/plugin/ops/select.cpp       |   50 -
 .../intel_gpu/src/plugin/ops/shape_of.cpp     |    5 +-
 .../src/plugin/ops/shuffle_channels.cpp       |    1 -
 .../intel_gpu/src/plugin/ops/slice.cpp        |    1 -
 .../intel_gpu/src/plugin/ops/softmax.cpp      |    1 -
 .../src/plugin/ops/space_to_batch.cpp         |   28 +-
 .../src/plugin/ops/space_to_depth.cpp         |    1 -
 .../intel_gpu/src/plugin/ops/split.cpp        |  101 +-
 .../src/plugin/ops/strided_slice.cpp          |  248 +--
 .../intel_gpu/src/plugin/ops/swiglu.cpp       |   29 +-
 src/plugins/intel_gpu/src/plugin/ops/tile.cpp |   27 -
 src/plugins/intel_gpu/src/plugin/ops/topk.cpp |   89 +-
 .../intel_gpu/src/plugin/ops/variable.cpp     |    1 -
 .../intel_gpu/src/plugin/program_builder.cpp  |   22 +-
 .../src/plugin/sync_infer_request.cpp         |   13 -
 .../src/runtime/execution_config.cpp          |    1 -
 .../intel_gpu/src/runtime/kernels_cache.cpp   |    3 +-
 .../concurrency/gpu_concurrency_tests.cpp     |   12 +-
 .../gpu_dyn_batch_shape_tests.cpp             |    4 +-
 ...nvolution_backprop_data_transformation.cpp |   10 +-
 .../convolution_transformation.cpp            |   22 +-
 ...ntwise_branch_selection_transformation.cpp |   12 +-
 .../fq_transformation.cpp                     |   12 +-
 .../fq_with_dq_not_optimal_transformation.cpp |    8 +-
 .../group_convolution_transformation.cpp      |   14 +-
 .../groupconvolution_qdq_transformation.cpp   |   20 +-
 .../mat_mul_with_constant_transformation.cpp  |   16 +-
 .../move_fake_quantize_transformation.cpp     |   16 +-
 ...ly_to_group_convolution_transformation.cpp |    6 +-
 .../pull_reshape_through_dequantization.cpp   |    4 +-
 .../recurrent_cell_transformation.cpp         |    8 +-
 .../reshape_transformation.cpp                |   32 +-
 .../dynamic/read_value_assign.cpp             |    1 +
 .../dynamic/rms_norm_decomposition.cpp        |    1 +
 .../subgraph_tests/dynamic/swiglu_fusion.cpp  |    1 +
 .../bounded_shape_mem_alloc.cpp               |    2 -
 .../is_valid_fusion_test.cpp                  |    2 +-
 .../dynamic_execution/memory_realloc_test.cpp |    7 +-
 .../optimized_out_execution_test.cpp          |    2 +-
 .../unit/dynamic_execution/priorbox_test.cpp  |    2 +-
 .../skip_redundant_reorder_at_runtime.cpp     |    4 +-
 .../unit/dynamic_execution/stateful_model.cpp |    8 +-
 .../fake_alignment/fc_fake_alignment_test.cpp |    1 -
 .../fusions/batch_to_space_fusion_test.cpp    |   25 +-
 .../fusions/fully_connected_fusion_test.cpp   |    5 -
 .../tests/unit/fusions/gather_fusion_test.cpp |    2 -
 .../tests/unit/fusions/gemm_fusion_test.cpp   |    6 -
 .../tests/unit/fusions/reduce_fusion_test.cpp |    3 -
 .../tests/unit/fusions/select_fusion_test.cpp |    4 +-
 .../fusions/space_to_batch_fusion_test.cpp    |   25 +-
 .../kernel_impl_params_relevance_test.cpp     |    3 +-
 .../tests/unit/module_tests/network_test.cpp  |   12 +-
 .../weights_reorder_factory_test.cpp          |    4 +-
 ...dd_onednn_optimization_attributes_test.cpp |    2 +-
 .../passes/add_required_reorders_test.cpp     |    2 +-
 .../unit/passes/clamp_fp16_output_test.cpp    |    4 +-
 .../tests/unit/passes/handle_reshape.cpp      |   12 +-
 .../tests/unit/passes/kernels_cache_test.cpp  |    2 +-
 .../passes/mark_shape_of_subgraphs_test.cpp   |   16 +-
 .../unit/passes/post_optimize_weights.cpp     |   11 +-
 .../passes/prepare_buffer_fusing_test.cpp     |   18 +-
 .../unit/passes/prepare_padding_test.cpp      |    4 +-
 .../passes/prepare_primitive_fusing_test.cpp  |   30 +-
 .../remove_redundant_reorders_tests.cpp       |   12 +-
 .../tests/unit/passes/reorder_inputs_test.cpp |   18 +-
 .../tests/unit/passes/reorder_transfer.cpp    |    2 +-
 .../passes/select_preferred_formats_test.cpp  |    2 +-
 .../unit/shape_infer/broadcast_si_test.cpp    |    2 +-
 .../tests/unit/shape_infer/matmul_si_test.cpp |    4 +-
 .../non_max_suppression_si_test.cpp           |   12 +-
 .../unit/shape_infer/one_hot_si_test.cpp      |    2 +-
 .../unit/shape_infer/reverse_si_test.cpp      |   12 +-
 .../tests/unit/shape_infer/roll_si_test.cpp   |    2 +-
 .../test_cases/activation_simple_gpu_test.cpp |    7 +-
 .../adaptive_avg_pooling_gpu_test.cpp         |   66 +-
 .../adaptive_max_pooling_gpu_test.cpp         |  312 ----
 .../unit/test_cases/add_reorders_gpu_test.cpp |    1 -
 .../unit/test_cases/arg_max_gpu_test.cpp      |    6 +-
 .../test_cases/batch_to_space_gpu_test.cpp    |   70 +-
 .../tests/unit/test_cases/border_gpu_test.cpp |   10 +-
 .../unit/test_cases/broadcast_gpu_test.cpp    | 1204 ++++----------
 .../test_cases/canonicalization_gpu_test.cpp  |    3 +-
 .../test_cases/concatenation_gpu_test.cpp     |    6 +-
 .../unit/test_cases/condition_gpu_test.cpp    |    8 +-
 .../unit/test_cases/convolution_gpu_test.cpp  |   11 +-
 .../tests/unit/test_cases/crop_gpu_test.cpp   |    5 +-
 .../unit/test_cases/cum_sum_gpu_test.cpp      |    2 +-
 .../tests/unit/test_cases/data_gpu_test.cpp   |    4 +-
 .../test_cases/deconvolution_gpu_test.cpp     |    2 +-
 .../unit/test_cases/eltwise_gpu_test.cpp      |   18 +-
 .../test_cases/embedding_bag_gpu_test.cpp     | 1427 -----------------
 .../unit/test_cases/empty_tensor_gpu_test.cpp |    2 +-
 ...al_detectron_detection_output_gpu_test.cpp |  456 ------
 ...nerate_proposals_single_image_gpu_test.cpp |  359 -----
 ...etectron_prior_grid_generator_gpu_test.cpp |  239 ---
 ...tectron_roi_feature_extractor_gpu_test.cpp |  306 ----
 ...erimental_detectron_topk_rois_gpu_test.cpp |  176 --
 .../extract_image_patches_gpu_test.cpp        |  571 -------
 .../intel_gpu/tests/unit/test_cases/eye.cpp   |  229 ---
 .../test_cases/fully_connected_gpu_test.cpp   |   40 +-
 .../test_cases/gather_elements_gpu_test.cpp   |    2 +-
 .../tests/unit/test_cases/gather_gpu_test.cpp |   17 +-
 .../unit/test_cases/gather_nd_gpu_test.cpp    |    4 +-
 .../tests/unit/test_cases/gemm_gpu_test.cpp   |   38 +-
 .../generate_proposals_gpu_test.cpp           |  478 ------
 .../unit/test_cases/grid_sample_gpu_test.cpp  |    2 +-
 .../tests/unit/test_cases/loop_gpu_test.cpp   |   24 +-
 .../unit/test_cases/matrix_nms_gpu_test.cpp   |  695 --------
 .../tests/unit/test_cases/memory_test.cpp     |    8 +-
 .../test_cases/multiclass_nms_gpu_test.cpp    |  877 ----------
 .../test_cases/multiple_streams_gpu_test.cpp  |    2 +-
 .../tests/unit/test_cases/mvn_gpu_test.cpp    |    4 +-
 .../test_cases/non_max_suppression_test.cpp   |  105 +-
 .../unit/test_cases/non_zero_gpu_test.cpp     |    8 +-
 .../unit/test_cases/one_hot_gpu_test.cpp      |   53 +-
 .../unit/test_cases/permute_gpu_test.cpp      |   10 +-
 .../unit/test_cases/quantize_gpu_test.cpp     |    2 +-
 .../tests/unit/test_cases/range_gpu_test.cpp  |   28 +-
 .../tests/unit/test_cases/reduce_gpu_test.cpp |    6 +-
 .../unit/test_cases/reorder_gpu_test.cpp      |    7 +-
 .../unit/test_cases/resample_gpu_test.cpp     |   30 +-
 .../unit/test_cases/reshape_gpu_test.cpp      |   16 +-
 .../unit/test_cases/reverse_gpu_test.cpp      |   56 +-
 .../tests/unit/test_cases/rms_gpu_test.cpp    |    3 -
 .../tests/unit/test_cases/roll_gpu_test.cpp   |    2 +-
 .../test_cases/scatter_nd_update_gpu_test.cpp |    6 +-
 .../test_cases/scatter_update_gpu_test.cpp    |    6 +-
 .../tests/unit/test_cases/select_gpu_test.cpp |    2 +-
 .../unit/test_cases/shape_of_gpu_test.cpp     |    4 +-
 .../tests/unit/test_cases/slice_gpu_test.cpp  |   10 +-
 .../unit/test_cases/softmax_gpu_test.cpp      |    6 +-
 .../test_cases/space_to_batch_gpu_test.cpp    |   70 +-
 .../test_cases/strided_slice_gpu_test.cpp     |   12 +-
 .../tests/unit/test_cases/swiglu_gpu_test.cpp |    4 +-
 .../tests/unit/test_cases/tile_gpu_test.cpp   |    2 +-
 .../tests/unit/test_cases/unique_gpu_test.cpp |    2 +-
 425 files changed, 1716 insertions(+), 13984 deletions(-)
 delete mode 100644 src/plugins/intel_gpu/tests/unit/test_cases/adaptive_max_pooling_gpu_test.cpp
 delete mode 100644 src/plugins/intel_gpu/tests/unit/test_cases/embedding_bag_gpu_test.cpp
 delete mode 100644 src/plugins/intel_gpu/tests/unit/test_cases/experimental_detectron_detection_output_gpu_test.cpp
 delete mode 100644 src/plugins/intel_gpu/tests/unit/test_cases/experimental_detectron_generate_proposals_single_image_gpu_test.cpp
 delete mode 100644 src/plugins/intel_gpu/tests/unit/test_cases/experimental_detectron_prior_grid_generator_gpu_test.cpp
 delete mode 100644 src/plugins/intel_gpu/tests/unit/test_cases/experimental_detectron_roi_feature_extractor_gpu_test.cpp
 delete mode 100644 src/plugins/intel_gpu/tests/unit/test_cases/experimental_detectron_topk_rois_gpu_test.cpp
 delete mode 100644 src/plugins/intel_gpu/tests/unit/test_cases/extract_image_patches_gpu_test.cpp
 delete mode 100644 src/plugins/intel_gpu/tests/unit/test_cases/eye.cpp
 delete mode 100644 src/plugins/intel_gpu/tests/unit/test_cases/generate_proposals_gpu_test.cpp
 delete mode 100644 src/plugins/intel_gpu/tests/unit/test_cases/matrix_nms_gpu_test.cpp
 delete mode 100644 src/plugins/intel_gpu/tests/unit/test_cases/multiclass_nms_gpu_test.cpp

diff --git a/src/plugins/intel_gpu/include/intel_gpu/graph/program.hpp b/src/plugins/intel_gpu/include/intel_gpu/graph/program.hpp
index 379d7b3b64a222..245d6e1a0f1767 100644
--- a/src/plugins/intel_gpu/include/intel_gpu/graph/program.hpp
+++ b/src/plugins/intel_gpu/include/intel_gpu/graph/program.hpp
@@ -287,7 +287,6 @@ struct program {
     void load(cldnn::BinaryInputBuffer& ib);
     bool is_loaded_from_cache() const { return _loaded_from_cache; }
 
-    bool is_new_shape_infer() const { return new_shape_infer; }
     layout_optimizer& get_layout_optimizer() const { return *_layout_optimizer; }
 
 private:
@@ -313,8 +312,6 @@ struct program {
     std::shared_ptr<ICompilationContext> _compilation_context;
     bool _loaded_from_cache = false;
 
-    bool new_shape_infer = false;
-
     std::map<primitive_id, std::shared_ptr<program_node>> nodes_map;
     std::list<primitive_id> optimized_out;
 
diff --git a/src/plugins/intel_gpu/include/intel_gpu/plugin/program_builder.hpp b/src/plugins/intel_gpu/include/intel_gpu/plugin/program_builder.hpp
index 5cede62fd17e69..e0b94070249524 100644
--- a/src/plugins/intel_gpu/include/intel_gpu/plugin/program_builder.hpp
+++ b/src/plugins/intel_gpu/include/intel_gpu/plugin/program_builder.hpp
@@ -138,7 +138,6 @@ class ProgramBuilder final {
 
     void add_primitive(const ov::Node& op, std::shared_ptr<cldnn::primitive> prim, std::vector<std::string> aliases = {});
 
-    bool use_new_shape_infer() const { return allow_new_shape_infer; }
     bool requires_new_shape_infer(const std::shared_ptr<ov::Node>& op) const;
     bool is_inner_program() const { return m_is_inner_program; }
     bool is_query_mode() { return queryMode; }
@@ -157,8 +156,6 @@ class ProgramBuilder final {
     std::shared_ptr<cldnn::topology> m_topology;
     CustomLayerMap m_custom_layers;
 
-    bool allow_new_shape_infer = false;
-
     bool queryMode;
 
     std::shared_ptr<ov::threading::IStreamsExecutor> m_task_executor;
diff --git a/src/plugins/intel_gpu/include/intel_gpu/primitives/adaptive_pooling.hpp b/src/plugins/intel_gpu/include/intel_gpu/primitives/adaptive_pooling.hpp
index b6a80edd2b6d14..d04cd2ceec8968 100644
--- a/src/plugins/intel_gpu/include/intel_gpu/primitives/adaptive_pooling.hpp
+++ b/src/plugins/intel_gpu/include/intel_gpu/primitives/adaptive_pooling.hpp
@@ -20,35 +20,6 @@ struct adaptive_pooling : public primitive_base<adaptive_pooling> {
                          mode{adaptive_pooling_mode::average},
                          output_size{} {}
 
-    /// @brief Constructs AdaptiveAvgPooling primitive.
-    /// @param id This primitive id.
-    /// @param input Input primitive id.
-    /// @param output_size Output data size of the primitive
-    adaptive_pooling(const primitive_id &id,
-                     const input_info &input,
-                     tensor output_size)
-            : primitive_base(id, {input}),
-              mode{adaptive_pooling_mode::average},
-              output_size{output_size} {}
-
-    /// @brief Constructs AdaptiveMaxPooling primitive.
-    /// @param id This primitive id.
-    /// @param input Input primitive id.
-    /// @param output_shape Output shape primitive id.
-    /// @param output_size Output data size of the primitive
-    /// @param indices_output Indices output primitive id.
-    /// @param index_element_type Data type of indices output.
-    adaptive_pooling(const primitive_id &id,
-                     const input_info &input,
-                     tensor output_size,
-                     const primitive_id &indices_output,
-                     data_types index_element_type)
-            : primitive_base(id, {input, indices_output}),
-              mode{adaptive_pooling_mode::max},
-              output_size{output_size},
-              indices_output{indices_output},
-              index_element_type{index_element_type} {}
-
     /// @brief Constructs AdaptiveAvgPooling primitive for dynamic shape.
     /// @param id This primitive id.
     /// @param input Input primitive id.
diff --git a/src/plugins/intel_gpu/include/intel_gpu/primitives/arg_max_min.hpp b/src/plugins/intel_gpu/include/intel_gpu/primitives/arg_max_min.hpp
index 978b77d9ea03f5..181427ecec3430 100644
--- a/src/plugins/intel_gpu/include/intel_gpu/primitives/arg_max_min.hpp
+++ b/src/plugins/intel_gpu/include/intel_gpu/primitives/arg_max_min.hpp
@@ -111,12 +111,6 @@ struct arg_max_min : public primitive_base<arg_max_min> {
                stable == rhs_casted.stable;
     }
 
-    size_t get_output_nums() const {
-        return (input_size() == 3 ? 2 : output_size());
-    }
-    bool has_second_output() const { return get_output_nums() == 2; }
-    bool use_multiple_outputs() const { return input_size() != 3; }
-
     void save(BinaryOutputBuffer& ob) const override {
         primitive_base<arg_max_min>::save(ob);
         ob << make_data(&mode, sizeof(ov::op::TopKMode));
diff --git a/src/plugins/intel_gpu/include/intel_gpu/primitives/batch_to_space.hpp b/src/plugins/intel_gpu/include/intel_gpu/primitives/batch_to_space.hpp
index 090bcf44a140a3..6ee60ae3a41cdd 100644
--- a/src/plugins/intel_gpu/include/intel_gpu/primitives/batch_to_space.hpp
+++ b/src/plugins/intel_gpu/include/intel_gpu/primitives/batch_to_space.hpp
@@ -50,38 +50,33 @@ struct batch_to_space : public primitive_base<batch_to_space> {
     /// @param crops_end Amount to crop from the ending along each axis of data input
     batch_to_space(const primitive_id& id,
                    const input_info& input,
-                   const tensor& block_shape,
-                   const tensor& crops_begin,
-                   const tensor& crops_end,
-                   const tensor& out_size)
+                   const std::vector<int32_t>& block_shape,
+                   const std::vector<int32_t>& crops_begin,
+                   const std::vector<int32_t>& crops_end)
         : primitive_base(id, {input}),
           block_shape(block_shape),
           crops_begin(crops_begin),
           crops_end(crops_end),
-          out_size(out_size),
           shape_constant(1) {}
 
     batch_to_space(const primitive_id& id,
-                   const std::vector<input_info>& inputs,
-                   const tensor& out_size)
-        : primitive_base(id, inputs),
-          block_shape(tensor()),
-          crops_begin(tensor()),
-          crops_end(tensor()),
-          out_size(out_size),
+                   const std::vector<input_info>& inputs)
+        : primitive_base(id, inputs, {}),
+          block_shape({}),
+          crops_begin({}),
+          crops_end({}),
           shape_constant(0) {}
 
-    tensor block_shape;
-    tensor crops_begin;
-    tensor crops_end;
-    tensor out_size;
+    std::vector<int32_t> block_shape;
+    std::vector<int32_t> crops_begin;
+    std::vector<int32_t> crops_end;
     int64_t shape_constant;
 
     size_t hash() const override {
         size_t seed = primitive::hash();
-        seed = hash_combine(seed, block_shape.hash());
-        seed = hash_combine(seed, crops_begin.hash());
-        seed = hash_combine(seed, crops_end.hash());
+        seed = hash_range(seed, block_shape.begin(), block_shape.end());
+        seed = hash_range(seed, crops_begin.begin(), crops_begin.end());
+        seed = hash_range(seed, crops_end.begin(), crops_end.end());
         seed = hash_combine(seed, shape_constant);
         return seed;
     }
@@ -102,7 +97,6 @@ struct batch_to_space : public primitive_base<batch_to_space> {
         ob << block_shape;
         ob << crops_begin;
         ob << crops_end;
-        ob << out_size;
         ob << shape_constant;
     }
 
@@ -111,7 +105,6 @@ struct batch_to_space : public primitive_base<batch_to_space> {
         ib >> block_shape;
         ib >> crops_begin;
         ib >> crops_end;
-        ib >> out_size;
         ib >> shape_constant;
     }
 };
diff --git a/src/plugins/intel_gpu/include/intel_gpu/primitives/broadcast.hpp b/src/plugins/intel_gpu/include/intel_gpu/primitives/broadcast.hpp
index 4ce31e2b118e9b..00d26d974099fb 100644
--- a/src/plugins/intel_gpu/include/intel_gpu/primitives/broadcast.hpp
+++ b/src/plugins/intel_gpu/include/intel_gpu/primitives/broadcast.hpp
@@ -57,25 +57,6 @@ struct broadcast : public primitive_base<broadcast> {
 
     broadcast() : primitive_base("", {}) {}
 
-    /// @brief Constructs broadcast primitive / layer.
-    ///
-    /// @param id              An identifier of new primitive.
-    /// @param input           An identifier of primitive which is an input for newly created
-    ///                        broadcast primitive.
-    /// @param broadcast_sizes Sizes of broadcast. Output size of current primitive
-    ///                        will match broadcast sizes (layout type will not change).
-    /// @param broadcast_axes  Axes positions (0-based, from left to right) in output_shape
-    ///                        that are being broadcast. Values of broadcast_axes on remaining
-    ///                        axes must be greater (dividable) or equal to corresponding input
-    ///                        dimension values.
-    broadcast(const primitive_id& id,
-              const input_info& input,
-              const tensor& broadcast_sizes,
-              const std::vector<uint16_t>& broadcast_axes = {})
-        : primitive_base(id, {input}),
-          broadcast_sizes(broadcast_sizes),
-          broadcast_axes(broadcast_axes) {}
-
     /// @brief Constructs broadcast primitive / layer with static target_shape.
     ///
     /// @param id             An identifier of new primitive.
@@ -99,9 +80,7 @@ struct broadcast : public primitive_base<broadcast> {
         : primitive_base(id, {input}),
           target_shape(target_shape),
           axes_mapping(axes_mapping),
-          broadcast_mode(broadcast_spec),
-          broadcast_sizes(target_shape.empty() ? tensor(1) : tensor(0)),
-          broadcast_axes({}) {}
+          broadcast_mode(broadcast_spec) {}
 
     /// @brief Constructs broadcast primitive / layer with dynamic target_shape.
     broadcast(const primitive_id& id,
@@ -112,9 +91,7 @@ struct broadcast : public primitive_base<broadcast> {
     : primitive_base(id, {input, target_shape_id}),
       target_shape({}),
       axes_mapping(axes_mapping),
-      broadcast_mode(broadcast_spec),
-      broadcast_sizes({}),
-      broadcast_axes({}) {}
+      broadcast_mode(broadcast_spec) {}
 
     /// @brief The shape of the output tensor.
     ov::Shape target_shape;
@@ -122,17 +99,11 @@ struct broadcast : public primitive_base<broadcast> {
     ov::AxisSet axes_mapping;
     /// @brief Broadcast mode to use for determining broadcast axes.
     ov::op::BroadcastModeSpec broadcast_mode;
-    /// @brief Expected sizes of output from broadcast primitive.
-    tensor broadcast_sizes;
-    /// @brief Array of axes positions from output shape (0-based, from left to right)
-    ///        along which broadcast should happen.
-    std::vector<uint16_t> broadcast_axes;
 
     ov::PartialShape output_pshape = ov::PartialShape::dynamic();
 
     size_t hash() const override {
         size_t seed = primitive::hash();
-        seed = hash_range(seed, broadcast_axes.begin(), broadcast_axes.end());
         seed = hash_range(seed, axes_mapping.begin(), axes_mapping.end());
         return seed;
     }
@@ -145,7 +116,6 @@ struct broadcast : public primitive_base<broadcast> {
 
         return axes_mapping == rhs_casted.axes_mapping &&
                broadcast_mode == rhs_casted.broadcast_mode &&
-               broadcast_sizes == rhs_casted.broadcast_sizes &&
                output_pshape == rhs_casted.output_pshape;
     }
 
@@ -154,8 +124,6 @@ struct broadcast : public primitive_base<broadcast> {
         ob << target_shape;
         ob << axes_mapping;
         ob << make_data(&broadcast_mode, sizeof(ov::op::BroadcastModeSpec));
-        ob << broadcast_sizes;
-        ob << broadcast_axes;
         ob << output_pshape;
     }
 
@@ -164,8 +132,6 @@ struct broadcast : public primitive_base<broadcast> {
         ib >> target_shape;
         ib >> axes_mapping;
         ib >> make_data(&broadcast_mode, sizeof(ov::op::BroadcastModeSpec));
-        ib >> broadcast_sizes;
-        ib >> broadcast_axes;
         ib >> output_pshape;
     }
 };
diff --git a/src/plugins/intel_gpu/include/intel_gpu/primitives/embedding_bag.hpp b/src/plugins/intel_gpu/include/intel_gpu/primitives/embedding_bag.hpp
index ba85b5a7840cf9..5131fb803f63c8 100644
--- a/src/plugins/intel_gpu/include/intel_gpu/primitives/embedding_bag.hpp
+++ b/src/plugins/intel_gpu/include/intel_gpu/primitives/embedding_bag.hpp
@@ -29,9 +29,8 @@ struct embedding_bag : public primitive_base<embedding_bag> {
     embedding_bag(const primitive_id& id,
                   const std::vector<input_info>& inputs,
                   const embedding_bag_type& type,
-                  const tensor& output_shape,
                   const int32_t default_index = -1)
-        : primitive_base(id, inputs), type(type), output_shape(output_shape), default_index(default_index) {}
+        : primitive_base(id, inputs), type(type), default_index(default_index) {}
 
     /// @brief Type of EmbeddingBag operation
     embedding_bag_type type;
@@ -60,14 +59,12 @@ struct embedding_bag : public primitive_base<embedding_bag> {
     void save(BinaryOutputBuffer& ob) const override {
         primitive_base<embedding_bag>::save(ob);
         ob << make_data(&type, sizeof(embedding_bag_type));
-        ob << output_shape;
         ob << default_index;
     }
 
     void load(BinaryInputBuffer& ib) override {
         primitive_base<embedding_bag>::load(ib);
         ib >> make_data(&type, sizeof(embedding_bag_type));
-        ib >> output_shape;
         ib >> default_index;
     }
 };
diff --git a/src/plugins/intel_gpu/include/intel_gpu/primitives/experimental_detectron_detection_output.hpp b/src/plugins/intel_gpu/include/intel_gpu/primitives/experimental_detectron_detection_output.hpp
index 081acee527fe87..7bed9155ca9718 100644
--- a/src/plugins/intel_gpu/include/intel_gpu/primitives/experimental_detectron_detection_output.hpp
+++ b/src/plugins/intel_gpu/include/intel_gpu/primitives/experimental_detectron_detection_output.hpp
@@ -37,8 +37,6 @@ struct experimental_detectron_detection_output : public primitive_base<experimen
                                             const input_info& input_deltas,
                                             const input_info& input_scores,
                                             const input_info& input_im_info,
-                                            const input_info& output_classes,
-                                            const input_info& output_scores,
                                             float score_threshold,
                                             float nms_threshold,
                                             int num_classes,
@@ -47,10 +45,7 @@ struct experimental_detectron_detection_output : public primitive_base<experimen
                                             bool class_agnostic_box_regression,
                                             float max_delta_log_wh,
                                             std::vector<float> deltas_weights)
-        : primitive_base{id,
-                         {input_rois, input_deltas, input_scores, input_im_info, output_classes, output_scores}},
-          output_classes{output_classes.pid},
-          output_scores{output_scores.pid},
+        : primitive_base{id, {input_rois, input_deltas, input_scores, input_im_info}},
           score_threshold{score_threshold},
           nms_threshold{nms_threshold},
           num_classes{num_classes},
@@ -60,34 +55,6 @@ struct experimental_detectron_detection_output : public primitive_base<experimen
           max_delta_log_wh{max_delta_log_wh},
           deltas_weights{std::move(deltas_weights)} {}
 
-        experimental_detectron_detection_output(const primitive_id& id,
-                                            const input_info& input_rois,
-                                            const input_info& input_deltas,
-                                            const input_info& input_scores,
-                                            const input_info& input_im_info,
-                                            float score_threshold,
-                                            float nms_threshold,
-                                            int num_classes,
-                                            int post_nms_count,
-                                            int max_detections_per_image,
-                                            bool class_agnostic_box_regression,
-                                            float max_delta_log_wh,
-                                            std::vector<float> deltas_weights)
-        : primitive_base{id,
-                         {input_rois, input_deltas, input_scores, input_im_info}},
-          output_classes{},
-          output_scores{},
-          score_threshold{score_threshold},
-          nms_threshold{nms_threshold},
-          num_classes{num_classes},
-          post_nms_count{post_nms_count},
-          max_detections_per_image{max_detections_per_image},
-          class_agnostic_box_regression{class_agnostic_box_regression},
-          max_delta_log_wh{max_delta_log_wh},
-          deltas_weights{std::move(deltas_weights)} {}
-
-    primitive_id output_classes;
-    primitive_id output_scores;
     float score_threshold = 0.0f;
     float nms_threshold = 0.0f;
     int num_classes = 0;
@@ -107,8 +74,6 @@ struct experimental_detectron_detection_output : public primitive_base<experimen
         seed = hash_combine(seed, class_agnostic_box_regression);
         seed = hash_combine(seed, max_delta_log_wh);
         seed = hash_range(seed, deltas_weights.begin(), deltas_weights.end());
-        seed = hash_combine(seed, output_classes.empty());
-        seed = hash_combine(seed, output_scores.empty());
         return seed;
     }
 
@@ -126,16 +91,12 @@ struct experimental_detectron_detection_output : public primitive_base<experimen
                cmp_fields(max_detections_per_image) &&
                cmp_fields(class_agnostic_box_regression) &&
                cmp_fields(max_delta_log_wh) &&
-               cmp_fields(deltas_weights) &&
-               cmp_fields(output_classes.empty()) &&
-               cmp_fields(output_scores.empty());
+               cmp_fields(deltas_weights);
         #undef cmp_fields
     }
 
     void save(BinaryOutputBuffer& ob) const override {
         primitive_base<experimental_detectron_detection_output>::save(ob);
-        ob << output_classes;
-        ob << output_scores;
         ob << score_threshold;
         ob << nms_threshold;
         ob << num_classes;
@@ -148,8 +109,6 @@ struct experimental_detectron_detection_output : public primitive_base<experimen
 
     void load(BinaryInputBuffer& ib) override {
         primitive_base<experimental_detectron_detection_output>::load(ib);
-        ib >> output_classes;
-        ib >> output_scores;
         ib >> score_threshold;
         ib >> nms_threshold;
         ib >> num_classes;
@@ -159,17 +118,5 @@ struct experimental_detectron_detection_output : public primitive_base<experimen
         ib >> max_delta_log_wh;
         ib >> deltas_weights;
     }
-
-protected:
-    std::vector<input_info> get_dependencies() const override {
-        std::vector<input_info> ret;
-        if (!output_classes.empty())
-            ret.emplace_back(output_classes);
-
-        if (!output_scores.empty())
-            ret.emplace_back(output_scores);
-
-        return ret;
-    }
 };
 }  // namespace cldnn
diff --git a/src/plugins/intel_gpu/include/intel_gpu/primitives/experimental_detectron_generate_proposals_single_image.hpp b/src/plugins/intel_gpu/include/intel_gpu/primitives/experimental_detectron_generate_proposals_single_image.hpp
index 99817ba14cbb07..e179b76ddebfb2 100644
--- a/src/plugins/intel_gpu/include/intel_gpu/primitives/experimental_detectron_generate_proposals_single_image.hpp
+++ b/src/plugins/intel_gpu/include/intel_gpu/primitives/experimental_detectron_generate_proposals_single_image.hpp
@@ -26,23 +26,6 @@ struct experimental_detectron_generate_proposals_single_image
     /// @param nms_threshold threshold to be used in NonMaxSuppression stage
     /// @param pre_nms_count number of top-n proposals before NMS
     /// @param post_nms_count number of top-n proposals after NMS
-    experimental_detectron_generate_proposals_single_image(const primitive_id& id,
-           const input_info& input_im_info,
-           const input_info& input_anchors,
-           const input_info& input_deltas,
-           const input_info& input_scores,
-           const input_info& output_roi_scores,
-           float min_size,
-           float nms_threshold,
-           int64_t pre_nms_count,
-           int64_t post_nms_count) :
-            primitive_base{id, {input_im_info, input_anchors, input_deltas, input_scores, output_roi_scores}},
-            output_roi_scores{output_roi_scores.pid},
-            min_size{min_size},
-            nms_threshold{nms_threshold},
-            pre_nms_count{pre_nms_count},
-            post_nms_count{post_nms_count} {}
-
     experimental_detectron_generate_proposals_single_image(const primitive_id& id,
            const input_info& input_im_info,
            const input_info& input_anchors,
@@ -53,13 +36,11 @@ struct experimental_detectron_generate_proposals_single_image
            int64_t pre_nms_count,
            int64_t post_nms_count) :
             primitive_base{id, {input_im_info, input_anchors, input_deltas, input_scores}},
-            output_roi_scores{},
             min_size{min_size},
             nms_threshold{nms_threshold},
             pre_nms_count{pre_nms_count},
             post_nms_count{post_nms_count} {}
 
-    primitive_id output_roi_scores;
     float min_size = 0.0f;
     float nms_threshold = 0.0f;
     int64_t pre_nms_count = 0;
@@ -71,7 +52,6 @@ struct experimental_detectron_generate_proposals_single_image
         seed = hash_combine(seed, nms_threshold);
         seed = hash_combine(seed, pre_nms_count);
         seed = hash_combine(seed, post_nms_count);
-        seed = hash_combine(seed, output_roi_scores.empty());
         return seed;
     }
 
@@ -84,13 +64,11 @@ struct experimental_detectron_generate_proposals_single_image
         return min_size == rhs_casted.min_size &&
                nms_threshold == rhs_casted.nms_threshold &&
                pre_nms_count == rhs_casted.pre_nms_count &&
-               post_nms_count == rhs_casted.post_nms_count &&
-               output_roi_scores.empty() == rhs_casted.output_roi_scores.empty();
+               post_nms_count == rhs_casted.post_nms_count;
     }
 
     void save(BinaryOutputBuffer& ob) const override {
         primitive_base<experimental_detectron_generate_proposals_single_image>::save(ob);
-        ob << output_roi_scores;
         ob << min_size;
         ob << nms_threshold;
         ob << pre_nms_count;
@@ -99,19 +77,10 @@ struct experimental_detectron_generate_proposals_single_image
 
     void load(BinaryInputBuffer& ib) override {
         primitive_base<experimental_detectron_generate_proposals_single_image>::load(ib);
-        ib >> output_roi_scores;
         ib >> min_size;
         ib >> nms_threshold;
         ib >> pre_nms_count;
         ib >> post_nms_count;
     }
-
-protected:
-    std::vector<input_info> get_dependencies() const override {
-        std::vector<input_info> ret;
-        if (!output_roi_scores.empty())
-            ret.push_back(output_roi_scores);
-        return ret;
-    }
 };
 }  // namespace cldnn
diff --git a/src/plugins/intel_gpu/include/intel_gpu/primitives/extract_image_patches.hpp b/src/plugins/intel_gpu/include/intel_gpu/primitives/extract_image_patches.hpp
index cd5ded9872c91c..49c6795f1e78f0 100644
--- a/src/plugins/intel_gpu/include/intel_gpu/primitives/extract_image_patches.hpp
+++ b/src/plugins/intel_gpu/include/intel_gpu/primitives/extract_image_patches.hpp
@@ -28,14 +28,12 @@ struct extract_image_patches : public primitive_base<extract_image_patches> {
                           const ov::Shape& sizes,
                           const ov::Strides& strides,
                           const ov::Shape& rates,
-                          const ov::op::PadType& auto_pad,
-                          const tensor& output_shape = tensor{})
+                          const ov::op::PadType& auto_pad)
         : primitive_base(id, {input}),
           sizes(sizes),
           strides(strides),
           rates(rates),
-          auto_pad(auto_pad),
-          output_shape(output_shape) {}
+          auto_pad(auto_pad) {}
 
     /// @brief Vector with sizes
     ov::Shape sizes;
@@ -45,8 +43,6 @@ struct extract_image_patches : public primitive_base<extract_image_patches> {
     ov::Shape rates;
     /// @brief Mode how the padding is calculated
     ov::op::PadType auto_pad;
-    /// @brief Shape of output layout
-    tensor output_shape;
 
     size_t hash() const override {
         size_t seed = primitive::hash();
@@ -75,7 +71,6 @@ struct extract_image_patches : public primitive_base<extract_image_patches> {
         ob << strides;
         ob << rates;
         ob << make_data(&auto_pad, sizeof(ov::op::PadType));
-        ob << output_shape;
     }
 
     void load(BinaryInputBuffer& ib) override {
@@ -84,7 +79,6 @@ struct extract_image_patches : public primitive_base<extract_image_patches> {
         ib >> strides;
         ib >> rates;
         ib >> make_data(&auto_pad, sizeof(ov::op::PadType));
-        ib >> output_shape;
     }
 };
 }  // namespace cldnn
diff --git a/src/plugins/intel_gpu/include/intel_gpu/primitives/eye.hpp b/src/plugins/intel_gpu/include/intel_gpu/primitives/eye.hpp
index 40b8905f16d495..85e6d59531d24b 100644
--- a/src/plugins/intel_gpu/include/intel_gpu/primitives/eye.hpp
+++ b/src/plugins/intel_gpu/include/intel_gpu/primitives/eye.hpp
@@ -1,4 +1,4 @@
-// Copyright (C) 2022 Intel Corporation
+// Copyright (C) 2022-2024 Intel Corporation
 // SPDX-License-Identifier: Apache-2.0
 //
 
@@ -17,17 +17,14 @@ struct eye : public primitive_base<eye> {
     /// @brief Constructs eye primitive.
     /// @param id This primitive id.
     /// @param inputs List of primitive ids.
-    /// @param output_shape Tensor output shape
     /// @param ext_prim_id Primitive extra id (friendly name)
     /// @param shift Eye diagonal
     /// @param output_type Tensor output type
     eye(const primitive_id& id,
         const std::vector<input_info>& inputs,
-        const tensor& output_shape,
         const int32_t shift,
         const cldnn::data_types output_type)
         : primitive_base{id, inputs, 1, {optional_data_type(output_type)}},
-          output_shape{output_shape},
           shift{shift} {}
 
     tensor output_shape;
@@ -50,13 +47,11 @@ struct eye : public primitive_base<eye> {
 
     void save(BinaryOutputBuffer& ob) const override {
         primitive_base<eye>::save(ob);
-        ob << output_shape;
         ob << shift;
     }
 
     void load(BinaryInputBuffer& ib) override {
         primitive_base<eye>::load(ib);
-        ib >> output_shape;
         ib >> shift;
     }
 };
diff --git a/src/plugins/intel_gpu/include/intel_gpu/primitives/generate_proposals.hpp b/src/plugins/intel_gpu/include/intel_gpu/primitives/generate_proposals.hpp
index 2c056c7c21e274..643333cffb9582 100644
--- a/src/plugins/intel_gpu/include/intel_gpu/primitives/generate_proposals.hpp
+++ b/src/plugins/intel_gpu/include/intel_gpu/primitives/generate_proposals.hpp
@@ -3,6 +3,7 @@
 //
 
 #pragma once
+#include "openvino/op/generate_proposals.hpp"
 #include "primitive.hpp"
 #include "openvino/op/generate_proposals.hpp"
 #include <vector>
@@ -18,52 +19,16 @@ struct generate_proposals
 
     /// @brief Constructs generate_proposals primitive
     /// @param id This primitive id
-    /// @param input_im_info image size info
-    /// @param input_anchors anchors
-    /// @param input_deltas deltas for anchors
-    /// @param input_scores proposal scores
-    /// @param output_rois_scores ROIs scores
-    /// @param output_rois_num number of proposed ROIs
-    /// @param min_size  minimum box width and height
-    /// @param nms_threshold threshold to be used in NonMaxSuppression stage
-    /// @param pre_nms_count number of top-n proposals before NMS
-    /// @param post_nms_count number of top-n proposals after NMS
-    /// @param normalized indicates whether proposal bboxes are normalized
-    /// @param nms_eta eta parameter for adaptive NMS
-    /// @param roi_num_type type of 3rd output elements
-    generate_proposals(const primitive_id& id,
-                       const std::vector<input_info>& inputs,
-                       float min_size,
-                       float nms_threshold,
-                       int64_t pre_nms_count,
-                       int64_t post_nms_count,
-                       bool normalized,
-                       float nms_eta,
-                       const data_types roi_num_type) :
-            primitive_base{id, inputs},
-            output_rois_scores{inputs[4].pid},
-            output_rois_num{inputs[5].pid},
-            roi_num_type{roi_num_type} {
-        attrs.min_size = min_size;
-        attrs.nms_threshold = nms_threshold;
-        attrs.pre_nms_count = pre_nms_count;
-        attrs.post_nms_count = post_nms_count;
-        attrs.normalized = normalized;
-        attrs.nms_eta = nms_eta;
-    }
-
+    /// @param inputs input primitive ids
+    /// @param attr Attributes of GenerateProposal op
     generate_proposals(const primitive_id& id,
                        const std::vector<input_info>& inputs,
                        const ov::op::v9::GenerateProposals::Attributes& attrs) :
-            primitive_base{id, inputs, {}},
+            primitive_base{id, inputs},
             attrs{attrs} {}
 
     ov::op::v9::GenerateProposals::Attributes attrs;
 
-    primitive_id output_rois_scores;
-    primitive_id output_rois_num;
-    data_types roi_num_type = data_types::undefined;
-
     size_t hash() const override {
         size_t seed = primitive::hash();
         seed = hash_combine(seed, attrs.min_size);
@@ -72,9 +37,6 @@ struct generate_proposals
         seed = hash_combine(seed, attrs.post_nms_count);
         seed = hash_combine(seed, attrs.normalized);
         seed = hash_combine(seed, attrs.nms_eta);
-        seed = hash_combine(seed, roi_num_type);
-        seed = hash_combine(seed, output_rois_scores.empty());
-        seed = hash_combine(seed, output_rois_num.empty());
         return seed;
     }
 
@@ -90,47 +52,28 @@ struct generate_proposals
                cmp_fields(attrs.pre_nms_count) &&
                cmp_fields(attrs.post_nms_count) &&
                cmp_fields(attrs.normalized) &&
-               cmp_fields(attrs.nms_eta) &&
-               cmp_fields(roi_num_type) &&
-               cmp_fields(output_rois_scores.empty()) &&
-               cmp_fields(output_rois_num.empty());
+               cmp_fields(attrs.nms_eta);
         #undef cmp_fields
     }
 
     void save(BinaryOutputBuffer& ob) const override {
         primitive_base<generate_proposals>::save(ob);
-        ob << output_rois_scores;
-        ob << output_rois_num;
         ob << attrs.min_size;
         ob << attrs.nms_threshold;
         ob << attrs.pre_nms_count;
         ob << attrs.post_nms_count;
         ob << attrs.normalized;
         ob << attrs.nms_eta;
-        ob << make_data(&roi_num_type, sizeof(data_types));
     }
 
     void load(BinaryInputBuffer& ib) override {
         primitive_base<generate_proposals>::load(ib);
-        ib >> output_rois_scores;
-        ib >> output_rois_num;
         ib >> attrs.min_size;
         ib >> attrs.nms_threshold;
         ib >> attrs.pre_nms_count;
         ib >> attrs.post_nms_count;
         ib >> attrs.normalized;
         ib >> attrs.nms_eta;
-        ib >> make_data(&roi_num_type, sizeof(data_types));
-    }
-
-protected:
-    std::vector<input_info> get_dependencies() const override {
-        std::vector<input_info> ret;
-        if (!output_rois_scores.empty())
-            ret.push_back(output_rois_scores);
-        if (!output_rois_num.empty())
-            ret.push_back(output_rois_num);
-        return ret;
     }
 };
 }  // namespace cldnn
diff --git a/src/plugins/intel_gpu/include/intel_gpu/primitives/matrix_nms.hpp b/src/plugins/intel_gpu/include/intel_gpu/primitives/matrix_nms.hpp
index 475922183b24a1..2543c9ef131f1e 100644
--- a/src/plugins/intel_gpu/include/intel_gpu/primitives/matrix_nms.hpp
+++ b/src/plugins/intel_gpu/include/intel_gpu/primitives/matrix_nms.hpp
@@ -1,4 +1,4 @@
-// Copyright (C) 2022 Intel Corporation
+// Copyright (C) 2022-2024 Intel Corporation
 // SPDX-License-Identifier: Apache-2.0
 //
 
@@ -23,15 +23,6 @@ struct matrix_nms : public primitive_base<matrix_nms> {
     /// @param second_output primitive id.
     /// @param third_output primitive id.
     /// @param attrs operation attributes.
-    matrix_nms(const primitive_id& id,
-               const input_info& boxes,
-               const input_info& scores,
-               const input_info& second_output,
-               const input_info& third_output,
-               const ov::op::v8::MatrixNms::Attributes& attrs)
-        : primitive_base(id, {boxes, scores, second_output, third_output}),
-          attribs(attrs) {}
-
     matrix_nms(const primitive_id& id,
                const input_info& boxes,
                const input_info& scores,
diff --git a/src/plugins/intel_gpu/include/intel_gpu/primitives/multiclass_nms.hpp b/src/plugins/intel_gpu/include/intel_gpu/primitives/multiclass_nms.hpp
index 910d57021bbddd..89a95f9cd4d065 100644
--- a/src/plugins/intel_gpu/include/intel_gpu/primitives/multiclass_nms.hpp
+++ b/src/plugins/intel_gpu/include/intel_gpu/primitives/multiclass_nms.hpp
@@ -19,28 +19,20 @@ struct multiclass_nms : public primitive_base<multiclass_nms> {
 
     multiclass_nms() : primitive_base("", {}) {}
 
+    /// @brief Constructs multiclass_nms primitive
+    /// @param id This primitive id
+    /// @param boxes Boxes coordinates
+    /// @param scores Box scores
+    /// @param roisnum Number of boxes in each batch for MulticlassNMS-9 (empty string for MulticlassNMS-8)
+    /// @param attrs Attributes
     multiclass_nms(const primitive_id& id,
                    const std::vector<input_info> inputs,
-                   const ov::op::util::MulticlassNmsBase::Attributes& attrs)
+                   const ov::op::util::MulticlassNmsBase::Attributes& attrs,
+                   const padding& output_padding = {})
         : primitive_base{id, inputs},
-          attrs(attrs) {
-        // Legacy multi-output
-        if (inputs.size() == 5) {
-            output_selected_indices = inputs[InputIdx::OutputSelectedIndices].pid;
-            output_selected_num = inputs[InputIdx::OutputSelectedNum].pid;
-            has_roisnum = !inputs[InputIdx::RoisNum].pid.empty();
-            if (inputs[InputIdx::RoisNum].pid.empty()) {
-                this->input.erase(this->input.begin() + 2);
-            }
-        } else {
-            has_roisnum = inputs.size() == 3;
-        }
-    }
+          attrs(attrs) {}
 
-    primitive_id output_selected_indices{};
-    primitive_id output_selected_num{};
     ov::op::util::MulticlassNmsBase::Attributes attrs;
-    bool has_roisnum{false};
 
    size_t hash() const override {
         size_t seed = primitive::hash();
@@ -101,16 +93,6 @@ struct multiclass_nms : public primitive_base<multiclass_nms> {
         ib >> attrs.nms_eta;
     }
 
-protected:
-    std::vector<input_info> get_dependencies() const override {
-        std::vector<input_info> ret;
-        if (!output_selected_indices.empty())
-            ret.emplace_back(output_selected_indices);
-        if (!output_selected_num.empty())
-            ret.emplace_back(output_selected_num);
-        return ret;
-    }
-
 private:
     enum InputIdx : size_t {
         Boxes = 0,
diff --git a/src/plugins/intel_gpu/include/intel_gpu/primitives/non_max_suppression.hpp b/src/plugins/intel_gpu/include/intel_gpu/primitives/non_max_suppression.hpp
index b2497c6d711d7b..f18314386ebd25 100644
--- a/src/plugins/intel_gpu/include/intel_gpu/primitives/non_max_suppression.hpp
+++ b/src/plugins/intel_gpu/include/intel_gpu/primitives/non_max_suppression.hpp
@@ -4,7 +4,6 @@
 
 #pragma once
 #include "primitive.hpp"
-#include "intel_gpu/graph/serialization/string_serializer.hpp"
 
 #include <vector>
 
@@ -42,50 +41,25 @@ struct non_max_suppression : public primitive_base<non_max_suppression> {
     /// @param second_output Id of primitive specifying output for scores for each selected box.
     /// @param third_output Id of primitive specifying output for total number of selected boxes.
     non_max_suppression(const primitive_id& id,
-                        const input_info& boxes_positions,
-                        const input_info& boxes_score,
+                        const std::vector<input_info>& inputs,
                         int selected_indices_num,
                         bool center_point_box = false,
                         bool sort_result_descending = true,
-                        const primitive_id& num_select_per_class = primitive_id(),
-                        const primitive_id& iou_threshold = primitive_id(),
-                        const primitive_id& score_threshold = primitive_id(),
-                        const primitive_id& soft_nms_sigma = primitive_id(),
-                        const primitive_id& second_output = primitive_id(),
-                        const primitive_id& third_output = primitive_id(),
                         const size_t num_outputs = 1)
-        : primitive_base(id, {boxes_positions, boxes_score}, num_outputs, {optional_data_type()})
+        : primitive_base(id, inputs, num_outputs)
         , selected_indices_num(selected_indices_num)
         , center_point_box(center_point_box)
-        , sort_result_descending(sort_result_descending)
-        , num_select_per_class(num_select_per_class)
-        , iou_threshold(iou_threshold)
-        , score_threshold(score_threshold)
-        , soft_nms_sigma(soft_nms_sigma)
-        , second_output(second_output)
-        , third_output(third_output) {}
+        , sort_result_descending(sort_result_descending) {}
 
     int selected_indices_num;
     bool center_point_box;
     bool sort_result_descending;
-    primitive_id num_select_per_class;
-    primitive_id iou_threshold;
-    primitive_id score_threshold;
-    primitive_id soft_nms_sigma;
-    primitive_id second_output;
-    primitive_id third_output;
     Rotation rotation{Rotation::NONE};
 
     size_t hash() const override {
         size_t seed = primitive::hash();
         seed = hash_combine(seed, center_point_box);
         seed = hash_combine(seed, sort_result_descending);
-        seed = hash_combine(seed, num_select_per_class.empty());
-        seed = hash_combine(seed, iou_threshold.empty());
-        seed = hash_combine(seed, score_threshold.empty());
-        seed = hash_combine(seed, soft_nms_sigma.empty());
-        seed = hash_combine(seed, second_output.empty());
-        seed = hash_combine(seed, third_output.empty());
         seed = hash_combine(seed, rotation);
         return seed;
     }
@@ -100,45 +74,15 @@ struct non_max_suppression : public primitive_base<non_max_suppression> {
         return cmp_fields(selected_indices_num) &&
                cmp_fields(center_point_box) &&
                cmp_fields(sort_result_descending) &&
-               cmp_fields(num_select_per_class.empty()) &&
-               cmp_fields(iou_threshold.empty()) &&
-               cmp_fields(score_threshold.empty()) &&
-               cmp_fields(soft_nms_sigma.empty()) &&
-               cmp_fields(second_output.empty()) &&
-               cmp_fields(third_output.empty()) &&
                cmp_fields(rotation);
         #undef cmp_fields
     }
 
-    std::vector<input_info> get_dependencies() const override {
-        std::vector<input_info> ret;
-        if (!num_select_per_class.empty())
-            ret.push_back(num_select_per_class);
-        if (!iou_threshold.empty())
-            ret.push_back(iou_threshold);
-        if (!score_threshold.empty())
-            ret.push_back(score_threshold);
-        if (!soft_nms_sigma.empty())
-            ret.push_back(soft_nms_sigma);
-        if (!second_output.empty())
-            ret.push_back(second_output);
-        if (!third_output.empty())
-            ret.push_back(third_output);
-
-        return ret;
-    }
-
     void save(BinaryOutputBuffer& ob) const override {
         primitive_base<non_max_suppression>::save(ob);
         ob << selected_indices_num;
         ob << center_point_box;
         ob << sort_result_descending;
-        ob << num_select_per_class;
-        ob << iou_threshold;
-        ob << score_threshold;
-        ob << soft_nms_sigma;
-        ob << second_output;
-        ob << third_output;
         ob << make_data(&rotation, sizeof(rotation));
     }
 
@@ -147,12 +91,6 @@ struct non_max_suppression : public primitive_base<non_max_suppression> {
         ib >> selected_indices_num;
         ib >> center_point_box;
         ib >> sort_result_descending;
-        ib >> num_select_per_class;
-        ib >> iou_threshold;
-        ib >> score_threshold;
-        ib >> soft_nms_sigma;
-        ib >> second_output;
-        ib >> third_output;
         ib >> make_data(&rotation, sizeof(rotation));
     }
 };
diff --git a/src/plugins/intel_gpu/include/intel_gpu/primitives/one_hot.hpp b/src/plugins/intel_gpu/include/intel_gpu/primitives/one_hot.hpp
index c66bbedc80ee0c..7dbe6f062094fe 100644
--- a/src/plugins/intel_gpu/include/intel_gpu/primitives/one_hot.hpp
+++ b/src/plugins/intel_gpu/include/intel_gpu/primitives/one_hot.hpp
@@ -35,25 +35,6 @@ struct one_hot : public primitive_base<one_hot> {
 
     one_hot() : primitive_base("", {}) {}
 
-    /// @brief Constructs one-hot primitive layer.
-    /// @param id              An identifier of new primitive.
-    /// @param input           An identifier of primitive which is an input for newly created one-hot primitive.
-    /// @param shape           Size of the output primitive.
-    /// @param one_hot_axis    One-hot axis position (0-based, from left to right) in shape.
-    one_hot(const primitive_id& id,
-            const input_info& input,
-            const tensor& shape,
-            const int64_t& one_hot_axis,
-            const int64_t& depth,
-            const float& on_value = 1.0f,
-            const float& off_value = 0.0f)
-        : primitive_base(id, {input})
-        , shape(shape)
-        , one_hot_axis(one_hot_axis)
-        , depth(depth)
-        , on_value(on_value)
-        , off_value(off_value) {}
-
     /// @brief Constructs one-hot primitive layer.
     /// @param id              An identifier of new primitive.
     /// @param input           An identifier of primitive which is an input for newly created one-hot primitive.
@@ -62,21 +43,17 @@ struct one_hot : public primitive_base<one_hot> {
     /// @param one_hot_axis    One-hot axis position (0-based, from left to right) in shape.
     one_hot(const primitive_id& id,
             const input_info& input,
-            const tensor& shape,
             const data_types output_dt,
             const int64_t& one_hot_axis,
             const int64_t& depth,
             const float& on_value = 1.0f,
             const float& off_value = 0.0f)
         : primitive_base(id, {input}, 1, {optional_data_type{output_dt}})
-        , shape(shape)
         , one_hot_axis(one_hot_axis)
         , depth(depth)
         , on_value(on_value)
         , off_value(off_value) {}
 
-    /// @brief Output size reference.
-    tensor shape;
     /// @brief One-hot axis position in output shape (0-based, from left to right).
     int64_t one_hot_axis = 0;
     /// @brief The number of classes and thus the size of the one-hot dimension
@@ -108,7 +85,6 @@ struct one_hot : public primitive_base<one_hot> {
 
     void save(BinaryOutputBuffer& ob) const override {
         primitive_base<one_hot>::save(ob);
-        ob << shape;
         ob << one_hot_axis;
         ob << depth;
         ob << on_value;
@@ -117,7 +93,6 @@ struct one_hot : public primitive_base<one_hot> {
 
     void load(BinaryInputBuffer& ib) override {
         primitive_base<one_hot>::load(ib);
-        ib >> shape;
         ib >> one_hot_axis;
         ib >> depth;
         ib >> on_value;
diff --git a/src/plugins/intel_gpu/include/intel_gpu/primitives/pooling.hpp b/src/plugins/intel_gpu/include/intel_gpu/primitives/pooling.hpp
index 5cecc8638b19c9..689713d5871948 100644
--- a/src/plugins/intel_gpu/include/intel_gpu/primitives/pooling.hpp
+++ b/src/plugins/intel_gpu/include/intel_gpu/primitives/pooling.hpp
@@ -57,8 +57,7 @@ struct pooling : public primitive_base<pooling> {
           pads_begin(pads_begin),
           pads_end(pads_end),
           auto_pad(auto_pad),
-          rounding_type(rounding_type),
-          with_output_size(false) {}
+          rounding_type(rounding_type) {}
 
     /// @brief Constructs pooling primitive with known output shape.
     /// @param id This primitive id.
@@ -84,9 +83,7 @@ struct pooling : public primitive_base<pooling> {
           pads_begin(pads_begin),
           pads_end(pads_end),
           auto_pad(ov::op::PadType::EXPLICIT),
-          rounding_type(ov::op::RoundingType::CEIL),
-          with_output_size(true),
-          output_size(output_size) {}
+          rounding_type(ov::op::RoundingType::CEIL) {}
 
     /// @brief Constructs pooling primitive that supports MaxPool features from opset8 (dilation and indices output).
     /// @param id This primitive id.
@@ -112,7 +109,6 @@ struct pooling : public primitive_base<pooling> {
             ov::op::RoundingType rounding_type,
             int64_t axis,
             data_types index_element_type,
-            tensor output_size,
             const data_types output_data_type)
             : primitive_base(id, {input, indices_output}, 1, {optional_data_type{output_data_type}}),
               indices_output(indices_output.pid),
@@ -125,8 +121,6 @@ struct pooling : public primitive_base<pooling> {
               auto_pad(auto_pad),
               rounding_type(rounding_type),
               axis(axis),
-              with_output_size(true),
-              output_size(output_size),
               index_element_type(index_element_type),
               maxPoolOpset8Features(true) {}
 
@@ -150,10 +144,6 @@ struct pooling : public primitive_base<pooling> {
     ov::op::RoundingType rounding_type = ov::op::RoundingType::CEIL;
     /// @brief first dimension of input that should be used to calculate the upper bound of index output.
     int64_t axis = 0;
-    /// @brief Indicates that the primitive has user-defined output size (non-zero value).
-    bool with_output_size = true;
-    /// @brief User-defined output data size of the primitive (w/o padding).
-    tensor output_size;
     /// @brief type of index output
     data_types index_element_type = data_types::i32;
     bool maxPoolOpset8Features{false};
@@ -209,8 +199,6 @@ struct pooling : public primitive_base<pooling> {
         ob << make_data(&auto_pad, sizeof(ov::op::PadType));
         ob << make_data(&rounding_type, sizeof(ov::op::RoundingType));
         ob << axis;
-        ob << with_output_size;
-        ob << output_size;
         ob << make_data(&index_element_type, sizeof(data_types));
         ob << maxPoolOpset8Features;
     }
@@ -227,8 +215,6 @@ struct pooling : public primitive_base<pooling> {
         ib >> make_data(&auto_pad, sizeof(ov::op::PadType));
         ib >> make_data(&rounding_type, sizeof(ov::op::RoundingType));
         ib >> axis;
-        ib >> with_output_size;
-        ib >> output_size;
         ib >> make_data(&index_element_type, sizeof(data_types));
         ib >> maxPoolOpset8Features;
     }
diff --git a/src/plugins/intel_gpu/include/intel_gpu/primitives/reverse.hpp b/src/plugins/intel_gpu/include/intel_gpu/primitives/reverse.hpp
index aaa11b219d76d8..45ec3f43e1a435 100644
--- a/src/plugins/intel_gpu/include/intel_gpu/primitives/reverse.hpp
+++ b/src/plugins/intel_gpu/include/intel_gpu/primitives/reverse.hpp
@@ -6,9 +6,9 @@
 
 #include "primitive.hpp"
 
-namespace cldnn {
+#include "openvino/op/reverse.hpp"
 
-enum class reverse_mode : uint32_t { index, mask };
+namespace cldnn {
 
 struct reverse : public primitive_base<reverse> {
     CLDNN_DECLARE_PRIMITIVE(reverse)
@@ -23,11 +23,11 @@ struct reverse : public primitive_base<reverse> {
     reverse(const primitive_id& id,
             const input_info& input,
             const input_info& axes,
-            const reverse_mode mode)
+            const ov::op::v1::Reverse::Mode& mode)
         : primitive_base{id, {input, axes}},
           mode{mode} {}
 
-    reverse_mode mode{reverse_mode::index};
+    ov::op::v1::Reverse::Mode mode;
 
     size_t hash() const override {
         size_t seed = primitive::hash();
@@ -46,12 +46,12 @@ struct reverse : public primitive_base<reverse> {
 
     void save(BinaryOutputBuffer& ob) const override {
         primitive_base<reverse>::save(ob);
-        ob << make_data(&mode, sizeof(reverse_mode));
+        ob << make_data(&mode, sizeof(ov::op::v1::Reverse::Mode));
     }
 
     void load(BinaryInputBuffer& ib) override {
         primitive_base<reverse>::load(ib);
-        ib >> make_data(&mode, sizeof(reverse_mode));
+        ib >> make_data(&mode, sizeof(ov::op::v1::Reverse::Mode));
     }
 };
 }  // namespace cldnn
diff --git a/src/plugins/intel_gpu/include/intel_gpu/primitives/roll.hpp b/src/plugins/intel_gpu/include/intel_gpu/primitives/roll.hpp
index 671c60e57688bf..8b9a8f4a888ecc 100644
--- a/src/plugins/intel_gpu/include/intel_gpu/primitives/roll.hpp
+++ b/src/plugins/intel_gpu/include/intel_gpu/primitives/roll.hpp
@@ -15,16 +15,6 @@ struct roll : primitive_base<roll> {
 
     roll() : primitive_base("", {}) {}
 
-    /// @brief Constructs roll primitive.
-    /// @param id This primitive id.
-    /// @param input Input primitive id.
-    /// @param shift Tensor which specifies the number of places by which the elements are shifted.
-    roll(const primitive_id& id,
-         const input_info& input,
-         const tensor& shift)
-        : primitive_base(id, {input}),
-          shift(shift) {}
-
     /// @brief Constructs roll primitive for dynamic shape.
     /// @param id This primitive id.
     /// @param input Input primitive id.
@@ -37,16 +27,12 @@ struct roll : primitive_base<roll> {
         : primitive_base(id, {input}),
           raw_shift(raw_shift), raw_axes(raw_axes) {}
 
-    /// @brief Tensor which specifies the number of places by which the elements are shifted.
-    tensor shift;
-
     /// @brief Raw shift/axes vector to calculate normalized shift when input shape becomes static
     std::vector<int32_t> raw_shift;
     std::vector<int32_t> raw_axes;
 
     size_t hash() const override {
         size_t seed = primitive::hash();
-        seed = hash_combine(seed, shift.hash());
         seed = hash_range(seed, raw_shift.begin(), raw_shift.end());
         seed = hash_range(seed, raw_axes.begin(), raw_axes.end());
         return seed;
@@ -58,19 +44,20 @@ struct roll : primitive_base<roll> {
 
         auto rhs_casted = downcast<const roll>(rhs);
 
-        return shift == rhs_casted.shift &&
-               raw_shift == rhs_casted.raw_shift &&
+        return raw_shift == rhs_casted.raw_shift &&
                raw_axes == rhs_casted.raw_axes;
     }
 
     void save(BinaryOutputBuffer& ob) const override {
         primitive_base<roll>::save(ob);
-        ob << shift;
+        ob << raw_shift;
+        ob << raw_axes;
     }
 
     void load(BinaryInputBuffer& ib) override {
         primitive_base<roll>::load(ib);
-        ib >> shift;
+        ib >> raw_shift;
+        ib >> raw_axes;
     }
 };
 
diff --git a/src/plugins/intel_gpu/include/intel_gpu/primitives/space_to_batch.hpp b/src/plugins/intel_gpu/include/intel_gpu/primitives/space_to_batch.hpp
index 900804883f1a64..abe1e8643dcc9e 100644
--- a/src/plugins/intel_gpu/include/intel_gpu/primitives/space_to_batch.hpp
+++ b/src/plugins/intel_gpu/include/intel_gpu/primitives/space_to_batch.hpp
@@ -3,6 +3,7 @@
 //
 
 #pragma once
+#include "intel_gpu/runtime/utils.hpp"
 #include "primitive.hpp"
 
 namespace cldnn {
@@ -47,38 +48,33 @@ struct space_to_batch : public primitive_base<space_to_batch> {
     /// @param out_size Size of output tensor.
     space_to_batch(const primitive_id& id,
                    const input_info& input,
-                   const tensor& block_shape,
-                   const tensor& pads_begin,
-                   const tensor& pads_end,
-                   const tensor& out_size)
+                   const std::vector<int32_t>& block_shape,
+                   const std::vector<int32_t>& pads_begin,
+                   const std::vector<int32_t>& pads_end)
         : primitive_base(id, {input}),
           block_shape(block_shape),
           pads_begin(pads_begin),
           pads_end(pads_end),
-          out_size(out_size),
           shape_constant(1) {}
 
     space_to_batch(const primitive_id& id,
-                   const std::vector<input_info>& inputs,
-                   const tensor& out_size)
+                   const std::vector<input_info>& inputs)
         : primitive_base(id, inputs),
-          block_shape(tensor()),
-          pads_begin(tensor()),
-          pads_end(tensor()),
-          out_size(out_size),
+          block_shape({}),
+          pads_begin({}),
+          pads_end({}),
           shape_constant(0) {}
 
-    tensor block_shape;
-    tensor pads_begin;
-    tensor pads_end;
-    tensor out_size;
+    std::vector<int32_t> block_shape;
+    std::vector<int32_t> pads_begin;
+    std::vector<int32_t> pads_end;
     int64_t shape_constant;
 
     size_t hash() const override {
         size_t seed = primitive::hash();
-        seed = hash_combine(seed, block_shape.hash());
-        seed = hash_combine(seed, pads_begin.hash());
-        seed = hash_combine(seed, pads_end.hash());
+        seed = hash_range(seed, block_shape.begin(), block_shape.end());
+        seed = hash_range(seed, pads_begin.begin(), pads_begin.end());
+        seed = hash_range(seed, pads_end.begin(), pads_end.end());
         seed = hash_combine(seed, shape_constant);
         return seed;
     }
@@ -100,7 +96,6 @@ struct space_to_batch : public primitive_base<space_to_batch> {
         ob << block_shape;
         ob << pads_begin;
         ob << pads_end;
-        ob << out_size;
         ob << shape_constant;
     }
 
@@ -109,7 +104,6 @@ struct space_to_batch : public primitive_base<space_to_batch> {
         ib >> block_shape;
         ib >> pads_begin;
         ib >> pads_end;
-        ib >> out_size;
         ib >> shape_constant;
     }
 };
diff --git a/src/plugins/intel_gpu/include/intel_gpu/primitives/swiglu.hpp b/src/plugins/intel_gpu/include/intel_gpu/primitives/swiglu.hpp
index 0aa30c619e65a7..7be2f98338a886 100644
--- a/src/plugins/intel_gpu/include/intel_gpu/primitives/swiglu.hpp
+++ b/src/plugins/intel_gpu/include/intel_gpu/primitives/swiglu.hpp
@@ -26,20 +26,17 @@ struct swiglu : public primitive_base<swiglu> {
            const int64_t& axis,
            const int64_t& split_lengths,
            const ov::intel_gpu::op::SwiGLU::GluType glu_type,
-           const size_t split_to_glu_idx,
-           const tensor output_size)
+           const size_t split_to_glu_idx)
            : primitive_base(id, {input}),
              axis(axis),
              split_lengths(split_lengths),
              glu_type(glu_type),
-             split_to_glu_idx(split_to_glu_idx),
-             output_size(output_size) {}
+             split_to_glu_idx(split_to_glu_idx) {}
 
     int64_t axis = 0;
     int64_t split_lengths = 0;
     ov::intel_gpu::op::SwiGLU::GluType glu_type = ov::intel_gpu::op::SwiGLU::GluType::Swish;
     size_t split_to_glu_idx = 0;
-    tensor output_size;
 
     size_t hash() const override {
         size_t seed = primitive::hash();
@@ -63,7 +60,6 @@ struct swiglu : public primitive_base<swiglu> {
         primitive_base<swiglu>::save(ob);
         ob << axis;
         ob << split_lengths;
-        ob << output_size;
         ob << make_data(&glu_type, sizeof(glu_type));
         ob << split_to_glu_idx;
     }
@@ -72,7 +68,6 @@ struct swiglu : public primitive_base<swiglu> {
         primitive_base<swiglu>::load(ib);
         ib >> axis;
         ib >> split_lengths;
-        ib >> output_size;
         ib >> make_data(&glu_type, sizeof(glu_type));
         ib >> split_to_glu_idx;
     }
diff --git a/src/plugins/intel_gpu/include/intel_gpu/runtime/internal_properties.hpp b/src/plugins/intel_gpu/include/intel_gpu/runtime/internal_properties.hpp
index febcabd57efba0..6a8da44dca315d 100644
--- a/src/plugins/intel_gpu/include/intel_gpu/runtime/internal_properties.hpp
+++ b/src/plugins/intel_gpu/include/intel_gpu/runtime/internal_properties.hpp
@@ -45,7 +45,6 @@ static constexpr Property<bool, PropertyMutability::RW> enable_memory_pool{"GPU_
 static constexpr Property<bool, PropertyMutability::RW> optimize_data{"GPU_OPTIMIZE_DATA"};
 static constexpr Property<bool, PropertyMutability::RW> allow_static_input_reorder{"GPU_ALLOW_STATIC_INPUT_REORDER"};
 static constexpr Property<bool, PropertyMutability::RW> partial_build_program{"GPU_PARTIAL_BUILD"};
-static constexpr Property<bool, PropertyMutability::RW> allow_new_shape_infer{"GPU_ALLOW_NEW_SHAPE_INFER"};
 static constexpr Property<bool, PropertyMutability::RW> use_only_static_kernels_for_dynamic_shape{"GPU_USE_ONLY_STATIC_KERNELS_FOR_DYNAMIC_SHAPE"};
 static constexpr Property<std::string, PropertyMutability::RW> dump_graphs{"GPU_DUMP_GRAPHS"};
 static constexpr Property<std::vector<std::string>, PropertyMutability::RW> custom_outputs{"GPU_CUSTOM_OUTPUTS"};
diff --git a/src/plugins/intel_gpu/src/graph/activation.cpp b/src/plugins/intel_gpu/src/graph/activation.cpp
index 6c1a57f8759478..e356bee74855a7 100644
--- a/src/plugins/intel_gpu/src/graph/activation.cpp
+++ b/src/plugins/intel_gpu/src/graph/activation.cpp
@@ -12,35 +12,6 @@
 namespace cldnn {
 GPU_DEFINE_PRIMITIVE_TYPE_ID(activation)
 
-layout activation_inst::calc_output_layout(activation_node const& node, kernel_impl_params const& impl_param) {
-    assert(static_cast<bool>(impl_param.desc->output_data_types[0]) == false &&
-           "Output data type forcing is not supported for activation_node!");
-
-    auto input_node_layout = impl_param.get_non_padded_input_layout();
-    auto desc = impl_param.typed_desc<activation>();
-    auto func = desc->activation_function;
-
-    std::vector<activation_func> activations_int8 = {
-        activation_func::none,
-        activation_func::negative,
-        activation_func::negation,
-        activation_func::relu,
-        activation_func::floor,
-        activation_func::clamp };
-
-    if (input_node_layout.data_type == data_types::i8 || input_node_layout.data_type == data_types::u8 ||
-        input_node_layout.data_type == data_types::i32) {
-        if (std::find(activations_int8.begin(), activations_int8.end(), func) == activations_int8.end())
-            CLDNN_ERROR_MESSAGE(desc->id, "Requested activation is not supported for integer type.");
-    }
-
-    if (impl_param.has_fused_primitives()) {
-        input_node_layout.data_type = impl_param.get_output_element_type();
-    }
-
-    return input_node_layout;
-}
-
 std::string activation_inst::to_string(activation_node const& node) {
     auto node_info = node.desc_to_json();
     auto desc = node.get_primitive();
diff --git a/src/plugins/intel_gpu/src/graph/adaptive_pooling.cpp b/src/plugins/intel_gpu/src/graph/adaptive_pooling.cpp
index f003d1a44b62a2..a86486adb4fc00 100644
--- a/src/plugins/intel_gpu/src/graph/adaptive_pooling.cpp
+++ b/src/plugins/intel_gpu/src/graph/adaptive_pooling.cpp
@@ -13,12 +13,6 @@
 namespace cldnn {
 GPU_DEFINE_PRIMITIVE_TYPE_ID(adaptive_pooling)
 
-layout adaptive_pooling_inst::calc_output_layout(adaptive_pooling_node const& node, kernel_impl_params const& impl_param) {
-    const auto data_layout = impl_param.get_input_layout();
-    const auto prim = impl_param.typed_desc<adaptive_pooling>();
-    return {data_layout.data_type, data_layout.format, prim->output_size};
-}
-
 template<typename ShapeType>
 std::vector<layout> adaptive_pooling_inst::calc_output_layouts(adaptive_pooling_node const& /*node*/, const kernel_impl_params& impl_param) {
     std::vector<layout> layouts;
diff --git a/src/plugins/intel_gpu/src/graph/arg_max_min.cpp b/src/plugins/intel_gpu/src/graph/arg_max_min.cpp
index 63df47850c061d..94f3fc4ef0d657 100644
--- a/src/plugins/intel_gpu/src/graph/arg_max_min.cpp
+++ b/src/plugins/intel_gpu/src/graph/arg_max_min.cpp
@@ -14,58 +14,6 @@
 namespace cldnn {
 GPU_DEFINE_PRIMITIVE_TYPE_ID(arg_max_min)
 
-layout arg_max_min_inst::calc_output_layout(arg_max_min_node const& node, kernel_impl_params const& impl_param) {
-    auto desc = impl_param.typed_desc<arg_max_min>();
-    auto input_layout = impl_param.get_input_layout();
-    bool values_first = desc->values_first;
-    data_types output_data_type;
-    data_types output_idx_type;
-    output_data_type = desc->output_data_types[0].value_or(input_layout.data_type);
-    if (impl_param.input_layouts.size() == 3) {
-        output_idx_type = impl_param.get_input_layout(2).data_type;
-    } else {
-        output_idx_type = *(desc->output_data_types[0]);
-    }
-    auto size_check = [&](size_t tensor_size) {
-        if (desc->input.size() == 1 && values_first)
-            return;
-        size_t max_size;
-        // lowest integer not representable in floating point type = 2^(mantissa_bits + 1) + 1
-        // https://stackoverflow.com/questions/3793838/which-is-the-first-integer-that-an-ieee-754-float-is-incapable-of-representing-e
-        if (output_idx_type == data_types::f32) {
-            max_size = (1 << std::numeric_limits<float>::digits);
-        } else if (output_idx_type == data_types::f16) {
-            // mantissa_bits for fp16 = 10
-            max_size = (1 << 11);
-        } else if (output_idx_type == data_types::u8) {
-            max_size = std::numeric_limits<uint8_t>::max();
-        } else if (output_idx_type == data_types::i32) {
-            max_size = std::numeric_limits<int32_t>::max();
-        } else {
-            max_size = std::numeric_limits<size_t>::max();
-        }
-
-        if (tensor_size > max_size) {
-            CLDNN_ERROR_GREATER_THAN(desc->id,
-                                     "Reduced tensor size",
-                                     tensor_size,
-                                     "Maximum output data type value",
-                                     max_size,
-                                     "Current output data type is unable to hold maximum index of a tensor.");
-        }
-    };
-    for (auto dim : input_layout.get_dims()) {
-        size_check(dim);
-    }
-    auto format = input_layout.format;
-    auto sizes = input_layout.get_dims();
-    if (desc->axis >= static_cast<int64_t>(sizes.size()) || desc->axis < 0) {
-        OPENVINO_THROW("Incorrect arg_max_min axis.");
-    }
-    sizes[desc->axis] = desc->top_k;
-    return layout{output_data_type, format, tensor(format::get_default_format(input_layout.get_rank()), sizes)};
-}
-
 template<typename ShapeType>
 std::vector<layout> arg_max_min_inst::calc_output_layouts(arg_max_min_node const& /*node*/, const kernel_impl_params& impl_param) {
     std::vector<layout> layouts;
diff --git a/src/plugins/intel_gpu/src/graph/assign.cpp b/src/plugins/intel_gpu/src/graph/assign.cpp
index 1e8e71dc34c988..3002172110d1da 100644
--- a/src/plugins/intel_gpu/src/graph/assign.cpp
+++ b/src/plugins/intel_gpu/src/graph/assign.cpp
@@ -15,10 +15,6 @@ assign_inst::typed_primitive_inst(network& network, const assign_node& node) :
     memory_state::variable{node.get_primitive()->variable_id, node.get_primitive()->user_specified_type} {
 }
 
-layout assign_inst::calc_output_layout(const assign_node& node, kernel_impl_params const& impl_param) {
-    return impl_param.typed_desc<assign>()->output_layout;
-}
-
 std::string assign_inst::to_string(const assign_node& node) {
     auto node_info = node.desc_to_json();
     json_composite assign_info;
diff --git a/src/plugins/intel_gpu/src/graph/batch_to_space.cpp b/src/plugins/intel_gpu/src/graph/batch_to_space.cpp
index c620b8e6c30f82..68031944f637d8 100644
--- a/src/plugins/intel_gpu/src/graph/batch_to_space.cpp
+++ b/src/plugins/intel_gpu/src/graph/batch_to_space.cpp
@@ -5,7 +5,6 @@
 #include "batch_to_space_inst.h"
 
 #include "primitive_type_base.h"
-#include "intel_gpu/runtime/error_handler.hpp"
 #include "json_object.h"
 #include <string>
 #include <vector>
@@ -15,68 +14,6 @@
 namespace cldnn {
 GPU_DEFINE_PRIMITIVE_TYPE_ID(batch_to_space)
 
-layout batch_to_space_inst::calc_output_layout(batch_to_space_node const& node, kernel_impl_params const& impl_param) {
-    auto desc = impl_param.typed_desc<batch_to_space>();
-
-    auto input_layout = impl_param.get_input_layout();
-    auto input_format = input_layout.format;
-
-    auto output_type = desc->output_data_types[0].value_or(input_layout.data_type);
-
-    if (impl_param.has_fused_primitives())
-        output_type = impl_param.get_output_element_type();
-
-    const size_t spatial_num = format::spatial_num(input_format);
-
-    const auto& block_shape = desc->block_shape;
-    const auto& crops_begin = desc->crops_begin;
-    const auto& crops_end = desc->crops_end;
-
-    if (block_shape.batch[0] != 1)
-        CLDNN_ERROR_MESSAGE(desc->id,
-            "block_shape[0] is expected to be 1. Actual block_shape[0] is " +
-            std::to_string(block_shape.batch[0]));
-
-    if (crops_begin.batch[0] != 0)
-        CLDNN_ERROR_MESSAGE(desc->id,
-            "crops_begin[0] is expected to be 0. Actual crops_begin[0] is " +
-            std::to_string(crops_begin.batch[0]));
-
-    if (crops_end.batch[0] != 0)
-        CLDNN_ERROR_MESSAGE(desc->id,
-            "crops_end[0] is expected to be 0. Actual crops_end[0] is " +
-            std::to_string(crops_end.batch[0]));
-
-    size_t block_sizes_multiplied = block_shape.feature[0];
-    for (size_t i = 0; i < spatial_num; ++i)
-        block_sizes_multiplied *= block_shape.spatial[i];
-
-    if (input_layout.batch() % block_sizes_multiplied != 0)
-        CLDNN_ERROR_MESSAGE(desc->id,
-            "The batch of the input tensor must be divisible by multiplied block sizes = " +
-            std::to_string(block_sizes_multiplied));
-
-    if (crops_begin.feature[0] + crops_end.feature[0] >= block_shape.feature[0] * input_layout.feature())
-            CLDNN_ERROR_MESSAGE(desc->id,
-                "Output dimensions must be positive");
-
-    for (size_t i = 0; i < spatial_num; ++i)
-        if (crops_begin.spatial[i] + crops_end.spatial[i] >= block_shape.spatial[i] * input_layout.spatial(i))
-            CLDNN_ERROR_MESSAGE(desc->id,
-                "Output dimensions must be positive");
-
-    return layout{output_type, input_format, desc->out_size};
-}
-
-static std::vector<int32_t> tensor_to_vec(const tensor& t, const format f) {
-    std::vector<int32_t> vec(cldnn::format::dimension(f));
-    for (size_t i = 0; i < vec.size(); ++i) {
-        vec[i] = t.sizes()[i];
-    }
-    std::reverse(vec.begin() + 2, vec.end());
-    return vec;
-}
-
 template<typename ShapeType>
 std::vector<layout> batch_to_space_inst::calc_output_layouts(batch_to_space_node const& /*node*/, const kernel_impl_params& impl_param) {
     auto desc = impl_param.typed_desc<batch_to_space>();
@@ -114,13 +51,9 @@ std::vector<layout> batch_to_space_inst::calc_output_layouts(batch_to_space_node
 
     std::unordered_map<size_t, ov::Tensor> const_data;
     if (desc->shape_constant) {
-        auto block_sizes = tensor_to_vec(block_data, input0_format);
-        auto begin_sizes = tensor_to_vec(begin_data, input0_format);
-        auto end_sizes = tensor_to_vec(end_data, input0_format);
-
-        auto block_values = static_cast<void*>(block_sizes.data());
-        auto begin_values = static_cast<void*>(begin_sizes.data());
-        auto end_values = static_cast<void*>(end_sizes.data());
+        auto block_values = static_cast<void*>(block_data.data());
+        auto begin_values = static_cast<void*>(begin_data.data());
+        auto end_values = static_cast<void*>(end_data.data());
 
         auto block_tensor = make_tensor({ block_shape, data_types::i32, input0_format }, block_values);
         auto begin_tensor = make_tensor({ begin_shape, data_types::i32, input0_format }, begin_values);
diff --git a/src/plugins/intel_gpu/src/graph/border.cpp b/src/plugins/intel_gpu/src/graph/border.cpp
index 09bf9f7d71f591..3e23b326415652 100644
--- a/src/plugins/intel_gpu/src/graph/border.cpp
+++ b/src/plugins/intel_gpu/src/graph/border.cpp
@@ -15,23 +15,6 @@
 namespace cldnn {
 GPU_DEFINE_PRIMITIVE_TYPE_ID(border)
 
-layout border_inst::calc_output_layout(border_node const& node, kernel_impl_params const& impl_param) {
-    assert(static_cast<bool>(impl_param.desc->output_data_types[0]) == false &&
-           "Output data type forcing is not supported for border_node!");
-    auto input_layout = impl_param.get_input_layout();
-    auto input_format = input_layout.format;
-    auto desc = impl_param.typed_desc<border>();
-
-    auto dims_format = format::adjust_to_rank(format::bfyx, input_layout.get_rank());
-    auto new_dims = input_layout.get_dims();
-
-    for (size_t i = 0; i < new_dims.size(); ++i) {
-        new_dims[i] += (i < desc->pads_begin.size()) ? desc->pads_begin[i] : 0;
-        new_dims[i] += (i < desc->pads_end.size()) ? desc->pads_end[i] : 0;
-    }
-    return layout{ input_layout.data_type, input_format, tensor(dims_format, new_dims) };
-}
-
 template<typename ShapeType>
 std::vector<layout> border_inst::calc_output_layouts(border_node const& /*node*/, const kernel_impl_params& impl_param) {
     auto desc = impl_param.typed_desc<border>();
diff --git a/src/plugins/intel_gpu/src/graph/broadcast.cpp b/src/plugins/intel_gpu/src/graph/broadcast.cpp
index 741a3ad8a30661..3f32f05dc17ad7 100644
--- a/src/plugins/intel_gpu/src/graph/broadcast.cpp
+++ b/src/plugins/intel_gpu/src/graph/broadcast.cpp
@@ -5,7 +5,6 @@
 #include "broadcast_inst.h"
 #include "broadcast_shape_inference.hpp"
 
-#include "intel_gpu/runtime/error_handler.hpp"
 #include "json_object.h"
 #include "primitive_type_base.h"
 #include <string>
@@ -15,33 +14,6 @@
 namespace cldnn {
 GPU_DEFINE_PRIMITIVE_TYPE_ID(broadcast)
 
-layout broadcast_inst::calc_output_layout(broadcast_node const& node, kernel_impl_params const& impl_param) {
-    assert(static_cast<bool>(impl_param.desc->output_data_types[0]) == false &&
-           "Output data type forcing is not supported for broadcast_node!");
-    auto input_layout = impl_param.get_input_layout();
-    auto desc = impl_param.typed_desc<broadcast>();
-
-    auto output_type = input_layout.data_type;
-    if (impl_param.has_fused_primitives()) {
-        output_type = impl_param.get_output_element_type();
-    }
-
-    if (!desc->target_shape.empty()) {
-        std::vector<tensor::value_type> dims_converted(desc->target_shape.size());
-        std::transform(desc->target_shape.begin(), desc->target_shape.end(), dims_converted.begin(), [](size_t value) {
-            return static_cast<tensor::value_type>(value);
-        });
-        for (size_t i = dims_converted.size(); i < 4; i++)
-            dims_converted.push_back(1);  // extend shape to 4d
-
-        return { output_type,
-                 input_layout.format,
-                 tensor(format::get_default_format(dims_converted.size()), dims_converted) };
-    } else {
-        return { output_type, input_layout.format, desc->broadcast_sizes };
-    }
-}
-
 template<typename ShapeType>
 std::vector<layout> broadcast_inst::calc_output_layouts(broadcast_node const& /*node*/, const kernel_impl_params& impl_param) {
     auto desc = impl_param.typed_desc<broadcast>();
@@ -86,6 +58,9 @@ std::vector<layout> broadcast_inst::calc_output_layouts(broadcast_node const& /*
         output_shapes = ov::op::v3::shape_infer(&op, input_shapes, ov::make_tensor_accessor(const_data));
     } else if (impl_param.input_layouts.size() == 1) {
         // predefined pattern shape
+        if (target_shape.empty()) {
+            target_shape.push_back(0); // add some value to vec to have not null ptr in tensor
+        }
         auto target_shape_tensor = make_tensor({pattern_shape, data_types::i64, format::bfyx}, static_cast<void*>(target_shape.data()));
         const_data.emplace(1, target_shape_tensor);
         output_shapes = ov::op::v3::shape_infer(&op, input_shapes, ov::make_tensor_accessor(const_data));
@@ -108,21 +83,13 @@ template std::vector<layout> broadcast_inst::calc_output_layouts<ov::PartialShap
 std::string broadcast_inst::to_string(broadcast_node const& node) {
     auto desc = node.get_primitive();
     auto node_info = node.desc_to_json();
-    const auto& broadcast_sizes = desc->broadcast_sizes;
-    const auto& broadcast_axes = desc->broadcast_axes;
     auto& input = node.input();
 
     std::stringstream primitive_description;
     std::stringstream ss_broadcast_axes;
-
-    for (size_t i = 0; i < broadcast_axes.size(); ++i) {
-        ss_broadcast_axes << broadcast_axes.at(i);
-        i != (broadcast_axes.size() - 1) ? ss_broadcast_axes << ", " : ss_broadcast_axes << "";
-    }
-
+    ss_broadcast_axes << desc->axes_mapping;
     json_composite broadcast_info;
     broadcast_info.add("input id", input.id());
-    broadcast_info.add("broadcast_sizes", broadcast_sizes.to_string());
     broadcast_info.add("broadcast axes", ss_broadcast_axes.str());
 
     node_info->add("broadcast info", broadcast_info);
@@ -150,63 +117,5 @@ void broadcast_inst::update_output_memory() {
     _mem_allocated = false;
 }
 
-broadcast_inst::typed_primitive_inst(network& network, broadcast_node const& node) : parent(network, node) {
-    auto input_layout = node.get_input_layout();
-    if (input_layout.is_dynamic())
-        return;
-    const auto& output_sizes = argument->broadcast_sizes;
-
-    std::vector<tensor::value_type> input_dims = input_layout.get_dims();
-    size_t max_axes_num = input_layout.get_rank();
-
-    std::vector<tensor::value_type> reordered_input_dims(max_axes_num, 0);
-    std::set<uint16_t> existing;
-
-    const auto& broadcast_axes = node.get_primitive()->broadcast_axes;
-    size_t broadcast_axes_size = broadcast_axes.size();
-    size_t index = 0;
-    size_t input_index = broadcast_axes_size;
-
-    OPENVINO_ASSERT(broadcast_axes_size >= 0 && broadcast_axes_size <= max_axes_num,
-                    "Incorrect parameters configuration: broadcast_axes size should be less or equal ", std::to_string(max_axes_num), ".");
-    for (size_t i = 0; i < broadcast_axes_size; ++i) {
-        if (broadcast_axes.at(i) >= max_axes_num) {
-            CLDNN_ERROR_MESSAGE(
-                node.id(),
-                "Incorrect parameters configuration: broadcast_axes index should be within broadcast_sizes range.");
-        }
-        if (existing.find(broadcast_axes.at(i)) != existing.end()) {
-            CLDNN_ERROR_MESSAGE(
-                node.id(),
-                "Incorrect parameters configuration: Duplicate axes numbers was found in broadcast_axes.");
-        }
-        existing.insert(broadcast_axes.at(i));
-    }
-    for (size_t i = 0; i < input_index; ++i) {
-        CLDNN_ERROR_NOT_EQUAL(node.id(),
-                              "Input size on dimension number " + std::to_string(i),
-                              input_dims.at(i),
-                              "",
-                              1,
-                              "Must be equal 1.");
-    }
-    // bfyx, bfzyx format
-    for (size_t i = 0; i < max_axes_num; ++i) {
-        if (std::find(broadcast_axes.begin(), broadcast_axes.end(), i) != broadcast_axes.end()) {
-            reordered_input_dims.at(i) = input_dims.at(index);
-            ++index;
-        } else {
-            reordered_input_dims.at(i) = input_dims.at(input_index);
-            ++input_index;
-        }
-    }
-    tensor input_sizes_to_compare = tensor(format::get_default_format(reordered_input_dims.size()), reordered_input_dims);
-
-    CLDNN_ERROR_TENSOR_SIZES_NOT_DIVIDABLE(node.id(),
-                                           "Broadcast sizes",
-                                           output_sizes,
-                                           "input sizes",
-                                           input_sizes_to_compare,
-                                           "Invalid broadcast size: not dividable by input size");
-}
+broadcast_inst::typed_primitive_inst(network& network, broadcast_node const& node) : parent(network, node) { }
 }  // namespace cldnn
diff --git a/src/plugins/intel_gpu/src/graph/bucketize.cpp b/src/plugins/intel_gpu/src/graph/bucketize.cpp
index 7a0b673d693f46..d0dc9d53681009 100644
--- a/src/plugins/intel_gpu/src/graph/bucketize.cpp
+++ b/src/plugins/intel_gpu/src/graph/bucketize.cpp
@@ -13,12 +13,6 @@
 namespace cldnn {
 GPU_DEFINE_PRIMITIVE_TYPE_ID(bucketize)
 
-layout bucketize_inst::calc_output_layout(const bucketize_node& node, kernel_impl_params const& impl_param) {
-    auto input_layout = impl_param.get_input_layout();
-    auto primitive = impl_param.desc;
-    return {*primitive->output_data_types[0], input_layout.format, input_layout.get_tensor()};
-}
-
 std::string bucketize_inst::to_string(const bucketize_node& node) {
     auto primitive = node.get_primitive();
     json_composite bucketize_info;
diff --git a/src/plugins/intel_gpu/src/graph/concatenation.cpp b/src/plugins/intel_gpu/src/graph/concatenation.cpp
index b493bb217b1c32..6487eb5ef9dca3 100644
--- a/src/plugins/intel_gpu/src/graph/concatenation.cpp
+++ b/src/plugins/intel_gpu/src/graph/concatenation.cpp
@@ -15,35 +15,6 @@
 namespace cldnn {
 GPU_DEFINE_PRIMITIVE_TYPE_ID(concatenation)
 
-layout concatenation_inst::calc_output_layout(concatenation_node const& node, kernel_impl_params const& impl_param) {
-    auto desc = impl_param.typed_desc<concatenation>();
-
-    auto input_layout = impl_param.get_input_layout();
-    auto output_format = input_layout.format;
-    auto result_sizes = input_layout.get_dims();
-
-    auto output_dt = desc->output_data_types[0].value_or(input_layout.data_type);
-    if (impl_param.has_fused_primitives()) {
-        output_dt = impl_param.get_output_element_type();
-    }
-
-    auto axis_index = desc->axis;
-
-    // calculate sum of features from all inputs
-    result_sizes[axis_index] = 0;
-    for (size_t i = 0; i < desc->input.size(); ++i) {
-        auto input_sizes = impl_param.get_input_layout(i).get_dims();
-        if (impl_param.get_input_layout(i).format == format::b_fs_yx_fsv16)
-            output_format = format::b_fs_yx_fsv16;
-
-        result_sizes[axis_index] += input_sizes[axis_index];
-    }
-
-    auto def_fmt = format::get_default_format(input_layout.get_rank());
-
-    return layout {output_dt, output_format, tensor(def_fmt, result_sizes)};
-}
-
 template<typename ShapeType>
 std::vector<layout> concatenation_inst::calc_output_layouts(const concatenation_node& /* node */, const kernel_impl_params& impl_param) {
     auto desc = impl_param.typed_desc<concatenation>();
diff --git a/src/plugins/intel_gpu/src/graph/condition.cpp b/src/plugins/intel_gpu/src/graph/condition.cpp
index 18717b9406cc30..faa985ef3c011b 100644
--- a/src/plugins/intel_gpu/src/graph/condition.cpp
+++ b/src/plugins/intel_gpu/src/graph/condition.cpp
@@ -45,34 +45,6 @@ static std::vector<layout> get_output_layouts(std::map<primitive_id, layout>&& o
     return out_layouts;
 }
 
-/*
-    Calc_output_layout method is called only when output layout is invalidated.
-    It means, that it is called when:
-    1) It has never been called.
-    2) Dependency has changed output layout.
-    In this both cases, we need to recalc branch_true and branch_false.
-    !* We can be sure, that this method was called AT LEAST once during graph compilation.*!
-*/
-layout condition_inst::calc_output_layout(condition_node const& /* node */, kernel_impl_params const& impl_param) {
-    OPENVINO_ASSERT(static_cast<bool>(impl_param.desc->output_data_types[0]) == false, "Output data type forcing is not supported for condition_node!");
-    OPENVINO_ASSERT(impl_param.get_input_layout(0).count() == 1, "layout of compare_data of condition should be {1,1,1,1}");
-
-    OPENVINO_ASSERT(impl_param.inner_progs.size() == 2, "If(Condition) contains incorrect number of inner programs ", impl_param.inner_progs.size());
-    OPENVINO_ASSERT(impl_param.io_output_maps.size() == 2, "If(Condition) contains incorrect number of io output maps ", impl_param.io_output_maps.size());
-
-    auto layouts_true  = get_output_layouts(get_out_layout_map(impl_param.inner_progs[idx_branch_true]),  impl_param.io_output_maps[idx_branch_true]);
-    auto layouts_false = get_output_layouts(get_out_layout_map(impl_param.inner_progs[idx_branch_false]), impl_param.io_output_maps[idx_branch_false]);
-
-    CLDNN_ERROR_LAYOUT_MISMATCH(impl_param.desc->id,
-                                "Branch true output layout",
-                                layouts_true[0],
-                                "branch false output layout",
-                                layouts_false[0],
-                                "Layout of the branches should be the same.");
-
-    return layouts_true[0];
-}
-
 template <class T>
 static bool convert_data(memory::ptr mem, stream& stream) {
     mem_lock<T, mem_lock_type::read> lock_data{mem, stream};
@@ -234,16 +206,10 @@ void condition_inst::update_output_layout() {
     _impl_params->memory_deps = memory_deps;
 
     auto new_layouts = _node->type()->calc_output_layouts(*_node, *_impl_params);
-    if (new_layouts.empty()) {
-        auto new_layout = _node->type()->calc_output_layout(*_node, *_impl_params);
-        new_layout.data_padding = padding::max(_node->get_primitive()->get_output_padding(0), new_layout.data_padding);
-        _impl_params->output_layouts[0] = new_layout;
-    } else {
-        for (size_t i = 0; i != new_layouts.size(); ++i) {
-            auto new_layout = new_layouts[i];
-            new_layout.data_padding = padding::max(_node->get_primitive()->get_output_padding(i), new_layout.data_padding);
-            _impl_params->output_layouts[i] = new_layout;
-        }
+    for (size_t i = 0; i != new_layouts.size(); ++i) {
+        auto new_layout = new_layouts[i];
+        new_layout.data_padding = padding::max(_node->get_primitive()->get_output_padding(i), new_layout.data_padding);
+        _impl_params->output_layouts[i] = new_layout;
     }
 }
 
diff --git a/src/plugins/intel_gpu/src/graph/convert_color.cpp b/src/plugins/intel_gpu/src/graph/convert_color.cpp
index ebe9211068e6d4..4c39833867c196 100644
--- a/src/plugins/intel_gpu/src/graph/convert_color.cpp
+++ b/src/plugins/intel_gpu/src/graph/convert_color.cpp
@@ -39,32 +39,6 @@ std::vector<layout> convert_color_inst::calc_output_layouts(convert_color_node c
 }
 template std::vector<layout> convert_color_inst::calc_output_layouts<ov::PartialShape>(convert_color_node const& node, const kernel_impl_params& impl_param);
 
-layout convert_color_inst::calc_output_layout(convert_color_node const& /* node */, kernel_impl_params const& impl_param) {
-    auto desc = impl_param.typed_desc<convert_color>();
-
-    auto src_fmt = desc->input_color_format;
-    auto dst_fmt = desc->output_color_format;
-    auto dst_is_rgb_or_bgr = dst_fmt == convert_color::color_format::BGR ||
-                             dst_fmt == convert_color::color_format::RGB;
-    auto inputs_count = desc->input_size();
-    bool single_plane_input = inputs_count == 1;
-    const size_t h_dim = 1;
-    const size_t c_dim = 3;
-    if ((src_fmt == convert_color::color_format::NV12 || src_fmt == convert_color::color_format::I420) && dst_is_rgb_or_bgr) {
-        auto out_layout = impl_param.get_input_layout(0);
-        out_layout.format = format::bfyx;
-        auto out_shape = out_layout.get_partial_shape();
-        out_shape[c_dim] = 3;
-        if (single_plane_input) {
-            out_shape[h_dim] = out_shape[h_dim] * 2 / 3;
-        }
-        out_layout.set_partial_shape(out_shape);
-
-        return out_layout;
-    }
-    OPENVINO_THROW("[GPU] Unsupported color format combinations");
-}
-
 std::string convert_color_inst::to_string(convert_color_node const& node) {
     auto desc = node.get_primitive();
     auto node_info = node.desc_to_json();
diff --git a/src/plugins/intel_gpu/src/graph/convolution.cpp b/src/plugins/intel_gpu/src/graph/convolution.cpp
index 04acd4b8305a34..36ccbac43bd1db 100644
--- a/src/plugins/intel_gpu/src/graph/convolution.cpp
+++ b/src/plugins/intel_gpu/src/graph/convolution.cpp
@@ -146,10 +146,6 @@ std::vector<layout> calc_output_layout_impl(convolution_node const& node, kernel
 namespace cldnn {
 GPU_DEFINE_PRIMITIVE_TYPE_ID(convolution)
 
-layout convolution_inst::calc_output_layout(convolution_node const& node, kernel_impl_params const& impl_param) {
-    return calc_output_layout_impl(node, impl_param, true)[0];
-}
-
 template<typename ShapeType>
 std::vector<layout> convolution_inst::calc_output_layouts(convolution_node const& node, kernel_impl_params const& impl_param) {
     return calc_output_layout_impl(node, impl_param, false);
diff --git a/src/plugins/intel_gpu/src/graph/crop.cpp b/src/plugins/intel_gpu/src/graph/crop.cpp
index 0fd733be570f88..dbb8508e808b44 100644
--- a/src/plugins/intel_gpu/src/graph/crop.cpp
+++ b/src/plugins/intel_gpu/src/graph/crop.cpp
@@ -16,29 +16,6 @@
 namespace cldnn {
 GPU_DEFINE_PRIMITIVE_TYPE_ID(crop)
 
-layout crop_inst::calc_output_layout(crop_node const& node, kernel_impl_params const& impl_param) {
-    assert(static_cast<bool>(impl_param.desc->output_data_types[0]) == false &&
-           "Output data type forcing is not supported for crop_node!");
-    auto desc = impl_param.typed_desc<crop>();
-    const auto& ref_in_sizes = desc->reference_input;
-    const auto in_layout = impl_param.get_input_layout();
-    const auto& in_sizes = in_layout.get_tensor();
-    const auto& offsets = desc->offsets;
-
-    // Check for borders variant of crop.
-    if (ref_in_sizes.batch[0] < 0 || ref_in_sizes.feature[0] < 0 || ref_in_sizes.spatial[0] < 0 ||
-        ref_in_sizes.spatial[1] < 0 || ref_in_sizes.spatial[2] < 0) {
-        // Ignore not supported dimensions.
-        const auto rb_sizes = ref_in_sizes.negate().sub({0, 0, 0, 0, 0});
-        const auto lt_sizes = offsets.sub({0, 0, 0, 0, 0});
-
-        const auto out_sizes = in_sizes - (rb_sizes + lt_sizes);
-
-        return layout({in_layout.data_type, in_layout.format, out_sizes});
-    }
-    return layout({in_layout.data_type, in_layout.format, ref_in_sizes});
-}
-
 template<typename ShapeType>
 std::vector<layout> crop_inst::calc_output_layouts(const crop_node& /*node*/, const kernel_impl_params& impl_param) {
     OPENVINO_ASSERT(static_cast<bool>(impl_param.desc->output_data_types[0]) == false,
@@ -269,7 +246,7 @@ void crop_inst::update_output_memory() {
     if (_node != nullptr)
         build_deps();
 
-    if (node->get_program().is_new_shape_infer() && input_memory_ptr() == nullptr)
+    if (input_memory_ptr() == nullptr)
         return;
 
     if (_outputs[0] && _network.get_engine().is_the_same_buffer(output_memory(), input_memory()))
diff --git a/src/plugins/intel_gpu/src/graph/ctc_greedy_decoder.cpp b/src/plugins/intel_gpu/src/graph/ctc_greedy_decoder.cpp
index af7a41b8b57fec..c63afb2cc6f2a2 100644
--- a/src/plugins/intel_gpu/src/graph/ctc_greedy_decoder.cpp
+++ b/src/plugins/intel_gpu/src/graph/ctc_greedy_decoder.cpp
@@ -13,14 +13,6 @@
 namespace cldnn {
 GPU_DEFINE_PRIMITIVE_TYPE_ID(ctc_greedy_decoder)
 
-layout ctc_greedy_decoder_inst::calc_output_layout(ctc_greedy_decoder_node const& node, kernel_impl_params const& impl_param) {
-    auto input_node_layout = impl_param.get_input_layout();
-    auto prim = impl_param.typed_desc<ctc_greedy_decoder>();
-    auto output_type = prim->output_data_types[0].value_or(input_node_layout.data_type);
-
-    return layout(output_type, input_node_layout.format, prim->output_tensor);
-}
-
 template<typename ShapeType>
 std::vector<layout> ctc_greedy_decoder_inst::calc_output_layouts(ctc_greedy_decoder_node const& /*node*/, const kernel_impl_params& impl_param) {
     std::vector<layout> layouts;
diff --git a/src/plugins/intel_gpu/src/graph/ctc_loss.cpp b/src/plugins/intel_gpu/src/graph/ctc_loss.cpp
index ec9e62ae545e1c..746c3efabe565c 100644
--- a/src/plugins/intel_gpu/src/graph/ctc_loss.cpp
+++ b/src/plugins/intel_gpu/src/graph/ctc_loss.cpp
@@ -20,13 +20,6 @@ std::vector<layout> ctc_loss_inst::calc_output_layouts(ctc_loss_node const& /*no
 
 template std::vector<layout> ctc_loss_inst::calc_output_layouts<ov::PartialShape>(ctc_loss_node const& node, const kernel_impl_params& impl_param);
 
-
-layout ctc_loss_inst::calc_output_layout(const ctc_loss_node& node, const kernel_impl_params& impl_param) {
-    auto input_layout = impl_param.get_input_layout();
-    std::vector<tensor::value_type> out_tensor = {input_layout.get_tensor().sizes().front(), 1, 1, 1};
-    return {input_layout.data_type, input_layout.format, tensor(input_layout.format, out_tensor)};
-}
-
 std::string ctc_loss_inst::to_string(const ctc_loss_node& node) {
     auto primitive = node.get_primitive();
     json_composite ctc_loss_info;
diff --git a/src/plugins/intel_gpu/src/graph/cum_sum.cpp b/src/plugins/intel_gpu/src/graph/cum_sum.cpp
index 6227b0cce4b561..e0a7fdc332c70f 100644
--- a/src/plugins/intel_gpu/src/graph/cum_sum.cpp
+++ b/src/plugins/intel_gpu/src/graph/cum_sum.cpp
@@ -11,10 +11,6 @@
 namespace cldnn {
 GPU_DEFINE_PRIMITIVE_TYPE_ID(cum_sum)
 
-layout cum_sum_inst::calc_output_layout(cum_sum_node const& node, kernel_impl_params const& impl_param) {
-    return impl_param.get_input_layout();
-}
-
 std::string cum_sum_inst::to_string(cum_sum_node const& node) {
     auto desc = node.get_primitive();
     auto node_info = node.desc_to_json();
diff --git a/src/plugins/intel_gpu/src/graph/deconvolution.cpp b/src/plugins/intel_gpu/src/graph/deconvolution.cpp
index dc6c2af30523d2..7085bea9b2fa1d 100644
--- a/src/plugins/intel_gpu/src/graph/deconvolution.cpp
+++ b/src/plugins/intel_gpu/src/graph/deconvolution.cpp
@@ -16,89 +16,6 @@ using namespace ov::intel_gpu;
 namespace cldnn {
 GPU_DEFINE_PRIMITIVE_TYPE_ID(deconvolution)
 
-layout deconvolution_inst::calc_output_layout(deconvolution_node const& node, kernel_impl_params const& impl_param) {
-    assert(static_cast<bool>(impl_param.desc->output_data_types[0]) == false &&
-           "Output data type forcing is not supported for deconvolution_node!");
-    auto desc = impl_param.typed_desc<deconvolution>();
-
-    auto input_layout = impl_param.get_input_layout();
-    auto weights_layout = *impl_param.weights_layout;
-    weights_layout = weights_layout.convert_to_weights_layout(desc->grouped_weights_shape);
-
-    auto data_type = input_layout.data_type;
-    if ((input_layout.data_type == data_types::i8 || input_layout.data_type == data_types::u8) && !impl_param.has_fused_primitives()) {
-        data_type = data_types::f32;
-    }
-
-    if (impl_param.has_fused_primitives()) {
-        data_type = impl_param.get_output_element_type();
-    }
-
-    auto pad = desc->pad;
-    auto strd = desc->stride;
-
-    int32_t number_of_features = weights_layout.group() * weights_layout.ofm();
-
-    format out_fmt = input_layout.format;
-    if (node.get_preferred_impl_type() == impl_types::onednn && node.get_preferred_output_fmt() != format::any) {
-        out_fmt = node.get_preferred_output_fmt();
-    }
-
-    if (desc->with_output_size) {
-        CLDNN_ERROR_LESS_OR_EQUAL_THAN(desc->id,
-                                       "User-defined output spatial X",
-                                       desc->output_size.spatial[0],
-                                       "value 0",
-                                       0,
-                                       "User-defined size of output layout must be positive (>= 1)");
-        CLDNN_ERROR_LESS_OR_EQUAL_THAN(desc->id,
-                                       "User-defined output spatial Y",
-                                       desc->output_size.spatial[1],
-                                       "value 0",
-                                       0,
-                                       "User-defined size of output layout must be positive (>= 1)");
-        CLDNN_ERROR_LESS_OR_EQUAL_THAN(desc->id,
-                                       "User-defined output spatial Z",
-                                       desc->output_size.spatial[2],
-                                       "value 0",
-                                       0,
-                                       "User-defined size of output layout must be positive (>= 1)");
-
-        tensor output_size(input_layout.batch(),
-                           number_of_features,
-                           desc->output_size.spatial[0],
-                           desc->output_size.spatial[1],
-                           desc->output_size.spatial[2]);
-        return {data_type, out_fmt, output_size};
-    }
-
-    int32_t off_factor = -2;
-    size_t spatial_dims = input_layout.get_spatial_rank();
-    CLDNN_ERROR_GREATER_THAN(desc->id,
-                             "number of spatial dimensions",
-                             spatial_dims,
-                             "expected number of dimensions",
-                             3,
-                             "As for now, deconvolutions with more than 3 dimensions are not supported");
-
-    int32_t x = static_cast<int32_t>(
-        off_factor * pad[pad.size() - 1] + (input_layout.spatial(0) - 1) * strd[strd.size() - 1] + weights_layout.spatial(0));
-    int32_t y = 1;
-    if (spatial_dims > 1) {
-        y = static_cast<int32_t>(
-            off_factor * pad[pad.size() - 2] + (input_layout.spatial(1) - 1) * strd[strd.size() - 2] + weights_layout.spatial(1));
-    }
-    int32_t z = 1;
-    if (spatial_dims > 2) {
-        z = static_cast<int32_t>(
-            off_factor * pad[pad.size() - 3] + (input_layout.spatial(2) - 1) * strd[strd.size() - 3] + weights_layout.spatial(2));
-    }
-
-    tensor output_size(input_layout.batch(),
-                       number_of_features, x, y, z);
-    return {data_type, out_fmt, output_size};
-}
-
 template<typename ShapeType>
 std::vector<layout> deconvolution_inst::calc_output_layouts(deconvolution_node const& node, const kernel_impl_params& impl_param) {
     auto desc = impl_param.typed_desc<deconvolution>();
diff --git a/src/plugins/intel_gpu/src/graph/depth_to_space.cpp b/src/plugins/intel_gpu/src/graph/depth_to_space.cpp
index 37f57c28215432..83f99fa8bfb875 100644
--- a/src/plugins/intel_gpu/src/graph/depth_to_space.cpp
+++ b/src/plugins/intel_gpu/src/graph/depth_to_space.cpp
@@ -13,41 +13,6 @@
 namespace cldnn {
 GPU_DEFINE_PRIMITIVE_TYPE_ID(depth_to_space)
 
-layout depth_to_space_inst::calc_output_layout(depth_to_space_node const& node, kernel_impl_params const& impl_param) {
-    auto desc = impl_param.typed_desc<depth_to_space>();
-
-    auto input_layout = impl_param.get_input_layout();
-    auto input_format = input_layout.format;
-
-    const size_t block_size = desc->block_size;
-
-    if (input_layout.feature() % (block_size * block_size) != 0)
-        CLDNN_ERROR_MESSAGE(
-            desc->id,
-            "The depth of the input tensor must be divisible by squared block size. Actual block size is " +
-                std::to_string(block_size));
-
-    auto out_size = input_layout.get_tensor();
-    if (format::spatial_num(input_layout.format) == 3) {
-        const size_t feature = input_layout.feature() / block_size / block_size / block_size;
-        const size_t z = input_layout.spatial(2) * block_size;
-        const size_t y = input_layout.spatial(1) * block_size;
-        const size_t x = input_layout.spatial(0) * block_size;
-        out_size = tensor(TensorValue(input_layout.batch()), TensorValue(feature), TensorValue(x), TensorValue(y), TensorValue(z));
-    } else {
-        const size_t feature = input_layout.feature() / block_size / block_size;
-        const size_t y = input_layout.spatial(1) * block_size;
-        const size_t x = input_layout.spatial(0) * block_size;
-        out_size = tensor(TensorValue(input_layout.batch()), TensorValue(feature), TensorValue(x), TensorValue(y));
-    }
-
-    if (impl_param.has_fused_primitives()) {
-        input_layout.data_type = impl_param.get_output_element_type();
-    }
-
-    return layout{input_layout.data_type, input_format, out_size};
-}
-
 template<typename ShapeType>
 std::vector<layout> depth_to_space_inst::calc_output_layouts(depth_to_space_node const& node, kernel_impl_params const& impl_param) {
     auto desc = impl_param.typed_desc<depth_to_space>();
diff --git a/src/plugins/intel_gpu/src/graph/detection_output.cpp b/src/plugins/intel_gpu/src/graph/detection_output.cpp
index 54af95978e0f31..85406b6c5bfc82 100644
--- a/src/plugins/intel_gpu/src/graph/detection_output.cpp
+++ b/src/plugins/intel_gpu/src/graph/detection_output.cpp
@@ -13,49 +13,6 @@
 namespace cldnn {
 GPU_DEFINE_PRIMITIVE_TYPE_ID(detection_output)
 
-layout detection_output_inst::calc_output_layout(detection_output_node const& node, kernel_impl_params const& impl_param) {
-    assert(static_cast<bool>(impl_param.desc->output_data_types[0]) == false &&
-           "Output data type forcing is not supported for "
-           "detection_output_node!");
-    auto desc = impl_param.typed_desc<detection_output>();
-    CLDNN_ERROR_NOT_EQUAL(desc->id,
-                          "Detection output layer input number",
-                          impl_param.input_layouts.size(),
-                          "expected number of inputs",
-                          static_cast<size_t>(3),
-                          "");
-
-    auto input_layout = impl_param.get_input_layout();
-
-    // Batch size and feature size are 1.
-    // Number of bounding boxes to be kept is set to keep_top_k*batch size.
-    // If number of detections is lower than top_k, will write dummy results at the end with image_id=-1.
-    // Each row is a 7 dimension vector, which stores:
-    // [image_id, label, confidence, xmin, ymin, xmax, ymax]
-    int output_size = static_cast<int>(input_layout.get_linear_size()) / PRIOR_BOX_SIZE;
-    int num_classes = desc->num_classes;
-
-    if (desc->share_location) {
-        num_classes = (desc->background_label_id == 0) ? desc->num_classes - 1
-                                                       : desc->num_classes;
-        output_size *= num_classes;
-    }
-
-    if (desc->top_k != -1) {
-        int top_k = desc->top_k * num_classes * input_layout.batch();
-        if (top_k < output_size) {
-            output_size = top_k;
-        }
-    }
-
-    output_size *= DETECTION_OUTPUT_ROW_SIZE;
-    // Add space for number of output results per image - needed in the next detection output step
-    output_size += ((input_layout.batch() + 15) / 16) * 16;
-
-    return {input_layout.data_type, cldnn::format::bfyx,
-            cldnn::tensor(1, 1, DETECTION_OUTPUT_ROW_SIZE, desc->keep_top_k * input_layout.batch())};
-}
-
 template<typename ShapeType>
 std::vector<layout> detection_output_inst::calc_output_layouts(detection_output_node const& node, kernel_impl_params const& impl_param) {
     auto desc = impl_param.typed_desc<detection_output>();
diff --git a/src/plugins/intel_gpu/src/graph/dft.cpp b/src/plugins/intel_gpu/src/graph/dft.cpp
index f044ce53f4e165..d0f4eb32c03302 100644
--- a/src/plugins/intel_gpu/src/graph/dft.cpp
+++ b/src/plugins/intel_gpu/src/graph/dft.cpp
@@ -13,32 +13,6 @@
 namespace cldnn {
 GPU_DEFINE_PRIMITIVE_TYPE_ID(dft)
 
-layout dft_inst::calc_output_layout(dft_node const& node, kernel_impl_params const& impl_param) {
-    const auto primitive = impl_param.typed_desc<dft>();
-    const auto input_layout = impl_param.get_input_layout();
-
-    std::vector<tensor::value_type> dims_converted(primitive->output_shape.size());
-    std::transform(primitive->output_shape.begin(),
-                   primitive->output_shape.end(),
-                   dims_converted.begin(),
-                   [](size_t value) {
-                       return static_cast<int>(value);
-                   });
-
-    // Extend shape to 4d by pushing ones at the end (needed to support less than 4d cases)
-    for (auto i = dims_converted.size(); i < 4; ++i) {
-        auto it = dims_converted.end();
-        // For IRDFT push ones at the end, for other DTFs push ones before the last dim
-        if (primitive->direction != dft_direction::inverse || primitive->mode != dft_mode::real) {
-            it = std::prev(it);
-        }
-        dims_converted.insert(it, 1);
-    }
-
-    const auto output_format = format::adjust_to_rank(input_layout.format, dims_converted.size());
-    return {input_layout.data_type, output_format, tensor(output_format, dims_converted)};
-}
-
 template<typename ShapeType>
 std::vector<layout> dft_inst::calc_output_layouts(dft_node const& /*node*/, kernel_impl_params const& impl_param) {
     std::vector<layout> layouts;
diff --git a/src/plugins/intel_gpu/src/graph/eltwise.cpp b/src/plugins/intel_gpu/src/graph/eltwise.cpp
index a370e8ba260f8b..bde2d1f376d366 100644
--- a/src/plugins/intel_gpu/src/graph/eltwise.cpp
+++ b/src/plugins/intel_gpu/src/graph/eltwise.cpp
@@ -29,92 +29,6 @@ const std::set<eltwise_mode>
                                     eltwise_mode::is_inf,
                                     eltwise_mode::is_nan };
 
-layout eltwise_inst::calc_output_layout(eltwise_node const& node, kernel_impl_params const& impl_param) {
-    size_t primary_input_idx = 0;
-    if (node.input(primary_input_idx).is_constant()) {
-        for (size_t i = 1; i < node.get_dependencies().size(); i++) {
-            if (!node.input(i).is_constant()) {
-                primary_input_idx = i;
-                break;
-            }
-        }
-    }
-    auto input_node_layout = impl_param.get_non_padded_input_layout(primary_input_idx);
-    auto desc = impl_param.typed_desc<eltwise>();
-    auto output_type = desc->output_data_types[0].value_or(input_node_layout.data_type);
-
-    auto size = input_node_layout.get_tensor();
-    auto format = input_node_layout.format;
-    for (size_t i = 0; i < desc->input_size(); i++) {
-        if (i == primary_input_idx)
-            continue;
-
-        auto l = impl_param.get_non_padded_input_layout(i);
-        size = tensor::max(size, l.get_tensor());
-        if (l.format == format::b_fs_zyx_fsv16)  // use optimized 5D
-            format = format::b_fs_zyx_fsv16;
-        else if (l.format == format::bs_fs_zyx_bsv16_fsv16)
-            format = format::bs_fs_zyx_bsv16_fsv16;
-    }
-    auto output_layout = layout(output_type, format, size);
-
-    auto mode = desc->mode;
-    // list of operations supported for integer types
-    if (input_node_layout.data_type == data_types::i8 || input_node_layout.data_type == data_types::u8 ||
-        input_node_layout.data_type == data_types::i32 || input_node_layout.data_type == data_types::i64) {
-        std::vector<eltwise_mode> eltwise_int_modes = {eltwise_mode::sum,
-                                                       eltwise_mode::sub,
-                                                       eltwise_mode::prod,
-                                                       eltwise_mode::div,
-                                                       eltwise_mode::min,
-                                                       eltwise_mode::max,
-                                                       eltwise_mode::mod,
-                                                       eltwise_mode::eq,
-                                                       eltwise_mode::ne,
-                                                       eltwise_mode::lt,
-                                                       eltwise_mode::le,
-                                                       eltwise_mode::gt,
-                                                       eltwise_mode::ge,
-                                                       eltwise_mode::squared_diff,
-                                                       eltwise_mode::floor_mod,
-                                                       eltwise_mode::logic_and,
-                                                       eltwise_mode::logic_or,
-                                                       eltwise_mode::logic_xor,
-                                                       eltwise_mode::right_shift,
-                                                       eltwise_mode::left_shift,
-                                                       eltwise_mode::bitwise_and,
-                                                       eltwise_mode::bitwise_or,
-                                                       eltwise_mode::bitwise_xor};
-        if (std::find(eltwise_int_modes.begin(), eltwise_int_modes.end(), mode) == eltwise_int_modes.end())
-            CLDNN_ERROR_MESSAGE(desc->id, "Requested eltwise mode is not supported for integer types.");
-    }
-
-    // Logic and comparison operations should return i8 for any inputs
-    if (eltwise::eltwise_bool_modes.find(mode) != eltwise::eltwise_bool_modes.end()) {
-        output_layout.data_type = data_types::i8;
-    }
-
-    if (desc->output_data_types[0]) {
-        output_layout.data_type = *desc->output_data_types[0];
-    }
-
-    if (node.has_fused_primitives()) {
-        output_layout.data_type = impl_param.get_output_element_type();
-    }
-
-    if (!desc->stride.empty()) {
-        auto new_size = input_node_layout.get_tensor();
-        // we can safely use only first stride, since we're using first input, and input / stride should give exact same
-        // value for every input
-        new_size.spatial[0] = (input_node_layout.spatial(0) - 1) / desc->stride[0].spatial[0] + 1;
-        new_size.spatial[1] = (input_node_layout.spatial(1) - 1) / desc->stride[0].spatial[1] + 1;
-        new_size.spatial[2] = (input_node_layout.spatial(2) - 1) / desc->stride[0].spatial[2] + 1;
-        input_node_layout.set_tensor(new_size);
-        return input_node_layout;
-    }
-    return output_layout;
-}
-
 template<typename ShapeType>
 std::vector<layout> eltwise_inst::calc_output_layouts(eltwise_node const& /*node*/, kernel_impl_params const& impl_param) {
     auto desc = impl_param.typed_desc<eltwise>();
@@ -393,18 +307,13 @@ eltwise_inst::typed_primitive_inst(network& network, eltwise_node const& node) :
                                       "");
         }
     } else {
-        bool use_new_shape_infer = network.get_config().get_property(ov::intel_gpu::allow_new_shape_infer);
         auto input0_pshape = node.get_input_pshape(0);
 
         for (size_t i = 1; i < inputs_count; ++i) {
             auto input_pshape = node.get_input_pshape(i);
 
             if (input0_pshape.size() > input_pshape.size()) {
-                if (use_new_shape_infer) {
-                    input_pshape.insert(input_pshape.begin(), input0_pshape.size() - input_pshape.size(), 1);
-                } else {
-                    input_pshape.insert(input_pshape.end(), input0_pshape.size() - input_pshape.size(), 1);
-                }
+                input_pshape.insert(input_pshape.begin(), input0_pshape.size() - input_pshape.size(), 1);
             }
 
             auto base_pshape = input0_pshape;
diff --git a/src/plugins/intel_gpu/src/graph/embedding_bag.cpp b/src/plugins/intel_gpu/src/graph/embedding_bag.cpp
index 1e16b108ef72f3..fe436070ae5866 100644
--- a/src/plugins/intel_gpu/src/graph/embedding_bag.cpp
+++ b/src/plugins/intel_gpu/src/graph/embedding_bag.cpp
@@ -61,17 +61,6 @@ std::vector<layout> embedding_bag_inst::calc_output_layouts(embedding_bag_node c
 
 template std::vector<layout> embedding_bag_inst::calc_output_layouts<ov::PartialShape>(embedding_bag_node const& node, const kernel_impl_params& impl_param);
 
-layout embedding_bag_inst::calc_output_layout(embedding_bag_node const& node, kernel_impl_params const& impl_param) {
-    auto desc = impl_param.typed_desc<embedding_bag>();
-
-    auto input_layout = impl_param.get_input_layout();
-    auto output_format = input_layout.format;
-
-    auto output_shape = desc->output_shape;
-
-    return layout(input_layout.data_type, output_format, output_shape);
-}
-
 std::string embedding_bag_inst::to_string(embedding_bag_node const& node) {
     auto desc = node.get_primitive();
     auto node_info = node.desc_to_json();
diff --git a/src/plugins/intel_gpu/src/graph/experimental_detectron_detection_output.cpp b/src/plugins/intel_gpu/src/graph/experimental_detectron_detection_output.cpp
index 4d6a090e77bdc8..eacd8940873417 100644
--- a/src/plugins/intel_gpu/src/graph/experimental_detectron_detection_output.cpp
+++ b/src/plugins/intel_gpu/src/graph/experimental_detectron_detection_output.cpp
@@ -33,14 +33,6 @@ template std::vector<layout>
 experimental_detectron_detection_output_inst::calc_output_layouts<ov::PartialShape>(
         experimental_detectron_detection_output_node const& node, const kernel_impl_params& impl_param);
 
-layout experimental_detectron_detection_output_inst::calc_output_layout(
-    const experimental_detectron_detection_output_node& node, kernel_impl_params const& impl_param) {
-    const layout data_layout = impl_param.get_input_layout();
-    auto desc = impl_param.typed_desc<experimental_detectron_detection_output>();
-
-    return layout(data_layout.data_type, data_layout.format, {static_cast<int>(desc->max_detections_per_image), 4, 1, 1});
-}
-
 std::string experimental_detectron_detection_output_inst::to_string(
     const experimental_detectron_detection_output_node& node) {
     auto desc = node.get_primitive();
diff --git a/src/plugins/intel_gpu/src/graph/experimental_detectron_generate_proposal_single_image.cpp b/src/plugins/intel_gpu/src/graph/experimental_detectron_generate_proposal_single_image.cpp
index b538e001427be7..99520ccfb253a1 100644
--- a/src/plugins/intel_gpu/src/graph/experimental_detectron_generate_proposal_single_image.cpp
+++ b/src/plugins/intel_gpu/src/graph/experimental_detectron_generate_proposal_single_image.cpp
@@ -31,14 +31,6 @@ template std::vector<layout>
 experimental_detectron_generate_proposals_single_image_inst::calc_output_layouts<ov::PartialShape>(
     experimental_detectron_generate_proposals_single_image_node const& node, const kernel_impl_params& impl_param);
 
-layout experimental_detectron_generate_proposals_single_image_inst::calc_output_layout(
-        const experimental_detectron_generate_proposals_single_image_node& node, kernel_impl_params const& impl_param) {
-    const layout data_layout = impl_param.get_input_layout();
-    auto desc = impl_param.typed_desc<experimental_detectron_generate_proposals_single_image>();
-
-    return layout(data_layout.data_type, data_layout.format, {static_cast<int>(desc->post_nms_count), 4, 1, 1});
-}
-
 std::string experimental_detectron_generate_proposals_single_image_inst::to_string(
         const experimental_detectron_generate_proposals_single_image_node& node) {
     auto desc = node.get_primitive();
diff --git a/src/plugins/intel_gpu/src/graph/experimental_detectron_prior_grid_generator.cpp b/src/plugins/intel_gpu/src/graph/experimental_detectron_prior_grid_generator.cpp
index 2e0e5c0a1e2fec..3a24d8cb47cd0f 100644
--- a/src/plugins/intel_gpu/src/graph/experimental_detectron_prior_grid_generator.cpp
+++ b/src/plugins/intel_gpu/src/graph/experimental_detectron_prior_grid_generator.cpp
@@ -31,24 +31,6 @@ template std::vector<layout>
 experimental_detectron_prior_grid_generator_inst::calc_output_layouts<ov::PartialShape>(
         experimental_detectron_prior_grid_generator_node const& node, const kernel_impl_params& impl_param);
 
-layout experimental_detectron_prior_grid_generator_inst::calc_output_layout(
-    const experimental_detectron_prior_grid_generator_node& node, kernel_impl_params const& impl_param) {
-    const layout data_layout = impl_param.get_input_layout();
-    auto desc = impl_param.typed_desc<experimental_detectron_prior_grid_generator>();
-    if (desc->flatten) {
-        return layout(data_layout.data_type,
-                      format::bfyx,
-                      {static_cast<int>(desc->featmap_width * desc->featmap_height * data_layout.batch()), 4, 1, 1});
-    } else {
-        return layout(data_layout.data_type,
-                      format::bfyx,
-                      {static_cast<int>(desc->featmap_height),
-                       static_cast<int>(desc->featmap_width),
-                       4,
-                       static_cast<int>(data_layout.batch())});
-    }
-}
-
 std::string experimental_detectron_prior_grid_generator_inst::to_string(
     experimental_detectron_prior_grid_generator_node const& node) {
     auto node_info = node.desc_to_json();
diff --git a/src/plugins/intel_gpu/src/graph/experimental_detectron_roi_feature_extractor.cpp b/src/plugins/intel_gpu/src/graph/experimental_detectron_roi_feature_extractor.cpp
index 1c09fcb7cc7d4b..881b281457320b 100644
--- a/src/plugins/intel_gpu/src/graph/experimental_detectron_roi_feature_extractor.cpp
+++ b/src/plugins/intel_gpu/src/graph/experimental_detectron_roi_feature_extractor.cpp
@@ -14,22 +14,15 @@ size_t experimental_detectron_roi_feature_extractor_inst::inputs_memory_count()
     return parent::inputs_memory_count() - 1;
 }
 
-memory::ptr experimental_detectron_roi_feature_extractor_inst::second_output_memory() const {
-    if (desc()->num_outputs == 1) {
-        return input_memory_ptr(parent::inputs_memory_count() - 1);
-    } else {
-        return output_memory_ptr(1);
-    }
-}
-
 memory::ptr experimental_detectron_roi_feature_extractor_inst::rois_memory() const {
     return input_memory_ptr(0);
 }
 
 void experimental_detectron_roi_feature_extractor_inst::copy_rois_input_to_second_output() const {
-    second_output_memory()->copy_from(get_network().get_stream(), *rois_memory());
+    output_memory_ptr(1)->copy_from(get_network().get_stream(), *rois_memory());
 }
 
+
 template<typename ShapeType>
 std::vector<layout> experimental_detectron_roi_feature_extractor_inst::calc_output_layouts(
         experimental_detectron_roi_feature_extractor_node const& /*node*/, const kernel_impl_params& impl_param) {
@@ -49,19 +42,6 @@ template std::vector<layout>
 experimental_detectron_roi_feature_extractor_inst::calc_output_layouts<ov::PartialShape>(
         experimental_detectron_roi_feature_extractor_node const& node, const kernel_impl_params& impl_param);
 
-layout experimental_detectron_roi_feature_extractor_inst::calc_output_layout(
-    experimental_detectron_roi_feature_extractor_node const& node, kernel_impl_params const& impl_param) {
-    assert(static_cast<bool>(impl_param.desc->output_data_types[0]) == false &&
-           "Output data type forcing is not supported for roi_pooling_node!");
-    layout rois_layout = impl_param.get_input_layout(0);
-    layout data_layout = impl_param.get_input_layout(1);
-    int num_rois = rois_layout.batch();
-    int num_channels = data_layout.feature();
-    auto desc = impl_param.typed_desc<experimental_detectron_roi_feature_extractor>();
-
-    return layout(data_layout.data_type, format::bfyx, {num_rois, num_channels, desc->output_dim, desc->output_dim});
-}
-
 std::string experimental_detectron_roi_feature_extractor_inst::to_string(experimental_detectron_roi_feature_extractor_node const& node) {
     auto desc = node.get_primitive();
 
diff --git a/src/plugins/intel_gpu/src/graph/experimental_detectron_topk_rois.cpp b/src/plugins/intel_gpu/src/graph/experimental_detectron_topk_rois.cpp
index 4626cbd8f27f3a..7d6885fc7f5ac5 100644
--- a/src/plugins/intel_gpu/src/graph/experimental_detectron_topk_rois.cpp
+++ b/src/plugins/intel_gpu/src/graph/experimental_detectron_topk_rois.cpp
@@ -27,17 +27,6 @@ template std::vector<layout>
 experimental_detectron_topk_rois_inst::calc_output_layouts<ov::PartialShape>(
     experimental_detectron_topk_rois_node const& node, const kernel_impl_params& impl_param);
 
-layout experimental_detectron_topk_rois_inst::calc_output_layout(
-    experimental_detectron_topk_rois_node const &node, kernel_impl_params const& impl_param) {
-    auto input_layout = impl_param.get_input_layout();
-    auto desc = impl_param.typed_desc<experimental_detectron_topk_rois>();
-
-    int32_t roi_num = std::min(input_layout.get_tensor().sizes()[0], static_cast<int32_t>(desc->max_rois));
-
-    return {input_layout.data_type, input_layout.format,  {roi_num,
-                                                                 input_layout.get_tensor().sizes()[1], 1, 1 }};
-}
-
 std::string experimental_detectron_topk_rois_inst::to_string(experimental_detectron_topk_rois_node const &node) {
     auto node_info = node.desc_to_json();
     json_composite experimental_detectron_topk_rois_info;
diff --git a/src/plugins/intel_gpu/src/graph/extract_image_patches.cpp b/src/plugins/intel_gpu/src/graph/extract_image_patches.cpp
index aff15321da2e1d..b155c7917522e8 100644
--- a/src/plugins/intel_gpu/src/graph/extract_image_patches.cpp
+++ b/src/plugins/intel_gpu/src/graph/extract_image_patches.cpp
@@ -29,16 +29,6 @@ std::vector<layout> extract_image_patches_inst::calc_output_layouts(extract_imag
 template std::vector<layout>
 extract_image_patches_inst::calc_output_layouts<ov::PartialShape>(extract_image_patches_node const& node, const kernel_impl_params& impl_param);
 
-layout extract_image_patches_inst::calc_output_layout(extract_image_patches_node const& node, kernel_impl_params const& impl_param) {
-    auto desc = impl_param.typed_desc<extract_image_patches>();
-
-    auto input_layout = impl_param.get_input_layout();
-    auto input_format = input_layout.format;
-
-    auto output_shape = desc->output_shape;
-    return layout(input_layout.data_type, input_format, output_shape);
-}
-
 std::string extract_image_patches_inst::to_string(extract_image_patches_node const& node) {
     auto desc = node.get_primitive();
     auto node_info = node.desc_to_json();
diff --git a/src/plugins/intel_gpu/src/graph/eye.cpp b/src/plugins/intel_gpu/src/graph/eye.cpp
index 3715fbf619c1eb..fbbff319609eb2 100644
--- a/src/plugins/intel_gpu/src/graph/eye.cpp
+++ b/src/plugins/intel_gpu/src/graph/eye.cpp
@@ -2,8 +2,8 @@
 // SPDX-License-Identifier: Apache-2.0
 //
 
-#include <eye_inst.h>
 #include "openvino/op/eye.hpp"
+#include <eye_inst.h>
 #include "eye_shape_inference.hpp"
 #include <json_object.h>
 
@@ -42,11 +42,6 @@ std::vector<layout> eye_inst::calc_output_layouts(eye_node const& /*node*/, cons
 
 template std::vector<layout> eye_inst::calc_output_layouts<ov::PartialShape>(eye_node const& node, const kernel_impl_params& impl_param);
 
-layout eye_inst::calc_output_layout(eye_node const& node, const kernel_impl_params&) {
-    auto primitive = node.get_primitive();
-    return {*(primitive->output_data_types[0]), node.get_input_layout().format, primitive->output_shape};
-}
-
 std::string eye_inst::to_string(eye_node const& node) {
     auto node_info = node.desc_to_json();
     json_composite eye_info;
diff --git a/src/plugins/intel_gpu/src/graph/fully_connected.cpp b/src/plugins/intel_gpu/src/graph/fully_connected.cpp
index d0820a119d5468..d1e6955391f913 100644
--- a/src/plugins/intel_gpu/src/graph/fully_connected.cpp
+++ b/src/plugins/intel_gpu/src/graph/fully_connected.cpp
@@ -13,128 +13,6 @@
 namespace cldnn {
 GPU_DEFINE_PRIMITIVE_TYPE_ID(fully_connected)
 
-namespace {
-bool is_batch_after_spatial(const std::string order) {
-    bool spatial_found = false;
-    for (auto c : order) {
-        switch (c) {
-            case 'b':
-            case 'n':
-                return spatial_found;
-
-            case 'x':
-            case 'y':
-            case 'z':
-            case 'w':
-            case 's':
-                spatial_found = true;
-                break;
-
-            default:
-                break;
-        }
-    }
-    return false;
-}
-
-format::type get_preferred_format(fully_connected_node const& node, const kernel_impl_params& impl_param) {
-    if (node.get_preferred_impl_type() == impl_types::onednn && node.get_preferred_output_fmt() != format::any) {
-        return node.get_preferred_output_fmt();
-    }
-
-    auto input_layout = impl_param.get_input_layout();
-
-    // for 3d output we have to chose bfyx format
-    if (impl_param.typed_desc<fully_connected>()->input_size == 3)
-        return format::bfyx;
-
-    if (data_type_traits::is_floating_point(input_layout.data_type) &&
-        (is_batch_after_spatial(input_layout.format.order()) ||
-         input_layout.format == format::bs_f_bsv16 ||
-         input_layout.format == format::bs_fs_fsv8_bsv8))
-        return format::yxfb;
-
-    bool no_spatial_padding = true;
-    // C++ 11 range loop shouldn't be used here because of incorrect iterator functionality in mutable_array_ref<>
-    for (size_t i = 0; i < input_layout.get_spatial_rank(); ++i) {
-        no_spatial_padding &= (input_layout.data_padding._lower_size[2 + i] == 0);
-    }
-    for (size_t i = 0; i < input_layout.get_spatial_rank(); ++i) {
-        no_spatial_padding &= (input_layout.data_padding._upper_size[2 + i] == 0);
-    }
-
-    if (input_layout.data_type == data_types::f32 &&
-        input_layout.format == format::bfyx &&
-        no_spatial_padding &&
-        input_layout.batch() != 8)
-        return format::bfyx;
-
-    auto input_pitches = input_layout.get_pitches();
-    if (input_layout.data_type == data_types::f16 &&
-        input_layout.format == format::bfyx &&
-        no_spatial_padding &&
-        input_pitches[0] % 2 == 0 &&
-        input_layout.batch() != 16)
-        return format::bfyx;
-
-    // this condition tests whether our input is batch>1 in bfyx format, if yes there will be
-    // extra reorder between input and this fc from bfyx to yxfb format (so
-    // "is_batch_after_spatial" should return true)
-    if (data_type_traits::is_floating_point(input_layout.data_type) &&
-        input_layout.format == format::bfyx &&
-        input_layout.batch() > 1)
-        return format::yxfb;
-
-    return format::bfyx;
-}
-
-}  // namespace
-
-layout fully_connected_inst::calc_output_layout(fully_connected_node const& node, kernel_impl_params const& impl_param) {
-    auto desc = impl_param.typed_desc<fully_connected>();
-
-    auto input_layout = impl_param.get_input_layout();
-    auto input_pshape = input_layout.get_partial_shape();
-    auto weights_layout = *impl_param.weights_layout;
-    auto weights_pshape = weights_layout.get_partial_shape();
-    auto output_type = desc->output_data_types[0].value_or(input_layout.data_type);
-    if (data_type_traits::is_i8_u8(input_layout.data_type) && desc->output_data_types[0])
-        output_type = *desc->output_data_types[0];
-
-    if (impl_param.has_fused_primitives()) {
-        output_type = impl_param.get_output_element_type();
-    }
-
-    auto reshape_to_2d = [](const ov::PartialShape& shape, int64_t feature) {
-        auto staticShape = shape.to_shape();
-        size_t total = std::accumulate(staticShape.begin(), staticShape.end(), static_cast<size_t>(1), std::multiplies<size_t>());
-        std::vector<int64_t> reshapeSize = { static_cast<int64_t>(total) / feature, feature };
-        return reshapeSize;
-    };
-
-    int64_t feature = input_pshape[std::min(desc->input_size, static_cast<size_t>(4)) - 1].get_length();
-    if (desc->input_size == 3) {
-        feature = std::max({input_layout.spatial(0), input_layout.spatial(1), input_layout.spatial(2)});
-    }
-
-    if (desc->input_size > 4) {
-       input_layout.set_partial_shape(reshape_to_2d(input_pshape, feature));
-    }
-    if (weights_pshape.size() != 2) {
-        weights_layout.set_partial_shape(reshape_to_2d(weights_pshape, feature));
-    }
-
-    auto output_size = tensor(input_layout.batch(), weights_layout.batch(), 1, 1);
-    if (desc->input_size == 3) {
-        output_size = tensor(input_layout.batch(), input_layout.feature(), 1, weights_layout.batch());
-    } else if (desc->input_size == 4) {
-        output_size = tensor(input_layout.batch(), input_layout.feature(), weights_layout.batch(), input_layout.spatial(1));
-    }
-    format output_format = get_preferred_format(node, impl_param);
-
-    return layout(output_type, output_format, output_size);
-}
-
 template<typename ShapeType>
 std::vector<layout> fully_connected_inst::calc_output_layouts(fully_connected_node const& node, const kernel_impl_params& impl_param) {
     auto desc = impl_param.typed_desc<fully_connected>();
@@ -158,10 +36,7 @@ std::vector<layout> fully_connected_inst::calc_output_layouts(fully_connected_no
 
     std::vector<ShapeType> output_shapes = ov::op::v0::shape_infer(&op, input_shapes);
 
-    bool is_static = input_layout.is_static() && weights_layout.is_static();
-    bool allow_new_shape_infer = impl_param.get_program().is_new_shape_infer();
-    format::type output_format = is_static && !allow_new_shape_infer ? get_preferred_format(node, impl_param) :
-                                              input_layout.format.value;
+    format::type output_format = input_layout.format.value;
 
     if (node.get_preferred_output_fmt() != format::any)
         output_format = node.get_preferred_output_fmt();
diff --git a/src/plugins/intel_gpu/src/graph/gather.cpp b/src/plugins/intel_gpu/src/graph/gather.cpp
index b4fdc8b2f81013..d631cdf50ae47d 100644
--- a/src/plugins/intel_gpu/src/graph/gather.cpp
+++ b/src/plugins/intel_gpu/src/graph/gather.cpp
@@ -13,61 +13,6 @@
 namespace cldnn {
 GPU_DEFINE_PRIMITIVE_TYPE_ID(gather)
 
-layout gather_inst::calc_output_layout(gather_node const& node, kernel_impl_params const& impl_param) {
-    auto desc = impl_param.typed_desc<gather>();
-
-    auto input_layout = impl_param.get_input_layout();
-    std::vector<tensor::value_type> dims_converted;
-    for (auto dim : desc->output_shape) {
-        dims_converted.push_back(static_cast<tensor::value_type>(dim));
-    }
-    // extend shape to 4d
-    for (size_t i = dims_converted.size(); i < 4; i++)
-        dims_converted.push_back(1);
-
-    format output_format = input_layout.format;
-    if (dims_converted.size() == 5) {
-        switch (input_layout.format) {
-        case format::bfyx:
-            output_format = format::get_default_format(dims_converted.size());
-            break;
-        case format::b_fs_yx_fsv16:
-            output_format = format::b_fs_zyx_fsv16;
-            break;
-        case format::b_fs_yx_fsv32:
-            output_format = format::b_fs_zyx_fsv32;
-            break;
-        case format::bs_fs_yx_bsv16_fsv16:
-            output_format = format::bs_fs_zyx_bsv16_fsv16;
-            break;
-        default:
-            break;
-        }
-    } else if (dims_converted.size() == 6) {
-        switch (input_layout.format) {
-        case format::bfyx:
-        case format::bfzyx:
-        case format::b_fs_zyx_fsv16:
-        case format::b_fs_zyx_fsv32:
-            output_format = format::get_default_format(dims_converted.size());
-            break;
-        default:
-            break;
-        }
-    }
-    auto output_type = input_layout.data_type;
-    if (impl_param.typed_desc<gather>()->compressed_weights) {
-        output_type = impl_param.typed_desc<gather>()->decompressed_type;
-    }
-    if (impl_param.has_fused_primitives()) {
-        output_type = impl_param.get_output_element_type();
-    }
-
-    return layout{output_type,
-                  output_format,
-                  tensor(format::get_default_format(dims_converted.size()), dims_converted)};
-}
-
 template<typename ShapeType>
 std::vector<layout> gather_inst::calc_output_layouts(gather_node const& /*node*/, const kernel_impl_params& impl_param) {
     auto desc = impl_param.typed_desc<gather>();
diff --git a/src/plugins/intel_gpu/src/graph/gather_elements.cpp b/src/plugins/intel_gpu/src/graph/gather_elements.cpp
index e4c3cb20e21a1c..cb08e9c522881c 100644
--- a/src/plugins/intel_gpu/src/graph/gather_elements.cpp
+++ b/src/plugins/intel_gpu/src/graph/gather_elements.cpp
@@ -12,23 +12,6 @@
 namespace cldnn {
 GPU_DEFINE_PRIMITIVE_TYPE_ID(gather_elements)
 
-layout gather_elements_inst::calc_output_layout(gather_elements_node const& node, kernel_impl_params const& impl_param) {
-    auto op = impl_param.typed_desc<gather_elements>();
-
-    auto input_layout_origin = impl_param.get_input_layout(0);
-    auto indices_layout_origin = impl_param.get_input_layout(1);
-
-    auto input_layout = input_layout_origin.get_tensor().sizes(input_layout_origin.format);
-    auto indices_layout = indices_layout_origin.get_tensor().sizes(indices_layout_origin.format);
-
-    auto output_type = (impl_param.has_fused_primitives()) ? impl_param.get_output_element_type() :
-                       input_layout_origin.data_type;
-    auto output_shape = op->output_shape;
-    auto output_format = op->output_format;
-    // calculate initial output shape
-    return layout(output_type, output_format, output_shape);
-}
-
 template<typename ShapeType>
 std::vector<layout> gather_elements_inst::calc_output_layouts(gather_elements_node const& /*node*/, const kernel_impl_params& impl_param) {
     auto desc = impl_param.typed_desc<gather_elements>();
@@ -65,7 +48,6 @@ std::string gather_elements_inst::to_string(gather_elements_node const& node) {
 
     json_composite gather_elements_info;
     gather_elements_info.add("input id", input.id());
-    gather_elements_info.add("output format", calc_output_layout(node, *node.get_kernel_impl_params()).format);
     gather_elements_info.add("axis", desc->axis);
 
     node_info->add("gather_elements info", gather_elements_info);
diff --git a/src/plugins/intel_gpu/src/graph/gather_nd.cpp b/src/plugins/intel_gpu/src/graph/gather_nd.cpp
index 676d76164094d8..909dba9437b8db 100644
--- a/src/plugins/intel_gpu/src/graph/gather_nd.cpp
+++ b/src/plugins/intel_gpu/src/graph/gather_nd.cpp
@@ -12,66 +12,6 @@
 namespace cldnn {
 GPU_DEFINE_PRIMITIVE_TYPE_ID(gather_nd)
 
-layout gather_nd_inst::calc_output_layout(gather_nd_node const& node, kernel_impl_params const& impl_param) {
-    auto op = impl_param.typed_desc<gather_nd>();
-
-    auto input_layout_origin = impl_param.get_input_layout(0);
-    auto indices_layout_origin = impl_param.get_input_layout(1);
-
-    auto input_layout = input_layout_origin.get_tensor().sizes(input_layout_origin.format);
-    auto indices_layout = indices_layout_origin.get_tensor().sizes(indices_layout_origin.format);
-
-    const auto input_rank = static_cast<size_t>(op->input_rank);
-    const auto indices_rank = op->indices_rank;
-    const auto batch_dims = op->batch_dims;
-
-    // calculate initial output shape
-    std::vector<tensor::value_type> output_sizes;
-
-    for (uint8_t x = 0; x < indices_rank - 1; x++) {
-        output_sizes.push_back(indices_layout[x]);
-    }
-
-    const size_t indices_last_dim = indices_layout[indices_rank - 1];
-    for (size_t x = static_cast<size_t>(batch_dims + indices_last_dim); x < input_rank; x++) {
-        output_sizes.push_back(input_layout[x]);
-    }
-
-    // create final output shape by batch_dims
-    std::vector<tensor::value_type> final_output_sizes;
-
-    if (op->batch_merged_output) {
-        // calculate batch_size by batch_dims
-        int batch_size = 1;
-        for (uint8_t x = 0; x < batch_dims; x++) {
-            batch_size *= output_sizes[x];
-        }
-
-        if (batch_dims > 0) {
-            final_output_sizes.push_back(batch_size);
-        }
-
-        for (size_t x = static_cast<size_t>(batch_dims); x < output_sizes.size(); x++) {
-            final_output_sizes.push_back(output_sizes[x]);
-        }
-    } else {
-        for (size_t x = 0; x < output_sizes.size(); x++) {
-            final_output_sizes.push_back(output_sizes[x]);
-        }
-    }
-
-    auto output_format = format::get_default_format(final_output_sizes.size());
-    auto output_sizes_tensor = tensor(tensor(final_output_sizes).sizes(output_format));
-    auto padding = op->output_paddings[0];
-
-    if (impl_param.has_fused_primitives()) {
-        input_layout_origin.data_type = impl_param.get_output_element_type();
-    }
-
-    return layout(input_layout_origin.data_type, output_format, output_sizes_tensor, padding);
-}
-
-
 template<typename ShapeType>
 std::vector<layout> gather_nd_inst::calc_output_layouts(gather_nd_node const& /*node*/, const kernel_impl_params& impl_param) {
     auto desc = impl_param.typed_desc<gather_nd>();
diff --git a/src/plugins/intel_gpu/src/graph/gather_tree.cpp b/src/plugins/intel_gpu/src/graph/gather_tree.cpp
index 26b55b65490925..ec44c72f74a4b7 100644
--- a/src/plugins/intel_gpu/src/graph/gather_tree.cpp
+++ b/src/plugins/intel_gpu/src/graph/gather_tree.cpp
@@ -14,13 +14,6 @@
 namespace cldnn {
 GPU_DEFINE_PRIMITIVE_TYPE_ID(gather_tree)
 
-layout gather_tree_inst::calc_output_layout(gather_tree_node const& node, kernel_impl_params const& impl_param) {
-    assert(static_cast<bool>(impl_param.desc->output_data_types[0]) == false &&
-        "Output data type forcing is not supported for gather_tree_node!");
-    auto input_layout = impl_param.get_input_layout();
-    return input_layout;
-}
-
 template<typename ShapeType>
 std::vector<layout> gather_tree_inst::calc_output_layouts(gather_tree_node const& /*node*/, const kernel_impl_params& impl_param) {
     auto desc = impl_param.typed_desc<gather_tree>();
diff --git a/src/plugins/intel_gpu/src/graph/gemm.cpp b/src/plugins/intel_gpu/src/graph/gemm.cpp
index a8b196bd45885f..c971481d654d2f 100644
--- a/src/plugins/intel_gpu/src/graph/gemm.cpp
+++ b/src/plugins/intel_gpu/src/graph/gemm.cpp
@@ -13,96 +13,6 @@
 namespace cldnn {
 GPU_DEFINE_PRIMITIVE_TYPE_ID(gemm)
 
-layout gemm_inst::calc_output_layout(gemm_node const& node, kernel_impl_params const& impl_param) {
-    auto prim = impl_param.typed_desc<gemm>();
-
-    auto input0_layout = impl_param.get_input_layout(0);
-    auto input1_layout = impl_param.get_input_layout(1);
-
-    auto input0_shape = input0_layout.get_shape();
-    auto input1_shape = input1_layout.get_shape();
-
-    auto input0_transpose_order = prim->input0_transpose_order;
-    auto input1_transpose_order = prim->input1_transpose_order;
-
-    bool reordered = prim->input_rank > 4 || prim->weight_rank > 4;
-    size_t output_rank = std::max(prim->input_rank, prim->weight_rank);
-    size_t input_rank = reordered ? output_rank : prim->input_rank;
-    size_t weight_rank = reordered ? output_rank : prim->weight_rank;
-
-    auto update_input_shape = [&output_rank](const ov::Shape& input_shape, size_t rank, std::vector<int64_t> input_order, bool first_input) {
-        auto input_shape_update = ov::Shape();
-        auto _input_shape_update = ov::Shape(input_shape.begin(), input_shape.begin() + std::min(rank, input_shape.size()));
-        if (_input_shape_update.size() == input_order.size() && input_order.size() > 1) {
-            for (auto idx : input_order) {
-                input_shape_update.push_back(_input_shape_update[idx]);
-            }
-        } else {
-            input_shape_update = _input_shape_update;
-        }
-        if (input_shape_update.size() == 1) {
-            first_input ? input_shape_update.insert(input_shape_update.begin(), 1)
-                        : input_shape_update.insert(input_shape_update.end(), 1);
-            output_rank = std::max(output_rank, rank + 1);
-        }
-        input_shape_update.insert(input_shape_update.begin(), output_rank - input_shape_update.size(), 1);
-        return input_shape_update;
-    };
-
-    auto transpose_shape = [](const ov::Shape& shape, const std::vector<int64_t>& order) {
-        auto shape_transposed = ov::Shape(shape);
-        auto rank_diff = shape.size() - order.size();
-        for (size_t i = 0; i < order.size(); i++) {
-            size_t idx = static_cast<size_t>(order[i]);
-            shape_transposed[i + rank_diff] = shape[idx + rank_diff];
-        }
-
-        return shape_transposed;
-    };
-
-    auto input0_shape_update = update_input_shape(input0_shape, input_rank, input0_transpose_order, true);
-    auto input1_shape_update = update_input_shape(input1_shape, weight_rank, input1_transpose_order, false);
-
-    ov::Shape bias_shape(output_rank);
-    if (prim->input_size() == 3) {
-        bias_shape = impl_param.get_input_layout(2).get_shape();
-        bias_shape = update_input_shape(bias_shape, weight_rank, input1_transpose_order, false);
-    }
-
-    auto output_shape = input0_shape_update;
-    for (size_t i = 0; i < output_rank; ++i) {
-        output_shape[i] = std::max(std::max(input0_shape_update[i], input1_shape_update[i]), bias_shape[i]);
-    }
-
-    size_t M = *(input0_shape_update.end() - 2);
-    size_t N = input1_shape_update.back();
-
-    output_shape[output_rank - 2] = M;
-    output_shape[output_rank - 1] = N;
-
-    size_t ones_to_add = 4 - std::min(output_shape.size(), static_cast<size_t>(4));
-    output_shape.insert(output_shape.begin(), ones_to_add, 1);
-
-    if (prim->output_transpose_order.size() > 0)
-        output_shape = transpose_shape(output_shape, prim->output_transpose_order);
-
-    auto output_type = input0_layout.data_type;
-    if ((output_type == data_types::u8 || output_type == data_types::i8) && prim->output_data_types[0])
-        output_type = *prim->output_data_types[0];
-
-    if (impl_param.has_fused_primitives()) {
-        output_type = impl_param.get_output_element_type();
-    }
-
-    auto output_format = input0_layout.format;
-
-    if (node.get_preferred_impl_type() == impl_types::onednn && node.get_preferred_output_fmt() != format::any) {
-        output_format = node.get_preferred_output_fmt();
-    }
-
-    return layout(output_shape, output_type, output_format, prim->output_paddings[0]);
-}
-
 template<typename ShapeType>
 std::vector<layout> gemm_inst::calc_output_layouts(gemm_node const& node, const kernel_impl_params& impl_param) {
     auto prim = impl_param.typed_desc<gemm>();
@@ -229,7 +139,7 @@ layout gemm_inst::transform_output_layout(const std::shared_ptr<const gemm> prim
                                 (i == 1) ? transposed_input1_pshape :
                                 input_layouts[i].get_partial_shape();
             for (size_t j = 0; j != input_pshape.size(); ++j) {
-                ov::Dimension::merge(output_pshape[j], output_pshape[j], input_pshape[j]);
+                ov::Dimension::broadcast_merge(output_pshape[j], output_pshape[j], input_pshape[j]);
             }
         }
 
diff --git a/src/plugins/intel_gpu/src/graph/generate_proposals.cpp b/src/plugins/intel_gpu/src/graph/generate_proposals.cpp
index 3ecb0e51b5761a..9d4bcc949f1a79 100644
--- a/src/plugins/intel_gpu/src/graph/generate_proposals.cpp
+++ b/src/plugins/intel_gpu/src/graph/generate_proposals.cpp
@@ -2,8 +2,8 @@
 // SPDX-License-Identifier: Apache-2.0
 //
 
-#include "generate_proposals_inst.h"
 #include "openvino/op/generate_proposals.hpp"
+#include "generate_proposals_inst.h"
 #include "generate_proposals_shape_inference.hpp"
 #include "primitive_type_base.h"
 #include "json_object.h"
@@ -41,13 +41,6 @@ std::vector<layout> generate_proposals_inst::calc_output_layouts(generate_propos
 template std::vector<layout>
 generate_proposals_inst::calc_output_layouts<ov::PartialShape>(generate_proposals_node const& node, const kernel_impl_params& impl_param);
 
-layout generate_proposals_inst::calc_output_layout(const generate_proposals_node& node, kernel_impl_params const& impl_param) {
-    const layout data_layout = impl_param.get_input_layout();
-    const auto num_batches = data_layout.batch();
-    const auto desc = impl_param.typed_desc<generate_proposals>();
-    return layout(data_layout.data_type, data_layout.format, {static_cast<int>(num_batches * desc->attrs.post_nms_count), 4, 1, 1});
-}
-
 std::string generate_proposals_inst::to_string(const generate_proposals_node& node) {
     auto desc = node.get_primitive();
 
diff --git a/src/plugins/intel_gpu/src/graph/graph_optimizer/add_required_reorders.cpp b/src/plugins/intel_gpu/src/graph/graph_optimizer/add_required_reorders.cpp
index 9dabf5f51ecc4b..438d076c4d0a42 100644
--- a/src/plugins/intel_gpu/src/graph/graph_optimizer/add_required_reorders.cpp
+++ b/src/plugins/intel_gpu/src/graph/graph_optimizer/add_required_reorders.cpp
@@ -81,24 +81,6 @@ void add_required_reorders::run(program& p) {
             }
         }
 
-        if (usr->is_type<eltwise>()) {
-            for (size_t i = 0; i < usr->get_dependencies().size(); i++) {
-                auto& dep = usr->get_dependency(i);
-                if (!dep.is_in_data_flow() || dep.is_constant())
-                    continue;
-                auto dep_layout = dep.get_output_layout();
-                auto out_layout = usr->get_output_layout();
-                bool required_reorder = (format::dimension(out_layout.format) != format::dimension(dep_layout.format)) ||
-                                        (usr->is_in_shape_of_subgraph() && (out_layout.data_type != dep_layout.data_type));
-                if (required_reorder) {
-                    auto new_reorder = std::make_shared<reorder>(dep.id() + "_reorder_" + usr->id(), dep.id(), out_layout.format, out_layout.data_type);
-                    auto& new_reorder_node = p.get_or_create(new_reorder);
-                    p.add_intermediate(new_reorder_node, *usr, dep);
-                    new_reorder_node.recalc_output_layouts(false);
-                }
-            }
-        }
-
         if (optimize_data) {
             auto fused_ops = usr->get_fused_primitives();
             auto out_layout = usr->get_output_layout();
diff --git a/src/plugins/intel_gpu/src/graph/graph_optimizer/handle_reshape.cpp b/src/plugins/intel_gpu/src/graph/graph_optimizer/handle_reshape.cpp
index ca8b781f8d9e48..7d75092e5aaae8 100644
--- a/src/plugins/intel_gpu/src/graph/graph_optimizer/handle_reshape.cpp
+++ b/src/plugins/intel_gpu/src/graph/graph_optimizer/handle_reshape.cpp
@@ -72,8 +72,7 @@ void handle_reshape::run(program& p) {
             // In case of new shape infer we should not shrink reshapes chain if first reshape changes input rank, e.g.
             // [a, b] -> reshape1 -> [a1, b1, c1] -> reshape2 -> [a2, b2, 0] and any of the reshapes has special_zero=true
             // Configuration above will fail if we remove reshape1 node as attempt to handle special zero will fail due to small rank of input
-            if (p.is_new_shape_infer() &&
-                out_node->get_output_pshape().size() != node.get_input_pshape().size() &&
+            if (out_node->get_output_pshape().size() != node.get_input_pshape().size() &&
                 (out_reshape.get_primitive()->special_zero || node.get_primitive()->special_zero))
                 return;
 
diff --git a/src/plugins/intel_gpu/src/graph/graph_optimizer/mark_shape_of_subgraphs.cpp b/src/plugins/intel_gpu/src/graph/graph_optimizer/mark_shape_of_subgraphs.cpp
index cf0b733b6ef178..c92377bd1c18fb 100644
--- a/src/plugins/intel_gpu/src/graph/graph_optimizer/mark_shape_of_subgraphs.cpp
+++ b/src/plugins/intel_gpu/src/graph/graph_optimizer/mark_shape_of_subgraphs.cpp
@@ -120,9 +120,7 @@ void mark_shape_of_subgraphs::mark_node(program_node& node) {
 }
 
 void mark_shape_of_subgraphs::run(program& p) {
-    if (p.is_new_shape_infer()) {
-        for (auto& node : p.get_processing_order()) {
-            look_for_shape_of_subgraph(*node);
-        }
+    for (auto& node : p.get_processing_order()) {
+        look_for_shape_of_subgraph(*node);
     }
 }
diff --git a/src/plugins/intel_gpu/src/graph/graph_optimizer/prepare_padding.cpp b/src/plugins/intel_gpu/src/graph/graph_optimizer/prepare_padding.cpp
index 9a97885e2601f9..0daffb74fdf0b5 100644
--- a/src/plugins/intel_gpu/src/graph/graph_optimizer/prepare_padding.cpp
+++ b/src/plugins/intel_gpu/src/graph/graph_optimizer/prepare_padding.cpp
@@ -128,27 +128,36 @@ void prepare_padding::run(program& p) {
                 auto& prim_node = node->as<pooling>();
                 const auto& prim = prim_node.get_primitive();
 
-                if (!prim->with_output_size)
-                    continue;
+                auto padding_begin = prim->pads_begin;
+                auto padding_end = prim->pads_end;
 
-                padding needed_padding;
-                // WA for this format. sliding window needs to be fixed --perf degradation for IncepctionV1 type models
-                tensor size(1);
-                for (size_t i = 0; i < prim->size.size(); i++) {
-                    size.spatial[i] = static_cast<tensor::value_type>(prim->size[prim->size.size() - i - 1]);
-                }
+                tensor::value_type pb_z = std::max<std::ptrdiff_t>(padding_begin.size() >= 3 ? padding_begin[padding_begin.size() - 3] : 0, 0);
+                tensor::value_type pb_y = std::max<std::ptrdiff_t>(padding_begin.size() >= 2 ? padding_begin[padding_begin.size() - 2] : 0, 0);
+                tensor::value_type pb_x = std::max<std::ptrdiff_t>(padding_begin.size() >= 1 ? padding_begin[padding_begin.size() - 1] : 0, 0);
+
+                tensor::value_type pe_z = std::max<std::ptrdiff_t>(padding_end.size() >= 3 ? padding_end[padding_end.size() - 3] : 0, 0);
+                tensor::value_type pe_y = std::max<std::ptrdiff_t>(padding_end.size() >= 2 ? padding_end[padding_end.size() - 2] : 0, 0);
+                tensor::value_type pe_x = std::max<std::ptrdiff_t>(padding_end.size() >= 1 ? padding_end[padding_end.size() - 1] : 0, 0);
+
+                tensor pad_l = tensor(0);
+                tensor pad_u = tensor(0);
+                pad_l.spatial[0] = pb_x;
+                pad_l.spatial[1] = pb_y;
+                pad_l.spatial[2] = pb_z;
+
+                pad_u.spatial[0] = pe_x;
+                pad_u.spatial[1] = pe_y;
+                pad_u.spatial[2] = pe_z;
+
+                auto in_layout = prim_node.get_input_layout();
 
-                if (node->get_output_layout().format == format::b_fs_yx_fsv16)
-                    needed_padding = calc_sliding_window_needed_input_padding(prim_node.get_input_layout(),
-                                                                              prim->output_size,
-                                                                              size,
-                                                                              ov::CoordinateDiff(prim->pads_begin.begin(), prim->pads_begin.end()),
-                                                                              prim->stride,
-                                                                              ov::Strides(prim->size.size(), 1),
-                                                                              false,
-                                                                              1);
-                else
-                    needed_padding = prim_node.get_input_layout().data_padding;
+                const auto& actual_lpad = in_layout.data_padding.lower_size();
+                const auto& actual_upad = in_layout.data_padding.upper_size();
+
+                auto needed_lpad = tensor::max(pad_l, actual_lpad);
+                auto needed_upad = tensor::max(pad_u, actual_upad);
+
+                padding needed_padding(needed_lpad.sizes(), needed_upad.sizes());
 
                 add_required_padding(prim_node, needed_padding);
             }
@@ -223,7 +232,7 @@ cldnn::padding prepare_padding::get_needed_padding_for_convolution(convolution_n
 
     auto& conv_input_node = node.get_dependency(0);
     // convolution have only one input primitive
-    auto prev_prim_output_layout = conv_input_node.get_output_layout();
+    auto output_layout = conv_input_node.get_output_layout();
 
     // Calculating input padding needed for convolution
     auto& filter_node = node.as<convolution>().weights();
@@ -264,19 +273,41 @@ cldnn::padding prepare_padding::get_needed_padding_for_convolution(convolution_n
         padding_end_y = std::max(pad_y, 0);
         padding_end_z = std::max(pad_z, 0);
     } else {
-        auto input_limit_x = -pad_x + (conv_layout.spatial(0) - 1) * stride_x +
-                            (filter_layout.spatial(0) - 1) * dilation_x + 1;
-        auto input_limit_y = -pad_y + (conv_layout.spatial(1) - 1) * stride_y +
-                            (filter_layout.spatial(1) - 1) * dilation_y + 1;
-        auto input_limit_z = -pad_z + (conv_layout.spatial(2) - 1) * stride_z +
-                            (filter_layout.spatial(2) - 1) * dilation_z + 1;
+        const auto& ker_size = filter_layout.get_partial_shape();
+        const auto& in_size = conv_layout.get_partial_shape();
+        const auto& out_size = output_layout.get_partial_shape();
+        auto spatials_size = ker_size.size() - (conv->grouped_weights_shape ? 3 : 2);
+
+        uint32_t kz = spatials_size >= 3 ? static_cast<uint32_t>(ker_size[ker_size.size() - 3].get_length()) : 1;
+        uint32_t ky = spatials_size >= 2 ? static_cast<uint32_t>(ker_size[ker_size.size() - 2].get_length()) : 1;
+        uint32_t kx = spatials_size >= 1 ? static_cast<uint32_t>(ker_size[ker_size.size() - 1].get_length()) : 1;
+
+        uint32_t in_z = spatials_size >= 3 ? static_cast<uint32_t>(in_size[in_size.size() - 3].get_length()) : 1;
+        uint32_t in_y = spatials_size >= 2 ? static_cast<uint32_t>(in_size[in_size.size() - 2].get_length()) : 1;
+        uint32_t in_x = spatials_size >= 1 ? static_cast<uint32_t>(in_size[in_size.size() - 1].get_length()) : 1;
+
+        uint32_t out_z = spatials_size >= 3 ? static_cast<uint32_t>(out_size[out_size.size() - 3].get_length()) : 1;
+        uint32_t out_y = spatials_size >= 2 ? static_cast<uint32_t>(out_size[out_size.size() - 2].get_length()) : 1;
+        uint32_t out_x = spatials_size >= 1 ? static_cast<uint32_t>(out_size[out_size.size() - 1].get_length()) : 1;
+
+        auto input_limit_x = -pad_x + (in_x - 1) * stride_x +
+                            (kx - 1) * dilation_x + 1;
+        auto input_limit_y = -pad_y + (in_y - 1) * stride_y +
+                            (ky - 1) * dilation_y + 1;
+        auto input_limit_z = -pad_z + (in_z - 1) * stride_z +
+                            (kz - 1) * dilation_z + 1;
 
         padding_begin_x = std::max(pad_x, 0);
         padding_begin_y = std::max(pad_y, 0);
         padding_begin_z = std::max(pad_z, 0);
-        padding_end_x = std::max<tensor::value_type>(input_limit_x - prev_prim_output_layout.spatial(0), 0);
-        padding_end_y = std::max<tensor::value_type>(input_limit_y - prev_prim_output_layout.spatial(1), 0);
-        padding_end_z = std::max<tensor::value_type>(input_limit_z - prev_prim_output_layout.spatial(2), 0);
+        padding_end_x = std::max<tensor::value_type>(input_limit_x - out_x, 0);
+        padding_end_y = std::max<tensor::value_type>(input_limit_y - out_y, 0);
+        padding_end_z = std::max<tensor::value_type>(input_limit_z - out_z, 0);
+
+        if (in_size.size() == 3) {
+            std::swap(padding_begin_x, padding_begin_y);
+            std::swap(padding_end_x, padding_end_y);
+        }
     }
 
     // Adjust right padding, so entire buffer size in X dimension is properly aligned.
@@ -292,7 +323,7 @@ cldnn::padding prepare_padding::get_needed_padding_for_convolution(convolution_n
         needed_padding = padding({0, 0, padding_begin_y, padding_begin_x}, {0, 0, padding_end_y, padding_end_x}, 0);
     else if (padding_begin.size() >= 1)
         needed_padding = padding({0, 0, padding_begin_x}, {0, 0, padding_end_x}, 0);
-    needed_padding = padding::max(prev_prim_output_layout.data_padding, needed_padding);
+    needed_padding = padding::max(output_layout.data_padding, needed_padding);
 
     return needed_padding;
 }
diff --git a/src/plugins/intel_gpu/src/graph/graph_optimizer/prepare_primitive_fusing_through.cpp b/src/plugins/intel_gpu/src/graph/graph_optimizer/prepare_primitive_fusing_through.cpp
index f63f1bf4efbe21..69d914084aa91e 100644
--- a/src/plugins/intel_gpu/src/graph/graph_optimizer/prepare_primitive_fusing_through.cpp
+++ b/src/plugins/intel_gpu/src/graph/graph_optimizer/prepare_primitive_fusing_through.cpp
@@ -134,7 +134,7 @@ void prepare_primitive_fusing_through::run(program& p) {
         if (node->is_type<eltwise>()) {
             auto out_shape = new_prev->get_output_layout().get_partial_shape();  // new_prev's layout became node's new layout after fusing
             auto in_shape = node->get_dependency(1).get_output_layout().get_partial_shape();
-            if (!broadcastable(in_shape, out_shape, true, true))
+            if (!broadcastable(in_shape, out_shape, true))
                 continue;
         }
 
diff --git a/src/plugins/intel_gpu/src/graph/graph_optimizer/remove_redundant_reorders.cpp b/src/plugins/intel_gpu/src/graph/graph_optimizer/remove_redundant_reorders.cpp
index e4725ace72441b..9ef9fc1412e86a 100644
--- a/src/plugins/intel_gpu/src/graph/graph_optimizer/remove_redundant_reorders.cpp
+++ b/src/plugins/intel_gpu/src/graph/graph_optimizer/remove_redundant_reorders.cpp
@@ -676,8 +676,7 @@ void remove_redundant_reorders::run(program& p) {
         // In case of new shape infer we should not shrink reshapes chain if first reshape changes input rank, e.g.
         // [a, b] -> reshape1 -> [a1, b1, c1] -> reshape2 -> [a2, b2, 0] and any of the reshapes has special_zero=true
         // Configuration above will fail if we remove reshape1 node as attempt to handle special zero will fail due to small rank of input
-        if (p.is_new_shape_infer() &&
-            reshape_node.get_output_pshape().size() != dep_node.get_input_pshape().size() &&
+        if (reshape_node.get_output_pshape().size() != dep_node.get_input_pshape().size() &&
             (reshape_node.get_primitive()->special_zero || reshape_input_node.get_primitive()->special_zero))
             continue;
 
diff --git a/src/plugins/intel_gpu/src/graph/grid_sample.cpp b/src/plugins/intel_gpu/src/graph/grid_sample.cpp
index b800aa8d470773..d027cd4750a379 100644
--- a/src/plugins/intel_gpu/src/graph/grid_sample.cpp
+++ b/src/plugins/intel_gpu/src/graph/grid_sample.cpp
@@ -12,20 +12,6 @@
 namespace cldnn {
 GPU_DEFINE_PRIMITIVE_TYPE_ID(grid_sample)
 
-layout grid_sample_inst::calc_output_layout(const grid_sample_node& node, const kernel_impl_params& impl_param) {
-    const auto data_layout = impl_param.get_input_layout();
-    const auto data_sizes = data_layout.get_dims();
-    const auto& N = data_sizes[0];
-    const auto& C = data_sizes[1];
-
-    const auto grid_layout = impl_param.get_input_layout(1);
-    const auto grid_sizes = grid_layout.get_dims();
-    const auto& H = grid_sizes[1];
-    const auto& W = grid_sizes[2];
-
-    return {data_layout.data_type, data_layout.format, tensor(data_layout.format, {N, C, H, W})};
-}
-
 template<typename ShapeType>
 std::vector<layout> grid_sample_inst::calc_output_layouts(grid_sample_node const& /*node*/, const kernel_impl_params& impl_param) {
     auto prim = impl_param.typed_desc<grid_sample>();
diff --git a/src/plugins/intel_gpu/src/graph/grn.cpp b/src/plugins/intel_gpu/src/graph/grn.cpp
index 8ee2ff6720a640..110549e33daff0 100644
--- a/src/plugins/intel_gpu/src/graph/grn.cpp
+++ b/src/plugins/intel_gpu/src/graph/grn.cpp
@@ -10,13 +10,6 @@
 namespace cldnn {
 GPU_DEFINE_PRIMITIVE_TYPE_ID(grn)
 
-layout grn_inst::calc_output_layout(grn_node const& node, kernel_impl_params const& impl_param) {
-    auto input_node_layout = impl_param.get_non_padded_input_layout();
-    auto output_type = impl_param.desc->output_data_types[0].value_or(input_node_layout.data_type);
-
-    return layout(output_type, input_node_layout.format, input_node_layout.get_tensor());
-}
-
 std::string grn_inst::to_string(grn_node const& node) {
     auto node_info = node.desc_to_json();
     auto desc = node.get_primitive();
diff --git a/src/plugins/intel_gpu/src/graph/group_normalization.cpp b/src/plugins/intel_gpu/src/graph/group_normalization.cpp
index d9d359f339bcac..eab2230718dc54 100644
--- a/src/plugins/intel_gpu/src/graph/group_normalization.cpp
+++ b/src/plugins/intel_gpu/src/graph/group_normalization.cpp
@@ -9,18 +9,6 @@
 namespace cldnn {
 GPU_DEFINE_PRIMITIVE_TYPE_ID(group_normalization)
 
-layout group_normalization_inst::calc_output_layout(group_normalization_node const& node, kernel_impl_params const& impl_param) {
-    assert(static_cast<bool>(impl_param.desc->output_data_types[0]) == false &&
-        "Output data type forcing is not supported for group_normalization_node!");
-    auto input_node_layout = impl_param.get_non_padded_input_layout();
-    auto output_type = impl_param.desc->output_data_types[0].value_or(input_node_layout.data_type);
-
-    if (impl_param.has_fused_primitives())
-        output_type = impl_param.get_output_element_type();
-
-    return layout(output_type, input_node_layout.format, input_node_layout.get_tensor());
-}
-
 std::string group_normalization_inst::to_string(group_normalization_node const& node) {
     auto desc = node.get_primitive();
     auto node_info = node.desc_to_json();
diff --git a/src/plugins/intel_gpu/src/graph/impls/common/loop.cpp b/src/plugins/intel_gpu/src/graph/impls/common/loop.cpp
index 3523b420d221ae..e9383a8a61be0b 100644
--- a/src/plugins/intel_gpu/src/graph/impls/common/loop.cpp
+++ b/src/plugins/intel_gpu/src/graph/impls/common/loop.cpp
@@ -4,7 +4,6 @@
 #include "loop_inst.h"
 #include "impls/registry/implementation_map.hpp"
 #include "register.hpp"
-#include "mutable_data_inst.h"
 #include "input_layout_inst.h"
 #include <vector>
 #include <algorithm>
diff --git a/src/plugins/intel_gpu/src/graph/impls/cpu/non_max_suppression.cpp b/src/plugins/intel_gpu/src/graph/impls/cpu/non_max_suppression.cpp
index 4783159d501404..7b8c89829254ea 100644
--- a/src/plugins/intel_gpu/src/graph/impls/cpu/non_max_suppression.cpp
+++ b/src/plugins/intel_gpu/src/graph/impls/cpu/non_max_suppression.cpp
@@ -363,18 +363,6 @@ void run(non_max_suppression_inst& instance) {
 
     size_t output_size = instance.get_impl_params()->output_layouts[0].batch();
 
-    // Legacy APIs using mutable inputs for multiple outputs
-    if (instance.has_third_output()) {
-        store_third_output(stream, instance.third_output_mem(), result);
-    }
-
-    if (instance.has_second_output()) {
-        store_second_output(stream, instance.second_output_mem(), result, output_size);
-        store_first_output(stream, instance.output_memory_ptr(), result, output_size);
-        return;
-    }
-
-    // New API for mutiple outputs support
     if (instance.outputs_memory_count() == 3)
         store_third_output(stream, instance.output_memory_ptr(2), result);
 
diff --git a/src/plugins/intel_gpu/src/graph/impls/ocl/adaptive_pooling.cpp b/src/plugins/intel_gpu/src/graph/impls/ocl/adaptive_pooling.cpp
index 9f8f3ecfa5b7e2..8faddbc53c80d1 100644
--- a/src/plugins/intel_gpu/src/graph/impls/ocl/adaptive_pooling.cpp
+++ b/src/plugins/intel_gpu/src/graph/impls/ocl/adaptive_pooling.cpp
@@ -2,6 +2,7 @@
 // SPDX-License-Identifier: Apache-2.0
 //
 
+#include "impls/ocl/kernel_selector_helper.h"
 #include "primitive_base.hpp"
 
 #include "adaptive_pooling_inst.h"
@@ -22,19 +23,6 @@ struct adaptive_pooling_impl : public typed_primitive_impl_ocl<adaptive_pooling>
         return make_unique<adaptive_pooling_impl>(*this);
     }
 
-protected:
-    kernel_arguments_data get_arguments(const typed_primitive_inst<adaptive_pooling>& instance) const override {
-        kernel_arguments_data args = parent::get_arguments(instance);
-        auto desc = instance.get_typed_desc<adaptive_pooling>();
-
-        // Legacy multi-output
-        if (desc->num_outputs == 1 && desc->mode == adaptive_pooling_mode::max) {
-            args.outputs.push_back(instance.dep_memory_ptr(2));
-        }
-
-        return args;
-    }
-
 public:
     static kernel_params_t get_kernel_params(const kernel_impl_params& impl_param) {
         const auto& primitive = impl_param.typed_desc<adaptive_pooling>();
@@ -46,12 +34,7 @@ struct adaptive_pooling_impl : public typed_primitive_impl_ocl<adaptive_pooling>
             params.mode = kernel_selector::PoolType::MAX;
             params.poolIndexElementType = to_data_type(primitive->index_element_type);
             params.outputs_num = 2;
-            if (primitive->num_outputs == 2) {
-                params.outputs.push_back(convert_data_tensor(impl_param.get_output_layout(1)));
-            } else {
-                // Legacy multi-output
-                params.outputs.push_back(convert_data_tensor(impl_param.get_input_layout(2)));
-            }
+            params.outputs.push_back(convert_data_tensor(impl_param.get_output_layout(1)));
         }
 
         return params;
diff --git a/src/plugins/intel_gpu/src/graph/impls/ocl/arg_max_min.cpp b/src/plugins/intel_gpu/src/graph/impls/ocl/arg_max_min.cpp
index a1a869f131b3f4..acef46133fd317 100644
--- a/src/plugins/intel_gpu/src/graph/impls/ocl/arg_max_min.cpp
+++ b/src/plugins/intel_gpu/src/graph/impls/ocl/arg_max_min.cpp
@@ -54,17 +54,6 @@ struct arg_max_min_impl : typed_primitive_impl_ocl<arg_max_min> {
         }
     }
 
-protected:
-    kernel_arguments_data get_arguments(const typed_primitive_inst<arg_max_min>& instance) const override {
-        kernel_arguments_data args = parent::get_arguments(instance);
-
-        // Legacy multi-output
-        if (instance.get_typed_desc<arg_max_min>()->has_second_output()) {
-            args.outputs.push_back(instance.dep_memory_ptr(instance.dependencies().size() - 1));
-        }
-
-        return args;
-    }
 
 public:
     static kernel_params_t get_kernel_params(const kernel_impl_params& impl_param, bool is_shape_agnostic = false) {
@@ -75,7 +64,7 @@ struct arg_max_min_impl : typed_primitive_impl_ocl<arg_max_min> {
         const auto& sort_type = primitive->sort;
         const auto& values_first = primitive->values_first;
         const auto& stable = primitive->stable;
-        const auto& outputs_num = primitive->input_size() == 3 ? 2 : static_cast<uint32_t>(primitive->output_size());
+        const auto& outputs_num = static_cast<uint32_t>(primitive->output_size());
 
         auto argm_params = get_default_params<kernel_selector::arg_max_min_params>(impl_param, is_shape_agnostic);
 
@@ -103,13 +92,8 @@ struct arg_max_min_impl : typed_primitive_impl_ocl<arg_max_min> {
         else
             argm_params.argMaxMinSortType = kernel_selector::argm_sort::INDEX;
 
-        if (outputs_num == 2) {  // for backward compatibility
-            if (primitive->input_size() != 3) {
-                argm_params.outputs.push_back(convert_data_tensor(impl_param.get_output_layout(1)));
-            } else {
-                // Legacy multi-output
-                argm_params.outputs.push_back(convert_data_tensor(impl_param.get_input_layout(2)));
-            }
+        if (outputs_num == 2) {
+            argm_params.outputs.push_back(convert_data_tensor(impl_param.get_output_layout(1)));
         }
 
         argm_params.values_first = values_first;
diff --git a/src/plugins/intel_gpu/src/graph/impls/ocl/batch_to_space.cpp b/src/plugins/intel_gpu/src/graph/impls/ocl/batch_to_space.cpp
index 87e73704b7e7cd..88ba6cbbed563e 100644
--- a/src/plugins/intel_gpu/src/graph/impls/ocl/batch_to_space.cpp
+++ b/src/plugins/intel_gpu/src/graph/impls/ocl/batch_to_space.cpp
@@ -25,15 +25,16 @@ struct batch_to_space_impl : typed_primitive_impl_ocl<batch_to_space> {
         const auto& primitive = impl_param.typed_desc<batch_to_space>();
         auto params = get_default_params<kernel_selector::batch_to_space_params>(impl_param);
 
+        auto out_rank = impl_param.output_layouts[0].get_rank();
         if (primitive->shape_constant) {
             params.block_type = kernel_selector::base_params::ArgType::Constant;
-            params.block_shape = convert_dim_vector(primitive->block_shape);
+            params.block_shape = convert_vec_to_dim_tensor(primitive->block_shape, out_rank, 1);
 
             params.begin_type = kernel_selector::base_params::ArgType::Constant;
-            params.crops_begin = convert_dim_vector(primitive->crops_begin);
+            params.crops_begin = convert_vec_to_dim_tensor(primitive->crops_begin, out_rank, 0);
 
             params.end_type = kernel_selector::base_params::ArgType::Constant;
-            params.crops_end = convert_dim_vector(primitive->crops_end);
+            params.crops_end = convert_vec_to_dim_tensor(primitive->crops_end, out_rank, 0);
         } else {
             params.block_input_index = 1;
             params.block_type = kernel_selector::base_params::ArgType::Input;
diff --git a/src/plugins/intel_gpu/src/graph/impls/ocl/broadcast.cpp b/src/plugins/intel_gpu/src/graph/impls/ocl/broadcast.cpp
index a1cb339ce7cae0..ace9cce7e96b99 100644
--- a/src/plugins/intel_gpu/src/graph/impls/ocl/broadcast.cpp
+++ b/src/plugins/intel_gpu/src/graph/impls/ocl/broadcast.cpp
@@ -39,19 +39,9 @@ struct broadcast_impl : typed_primitive_impl_ocl<broadcast> {
         const auto format = impl_param.get_output_layout().format;
         size_t max_axes_num = format.dimension();
 
-        const auto& broadcast_axes = primitive->broadcast_axes;
-        uint16_t index = (uint16_t)0;
-        uint16_t input_index = (uint16_t)broadcast_axes.size();
-
         // bfyx, bfzyx format
         for (size_t i = 0; i < max_axes_num; ++i) {
-            if (std::find(broadcast_axes.begin(), broadcast_axes.end(), i) != broadcast_axes.end()) {
-                params.input_order.push_back(index);
-                ++index;
-            } else {
-                params.input_order.push_back(input_index);
-                ++input_index;
-            }
+            params.input_order.push_back(i);
         }
 
         return params;
@@ -67,57 +57,24 @@ struct broadcast_impl : typed_primitive_impl_ocl<broadcast> {
         auto input_pshape = i_layout.get_partial_shape();
         auto output_pshape = o_layout.get_partial_shape();
 
-        auto output_rank = output_pshape.size();
+        auto new_in_shape = output_pshape;
 
         if (primitive->axes_mapping.empty()) {
-            bool use_new_shape_infer = impl_params.prog->is_new_shape_infer();
-            if (!broadcastable(input_pshape, output_pshape, use_new_shape_infer)) {
-                input_pshape = extend_shape_to_rank_from_begin(input_pshape, output_pshape.size());
+            if (!broadcastable(input_pshape, output_pshape)) {
+                new_in_shape = extend_shape_to_rank_from_begin(input_pshape, output_pshape.size());
             } else {
-                input_pshape = extend_shape_to_rank_from_end(input_pshape, output_pshape.size());
+                new_in_shape = extend_shape_to_rank_from_end(input_pshape, output_pshape.size());
             }
         } else {
-            if (i_layout.is_static() && o_layout.is_static()) {
-                // If axis_mapping is specified, then ones are inserted according to it.
-                ov::Shape tmp_shape;
-                int prev_axis = -1;
-                int next_axis = -1;
-                size_t currentRank = 0;
-                int axe_idx = 0;
-                for (auto& axis : primitive->axes_mapping) {
-                    prev_axis = next_axis;
-                    next_axis = static_cast<int>(axis);
-
-                    int ones_count = std::max(next_axis - prev_axis - 1, 0);
-                    tmp_shape.insert(tmp_shape.begin() + currentRank, ones_count, 1ul);
-                    tmp_shape.push_back(input_pshape[axe_idx].get_length()); // Consider the Broadcast kernel 'broadcast' input to output shape
-
-                    currentRank += ones_count + 1;
-                    axe_idx += 1;
-                }
-                input_pshape = extend_shape_to_rank_from_end(tmp_shape, output_rank);
-            } else {
-                // dynamic input
-                // insert 1 to extend dimensions by axes_mapping
-                ov::Shape tmp_shape;
-                size_t idx = 0;
-                for (auto& axis : primitive->axes_mapping) {
-                    if (idx == axis) {
-                        tmp_shape.insert(tmp_shape.begin() + idx, 1, -1);
-                        idx += 1;
-                    } else {
-                        tmp_shape.insert(tmp_shape.begin() + idx, axis - idx, 1);
-                        idx = axis;
-                        tmp_shape.insert(tmp_shape.begin() + idx, 1, -1);
-                        idx += 1;
-                    }
+            for (size_t i = 0; i < new_in_shape.size(); i++) {
+                if (primitive->axes_mapping.find(i) == primitive->axes_mapping.end()) {
+                    new_in_shape[i] = 1;
                 }
-                input_pshape = extend_shape_to_rank_from_end(tmp_shape, output_rank);
             }
         }
 
-        updated_impl_params.input_layouts[0].set_partial_shape(extend_shape_to_rank_from_end(input_pshape));
-        updated_impl_params.input_layouts[0].format = format::adjust_to_rank(i_layout.format, input_pshape.size());
+        updated_impl_params.input_layouts[0].set_partial_shape(extend_shape_to_rank_from_end(new_in_shape));
+        updated_impl_params.input_layouts[0].format = format::adjust_to_rank(i_layout.format, new_in_shape.size());
 
         updated_impl_params.output_layouts[0].set_partial_shape(extend_shape_to_rank_from_end(output_pshape));
 
diff --git a/src/plugins/intel_gpu/src/graph/impls/ocl/ctc_greedy_decoder.cpp b/src/plugins/intel_gpu/src/graph/impls/ocl/ctc_greedy_decoder.cpp
index 377c863b534f1e..d9946ec0c0a37a 100644
--- a/src/plugins/intel_gpu/src/graph/impls/ocl/ctc_greedy_decoder.cpp
+++ b/src/plugins/intel_gpu/src/graph/impls/ocl/ctc_greedy_decoder.cpp
@@ -19,17 +19,6 @@ struct ctc_greedy_decoder_impl : typed_primitive_impl_ocl<ctc_greedy_decoder> {
 
     DECLARE_OBJECT_TYPE_SERIALIZATION(cldnn::ocl::ctc_greedy_decoder_impl)
 
-protected:
-    kernel_arguments_data get_arguments(const ctc_greedy_decoder_inst& instance) const override {
-        kernel_arguments_data args = parent::get_arguments(instance);
-        // Legacy multi-output
-        if (instance.desc()->num_outputs == 1) {
-            args.outputs.push_back(instance.dep_memory_ptr(instance.desc()->input_size() - 1));
-        }
-
-        return args;
-    }
-
 public:
     std::unique_ptr<primitive_impl> clone() const override {
         return make_unique<ctc_greedy_decoder_impl>(*this);
@@ -39,7 +28,6 @@ struct ctc_greedy_decoder_impl : typed_primitive_impl_ocl<ctc_greedy_decoder> {
         const auto& primitive = impl_param.typed_desc<ctc_greedy_decoder>();
         auto params = get_default_params<kernel_selector::ctc_greedy_decoder_params>(impl_param);
 
-        auto has_second_output = !primitive->second_output.empty();
         params.inputs.push_back(convert_data_tensor(impl_param.input_layouts[1]));
         params.merge_repeated = primitive->ctc_merge_repeated;
         if (primitive->blank_index == UINT32_MAX) {
@@ -48,17 +36,14 @@ struct ctc_greedy_decoder_impl : typed_primitive_impl_ocl<ctc_greedy_decoder> {
             params.blank_index = primitive->blank_index;
         }
 
+        if (primitive->blank_index == UINT32_MAX) {
+            params.blank_index = impl_param.get_input_layout(0).get_partial_shape()[2].get_length() - 1;
+        } else {
+            params.blank_index = primitive->blank_index;
+        }
         if (primitive->num_outputs == 2) {
             params.outputs_num = 2;
             params.outputs.push_back(convert_data_tensor(impl_param.get_output_layout(1)));
-
-        } else {
-            // Legacy multi-output
-            params.outputs_num = has_second_output ? 2 : 1;
-
-            if (params.outputs_num == 2) {
-                params.outputs.push_back(convert_data_tensor(impl_param.get_input_layout(1)));
-            }
         }
 
         return params;
diff --git a/src/plugins/intel_gpu/src/graph/impls/ocl/dft.cpp b/src/plugins/intel_gpu/src/graph/impls/ocl/dft.cpp
index 071c5e466a2d8f..517488443330e9 100644
--- a/src/plugins/intel_gpu/src/graph/impls/ocl/dft.cpp
+++ b/src/plugins/intel_gpu/src/graph/impls/ocl/dft.cpp
@@ -27,8 +27,7 @@ struct dft_impl : typed_primitive_impl_ocl<dft> {
         auto params = get_default_params<kernel_selector::dft_params>(impl_param);
         auto& memory_deps = impl_param.memory_deps;
 
-        bool allow_new_shape_infer = impl_param.get_program().is_new_shape_infer();
-        if (allow_new_shape_infer && primitive->axes.empty() && primitive->signal_size.empty()) {
+        if (primitive->axes.empty() && primitive->signal_size.empty()) {
             if (memory_deps.count(1)) {
                 auto axes_mem = memory_deps.at(1);
                 cldnn::mem_lock<uint8_t, mem_lock_type::read> axes_lock(axes_mem, impl_param.get_stream());
@@ -83,10 +82,10 @@ struct dft_impl : typed_primitive_impl_ocl<dft> {
             const auto output_layout = impl_param.get_output_layout();
             // No need to extend layout for input that has less than 4 dimensions
             if (input_layout.get_rank() != output_layout.get_rank()) {
-                auto new_dims = input_layout.get_dims();
+                auto new_dims = input_layout.get_partial_shape();
                 new_dims.push_back(1);
                 const auto new_fmt = format::adjust_to_rank(input_layout.format, new_dims.size());
-                params.inputs[0] = convert_data_tensor({input_layout.data_type, new_fmt, tensor(new_fmt, new_dims)});
+                params.inputs[0] = convert_data_tensor({new_dims, input_layout.data_type, new_fmt});
             }
         }
 
@@ -96,15 +95,43 @@ struct dft_impl : typed_primitive_impl_ocl<dft> {
             const auto output_layout = impl_param.get_output_layout();
             // No need to extend layout for output that has less than 4 dimensions
             if (input_layout.get_rank() != output_layout.get_rank()) {
-                auto new_dims = output_layout.get_dims();
+                auto new_dims = output_layout.get_partial_shape();
                 new_dims.push_back(1);
                 const auto new_fmt = format::adjust_to_rank(output_layout.format, new_dims.size());
-                params.outputs[0] = convert_data_tensor({output_layout.data_type, new_fmt, tensor(new_fmt, new_dims)});
+                params.outputs[0] = convert_data_tensor({new_dims, output_layout.data_type, new_fmt});
             }
         }
 
         return params;
     }
+
+    static kernel_impl_params static_canonicalize_shapes(const kernel_impl_params& impl_params) {
+        auto updated_impl_params = canonicalize_fused_shapes(impl_params);
+        auto primitive = impl_params.typed_desc<dft>();
+
+        for (auto& input_layout : updated_impl_params.input_layouts) {
+            input_layout.set_partial_shape(extend_shape_to_rank_from_end(input_layout.get_partial_shape()));
+        }
+
+        auto& output_layout = updated_impl_params.output_layouts[0];
+        auto output_shape = output_layout.get_partial_shape();
+        // Extend shape to 4d by pushing ones at the end (needed to support less than 4d cases)
+        for (auto i = output_shape.size(); i < 4; ++i) {
+            auto it = output_shape.end();
+            // For IRDFT push ones at the end, for other DTFs push ones before the last dim
+            if (primitive->direction != dft_direction::inverse || primitive->mode != dft_mode::real) {
+                it = std::prev(it);
+            }
+            output_shape.insert(it, 1);
+        }
+        output_layout.set_partial_shape(output_shape);
+
+        return updated_impl_params;
+    }
+
+    kernel_impl_params canonicalize_shapes(const kernel_impl_params& impl_params) const override {
+        return dft_impl::static_canonicalize_shapes(impl_params);
+    }
 };
 
 namespace detail {
diff --git a/src/plugins/intel_gpu/src/graph/impls/ocl/eltwise.cpp b/src/plugins/intel_gpu/src/graph/impls/ocl/eltwise.cpp
index c3772d922e3c26..5b113785058f87 100644
--- a/src/plugins/intel_gpu/src/graph/impls/ocl/eltwise.cpp
+++ b/src/plugins/intel_gpu/src/graph/impls/ocl/eltwise.cpp
@@ -129,7 +129,6 @@ struct eltwise_impl : typed_primitive_impl_ocl<eltwise> {
 
     static kernel_impl_params static_canonicalize_shapes(const kernel_impl_params& impl_params) {
         auto updated_impl_params = canonicalize_fused_shapes(impl_params);
-        bool use_new_shape_infer = impl_params.prog->is_new_shape_infer();
 
         auto& output_layout = updated_impl_params.output_layouts[0];
         auto out_pshape = output_layout.get_partial_shape();
@@ -137,7 +136,7 @@ struct eltwise_impl : typed_primitive_impl_ocl<eltwise> {
 
         for (auto& input_layout : updated_impl_params.input_layouts) {
             auto input_pshape = input_layout.get_partial_shape();
-            if (!broadcastable(input_pshape, out_pshape, use_new_shape_infer)) {
+            if (!broadcastable(input_pshape, out_pshape)) {
                 input_pshape = extend_shape_to_rank_from_begin(input_pshape, out_pshape.size());
             }
             input_layout.set_partial_shape(extend_shape_to_rank_from_end(input_pshape));
diff --git a/src/plugins/intel_gpu/src/graph/impls/ocl/embedding_bag.cpp b/src/plugins/intel_gpu/src/graph/impls/ocl/embedding_bag.cpp
index 43ed52e50b81b3..3bc53327b5fbfb 100644
--- a/src/plugins/intel_gpu/src/graph/impls/ocl/embedding_bag.cpp
+++ b/src/plugins/intel_gpu/src/graph/impls/ocl/embedding_bag.cpp
@@ -10,6 +10,34 @@
 
 namespace cldnn {
 namespace ocl {
+namespace {
+std::vector<size_t> get_kernel_arg_indices(size_t num_inputs, embedding_bag::embedding_bag_type type) {
+    std::vector<size_t> input_idx = {0, 1}; // common input indices
+    switch (type) {
+        case embedding_bag::packed_sum: {
+            if (num_inputs == 3) {
+                input_idx.push_back(2); // optional per_sample_weights
+            }
+            break;
+        }
+        case embedding_bag::offsets_sum: {
+            input_idx.push_back(2); // offsets
+            if (num_inputs == 5) {
+                input_idx.push_back(4); // optional per_sample_weights
+            }
+            break;
+        }
+        case embedding_bag::segments_sum:
+            input_idx.push_back(2); // segment_ids
+            if (num_inputs == 6) {
+                input_idx.push_back(5); // optional per_sample_weights
+            }
+            break;
+        }
+    return input_idx;
+}
+
+}  // namespace
 struct embedding_bag_impl : typed_primitive_impl_ocl<embedding_bag> {
     using parent = typed_primitive_impl_ocl<embedding_bag>;
     using parent::parent;
@@ -22,12 +50,22 @@ struct embedding_bag_impl : typed_primitive_impl_ocl<embedding_bag> {
         return make_unique<embedding_bag_impl>(*this);
     }
 
+    kernel_arguments_data get_arguments(const typed_primitive_inst<embedding_bag>& instance) const override {
+        kernel_arguments_data args = parent::get_arguments(instance);
+        args.inputs.clear();
+        auto primitive = instance.get_typed_desc<embedding_bag>();
+
+        auto input_idx = get_kernel_arg_indices(primitive->input_size(), primitive->type);
+        for (size_t i = 0; i < input_idx.size(); i++) {
+            args.inputs.push_back(instance.input_memory_ptr(input_idx[i]));
+        }
+
+        return args;
+    }
+
     static kernel_params_t get_kernel_params(const kernel_impl_params& impl_param) {
         const auto& primitive = impl_param.typed_desc<embedding_bag>();
         auto params = get_default_params<kernel_selector::embedding_bag_params>(impl_param);
-
-        auto inputs_count = impl_param.input_layouts.size();
-
         switch (primitive->type) {
         case embedding_bag::packed_sum:
             params.type = kernel_selector::EmbeddingBagType::PACKED_SUM;
@@ -41,8 +79,10 @@ struct embedding_bag_impl : typed_primitive_impl_ocl<embedding_bag> {
         default: OPENVINO_ASSERT(false, "[GPU] Unknown embedding_bag type in primitive ", primitive->id);
         }
 
-        for (size_t i = 1; i < inputs_count; i++) {
-            params.inputs.push_back(convert_data_tensor(impl_param.input_layouts[i]));
+        params.inputs.clear();
+        auto input_idx = get_kernel_arg_indices(primitive->input_size(), primitive->type);
+        for (size_t i = 0; i < input_idx.size(); i++) {
+            params.inputs.push_back(convert_data_tensor(impl_param.input_layouts[input_idx[i]]));
         }
 
         params.default_index = primitive->default_index;
diff --git a/src/plugins/intel_gpu/src/graph/impls/ocl/experimental_detectron_detection_output.cpp b/src/plugins/intel_gpu/src/graph/impls/ocl/experimental_detectron_detection_output.cpp
index df65ba8beea5c6..384643aa4f2f6b 100644
--- a/src/plugins/intel_gpu/src/graph/impls/ocl/experimental_detectron_detection_output.cpp
+++ b/src/plugins/intel_gpu/src/graph/impls/ocl/experimental_detectron_detection_output.cpp
@@ -23,17 +23,6 @@ struct experimental_detectron_detection_output_impl
         return make_unique<experimental_detectron_detection_output_impl>(*this);
     }
 
-protected:
-    kernel_arguments_data get_arguments(const typed_primitive_inst<experimental_detectron_detection_output>& instance) const override {
-        kernel_arguments_data args = parent::get_arguments(instance);
-        if (instance.desc()->num_outputs == 1) {
-            // Legacy multi-output
-            args.outputs.push_back(instance.output_classes_memory());
-            args.outputs.push_back(instance.output_scores_memory());
-        }
-
-        return args;
-    }
 
 public:
     static kernel_params_t get_kernel_params(const kernel_impl_params& impl_param) {
@@ -49,26 +38,14 @@ struct experimental_detectron_detection_output_impl
         params.class_agnostic_box_regression = primitive->class_agnostic_box_regression;
         params.deltas_weights = primitive->deltas_weights;
 
-        if (impl_param.prog->is_new_shape_infer()) {
-            const size_t num_inputs = primitive->input_size();
-            for (size_t i = 1; i < num_inputs; i++) {
-                params.inputs.push_back(convert_data_tensor(impl_param.get_input_layout(i)));
-            }
-
-            params.outputs.push_back(convert_data_tensor(impl_param.output_layouts[1]));
-            params.outputs.push_back(convert_data_tensor(impl_param.output_layouts[2]));
-        } else {
-            const size_t num_deps = primitive->input_size();
-            OPENVINO_ASSERT(num_deps == 6, "Unexpected deps num: ", num_deps);
-            const size_t num_inputs = num_deps - 2;
-            for (size_t i = 1; i < num_inputs; i++) {
-                params.inputs.push_back(convert_data_tensor(impl_param.get_input_layout(i)));
-            }
-            for (size_t i = num_inputs; i < num_deps; i++) {
-                params.outputs.push_back(convert_data_tensor(impl_param.get_input_layout(i)));
-            }
+        const size_t num_inputs = primitive->input_size();
+        for (size_t i = 1; i < num_inputs; i++) {
+            params.inputs.push_back(convert_data_tensor(impl_param.get_input_layout(i)));
         }
 
+        params.outputs.push_back(convert_data_tensor(impl_param.output_layouts[1]));
+        params.outputs.push_back(convert_data_tensor(impl_param.output_layouts[2]));
+
         return params;
     }
 };
diff --git a/src/plugins/intel_gpu/src/graph/impls/ocl/experimental_detectron_generate_proposals_single_image.cpp b/src/plugins/intel_gpu/src/graph/impls/ocl/experimental_detectron_generate_proposals_single_image.cpp
index 6242b987369126..33d53322e7c4ac 100644
--- a/src/plugins/intel_gpu/src/graph/impls/ocl/experimental_detectron_generate_proposals_single_image.cpp
+++ b/src/plugins/intel_gpu/src/graph/impls/ocl/experimental_detectron_generate_proposals_single_image.cpp
@@ -23,25 +23,6 @@ struct experimental_detectron_generate_proposals_single_image_impl
         return make_unique<experimental_detectron_generate_proposals_single_image_impl>(*this);
     }
 
-protected:
-    kernel_arguments_data get_arguments(const typed_primitive_inst<experimental_detectron_generate_proposals_single_image>& instance) const override {
-        kernel_arguments_data args;
-        if (instance.desc()->num_outputs == 1) {
-            const auto num_inputs = instance.inputs_memory_count();
-            for (size_t i = 0; i < num_inputs; ++i) {
-                args.inputs.push_back(instance.input_memory_ptr(i));
-            }
-
-            args.outputs.push_back(instance.output_memory_ptr());
-            //TODO: Future improvement: To add second output parameter only when it's needed
-            args.outputs.push_back(instance.output_roi_scores_memory());
-        } else {
-            args = parent::get_arguments(instance);
-        }
-
-        return args;
-    }
-
 public:
     static kernel_params_t get_kernel_params(const kernel_impl_params& impl_param) {
         const auto& primitive = impl_param.typed_desc<experimental_detectron_generate_proposals_single_image>();
@@ -52,25 +33,13 @@ struct experimental_detectron_generate_proposals_single_image_impl
         params.pre_nms_count = primitive->pre_nms_count;
         params.post_nms_count = primitive->post_nms_count;
 
-        if (impl_param.prog->is_new_shape_infer()) {
-            const size_t num_inputs = primitive->input_size();
-            for (size_t i = 1; i < num_inputs; i++) {
-                params.inputs.push_back(convert_data_tensor(impl_param.get_input_layout(i)));
-            }
-
-            params.outputs.push_back(convert_data_tensor(impl_param.output_layouts[1]));
-        } else {
-            const size_t num_deps = primitive->input_size();
-            OPENVINO_ASSERT(num_deps == 5, "Unexpected deps num: ", num_deps);
-            const size_t num_inputs = num_deps - 1;
-            for (size_t i = 1; i < num_inputs; i++) {
-                params.inputs.push_back(convert_data_tensor(impl_param.get_input_layout(i)));
-            }
-            for (size_t i = num_inputs; i < num_deps; i++) {
-                params.outputs.push_back(convert_data_tensor(impl_param.get_input_layout(i)));
-            }
+        const size_t num_inputs = primitive->input_size();
+        for (size_t i = 1; i < num_inputs; i++) {
+            params.inputs.push_back(convert_data_tensor(impl_param.get_input_layout(i)));
         }
 
+        params.outputs.push_back(convert_data_tensor(impl_param.output_layouts[1]));
+
         return params;
     }
 };
diff --git a/src/plugins/intel_gpu/src/graph/impls/ocl/experimental_detectron_roi_feature_extractor.cpp b/src/plugins/intel_gpu/src/graph/impls/ocl/experimental_detectron_roi_feature_extractor.cpp
index ae008547fe30b6..a15800c9a32008 100644
--- a/src/plugins/intel_gpu/src/graph/impls/ocl/experimental_detectron_roi_feature_extractor.cpp
+++ b/src/plugins/intel_gpu/src/graph/impls/ocl/experimental_detectron_roi_feature_extractor.cpp
@@ -22,6 +22,7 @@ struct experimental_detectron_roi_feature_extractor_impl : public typed_primitiv
         return make_unique<experimental_detectron_roi_feature_extractor_impl>(*this);
     }
 
+protected:
     event::ptr execute_impl(const std::vector<event::ptr>& events,
                             experimental_detectron_roi_feature_extractor_inst& instance) override {
         instance.copy_rois_input_to_second_output();
diff --git a/src/plugins/intel_gpu/src/graph/impls/ocl/fully_connected.cpp b/src/plugins/intel_gpu/src/graph/impls/ocl/fully_connected.cpp
index d3acb9dd6a9b55..98cb73249973a0 100644
--- a/src/plugins/intel_gpu/src/graph/impls/ocl/fully_connected.cpp
+++ b/src/plugins/intel_gpu/src/graph/impls/ocl/fully_connected.cpp
@@ -80,7 +80,7 @@ struct fully_connected_impl : typed_primitive_impl_ocl<fully_connected> {
     static kernel_impl_params update_impl_params(const kernel_impl_params& impl_param) {
         const auto& primitive = impl_param.typed_desc<fully_connected>();
 
-        auto get_fc_input_layouts = [primitive](const std::vector<layout>& input_layouts, bool allow_new_shape_infer) {
+        auto get_fc_input_layouts = [primitive](const std::vector<layout>& input_layouts) {
             auto reshape_to_2d = [](const ov::PartialShape& shape, const ov::Dimension& feature, size_t rank) {
                 if (shape.is_static()) {
                     auto static_shape = shape.to_shape();
@@ -98,10 +98,7 @@ struct fully_connected_impl : typed_primitive_impl_ocl<fully_connected> {
             auto input0_pshape = input0_layout.get_partial_shape();
             auto input1_pshape = input1_layout.get_partial_shape();
 
-            ov::Dimension feature = input0_pshape[std::min(primitive->input_size, static_cast<size_t>(4)) - 1ul];
-            if (allow_new_shape_infer) {
-                feature = input0_pshape[primitive->input_size - 1ul];
-            }
+            ov::Dimension feature = input0_pshape[primitive->input_size - 1ul];
 
             // TO DO, to remove WA
             if (primitive->input_size > 3) {
@@ -147,10 +144,9 @@ struct fully_connected_impl : typed_primitive_impl_ocl<fully_connected> {
             return updated_out_layout;
         };
 
-        bool allow_new_shape_infer = impl_param.get_program().is_new_shape_infer();
         auto updated_impl_param = impl_param;
 
-        const auto input_layouts = get_fc_input_layouts(impl_param.input_layouts, allow_new_shape_infer);
+        const auto input_layouts = get_fc_input_layouts(impl_param.input_layouts);
         for (size_t i = 0; i < input_layouts.size(); ++i) {
             updated_impl_param.input_layouts[i] = input_layouts[i];
         }
diff --git a/src/plugins/intel_gpu/src/graph/impls/ocl/generate_proposals.cpp b/src/plugins/intel_gpu/src/graph/impls/ocl/generate_proposals.cpp
index 244c77151a812d..4bd2c314c128e9 100644
--- a/src/plugins/intel_gpu/src/graph/impls/ocl/generate_proposals.cpp
+++ b/src/plugins/intel_gpu/src/graph/impls/ocl/generate_proposals.cpp
@@ -23,17 +23,6 @@ struct generate_proposals_impl
         return make_unique<generate_proposals_impl>(*this);
     }
 
-protected:
-    kernel_arguments_data get_arguments(const typed_primitive_inst<generate_proposals>& instance) const override {
-        auto args = parent::get_arguments(instance);
-        if (instance.desc()->num_outputs == 1) {
-            // Legacy multi-output
-            args.outputs.push_back(instance.output_rois_scores_memory());
-            args.outputs.push_back(instance.output_rois_nums_memory());
-        }
-        return args;
-    }
-
 public:
     static kernel_params_t get_kernel_params(const kernel_impl_params& impl_param) {
         const auto& primitive = impl_param.typed_desc<generate_proposals>();
@@ -45,29 +34,16 @@ struct generate_proposals_impl
         params.post_nms_count = primitive->attrs.post_nms_count;
         params.normalized = primitive->attrs.normalized;
         params.nms_eta = primitive->attrs.nms_eta;
+        params.roi_num_type = to_data_type(primitive->output_data_types[2].value());
 
-        if (impl_param.prog-> is_new_shape_infer()) {
-            params.roi_num_type = to_data_type(primitive->output_data_types[2].value());
-            const size_t num_inputs = primitive->input_size();
-            for (size_t i = 1; i < num_inputs; i++) {
-                params.inputs.push_back(convert_data_tensor(impl_param.get_input_layout(i)));
-            }
-
-            params.outputs.push_back(convert_data_tensor(impl_param.output_layouts[1]));
-            params.outputs.push_back(convert_data_tensor(impl_param.output_layouts[2]));
-        } else {
-            params.roi_num_type = primitive->roi_num_type == cldnn::data_types::i32 ? kernel_selector::Datatype::INT32 : kernel_selector::Datatype::INT64;
-            const size_t num_deps = primitive->input_size();
-            OPENVINO_ASSERT(num_deps == 6, "Unexpected deps num: ", num_deps);
-            const size_t num_inputs = num_deps - 2;
-            for (size_t i = 1; i < num_inputs; i++) {
-                params.inputs.push_back(convert_data_tensor(impl_param.get_input_layout(i)));
-            }
-            for (size_t i = num_inputs; i < num_deps; i++) {
-                params.outputs.push_back(convert_data_tensor(impl_param.get_input_layout(i)));
-            }
+        const size_t num_inputs = primitive->input_size();
+        for (size_t i = 1; i < num_inputs; i++) {
+            params.inputs.push_back(convert_data_tensor(impl_param.get_input_layout(i)));
         }
 
+        params.outputs.push_back(convert_data_tensor(impl_param.output_layouts[1]));
+        params.outputs.push_back(convert_data_tensor(impl_param.output_layouts[2]));
+
         return params;
     }
 };
diff --git a/src/plugins/intel_gpu/src/graph/impls/ocl/kernel_selector_helper.h b/src/plugins/intel_gpu/src/graph/impls/ocl/kernel_selector_helper.h
index 3ddb5bf8793c29..4229cd57128ebb 100644
--- a/src/plugins/intel_gpu/src/graph/impls/ocl/kernel_selector_helper.h
+++ b/src/plugins/intel_gpu/src/graph/impls/ocl/kernel_selector_helper.h
@@ -117,6 +117,17 @@ kernel_selector::dim_tensor<T> convert_dim_vector(const tensor& t) {
             static_cast<T>(sizes[5])};
 }
 
+
+inline kernel_selector::DimTensor<uint32_t> convert_vec_to_dim_tensor(const std::vector<int32_t>& p, size_t out_rank, int32_t default_value) {
+    auto sizes = p;
+    auto format = cldnn::format::get_default_format(out_rank);
+    for (size_t s = sizes.size(); s < format.dimension(); s++) {
+        sizes.push_back(default_value);
+    }
+    tensor block_shape(format, sizes, default_value);
+    return convert_dim_vector(block_shape);
+}
+
 std::shared_ptr<kernel_selector::fuse_params> convert_fuse_params(std::shared_ptr<NodeFuseParams> p);
 void convert_fused_ops_to_legacy_activations(const kernel_impl_params& param_info, std::vector<kernel_selector::base_activation_params>& activations);
 bool use_legacy_fused_ops(const kernel_impl_params& param_info);
@@ -233,8 +244,7 @@ inline ov::PartialShape extend_shape_to_rank_from_begin(const ov::PartialShape&
     return extended_pshape;
 }
 
-inline bool broadcastable(const ov::PartialShape& first_pshape, const ov::PartialShape& second_pshape, bool use_new_shape_infer,
-                          bool first_to_second_only = false) {
+inline bool broadcastable(const ov::PartialShape& first_pshape, const ov::PartialShape& second_pshape, bool first_to_second_only = false) {
     if (first_pshape.is_dynamic() || second_pshape.is_dynamic()) {
         return false;
     }
@@ -243,7 +253,7 @@ inline bool broadcastable(const ov::PartialShape& first_pshape, const ov::Partia
             return false;
         }
     } else {
-        if (first_pshape.size() != second_pshape.size() && use_new_shape_infer) {
+        if (first_pshape.size() != second_pshape.size()) {
             return false;
         }
     }
@@ -259,7 +269,6 @@ inline bool broadcastable(const ov::PartialShape& first_pshape, const ov::Partia
 
 inline kernel_impl_params canonicalize_fused_shapes(const kernel_impl_params& impl_params) {
     auto updated_impl_params = impl_params;
-    bool use_new_shape_infer = impl_params.prog->is_new_shape_infer();
 
     for (auto& fd : updated_impl_params.fused_desc) {
         if (fd.is_type<eltwise>() && fd.total_num_deps == 2 && fd.has_outer_dep()) {
@@ -269,7 +278,7 @@ inline kernel_impl_params canonicalize_fused_shapes(const kernel_impl_params& im
                 auto& dep_layout = updated_impl_params.input_layouts[fd.outer_dep_start_idx];
                 const auto& dep_shape = dep_layout.get_partial_shape();
 
-                if (!broadcastable(dep_shape, out_pshape, use_new_shape_infer)) {
+                if (!broadcastable(dep_shape, out_pshape)) {
                     dep_layout.set_partial_shape(extend_shape_to_rank_from_begin(dep_shape, out_pshape.size()));
                 }
             }
diff --git a/src/plugins/intel_gpu/src/graph/impls/ocl/matrix_nms.cpp b/src/plugins/intel_gpu/src/graph/impls/ocl/matrix_nms.cpp
index 4e6a32ace1d8ef..3cc16f2fde4911 100644
--- a/src/plugins/intel_gpu/src/graph/impls/ocl/matrix_nms.cpp
+++ b/src/plugins/intel_gpu/src/graph/impls/ocl/matrix_nms.cpp
@@ -47,33 +47,14 @@ struct matrix_nms_impl : typed_primitive_impl_ocl<matrix_nms> {
         return make_unique<matrix_nms_impl>(*this);
     }
 
-protected:
-    kernel_arguments_data get_arguments(const matrix_nms_inst& instance) const override {
-        kernel_arguments_data args = parent::get_arguments(instance);
-        // Legacy multi-output
-        if (instance.desc()->num_outputs == 1) {
-            args.outputs.push_back(instance.input_selected_boxes_mem());
-            args.outputs.push_back(instance.input_valid_outputs_mem());
-        }
-
-        return args;
-    }
-
 public:
     static kernel_params_t get_kernel_params(const kernel_impl_params& impl_param) {
         const auto& primitive = impl_param.typed_desc<matrix_nms>();
         auto params = get_default_params<kernel_selector::matrix_nms_params>(impl_param);
 
         params.inputs.push_back(convert_data_tensor(impl_param.input_layouts[1]));
-
-        if (primitive->num_outputs == 3) {
-            params.outputs.push_back(convert_data_tensor(impl_param.output_layouts[1]));
-            params.outputs.push_back(convert_data_tensor(impl_param.output_layouts[2]));
-        } else {
-            // Legacy multi-output
-            params.outputs.push_back(convert_data_tensor(impl_param.get_input_layout(2)));
-            params.outputs.push_back(convert_data_tensor(impl_param.get_input_layout(3)));
-        }
+        params.outputs.push_back(convert_data_tensor(impl_param.output_layouts[1]));
+        params.outputs.push_back(convert_data_tensor(impl_param.output_layouts[2]));
 
         params.sort_type = from(primitive->attribs.sort_result_type);
         params.sort_result_across_batch = primitive->attribs.sort_result_across_batch;
diff --git a/src/plugins/intel_gpu/src/graph/impls/ocl/multiclass_nms.cpp b/src/plugins/intel_gpu/src/graph/impls/ocl/multiclass_nms.cpp
index c07bf9dac81daa..3907f6019a58fa 100644
--- a/src/plugins/intel_gpu/src/graph/impls/ocl/multiclass_nms.cpp
+++ b/src/plugins/intel_gpu/src/graph/impls/ocl/multiclass_nms.cpp
@@ -43,17 +43,6 @@ struct multiclass_nms_impl : public typed_primitive_impl_ocl<multiclass_nms> {
         return make_unique<multiclass_nms_impl>(*this);
     }
 
-protected:
-    kernel_arguments_data get_arguments(const typed_primitive_inst<multiclass_nms>& instance) const override {
-        kernel_arguments_data args = parent::get_arguments(instance);
-        // Legacy multi-output
-        if (instance.desc()->num_outputs == 1) {
-            args.outputs.push_back(instance.output_indices_memory());
-            args.outputs.push_back(instance.output_num_memory());
-        }
-        return args;
-    }
-
 public:
    static kernel_params_t get_kernel_params(const kernel_impl_params& impl_param) {
         const auto& primitive = impl_param.typed_desc<multiclass_nms>();
@@ -70,24 +59,14 @@ struct multiclass_nms_impl : public typed_primitive_impl_ocl<multiclass_nms> {
         params.background_class = attrs.background_class;
         params.normalized = attrs.normalized;
         params.nms_eta = attrs.nms_eta;
-        params.has_roisnum = primitive->has_roisnum;
-
-        size_t inputs_num = primitive->has_roisnum ? 3 : 2;
 
         params.inputs.push_back(convert_data_tensor(impl_param.input_layouts[1]));
-        if (inputs_num == 3) {
+        if (primitive->input_size() == 3) {
             params.inputs.push_back(convert_data_tensor(impl_param.input_layouts[2]));
             params.has_roisnum = true;
         }
-
-        if (primitive->num_outputs == 3) {
-            params.outputs.push_back(convert_data_tensor(impl_param.output_layouts[1]));
-            params.outputs.push_back(convert_data_tensor(impl_param.output_layouts[2]));
-        } else {
-            // Legacy multi-output
-            params.outputs.push_back(convert_data_tensor(impl_param.input_layouts[inputs_num + 0]));
-            params.outputs.push_back(convert_data_tensor(impl_param.input_layouts[inputs_num + 1]));
-        }
+        params.outputs.push_back(convert_data_tensor(impl_param.output_layouts[1]));
+        params.outputs.push_back(convert_data_tensor(impl_param.output_layouts[2]));
 
         return params;
     }
diff --git a/src/plugins/intel_gpu/src/graph/impls/ocl/non_max_suppression.cpp b/src/plugins/intel_gpu/src/graph/impls/ocl/non_max_suppression.cpp
index 65bfa94173bf11..61fdad39a67841 100644
--- a/src/plugins/intel_gpu/src/graph/impls/ocl/non_max_suppression.cpp
+++ b/src/plugins/intel_gpu/src/graph/impls/ocl/non_max_suppression.cpp
@@ -46,15 +46,9 @@ struct non_max_suppression_impl : typed_primitive_impl_ocl<non_max_suppression>
             args.inputs.push_back(instance.soft_nms_sigma_mem());
         }
 
-        // New API for mutiple outputs support
         for (size_t i = 0; i < instance.outputs_memory_count(); i++) {
             args.outputs.push_back(instance.output_memory_ptr(i));
         }
-        // // Legacy multi-output
-        if (instance.has_second_output())
-            args.outputs.push_back(instance.second_output_mem());
-        if (instance.has_third_output())
-            args.outputs.push_back(instance.third_output_mem());
 
         return args;
     }
@@ -112,29 +106,8 @@ static kernel_params_t get_kernel_params(const kernel_impl_params& impl_param, b
             }
         }
 
-        auto get_additional_output_node_idx = [&] (bool is_third) {
-            size_t offset = 2;
-            offset += arg.has_num_select_per_class();
-            offset += arg.has_iou_threshold();
-            offset += arg.has_score_threshold();
-            offset += arg.has_soft_nms_sigma();
-            if (is_third)
-                offset += arg.has_second_output();
-            return offset;
-        };
-
-        // Legacy multi-output
-        if (arg.has_second_output()) {
-            params.outputs.push_back(convert_data_tensor(impl_param.input_layouts[get_additional_output_node_idx(false)]));
-        }
-
-        if (arg.has_third_output()) {
-            params.outputs.push_back(convert_data_tensor(impl_param.input_layouts[get_additional_output_node_idx(true)]));
-        }
-
-        if (arg.use_multiple_outputs()) {
-            params.outputs.push_back(convert_data_tensor(impl_param.output_layouts[1]));
-            params.outputs.push_back(convert_data_tensor(impl_param.output_layouts[2]));
+        for (size_t i = 1; i < primitive->num_outputs; i++) {
+            params.outputs.push_back(convert_data_tensor(impl_param.output_layouts[i]));
         }
 
         params.sort_result_descending = primitive->sort_result_descending;
diff --git a/src/plugins/intel_gpu/src/graph/impls/ocl/pooling.cpp b/src/plugins/intel_gpu/src/graph/impls/ocl/pooling.cpp
index d9496db3377915..63a12cdbd6f0d0 100644
--- a/src/plugins/intel_gpu/src/graph/impls/ocl/pooling.cpp
+++ b/src/plugins/intel_gpu/src/graph/impls/ocl/pooling.cpp
@@ -2,6 +2,7 @@
 // SPDX-License-Identifier: Apache-2.0
 //
 
+#include "impls/ocl/kernel_selector_helper.h"
 #include "openvino/core/validation_util.hpp"
 #include "pooling/pooling_kernel_base.h"
 #include "pooling/pooling_kernel_selector.h"
@@ -54,17 +55,6 @@ struct pooling_impl : typed_primitive_impl_ocl<pooling> {
         return make_unique<pooling_impl>(*this);
     }
 
-protected:
-    kernel_arguments_data get_arguments(const typed_primitive_inst<pooling>& instance) const override {
-        kernel_arguments_data args = parent::get_arguments(instance);
-        // Legacy multi-output
-        if (instance.get_typed_desc<pooling>()->maxPoolOpset8Features) {
-            args.inputs = { instance.dep_memory_ptr(0) };
-            args.outputs.push_back(instance.dep_memory_ptr(1));
-        }
-        return args;
-    }
-
 public:
     static kernel_params_t get_kernel_params(const kernel_impl_params& impl_param) {
         const auto& primitive = impl_param.typed_desc<pooling>();
@@ -72,19 +62,12 @@ struct pooling_impl : typed_primitive_impl_ocl<pooling> {
 
         params.maxPoolOpset8Features = primitive->maxPoolOpset8Features;
         if (params.maxPoolOpset8Features) {
-            switch (primitive->index_element_type) {
-                case cldnn::data_types::i32: {
-                    params.poolIndexElementType = kernel_selector::Datatype::INT32;
-                    break;
-                }
-                case cldnn::data_types::i64: {
-                    params.poolIndexElementType = kernel_selector::Datatype::INT64;
-                    break;
-                }
-                default:
-                    throw std::runtime_error{"Not supported index element type"};
-            }
+            params.poolIndexElementType = to_data_type(primitive->index_element_type);
             params.poolAxis = primitive->axis;
+
+            if (primitive->num_outputs == 2) {
+                params.outputs.push_back(convert_data_tensor(impl_param.get_output_layout(1)));
+            }
         }
 
         const auto& input_layout = impl_param.get_input_layout();
diff --git a/src/plugins/intel_gpu/src/graph/impls/ocl/reverse.cpp b/src/plugins/intel_gpu/src/graph/impls/ocl/reverse.cpp
index aee736b6871299..e925f4103e3956 100644
--- a/src/plugins/intel_gpu/src/graph/impls/ocl/reverse.cpp
+++ b/src/plugins/intel_gpu/src/graph/impls/ocl/reverse.cpp
@@ -28,8 +28,8 @@ struct reverse_impl : typed_primitive_impl_ocl<reverse> {
         auto params = get_default_params<kernel_selector::reverse_params>(impl_param);
 
         params.inputs.push_back(convert_data_tensor(impl_param.get_input_layout(1)));
-        params.reverseMode = primitive->mode == reverse_mode::index ? kernel_selector::reverse_mode::index
-                                                                    : kernel_selector::reverse_mode::mask;
+        params.reverseMode = primitive->mode == ov::op::v1::Reverse::Mode::INDEX ? kernel_selector::reverse_mode::index
+                                                                                 : kernel_selector::reverse_mode::mask;
         return params;
     }
 };
diff --git a/src/plugins/intel_gpu/src/graph/impls/ocl/roll.cpp b/src/plugins/intel_gpu/src/graph/impls/ocl/roll.cpp
index 85cff366ac18bf..d5fb1dbb6cc569 100644
--- a/src/plugins/intel_gpu/src/graph/impls/ocl/roll.cpp
+++ b/src/plugins/intel_gpu/src/graph/impls/ocl/roll.cpp
@@ -26,44 +26,38 @@ struct roll_impl : typed_primitive_impl_ocl<roll> {
     static kernel_params_t get_kernel_params(const kernel_impl_params& impl_param) {
         const auto& primitive = impl_param.typed_desc<roll>();
         auto params = get_default_params<kernel_selector::roll_params>(impl_param);
-
-        if ((primitive->raw_shift.empty()) && (primitive->raw_axes.empty())) {
-            // Primitive created with static shape input
-            params.shift = convert_dim_vector(primitive->shift);
-        } else {
-            // Primitive created with dynamic shape input
-            const auto input_layout = impl_param.get_input_layout(0);
-            const auto& input_shape = input_layout.get_shape();
-            const auto rank = static_cast<int>(input_layout.get_rank());
-            const auto format = cldnn::format::get_default_format(rank);
-            const auto default_rank = format.dimension();
-            auto axes_raw = primitive->raw_axes;
-            auto shift_raw = primitive->raw_shift;
-
-            // Normalize axes and sum shift
-            std::vector<int32_t> shift(default_rank);
-            for (size_t a = 0; a < axes_raw.size(); ++a) {
-                auto& axis = axes_raw[a];
-                if (axis < 0) {
-                    axis += rank;
-                }
-                if (axis < 0 || axis >= rank) {
-                    OPENVINO_THROW(" Incorrect axis value: ", axis);
-                }
-                shift[axis] += shift_raw[a];
+        // Primitive created with dynamic shape input
+        const auto input_layout = impl_param.get_input_layout(0);
+        const auto& input_shape = input_layout.get_shape();
+        const auto rank = static_cast<int32_t>(input_layout.get_rank());
+        const auto format = cldnn::format::get_default_format(rank);
+        const auto default_rank = format.dimension();
+        auto axes_raw = primitive->raw_axes;
+        auto shift_raw = primitive->raw_shift;
+
+        // Normalize axes and sum shift
+        std::vector<int32_t> shift(default_rank);
+        for (size_t a = 0; a < axes_raw.size(); ++a) {
+            auto& axis = axes_raw[a];
+            if (axis < 0) {
+                axis += rank;
+            }
+            if (axis < 0 || axis >= rank) {
+                OPENVINO_THROW(" Incorrect axis value: ", axis);
             }
+            shift[axis] += shift_raw[a];
+        }
 
-            // Normalize shift
-            for (int s = 0; s < rank; ++s) {
-                auto& sh = shift[s];
-                const auto dim = static_cast<int32_t>(input_shape[s]);
-                sh %= dim;
-                if (sh < 0) {
-                    sh += dim;
-                }
+        // Normalize shift
+        for (int s = 0; s < rank; ++s) {
+            auto& sh = shift[s];
+            const auto dim = static_cast<int32_t>(input_shape[s]);
+            sh %= dim;
+            if (sh < 0) {
+                sh += dim;
             }
-            params.shift = convert_dim_vector({format, shift});
         }
+        params.shift = convert_vec_to_dim_tensor(shift, input_layout.get_rank(), 0);
         return params;
     }
 };
@@ -90,13 +84,7 @@ attach_roll_impl::attach_roll_impl() {
 
         format::bfwzyx
     };
-    std::set<std::tuple<data_types, format::type>> keys;
-    for (const auto& t : types) {
-        for (const auto& f : formats) {
-            keys.emplace(t, f);
-        }
-    }
-    implementation_map<roll>::add(impl_types::ocl, typed_primitive_impl_ocl<roll>::create<roll_impl>, keys);
+    implementation_map<roll>::add(impl_types::ocl, typed_primitive_impl_ocl<roll>::create<roll_impl>, types, formats);
 }
 
 }  // namespace detail
diff --git a/src/plugins/intel_gpu/src/graph/impls/ocl/space_to_batch.cpp b/src/plugins/intel_gpu/src/graph/impls/ocl/space_to_batch.cpp
index 75568cc8984bd3..a83e2514cbb106 100644
--- a/src/plugins/intel_gpu/src/graph/impls/ocl/space_to_batch.cpp
+++ b/src/plugins/intel_gpu/src/graph/impls/ocl/space_to_batch.cpp
@@ -10,6 +10,7 @@
 
 namespace cldnn {
 namespace ocl {
+
 struct space_to_batch_impl : typed_primitive_impl_ocl<space_to_batch> {
     using parent = typed_primitive_impl_ocl<space_to_batch>;
     using parent::parent;
@@ -25,16 +26,17 @@ struct space_to_batch_impl : typed_primitive_impl_ocl<space_to_batch> {
     static kernel_params_t get_kernel_params(const kernel_impl_params& impl_param, bool is_shape_agnostic = false) {
         const auto& primitive = impl_param.typed_desc<space_to_batch>();
         auto params = get_default_params<kernel_selector::space_to_batch_params>(impl_param);
+        auto out_rank = impl_param.output_layouts[0].get_rank();
 
         if (primitive->shape_constant) {
             params.block_type = kernel_selector::base_params::ArgType::Constant;
-            params.block_shape = convert_dim_vector(primitive->block_shape);
+            params.block_shape = convert_vec_to_dim_tensor(primitive->block_shape, out_rank, 1);
 
             params.begin_type = kernel_selector::base_params::ArgType::Constant;
-            params.pads_begin = convert_dim_vector(primitive->pads_begin);
+            params.pads_begin = convert_vec_to_dim_tensor(primitive->pads_begin, out_rank, 0);
 
             params.end_type = kernel_selector::base_params::ArgType::Constant;
-            params.pads_end = convert_dim_vector(primitive->pads_end);
+            params.pads_end = convert_vec_to_dim_tensor(primitive->pads_end, out_rank, 0);
         } else {
             params.block_input_index = 1;
             params.block_type = kernel_selector::base_params::ArgType::Input;
diff --git a/src/plugins/intel_gpu/src/graph/impls/onednn/primitive_onednn_base.h b/src/plugins/intel_gpu/src/graph/impls/onednn/primitive_onednn_base.h
index 57fd4afbe933d6..8d9b88e5a0c652 100644
--- a/src/plugins/intel_gpu/src/graph/impls/onednn/primitive_onednn_base.h
+++ b/src/plugins/intel_gpu/src/graph/impls/onednn/primitive_onednn_base.h
@@ -353,10 +353,6 @@ struct typed_primitive_onednn_impl : public typed_primitive_impl<PType> {
     void build_primitive(const ExecutionConfig& config) {
         auto cache_outpath = get_cache_directory(config);
 
-        if (!config.get_property(ov::intel_gpu::allow_new_shape_infer)) {
-            cache_outpath = "";
-        }
-
         if (cache_outpath.empty()) {
             _prim = PrimType(_pd);
         } else {
diff --git a/src/plugins/intel_gpu/src/graph/include/activation_inst.h b/src/plugins/intel_gpu/src/graph/include/activation_inst.h
index 83c89ea6fe023d..2440b18968638e 100644
--- a/src/plugins/intel_gpu/src/graph/include/activation_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/activation_inst.h
@@ -54,7 +54,6 @@ class typed_primitive_inst<activation> : public typed_primitive_inst_base<activa
         return forward_input0_shape<ShapeType>(impl_param);
     }
 
-    static layout calc_output_layout(activation_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(activation_node const& node);
 
     typed_primitive_inst(network& network, activation_node const& node);
diff --git a/src/plugins/intel_gpu/src/graph/include/adaptive_pooling_inst.h b/src/plugins/intel_gpu/src/graph/include/adaptive_pooling_inst.h
index 59ac50aa567ab0..2fc9deecd29f14 100644
--- a/src/plugins/intel_gpu/src/graph/include/adaptive_pooling_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/adaptive_pooling_inst.h
@@ -29,7 +29,6 @@ class typed_primitive_inst<adaptive_pooling> : public typed_primitive_inst_base<
 public:
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(adaptive_pooling_node const& /*node*/, const kernel_impl_params& impl_param);
-    static layout calc_output_layout(adaptive_pooling_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(adaptive_pooling_node const& node);
 
     typed_primitive_inst(network& network, adaptive_pooling_node const& node);
diff --git a/src/plugins/intel_gpu/src/graph/include/arg_max_min_inst.h b/src/plugins/intel_gpu/src/graph/include/arg_max_min_inst.h
index e7a19946e96021..90f45f8fb94e91 100644
--- a/src/plugins/intel_gpu/src/graph/include/arg_max_min_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/arg_max_min_inst.h
@@ -32,7 +32,6 @@ class typed_primitive_inst<arg_max_min> : public typed_primitive_inst_base<arg_m
 public:
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(arg_max_min_node const& /*node*/, const kernel_impl_params& impl_param);
-    static layout calc_output_layout(arg_max_min_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(arg_max_min_node const& node);
 
 public:
diff --git a/src/plugins/intel_gpu/src/graph/include/assign_inst.h b/src/plugins/intel_gpu/src/graph/include/assign_inst.h
index 0c92345e173e0d..80a3ea173e645d 100644
--- a/src/plugins/intel_gpu/src/graph/include/assign_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/assign_inst.h
@@ -34,8 +34,6 @@ class typed_primitive_inst<assign> : public typed_primitive_inst_base<assign>, p
         return forward_input0_shape<ShapeType>(impl_param);
     }
 
-    static layout calc_output_layout(const assign_node& node, kernel_impl_params const& impl_param);
-
     static std::string to_string(const assign_node& node);
 
     typed_primitive_inst(network& network, const assign_node& desc);
diff --git a/src/plugins/intel_gpu/src/graph/include/batch_to_space_inst.h b/src/plugins/intel_gpu/src/graph/include/batch_to_space_inst.h
index 8f9668f370f02e..8b7fc918fc8e50 100644
--- a/src/plugins/intel_gpu/src/graph/include/batch_to_space_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/batch_to_space_inst.h
@@ -30,7 +30,6 @@ class typed_primitive_inst<batch_to_space> : public typed_primitive_inst_base<ba
 public:
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(batch_to_space_node const& /*node*/, const kernel_impl_params& impl_param);
-    static layout calc_output_layout(batch_to_space_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(batch_to_space_node const& node);
 
     bool need_reset_output_memory() const override {
diff --git a/src/plugins/intel_gpu/src/graph/include/border_inst.h b/src/plugins/intel_gpu/src/graph/include/border_inst.h
index 67a08ea0e97d58..3fec5a6072957c 100644
--- a/src/plugins/intel_gpu/src/graph/include/border_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/border_inst.h
@@ -35,7 +35,6 @@ class typed_primitive_inst<border> : public typed_primitive_inst_base<border> {
 public:
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(border_node const& /*node*/, const kernel_impl_params& impl_param);
-    static layout calc_output_layout(border_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(border_node const& node);
     typed_primitive_inst(network& network, border_node const& node);
 };
diff --git a/src/plugins/intel_gpu/src/graph/include/broadcast_inst.h b/src/plugins/intel_gpu/src/graph/include/broadcast_inst.h
index 9b9b34574498b9..de0e5bad235f77 100644
--- a/src/plugins/intel_gpu/src/graph/include/broadcast_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/broadcast_inst.h
@@ -36,7 +36,6 @@ class typed_primitive_inst<broadcast> : public typed_primitive_inst_base<broadca
 public:
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(broadcast_node const& /*node*/, const kernel_impl_params& impl_param);
-    static layout calc_output_layout(broadcast_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(broadcast_node const& node);
     typed_primitive_inst(network& network, broadcast_node const& node);
     void update_output_memory() override;
diff --git a/src/plugins/intel_gpu/src/graph/include/bucketize_inst.hpp b/src/plugins/intel_gpu/src/graph/include/bucketize_inst.hpp
index 884011037d51bf..b6245135ab9919 100644
--- a/src/plugins/intel_gpu/src/graph/include/bucketize_inst.hpp
+++ b/src/plugins/intel_gpu/src/graph/include/bucketize_inst.hpp
@@ -21,7 +21,6 @@ class typed_primitive_inst<bucketize> : public typed_primitive_inst_base<bucketi
         return forward_input0_shape<ShapeType>(impl_param);
     }
 
-    static layout calc_output_layout(const bucketize_node& node, kernel_impl_params const& impl_param);
     static std::string to_string(const bucketize_node& node);
 };
 
diff --git a/src/plugins/intel_gpu/src/graph/include/concatenation_inst.h b/src/plugins/intel_gpu/src/graph/include/concatenation_inst.h
index 30f100fd04c80f..7c90cc13331321 100644
--- a/src/plugins/intel_gpu/src/graph/include/concatenation_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/concatenation_inst.h
@@ -36,7 +36,6 @@ class typed_primitive_inst<concatenation> : public typed_primitive_inst_base<con
 public:
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(const concatenation_node& /* node */, const kernel_impl_params& impl_param);
-    static layout calc_output_layout(concatenation_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(concatenation_node const& node);
 
     typed_primitive_inst(network& network, concatenation_node const& node);
diff --git a/src/plugins/intel_gpu/src/graph/include/condition_inst.h b/src/plugins/intel_gpu/src/graph/include/condition_inst.h
index d15ed5ff864862..1bd95bb4c5ba1f 100644
--- a/src/plugins/intel_gpu/src/graph/include/condition_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/condition_inst.h
@@ -67,7 +67,6 @@ class typed_primitive_inst<condition> : public typed_primitive_inst_base<conditi
 public:
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(condition_node const& /*node*/, kernel_impl_params const& impl_param);
-    static layout calc_output_layout(condition_node const& /* node */, kernel_impl_params const& impl_param);
     static std::string to_string(condition_node const& node);
     static bool get_pred_from_memory(memory::ptr mem, stream& stream);
     typed_primitive_inst(network& network, condition_node const& node);
diff --git a/src/plugins/intel_gpu/src/graph/include/convert_color_inst.h b/src/plugins/intel_gpu/src/graph/include/convert_color_inst.h
index dcdd113416e0f1..d1b8ed80831271 100644
--- a/src/plugins/intel_gpu/src/graph/include/convert_color_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/convert_color_inst.h
@@ -26,8 +26,7 @@ class typed_primitive_inst<convert_color> : public typed_primitive_inst_base<con
 
 public:
     template<typename ShapeType>
-    static std::vector<layout> calc_output_layouts(convert_color_node const& /* node */, const kernel_impl_params& impl_param);
-    static layout calc_output_layout(convert_color_node const& node, kernel_impl_params const& impl_param);
+    static std::vector<layout> calc_output_layouts(convert_color_node const& node, const kernel_impl_params& impl_param);
     static std::string to_string(convert_color_node const& node);
     typed_primitive_inst(network& network, convert_color_node const& desc);
 };
diff --git a/src/plugins/intel_gpu/src/graph/include/convolution_inst.h b/src/plugins/intel_gpu/src/graph/include/convolution_inst.h
index c66bd35fb1daed..459f909d829a09 100644
--- a/src/plugins/intel_gpu/src/graph/include/convolution_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/convolution_inst.h
@@ -125,7 +125,6 @@ class typed_primitive_inst<convolution> : public typed_primitive_inst_base<convo
 public:
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(convolution_node const& node, kernel_impl_params const& impl_param);
-    static layout calc_output_layout(convolution_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(convolution_node const& node);
 
     bool need_reset_input_memory(size_t idx = 0) const override {
diff --git a/src/plugins/intel_gpu/src/graph/include/crop_inst.h b/src/plugins/intel_gpu/src/graph/include/crop_inst.h
index 30b0839caaaefc..c732467eb7f6f2 100644
--- a/src/plugins/intel_gpu/src/graph/include/crop_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/crop_inst.h
@@ -51,7 +51,6 @@ class typed_primitive_inst<crop> : public typed_primitive_inst_base<crop> {
 public:
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(const crop_node& /*node*/, const kernel_impl_params& impl_param);
-    static layout calc_output_layout(crop_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(crop_node const& node);
     typed_primitive_inst(network& network, crop_node const& node);
     void update_output_memory() override;
diff --git a/src/plugins/intel_gpu/src/graph/include/ctc_greedy_decoder_inst.h b/src/plugins/intel_gpu/src/graph/include/ctc_greedy_decoder_inst.h
index 24c4780928d24a..d0e61338ef7369 100644
--- a/src/plugins/intel_gpu/src/graph/include/ctc_greedy_decoder_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/ctc_greedy_decoder_inst.h
@@ -19,9 +19,6 @@ struct typed_program_node<ctc_greedy_decoder> : public typed_program_node_base<c
 
     program_node& input() const { return get_dependency(0); }
     program_node& seq_indicators() const { return get_dependency(1); }
-
-    bool has_second_output() const { return !get_primitive()->second_output.empty(); }
-    program_node& second_output() const { return get_dependency(2); }
 };
 
 using ctc_greedy_decoder_node = typed_program_node<ctc_greedy_decoder>;
@@ -34,7 +31,6 @@ class typed_primitive_inst<ctc_greedy_decoder> : public typed_primitive_inst_bas
 public:
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(ctc_greedy_decoder_node const& /*node*/, const kernel_impl_params& impl_param);
-    static layout calc_output_layout(ctc_greedy_decoder_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(ctc_greedy_decoder_node const& node);
 
 public:
diff --git a/src/plugins/intel_gpu/src/graph/include/ctc_loss_inst.hpp b/src/plugins/intel_gpu/src/graph/include/ctc_loss_inst.hpp
index 4a750a64678689..24d086c25ed1f8 100644
--- a/src/plugins/intel_gpu/src/graph/include/ctc_loss_inst.hpp
+++ b/src/plugins/intel_gpu/src/graph/include/ctc_loss_inst.hpp
@@ -27,7 +27,7 @@ class typed_primitive_inst<ctc_loss> : public typed_primitive_inst_base<ctc_loss
     using parent::parent;
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(ctc_loss_node const& /*node*/, const kernel_impl_params& impl_param);
-    static layout calc_output_layout(const ctc_loss_node& node, kernel_impl_params const& impl_param);
+
     static std::string to_string(const ctc_loss_node& node);
 };
 
diff --git a/src/plugins/intel_gpu/src/graph/include/cum_sum_inst.h b/src/plugins/intel_gpu/src/graph/include/cum_sum_inst.h
index 0599a640bb2b4b..0e5690737fb6b5 100644
--- a/src/plugins/intel_gpu/src/graph/include/cum_sum_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/cum_sum_inst.h
@@ -32,7 +32,6 @@ class typed_primitive_inst<cum_sum> : public typed_primitive_inst_base<cum_sum>
         return forward_input0_shape<ShapeType>(impl_param);
     }
 
-    static layout calc_output_layout(cum_sum_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(cum_sum_node const& node);
     typed_primitive_inst(network& network, cum_sum_node const& desc);
 };
diff --git a/src/plugins/intel_gpu/src/graph/include/custom_gpu_primitive_inst.h b/src/plugins/intel_gpu/src/graph/include/custom_gpu_primitive_inst.h
index a414067d74065a..79d94206b1c18e 100644
--- a/src/plugins/intel_gpu/src/graph/include/custom_gpu_primitive_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/custom_gpu_primitive_inst.h
@@ -32,20 +32,6 @@ class typed_primitive_inst<custom_gpu_primitive> : public typed_primitive_inst_b
         return { output_layout };
     }
 
-    static layout calc_output_layout(custom_gpu_primitive_node const& node, kernel_impl_params const& impl_param) {
-        assert(static_cast<bool>(impl_param.desc->output_data_types[0]) == false &&
-               "Output data type forcing is not supported for "
-               "custom_gpu_primitive_node!");
-        layout output_layout = impl_param.typed_desc<custom_gpu_primitive>()->output_layout;
-
-        // if the output layout format was set to any, it means the layer output format will be the same as the first
-        // input
-        if (output_layout.format == format::any) {
-            output_layout.format = impl_param.get_input_layout().format;
-        }
-        return output_layout;
-    }
-
     static std::string to_string(custom_gpu_primitive_node const& node);
 
 public:
diff --git a/src/plugins/intel_gpu/src/graph/include/data_inst.h b/src/plugins/intel_gpu/src/graph/include/data_inst.h
index 362c73d9e1b0a9..be37656e0121f6 100644
--- a/src/plugins/intel_gpu/src/graph/include/data_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/data_inst.h
@@ -38,10 +38,6 @@ class typed_primitive_inst<data> : public typed_primitive_inst_base<data> {
         return { node.get_attached_memory().get_layout() };
     }
 
-    static layout calc_output_layout(data_node const& node, kernel_impl_params const& impl_param) {
-        return node.get_attached_memory().get_layout();
-    }
-
     static std::string to_string(data_node const& node);
 
     typed_primitive_inst(network& network, data_node const& node);
diff --git a/src/plugins/intel_gpu/src/graph/include/deconvolution_inst.h b/src/plugins/intel_gpu/src/graph/include/deconvolution_inst.h
index 1b050b371b098b..6517163da468b0 100644
--- a/src/plugins/intel_gpu/src/graph/include/deconvolution_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/deconvolution_inst.h
@@ -57,7 +57,6 @@ class typed_primitive_inst<deconvolution> : public typed_primitive_inst_base<dec
 public:
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(deconvolution_node const& node, const kernel_impl_params& impl_param);
-    static layout calc_output_layout(deconvolution_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(deconvolution_node const& node);
 
     bool need_reset_input_memory(size_t idx = 0) const override {
diff --git a/src/plugins/intel_gpu/src/graph/include/depth_to_space_inst.h b/src/plugins/intel_gpu/src/graph/include/depth_to_space_inst.h
index 1e39e07d9a70b0..ec8451ffb45a78 100644
--- a/src/plugins/intel_gpu/src/graph/include/depth_to_space_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/depth_to_space_inst.h
@@ -34,7 +34,6 @@ class typed_primitive_inst<depth_to_space> : public typed_primitive_inst_base<de
 public:
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(depth_to_space_node const& node, kernel_impl_params const& impl_param);
-    static layout calc_output_layout(depth_to_space_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(depth_to_space_node const& node);
 
     typed_primitive_inst(network& network, depth_to_space_node const& desc);
diff --git a/src/plugins/intel_gpu/src/graph/include/detection_output_inst.h b/src/plugins/intel_gpu/src/graph/include/detection_output_inst.h
index 80438a8044f38e..32dc58ed7b81dc 100644
--- a/src/plugins/intel_gpu/src/graph/include/detection_output_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/detection_output_inst.h
@@ -38,7 +38,6 @@ class typed_primitive_inst<detection_output> : public typed_primitive_inst_base<
 public:
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(detection_output_node const& node, kernel_impl_params const& impl_param);
-    static layout calc_output_layout(detection_output_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(detection_output_node const& node);
 
     typed_primitive_inst(network& network, detection_output_node const& node);
diff --git a/src/plugins/intel_gpu/src/graph/include/dft_inst.h b/src/plugins/intel_gpu/src/graph/include/dft_inst.h
index f6bb1d54850bfa..24e457db556352 100644
--- a/src/plugins/intel_gpu/src/graph/include/dft_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/dft_inst.h
@@ -35,7 +35,6 @@ class typed_primitive_inst<dft> : public typed_primitive_inst_base<dft> {
 public:
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(dft_node const& /*node*/, kernel_impl_params const& impl_param);
-    static layout calc_output_layout(dft_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(dft_node const& node);
 
     typed_primitive_inst(network& network, dft_node const& node);
diff --git a/src/plugins/intel_gpu/src/graph/include/eltwise_inst.h b/src/plugins/intel_gpu/src/graph/include/eltwise_inst.h
index d75a18a4f40504..0a9bd1e36c7527 100644
--- a/src/plugins/intel_gpu/src/graph/include/eltwise_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/eltwise_inst.h
@@ -48,7 +48,6 @@ class typed_primitive_inst<eltwise> : public typed_primitive_inst_base<eltwise>
 public:
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(eltwise_node const& /*node*/, const kernel_impl_params& impl_param);
-    static layout calc_output_layout(eltwise_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(eltwise_node const& node);
     typed_primitive_inst(network& network, eltwise_node const& node);
 };
diff --git a/src/plugins/intel_gpu/src/graph/include/embedding_bag_inst.h b/src/plugins/intel_gpu/src/graph/include/embedding_bag_inst.h
index a093b571ecaa51..c3018a0ee07caa 100644
--- a/src/plugins/intel_gpu/src/graph/include/embedding_bag_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/embedding_bag_inst.h
@@ -29,7 +29,6 @@ class typed_primitive_inst<embedding_bag> : public typed_primitive_inst_base<emb
 public:
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(embedding_bag_node const& /*node*/, const kernel_impl_params& impl_param);
-    static layout calc_output_layout(embedding_bag_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(embedding_bag_node const& node);
     typed_primitive_inst(network& network, embedding_bag_node const& desc);
 };
diff --git a/src/plugins/intel_gpu/src/graph/include/experimental_detectron_detection_output_inst.hpp b/src/plugins/intel_gpu/src/graph/include/experimental_detectron_detection_output_inst.hpp
index 89b42dacd8f3f8..1b1bfd34a435bd 100644
--- a/src/plugins/intel_gpu/src/graph/include/experimental_detectron_detection_output_inst.hpp
+++ b/src/plugins/intel_gpu/src/graph/include/experimental_detectron_detection_output_inst.hpp
@@ -28,13 +28,6 @@ struct typed_program_node<experimental_detectron_detection_output>
     program_node& image_size_info() const {
         return get_dependency(3);
     }
-
-    program_node& output_classes_node() const {
-        return get_dependency(4);
-    }
-    program_node& output_scores_node() const {
-        return get_dependency(5);
-    }
 };
 
 using experimental_detectron_detection_output_node = typed_program_node<experimental_detectron_detection_output>;
@@ -48,18 +41,10 @@ class typed_primitive_inst<experimental_detectron_detection_output>
 public:
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(experimental_detectron_detection_output_node const& /*node*/, const kernel_impl_params& impl_param);
-    static layout calc_output_layout(const experimental_detectron_detection_output_node& node, kernel_impl_params const& impl_param);
     static std::string to_string(const experimental_detectron_detection_output_node& node);
 
     typed_primitive_inst(network& network, const experimental_detectron_detection_output_node& node)
         : parent(network, node) {}
-
-    memory::ptr output_classes_memory() const {
-        return dep_memory_ptr(4);
-    }
-    memory::ptr output_scores_memory() const {
-        return dep_memory_ptr(5);
-    }
 };
 
 using experimental_detectron_detection_output_inst = typed_primitive_inst<experimental_detectron_detection_output>;
diff --git a/src/plugins/intel_gpu/src/graph/include/experimental_detectron_generate_proposals_single_image_inst.hpp b/src/plugins/intel_gpu/src/graph/include/experimental_detectron_generate_proposals_single_image_inst.hpp
index a863368d23b3da..5ce4ebf122b466 100644
--- a/src/plugins/intel_gpu/src/graph/include/experimental_detectron_generate_proposals_single_image_inst.hpp
+++ b/src/plugins/intel_gpu/src/graph/include/experimental_detectron_generate_proposals_single_image_inst.hpp
@@ -35,7 +35,6 @@ class typed_primitive_inst<experimental_detectron_generate_proposals_single_imag
 public:
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(experimental_detectron_generate_proposals_single_image_node const&, const kernel_impl_params& impl_param);
-    static layout calc_output_layout(const experimental_detectron_generate_proposals_single_image_node& node, kernel_impl_params const& impl_param);
     static std::string to_string(const experimental_detectron_generate_proposals_single_image_node& node);
 
     typed_primitive_inst(network& network, const experimental_detectron_generate_proposals_single_image_node& node)
diff --git a/src/plugins/intel_gpu/src/graph/include/experimental_detectron_prior_grid_generator_inst.h b/src/plugins/intel_gpu/src/graph/include/experimental_detectron_prior_grid_generator_inst.h
index 38aaae23fb333f..39e5b107aa1623 100644
--- a/src/plugins/intel_gpu/src/graph/include/experimental_detectron_prior_grid_generator_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/experimental_detectron_prior_grid_generator_inst.h
@@ -29,7 +29,6 @@ class typed_primitive_inst<experimental_detectron_prior_grid_generator>
 
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(experimental_detectron_prior_grid_generator_node const& /*node*/, const kernel_impl_params& impl_param);
-    static layout calc_output_layout(experimental_detectron_prior_grid_generator_node const& node, kernel_impl_params const& impl_param);
 
     static std::string to_string(experimental_detectron_prior_grid_generator_node const& node);
 };
diff --git a/src/plugins/intel_gpu/src/graph/include/experimental_detectron_roi_feature_extractor_inst.hpp b/src/plugins/intel_gpu/src/graph/include/experimental_detectron_roi_feature_extractor_inst.hpp
index 6970d286f0e5dc..375ff3f2a94085 100644
--- a/src/plugins/intel_gpu/src/graph/include/experimental_detectron_roi_feature_extractor_inst.hpp
+++ b/src/plugins/intel_gpu/src/graph/include/experimental_detectron_roi_feature_extractor_inst.hpp
@@ -21,11 +21,9 @@ struct typed_primitive_inst<experimental_detectron_roi_feature_extractor> : publ
 
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(experimental_detectron_roi_feature_extractor_node const& /*node*/, const kernel_impl_params& impl_param);
-    static layout calc_output_layout(experimental_detectron_roi_feature_extractor_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(experimental_detectron_roi_feature_extractor_node const& node);
 
 private:
-    memory::ptr second_output_memory() const;
     memory::ptr rois_memory() const;
 };
 
diff --git a/src/plugins/intel_gpu/src/graph/include/experimental_detectron_topk_rois_inst.h b/src/plugins/intel_gpu/src/graph/include/experimental_detectron_topk_rois_inst.h
index fb223171a26f94..f657682703c043 100644
--- a/src/plugins/intel_gpu/src/graph/include/experimental_detectron_topk_rois_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/experimental_detectron_topk_rois_inst.h
@@ -19,7 +19,6 @@ class typed_primitive_inst<experimental_detectron_topk_rois> : public typed_prim
 public:
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(experimental_detectron_topk_rois_node const& /*node*/, const kernel_impl_params& impl_param);
-    static layout calc_output_layout(experimental_detectron_topk_rois_node const &node, kernel_impl_params const& impl_param);
 
     static std::string to_string(experimental_detectron_topk_rois_node const &node);
 
diff --git a/src/plugins/intel_gpu/src/graph/include/extract_image_patches_inst.h b/src/plugins/intel_gpu/src/graph/include/extract_image_patches_inst.h
index 4ccf35b0d398ed..fde398e66c5c7a 100644
--- a/src/plugins/intel_gpu/src/graph/include/extract_image_patches_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/extract_image_patches_inst.h
@@ -18,7 +18,6 @@ class typed_primitive_inst<extract_image_patches> : public typed_primitive_inst_
 public:
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(extract_image_patches_node const& /*node*/, const kernel_impl_params& impl_param);
-    static layout calc_output_layout(extract_image_patches_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(extract_image_patches_node const& node);
 
     typed_primitive_inst(network& network, extract_image_patches_node const& desc);
diff --git a/src/plugins/intel_gpu/src/graph/include/eye_inst.h b/src/plugins/intel_gpu/src/graph/include/eye_inst.h
index b909829bf534da..907806054b14d8 100644
--- a/src/plugins/intel_gpu/src/graph/include/eye_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/eye_inst.h
@@ -22,6 +22,7 @@ struct typed_program_node<eye> : typed_program_node_base<eye> {
 };
 using eye_node = typed_program_node<eye>;
 
+
 template <>
 class typed_primitive_inst<eye> : public typed_primitive_inst_base<eye> {
     using parent = typed_primitive_inst_base<eye>;
@@ -30,7 +31,6 @@ class typed_primitive_inst<eye> : public typed_primitive_inst_base<eye> {
 public:
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(eye_node const& /*node*/, const kernel_impl_params& impl_param);
-    static layout calc_output_layout(eye_node const& node, const kernel_impl_params& impl_param);
     static std::string to_string(eye_node const& node);
 
     typed_primitive_inst(network& network, eye_node const& desc);
diff --git a/src/plugins/intel_gpu/src/graph/include/fully_connected_inst.h b/src/plugins/intel_gpu/src/graph/include/fully_connected_inst.h
index ac7bd91f84d662..cc92e40a148c99 100644
--- a/src/plugins/intel_gpu/src/graph/include/fully_connected_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/fully_connected_inst.h
@@ -46,7 +46,6 @@ class typed_primitive_inst<fully_connected> : public typed_primitive_inst_base<f
 public:
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(fully_connected_node const& /*node*/, const kernel_impl_params& impl_param);
-    static layout calc_output_layout(fully_connected_node const& node, kernel_impl_params const& impl_param);
     static kernel_impl_params get_fake_aligned_params(kernel_impl_params const& orig_impl_param);
     static std::string to_string(fully_connected_node const& node);
 
diff --git a/src/plugins/intel_gpu/src/graph/include/gather_elements_inst.h b/src/plugins/intel_gpu/src/graph/include/gather_elements_inst.h
index b73ca3bc3f28f9..2601ab76bbf955 100644
--- a/src/plugins/intel_gpu/src/graph/include/gather_elements_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/gather_elements_inst.h
@@ -29,7 +29,6 @@ class typed_primitive_inst<gather_elements> : public typed_primitive_inst_base<g
 public:
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(gather_elements_node const& /*node*/, const kernel_impl_params& impl_param);
-    static layout calc_output_layout(gather_elements_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(gather_elements_node const& node);
 
 public:
diff --git a/src/plugins/intel_gpu/src/graph/include/gather_inst.h b/src/plugins/intel_gpu/src/graph/include/gather_inst.h
index d6d390cd0eb291..1734643397913b 100644
--- a/src/plugins/intel_gpu/src/graph/include/gather_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/gather_inst.h
@@ -30,7 +30,6 @@ class typed_primitive_inst<gather> : public typed_primitive_inst_base<gather> {
 public:
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(gather_node const& /*node*/, const kernel_impl_params& impl_param);
-    static layout calc_output_layout(gather_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(gather_node const& node);
 
     typed_primitive_inst(network& network, gather_node const& desc);
diff --git a/src/plugins/intel_gpu/src/graph/include/gather_nd_inst.h b/src/plugins/intel_gpu/src/graph/include/gather_nd_inst.h
index c8821bf78f9649..c8511da3672069 100644
--- a/src/plugins/intel_gpu/src/graph/include/gather_nd_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/gather_nd_inst.h
@@ -19,7 +19,6 @@ class typed_primitive_inst<gather_nd> : public typed_primitive_inst_base<gather_
 public:
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(gather_nd_node const& /*node*/, const kernel_impl_params& impl_param);
-    static layout calc_output_layout(gather_nd_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(gather_nd_node const& node);
 
 public:
diff --git a/src/plugins/intel_gpu/src/graph/include/gather_tree_inst.h b/src/plugins/intel_gpu/src/graph/include/gather_tree_inst.h
index 1a0ac6f423eae1..cb27195c1c1fdf 100644
--- a/src/plugins/intel_gpu/src/graph/include/gather_tree_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/gather_tree_inst.h
@@ -32,7 +32,6 @@ class typed_primitive_inst<gather_tree> : public typed_primitive_inst_base<gathe
 public:
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(gather_tree_node const& /*node*/, const kernel_impl_params& impl_param);
-    static layout calc_output_layout(gather_tree_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(gather_tree_node const& node);
     typed_primitive_inst(network& network, gather_tree_node const& node);
 };
diff --git a/src/plugins/intel_gpu/src/graph/include/gemm_inst.h b/src/plugins/intel_gpu/src/graph/include/gemm_inst.h
index b6bb55ceb55497..5d2214bb19b0af 100644
--- a/src/plugins/intel_gpu/src/graph/include/gemm_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/gemm_inst.h
@@ -30,7 +30,6 @@ class typed_primitive_inst<gemm> : public typed_primitive_inst_base<gemm> {
 public:
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(gemm_node const& /*node*/, const kernel_impl_params& impl_param);
-    static layout calc_output_layout(gemm_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(gemm_node const& node);
 
     static std::vector<layout> transform_input_layouts(const std::shared_ptr<const gemm> primitive,
diff --git a/src/plugins/intel_gpu/src/graph/include/generate_proposals_inst.h b/src/plugins/intel_gpu/src/graph/include/generate_proposals_inst.h
index bddeb909083fd8..f80e0c4ce40216 100644
--- a/src/plugins/intel_gpu/src/graph/include/generate_proposals_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/generate_proposals_inst.h
@@ -36,7 +36,6 @@ class typed_primitive_inst<generate_proposals>
 public:
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(generate_proposals_node const& /*node*/, const kernel_impl_params& impl_param);
-    static layout calc_output_layout(const generate_proposals_node& node, kernel_impl_params const& impl_param);
     static std::string to_string(const generate_proposals_node& node);
 
     typed_primitive_inst(network& network, const generate_proposals_node& node)
diff --git a/src/plugins/intel_gpu/src/graph/include/grid_sample_inst.hpp b/src/plugins/intel_gpu/src/graph/include/grid_sample_inst.hpp
index e6603d5922574a..a4b07669a80ccc 100644
--- a/src/plugins/intel_gpu/src/graph/include/grid_sample_inst.hpp
+++ b/src/plugins/intel_gpu/src/graph/include/grid_sample_inst.hpp
@@ -29,7 +29,6 @@ class typed_primitive_inst<grid_sample> : public typed_primitive_inst_base<grid_
 public:
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(grid_sample_node const& /*node*/, const kernel_impl_params& impl_param);
-    static layout calc_output_layout(const grid_sample_node& node, const kernel_impl_params& impl_param);
     static std::string to_string(const grid_sample_node& node);
 
     typed_primitive_inst(network& network, grid_sample_node const& node);
diff --git a/src/plugins/intel_gpu/src/graph/include/grn_inst.h b/src/plugins/intel_gpu/src/graph/include/grn_inst.h
index 376dba93f480bb..875d4370da4a3e 100644
--- a/src/plugins/intel_gpu/src/graph/include/grn_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/grn_inst.h
@@ -22,7 +22,6 @@ class typed_primitive_inst<grn> : public typed_primitive_inst_base<grn> {
     static std::vector<layout> calc_output_layouts(grn_node const& /*node*/, const kernel_impl_params& impl_param) {
         return forward_input0_shape<ShapeType>(impl_param);
     }
-    static layout calc_output_layout(grn_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(grn_node const& node);
 
     typed_primitive_inst(network& network, grn_node const& node);
diff --git a/src/plugins/intel_gpu/src/graph/include/group_normalization_inst.h b/src/plugins/intel_gpu/src/graph/include/group_normalization_inst.h
index 27fe382146999b..d1838e14013910 100644
--- a/src/plugins/intel_gpu/src/graph/include/group_normalization_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/group_normalization_inst.h
@@ -28,7 +28,6 @@ class typed_primitive_inst<group_normalization> : public typed_primitive_inst_ba
         return forward_input0_shape<ShapeType>(impl_param);
     }
 
-    static layout calc_output_layout(group_normalization_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(group_normalization_node const& node);
 
     typed_primitive_inst(network& network, group_normalization_node const& desc);
diff --git a/src/plugins/intel_gpu/src/graph/include/input_layout_inst.h b/src/plugins/intel_gpu/src/graph/include/input_layout_inst.h
index ee59d43bf116aa..3ca7fc23f6e0bf 100644
--- a/src/plugins/intel_gpu/src/graph/include/input_layout_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/input_layout_inst.h
@@ -32,9 +32,6 @@ class typed_primitive_inst<input_layout> : public typed_primitive_inst_base<inpu
         return { impl_param.typed_desc<input_layout>()->layout };
     }
 
-    static layout calc_output_layout(input_layout_node const& node, kernel_impl_params const& impl_param) {
-        return impl_param.typed_desc<input_layout>()->layout;
-    }
     static std::string to_string(input_layout_node const& node);
 
     void update_shape() override;
diff --git a/src/plugins/intel_gpu/src/graph/include/kv_cache_inst.h b/src/plugins/intel_gpu/src/graph/include/kv_cache_inst.h
index f3aa4de5ec34e1..8d77e88ca2eb14 100644
--- a/src/plugins/intel_gpu/src/graph/include/kv_cache_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/kv_cache_inst.h
@@ -48,7 +48,6 @@ class typed_primitive_inst<kv_cache> : public typed_primitive_inst_base<kv_cache
 public:
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(kv_cache_node const& /*node*/, const kernel_impl_params& impl_param);
-    static layout calc_output_layout(const kv_cache_node& node, kernel_impl_params const& impl_param);
 
     static std::string to_string(const kv_cache_node& node);
 
diff --git a/src/plugins/intel_gpu/src/graph/include/loop_inst.h b/src/plugins/intel_gpu/src/graph/include/loop_inst.h
index a9ec2262342bec..efc69418947ad3 100644
--- a/src/plugins/intel_gpu/src/graph/include/loop_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/loop_inst.h
@@ -322,7 +322,6 @@ class typed_primitive_inst<loop> : public typed_primitive_inst_base<loop> {
 
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(loop_node const& /*node*/, kernel_impl_params const& impl_param);
-    static layout calc_output_layout(const loop_node& /*node*/, kernel_impl_params const& impl_param);
     bool preproc_memories_done = false;
     std::vector<backedge_memory_mapping> backedge_memory_mappings;
     std::vector<concatenated_memory_mapping::ptr> concatenated_input_mem_mappings;
diff --git a/src/plugins/intel_gpu/src/graph/include/lrn_inst.h b/src/plugins/intel_gpu/src/graph/include/lrn_inst.h
index 7b3caf2b9ac4ae..7d51df14aa2bc4 100644
--- a/src/plugins/intel_gpu/src/graph/include/lrn_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/lrn_inst.h
@@ -22,7 +22,6 @@ class typed_primitive_inst<lrn> : public typed_primitive_inst_base<lrn> {
     static std::vector<layout> calc_output_layouts(lrn_node const& /*node*/, const kernel_impl_params& impl_param) {
         return forward_input0_shape<ShapeType>(impl_param);
     }
-    static layout calc_output_layout(lrn_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(lrn_node const& node);
 
     typed_primitive_inst(network& network, lrn_node const& node);
diff --git a/src/plugins/intel_gpu/src/graph/include/lstm_elt_inst.h b/src/plugins/intel_gpu/src/graph/include/lstm_elt_inst.h
index 1524598c6f3987..f17272ca99a765 100644
--- a/src/plugins/intel_gpu/src/graph/include/lstm_elt_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/lstm_elt_inst.h
@@ -40,7 +40,6 @@ class typed_primitive_inst<lstm_elt> : public typed_primitive_inst_base<lstm_elt
 public:
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(lstm_elt_node const& node, kernel_impl_params const& impl_param);
-    static layout calc_output_layout(lstm_elt_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(lstm_elt_node const& node);
 
 public:
diff --git a/src/plugins/intel_gpu/src/graph/include/matrix_nms_inst.h b/src/plugins/intel_gpu/src/graph/include/matrix_nms_inst.h
index 591de52c5061ed..8319b793baa213 100644
--- a/src/plugins/intel_gpu/src/graph/include/matrix_nms_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/matrix_nms_inst.h
@@ -23,8 +23,6 @@ class typed_primitive_inst<matrix_nms> : public typed_primitive_inst_base<matrix
 
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(matrix_nms_node const& /*node*/, const kernel_impl_params& impl_param);
-
-    static layout calc_output_layout(const matrix_nms_node& node, const kernel_impl_params& impl_param);
     static std::string to_string(const matrix_nms_node& node);
 
     memory::ptr input_boxes_mem() const {
@@ -33,12 +31,6 @@ class typed_primitive_inst<matrix_nms> : public typed_primitive_inst_base<matrix
     memory::ptr input_scores_mem() const {
         return dep_memory_ptr(1);
     }
-    memory::ptr input_selected_boxes_mem() const {
-        return dep_memory_ptr(2);
-    }
-    memory::ptr input_valid_outputs_mem() const {
-        return dep_memory_ptr(3);
-    }
 };
 
 using matrix_nms_inst = typed_primitive_inst<matrix_nms>;
diff --git a/src/plugins/intel_gpu/src/graph/include/multiclass_nms_inst.h b/src/plugins/intel_gpu/src/graph/include/multiclass_nms_inst.h
index 4bdff2792f40b1..0a6d48cc30e8ca 100644
--- a/src/plugins/intel_gpu/src/graph/include/multiclass_nms_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/multiclass_nms_inst.h
@@ -1,4 +1,4 @@
-// Copyright (C) 2022 Intel Corporation
+// Copyright (C) 2022-2024 Intel Corporation
 // SPDX-License-Identifier: Apache-2.0
 //
 
@@ -28,26 +28,13 @@ struct typed_program_node<multiclass_nms> : public typed_program_node_base<multi
     }
 
     bool has_roisnum() const {
-        return get_primitive()->has_roisnum;
+        return get_primitive()->input_size() == 3;
     }
 
     const program_node& roisnum() const {
-        if (!get_primitive()->has_roisnum)
-            throw std::runtime_error("there is no roisnum input");
+        OPENVINO_ASSERT(has_roisnum(), "[GPU] rois_num not found");
         return get_dependency(2);
     }
-
-    const program_node& output_selected_indices() const {
-        return get_dependency(input_count());
-    }
-    const program_node& output_selected_num() const {
-        return get_dependency(input_count() + 1);
-    }
-
-private:
-    int input_count() const {
-        return 2 + (get_primitive()->has_roisnum ? 1 : 0);
-    }
 };
 
 using multiclass_nms_node = typed_program_node<multiclass_nms>;
@@ -60,17 +47,9 @@ class typed_primitive_inst<multiclass_nms> : public typed_primitive_inst_base<mu
 public:
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(multiclass_nms_node const& /*node*/, const kernel_impl_params& impl_param);
-    static layout calc_output_layout(const multiclass_nms_node& node, const kernel_impl_params& impl_param);
     static std::string to_string(const multiclass_nms_node& node);
 
     typed_primitive_inst(network& network, const multiclass_nms_node& node) : parent(network, node) {}
-
-    memory::ptr output_indices_memory() const {
-        return dep_memory_ptr(dependencies().size() - 2);
-    }
-    memory::ptr output_num_memory() const {
-        return dep_memory_ptr(dependencies().size() - 1);
-    }
 };
 
 using multiclass_nms_inst = typed_primitive_inst<multiclass_nms>;
diff --git a/src/plugins/intel_gpu/src/graph/include/multinomial_inst.h b/src/plugins/intel_gpu/src/graph/include/multinomial_inst.h
index 102e300b74b4ef..4e66118b6a36e2 100644
--- a/src/plugins/intel_gpu/src/graph/include/multinomial_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/multinomial_inst.h
@@ -17,7 +17,6 @@ class typed_primitive_inst<multinomial> : public typed_primitive_inst_base<multi
 public:
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(multinomial_node const& /*node*/, const kernel_impl_params& impl_param);
-    static layout calc_output_layout(multinomial_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(multinomial_node const& node);
 
     typed_primitive_inst(network& network, multinomial_node const& desc);
diff --git a/src/plugins/intel_gpu/src/graph/include/mutable_data_inst.h b/src/plugins/intel_gpu/src/graph/include/mutable_data_inst.h
index 0140c60f12a0d6..89e683f3687538 100644
--- a/src/plugins/intel_gpu/src/graph/include/mutable_data_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/mutable_data_inst.h
@@ -41,10 +41,6 @@ class typed_primitive_inst<mutable_data> : public typed_primitive_inst_base<muta
         return { node.get_attached_memory().get_layout() };
     }
 
-    static layout calc_output_layout(mutable_data_node const& node, kernel_impl_params const& impl_param) {
-        return node.get_attached_memory().get_layout();
-    }
-
     static std::string to_string(mutable_data_node const& node);
 
     typed_primitive_inst(network& network, mutable_data_node const& node);
diff --git a/src/plugins/intel_gpu/src/graph/include/mvn_inst.h b/src/plugins/intel_gpu/src/graph/include/mvn_inst.h
index ad677d39420cb1..8672b5c0e068c1 100644
--- a/src/plugins/intel_gpu/src/graph/include/mvn_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/mvn_inst.h
@@ -33,7 +33,6 @@ class typed_primitive_inst<mvn> : public typed_primitive_inst_base<mvn> {
     static std::vector<layout> calc_output_layouts(mvn_node const& /*node*/, const kernel_impl_params& impl_param)  {
         return forward_input0_shape<ShapeType>(impl_param);
     }
-    static layout calc_output_layout(mvn_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(mvn_node const& node);
 
     typed_primitive_inst(network& network, mvn_node const& node);
diff --git a/src/plugins/intel_gpu/src/graph/include/non_max_suppression_inst.h b/src/plugins/intel_gpu/src/graph/include/non_max_suppression_inst.h
index 4e73633f3a13a8..1a61b463d9ca34 100644
--- a/src/plugins/intel_gpu/src/graph/include/non_max_suppression_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/non_max_suppression_inst.h
@@ -30,19 +30,19 @@ struct typed_program_node<non_max_suppression> : public typed_program_node_base<
         return get_dependency(1);
     }
 
-    bool has_num_select_per_class() const { return !get_primitive()->num_select_per_class.empty(); }
+    bool has_num_select_per_class() const { return get_primitive()->input_size() >= 3; }
     program_node& num_select_per_class_node() const {
         return get_dependency(2);
     }
 
-    bool has_iou_threshold() const { return !get_primitive()->iou_threshold.empty(); }
+    bool has_iou_threshold() const { return get_primitive()->input_size() >= 4; }
     program_node& iou_threshold_node() const {
         size_t offset = 2;
         offset += has_num_select_per_class();
         return get_dependency(offset);
     }
 
-    bool has_score_threshold() const { return !get_primitive()->score_threshold.empty(); }
+    bool has_score_threshold() const { return get_primitive()->input_size() >= 5; }
     program_node& score_threshold_node() const {
         size_t offset = 2;
         offset += has_num_select_per_class();
@@ -50,7 +50,7 @@ struct typed_program_node<non_max_suppression> : public typed_program_node_base<
         return get_dependency(offset);
     }
 
-    bool has_soft_nms_sigma() const { return !get_primitive()->soft_nms_sigma.empty(); }
+    bool has_soft_nms_sigma() const { return get_primitive()->input_size() >= 6; }
     program_node& soft_nms_sigma_node() const {
         size_t offset = 2;
         offset += has_num_select_per_class();
@@ -59,28 +59,6 @@ struct typed_program_node<non_max_suppression> : public typed_program_node_base<
         return get_dependency(offset);
     }
 
-    bool has_second_output() const { return !get_primitive()->second_output.empty(); }
-    program_node& second_output_node() const {
-        size_t offset = 2;
-        offset += has_num_select_per_class();
-        offset += has_iou_threshold();
-        offset += has_score_threshold();
-        offset += has_soft_nms_sigma();
-        return get_dependency(offset);
-    }
-
-    bool has_third_output() const { return !get_primitive()->third_output.empty(); }
-    program_node& third_output_node() const {
-        size_t offset = 2;
-        offset += has_num_select_per_class();
-        offset += has_iou_threshold();
-        offset += has_score_threshold();
-        offset += has_soft_nms_sigma();
-        offset += has_second_output();
-        return get_dependency(offset);
-    }
-    bool use_multiple_outputs() const { return get_primitive()->output_size() == 3; }
-
     std::vector<size_t> get_shape_infer_dependencies() const override { return {2}; }
 };
 
@@ -119,7 +97,6 @@ class typed_primitive_inst<non_max_suppression> : public typed_primitive_inst_ba
 
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(non_max_suppression_node const& /*node*/, const kernel_impl_params& impl_param);
-    static layout calc_output_layout(non_max_suppression_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(non_max_suppression_node const& node);
 
     memory::ptr input_boxes_mem() const {
@@ -130,7 +107,7 @@ class typed_primitive_inst<non_max_suppression> : public typed_primitive_inst_ba
         return dep_memory_ptr(1);
     }
 
-    bool has_num_select_per_class() const { return !get_typed_desc<non_max_suppression>()->num_select_per_class.empty(); }
+    bool has_num_select_per_class() const { return static_cast<const non_max_suppression_node*>(_node)->has_num_select_per_class(); }
     memory::ptr num_select_per_class_mem() const {
         return dep_memory_ptr(2);
     }
@@ -138,7 +115,7 @@ class typed_primitive_inst<non_max_suppression> : public typed_primitive_inst_ba
         return dependencies().at(2).first;
     }
 
-    bool has_iou_threshold() const { return !get_typed_desc<non_max_suppression>()->iou_threshold.empty(); }
+    bool has_iou_threshold() const { return static_cast<const non_max_suppression_node*>(_node)->has_iou_threshold(); }
     memory::ptr iou_threshold_mem() const {
         return dep_memory_ptr(get_iou_threshold_offset());
     }
@@ -146,7 +123,7 @@ class typed_primitive_inst<non_max_suppression> : public typed_primitive_inst_ba
         return dependencies().at(get_iou_threshold_offset()).first;
     }
 
-    bool has_score_threshold() const { return !get_typed_desc<non_max_suppression>()->score_threshold.empty(); }
+    bool has_score_threshold() const { return static_cast<const non_max_suppression_node*>(_node)->has_score_threshold(); }
     memory::ptr score_threshold_mem() const {
         return dep_memory_ptr(get_score_threshold_offset());
     }
@@ -154,34 +131,13 @@ class typed_primitive_inst<non_max_suppression> : public typed_primitive_inst_ba
         return dependencies().at(get_score_threshold_offset()).first;
     }
 
-    bool has_soft_nms_sigma() const { return !get_typed_desc<non_max_suppression>()->soft_nms_sigma.empty(); }
+    bool has_soft_nms_sigma() const { return static_cast<const non_max_suppression_node*>(_node)->has_soft_nms_sigma(); }
     memory::ptr soft_nms_sigma_mem() const {
         return dep_memory_ptr(get_soft_nms_sigma_offset());
     }
     const primitive_inst* soft_nms_sigma_inst() const {
         return dependencies().at(get_soft_nms_sigma_offset()).first;
     }
-
-    bool has_second_output() const { return !get_typed_desc<non_max_suppression>()->second_output.empty(); }
-    memory::ptr second_output_mem() const {
-        size_t offset = 2;
-        offset += has_num_select_per_class();
-        offset += has_iou_threshold();
-        offset += has_score_threshold();
-        offset += has_soft_nms_sigma();
-        return dep_memory_ptr(offset);
-    }
-
-    bool has_third_output() const { return !get_typed_desc<non_max_suppression>()->third_output.empty(); }
-    memory::ptr third_output_mem() const {
-        size_t offset = 2;
-        offset += has_num_select_per_class();
-        offset += has_iou_threshold();
-        offset += has_score_threshold();
-        offset += has_soft_nms_sigma();
-        offset += has_second_output();
-        return dep_memory_ptr(offset);
-    }
 };
 
 using non_max_suppression_inst = typed_primitive_inst<non_max_suppression>;
diff --git a/src/plugins/intel_gpu/src/graph/include/non_zero_inst.h b/src/plugins/intel_gpu/src/graph/include/non_zero_inst.h
index cbaea742335502..3518c598e1e4c7 100644
--- a/src/plugins/intel_gpu/src/graph/include/non_zero_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/non_zero_inst.h
@@ -36,7 +36,6 @@ class typed_primitive_inst<count_nonzero> : public typed_primitive_inst_base<cou
 public:
     template <typename ShapeType>
     static std::vector<layout> calc_output_layouts(count_nonzero_node const& /*node*/, kernel_impl_params const& impl_param);
-    static layout calc_output_layout(count_nonzero_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(count_nonzero_node const& node);
 
     typed_primitive_inst(network& network, count_nonzero_node const& node);
@@ -71,7 +70,6 @@ class typed_primitive_inst<gather_nonzero> : public typed_primitive_inst_base<ga
 public:
     template <typename ShapeType>
     static std::vector<layout> calc_output_layouts(gather_nonzero_node const& /*node*/, kernel_impl_params const& impl_param);
-    static layout calc_output_layout(gather_nonzero_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(gather_nonzero_node const& node);
 
     typed_primitive_inst(network& network, gather_nonzero_node const& node);
diff --git a/src/plugins/intel_gpu/src/graph/include/normalize_inst.h b/src/plugins/intel_gpu/src/graph/include/normalize_inst.h
index 5a86ce13e0e5d8..880bb94808e45d 100644
--- a/src/plugins/intel_gpu/src/graph/include/normalize_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/normalize_inst.h
@@ -34,7 +34,6 @@ class typed_primitive_inst<normalize> : public typed_primitive_inst_base<normali
     static std::vector<layout> calc_output_layouts(normalize_node const& /*node*/, const kernel_impl_params& impl_param) {
         return forward_input0_shape<ShapeType>(impl_param);
     }
-    static layout calc_output_layout(normalize_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(normalize_node const& node);
 
     typed_primitive_inst(network& network, normalize_node const& node);
diff --git a/src/plugins/intel_gpu/src/graph/include/one_hot_inst.h b/src/plugins/intel_gpu/src/graph/include/one_hot_inst.h
index 782751e261e51a..ad6cb5ff9db5ba 100644
--- a/src/plugins/intel_gpu/src/graph/include/one_hot_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/one_hot_inst.h
@@ -35,7 +35,6 @@ class typed_primitive_inst<one_hot> : public typed_primitive_inst_base<one_hot>
 public:
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(const one_hot_node& /*node*/, const kernel_impl_params& impl_param);
-    static layout calc_output_layout(one_hot_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(one_hot_node const& node);
     typed_primitive_inst(network& network, one_hot_node const& node);
 };
diff --git a/src/plugins/intel_gpu/src/graph/include/permute_inst.h b/src/plugins/intel_gpu/src/graph/include/permute_inst.h
index e00a49ec8bfa15..2b48b309b9a3cd 100644
--- a/src/plugins/intel_gpu/src/graph/include/permute_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/permute_inst.h
@@ -62,7 +62,6 @@ class typed_primitive_inst<permute> : public typed_primitive_inst_base<permute>
 public:
     template <typename ShapeType>
     static std::vector<layout> calc_output_layouts(permute_node const& node, kernel_impl_params const& impl_param);
-    static layout calc_output_layout(permute_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(permute_node const& node);
 
 public:
diff --git a/src/plugins/intel_gpu/src/graph/include/pooling_inst.h b/src/plugins/intel_gpu/src/graph/include/pooling_inst.h
index ab258ea47f24c3..ca804c14958379 100644
--- a/src/plugins/intel_gpu/src/graph/include/pooling_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/pooling_inst.h
@@ -33,7 +33,6 @@ class typed_primitive_inst<pooling> : public typed_primitive_inst_base<pooling>
 public:
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(pooling_node const& /*node*/, const kernel_impl_params& impl_param);
-    static layout calc_output_layout(pooling_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(pooling_node const& node);
 
 public:
diff --git a/src/plugins/intel_gpu/src/graph/include/primitive_type.h b/src/plugins/intel_gpu/src/graph/include/primitive_type.h
index 2c52079584db8d..58ce07c483d37c 100644
--- a/src/plugins/intel_gpu/src/graph/include/primitive_type.h
+++ b/src/plugins/intel_gpu/src/graph/include/primitive_type.h
@@ -43,7 +43,6 @@ struct primitive_type {
     virtual bool does_dynamic_implementation_exist(const program_node& node) const = 0;
     virtual bool does_dynamic_implementation_exist(const program_node& node, const kernel_impl_params& params) const = 0;
 
-    virtual layout calc_output_layout(const program_node& node, const kernel_impl_params& params) const = 0;
     virtual std::vector<layout> calc_output_layouts(const program_node& node, const kernel_impl_params& impl_param) const = 0;
     virtual kernel_impl_params get_fake_aligned_params(kernel_impl_params const& orig_impl_param) const = 0;
     virtual std::string to_string(const program_node& node) const = 0;
diff --git a/src/plugins/intel_gpu/src/graph/include/primitive_type_base.h b/src/plugins/intel_gpu/src/graph/include/primitive_type_base.h
index 96df67322d08c9..0f3f82d744de79 100644
--- a/src/plugins/intel_gpu/src/graph/include/primitive_type_base.h
+++ b/src/plugins/intel_gpu/src/graph/include/primitive_type_base.h
@@ -99,17 +99,6 @@ struct primitive_type_base : primitive_type {
         return implementation_map<PType>::check(impl_param, node.get_preferred_impl_type(), shape_types::dynamic_shape);
     }
 
-    cldnn::layout calc_output_layout(const cldnn::program_node& node, const kernel_impl_params& impl_param) const override {
-        OPENVINO_ASSERT(node.type() == this, "[GPU] primitive_type_base::calc_output_layout: primitive type mismatch");
-        for (auto& t : impl_param.input_layouts) {
-            GPU_DEBUG_TRACE_DETAIL << impl_param.desc->id << " input tensor: " << t.to_short_string() << std::endl;
-        }
-        auto res = typed_primitive_inst<PType>::calc_output_layout(node, impl_param);
-
-        GPU_DEBUG_TRACE_DETAIL << impl_param.desc->id << " output tensor: " << res.to_short_string() << std::endl;
-        return res;
-    }
-
     std::vector<cldnn::layout> calc_output_layouts(const cldnn::program_node& node, const kernel_impl_params& impl_param) const override {
         OPENVINO_ASSERT(node.type() == this, "primitive_type_base::calc_output_layouts: primitive type mismatch");
 
diff --git a/src/plugins/intel_gpu/src/graph/include/prior_box_inst.h b/src/plugins/intel_gpu/src/graph/include/prior_box_inst.h
index 9a789733a5e3c9..cdf5b705a1b4d0 100644
--- a/src/plugins/intel_gpu/src/graph/include/prior_box_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/prior_box_inst.h
@@ -38,7 +38,6 @@ class typed_primitive_inst<prior_box> : public typed_primitive_inst_base<prior_b
 public:
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(prior_box_node const& /*node*/, kernel_impl_params const& impl_param);
-    static layout calc_output_layout(prior_box_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(prior_box_node const& node);
 
 public:
diff --git a/src/plugins/intel_gpu/src/graph/include/program_node.h b/src/plugins/intel_gpu/src/graph/include/program_node.h
index 029755c4733fe4..aef9c194e5aeb4 100644
--- a/src/plugins/intel_gpu/src/graph/include/program_node.h
+++ b/src/plugins/intel_gpu/src/graph/include/program_node.h
@@ -79,8 +79,6 @@ struct program_node {
     }
 
     bool is_shape_infer_dep(void) const {
-        if (!myprog.is_new_shape_infer())
-            return false;
         for (auto u : users) {
             for (auto dep_idx : u->get_shape_infer_dependencies()) {
                 if (u->get_dependencies().size() <= dep_idx) {
@@ -235,8 +233,6 @@ struct program_node {
         set_output_padding(padding::max(padd, output_layouts[idx].data_padding));
     }
 
-    // only calculated output layout (for external usage), does not modify/use cached output layout nor invalidate users
-    layout calc_output_layout() const;
     std::vector<layout> calc_output_layouts() const;
 
     // uses cached output layout if valid, if not calls 'calc_output_layout' and stores its result + invalidate all
diff --git a/src/plugins/intel_gpu/src/graph/include/proposal_inst.h b/src/plugins/intel_gpu/src/graph/include/proposal_inst.h
index d4f3ef545b272f..9388d6f1f9b4c3 100644
--- a/src/plugins/intel_gpu/src/graph/include/proposal_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/proposal_inst.h
@@ -67,7 +67,6 @@ class typed_primitive_inst<proposal> : public typed_primitive_inst_base<proposal
 
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(proposal_node const& node, kernel_impl_params const& impl_param);
-    static layout calc_output_layout(proposal_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(proposal_node const& node);
 
     typed_primitive_inst(network& network, proposal_node const& desc);
diff --git a/src/plugins/intel_gpu/src/graph/include/quantize_inst.h b/src/plugins/intel_gpu/src/graph/include/quantize_inst.h
index 7bffd87e5af598..3d3dc5fc6beb1e 100644
--- a/src/plugins/intel_gpu/src/graph/include/quantize_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/quantize_inst.h
@@ -203,7 +203,6 @@ class typed_primitive_inst<quantize> : public typed_primitive_inst_base<quantize
     static std::vector<layout> calc_output_layouts(quantize_node const& node, kernel_impl_params const& impl_param) {
         return forward_input0_shape<ShapeType>(impl_param);
     }
-    static layout calc_output_layout(quantize_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(quantize_node const& node);
 
     typed_primitive_inst(network& network, quantize_node const& node);
diff --git a/src/plugins/intel_gpu/src/graph/include/random_uniform_inst.h b/src/plugins/intel_gpu/src/graph/include/random_uniform_inst.h
index e9c647dcf0d5af..d579cb2e9e9aa8 100644
--- a/src/plugins/intel_gpu/src/graph/include/random_uniform_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/random_uniform_inst.h
@@ -30,7 +30,6 @@ class typed_primitive_inst<random_uniform> : public typed_primitive_inst_base<ra
 public:
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(random_uniform_node const& /*node*/, const kernel_impl_params& impl_param);
-    static layout calc_output_layout(random_uniform_node const &node, kernel_impl_params const& impl_param);
 
     static std::string to_string(random_uniform_node const &node);
 
diff --git a/src/plugins/intel_gpu/src/graph/include/range_inst.h b/src/plugins/intel_gpu/src/graph/include/range_inst.h
index 79ef03e0057dd6..57a56f823f99d1 100644
--- a/src/plugins/intel_gpu/src/graph/include/range_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/range_inst.h
@@ -32,7 +32,6 @@ class typed_primitive_inst<range> : public typed_primitive_inst_base<range> {
 public:
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(range_node const& /*node*/, const kernel_impl_params& impl_param);
-    static layout calc_output_layout(range_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(range_node const& node);
 
     typed_primitive_inst(network& network, range_node const& desc);
diff --git a/src/plugins/intel_gpu/src/graph/include/read_value_inst.h b/src/plugins/intel_gpu/src/graph/include/read_value_inst.h
index 74f9ffff581b87..2e6051be85cd36 100644
--- a/src/plugins/intel_gpu/src/graph/include/read_value_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/read_value_inst.h
@@ -38,8 +38,6 @@ class typed_primitive_inst<read_value> : public typed_primitive_inst_base<read_v
         return { impl_param.state_layout.value_or(default_layout) };
     }
 
-    static layout calc_output_layout(const read_value_node& node, kernel_impl_params const& impl_param);
-
     static std::string to_string(const read_value_node& node);
 
     typed_primitive_inst(network& network, const read_value_node& desc);
diff --git a/src/plugins/intel_gpu/src/graph/include/reduce_inst.h b/src/plugins/intel_gpu/src/graph/include/reduce_inst.h
index 4575cea7e72810..5253918cec3d72 100644
--- a/src/plugins/intel_gpu/src/graph/include/reduce_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/reduce_inst.h
@@ -30,7 +30,6 @@ class typed_primitive_inst<reduce> : public typed_primitive_inst_base<reduce> {
 public:
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(reduce_node const& node, const kernel_impl_params& impl_param);
-    static layout calc_output_layout(reduce_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(reduce_node const& node);
 
     bool need_reset_input_memory(size_t idx = 0) const override {
diff --git a/src/plugins/intel_gpu/src/graph/include/region_yolo_inst.h b/src/plugins/intel_gpu/src/graph/include/region_yolo_inst.h
index 2c24172949ea64..fa3e7921232369 100644
--- a/src/plugins/intel_gpu/src/graph/include/region_yolo_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/region_yolo_inst.h
@@ -30,7 +30,6 @@ class typed_primitive_inst<region_yolo> : public typed_primitive_inst_base<regio
 public:
 template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(region_yolo_node const& node, kernel_impl_params const& impl_param);
-    static layout calc_output_layout(region_yolo_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(region_yolo_node const& node);
 
 public:
diff --git a/src/plugins/intel_gpu/src/graph/include/reorder_inst.h b/src/plugins/intel_gpu/src/graph/include/reorder_inst.h
index 8e91957c5192dd..d68e5e16f2de8e 100644
--- a/src/plugins/intel_gpu/src/graph/include/reorder_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/reorder_inst.h
@@ -82,7 +82,6 @@ class typed_primitive_inst<reorder> : public typed_primitive_inst_base<reorder>
 public:
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(reorder_node const& /*node*/, const kernel_impl_params& impl_param);
-    static layout calc_output_layout(reorder_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(reorder_node const& node);
 
 public:
diff --git a/src/plugins/intel_gpu/src/graph/include/reorg_yolo_inst.h b/src/plugins/intel_gpu/src/graph/include/reorg_yolo_inst.h
index 3aa4e571fa96da..9250343de29d06 100644
--- a/src/plugins/intel_gpu/src/graph/include/reorg_yolo_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/reorg_yolo_inst.h
@@ -30,7 +30,6 @@ class typed_primitive_inst<reorg_yolo> : public typed_primitive_inst_base<reorg_
 public:
 template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(reorg_yolo_node const& node, kernel_impl_params const& impl_param);
-    static layout calc_output_layout(reorg_yolo_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(reorg_yolo_node const& node);
 
 public:
diff --git a/src/plugins/intel_gpu/src/graph/include/resample_inst.h b/src/plugins/intel_gpu/src/graph/include/resample_inst.h
index a7257f8c6907b9..373ffe7ceaa03a 100644
--- a/src/plugins/intel_gpu/src/graph/include/resample_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/resample_inst.h
@@ -35,7 +35,6 @@ class typed_primitive_inst<resample> : public typed_primitive_inst_base<resample
 public:
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(resample_node const& /*node*/, const kernel_impl_params& impl_param);
-    static layout calc_output_layout(resample_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(resample_node const& node);
 
 public:
diff --git a/src/plugins/intel_gpu/src/graph/include/reshape_inst.h b/src/plugins/intel_gpu/src/graph/include/reshape_inst.h
index 1bbfd94256a50c..2bd2b19531db5f 100644
--- a/src/plugins/intel_gpu/src/graph/include/reshape_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/reshape_inst.h
@@ -191,7 +191,6 @@ class typed_primitive_inst<reshape> : public typed_primitive_inst_base<reshape>
 public:
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(reshape_node const& /*node*/, const kernel_impl_params& impl_param);
-    static layout calc_output_layout(reshape_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(reshape_node const& node);
 
     typed_primitive_inst(network& network, reshape_node const& node);
diff --git a/src/plugins/intel_gpu/src/graph/include/reverse_inst.h b/src/plugins/intel_gpu/src/graph/include/reverse_inst.h
index fbd870ab196a3a..006866ccbfb43b 100644
--- a/src/plugins/intel_gpu/src/graph/include/reverse_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/reverse_inst.h
@@ -22,7 +22,6 @@ class typed_primitive_inst<reverse> : public typed_primitive_inst_base<reverse>
     static std::vector<layout> calc_output_layouts(reverse_node const& /*node*/, const kernel_impl_params& impl_param) {
         return forward_input0_shape<ShapeType>(impl_param);
     }
-    static layout calc_output_layout(reverse_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(reverse_node const& node);
 
     typed_primitive_inst(network& network, reverse_node const& desc);
diff --git a/src/plugins/intel_gpu/src/graph/include/reverse_sequence_inst.h b/src/plugins/intel_gpu/src/graph/include/reverse_sequence_inst.h
index c5f8762a4451b8..f247d964c87caa 100644
--- a/src/plugins/intel_gpu/src/graph/include/reverse_sequence_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/reverse_sequence_inst.h
@@ -22,7 +22,6 @@ class typed_primitive_inst<reverse_sequence> : public typed_primitive_inst_base<
     static std::vector<layout> calc_output_layouts(reverse_sequence_node const& /*node*/, const kernel_impl_params& impl_param) {
         return forward_input0_shape<ShapeType>(impl_param);
     }
-    static layout calc_output_layout(reverse_sequence_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(reverse_sequence_node const& node);
 
     typed_primitive_inst(network& network, reverse_sequence_node const& desc);
diff --git a/src/plugins/intel_gpu/src/graph/include/rms_inst.h b/src/plugins/intel_gpu/src/graph/include/rms_inst.h
index a7800249f40421..9f6afceb434daf 100644
--- a/src/plugins/intel_gpu/src/graph/include/rms_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/rms_inst.h
@@ -33,7 +33,6 @@ class typed_primitive_inst<rms> : public typed_primitive_inst_base<rms> {
     static std::vector<layout> calc_output_layouts(rms_node const& /*node*/, const kernel_impl_params& impl_params) {
         return forward_input0_shape<ShapeType>(impl_params);
     }
-    static layout calc_output_layout(rms_node const& node, kernel_impl_params const& impl_params);
     static std::string to_string(rms_node const& node);
 
     typed_primitive_inst(network& network, rms_node const& node);
diff --git a/src/plugins/intel_gpu/src/graph/include/roi_align_inst.h b/src/plugins/intel_gpu/src/graph/include/roi_align_inst.h
index 371ac1b6ab1522..d0a0cc1a0220f4 100644
--- a/src/plugins/intel_gpu/src/graph/include/roi_align_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/roi_align_inst.h
@@ -29,7 +29,6 @@ class typed_primitive_inst<roi_align> : public typed_primitive_inst_base<roi_ali
 public:
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(roi_align_node const& node, kernel_impl_params const& impl_param);
-    static layout calc_output_layout(roi_align_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(roi_align_node const& node);
 
 public:
diff --git a/src/plugins/intel_gpu/src/graph/include/roi_pooling_inst.h b/src/plugins/intel_gpu/src/graph/include/roi_pooling_inst.h
index 8c4c2622488ced..1d1b7e0410cb09 100644
--- a/src/plugins/intel_gpu/src/graph/include/roi_pooling_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/roi_pooling_inst.h
@@ -29,7 +29,6 @@ class typed_primitive_inst<roi_pooling> : public typed_primitive_inst_base<roi_p
 public:
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(roi_pooling_node const& node, kernel_impl_params const& impl_param);
-    static layout calc_output_layout(roi_pooling_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(roi_pooling_node const& node);
 
 public:
diff --git a/src/plugins/intel_gpu/src/graph/include/roll_inst.hpp b/src/plugins/intel_gpu/src/graph/include/roll_inst.hpp
index 0b98d68651256d..47ecc250b46cc0 100644
--- a/src/plugins/intel_gpu/src/graph/include/roll_inst.hpp
+++ b/src/plugins/intel_gpu/src/graph/include/roll_inst.hpp
@@ -30,7 +30,6 @@ class typed_primitive_inst<roll> : public typed_primitive_inst_base<roll> {
     static std::vector<layout> calc_output_layouts(roll_node const& /*node*/, const kernel_impl_params& impl_param) {
         return forward_input0_shape<ShapeType>(impl_param);
     }
-    static layout calc_output_layout(const roll_node& node, kernel_impl_params const& impl_param);
     static std::string to_string(const roll_node& node);
 };
 
diff --git a/src/plugins/intel_gpu/src/graph/include/scatter_elements_update_inst.h b/src/plugins/intel_gpu/src/graph/include/scatter_elements_update_inst.h
index 0e06d900bddcbc..49d54f7d388ea5 100644
--- a/src/plugins/intel_gpu/src/graph/include/scatter_elements_update_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/scatter_elements_update_inst.h
@@ -22,7 +22,6 @@ class typed_primitive_inst<scatter_elements_update> : public typed_primitive_ins
         return forward_input0_shape<ShapeType>(impl_param);
     }
 
-    static layout calc_output_layout(scatter_elements_update_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(scatter_elements_update_node const& node);
 
     typed_primitive_inst(network& network, scatter_elements_update_node const& desc);
diff --git a/src/plugins/intel_gpu/src/graph/include/scatter_nd_update_inst.h b/src/plugins/intel_gpu/src/graph/include/scatter_nd_update_inst.h
index 4718bf367d3b55..3c828aa994390e 100644
--- a/src/plugins/intel_gpu/src/graph/include/scatter_nd_update_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/scatter_nd_update_inst.h
@@ -31,7 +31,6 @@ class typed_primitive_inst<scatter_nd_update> : public typed_primitive_inst_base
 public:
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(scatter_nd_update_node const& /*node*/, const kernel_impl_params& impl_param);
-    static layout calc_output_layout(scatter_nd_update_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(scatter_nd_update_node const& node);
 
 public:
diff --git a/src/plugins/intel_gpu/src/graph/include/scatter_update_inst.h b/src/plugins/intel_gpu/src/graph/include/scatter_update_inst.h
index 008c99ef070119..640ef528a87369 100644
--- a/src/plugins/intel_gpu/src/graph/include/scatter_update_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/scatter_update_inst.h
@@ -33,7 +33,6 @@ class typed_primitive_inst<scatter_update> : public typed_primitive_inst_base<sc
     static std::vector<layout> calc_output_layouts(scatter_update_node const& /*node*/, const kernel_impl_params& impl_param) {
         return forward_input0_shape<ShapeType>(impl_param);
     }
-    static layout calc_output_layout(scatter_update_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(scatter_update_node const& node);
 
     typed_primitive_inst(network& network, scatter_update_node const& desc);
diff --git a/src/plugins/intel_gpu/src/graph/include/select_inst.h b/src/plugins/intel_gpu/src/graph/include/select_inst.h
index 5c1305cde1e4af..f0795de5192306 100644
--- a/src/plugins/intel_gpu/src/graph/include/select_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/select_inst.h
@@ -30,7 +30,6 @@ class typed_primitive_inst<select> : public typed_primitive_inst_base<select> {
 public:
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(const select_node& /*node*/, const kernel_impl_params& impl_param);
-    static layout calc_output_layout(select_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(select_node const& node);
     typed_primitive_inst(network& network, select_node const& node);
 };
diff --git a/src/plugins/intel_gpu/src/graph/include/shape_of_inst.h b/src/plugins/intel_gpu/src/graph/include/shape_of_inst.h
index 7711ee84cf9a96..3c7edcc584673a 100644
--- a/src/plugins/intel_gpu/src/graph/include/shape_of_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/shape_of_inst.h
@@ -35,7 +35,6 @@ class typed_primitive_inst<shape_of> : public typed_primitive_inst_base<shape_of
 public:
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(shape_of_node const& /*node*/, const kernel_impl_params& impl_param);
-    static layout calc_output_layout(shape_of_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(shape_of_node const& node);
 
     typed_primitive_inst(network& network, shape_of_node const& node);
diff --git a/src/plugins/intel_gpu/src/graph/include/shuffle_channels_inst.h b/src/plugins/intel_gpu/src/graph/include/shuffle_channels_inst.h
index 6ca6aed36ec85e..e02331f379bb2b 100644
--- a/src/plugins/intel_gpu/src/graph/include/shuffle_channels_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/shuffle_channels_inst.h
@@ -23,7 +23,6 @@ class typed_primitive_inst<shuffle_channels> : public typed_primitive_inst_base<
         return forward_input0_shape<ShapeType>(impl_param);
     }
 
-    static layout calc_output_layout(shuffle_channels_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(shuffle_channels_node const& node);
 
     typed_primitive_inst(network& network, shuffle_channels_node const& desc);
diff --git a/src/plugins/intel_gpu/src/graph/include/slice_inst.h b/src/plugins/intel_gpu/src/graph/include/slice_inst.h
index 8889cca07eb850..1297b6e7028fe9 100644
--- a/src/plugins/intel_gpu/src/graph/include/slice_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/slice_inst.h
@@ -56,8 +56,7 @@ class typed_primitive_inst<slice> : public typed_primitive_inst_base<slice> {
 
 public:
     template<typename ShapeType>
-        static std::vector<layout> calc_output_layouts(const slice_node& /*node*/, const kernel_impl_params& impl_param);
-    static layout calc_output_layout(slice_node const& node, kernel_impl_params const& impl_param);
+    static std::vector<layout> calc_output_layouts(const slice_node& /*node*/, const kernel_impl_params& impl_param);
     static std::string to_string(slice_node const& node);
 
     typed_primitive_inst(network& network, slice_node const& desc);
diff --git a/src/plugins/intel_gpu/src/graph/include/softmax_inst.h b/src/plugins/intel_gpu/src/graph/include/softmax_inst.h
index d030dbfca58d72..e0a17fe9732307 100644
--- a/src/plugins/intel_gpu/src/graph/include/softmax_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/softmax_inst.h
@@ -31,7 +31,6 @@ class typed_primitive_inst<softmax> : public typed_primitive_inst_base<softmax>
         return forward_input0_shape<ShapeType>(impl_param);
     }
 
-    static layout calc_output_layout(softmax_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(softmax_node const& node);
 
     typed_primitive_inst(network& network, softmax_node const& desc);
diff --git a/src/plugins/intel_gpu/src/graph/include/space_to_batch_inst.h b/src/plugins/intel_gpu/src/graph/include/space_to_batch_inst.h
index 43c4ba49309032..6e12213dafb3b7 100644
--- a/src/plugins/intel_gpu/src/graph/include/space_to_batch_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/space_to_batch_inst.h
@@ -32,7 +32,6 @@ class typed_primitive_inst<space_to_batch> : public typed_primitive_inst_base<sp
 public:
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(space_to_batch_node const& /*node*/, const kernel_impl_params& impl_param);
-    static layout calc_output_layout(space_to_batch_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(space_to_batch_node const& node);
 
     bool need_reset_output_memory() const override {
diff --git a/src/plugins/intel_gpu/src/graph/include/space_to_depth_inst.h b/src/plugins/intel_gpu/src/graph/include/space_to_depth_inst.h
index dbd94dc446ee5b..963d6093e191a3 100644
--- a/src/plugins/intel_gpu/src/graph/include/space_to_depth_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/space_to_depth_inst.h
@@ -33,7 +33,6 @@ class typed_primitive_inst<space_to_depth> : public typed_primitive_inst_base<sp
 public:
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(space_to_depth_node const& node, kernel_impl_params const& impl_param);
-    static layout calc_output_layout(space_to_depth_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(space_to_depth_node const& node);
 
 public:
diff --git a/src/plugins/intel_gpu/src/graph/include/strided_slice_inst.h b/src/plugins/intel_gpu/src/graph/include/strided_slice_inst.h
index 6f7ca39bd5efda..6858032e52d3b1 100644
--- a/src/plugins/intel_gpu/src/graph/include/strided_slice_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/strided_slice_inst.h
@@ -36,7 +36,6 @@ class typed_primitive_inst<strided_slice> : public typed_primitive_inst_base<str
 public:
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(strided_slice_node const& /*node*/, const kernel_impl_params& impl_param);
-    static layout calc_output_layout(strided_slice_node const& node, kernel_impl_params const& impl_param);
     static std::string to_string(strided_slice_node const& node);
 
     typed_primitive_inst(network& network, strided_slice_node const& desc);
diff --git a/src/plugins/intel_gpu/src/graph/include/swiglu_inst.h b/src/plugins/intel_gpu/src/graph/include/swiglu_inst.h
index 6a5ce08dc54bd2..2413cfa72af86a 100644
--- a/src/plugins/intel_gpu/src/graph/include/swiglu_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/swiglu_inst.h
@@ -31,7 +31,6 @@ class typed_primitive_inst<swiglu> : public typed_primitive_inst_base<swiglu> {
 public:
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(swiglu_node const& /*node*/, const kernel_impl_params& impl_params);
-    static layout calc_output_layout(swiglu_node const& node, kernel_impl_params const& impl_params);
     static std::string to_string(swiglu_node const& node);
 
     typed_primitive_inst(network& network, swiglu_node const& node);
diff --git a/src/plugins/intel_gpu/src/graph/include/tile_inst.h b/src/plugins/intel_gpu/src/graph/include/tile_inst.h
index db9a1b87fedd9a..c456802070d5a4 100644
--- a/src/plugins/intel_gpu/src/graph/include/tile_inst.h
+++ b/src/plugins/intel_gpu/src/graph/include/tile_inst.h
@@ -32,7 +32,6 @@ class typed_primitive_inst<tile> : public typed_primitive_inst_base<tile> {
 public:
     template<typename ShapeType>
     static std::vector<layout> calc_output_layouts(tile_node const& /*node*/, const kernel_impl_params& impl_param);
-    static layout calc_output_layout(tile_node const& node, kernel_impl_params const& impl_param);
 
     static std::string to_string(tile_node const& node);
 
diff --git a/src/plugins/intel_gpu/src/graph/include/unique_inst.hpp b/src/plugins/intel_gpu/src/graph/include/unique_inst.hpp
index 6b1faecd5d39fe..21394110563398 100644
--- a/src/plugins/intel_gpu/src/graph/include/unique_inst.hpp
+++ b/src/plugins/intel_gpu/src/graph/include/unique_inst.hpp
@@ -27,7 +27,6 @@ class typed_primitive_inst<unique_count> : public typed_primitive_inst_base<uniq
     using parent = typed_primitive_inst_base<unique_count>;
     using parent::parent;
 
-    static layout calc_output_layout(const unique_count_node& node, const kernel_impl_params& impl_param);
     template <typename ShapeType>
     static std::vector<layout> calc_output_layouts(const unique_count_node& node, const kernel_impl_params& impl_param);
     static std::string to_string(const unique_count_node& node);
@@ -57,7 +56,6 @@ class typed_primitive_inst<unique_gather> : public typed_primitive_inst_base<uni
     using parent = typed_primitive_inst_base<unique_gather>;
     using parent::parent;
 
-    static layout calc_output_layout(const unique_gather_node& node, const kernel_impl_params& impl_param);
     template <typename ShapeType>
     static std::vector<layout> calc_output_layouts(const unique_gather_node& node,
                                                    const kernel_impl_params& impl_param);
diff --git a/src/plugins/intel_gpu/src/graph/kv_cache.cpp b/src/plugins/intel_gpu/src/graph/kv_cache.cpp
index 95cdd587cdf175..fa158039291670 100644
--- a/src/plugins/intel_gpu/src/graph/kv_cache.cpp
+++ b/src/plugins/intel_gpu/src/graph/kv_cache.cpp
@@ -20,10 +20,6 @@ kv_cache_inst::typed_primitive_inst(network& network, const kv_cache_node& node)
     kv_cache_id = network.get_kv_cache_ids().size();
 }
 
-layout kv_cache_inst::calc_output_layout(const kv_cache_node& node, kernel_impl_params const& impl_param) {
-    return impl_param.input_layouts[0];
-}
-
 template<typename ShapeType>
 std::vector<layout> kv_cache_inst::calc_output_layouts(kv_cache_node const& /*node*/, kernel_impl_params const& impl_param) {
     auto desc = impl_param.typed_desc<kv_cache>();
diff --git a/src/plugins/intel_gpu/src/graph/layout_optimizer.cpp b/src/plugins/intel_gpu/src/graph/layout_optimizer.cpp
index 6439ae570cd8c5..a4de595d5a5af1 100644
--- a/src/plugins/intel_gpu/src/graph/layout_optimizer.cpp
+++ b/src/plugins/intel_gpu/src/graph/layout_optimizer.cpp
@@ -426,7 +426,6 @@ bool layout_optimizer::can_fuse_reorder(program_node& prev, program_node& next,
 }
 
 bool layout_optimizer::can_fuse_reorder_to_prev(program_node& prev, reorder_node& node, format fmt_prev, format fmt_next) {
-    bool allow_new_shape_infer = node.get_program().is_new_shape_infer();
     // Because mvn and concatenation kernel can work cross-layout, if reorder only performs type conversion,
     // fusing reorder to the previous node can be done even if it is a dynamic shape case
     if ((prev.is_type<mvn>() || prev.is_type<concatenation>() || prev.is_type<gather>() || prev.is_type<broadcast>() ||
@@ -497,8 +496,7 @@ bool layout_optimizer::can_fuse_reorder_to_prev(program_node& prev, reorder_node
         if (fmt_prev.dimension() > 6 || fmt_next.dimension() > 6)
             return false;
 
-        // Skip reorder fusing to permute when allow_new_shape_infer is True and input and output rank is different
-        if (allow_new_shape_infer && (fmt_prev.dimension() != fmt_next.dimension()))
+        if (fmt_prev.dimension() != fmt_next.dimension())
             return false;
 
         return true;
@@ -727,7 +725,7 @@ bool layout_optimizer::should_select_b_fs_yx_fsv16_layout(convolution_node const
     auto fully_support_conv_num = _optimized_conv_count.at({format::b_fs_yx_fsv16, false});
     auto partially_support_conv_num = _optimized_conv_count.at({format::b_fs_yx_fsv16, true});
 
-    auto output_layout = node.calc_output_layout();
+    auto output_layout = node.calc_output_layouts()[0];
 
     auto current_conv_supports_layout = convolution_b_fs_yx_fsv16_opt(input_layout, output_layout, weights_layout,  prim);
     auto is_prev_conv_node_supports_layout = node.get_dependency(0).is_type<convolution>() &&
@@ -1006,7 +1004,7 @@ bool layout_optimizer::users_for_convolution_byxf_opt(program_node const& node,
         // convolution that is capable to use byxf and is performant is also valid for byxf opt
         } else if (user->type() == cldnn::convolution::type_id()) {
             if (convolution_byxf_opt(node.get_output_layout(),
-                                     user->calc_output_layout(),
+                                     user->calc_output_layouts()[0],
                                      user->get_input_layout(1),
                                      user->as<convolution>())) {
                 if (!users_for_convolution_byxf_opt(*user, depth - 1))
@@ -1751,28 +1749,10 @@ format layout_optimizer::get_preferred_format(program_node& node) {
     auto output_layout = node.get_output_layout();
     bool use_onednn_impls = _optimization_attributes.use_onednn_impls;
 
-    bool allow_new_shape_infer = node.get_program().is_new_shape_infer();
-
-    if (allow_new_shape_infer) {
-        // Let reorder_input pass to check input format instead of output_format in forward investigation, vice versa
-        auto out_lay_rank = node.get_output_layout(false).get_rank();
-        auto has_reshape_user = [&](const program_node& node) -> bool {
-            for (auto& user_node : node.get_users()) {
-                if (user_node->is_type<reshape>())
-                    return true;
-            }
-            return false;
-        };
-
-        // Return default format for output layout rank when user node is reshape
-        // to add reorder in front of reshape in reorder_input stage instead of handle_reshpae stage.
-        // It is only applied for the dynamic shape with static input shape
-        if (!node.is_dynamic() &&  has_reshape_user(node))
-            return format::get_default_format(out_lay_rank);
-
-        if (node.is_type<shape_of>())
-            return format::get_default_format(node.get_input_layout(0).get_rank());
+    if (node.is_type<shape_of>())
+        return format::get_default_format(node.get_input_layout(0).get_rank());
 
+    if (node.is_dynamic()) {
         auto dep_size = node.get_dependencies().size();
         for (size_t i = 0; i < dep_size; i++) {
             auto in_lay_rank = node.get_input_layout(i).get_rank();
@@ -1780,31 +1760,17 @@ format layout_optimizer::get_preferred_format(program_node& node) {
             if (std::find(shape_infer_deps.begin(), shape_infer_deps.end(), i) != shape_infer_deps.end()) {
                 auto fmt = format::get_default_format(in_lay_rank, false, false);
                 node.set_preferred_input_fmt(i, fmt);
-            } else if (in_lay_rank != out_lay_rank) {
-                auto fmt = get_preferred_format(node.get_dependency(i));
-                // Check if selected format can be adjusted to the required input rank
-                // If no, use default fotmat instead
-                try {
-                    // 7-dimention and 8-dimention only support plain format
-                    if (in_lay_rank >= 7 || out_lay_rank >= 7) {
-                        fmt = format::get_default_format(in_lay_rank);
-                    } else {
-                        format::adjust_to_rank(fmt, in_lay_rank);
-                    }
-                } catch (ov::Exception&) {
-                    fmt = format::get_default_format(in_lay_rank);
-                }
-                node.set_preferred_input_fmt(i, fmt);
             }
         }
+    }
 
-        // shape_infer_dep should be plain format because the memory is being read by ngraph shape infer as is
-        if (node.is_shape_infer_dep()) {
-            expected = format::get_default_format(output_layout.get_rank(), false, false);
-            node.set_preferred_output_fmt(0, expected);
-            return expected;
-        }
+    // shape_infer_dep should be plain format because the memory is being read by ngraph shape infer as is
+    if (node.is_shape_infer_dep()) {
+        expected = format::get_default_format(output_layout.get_rank(), false, false);
+        node.set_preferred_output_fmt(0, expected);
+        return expected;
     }
+
     if (!_forcing_map.empty() && _forcing_map.count(node.id()) != 0) {
         expected = _forcing_map.at(node.id()).first;
     } else if (node.is_type<convolution>()) {
@@ -1866,19 +1832,10 @@ format layout_optimizer::get_preferred_format(program_node& node) {
             expected = node.get_preferred_output_fmt();
         }
         if (node.is_type<fully_connected>()) {
-            if (allow_new_shape_infer) {
-                // Plain input format is enforced because no available shape agnostic kernel supporting blocked format.
-                // The condition will be relaxed once more shape agnostic kernels for other formats are enabled (e.g., fsv->bfyx FC optimized kernel(i8)))
-                expected = format::get_default_format(node.get_input_layout(0).get_rank());
-                node.set_preferred_input_fmt(0, expected);
-            } else {
-                auto& fc_node = node.as<fully_connected>();
-                auto input_layout = fc_node.get_input_layout();
-                if (input_layout.format.dimension() > 4) {
-                    expected = format::bfyx;
-                    node.set_preferred_input_fmt(0, format::bfyx);
-                }
-            }
+            // Plain input format is enforced because no available shape agnostic kernel supporting blocked format.
+            // The condition will be relaxed once more shape agnostic kernels for other formats are enabled (e.g., fsv->bfyx FC optimized kernel(i8)))
+            expected = format::get_default_format(node.get_input_layout(0).get_rank());
+            node.set_preferred_input_fmt(0, expected);
         }
     } else if (node.is_type<gather>()) {
         // Gather needs the original input/output rank because
@@ -1893,7 +1850,7 @@ format layout_optimizer::get_preferred_format(program_node& node) {
         }
     }
 
-    if (allow_new_shape_infer && node.get_preferred_input_fmt() != format::any) {
+    if (node.get_preferred_input_fmt() != format::any) {
         if (node.get_preferred_output_fmt() != format::any)
             expected = node.get_preferred_output_fmt();
         node.set_preferred_output_fmt(0, expected);
@@ -2088,7 +2045,7 @@ void layout_optimizer::set_optimization_attribute(optimization_attributes_type a
 bool layout_optimizer::is_format_optimized(const convolution_node& node, const format& format, bool use_weak_restrictions) {
     auto input_layout = node.get_input_layout();
     auto weights_layout = node.weights().get_output_layout();
-    auto output_layout = node.calc_output_layout();
+    auto output_layout = node.calc_output_layouts()[0];
     auto prim = node.get_primitive();
 
     if (input_layout.is_dynamic() || output_layout.is_dynamic())
diff --git a/src/plugins/intel_gpu/src/graph/loop.cpp b/src/plugins/intel_gpu/src/graph/loop.cpp
index 51a7f5f0040a8f..ef07279a4afbf9 100644
--- a/src/plugins/intel_gpu/src/graph/loop.cpp
+++ b/src/plugins/intel_gpu/src/graph/loop.cpp
@@ -42,35 +42,6 @@ std::map<size_t, memory::ptr> loop_node::get_memory_deps() const {
     return memory_deps;
 }
 
-layout loop_inst::calc_output_layout(loop_node const& /*node*/, kernel_impl_params const& impl_param) {
-    auto prim = impl_param.typed_desc<loop>();
-
-    // finds internal output
-    const auto& output_primitive_maps = prim->output_primitive_maps;
-    const auto& output_mapping = output_primitive_maps.front();
-
-    const auto& body_program = impl_param.inner_progs.front();
-    const auto& body_outputs = body_program->get_outputs();
-
-    const primitive_id& output_internal_id = output_mapping.internal_id.pid;
-    auto target = std::find_if(body_outputs.begin(), body_outputs.end(), [&](const cldnn::program_node * output) {
-        return output->id() == output_internal_id;
-    });
-    OPENVINO_ASSERT(target != body_outputs.end(), impl_param.desc->id, "output not found");
-
-    // set body output layout
-    layout loop_output_layout = (*target)->get_output_layout();
-    const int64_t axis_to_iterate_through = output_mapping.axis;
-    if (axis_to_iterate_through != -1) {
-        const size_t ndim = loop_output_layout.get_rank();
-        auto shape = loop_output_layout.get_dims();
-        shape[axis_to_iterate_through] = static_cast<int32_t>(prim->max_num_iterations);
-        loop_output_layout.set_tensor(tensor(format::get_default_format(ndim), shape));
-    }
-
-    return loop_output_layout;
-}
-
 template<typename T>
 static std::vector<layout> get_output_layouts(kernel_impl_params const& impl_param, std::vector<T> body_outputs, const int64_t num_iterations = -1) {
     auto prim = impl_param.typed_desc<loop>();
@@ -782,19 +753,13 @@ void loop_inst::update_output_layout() {
     _impl_params->memory_deps = memory_deps;
 
     auto new_layouts = _node->type()->calc_output_layouts(*_node, *_impl_params);
-    if (new_layouts.empty()) {
-        auto new_layout = _node->type()->calc_output_layout(*_node, *_impl_params);
-        new_layout.data_padding = padding::max(_node->get_primitive()->get_output_padding(0), new_layout.data_padding);
-        _impl_params->output_layouts[0] = new_layout;
-    } else {
-        if (_impl_params->output_layouts.size() < new_layouts.size()) {
-            _impl_params->output_layouts.resize(new_layouts.size());
-        }
-        for (size_t i = 0; i < new_layouts.size(); ++i) {
-            auto new_layout = new_layouts[i];
-            new_layout.data_padding = padding::max(_node->get_primitive()->get_output_padding(i), new_layout.data_padding);
-            _impl_params->output_layouts[i] = new_layout;
-        }
+    if (_impl_params->output_layouts.size() < new_layouts.size()) {
+        _impl_params->output_layouts.resize(new_layouts.size());
+    }
+    for (size_t i = 0; i < new_layouts.size(); ++i) {
+        auto new_layout = new_layouts[i];
+        new_layout.data_padding = padding::max(_node->get_primitive()->get_output_padding(i), new_layout.data_padding);
+        _impl_params->output_layouts[i] = new_layout;
     }
 }
 
diff --git a/src/plugins/intel_gpu/src/graph/lrn.cpp b/src/plugins/intel_gpu/src/graph/lrn.cpp
index 3ece107b2d9de6..7e4b7e4dc06330 100644
--- a/src/plugins/intel_gpu/src/graph/lrn.cpp
+++ b/src/plugins/intel_gpu/src/graph/lrn.cpp
@@ -11,22 +11,6 @@
 namespace cldnn {
 GPU_DEFINE_PRIMITIVE_TYPE_ID(lrn)
 
-layout lrn_inst::calc_output_layout(lrn_node const& node, kernel_impl_params const& impl_param) {
-    assert(static_cast<bool>(impl_param.desc->output_data_types[0]) == false &&
-           "Output data type forcing is not supported for lrn_node!");
-    auto input_layout = impl_param.get_input_layout();
-    auto output_type = input_layout.data_type;
-
-    if (impl_param.has_fused_primitives()) {
-        output_type = impl_param.get_output_element_type();
-    }
-
-    auto result = impl_param.get_non_padded_input_layout();
-    result.data_type = output_type;
-
-    return result;
-}
-
 std::string lrn_inst::to_string(lrn_node const& node) {
     auto node_info = node.desc_to_json();
     auto desc = node.get_primitive();
diff --git a/src/plugins/intel_gpu/src/graph/lstm_elt.cpp b/src/plugins/intel_gpu/src/graph/lstm_elt.cpp
index 098e89aa45003e..aa8e01f9acf64e 100644
--- a/src/plugins/intel_gpu/src/graph/lstm_elt.cpp
+++ b/src/plugins/intel_gpu/src/graph/lstm_elt.cpp
@@ -10,23 +10,6 @@
 namespace cldnn {
 GPU_DEFINE_PRIMITIVE_TYPE_ID(lstm_elt)
 
-layout lstm_elt_inst::calc_output_layout(lstm_elt_node const& node, kernel_impl_params const& impl_param) {
-    assert(static_cast<bool>(impl_param.desc->output_data_types[0]) == false &&
-           "Output data type forcing is not supported for lstm_elt_node!");
-    auto input_layout = impl_param.get_input_layout();
-
-    // tempGEMM{bfyx} = [b: batch, f: direction, x: 1,         y: 4 * hidden_size ] input
-    // cell{bfyx}     = [b: batch, f: direction, x: 1,         y: hidden_size ] optional
-    // output{bfyx}   = [b: batch, f: 2,         x: direction, y: hidden_size ] output
-    // The output of the lstm_elt node is the concatenation of the intermediate [hidden, cell] tensors.
-    // A crop/split node is needed to extract each individual tensors
-    auto result =
-        layout(input_layout.data_type,
-               input_layout.format,
-               tensor(input_layout.batch(), 2, input_layout.spatial(0) / 4, input_layout.feature()));
-    return result;
-}
-
 template<typename ShapeType>
 std::vector<layout> lstm_elt_inst::calc_output_layouts(lstm_elt_node const& node, kernel_impl_params const& impl_param) {
     std::vector<layout> output_layouts;
diff --git a/src/plugins/intel_gpu/src/graph/matrix_nms.cpp b/src/plugins/intel_gpu/src/graph/matrix_nms.cpp
index cd7462633c89a8..c03a1c277f0dcb 100644
--- a/src/plugins/intel_gpu/src/graph/matrix_nms.cpp
+++ b/src/plugins/intel_gpu/src/graph/matrix_nms.cpp
@@ -1,6 +1,7 @@
 // Copyright (C) 2018-2024 Intel Corporation
 // SPDX-License-Identifier: Apache-2.0
 
+#include "intel_gpu/primitives/matrix_nms.hpp"
 #include <json_object.h>
 
 #include <sstream>
@@ -61,33 +62,6 @@ std::vector<layout> matrix_nms_inst::calc_output_layouts(matrix_nms_node const&
 
 template std::vector<layout> matrix_nms_inst::calc_output_layouts<ov::PartialShape>(matrix_nms_node const& node, const kernel_impl_params& impl_param);
 
-layout matrix_nms_inst::calc_output_layout(const matrix_nms_node& node, const kernel_impl_params& impl_param) {
-    const auto primitive = impl_param.typed_desc<matrix_nms>();
-    const auto boxes_layout = impl_param.get_input_layout(0);
-    const auto scores_layout = impl_param.get_input_layout(1);
-
-    const auto batches_num = boxes_layout.batch();
-    auto classes_num = scores_layout.feature();
-    const auto boxes_num = boxes_layout.feature();
-
-    if (primitive->attribs.background_class >= 0 && primitive->attribs.background_class < classes_num)
-        classes_num = std::max(1, classes_num - 1);
-
-    int max_output_boxes_per_class{boxes_num};
-    if (primitive->attribs.nms_top_k >= 0)
-        max_output_boxes_per_class = std::min(max_output_boxes_per_class, primitive->attribs.nms_top_k);
-
-    auto max_output_boxes_per_batch = max_output_boxes_per_class * classes_num;
-    if (primitive->attribs.keep_top_k >= 0)
-        max_output_boxes_per_batch = std::min(max_output_boxes_per_batch, primitive->attribs.keep_top_k);
-
-    auto output_num = max_output_boxes_per_batch * batches_num;
-
-    // BOX_DATA: class_id, box_score, xmin, ymin, xmax, ymax
-    constexpr size_t BOX_DATA{6};
-    return layout(boxes_layout.data_type, boxes_layout.format, {output_num, BOX_DATA, 1, 1});
-}
-
 std::string matrix_nms_inst::to_string(const matrix_nms_node& node) {
     json_composite matrix_nms_info;
     matrix_nms_info.add("boxes id", node.input().id());
diff --git a/src/plugins/intel_gpu/src/graph/multiclass_nms.cpp b/src/plugins/intel_gpu/src/graph/multiclass_nms.cpp
index 736f64d1b2591c..c0414a9b8ef5d2 100644
--- a/src/plugins/intel_gpu/src/graph/multiclass_nms.cpp
+++ b/src/plugins/intel_gpu/src/graph/multiclass_nms.cpp
@@ -2,6 +2,8 @@
 // SPDX-License-Identifier: Apache-2.0
 //
 
+#include "openvino/op/multiclass_nms.hpp"
+#include "multiclass_nms_shape_inference.hpp"
 #include <string>
 
 #include "json_object.h"
@@ -41,39 +43,6 @@ std::vector<layout> multiclass_nms_inst::calc_output_layouts(multiclass_nms_node
 
 template std::vector<layout> multiclass_nms_inst::calc_output_layouts<ov::PartialShape>(multiclass_nms_node const& node, const kernel_impl_params& impl_param);
 
-
-layout multiclass_nms_inst::calc_output_layout(const multiclass_nms_node& node, const kernel_impl_params& impl_param) {
-    const auto input_layout = impl_param.get_input_layout();
-    const auto attrs = impl_param.typed_desc<multiclass_nms>()->attrs;
-
-    const auto num_batches =
-        node.has_roisnum() ? node.roisnum().get_output_layout().batch() : node.scores().get_output_layout().batch();
-    auto num_classes =
-        node.has_roisnum() ? node.boxes().get_output_layout().batch() : node.scores().get_output_layout().feature();
-    const auto num_boxes = node.boxes().get_output_layout().feature();
-
-    // see shape_infer() call in MulticlassNmsIEInternal::validate_and_infer_types() - ignore_bg_class == true
-    if (attrs.background_class >= 0 && attrs.background_class < num_classes) {
-        num_classes = std::max(1, num_classes - 1);
-    }
-
-    int max_output_boxes_per_class = 0;
-    if (attrs.nms_top_k >= 0) {
-        max_output_boxes_per_class = std::min(num_boxes, attrs.nms_top_k);
-    } else {
-        max_output_boxes_per_class = num_boxes;
-    }
-
-    auto max_output_boxes_per_batch = max_output_boxes_per_class * num_classes;
-    if (attrs.keep_top_k >= 0) {
-        max_output_boxes_per_batch = std::min(max_output_boxes_per_batch, attrs.keep_top_k);
-    }
-
-    const auto dim = max_output_boxes_per_batch * num_batches;
-    constexpr auto output_size = 6; // 4 coordinates + 1 class + 1 score
-    return layout{input_layout.data_type, input_layout.format, {dim, output_size, 1, 1}};
-}
-
 std::string multiclass_nms_inst::to_string(const multiclass_nms_node& node) {
     const auto attrs = node.get_primitive()->attrs;
     std::stringstream primitive_description;
diff --git a/src/plugins/intel_gpu/src/graph/multinomial.cpp b/src/plugins/intel_gpu/src/graph/multinomial.cpp
index fb33bc77844e35..eb4724c7478da5 100644
--- a/src/plugins/intel_gpu/src/graph/multinomial.cpp
+++ b/src/plugins/intel_gpu/src/graph/multinomial.cpp
@@ -23,23 +23,6 @@ std::vector<layout> multinomial_inst::calc_output_layouts(multinomial_node const
 
 template std::vector<layout> multinomial_inst::calc_output_layouts<ov::PartialShape>(multinomial_node const& node, const kernel_impl_params& impl_param);
 
-layout multinomial_inst::calc_output_layout(multinomial_node const& node, kernel_impl_params const& impl_param) {
-    auto primitive = impl_param.typed_desc<multinomial>();
-    auto input_layout = impl_param.get_input_layout(0);
-    if (input_layout.get_shape().size() == 1) {
-        return {primitive->output_data_type, input_layout.format,
-            tensor{std::vector<tensor::value_type>{
-                static_cast<tensor::value_type>(primitive->num_samples)
-            }}};
-    } else {
-        return {primitive->output_data_type, input_layout.format,
-            tensor{std::vector<tensor::value_type>{
-                input_layout.batch(),
-                static_cast<tensor::value_type>(primitive->num_samples)
-            }}};
-    }
-}
-
 multinomial_inst::typed_primitive_inst(network& network, multinomial_node const& node)
     : parent{network, node} {}
 
diff --git a/src/plugins/intel_gpu/src/graph/mvn.cpp b/src/plugins/intel_gpu/src/graph/mvn.cpp
index 3f7dfb8663b37c..ce92b617630264 100644
--- a/src/plugins/intel_gpu/src/graph/mvn.cpp
+++ b/src/plugins/intel_gpu/src/graph/mvn.cpp
@@ -10,19 +10,6 @@
 namespace cldnn {
 GPU_DEFINE_PRIMITIVE_TYPE_ID(mvn)
 
-layout mvn_inst::calc_output_layout(mvn_node const& node, kernel_impl_params const& impl_param) {
-    auto input_node_layout = impl_param.get_non_padded_input_layout();
-    auto output_type = impl_param.desc->output_data_types[0].value_or(input_node_layout.data_type);
-
-    if (impl_param.has_fused_primitives()) {
-        output_type = impl_param.get_output_element_type();
-    } else if (input_node_layout.data_type == data_types::u8 || input_node_layout.data_type == data_types::i8) {
-        output_type = data_types::f32;
-    }
-
-    return layout(output_type, input_node_layout.format, input_node_layout.get_tensor());
-}
-
 std::string mvn_inst::to_string(mvn_node const& node) {
     auto node_info = node.desc_to_json();
     auto desc = node.get_primitive();
diff --git a/src/plugins/intel_gpu/src/graph/non_max_suppression.cpp b/src/plugins/intel_gpu/src/graph/non_max_suppression.cpp
index 00fdc5dc6db31e..d77c1a0450ba79 100644
--- a/src/plugins/intel_gpu/src/graph/non_max_suppression.cpp
+++ b/src/plugins/intel_gpu/src/graph/non_max_suppression.cpp
@@ -1,7 +1,9 @@
 // Copyright (C) 2018-2024 Intel Corporation
 // SPDX-License-Identifier: Apache-2.0
 //
+#include "intel_gpu/runtime/tensor_accessor.hpp"
 #include "non_max_suppression_inst.h"
+#include "openvino/op/nms_rotated.hpp"
 #include "primitive_type_base.h"
 #include "json_object.h"
 #include <string>
@@ -17,15 +19,6 @@ namespace cldnn {
 // -----------------------------------------------
 GPU_DEFINE_PRIMITIVE_TYPE_ID(non_max_suppression)
 
-layout non_max_suppression_inst::calc_output_layout(non_max_suppression_node const& node, kernel_impl_params const& impl_param) {
-    auto desc = impl_param.typed_desc<non_max_suppression>();
-
-    auto output_type = desc->output_data_types[0].value_or(data_types::i32);
-
-    auto output_size = tensor(batch(desc->selected_indices_num), feature(3));
-    return layout(output_type, impl_param.get_input_layout().format, output_size);
-}
-
 template<typename ShapeType>
 std::vector<layout> non_max_suppression_inst::calc_output_layouts(non_max_suppression_node const& /*node*/, const kernel_impl_params& impl_param) {
     std::vector<layout> layouts;
@@ -148,7 +141,7 @@ void non_max_suppression_gather_inst::update_output_memory() {
         return;
 
     for (size_t i = 0; i < inputs_memory_count(); i++) {
-        if (node->get_program().is_new_shape_infer() && input_memory_ptr(i) == nullptr)
+        if (input_memory_ptr(i) == nullptr)
             return;
 
         if (output_memory_ptr(i) != nullptr && _network.get_engine().is_the_same_buffer(output_memory(i), input_memory(i)))
diff --git a/src/plugins/intel_gpu/src/graph/non_zero.cpp b/src/plugins/intel_gpu/src/graph/non_zero.cpp
index 9bf1fd4ff32b73..429eaf68acba96 100644
--- a/src/plugins/intel_gpu/src/graph/non_zero.cpp
+++ b/src/plugins/intel_gpu/src/graph/non_zero.cpp
@@ -16,12 +16,6 @@ namespace cldnn {
 // -----------------------------------------------
 GPU_DEFINE_PRIMITIVE_TYPE_ID(count_nonzero)
 
-layout count_nonzero_inst::calc_output_layout(count_nonzero_node const& node, kernel_impl_params const& impl_param) {
-    assert(static_cast<bool>(node.get_primitive()->output_data_types[0]) == false &&
-           "Output data type forcing is not supported for count_nonzero_node!");
-    return layout{cldnn::data_types::i32, cldnn::format::bfyx, tensor{1, 1, 1, 1}};
-}
-
 template<typename ShapeType>
 std::vector<layout> count_nonzero_inst::calc_output_layouts(count_nonzero_node const& /*node*/, kernel_impl_params const& impl_param) {
     assert(static_cast<bool>(impl_param.desc->output_data_types[0]) == false &&
@@ -53,18 +47,6 @@ count_nonzero_inst::typed_primitive_inst(network& network, count_nonzero_node co
 // -----------------------------------------------
 GPU_DEFINE_PRIMITIVE_TYPE_ID(gather_nonzero)
 
-layout gather_nonzero_inst::calc_output_layout(gather_nonzero_node const& node, kernel_impl_params const& impl_param) {
-    assert(static_cast<bool>(node.get_primitive()->output_data_types[0]) == false &&
-           "Output data type forcing is not supported for gather_nonzero_node!");
-    auto rank = impl_param.get_input_layout(0).get_partial_shape().rank().get_length();
-    if (impl_param.memory_deps.count(1)) {
-        auto out_size = read_vector<int64_t>(impl_param.memory_deps.at(1), impl_param.get_stream());
-        return layout{{rank, out_size[0], 1, 1}, cldnn::data_types::i32, cldnn::format::bfyx};
-    } else {
-        return layout{ov::PartialShape({ov::Dimension(rank), ov::Dimension::dynamic(), 1, 1}), cldnn::data_types::i32, cldnn::format::bfyx};
-    }
-}
-
 template<typename ShapeType>
 std::vector<layout> gather_nonzero_inst::calc_output_layouts(gather_nonzero_node const& /*node*/, kernel_impl_params const& impl_param) {
     auto desc = impl_param.typed_desc<gather_nonzero>();
diff --git a/src/plugins/intel_gpu/src/graph/normalize.cpp b/src/plugins/intel_gpu/src/graph/normalize.cpp
index 02d2524f23dba3..7c20972562b277 100644
--- a/src/plugins/intel_gpu/src/graph/normalize.cpp
+++ b/src/plugins/intel_gpu/src/graph/normalize.cpp
@@ -11,21 +11,6 @@
 namespace cldnn {
 GPU_DEFINE_PRIMITIVE_TYPE_ID(normalize)
 
-layout normalize_inst::calc_output_layout(normalize_node const& node, kernel_impl_params const& impl_param) {
-    assert(static_cast<bool>(impl_param.desc->output_data_types[0]) == false &&
-           "Output data type forcing is not supported for normalize_node!");
-    auto input_node_layout = impl_param.get_non_padded_input_layout();
-    auto output_type = input_node_layout.data_type;
-
-    if (impl_param.has_fused_primitives()) {
-        output_type = impl_param.get_output_element_type();
-    } else if (input_node_layout.data_type == data_types::u8 || input_node_layout.data_type == data_types::i8) {
-        output_type = data_types::f32;
-    }
-
-    return layout(output_type, input_node_layout.format, input_node_layout.get_tensor());
-}
-
 std::string normalize_inst::to_string(normalize_node const& node) {
     auto node_info = node.desc_to_json();
     auto desc = node.get_primitive();
diff --git a/src/plugins/intel_gpu/src/graph/one_hot.cpp b/src/plugins/intel_gpu/src/graph/one_hot.cpp
index ede34e8e0935b0..fb3a17b675e7f7 100644
--- a/src/plugins/intel_gpu/src/graph/one_hot.cpp
+++ b/src/plugins/intel_gpu/src/graph/one_hot.cpp
@@ -4,7 +4,6 @@
 
 #include "one_hot_inst.h"
 
-#include "intel_gpu/runtime/error_handler.hpp"
 #include "json_object.h"
 #include "primitive_type_base.h"
 #include <string>
@@ -15,35 +14,6 @@
 namespace cldnn {
 GPU_DEFINE_PRIMITIVE_TYPE_ID(one_hot)
 
-static bool is_output_bfzyx(const layout& input, int32_t axis) {
-    if (input.format == format::bfzyx)
-        return true;
-    if (axis == 4)
-        return true;
-    auto in_dims = input.get_tensor().sizes(format::bfyx);
-    if (in_dims[3] != 1)
-        return true;
-    return false;
-}
-
-layout one_hot_inst::calc_output_layout(one_hot_node const& node, kernel_impl_params const& impl_param) {
-    auto input_layout = impl_param.get_input_layout();
-    auto desc = impl_param.typed_desc<one_hot>();
-
-    auto dt = desc->output_data_types[0].value_or(input_layout.data_type);
-    auto format = input_layout.format;
-
-    if (desc->one_hot_axis > 4) {
-        CLDNN_ERROR_MESSAGE(desc->id,
-                            "Incorrect parameters configuration: one_hot_axis should be less or equal to 4.");
-    }
-
-    if (is_output_bfzyx(input_layout, desc->one_hot_axis))
-        format = format::bfzyx;
-
-    return {dt, format, desc->shape};
-}
-
 template<typename ShapeType>
 std::vector<layout> one_hot_inst::calc_output_layouts(const one_hot_node& /*node*/, const kernel_impl_params& impl_param) {
     auto desc = impl_param.typed_desc<one_hot>();
@@ -81,7 +51,6 @@ template std::vector<layout> one_hot_inst::calc_output_layouts<ov::PartialShape>
 std::string one_hot_inst::to_string(one_hot_node const& node) {
     auto desc = node.get_primitive();
     auto node_info = node.desc_to_json();
-    const auto& shape = desc->shape;
     const auto& one_hot_axis = desc->one_hot_axis;
     auto& input = node.input();
 
@@ -89,7 +58,6 @@ std::string one_hot_inst::to_string(one_hot_node const& node) {
 
     json_composite one_hot_info;
     one_hot_info.add("input id", input.id());
-    one_hot_info.add("output shape", shape.to_string());
     one_hot_info.add("one-hot axis", one_hot_axis);
 
     node_info->add("one_hot info", one_hot_info);
@@ -98,36 +66,5 @@ std::string one_hot_inst::to_string(one_hot_node const& node) {
     return primitive_description.str();
 }
 
-one_hot_inst::typed_primitive_inst(network& network, one_hot_node const& node) : parent(network, node) {
-    auto input_layout = node.get_input_layout();
-
-    if (input_layout.is_dynamic())
-        return;
-
-    const auto& input_sizes = input_layout.get_tensor();
-    const auto& output_sizes = argument->shape;
-
-    std::vector<tensor::value_type> input_dims = {input_sizes.batch[0],
-                                                  input_sizes.feature[0],
-                                                  input_sizes.spatial[1],
-                                                  input_sizes.spatial[0]};
-    std::vector<tensor::value_type> output_dims = {output_sizes.batch[0],
-                                                   output_sizes.feature[0],
-                                                   output_sizes.spatial[1],
-                                                   output_sizes.spatial[0]};
-
-    if (is_output_bfzyx(input_layout, node.get_primitive()->one_hot_axis)) {
-        output_dims.insert(output_dims.begin() + 2, output_sizes.spatial[2]);
-    }
-
-    const auto& one_hot_axis = node.get_primitive()->one_hot_axis;
-
-    for (int64_t i = 0, j = 0; j < static_cast<int64_t>(output_dims.size()) - 1; ++i, ++j) {
-        if (j == one_hot_axis)
-            ++j;
-        if (input_dims[i] != output_dims[j]) {
-            CLDNN_ERROR_MESSAGE(node.id(), "Incorrect parameters configuration: shape does not fit input size.");
-        }
-    }
-}
+one_hot_inst::typed_primitive_inst(network& network, one_hot_node const& node) : parent(network, node) { }
 }  // namespace cldnn
diff --git a/src/plugins/intel_gpu/src/graph/permute.cpp b/src/plugins/intel_gpu/src/graph/permute.cpp
index d73e6052fd5ecb..8b46fb2878a1dd 100644
--- a/src/plugins/intel_gpu/src/graph/permute.cpp
+++ b/src/plugins/intel_gpu/src/graph/permute.cpp
@@ -13,39 +13,6 @@
 namespace cldnn {
 GPU_DEFINE_PRIMITIVE_TYPE_ID(permute)
 
-layout permute_inst::calc_output_layout(permute_node const& node, kernel_impl_params const& impl_param) {
-    auto desc = impl_param.typed_desc<permute>();
-    auto input_layout = impl_param.get_input_layout();
-    auto permute_order = desc->permute_order;
-    std::vector<tensor::value_type> output_shape;
-
-    auto input_shape = input_layout.get_dims();
-
-    for (size_t x = 0; x < permute_order.size(); x++) {
-        output_shape.push_back(input_shape[permute_order[x]]);
-    }
-
-    for (size_t i = output_shape.size(); i < 4; i++) {
-        output_shape.push_back(1);
-    }
-
-    auto output_size = tensor(format::get_default_format(input_layout.get_rank()), output_shape);
-    auto op = desc->output_paddings[0];
-
-    auto output_type = desc->output_data_types[0].value_or(input_layout.data_type);
-    if (impl_param.has_fused_primitives()) {
-        output_type = impl_param.get_output_element_type();
-    }
-
-    // Adjust output format for optimizing out of transpose related to acdb format.
-    auto out_fmt = input_layout.format;
-    if (node.get_preferred_output_fmt() != format::any) {
-        out_fmt = node.get_preferred_output_fmt();
-    }
-
-    return layout(output_type, out_fmt, output_size, op);
-}
-
 template<typename ShapeType>
 std::vector<layout> permute_inst::calc_output_layouts(permute_node const& node, kernel_impl_params const& impl_param) {
     auto desc = impl_param.typed_desc<permute>();
diff --git a/src/plugins/intel_gpu/src/graph/pooling.cpp b/src/plugins/intel_gpu/src/graph/pooling.cpp
index 671a5a412f1067..bbf19835c3edf8 100644
--- a/src/plugins/intel_gpu/src/graph/pooling.cpp
+++ b/src/plugins/intel_gpu/src/graph/pooling.cpp
@@ -17,133 +17,6 @@ using namespace ov::intel_gpu;
 namespace cldnn {
 GPU_DEFINE_PRIMITIVE_TYPE_ID(pooling)
 
-layout pooling_inst::calc_output_layout(parent::typed_node const& node, kernel_impl_params const& impl_param) {
-    auto desc = impl_param.typed_desc<pooling>();
-
-    auto input_layout = impl_param.get_input_layout();
-
-    auto pad = desc->pads_begin;
-    auto stride = desc->stride;
-    auto window_size = desc->size;
-
-    // auto output_type = node.get_primitive()->output_data_type ? *node.get_primitive()->output_data_type : input_layout.data_type;
-    // FIXME: dirty hack. Replace it with optional output data type (above) once OV returns correct precision on edges
-    auto output_type = input_layout.data_type;
-
-    if (output_type == data_types::u8 || output_type == data_types::i8) {
-        if (desc->mode == pooling_mode::average_no_padding || desc->mode == pooling_mode::average) {
-            output_type = data_types::f32;
-        }
-    }
-
-    if (impl_param.has_fused_primitives()) {
-        output_type = impl_param.get_output_element_type();
-
-        // pooling doesn't support i32 data type
-        // FIXME: Someday delete this, when pooling supports i32 output.
-        if (desc->mode == pooling_mode::max && output_type == data_types::i32) {
-            output_type = data_types::f32;
-        }
-    }
-
-    auto stride_z = stride.size() >= 3 ? stride[stride.size() - 3] : 1;
-    auto stride_y = stride.size() >= 2 ? stride[stride.size() - 2] : 1;
-    auto stride_x = stride.size() >= 1 ? stride[stride.size() - 1] : 1;
-
-    auto kernel_z = window_size.size() >= 3 ? window_size[window_size.size() - 3] : 1;
-    auto kernel_y = window_size.size() >= 2 ? window_size[window_size.size() - 2] : 1;
-    auto kernel_x = window_size.size() >= 1 ? window_size[window_size.size() - 1] : 1;
-
-    // TODO: Consider moving general parameter verification to arguments constructor.
-    CLDNN_ERROR_LESS_OR_EQUAL_THAN(desc->id,
-                                   "stride spatial X",
-                                   stride_x,
-                                   "",
-                                   0,
-                                   "Stride spatial X must be positive (>= 1)");
-    CLDNN_ERROR_LESS_OR_EQUAL_THAN(desc->id,
-                                   "stride spatial Y",
-                                   stride_y,
-                                   "",
-                                   0,
-                                   "Stride spatial Y must be positive (>= 1)");
-    CLDNN_ERROR_LESS_OR_EQUAL_THAN(desc->id,
-                                   "window size spatial X",
-                                   kernel_x,
-                                   "",
-                                   0,
-                                   "Size X (of pooling window) must be positive (>= 1)");
-    CLDNN_ERROR_LESS_OR_EQUAL_THAN(desc->id,
-                                   "window size spatial Y",
-                                   kernel_y,
-                                   "",
-                                   0,
-                                   "Size Y (of pooling window) must be positive (>= 1)");
-    if (input_layout.format.spatial_num() == 3) {
-        // 3D
-        CLDNN_ERROR_LESS_OR_EQUAL_THAN(desc->id,
-                                       "stride spatial Z",
-                                       stride_z,
-                                       "",
-                                       0,
-                                       "Stride spatial Z must be positive (>= 1)");
-        CLDNN_ERROR_LESS_OR_EQUAL_THAN(desc->id,
-                                       "window size spatial Z",
-                                       kernel_z,
-                                       "",
-                                       0,
-                                       "Size Z (of pooling window) must be positive (>= 1)");
-    }
-
-    if (desc->with_output_size) {
-        CLDNN_ERROR_LESS_OR_EQUAL_THAN(desc->id,
-                                       "User-defined size of output X",
-                                       desc->output_size.spatial[0],
-                                       "",
-                                       0,
-                                       "User-defined size of output layout (spatial X) must be positive (>= 1)");
-        CLDNN_ERROR_LESS_OR_EQUAL_THAN(desc->id,
-                                       "User-defined size of output Y",
-                                       desc->output_size.spatial[1],
-                                       "",
-                                       0,
-                                       "User-defined size of output layout (spatial Y) must be positive (>= 1)");
-        CLDNN_ERROR_LESS_OR_EQUAL_THAN(desc->id,
-                                       "User-defined size of output Z",
-                                       desc->output_size.spatial[2],
-                                       "",
-                                       0,
-                                       "User-defined size of output layout (spatial Z) must be positive (>= 1)");
-
-        tensor output_size(input_layout.batch(),
-                           input_layout.feature(),
-                           desc->output_size.spatial[0],
-                           desc->output_size.spatial[1],
-                           desc->output_size.spatial[2]);
-        return {output_type, input_layout.format, output_size};
-    }
-
-    // TODO: Check compatibility of output size calculation (with caffe).
-    tensor size(1);
-    for (size_t i = 0; i < window_size.size(); i++) {
-        size.spatial[i] = static_cast<tensor::value_type>(window_size[window_size.size() - i - 1]);
-    }
-    auto output_range = calc_sliding_window_output_range<swor_mode::exceed_once_data>(input_layout.get_tensor(),
-                                                                                      size,
-                                                                                      ov::CoordinateDiff(pad.begin(), pad.end()),
-                                                                                      stride,
-                                                                                      ov::Strides(window_size.size(), 1),
-                                                                                      true,
-                                                                                      1);
-
-    tensor output_size(input_layout.batch(),
-                       input_layout.feature(),
-                       output_range.spatial[0],
-                       output_range.spatial[1],
-                       output_range.spatial[2]);
-    return {output_type, input_layout.format, output_size};
-}
-
 template<typename ShapeType>
 std::vector<layout> pooling_inst::calc_output_layouts(pooling_node const& /*node*/, const kernel_impl_params& impl_param) {
     auto desc = impl_param.typed_desc<pooling>();
@@ -184,34 +57,6 @@ std::vector<layout> pooling_inst::calc_output_layouts(pooling_node const& /*node
         return out_layouts;
     }
 
-    if (desc->with_output_size) {
-        CLDNN_ERROR_LESS_OR_EQUAL_THAN(desc->id,
-                                       "User-defined size of output X",
-                                       desc->output_size.spatial[0],
-                                       "",
-                                       0,
-                                       "User-defined size of output layout (spatial X) must be positive (>= 1)");
-        CLDNN_ERROR_LESS_OR_EQUAL_THAN(desc->id,
-                                       "User-defined size of output Y",
-                                       desc->output_size.spatial[1],
-                                       "",
-                                       0,
-                                       "User-defined size of output layout (spatial Y) must be positive (>= 1)");
-        CLDNN_ERROR_LESS_OR_EQUAL_THAN(desc->id,
-                                       "User-defined size of output Z",
-                                       desc->output_size.spatial[2],
-                                       "",
-                                       0,
-                                       "User-defined size of output layout (spatial Z) must be positive (>= 1)");
-
-        tensor output_size(input_layout.batch(),
-                           input_layout.feature(),
-                           desc->output_size.spatial[0],
-                           desc->output_size.spatial[1],
-                           desc->output_size.spatial[2]);
-        return {{output_dtype, input_layout.format, output_size}};
-    }
-
     auto kernel_size = desc->size;
     auto stride = desc->stride;
     auto dilation = desc->dilation.empty() ? ov::Strides(stride.size(), 1)
@@ -268,12 +113,6 @@ std::string pooling_inst::to_string(pooling_node const& node) {
     pooling_info.add("mode", mode);
     pooling_info.add("stride", cldnn::to_string(strd));
     pooling_info.add("kernel size", cldnn::to_string(kernel_size));
-    if (desc->with_output_size) {
-        json_composite ud_out_size_info;
-        ud_out_size_info.add("size", desc->output_size.to_string());
-        pooling_info.add("with_user_defined_output_size", ud_out_size_info);
-    }
-
     node_info->add("pooling info", pooling_info);
     node_info->dump(primitive_description);
 
diff --git a/src/plugins/intel_gpu/src/graph/primitive_inst.cpp b/src/plugins/intel_gpu/src/graph/primitive_inst.cpp
index ad1541177b7dd6..2a19fecfce8687 100644
--- a/src/plugins/intel_gpu/src/graph/primitive_inst.cpp
+++ b/src/plugins/intel_gpu/src/graph/primitive_inst.cpp
@@ -2344,7 +2344,6 @@ cldnn::network::ptr primitive_inst::get_unfused_subgraph() {
         }
         ExecutionConfig subgraph_config{
             ov::intel_gpu::allow_static_input_reorder(true),
-            ov::intel_gpu::allow_new_shape_infer(true),
             ov::enable_profiling(get_network().get_config().get_property(ov::enable_profiling))
         };
         auto prog = program::build_program(get_network().get_engine(),
diff --git a/src/plugins/intel_gpu/src/graph/prior_box.cpp b/src/plugins/intel_gpu/src/graph/prior_box.cpp
index 44634aea0d2b25..d142c2d70d2870 100644
--- a/src/plugins/intel_gpu/src/graph/prior_box.cpp
+++ b/src/plugins/intel_gpu/src/graph/prior_box.cpp
@@ -225,59 +225,6 @@ std::string vector_to_string(const std::vector<float>& vec) {
     return result.str();
 }
 
-std::vector<float> normalized_aspect_ratio(const std::vector<float>& aspect_ratio, bool flip) {
-    std::set<float> unique_ratios;
-    for (auto ratio : aspect_ratio) {
-        unique_ratios.insert(std::round(ratio * 1e6) / 1e6);
-        if (flip)
-            unique_ratios.insert(std::round(1 / ratio * 1e6) / 1e6);
-    }
-    unique_ratios.insert(1);
-    return std::vector<float>(unique_ratios.begin(), unique_ratios.end());
-}
-
-int64_t number_of_priors(const std::vector<float>& aspect_ratio,
-                         const std::vector<float>& min_size,
-                         const std::vector<float>& max_size,
-                         const std::vector<float>& fixed_size,
-                         const std::vector<float>& fixed_ratio,
-                         const std::vector<float>& densities,
-                         bool scale_all_sizes,
-                         bool flip) {
-    // Starting with 0 number of prior and then various conditions on attributes will contribute
-    // real number of prior boxes as PriorBox is a fat thing with several modes of
-    // operation that will be checked in order in the next statements.
-    int64_t num_priors = 0;
-
-    // Total number of boxes around each point; depends on whether flipped boxes are included
-    // plus one box 1x1.
-    int64_t total_aspect_ratios = normalized_aspect_ratio(aspect_ratio, flip).size();
-
-    if (scale_all_sizes) {
-        num_priors = total_aspect_ratios * min_size.size() + max_size.size();
-    } else {
-        num_priors = total_aspect_ratios + min_size.size() - 1;
-    }
-
-    if (!fixed_size.empty()) {
-        num_priors = total_aspect_ratios * fixed_size.size();
-    }
-
-    for (auto density : densities) {
-        auto rounded_density = static_cast<int64_t>(density);
-        auto density_2d = (rounded_density * rounded_density - 1);
-        if (!fixed_ratio.empty()) {
-            num_priors += fixed_ratio.size() * density_2d;
-        } else {
-            num_priors += total_aspect_ratios * density_2d;
-        }
-    }
-    return num_priors;
-}
-
-tensor get_output_shape(int32_t height, int32_t width, int32_t number_of_priors) {
-    return tensor{std::vector<int32_t>{2, 4 * height * width * number_of_priors}};
-}
 }  // namespace
 
 void prior_box_node::calc_result() {
@@ -412,25 +359,6 @@ void prior_box_node::calc_result() {
                                                                              *typed_desc());
 }
 
-layout prior_box_inst::calc_output_layout(prior_box_node const& node, kernel_impl_params const& impl_param) {
-    const auto primitive = impl_param.typed_desc<prior_box>();
-    auto number = number_of_priors(primitive->aspect_ratios,
-                                   primitive->min_sizes,
-                                   primitive->max_sizes,
-                                   primitive->fixed_size,
-                                   primitive->fixed_ratio,
-                                   primitive->density,
-                                   primitive->scale_all_sizes,
-                                   primitive->flip);
-    if (primitive->is_clustered()) {
-        number = primitive->widths.size();
-    }
-    const auto output_type = primitive->output_data_types[0].value_or(data_types::f32);
-    const auto output_shape = get_output_shape(primitive->output_size.spatial[1], primitive->output_size.spatial[0], number);
-
-    return {output_type, impl_param.get_input_layout().format, output_shape};
-}
-
 template<typename ShapeType>
 std::vector<layout> prior_box_inst::calc_output_layouts(prior_box_node const& /*node*/, kernel_impl_params const& impl_param) {
     const auto primitive = impl_param.typed_desc<prior_box>();
diff --git a/src/plugins/intel_gpu/src/graph/program.cpp b/src/plugins/intel_gpu/src/graph/program.cpp
index 55b87fea9fe298..d8db65987dfc07 100644
--- a/src/plugins/intel_gpu/src/graph/program.cpp
+++ b/src/plugins/intel_gpu/src/graph/program.cpp
@@ -2,6 +2,7 @@
 // SPDX-License-Identifier: Apache-2.0
 //
 
+#include "intel_gpu/primitives/non_max_suppression.hpp"
 #include "openvino/runtime/system_conf.hpp"
 #include "openvino/runtime/threading/cpu_streams_info.hpp"
 
@@ -209,7 +210,6 @@ program::program(engine& engine, const ExecutionConfig& config)
       processing_order() {
     init_primitives();
     _config.apply_user_properties(_engine.get_device_info());
-    new_shape_infer = _config.get_property(ov::intel_gpu::allow_new_shape_infer);
     _layout_optimizer = cldnn::make_unique<layout_optimizer>();
 }
 
@@ -221,7 +221,6 @@ void program::init_program() {
     set_options();
 
     pm = std::unique_ptr<pass_manager>(new pass_manager(*this));
-    new_shape_infer = _config.get_property(ov::intel_gpu::allow_new_shape_infer);
 
     if (_task_executor == nullptr)
         _task_executor = program::make_task_executor(_config);
@@ -355,34 +354,6 @@ bool program::analyze_output_size_handling_need() {
                                                                             true,
                                                                             1);
 
-            if (specified_output_range != calc_output_range)
-                handling_needed = true;
-        } else if (node->is_type<pooling>()) {
-            auto& prim_node = node->as<pooling>();
-            const auto& prim = prim_node.get_primitive();
-
-            if (!prim->with_output_size)
-                continue;
-
-            tensor specified_output_range(
-                {0, 0, prim->output_size.spatial[0], prim->output_size.spatial[1], prim->output_size.spatial[2]},
-                1);
-
-            tensor size(1);
-            for (size_t i = 0; i < prim->size.size(); i++) {
-                size.spatial[i] = static_cast<tensor::value_type>(prim->size[prim->size.size() - i - 1]);
-            }
-            // TODO: Check compatibility of output size calculation (with caffe).
-            auto primInputSize = prim_node.get_input_layout().get_tensor();
-            auto calc_output_range = calc_sliding_window_output_range<swor_mode::exceed_once_data>(
-                primInputSize,
-                size,
-                ov::CoordinateDiff(prim->pads_begin.begin(), prim->pads_begin.end()),
-                prim->stride,
-                ov::Strides(prim->stride.size(), 1),
-                true,
-                1);
-
             if (specified_output_range != calc_output_range)
                 handling_needed = true;
         }
@@ -656,7 +627,11 @@ void program::post_optimize_graph(bool is_internal) {
 
 // mark if the node is constant assuming that all dependencies are marked properly
 void program::mark_if_constant(program_node& node) {
-    if (node.get_dependencies().empty() || node.is_type<assign>() || node.is_type<read_value>() || node.is_type<gather_nonzero>()) {
+    if (node.get_dependencies().empty() ||
+        node.is_type<assign>() ||
+        node.is_type<read_value>() ||
+        node.is_type<gather_nonzero>() ||
+        node.is_type<non_max_suppression>() /* WA: constant folding works incorrectly for NMS */) {
         return;
     }
     node.constant = true;
diff --git a/src/plugins/intel_gpu/src/graph/program_node.cpp b/src/plugins/intel_gpu/src/graph/program_node.cpp
index 3c21800c66d938..76422d4749ac8d 100644
--- a/src/plugins/intel_gpu/src/graph/program_node.cpp
+++ b/src/plugins/intel_gpu/src/graph/program_node.cpp
@@ -367,31 +367,10 @@ bool program_node::is_detached(bool whole_branch) {
     return true;
 }
 
-layout program_node::calc_output_layout() const {
-    bool allow_new_shape_infer = get_program().is_new_shape_infer();
-    if (allow_new_shape_infer) {
-        auto out_layouts = type()->calc_output_layouts(*this, *get_kernel_impl_params());
-        if (!out_layouts.empty()) {
-            GPU_DEBUG_TRACE_DETAIL << id() << ": calc_output_layout(new):" << out_layouts[0] << std::endl;
-            return out_layouts[0];
-        }
-    }
-
-    auto res = type()->calc_output_layout(*this, *get_kernel_impl_params());
-    GPU_DEBUG_TRACE_DETAIL << id() << ": calc_output_layout:" << res << std::endl;
-
-    return res;
-}
-
 std::vector<layout> program_node::calc_output_layouts() const {
-    bool allow_new_shape_infer = get_program().is_new_shape_infer();
-    if (allow_new_shape_infer) {
-        auto out_layouts = type()->calc_output_layouts(*this, *get_kernel_impl_params());
-        if (!out_layouts.empty())
-            return out_layouts;
-    }
-
-    return {type()->calc_output_layout(*this, *get_kernel_impl_params())};
+    auto out_layouts = type()->calc_output_layouts(*this, *get_kernel_impl_params());
+    OPENVINO_ASSERT(!out_layouts.empty());
+    return out_layouts;
 }
 
 const layout& program_node::get_output_layout(bool invalidate_users_if_changed, size_t idx) {
@@ -460,8 +439,7 @@ bool program_node::set_output_layouts(std::vector<layout>& new_layouts, bool inv
 }
 
 bool program_node::recalc_output_layout(bool invalidate_users_if_changed) {
-    auto new_layout = calc_output_layout();
-    return set_output_layout(new_layout, invalidate_users_if_changed);
+    return recalc_output_layouts();
 }
 
 bool program_node::recalc_output_layouts(bool invalidate_users_if_changed) {
@@ -1487,15 +1465,10 @@ void program_node::create_onednn_primitive_attributes(
         auto& desc = cldnn_post_ops[idx];
         if (desc.is_type<activation>()) {
             auto fused_desc = desc.typed_desc<activation>();
-            bool allow_new_shape_infer = get_program().is_new_shape_infer();
             if (fused_desc->activation_function == cldnn::activation_func::relu_negative_slope
                 && !fused_desc->additional_params_input.empty()) {
                 auto dep_idx = cldnn_post_ops[idx].outer_dep_start_idx;
-                int oc_dim = 1;
-                if (allow_new_shape_infer)
-                    oc_dim = static_cast<int>(desc.output_layout.get_partial_shape()[1].get_max_length());
-                else
-                    oc_dim = static_cast<int>(desc.output_layout.get_tensor().feature.size());
+                int oc_dim = static_cast<int>(desc.output_layout.get_partial_shape()[1].get_max_length());
                 post_ops.append_prelu(1 << std::max(0, oc_dim));
                 update_onednn_post_op_list(onednn_post_op_type::binary_relu, dep_idx);
             } else if (fused_desc->activation_function == cldnn::activation_func::hard_sigmoid) {
diff --git a/src/plugins/intel_gpu/src/graph/proposal.cpp b/src/plugins/intel_gpu/src/graph/proposal.cpp
index 9439ce18b1ed09..a3461850bbd41a 100644
--- a/src/plugins/intel_gpu/src/graph/proposal.cpp
+++ b/src/plugins/intel_gpu/src/graph/proposal.cpp
@@ -23,17 +23,6 @@ static void generate_anchors(unsigned base_size,
 
 GPU_DEFINE_PRIMITIVE_TYPE_ID(proposal)
 
-layout proposal_inst::calc_output_layout(proposal_node const& node, kernel_impl_params const& impl_param) {
-    assert(static_cast<bool>(impl_param.desc->output_data_types[0]) == false &&
-           "Output data type forcing is not supported for proposal_node!");
-    auto desc = impl_param.typed_desc<proposal>();
-    layout input_layout = impl_param.get_input_layout(cls_scores_index);
-
-    return layout(input_layout.data_type,
-                  format::bfyx,
-                  {input_layout.batch() * desc->post_nms_topn, CLDNN_ROI_VECTOR_SIZE, 1, 1});
-}
-
 template<typename ShapeType>
 std::vector<layout> proposal_inst::calc_output_layouts(proposal_node const& node, kernel_impl_params const& impl_param) {
     std::vector<layout> layouts;
diff --git a/src/plugins/intel_gpu/src/graph/quantize.cpp b/src/plugins/intel_gpu/src/graph/quantize.cpp
index 02f1f8213e50ba..1728af5f524274 100644
--- a/src/plugins/intel_gpu/src/graph/quantize.cpp
+++ b/src/plugins/intel_gpu/src/graph/quantize.cpp
@@ -12,18 +12,6 @@
 namespace cldnn {
 GPU_DEFINE_PRIMITIVE_TYPE_ID(quantize)
 
-layout quantize_inst::calc_output_layout(quantize_node const& node, kernel_impl_params const& impl_param) {
-    auto desc = impl_param.typed_desc<quantize>();
-
-    auto input_layout = impl_param.get_input_layout();
-    auto output_format = input_layout.format;
-    auto out_dt = input_layout.data_type;
-    if (desc->output_data_types[0])
-        out_dt = *desc->output_data_types[0];
-
-    return layout{out_dt, output_format, input_layout.get_tensor()};
-}
-
 std::string quantize_inst::to_string(quantize_node const& node) {
     auto desc = node.get_primitive();
     auto node_info = node.desc_to_json();
diff --git a/src/plugins/intel_gpu/src/graph/random_uniform.cpp b/src/plugins/intel_gpu/src/graph/random_uniform.cpp
index 437b84a9b6cfdc..3e92e70f6f83da 100644
--- a/src/plugins/intel_gpu/src/graph/random_uniform.cpp
+++ b/src/plugins/intel_gpu/src/graph/random_uniform.cpp
@@ -15,13 +15,6 @@ random_uniform_inst::typed_primitive_inst(network& network, random_uniform_node
 : parent(network, node) {
 }
 
-layout random_uniform_inst::calc_output_layout(random_uniform_node const &node, kernel_impl_params const& impl_param) {
-    auto primitive = impl_param.typed_desc<random_uniform>();
-    auto format = format::get_default_format(primitive->output_shape.size());
-
-    return {primitive->output_shape, *primitive->output_data_types[0], format};
-}
-
 template<typename ShapeType>
 std::vector<layout> random_uniform_inst::calc_output_layouts(random_uniform_node const& /*node*/, kernel_impl_params const& impl_param) {
     auto desc = impl_param.typed_desc<random_uniform>();
diff --git a/src/plugins/intel_gpu/src/graph/range.cpp b/src/plugins/intel_gpu/src/graph/range.cpp
index 46455c980efae2..c6d7117bda7f2c 100644
--- a/src/plugins/intel_gpu/src/graph/range.cpp
+++ b/src/plugins/intel_gpu/src/graph/range.cpp
@@ -20,10 +20,6 @@ std::string lexical_cast(const json_base& j, int offset = 1) {
 
 GPU_DEFINE_PRIMITIVE_TYPE_ID(range)
 
-layout range_inst::calc_output_layout(range_node const& node, kernel_impl_params const& impl_param) {
-    return impl_param.typed_desc<range>()->output_layout;
-}
-
 template<typename ShapeType>
 std::vector<layout> range_inst::calc_output_layouts(range_node const& /*node*/, kernel_impl_params const& impl_param) {
     auto desc = impl_param.typed_desc<range>();
diff --git a/src/plugins/intel_gpu/src/graph/read_value.cpp b/src/plugins/intel_gpu/src/graph/read_value.cpp
index bf6e730e8a808b..c071b8661f6091 100644
--- a/src/plugins/intel_gpu/src/graph/read_value.cpp
+++ b/src/plugins/intel_gpu/src/graph/read_value.cpp
@@ -15,10 +15,6 @@ read_value_inst::typed_primitive_inst(network& network, const read_value_node& n
     memory_state::variable{node.get_primitive()->variable_id, node.get_primitive()->user_specified_type} {
 }
 
-layout read_value_inst::calc_output_layout(const read_value_node& node, kernel_impl_params const& impl_param) {
-    return impl_param.typed_desc<read_value>()->output_layout;
-}
-
 std::string read_value_inst::to_string(const read_value_node& node) {
     auto node_info = node.desc_to_json();
 
diff --git a/src/plugins/intel_gpu/src/graph/reduce.cpp b/src/plugins/intel_gpu/src/graph/reduce.cpp
index 8621ba3705fd5c..a388391f0110a7 100644
--- a/src/plugins/intel_gpu/src/graph/reduce.cpp
+++ b/src/plugins/intel_gpu/src/graph/reduce.cpp
@@ -14,84 +14,6 @@
 namespace cldnn {
 GPU_DEFINE_PRIMITIVE_TYPE_ID(reduce)
 
-static std::vector<uint16_t> convert_axes(std::vector<int64_t> axes, size_t rank) {
-    std::vector<uint16_t> converted_axes;
-    for (auto axis : axes) {
-        if (axis == 0 || axis == 1) {
-            converted_axes.push_back(axis);
-            continue;
-        }
-
-        if (axis < 0)
-            axis = axis + rank;
-
-        converted_axes.push_back(static_cast<uint16_t>(rank + 1 - axis));
-    }
-
-    return converted_axes;
-}
-
-layout reduce_inst::calc_output_layout(reduce_node const& node, kernel_impl_params const& impl_param) {
-    auto desc = impl_param.typed_desc<reduce>();
-
-    auto input_layout = impl_param.get_input_layout();
-    auto input_format = input_layout.format;
-    auto format_dim = input_format.dimension();
-    auto output_type = input_layout.data_type;
-    auto mode = desc->mode;
-    auto reduce_axes = convert_axes(desc->axes, input_layout.get_rank());
-    auto in_dims = input_layout.get_tensor().sizes();
-
-    for (size_t a = 0; a < reduce_axes.size(); a++) {
-        in_dims[reduce_axes[a]] = 1;
-    }
-
-    std::vector<int32_t> updated_dims;
-    if (!desc->keep_dims) {
-        // Get unreduced from b-f and x-w range
-        for (size_t b_f_index = 0; b_f_index < 2; b_f_index++) {
-            bool index_to_remove = std::find(reduce_axes.begin(), reduce_axes.end(), b_f_index) != reduce_axes.end();
-            if (!index_to_remove)
-                updated_dims.push_back(in_dims[b_f_index]);
-        }
-        for (size_t x_w_index = format_dim - 1; x_w_index >= 2; x_w_index--) {
-            bool index_to_remove = std::find(reduce_axes.begin(), reduce_axes.end(), x_w_index) != reduce_axes.end();
-            if (!index_to_remove)
-                updated_dims.push_back(in_dims[x_w_index]);
-        }
-
-        if (input_format.dimension() == 4 && reduce_axes.size() == 1)
-            updated_dims.push_back(1);
-        if (updated_dims.size() > 2)
-            std::reverse(updated_dims.begin() + 2, updated_dims.end());
-
-        // Fill updated dims to format_dim size
-        while (updated_dims.size() < format_dim)
-            updated_dims.push_back(1);
-
-        in_dims = std::move(updated_dims);
-    }
-
-    std::vector<reduce_mode> reduce_bool_modes = {reduce_mode::logical_and, reduce_mode::logical_or};
-    if (std::find(reduce_bool_modes.begin(), reduce_bool_modes.end(), mode) != reduce_bool_modes.end())
-        output_type = data_types::i8;
-    else if (output_type == data_types::i8 || output_type == data_types::u8)
-        output_type = data_types::f32;
-
-    if (desc->output_data_types[0])
-        output_type = *desc->output_data_types[0];
-
-    if (impl_param.has_fused_primitives())
-        output_type = impl_param.get_output_element_type();
-
-    if (format_dim == 6)
-        return layout{output_type, input_format, tensor(batch(in_dims[0]), feature(in_dims[1]), spatial(in_dims[2], in_dims[3], in_dims[4], in_dims[5]))};
-    else if (format_dim == 5)
-        return layout{output_type, input_format, tensor(batch(in_dims[0]), feature(in_dims[1]), spatial(in_dims[2], in_dims[3], in_dims[4]))};
-    else
-        return layout{output_type, input_format, tensor(batch(in_dims[0]), feature(in_dims[1]), spatial(in_dims[2], in_dims[3]))};
-}
-
 template<typename ShapeType>
 std::vector<layout> reduce_inst::calc_output_layouts(reduce_node const& /*node*/, kernel_impl_params const& impl_param) {
     auto desc = impl_param.typed_desc<reduce>();
diff --git a/src/plugins/intel_gpu/src/graph/region_yolo.cpp b/src/plugins/intel_gpu/src/graph/region_yolo.cpp
index 49ab172d633820..bda2f45b276142 100644
--- a/src/plugins/intel_gpu/src/graph/region_yolo.cpp
+++ b/src/plugins/intel_gpu/src/graph/region_yolo.cpp
@@ -12,30 +12,6 @@
 namespace cldnn {
 GPU_DEFINE_PRIMITIVE_TYPE_ID(region_yolo)
 
-layout region_yolo_inst::calc_output_layout(region_yolo_node const& node, kernel_impl_params const& impl_param) {
-    assert(static_cast<bool>(impl_param.desc->output_data_types[0]) == false &&
-           "Output data type forcing is not supported for "
-           "region_yolo_node!");
-    auto input_layout = impl_param.get_input_layout();
-    auto desc = impl_param.typed_desc<region_yolo>();
-
-    if (desc->do_softmax) {
-        return cldnn::layout(
-            input_layout.data_type,
-            input_layout.format,
-            tensor(input_layout.batch(),
-                   input_layout.feature() * input_layout.spatial(0) * input_layout.spatial(1),
-                   1,
-                   1));
-    } else {
-        tensor::value_type features = (desc->classes + desc->coords + 1) * desc->mask_size;
-        return cldnn::layout(
-            input_layout.data_type,
-            input_layout.format,
-            tensor(input_layout.batch(), features, input_layout.spatial(0), input_layout.spatial(1)));
-    }
-}
-
 template<typename ShapeType>
 std::vector<layout> region_yolo_inst::calc_output_layouts(region_yolo_node const& node, kernel_impl_params const& impl_param) {
     auto desc = impl_param.typed_desc<region_yolo>();
diff --git a/src/plugins/intel_gpu/src/graph/reorder.cpp b/src/plugins/intel_gpu/src/graph/reorder.cpp
index e322baeee95e52..d704301384ad08 100644
--- a/src/plugins/intel_gpu/src/graph/reorder.cpp
+++ b/src/plugins/intel_gpu/src/graph/reorder.cpp
@@ -16,163 +16,6 @@
 namespace cldnn {
 GPU_DEFINE_PRIMITIVE_TYPE_ID(reorder)
 
-layout reorder_inst::calc_output_layout(reorder_node const& node, kernel_impl_params const& impl_param) {
-    auto input_layout = impl_param.get_input_layout();
-    auto ifmt = input_layout.format;
-
-    auto desc = impl_param.typed_desc<reorder>();
-    auto odt = desc->output_data_types[0].value_or(input_layout.data_type);
-    auto ofmt = desc->output_format;
-    auto op = desc->output_paddings[0];
-
-    if (ofmt == format::any) {
-        ofmt = ifmt;
-    }
-
-    if (ifmt.is_nv12() && !desc->has_surface_input()) {
-        const size_t h_dim = 1;
-        const size_t c_dim = 3;
-
-        auto out_shape = input_layout.get_partial_shape();
-        out_shape[c_dim] = 3;
-        if (desc->input_size() == 1)
-            out_shape[h_dim] = out_shape[h_dim] * 2 / 3;
-
-        if (ofmt != ifmt)
-            return layout(out_shape, odt, ofmt, op);
-
-        CLDNN_ERROR_MESSAGE(desc->id, "No image_nv12 to image_nv12 reorder is supported");
-    } else if (ofmt.is_winograd() && ifmt.is_winograd()) {
-        if (ofmt == ifmt)
-            return layout(odt, ofmt, input_layout.get_tensor(), op);
-
-        CLDNN_ERROR_MESSAGE(desc->id, "Reordering between winograd weights and data formats is unsupported");
-    } else if (ifmt == format::image_2d_rgba) {
-        return layout(data_types::f16, format::bfyx, input_layout.get_tensor(), op);
-    }
-
-    // transformation of data from standard to winograd
-    if (ofmt == format::winograd_2x3_s1_data) {
-        // some constants which are defined by F(2,3) with stride 1 -- todo: think about generic way to calculate them
-        // for any F(r,m) with stride s
-        // NOTE: FOR THE FOLLOWING CONSTANTS 'OUTPUT' MEANS OUTPUT OF WINOGRAD CONV (in standard domain) AND 'INPUT'
-        // MEANS INPUT FOR WINOGRAD CONV (in winograd domain), THEREFORE 'INPUT' ACTUALLY REFERS TO THE OUTPUT OF THIS
-        // CONVERSION (which is later fed as input for winograd conv)
-        constexpr tensor::value_type output_tile_width = 2;  // by definition of F(2,3)
-        constexpr tensor::value_type filter_width = 3;       // by definition of F(2,3)
-        constexpr tensor::value_type filter_stride =
-            1;  // by definition of format::winograd_2x3_s1_data (our assumption)
-
-        constexpr tensor::value_type input_tile_width =
-            filter_width +
-            (output_tile_width - 1) * filter_stride;  // input tile should be large enought to hold data for
-                                                      // computations of output tile (for given filter size and stride)
-
-        // how many tiles do we need to produce
-        // each input tile produces one output tile so we can find no. of input tiles by calculating no. of output tiles
-        // (which is equal to width of an output divided by output tile width)
-        tensor::value_type conv_output_width =
-            input_layout.spatial(0) - filter_width + 1;
-        tensor::value_type input_tiles_count_x = conv_output_width / output_tile_width;
-        tensor::value_type output_width = input_tiles_count_x * input_tile_width;
-        tensor::value_type output_height = input_layout.spatial(1);
-
-        tensor::value_type padd_x = 0;
-        tensor::value_type padd_y = (8 - ((output_height - 2) % 8)) % 8;
-        if (conv_output_width % output_tile_width != 0) {  // leftovers
-            output_width += 3;  // one tile is 4 elements from which only 3 first are used to generate first output
-                                // value
-            padd_x = 1;
-        }
-
-        auto data_size = tensor{input_layout.batch(), input_layout.feature(), output_width, output_height};
-        tensor upper_padd = tensor{0, 0, padd_x, padd_y};
-        return layout(odt, ofmt, data_size, padding{{0, 0, 0, 0}, upper_padd.sizes()});
-    }
-
-    // transformation of weights from standard to winograd
-    if (ofmt == format::winograd_2x3_s1_weights || ofmt == format::winograd_2x3_s1_fused_weights) {
-        CLDNN_ERROR_NOT_EQUAL(desc->id,
-                              "input_layout.spatial(0)",
-                              input_layout.spatial(0),
-                              "expected value",
-                              3,
-                              "input for conversion to winograd_2x3_s1 weights format should have spatial size 3x3");
-        CLDNN_ERROR_NOT_EQUAL(desc->id,
-                              "input_layout.spatial(1)",
-                              input_layout.spatial(1),
-                              "expected value",
-                              3,
-                              "input for conversion to winograd_2x3_s1 weights format should have spatial size 3x3");
-
-        return layout(odt, ofmt, tensor{input_layout.batch(), input_layout.feature(), 4, 3});
-    } else if (ofmt == format::winograd_6x3_s1_fused_weights) {
-        CLDNN_ERROR_NOT_EQUAL(desc->id,
-                              "input_layout.spatial(0)",
-                              input_layout.spatial(0),
-                              "expected value",
-                              3,
-                              "input for conversion to winograd_2x3_s1 weights format should have spatial size 3x3");
-        CLDNN_ERROR_NOT_EQUAL(desc->id,
-                              "input_layout.spatial(1)",
-                              input_layout.spatial(1),
-                              "expected value",
-                              3,
-                              "input for conversion to winograd_2x3_s1 weights format should have spatial size 3x3");
-
-        return layout(odt, ofmt, tensor{input_layout.batch(), input_layout.feature(), 8, 3});
-    }
-
-    // transformation of data from winograd to standard
-    if (ifmt == format::winograd_2x3_s1_data) {
-        constexpr tensor::value_type output_tile_width = 2;  // by definition of F(2,3)
-        constexpr tensor::value_type filter_width = 3;       // by definition of F(2,3)
-        constexpr tensor::value_type filter_stride =
-            1;  // by definition of format::winograd_2x3_s1_data (our assumption)
-
-        constexpr tensor::value_type input_tile_width =
-            filter_width +
-            (output_tile_width - 1) * filter_stride;  // input tile should be large enought to hold data for
-                                                      // computations of output tile (for given filter size and stride)
-
-        auto output_width = input_layout.spatial(0) / input_tile_width * output_tile_width;
-        if (input_layout.spatial(0) % input_tile_width != 0)  // leftovers
-            ++output_width;  // output tile is 2 by default, so we can have only 1 value as leftover
-
-        return layout(odt,
-                      ofmt,
-                      tensor{input_layout.batch(),
-                             input_layout.feature(),
-                             output_width,
-                             input_layout.spatial(1)});
-    }
-
-    // transformation of weights from winograd to standard
-    if (ifmt == format::winograd_2x3_s1_weights || ifmt == format::winograd_2x3_s1_fused_weights ||
-        ifmt == format::winograd_6x3_s1_fused_weights) {
-        CLDNN_ERROR_MESSAGE(desc->id,
-                            "Conversion of weights from winograd to standard domain is currently unsupported");
-    }
-
-    if (desc->weights_reorder_params) {
-        return desc->weights_reorder_params->get_output_layout();
-    }
-
-    if ((ofmt == format::bs_fs_fsv8_bsv8 || ofmt == format::os_i_osv8__ai8 || ofmt == format::os_i_osv16__ai8 || ofmt == format::os_i_osv16 ||
-        ofmt == format::bfzyx || ifmt == format::bfzyx || ofmt == format::b_fs_zyx_fsv16 || ifmt == format::b_fs_zyx_fsv16 ||
-        ofmt == format::bs_fs_zyx_bsv16_fsv16 || ifmt == format::bs_fs_zyx_bsv16_fsv16 ||
-        ofmt == format::bs_fs_zyx_bsv16_fsv32 || ifmt == format::bs_fs_zyx_bsv16_fsv32 ||
-        ofmt == format::b_fs_zyx_fsv32 || ifmt == format::b_fs_zyx_fsv32 ||
-        ofmt == format::bs_fs_yx_bsv16_fsv16 || ifmt == format::bs_fs_yx_bsv16_fsv16) && input_layout.is_static()) {
-        return layout(odt, ofmt, input_layout.get_tensor().transform(ofmt, 1), op);
-    } else if (ofmt != ifmt && (ofmt == format::bfwzyx || ifmt == format::bfwzyx)) {
-        // TODO Shouldn't transform be called every time ifmt != ofmt?
-        return layout(odt, ofmt, input_layout.get_tensor().transform(ofmt, 1), op);
-    } else {
-        return layout(odt, ofmt, input_layout.get_tensor(), op);
-    }
-}
-
 template<typename ShapeType>
 std::vector<layout> reorder_inst::calc_output_layouts(reorder_node const& /*node*/, const kernel_impl_params& impl_param) {
     auto desc = impl_param.typed_desc<reorder>();
diff --git a/src/plugins/intel_gpu/src/graph/reorg_yolo.cpp b/src/plugins/intel_gpu/src/graph/reorg_yolo.cpp
index 11cf8a8a833445..e5f9aec11985c3 100644
--- a/src/plugins/intel_gpu/src/graph/reorg_yolo.cpp
+++ b/src/plugins/intel_gpu/src/graph/reorg_yolo.cpp
@@ -12,23 +12,6 @@
 namespace cldnn {
 GPU_DEFINE_PRIMITIVE_TYPE_ID(reorg_yolo)
 
-layout reorg_yolo_inst::calc_output_layout(reorg_yolo_node const& node, kernel_impl_params const& impl_param) {
-    assert(static_cast<bool>(impl_param.desc->output_data_types[0]) == false &&
-           "Output data type forcing is not supported for "
-           "reorg_yolo_node!");
-    auto input_layout = impl_param.get_input_layout();
-    auto desc = impl_param.typed_desc<reorg_yolo>();
-    auto stride = desc->stride;
-
-    cldnn::layout layoutTemp = cldnn::layout(input_layout.data_type,
-                                             input_layout.format,
-                                             tensor(input_layout.batch(),
-                                                    input_layout.feature() * stride * stride,
-                                                    input_layout.spatial(0) / stride,
-                                                    input_layout.spatial(1) / stride));
-    return layoutTemp;
-}
-
 template<typename ShapeType>
 std::vector<layout> reorg_yolo_inst::calc_output_layouts(reorg_yolo_node const& node, kernel_impl_params const& impl_param) {
     auto desc = impl_param.typed_desc<reorg_yolo>();
diff --git a/src/plugins/intel_gpu/src/graph/resample.cpp b/src/plugins/intel_gpu/src/graph/resample.cpp
index 29d2fec685bae9..637331ad8736ec 100644
--- a/src/plugins/intel_gpu/src/graph/resample.cpp
+++ b/src/plugins/intel_gpu/src/graph/resample.cpp
@@ -12,24 +12,6 @@
 namespace cldnn {
 GPU_DEFINE_PRIMITIVE_TYPE_ID(resample)
 
-layout resample_inst::calc_output_layout(resample_node const& node, kernel_impl_params const& impl_param) {
-    auto desc = impl_param.typed_desc<resample>();
-    auto input_layout = impl_param.get_input_layout();
-
-    auto output_type = input_layout.data_type;
-    if ((input_layout.data_type == data_types::i8 || input_layout.data_type == data_types::u8)
-        && desc->operation_type != resample::InterpolateOp::InterpolateMode::NEAREST
-        && desc->operation_type != resample::InterpolateOp::InterpolateMode::LINEAR_ONNX) {
-        output_type = data_types::f32;
-    }
-    if (impl_param.has_fused_primitives()) {
-        output_type = impl_param.get_output_element_type();
-    }
-
-    return desc->sizes.empty() ? layout({output_type, input_layout.format, desc->output_size}) :
-                                 layout({desc->sizes, output_type, input_layout.format});
-}
-
 namespace v4 {
 template<typename ShapeType>
 static std::vector<layout> calc_output_layouts(resample_node const& /*node*/, const kernel_impl_params& impl_param) {
diff --git a/src/plugins/intel_gpu/src/graph/reshape.cpp b/src/plugins/intel_gpu/src/graph/reshape.cpp
index 0830dc3e5b9226..ec31ce0121899a 100644
--- a/src/plugins/intel_gpu/src/graph/reshape.cpp
+++ b/src/plugins/intel_gpu/src/graph/reshape.cpp
@@ -106,44 +106,6 @@ padding propagate_padding(const layout& in_layout, const ov::PartialShape& out_s
     return padding(update_pad_lower, update_pad_upper, ret_update_pad_mask);
 }
 
-layout reshape_inst::calc_output_layout(reshape_node const& node, kernel_impl_params const& impl_param) {
-    assert(static_cast<bool>(impl_param.desc->output_data_types[0]) == false &&
-           "Output data type forcing is not supported for reshape_node!");
-    auto input_layout = impl_param.get_non_padded_input_layout();
-    auto desc = impl_param.typed_desc<reshape>();
-    if (desc->output_shape.count() == 0) {
-        if (desc->output_partial_shape.size() != 0) {
-            format out_fmt = format::adjust_to_rank(input_layout.format, desc->output_partial_shape.rank().get_length());
-            return layout{desc->output_partial_shape, input_layout.data_type, out_fmt};
-        } else {
-            OPENVINO_ASSERT("[GPU] Output shape is not provided");
-        }
-    }
-
-    auto sizes = desc->output_shape.sizes();
-    auto input_sizes = input_layout.get_tensor().sizes();
-    size_t need_recalc = 0;
-    uint32_t shape_count = 1;
-
-    for (size_t i = 0; i < sizes.size(); i++) {
-        if (sizes[i] == -1) {
-            if (need_recalc) {
-                CLDNN_ERROR_MESSAGE(desc->id, "Only one dimension of the new shape can be -1");
-            }
-            need_recalc = i;
-            continue;
-        }
-        if (sizes[i] == 0) {
-            sizes[i] = input_sizes[i];
-        }
-        shape_count *= sizes[i];
-    }
-    if (need_recalc)
-        sizes[need_recalc] = static_cast<int>(input_layout.count()) / shape_count;
-
-    return layout{input_layout.data_type, input_layout.format, tensor(sizes)};
-}
-
 template<typename ShapeType>
 std::vector<layout> reshape_inst::calc_output_layouts(reshape_node const& node, const kernel_impl_params& impl_param) {
     assert(static_cast<bool>(impl_param.typed_desc<reshape>()->output_data_types[0]) == false &&
@@ -312,7 +274,7 @@ void reshape_inst::update_output_memory() {
         return;
 
     build_deps();  // reshape need deps
-    if (node->get_program().is_new_shape_infer() && input_memory_ptr() == nullptr)
+    if (input_memory_ptr() == nullptr)
         return;
     OPENVINO_ASSERT(input_memory_ptr() != nullptr, "[GPU] Failed to reuse input in ", id(), " primitive: input memory was not allocated");
     _outputs = {_network.get_engine().reinterpret_buffer(input_memory(), _impl_params->get_output_layout())};
diff --git a/src/plugins/intel_gpu/src/graph/reverse.cpp b/src/plugins/intel_gpu/src/graph/reverse.cpp
index 11388ecadb4f11..1706b7f3299ac4 100644
--- a/src/plugins/intel_gpu/src/graph/reverse.cpp
+++ b/src/plugins/intel_gpu/src/graph/reverse.cpp
@@ -2,6 +2,7 @@
 // SPDX-License-Identifier: Apache-2.0
 //
 
+#include "openvino/op/reverse.hpp"
 #include <string>
 
 #include "json_object.h"
@@ -11,10 +12,6 @@
 namespace cldnn {
 GPU_DEFINE_PRIMITIVE_TYPE_ID(reverse)
 
-layout reverse_inst::calc_output_layout(reverse_node const& node, kernel_impl_params const& impl_param) {
-    return impl_param.get_input_layout();
-}
-
 std::string reverse_inst::to_string(reverse_node const& node) {
     const auto prim = node.get_primitive();
 
@@ -23,7 +20,7 @@ std::string reverse_inst::to_string(reverse_node const& node) {
     json_composite info;
     info.add("input id", node.input(0).id());
     info.add("axes id", node.input(1).id());
-    const auto mode = prim->mode == reverse_mode::index ? "index" : "mask";
+    const auto mode = prim->mode == ov::op::v1::Reverse::Mode::INDEX ? "index" : "mask";
     info.add("mode", mode);
 
     auto node_info = node.desc_to_json();
diff --git a/src/plugins/intel_gpu/src/graph/reverse_sequence.cpp b/src/plugins/intel_gpu/src/graph/reverse_sequence.cpp
index 0fe2c4df37172f..b0173c265035af 100644
--- a/src/plugins/intel_gpu/src/graph/reverse_sequence.cpp
+++ b/src/plugins/intel_gpu/src/graph/reverse_sequence.cpp
@@ -11,13 +11,6 @@
 namespace cldnn {
 GPU_DEFINE_PRIMITIVE_TYPE_ID(reverse_sequence)
 
-layout reverse_sequence_inst::calc_output_layout(reverse_sequence_node const& node, kernel_impl_params const& impl_param) {
-    auto input_layout = impl_param.get_input_layout();
-    auto input_format = input_layout.format;
-
-    return layout{input_layout.data_type, input_format, input_layout.get_tensor()};
-}
-
 std::string reverse_sequence_inst::to_string(reverse_sequence_node const& node) {
     auto desc = node.get_primitive();
     auto node_info = node.desc_to_json();
diff --git a/src/plugins/intel_gpu/src/graph/rms.cpp b/src/plugins/intel_gpu/src/graph/rms.cpp
index 5002417df57394..c2e1eed46e58e2 100644
--- a/src/plugins/intel_gpu/src/graph/rms.cpp
+++ b/src/plugins/intel_gpu/src/graph/rms.cpp
@@ -11,15 +11,6 @@
 namespace cldnn {
 GPU_DEFINE_PRIMITIVE_TYPE_ID(rms);
 
-layout rms_inst::calc_output_layout(rms_node const& node, kernel_impl_params const& impl_param) {
-    auto desc = impl_param.typed_desc<rms>();
-    auto input_layout = impl_param.get_input_layout();
-    auto output_type = desc->output_data_types[0].value_or(input_layout.data_type);
-    auto output_format = input_layout.format;
-
-    return layout(output_type, output_format, input_layout.get_tensor());
-}
-
 std::string rms_inst::to_string(rms_node const& node) {
     auto desc = node.get_primitive();
     auto node_info = node.desc_to_json();
diff --git a/src/plugins/intel_gpu/src/graph/roi_align.cpp b/src/plugins/intel_gpu/src/graph/roi_align.cpp
index 22e5dd4bf98f6c..8649f5ce194aea 100644
--- a/src/plugins/intel_gpu/src/graph/roi_align.cpp
+++ b/src/plugins/intel_gpu/src/graph/roi_align.cpp
@@ -16,17 +16,6 @@ GPU_DEFINE_PRIMITIVE_TYPE_ID(roi_align)
 roi_align_inst::typed_primitive_inst(network& network, roi_align_node const& node)
     : parent(network, node) {}
 
-layout roi_align_inst::calc_output_layout(roi_align_node const& node, kernel_impl_params const& impl_param) {
-    auto primitive = impl_param.typed_desc<roi_align>();
-    auto input_layout = impl_param.get_input_layout(0);
-    auto rois_layout = impl_param.get_input_layout(1);
-    auto num_rois = rois_layout.batch();
-    auto num_channels = input_layout.feature();
-    return layout({num_rois, num_channels, primitive->pooled_h, primitive->pooled_w},
-                  input_layout.data_type,
-                  input_layout.format);
-}
-
 template<typename ShapeType>
 std::vector<layout> roi_align_inst::calc_output_layouts(roi_align_node const& node, kernel_impl_params const& impl_param) {
     auto primitive = impl_param.typed_desc<roi_align>();
diff --git a/src/plugins/intel_gpu/src/graph/roi_pooling.cpp b/src/plugins/intel_gpu/src/graph/roi_pooling.cpp
index d2af4d4d4d8674..a07ad6353c1eba 100644
--- a/src/plugins/intel_gpu/src/graph/roi_pooling.cpp
+++ b/src/plugins/intel_gpu/src/graph/roi_pooling.cpp
@@ -2,6 +2,8 @@
 // SPDX-License-Identifier: Apache-2.0
 //
 
+#include "openvino/core/partial_shape.hpp"
+#include "openvino/op/psroi_pooling.hpp"
 #include "roi_pooling_inst.h"
 #include "roi_pooling_shape_inference.hpp"
 #include "psroi_pooling_shape_inference.hpp"
@@ -13,20 +15,6 @@
 namespace cldnn {
 GPU_DEFINE_PRIMITIVE_TYPE_ID(roi_pooling)
 
-layout roi_pooling_inst::calc_output_layout(roi_pooling_node const& node, kernel_impl_params const& impl_param) {
-    assert(static_cast<bool>(impl_param.desc->output_data_types[0]) == false &&
-           "Output data type forcing is not supported for roi_pooling_node!");
-    auto desc = impl_param.typed_desc<roi_pooling>();
-    layout data_layout = impl_param.get_input_layout(0);
-    layout rois_layout = impl_param.get_input_layout(1);
-    int num_rois = rois_layout.batch();
-    int out_fm = desc->position_sensitive ? desc->output_dim : data_layout.feature();
-
-    return layout(data_layout.data_type,
-                  data_layout.format,
-                  {num_rois, out_fm, desc->pooled_width, desc->pooled_height});
-}
-
 template<typename ShapeType>
 std::vector<layout> roi_pooling_inst::calc_output_layouts(roi_pooling_node const& node, kernel_impl_params const& impl_param) {
  auto desc = impl_param.typed_desc<roi_pooling>();
diff --git a/src/plugins/intel_gpu/src/graph/roll.cpp b/src/plugins/intel_gpu/src/graph/roll.cpp
index e42c3302c5c080..1a3ad61f286cb5 100644
--- a/src/plugins/intel_gpu/src/graph/roll.cpp
+++ b/src/plugins/intel_gpu/src/graph/roll.cpp
@@ -11,15 +11,10 @@
 namespace cldnn {
 GPU_DEFINE_PRIMITIVE_TYPE_ID(roll)
 
-layout roll_inst::calc_output_layout(const roll_node& node, kernel_impl_params const& impl_param) {
-    return impl_param.get_input_layout();
-}
-
 std::string roll_inst::to_string(const roll_node& node) {
     auto node_info = node.desc_to_json();
     json_composite roll_info;
     roll_info.add("input id", node.input().id());
-    roll_info.add("shift", node.get_primitive()->shift);
     node_info->add("roll info", roll_info);
     std::ostringstream primitive_description;
     node_info->dump(primitive_description);
diff --git a/src/plugins/intel_gpu/src/graph/scatter_elements_update.cpp b/src/plugins/intel_gpu/src/graph/scatter_elements_update.cpp
index df9236a15474ef..069b745ee2b137 100644
--- a/src/plugins/intel_gpu/src/graph/scatter_elements_update.cpp
+++ b/src/plugins/intel_gpu/src/graph/scatter_elements_update.cpp
@@ -14,28 +14,6 @@
 namespace cldnn {
 GPU_DEFINE_PRIMITIVE_TYPE_ID(scatter_elements_update)
 
-layout scatter_elements_update_inst::calc_output_layout(scatter_elements_update_node const& node, kernel_impl_params const& impl_param) {
-    auto desc = impl_param.typed_desc<scatter_elements_update>();
-
-    const int32_t axis = desc->axis;
-    const size_t input_number_of_dims = impl_param.get_input_layout().get_partial_shape().size();
-
-    auto input_layout = impl_param.get_input_layout();
-
-    auto output_shape = input_layout.get_partial_shape();
-    auto input_format = input_layout.format;
-    auto output_type = input_layout.data_type;
-
-    if (impl_param.has_fused_primitives()) {
-        output_type = impl_param.get_output_element_type();
-    }
-
-    if (static_cast<size_t>(axis) < 0 || static_cast<size_t>(axis) >= input_number_of_dims)
-        CLDNN_ERROR_MESSAGE(desc->id, "Incorrect axis value for ScatterElementsUpdate: Axis must be positive and less than the input tensor dimension.");
-
-    return layout{output_shape, output_type, input_format};
-}
-
 std::string scatter_elements_update_inst::to_string(scatter_elements_update_node const& node) {
     auto desc = node.get_primitive();
     auto node_info = node.desc_to_json();
diff --git a/src/plugins/intel_gpu/src/graph/scatter_nd_update.cpp b/src/plugins/intel_gpu/src/graph/scatter_nd_update.cpp
index 8f66889c25b884..d545ef15db1f8b 100644
--- a/src/plugins/intel_gpu/src/graph/scatter_nd_update.cpp
+++ b/src/plugins/intel_gpu/src/graph/scatter_nd_update.cpp
@@ -13,20 +13,6 @@
 namespace cldnn {
 GPU_DEFINE_PRIMITIVE_TYPE_ID(scatter_nd_update)
 
-layout scatter_nd_update_inst::calc_output_layout(scatter_nd_update_node const& node, kernel_impl_params const& impl_param) {
-    auto input_layout = impl_param.get_input_layout();
-
-    auto output_shape = input_layout.get_tensor();
-    auto input_format = input_layout.format;
-    auto output_type = input_layout.data_type;
-
-    if (impl_param.has_fused_primitives()) {
-        output_type = impl_param.get_output_element_type();
-    }
-
-    return layout{output_type, input_format, output_shape};
-}
-
 template<typename ShapeType>
 std::vector<layout> scatter_nd_update_inst::calc_output_layouts(scatter_nd_update_node const& /*node*/, const kernel_impl_params& impl_param) {
     const auto& input0_layout = impl_param.get_input_layout(0);
diff --git a/src/plugins/intel_gpu/src/graph/scatter_update.cpp b/src/plugins/intel_gpu/src/graph/scatter_update.cpp
index 59995341d832b0..1b4a35ca1e4802 100644
--- a/src/plugins/intel_gpu/src/graph/scatter_update.cpp
+++ b/src/plugins/intel_gpu/src/graph/scatter_update.cpp
@@ -11,22 +11,6 @@
 namespace cldnn {
 GPU_DEFINE_PRIMITIVE_TYPE_ID(scatter_update)
 
-layout scatter_update_inst::calc_output_layout(scatter_update_node const& node, kernel_impl_params const& impl_param) {
-    auto desc = impl_param.typed_desc<scatter_update>();
-
-    auto input_layout = impl_param.get_input_layout();
-
-    auto output_shape = input_layout.get_tensor();
-    auto input_format = input_layout.format;
-    auto output_type = input_layout.data_type;
-
-    if (impl_param.has_fused_primitives()) {
-        output_type = impl_param.get_output_element_type();
-    }
-
-    return layout{output_type, input_format, output_shape};
-}
-
 std::string scatter_update_inst::to_string(scatter_update_node const& node) {
     auto desc = node.get_primitive();
     auto node_info = node.desc_to_json();
diff --git a/src/plugins/intel_gpu/src/graph/select.cpp b/src/plugins/intel_gpu/src/graph/select.cpp
index 9e0902e1f2ad4e..17af323dbe5d30 100644
--- a/src/plugins/intel_gpu/src/graph/select.cpp
+++ b/src/plugins/intel_gpu/src/graph/select.cpp
@@ -12,25 +12,6 @@
 namespace cldnn {
 GPU_DEFINE_PRIMITIVE_TYPE_ID(select)
 
-layout select_inst::calc_output_layout(select_node const& node, kernel_impl_params const& impl_param) {
-    assert(static_cast<bool>(impl_param.desc->output_data_types[0]) == false &&
-           "Output data type forcing is not supported for select_node!");
-
-    auto in_layout = impl_param.get_non_padded_input_layout(1);
-    auto output_size = in_layout.get_tensor();
-
-    if (impl_param.typed_desc<select>()->broadcast_spec.m_type == ov::op::AutoBroadcastType::NUMPY) {
-        auto input1_size = impl_param.get_input_layout(1).get_tensor();
-        auto input2_size = impl_param.get_input_layout(2).get_tensor();
-        output_size = tensor::max(input1_size, input2_size);
-        // Cond input0 also can be broadcasted.
-        auto input0_size = impl_param.get_input_layout(0).get_tensor();
-        output_size = tensor::max(input0_size, output_size);
-    }
-
-    return layout(in_layout.data_type, in_layout.format, output_size);
-}
-
 template<typename ShapeType>
 std::vector<layout> select_inst::calc_output_layouts(const select_node& /*node*/, const kernel_impl_params& impl_param) {
     auto input0_layout = impl_param.get_input_layout(0);
@@ -94,54 +75,5 @@ select_inst::typed_primitive_inst(network& network, select_node const& node) : p
                                 "Expected number of inputs",
                                 3,
                                 "");
-
-    bool allow_new_shape_infer = network.get_program()->get_config().get_property(ov::intel_gpu::allow_new_shape_infer);
-    // Broadcast check is performed in ngraph shape infer of select when allow_new_shape_infer=true
-    if (!allow_new_shape_infer) {
-        if (node.get_primitive()->broadcast_spec.m_type == ov::op::AutoBroadcastType::NONE) {
-            CLDNN_ERROR_LAYOUT_MISMATCH(node.id(),
-                                    "Positive input layout",
-                                    deps[1].first->get_output_layout(),
-                                    "Negative input layout",
-                                    deps[2].first->get_output_layout(),
-                                    "");
-
-            CLDNN_ERROR_NOT_EQUAL(node.id(),
-                                    "Mask size",
-                                    deps[0].first->get_output_layout().get_tensor(),
-                                    "Positive input format",
-                                    deps[1].first->get_output_layout().get_tensor(),
-                                    "");
-        } else if (node.get_primitive()->broadcast_spec.m_type == ov::op::AutoBroadcastType::NUMPY) {
-            CLDNN_ERROR_DATA_TYPES_MISMATCH(node.id(),
-                                    "Positive input data type",
-                                    deps[1].first->get_output_layout().data_type,
-                                    "Negative input data type",
-                                    deps[2].first->get_output_layout().data_type,
-                                    "");
-
-            auto dep1_size = deps[1].first->get_output_layout().get_tensor();
-            auto dep2_size = deps[2].first->get_output_layout().get_tensor();
-            cldnn::tensor output_tensor = tensor::max(dep1_size, dep2_size);
-            // Cond input0 also can be broadcasted.
-            auto dep0_size = deps[0].first->get_output_layout().get_tensor();
-            output_tensor = tensor::max(dep0_size, output_tensor);
-
-            auto max_dim_count = output_tensor.raw.size();
-
-            for (size_t i = 0; i < deps.size(); i++) {
-                for (size_t d = 0; d < max_dim_count; d++) {
-                    auto current_dim = deps[i].first->get_output_layout().get_tensor().raw[d];
-
-                    CLDNN_ERROR_BOOL(node.id(),
-                                        "Sizes equal or broadcast is possible",
-                                        !(current_dim == output_tensor.raw[d] || current_dim == 1),
-                                        "Invalid input shapes");
-                }
-            }
-        } else {
-            CLDNN_ERROR_MESSAGE(node.id(), "Unsupported broadcast_type: " + std::to_string(static_cast<int>(node.get_primitive()->broadcast_spec.m_type)));
-        }
-    }
 }
 }  // namespace cldnn
diff --git a/src/plugins/intel_gpu/src/graph/shape_of.cpp b/src/plugins/intel_gpu/src/graph/shape_of.cpp
index c3e791357c1f27..73fc8db3b58ddb 100644
--- a/src/plugins/intel_gpu/src/graph/shape_of.cpp
+++ b/src/plugins/intel_gpu/src/graph/shape_of.cpp
@@ -23,15 +23,6 @@ data_types get_output_data_type(const kernel_impl_params& impl_param) {
 }
 }  // namespace
 
-layout shape_of_inst::calc_output_layout(shape_of_node const& node, kernel_impl_params const& impl_param) {
-    const auto prim = impl_param.typed_desc<shape_of>();
-    const auto dt = get_output_data_type(impl_param);
-    const auto rank = impl_param.get_input_layout(0).get_rank();
-    const cldnn::tensor out_size{static_cast<tensor::value_type>(rank), 1, 1, 1};
-
-    return layout{dt, format::bfyx, out_size};
-}
-
 template<typename ShapeType>
 std::vector<layout> shape_of_inst::calc_output_layouts(shape_of_node const& /*node*/, const kernel_impl_params& impl_param) {
     const auto dt = get_output_data_type(impl_param);
diff --git a/src/plugins/intel_gpu/src/graph/shuffle_channels.cpp b/src/plugins/intel_gpu/src/graph/shuffle_channels.cpp
index ef7f7148d1ddbb..b71a8032d00683 100644
--- a/src/plugins/intel_gpu/src/graph/shuffle_channels.cpp
+++ b/src/plugins/intel_gpu/src/graph/shuffle_channels.cpp
@@ -12,35 +12,6 @@
 namespace cldnn {
 GPU_DEFINE_PRIMITIVE_TYPE_ID(shuffle_channels)
 
-layout shuffle_channels_inst::calc_output_layout(shuffle_channels_node const& node, kernel_impl_params const& impl_param) {
-    auto desc = impl_param.typed_desc<shuffle_channels>();
-
-    auto input_layout = impl_param.get_input_layout();
-    auto input_format = input_layout.format;
-
-    const int32_t number_of_dims = 4;
-    const int32_t group = desc->group;
-    int32_t axis = desc->axis;
-
-    if (axis < 0)
-        axis += number_of_dims;
-
-    if (axis < 0 || axis >= number_of_dims)
-        CLDNN_ERROR_MESSAGE(desc->id, "Incorrect axis value! Actual axis is" + std::to_string(group));
-
-    if (group < 1)
-        CLDNN_ERROR_MESSAGE(
-            desc->id,
-            "Invalid group size value (should equal at least one). Actual block size is" + std::to_string(group));
-
-    if (input_layout.get_tensor().sizes(format::bfyx)[axis] % group != 0)
-        CLDNN_ERROR_MESSAGE(
-            desc->id,
-            "Group parameter must evenly divide the channel dimension. Actual group size is " + std::to_string(group));
-
-    return layout{input_layout.data_type, input_format, input_layout.get_tensor()};
-}
-
 std::string shuffle_channels_inst::to_string(shuffle_channels_node const& node) {
     auto desc = node.get_primitive();
     auto node_info = node.desc_to_json();
diff --git a/src/plugins/intel_gpu/src/graph/slice.cpp b/src/plugins/intel_gpu/src/graph/slice.cpp
index 6f0ca337414b69..4bc4b343011594 100644
--- a/src/plugins/intel_gpu/src/graph/slice.cpp
+++ b/src/plugins/intel_gpu/src/graph/slice.cpp
@@ -39,10 +39,6 @@ GPU_DEFINE_PRIMITIVE_TYPE_ID(slice)
 slice_inst::typed_primitive_inst(network& network, slice_node const& node)
     : parent(network, node) {}
 
-layout slice_inst::calc_output_layout(slice_node const& node, kernel_impl_params const& impl_param) {
-    return calc_output_layouts<ov::PartialShape>(node, impl_param)[0];
-}
-
 template <typename ShapeType>
 inline std::vector<layout> slice_inst::calc_output_layouts(const slice_node&, const kernel_impl_params& impl_param) {
     std::vector<ShapeType> input_shapes{impl_param.input_layouts[0].get<ShapeType>()};
diff --git a/src/plugins/intel_gpu/src/graph/softmax.cpp b/src/plugins/intel_gpu/src/graph/softmax.cpp
index 2851074feb8ff0..4b23a877da01df 100644
--- a/src/plugins/intel_gpu/src/graph/softmax.cpp
+++ b/src/plugins/intel_gpu/src/graph/softmax.cpp
@@ -10,18 +10,6 @@
 namespace cldnn {
 GPU_DEFINE_PRIMITIVE_TYPE_ID(softmax)
 
-layout softmax_inst::calc_output_layout(softmax_node const& node, kernel_impl_params const& impl_param) {
-    assert(static_cast<bool>(impl_param.desc->output_data_types[0]) == false &&
-           "Output data type forcing is not supported for softmax_node!");
-
-    auto output_layout = impl_param.get_input_layout();
-
-    if (impl_param.has_fused_primitives())
-        output_layout.data_type = impl_param.get_output_element_type();
-
-    return output_layout;
-}
-
 std::string softmax_inst::to_string(softmax_node const& node) {
     auto desc = node.get_primitive();
     auto node_info = node.desc_to_json();
@@ -37,24 +25,5 @@ std::string softmax_inst::to_string(softmax_node const& node) {
     return primitive_description.str();
 }
 
-softmax_inst::typed_primitive_inst(network& network, softmax_node const& node) : parent(network, node) {
-    //    auto& input_offset  = arg.input_offset;
-    //    auto& output_offset = arg.output_offset;
-    //    auto& output_size   = arg.output_size;
-    //
-    //    auto& input_inst  = arg.input[0].primitive().as<const memory&>().argument;
-    //    auto& output_inst = arg.output[0].as<const memory&>().argument;
-    //    for (auto &x : input_offset.raw) if (x < 0) throw std::runtime_error("Softmax negative input offset.");
-    //
-    //    for(size_t i = 0; i < input_inst.size.raw.size(); ++i) {
-    //        if( input_inst.size.raw[i] < output_size.raw[i] +  input_offset.raw[i]) throw std::runtime_error("Softmax
-    //        input/output size does not match."); if(output_inst.size.raw[i] < output_size.raw[i] +
-    //        output_offset.raw[i]) throw std::runtime_error("Softmax sizes too small.");
-    //    }
-
-    // auto& input_inst = network.get_topology()->get_primitives().at(desc->input()[0]);
-    // if (input_inst->output_layout->size.format == cldnn::format::bfyx)
-    //    if (input_inst->output_layout->size.spatial[0] != 1 || input_inst->output_layout->size.spatial[1] != 1)
-    //        throw std::runtime_error("Softmax input has more than one dimension per batch");
-}
+softmax_inst::typed_primitive_inst(network& network, softmax_node const& node) : parent(network, node) {}
 }  // namespace cldnn
diff --git a/src/plugins/intel_gpu/src/graph/space_to_batch.cpp b/src/plugins/intel_gpu/src/graph/space_to_batch.cpp
index 32cdda5218d94d..b053f0c6838fd2 100644
--- a/src/plugins/intel_gpu/src/graph/space_to_batch.cpp
+++ b/src/plugins/intel_gpu/src/graph/space_to_batch.cpp
@@ -16,59 +16,6 @@
 namespace cldnn {
 GPU_DEFINE_PRIMITIVE_TYPE_ID(space_to_batch)
 
-layout space_to_batch_inst::calc_output_layout(space_to_batch_node const& node, kernel_impl_params const& impl_param) {
-    auto desc = impl_param.typed_desc<space_to_batch>();
-
-    auto input_layout = impl_param.get_input_layout();
-    auto input_format = input_layout.format;
-
-    auto output_type = desc->output_data_types[0].value_or(input_layout.data_type);
-
-    if (impl_param.has_fused_primitives())
-        output_type = impl_param.get_output_element_type();
-
-    const size_t spatial_num = format::spatial_num(input_format);
-
-    const auto& block_shape = desc->block_shape;
-    const auto& pads_begin = desc->pads_begin;
-    const auto& pads_end = desc->pads_end;
-
-    if (block_shape.batch[0] != 1)
-        CLDNN_ERROR_MESSAGE(desc->id,
-            "block_shape[0] is expected to be 1. Actual block_shape[0] is " +
-            std::to_string(block_shape.batch[0]));
-
-    if (pads_begin.batch[0] != 0)
-        CLDNN_ERROR_MESSAGE(desc->id,
-            "pads_begin[0] is expected to be 0. Actual pads_begin[0] is " +
-            std::to_string(pads_begin.batch[0]));
-
-    if (pads_end.batch[0] != 0)
-        CLDNN_ERROR_MESSAGE(desc->id,
-            "pads_end[0] is expected to be 0. Actual pads_end[0] is " +
-            std::to_string(pads_end.batch[0]));
-
-    if ((input_layout.feature() + pads_begin.feature[0] + pads_end.feature[0]) % block_shape.feature[0] != 0)
-            CLDNN_ERROR_MESSAGE(desc->id,
-                "Input feature shape after padding must be divisible by block_shape");
-
-    for (size_t i = 0; i < spatial_num; ++i)
-        if ((input_layout.spatial(i) + pads_begin.spatial[i] + pads_end.spatial[i]) % block_shape.spatial[i] != 0)
-            CLDNN_ERROR_MESSAGE(desc->id,
-                "Input spatial shapes after padding must be divisible by block_shape");
-
-    return layout{output_type, input_format, desc->out_size};
-}
-
-static std::vector<int32_t> tensor_to_vec(const tensor& t, const format f) {
-    std::vector<int32_t> vec(cldnn::format::dimension(f));
-    for (size_t i = 0; i < vec.size(); ++i) {
-        vec[i] = t.sizes()[i];
-    }
-    std::reverse(vec.begin() + 2, vec.end());
-    return vec;
-}
-
 template<typename ShapeType>
 std::vector<layout> space_to_batch_inst::calc_output_layouts(space_to_batch_node const& /*node*/, const kernel_impl_params& impl_param) {
     auto desc = impl_param.typed_desc<space_to_batch>();
@@ -103,13 +50,9 @@ std::vector<layout> space_to_batch_inst::calc_output_layouts(space_to_batch_node
 
     std::unordered_map<size_t, ov::Tensor> const_data;
     if (desc->shape_constant) {
-        auto block_sizes = tensor_to_vec(block_data, input0_format);
-        auto begin_sizes = tensor_to_vec(begin_data, input0_format);
-        auto end_sizes = tensor_to_vec(end_data, input0_format);
-
-        auto block_values = static_cast<void*>(block_sizes.data());
-        auto begin_values = static_cast<void*>(begin_sizes.data());
-        auto end_values = static_cast<void*>(end_sizes.data());
+        auto block_values = static_cast<void*>(block_data.data());
+        auto begin_values = static_cast<void*>(begin_data.data());
+        auto end_values = static_cast<void*>(end_data.data());
 
         auto block_tensor = make_tensor({ block_shape, data_types::i32, input0_format }, block_values);
         auto begin_tensor = make_tensor({ begin_shape, data_types::i32, input0_format }, begin_values);
diff --git a/src/plugins/intel_gpu/src/graph/space_to_depth.cpp b/src/plugins/intel_gpu/src/graph/space_to_depth.cpp
index 1452a61fce608d..8b04851267f8bd 100644
--- a/src/plugins/intel_gpu/src/graph/space_to_depth.cpp
+++ b/src/plugins/intel_gpu/src/graph/space_to_depth.cpp
@@ -44,66 +44,6 @@ std::vector<layout> space_to_depth_inst::calc_output_layouts(space_to_depth_node
 
 template std::vector<layout> space_to_depth_inst::calc_output_layouts<ov::PartialShape>(space_to_depth_node const& node, const kernel_impl_params& impl_param);
 
-layout space_to_depth_inst::calc_output_layout(space_to_depth_node const& node, kernel_impl_params const& impl_param) {
-    auto desc = impl_param.typed_desc<space_to_depth>();
-
-    auto input_layout = impl_param.get_input_layout();
-    auto input_format = input_layout.format;
-
-    const size_t block_size = desc->block_size;
-    auto depth_mode = desc->mode;
-
-    auto output_type = input_layout.data_type;
-    if (impl_param.has_fused_primitives()) {
-        output_type = impl_param.get_output_element_type();
-    }
-
-    if (depth_mode != SpaceToDepth::SpaceToDepthMode::DEPTH_FIRST && depth_mode != SpaceToDepth::SpaceToDepthMode::BLOCKS_FIRST)
-        CLDNN_ERROR_MESSAGE(desc->id,
-                            "Invalid mode for spaceToDepth: must be \"blocks_first\" or \"depth_first\" only");
-
-    if (block_size == 0)
-        CLDNN_ERROR_MESSAGE(desc->id,
-                            "Invalid spaceToDepth block_size value (should be >= 1). Actual block size is" +
-                                std::to_string(block_size));
-
-    if (input_layout.spatial(0) % block_size != 0 || input_layout.spatial(1) % block_size != 0)
-        CLDNN_ERROR_MESSAGE(
-            desc->id,
-            "Sizes of spatials x, y must be divisible by block size. Actual spatial sizes are " +
-                std::to_string(input_layout.spatial(0)) + ", " + std::to_string(input_layout.spatial(1)) +
-                    " (x, y). Actual block size is " + std::to_string(block_size));
-
-
-    if (input_layout.format.dimension() == 5) {
-        if (input_layout.spatial(2) % block_size != 0)
-        CLDNN_ERROR_MESSAGE(
-            desc->id,
-            "Sizes of spatials z must be divisible by block size. Actual spatial sizes are " +
-                std::to_string(input_layout.spatial(2)) +
-                    " (z). Block size is " + std::to_string(block_size));
-
-        const size_t feature = input_layout.feature() * block_size * block_size * block_size;
-        const size_t z = input_layout.spatial(2) / block_size;
-        const size_t y = input_layout.spatial(1) / block_size;
-        const size_t x = input_layout.spatial(0) / block_size;
-
-        return layout{
-            output_type,
-            input_format,
-            tensor(TensorValue(input_layout.batch()), TensorValue(feature), TensorValue(x), TensorValue(y), TensorValue(z))};
-    } else {
-        const size_t feature = input_layout.feature() * block_size * block_size;
-        const size_t y = input_layout.spatial(1) / block_size;
-        const size_t x = input_layout.spatial(0) / block_size;
-
-        return layout{
-            output_type,
-            input_format,
-            tensor(TensorValue(input_layout.batch()), TensorValue(feature), TensorValue(x), TensorValue(y))};
-    }
-}
-
 std::string space_to_depth_inst::to_string(space_to_depth_node const& node) {
     auto desc = node.get_primitive();
     auto node_info = node.desc_to_json();
diff --git a/src/plugins/intel_gpu/src/graph/strided_slice.cpp b/src/plugins/intel_gpu/src/graph/strided_slice.cpp
index ab321edb961e17..1879ad150c31a4 100644
--- a/src/plugins/intel_gpu/src/graph/strided_slice.cpp
+++ b/src/plugins/intel_gpu/src/graph/strided_slice.cpp
@@ -13,23 +13,6 @@
 namespace cldnn {
 GPU_DEFINE_PRIMITIVE_TYPE_ID(strided_slice)
 
-layout strided_slice_inst::calc_output_layout(strided_slice_node const& node, kernel_impl_params const& impl_param) {
-    auto desc = impl_param.typed_desc<strided_slice>();
-    auto input_layout = impl_param.get_input_layout();
-    auto output_format = format::get_default_format(desc->out_size.size());
-    auto out_shape = desc->out_size;
-    std::vector<tensor::value_type> dims_converted;
-    for (auto dim : out_shape) {
-        dims_converted.push_back(static_cast<tensor::value_type>(dim));
-    }
-    // extend shape to 4d
-    for (size_t i = dims_converted.size(); i < 4; i++) {
-        dims_converted.push_back(1);
-    }
-    auto out_size = cldnn::tensor(output_format, dims_converted);
-    return layout{input_layout.data_type, output_format, out_size};
-}
-
 template<typename ShapeType>
 std::vector<layout> strided_slice_inst::calc_output_layouts(strided_slice_node const& /*node*/, const kernel_impl_params& impl_param) {
     auto desc = impl_param.typed_desc<strided_slice>();
diff --git a/src/plugins/intel_gpu/src/graph/swiglu.cpp b/src/plugins/intel_gpu/src/graph/swiglu.cpp
index c3d36e15684610..defcb85b15c298 100644
--- a/src/plugins/intel_gpu/src/graph/swiglu.cpp
+++ b/src/plugins/intel_gpu/src/graph/swiglu.cpp
@@ -12,15 +12,6 @@
 namespace cldnn {
 GPU_DEFINE_PRIMITIVE_TYPE_ID(swiglu);
 
-layout swiglu_inst::calc_output_layout(swiglu_node const& node, kernel_impl_params const& impl_param) {
-    auto desc = impl_param.typed_desc<swiglu>();
-    auto input_layout = impl_param.get_input_layout();
-    auto output_type = impl_param.desc->output_data_types[0].value_or(input_layout.data_type);
-    auto output_format = input_layout.format;
-
-    return layout(output_type, output_format, desc->output_size);
-}
-
 template<typename ShapeType>
 std::vector<layout> swiglu_inst::calc_output_layouts(swiglu_node const& /*node*/, const kernel_impl_params& impl_param) {
     auto desc = impl_param.typed_desc<swiglu>();
diff --git a/src/plugins/intel_gpu/src/graph/tile.cpp b/src/plugins/intel_gpu/src/graph/tile.cpp
index 73383d67ea4388..c75b884713ea2c 100644
--- a/src/plugins/intel_gpu/src/graph/tile.cpp
+++ b/src/plugins/intel_gpu/src/graph/tile.cpp
@@ -16,23 +16,6 @@ namespace cldnn {
 
 GPU_DEFINE_PRIMITIVE_TYPE_ID(tile)
 
-layout tile_inst::calc_output_layout(tile_node const& node, kernel_impl_params const& impl_param) {
-    assert(static_cast<bool>(impl_param.desc->output_data_types[0]) == false &&
-           "Output data type forcing is not supported for tile_node!");
-    auto desc = impl_param.typed_desc<tile>();
-
-    auto input_layout = impl_param.get_input_layout();
-    auto input_format = input_layout.format;
-
-    std::vector<int64_t> repeats = desc->repeats;
-
-    auto out_shape = input_layout.get_dims();
-    for (size_t i = 0; i < repeats.size(); ++i) {
-        out_shape[i] *= repeats[i];
-    }
-    return layout{input_layout.data_type, input_format, tensor(input_format, out_shape)};
-}
-
 template<typename ShapeType>
 std::vector<layout> tile_inst::calc_output_layouts(tile_node const& /*node*/, const kernel_impl_params& impl_param) {
     auto desc = impl_param.typed_desc<tile>();
diff --git a/src/plugins/intel_gpu/src/graph/unique.cpp b/src/plugins/intel_gpu/src/graph/unique.cpp
index 93e739d422f04c..96ccff21bb0f9c 100644
--- a/src/plugins/intel_gpu/src/graph/unique.cpp
+++ b/src/plugins/intel_gpu/src/graph/unique.cpp
@@ -17,10 +17,6 @@ namespace cldnn {
 // -----------------------------------------------
 GPU_DEFINE_PRIMITIVE_TYPE_ID(unique_count)
 
-layout unique_count_inst::calc_output_layout(const unique_count_node& node, const kernel_impl_params& impl_param) {
-    OPENVINO_THROW("Only calc_output_layouts should be used!");
-}
-
 template <typename ShapeType>
 std::vector<layout> unique_count_inst::calc_output_layouts(const unique_count_node& node,
                                                            const kernel_impl_params& impl_param) {
@@ -52,10 +48,6 @@ std::string unique_count_inst::to_string(const unique_count_node& node) {
 // -----------------------------------------------
 GPU_DEFINE_PRIMITIVE_TYPE_ID(unique_gather)
 
-layout unique_gather_inst::calc_output_layout(const unique_gather_node& node, const kernel_impl_params& impl_param) {
-    OPENVINO_THROW("Only calc_output_layouts should be used!");
-}
-
 template <typename ShapeType>
 std::vector<layout> unique_gather_inst::calc_output_layouts(const unique_gather_node& node,
                                                             const kernel_impl_params& impl_param) {
diff --git a/src/plugins/intel_gpu/src/kernel_selector/kernels/matrix_nms/matrix_nms_kernel_ref.cpp b/src/plugins/intel_gpu/src/kernel_selector/kernels/matrix_nms/matrix_nms_kernel_ref.cpp
index 8461ff2bc20f5e..9f07713dc488e9 100644
--- a/src/plugins/intel_gpu/src/kernel_selector/kernels/matrix_nms/matrix_nms_kernel_ref.cpp
+++ b/src/plugins/intel_gpu/src/kernel_selector/kernels/matrix_nms/matrix_nms_kernel_ref.cpp
@@ -125,6 +125,13 @@ bool MatrixNmsKernelRef::Validate(const Params& p) const {
         return false;
     }
 
+    const matrix_nms_params& params = static_cast<const matrix_nms_params&>(p);
+    if (params.inputs.size() != 2)
+        return false;
+
+    if (params.outputs.size() != 3)
+        return false;
+
     return true;
 }
 
diff --git a/src/plugins/intel_gpu/src/plugin/graph.cpp b/src/plugins/intel_gpu/src/plugin/graph.cpp
index 2a3bd5dc0ff239..db798f8c956bca 100644
--- a/src/plugins/intel_gpu/src/plugin/graph.cpp
+++ b/src/plugins/intel_gpu/src/plugin/graph.cpp
@@ -3,6 +3,7 @@
 //
 
 #include "intel_gpu/runtime/layout.hpp"
+#include "openvino/pass/visualize_tree.hpp"
 #include "openvino/runtime/threading/executor_manager.hpp"
 #include "openvino/runtime/exec_model_info.hpp"
 #include "openvino/pass/serialize.hpp"
@@ -92,8 +93,6 @@ Graph::Graph(cldnn::BinaryInputBuffer &ib, const RemoteContextImpl::Ptr& context
         m_config.set_property(ov::intel_gpu::partial_build_program(bool_prop_value));
         ib >> bool_prop_value;
         m_config.set_property(ov::intel_gpu::optimize_data(bool_prop_value));
-        ib >> bool_prop_value;
-        m_config.set_property(ov::intel_gpu::allow_new_shape_infer(bool_prop_value));
     }
 
     auto imported_prog = std::make_shared<cldnn::program>(get_engine(), m_config);
@@ -196,8 +195,8 @@ void Graph::build(std::shared_ptr<cldnn::program> program) {
         auto steps_info = get_network()->get_optimizer_passes_info();
         size_t step_idx = 0;
         for (auto& step : steps_info) {
-            auto xml_path = debug_config->dump_graphs + std::to_string(net_id) + "_" + std::to_string(step_idx) + "_" + step.first + "_graph.xml";
-            ov::pass::Serialize(xml_path, "").run_on_model(get_runtime_model(step.second, true));
+            auto xml_path = debug_config->dump_graphs + std::to_string(net_id) + "_" + std::to_string(step_idx) + "_" + step.first + "_graph.svg";
+            ov::pass::VisualizeTree(xml_path).run_on_model(get_runtime_model(step.second, true));
             step_idx++;
         }
         net_id++;
@@ -234,7 +233,6 @@ std::shared_ptr<ov::Model> Graph::get_runtime_model(std::vector<cldnn::primitive
                 { "border", "Pad" },
                 { "concatenation", "Concat" },
                 { "convolution", "Convolution" },
-                { "deformable_convolution", "DeformableConvolution" },
                 { "crop", "Crop" },
                 { "custom_gpu_primitive", "CustomGPUPrimitive" },
                 { "data", "Const" },
@@ -523,7 +521,6 @@ void Graph::export_model(cldnn::BinaryOutputBuffer &ob) {
     {
         ob << m_config.get_property(ov::intel_gpu::partial_build_program);
         ob << m_config.get_property(ov::intel_gpu::optimize_data);
-        ob << m_config.get_property(ov::intel_gpu::allow_new_shape_infer);
     }
 
     ob.set_stream(m_network->get_stream_ptr().get());
diff --git a/src/plugins/intel_gpu/src/plugin/ops/adaptive_pooling.cpp b/src/plugins/intel_gpu/src/plugin/ops/adaptive_pooling.cpp
index 5fccdb9be3fb31..4982edcc25cda6 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/adaptive_pooling.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/adaptive_pooling.cpp
@@ -2,13 +2,12 @@
 // SPDX-License-Identifier: Apache-2.0
 //
 
+#include "intel_gpu/plugin/common_utils.hpp"
 #include "openvino/op/adaptive_max_pool.hpp"
 #include "openvino/op/adaptive_avg_pool.hpp"
 
 #include "intel_gpu/plugin/program_builder.hpp"
-#include "intel_gpu/plugin/common_utils.hpp"
 
-#include "intel_gpu/primitives/mutable_data.hpp"
 #include "intel_gpu/primitives/adaptive_pooling.hpp"
 
 namespace ov {
@@ -20,17 +19,8 @@ static void CreateAdaptiveAvgPoolOp(ProgramBuilder& p, const std::shared_ptr<ov:
     const auto inputs = p.GetInputInfo(op);
     const auto layer_name = layer_type_name_ID(op);
 
-    if (p.use_new_shape_infer()) {
-        const cldnn::adaptive_pooling poolPrim{layer_name,
-                                            inputs[0],
-                                            inputs[1]};
-        p.add_primitive(*op, poolPrim);
-    } else {
-        const cldnn::adaptive_pooling poolPrim{layer_name,
-                                            inputs[0],
-                                            tensor_from_dims(op->get_output_shape(0))};
-        p.add_primitive(*op, poolPrim);
-    }
+    const cldnn::adaptive_pooling poolPrim{layer_name, inputs[0], inputs[1]};
+    p.add_primitive(*op, poolPrim);
 }
 
 static void CreateAdaptiveMaxPoolOp(ProgramBuilder& p, const std::shared_ptr<ov::op::v8::AdaptiveMaxPool>& op) {
@@ -40,55 +30,17 @@ static void CreateAdaptiveMaxPoolOp(ProgramBuilder& p, const std::shared_ptr<ov:
     auto inputs = p.GetInputInfo(op);
     const auto layer_type_name = layer_type_name_ID(op);
 
-    if (p.use_new_shape_infer()) {
-        size_t num_outputs = op->get_output_size();
-
-        auto get_output_data_types = [&]() {
-            std::vector<cldnn::optional_data_type> output_data_types;
-            for (size_t i = 0; i < num_outputs; i++) {
-                auto type = op->get_output_element_type(i);
-                output_data_types.push_back(cldnn::element_type_to_data_type(type));
-            }
-            return output_data_types;
-        };
-
-        cldnn::adaptive_pooling poolPrim{layer_type_name,
-                                         inputs[0],
-                                         inputs[1],
-                                         cldnn::element_type_to_data_type(op->get_index_element_type()),
-                                         cldnn::element_type_to_data_type(op->get_output_element_type(0)),
-                                         num_outputs};
-        poolPrim.output_data_types = get_output_data_types();
-        p.add_primitive(*op, poolPrim);
-
-    } else {
-        const auto layer_name = layer_type_name + ".out0";
-
-        const auto indices_precision = op->get_output_element_type(1);
-        const auto indices_shape = op->get_output_shape(1);
-        const cldnn::layout indices_layout{cldnn::element_type_to_data_type(indices_precision),
-                                        cldnn::format::get_default_format(indices_shape.size()),
-                                        tensor_from_dims(indices_shape)};
-        const auto indices_memory = p.get_engine().allocate_memory(indices_layout);
-
-        const cldnn::primitive_id indices_id_w = layer_type_name + "_md_write";
-        const cldnn::mutable_data indices_mutable_prim_w{indices_id_w, indices_memory};
-        p.add_primitive(*op, indices_mutable_prim_w);
-
-        inputs.push_back(cldnn::input_info(indices_id_w));
-
-        const cldnn::adaptive_pooling poolPrim{layer_name,
-                                            inputs[0],
-                                            tensor_from_dims(op->get_output_shape(0)),
-                                            inputs.back().pid,
-                                            cldnn::element_type_to_data_type(op->get_index_element_type())};
-        p.add_primitive(*op, poolPrim);
+    size_t num_outputs = op->get_output_size();
 
-        const cldnn::primitive_id indices_id_r = layer_type_name + ".out1";
-        const cldnn::mutable_data indices_mutable_prim_r{indices_id_r, {cldnn::input_info(layer_name)}, indices_memory};
-        p.add_primitive(*op, indices_mutable_prim_r);
+    cldnn::adaptive_pooling poolPrim{layer_type_name,
+                                        inputs[0],
+                                        inputs[1],
+                                        cldnn::element_type_to_data_type(op->get_index_element_type()),
+                                        cldnn::element_type_to_data_type(op->get_output_element_type(0)),
+                                        num_outputs};
+    poolPrim.output_data_types = get_output_data_types(op);
+    p.add_primitive(*op, poolPrim);
 }
-    }
 
 REGISTER_FACTORY_IMPL(v8, AdaptiveAvgPool);
 REGISTER_FACTORY_IMPL(v8, AdaptiveMaxPool);
diff --git a/src/plugins/intel_gpu/src/plugin/ops/batch_to_space.cpp b/src/plugins/intel_gpu/src/plugin/ops/batch_to_space.cpp
index 1527d8940d742b..2ce7a0c5e6f62a 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/batch_to_space.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/batch_to_space.cpp
@@ -21,8 +21,8 @@ static void CreateBatchToSpaceOp(ProgramBuilder& p, const std::shared_ptr<ov::op
     auto rank = op->get_input_partial_shape(0).size();
     auto format = cldnn::format::get_default_format(rank);
 
-    std::vector<cldnn::tensor> tensor_inputs;
-    tensor_inputs.reserve(3);
+    std::vector<std::vector<int32_t>> const_inputs;
+    const_inputs.reserve(3);
 
     bool non_constant_input = false;
     for (size_t i = 1; i < 4; ++i) {
@@ -37,30 +37,21 @@ static void CreateBatchToSpaceOp(ProgramBuilder& p, const std::shared_ptr<ov::op
         }
     }
 
-    auto output_pshape = op->get_output_partial_shape(0);
-    auto out_size = output_pshape.is_static() ? tensor_from_dims(output_pshape.to_shape()) : cldnn::tensor();
-
     if (non_constant_input) {
-        auto batchToSpacePrim = cldnn::batch_to_space(layerName, inputs, out_size);
+        auto batchToSpacePrim = cldnn::batch_to_space(layerName, inputs);
         p.add_primitive(*op, batchToSpacePrim);
     } else {
         for (size_t i = 1; i < 4; ++i) {
-            auto inConst = std::dynamic_pointer_cast<ov::op::v0::Constant>(op->get_input_node_shared_ptr(i));
-
-            std::vector<int32_t> sizes = inConst->cast_vector<int32_t>();
-            int32_t default_size = i == 1 ? 1 : 0;
-            for (size_t s = sizes.size(); s < format.dimension(); s++) {
-                sizes.push_back(default_size);
-            }
-            tensor_inputs.emplace_back(format, sizes, default_size);
+            auto in_const = std::dynamic_pointer_cast<ov::op::v0::Constant>(op->get_input_node_shared_ptr(i));
+            const_inputs.emplace_back(in_const->cast_vector<int32_t>());
         }
 
         auto batchToSpacePrim = cldnn::batch_to_space(layerName,
-                                                      inputs[0],            // input
-                                                      tensor_inputs[0],     // block_shape
-                                                      tensor_inputs[1],     // crops_begin
-                                                      tensor_inputs[2],     // crops_end
-                                                      out_size);
+                                                      inputs[0],           // input
+                                                      const_inputs[0],     // block_shape
+                                                      const_inputs[1],     // crops_begin
+                                                      const_inputs[2]);    // crops_end
+
 
         p.add_primitive(*op, batchToSpacePrim);
     }
diff --git a/src/plugins/intel_gpu/src/plugin/ops/broadcast.cpp b/src/plugins/intel_gpu/src/plugin/ops/broadcast.cpp
index 4fda62fcb6d519..88ef8ab30d4356 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/broadcast.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/broadcast.cpp
@@ -4,14 +4,11 @@
 
 #include "openvino/core/except.hpp"
 #include "intel_gpu/plugin/program_builder.hpp"
-#include "intel_gpu/plugin/common_utils.hpp"
 
 #include "openvino/op/broadcast.hpp"
 #include "openvino/op/constant.hpp"
 
 #include "intel_gpu/primitives/broadcast.hpp"
-#include "intel_gpu/primitives/reorder.hpp"
-#include "intel_gpu/primitives/reshape.hpp"
 
 namespace ov {
 namespace intel_gpu {
@@ -22,44 +19,9 @@ static void CreateCommonBroadcastOp(ProgramBuilder& p, const std::shared_ptr<ov:
 
     auto input_pshape = op->get_input_partial_shape(0);
     auto output_pshape = op->get_output_partial_shape(0);
-    auto input_rank = input_pshape.size();
-    auto output_rank = output_pshape.size();
 
     auto input = inputs[0];
 
-    if (input_rank != output_rank && input_pshape.is_static() && output_pshape.is_static() && !p.use_new_shape_infer()) {
-        auto inputShape = op->get_input_shape(0);
-        auto outputShape = op->get_output_shape(0);
-        // Add reorder if changing number of dimensions requires changing format
-        auto targetFormat = cldnn::format::get_default_format(output_rank);
-        if (targetFormat.value != cldnn::format::get_default_format(input_rank).value) {
-            auto reorderName = layerName + "_cldnn_in_reorder";
-            auto targetDatatype = cldnn::element_type_to_data_type(op->get_input_element_type(0));
-            auto reorderPrim = cldnn::reorder(reorderName,
-                                              input,
-                                              targetFormat,
-                                              targetDatatype);
-            p.add_primitive(*op, reorderPrim);
-
-            input.pid = reorderName;
-        }
-
-        auto reshapeName = layerName + "_cldnn_in_reshape";
-
-        // Extend input dimensions with ones
-        if (axis_mapping.empty()) {
-            // If axis_mapping is not specified, then we prepend shape with neccesary count of 1-s
-            inputShape.insert(inputShape.begin(), output_rank - input_rank, 1ul);
-        }
-
-        auto targetShape = tensor_from_dims(inputShape);
-
-        auto reshapePrim = cldnn::reshape(reshapeName, input, targetShape);
-        p.add_primitive(*op, reshapePrim);
-
-        input.pid = reshapeName;
-    }
-
     ov::op::BroadcastModeSpec mode = ov::op::BroadcastType::NONE;
     if (auto broadcast_v3 = std::dynamic_pointer_cast<ov::op::v3::Broadcast>(op)) {
         mode = broadcast_v3->get_broadcast_spec();
diff --git a/src/plugins/intel_gpu/src/plugin/ops/bucketize.cpp b/src/plugins/intel_gpu/src/plugin/ops/bucketize.cpp
index 24a32b233a641b..b49107d49ec29b 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/bucketize.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/bucketize.cpp
@@ -4,7 +4,6 @@
 
 #include "openvino/op/bucketize.hpp"
 #include "intel_gpu/primitives/bucketize.hpp"
-#include "intel_gpu/plugin/common_utils.hpp"
 #include "intel_gpu/plugin/program_builder.hpp"
 
 namespace ov {
diff --git a/src/plugins/intel_gpu/src/plugin/ops/concat.cpp b/src/plugins/intel_gpu/src/plugin/ops/concat.cpp
index e44b280643663c..92d8d3bb727040 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/concat.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/concat.cpp
@@ -3,7 +3,6 @@
 //
 
 #include "intel_gpu/plugin/program_builder.hpp"
-#include "intel_gpu/plugin/common_utils.hpp"
 
 #include "openvino/op/concat.hpp"
 
diff --git a/src/plugins/intel_gpu/src/plugin/ops/condition.cpp b/src/plugins/intel_gpu/src/plugin/ops/condition.cpp
index 4b7b3748d6e69d..81a3ed5198b70b 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/condition.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/condition.cpp
@@ -29,7 +29,6 @@ static cldnn::condition::branch gen_branch(ProgramBuilder& p, const std::shared_
         }
     }
     config.set_property(ov::intel_gpu::max_dynamic_batch(1));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(op->is_dynamic() || p.use_new_shape_infer()));
 
     ProgramBuilder prog(internal_body, p.get_engine(), config, false, p.get_task_executor(), p.get_compilation_context(), true);
     branch.inner_program = prog.get_compiled_program();
diff --git a/src/plugins/intel_gpu/src/plugin/ops/constant.cpp b/src/plugins/intel_gpu/src/plugin/ops/constant.cpp
index f87c2b39848d09..8cbc0b1d5d5b36 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/constant.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/constant.cpp
@@ -3,26 +3,8 @@
 //
 
 #include "intel_gpu/plugin/program_builder.hpp"
-#include "intel_gpu/plugin/common_utils.hpp"
-#include "intel_gpu/op/convolution.hpp"
 
 #include "openvino/op/constant.hpp"
-#include "openvino/op/convolution.hpp"
-#include "openvino/op/convert.hpp"
-#include "openvino/op/deformable_convolution.hpp"
-#include "openvino/op/group_conv.hpp"
-#include "openvino/op/concat.hpp"
-#include "openvino/op/squared_difference.hpp"
-#include "openvino/op/gather.hpp"
-#include "openvino/op/split.hpp"
-#include "openvino/op/prelu.hpp"
-#include "openvino/op/roi_align.hpp"
-#include "openvino/op/roi_align_rotated.hpp"
-#include "openvino/op/variadic_split.hpp"
-#include "openvino/op/util/op_types.hpp"
-#include "openvino/op/loop.hpp"
-#include "openvino/op/tensor_iterator.hpp"
-#include "openvino/op/util/binary_elementwise_bitwise.hpp"
 
 #include "intel_gpu/primitives/data.hpp"
 #include "intel_gpu/runtime/debug_configuration.hpp"
@@ -30,64 +12,12 @@
 namespace ov {
 namespace intel_gpu {
 
-static cldnn::tensor getConstTensor(const ov::Shape constDims) {
-    std::vector<cldnn::tensor::value_type> shuffled_dims(constDims.size());
-
-    // cldnn tensor c-tor expects constants be in a reversed order (x, y, z, w, u, v)
-    for (size_t i = 0; i < constDims.size(); i++) {
-        shuffled_dims[i] = TensorValue(constDims[i < 2 ? i : (constDims.size() - 1 - i)]);
-    }
-    cldnn::tensor constTensor;
-    switch (constDims.size()) {
-    case 8:
-    case 7:
-        constTensor = cldnn::tensor(shuffled_dims);
-        break;
-    case 6: constTensor = cldnn::tensor(TensorValue(constDims[0]), TensorValue(constDims[1]),
-                                        TensorValue(constDims[5]), TensorValue(constDims[4]),
-                                        TensorValue(constDims[3]), TensorValue(constDims[2]));
-        break;
-    case 5: constTensor = cldnn::tensor(TensorValue(constDims[0]), TensorValue(constDims[1]),
-                                        TensorValue(constDims[4]), TensorValue(constDims[3]), TensorValue(constDims[2]));
-        break;
-    case 4: constTensor = cldnn::tensor(TensorValue(constDims[0]), TensorValue(constDims[1]),
-                                        TensorValue(constDims[3]), TensorValue(constDims[2]));
-        break;
-    case 3: constTensor = cldnn::tensor(TensorValue(constDims[0]), TensorValue(constDims[1]),
-                                        1, TensorValue(constDims[2]));
-        break;
-    case 2: constTensor = cldnn::tensor(TensorValue(constDims[0]), TensorValue(constDims[1]), 1, 1);
-        break;
-    case 1: constTensor = cldnn::tensor(1, TensorValue(constDims[0]), 1, 1);
-        break;
-    case 0: constTensor = cldnn::tensor(1, 1, 1, 1);
-        break;
-    default: OPENVINO_THROW("Invalid constant blob dimensions");
-    }
-    return constTensor;
-}
-
-struct ConstProperties {
-    bool needsBatchInterpretation;
-};
-
-static void create_data(ProgramBuilder& p, const ov::Shape& const_shape, const std::shared_ptr<ov::op::v0::Constant>& op, const ConstProperties& props) {
-    cldnn::tensor constTensor = getConstTensor(const_shape);
+static void CreateConstantOp(ProgramBuilder& p, const std::shared_ptr<ov::op::v0::Constant>& op) {
+    auto const_shape = op->get_output_shape(0);
     auto constFormat = cldnn::format::get_default_format(const_shape.size());
 
-    if (props.needsBatchInterpretation) {
-        constTensor.batch[0] = static_cast<cldnn::tensor::value_type>(constTensor.count());
-        constTensor.feature[0] = 1;
-    }
-
-    // If const_shape has a dimension = 0, then create tensor with single value
-    // TODO: check if dim=0 is a valid case
-    if (std::accumulate(const_shape.begin(), const_shape.end(), size_t(1), std::multiplies<size_t>()) == 0)
-        constTensor = cldnn::tensor{1};
-
     cldnn::data_types out_dtype = cldnn::element_type_to_data_type(op->get_output_element_type(0));
-    cldnn::layout constLayout = p.use_new_shape_infer() ? cldnn::layout(const_shape, out_dtype, constFormat) :
-                                                          cldnn::layout(out_dtype, constFormat, constTensor);
+    cldnn::layout const_layout = cldnn::layout(const_shape, out_dtype, constFormat);
 
     cldnn::primitive_id initialconstPrimID = layer_type_name_ID(op);
     cldnn::primitive_id constPrimID;
@@ -103,22 +33,22 @@ static void create_data(ProgramBuilder& p, const ov::Shape& const_shape, const s
         p.profiling_ids.push_back(initialconstPrimID);
     } else {
         cldnn::memory::ptr mem = nullptr;
-        if (constLayout.bytes_count() > 0) {
-            mem = p.get_engine().allocate_memory(constLayout, false);
+        if (const_layout.bytes_count() > 0) {
+            mem = p.get_engine().allocate_memory(const_layout, false);
         } else {
             // In the case of empty const data with {0} shape, it has zero byte.
             // To avoid zero byte memory allocation issue, reinterpret one dimension memory to zero dimension memory.
-            auto one_dim_layout = cldnn::layout(ov::PartialShape({1}), constLayout.data_type, constLayout.format);
+            auto one_dim_layout = cldnn::layout(ov::PartialShape({1}), const_layout.data_type, const_layout.format);
             auto one_dim_mem = p.get_engine().allocate_memory(one_dim_layout, false);
-            mem = p.get_engine().reinterpret_buffer(*one_dim_mem, constLayout);
+            mem = p.get_engine().reinterpret_buffer(*one_dim_mem, const_layout);
         }
 
         GPU_DEBUG_LOG << "[" << initialconstPrimID << ": constant] layout: "
-                        << constLayout.to_short_string() << ", mem_ptr(" << mem << ", " << mem->size() << " bytes)"<< std::endl;
+                        << const_layout.to_short_string() << ", mem_ptr(" << mem << ", " << mem->size() << " bytes)"<< std::endl;
         auto& stream = p.get_engine().get_service_stream();
         cldnn::mem_lock<char> lock{mem, stream};
         auto buf = lock.data();
-        auto bufSize = constLayout.bytes_count();
+        auto bufSize = const_layout.bytes_count();
 
         std::memcpy(&buf[0], &data[0], bufSize);
         p.add_primitive(*op, cldnn::data(initialconstPrimID, mem));
@@ -127,131 +57,6 @@ static void create_data(ProgramBuilder& p, const ov::Shape& const_shape, const s
     }
 }
 
-static bool is_btiwise(Node* node) {
-    return dynamic_cast<const ov::op::util::BinaryElementwiseBitwise*>(node) != nullptr;
-}
-
-static void CreateConstantOp(ProgramBuilder& p, const std::shared_ptr<ov::op::v0::Constant>& op) {
-    ov::Shape constDims = op->get_shape();
-    auto constUsers = op->get_output_target_inputs(0);
-
-    std::unordered_map<std::shared_ptr<ov::op::v0::Constant>, ConstProperties> consts = {
-        {op, {false}}
-    };
-
-    auto is_binary_eltwise = [&] (ov::Node* op) -> bool {
-        if (ov::op::util::is_binary_elementwise_arithmetic(op) ||
-            ov::op::util::is_binary_elementwise_logical(op) ||
-            ov::op::util::is_binary_elementwise_comparison(op) ||
-            is_btiwise(op)) {
-            return true;
-        } else {
-            return false;
-        }
-    };
-
-    auto is_all_inputs_1d = [&] (ov::Node* op) -> bool {
-        for (size_t i = 0; i < op->get_input_size(); i++) {
-            auto& in_shape = op->get_input_partial_shape(i);
-            if (in_shape.size() > 1)
-                return false;
-        }
-        return true;
-    };
-
-    auto is_convert_into_binary_eltwise = [&] (ov::Node* op) -> bool {
-        if (ov::is_type<ov::op::v0::Convert>(op)) {
-            for (size_t i = 0; i < op->get_output_size(); ++i) {
-                auto convertUsers = op->get_output_target_inputs(i);
-                for (auto user : convertUsers) {
-                    if (is_binary_eltwise(user.get_node()) &&
-                        is_all_inputs_1d(user.get_node())) {
-                        return true;
-                    }
-                }
-            }
-        }
-        return false;
-    };
-
-    auto is_grouped_conv = [](ov::Node* op) -> bool {
-        if (ov::is_type<ov::op::v1::GroupConvolution>(op))
-            return true;
-
-        if (ov::is_type<op::Convolution>(op)) {
-            return ov::as_type<op::Convolution>(op)->get_groups() > 0;
-        }
-
-        return false;
-    };
-    // WA to inconsistency between input and const 1d tensors
-    // For Concat along batch we go with batch interpretation
-    // For Gather input we go with batch interpretation
-    // Also check if constant users is a backprop convolution - in that case O and I need to be swapped.
-    for (auto& node : constUsers) {
-        auto outOp = node.get_node();
-        if (auto castedOp = dynamic_cast<ov::op::v0::Concat*>(outOp)) {
-            if (castedOp->get_axis() == 0) {
-                consts[op].needsBatchInterpretation = constDims.size() == 1;
-            }
-        } else if (((is_binary_eltwise(outOp) || ov::is_type<ov::op::v0::SquaredDifference>(outOp)) && is_all_inputs_1d(outOp)) ||
-                     is_convert_into_binary_eltwise(outOp)) {
-            consts[op].needsBatchInterpretation = constDims.size() == 1;
-        } else if (ov::is_type<ov::op::v1::Gather>(outOp) ||
-                   ov::is_type<ov::op::v7::Gather>(outOp) ||
-                   ov::is_type<ov::op::v8::Gather>(outOp) ||
-                   ov::is_type<ov::op::v1::Split>(outOp) ||
-                   ov::is_type<ov::op::v1::VariadicSplit>(outOp)) {
-            consts[op].needsBatchInterpretation = constDims.size() == 1;
-        } else if (ov::is_type<ov::op::v0::PRelu>(outOp) && node.get_index() == 1) {
-            // PReLU slope tensor reshape policy
-            //
-            // 1. 1-dim slope is handled by 'getConstTensor' (if slope dimension is equal to the feature dimension of input).
-            //   ex) [1] --> [1, 1, 1, 1]
-            //       [N] --> [1, N, 1, 1]
-            //
-            // 2. Multi-dims slope tensor is handled by the numpy broadcasting rule that is defined at
-            //    'https://docs.openvino.ai/2023.0/openvino_docs_ops_broadcast_rules.html'.
-            //   ex) [N, 1, 1] --> [1, N, 1, 1]
-            //       [N, M, 1] --> [1, N, M, 1]
-            auto input_shape = outOp->get_input_partial_shape(0);
-            if ((constDims.size() != 1 && constDims.size() < input_shape.size()) ||
-                (constDims.size() == 1 && input_shape.is_static() && static_cast<int64_t>(constDims[0]) != input_shape[1].get_length())) {
-                // Reshape 'constDims' according to the numpy broadcasting rule.
-                ov::Shape slope_shape(input_shape.size(), 1);
-                for (size_t j = 1; j <= constDims.size(); j++)
-                    slope_shape[slope_shape.size() - j] = constDims[constDims.size() - j];
-                constDims = slope_shape;
-            }
-        } else if (is_grouped_conv(outOp) && node.get_index() == 1 && !p.use_new_shape_infer()) {
-            auto input_shape = outOp->get_input_partial_shape(0);
-            if (constDims.size() == 4 && input_shape.size() == 3) { // In case of weight dim 4 and input dim 3,
-                constDims.push_back(1);                             // The weight cldnn tensor adds 1d to the end as the input cldnn tensor does
-            }
-        } else if (ov::is_type<ov::op::v3::ROIAlign>(outOp) || ov::is_type<ov::op::v9::ROIAlign>(outOp) ||
-                   ov::is_type<ov::op::v15::ROIAlignRotated>(outOp)) { //< Hacks...
-            consts[op].needsBatchInterpretation = constDims.size() == 1;
-        } else if ((ov::is_type<ov::op::v5::Loop>(outOp) || ov::is_type<ov::op::v0::TensorIterator>(outOp))) {
-            // when inner network has 1d parameter which is connected to outer loop's constant 1d data,
-            // outer constant 1d data and inner 1d parameter has same bytes_count but layout is different
-            // (outer constant is [1, N, 1, 1] but inner parameter is [N, 1, 1, 1]).
-            // To pass check_memory_to_set in input_layout::set_data for this case, Set constDims to [N, 1, 1, 1]
-            // when constDims is one dim and user op is Loop or TensorIterator.
-            consts[op].needsBatchInterpretation = constDims.size() == 1;
-        } else if (ov::is_type<ov::op::v0::Result>(outOp) && !p.use_new_shape_infer() && p.is_inner_program()) {
-            // When IF-operation generates branch-true and branch-false,
-            // simple nodes for both can be created such as Parameter->Result, Constant->Result
-            // And each layout will be like Parameter->Result [N, 1, 1, 1], Constant->Result [1, N, 1, 1], that produces layout mismatch error.
-            // For that case, Constant->Result needs to be [N, 1, 1, 1]
-            consts[op].needsBatchInterpretation = constDims.size() == 1;
-        }
-    }
-
-    for (auto& it : consts) {
-        create_data(p, constDims, it.first, it.second);
-    }
-}
-
 REGISTER_FACTORY_IMPL(v0, Constant);
 
 }  // namespace intel_gpu
diff --git a/src/plugins/intel_gpu/src/plugin/ops/convert.cpp b/src/plugins/intel_gpu/src/plugin/ops/convert.cpp
index 395bf49c8ac0cb..c9f4d71403f86e 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/convert.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/convert.cpp
@@ -3,7 +3,6 @@
 //
 
 #include "intel_gpu/plugin/program_builder.hpp"
-#include "intel_gpu/plugin/common_utils.hpp"
 
 #include "openvino/op/convert.hpp"
 #include "openvino/op/convert_like.hpp"
diff --git a/src/plugins/intel_gpu/src/plugin/ops/convert_color.cpp b/src/plugins/intel_gpu/src/plugin/ops/convert_color.cpp
index 98231d272b25ea..0b51843353655d 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/convert_color.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/convert_color.cpp
@@ -9,7 +9,6 @@
 #include "openvino/op/i420_to_rgb.hpp"
 
 #include "intel_gpu/plugin/program_builder.hpp"
-#include "intel_gpu/plugin/common_utils.hpp"
 
 #include "intel_gpu/primitives/convert_color.hpp"
 #include "intel_gpu/primitives/concatenation.hpp"
diff --git a/src/plugins/intel_gpu/src/plugin/ops/convolution.cpp b/src/plugins/intel_gpu/src/plugin/ops/convolution.cpp
index 2587dbd5255e55..e6e8ab3125e37d 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/convolution.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/convolution.cpp
@@ -44,14 +44,6 @@ static void CreateConvolutionOp(ProgramBuilder& p, const std::shared_ptr<ov::int
     auto pads_end = op->get_pads_end();
     auto auto_pad = op->get_auto_pad();
 
-    if (!op->is_dynamic()) {
-        // Extend 1d vectors to 2d as 1d can't be handled properly by the graph optimizer for now
-        strides.resize(std::max<size_t>(2, strides.size()), 1);
-        dilations.resize(std::max<size_t>(2, strides.size()), 1);
-        pads_begin.resize(std::max<size_t>(2, pads_begin.size()), 0);
-        pads_end.resize(std::max<size_t>(2, pads_end.size()), 0);
-    }
-
     std::shared_ptr<cldnn::convolution> prim = nullptr;
 
     if (op->is_asymmetric()) {
diff --git a/src/plugins/intel_gpu/src/plugin/ops/ctc_greedy_decoder.cpp b/src/plugins/intel_gpu/src/plugin/ops/ctc_greedy_decoder.cpp
index 5f199c78d916c5..3e46d80040218f 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/ctc_greedy_decoder.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/ctc_greedy_decoder.cpp
@@ -6,12 +6,10 @@
 #include "intel_gpu/plugin/common_utils.hpp"
 
 #include "openvino/op/ctc_greedy_decoder.hpp"
+#include "intel_gpu/runtime/layout.hpp"
 #include "openvino/op/ctc_greedy_decoder_seq_len.hpp"
 
 #include "intel_gpu/primitives/ctc_greedy_decoder.hpp"
-#include "intel_gpu/primitives/reorder.hpp"
-#include "intel_gpu/primitives/mutable_data.hpp"
-#include "intel_gpu/runtime/debug_configuration.hpp"
 
 #include "transformations/utils/utils.hpp"
 
@@ -22,115 +20,30 @@ static void CreateCommonCTCGreedyDecoderOp(ProgramBuilder& p, const std::shared_
     validate_inputs_count(op, {2, 3});
     auto inputs = p.GetInputInfo(op);
 
-    std::vector<cldnn::input_info> reordered_inputs;
-    reordered_inputs.resize(inputs.size());
-
-    for (size_t portIndex = 0; portIndex < inputs.size(); portIndex++) {
-        auto inputDataType = cldnn::element_type_to_data_type(op->get_input_element_type(portIndex));
-        if (inputDataType == cldnn::data_types::i64) {
-            // GPU primitive supports only i32 data type for 'sequence_length' and 'blank_index' inputs
-            // so we need additional reorder if it's provided as i64
-            auto reorderPrimName = inputs[portIndex].pid + "_" + op->get_friendly_name() + ProgramBuilder::m_preProcessTag;
-            auto targetFormat = cldnn::format::get_default_format(op->get_input_shape(portIndex).size());
-            auto preprocessPrim = cldnn::reorder(reorderPrimName,
-                                                 inputs[portIndex],
-                                                 targetFormat,
-                                                 cldnn::data_types::i32);
-            p.add_primitive(*op, preprocessPrim);
-            reordered_inputs[portIndex] = cldnn::input_info(reorderPrimName);
-        } else {
-            reordered_inputs[portIndex] = inputs[portIndex];
+    uint32_t blank_index = UINT32_MAX;
+    if (inputs.size() == 3) {
+        auto blank_index_node = std::dynamic_pointer_cast<ov::op::v0::Constant>(op->get_input_node_shared_ptr(2));
+        if (!blank_index_node) {
+            OPENVINO_THROW("Unsupported blank_index node type in ", op->get_friendly_name(), " (", op->get_type_name(), ")");
         }
-    }
-
-    if (p.use_new_shape_infer()) {
-        uint32_t blank_index = UINT32_MAX;
-        if (reordered_inputs.size() == 3) {
-            auto blank_index_node = std::dynamic_pointer_cast<ov::op::v0::Constant>(op->get_input_node_shared_ptr(2));
-            if (!blank_index_node) {
-                OPENVINO_THROW("Unsupported blank_index node type in ", op->get_friendly_name(), " (", op->get_type_name(), ")");
-            }
-            float val;
-            if (ov::shape_size(blank_index_node->get_output_shape(0)) != 1 || !ov::op::util::get_single_value(blank_index_node, val)) {
-                OPENVINO_THROW("Unsupported parameter size in ", op->get_friendly_name(), " (", op->get_type_name(), ")");
-            }
-            blank_index = static_cast<uint32_t>(val);
-            reordered_inputs.pop_back();
-        }
-
-        auto primitive = cldnn::ctc_greedy_decoder(
-                    layer_type_name_ID(op),
-                    reordered_inputs,
-                    blank_index,
-                    ctc_merge_repeated,
-                    cldnn::element_type_to_data_type(op->get_output_element_type(0)),
-                    op->get_output_size());
-        primitive.output_data_types = get_output_data_types(op);
-        p.add_primitive(*op, primitive);
-    } else {
-        uint32_t blank_index = static_cast<uint32_t>(op->get_input_shape(0).back() - 1);
-        if (reordered_inputs.size() == 3) {
-            auto blank_index_node = std::dynamic_pointer_cast<ov::op::v0::Constant>(op->get_input_node_shared_ptr(2));
-            if (!blank_index_node) {
-                OPENVINO_THROW("Unsupported blank_index node type in ", op->get_friendly_name(), " (", op->get_type_name(), ")");
-            }
-            float val;
-            if (ov::shape_size(blank_index_node->get_output_shape(0)) != 1 || !ov::op::util::get_single_value(blank_index_node, val)) {
-                OPENVINO_THROW("Unsupported parameter size in ", op->get_friendly_name(), " (", op->get_type_name(), ")");
-            }
-            blank_index = static_cast<uint32_t>(val);
-            reordered_inputs.pop_back();
-        }
-
-        std::size_t num_output = op->get_output_size();
-
-        std::vector<cldnn::memory::ptr> shared_memory;
-        if (num_output == 2) {
-            auto mutable_precision = op->get_output_element_type(1);
-            if (mutable_precision == ov::element::i64) {
-                mutable_precision = ov::element::i32;
-            }
-
-            cldnn::layout mutableLayout = cldnn::layout(
-                cldnn::element_type_to_data_type(mutable_precision),
-                cldnn::format::get_default_format(op->get_output_shape(1).size()),
-                tensor_from_dims(op->get_output_shape(1)));
-
-            GPU_DEBUG_LOG << "[" << layer_type_name_ID(op) << ": mutable data]" << std::endl;
-            shared_memory.emplace_back(p.get_engine().allocate_memory(mutableLayout));
-
-            cldnn::primitive_id ctc_gd_mutable_id_w = layer_type_name_ID(op) + "_md_write";
-            auto ctc_gd_mutable_prim = cldnn::mutable_data(ctc_gd_mutable_id_w,
-                                                        shared_memory[0]);
-            p.add_primitive(*op, ctc_gd_mutable_prim);
-            reordered_inputs.push_back(ctc_gd_mutable_id_w);
-        }
-
-        auto CTCGreedyDecoderLayerName = num_output == 2 ? layer_type_name_ID(op) + ".out0" : layer_type_name_ID(op);
-        auto primitive = cldnn::ctc_greedy_decoder(
-                    CTCGreedyDecoderLayerName,
-                    reordered_inputs,
-                    blank_index,
-                    ctc_merge_repeated,
-                    tensor_from_dims(op->get_output_shape(0)));
-
-        // GPU primitive supports only i32 as output data type
-        primitive.output_data_types = {cldnn::element_type_to_data_type(ov::element::i32)};
-
-        if (num_output == 2) {
-            primitive.second_output = reordered_inputs.back().pid;
-        }
-
-        p.add_primitive(*op, primitive);
-
-        if (num_output == 2) {
-            cldnn::primitive_id ctc_gd_mutable_id_r = layer_type_name_ID(op) + ".out1";
-            auto ctc_gd_mutable_prim_r = cldnn::mutable_data(ctc_gd_mutable_id_r,
-                                                            { cldnn::input_info(CTCGreedyDecoderLayerName) },
-                                                            shared_memory[0]);
-            p.add_primitive(*op, ctc_gd_mutable_prim_r);
+        float val;
+        if (ov::shape_size(blank_index_node->get_output_shape(0)) != 1 || !ov::op::util::get_single_value(blank_index_node, val)) {
+            OPENVINO_THROW("Unsupported parameter size in ", op->get_friendly_name(), " (", op->get_type_name(), ")");
         }
+        blank_index = static_cast<uint32_t>(val);
+        inputs.pop_back();
     }
+
+    auto primitive = cldnn::ctc_greedy_decoder(
+                layer_type_name_ID(op),
+                inputs,
+                blank_index,
+                ctc_merge_repeated,
+                cldnn::element_type_to_data_type(op->get_output_element_type(0)),
+                op->get_output_size());
+    primitive.output_data_types = get_output_data_types(op, {{ov::element::i64, ov::element::i32}});
+    primitive.output_data_types[0] = cldnn::optional_data_type{ov::element::i32}; // // GPU primitive supports only i32 as output data type
+    p.add_primitive(*op, primitive);
 }
 
 static void CreateCTCGreedyDecoderOp(ProgramBuilder& p, const std::shared_ptr<ov::op::v0::CTCGreedyDecoder>& op) {
diff --git a/src/plugins/intel_gpu/src/plugin/ops/cum_sum.cpp b/src/plugins/intel_gpu/src/plugin/ops/cum_sum.cpp
index 9d0078e3b2761c..22a41da9876d6d 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/cum_sum.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/cum_sum.cpp
@@ -2,7 +2,6 @@
 // SPDX-License-Identifier: Apache-2.0
 //
 
-#include "intel_gpu/plugin/common_utils.hpp"
 #include "intel_gpu/plugin/program_builder.hpp"
 #include "intel_gpu/primitives/cum_sum.hpp"
 #include "openvino/core/validation_util.hpp"
diff --git a/src/plugins/intel_gpu/src/plugin/ops/custom.cpp b/src/plugins/intel_gpu/src/plugin/ops/custom.cpp
index c00b2c01a19de1..6c69d9ec66a8dc 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/custom.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/custom.cpp
@@ -6,7 +6,6 @@
 #include "openvino/core/node.hpp"
 
 #include "intel_gpu/plugin/program_builder.hpp"
-#include "intel_gpu/plugin/common_utils.hpp"
 #include "intel_gpu/plugin/simple_math.hpp"
 #include "intel_gpu/primitives/custom_gpu_primitive.hpp"
 #include "intel_gpu/primitives/reorder.hpp"
diff --git a/src/plugins/intel_gpu/src/plugin/ops/dft.cpp b/src/plugins/intel_gpu/src/plugin/ops/dft.cpp
index 46a1a28b0a5cf8..615217a1f17bd0 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/dft.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/dft.cpp
@@ -28,7 +28,7 @@ void createDft(ProgramBuilder& p,
     const auto layer_name = layer_type_name_ID(op);
     const auto& friendly_name = op->get_friendly_name();
 
-    if (op->is_dynamic() && p.use_new_shape_infer()) {
+    if (op->is_dynamic()) {
         std::vector<int64_t> axes;
         auto axes_constant = std::dynamic_pointer_cast<ov::op::v0::Constant>(op->get_input_node_shared_ptr(1));
         if (axes_constant != nullptr) {
diff --git a/src/plugins/intel_gpu/src/plugin/ops/eltwise.cpp b/src/plugins/intel_gpu/src/plugin/ops/eltwise.cpp
index ad0eb26c6e1cc0..314037570e1f65 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/eltwise.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/eltwise.cpp
@@ -4,11 +4,8 @@
 
 #include "intel_gpu/primitives/eltwise.hpp"
 
-#include "intel_gpu/plugin/common_utils.hpp"
 #include "intel_gpu/plugin/program_builder.hpp"
 #include "intel_gpu/primitives/activation.hpp"
-#include "intel_gpu/primitives/reorder.hpp"
-#include "intel_gpu/primitives/reshape.hpp"
 #include "openvino/op/add.hpp"
 #include "openvino/op/bitwise_and.hpp"
 #include "openvino/op/bitwise_or.hpp"
@@ -36,8 +33,9 @@
 #include "openvino/op/power.hpp"
 #include "openvino/op/squared_difference.hpp"
 #include "openvino/op/subtract.hpp"
-#include "openvino/op/xor.hpp"
 #include "transformations/utils/utils.hpp"
+#include "openvino/op/power.hpp"
+#include "openvino/op/floor_mod.hpp"
 
 namespace ov {
 namespace intel_gpu {
@@ -50,44 +48,6 @@ void CreateElementwiseOp(ProgramBuilder& p,
     auto inputs = p.GetInputInfo(op);
     std::string layerName = layer_type_name_ID(op);
 
-    auto out_pshape = op->get_output_partial_shape(0);
-    auto out_rank = out_pshape.size();
-    // New shape infer is supposed to work w/o extra reshapes/reorders
-    // So the code below must be removed once new shape infer is enabled
-    if (out_pshape.is_static() && !p.use_new_shape_infer()) {
-        for (size_t i = 0; i < inputs.size(); ++i) {
-            auto input_pshape = op->get_input_partial_shape(i);
-            auto input_rank = input_pshape.size();
-            if (input_rank != out_rank && input_pshape.is_static()) {
-                // Add reorder if changing number of dimensions requires changing format
-                auto targetFormat = cldnn::format::get_default_format(out_rank);
-                if (targetFormat.value != cldnn::format::get_default_format(input_rank).value) {
-                    auto reorderName = layerName + "_cldnn_in" + std::to_string(i) + "_reorder";
-                    auto targetDatatype = cldnn::element_type_to_data_type(op->get_input_element_type(i));
-                    auto reorderPrim = cldnn::reorder(reorderName,
-                                                    inputs[i],
-                                                    targetFormat,
-                                                    targetDatatype);
-
-                    p.add_primitive(*op, reorderPrim);
-                    inputs[i] = cldnn::input_info(reorderName);
-                }
-
-                auto reshapeName = layerName + "_cldnn_in" + std::to_string(i) + "_reshape";
-
-                // Extend input dimensions by prepending ones
-                input_pshape.insert(input_pshape.begin(), out_rank - input_rank, 1ul);
-
-                auto targetShape = tensor_from_dims(input_pshape.to_shape());
-
-                auto reshapePrim = cldnn::reshape(reshapeName, inputs[i], targetShape);
-                p.add_primitive(*op, reshapePrim);
-
-                inputs[i] = cldnn::input_info(reshapeName);
-            }
-        }
-    }
-
     auto out_dt = cldnn::element_type_to_data_type(op->get_output_element_type(0));
     auto eltwisePrim = cldnn::eltwise(layerName,
                                       inputs,
diff --git a/src/plugins/intel_gpu/src/plugin/ops/embedding_bag.cpp b/src/plugins/intel_gpu/src/plugin/ops/embedding_bag.cpp
index 74b9c1c0230c0f..07cb59fffd0fb1 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/embedding_bag.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/embedding_bag.cpp
@@ -32,34 +32,11 @@ static void CreateEmbeddingBagOffsetsSumOp(ProgramBuilder& p, const std::shared_
              OPENVINO_THROW("Unsupported parameter size in ", op->get_friendly_name(), " (", op->get_type_name(), ")");
 
         defaultIndex = static_cast<int32_t>(val);
-        inputs.erase(inputs.begin() + 3); // Remove "default_index"
-    }
-
-    std::vector<cldnn::input_info> reordered_inputs;
-    reordered_inputs.resize(inputs.size());
-
-    for (size_t portIndex = 0; portIndex < inputs.size(); portIndex++) {
-        auto inputDataType = cldnn::element_type_to_data_type(op->get_input_element_type(portIndex));
-        if (((portIndex == 1) || (portIndex == 2)) && (inputDataType == cldnn::data_types::i64)) {
-            // GPU primitive supports only i32 data type for indices inputs,
-            // so we need additional reorders if they are provided as i64
-            auto reorderPrimName = inputs[portIndex].pid + "_" + op->get_friendly_name() + ProgramBuilder::m_preProcessTag;
-            auto targetFormat = cldnn::format::get_default_format(op->get_input_shape(portIndex).size());
-            auto preprocessPrim = cldnn::reorder(reorderPrimName,
-                                                 inputs[portIndex],
-                                                 targetFormat,
-                                                 cldnn::data_types::i32);
-            p.add_primitive(*op, preprocessPrim);
-            reordered_inputs[portIndex] = cldnn::input_info(reorderPrimName);
-        } else {
-            reordered_inputs[portIndex] = inputs[portIndex];
-        }
     }
 
     auto embeddingBagPrim = cldnn::embedding_bag(layerName,
-                                                 reordered_inputs,
+                                                 inputs,
                                                  cldnn::embedding_bag::offsets_sum,
-                                                 tensor_from_dims(op->get_output_shape(0)),
                                                  defaultIndex);
 
     p.add_primitive(*op, embeddingBagPrim);
@@ -70,31 +47,9 @@ static void CreateEmbeddingBagPackedSumOp(ProgramBuilder& p, const std::shared_p
     auto inputs = p.GetInputInfo(op);
     std::string layerName = layer_type_name_ID(op);
 
-    std::vector<cldnn::input_info> reordered_inputs;
-    reordered_inputs.resize(inputs.size());
-
-    for (size_t portIndex = 0; portIndex < inputs.size(); portIndex++) {
-        auto inputDataType = cldnn::element_type_to_data_type(op->get_input_element_type(portIndex));
-        if ((portIndex == 1) && (inputDataType == cldnn::data_types::i64)) {
-            // GPU primitive supports only i32 data type for indices input,
-            // so we need additional reorder if it's provided as i64
-            auto reorderPrimName = inputs[portIndex].pid + "_" + op->get_friendly_name() + ProgramBuilder::m_preProcessTag;
-            auto targetFormat = cldnn::format::get_default_format(op->get_input_shape(portIndex).size());
-            auto preprocessPrim = cldnn::reorder(reorderPrimName,
-                                                 inputs[portIndex],
-                                                 targetFormat,
-                                                 cldnn::data_types::i32);
-            p.add_primitive(*op, preprocessPrim);
-            reordered_inputs[portIndex] = cldnn::input_info(reorderPrimName);
-        } else {
-            reordered_inputs[portIndex] = inputs[portIndex];
-        }
-    }
-
     auto embeddingBagPrim = cldnn::embedding_bag(layerName,
-                                                 reordered_inputs,
+                                                 inputs,
                                                  cldnn::embedding_bag::packed_sum,
-                                                 tensor_from_dims(op->get_output_shape(0)),
                                                  -1);
 
     p.add_primitive(*op, embeddingBagPrim);
@@ -105,11 +60,8 @@ static void CreateEmbeddingSegmentsSumOp(ProgramBuilder& p, const std::shared_pt
     auto inputs = p.GetInputInfo(op);
     std::string layerName = layer_type_name_ID(op);
 
-    inputs.erase(inputs.begin() + 3); // Remove "num_segments"
-
     int32_t defaultIndex = -1;
-    // port of default_index is 4 by default, but we removed "num_segments" above, so now it's equal to 3
-    if (inputs.size() > 3) {
+    if (op->get_input_size() > 4) {
         auto index_node = std::dynamic_pointer_cast<ov::op::v0::Constant>(op->get_input_node_shared_ptr(4));
         OPENVINO_ASSERT(index_node != nullptr, "[GPU] Unsupported parameter nodes type in ", op->get_friendly_name(), " (", op->get_type_name(), ")");
 
@@ -118,34 +70,11 @@ static void CreateEmbeddingSegmentsSumOp(ProgramBuilder& p, const std::shared_pt
             OPENVINO_THROW("Unsupported parameter size in ", op->get_friendly_name(), " (", op->get_type_name(), ")");
 
         defaultIndex = static_cast<int32_t>(val);
-        inputs.erase(inputs.begin() + 3); // Remove "default_index"
-    }
-
-    std::vector<cldnn::input_info> reordered_inputs;
-    reordered_inputs.resize(inputs.size());
-
-    for (size_t portIndex = 0; portIndex < inputs.size(); portIndex++) {
-        auto inputDataType = cldnn::element_type_to_data_type(op->get_input_element_type(portIndex));
-        if (((portIndex == 1) || (portIndex == 2)) && (inputDataType == cldnn::data_types::i64)) {
-            // GPU primitive supports only i32 data type for indices inputs,
-            // so we need additional reorders if they are provided as i64
-            auto reorderPrimName = inputs[portIndex].pid + "_" + op->get_friendly_name() + ProgramBuilder::m_preProcessTag;
-            auto targetFormat = cldnn::format::get_default_format(op->get_input_shape(portIndex).size());
-            auto preprocessPrim = cldnn::reorder(reorderPrimName,
-                                                 inputs[portIndex],
-                                                 targetFormat,
-                                                 cldnn::data_types::i32);
-            p.add_primitive(*op, preprocessPrim);
-            reordered_inputs[portIndex] = cldnn::input_info(reorderPrimName);
-        } else {
-            reordered_inputs[portIndex] = inputs[portIndex];
-        }
     }
 
     auto embeddingBagPrim = cldnn::embedding_bag(layerName,
-                                                 reordered_inputs,
+                                                 inputs,
                                                  cldnn::embedding_bag::segments_sum,
-                                                 tensor_from_dims(op->get_output_shape(0)),
                                                  defaultIndex);
 
     p.add_primitive(*op, embeddingBagPrim);
diff --git a/src/plugins/intel_gpu/src/plugin/ops/experimental_detectron_detection_output.cpp b/src/plugins/intel_gpu/src/plugin/ops/experimental_detectron_detection_output.cpp
index 853e86a0a1cf3e..cb27a5bc4acc70 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/experimental_detectron_detection_output.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/experimental_detectron_detection_output.cpp
@@ -7,7 +7,6 @@
 #include "intel_gpu/plugin/common_utils.hpp"
 #include "intel_gpu/plugin/program_builder.hpp"
 #include "intel_gpu/primitives/experimental_detectron_detection_output.hpp"
-#include "intel_gpu/primitives/mutable_data.hpp"
 
 namespace ov {
 namespace intel_gpu {
@@ -25,83 +24,23 @@ static void CreateExperimentalDetectronDetectionOutputOp(
 
     const auto& attrs = op->get_attrs();
 
-    if (p.use_new_shape_infer()) {
-        cldnn::experimental_detectron_detection_output prim{layer_type_name_ID(op),
-                                                            inputs[0],
-                                                            inputs[1],
-                                                            inputs[2],
-                                                            inputs[3],
-                                                            attrs.score_threshold,
-                                                            attrs.nms_threshold,
-                                                            static_cast<int>(attrs.num_classes),
-                                                            static_cast<int>(attrs.post_nms_count),
-                                                            static_cast<int>(attrs.max_detections_per_image),
-                                                            attrs.class_agnostic_box_regression,
-                                                            attrs.max_delta_log_wh,
-                                                            attrs.deltas_weights};
-        prim.num_outputs = op->get_output_size();
-        prim.output_data_types = get_output_data_types(op, {{ov::element::i64, ov::element::i32}});
-
-        p.add_primitive(*op, prim);
-    } else {
-        const auto layer_type_name = layer_type_name_ID(op);
-        const auto layer_name = layer_type_name + ".out0";
-
-        const auto mutable_precision1 = op->get_output_element_type(1);
-        const auto output_shape1 = op->get_output_shape(1);
-        const cldnn::layout mutable_layout1{cldnn::element_type_to_data_type(mutable_precision1),
-                                            cldnn::format::get_default_format(output_shape1.size()),
-                                            tensor_from_dims(output_shape1)};
-        cldnn::memory::ptr shared_memory1{p.get_engine().allocate_memory(mutable_layout1)};
-
-        const auto mutable_id_w1 = layer_type_name + "_md_write.1";
-        const cldnn::mutable_data mutable_prim_w{mutable_id_w1, shared_memory1};
-        p.add_primitive(*op, mutable_prim_w);
-        inputs.push_back(cldnn::input_info(mutable_id_w1));
-
-        const auto mutable_precision2 = op->get_output_element_type(2);
-        const auto output_shape2 = op->get_output_shape(2);
-        const cldnn::layout mutable_layout2{cldnn::element_type_to_data_type(mutable_precision2),
-                                            cldnn::format::get_default_format(output_shape2.size()),
-                                            tensor_from_dims(output_shape2)};
-        cldnn::memory::ptr shared_memory2{p.get_engine().allocate_memory(mutable_layout2)};
-
-        const auto mutable_id_w2 = layer_type_name + "_md_write.2";
-        const cldnn::mutable_data mutable_prim_w2{mutable_id_w2, shared_memory2};
-        p.add_primitive(*op, mutable_prim_w2);
-        inputs.push_back(cldnn::input_info(mutable_id_w2));
-
-        const auto expectedPrimInputCount = 4 + 2; // 4 operation inputs plus 2 input-outputs
-        if (inputs.size() != expectedPrimInputCount) {
-            OPENVINO_THROW("experimental_detectron_detection_output primitive requires 6 inputs");
-        }
-
-        const cldnn::experimental_detectron_detection_output prim{layer_name,
-                                                                inputs[0],
-                                                                inputs[1],
-                                                                inputs[2],
-                                                                inputs[3],
-                                                                inputs[4],  // output classes
-                                                                inputs[5],  // output scores
-                                                                attrs.score_threshold,
-                                                                attrs.nms_threshold,
-                                                                static_cast<int>(attrs.num_classes),
-                                                                static_cast<int>(attrs.post_nms_count),
-                                                                static_cast<int>(attrs.max_detections_per_image),
-                                                                attrs.class_agnostic_box_regression,
-                                                                attrs.max_delta_log_wh,
-                                                                attrs.deltas_weights};
-
-        p.add_primitive(*op, prim);
-
-        const auto mutable_id_r1 = layer_type_name + ".out1";
-        const cldnn::mutable_data mutable_prim_r1{mutable_id_r1, {cldnn::input_info(layer_name)}, shared_memory1};
-        p.add_primitive(*op, mutable_prim_r1);
-
-        const auto mutable_id_r2 = layer_type_name + ".out2";
-        const cldnn::mutable_data mutable_prim_r2{mutable_id_r2, {cldnn::input_info(layer_name)}, shared_memory2};
-        p.add_primitive(*op, mutable_prim_r2);
-    }
+    cldnn::experimental_detectron_detection_output prim{layer_type_name_ID(op),
+                                                        inputs[0],
+                                                        inputs[1],
+                                                        inputs[2],
+                                                        inputs[3],
+                                                        attrs.score_threshold,
+                                                        attrs.nms_threshold,
+                                                        static_cast<int>(attrs.num_classes),
+                                                        static_cast<int>(attrs.post_nms_count),
+                                                        static_cast<int>(attrs.max_detections_per_image),
+                                                        attrs.class_agnostic_box_regression,
+                                                        attrs.max_delta_log_wh,
+                                                        attrs.deltas_weights};
+    prim.num_outputs = op->get_output_size();
+    prim.output_data_types = get_output_data_types(op, {{ov::element::i64, ov::element::i32}});
+
+    p.add_primitive(*op, prim);
 }
 
 REGISTER_FACTORY_IMPL(v6, ExperimentalDetectronDetectionOutput);
diff --git a/src/plugins/intel_gpu/src/plugin/ops/experimental_detectron_generate_proposals_single_image.cpp b/src/plugins/intel_gpu/src/plugin/ops/experimental_detectron_generate_proposals_single_image.cpp
index b386b08feb6652..73670064c06d32 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/experimental_detectron_generate_proposals_single_image.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/experimental_detectron_generate_proposals_single_image.cpp
@@ -7,7 +7,6 @@
 
 #include "openvino/op/experimental_detectron_generate_proposals.hpp"
 
-#include "intel_gpu/primitives/mutable_data.hpp"
 #include "intel_gpu/primitives/experimental_detectron_generate_proposals_single_image.hpp"
 
 namespace ov {
@@ -25,41 +24,14 @@ static void CreateExperimentalDetectronGenerateProposalsSingleImageOp(
 
     const auto& attrs = op->get_attrs();
 
-    if (p.use_new_shape_infer()) {
-        cldnn::experimental_detectron_generate_proposals_single_image prim{layer_type_name_ID(op),
+    cldnn::experimental_detectron_generate_proposals_single_image prim{layer_type_name_ID(op),
                              inputs[0], inputs[1], inputs[2], inputs[3],
                              attrs.min_size, attrs.nms_threshold, attrs.pre_nms_count, attrs.post_nms_count};
 
-        prim.num_outputs = op->get_output_size();
-        prim.output_data_types = get_output_data_types(op, {{ov::element::i64, ov::element::i32}});
+    prim.num_outputs = op->get_output_size();
+    prim.output_data_types = get_output_data_types(op, {{ov::element::i64, ov::element::i32}});
 
-        p.add_primitive(*op, prim);
-    } else {
-        const auto layer_type_name = layer_type_name_ID(op);
-        const auto layer_name = layer_type_name + ".out0";
-
-        const auto mutable_precision = op->get_output_element_type(1);
-        const auto output_shape = op->get_output_shape(1);
-        const cldnn::layout mutable_layout{cldnn::element_type_to_data_type(mutable_precision),
-                                        cldnn::format::get_default_format(output_shape.size()),
-                                        tensor_from_dims(output_shape)};
-        cldnn::memory::ptr shared_memory{p.get_engine().allocate_memory(mutable_layout)};
-
-        const auto mutable_id_w = layer_type_name + "_md_write";
-        const cldnn::mutable_data mutable_prim_w{mutable_id_w, shared_memory};
-        p.add_primitive(*op, mutable_prim_w);
-        inputs.push_back(cldnn::input_info(mutable_id_w));
-
-        const cldnn::experimental_detectron_generate_proposals_single_image prim{layer_name,
-                                inputs[0], inputs[1], inputs[2], inputs[3], inputs.back(),
-                                attrs.min_size, attrs.nms_threshold, attrs.pre_nms_count, attrs.post_nms_count};
-
-        p.add_primitive(*op, prim);
-
-        const auto mutable_id_r = layer_type_name + ".out1";
-        const cldnn::mutable_data mutable_prim_r{mutable_id_r, {cldnn::input_info(layer_name)}, shared_memory};
-        p.add_primitive(*op, mutable_prim_r);
-    }
+    p.add_primitive(*op, prim);
 }
 
 REGISTER_FACTORY_IMPL(v6, ExperimentalDetectronGenerateProposalsSingleImage);
diff --git a/src/plugins/intel_gpu/src/plugin/ops/experimental_detectron_roi_feature_extractor.cpp b/src/plugins/intel_gpu/src/plugin/ops/experimental_detectron_roi_feature_extractor.cpp
index 371c51656e3496..f1405bba92ffd5 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/experimental_detectron_roi_feature_extractor.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/experimental_detectron_roi_feature_extractor.cpp
@@ -7,7 +7,6 @@
 
 #include "openvino/op/experimental_detectron_roi_feature.hpp"
 
-#include "intel_gpu/primitives/mutable_data.hpp"
 #include "intel_gpu/primitives/experimental_detectron_roi_feature_extractor.hpp"
 
 namespace ov {
@@ -16,49 +15,19 @@ namespace intel_gpu {
 static void CreateExperimentalDetectronROIFeatureExtractorOp(ProgramBuilder& p,
                                                              const std::shared_ptr<ov::op::v6::ExperimentalDetectronROIFeatureExtractor>& op) {
     auto inputs = p.GetInputInfo(op);
-    const ov::op::v6::ExperimentalDetectronROIFeatureExtractor::Attributes& operation_attributes = op->get_attrs();
-
-    if (p.use_new_shape_infer()) {
-        cldnn::experimental_detectron_roi_feature_extractor prim(layer_type_name_ID(op),
-                                                                 inputs,
-                                                                 operation_attributes.output_size,
-                                                                 operation_attributes.pyramid_scales,
-                                                                 operation_attributes.sampling_ratio,
-                                                                 operation_attributes.aligned);
-        prim.num_outputs = op->get_output_size();
-        prim.output_data_types = get_output_data_types(op, {{ov::element::i64, ov::element::i32}});
-
-        p.add_primitive(*op, prim);
-    } else {
-        std::string layerName = layer_type_name_ID(op) + ".out0";
 
-        cldnn::layout mutableLayout = cldnn::layout(
-            cldnn::element_type_to_data_type(op->get_output_element_type(1)),
-            cldnn::format::get_default_format(op->get_output_shape(1).size()),
-            tensor_from_dims(op->get_output_shape(1)));
-
-        cldnn::memory::ptr shared_memory {p.get_engine().allocate_memory(mutableLayout)};
-
-        cldnn::primitive_id experimental_detectron_mutable_id_w = layer_type_name_ID(op) + "_md_write";
-        cldnn::mutable_data experimenta_detectron_mutable_prim(experimental_detectron_mutable_id_w,
-                                                            shared_memory);
-        p.add_primitive(*op, experimenta_detectron_mutable_prim);
-        inputs.push_back(cldnn::input_info(experimental_detectron_mutable_id_w));
+    const ov::op::v6::ExperimentalDetectronROIFeatureExtractor::Attributes& operation_attributes = op->get_attrs();
 
-        cldnn::experimental_detectron_roi_feature_extractor experimentalDetectronPrim(layerName,
-                                                                                    inputs,
-                                                                                    operation_attributes.output_size,
-                                                                                    operation_attributes.pyramid_scales,
-                                                                                    operation_attributes.sampling_ratio,
-                                                                                    operation_attributes.aligned);
-        p.add_primitive(*op, experimentalDetectronPrim);
+    cldnn::experimental_detectron_roi_feature_extractor prim(layer_type_name_ID(op),
+                                                             inputs,
+                                                             operation_attributes.output_size,
+                                                             operation_attributes.pyramid_scales,
+                                                             operation_attributes.sampling_ratio,
+                                                             operation_attributes.aligned);
+    prim.num_outputs = op->get_output_size();
+    prim.output_data_types = get_output_data_types(op, {{ov::element::i64, ov::element::i32}});
 
-        cldnn::primitive_id experimental_detectron_mutable_id_r = layer_type_name_ID(op) + ".out1";
-        cldnn::mutable_data experimental_detectron_mutable_prim_r(experimental_detectron_mutable_id_r,
-                                                                {cldnn::input_info(layerName)},
-                                                                shared_memory);
-        p.add_primitive(*op, experimental_detectron_mutable_prim_r);
-    }
+    p.add_primitive(*op, prim);
 }
 
 REGISTER_FACTORY_IMPL(v6, ExperimentalDetectronROIFeatureExtractor);
diff --git a/src/plugins/intel_gpu/src/plugin/ops/extract_image_patches.cpp b/src/plugins/intel_gpu/src/plugin/ops/extract_image_patches.cpp
index 5a252bf70e48c6..d10a3186da2a7c 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/extract_image_patches.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/extract_image_patches.cpp
@@ -22,8 +22,7 @@ static void CreateExtractImagePatchesOp(ProgramBuilder& p, const std::shared_ptr
                                                                 op->get_sizes(),
                                                                 op->get_strides(),
                                                                 op->get_rates(),
-                                                                op->get_auto_pad(),
-                                                                tensor_from_dims(op->get_output_shape(0)));
+                                                                op->get_auto_pad());
 
     p.add_primitive(*op, extractImagePatchesPrim);
 }
diff --git a/src/plugins/intel_gpu/src/plugin/ops/eye.cpp b/src/plugins/intel_gpu/src/plugin/ops/eye.cpp
index 82f82ecca41715..0cc8d3ab5afebb 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/eye.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/eye.cpp
@@ -7,7 +7,6 @@
 
 #include <memory>
 
-#include "intel_gpu/plugin/common_utils.hpp"
 #include "intel_gpu/plugin/program_builder.hpp"
 #include "intel_gpu/primitives/eye.hpp"
 #include "intel_gpu/runtime/layout.hpp"
@@ -20,15 +19,6 @@ namespace {
 static void CreateEyeOp(ProgramBuilder& p, const std::shared_ptr<ov::op::v9::Eye>& op) {
     validate_inputs_count(op, {3, 4});
 
-    const ov::Shape& output_shapes = op->get_output_shape(0);
-    auto os_sz = output_shapes.size();
-    OPENVINO_ASSERT(2 <= os_sz && os_sz <= 5, "Incorrect output size: ", os_sz, " in op ", op->get_friendly_name());
-
-    size_t dim_size = std::max(os_sz, static_cast<size_t>(4));
-    ov::Shape dims(dim_size, 1);
-    for (size_t i = dim_size, j = os_sz; i > 0 && j > 0; --i, --j) {
-        dims[i - 1] = output_shapes[j - 1];
-    }
     const ov::op::v0::Constant* constant = dynamic_cast<ov::op::v0::Constant*>(op->get_input_node_ptr(2));
     OPENVINO_ASSERT(constant != nullptr, "Unsupported parameter nodes type in ", op->get_friendly_name(), " (", op->get_type_name(), ")");
 
@@ -45,10 +35,8 @@ static void CreateEyeOp(ProgramBuilder& p, const std::shared_ptr<ov::op::v9::Eye
         break;
     }
     auto input_info = p.GetInputInfo(op);
-    auto output_shape = tensor_from_dims(dims);
     auto eye_prim = cldnn::eye(layer_type_name_ID(op),
                                input_info,
-                               output_shape,
                                shift,
                                cldnn::element_type_to_data_type(op->get_out_type()));
 
diff --git a/src/plugins/intel_gpu/src/plugin/ops/fully_connected.cpp b/src/plugins/intel_gpu/src/plugin/ops/fully_connected.cpp
index 7c0c570f7cf54c..6af4becb3c73b7 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/fully_connected.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/fully_connected.cpp
@@ -3,15 +3,12 @@
 //
 
 #include "intel_gpu/plugin/program_builder.hpp"
-#include "intel_gpu/plugin/common_utils.hpp"
 
 #include "intel_gpu/op/fully_connected.hpp"
 #include "intel_gpu/op/fully_connected_compressed.hpp"
 #include "openvino/op/constant.hpp"
 
 #include "intel_gpu/primitives/fully_connected.hpp"
-#include "intel_gpu/primitives/reshape.hpp"
-#include "intel_gpu/primitives/reorder.hpp"
 
 namespace ov {
 namespace op {
@@ -94,34 +91,6 @@ static void CreateFullyConnectedOp(ProgramBuilder& p, const std::shared_ptr<op::
                                          rank_b);
 
     p.add_primitive(*op, fcPrim);
-
-    if (shape_a.size() > 3 && !p.use_new_shape_infer()) {
-        auto lastLayerName = layerName;
-        auto outReshapeName = layerName + "_cldnn_out_reshape";
-
-        // add reorder
-        auto outDims = op->get_output_shape(0);
-        auto outTensor = tensor_from_dims(outDims);
-
-        if (outDims.size() > 4) {
-            cldnn::format outputFormat = cldnn::format::bfyx;
-            switch (outDims.size()) {
-                case 5: outputFormat = cldnn::format::bfzyx; break;
-                case 6: outputFormat = cldnn::format::bfwzyx; break;
-                default: break;
-            }
-
-            cldnn::primitive_id reorderId = "reorder:" + outReshapeName + "_reorder";
-            cldnn::layout outputLayout(cldnn::element_type_to_data_type(op->get_output_element_type(0)), outputFormat, outTensor);
-            auto reorder_prim = cldnn::reorder(reorderId, cldnn::input_info(layerName), outputLayout);
-            p.add_primitive(*op, reorder_prim);
-            lastLayerName = reorderId;
-        }
-
-        // add reshape
-        auto outReshapePrim = cldnn::reshape(outReshapeName, cldnn::input_info(lastLayerName), outTensor);
-        p.add_primitive(*op, outReshapePrim);
-    }
 }
 
 REGISTER_FACTORY_IMPL(internal, FullyConnected);
diff --git a/src/plugins/intel_gpu/src/plugin/ops/gather.cpp b/src/plugins/intel_gpu/src/plugin/ops/gather.cpp
index e8d9236a7e6f6d..31458e54f760c5 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/gather.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/gather.cpp
@@ -34,27 +34,6 @@ void CreateGatherOpBase(ProgramBuilder& p, const std::shared_ptr<T>& op, const i
 
     int64_t axis = op->get_axis();
 
-    std::vector<cldnn::input_info> reordered_inputs;
-    reordered_inputs.resize(inputs.size());
-
-    for (size_t portIndex = 0; portIndex < inputs.size(); portIndex++) {
-        auto inputDataType = cldnn::element_type_to_data_type(op->get_input_element_type(portIndex));
-        if (inputDataType == cldnn::data_types::i64) {
-            // GPU primitive does not support i64 inputs,
-            // so we need additional reorders to convert them to i32
-            auto reorderPrimName = inputs[portIndex].pid + "_" + op->get_friendly_name() + ProgramBuilder::m_preProcessTag;
-            auto targetFormat = cldnn::format::get_default_format(op->get_input_partial_shape(portIndex).size());
-            auto preprocessPrim = cldnn::reorder(reorderPrimName,
-                                                 inputs[portIndex],
-                                                 targetFormat,
-                                                 cldnn::data_types::i32);
-            p.add_primitive(*op, preprocessPrim);
-            reordered_inputs[portIndex] = cldnn::input_info(reorderPrimName);
-        } else {
-            reordered_inputs[portIndex] = inputs[portIndex];
-        }
-    }
-
     // Dynamic path will do shape infer internally, so no need to pass valid out shape for that case
     bool is_static = op->get_output_partial_shape(0).is_static();
     ov::Shape out_shape = is_static ? op->get_output_shape(0) : ov::Shape{};
@@ -62,22 +41,6 @@ void CreateGatherOpBase(ProgramBuilder& p, const std::shared_ptr<T>& op, const i
     // Update output_shape in case of scalar indice
     bool need_reshape = false;
     auto out_shape_original = out_shape;
-    if (!p.use_new_shape_infer() && is_static) {
-        auto input1_shape = op->get_input_shape(1);
-        if (input1_shape.size() == 0 && batch_dim == 0) {
-            need_reshape = true;
-
-            auto new_axis = axis;
-            if (new_axis < 0) {
-                new_axis += op->get_input_shape(0).size();
-            }
-            out_shape.push_back(1);
-            for (int i = static_cast<int>(out_shape.size()) - 1; i > new_axis ; i--) {
-                out_shape[i] = out_shape[i-1];
-            }
-            out_shape[new_axis] = 1;
-        }
-    }
 
     // WA for NMS->Gather construction. NMS fills part of the output blob by the -1 if these values
     // must not be taken into account.
@@ -132,13 +95,13 @@ void CreateGatherOpBase(ProgramBuilder& p, const std::shared_ptr<T>& op, const i
 
         // Create Crop
         layerName = get_crop_layer_name(layerName, static_cast<size_t>(result));
-        auto cropPrim = cldnn::crop(layerName, reordered_inputs[0], outTensor, offsetTensor);
+        auto cropPrim = cldnn::crop(layerName, inputs[0], outTensor, offsetTensor);
         p.add_primitive(*op, cropPrim);
     } else {
         if (!weights_compressed) {
             auto gatherPrim = cldnn::gather(layerName,
-                                            reordered_inputs[0],
-                                            reordered_inputs[1],
+                                            inputs[0],
+                                            inputs[1],
                                             axis,
                                             input_rank,
                                             out_shape,
@@ -159,11 +122,11 @@ void CreateGatherOpBase(ProgramBuilder& p, const std::shared_ptr<T>& op, const i
             std::shared_ptr<ov::op::internal::GatherCompressed> op_compressed = std::dynamic_pointer_cast<ov::op::internal::GatherCompressed>(op);
 
             auto gatherPrim = cldnn::gather(layerName,
-                                            reordered_inputs[0],
-                                            reordered_inputs[1],
+                                            inputs[0],
+                                            inputs[1],
                                             axis,
-                                            reordered_inputs[3],
-                                            (has_scalar_zp || op->get_input_size() == 4) ? cldnn::input_info() : reordered_inputs[4],
+                                            inputs[3],
+                                            (has_scalar_zp || op->get_input_size() == 4) ? cldnn::input_info() : inputs[4],
                                             op_compressed->get_output_element_type(0),
                                             input_rank,
                                             out_shape,
diff --git a/src/plugins/intel_gpu/src/plugin/ops/gather_elements.cpp b/src/plugins/intel_gpu/src/plugin/ops/gather_elements.cpp
index 53156052cff052..334b979cbe9c15 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/gather_elements.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/gather_elements.cpp
@@ -25,18 +25,7 @@ static void CreateGatherElementsOp(ProgramBuilder& p, const std::shared_ptr<ov::
     OPENVINO_ASSERT(axis >= 0 && axis < static_cast<int64_t>(rank),
                     "GatherElements axis is not correspond to number of dimensions");
 
-    std::shared_ptr<cldnn::gather_elements> primitive = nullptr;
-    if (op->get_output_partial_shape(0).is_dynamic() || p.use_new_shape_infer()) {
-        primitive = std::make_shared<cldnn::gather_elements>(layerName, inputs[0], inputs[1], axis);
-    } else {
-        auto outLayout = cldnn::format::get_default_format(op->get_output_shape(0).size());
-        primitive = std::make_shared<cldnn::gather_elements>(layerName,
-                                                             inputs[0],
-                                                             inputs[1],
-                                                             outLayout,
-                                                             tensor_from_dims(op->get_output_shape(0)),
-                                                             axis);
-    }
+    auto primitive = std::make_shared<cldnn::gather_elements>(layerName, inputs[0], inputs[1], axis);
 
     p.add_primitive(*op, primitive);
 }
diff --git a/src/plugins/intel_gpu/src/plugin/ops/generate_proposals.cpp b/src/plugins/intel_gpu/src/plugin/ops/generate_proposals.cpp
index fe6c865cd14dd1..3637a990983de1 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/generate_proposals.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/generate_proposals.cpp
@@ -8,7 +8,6 @@
 
 #include "intel_gpu/plugin/common_utils.hpp"
 #include "intel_gpu/plugin/program_builder.hpp"
-#include "intel_gpu/primitives/mutable_data.hpp"
 
 namespace ov {
 namespace intel_gpu {
@@ -22,64 +21,12 @@ static void CreateGenerateProposalsIEInternalOp(
     }
 
     auto inputs = p.GetInputInfo(op);
-    const auto& attrs = op->get_attrs();
-    if (p.use_new_shape_infer()) {
-        cldnn::generate_proposals prim{layer_type_name_ID(op), inputs, op->get_attrs()};
+    cldnn::generate_proposals prim{layer_type_name_ID(op), inputs, op->get_attrs()};
 
-        prim.num_outputs = op->get_output_size();
-        prim.output_data_types = get_output_data_types(op, {{ov::element::i64, ov::element::i32}});
+    prim.num_outputs = op->get_output_size();
+    prim.output_data_types = get_output_data_types(op, {{ov::element::i64, ov::element::i32}});
 
-        p.add_primitive(*op, prim);
-    } else {
-        const auto layer_type_name = layer_type_name_ID(op);
-        const auto layer_name = layer_type_name + ".out0";
-
-        // output 2 - scores
-        const auto mutable_precision_1 = op->get_output_element_type(1);
-        const auto output_shape_1 = op->get_output_shape(1);
-        const cldnn::layout mutable_layout_1{cldnn::element_type_to_data_type(mutable_precision_1),
-                                            cldnn::format::get_default_format(output_shape_1.size()),
-                                            tensor_from_dims(output_shape_1)};
-        cldnn::memory::ptr shared_memory_1{p.get_engine().allocate_memory(mutable_layout_1)};
-
-        const auto mutable_id_w_1 = layer_type_name + "_md_write.1";
-        const cldnn::mutable_data mutable_prim_w_1{mutable_id_w_1, shared_memory_1};
-        p.add_primitive(*op, mutable_prim_w_1);
-        inputs.push_back(cldnn::input_info(mutable_id_w_1));
-
-        // output 3 - roisNum
-        const auto output_shape_2 = op->get_output_shape(2);
-        const auto mutable_precision_2 = op->get_output_element_type(2);
-        const cldnn::layout mutable_layout_2{cldnn::element_type_to_data_type(mutable_precision_2),
-                                            cldnn::format::get_default_format(output_shape_2.size()),
-                                            tensor_from_dims(output_shape_2)};
-        cldnn::memory::ptr shared_memory_2{p.get_engine().allocate_memory(mutable_layout_2)};
-
-        const auto mutable_id_w_2 = layer_type_name + "_md_write.2";
-        const cldnn::mutable_data mutable_prim_w_2{mutable_id_w_2, shared_memory_2};
-        p.add_primitive(*op, mutable_prim_w_2);
-        inputs.push_back(cldnn::input_info(mutable_id_w_2));
-
-        const cldnn::generate_proposals prim{layer_name,
-                                             inputs,
-                                             attrs.min_size,
-                                             attrs.nms_threshold,
-                                             attrs.pre_nms_count,
-                                             attrs.post_nms_count,
-                                             attrs.normalized,
-                                             attrs.nms_eta,
-                                             cldnn::element_type_to_data_type(op->get_roi_num_type())};
-
-        p.add_primitive(*op, prim);
-
-        const auto mutable_id_r_1 = layer_type_name + ".out1";
-        const cldnn::mutable_data mutable_prim_r_1{mutable_id_r_1, {cldnn::input_info(layer_name)}, shared_memory_1};
-        p.add_primitive(*op, mutable_prim_r_1);
-
-        const auto mutable_id_r_2 = layer_type_name + ".out2";
-        const cldnn::mutable_data mutable_prim_r_2{mutable_id_r_2, {cldnn::input_info(layer_name)}, shared_memory_2};
-        p.add_primitive(*op, mutable_prim_r_2);
-    }
+    p.add_primitive(*op, prim);
 }
 
 REGISTER_FACTORY_IMPL(internal, GenerateProposalsIEInternal);
diff --git a/src/plugins/intel_gpu/src/plugin/ops/interpolate.cpp b/src/plugins/intel_gpu/src/plugin/ops/interpolate.cpp
index 9ed7136c83e615..c1b69e64661586 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/interpolate.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/interpolate.cpp
@@ -92,54 +92,36 @@ static void CreateInterpolateOp(ProgramBuilder& p, const std::shared_ptr<ov::op:
     ValidateAxesAndThrowIfError(op, axes);
 
     std::shared_ptr<cldnn::resample> resamplePrim = nullptr;
-    if (p.use_new_shape_infer()) {
-        if (sizes_constant && scales_constant) {
-            resamplePrim = std::make_shared<cldnn::resample>(layerName,
-                                                             inputs[0],
-                                                             sizes,
-                                                             scales,
-                                                             axes,
-                                                             attrs.pads_begin,
-                                                             attrs.pads_end,
-                                                             attrs.antialias,
-                                                             attrs.cube_coeff,
-                                                             attrs.mode,
-                                                             attrs.shape_calculation_mode,
-                                                             attrs.coordinate_transformation_mode,
-                                                             attrs.nearest_mode);
-        } else {
-            resamplePrim = std::make_shared<cldnn::resample>(layerName,
-                                                             inputs[0],
-                                                             inputs[SIZES_INDEX],
-                                                             inputs[SCALES_INDEX],
-                                                             axes,
-                                                             attrs.pads_begin,
-                                                             attrs.pads_end,
-                                                             attrs.antialias,
-                                                             attrs.cube_coeff,
-                                                             attrs.mode,
-                                                             attrs.shape_calculation_mode,
-                                                             attrs.coordinate_transformation_mode,
-                                                             attrs.nearest_mode);
-        }
+    if (sizes_constant && scales_constant) {
+        resamplePrim = std::make_shared<cldnn::resample>(layerName,
+                                                            inputs[0],
+                                                            sizes,
+                                                            scales,
+                                                            axes,
+                                                            attrs.pads_begin,
+                                                            attrs.pads_end,
+                                                            attrs.antialias,
+                                                            attrs.cube_coeff,
+                                                            attrs.mode,
+                                                            attrs.shape_calculation_mode,
+                                                            attrs.coordinate_transformation_mode,
+                                                            attrs.nearest_mode);
     } else {
-        auto outShape = op->get_output_shape(0);
-        auto outputPattern = std::vector<int64_t>(outShape.begin(), outShape.end());
-
         resamplePrim = std::make_shared<cldnn::resample>(layerName,
-                                                         inputs[0],
-                                                         outputPattern,
-                                                         scales,
-                                                         axes,
-                                                         attrs.pads_begin,
-                                                         attrs.pads_end,
-                                                         attrs.antialias,
-                                                         attrs.cube_coeff,
-                                                         attrs.mode,
-                                                         attrs.shape_calculation_mode,
-                                                         attrs.coordinate_transformation_mode,
-                                                         attrs.nearest_mode);
+                                                            inputs[0],
+                                                            inputs[SIZES_INDEX],
+                                                            inputs[SCALES_INDEX],
+                                                            axes,
+                                                            attrs.pads_begin,
+                                                            attrs.pads_end,
+                                                            attrs.antialias,
+                                                            attrs.cube_coeff,
+                                                            attrs.mode,
+                                                            attrs.shape_calculation_mode,
+                                                            attrs.coordinate_transformation_mode,
+                                                            attrs.nearest_mode);
     }
+
     p.add_primitive(*op, resamplePrim);
 }
 
@@ -172,55 +154,37 @@ static void CreateInterpolateOp(ProgramBuilder& p, const std::shared_ptr<ov::op:
     ValidateAxesAndThrowIfError(op, axes);
 
     std::shared_ptr<cldnn::resample> resamplePrim = nullptr;
-    if (p.use_new_shape_infer()) {
-        if (scales_or_sizes_constant) {
-            resamplePrim = std::make_shared<cldnn::resample>(layerName,
-                                                             inputs[0],
-                                                             sizes,
-                                                             scales,
-                                                             axes,
-                                                             attrs.pads_begin,
-                                                             attrs.pads_end,
-                                                             attrs.antialias,
-                                                             attrs.cube_coeff,
-                                                             attrs.mode,
-                                                             attrs.shape_calculation_mode,
-                                                             attrs.coordinate_transformation_mode,
-                                                             attrs.nearest_mode);
-        } else {
-            resamplePrim = std::make_shared<cldnn::resample>(layerName,
-                                                             inputs[0],
-                                                             inputs[eScalesOrSizesIndex],
-                                                             inputs[eAxesIndex],
-                                                             axes,
-                                                             attrs.pads_begin,
-                                                             attrs.pads_end,
-                                                             attrs.antialias,
-                                                             attrs.cube_coeff,
-                                                             attrs.mode,
-                                                             attrs.shape_calculation_mode,
-                                                             attrs.coordinate_transformation_mode,
-                                                             attrs.nearest_mode,
-                                                             1);
-        }
+    if (scales_or_sizes_constant) {
+        resamplePrim = std::make_shared<cldnn::resample>(layerName,
+                                                            inputs[0],
+                                                            sizes,
+                                                            scales,
+                                                            axes,
+                                                            attrs.pads_begin,
+                                                            attrs.pads_end,
+                                                            attrs.antialias,
+                                                            attrs.cube_coeff,
+                                                            attrs.mode,
+                                                            attrs.shape_calculation_mode,
+                                                            attrs.coordinate_transformation_mode,
+                                                            attrs.nearest_mode);
     } else {
-        auto outShape = op->get_output_shape(0);
-        auto outputPattern = std::vector<int64_t>(outShape.begin(), outShape.end());
-
         resamplePrim = std::make_shared<cldnn::resample>(layerName,
-                                                         inputs[0],
-                                                         outputPattern,
-                                                         scales,
-                                                         axes,
-                                                         attrs.pads_begin,
-                                                         attrs.pads_end,
-                                                         attrs.antialias,
-                                                         attrs.cube_coeff,
-                                                         attrs.mode,
-                                                         attrs.shape_calculation_mode,
-                                                         attrs.coordinate_transformation_mode,
-                                                         attrs.nearest_mode);
+                                                            inputs[0],
+                                                            inputs[eScalesOrSizesIndex],
+                                                            inputs[eAxesIndex],
+                                                            axes,
+                                                            attrs.pads_begin,
+                                                            attrs.pads_end,
+                                                            attrs.antialias,
+                                                            attrs.cube_coeff,
+                                                            attrs.mode,
+                                                            attrs.shape_calculation_mode,
+                                                            attrs.coordinate_transformation_mode,
+                                                            attrs.nearest_mode,
+                                                            1);
     }
+
     p.add_primitive(*op, resamplePrim);
 }
 
diff --git a/src/plugins/intel_gpu/src/plugin/ops/loop.cpp b/src/plugins/intel_gpu/src/plugin/ops/loop.cpp
index bb11308064f7e7..c00e70ab2f85bd 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/loop.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/loop.cpp
@@ -41,18 +41,6 @@ static DATA_TYPE CreateScalarData(ProgramBuilder &p, const cldnn::primitive_id&
     return {id, mem};
 }
 
-static cldnn::mutable_data CreateAdditionalOutputData(ProgramBuilder &p, const std::shared_ptr<ov::Node>& op,
-                                                        const cldnn::primitive_id& id, const cldnn::primitive_id& input,
-                                                        const int32_t output_idx) {
-    const auto precision = cldnn::element_type_to_data_type(op->get_output_element_type(output_idx));
-    const auto format = cldnn::format::get_default_format(op->get_output_shape(output_idx).size());
-    const auto tensor = tensor_from_dims(op->get_output_shape(output_idx));
-    cldnn::layout output_layout = cldnn::layout(precision, format, tensor);
-    auto mem = p.get_engine().allocate_memory(output_layout);
-    auto md = cldnn::mutable_data(id, {cldnn::input_info(input)}, std::move(mem)); // cldnn::data cannot set dependency
-    return md;
-}
-
 static void SetLoopInputOutputMap(ProgramBuilder& p,
                                     const std::shared_ptr<ov::op::util::SubGraphOp>& op,
                                     cldnn::primitive::input_info_arr& inputs,
@@ -65,8 +53,6 @@ static void SetLoopInputOutputMap(ProgramBuilder& p,
     const auto& body_inputs = op->get_function()->get_parameters();
     const auto& body_outputs = op->get_function()->get_results();
 
-    bool use_new_shape_infer = p.use_new_shape_infer();
-
     // set input mapping & back edges
     for (const auto& loop_input_desc : loop_input_descs) {
         auto external_id = inputs.at(loop_input_desc->m_input_index);
@@ -108,72 +94,30 @@ static void SetLoopInputOutputMap(ProgramBuilder& p,
     }
 
     // set output mapping
-    if (use_new_shape_infer) {
-        for (const auto& loop_output_desc : loop_output_descs) {
-            cldnn::input_info external_input_info(layerName, loop_output_desc->m_output_index);
-            p.primitive_ids[layerName] = layerName;
-
-            const auto& body_output = body_outputs.at(loop_output_desc->m_body_value_index);
-            cldnn::primitive_id internal_id = layer_type_name_ID(body_output);
-
-            // update primitive_map
-            if (const auto& concatOutput =
-                std::dynamic_pointer_cast<ov::op::util::MultiSubGraphOp::ConcatOutputDescription>(loop_output_desc)) {
-                // output which requires concatenation
-                output_primitive_maps.emplace_back(external_input_info, internal_id, concatOutput->m_axis,
-                    concatOutput->m_start, concatOutput->m_end, concatOutput->m_stride);
-                GPU_DEBUG_LOG << "loop_output_descs[" << layerName << "][ConcatOutputDescription] external:"
-                        << external_input_info << ", internal:"
-                        << internal_id << "(axis, start, end, stride)={"
-                        << concatOutput->m_axis << "," << concatOutput->m_start << ","
-                        << concatOutput->m_end << "," << concatOutput->m_stride << "}" << std::endl;
-            }
-            if (std::dynamic_pointer_cast<ov::op::util::MultiSubGraphOp::BodyOutputDescription>(loop_output_desc)) {
-                // output which requires no concatenation
-                output_primitive_maps.emplace_back(external_input_info, internal_id);
-                GPU_DEBUG_LOG << "loop_output_descs[" << layerName << "][BodyOutputDescription] external:"
-                        << external_input_info << ", internal:" << internal_id << std::endl;
-            }
+    for (const auto& loop_output_desc : loop_output_descs) {
+        cldnn::input_info external_input_info(layerName, loop_output_desc->m_output_index);
+        p.primitive_ids[layerName] = layerName;
+
+        const auto& body_output = body_outputs.at(loop_output_desc->m_body_value_index);
+        cldnn::primitive_id internal_id = layer_type_name_ID(body_output);
+
+        // update primitive_map
+        if (const auto& concatOutput =
+            std::dynamic_pointer_cast<ov::op::util::MultiSubGraphOp::ConcatOutputDescription>(loop_output_desc)) {
+            // output which requires concatenation
+            output_primitive_maps.emplace_back(external_input_info, internal_id, concatOutput->m_axis,
+                concatOutput->m_start, concatOutput->m_end, concatOutput->m_stride);
+            GPU_DEBUG_LOG << "loop_output_descs[" << layerName << "][ConcatOutputDescription] external:"
+                    << external_input_info << ", internal:"
+                    << internal_id << "(axis, start, end, stride)={"
+                    << concatOutput->m_axis << "," << concatOutput->m_start << ","
+                    << concatOutput->m_end << "," << concatOutput->m_stride << "}" << std::endl;
         }
-    } else {
-        for (const auto& loop_output_desc : loop_output_descs) {
-            const uint64_t output_idx = loop_output_desc->m_output_index;
-
-            // Add additional mutable_data for multiple outputs
-            // primitive ID should be <TI primitive ID>.<output_idx> if output_idx > 0
-            // otherwise primitive ID should be equals to TI primitive ID
-            const std::string layerNameWithIndex = layerName + ".out" + std::to_string(output_idx);
-            std::string external_id;
-            if (output_idx > 0) {
-                cldnn::mutable_data output_data = CreateAdditionalOutputData(p, op, layerNameWithIndex, layerName, output_idx);
-                p.add_primitive(*op, std::move(output_data));
-                external_id = layerNameWithIndex;
-            } else {
-                p.primitive_ids[layerNameWithIndex] = layerName;
-                p.primitive_ids[layerName] = layerName;
-                external_id = layerName;
-            }
-            const auto& body_output = body_outputs.at(loop_output_desc->m_body_value_index);
-            cldnn::primitive_id internal_id = layer_type_name_ID(body_output);
-
-            // update primitive_map
-            if (const auto& concatOutput =
-                std::dynamic_pointer_cast<ov::op::util::MultiSubGraphOp::ConcatOutputDescription>(loop_output_desc)) {
-                // output which requires concatenation
-                output_primitive_maps.emplace_back(external_id, internal_id, concatOutput->m_axis,
-                    concatOutput->m_start, concatOutput->m_end, concatOutput->m_stride);
-                GPU_DEBUG_LOG << "loop_output_descs[" << layerName << "][ConcatOutputDescription] external:"
-                        << external_id << ", internal:"
-                        << internal_id << "(axis, start, end, stride)={"
-                        << concatOutput->m_axis << "," << concatOutput->m_start << ","
-                        << concatOutput->m_end << "," << concatOutput->m_stride << "}" << std::endl;
-            }
-            if (std::dynamic_pointer_cast<ov::op::util::MultiSubGraphOp::BodyOutputDescription>(loop_output_desc)) {
-                // output which requires no concatenation
-                output_primitive_maps.emplace_back(external_id, internal_id);
-                GPU_DEBUG_LOG << "loop_output_descs[" << layerName << "][BodyOutputDescription] external:"
-                        << external_id << ", internal:" << internal_id << std::endl;
-            }
+        if (std::dynamic_pointer_cast<ov::op::util::MultiSubGraphOp::BodyOutputDescription>(loop_output_desc)) {
+            // output which requires no concatenation
+            output_primitive_maps.emplace_back(external_input_info, internal_id);
+            GPU_DEBUG_LOG << "loop_output_descs[" << layerName << "][BodyOutputDescription] external:"
+                    << external_input_info << ", internal:" << internal_id << std::endl;
         }
     }
 }
@@ -208,11 +152,10 @@ static std::vector<cldnn::primitive_id> GetOutputNames(const cldnn::primitive_id
 static void CreateCommonLoopOp(ProgramBuilder& p, const std::shared_ptr<ov::op::util::SubGraphOp>& op, bool is_loop_op) {
     const std::string layerName = layer_type_name_ID(op);
     auto inputs = p.GetInputInfo(op);
-    bool is_dynamic = p.use_new_shape_infer() || op->is_dynamic();
 
     int64_t num_iterations = op->get_num_iterations();
 
-    auto num_outputs = is_dynamic? op->get_output_size() : 1;
+    auto num_outputs = op->get_output_size();
     auto ov_model = op->get_function();
 
     // Set special body ports: current_iteration input , execution condition output
@@ -252,16 +195,11 @@ static void CreateCommonLoopOp(ProgramBuilder& p, const std::shared_ptr<ov::op::
 
     SetLoopInputOutputMap(p, op, inputs, input_primitive_maps, output_primitive_maps, back_edges);
 
-    auto shape = is_dynamic? ov::Shape{} : ov::Shape{1, 1, 1, 1};
-    if (!is_dynamic) {
-        for (size_t i = 4; i < op->get_output_shape(0).size(); ++i) {
-            shape.push_back(1);
-        }
-    }
+    auto shape = ov::Shape{};
     auto prec = ov::element::i64;
     if (current_iteration_input_op) {
         OPENVINO_ASSERT(current_iteration_input_op->get_partial_shape().is_static(), "current_iteration should be static layout");
-        shape = is_dynamic? current_iteration_input_op->get_partial_shape().to_shape() : shape;
+        shape = current_iteration_input_op->get_partial_shape().to_shape();
         prec = current_iteration_input_op->get_element_type();
 
         auto increment_value_id = current_iteration_input_op->get_friendly_name() + "_inc";
@@ -301,7 +239,6 @@ static void CreateCommonLoopOp(ProgramBuilder& p, const std::shared_ptr<ov::op::
     auto config = p.get_config();
     config.set_property(ov::intel_gpu::custom_outputs(output_names_vec));
     config.set_property(ov::intel_gpu::max_dynamic_batch(1));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(is_dynamic));
 
     // get body program from ov::Model
     ProgramBuilder prog(ov_model, p.get_engine(), config, false, p.get_task_executor(), p.get_compilation_context(), true);
diff --git a/src/plugins/intel_gpu/src/plugin/ops/matmul.cpp b/src/plugins/intel_gpu/src/plugin/ops/matmul.cpp
index 9cbbe179173915..8bb0ab94b31811 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/matmul.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/matmul.cpp
@@ -8,15 +8,10 @@
 #include "intel_gpu/plugin/common_utils.hpp"
 
 #include "openvino/op/matmul.hpp"
-#include "openvino/op/constant.hpp"
-#include "openvino/op/fake_quantize.hpp"
 #include "intel_gpu/op/gemm.hpp"
 #include "intel_gpu/op/indirect_gemm.hpp"
 
 #include "intel_gpu/primitives/gemm.hpp"
-#include "intel_gpu/primitives/fully_connected.hpp"
-#include "intel_gpu/primitives/reshape.hpp"
-#include "intel_gpu/primitives/reorder.hpp"
 #include "intel_gpu/primitives/permute.hpp"
 
 namespace ov {
@@ -130,18 +125,6 @@ static void CreateMatMulOp(ProgramBuilder& p, const std::shared_ptr<ov::op::v0::
                                 rank_b);
 
     p.add_primitive(*op, gemmPrim);
-
-    if (!p.use_new_shape_infer()) {
-        auto outDims = op->get_output_shape(0);
-        auto outDimsN = outDims.size();
-        // Reshape output if gemm specific shape does not match default one
-        if (outDimsN < 4) {
-            auto outputShape = tensor_from_dims(outDims);
-            auto outReshapeName = layerName + "_cldnn_out_reshape";
-            auto outReshapePrim = cldnn::reshape(outReshapeName, cldnn::input_info(layerName), outputShape);
-            p.add_primitive(*op, outReshapePrim);
-        }
-    }
 }
 
 static void CreateGemmOp(ProgramBuilder& p, const std::shared_ptr<ov::op::internal::Gemm>& op) {
@@ -174,18 +157,6 @@ static void CreateGemmOp(ProgramBuilder& p, const std::shared_ptr<ov::op::intern
                                 beta);
 
     p.add_primitive(*op, gemmPrim);
-
-    if (!p.use_new_shape_infer()) {
-        auto outDims = op->get_output_shape(0);
-        auto outDimsN = outDims.size();
-        // Reshape output if gemm specific shape does not match default one
-        if (outDimsN < 4) {
-            auto outputShape = tensor_from_dims(outDims);
-            auto outReshapeName = layerName + "_cldnn_out_reshape";
-            auto outReshapePrim = cldnn::reshape(outReshapeName, cldnn::input_info(layerName), outputShape);
-            p.add_primitive(*op, outReshapePrim);
-        }
-    }
 }
 
 static void CreateIndirectGemmOp(ProgramBuilder& p, const std::shared_ptr<ov::intel_gpu::op::IndirectGemm>& op) {
diff --git a/src/plugins/intel_gpu/src/plugin/ops/matrix_nms.cpp b/src/plugins/intel_gpu/src/plugin/ops/matrix_nms.cpp
index a2bd947c074170..dfcb77b92b97e3 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/matrix_nms.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/matrix_nms.cpp
@@ -7,7 +7,6 @@
 
 #include "intel_gpu/plugin/common_utils.hpp"
 #include "intel_gpu/plugin/program_builder.hpp"
-#include "intel_gpu/primitives/mutable_data.hpp"
 #include "ov_ops/nms_static_shape_ie.hpp"
 
 #include <memory>
@@ -27,60 +26,12 @@ namespace {
 void CreateNmsStaticShapeIE8Op(ProgramBuilder& p, const std::shared_ptr<ov::op::internal::NmsStaticShapeIE8>& op) {
     validate_inputs_count(op, {2});
     auto inputs = p.GetInputInfo(op);
-    if (p.use_new_shape_infer()) {
-        auto prim = cldnn::matrix_nms(layer_type_name_ID(op), inputs[0], inputs[1], op->get_attrs());
-        prim.num_outputs = op->get_output_size();
-        prim.output_data_types = get_output_data_types(op, {{ov::element::i64, ov::element::i32}});
 
-        p.add_primitive(*op, prim);
-    } else {
-        std::vector<cldnn::memory::ptr> shared_memory;
+    auto prim = cldnn::matrix_nms(layer_type_name_ID(op), inputs[0], inputs[1], op->get_attrs());
+    prim.num_outputs = op->get_output_size();
+    prim.output_data_types = get_output_data_types(op, {{ov::element::i64, ov::element::i32}});
 
-        auto outputIndices = op->get_output_shape(0)[0];
-        cldnn::layout mutableLayoutFirst = cldnn::layout(cldnn::element_type_to_data_type(ov::element::i32),
-                                                        cldnn::format::bfyx,
-                                                        cldnn::tensor(static_cast<int32_t>(outputIndices), 1, 1, 1));
-
-        shared_memory.emplace_back(p.get_engine().allocate_memory(mutableLayoutFirst));
-
-        cldnn::primitive_id matrix_nms_mutable_id_w_first = layer_type_name_ID(op) + "_md_write_first";
-        auto matrix_nms_mutable_prim_first = cldnn::mutable_data(matrix_nms_mutable_id_w_first, shared_memory.back());
-        p.add_primitive(*op, matrix_nms_mutable_prim_first);
-        inputs.push_back(cldnn::input_info(matrix_nms_mutable_id_w_first));
-
-        auto batches_num = op->get_output_shape(2)[0];
-        cldnn::layout mutableLayoutSecond = cldnn::layout(cldnn::element_type_to_data_type(ov::element::i32),
-                                                        cldnn::format::bfyx,
-                                                        cldnn::tensor(static_cast<int32_t>(batches_num), 1, 1, 1));
-
-        shared_memory.emplace_back(p.get_engine().allocate_memory(mutableLayoutSecond));
-
-        cldnn::primitive_id matrix_nms_mutable_id_w_second = layer_type_name_ID(op) + "_md_write_second";
-        auto matrix_nms_mutable_prim_second = cldnn::mutable_data(matrix_nms_mutable_id_w_second, shared_memory.back());
-        p.add_primitive(*op, matrix_nms_mutable_prim_second);
-        inputs.push_back(cldnn::input_info(matrix_nms_mutable_id_w_second));
-
-        auto matrixNmsLayerName = layer_type_name_ID(op) + ".out0";
-
-        auto prim = cldnn::matrix_nms(matrixNmsLayerName,
-                                    inputs[0],
-                                    inputs[1],
-                                    inputs[inputs.size() - 2],
-                                    inputs[inputs.size() - 1],
-                                    op->get_attrs());
-
-        p.add_primitive(*op, prim);
-
-        cldnn::primitive_id matrix_nms_id_r_first = layer_type_name_ID(op) + ".out1";
-        auto matrix_nms_mutable_prim_r_first =
-            cldnn::mutable_data(matrix_nms_id_r_first, { cldnn::input_info(matrixNmsLayerName) }, shared_memory.front());
-        p.add_primitive(*op, matrix_nms_mutable_prim_r_first);
-
-        cldnn::primitive_id matrix_nms_id_r_second = layer_type_name_ID(op) + ".out2";
-        auto matrix_nms_mutable_prim_r_second =
-            cldnn::mutable_data(matrix_nms_id_r_second, { cldnn::input_info(matrixNmsLayerName) }, shared_memory.back());
-        p.add_primitive(*op, matrix_nms_mutable_prim_r_second);
-    }
+    p.add_primitive(*op, prim);
 }
 
 }  // anonymous namespace
diff --git a/src/plugins/intel_gpu/src/plugin/ops/multiclass_nms.cpp b/src/plugins/intel_gpu/src/plugin/ops/multiclass_nms.cpp
index c6d1286f4faf19..3ac01440166135 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/multiclass_nms.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/multiclass_nms.cpp
@@ -1,4 +1,4 @@
-// Copyright (C) 2022 Intel Corporation
+// Copyright (C) 2022-2024 Intel Corporation
 // SPDX-License-Identifier: Apache-2.0
 //
 
@@ -8,7 +8,6 @@
 #include "intel_gpu/plugin/common_utils.hpp"
 #include "intel_gpu/plugin/program_builder.hpp"
 #include "intel_gpu/primitives/multiclass_nms.hpp"
-#include "intel_gpu/primitives/mutable_data.hpp"
 
 namespace ov {
 namespace intel_gpu {
@@ -19,65 +18,11 @@ static void CreateMulticlassNmsIEInternalOp(ProgramBuilder& p, const std::shared
 
     auto inputs = p.GetInputInfo(op);
 
-    if (p.use_new_shape_infer()) {
-        cldnn::multiclass_nms prim{layer_type_name_ID(op), inputs, op->get_attrs()};
-        prim.num_outputs = op->get_output_size();
-        prim.output_data_types = get_output_data_types(op, {{ov::element::i64, ov::element::i32}});
+    cldnn::multiclass_nms prim{layer_type_name_ID(op), inputs, op->get_attrs()};
+    prim.num_outputs = op->get_output_size();
+    prim.output_data_types = get_output_data_types(op, {{ov::element::i64, ov::element::i32}});
 
-        p.add_primitive(*op, prim);
-    } else {
-        if (inputs.size() == 2) {
-            inputs.push_back(cldnn::input_info(""));  // roisnum dummy id
-        }
-
-        const auto op_friendly_name = op->get_friendly_name();
-
-        const auto layer_type_name = layer_type_name_ID(op);
-        const auto layer_name = layer_type_name + ".out0";
-
-        const auto mutable_precision1 = op->get_output_element_type(1);
-        const auto output_shape1 = op->get_output_shape(1);
-        const cldnn::layout mutable_layout1{cldnn::element_type_to_data_type(mutable_precision1),
-                                            cldnn::format::get_default_format(output_shape1.size()),
-                                            tensor_from_dims(output_shape1)};
-        cldnn::memory::ptr shared_memory1{p.get_engine().allocate_memory(mutable_layout1)};
-
-        const auto mutable_id_w1 = layer_type_name + "_md_write.1";
-        const cldnn::mutable_data mutable_prim_w{mutable_id_w1, shared_memory1};
-        p.add_primitive(*op, mutable_prim_w);
-        inputs.push_back(cldnn::input_info(mutable_id_w1));
-
-        const auto mutable_precision2 = op->get_output_element_type(2);
-        const auto output_shape2 = op->get_output_shape(2);
-        const cldnn::layout mutable_layout2{cldnn::element_type_to_data_type(mutable_precision2),
-                                            cldnn::format::get_default_format(output_shape2.size()),
-                                            tensor_from_dims(output_shape2)};
-        cldnn::memory::ptr shared_memory2{p.get_engine().allocate_memory(mutable_layout2)};
-
-        const auto mutable_id_w2 = layer_type_name + "_md_write.2";
-        const cldnn::mutable_data mutable_prim_w2{mutable_id_w2, shared_memory2};
-        p.add_primitive(*op, mutable_prim_w2);
-        inputs.push_back(cldnn::input_info(mutable_id_w2));
-
-        constexpr auto expected_inputs_count = 3 + 2;  // 3 operation inputs plus 2 additional outputs
-        if (inputs.size() != expected_inputs_count) {
-            OPENVINO_THROW("multiclass_nms primitive requires 5 inputs");
-        }
-
-        const cldnn::multiclass_nms prim{layer_name,
-                                        inputs,
-                                        op->get_attrs()};
-
-        p.add_primitive(*op, prim);
-
-        const auto mutable_id_r1 = layer_type_name + ".out1";
-        const cldnn::mutable_data mutable_prim_r1{mutable_id_r1, {cldnn::input_info(layer_name)}, shared_memory1};
-        p.add_primitive(*op, mutable_prim_r1);
-
-        const auto mutable_id_r2 = layer_type_name + ".out2";
-        const cldnn::mutable_data mutable_prim_r2{mutable_id_r2, {cldnn::input_info(layer_name)}, shared_memory2};
-        p.add_primitive(*op, mutable_prim_r2);
-    }
+    p.add_primitive(*op, prim);
 }
 
 REGISTER_FACTORY_IMPL(internal, MulticlassNmsIEInternal);
diff --git a/src/plugins/intel_gpu/src/plugin/ops/multinomial.cpp b/src/plugins/intel_gpu/src/plugin/ops/multinomial.cpp
index b78e1300f883cc..c748b9533a44ed 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/multinomial.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/multinomial.cpp
@@ -8,7 +8,6 @@
 #include "openvino/op/multinomial.hpp"
 
 #include "intel_gpu/primitives/activation.hpp"
-#include "intel_gpu/primitives/broadcast.hpp"
 #include "intel_gpu/primitives/cum_sum.hpp"
 #include "intel_gpu/primitives/data.hpp"
 #include "intel_gpu/primitives/eltwise.hpp"
@@ -28,7 +27,7 @@ namespace {
 template<typename T>
 cldnn::data CreateScalarDataPrimitive(ProgramBuilder& p, const cldnn::primitive_id& name, T value) {
     auto mem = p.get_engine().allocate_memory(
-        cldnn::layout{element::from<T>(), cldnn::format::bfyx, {1, 1, 1, 1}}, false);
+        cldnn::layout{{1}, element::from<T>(), cldnn::format::bfyx}, false);
     cldnn::mem_lock<int8_t> host_mem{mem, p.get_engine().get_service_stream()};
     std::memcpy(host_mem.data(), &value, sizeof value);
     return {name, mem};
@@ -36,7 +35,7 @@ cldnn::data CreateScalarDataPrimitive(ProgramBuilder& p, const cldnn::primitive_
 
 cldnn::data CreateShapeDataPrimitive(ProgramBuilder& p, const cldnn::primitive_id& name, Shape& value) {
     auto mem = p.get_engine().allocate_memory(
-        cldnn::layout{element::Type_t::i64, cldnn::format::bfyx, {1, 1, 1, static_cast<int>(value.size())}}, false);
+        cldnn::layout{ov::PartialShape{static_cast<int64_t>(value.size())}, element::Type_t::i64, cldnn::format::bfyx}, false);
     cldnn::mem_lock<int8_t> host_mem{mem, p.get_engine().get_service_stream()};
     std::vector<std::int64_t> shape {};
     std::copy(value.begin(), value.end(), std::back_inserter(shape));
diff --git a/src/plugins/intel_gpu/src/plugin/ops/non_max_suppression.cpp b/src/plugins/intel_gpu/src/plugin/ops/non_max_suppression.cpp
index 29af11ebeadef0..d186ee0d346964 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/non_max_suppression.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/non_max_suppression.cpp
@@ -8,10 +8,7 @@
 #include "openvino/op/non_max_suppression.hpp"
 #include <ov_ops/nms_ie_internal.hpp>
 
-#include "intel_gpu/primitives/reorder.hpp"
-#include "intel_gpu/primitives/mutable_data.hpp"
 #include "intel_gpu/primitives/non_max_suppression.hpp"
-#include "intel_gpu/runtime/debug_configuration.hpp"
 
 namespace ov {
 namespace intel_gpu {
@@ -30,164 +27,22 @@ static void CreateNonMaxSuppressionIEInternalOp(ProgramBuilder& p, const std::sh
         validate_inputs_count(op, {2, 3, 4, 5, 6});
     }
     auto inputs = p.GetInputInfo(op);
-    std::vector<cldnn::input_info> reordered_inputs;
-    reordered_inputs.resize(inputs.size());
-
-    for (size_t portIndex = 0; portIndex < inputs.size(); portIndex++) {
-        auto inputDataType = cldnn::element_type_to_data_type(op->get_input_element_type(portIndex));
-        if ((portIndex == 2) && (inputDataType == cldnn::data_types::i64)) {
-            // GPU primitive supports only i32 data type for 'max_output_boxes_per_class' input
-            // so we need additional reorder if it's provided as i64
-            auto reorderPrimName = inputs[portIndex].pid + "_" + op->get_friendly_name() + ProgramBuilder::m_preProcessTag;
-            auto targetFormat = cldnn::format::get_default_format(op->get_input_partial_shape(portIndex).size());
-            auto preprocessPrim = cldnn::reorder(reorderPrimName,
-                                                 inputs[portIndex],
-                                                 targetFormat,
-                                                 cldnn::data_types::i32);
-            p.add_primitive(*op, preprocessPrim);
-            reordered_inputs[portIndex] = cldnn::input_info(reorderPrimName);
-        } else {
-            reordered_inputs[portIndex] = inputs[portIndex];
-        }
-    }
 
     auto boxesShape = op->get_input_partial_shape(0);
     size_t num_outputs = op->get_output_size();
-    if (p.use_new_shape_infer()) {
-        auto NMSLayerName = layer_type_name_ID(op);
-        auto prim = cldnn::non_max_suppression(
-                NMSLayerName,
-                reordered_inputs[0],
-                reordered_inputs[1],
-                0,
-                op->m_center_point_box,
-                op->m_sort_result_descending,
-                "", "", "", "", "", "", num_outputs);
-
-        prim.output_data_types = get_output_data_types(op, {{ov::element::i64, ov::element::i32}});
-        prim.rotation = rotation;
-
-        switch (reordered_inputs.size()) {
-            case 6: prim.soft_nms_sigma = reordered_inputs[5].pid;
-            case 5: prim.score_threshold = reordered_inputs[4].pid;
-            case 4: prim.iou_threshold = reordered_inputs[3].pid;
-            case 3: prim.num_select_per_class = reordered_inputs[2].pid;
-            case 2: break;
-            default: OPENVINO_THROW("Incorrect number of input primitives for layer: ", op->get_friendly_name());
-        }
-
-        p.add_primitive(*op, prim);
-
-        auto NMSGatherLayerName = layer_type_name_ID(op) + "_NMSGather";
-        std::vector<cldnn::input_info> nms_gather_inputs;
-        const std::vector<cldnn::input_info> nms_gather_input_list = {
-            cldnn::input_info(NMSLayerName, 0),
-            cldnn::input_info(NMSLayerName, 1),
-            cldnn::input_info(NMSLayerName, 2)
-        };
-        for (size_t i = 0; i < num_outputs; i++) {
-            nms_gather_inputs.push_back(nms_gather_input_list[i]);
-        }
-
-        auto nms_gather_prim = cldnn::non_max_suppression_gather(
-            NMSGatherLayerName,
-            nms_gather_inputs,
+    auto nonMaxSuppressionLayerName = layer_type_name_ID(op);
+    auto prim = cldnn::non_max_suppression(
+            nonMaxSuppressionLayerName,
+            inputs,
+            0,
+            op->m_center_point_box,
+            op->m_sort_result_descending,
             num_outputs);
 
-        p.add_primitive(*op, nms_gather_prim);
-    } else {
-        auto outputIndices = op->get_output_partial_shape(0)[0].get_length();
-
-        std::vector<cldnn::memory::ptr> shared_memory;
-        switch (num_outputs) {
-            case 3: {
-                auto mutable_precision_second = op->get_output_element_type(2);
-                if (mutable_precision_second == ov::element::i64) {
-                    mutable_precision_second = ov::element::i32;
-                }
-                cldnn::layout mutableLayoutSecond = cldnn::layout(
-                    cldnn::element_type_to_data_type(mutable_precision_second),
-                    cldnn::format::get_default_format(op->get_output_shape(2).size()),
-                    tensor_from_dims(op->get_output_shape(2)));
-
-                GPU_DEBUG_LOG << "[" << layer_type_name_ID(op) << ": mutable data]" << std::endl;
-                shared_memory.emplace_back(p.get_engine().allocate_memory(mutableLayoutSecond));
+    prim.output_data_types = get_output_data_types(op, {{ov::element::i64, ov::element::i32}});
+    prim.rotation = rotation;
 
-                cldnn::primitive_id non_max_suppression_mutable_id_w_second = layer_type_name_ID(op) + "_md_write_second";
-                auto nms_mutable_prim_second = cldnn::mutable_data(non_max_suppression_mutable_id_w_second,
-                                                                   shared_memory.back());
-                p.add_primitive(*op, nms_mutable_prim_second);
-                inputs.push_back(cldnn::input_info(non_max_suppression_mutable_id_w_second));
-            }
-            case 2: {
-                auto mutable_precision_first = op->get_output_element_type(1);
-                cldnn::layout mutableLayoutFirst = cldnn::layout(
-                    cldnn::element_type_to_data_type(mutable_precision_first),
-                    cldnn::format::bfyx,
-                    cldnn::tensor(static_cast<int32_t>(outputIndices), 3, 1, 1));
-
-                GPU_DEBUG_LOG << "[" << layer_type_name_ID(op) << ": mutable data]" << std::endl;
-                shared_memory.emplace_back(p.get_engine().allocate_memory(mutableLayoutFirst));
-
-                cldnn::primitive_id non_max_suppression_mutable_id_w_first = layer_type_name_ID(op) + "_md_write_first";
-                auto nms_mutable_prim_first = cldnn::mutable_data(non_max_suppression_mutable_id_w_first,
-                                                                  shared_memory.back());
-                p.add_primitive(*op, nms_mutable_prim_first);
-                inputs.push_back(cldnn::input_info(non_max_suppression_mutable_id_w_first));
-            }
-            case 1: break;
-            default: OPENVINO_THROW("Incorrect number of output for layer: ", op->get_friendly_name());
-        }
-
-        auto nonMaxSuppressionLayerName = num_outputs > 1 ? layer_type_name_ID(op) + ".out0" : layer_type_name_ID(op);
-
-        auto prim = cldnn::non_max_suppression(
-                nonMaxSuppressionLayerName,
-                reordered_inputs[0],
-                reordered_inputs[1],
-                static_cast<int>(outputIndices),
-                op->m_center_point_box,
-                op->m_sort_result_descending,
-                "", "", "", "", "", "");
-
-        prim.output_data_types = get_output_data_types(op, {{ov::element::i64, ov::element::i32}});
-        prim.rotation = rotation;
-
-        switch (reordered_inputs.size()) {
-            case 6: prim.soft_nms_sigma = reordered_inputs[5].pid;
-            case 5: prim.score_threshold = reordered_inputs[4].pid;
-            case 4: prim.iou_threshold = reordered_inputs[3].pid;
-            case 3: prim.num_select_per_class = reordered_inputs[2].pid;
-            case 2: break;
-            default: OPENVINO_THROW("Incorrect number of input primitives for layer: ", op->get_friendly_name());
-        }
-
-        switch (num_outputs) {
-            case 3: prim.third_output = inputs[inputs.size() - 2].pid;
-            case 2: prim.second_output = inputs[inputs.size() - 1].pid;
-            default: break;
-        }
-
-        p.add_primitive(*op, prim);
-
-        switch (num_outputs) {
-            case 3: {
-                cldnn::primitive_id non_max_suppression_id_r_second = layer_type_name_ID(op) + ".out2";
-                auto nms_mutable_prim_r_second = cldnn::mutable_data(non_max_suppression_id_r_second,
-                                                                     { cldnn::input_info(nonMaxSuppressionLayerName) },
-                                                                     shared_memory.front());
-                p.add_primitive(*op, nms_mutable_prim_r_second);
-            }
-            case 2: {
-                cldnn::primitive_id non_max_suppression_id_r_first = layer_type_name_ID(op) + ".out1";
-                auto nms_mutable_prim_r_first = cldnn::mutable_data(non_max_suppression_id_r_first,
-                                                                    { cldnn::input_info(nonMaxSuppressionLayerName) },
-                                                                    shared_memory.back());
-                p.add_primitive(*op, nms_mutable_prim_r_first);
-            }
-            default: break;
-        }
-    }
+    p.add_primitive(*op, prim);
 }
 
 REGISTER_FACTORY_IMPL(internal, NonMaxSuppressionIEInternal);
diff --git a/src/plugins/intel_gpu/src/plugin/ops/normalize_l2.cpp b/src/plugins/intel_gpu/src/plugin/ops/normalize_l2.cpp
index 670780f7617785..7cb1a5413f596e 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/normalize_l2.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/normalize_l2.cpp
@@ -34,7 +34,7 @@ static void CreateNormalizeL2Op(ProgramBuilder& p, const std::shared_ptr<ov::op:
 
     // We create fake scale constant and fill it with ones to keep the same behavior as current primitive
     auto scale = std::make_shared<ov::op::v0::Constant>(op->get_output_element_type(0), ov::Shape{1}, std::vector<float>{1.0});
-    cldnn::layout constLayout = cldnn::layout(cldnn::element_type_to_data_type(op->get_output_element_type(0)), cldnn::format::bfyx, cldnn::tensor{1});
+    cldnn::layout constLayout = cldnn::layout({1}, cldnn::element_type_to_data_type(op->get_output_element_type(0)), cldnn::format::bfyx);
     auto mem = p.get_engine().allocate_memory(constLayout, false);
     cldnn::mem_lock<int8_t> tmpPointer{mem, p.get_engine().get_service_stream()};
     auto buf = tmpPointer.data();
diff --git a/src/plugins/intel_gpu/src/plugin/ops/one_hot.cpp b/src/plugins/intel_gpu/src/plugin/ops/one_hot.cpp
index 9a7f8697d0b736..9b41f934767eb2 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/one_hot.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/one_hot.cpp
@@ -3,7 +3,6 @@
 //
 
 #include "intel_gpu/plugin/program_builder.hpp"
-#include "intel_gpu/plugin/common_utils.hpp"
 #include "transformations/utils/utils.hpp"
 
 #include "openvino/op/one_hot.hpp"
@@ -51,12 +50,8 @@ static void CreateOneHotOp(ProgramBuilder& p, const std::shared_ptr<ov::op::v1::
 
     int64_t depth = depth_value_node->cast_vector<int64_t>()[0];
 
-    auto out_pshape = op->get_output_partial_shape(0);
-    cldnn::tensor out_tensor = out_pshape.is_static() ? tensor_from_dims(out_pshape.to_shape()) : cldnn::tensor{};
-
     auto oneHotPrim = cldnn::one_hot(layerName,
                                      inputs[0],
-                                     out_tensor,
                                      cldnn::element_type_to_data_type(op->get_output_element_type(0)),
                                      axis,
                                      depth,
diff --git a/src/plugins/intel_gpu/src/plugin/ops/pad.cpp b/src/plugins/intel_gpu/src/plugin/ops/pad.cpp
index 09489689687fc4..f74d82d0b1a288 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/pad.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/pad.cpp
@@ -3,7 +3,6 @@
 //
 
 #include "intel_gpu/plugin/program_builder.hpp"
-#include "intel_gpu/plugin/common_utils.hpp"
 #include "transformations/utils/utils.hpp"
 
 #include "openvino/op/pad.hpp"
diff --git a/src/plugins/intel_gpu/src/plugin/ops/parameter.cpp b/src/plugins/intel_gpu/src/plugin/ops/parameter.cpp
index 7f5c4b73223326..a57aa3cd4fefac 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/parameter.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/parameter.cpp
@@ -16,7 +16,6 @@
 
 #include "intel_gpu/primitives/input_layout.hpp"
 #include "intel_gpu/primitives/reorder.hpp"
-#include "intel_gpu/primitives/data.hpp"
 #include "intel_gpu/primitives/concatenation.hpp"
 
 namespace ov {
@@ -24,9 +23,6 @@ namespace intel_gpu {
 
 static void CreateParameterOp(ProgramBuilder& p, const std::shared_ptr<ov::op::v0::Parameter>& op) {
     auto input_pshape = op->get_partial_shape();
-    if (!p.use_new_shape_infer() && input_pshape.size() < 4) {
-        input_pshape.insert(input_pshape.end(), 4 - input_pshape.size(), ov::Dimension(1));
-    }
 
     cldnn::format input_format = cldnn::format::get_default_format(input_pshape.size());
     auto element_type = cldnn::element_type_to_data_type(convert_to_supported_device_type(op->get_output_element_type(0)));
diff --git a/src/plugins/intel_gpu/src/plugin/ops/pooling.cpp b/src/plugins/intel_gpu/src/plugin/ops/pooling.cpp
index 44095638630f67..8fb715417d19bd 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/pooling.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/pooling.cpp
@@ -2,13 +2,12 @@
 // SPDX-License-Identifier: Apache-2.0
 //
 
-#include "intel_gpu/plugin/program_builder.hpp"
 #include "intel_gpu/plugin/common_utils.hpp"
+#include "intel_gpu/plugin/program_builder.hpp"
 
 #include "openvino/op/max_pool.hpp"
 #include "openvino/op/avg_pool.hpp"
 
-#include "intel_gpu/primitives/mutable_data.hpp"
 #include "intel_gpu/primitives/pooling.hpp"
 
 namespace ov {
@@ -19,30 +18,16 @@ static void CreateAvgPoolOp(ProgramBuilder& p, const std::shared_ptr<ov::op::v1:
     auto inputs = p.GetInputInfo(op);
     std::string layerName = layer_type_name_ID(op);
 
-    std::shared_ptr<cldnn::pooling> pooling_prim = nullptr;
-    if (p.use_new_shape_infer()) {
-        pooling_prim = std::make_shared<cldnn::pooling>(layerName,
-                                                        inputs[0],
-                                                        op->get_exclude_pad() ? cldnn::pooling_mode::average_no_padding
-                                                                              : cldnn::pooling_mode::average,
-                                                        op->get_kernel(),
-                                                        op->get_strides(),
-                                                        op->get_pads_begin(),
-                                                        op->get_pads_end(),
-                                                        op->get_auto_pad(),
-                                                        op->get_rounding_type());
-    } else {
-        pooling_prim = std::make_shared<cldnn::pooling>(layerName,
-                                                        inputs[0],
-                                                        op->get_exclude_pad() ? cldnn::pooling_mode::average_no_padding
-                                                                              : cldnn::pooling_mode::average,
-                                                        op->get_kernel(),
-                                                        op->get_strides(),
-                                                        op->get_pads_begin(),
-                                                        op->get_pads_end(),
-                                                        tensor_from_dims(op->get_output_shape(0)),
-                                                        cldnn::element_type_to_data_type(op->get_output_element_type(0)));
-    }
+    auto pooling_prim = std::make_shared<cldnn::pooling>(layerName,
+                                                         inputs[0],
+                                                         op->get_exclude_pad() ? cldnn::pooling_mode::average_no_padding
+                                                                               : cldnn::pooling_mode::average,
+                                                         op->get_kernel(),
+                                                         op->get_strides(),
+                                                         op->get_pads_begin(),
+                                                         op->get_pads_end(),
+                                                         op->get_auto_pad(),
+                                                         op->get_rounding_type());
     p.add_primitive(*op, pooling_prim);
 }
 
@@ -51,28 +36,15 @@ static void CreateMaxPoolOp(ProgramBuilder& p, const std::shared_ptr<ov::op::v1:
     auto inputs = p.GetInputInfo(op);
     std::string layerName = layer_type_name_ID(op);
 
-    std::shared_ptr<cldnn::pooling> pooling_prim = nullptr;
-    if (p.use_new_shape_infer()) {
-        pooling_prim = std::make_shared<cldnn::pooling>(layerName,
-                                                        inputs[0],
-                                                        cldnn::pooling_mode::max,
-                                                        op->get_kernel(),
-                                                        op->get_strides(),
-                                                        op->get_pads_begin(),
-                                                        op->get_pads_end(),
-                                                        op->get_auto_pad(),
-                                                        op->get_rounding_type());
-    } else {
-        pooling_prim = std::make_shared<cldnn::pooling>(layerName,
-                                                        inputs[0],
-                                                        cldnn::pooling_mode::max,
-                                                        op->get_kernel(),
-                                                        op->get_strides(),
-                                                        op->get_pads_begin(),
-                                                        op->get_pads_end(),
-                                                        tensor_from_dims(op->get_output_shape(0)),
-                                                        cldnn::element_type_to_data_type(op->get_output_element_type(0)));
-    }
+    auto pooling_prim = std::make_shared<cldnn::pooling>(layerName,
+                                                         inputs[0],
+                                                         cldnn::pooling_mode::max,
+                                                         op->get_kernel(),
+                                                         op->get_strides(),
+                                                         op->get_pads_begin(),
+                                                         op->get_pads_end(),
+                                                         op->get_auto_pad(),
+                                                         op->get_rounding_type());
     p.add_primitive(*op, pooling_prim);
 }
 
@@ -82,22 +54,7 @@ static void CreateMaxPoolOp(ProgramBuilder& p, const std::shared_ptr<ov::op::v8:
         OPENVINO_THROW("[GPU] v8:MaxPool requires 2 outputs");
     }
     auto inputs = p.GetInputInfo(op);
-    const auto layer_type_name = layer_type_name_ID(op);
-    const auto layerName = layer_type_name + ".out0";
-
-    const auto mutable_precision = op->get_output_element_type(1);
-    const auto output_shape = op->get_output_shape(1);
-    cldnn::layout mutableLayout = cldnn::layout(cldnn::element_type_to_data_type(mutable_precision),
-                                                cldnn::format::get_default_format(output_shape.size()),
-                                                tensor_from_dims(output_shape));
-    const auto shared_memory = p.get_engine().allocate_memory(mutableLayout);
-    const cldnn::primitive_id maxpool_mutable_id_w = layer_type_name + "_md_write";
-    auto indices_mutable_prim = cldnn::mutable_data(maxpool_mutable_id_w,
-                                                          shared_memory);
-    p.add_primitive(*op, indices_mutable_prim);
-    inputs.push_back(cldnn::input_info(maxpool_mutable_id_w));
-
-    auto poolPrim = cldnn::pooling(layerName,
+    auto poolPrim = cldnn::pooling(layer_type_name_ID(op),
                                    inputs[0],
                                    inputs.back(),
                                    op->get_kernel(),
@@ -109,15 +66,12 @@ static void CreateMaxPoolOp(ProgramBuilder& p, const std::shared_ptr<ov::op::v8:
                                    op->get_rounding_type(),
                                    op->get_axis(),
                                    cldnn::element_type_to_data_type(op->get_index_element_type()),
-                                   tensor_from_dims(op->get_output_shape(0)),
                                    cldnn::element_type_to_data_type(op->get_output_element_type(0)));
-    p.add_primitive(*op, poolPrim);
 
-    const cldnn::primitive_id maxpool_mutable_id_r = layer_type_name + ".out1";
-    auto indices_mutable_id_r = cldnn::mutable_data(maxpool_mutable_id_r,
-                                                    { cldnn::input_info(layerName) },
-                                                    shared_memory);
-    p.add_primitive(*op, indices_mutable_id_r);
+    poolPrim.num_outputs = op->get_output_size();
+    poolPrim.output_data_types = get_output_data_types(op);
+
+    p.add_primitive(*op, poolPrim);
 }
 
 
diff --git a/src/plugins/intel_gpu/src/plugin/ops/proposal.cpp b/src/plugins/intel_gpu/src/plugin/ops/proposal.cpp
index 5ddb7d513a12b7..39998492865985 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/proposal.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/proposal.cpp
@@ -7,8 +7,6 @@
 #include "intel_gpu/plugin/program_builder.hpp"
 #include "intel_gpu/plugin/common_utils.hpp"
 #include "intel_gpu/primitives/proposal.hpp"
-#include "intel_gpu/primitives/mutable_data.hpp"
-#include "intel_gpu/runtime/debug_configuration.hpp"
 
 namespace ov {
 namespace intel_gpu {
@@ -54,123 +52,36 @@ static void CreateProposalOp(ProgramBuilder& p, const std::shared_ptr<ov::op::v0
         swap_xy = false;
     }
 
-    if (p.use_new_shape_infer()) {
-        size_t num_outputs = op->get_output_size();
-
-        auto proposalPrim = cldnn::proposal(layerName,
-                                            inputs[0],  // cls_score
-                                            inputs[1],  // bbox_pred
-                                            inputs[2],  // im_info
-                                            0,          // max_num_proposals is unused
-                                            nms_thresh,
-                                            base_size,
-                                            min_size,
-                                            feature_stride,
-                                            pre_nms_topn,
-                                            post_nms_topn,
-                                            ratio,
-                                            scale,
-                                            coordinates_offset,
-                                            box_coordinate_scale,
-                                            box_size_scale,
-                                            false,
-                                            swap_xy,
-                                            initial_clip,
-                                            clip_before_nms,
-                                            clip_after_nms,
-                                            round_ratios,
-                                            shift_anchors,
-                                            normalize,
-                                            cldnn::element_type_to_data_type(op->get_output_element_type(0)),
-                                            num_outputs);
-        proposalPrim.output_data_types = get_output_data_types(op);
-        p.add_primitive(*op, proposalPrim);
-    } else {
-        if (op->get_output_size() == 2) {
-            auto mutable_precision = op->get_output_element_type(1);
-            if (mutable_precision == ov::element::i64) {
-                mutable_precision = ov::element::i32;
-            }
-
-            cldnn::layout mutableLayout = cldnn::layout(cldnn::element_type_to_data_type(mutable_precision),
-                                                        cldnn::format::get_default_format(op->get_output_shape(1).size()),
-                                                        tensor_from_dims(op->get_output_shape(1)));
-
-            GPU_DEBUG_LOG << "[" << layerName << ": mutable data]" << std::endl;
-            auto shared_memory = p.get_engine().allocate_memory(mutableLayout);
-
-            cldnn::primitive_id proposal_mutable_id_w = layerName + "_md_write";
-            auto argmax_mutable_prim = cldnn::mutable_data(proposal_mutable_id_w,
-                                                           shared_memory);
-            p.add_primitive(*op, argmax_mutable_prim);
-            inputs.push_back(cldnn::input_info(proposal_mutable_id_w));
-
-            std::string proposalLayerName = layerName + ".out0";
-            auto proposalPrim = cldnn::proposal(proposalLayerName,
-                                                inputs[0],  // cls_score
-                                                inputs[1],  // bbox_pred
-                                                inputs[2],  // im_info
-                                                inputs[3],  // second_output
-                                                0,          // max_num_proposals is unused
-                                                nms_thresh,
-                                                base_size,
-                                                min_size,
-                                                feature_stride,
-                                                pre_nms_topn,
-                                                post_nms_topn,
-                                                ratio,
-                                                scale,
-                                                coordinates_offset,
-                                                box_coordinate_scale,
-                                                box_size_scale,
-                                                false,
-                                                swap_xy,
-                                                initial_clip,
-                                                clip_before_nms,
-                                                clip_after_nms,
-                                                round_ratios,
-                                                shift_anchors,
-                                                normalize);
-
-            p.add_primitive(*op, proposalPrim);
-
-            cldnn::primitive_id proposal_mutable_id_r = layerName + ".out1";
-            auto argmax_mutable_prim_r = cldnn::mutable_data(proposal_mutable_id_r,
-                                                             { cldnn::input_info(proposalLayerName) },
-                                                             shared_memory);
-            p.add_primitive(*op, argmax_mutable_prim_r);
-            return;
-        } else if (op->get_output_size() == 1) {
-            auto proposalPrim = cldnn::proposal(layerName,
-                                                inputs[0],  // cls_score
-                                                inputs[1],  // bbox_pred
-                                                inputs[2],  // im_info
-                                                0,          // max_num_proposals is unused
-                                                nms_thresh,
-                                                base_size,
-                                                min_size,
-                                                feature_stride,
-                                                pre_nms_topn,
-                                                post_nms_topn,
-                                                ratio,
-                                                scale,
-                                                coordinates_offset,
-                                                box_coordinate_scale,
-                                                box_size_scale,
-                                                false,
-                                                swap_xy,
-                                                initial_clip,
-                                                clip_before_nms,
-                                                clip_after_nms,
-                                                round_ratios,
-                                                shift_anchors,
-                                                normalize);
-
-            p.add_primitive(*op, proposalPrim);
-        } else {
-            OPENVINO_THROW(op->get_friendly_name(), " Incorrect Proposal outputs number");
-        }
-    }
+    size_t num_outputs = op->get_output_size();
+
+    auto proposalPrim = cldnn::proposal(layerName,
+                                        inputs[0],  // cls_score
+                                        inputs[1],  // bbox_pred
+                                        inputs[2],  // im_info
+                                        0,          // max_num_proposals is unused
+                                        nms_thresh,
+                                        base_size,
+                                        min_size,
+                                        feature_stride,
+                                        pre_nms_topn,
+                                        post_nms_topn,
+                                        ratio,
+                                        scale,
+                                        coordinates_offset,
+                                        box_coordinate_scale,
+                                        box_size_scale,
+                                        false,
+                                        swap_xy,
+                                        initial_clip,
+                                        clip_before_nms,
+                                        clip_after_nms,
+                                        round_ratios,
+                                        shift_anchors,
+                                        normalize,
+                                        cldnn::element_type_to_data_type(op->get_output_element_type(0)),
+                                        num_outputs);
+    proposalPrim.output_data_types = get_output_data_types(op);
+    p.add_primitive(*op, proposalPrim);
 }
 
 REGISTER_FACTORY_IMPL(v0, Proposal);
diff --git a/src/plugins/intel_gpu/src/plugin/ops/random_uniform.cpp b/src/plugins/intel_gpu/src/plugin/ops/random_uniform.cpp
index bf2dfd6c10f57b..ca4eb25ff00950 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/random_uniform.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/random_uniform.cpp
@@ -3,7 +3,6 @@
 //
 
 #include "intel_gpu/plugin/program_builder.hpp"
-#include "intel_gpu/plugin/common_utils.hpp"
 #include "openvino/op/random_uniform.hpp"
 #include "intel_gpu/primitives/random_uniform.hpp"
 
@@ -20,28 +19,14 @@ void CreateRandomUniformOp(ProgramBuilder &p, const std::shared_ptr<ov::op::v8::
 
     OPENVINO_ASSERT(input_pshape.is_static(), "[GPU] Dynamic input of RandomUniform leads to dynamic output rank, but GPU doesn't support it yet");
 
-    if (output_pshape.is_static() && !p.use_new_shape_infer()) {
-        auto output_shape = output_pshape.get_shape();
-        // Extend to 4D shape
-        output_shape.insert(output_shape.end(), 4 - output_shape.size(), 1ul);
-
-        auto random_uniform_prim = cldnn::random_uniform(layer_type_name_ID(op),
-                                                         inputs,
-                                                         cldnn::element_type_to_data_type(op->get_out_type()),
-                                                         op->get_global_seed(),
-                                                         op->get_op_seed(),
-                                                         output_shape);
-        p.add_primitive(*op, random_uniform_prim);
-    } else {
-        OPENVINO_ASSERT(input_pshape.size() == 1, "[GPU] RandomUniform expects 1D input, got ", input_pshape.size());
-
-        auto random_uniform_prim = cldnn::random_uniform(layer_type_name_ID(op),
-                                                         inputs,
-                                                         cldnn::element_type_to_data_type(op->get_out_type()),
-                                                         op->get_global_seed(),
-                                                         op->get_op_seed());
-        p.add_primitive(*op, random_uniform_prim);
-    }
+    OPENVINO_ASSERT(input_pshape.size() == 1, "[GPU] RandomUniform expects 1D input, got ", input_pshape.size());
+
+    auto random_uniform_prim = cldnn::random_uniform(layer_type_name_ID(op),
+                                                        inputs,
+                                                        cldnn::element_type_to_data_type(op->get_out_type()),
+                                                        op->get_global_seed(),
+                                                        op->get_op_seed());
+    p.add_primitive(*op, random_uniform_prim);
 }
 
 } // namespace
diff --git a/src/plugins/intel_gpu/src/plugin/ops/range.cpp b/src/plugins/intel_gpu/src/plugin/ops/range.cpp
index c7da877e751dfd..cb72a5c9943660 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/range.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/range.cpp
@@ -16,17 +16,10 @@ static void CreateRangeOp(ProgramBuilder &p, const std::shared_ptr<ov::op::v4::R
     OPENVINO_ASSERT(output_pshape.rank().get_length() == 1 , "[GPU] range v4 output rank should be 1");
     auto output_dtype = cldnn::element_type_to_data_type(op->get_output_element_type(0));
 
-    std::shared_ptr<cldnn::range> range_prim = nullptr;
-    if (p.use_new_shape_infer()) {
-        range_prim = std::make_shared<cldnn::range>(layer_type_name_ID(op),
-                                                    p.GetInputInfo(op),
-                                                    output_dtype);
-    } else {
-        auto outLayout = cldnn::layout{ output_pshape, output_dtype, cldnn::format::bfyx };
-        range_prim = std::make_shared<cldnn::range>(layer_type_name_ID(op),
-                                                    p.GetInputInfo(op),
-                                                    outLayout);
-    }
+    auto range_prim = std::make_shared<cldnn::range>(layer_type_name_ID(op),
+                                                     p.GetInputInfo(op),
+                                                     output_dtype);
+
     p.add_primitive(*op, range_prim);
 }
 
diff --git a/src/plugins/intel_gpu/src/plugin/ops/reduce.cpp b/src/plugins/intel_gpu/src/plugin/ops/reduce.cpp
index 683cec31b7787e..a5ae25269ce00a 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/reduce.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/reduce.cpp
@@ -3,7 +3,6 @@
 //
 
 #include "intel_gpu/plugin/program_builder.hpp"
-#include "intel_gpu/plugin/common_utils.hpp"
 
 #include "openvino/op/reduce_sum.hpp"
 #include "openvino/op/reduce_prod.hpp"
@@ -17,8 +16,6 @@
 #include "openvino/op/constant.hpp"
 
 #include "intel_gpu/primitives/reduce.hpp"
-#include "intel_gpu/primitives/reorder.hpp"
-#include "intel_gpu/primitives/reshape.hpp"
 
 namespace ov {
 namespace intel_gpu {
@@ -49,49 +46,6 @@ static void CreateReduceOp(ProgramBuilder& p, const std::shared_ptr<ov::Node>& o
                                     keep_dims);
 
     p.add_primitive(*op, reducePrim);
-
-    if (input_pshape.is_dynamic() || p.use_new_shape_infer()) {
-        return;
-    }
-
-    auto resultLayerName = layerName;
-    auto out_dims = op->get_output_shape(0).size();
-    if (out_dims == 3 && !keep_dims && rank >= 4) {
-        resultLayerName = layerName + "_reshape";
-        auto out_shape = op->get_output_shape(0);
-        cldnn::tensor outTensor;
-        switch (rank) {
-            case 6:
-                outTensor = cldnn::tensor(TensorValue(out_shape[0]), TensorValue(out_shape[1]),
-                                          1, TensorValue(out_shape[2]), 1, 1);
-            case 5:
-                outTensor = cldnn::tensor(TensorValue(out_shape[0]), TensorValue(out_shape[1]),
-                                          1, TensorValue(out_shape[2]), 1);
-            case 4:
-                outTensor = cldnn::tensor(TensorValue(out_shape[0]), TensorValue(out_shape[1]),
-                                          1, TensorValue(out_shape[2]));
-        }
-        auto reshape_prim = cldnn::reshape(resultLayerName, cldnn::input_info(layerName), outTensor);
-        p.add_primitive(*op, reshape_prim);
-    }
-
-    auto reorderLayerName = layerName + "_reorder";
-    cldnn::format out_format = cldnn::format::any;
-    auto out_dt = cldnn::element_type_to_data_type(op->get_output_element_type(0));
-    if (!keep_dims && rank > 4) {
-        if (rank - axes.size() == 6)
-            out_format = cldnn::format::bfwzyx;
-        else if (rank - axes.size() == 5)
-            out_format = cldnn::format::bfzyx;
-        else if (rank - axes.size() <= 4)
-            out_format = cldnn::format::bfyx;
-
-        auto reorder_prim = cldnn::reorder(reorderLayerName,
-                                           cldnn::input_info(resultLayerName),
-                                           out_format,
-                                           out_dt);
-        p.add_primitive(*op, reorder_prim);
-    }
 }
 
 static void CreateReduceMaxOp(ProgramBuilder& p, const std::shared_ptr<ov::op::v1::ReduceMax>& op) {
diff --git a/src/plugins/intel_gpu/src/plugin/ops/region_yolo.cpp b/src/plugins/intel_gpu/src/plugin/ops/region_yolo.cpp
index c8a7b279a14ee0..a4a07b0c7e0428 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/region_yolo.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/region_yolo.cpp
@@ -3,7 +3,6 @@
 //
 
 #include "intel_gpu/plugin/program_builder.hpp"
-#include "intel_gpu/plugin/common_utils.hpp"
 
 #include "openvino/op/region_yolo.hpp"
 
diff --git a/src/plugins/intel_gpu/src/plugin/ops/reorg_yolo.cpp b/src/plugins/intel_gpu/src/plugin/ops/reorg_yolo.cpp
index 83fc5da2386968..9aa9af7a5f88d1 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/reorg_yolo.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/reorg_yolo.cpp
@@ -3,7 +3,6 @@
 //
 
 #include "intel_gpu/plugin/program_builder.hpp"
-#include "intel_gpu/plugin/common_utils.hpp"
 
 #include "openvino/op/reorg_yolo.hpp"
 
diff --git a/src/plugins/intel_gpu/src/plugin/ops/reshape.cpp b/src/plugins/intel_gpu/src/plugin/ops/reshape.cpp
index 7e98d79583cc07..c0719243d42b71 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/reshape.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/reshape.cpp
@@ -3,7 +3,6 @@
 //
 
 #include "intel_gpu/plugin/program_builder.hpp"
-#include "intel_gpu/plugin/common_utils.hpp"
 
 #include "openvino/op/reshape.hpp"
 #include "openvino/op/squeeze.hpp"
@@ -12,7 +11,6 @@
 #include "openvino/core/validation_util.hpp"
 
 #include "intel_gpu/primitives/reshape.hpp"
-#include "intel_gpu/primitives/reorder.hpp"
 
 namespace ov {
 namespace intel_gpu {
@@ -25,68 +23,36 @@ static void CreateCommonReshapeOp(ProgramBuilder& p, const std::shared_ptr<ov::N
     auto input_pshape = op->get_input_partial_shape(0);
     auto output_pshape = op->get_output_partial_shape(0);
 
-    if (p.use_new_shape_infer() || op->is_dynamic()) {
-        std::shared_ptr<cldnn::reshape> reshape_prim = nullptr;
-        auto second_const_input = op->get_input_size() == 2 ? std::dynamic_pointer_cast<ov::op::v0::Constant>(op->get_input_node_shared_ptr(1)) : nullptr;
-        std::vector<int64_t> output_pattern = {};
-        if (second_const_input != nullptr) {
-            output_pattern = second_const_input->cast_vector<int64_t>();
-            if (mode == cldnn::reshape::reshape_mode::unsqueeze) {
-                ov::util::try_normalize_axes(output_pattern, op->get_output_partial_shape(0).rank(), *op);
-            } else if (mode == cldnn::reshape::reshape_mode::squeeze) {
-                ov::util::try_normalize_axes(output_pattern, op->get_input_partial_shape(0).rank(), *op);
-            }
-        }
-
-        // If second input is absent (it's optional in Squeeze op) or it's constant, create reshape with single input and compile time out pattern
-        if (op->get_input_size() == 1 || second_const_input != nullptr) {
-            reshape_prim = std::make_shared<cldnn::reshape>(layerName,
-                                                            inputs[0],
-                                                            special_zero,
-                                                            output_pattern,
-                                                            output_pshape,
-                                                            mode);
-        } else {
-            reshape_prim = std::make_shared<cldnn::reshape>(layerName,
-                                                            inputs[0],
-                                                            inputs[1],
-                                                            special_zero,
-                                                            output_pshape,
-                                                            mode);
+    std::shared_ptr<cldnn::reshape> reshape_prim = nullptr;
+    auto second_const_input = op->get_input_size() == 2 ? std::dynamic_pointer_cast<ov::op::v0::Constant>(op->get_input_node_shared_ptr(1)) : nullptr;
+    std::vector<int64_t> output_pattern = {};
+    if (second_const_input != nullptr) {
+        output_pattern = second_const_input->cast_vector<int64_t>();
+        if (mode == cldnn::reshape::reshape_mode::unsqueeze) {
+            ov::util::try_normalize_axes(output_pattern, op->get_output_partial_shape(0).rank(), *op);
+        } else if (mode == cldnn::reshape::reshape_mode::squeeze) {
+            ov::util::try_normalize_axes(output_pattern, op->get_input_partial_shape(0).rank(), *op);
         }
+    }
 
-        p.add_primitive(*op, reshape_prim);
+    // If second input is absent (it's optional in Squeeze op) or it's constant, create reshape with single input and compile time out pattern
+    if (op->get_input_size() == 1 || second_const_input != nullptr) {
+        reshape_prim = std::make_shared<cldnn::reshape>(layerName,
+                                                        inputs[0],
+                                                        special_zero,
+                                                        output_pattern,
+                                                        output_pshape,
+                                                        mode);
     } else {
-        OPENVINO_ASSERT(input_pshape.is_static() && output_pshape.is_static(), "Dynamic shapes are not supported for Reshape operation yet");
-
-        auto outTensor = tensor_from_dims(output_pshape.to_shape());
-
-        // if we convert from or to 5D/6D, additional reorder also required to change format
-        cldnn::input_info reshape_input = inputs[0];
-        if (input_pshape.size() != output_pshape.size()) {
-            cldnn::primitive_id reorderId = "reorder:" + op->get_friendly_name() + "_reorder";
-            cldnn::format outputFormat = cldnn::format::bfyx;
-
-            switch (output_pshape.size()) {
-            case 5: outputFormat = cldnn::format::bfzyx; break;
-            case 6: outputFormat = cldnn::format::bfwzyx; break;
-            default: break;
-            }
-
-            cldnn::layout outputLayout(cldnn::element_type_to_data_type(op->get_output_element_type(0)), outputFormat, outTensor);
-            p.add_primitive(*op, cldnn::reorder(reorderId,
-                                                reshape_input,
-                                                outputLayout));
-            reshape_input = cldnn::input_info(reorderId);
-        }
-
-        auto reshapePrim = cldnn::reshape(layerName,
-                                        reshape_input,
-                                        outTensor,
-                                        mode);
-
-        p.add_primitive(*op, reshapePrim);
+        reshape_prim = std::make_shared<cldnn::reshape>(layerName,
+                                                        inputs[0],
+                                                        inputs[1],
+                                                        special_zero,
+                                                        output_pshape,
+                                                        mode);
     }
+
+    p.add_primitive(*op, reshape_prim);
 }
 
 static void CreateReshapeOp(ProgramBuilder& p, const std::shared_ptr<ov::op::v1::Reshape>& op) {
diff --git a/src/plugins/intel_gpu/src/plugin/ops/result.cpp b/src/plugins/intel_gpu/src/plugin/ops/result.cpp
index 4172f56e483af3..8adc239d78aec4 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/result.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/result.cpp
@@ -3,15 +3,10 @@
 //
 
 #include "openvino/op/result.hpp"
-#include "openvino/op/nv12_to_rgb.hpp"
-#include "openvino/op/nv12_to_bgr.hpp"
-#include "openvino/op/i420_to_rgb.hpp"
-#include "openvino/op/i420_to_bgr.hpp"
 
 #include "intel_gpu/plugin/program_builder.hpp"
 #include "intel_gpu/plugin/common_utils.hpp"
 #include "intel_gpu/primitives/reorder.hpp"
-#include "transformations/utils/utils.hpp"
 
 namespace ov {
 namespace intel_gpu {
diff --git a/src/plugins/intel_gpu/src/plugin/ops/reverse.cpp b/src/plugins/intel_gpu/src/plugin/ops/reverse.cpp
index 1ae2e96c7c0c28..fbb878fb8d6957 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/reverse.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/reverse.cpp
@@ -1,10 +1,9 @@
-// Copyright (C) 2022 Intel Corporation
+// Copyright (C) 2022-2024 Intel Corporation
 // SPDX-License-Identifier: Apache-2.0
 //
 
 #include "openvino/op/reverse.hpp"
 
-#include "intel_gpu/plugin/common_utils.hpp"
 #include "intel_gpu/plugin/program_builder.hpp"
 #include "intel_gpu/primitives/reverse.hpp"
 
@@ -15,10 +14,8 @@ static void CreateReverseOp(ProgramBuilder& p, const std::shared_ptr<ov::op::v1:
     validate_inputs_count(op, {2});
     const auto inputs = p.GetInputInfo(op);
     const auto layer_name = layer_type_name_ID(op);
-    const auto mode =
-        op->get_mode() == ov::op::v1::Reverse::Mode::INDEX ? cldnn::reverse_mode::index : cldnn::reverse_mode::mask;
 
-    const cldnn::reverse reverse{layer_name, inputs[0], inputs[1], mode};
+    const cldnn::reverse reverse{layer_name, inputs[0], inputs[1], op->get_mode()};
 
     p.add_primitive(*op, reverse);
 }
diff --git a/src/plugins/intel_gpu/src/plugin/ops/reverse_sequence.cpp b/src/plugins/intel_gpu/src/plugin/ops/reverse_sequence.cpp
index 425e234e1f1489..9e80dd9201c74e 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/reverse_sequence.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/reverse_sequence.cpp
@@ -3,7 +3,6 @@
 //
 
 #include "intel_gpu/plugin/program_builder.hpp"
-#include "intel_gpu/plugin/common_utils.hpp"
 
 #include "openvino/op/reverse_sequence.hpp"
 
diff --git a/src/plugins/intel_gpu/src/plugin/ops/rnn.cpp b/src/plugins/intel_gpu/src/plugin/ops/rnn.cpp
index 713e24fe7571bd..b6aed333c07727 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/rnn.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/rnn.cpp
@@ -64,7 +64,7 @@ void GetLSTMActivationParams(const std::shared_ptr<T>& op,
 
 static void CreateLSTMCellOp(ProgramBuilder& p, const std::shared_ptr<ov::op::v4::LSTMCell>& op) {
     validate_inputs_count(op, {6});
-    int lstm_batch_size, lstm_input_size, lstm_hidden_size;
+    int lstm_batch_size, lstm_hidden_size;
     auto inputs = p.GetInputInfo(op);
 
     std::string layerName = layer_type_name_ID(op);
@@ -77,11 +77,6 @@ static void CreateLSTMCellOp(ProgramBuilder& p, const std::shared_ptr<ov::op::v4
         const auto in0_pshape = op->get_input_partial_shape(0);
         const auto out0_pshape = op->get_output_partial_shape(0);
 
-        if (in0_pshape[in0_pshape.size() - 1].is_static())
-            lstm_input_size = in0_pshape[in0_pshape.size() - 1].get_length();
-        else
-            lstm_input_size = -1;
-
         if (in0_pshape[in0_pshape.size() - 2].is_static())
             lstm_batch_size = in0_pshape[in0_pshape.size() - 2].get_length();
         else
@@ -98,128 +93,62 @@ static void CreateLSTMCellOp(ProgramBuilder& p, const std::shared_ptr<ov::op::v4
     GetLSTMActivationParams(op, activations, activation_params);
     float clip = op->get_clip();
 
-    if (p.use_new_shape_infer()) {
-        cldnn::primitive_id input_concatID = layerName + "_inputConcat";
-        p.add_primitive(*op, cldnn::concatenation(input_concatID, { inputs[0], inputs[1] }, 1));
-
-        cldnn::primitive_id lstm_fc_id = layerName + "_fully_connected";
-        cldnn::primitive_id lstm_elt_id = layerName + "_lstm_elt";
-        cldnn::primitive_id wr_concat_id = layerName + "_WRconcat";
-        p.add_primitive(*op, cldnn::concatenation(wr_concat_id, { inputs[3], inputs[4] }, 1));
-        p.add_primitive(*op, cldnn::fully_connected(lstm_fc_id, cldnn::input_info(input_concatID), wr_concat_id, bias.pid));
-        p.add_primitive(*op, cldnn::lstm_elt(lstm_elt_id, cldnn::input_info(lstm_fc_id), inputs[2].pid, clip, 0, activations,
-                                            activation_params, cldnn::lstm_weights_order::fizo, 0));
-
-        auto outSz = op->get_output_partial_shape(0);
-        std::vector<int64_t> outSzPt;
-        for (auto pshape : outSz) {
-            if (pshape.is_static())
-                outSzPt.push_back(pshape.get_length());
-            else
-                outSzPt.push_back(-1);
-        }
+    cldnn::primitive_id input_concatID = layerName + "_inputConcat";
+    p.add_primitive(*op, cldnn::concatenation(input_concatID, { inputs[0], inputs[1] }, 1));
 
-        cldnn::crop_ngraph_op_mode op_mode = cldnn::crop_ngraph_op_mode::split;
-        size_t num_splits = 2;
-        cldnn::tensor hiddenSz = cldnn::tensor{ lstm_batch_size, 1, lstm_hidden_size, 1 };
-
-        cldnn::primitive_id outputHiddenCropID = layerName + "_hc";
-        cldnn::primitive_id outputHiddenID = layerName + ".out0";
-        cldnn::primitive_id outputDataID = layerName + "_data";
-
-        cldnn::layout constLayout = cldnn::layout({}, cldnn::data_types::i64, cldnn::format::bfyx);
-        cldnn::memory::ptr data_mem = p.get_engine().allocate_memory(constLayout, false);
-        auto& stream = p.get_engine().get_service_stream();
-        cldnn::mem_lock<char> lock{data_mem, stream};
-        auto buf = lock.data();
-        const int64_t axis = 1;
-        std::memcpy(&buf[0], &axis, constLayout.bytes_count());
-        p.add_primitive(*op,  cldnn::data(outputDataID, data_mem));
-
-        p.add_primitive(*op,
-                        cldnn::crop(outputHiddenCropID,
-                        {cldnn::input_info(lstm_elt_id), cldnn::input_info(outputDataID)},
-                        hiddenSz,
-                        cldnn::tensor{0, 0, 0, 0},
-                        op_mode, 0, axis, num_splits));
-        p.add_primitive(*op, cldnn::reshape(outputHiddenID, cldnn::input_info(outputHiddenCropID),
-                        false, outSzPt, op->get_output_partial_shape(0)), {layerName});
-
-        cldnn::primitive_id outputCellCropID = layerName + "_cc";
-        cldnn::primitive_id outputCellID = layerName + ".out1";
-        p.add_primitive(*op,
-                        cldnn::crop(outputCellCropID,
-                        {cldnn::input_info(lstm_elt_id), cldnn::input_info(outputDataID)},
-                        hiddenSz,
-                        cldnn::tensor{0, 1, 0, 0},
-                        op_mode, 1, axis, num_splits));
-        p.add_primitive(*op, cldnn::reshape(outputCellID, cldnn::input_info(outputCellCropID),
-                        false, outSzPt, op->get_output_partial_shape(1)));
-    } else {
-        //  LSTM primitive works with single precision for all in/out/weights tensors
-        auto lstm_dtype = cldnn::element_type_to_data_type(op->get_output_element_type(0));
-
-        cldnn::primitive_id inReshapeID = layerName + "_inReshape";
-        cldnn::primitive_id permuteID = layerName + "_inputReorder";
-        cldnn::primitive_id inHiddenReshapeID = layerName + "_inHiddenReshape";
-        cldnn::primitive_id inHiddenReorderID = layerName + "_inHiddenReorder";
-        cldnn::primitive_id gemmReshapeID = layerName + "_gemmReshape";
-        cldnn::primitive_id gemmReorderID = layerName + "_gemmReorder";
-        cldnn::primitive_id input_concatID = layerName + "_inputConcat";
-
-        cldnn::tensor inputShape = { lstm_batch_size, 1, lstm_input_size, 1 };
-        cldnn::tensor inStateShape = { lstm_batch_size, 1, lstm_hidden_size, 1 };
-        cldnn::layout inputLayout = cldnn::layout(lstm_dtype, cldnn::format::bfyx, inputShape);
-        cldnn::layout hiddenLayout = cldnn::layout(lstm_dtype, cldnn::format::bfyx, inStateShape);
-        p.add_primitive(*op, cldnn::reshape(inReshapeID, inputs[0], inputShape));
-        p.add_primitive(*op, cldnn::reorder(permuteID, inReshapeID, inputLayout));
-
-
-        std::string hiddenInResh = inHiddenReshapeID + "_1";
-        std::string hiddenInStr = inHiddenReorderID + "_1";
-        std::string cellInResh = inHiddenReshapeID + "_2";
-        std::string cellInStr = inHiddenReorderID + "_2";
-        p.add_primitive(*op, cldnn::reshape(hiddenInResh, inputs[1], inStateShape));
-        p.add_primitive(*op, cldnn::reorder(hiddenInStr, cldnn::input_info(hiddenInResh), hiddenLayout));
-        p.add_primitive(*op, cldnn::reshape(cellInResh, inputs[2], inStateShape));
-        p.add_primitive(*op, cldnn::reorder(cellInStr, cldnn::input_info(cellInResh), hiddenLayout));
-        p.add_primitive(*op, cldnn::concatenation(input_concatID,
-                                                { permuteID, hiddenInStr },
-                                                3));
-
-        cldnn::tensor gemmSz = cldnn::tensor{ lstm_batch_size, 1, 4 * lstm_hidden_size, 1 };
-        cldnn::layout gemmLayout = cldnn::layout(lstm_dtype, cldnn::format::bfyx, gemmSz);
-        cldnn::tensor hiddenSz = cldnn::tensor{ lstm_batch_size, 1, lstm_hidden_size, 1 };
-        cldnn::tensor cellCropSz = cldnn::tensor{0, 1, 0, 0};
-
-        std::string lstm_fc_id = layerName + "_fully_connected";
-        std::string lstm_elt_id = layerName + "_lstm_elt";
-
-        cldnn::primitive_id WRconcatID = layerName + "_WRconcat";
-        p.add_primitive(*op, cldnn::concatenation(WRconcatID, { weight, recurrent }, 1));
-
-        cldnn::primitive_id FCInputReshapeID = "Reshape_bf_" + lstm_fc_id + "_for_input";
-        cldnn::tensor FCInputReshapeSz = { lstm_batch_size, inputShape.spatial[0] + inStateShape.spatial[0], 1, 1 };
-        p.add_primitive(*op, cldnn::reshape(FCInputReshapeID, cldnn::input_info(input_concatID), FCInputReshapeSz));
-
-        p.add_primitive(*op, cldnn::fully_connected(lstm_fc_id, cldnn::input_info(FCInputReshapeID), WRconcatID, bias.pid));
-        p.add_primitive(*op, cldnn::reshape(gemmReshapeID, cldnn::input_info(lstm_fc_id), gemmSz));
-        p.add_primitive(*op, cldnn::reorder(gemmReorderID, cldnn::input_info(gemmReshapeID), gemmLayout));
-        p.add_primitive(*op, cldnn::lstm_elt(lstm_elt_id, cldnn::input_info(gemmReorderID), cellInStr, clip, 0, activations,
-                                            activation_params, cldnn::lstm_weights_order::fizo, 0));
-
-
-        cldnn::tensor outSz = cldnn::tensor{ lstm_batch_size, lstm_hidden_size, 1, 1 };
-        cldnn::primitive_id outputHiddenCropID = layerName + "_hc";
-        cldnn::primitive_id outputHiddenID = layerName + ".out0";
-        p.add_primitive(*op, cldnn::crop(outputHiddenCropID, cldnn::input_info(lstm_elt_id), hiddenSz, cldnn::tensor{0, 0, 0, 0}));
-        p.add_primitive(*op, cldnn::reshape(outputHiddenID, cldnn::input_info(outputHiddenCropID), outSz), {layerName});
-
-        cldnn::primitive_id outputCellCropID = layerName + "_cc";
-        cldnn::primitive_id outputCellID = layerName + ".out1";
-        p.add_primitive(*op, cldnn::crop(outputCellCropID, cldnn::input_info(lstm_elt_id), hiddenSz, cellCropSz));
-        p.add_primitive(*op, cldnn::reshape(outputCellID, cldnn::input_info(outputCellCropID), outSz));
+    cldnn::primitive_id lstm_fc_id = layerName + "_fully_connected";
+    cldnn::primitive_id lstm_elt_id = layerName + "_lstm_elt";
+    cldnn::primitive_id wr_concat_id = layerName + "_WRconcat";
+    p.add_primitive(*op, cldnn::concatenation(wr_concat_id, { inputs[3], inputs[4] }, 1));
+    p.add_primitive(*op, cldnn::fully_connected(lstm_fc_id, cldnn::input_info(input_concatID), wr_concat_id, bias.pid));
+    p.add_primitive(*op, cldnn::lstm_elt(lstm_elt_id, cldnn::input_info(lstm_fc_id), inputs[2].pid, clip, 0, activations,
+                                        activation_params, cldnn::lstm_weights_order::fizo, 0));
+
+    auto outSz = op->get_output_partial_shape(0);
+    std::vector<int64_t> outSzPt;
+    for (auto pshape : outSz) {
+        if (pshape.is_static())
+            outSzPt.push_back(pshape.get_length());
+        else
+            outSzPt.push_back(-1);
     }
+
+    cldnn::crop_ngraph_op_mode op_mode = cldnn::crop_ngraph_op_mode::split;
+    size_t num_splits = 2;
+    cldnn::tensor hiddenSz = cldnn::tensor{ lstm_batch_size, 1, lstm_hidden_size, 1 };
+
+    cldnn::primitive_id outputHiddenCropID = layerName + "_hc";
+    cldnn::primitive_id outputHiddenID = layerName + ".out0";
+    cldnn::primitive_id outputDataID = layerName + "_data";
+
+    cldnn::layout constLayout = cldnn::layout({}, cldnn::data_types::i64, cldnn::format::bfyx);
+    cldnn::memory::ptr data_mem = p.get_engine().allocate_memory(constLayout, false);
+    auto& stream = p.get_engine().get_service_stream();
+    cldnn::mem_lock<char> lock{data_mem, stream};
+    auto buf = lock.data();
+    const size_t axis = 1;
+    std::memcpy(&buf[0], &axis, constLayout.bytes_count());
+    p.add_primitive(*op,  cldnn::data(outputDataID, data_mem));
+
+    p.add_primitive(*op,
+                    cldnn::crop(outputHiddenCropID,
+                    {cldnn::input_info(lstm_elt_id), cldnn::input_info(outputDataID)},
+                    hiddenSz,
+                    cldnn::tensor{0, 0, 0, 0},
+                    op_mode, 0, num_splits));
+    p.add_primitive(*op, cldnn::reshape(outputHiddenID, cldnn::input_info(outputHiddenCropID),
+                    false, outSzPt, op->get_output_partial_shape(0)), {layerName});
+
+    cldnn::primitive_id outputCellCropID = layerName + "_cc";
+    cldnn::primitive_id outputCellID = layerName + ".out1";
+    p.add_primitive(*op,
+                    cldnn::crop(outputCellCropID,
+                    {cldnn::input_info(lstm_elt_id), cldnn::input_info(outputDataID)},
+                    hiddenSz,
+                    cldnn::tensor{0, 1, 0, 0},
+                    op_mode, 1, num_splits));
+    p.add_primitive(*op, cldnn::reshape(outputCellID, cldnn::input_info(outputCellCropID),
+                    false, outSzPt, op->get_output_partial_shape(1)));
 }
 
 static void CreateLSTMSequenceOp(ProgramBuilder& p, const std::shared_ptr<ov::op::v5::LSTMSequence>& op) {
diff --git a/src/plugins/intel_gpu/src/plugin/ops/roi_align.cpp b/src/plugins/intel_gpu/src/plugin/ops/roi_align.cpp
index 939f2ff926f953..41a926bceaae9b 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/roi_align.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/roi_align.cpp
@@ -5,7 +5,6 @@
 
 #include <memory>
 
-#include "intel_gpu/plugin/common_utils.hpp"
 #include "intel_gpu/plugin/program_builder.hpp"
 #include "intel_gpu/primitives/roi_align.hpp"
 
diff --git a/src/plugins/intel_gpu/src/plugin/ops/roi_pooling.cpp b/src/plugins/intel_gpu/src/plugin/ops/roi_pooling.cpp
index ae96297b645238..3479b0b22f7777 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/roi_pooling.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/roi_pooling.cpp
@@ -3,7 +3,6 @@
 //
 
 #include "intel_gpu/plugin/program_builder.hpp"
-#include "intel_gpu/plugin/common_utils.hpp"
 
 #include "openvino/op/roi_pooling.hpp"
 #include "openvino/op/psroi_pooling.hpp"
diff --git a/src/plugins/intel_gpu/src/plugin/ops/roll.cpp b/src/plugins/intel_gpu/src/plugin/ops/roll.cpp
index 5e6965430641bc..0e3f7fc512b3e7 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/roll.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/roll.cpp
@@ -6,7 +6,6 @@
 #include "openvino/op/constant.hpp"
 
 #include "intel_gpu/primitives/roll.hpp"
-#include "intel_gpu/plugin/common_utils.hpp"
 #include "intel_gpu/plugin/program_builder.hpp"
 
 namespace ov {
@@ -20,7 +19,6 @@ void CreateRollOp(ProgramBuilder& p, const std::shared_ptr<ov::op::v7::Roll>& op
     const auto inputs = p.GetInputInfo(op);
     const auto layer_name = layer_type_name_ID(op);
     const auto& op_friendly_name = op->get_friendly_name();
-    const auto& input_pshape = op->get_input_partial_shape(0);
 
     auto shift_constant = std::dynamic_pointer_cast<ov::op::v0::Constant>(op->get_input_node_shared_ptr(1));
     OPENVINO_ASSERT(shift_constant != nullptr, "[GPU] Unsupported parameter nodes type in ", op_friendly_name, " (", op->get_type_name(), ")");
@@ -30,41 +28,8 @@ void CreateRollOp(ProgramBuilder& p, const std::shared_ptr<ov::op::v7::Roll>& op
     OPENVINO_ASSERT(axes_constant != nullptr, "[GPU] Unsupported parameter nodes type in ", op_friendly_name, " (", op->get_type_name(), ")");
     auto axes_raw = axes_constant->cast_vector<int32_t>();
 
-    if (input_pshape.is_dynamic()) {
-        const cldnn::roll roll_prim(layer_name, inputs.front(), shift_raw, axes_raw);
-        p.add_primitive(*op, roll_prim);
-    } else {
-        const auto& input_shape = input_pshape.to_shape();
-        const auto rank = static_cast<int>(input_shape.size());
-        const auto format = cldnn::format::get_default_format(rank);
-        const auto default_rank = format.dimension();
-
-        // Normalize axes and sum shift
-        std::vector<int32_t> shift(default_rank);
-        for (size_t a = 0; a < axes_raw.size(); ++a) {
-            auto& axis = axes_raw[a];
-            if (axis < 0) {
-                axis += rank;
-            }
-            if (axis < 0 || axis >= rank) {
-                OPENVINO_THROW(op_friendly_name, " Incorrect axis value: ", axis);
-            }
-            shift[axis] += shift_raw[a];
-        }
-
-        // Normalize shift
-        for (int s = 0; s < rank; ++s) {
-            auto& sh = shift[s];
-            const auto dim = static_cast<int32_t>(input_shape[s]);
-            sh %= dim;
-            if (sh < 0) {
-                sh += dim;
-            }
-        }
-
-        const cldnn::roll roll_prim(layer_name, inputs.front(), {format, shift});
-        p.add_primitive(*op, roll_prim);
-    }
+    const cldnn::roll roll_prim(layer_name, inputs.front(), shift_raw, axes_raw);
+    p.add_primitive(*op, roll_prim);
 }
 
 }  // namespace
diff --git a/src/plugins/intel_gpu/src/plugin/ops/scatter_elements_update.cpp b/src/plugins/intel_gpu/src/plugin/ops/scatter_elements_update.cpp
index 1a5d8424e0a402..ddb5b07424d3cb 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/scatter_elements_update.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/scatter_elements_update.cpp
@@ -2,7 +2,6 @@
 // SPDX-License-Identifier: Apache-2.0
 //
 
-#include "intel_gpu/plugin/common_utils.hpp"
 #include "intel_gpu/plugin/program_builder.hpp"
 #include "intel_gpu/primitives/scatter_elements_update.hpp"
 #include "openvino/core/validation_util.hpp"
diff --git a/src/plugins/intel_gpu/src/plugin/ops/scatter_nd_update.cpp b/src/plugins/intel_gpu/src/plugin/ops/scatter_nd_update.cpp
index 21ccfe9de650bd..8e60622fd21212 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/scatter_nd_update.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/scatter_nd_update.cpp
@@ -3,11 +3,7 @@
 //
 
 #include "intel_gpu/plugin/program_builder.hpp"
-#include "intel_gpu/plugin/common_utils.hpp"
-
 #include "openvino/op/scatter_nd_update.hpp"
-#include "openvino/op/constant.hpp"
-
 #include "intel_gpu/primitives/scatter_nd_update.hpp"
 
 namespace ov {
diff --git a/src/plugins/intel_gpu/src/plugin/ops/scatter_update.cpp b/src/plugins/intel_gpu/src/plugin/ops/scatter_update.cpp
index a7e145dde1cae9..4b7e909e5702ab 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/scatter_update.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/scatter_update.cpp
@@ -3,7 +3,6 @@
 //
 
 #include "intel_gpu/plugin/program_builder.hpp"
-#include "intel_gpu/plugin/common_utils.hpp"
 
 #include "openvino/op/scatter_update.hpp"
 #include "openvino/op/constant.hpp"
diff --git a/src/plugins/intel_gpu/src/plugin/ops/select.cpp b/src/plugins/intel_gpu/src/plugin/ops/select.cpp
index 58e8c47d699942..077322ffa559f9 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/select.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/select.cpp
@@ -3,13 +3,10 @@
 //
 
 #include "intel_gpu/plugin/program_builder.hpp"
-#include "intel_gpu/plugin/common_utils.hpp"
 
 #include "openvino/op/select.hpp"
 
 #include "intel_gpu/primitives/select.hpp"
-#include "intel_gpu/primitives/reorder.hpp"
-#include "intel_gpu/primitives/reshape.hpp"
 
 namespace ov {
 namespace intel_gpu {
@@ -19,9 +16,6 @@ static void CreateSelectOp(ProgramBuilder& p, const std::shared_ptr<ov::op::v1::
     auto inputs = p.GetInputInfo(op);
     std::string layerName = layer_type_name_ID(op);
 
-    auto output_pshape = op->get_output_partial_shape(0);
-    auto output_rank = output_pshape.size();
-
     auto broadcast_type = op->get_auto_broadcast();
 
     if (broadcast_type.m_type != ov::op::AutoBroadcastType::NONE &&
@@ -29,50 +23,6 @@ static void CreateSelectOp(ProgramBuilder& p, const std::shared_ptr<ov::op::v1::
         OPENVINO_THROW("[GPU] Unsupported broadcast type (", broadcast_type.m_type, ") in layer " + op->get_friendly_name());
     }
 
-    if (broadcast_type.m_type == ov::op::AutoBroadcastType::NUMPY) {
-        // Preprocess inputs
-        for (size_t i = 0; i < inputs.size(); ++i) {
-            auto input_pshape = op->get_input_partial_shape(i);
-
-            if (input_pshape.is_static() && !p.use_new_shape_infer()) {
-                auto input_shape = input_pshape.to_shape();
-                auto input_rank = input_shape.size();
-
-                // Add reorder if changing number of dimensions requires changing format
-                auto targetFormat = cldnn::format::get_default_format(output_rank);
-
-                if (targetFormat.value != cldnn::format::get_default_format(input_rank).value) {
-                    auto reorderName = layerName + "_cldnn_in" + std::to_string(i) + "_reorder";
-                    auto targetDatatype = cldnn::element_type_to_data_type(op->get_input_element_type(i));
-                    auto reorderPrim = cldnn::reorder(reorderName,
-                                                      inputs[i],
-                                                      targetFormat,
-                                                      targetDatatype);
-
-                    p.add_primitive(*op, reorderPrim);
-
-                    inputs[i] = cldnn::input_info(reorderName);
-                }
-
-                // Reshape input if they differ or select specific shape matches default one
-                if (input_rank != output_rank || input_rank < 4) {
-                    auto reshapeName = layerName + "_cldnn_in" + std::to_string(i) + "_reshape";
-
-                    // Extend input dimensions to the same size as output dimensions by prepending ones
-                    input_shape.insert(input_shape.begin(), output_rank - input_rank, 1ul);
-
-                    auto targetShape = tensor_from_dims(input_shape);
-
-                    auto reshapePrim = cldnn::reshape(reshapeName, inputs[i], targetShape);
-
-                    p.add_primitive(*op, reshapePrim);
-
-                    inputs[i] = cldnn::input_info(reshapeName);
-                }
-            }
-        }
-    }
-
     auto selectPrim = cldnn::select(layerName,
                                     inputs[0],
                                     inputs[1],
diff --git a/src/plugins/intel_gpu/src/plugin/ops/shape_of.cpp b/src/plugins/intel_gpu/src/plugin/ops/shape_of.cpp
index 0229cff5484a46..bc23f2c49188f4 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/shape_of.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/shape_of.cpp
@@ -3,7 +3,6 @@
 //
 
 #include "intel_gpu/plugin/program_builder.hpp"
-#include "intel_gpu/plugin/common_utils.hpp"
 
 #include "openvino/op/shape_of.hpp"
 
@@ -18,8 +17,8 @@ static void CreateShapeOfOpCommon(ProgramBuilder& p, const std::shared_ptr<ov::N
     const std::string layerName = layer_type_name_ID(op);
 
     const auto primitive = cldnn::shape_of(layerName,
-                                     inputs[0],
-                                     cldnn::element_type_to_data_type(op->get_output_element_type(0)));
+                                           inputs[0],
+                                           cldnn::element_type_to_data_type(op->get_output_element_type(0)));
 
     p.add_primitive(*op, primitive);
 }
diff --git a/src/plugins/intel_gpu/src/plugin/ops/shuffle_channels.cpp b/src/plugins/intel_gpu/src/plugin/ops/shuffle_channels.cpp
index 10590ad66a0acf..e3ed1a67fce035 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/shuffle_channels.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/shuffle_channels.cpp
@@ -2,7 +2,6 @@
 // SPDX-License-Identifier: Apache-2.0
 //
 
-#include "intel_gpu/plugin/common_utils.hpp"
 #include "intel_gpu/plugin/program_builder.hpp"
 #include "intel_gpu/primitives/shuffle_channels.hpp"
 #include "openvino/core/validation_util.hpp"
diff --git a/src/plugins/intel_gpu/src/plugin/ops/slice.cpp b/src/plugins/intel_gpu/src/plugin/ops/slice.cpp
index 52d53f4bba832d..3c02d33040c12b 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/slice.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/slice.cpp
@@ -3,7 +3,6 @@
 //
 
 #include "intel_gpu/plugin/program_builder.hpp"
-#include "intel_gpu/plugin/common_utils.hpp"
 
 #include "openvino/op/slice.hpp"
 
diff --git a/src/plugins/intel_gpu/src/plugin/ops/softmax.cpp b/src/plugins/intel_gpu/src/plugin/ops/softmax.cpp
index a7daf5fbc30cc9..b1b7833eb33dd1 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/softmax.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/softmax.cpp
@@ -2,7 +2,6 @@
 // SPDX-License-Identifier: Apache-2.0
 //
 
-#include "intel_gpu/plugin/common_utils.hpp"
 #include "intel_gpu/plugin/program_builder.hpp"
 #include "intel_gpu/primitives/activation.hpp"
 #include "intel_gpu/primitives/softmax.hpp"
diff --git a/src/plugins/intel_gpu/src/plugin/ops/space_to_batch.cpp b/src/plugins/intel_gpu/src/plugin/ops/space_to_batch.cpp
index 5a155a1ede2381..1cb5fcd6754dcd 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/space_to_batch.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/space_to_batch.cpp
@@ -21,8 +21,8 @@ static void CreateSpaceToBatchOp(ProgramBuilder& p, const std::shared_ptr<ov::op
     auto rank = op->get_input_partial_shape(0).size();
     auto format = cldnn::format::get_default_format(rank);
 
-    std::vector<cldnn::tensor> tensor_inputs;
-    tensor_inputs.reserve(3);
+    std::vector<std::vector<int32_t>> const_inputs;
+    const_inputs.reserve(3);
 
     bool non_constant_input = false;
     for (size_t i = 1; i < 4; ++i) {
@@ -37,32 +37,20 @@ static void CreateSpaceToBatchOp(ProgramBuilder& p, const std::shared_ptr<ov::op
         }
     }
 
-    // In case of dynamic shapes pass dummy shape value to space_to_batch primitive
-    // To be removed once we enable internal shape infer for all operations
-    auto output_pshape = op->get_output_partial_shape(0);
-    auto out_size = output_pshape.is_static() ? tensor_from_dims(output_pshape.to_shape()) : cldnn::tensor();
-
     if (non_constant_input) {
-        auto spaceToBatchPrim = cldnn::space_to_batch(layerName, inputs, out_size);
+        auto spaceToBatchPrim = cldnn::space_to_batch(layerName, inputs);
         p.add_primitive(*op, spaceToBatchPrim);
     } else {
         for (size_t i = 1; i < 4; ++i) {
-            auto inConst = std::dynamic_pointer_cast<ov::op::v0::Constant>(op->get_input_node_shared_ptr(i));
-
-            std::vector<int32_t> sizes = inConst->cast_vector<int32_t>();
-            int32_t default_size = i == 1 ? 1 : 0;
-            for (size_t s = sizes.size(); s < format.dimension(); s++) {
-                sizes.push_back(default_size);
-            }
-            tensor_inputs.emplace_back(format, sizes, default_size);
+            auto in_const = std::dynamic_pointer_cast<ov::op::v0::Constant>(op->get_input_node_shared_ptr(i));
+            const_inputs.emplace_back(in_const->cast_vector<int32_t>());
         }
 
         auto spaceToBatchPrim = cldnn::space_to_batch(layerName,
                                                       inputs[0],            // input data
-                                                      tensor_inputs[0],     // block_shape
-                                                      tensor_inputs[1],     // crops_begin
-                                                      tensor_inputs[2],     // crops_end
-                                                      out_size);
+                                                      const_inputs[0],     // block_shape
+                                                      const_inputs[1],     // crops_begin
+                                                      const_inputs[2]);     // crops_end
 
         p.add_primitive(*op, spaceToBatchPrim);
     }
diff --git a/src/plugins/intel_gpu/src/plugin/ops/space_to_depth.cpp b/src/plugins/intel_gpu/src/plugin/ops/space_to_depth.cpp
index 75d29a2d5bcc10..a9cf916a16ff23 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/space_to_depth.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/space_to_depth.cpp
@@ -3,7 +3,6 @@
 //
 
 #include "intel_gpu/plugin/program_builder.hpp"
-#include "intel_gpu/plugin/common_utils.hpp"
 
 #include "openvino/op/space_to_depth.hpp"
 
diff --git a/src/plugins/intel_gpu/src/plugin/ops/split.cpp b/src/plugins/intel_gpu/src/plugin/ops/split.cpp
index 32f0c9a7f36e1d..30600e2aa2567f 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/split.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/split.cpp
@@ -35,78 +35,19 @@ static void CreateCommonSplitOp(ProgramBuilder& p, const std::shared_ptr<ov::Nod
     };
 
     auto inputs = p.GetInputInfo(op);
-    if (p.use_new_shape_infer() || op->is_dynamic()) {
-        std::vector<cldnn::tensor> offsets;
-
-        // op->is_dynamic() does not check if output shape is dynamic. it only check dynamism for input shapes
-        // Even if op->is_dynamic() is false, output shape can be dynamic.
-        // Thus, it is necessary to check if output shape is dynamic.
-        if (!IsDynamic(op)) {
-            auto input_pshape = op->get_input_partial_shape(0);
-            ov::Shape start_offset(input_pshape.size());
-            for (size_t i = 0; i < op->get_output_size(); i++) {
-                const auto outPartialShape = op->get_output_partial_shape(i);
-
-                auto offsetTensor = tensor_from_dims(start_offset, 0);
-                offsets.push_back(offsetTensor);
-
-                for (size_t idx = 0; idx < input_pshape.size(); idx++) {
-                    if (outPartialShape[idx] != input_pshape[idx]) {
-                        start_offset[idx] += outPartialShape.to_shape()[idx];
-                    }
-                }
-            }
-        }
+    std::vector<cldnn::tensor> offsets;
 
-        int64_t axis = -1;
-        auto const_axis = std::dynamic_pointer_cast<ov::op::v0::Constant>(op->get_input_node_shared_ptr(1));
-        if (const_axis) {
-            axis = ov::util::try_normalize_axis(const_axis->cast_vector<int64_t>()[0],
-                                                op->get_input_partial_shape(0).rank(),
-                                                *op);
-        }
-        cldnn::crop_ngraph_op_mode op_mode = cldnn::crop_ngraph_op_mode::variadic_split;
-        auto num_splits = static_cast<size_t>(1);
-        if (ov::is_type<ov::op::v1::Split>(op)) {
-            num_splits = ov::as_type_ptr<ov::op::v1::Split>(op)->get_num_splits();
-            op_mode = cldnn::crop_ngraph_op_mode::split;
-        }
-
-        for (size_t i = 0; i < op->get_output_size(); i++) {
-            const auto& users = op->get_output_target_inputs(i);
-            // don't add crop primitive if port is not used by anyone
-            if (users.size() == 0)
-                continue;
-            auto cropPrim = cldnn::crop(get_layer_name(i),
-                                        inputs,
-                                        cldnn::tensor(1),
-                                        (offsets.empty() ? cldnn::tensor(0) : offsets[i]),
-                                        op_mode,
-                                        static_cast<int>(i),
-                                        axis,
-                                        num_splits);
-            p.add_primitive(*op, cropPrim);
-        }
-    } else {
+    // op->is_dynamic() does not check if output shape is dynamic. it only check dynamism for input shapes
+    // Even if op->is_dynamic() is false, output shape can be dynamic.
+    // Thus, it is necessary to check if output shape is dynamic.
+    if (!IsDynamic(op)) {
         auto input_pshape = op->get_input_partial_shape(0);
         ov::Shape start_offset(input_pshape.size());
         for (size_t i = 0; i < op->get_output_size(); i++) {
             const auto outPartialShape = op->get_output_partial_shape(i);
-            if (outPartialShape.size() != start_offset.size()) {
-                OPENVINO_THROW("Invalid dimesions in split layer: ", op->get_friendly_name(),
-                               " output: ", op->get_output_tensor(i).get_any_name());
-            }
-            for (size_t idx = 0; idx < input_pshape.size(); idx++) {
-                if ((outPartialShape[idx].get_length() + static_cast<ov::Dimension::value_type>(start_offset[idx])) > input_pshape[idx].get_length()) {
-                    OPENVINO_THROW("Invalid dimesions in split layer: ", op->get_friendly_name(),
-                                   " output: ", op->get_output_tensor(idx).get_any_name());
-                }
-            }
 
             auto offsetTensor = tensor_from_dims(start_offset, 0);
-            auto outTensor = tensor_from_dims(op->get_output_shape(i), 1);
-            auto cropPrim = cldnn::crop(get_layer_name(i), inputs[0], outTensor, offsetTensor);
-            p.add_primitive(*op, cropPrim);
+            offsets.push_back(offsetTensor);
 
             for (size_t idx = 0; idx < input_pshape.size(); idx++) {
                 if (outPartialShape[idx] != input_pshape[idx]) {
@@ -115,6 +56,36 @@ static void CreateCommonSplitOp(ProgramBuilder& p, const std::shared_ptr<ov::Nod
             }
         }
     }
+
+    int64_t axis = -1;
+    auto const_axis = std::dynamic_pointer_cast<ov::op::v0::Constant>(op->get_input_node_shared_ptr(1));
+    if (const_axis) {
+        axis = ov::util::try_normalize_axis(const_axis->cast_vector<int64_t>()[0],
+                                            op->get_input_partial_shape(0).rank(),
+                                            *op);
+    }
+    cldnn::crop_ngraph_op_mode op_mode = cldnn::crop_ngraph_op_mode::variadic_split;
+    auto num_splits = static_cast<size_t>(1);
+    if (ov::is_type<ov::op::v1::Split>(op)) {
+        num_splits = ov::as_type_ptr<ov::op::v1::Split>(op)->get_num_splits();
+        op_mode = cldnn::crop_ngraph_op_mode::split;
+    }
+
+    for (size_t i = 0; i < op->get_output_size(); i++) {
+        const auto& users = op->get_output_target_inputs(i);
+        // don't add crop primitive if port is not used by anyone
+        if (users.size() == 0)
+            continue;
+        auto cropPrim = cldnn::crop(get_layer_name(i),
+                                    inputs,
+                                    cldnn::tensor(1),
+                                    (offsets.empty() ? cldnn::tensor(0) : offsets[i]),
+                                    op_mode,
+                                    static_cast<int>(i),
+                                    axis,
+                                    num_splits);
+        p.add_primitive(*op, cropPrim);
+    }
 }
 
 static void CreateSplitOp(ProgramBuilder& p, const std::shared_ptr<ov::op::v1::Split>& op) {
diff --git a/src/plugins/intel_gpu/src/plugin/ops/strided_slice.cpp b/src/plugins/intel_gpu/src/plugin/ops/strided_slice.cpp
index 1c7354a54140b1..f4766d77ef0b0d 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/strided_slice.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/strided_slice.cpp
@@ -3,14 +3,11 @@
 //
 
 #include "intel_gpu/plugin/program_builder.hpp"
-#include "intel_gpu/plugin/common_utils.hpp"
 
 #include "openvino/op/strided_slice.hpp"
 #include "openvino/op/constant.hpp"
 
 #include "intel_gpu/primitives/strided_slice.hpp"
-#include "intel_gpu/primitives/reshape.hpp"
-#include "intel_gpu/primitives/crop.hpp"
 
 #include <climits>
 
@@ -52,244 +49,21 @@ static void CreateStridedSliceOp(ProgramBuilder& p, const std::shared_ptr<ov::op
     auto stride_constant = std::dynamic_pointer_cast<ov::op::v0::Constant>(op->input_value(3).get_node_shared_ptr());
     std::vector<int64_t> strides = stride_constant ? stride_constant->cast_vector<int64_t>() : std::vector<int64_t>{};
 
-    do {
-        if (!begin_constant || !end_constant || !stride_constant || input_pshape.is_dynamic() || p.use_new_shape_infer()) {
-            break;
-        }
-
-        auto input_pshape = op->get_input_partial_shape(0);
-
-        if (input_pshape.is_dynamic() || output_pshape.is_dynamic())
-            return;
-
-        auto input_shape = input_pshape.to_shape();
-        auto output_shape = output_pshape.to_shape();
-
-        bool ones_stride = true;
-        for (auto & s : strides) {
-            if (s != 1)
-                ones_stride = false;
-        }
-
-        if (!ones_stride)
-            break;
-
-        auto convert_to_set = [](const std::vector<int64_t> mask) {
-            ov::AxisSet axis_set{};
-            for (size_t i = 0; i < static_cast<size_t>(mask.size()); ++i) {
-                if (mask[i] == 1) {
-                    axis_set.emplace(i);
-                }
-            }
-            return axis_set;
-        };
-
-        auto shrink_axis_mask = convert_to_set(op->get_shrink_axis_mask());
-        auto new_axis_mask = convert_to_set(op->get_new_axis_mask());
-        auto ellipsis_mask = convert_to_set(op->get_ellipsis_mask());
-        auto begin_mask = convert_to_set(op->get_begin_mask());
-        auto end_mask = convert_to_set(op->get_end_mask());
-
-        std::vector<size_t> reshape_pattern,
-                            axes,
-                            offset,
-                            dim;
-
-        size_t input_shape_idx = 0;
-        uint64_t uniq_id = 0;
-        for (size_t axis = 0; axis < begin.size(); ++axis) {
-            // add dimensions hidden under the ellipsis mask if ellipsis mask is set
-            if (ellipsis_mask.count(axis)) {
-                // only one bit in ellipsis mask is allowed
-                int num_new_axis_after_ellipses = 0;
-                int num_input_axis_before_ellipses = 0;
-                for (size_t i = 0; i < axis; ++i) {
-                    if (!new_axis_mask.count(i))
-                        num_input_axis_before_ellipses++;
-                }
-                for (size_t i = axis + 1; i < begin.size(); ++i) {
-                    if (new_axis_mask.count(i))
-                        num_new_axis_after_ellipses++;
-                }
-
-                // -1 because it's a position of ellipses
-                unsigned long num_input_axis_after_ellipses =
-                    static_cast<unsigned long>(begin.size() - axis - num_new_axis_after_ellipses - 1);
-                unsigned long num_of_hidden_dims =
-                    static_cast<unsigned long>(input_shape.size() - num_input_axis_after_ellipses
-                                                    - num_input_axis_before_ellipses);
-                for (size_t i = 0; i < num_of_hidden_dims; ++i) {
-                    axes.emplace_back(uniq_id);
-                    uniq_id++;
-                    reshape_pattern.emplace_back(input_shape[input_shape_idx]);
-                    offset.emplace_back(0);
-
-                    dim.emplace_back(input_shape[input_shape_idx]);
-                    input_shape_idx++;
-                }
-            } else {
-                // add new single dimension if new_axis_mask is set
-                if (new_axis_mask.count(axis)) {
-                    reshape_pattern.emplace_back(1);
-                    dim.emplace_back(1);
-                    offset.emplace_back(0);
-                } else if (shrink_axis_mask.count(axis)) {
-                    // skip this dimension if shrink_axis_mask is set (input_shape_idx++)
-                    reshape_pattern.emplace_back(1);
-                    dim.emplace_back(1);
-                    int64_t lb = begin[axis];
-                    if (lb < 0)
-                        lb = std::max(static_cast<int64_t>(input_shape[input_shape_idx]) + lb,
-                                        static_cast<int64_t>(0));
-                    offset.emplace_back(begin_mask.count(axis) ? 0 : lb);
-                    input_shape_idx++;
-                } else {
-                    // calculate dimension using begin, end, begin_mask, end_mask, stride
-                    reshape_pattern.emplace_back(input_shape[input_shape_idx]);
-
-                    int64_t lb = begin[axis];
-                    int64_t ub = end[axis];
-
-                    // convert negative indexes to positive
-                    if (lb < 0)
-                        lb = std::max(static_cast<int64_t>(input_shape[input_shape_idx]) + lb,
-                                        static_cast<int64_t>(0));
-                    if (ub < 0)
-                        ub = std::max(static_cast<int64_t>(input_shape[input_shape_idx]) + ub,
-                                        static_cast<int64_t>(0));
-
-                    // apply restrictions when begin or end values more/less than max/min possible values.
-                    lb = std::min(static_cast<int64_t>(input_shape[input_shape_idx]), lb);
-                    ub = std::min(static_cast<int64_t>(input_shape[input_shape_idx]), ub);
-
-                    offset.emplace_back(lb);
-
-                    // set default value for stride or use given value
-                    int64_t stride = 1;
-                    if (strides.size() > axis)
-                        stride = strides[axis];
-
-                    int64_t dimension = 0;
-                    if (stride < 0) {
-                        // apply masks
-                        if (begin_mask.count(axis))
-                            lb = static_cast<int64_t>(input_shape[input_shape_idx]) - 1;
-                        if (end_mask.count(axis))
-                            ub = -1;
-
-                        lb = std::min(lb, static_cast<int64_t>(input_shape[input_shape_idx]) - 1);
-                        lb -= 1;  // we always get 1st element, so we need decrease range
-                        if (ub <= lb)
-                            dimension = (ub - lb) / stride + 1;
-                    } else {
-                        // apply masks
-                        if (begin_mask.count(axis))
-                            lb = 0;
-                        if (end_mask.count(axis))
-                            ub = static_cast<int64_t>(input_shape[input_shape_idx]);
-
-                        lb += 1;  // we always get 1st element, so we need decrease range
-                        if (ub >= lb)
-                            dimension = (ub - lb) / stride + 1;
-                    }
-
-                    dim.emplace_back(dimension);
-                    input_shape_idx++;
-                }
-                axes.emplace_back(uniq_id);
-                uniq_id++;
-            }
-        }
-
-        for (; input_shape_idx < input_shape.size(); ++input_shape_idx) {
-            reshape_pattern.emplace_back(input_shape[input_shape_idx]);
-            offset.emplace_back(0);
-            dim.emplace_back(input_shape[input_shape_idx]);
-            axes.emplace_back(uniq_id);
-            uniq_id++;
-        }
-
-        if (axes.size() > 4) {
-            break;
-        }
-
-        auto inPrimitive = inputs[0];
-        // Reshape in case of new axis
-        if (!new_axis_mask.empty()) {
-            auto targetShape = tensor_from_dims(reshape_pattern);
-            auto reshapeInName = op->get_friendly_name() + "/Reshape_before";
-            auto reshapePrim = cldnn::reshape(reshapeInName, inputs[0], targetShape);
-            p.add_primitive(*op, reshapePrim);
-            inPrimitive = cldnn::input_info(reshapeInName);
-        }
-
-        auto data_output = op->input_value(0);
-        auto data_node_shape = data_output.get_shape();
-
-        std::vector<cldnn::tensor::value_type> offset_tensor{ 0, 0, 0, 0 };
-        for (size_t i = 0; i < axes.size(); i++) {
-            OPENVINO_ASSERT(axes[i] < 4, "[GPU] Invalid crop axis: ", axes[i], " in op ", op->get_friendly_name());
-            offset_tensor[axes[i]] = static_cast<cldnn::tensor::value_type>(offset[i]);
-        }
-
-        ov::Shape crop_shape(reshape_pattern);
-        for (size_t i = 0; i < axes.size(); ++i) {
-            crop_shape[axes[i]] = dim[i];
-        }
-
-        cldnn::tensor refSize = tensor_from_dims(crop_shape);
-        cldnn::tensor offSize = tensor_from_dims(offset, 0);
-
-        auto cropPrim = cldnn::crop(layerName, inPrimitive, refSize, offSize);
-        p.add_primitive(*op, cropPrim);
-        auto last_layer_primitive = layerName;
-
-        // Reshape in case of deleting of axis
-        if (!shrink_axis_mask.empty()) {
-            std::vector<int64_t> output_pattern(output_shape.size());
-            auto out_p = output_pattern.begin();
-            for (auto s = output_shape.begin(); s != output_shape.end() && out_p != output_pattern.end(); s++, out_p++) {
-                *out_p = *s;
-            }
-
-            auto reshapeOutName = op->get_friendly_name() + "/Crop";
-            auto reshapePrim = cldnn::reshape(reshapeOutName, layerName, false, output_pattern, output_pshape);
-            p.add_primitive(*op, reshapePrim);
-            last_layer_primitive = reshapeOutName;
-        }
-        return;
-    } while (false);
-
     // In case of dynamic shapes pass dummy shape value to strided_slice primitive
     // To be removed once we enable internal shape infer for all operations
     auto output_shape = output_pshape.is_static() ? output_pshape.to_shape() : ov::Shape{};
 
-    std::shared_ptr<cldnn::strided_slice> stridedSlicePrim = nullptr;
-    if (begin_constant && end_constant && stride_constant && !input_pshape.is_dynamic() && !output_pshape.is_dynamic() && !p.use_new_shape_infer()) {
-        stridedSlicePrim = std::make_shared<cldnn::strided_slice>(layerName,
-                                                                  inputs[0],
-                                                                  begin,
-                                                                  end,
-                                                                  strides,
-                                                                  op->get_begin_mask(),
-                                                                  op->get_end_mask(),
-                                                                  op->get_new_axis_mask(),
-                                                                  op->get_shrink_axis_mask(),
-                                                                  op->get_ellipsis_mask(),
-                                                                  output_shape);
-    } else {
-        stridedSlicePrim = std::make_shared<cldnn::strided_slice>(layerName,
-                                                                  inputs,
-                                                                  begin,
-                                                                  end,
-                                                                  strides,
-                                                                  op->get_begin_mask(),
-                                                                  op->get_end_mask(),
-                                                                  op->get_new_axis_mask(),
-                                                                  op->get_shrink_axis_mask(),
-                                                                  op->get_ellipsis_mask(),
-                                                                  output_shape);
-    }
+    auto stridedSlicePrim = std::make_shared<cldnn::strided_slice>(layerName,
+                                                                   inputs,
+                                                                   begin,
+                                                                   end,
+                                                                   strides,
+                                                                   op->get_begin_mask(),
+                                                                   op->get_end_mask(),
+                                                                   op->get_new_axis_mask(),
+                                                                   op->get_shrink_axis_mask(),
+                                                                   op->get_ellipsis_mask(),
+                                                                   output_shape);
     p.add_primitive(*op, stridedSlicePrim);
 }
 
diff --git a/src/plugins/intel_gpu/src/plugin/ops/swiglu.cpp b/src/plugins/intel_gpu/src/plugin/ops/swiglu.cpp
index d814e3449c3c72..9ca365dccfd0e0 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/swiglu.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/swiglu.cpp
@@ -23,27 +23,14 @@ static void CreateSwiGLUOp(ProgramBuilder& p, const std::shared_ptr<op::SwiGLU>&
     auto inputs = p.GetInputInfo(op);
     std::string primitive_name = layer_type_name_ID(op);
 
-    if (p.use_new_shape_infer()) {
-        auto prim = cldnn::swiglu(primitive_name,
-                                  inputs[0],
-                                  op->get_axis(),
-                                  op->get_split_lengths(),
-                                  op->get_glu_type(),
-                                  op->get_split_to_glu_idx(),
-                                  cldnn::tensor());
-        prim.output_data_types = get_output_data_types(op);
-        p.add_primitive(*op, prim);
-    } else {
-        auto prim = cldnn::swiglu(primitive_name,
-                                  inputs[0],
-                                  op->get_axis(),
-                                  op->get_split_lengths(),
-                                  op->get_glu_type(),
-                                  op->get_split_to_glu_idx(),
-                                  tensor_from_dims(op->get_output_shape(0)));
-        prim.output_data_types = get_output_data_types(op);
-        p.add_primitive(*op, prim);
-    }
+    auto prim = cldnn::swiglu(primitive_name,
+                                inputs[0],
+                                op->get_axis(),
+                                op->get_split_lengths(),
+                                op->get_glu_type(),
+                                op->get_split_to_glu_idx());
+    prim.output_data_types = get_output_data_types(op);
+    p.add_primitive(*op, prim);
 }
 
 REGISTER_FACTORY_IMPL(internal, SwiGLU);
diff --git a/src/plugins/intel_gpu/src/plugin/ops/tile.cpp b/src/plugins/intel_gpu/src/plugin/ops/tile.cpp
index 5202e5e2dd231d..0608e2b08d123d 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/tile.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/tile.cpp
@@ -6,9 +6,7 @@
 #include "openvino/op/constant.hpp"
 
 #include "intel_gpu/plugin/program_builder.hpp"
-#include "intel_gpu/plugin/common_utils.hpp"
 #include "intel_gpu/primitives/tile.hpp"
-#include "intel_gpu/primitives/reshape.hpp"
 
 namespace ov {
 namespace intel_gpu {
@@ -20,31 +18,6 @@ static void CreateTileOp(ProgramBuilder& p, const std::shared_ptr<ov::op::v0::Ti
     if (auto repeats_const = std::dynamic_pointer_cast<ov::op::v0::Constant>(op->get_input_node_shared_ptr(1))) {
         std::vector<int64_t> repeats = repeats_const->cast_vector<int64_t>();
 
-        // TODO: Remove code below once new shape infer is enabled
-        if (!op->is_dynamic() && !p.use_new_shape_infer()) {
-            size_t rank = op->get_input_shape(0).size();
-            int64_t defaultSize = 1;
-            for (size_t i = repeats.size(); i < rank; ++i) {
-                repeats.insert(repeats.begin(), defaultSize);
-            }
-
-            if (repeats.size() > rank) {
-                std::string reshapeName = layerName + "_reshape";
-                auto inputDims = op->get_input_shape(0);
-
-                // Extend input dimensions to the same size as repeats dimensions by prepending ones
-                inputDims.insert(inputDims.begin(), repeats.size() - rank, defaultSize);
-
-                auto targetShape = tensor_from_dims(inputDims);
-
-                auto reshapePrim = cldnn::reshape(reshapeName, inputs[0], targetShape);
-
-                p.add_primitive(*op, reshapePrim);
-
-                inputs[0] = cldnn::input_info(reshapeName);
-            }
-        }
-
         p.add_primitive(*op, cldnn::tile(layerName,
                                          inputs[0],
                                          repeats));
diff --git a/src/plugins/intel_gpu/src/plugin/ops/topk.cpp b/src/plugins/intel_gpu/src/plugin/ops/topk.cpp
index fb5e021fec42eb..0f5deb46ee31a7 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/topk.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/topk.cpp
@@ -8,8 +8,6 @@
 #include "openvino/op/topk.hpp"
 
 #include "intel_gpu/primitives/arg_max_min.hpp"
-#include "intel_gpu/primitives/mutable_data.hpp"
-#include "intel_gpu/runtime/debug_configuration.hpp"
 
 namespace ov {
 namespace intel_gpu {
@@ -25,77 +23,22 @@ static void TopKImpl(ProgramBuilder& p,
     auto inputs = p.GetInputInfo(op);
     std::string layerName = layer_type_name_ID(op);
 
-    if (p.use_new_shape_infer()) {
-        size_t num_outputs = op->get_output_size();
-
-        auto topk_constant = std::dynamic_pointer_cast<ov::op::v0::Constant>(op->input_value(1).get_node_shared_ptr());
-        auto argmaxPrim = cldnn::arg_max_min(layerName,
-                                            inputs[0],
-                                            inputs[1],
-                                            mode,
-                                            (topk_constant ? top_k : 0),
-                                            chosen_axis,
-                                            stype,
-                                            true,
-                                            stable,
-                                            cldnn::element_type_to_data_type(op->get_output_element_type(0)),
-                                            num_outputs);
-        argmaxPrim.output_data_types = get_output_data_types(op);
-        p.add_primitive(*op, argmaxPrim);
-    } else {
-        if (op->get_output_size() == 2) {
-            auto mutable_precision = op->get_output_element_type(1);
-            if (mutable_precision == ov::element::i64) {
-                mutable_precision = ov::element::i32;
-            }
-
-            cldnn::layout mutableLayout = cldnn::layout(cldnn::element_type_to_data_type(mutable_precision),
-                                                        cldnn::format::get_default_format(op->get_output_shape(1).size()),
-                                                        tensor_from_dims(op->get_output_shape(1)));
-
-            GPU_DEBUG_LOG << "[" << layer_type_name_ID(op) << ": mutable data]" << std::endl;
-            auto shared_memory = p.get_engine().allocate_memory(mutableLayout);
-
-            cldnn::primitive_id argmax_mutable_id_w = layer_type_name_ID(op) + "_md_write";
-            auto argmax_mutable_prim = cldnn::mutable_data(argmax_mutable_id_w,
-                                                           shared_memory);
-            p.add_primitive(*op, argmax_mutable_prim);
-            inputs.push_back(cldnn::input_info(argmax_mutable_id_w));
-
-            std::string ArgMaxLayerName = layerName + ".out0";
-            auto argmaxPrim = cldnn::arg_max_min(ArgMaxLayerName,
-                                                 inputs,
-                                                 mode,
-                                                 top_k,
-                                                 chosen_axis,
-                                                 stype,
-                                                 true,
-                                                 stable,
-                                                 cldnn::element_type_to_data_type(op->get_output_element_type(0)));
-
-            p.add_primitive(*op, argmaxPrim);
-
-            cldnn::primitive_id argmax_mutable_id_r = layerName + ".out1";
-            auto argmax_mutable_prim_r = cldnn::mutable_data(argmax_mutable_id_r,
-                                                             { cldnn::input_info(ArgMaxLayerName) },
-                                                             shared_memory);
-            p.add_primitive(*op, argmax_mutable_prim_r);
-        } else if (op->get_output_size() == 1) {
-            auto argmaxPrim = cldnn::arg_max_min(layerName,
-                                                 inputs,
-                                                 mode,
-                                                 top_k,
-                                                 chosen_axis,
-                                                 stype,
-                                                 true,
-                                                 stable,
-                                                 cldnn::element_type_to_data_type(op->get_output_element_type(0)));
-
-            p.add_primitive(*op, argmaxPrim);
-        } else {
-            OPENVINO_THROW(op->get_friendly_name(), " Incorrect TopK outputs number");
-        }
-    }
+    size_t num_outputs = op->get_output_size();
+
+    auto topk_constant = std::dynamic_pointer_cast<ov::op::v0::Constant>(op->input_value(1).get_node_shared_ptr());
+    auto argmaxPrim = cldnn::arg_max_min(layerName,
+                                        inputs[0],
+                                        inputs[1],
+                                        mode,
+                                        (topk_constant ? top_k : 0),
+                                        chosen_axis,
+                                        stype,
+                                        true,
+                                        stable,
+                                        cldnn::element_type_to_data_type(op->get_output_element_type(0)),
+                                        num_outputs);
+    argmaxPrim.output_data_types = get_output_data_types(op);
+    p.add_primitive(*op, argmaxPrim);
 }
 
 static void CreateTopKOp(ProgramBuilder& p, const std::shared_ptr<ov::op::v1::TopK>& op) {
diff --git a/src/plugins/intel_gpu/src/plugin/ops/variable.cpp b/src/plugins/intel_gpu/src/plugin/ops/variable.cpp
index 9d7d6854009316..c02a0dc08a37d6 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/variable.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/variable.cpp
@@ -3,7 +3,6 @@
 //
 
 #include "intel_gpu/plugin/program_builder.hpp"
-#include "intel_gpu/plugin/common_utils.hpp"
 #include "openvino/core/type/element_type.hpp"
 #include "openvino/op/assign.hpp"
 #include "openvino/op/read_value.hpp"
diff --git a/src/plugins/intel_gpu/src/plugin/program_builder.cpp b/src/plugins/intel_gpu/src/plugin/program_builder.cpp
index aae9b163b4f6bf..263a7b92c0c771 100644
--- a/src/plugins/intel_gpu/src/plugin/program_builder.cpp
+++ b/src/plugins/intel_gpu/src/plugin/program_builder.cpp
@@ -145,22 +145,8 @@ void ProgramBuilder::cleanup_build() {
 
 std::shared_ptr<cldnn::program> ProgramBuilder::build(const std::vector<std::shared_ptr<ov::Node>>& ops, bool partial_build, bool is_inner_program) {
     OV_ITT_SCOPED_TASK(itt::domains::intel_gpu_plugin, "ProgramBuilder::build");
-    // In the case of inner program, allow_new_shape_infer flag is setted by outside of program.
-    // So, do not check allow_new_shape_infer for inner program build
-    for (const auto& op : ops) {
-        if (requires_new_shape_infer(op)) {
-            allow_new_shape_infer = true;
-            break;
-        }
-    }
-
-    if (is_inner_program) {
-        allow_new_shape_infer = (m_config.get_property(ov::intel_gpu::allow_new_shape_infer) || allow_new_shape_infer);
-    }
-
     m_config.set_property(ov::intel_gpu::partial_build_program(partial_build));
     m_config.set_property(ov::intel_gpu::optimize_data(true));
-    m_config.set_property(ov::intel_gpu::allow_new_shape_infer(allow_new_shape_infer));
 
     prepare_build();
     {
@@ -206,7 +192,6 @@ bool ProgramBuilder::is_op_supported(const std::shared_ptr<ov::Node>& op) {
         if (!data_types_are_supported(op.get()))
             return false;
 
-        allow_new_shape_infer = requires_new_shape_infer(op);
         CreateSingleLayerPrimitive(op);
         cleanup_build();
         DisableQueryMode();
@@ -263,10 +248,9 @@ std::vector<cldnn::input_info> ProgramBuilder::GetInputInfo(const std::shared_pt
         // Note: Currently Split/Variadic Split are divided to multiple crops
         // LSTMCell contains its own body network, and each output has a unique pid
         // But there is no need to maintain output port index for the next node e.g. Result
-        bool is_legacy_multiple_outputs = !allow_new_shape_infer
-                                          || ov::is_type<ov::op::v1::Split>(prevOp)
-                                          || ov::is_type<ov::op::v1::VariadicSplit>(prevOp)
-                                          || ov::is_type<ov::op::v4::LSTMCell>(prevOp);
+        bool is_legacy_multiple_outputs = ov::is_type<ov::op::v1::Split>(prevOp) ||
+                                          ov::is_type<ov::op::v1::VariadicSplit>(prevOp) ||
+                                          ov::is_type<ov::op::v4::LSTMCell>(prevOp);
         if (prevOp->get_output_size() > 1 && is_legacy_multiple_outputs) {
             prevName += ".out" + std::to_string(op->get_input_source_output(i).get_index());
         }
diff --git a/src/plugins/intel_gpu/src/plugin/sync_infer_request.cpp b/src/plugins/intel_gpu/src/plugin/sync_infer_request.cpp
index 346b4471779593..34c660180a17ee 100644
--- a/src/plugins/intel_gpu/src/plugin/sync_infer_request.cpp
+++ b/src/plugins/intel_gpu/src/plugin/sync_infer_request.cpp
@@ -390,13 +390,6 @@ void SyncInferRequest::wait() {
         if (need_output_update) {
             OV_ITT_SCOPED_TASK(itt::domains::intel_gpu_plugin, "SyncInferRequest::wait::update_output");
             auto mem_shape = output_layout.get_shape();
-            // In case of old shape infer we need to shrink out tensor shape to avoid redudnant dimensions that occur due to rank extension
-            // For new shape infer this shouldn't happen, thus remove that WA once we migrate to ngraph-based shape infer for all cases
-            if (!m_graph->get_config().get_property(ov::intel_gpu::allow_new_shape_infer)) {
-                OPENVINO_ASSERT(port.get_partial_shape().is_static(), "[GPU] Unexpected dynamic shape for legacy shape inference");
-                OPENVINO_ASSERT(ov::shape_size(port.get_shape()) == ov::shape_size(mem_shape), "[GPU] Unexpected elements count for output tensor");
-                mem_shape = port.get_shape();
-            }
             if (is_dynamic) {
                 bool need_reallocate = true;
                 auto usm_host_tensor = std::dynamic_pointer_cast<USMHostTensor>(output_tensor);
@@ -833,12 +826,6 @@ std::vector<cldnn::event::ptr> SyncInferRequest::prepare_input(const std::string
     }
 
     auto memory = device_tensor->get_memory();
-    // WA to extend shape to ranks expected by legacy shape infer. Remove after full migration to new shape infer
-    if (!m_graph->get_config().get_property(ov::intel_gpu::allow_new_shape_infer)) {
-        auto new_layout = memory->get_layout();
-        new_layout.set_partial_shape(m_graph->get_input_layouts().at(input_idx).get_shape());
-        memory = engine.reinterpret_buffer(*memory, new_layout);
-    }
 
     cldnn::event::ptr ret_event = nullptr;
     if (!is_remote_tensor_impl && !is_generic_remote && !convert_needed) {
diff --git a/src/plugins/intel_gpu/src/runtime/execution_config.cpp b/src/plugins/intel_gpu/src/runtime/execution_config.cpp
index a498dad24aa2f5..a9a2014bc60e8f 100644
--- a/src/plugins/intel_gpu/src/runtime/execution_config.cpp
+++ b/src/plugins/intel_gpu/src/runtime/execution_config.cpp
@@ -76,7 +76,6 @@ void ExecutionConfig::set_default() {
         std::make_tuple(ov::intel_gpu::dump_graphs, ""),
         std::make_tuple(ov::intel_gpu::force_implementations, ImplForcingMap{}),
         std::make_tuple(ov::intel_gpu::partial_build_program, false),
-        std::make_tuple(ov::intel_gpu::allow_new_shape_infer, false),
         std::make_tuple(ov::intel_gpu::use_only_static_kernels_for_dynamic_shape, false),
         std::make_tuple(ov::intel_gpu::buffers_preallocation_ratio, 1.1f),
         std::make_tuple(ov::intel_gpu::max_kernels_per_batch, 8));
diff --git a/src/plugins/intel_gpu/src/runtime/kernels_cache.cpp b/src/plugins/intel_gpu/src/runtime/kernels_cache.cpp
index d6dcaf5dd72d14..e0ed04ab5b914b 100644
--- a/src/plugins/intel_gpu/src/runtime/kernels_cache.cpp
+++ b/src/plugins/intel_gpu/src/runtime/kernels_cache.cpp
@@ -100,8 +100,7 @@ std::string kernels_cache::get_cache_path() const {
 }
 
 bool kernels_cache::is_cache_enabled() const {
-    if (!_config.get_property(ov::intel_gpu::allow_new_shape_infer) &&
-        (_config.get_property(ov::cache_mode) == ov::CacheMode::OPTIMIZE_SPEED)) {
+    if (_config.get_property(ov::cache_mode) == ov::CacheMode::OPTIMIZE_SPEED) {
         return false;
     }
 
diff --git a/src/plugins/intel_gpu/tests/functional/concurrency/gpu_concurrency_tests.cpp b/src/plugins/intel_gpu/tests/functional/concurrency/gpu_concurrency_tests.cpp
index 554c9918af08af..2ad5889410b457 100644
--- a/src/plugins/intel_gpu/tests/functional/concurrency/gpu_concurrency_tests.cpp
+++ b/src/plugins/intel_gpu/tests/functional/concurrency/gpu_concurrency_tests.cpp
@@ -51,7 +51,6 @@ class OVConcurrencyTest : public ov::test::TestsCommon,
             ov::test::utils::removeFilesWithExt(cacheFolderName, "cl_cache");
             ov::test::utils::removeDir(cacheFolderName);
             core->set_property(ov::cache_dir(cacheFolderName));
-            core->set_property(ov::test::utils::DEVICE_GPU, ov::intel_gpu::enable_loop_unrolling(false));
         }
 
         std::vector<std::pair<std::shared_ptr<ov::Model>, ov::InferRequest>> irs;
@@ -63,11 +62,15 @@ class OVConcurrencyTest : public ov::test::TestsCommon,
             if (is_caching_test) {
                 {
                     auto _dummy_exec_net = core->compile_model(fn, ov::test::utils::DEVICE_GPU,
-                                                    ov::num_streams(ov::streams::Num(num_streams)), ov::hint::inference_precision(ov::element::f32));
+                                                    ov::num_streams(ov::streams::Num(num_streams)),
+                                                    ov::hint::inference_precision(ov::element::f32),
+                                                    ov::intel_gpu::enable_loop_unrolling(false));
                 }
                 {
                     exec_net = core->compile_model(fn, ov::test::utils::DEVICE_GPU,
-                                                    ov::num_streams(ov::streams::Num(num_streams)), ov::hint::inference_precision(ov::element::f32));
+                                                    ov::num_streams(ov::streams::Num(num_streams)),
+                                                    ov::hint::inference_precision(ov::element::f32),
+                                                    ov::intel_gpu::enable_loop_unrolling(false));
                 }
             } else {
                 exec_net = core->compile_model(fn, ov::test::utils::DEVICE_GPU,
@@ -114,6 +117,7 @@ class OVConcurrencyTest : public ov::test::TestsCommon,
         }
 
         if (is_caching_test) {
+            core->set_property(ov::cache_dir(""));
             ov::test::utils::removeFilesWithExt(cacheFolderName, "blob");
             ov::test::utils::removeFilesWithExt(cacheFolderName, "cl_cache");
             ov::test::utils::removeDir(cacheFolderName);
@@ -352,4 +356,4 @@ TEST(canSwapTensorsBetweenInferRequests, outputs) {
         infer_request2.wait();
     }
 }
-} // namespace
\ No newline at end of file
+} // namespace
diff --git a/src/plugins/intel_gpu/tests/functional/dynamic_tests/gpu_dyn_batch_shape_tests.cpp b/src/plugins/intel_gpu/tests/functional/dynamic_tests/gpu_dyn_batch_shape_tests.cpp
index ed6db10b284f36..9f8669958a8326 100644
--- a/src/plugins/intel_gpu/tests/functional/dynamic_tests/gpu_dyn_batch_shape_tests.cpp
+++ b/src/plugins/intel_gpu/tests/functional/dynamic_tests/gpu_dyn_batch_shape_tests.cpp
@@ -99,12 +99,12 @@ TEST_P(OVDynamicBatchShape_Tests, InferDynamicBatchBound_cached) {
 
         core->set_property(ov::cache_dir(cacheFolderName));
         run();
+        core->set_property(ov::cache_dir(""));
     }
     {
-        core.reset();
-        core = ov::test::utils::PluginCache::get().core();
         core->set_property(ov::cache_dir(cacheFolderName));
         run();
+        core->set_property(ov::cache_dir(""));
 
         ov::test::utils::removeFilesWithExt(cacheFolderName, "blob");
         ov::test::utils::removeFilesWithExt(cacheFolderName, "cl_cache");
diff --git a/src/plugins/intel_gpu/tests/functional/shared_tests_instances/low_precision_transformations/convolution_backprop_data_transformation.cpp b/src/plugins/intel_gpu/tests/functional/shared_tests_instances/low_precision_transformations/convolution_backprop_data_transformation.cpp
index 9d36e5dd68f465..60d486453d6bf9 100644
--- a/src/plugins/intel_gpu/tests/functional/shared_tests_instances/low_precision_transformations/convolution_backprop_data_transformation.cpp
+++ b/src/plugins/intel_gpu/tests/functional/shared_tests_instances/low_precision_transformations/convolution_backprop_data_transformation.cpp
@@ -25,21 +25,21 @@ const std::vector<LayerTestsDefinitions::ConvolutionBackpropDataTransformationPa
         {256ul, ov::Shape{1, 1, 1, 1}, { 0.f }, { 25.5f }, { 0.f }, { 25.5f }},
         {255ul, ov::Shape{1, 1, 1, 1}, { -12.7f }, { 12.7f }, { -12.7f }, { 12.7f }},
         "convolutionBackpropData_original",
-        "u8"
+        ov::element::u8.get_type_name()
     },
     // FQ on weights
     {
         {256ul, ov::Shape{}, { 0.f }, { 25.5f }, { 0.f }, { 25.5f }},
         {255ul, ov::Shape{}, { -12.7f }, { 12.7f }, { -12.7f }, { 12.7f }},
         "convolutionBackpropData_original",
-        "u8"
+        ov::element::u8.get_type_name()
     },
     // FQ on weights
     {
         {256ul, ov::Shape{1, 1, 1, 1}, { -12.8f }, { 12.7f }, { -12.8f }, { 12.7f }},
         {255ul, ov::Shape{1, 1, 1, 1}, { -12.7f }, { 12.7f }, { -12.7f }, { 12.7f }},
         "convolutionBackpropData_original",
-        "i8"
+        ov::element::i8.get_type_name()
     },
     // FQ on weights
     // with zero point
@@ -135,14 +135,14 @@ const std::vector<LayerTestsDefinitions::ConvolutionBackpropDataTransformationPa
         {256ul, ov::Shape{1, 1, 1}, { 0.f }, { 25.5f }, { 0.f }, { 25.5f }},
         {255ul, ov::Shape{1, 1, 1}, { -12.7f }, { 12.7f }, { -12.7f }, { 12.7f }},
         "convolutionBackpropData_original",
-        "u8"
+        ov::element::u8.get_type_name()
     },
     // Qdq on weights
     {
         {256ul, ov::Shape{1, 1, 1}, { 0.f }, { 255.f }, { 0.f }, { 25.5f }},
         {{ov::element::f32}, {}, { {4.f}, ov::element::f32, {}, false }},
         "convolutionBackpropData_original",
-        "u8"
+        ov::element::u8.get_type_name()
     },
 };
 
diff --git a/src/plugins/intel_gpu/tests/functional/shared_tests_instances/low_precision_transformations/convolution_transformation.cpp b/src/plugins/intel_gpu/tests/functional/shared_tests_instances/low_precision_transformations/convolution_transformation.cpp
index 5ee51c51199bbb..19eda517feb190 100644
--- a/src/plugins/intel_gpu/tests/functional/shared_tests_instances/low_precision_transformations/convolution_transformation.cpp
+++ b/src/plugins/intel_gpu/tests/functional/shared_tests_instances/low_precision_transformations/convolution_transformation.cpp
@@ -27,7 +27,7 @@ const std::vector<LayerTestsDefinitions::ConvolutionTransformationParam> params
         {},
         false,
         "Convolution",
-        "FP32"
+        ov::element::f32.get_type_name()
     },
     {
         {},
@@ -35,7 +35,7 @@ const std::vector<LayerTestsDefinitions::ConvolutionTransformationParam> params
         { 255ul, ov::Shape { 1, 1, 1, 1 }, { 0.f }, { 254.f }, { -12.7f }, { 12.7f } },
         false,
         "Convolution",
-        "FP32"
+        ov::element::f32.get_type_name()
     },
     {
         { 256ul, ov::Shape { 1, 1, 1, 1 }, { 0.f }, { 255.f }, { 0.f }, { 25.5f } },
@@ -43,7 +43,7 @@ const std::vector<LayerTestsDefinitions::ConvolutionTransformationParam> params
         { 255ul, ov::Shape { 1, 1, 1, 1 }, { 0.f }, { 254.f }, { -12.7f }, { 12.7f } },
         false,
         "Convolution",
-        "U8"
+        ov::element::u8.get_type_name()
     },
     {
         { 256ul, ov::Shape {}, { 0.f }, { 255.f }, { 0.f }, { 25.5f } },
@@ -51,7 +51,7 @@ const std::vector<LayerTestsDefinitions::ConvolutionTransformationParam> params
         { 255ul, ov::Shape {}, { 0.f }, { 254.f }, { -12.7f }, { 12.7f } },
         false,
         "Convolution",
-        "U8"
+        ov::element::u8.get_type_name()
     },
     {
         { 256ul, ov::Shape { 1, 1, 1, 1 }, { 0.f }, { 255.f }, { -12.75f }, { 6.375f } },
@@ -59,7 +59,7 @@ const std::vector<LayerTestsDefinitions::ConvolutionTransformationParam> params
         { 255ul, ov::Shape { 1, 1, 1, 1 }, { 0.f }, { 254.f }, { -12.7f }, { 12.7f } },
         false,
         "Convolution",
-        "U8"
+        ov::element::u8.get_type_name()
     },
     {
         { 256ul, ov::Shape { 1 }, { 0.f }, { 255.f }, { -18.7f }, { 18.8f } },
@@ -70,7 +70,7 @@ const std::vector<LayerTestsDefinitions::ConvolutionTransformationParam> params
         },
         false,
         "Convolution",
-        "U8"
+        ov::element::u8.get_type_name()
     },
     {
         { 256ul, ov::Shape { 1 }, { 0.f }, { 255.f }, { -18.7f }, { 18.8f } },
@@ -82,7 +82,7 @@ const std::vector<LayerTestsDefinitions::ConvolutionTransformationParam> params
         },
         false,
         "Convolution",
-        "U8"
+        ov::element::u8.get_type_name()
     },
     // not supported quantization level on data
     {
@@ -91,7 +91,7 @@ const std::vector<LayerTestsDefinitions::ConvolutionTransformationParam> params
         { 255ul, ov::Shape{1, 1, 1, 1}, {0.f}, {254.f}, {-12.7f}, {12.7f}},
         false,
         "Convolution",
-        "FP32"
+        ov::element::f32.get_type_name()
     },
     // not supported quantization level on data & weights
     {
@@ -100,7 +100,7 @@ const std::vector<LayerTestsDefinitions::ConvolutionTransformationParam> params
         { 65536ul, ov::Shape{1, 1, 1, 1}, {0.f}, {254.f}, {-12.7f}, {12.7f}},
         false,
         "Convolution",
-        "FP32"
+        ov::element::f32.get_type_name()
     },
     // not supported quantization level on weights
     {
@@ -109,7 +109,7 @@ const std::vector<LayerTestsDefinitions::ConvolutionTransformationParam> params
         { 65536ul, ov::Shape{1, 1, 1, 1}, {0.f}, {254.f}, {-12.7f}, {12.7f}},
         false,
         "Convolution",
-        "FP32"
+        ov::element::f32.get_type_name()
     },
     {
         { 256ul, ov::Shape { 1, 1, 1, 1 }, { 0.f }, { 0.f }, { 0.f }, { 0.f } },
@@ -117,7 +117,7 @@ const std::vector<LayerTestsDefinitions::ConvolutionTransformationParam> params
         { 255ul, ov::Shape { 1, 1, 1, 1 }, { 0.f }, { 254.f }, { -12.7f }, { 12.7f } },
         false,
         "Convolution",
-        "u8"
+        ov::element::u8.get_type_name()
     }
 };
 
diff --git a/src/plugins/intel_gpu/tests/functional/shared_tests_instances/low_precision_transformations/elementwise_branch_selection_transformation.cpp b/src/plugins/intel_gpu/tests/functional/shared_tests_instances/low_precision_transformations/elementwise_branch_selection_transformation.cpp
index 574c5155a52a51..1c605064bbf9d2 100644
--- a/src/plugins/intel_gpu/tests/functional/shared_tests_instances/low_precision_transformations/elementwise_branch_selection_transformation.cpp
+++ b/src/plugins/intel_gpu/tests/functional/shared_tests_instances/low_precision_transformations/elementwise_branch_selection_transformation.cpp
@@ -42,9 +42,9 @@ const std::vector<LayerTestsDefinitions::ElementwiseBranchSelectionTestValues> p
         { 256ul, ov::Shape { 1, 1, 1, 1 }, { 0.f }, { 2.55f }, { 0.f }, { 2.55f } },
         {}, // GPU doesn't returns Reorders in performance counters
         {
-            {"convolution1", "U8"},
-            {"convolution2", "U8"},
-            {"eltwise", "U8"}
+            {"convolution1", ov::element::u8.get_type_name()},
+            {"convolution2", ov::element::u8.get_type_name()},
+            {"eltwise", ov::element::u8.get_type_name()}
         }
     },
     {
@@ -69,9 +69,9 @@ const std::vector<LayerTestsDefinitions::ElementwiseBranchSelectionTestValues> p
         { 256ul, ov::Shape { 1, 1, 1, 1 }, { 0.f }, { 2.55f }, { 0.f }, { 2.55f } },
         {}, // GPU doesn't returns Reorders in performance counters
         {
-            {"convolution1", "U8"},
-            {"convolution2", "U8"},
-            {"eltwise", "U8"}
+            {"convolution1", ov::element::u8.get_type_name()},
+            {"convolution2", ov::element::u8.get_type_name()},
+            {"eltwise", ov::element::u8.get_type_name()}
         }
     }
 };
diff --git a/src/plugins/intel_gpu/tests/functional/shared_tests_instances/low_precision_transformations/fq_transformation.cpp b/src/plugins/intel_gpu/tests/functional/shared_tests_instances/low_precision_transformations/fq_transformation.cpp
index 0508aca886d8c2..d7e91da3bede54 100644
--- a/src/plugins/intel_gpu/tests/functional/shared_tests_instances/low_precision_transformations/fq_transformation.cpp
+++ b/src/plugins/intel_gpu/tests/functional/shared_tests_instances/low_precision_transformations/fq_transformation.cpp
@@ -33,15 +33,15 @@ const std::vector<LayerTransformation::Params> trasformationParamValues = {
 const std::vector<FakeQuantizeTransformationParam> fakeQuantizeOnDataValues = {
     {
         {256ul, {}, {0.f}, {2.55f}, {0.f}, {2.55f}},
-        "Pooling", "U8"
+        "Pooling", ov::element::u8.get_type_name()
     },
     {
         { 256ul, { {1ul}, {1ul}, {1ul}, {1ul} }, { 0.f }, { 2.55f }, { 0.f }, { 2.55f } },
-        "Pooling", "U8"
+        "Pooling", ov::element::u8.get_type_name()
     },
     {
         { 256ul, {}, { 0.f }, { 2.55f }, { -1.28f }, { 1.27f } },
-        "Pooling", "I8"
+        "Pooling", ov::element::i8.get_type_name()
     },
     // nGraph: dot interval FQ node is being const-folded, so does Pooling
     {
@@ -50,15 +50,15 @@ const std::vector<FakeQuantizeTransformationParam> fakeQuantizeOnDataValues = {
     },
     {
         { 256ul, {}, { -127.5f }, { 0.f }, { -127.5f }, { 0.f } },
-        "Pooling", "U8"
+        "Pooling", ov::element::u8.get_type_name()
     },
     {
         { 16ul, {}, { 0.f }, { 1.5f }, { 0.f }, { 1.5f } },
-        "Pooling", "U8"
+        "Pooling", ov::element::u8.get_type_name()
     },
     {
         { 16ul, {}, { -8.f }, { 7.f }, { -0.8f }, { 0.7f } },
-        "Pooling", "I8"
+        "Pooling", ov::element::i8.get_type_name()
     },
     // nGraph: I8->FP32 Convert is not supported
     // { 256ul, {}, { -1.28f} , { 1.27f }, { -1.28f} , { 1.27f } },
diff --git a/src/plugins/intel_gpu/tests/functional/shared_tests_instances/low_precision_transformations/fq_with_dq_not_optimal_transformation.cpp b/src/plugins/intel_gpu/tests/functional/shared_tests_instances/low_precision_transformations/fq_with_dq_not_optimal_transformation.cpp
index b597cef9652183..d5ddb1372f0777 100644
--- a/src/plugins/intel_gpu/tests/functional/shared_tests_instances/low_precision_transformations/fq_with_dq_not_optimal_transformation.cpp
+++ b/src/plugins/intel_gpu/tests/functional/shared_tests_instances/low_precision_transformations/fq_with_dq_not_optimal_transformation.cpp
@@ -40,7 +40,7 @@ const std::vector<FakeQuantizeWithNotOptimalTransformationTestValues> fakeQuanti
             { {0.3f}, ov::element::f32, {}, false }
         },
         {},
-        "i8"
+        ov::element::i8.get_type_name()
     },
     {
         { 256ul, {{ 1, 1, 1, 1 }}, { 0.f }, { 25.5f }, { -128.f }, { 127.f }, ov::element::f32 },
@@ -59,7 +59,7 @@ const std::vector<FakeQuantizeWithNotOptimalTransformationTestValues> fakeQuanti
             { {0.3f}, ov::element::f32, {}, false }
         },
         {},
-        "i8"
+        ov::element::i8.get_type_name()
     },
     {
         { 256ul, {{ 1, 1, 1, 1 }}, { 0.f }, { 25.5f }, { -128.f }, { 127.f }, ov::element::f32 },
@@ -78,7 +78,7 @@ const std::vector<FakeQuantizeWithNotOptimalTransformationTestValues> fakeQuanti
             { {0.3f}, ov::element::f32, {}, false }
         },
         {},
-        "i8"
+        ov::element::i8.get_type_name()
     },
     {
         { 256ul, {{ 1, 1, 1, 1 }}, { 0.f }, { 25.5f }, { -128.f }, { 127.f }, ov::element::f32 },
@@ -97,7 +97,7 @@ const std::vector<FakeQuantizeWithNotOptimalTransformationTestValues> fakeQuanti
             { {0.3f}, ov::element::f32, {}, false }
         },
         {},
-        "i8"
+        ov::element::i8.get_type_name()
     }
 };
 
diff --git a/src/plugins/intel_gpu/tests/functional/shared_tests_instances/low_precision_transformations/group_convolution_transformation.cpp b/src/plugins/intel_gpu/tests/functional/shared_tests_instances/low_precision_transformations/group_convolution_transformation.cpp
index 29ba3d17fa9a99..d440815bad4b4b 100644
--- a/src/plugins/intel_gpu/tests/functional/shared_tests_instances/low_precision_transformations/group_convolution_transformation.cpp
+++ b/src/plugins/intel_gpu/tests/functional/shared_tests_instances/low_precision_transformations/group_convolution_transformation.cpp
@@ -34,7 +34,7 @@ const std::vector<LayerTestsDefinitions::GroupConvolutionTransformationParam> pa
         { 255ul, ov::Shape { 1, 1, 1, 1 }, { 0.f }, { 254.f }, { -127.f }, { 127.f } },
         true,
         "Convolution",
-        "U8"
+        ov::element::u8.get_type_name()
     },
     // group convolution, tensor quantization
     {
@@ -44,7 +44,7 @@ const std::vector<LayerTestsDefinitions::GroupConvolutionTransformationParam> pa
         { 255ul, ov::Shape { 1, 1, 1, 1 }, { 0.f }, { 254.f }, { -127.f }, { 127.f } },
         true,
         "Convolution",
-        "U8"
+        ov::element::u8.get_type_name()
     },
     // group convolution, tensor quantization
     {
@@ -54,7 +54,7 @@ const std::vector<LayerTestsDefinitions::GroupConvolutionTransformationParam> pa
         { 255ul, ov::Shape { 1, 1, 1, 1 }, { 0.f }, { 254.f }, { -127.f }, { 127.f } },
         true,
         "Convolution",
-        "U8"
+        ov::element::u8.get_type_name()
     },
     // group convolution, per-channel quantization
     {
@@ -107,7 +107,7 @@ const std::vector<LayerTestsDefinitions::GroupConvolutionTransformationParam> pa
         { 255ul, ov::Shape { 3, 8, 1, 1, 1 }, { -127.f }, { 127.f }, { -127.f }, { 127.f } },
         false,
         "Convolution",
-        "U8"
+        ov::element::u8.get_type_name()
     },
     // group convolution without reshape, per channel quantization with different values
     {
@@ -130,7 +130,7 @@ const std::vector<LayerTestsDefinitions::GroupConvolutionTransformationParam> pa
         },
         false,
         "Convolution",
-        "U8"
+        ov::element::u8.get_type_name()
     },
 };
 
@@ -159,7 +159,7 @@ const std::vector<LayerTestsDefinitions::GroupConvolutionTransformationParam> pa
         { 255ul, ov::Shape { 3, 8, 1, 1 }, { -127.f }, { 127.f }, { -127.f }, { 127.f } },
         false,
         "Convolution",
-        "U8"
+        ov::element::u8.get_type_name()
     },
     // group convolution without reshape, per channel quantization with different values
     {
@@ -182,7 +182,7 @@ const std::vector<LayerTestsDefinitions::GroupConvolutionTransformationParam> pa
         },
         false,
         "Convolution",
-        "U8"
+        ov::element::u8.get_type_name()
     },
 };
 
diff --git a/src/plugins/intel_gpu/tests/functional/shared_tests_instances/low_precision_transformations/groupconvolution_qdq_transformation.cpp b/src/plugins/intel_gpu/tests/functional/shared_tests_instances/low_precision_transformations/groupconvolution_qdq_transformation.cpp
index 8059a69daefeed..f236fd8231ae62 100644
--- a/src/plugins/intel_gpu/tests/functional/shared_tests_instances/low_precision_transformations/groupconvolution_qdq_transformation.cpp
+++ b/src/plugins/intel_gpu/tests/functional/shared_tests_instances/low_precision_transformations/groupconvolution_qdq_transformation.cpp
@@ -80,7 +80,7 @@ const std::vector<LayerTestsDefinitions::GroupConvolutionQDqTransformationParam>
         },
         { {3, 2, 2, 5, 5} },
         "output_original",
-        "fp32",
+        ov::element::f32.get_type_name(),
         false,
     },
 
@@ -144,7 +144,7 @@ const std::vector<LayerTestsDefinitions::GroupConvolutionQDqTransformationParam>
         },
         { {3, 2, 2, 5, 5} },
         "output_original",
-        "fp32",
+        ov::element::f32.get_type_name(),
         true,
     },
 
@@ -196,7 +196,7 @@ const std::vector<LayerTestsDefinitions::GroupConvolutionQDqTransformationParam>
         },
         { {3, 2, 2, 5, 5} },
         "output_original",
-        "u8",
+        ov::element::u8.get_type_name(),
         false
     },
 
@@ -251,7 +251,7 @@ const std::vector<LayerTestsDefinitions::GroupConvolutionQDqTransformationParam>
         },
         { {3, 2, 2, 5, 5} },
         "output_original",
-        "u8",
+        ov::element::u8.get_type_name(),
         true,
     },
 
@@ -308,7 +308,7 @@ const std::vector<LayerTestsDefinitions::GroupConvolutionQDqTransformationParam>
         },
         { {3, 2, 2, 5, 5} },
         "output_original",
-        "fp32",
+        ov::element::f32.get_type_name(),
         false,
     },
 
@@ -368,7 +368,7 @@ const std::vector<LayerTestsDefinitions::GroupConvolutionQDqTransformationParam>
         },
         { {3, 2, 2, 5, 5} },
         "output_original",
-        "fp32",
+        ov::element::f32.get_type_name(),
         true,
     },
 
@@ -428,7 +428,7 @@ const std::vector<LayerTestsDefinitions::GroupConvolutionQDqTransformationParam>
         },
         {},
         "output_original",
-        "u8",
+        ov::element::u8.get_type_name(),
         true,
     },
 
@@ -485,7 +485,7 @@ const std::vector<LayerTestsDefinitions::GroupConvolutionQDqTransformationParam>
         },
         { {3, 2, 2, 5, 5} },
         "output_original",
-        "u8",
+        ov::element::u8.get_type_name(),
         false,
     },
 
@@ -542,7 +542,7 @@ const std::vector<LayerTestsDefinitions::GroupConvolutionQDqTransformationParam>
         },
         {},
         "output_original",
-        "u8",
+        ov::element::u8.get_type_name(),
         false,
     },
 
@@ -602,7 +602,7 @@ const std::vector<LayerTestsDefinitions::GroupConvolutionQDqTransformationParam>
         },
         { {3, 2, 2, 5, 5} },
         "output_original",
-        "u8",
+        ov::element::u8.get_type_name(),
         true,
     },
 };
diff --git a/src/plugins/intel_gpu/tests/functional/shared_tests_instances/low_precision_transformations/mat_mul_with_constant_transformation.cpp b/src/plugins/intel_gpu/tests/functional/shared_tests_instances/low_precision_transformations/mat_mul_with_constant_transformation.cpp
index d0812b439b921d..1c900994af9b28 100644
--- a/src/plugins/intel_gpu/tests/functional/shared_tests_instances/low_precision_transformations/mat_mul_with_constant_transformation.cpp
+++ b/src/plugins/intel_gpu/tests/functional/shared_tests_instances/low_precision_transformations/mat_mul_with_constant_transformation.cpp
@@ -23,7 +23,7 @@ std::vector<MatMulWithConstantTransformationTestValues> testValues = {
         { 256ul, {{2, 1}, {2, 1}, {2, 1}, {2, 1}}, {-128.f, -12.8f}, {127.f, 12.7f}, {-128.f, -12.8f}, {127.f, 12.7f} },
         { {}, {}, {} },
         "FullyConnected",
-        "U8"
+        ov::element::u8.get_type_name()
     },
     {
         { 2, 3, 4 },
@@ -32,7 +32,7 @@ std::vector<MatMulWithConstantTransformationTestValues> testValues = {
         {},
         { ov::element::f32, {}, {0.1f} },
         "FullyConnected",
-        "U8"
+        ov::element::u8.get_type_name()
     },
     {
         { 1, 3, 4 },
@@ -41,7 +41,7 @@ std::vector<MatMulWithConstantTransformationTestValues> testValues = {
         { 256ul, {{2, 1}, {2, 1}, {2, 1}, {2, 1}}, {-128.f, -12.8f}, {127.f, 12.7f}, {-128.f, -12.8f}, {127.f, 12.7f} },
         { {}, {}, {} },
         "FullyConnected",
-        "U8"
+        ov::element::u8.get_type_name()
     },
     {
         { 1, 1, 3, 4 },
@@ -50,7 +50,7 @@ std::vector<MatMulWithConstantTransformationTestValues> testValues = {
         { 256ul, {{2, 1}, {2, 1}, {2, 1}, {2, 1}}, {-128.f, -12.8f}, {127.f, 12.7f}, {-128.f, -12.8f}, {127.f, 12.7f} },
         { {}, {}, {} },
         "FullyConnected",
-        "U8"
+        ov::element::u8.get_type_name()
     },
     {
         { 1, 1, 3, 4 },
@@ -59,7 +59,7 @@ std::vector<MatMulWithConstantTransformationTestValues> testValues = {
         {},
         { ov::element::f32, {}, {{0.1f, 0.01}, ov::element::f32, ov::Shape{ 2, 1 }} },
         "FullyConnected",
-        "U8"
+        ov::element::u8.get_type_name()
     },
     {
         { 1, 3, 4 },
@@ -68,7 +68,7 @@ std::vector<MatMulWithConstantTransformationTestValues> testValues = {
         { 256ul, {{1}, {1}, {1}, {1}}, {-128.f}, {127.f}, {-128.f}, {127.f} },
         { {}, {}, {} },
         "FullyConnected",
-        "U8"
+        ov::element::u8.get_type_name()
     },
     {
         { 2, 3 },
@@ -77,7 +77,7 @@ std::vector<MatMulWithConstantTransformationTestValues> testValues = {
         { 256ul, {{1}, {1}, {1}, {1}}, {-128.f}, {127.f}, {-12.8f}, {12.7f} },
         { {}, {}, {} },
         "FullyConnected",
-        "U8"
+        ov::element::u8.get_type_name()
     },
     {
         { 2, 3 },
@@ -86,7 +86,7 @@ std::vector<MatMulWithConstantTransformationTestValues> testValues = {
         {},
         { ov::element::f32, {}, {0.1f} },
         "FullyConnected",
-        "U8"
+        ov::element::u8.get_type_name()
     }
 };
 
diff --git a/src/plugins/intel_gpu/tests/functional/shared_tests_instances/low_precision_transformations/move_fake_quantize_transformation.cpp b/src/plugins/intel_gpu/tests/functional/shared_tests_instances/low_precision_transformations/move_fake_quantize_transformation.cpp
index c4c7b9a83f4433..34acf951939ae1 100644
--- a/src/plugins/intel_gpu/tests/functional/shared_tests_instances/low_precision_transformations/move_fake_quantize_transformation.cpp
+++ b/src/plugins/intel_gpu/tests/functional/shared_tests_instances/low_precision_transformations/move_fake_quantize_transformation.cpp
@@ -28,7 +28,7 @@ const std::vector<LayerTestsDefinitions::MoveFakeQuantizeTransformationParam> pa
         {},
         {},
         "Concat",
-        "U8",
+        ov::element::u8.get_type_name(),
         1,
     },
     // with ReLU operation
@@ -39,7 +39,7 @@ const std::vector<LayerTestsDefinitions::MoveFakeQuantizeTransformationParam> pa
         {},
         {},
         "Concat",
-        "U8",
+        ov::element::u8.get_type_name(),
         1
     },
     // negative axis
@@ -50,7 +50,7 @@ const std::vector<LayerTestsDefinitions::MoveFakeQuantizeTransformationParam> pa
         {},
         {},
         "Concat",
-        "FP32",
+        ov::element::f32.get_type_name(),
         0
     },
     // Q/DQ
@@ -65,7 +65,7 @@ const std::vector<LayerTestsDefinitions::MoveFakeQuantizeTransformationParam> pa
             { 0.01f }
         },
         "Concat",
-        "U8",
+        ov::element::u8.get_type_name(),
         1
     },
     // Q/DQ with ReLU
@@ -80,7 +80,7 @@ const std::vector<LayerTestsDefinitions::MoveFakeQuantizeTransformationParam> pa
             { 0.01f }
         },
         "Concat",
-        "U8",
+        ov::element::u8.get_type_name(),
         1
     },
     // multi chanel
@@ -96,7 +96,7 @@ const std::vector<LayerTestsDefinitions::MoveFakeQuantizeTransformationParam> pa
         {},
         {},
         "Concat",
-        "U8",
+        ov::element::u8.get_type_name(),
         1
     },
     // Q/DQ with multi-channels
@@ -118,7 +118,7 @@ const std::vector<LayerTestsDefinitions::MoveFakeQuantizeTransformationParam> pa
             { {0.01f, 0.01f, 0.01f}, ov::element::f32, {1, 3, 1, 1} }
         },
         "Concat",
-        "U8",
+        ov::element::u8.get_type_name(),
         1
     },
     // Q/DQ with multi-channels subtruct
@@ -140,7 +140,7 @@ const std::vector<LayerTestsDefinitions::MoveFakeQuantizeTransformationParam> pa
             { 0.01f }
         },
         "Concat",
-        "U8",
+        ov::element::u8.get_type_name(),
         1
     },
 };
diff --git a/src/plugins/intel_gpu/tests/functional/shared_tests_instances/low_precision_transformations/multiply_to_group_convolution_transformation.cpp b/src/plugins/intel_gpu/tests/functional/shared_tests_instances/low_precision_transformations/multiply_to_group_convolution_transformation.cpp
index 035ef0b328a661..a97bf8f40b8e10 100644
--- a/src/plugins/intel_gpu/tests/functional/shared_tests_instances/low_precision_transformations/multiply_to_group_convolution_transformation.cpp
+++ b/src/plugins/intel_gpu/tests/functional/shared_tests_instances/low_precision_transformations/multiply_to_group_convolution_transformation.cpp
@@ -19,19 +19,19 @@ const std::vector<MultiplyToGroupConvolutionTransformationParam> params = {
     {{256ul, ov::Shape{1, 1, 1, 1}, {0.f}, {25.5f}, {0.f}, {25.5f}},
      {{1.f, 2.f, 3.f}, ov::element::f32, Shape{1, 3, 1, 1}},
      "output/GroupConvolution",
-     "U8",
+     ov::element::u8.get_type_name(),
      false},
     // zero point
     {{256ul, ov::Shape{1, 1, 1, 1}, {-1.28f}, {1.27f}, {-1.28f}, {1.27f}},
      {{1.f, 2.f, 3.f}, ov::element::f32, Shape{1, 3, 1, 1}},
      "output/GroupConvolution",
-     "I8",
+     ov::element::i8.get_type_name(),
      false},
     // zero point
     {{256ul, ov::Shape{1, 1, 1, 1}, {-1.28f}, {1.27f / 2.f}, {-1.28f}, {1.27f / 2.f}},
      {{1.f, 2.f, 3.f}, ov::element::f32, Shape{1, 3, 1, 1}},
      "output/GroupConvolution",
-     "U8",
+     ov::element::u8.get_type_name(),
      false},
 
     // Multiply => GroupConvolution optimizations
diff --git a/src/plugins/intel_gpu/tests/functional/shared_tests_instances/low_precision_transformations/pull_reshape_through_dequantization.cpp b/src/plugins/intel_gpu/tests/functional/shared_tests_instances/low_precision_transformations/pull_reshape_through_dequantization.cpp
index e089ca538e859c..ba17a8b11a2801 100644
--- a/src/plugins/intel_gpu/tests/functional/shared_tests_instances/low_precision_transformations/pull_reshape_through_dequantization.cpp
+++ b/src/plugins/intel_gpu/tests/functional/shared_tests_instances/low_precision_transformations/pull_reshape_through_dequantization.cpp
@@ -38,7 +38,7 @@ const std::vector<PullReshapeThroughDequantizationTestValues> params = {
         ov::element::f32,
         {},
         "output_original",
-        "U8"
+        ov::element::u8.get_type_name()
     },
     {
         ov::element::f32,
@@ -57,7 +57,7 @@ const std::vector<PullReshapeThroughDequantizationTestValues> params = {
         ov::element::f32,
         {},
         "output_original",
-        "FP32"
+        ov::element::f32.get_type_name()
     }
 };
 
diff --git a/src/plugins/intel_gpu/tests/functional/shared_tests_instances/low_precision_transformations/recurrent_cell_transformation.cpp b/src/plugins/intel_gpu/tests/functional/shared_tests_instances/low_precision_transformations/recurrent_cell_transformation.cpp
index 85f8d79e7ace31..5e66b475a95922 100644
--- a/src/plugins/intel_gpu/tests/functional/shared_tests_instances/low_precision_transformations/recurrent_cell_transformation.cpp
+++ b/src/plugins/intel_gpu/tests/functional/shared_tests_instances/low_precision_transformations/recurrent_cell_transformation.cpp
@@ -49,7 +49,7 @@ const std::vector<LayerTestsDefinitions::RecurrentCellTransformationParam> param
         {{}, {}, {}},
         ov::builder::subgraph::RecurrentCellFunction::RNNType::LSTMSequence,
         "RNNCell",
-        "U8"
+        ov::element::u8.get_type_name()
     },
     // asymmetrical FQ on weights
     {
@@ -79,7 +79,7 @@ const std::vector<LayerTestsDefinitions::RecurrentCellTransformationParam> param
         {{}, {}, {}},
         ov::builder::subgraph::RecurrentCellFunction::RNNType::LSTMSequence,
         "RNNCell",
-        "FP32"
+        ov::element::f32.get_type_name()
     }
 };
 
@@ -130,7 +130,7 @@ const std::vector<LayerTestsDefinitions::RecurrentCellTransformationParam> param
         {{}, {}, {}},
         ov::builder::subgraph::RecurrentCellFunction::RNNType::GRUSequence,
         "RNNCell",
-        "U8"
+        ov::element::u8.get_type_name()
     },
     // asymmetrical FQ on weights
     {
@@ -160,7 +160,7 @@ const std::vector<LayerTestsDefinitions::RecurrentCellTransformationParam> param
         {{}, {}, {}},
         ov::builder::subgraph::RecurrentCellFunction::RNNType::GRUSequence,
         "RNNCell",
-        "FP32"
+        ov::element::f32.get_type_name()
     }
 };
 
diff --git a/src/plugins/intel_gpu/tests/functional/shared_tests_instances/low_precision_transformations/reshape_transformation.cpp b/src/plugins/intel_gpu/tests/functional/shared_tests_instances/low_precision_transformations/reshape_transformation.cpp
index ab9701a98a5692..984aa821a4c291 100644
--- a/src/plugins/intel_gpu/tests/functional/shared_tests_instances/low_precision_transformations/reshape_transformation.cpp
+++ b/src/plugins/intel_gpu/tests/functional/shared_tests_instances/low_precision_transformations/reshape_transformation.cpp
@@ -26,7 +26,7 @@ const std::vector<ReshapeTransformationParam> params = {
         { 1, 3, 4, 8 },
         { 256ul, ov::Shape{ 1, 1, 1 }, { 0.f }, { 255.f }, { 0.f }, { 25.5f } },
         "Reshape",
-        "U8"
+        ov::element::u8.get_type_name()
     },
     // 3D -> 1D
     {
@@ -34,7 +34,7 @@ const std::vector<ReshapeTransformationParam> params = {
         { -1 },
         { 256ul, ov::Shape{}, { 0.f }, { 255.f }, { 0.f }, { 25.5f } },
         "Reshape",
-        "U8"
+        ov::element::u8.get_type_name()
     },
     // 4D -> 3D
     {
@@ -42,7 +42,7 @@ const std::vector<ReshapeTransformationParam> params = {
         { 1, 3, 256 },
         { 256ul, ov::Shape{ 1, 1, 1, 1 }, { 0.f }, { 255.f }, { 0.f }, { 25.5f } },
         "Reshape",
-        "U8"
+        ov::element::u8.get_type_name()
     },
     // 4D -> 3D
     {
@@ -50,7 +50,7 @@ const std::vector<ReshapeTransformationParam> params = {
         { 0, 3, -1 },
         { 256ul, ov::Shape{ 1, 3, 1, 1 }, { 0.f }, { 255.f }, { 0.f, 0.f, 0.f }, { 255.f, 25.5f, 2.55f } },
         "Reshape",
-        "U8"
+        ov::element::u8.get_type_name()
     },
     // 4D -> 2D
     {
@@ -58,7 +58,7 @@ const std::vector<ReshapeTransformationParam> params = {
         { 1, -1 },
         { 256ul, ov::Shape{ 1, 1, 1, 1 }, { 0.f }, { 255.f }, { 0.f }, { 25.5f } },
         "Reshape",
-        "U8"
+        ov::element::u8.get_type_name()
     },
     // 4D -> 6D
     {
@@ -66,7 +66,7 @@ const std::vector<ReshapeTransformationParam> params = {
         { 1, 3, 4, 8, 1, 1 },
         { 256ul, ov::Shape{ 1, 1, 1, 1}, { 0.f }, { 255.f }, { 0.f }, { 25.5f } },
         "Reshape",
-        "U8"
+        ov::element::u8.get_type_name()
     },
     // 4D -> 2D
     {
@@ -81,7 +81,7 @@ const std::vector<ReshapeTransformationParam> params = {
             { 255.f, 255.f / 2.f, 255.f / 3.f },
         },
         "Reshape",
-        "U8"
+        ov::element::u8.get_type_name()
     },
     // 4D -> 3D
     {
@@ -96,7 +96,7 @@ const std::vector<ReshapeTransformationParam> params = {
             { 255.f, 255.f / 2.f, 255.f / 3.f },
         },
         "Reshape",
-        "U8"
+        ov::element::u8.get_type_name()
     },
     // per-channel
     // 4D -> 3D
@@ -112,7 +112,7 @@ const std::vector<ReshapeTransformationParam> params = {
             { 255.f, 255.f / 2.f, 255.f / 3.f },
         },
         "Reshape",
-        "U8"
+        ov::element::u8.get_type_name()
     },
     // Channels count reducing, per-channel dequantizations 4d -> 4d
     {
@@ -122,7 +122,7 @@ const std::vector<ReshapeTransformationParam> params = {
           { 0.f, 0.f, 0.f }, { 255.f, 255.f, 255.f },
           { 0.f, 0.f, 0.f }, { 255.f, 25.5f, 2.55f } },
         "Reshape",
-        "FP32"
+        ov::element::f32.get_type_name()
     },
     // Channels count reducing, per-channel dequantizations 3d -> 4d
     {
@@ -132,7 +132,7 @@ const std::vector<ReshapeTransformationParam> params = {
                 { 0.f, 0.f, 0.f }, { 255.f, 255.f, 255.f },
                 { 0.f, 0.f, 0.f }, { 255.f, 25.5f, 2.55f } },
         "Reshape",
-        "FP32"
+        ov::element::f32.get_type_name()
     },
     // Channels count reducing, per-channel dequantizations 4d -> 3d
     {
@@ -142,7 +142,7 @@ const std::vector<ReshapeTransformationParam> params = {
                 { 0.f, 0.f, 0.f }, { 255.f, 255.f, 255.f },
                 { 0.f, 0.f, 0.f }, { 255.f, 25.5f, 2.55f } },
         "Reshape",
-        "FP32"
+        ov::element::f32.get_type_name()
     },
     // Channels count reducing, per-channel dequantizations 5d -> 3d
     {
@@ -152,7 +152,7 @@ const std::vector<ReshapeTransformationParam> params = {
                 { 0.f, 0.f, 0.f }, { 255.f, 255.f, 255.f },
                 { 0.f, 0.f, 0.f }, { 255.f, 25.5f, 2.55f } },
         "Reshape",
-        "FP32"
+        ov::element::f32.get_type_name()
     },
     // Channels count reducing, per-channel dequantizations 5d -> 4d
     {
@@ -162,7 +162,7 @@ const std::vector<ReshapeTransformationParam> params = {
                 { 0.f, 0.f, 0.f }, { 255.f, 255.f, 255.f },
                 { 0.f, 0.f, 0.f }, { 255.f, 25.5f, 2.55f } },
         "Reshape",
-        "FP32"
+        ov::element::f32.get_type_name()
     },
 };
 
@@ -174,7 +174,3 @@ INSTANTIATE_TEST_SUITE_P(smoke_LPT, ReshapeTransformation,
         ::testing::ValuesIn(params)),
     ReshapeTransformation::getTestCaseName);
 }  // namespace
-
-
-
-
diff --git a/src/plugins/intel_gpu/tests/functional/subgraph_tests/dynamic/read_value_assign.cpp b/src/plugins/intel_gpu/tests/functional/subgraph_tests/dynamic/read_value_assign.cpp
index f45009a5365167..3fe28008d39495 100644
--- a/src/plugins/intel_gpu/tests/functional/subgraph_tests/dynamic/read_value_assign.cpp
+++ b/src/plugins/intel_gpu/tests/functional/subgraph_tests/dynamic/read_value_assign.cpp
@@ -90,6 +90,7 @@ TEST_P(ReadValueAssignGPUTest, Inference_cached) {
     }
     {
         run();
+        core->set_property(ov::cache_dir(""));
         ov::test::utils::removeFilesWithExt(cacheDirName, "blob");
         ov::test::utils::removeFilesWithExt(cacheDirName, "cl_cache");
         ov::test::utils::removeDir(cacheDirName);
diff --git a/src/plugins/intel_gpu/tests/functional/subgraph_tests/dynamic/rms_norm_decomposition.cpp b/src/plugins/intel_gpu/tests/functional/subgraph_tests/dynamic/rms_norm_decomposition.cpp
index bf515ed78fec5a..7cc1493ea05368 100644
--- a/src/plugins/intel_gpu/tests/functional/subgraph_tests/dynamic/rms_norm_decomposition.cpp
+++ b/src/plugins/intel_gpu/tests/functional/subgraph_tests/dynamic/rms_norm_decomposition.cpp
@@ -147,6 +147,7 @@ TEST_P(RMSNormDecomposition, Inference_cached) {
     }
     {
         run();
+        core->set_property(ov::cache_dir(""));
         ov::test::utils::removeFilesWithExt(cacheDirName, "blob");
         ov::test::utils::removeFilesWithExt(cacheDirName, "cl_cache");
         ov::test::utils::removeDir(cacheDirName);
diff --git a/src/plugins/intel_gpu/tests/functional/subgraph_tests/dynamic/swiglu_fusion.cpp b/src/plugins/intel_gpu/tests/functional/subgraph_tests/dynamic/swiglu_fusion.cpp
index 3b209010fe7961..bcf261a3ead4fd 100644
--- a/src/plugins/intel_gpu/tests/functional/subgraph_tests/dynamic/swiglu_fusion.cpp
+++ b/src/plugins/intel_gpu/tests/functional/subgraph_tests/dynamic/swiglu_fusion.cpp
@@ -102,6 +102,7 @@ TEST_P(SwiGLUFusion, Inference_cached) {
     }
     {
         run();
+        core->set_property(ov::cache_dir(""));
         ov::test::utils::removeFilesWithExt(cacheDirName, "blob");
         ov::test::utils::removeFilesWithExt(cacheDirName, "cl_cache");
         ov::test::utils::removeDir(cacheDirName);
diff --git a/src/plugins/intel_gpu/tests/unit/dynamic_execution/bounded_shape_mem_alloc.cpp b/src/plugins/intel_gpu/tests/unit/dynamic_execution/bounded_shape_mem_alloc.cpp
index fdeeaf2a92e870..8551f8f299b023 100644
--- a/src/plugins/intel_gpu/tests/unit/dynamic_execution/bounded_shape_mem_alloc.cpp
+++ b/src/plugins/intel_gpu/tests/unit/dynamic_execution/bounded_shape_mem_alloc.cpp
@@ -23,7 +23,6 @@ TEST(dyn_shape_bounded_shape_mem, reorder) {
     topology topology(input_layout("input", input_lay),
                       reorder("reorder", input_info("input"), format::bfyx, data_types::f16));
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
     network network(engine, topology, config);
 
     const auto reorder_mem = network.get_primitive("reorder")->output_memory_ptr();
@@ -37,7 +36,6 @@ TEST(dyn_shape_bounded_shape_mem, permute) {
     topology topology(input_layout("input", input_lay),
                       permute("permute", input_info("input"), {0, 2, 3, 1}));
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
     network network(engine, topology, config);
 
     const auto permute_mem = network.get_primitive("permute")->output_memory_ptr();
diff --git a/src/plugins/intel_gpu/tests/unit/dynamic_execution/is_valid_fusion_test.cpp b/src/plugins/intel_gpu/tests/unit/dynamic_execution/is_valid_fusion_test.cpp
index ac44dfb073ce49..ce835e5918930f 100644
--- a/src/plugins/intel_gpu/tests/unit/dynamic_execution/is_valid_fusion_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/dynamic_execution/is_valid_fusion_test.cpp
@@ -77,7 +77,7 @@ TEST(eltwise_activation_fusing_test, basic_dynamic_rank4) {
 
     ExecutionConfig config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::optimize_data(true));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
     network network(engine, topology, config);
     network.set_input_data("input", input_mem);
diff --git a/src/plugins/intel_gpu/tests/unit/dynamic_execution/memory_realloc_test.cpp b/src/plugins/intel_gpu/tests/unit/dynamic_execution/memory_realloc_test.cpp
index cf33ea908f2cc5..e19f11d5359622 100644
--- a/src/plugins/intel_gpu/tests/unit/dynamic_execution/memory_realloc_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/dynamic_execution/memory_realloc_test.cpp
@@ -94,7 +94,7 @@ TEST(memory_reuse_realloc_reset_test, basic_conv_with_padding) {
                       reorder("output", input_info("conv"), format::bfyx, data_types::f32)); /*output padding*/
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
     network network(engine, topology, config);
     network.set_input_data("input", input_mem_1);
@@ -153,7 +153,7 @@ TEST(softmax_gpu_dynamic_f32_test_upper_bound, input_same_values) {
                data_types::f32,
                format::bfyx);
     auto config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     ov::intel_gpu::ImplementationDesc softmax_impl = { format::bfyx, "softmax_gpu_ref" };
     config.set_property(ov::intel_gpu::force_implementations(ov::intel_gpu::ImplForcingMap{ { "softmax", softmax_impl } }));
     network network(engine, topology(input_layout("input", in_layout),
@@ -241,7 +241,7 @@ TEST(dyn_shape_mem_test, igpu_shape_infer_dep_mem_type) {
                       reshape("reshape", input_info("reorder"), input_info("eltwise"), false, ov::PartialShape()));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     network network(engine, topology, config);
 
     auto input_mem = engine.allocate_memory(layout{ov::PartialShape{6, 1}, data_types::f32, format::bfyx});
@@ -342,7 +342,6 @@ TEST(memory_reuse_realloc_reset_test, basic_conv_with_padding_reorder) {
                       reorder("output", input_info("conv"), format::bfyx, data_types::f32)); /*output padding*/
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
 
     network network(engine, topology, config);
     network.set_input_data("input", input_mem_2);
diff --git a/src/plugins/intel_gpu/tests/unit/dynamic_execution/optimized_out_execution_test.cpp b/src/plugins/intel_gpu/tests/unit/dynamic_execution/optimized_out_execution_test.cpp
index d9ee1b69be91b7..1efbb11ddf00b1 100644
--- a/src/plugins/intel_gpu/tests/unit/dynamic_execution/optimized_out_execution_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/dynamic_execution/optimized_out_execution_test.cpp
@@ -75,7 +75,7 @@ TEST(optimized_out_execution_test, concat_blocked_format) {
 
     ExecutionConfig config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::optimize_data(true));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
     network network(engine, topology, config);
     network.set_input_data("input1", input1);
diff --git a/src/plugins/intel_gpu/tests/unit/dynamic_execution/priorbox_test.cpp b/src/plugins/intel_gpu/tests/unit/dynamic_execution/priorbox_test.cpp
index 51f25ee0af3747..38a090332c27ed 100644
--- a/src/plugins/intel_gpu/tests/unit/dynamic_execution/priorbox_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/dynamic_execution/priorbox_test.cpp
@@ -139,7 +139,7 @@ TEST(priorbox_constant_propagation_test, basic) {
 
     ExecutionConfig config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::optimize_data(true));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
     network network(engine, topology, config);
     network.set_input_data("input1", input1_mem);
diff --git a/src/plugins/intel_gpu/tests/unit/dynamic_execution/skip_redundant_reorder_at_runtime.cpp b/src/plugins/intel_gpu/tests/unit/dynamic_execution/skip_redundant_reorder_at_runtime.cpp
index ad044071a30397..afa12652104bd8 100644
--- a/src/plugins/intel_gpu/tests/unit/dynamic_execution/skip_redundant_reorder_at_runtime.cpp
+++ b/src/plugins/intel_gpu/tests/unit/dynamic_execution/skip_redundant_reorder_at_runtime.cpp
@@ -33,7 +33,7 @@ TEST(remove_redundant_reorder, skip_reorder_at_runtime) {
                       reorder("reorder", input_info("fc"), format::bfyx, data_types::f32)); /*output padding*/
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
     network network(engine, topology, config);
     auto reorder_inst = network.get_primitive("reorder");
@@ -67,7 +67,7 @@ TEST(skip_reorder_at_runtime, correct_memory_reuse) {
                       reorder("reorder_fsv16", input_info("reshape"), format::b_fs_yx_fsv16, data_types::f32));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     config.set_property(ov::intel_gpu::optimize_data(true));
 
     network network(engine, topology, config);
diff --git a/src/plugins/intel_gpu/tests/unit/dynamic_execution/stateful_model.cpp b/src/plugins/intel_gpu/tests/unit/dynamic_execution/stateful_model.cpp
index 4b24fb996b3f3f..f385876f3f02db 100644
--- a/src/plugins/intel_gpu/tests/unit/dynamic_execution/stateful_model.cpp
+++ b/src/plugins/intel_gpu/tests/unit/dynamic_execution/stateful_model.cpp
@@ -44,7 +44,7 @@ TEST(stateful_model, skip_gather_at_runtime) {
                       reorder("reorder", input_info("concat"), format::bfyx, data_types::f32)); /*output padding*/
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
     network network(engine, topology, config);
     auto gather_inst = network.get_primitive("gather");
@@ -100,7 +100,7 @@ TEST(stateful_model, not_skip_gather_at_runtime) {
                       reorder("reorder", input_info("concat"), format::bfyx, data_types::f32)); /*output padding*/
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
     network network(engine, topology, config);
     auto gather_inst = network.get_primitive("gather");
@@ -152,7 +152,7 @@ TEST(stateful_model, not_skip_gather_in_cpuimpl) {
                       reorder("reorder", input_info("concat"), format::bfyx, data_types::f32)); /*output padding*/
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     config.set_property(ov::intel_gpu::force_implementations(ov::intel_gpu::ImplForcingMap{ {"gather", {format::bfyx, "", impl_types::cpu}} }));
 
     network network(engine, topology, config);
@@ -210,7 +210,7 @@ TEST(stateful_model, check_dynamic_pad_for_kv_cache) {
                       reorder("reorder", input_info("concat"), format::bfyx, data_types::f32)); /*output padding*/
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     config.set_property(ov::intel_gpu::optimize_data(true));
 
     network network(engine, topology, config);
diff --git a/src/plugins/intel_gpu/tests/unit/fake_alignment/fc_fake_alignment_test.cpp b/src/plugins/intel_gpu/tests/unit/fake_alignment/fc_fake_alignment_test.cpp
index 6e3472bc48a80d..6fcf1dc4933d0a 100644
--- a/src/plugins/intel_gpu/tests/unit/fake_alignment/fc_fake_alignment_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/fake_alignment/fc_fake_alignment_test.cpp
@@ -245,7 +245,6 @@ TEST_P(fully_connected_skip_fake_align_test, skip_fake_alignment_case) {
 
     ExecutionConfig config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::optimize_data(true));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
     network network(engine, topology, config);
 
     auto impl_param = network.get_primitive("fc_prim1")->get_impl_params();
diff --git a/src/plugins/intel_gpu/tests/unit/fusions/batch_to_space_fusion_test.cpp b/src/plugins/intel_gpu/tests/unit/fusions/batch_to_space_fusion_test.cpp
index 0f7a3cc4806694..ea6b0bdd53fcc9 100644
--- a/src/plugins/intel_gpu/tests/unit/fusions/batch_to_space_fusion_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/fusions/batch_to_space_fusion_test.cpp
@@ -2,6 +2,7 @@
 // SPDX-License-Identifier: Apache-2.0
 //
 
+#include "openvino/core/partial_shape.hpp"
 #include "test_utils.h"
 #include "fusion_test_common.hpp"
 
@@ -18,13 +19,13 @@ using namespace ::tests;
 
 namespace {
 struct batch_to_space_test_params {
-    tensor input_size;
-    tensor output_size;
+    ov::PartialShape input_size;
+    ov::PartialShape output_size;
     data_types input_type;
     format input_format;
-    tensor block_shape;
-    tensor crops_begin;
-    tensor crops_end;
+    std::vector<int32_t> block_shape;
+    std::vector<int32_t> crops_begin;
+    std::vector<int32_t> crops_end;
     data_types default_type;
     format default_format;
     size_t expected_fused_primitives;
@@ -46,11 +47,11 @@ class BatchToSpaceFusingsTest : public ::BaseFusingTest<batch_to_space_test_para
     }
 
     layout get_input_layout(batch_to_space_test_params& p) {
-        return layout{ p.input_type, p.input_format, p.input_size };
+        return layout{ p.input_size, p.input_type, p.input_format };
     }
 
     layout get_per_channel_layout(batch_to_space_test_params& p) {
-        return layout{ p.default_type, p.default_format, tensor{ 1, p.output_size.feature[0], 1, 1 } };
+        return layout{ { 1, p.output_size[1], 1, 1 }, p.default_type, p.default_format,  };
     }
 };
 
@@ -74,7 +75,7 @@ TEST_P(batch_to_space_quantize_i8, basic) {
     auto p = GetParam();
     create_topologies(
         input_layout("input", get_input_layout(p)),
-        batch_to_space("batch_to_space", input_info("input"), p.block_shape, p.crops_begin, p.crops_end, p.output_size),
+        batch_to_space("batch_to_space", input_info("input"), p.block_shape, p.crops_begin, p.crops_end),
         data("in_low", get_mem(get_per_channel_layout(p), min_random, 0)),
         data("in_high", get_mem(get_per_channel_layout(p), 1, max_random)),
         data("out_low", get_mem(get_single_element_layout(p), -128)),
@@ -100,11 +101,11 @@ TEST_P(batch_to_space_scale_act_eltwise_quantize_u8, basic) {
     auto p = GetParam();
     create_topologies(
         input_layout("input", get_input_layout(p)),
-        batch_to_space("batch_to_space", input_info("input"), p.block_shape, p.crops_begin, p.crops_end, p.output_size),
+        batch_to_space("batch_to_space", input_info("input"), p.block_shape, p.crops_begin, p.crops_end),
         data("scale1_data", get_mem(get_per_channel_layout(p), -0.125f)),
         eltwise("scale1", { input_info("batch_to_space"), input_info("scale1_data") }, eltwise_mode::prod, p.default_type),
         activation("actv1", input_info("scale1"), activation_func::relu),
-        data("eltw_data", get_mem(layout(p.default_type, p.input_format, p.output_size))),
+        data("eltw_data", get_mem(layout(p.output_size, p.default_type, p.input_format))),
         eltwise("eltw", { input_info("actv1"), input_info("eltw_data") }, eltwise_mode::sum, p.default_type),
         data("in_low", get_mem(get_per_channel_layout(p), min_random, 0)),
         data("in_high", get_mem(get_per_channel_layout(p), 1, max_random)),
@@ -135,11 +136,11 @@ TEST_P(batch_to_space_scale_act_eltw, basic) {
     auto p = GetParam();
     create_topologies(
         input_layout("input", get_input_layout(p)),
-        batch_to_space("batch_to_space", input_info("input"), p.block_shape, p.crops_begin, p.crops_end, p.output_size),
+        batch_to_space("batch_to_space", input_info("input"), p.block_shape, p.crops_begin, p.crops_end),
         data("scale1_data", get_mem(get_per_channel_layout(p), -0.125f)),
         eltwise("scale1", { input_info("batch_to_space"), input_info("scale1_data") }, eltwise_mode::prod, p.default_type),
         activation("actv1", input_info("scale1"), activation_func::relu),
-        data("eltw_data", get_mem(layout(p.default_type, p.input_format, p.output_size))),
+        data("eltw_data", get_mem(layout(p.output_size, p.default_type, p.input_format))),
         eltwise("eltw", { input_info("actv1"), input_info("eltw_data") }, eltwise_mode::sum, p.default_type),
         reorder("reorder_bfyx", input_info("eltw"), p.default_format, data_types::f32)
     );
diff --git a/src/plugins/intel_gpu/tests/unit/fusions/fully_connected_fusion_test.cpp b/src/plugins/intel_gpu/tests/unit/fusions/fully_connected_fusion_test.cpp
index ee482ed5543d56..fecd9ec941c2a2 100644
--- a/src/plugins/intel_gpu/tests/unit/fusions/fully_connected_fusion_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/fusions/fully_connected_fusion_test.cpp
@@ -36,8 +36,6 @@ class FullyConnectedFusingTest : public ::BaseFusingTest<fully_connected_test_pa
 public:
 
     void execute(fully_connected_test_params& p, bool is_dynamic = false) {
-        cfg_not_fused.set_property(ov::intel_gpu::allow_new_shape_infer(is_dynamic));
-        cfg_fused.set_property(ov::intel_gpu::allow_new_shape_infer(is_dynamic));
         auto input_prim = this->get_mem(get_input_layout(p));
         network network_not_fused(this->engine, this->topology_non_fused, this->cfg_not_fused);
         network network_fused(this->engine, this->topology_fused, this->cfg_fused);
@@ -103,7 +101,6 @@ class FullyConnectedFusingTestOneDNN : public BaseFusingTest<fully_connected_tes
 
         ov::intel_gpu::ImplementationDesc fc_impl = { forcing_format, "", impl_types::onednn };
         cfg_fused.set_property(ov::intel_gpu::force_implementations(ov::intel_gpu::ImplForcingMap{ { "fc_prim", fc_impl } }));
-        cfg_fused.set_property(ov::intel_gpu::allow_new_shape_infer(is_dynamic));
 
         network::ptr network_not_fused = get_network(this->engine, this->topology_non_fused, cfg_not_fused, get_test_stream_ptr(cfg_not_fused), is_caching_test);
         network::ptr network_fused = get_network(this->engine, this->topology_fused, cfg_fused, get_test_stream_ptr(cfg_fused), is_caching_test);
@@ -591,7 +588,6 @@ TEST_P(fc_fp16_eltwise_add_dynamic, basic) {
     );
 
     bool is_dynamic = true;
-    cfg_not_fused.set_property(ov::intel_gpu::allow_new_shape_infer(is_dynamic));
     tolerance = 1e-2f;
     execute(p, false, is_dynamic);
 }
@@ -655,7 +651,6 @@ TEST_P(fc_compressed_int8_bias_dynamic_onednn, basic) {
     );
 
     bool is_dynamic = true;
-    cfg_not_fused.set_property(ov::intel_gpu::allow_new_shape_infer(is_dynamic));
     tolerance = 1.0f;
     execute(p, false, is_dynamic);
 }
diff --git a/src/plugins/intel_gpu/tests/unit/fusions/gather_fusion_test.cpp b/src/plugins/intel_gpu/tests/unit/fusions/gather_fusion_test.cpp
index 2468a96e789a37..db924d10c6f965 100644
--- a/src/plugins/intel_gpu/tests/unit/fusions/gather_fusion_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/fusions/gather_fusion_test.cpp
@@ -33,8 +33,6 @@ struct gather_test_params {
 class GatherPrimitiveFusingTest : public ::BaseFusingTest<gather_test_params> {
 public:
     void execute(gather_test_params& p, bool is_dynamic = false, bool count_reorder = false) {
-        cfg_not_fused.set_property(ov::intel_gpu::allow_new_shape_infer(is_dynamic));
-        cfg_fused.set_property(ov::intel_gpu::allow_new_shape_infer(is_dynamic));
         cfg_fused.set_property(ov::intel_gpu::optimize_data(true));
         auto input_prim = get_mem(get_input_layout(p));
         auto indices_prim = get_mem(get_indices_layout(p), 0, static_cast<int>(get_axis_dim(p) - 1));
diff --git a/src/plugins/intel_gpu/tests/unit/fusions/gemm_fusion_test.cpp b/src/plugins/intel_gpu/tests/unit/fusions/gemm_fusion_test.cpp
index 799916fd61c345..c63845b8d41526 100644
--- a/src/plugins/intel_gpu/tests/unit/fusions/gemm_fusion_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/fusions/gemm_fusion_test.cpp
@@ -46,9 +46,6 @@ class GemmFusingTest : public ::BaseFusingTest<gemm_test_params> {
 public:
 
     void execute(gemm_test_params& p, bool is_dynamic, bool is_caching_test = false) {
-        cfg_not_fused.set_property(ov::intel_gpu::allow_new_shape_infer(is_dynamic));
-        cfg_fused.set_property(ov::intel_gpu::allow_new_shape_infer(is_dynamic));
-
         auto input0_prim = get_mem(get_input_layout(p, 0));
         auto input1_prim = get_mem(get_input_layout(p, 1));
 
@@ -425,9 +422,6 @@ TEST_P(gemm_2in_dynamic_add, add) {
     if (engine.get_device_info().supports_immad)
         p.expected_fused_primitives++;
 
-    cfg_fused.set_property(ov::intel_gpu::allow_new_shape_infer(true));
-    cfg_not_fused.set_property(ov::intel_gpu::allow_new_shape_infer(true));
-
     auto eltwise_layout = get_output_layout(p);
     auto eltwise_shape = ov::PartialShape::dynamic(eltwise_layout.get_partial_shape().size());
     if (p.broadcast_kind == broadcast_kinds::batch)
diff --git a/src/plugins/intel_gpu/tests/unit/fusions/reduce_fusion_test.cpp b/src/plugins/intel_gpu/tests/unit/fusions/reduce_fusion_test.cpp
index 19c4ecd522a242..772608f821dcab 100644
--- a/src/plugins/intel_gpu/tests/unit/fusions/reduce_fusion_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/fusions/reduce_fusion_test.cpp
@@ -39,9 +39,6 @@ class ReduceFusingTest : public ::BaseFusingTest<reduce_test_params> {
     void execute(reduce_test_params& p, bool is_dynamic = false, bool use_planar_input = false) {
         auto input_prim = get_mem(get_input_layout(p, use_planar_input));
 
-        cfg_not_fused.set_property(ov::intel_gpu::allow_new_shape_infer(is_dynamic));
-        cfg_fused.set_property(ov::intel_gpu::allow_new_shape_infer(is_dynamic));
-
         network network_not_fused(this->engine, this->topology_non_fused, cfg_not_fused);
         network network_fused(this->engine, this->topology_fused, cfg_fused);
 
diff --git a/src/plugins/intel_gpu/tests/unit/fusions/select_fusion_test.cpp b/src/plugins/intel_gpu/tests/unit/fusions/select_fusion_test.cpp
index 0cc5843545ba44..65ff71e3a6b212 100644
--- a/src/plugins/intel_gpu/tests/unit/fusions/select_fusion_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/fusions/select_fusion_test.cpp
@@ -31,10 +31,8 @@ struct select_test_params {
 class SelectFusingTest : public ::BaseFusingTest<select_test_params> {
 public:
     void execute(select_test_params& p, bool count_reorder = false) {
-        cfg_not_fused.set_property(ov::intel_gpu::allow_new_shape_infer(true));
-        cfg_fused.set_property(ov::intel_gpu::allow_new_shape_infer(true));
         cfg_fused.set_property(ov::intel_gpu::optimize_data(true));
- 
+
         tests::random_generator rg;
         auto mask_mem   = get_mem(get_mask_layout(p), 0, 1);
         auto input1_mem = get_mem(get_input_layout(p));
diff --git a/src/plugins/intel_gpu/tests/unit/fusions/space_to_batch_fusion_test.cpp b/src/plugins/intel_gpu/tests/unit/fusions/space_to_batch_fusion_test.cpp
index 0f96a98163eea6..a51ce427bd1212 100644
--- a/src/plugins/intel_gpu/tests/unit/fusions/space_to_batch_fusion_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/fusions/space_to_batch_fusion_test.cpp
@@ -2,6 +2,7 @@
 // SPDX-License-Identifier: Apache-2.0
 //
 
+#include "openvino/core/partial_shape.hpp"
 #include "test_utils.h"
 #include "fusion_test_common.hpp"
 
@@ -18,13 +19,13 @@ using namespace ::tests;
 
 namespace {
 struct space_to_batch_test_params {
-    tensor input_size;
-    tensor output_size;
+    ov::PartialShape input_size;
+    ov::PartialShape output_size;
     data_types input_type;
     format input_format;
-    tensor block_shape;
-    tensor pads_begin;
-    tensor pads_end;
+    std::vector<int32_t> block_shape;
+    std::vector<int32_t> pads_begin;
+    std::vector<int32_t> pads_end;
     data_types default_type;
     format default_format;
     size_t expected_fused_primitives;
@@ -46,11 +47,11 @@ class SpaceToBatchFusingsTest : public ::BaseFusingTest<space_to_batch_test_para
     }
 
     layout get_input_layout(space_to_batch_test_params& p) {
-        return layout{ p.input_type, p.input_format, p.input_size };
+        return layout{ p.input_size, p.input_type, p.input_format };
     }
 
     layout get_per_channel_layout(space_to_batch_test_params& p) {
-        return layout{ p.default_type, p.default_format, tensor{ 1, p.output_size.feature[0], 1, 1 } };
+        return layout{{ 1, p.output_size[1], 1, 1 }, p.default_type, p.default_format};
     }
 };
 }  // namespace
@@ -72,7 +73,7 @@ TEST_P(space_to_batch_quantize_i8, basic) {
     auto p = GetParam();
     create_topologies(
         input_layout("input", get_input_layout(p)),
-        space_to_batch("space_to_batch", input_info("input"), p.block_shape, p.pads_begin, p.pads_end, p.output_size),
+        space_to_batch("space_to_batch", input_info("input"), p.block_shape, p.pads_begin, p.pads_end),
         data("in_low", get_mem(get_per_channel_layout(p), min_random, 0)),
         data("in_high", get_mem(get_per_channel_layout(p), 1, max_random)),
         data("out_low", get_mem(get_single_element_layout(p), -128)),
@@ -98,11 +99,11 @@ TEST_P(space_to_batch_scale_act_eltwise_quantize_u8, basic) {
     auto p = GetParam();
     create_topologies(
         input_layout("input", get_input_layout(p)),
-        space_to_batch("space_to_batch", input_info("input"), p.block_shape, p.pads_begin, p.pads_end, p.output_size),
+        space_to_batch("space_to_batch", input_info("input"), p.block_shape, p.pads_begin, p.pads_end),
         data("scale1_data", get_mem(get_per_channel_layout(p), -0.125f)),
         eltwise("scale1", { input_info("space_to_batch"), input_info("scale1_data") }, eltwise_mode::prod, p.default_type),
         activation("actv1", input_info("scale1"), activation_func::relu),
-        data("eltw_data", get_mem(layout(p.default_type, p.input_format, p.output_size))),
+        data("eltw_data", get_mem(layout(p.output_size, p.default_type, p.input_format))),
         eltwise("eltw", { input_info("actv1"), input_info("eltw_data") }, eltwise_mode::sum, p.default_type),
         data("in_low", get_mem(get_per_channel_layout(p), min_random, 0)),
         data("in_high", get_mem(get_per_channel_layout(p), 1, max_random)),
@@ -134,11 +135,11 @@ TEST_P(space_to_batch_scale_act_eltw, basic) {
     auto p = GetParam();
     create_topologies(
         input_layout("input", get_input_layout(p)),
-        space_to_batch("space_to_batch", input_info("input"), p.block_shape, p.pads_begin, p.pads_end, p.output_size),
+        space_to_batch("space_to_batch", input_info("input"), p.block_shape, p.pads_begin, p.pads_end),
         data("scale1_data", get_mem(get_per_channel_layout(p), -0.125f)),
         eltwise("scale1", { input_info("space_to_batch"), input_info("scale1_data") }, eltwise_mode::prod, p.default_type),
         activation("actv1", input_info("scale1"), activation_func::relu),
-        data("eltw_data", get_mem(layout(p.default_type, p.input_format, p.output_size))),
+        data("eltw_data", get_mem(layout(p.output_size, p.default_type, p.input_format))),
         eltwise("eltw", { input_info("actv1"), input_info("eltw_data") }, eltwise_mode::sum, p.default_type),
         reorder("reorder_bfyx", input_info("eltw"), p.default_format, data_types::f32)
     );
diff --git a/src/plugins/intel_gpu/tests/unit/module_tests/kernel_impl_params_relevance_test.cpp b/src/plugins/intel_gpu/tests/unit/module_tests/kernel_impl_params_relevance_test.cpp
index 017ad15981cf91..f7e19b56b6c1fd 100644
--- a/src/plugins/intel_gpu/tests/unit/module_tests/kernel_impl_params_relevance_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/module_tests/kernel_impl_params_relevance_test.cpp
@@ -35,8 +35,7 @@ TEST(kernel_impl_params_relevance, weights_layout) {
 
     auto fc_opt_impl = ov::intel_gpu::ImplementationDesc(format::bfyx, "fully_connected_gpu_bf_tiled", impl_types::ocl);
     ExecutionConfig cfg{ ov::intel_gpu::force_implementations(ov::intel_gpu::ImplForcingMap{ {"fc", fc_opt_impl} }),
-                         ov::intel_gpu::optimize_data(true),
-                         ov::intel_gpu::allow_new_shape_infer(true) };
+                         ov::intel_gpu::optimize_data(true)};
 
     // 1. Compile network with forced `fully_connected_gpu_bf_tiled` kernel => optimized shape-agnostic
     //    kernel will be used
diff --git a/src/plugins/intel_gpu/tests/unit/module_tests/network_test.cpp b/src/plugins/intel_gpu/tests/unit/module_tests/network_test.cpp
index f4353711126218..765c73eba91151 100644
--- a/src/plugins/intel_gpu/tests/unit/module_tests/network_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/module_tests/network_test.cpp
@@ -47,7 +47,7 @@ TEST(network_test, model_with_empty_input_is_not_dynamic) {
     topology.add(data("input1", const_mem));
     topology.add(concatenation("output", { input_info("input0"), input_info("input1") }, 1));
 
-    network net(engine, topology, {ov::intel_gpu::allow_new_shape_infer(true)});
+    network net(engine, topology);
 
     ASSERT_FALSE(net.is_dynamic());
 }
@@ -63,7 +63,7 @@ TEST(network_test, model_with_dynamic_input_is_dynamic) {
     topology.add(data("input1", const_mem));
     topology.add(concatenation("output", { input_info("input0"), input_info("input1") }, 1));
 
-    network net(engine, topology, {ov::intel_gpu::allow_new_shape_infer(true)});
+    network net(engine, topology);
 
     ASSERT_TRUE(net.is_dynamic());
 }
@@ -87,7 +87,7 @@ TEST(network_test, has_proper_event_for_in_order_queue) {
 
     auto config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::queue_type(QueueTypes::in_order));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     config.set_property(ov::intel_gpu::force_implementations(impl_forcing_map));
 
     network net(engine, topology, config);
@@ -133,7 +133,7 @@ TEST(network_test, has_proper_event_for_in_order_queue_optimized_out) {
 
     auto config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::queue_type(QueueTypes::in_order));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     config.set_property(ov::intel_gpu::force_implementations(impl_forcing_map));
 
     network net(engine, topology, config);
@@ -186,7 +186,7 @@ TEST(network_test, has_proper_event_for_in_order_queue_onednn) {
 
     auto config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::queue_type(QueueTypes::in_order));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     config.set_property(ov::intel_gpu::force_implementations(impl_forcing_map));
 
     network net(engine, topology, config);
@@ -233,7 +233,7 @@ TEST(network_test, scratchpad_test) {
     auto config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::optimize_data(false));
     config.set_property(ov::intel_gpu::queue_type(QueueTypes::in_order));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     config.set_property(ov::intel_gpu::force_implementations(impl_forcing_map));
 
     network net1(engine, topology, config);
diff --git a/src/plugins/intel_gpu/tests/unit/module_tests/weights_reorder_factory_test.cpp b/src/plugins/intel_gpu/tests/unit/module_tests/weights_reorder_factory_test.cpp
index bc4cffc17e193a..a6dc904210f27a 100644
--- a/src/plugins/intel_gpu/tests/unit/module_tests/weights_reorder_factory_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/module_tests/weights_reorder_factory_test.cpp
@@ -58,8 +58,8 @@ TEST(weights_factory, reorder_test) {
     ov::intel_gpu::ImplementationDesc fc_impl_desc = { format::bfyx, "fully_connected_gpu_bf_tiled", impl_types::ocl };
     ExecutionConfig config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::optimize_data(true));
-    config.set_property(ov::intel_gpu::force_implementations(ov::intel_gpu::ImplForcingMap{ {"fc", fc_impl_desc} })),
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+    config.set_property(ov::intel_gpu::force_implementations(ov::intel_gpu::ImplForcingMap{ {"fc", fc_impl_desc} }));
+
     cldnn::network network(engine, topology, config);
 
     auto inst = network.get_primitive("fc");
diff --git a/src/plugins/intel_gpu/tests/unit/passes/add_onednn_optimization_attributes_test.cpp b/src/plugins/intel_gpu/tests/unit/passes/add_onednn_optimization_attributes_test.cpp
index 70e6f99aad8097..cd80c61208b417 100644
--- a/src/plugins/intel_gpu/tests/unit/passes/add_onednn_optimization_attributes_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/passes/add_onednn_optimization_attributes_test.cpp
@@ -45,7 +45,7 @@ TEST(add_onednn_optimization_attributes, init_attribute_for_fused_onednn_primiti
 
     ExecutionConfig config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::optimize_data(true));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     auto prog = program::build_program(engine, topology, config, false, false);
 
     prog->get_layout_optimizer().set_optimization_attribute(layout_optimizer::optimization_attributes_type::use_onednn_impls, true);
diff --git a/src/plugins/intel_gpu/tests/unit/passes/add_required_reorders_test.cpp b/src/plugins/intel_gpu/tests/unit/passes/add_required_reorders_test.cpp
index 8882a04fd9a400..2727a8e41bafc1 100644
--- a/src/plugins/intel_gpu/tests/unit/passes/add_required_reorders_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/passes/add_required_reorders_test.cpp
@@ -52,7 +52,7 @@ TEST(add_required_reorders, input_reorder_inside_shape_of_subgraph) {
     topology.add(concatenation("concat0", {input_info("reshape0"), input_info("reshape1")}, 0, data_types::f32));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     config.set_property(ov::intel_gpu::optimize_data(true));
     network network(engine, topology, config);
     network.set_input_data("input", input);
diff --git a/src/plugins/intel_gpu/tests/unit/passes/clamp_fp16_output_test.cpp b/src/plugins/intel_gpu/tests/unit/passes/clamp_fp16_output_test.cpp
index 30b9cd01a2365f..f18394cfc73058 100644
--- a/src/plugins/intel_gpu/tests/unit/passes/clamp_fp16_output_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/passes/clamp_fp16_output_test.cpp
@@ -56,7 +56,7 @@ TEST(clamp_fp16_output_test, test_gemm_softmax_simple) {
 
     ExecutionConfig config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::optimize_data(true));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     network network(engine, topology, config);
     network.set_input_data("input1", input1);
     network.set_input_data("input2", input2);
@@ -124,7 +124,7 @@ TEST(clamp_fp16_output_test, test_gemm_softmax_mult_fused) {
 
     ExecutionConfig config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::optimize_data(true));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     network network(engine, topology, config);
     network.set_input_data("input1", input1);
     network.set_input_data("input2", input2);
diff --git a/src/plugins/intel_gpu/tests/unit/passes/handle_reshape.cpp b/src/plugins/intel_gpu/tests/unit/passes/handle_reshape.cpp
index 151c6def8788b6..230acafef91577 100644
--- a/src/plugins/intel_gpu/tests/unit/passes/handle_reshape.cpp
+++ b/src/plugins/intel_gpu/tests/unit/passes/handle_reshape.cpp
@@ -40,7 +40,7 @@ TEST(handle_reshape, dont_remove_reshape_that_changes_rank) {
     topology.add(eltwise("e2", input_info("reshape"), input_info("data1"), eltwise_mode::sum));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     config.set_property(ov::intel_gpu::optimize_data(true));
     auto prog = program::build_program(engine, topology, config, false, true);
 
@@ -69,7 +69,7 @@ TEST(handle_reshape, dont_remove_reshape_that_changes_rank_chain) {
     topology.add(eltwise("e2", input_info("reshape2"), input_info("data1"), eltwise_mode::sum));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     config.set_property(ov::intel_gpu::optimize_data(true));
     auto prog = program::build_program(engine, topology, config, false, true);
 
@@ -144,7 +144,7 @@ TEST(handle_reshape, correct_parameters_propagation) {
     topology.add(reorder("reorder", input_info("reshape"), format::bfyx, data_types::f32));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     config.set_property(ov::intel_gpu::optimize_data(true));
     auto prog = program::build_program(engine, topology, config, false, true);
 
@@ -184,7 +184,7 @@ TEST(handle_reshape, correct_parameters_propagation_2_inputs) {
     topology.add(reorder("reorder", input_info("reshape"), format::bfyx, data_types::f32));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     config.set_property(ov::intel_gpu::optimize_data(true));
     auto prog = program::build_program(engine, topology, config, false, true);
 
@@ -236,7 +236,7 @@ TEST(handle_reshape, reshape_input_reorder) {
     topology.add(reorder("reorder", input_info("eltw"), format::bfyx, data_types::f32));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     config.set_property(ov::intel_gpu::optimize_data(true));
     auto prog = program::build_program(engine, topology, config);
 
@@ -297,7 +297,7 @@ TEST(handle_reshape, reshape_opt_out_layout_update) {
     topology.add(reorder("reorder", input_info("permute"), format::b_fs_yx_fsv16, data_types::f32));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     config.set_property(ov::intel_gpu::optimize_data(true));
     auto prog = program::build_program(engine, topology, config, false, true);
 
diff --git a/src/plugins/intel_gpu/tests/unit/passes/kernels_cache_test.cpp b/src/plugins/intel_gpu/tests/unit/passes/kernels_cache_test.cpp
index 6ebe5d3dced041..07ef9381c62ab2 100644
--- a/src/plugins/intel_gpu/tests/unit/passes/kernels_cache_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/passes/kernels_cache_test.cpp
@@ -60,7 +60,7 @@ TEST(kernels_cache, reuse_kernel_for_static_model_01) {
                       reorder("output", input_info("sum"), {{3, 2}, data_types::f16, format::bfyx}));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     auto prog = program::build_program(engine, topology, config, false, false);
     auto& cache = prog->get_kernels_cache();
     auto& conv1_node = prog->get_node("conv1");
diff --git a/src/plugins/intel_gpu/tests/unit/passes/mark_shape_of_subgraphs_test.cpp b/src/plugins/intel_gpu/tests/unit/passes/mark_shape_of_subgraphs_test.cpp
index 434c60a24eb3a3..ff800db9739c97 100644
--- a/src/plugins/intel_gpu/tests/unit/passes/mark_shape_of_subgraphs_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/passes/mark_shape_of_subgraphs_test.cpp
@@ -68,7 +68,7 @@ TEST(mark_shape_of_subgraphs, simple_chain) {
     topology.add(broadcast("broadcast", input_info("input"), input_info("concat"), {}, ov::op::BroadcastType::BIDIRECTIONAL));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     config.set_property(ov::intel_gpu::optimize_data(true));
     network network(engine, topology, config);
 
@@ -108,7 +108,7 @@ TEST(mark_shape_of_subgraphs, simple_chain_w_reshape_inside_subgraph) {
     topology.add(broadcast("broadcast", input_info("input"), input_info("reshape"), {}, ov::op::BroadcastType::BIDIRECTIONAL));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     config.set_property(ov::intel_gpu::optimize_data(true));
     network network(engine, topology, config);
 
@@ -135,7 +135,7 @@ TEST(mark_shape_of_subgraphs, parallel_shape_of_subgraphs) {
     topology.add(reshape("reshape", input_info("input"), input_info("eltwise"), false, ov::PartialShape()));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     config.set_property(ov::intel_gpu::optimize_data(true));
     network network(engine, topology, config);
 
@@ -183,7 +183,7 @@ TEST(mark_shape_of_subgraphs, parallel_shape_of_subgraphs_cascade) {
     topology.add(cldnn::select("select", input_info("data_0"), input_info("input"), input_info("reshape")));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     config.set_property(ov::intel_gpu::optimize_data(true));
     network network(engine, topology, config);
 
@@ -214,7 +214,7 @@ TEST(mark_shape_of_subgraphs, simple_chain_w_inserted_reorder) {
     topology.add(reshape("reshape_2", input_info("input"), input_info("eltwise"), false, ov::PartialShape()));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     config.set_property(ov::intel_gpu::optimize_data(true));
     network network(engine, topology, config);
 
@@ -243,7 +243,7 @@ TEST(mark_shape_of_subgraphs, concat_with_empty_tensor_inputs) {
     topology.add(concatenation("concat", {input_info("gather01"), input_info("shape_of_02"), input_info("shape_of_03")}, 0));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     config.set_property(ov::intel_gpu::optimize_data(true));
     network network(engine, topology, config);
 
@@ -308,7 +308,7 @@ TEST(mark_shape_of_subgraphs, gather_compressed_no_mark) {
     topology.add(broadcast("broadcast", input_info("input"), input_info("concat"), {}, ov::op::BroadcastType::BIDIRECTIONAL));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     config.set_property(ov::intel_gpu::optimize_data(true));
     network network(engine, topology, config);
 
@@ -317,4 +317,4 @@ TEST(mark_shape_of_subgraphs, gather_compressed_no_mark) {
 
     ASSERT_FALSE(check_subgraph(prog->get_node("shape_of"), prog->get_node("gather_compressed")));
     ASSERT_FALSE(check_subgraph(prog->get_node("shape_of"), prog->get_node("concat")));
-}
\ No newline at end of file
+}
diff --git a/src/plugins/intel_gpu/tests/unit/passes/post_optimize_weights.cpp b/src/plugins/intel_gpu/tests/unit/passes/post_optimize_weights.cpp
index 52ad30e321b1f3..25ee021e95d3bc 100644
--- a/src/plugins/intel_gpu/tests/unit/passes/post_optimize_weights.cpp
+++ b/src/plugins/intel_gpu/tests/unit/passes/post_optimize_weights.cpp
@@ -28,7 +28,7 @@ TEST(post_optimize_weights, fuse_reorder_to_weights_reorder_test) {
 
     ExecutionConfig config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::optimize_data(true));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     auto prog = program::build_program(engine, topology, config, false, true);
 
     reorder_factory rf;
@@ -57,7 +57,7 @@ TEST(post_optimize_weights, fuse_reorder_to_weights_reorder_test_dynamic) {
 
     ExecutionConfig config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::optimize_data(true));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     auto prog = program::build_program(engine, topology, config, false, true);
 
     reorder_factory rf;
@@ -88,7 +88,7 @@ TEST(post_optimize_weights, weights_reorder_constant_folding_test) {
 
     ExecutionConfig config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::optimize_data(true));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
     auto prog = program::build_program(engine, topology, config, false, true);
 
@@ -140,7 +140,7 @@ TEST(post_optimize_weights, weights_reorder_constant_folding_test_dynamic) {
 
     ExecutionConfig config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::optimize_data(true));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
     auto prog = program::build_program(engine, topology, config, false, true);
 
@@ -191,7 +191,7 @@ TEST(post_optimize_weights, fuse_only_with_supported_weights_layout) {
 
     ExecutionConfig config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::optimize_data(true));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     auto prog = program::build_program(engine, topology, config, false, true);
 
     reorder_factory rf;
@@ -223,7 +223,6 @@ TEST(post_optimize_weights, fuse_reorder_to_onednn_weights_reorder_test) {
 
     ExecutionConfig config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::optimize_data(true));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
 
     if (engine.get_device_info().supports_immad) {
         ov::intel_gpu::ImplementationDesc fc_impl = { format::bfyx, "", impl_types::onednn };
diff --git a/src/plugins/intel_gpu/tests/unit/passes/prepare_buffer_fusing_test.cpp b/src/plugins/intel_gpu/tests/unit/passes/prepare_buffer_fusing_test.cpp
index 6dee2779ae561f..04f9d330be1ac5 100644
--- a/src/plugins/intel_gpu/tests/unit/passes/prepare_buffer_fusing_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/passes/prepare_buffer_fusing_test.cpp
@@ -47,7 +47,7 @@ TEST(prepare_buffer_fusing, optimize_reshape) {
     topology.add(reorder("reorder", input_info("permute2"), format::bfyx, data_types::f32));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     auto prog = program::build_program(engine, topology, config, false, true);
 
     program_wrapper::apply_opt_pass<prepare_buffer_fusing>(*prog);
@@ -89,7 +89,7 @@ TEST(prepare_buffer_fusing, static_node_after_optimized_out_dyn_reshape) {
     topology.add(reorder("reorder", input_info("fc"), format::bfyx, data_types::f32));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     auto prog = program::build_program(engine, topology, config, false, true);
     ASSERT_NE(prog, nullptr);
 
@@ -186,7 +186,7 @@ TEST(prepare_buffer_fusing, in_place_concat_dynamic) {
 
     ExecutionConfig config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::optimize_data(true));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     auto prog = program::build_program(engine, topology, config, false, false);
     ASSERT_NE(prog, nullptr);
     cldnn::network net(prog, 0);
@@ -256,7 +256,7 @@ TEST(prepare_buffer_fusing, in_place_concat_strided_slice_dyn) {
 
     ExecutionConfig config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::optimize_data(true));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     auto prog = program::build_program(engine, topology, config, false, false);
     ASSERT_NE(prog, nullptr);
     cldnn::network net(prog, 0);
@@ -329,7 +329,6 @@ TEST(prepare_buffer_fusing, in_place_concat_dynamic_onednn_batch1) {
 
     ExecutionConfig config;
     config.set_property(ov::intel_gpu::optimize_data(true));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(false));
     auto prog = program::build_program(engine, topology, config, false, false);
     ASSERT_NE(prog, nullptr);
     auto& concat_node_p = prog->get_node("concat");
@@ -407,7 +406,6 @@ TEST(prepare_buffer_fusing, in_place_concat_dynamic_onednn_batch2) {
 
     ExecutionConfig config;
     config.set_property(ov::intel_gpu::optimize_data(true));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
     ov::intel_gpu::ImplForcingMap forcing_map = {
         {"reorder1", ov::intel_gpu::ImplementationDesc{format::any, "", impl_types::onednn}},
         {"reorder2", ov::intel_gpu::ImplementationDesc{format::any, "", impl_types::onednn}}
@@ -488,7 +486,7 @@ TEST(prepare_buffer_fusing, in_place_concat_dynamic__static_dim_dyn_pad) {
 
     ExecutionConfig config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::optimize_data(true));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     auto prog = program::build_program(engine, topology, config, false, false);
     ASSERT_NE(prog, nullptr);
     cldnn::network net(prog, 0);
@@ -614,7 +612,7 @@ TEST(prepare_buffer_fusing, skip_in_place_concat_inside_shape_of_subgraph) {
     topology.add(eltwise("eltwise2", input_info("concat1"), input_info("data_2"), eltwise_mode::prod, broadcast_spec));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     config.set_property(ov::intel_gpu::optimize_data(true));
     network network(engine, topology, config);
     network.set_input_data("input", input);
@@ -758,7 +756,6 @@ TEST(prepare_buffer_fusing, in_place_crop_dynamic) {
     );
 
     auto config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
     config.set_property(ov::intel_gpu::optimize_data(true));
     network network(engine, topology, config);
 
@@ -1380,7 +1377,7 @@ TEST(prepare_buffer_fusing, skip_in_place_concat_padding_in_non_concat_axis_of_d
 
     ExecutionConfig config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::optimize_data(true));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
     auto program = program::build_program(engine, topology, config, false, true);
     program_wrapper::apply_opt_pass<prepare_buffer_fusing>(*program);
@@ -1420,7 +1417,6 @@ TEST(prepare_buffer_fusing, in_place_onednn_concat_static) {
 
     ExecutionConfig config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::optimize_data(true));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(false));
     network network(engine, topology, config);
 
     auto input_memory1 = engine.allocate_memory(in_layout1);
diff --git a/src/plugins/intel_gpu/tests/unit/passes/prepare_padding_test.cpp b/src/plugins/intel_gpu/tests/unit/passes/prepare_padding_test.cpp
index dafe81c1f0dabd..68d123626d1c00 100644
--- a/src/plugins/intel_gpu/tests/unit/passes/prepare_padding_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/passes/prepare_padding_test.cpp
@@ -33,7 +33,7 @@ TEST(prepare_padding, groupconv_with_output) {
     topo.add(reorder("reorder", input_info("conv"), format::bfyx, data_types::f32));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     auto prog = program::build_program(engine, topo, config, false, true);
     reorder_factory rf;
     program_wrapper::apply_opt_pass<prepare_padding>(*prog, true);
@@ -59,7 +59,7 @@ TEST(prepare_padding, mvn_conv) {
     topo.add(reorder("reorder_output", input_info("conv"), format::bfyx, data_types::f16));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     config.set_property(ov::intel_gpu::optimize_data(true));
     network network(engine, topo, config);
     network.set_input_data("input", input);
diff --git a/src/plugins/intel_gpu/tests/unit/passes/prepare_primitive_fusing_test.cpp b/src/plugins/intel_gpu/tests/unit/passes/prepare_primitive_fusing_test.cpp
index f542ea60209a0c..dbafb9b614be54 100644
--- a/src/plugins/intel_gpu/tests/unit/passes/prepare_primitive_fusing_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/passes/prepare_primitive_fusing_test.cpp
@@ -41,7 +41,7 @@ TEST(prepare_primitive_fusing, fuse_activation_to_fc_dyn) {
     topology.add(reorder("reorder", input_info("act"), format::bfyx, data_types::f32));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     auto prog = program::build_program(engine, topology, config, false, true);
 
     program_wrapper::apply_opt_pass<prepare_primitive_fusing>(*prog);
@@ -65,7 +65,7 @@ TEST(prepare_primitive_fusing, dont_fuse_incompatible_eltwise) {
     topology.add(reorder("reorder", input_info("eltw"), format::bfyx, data_types::f32));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     auto prog = program::build_program(engine, topology, config, false, true);
 
     program_wrapper::apply_opt_pass<prepare_primitive_fusing>(*prog);
@@ -90,7 +90,7 @@ TEST(prepare_primitive_fusing, fuse_eltwise_to_fc_dyn_legal) {
 
     ExecutionConfig config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::optimize_data(true));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     auto prog = program::build_program(engine, topology, config, false, true);
 
     program_wrapper::apply_opt_pass<prepare_primitive_fusing>(*prog);
@@ -130,7 +130,7 @@ TEST(prepare_primitive_fusing, fuse_eltwise_to_fc_dyn_illegal) {
 
     ExecutionConfig config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::optimize_data(true));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     auto prog = program::build_program(engine, topology, config, false, true);
 
     program_wrapper::apply_opt_pass<prepare_primitive_fusing>(*prog);
@@ -184,7 +184,7 @@ TEST(prepare_primitive_fusing, fuse_eltwise_to_fc_dyn_illegal_const) {
 
     ExecutionConfig config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::optimize_data(true));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     auto prog = program::build_program(engine, topology, config, false, true);
 
     program_wrapper::apply_opt_pass<prepare_primitive_fusing>(*prog);
@@ -236,7 +236,7 @@ TEST(prepare_primitive_fusing, fuse_eltwise_to_fc_dyn_legal_scalar_const_broadca
 
     ExecutionConfig config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::optimize_data(true));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     auto prog = program::build_program(engine, topology, config, false, true);
 
     program_wrapper::apply_opt_pass<prepare_primitive_fusing>(*prog);
@@ -291,7 +291,7 @@ TEST(prepare_primitive_fusing, fuse_eltwise_to_fc_dyn_illegal_1) {
 
     ExecutionConfig config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::optimize_data(true));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     auto prog = program::build_program(engine, topology, config, false, true);
 
     program_wrapper::apply_opt_pass<prepare_primitive_fusing>(*prog);
@@ -358,7 +358,7 @@ TEST(prepare_primitive_fusing, fuse_eltwise_to_fc_dyn_illegal_2) {
 
     ExecutionConfig config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::optimize_data(true));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     auto prog = program::build_program(engine, topology, config, false, true);
 
     program_wrapper::apply_opt_pass<prepare_primitive_fusing>(*prog);
@@ -419,7 +419,7 @@ TEST(prepare_primitive_fusing, dont_remove_only_dep_reshape) {
 
     ExecutionConfig config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::optimize_data(true));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     auto prog = program::build_program(engine, topology, config, false, true);
 
     program_wrapper::apply_opt_pass<prepare_primitive_fusing>(*prog);
@@ -465,7 +465,7 @@ TEST(prepare_primitive_fusing, eltwise_fusing_residual_connection) {
 
     ExecutionConfig config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::optimize_data(true));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     auto prog = program::build_program(engine, topology, config, false, true);
 
     program_wrapper::apply_opt_pass<prepare_primitive_fusing>(*prog);
@@ -516,7 +516,7 @@ TEST(prepare_primitive_fusing, fuse_constant_transposes_removal_check) {
 
     ExecutionConfig config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::optimize_data(true));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
     if (engine.get_device_info().supports_immad) {
         ov::intel_gpu::ImplementationDesc fc_impl = { format::bfyx, "", impl_types::onednn };
@@ -561,7 +561,7 @@ TEST(prepare_primitive_fusing, fuse_constant_transposes_accuracy_test) {
 
     ExecutionConfig config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::optimize_data(true));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
     cldnn::network network(engine, topology, config);
     network.set_input_data("input", input);
@@ -572,7 +572,6 @@ TEST(prepare_primitive_fusing, fuse_constant_transposes_accuracy_test) {
 
     ExecutionConfig config_ref = get_test_default_config(engine);
     config_ref.set_property(ov::intel_gpu::optimize_data(false));
-    config_ref.set_property(ov::intel_gpu::allow_new_shape_infer(true));
 
     cldnn::network network_ref(engine, topology, config_ref);
     network_ref.set_input_data("input", input);
@@ -605,7 +604,7 @@ TEST(prepare_primitive_fusing, can_profiling_data_when_fuse_illegal) {
     ExecutionConfig config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::queue_type(ov::intel_gpu::QueueTypes::in_order));
     config.set_property(ov::intel_gpu::optimize_data(true));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     config.set_property(ov::enable_profiling(true));
     auto prog = program::build_program(engine, topology, config, false, true);
 
@@ -657,7 +656,7 @@ TEST(prepare_primitive_fusing, dont_fuse_eltwise_to_dyn_dts) {
     topology.add(reorder("reorder_bfyx", input_info("eltw"), format::bfyx, data_types::f32));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     auto prog = program::build_program(engine, topology, config, false, true);
 
     program_wrapper::apply_opt_pass<prepare_primitive_fusing>(*prog);
@@ -727,7 +726,6 @@ TEST(prepare_primitive_fusing, fuse_by_priotizing_to_parent_in_fusing_history) {
     set_values(eltwise_memory, eltwise_data);
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
 
     auto program = program::build_program(engine, topology, config, false, true);
     ASSERT_NE(program, nullptr);
diff --git a/src/plugins/intel_gpu/tests/unit/passes/remove_redundant_reorders_tests.cpp b/src/plugins/intel_gpu/tests/unit/passes/remove_redundant_reorders_tests.cpp
index 1fbeab7e67ac2d..004c62e1b4dca2 100644
--- a/src/plugins/intel_gpu/tests/unit/passes/remove_redundant_reorders_tests.cpp
+++ b/src/plugins/intel_gpu/tests/unit/passes/remove_redundant_reorders_tests.cpp
@@ -56,7 +56,7 @@ TEST(remove_redundant_reorders, remove_dep_dynamic) {
     topology.add(softmax("softmax", input_info("reorder"), 1));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     config.set_property(ov::intel_gpu::optimize_data(true));
     network network(engine, topology, config);
     network.set_input_data("input", input);
@@ -231,7 +231,7 @@ TEST(remove_redundant_reorders, not_to_fuse_permute_new_shape_infer) {
     topology.add(concatenation("concat", {input_info("reshape"), input_info("input2")}, 4));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     config.set_property(ov::intel_gpu::optimize_data(true));
     network network(engine, topology, config);
     network.set_input_data("input1", input1);
@@ -289,7 +289,7 @@ TEST(remove_redundant_reorders, fuse_reorder_to_prev_mvn_dyn) {
     topology.add(fully_connected("fc", input_info("reorder"), { "weights" }, "", data_types::f16, 3, 2));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     config.set_property(ov::intel_gpu::optimize_data(true));
     auto prog = program::build_program(engine, topology, config, false, true);
 
@@ -332,7 +332,7 @@ TEST(remove_redundant_reorders, fuse_reorder_to_prev_concat_dyn) {
     topology.add(softmax("softmax", input_info("reorder"), 1));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     config.set_property(ov::intel_gpu::optimize_data(true));
     auto prog = program::build_program(engine, topology, config, false, true);
 
@@ -389,7 +389,7 @@ TEST(remove_redundant_reorders, not_to_fuse_concat_with_reorder_inside_shape_of_
     topology.add(concatenation("concat1", {input_info("reorder3"), input_info("data_2")}, 0, data_types::i32));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     config.set_property(ov::intel_gpu::optimize_data(true));
     network network(engine, topology, config);
     network.set_input_data("input", input);
@@ -472,7 +472,7 @@ TEST(remove_redundant_reorders, reorder_of_non_default_port) {
 
     ExecutionConfig config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::optimize_data(true));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
     network network(engine, topology, config);
 
diff --git a/src/plugins/intel_gpu/tests/unit/passes/reorder_inputs_test.cpp b/src/plugins/intel_gpu/tests/unit/passes/reorder_inputs_test.cpp
index 9031fe6037b8ee..b0c1dbc8afb53a 100644
--- a/src/plugins/intel_gpu/tests/unit/passes/reorder_inputs_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/passes/reorder_inputs_test.cpp
@@ -280,7 +280,7 @@ TEST(reorder_inputs, no_add_reorder_infront_of_reshape) {
     topology.add(reorder("reorder", input_info("eltw"), format::bfyx, data_types::f32));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     config.set_property(ov::intel_gpu::optimize_data(true));
     auto prog = program::build_program(engine, topology, config);
 
@@ -316,16 +316,14 @@ TEST(reorder_inputs, no_need_of_reorder_for_strided_slice) {
         permute("permute1", input_info("input1"), {0, 1, 2, 3}),
         batch_to_space("batch_to_space1",
             input_info("input2"),
-            tensor{1, 1, 4, 1, 1},
-            tensor{0, 0, 1, 0, 0},
-            tensor{0, 0, 1, 0, 0},
-            tensor{1, 1080, 1920, 1, 2}),
+            std::vector<int32_t>{1, 1, 4, 1, 1},
+            std::vector<int32_t>{0, 0, 1, 0, 0},
+            std::vector<int32_t>{0, 0, 1, 0, 0}),
         batch_to_space("batch_to_space2",
             input_info("input2"),
-            tensor{1, 1, 4, 1, 1},
-            tensor{0, 0, 1, 0, 0},
-            tensor{0, 0, 1, 0, 0},
-            tensor{1, 1080, 1920, 1, 2}),
+            std::vector<int32_t>{1, 1, 4, 1, 1},
+            std::vector<int32_t>{0, 0, 1, 0, 0},
+            std::vector<int32_t>{0, 0, 1, 0, 0}),
         data("data_1", data_1),
         data("data_2", data_2),
         data("data_3", data_3),
@@ -555,7 +553,7 @@ TEST(reorder_inputs, has_reshape_user) {
 
     ExecutionConfig config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::optimize_data(true));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     network network(engine, topology, config);
 
     network.set_input_data("input", input);
diff --git a/src/plugins/intel_gpu/tests/unit/passes/reorder_transfer.cpp b/src/plugins/intel_gpu/tests/unit/passes/reorder_transfer.cpp
index 7731da37ef1e1e..a53be0e659cfea 100644
--- a/src/plugins/intel_gpu/tests/unit/passes/reorder_transfer.cpp
+++ b/src/plugins/intel_gpu/tests/unit/passes/reorder_transfer.cpp
@@ -27,7 +27,7 @@ TEST(reorder_transfer, transfer_per_permute) {
 
     ExecutionConfig config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::optimize_data(true));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     auto prog = program::build_program(engine, topology, config, false, true);
 
     for (auto& node : prog->get_processing_order()) {
diff --git a/src/plugins/intel_gpu/tests/unit/passes/select_preferred_formats_test.cpp b/src/plugins/intel_gpu/tests/unit/passes/select_preferred_formats_test.cpp
index 39151ce1306c56..eed75e26234040 100644
--- a/src/plugins/intel_gpu/tests/unit/passes/select_preferred_formats_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/passes/select_preferred_formats_test.cpp
@@ -34,7 +34,7 @@ TEST(test_select_preferred_formats, setting_target_conv_format) {
     topology.add(convolution("conv1", input_info("reorder"), "weights", "", 1, {1, 1}, {1, 1}, {0, 0}, {0, 0}, false));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     ov::intel_gpu::ImplementationDesc impl = { format::b_fs_yx_fsv16, std::string(""), impl_types::onednn };
     config.set_property(ov::intel_gpu::force_implementations(ov::intel_gpu::ImplForcingMap{ {"conv1", impl} }));
 
diff --git a/src/plugins/intel_gpu/tests/unit/shape_infer/broadcast_si_test.cpp b/src/plugins/intel_gpu/tests/unit/shape_infer/broadcast_si_test.cpp
index cb4b40533e0c1f..46175cc92994d6 100644
--- a/src/plugins/intel_gpu/tests/unit/shape_infer/broadcast_si_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/shape_infer/broadcast_si_test.cpp
@@ -105,7 +105,7 @@ TEST_P(broadcast_test_two_inputs_blocked_format, shape_infer) {
     );
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     config.set_property(ov::intel_gpu::optimize_data(true));
 
     std::vector<int32_t> input_data(p.data_layout.get_linear_size(), 1);
diff --git a/src/plugins/intel_gpu/tests/unit/shape_infer/matmul_si_test.cpp b/src/plugins/intel_gpu/tests/unit/shape_infer/matmul_si_test.cpp
index ae5fcceeecaeef..4d54b25af720f7 100644
--- a/src/plugins/intel_gpu/tests/unit/shape_infer/matmul_si_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/shape_infer/matmul_si_test.cpp
@@ -133,7 +133,7 @@ TEST_P(fully_connected_test_preferred_output_format, shape_infer) {
     auto matrix_b_layout_prim = std::make_shared<input_layout>("matrix_b", p.matrix_b_layout);
     auto fully_connected_prim = std::make_shared<fully_connected>("output", input_info("matrix_a"), "matrix_b", "", p.data_type);
 
-    cldnn::program prog(engine, {ov::intel_gpu::allow_new_shape_infer(true)});
+    cldnn::program prog(engine);
 
     auto& matrix_a_node = prog.get_or_create(matrix_a_layout_prim);
     auto& matrix_b_node = prog.get_or_create(matrix_b_layout_prim);
@@ -172,7 +172,7 @@ TEST_P(gemm_test_preferred_output_format, shape_infer) {
                                             p.matrix_a_layout.get_partial_shape().rank().get_length(),
                                             p.matrix_b_layout.get_partial_shape().rank().get_length());
 
-    cldnn::program prog(engine, {ov::intel_gpu::allow_new_shape_infer(true)});
+    cldnn::program prog(engine);
 
     auto& matrix_a_node = prog.get_or_create(matrix_a_layout_prim);
     auto& matrix_b_node = prog.get_or_create(matrix_b_layout_prim);
diff --git a/src/plugins/intel_gpu/tests/unit/shape_infer/non_max_suppression_si_test.cpp b/src/plugins/intel_gpu/tests/unit/shape_infer/non_max_suppression_si_test.cpp
index e4d642e8637423..2f4d65b7e72f72 100644
--- a/src/plugins/intel_gpu/tests/unit/shape_infer/non_max_suppression_si_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/shape_infer/non_max_suppression_si_test.cpp
@@ -56,23 +56,13 @@ TEST_P(non_max_suppression_test, shape_infer) {
     }
 
     auto non_max_suppression_prim = std::make_shared<non_max_suppression>("output",
-                                                                          input_prim_ids[0],
-                                                                          input_prim_ids[1],
+                                                                          input_prim_ids,
                                                                           p.selected_indices_num,
                                                                           p.center_point_box,
                                                                           p.sort_result_descending,
-                                                                          primitive_id(),
-                                                                          primitive_id(),
-                                                                          primitive_id(),
-                                                                          primitive_id(),
-                                                                          primitive_id(),
-                                                                          primitive_id(),
                                                                           p.num_outputs);
     non_max_suppression_prim->output_paddings = {padding(), padding(), padding()};
     non_max_suppression_prim->output_data_types = {optional_data_type{}, optional_data_type{p.in_layouts[1].data_type}, optional_data_type{}};
-    if (p.in_layouts.size() > 2) {
-        non_max_suppression_prim->num_select_per_class = input_prim_ids[2].pid;
-    }
 
     cldnn::program prog(engine);
 
diff --git a/src/plugins/intel_gpu/tests/unit/shape_infer/one_hot_si_test.cpp b/src/plugins/intel_gpu/tests/unit/shape_infer/one_hot_si_test.cpp
index 5fb0cba3b41c80..384834f9a5efe3 100644
--- a/src/plugins/intel_gpu/tests/unit/shape_infer/one_hot_si_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/shape_infer/one_hot_si_test.cpp
@@ -35,7 +35,7 @@ TEST_P(one_hot_test, shape_infer) {
     auto& engine = get_test_engine();
 
     auto input_layout_prim = std::make_shared<input_layout>("input", p.in_layout);
-    auto one_hot_prim = std::make_shared<one_hot>("output", input_info("input"), tensor(), p.axis, p.depth);
+    auto one_hot_prim = std::make_shared<one_hot>("output", input_info("input"), ov::element::f32, p.axis, p.depth);
 
     cldnn::program prog(engine);
 
diff --git a/src/plugins/intel_gpu/tests/unit/shape_infer/reverse_si_test.cpp b/src/plugins/intel_gpu/tests/unit/shape_infer/reverse_si_test.cpp
index 1f04ca2b7e308f..9edd3bd91dbeba 100644
--- a/src/plugins/intel_gpu/tests/unit/shape_infer/reverse_si_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/shape_infer/reverse_si_test.cpp
@@ -22,7 +22,7 @@ namespace shape_infer_tests {
 
 struct reverse_test_params {
     layout input_layout;
-    reverse_mode mode;
+    ov::op::v1::Reverse::Mode mode;
 };
 
 class reverse_test : public testing::TestWithParam<reverse_test_params> { };
@@ -53,11 +53,11 @@ TEST_P(reverse_test, shape_infer) {
 
 INSTANTIATE_TEST_SUITE_P(smoke, reverse_test,
     testing::ValuesIn(std::vector<reverse_test_params>{
-        { layout{ov::PartialShape{1, 2, 3}, data_types::f32, format::bfyx}, reverse_mode::index },
-        { layout{ov::PartialShape{1, 2, 3, 4}, data_types::f16, format::bfyx}, reverse_mode::mask },
-        { layout{ov::PartialShape{1, 2, 3, 4, 5}, data_types::f32, format::bfzyx}, reverse_mode::index },
-        { layout{ov::PartialShape::dynamic(4), data_types::f32, format::bfyx}, reverse_mode::mask },
-        { layout{ov::PartialShape::dynamic(5), data_types::f32, format::bfzyx}, reverse_mode::index }
+        { layout{ov::PartialShape{1, 2, 3}, data_types::f32, format::bfyx}, ov::op::v1::Reverse::Mode::INDEX },
+        { layout{ov::PartialShape{1, 2, 3, 4}, data_types::f16, format::bfyx}, ov::op::v1::Reverse::Mode::MASK },
+        { layout{ov::PartialShape{1, 2, 3, 4, 5}, data_types::f32, format::bfzyx}, ov::op::v1::Reverse::Mode::INDEX },
+        { layout{ov::PartialShape::dynamic(4), data_types::f32, format::bfyx}, ov::op::v1::Reverse::Mode::MASK },
+        { layout{ov::PartialShape::dynamic(5), data_types::f32, format::bfzyx}, ov::op::v1::Reverse::Mode::INDEX }
     }));
 
 }  // shape_infer_tests
diff --git a/src/plugins/intel_gpu/tests/unit/shape_infer/roll_si_test.cpp b/src/plugins/intel_gpu/tests/unit/shape_infer/roll_si_test.cpp
index 2da19e89256fb8..fdb51c0795327d 100644
--- a/src/plugins/intel_gpu/tests/unit/shape_infer/roll_si_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/shape_infer/roll_si_test.cpp
@@ -32,7 +32,7 @@ TEST_P(roll_test, shape_infer) {
     auto& engine = get_test_engine();
 
     auto input0_layout_prim = std::make_shared<input_layout>("input0", p.input_layout);
-    auto roll_prim = std::make_shared<roll>("output", input_info("input0"), tensor(1));
+    auto roll_prim = std::make_shared<roll>("output", input_info("input0"), std::vector<int32_t>{1}, std::vector<int32_t>{0});
 
     cldnn::program prog(engine);
 
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/activation_simple_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/activation_simple_gpu_test.cpp
index 069105c944494f..3aff2eeef336a8 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/activation_simple_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/activation_simple_gpu_test.cpp
@@ -40,7 +40,7 @@ TEST(activation_f32_fw_gpu, dynamic) {
         topology.add(activation("activation", input_info("input"), func));
 
         ExecutionConfig config = get_test_default_config(engine);
-        config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
         network network(engine, topology, config);
 
         network.set_input_data("input", input);
@@ -116,7 +116,7 @@ TEST(activation_f32_fw_cpu_impl, dynamic_8d) {
         ExecutionConfig config = get_test_default_config(engine);
         auto forcing_map = ov::intel_gpu::ImplForcingMap{ {"activation", {format::bfvuwzyx, "", impl_types::cpu}} };
         config.set_property(ov::intel_gpu::force_implementations(forcing_map));
-        config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
         network network(engine, topology, config);
 
         network.set_input_data("input", input);
@@ -1705,7 +1705,7 @@ TEST(activation_f32_fw_gpu, bfyx_prelu_dyn) {
     );
 
     ExecutionConfig config = get_test_default_config(eng);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     cldnn::network net(eng, topo, config);
 
     set_values(in_mem, flatten_4d(format::bfyx, in_data));
@@ -2114,7 +2114,6 @@ TEST(activation_gpu, has_proper_synchronization) {
 
     auto config_ref = get_test_default_config(engine);
     config_ref.set_property(ov::intel_gpu::queue_type(QueueTypes::in_order));
-    config_ref.set_property(ov::intel_gpu::allow_new_shape_infer(true));
 
     auto config_test = config_ref;
     config_test.set_property(ov::intel_gpu::force_implementations(impl_forcing_map));
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/adaptive_avg_pooling_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/adaptive_avg_pooling_gpu_test.cpp
index a2cd49a704858a..26f0f7947bef1e 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/adaptive_avg_pooling_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/adaptive_avg_pooling_gpu_test.cpp
@@ -18,8 +18,8 @@ using namespace ::tests;
 
 namespace {
 struct AdaptiveAvgPoolingParams {
-    tensor inputTensor;
-    tensor outputTensor;
+    ov::Shape input_shape;
+    ov::Shape output_shape;
 };
 
 using AdaptiveAvgPoolingParamsWithLayout = std::tuple<
@@ -54,23 +54,13 @@ std::vector<T> getValues(const std::vector<float>& values) {
     return result;
 }
 
-ov::Shape tensorToShape(const tensor& t, const format f)
-{
-    std::vector<int> vec(cldnn::format::dimension(f));
-    for (size_t i = 0; i < vec.size(); ++i) {
-        vec[i] = t.sizes()[i];
-    }
-    std::reverse(vec.begin() + 2, vec.end());
-
-    return ov::Shape(vec.begin(), vec.end());
-}
 
 template<typename T>
 void generateTestData(const AdaptiveAvgPoolingParams& p, const format fmt, const std::vector<float>& random_inputs, std::vector<T>& inputs, std::vector<T>& outputs) {
-    std::vector<float> out(p.outputTensor.count());
+    std::vector<float> out(ov::shape_size(p.output_shape));
 
-    const auto inShape = tensorToShape(p.inputTensor, fmt);
-    const auto outShape = tensorToShape(p.outputTensor, fmt);
+    const auto inShape = p.input_shape;
+    const auto outShape = p.output_shape;
 
     ov::reference::adaptive_avg_pool<float>(random_inputs.data(), out.data(), inShape, outShape);
 
@@ -98,8 +88,8 @@ struct PrintToStringParamName {
         format::type target_layout;
         bool is_caching_test;
         std::tie(p, plain_layout, target_layout, is_caching_test) = param.param;
-        buf << " input tensor " << p.inputTensor.to_string()
-            << " output tensor " << p.outputTensor.to_string()
+        buf << " input shape " << p.input_shape.to_string()
+            << " output shape " << p.output_shape.to_string()
             << " plain layout " << plain_layout
             << " target layout " << target_layout
             << " is_caching_test " << is_caching_test;
@@ -128,18 +118,22 @@ struct adaptive_avg_pooling_test
 
         std::vector<T> input_data;
         std::vector<T> expected;
-        const std::vector<float> random_input_data = rg.generate_random_1d<float>(params.inputTensor.count(), -127, 127, 8);
+        const std::vector<float> random_input_data = rg.generate_random_1d<float>(ov::shape_size(params.input_shape), -127, 127, 8);
         generateTestData<T>(params, plain_layout, random_input_data, input_data, expected);
         auto& engine = get_test_engine();
 
-        auto input = engine.allocate_memory({data_type, plain_layout, params.inputTensor});
+        auto input = engine.allocate_memory({params.input_shape, data_type, plain_layout });
+        auto shape_input = engine.allocate_memory({{ static_cast<int64_t>(params.output_shape.size()) - 2 }, ov::element::i32, plain_layout });
 
         set_values(input, input_data);
+        std::vector<int32_t> o_shape(params.output_shape.begin() + 2, params.output_shape.end());
+        set_values<int32_t>(shape_input, o_shape);
 
         topology topology;
         topology.add(input_layout("input", input->get_layout()));
+        topology.add(data("shape", shape_input));
         topology.add(reorder("input_reordered", input_info("input"), target_layout, data_type));
-        topology.add(adaptive_pooling("adaptive_avg_pooling_blocked", input_info("input_reordered"), params.outputTensor));
+        topology.add(adaptive_pooling("adaptive_avg_pooling_blocked", input_info("input_reordered"), input_info("shape")));
         topology.add(reorder("adaptive_avg_pooling", input_info("adaptive_avg_pooling_blocked"), plain_layout, data_type));
 
         cldnn::network::ptr network = get_network(engine, topology, get_test_default_config(engine), get_test_stream_ptr(), is_caching_test);
@@ -151,8 +145,8 @@ struct adaptive_avg_pooling_test
         auto out_mem = result.at("adaptive_avg_pooling").get_memory();
         cldnn::mem_lock<T> out_ptr(out_mem, get_test_stream());
 
-        ASSERT_EQ(params.outputTensor.count(), out_ptr.size());
-        ASSERT_EQ(params.outputTensor.count(), expected.size());
+        ASSERT_EQ(ov::shape_size(params.output_shape), out_ptr.size());
+        ASSERT_EQ(ov::shape_size(params.output_shape), expected.size());
         for (size_t i = 0; i < expected.size(); ++i) {
             ASSERT_NEAR(expected[i], out_ptr[i], getError<T>())
                 << "i = " << i << ", format=" << fmt_to_str(target_layout);
@@ -176,9 +170,9 @@ INSTANTIATE_TEST_SUITE_P(smoke_adaptive_avg_pooling_test_f32_2d,
                          adaptive_avg_pooling_test_f32,
                          ::testing::Combine(
                                  ::testing::ValuesIn(std::vector<AdaptiveAvgPoolingParams>{
-                                        { tensor(1, 2, 7, 3), tensor(1, 2, 3, 3) },
-                                        { tensor(2, 3, 7, 3), tensor(2, 3, 3, 3) },
-                                        { tensor(1, 3, 7, 7), tensor(1, 3, 7, 7) },
+                                        { ov::Shape{1, 2, 3, 7}, ov::Shape{1, 2, 3, 3} },
+                                        { ov::Shape{2, 3, 3, 7}, ov::Shape{2, 3, 3, 3} },
+                                        { ov::Shape{1, 3, 7, 7}, ov::Shape{1, 3, 7, 7} },
                                     }),
                                  ::testing::Values(format::bfyx),
                                  ::testing::Values(format::bfyx),
@@ -189,8 +183,8 @@ INSTANTIATE_TEST_SUITE_P(smoke_adaptive_avg_pooling_test_f32_3d,
                          adaptive_avg_pooling_test_f32,
                          ::testing::Combine(
                                  ::testing::ValuesIn(std::vector<AdaptiveAvgPoolingParams>{
-                                        { tensor(2, 2, 7, 3, 3), tensor(2, 2, 2, 2, 2) },
-                                        { tensor(2, 2, 8, 5, 4), tensor(2, 2, 3, 3, 3) },
+                                        { ov::Shape{2, 2, 3, 3, 7}, ov::Shape{2, 2, 2, 2, 2} },
+                                        { ov::Shape{2, 2, 4, 5, 8}, ov::Shape{2, 2, 3, 3, 3} },
                                     }),
                                  ::testing::Values(format::bfzyx),
                                  ::testing::Values(format::bfzyx),
@@ -201,8 +195,8 @@ INSTANTIATE_TEST_SUITE_P(smoke_adaptive_avg_pooling_test_f16_2d,
                          adaptive_avg_pooling_test_f16,
                          ::testing::Combine(
                                  ::testing::ValuesIn(std::vector<AdaptiveAvgPoolingParams>{
-                                        { tensor(1, 2, 7, 3), tensor(1, 2, 3, 3) },
-                                        { tensor(2, 3, 7, 3), tensor(2, 3, 3, 3) },
+                                        { ov::Shape{1, 2, 7, 3}, ov::Shape{1, 2, 3, 3} },
+                                        { ov::Shape{2, 3, 7, 3}, ov::Shape{2, 3, 3, 3} },
                                     }),
                                  ::testing::Values(format::bfyx),
                                  ::testing::Values(format::bfyx),
@@ -213,8 +207,8 @@ INSTANTIATE_TEST_SUITE_P(smoke_adaptive_avg_pooling_test_f16_3d,
                          adaptive_avg_pooling_test_f16,
                          ::testing::Combine(
                                  ::testing::ValuesIn(std::vector<AdaptiveAvgPoolingParams>{
-                                        { tensor(2, 2, 7, 3, 3), tensor(2, 2, 2, 2, 2) },
-                                        { tensor(2, 2, 8, 5, 4), tensor(2, 2, 3, 3, 3) },
+                                        { ov::Shape{2, 2, 7, 3, 3}, ov::Shape{2, 2, 2, 2, 2} },
+                                        { ov::Shape{2, 2, 8, 4, 5}, ov::Shape{2, 2, 3, 3, 3} },
                                     }),
                                  ::testing::Values(format::bfzyx),
                                  ::testing::Values(format::bfzyx),
@@ -225,8 +219,8 @@ INSTANTIATE_TEST_SUITE_P(smoke_adaptive_avg_pooling_test_2d_all_formats,
                          adaptive_avg_pooling_test_f32,
                          ::testing::Combine(
                                  ::testing::ValuesIn(std::vector<AdaptiveAvgPoolingParams>{
-                                        { tensor(20, 20, 7, 3), tensor(20, 20, 3, 3) },
-                                        { tensor(32, 32, 7, 3), tensor(32, 32, 3, 3) },
+                                        { ov::Shape{20, 20, 3, 7}, ov::Shape{20, 20, 3, 3} },
+                                        { ov::Shape{32, 32, 3, 7}, ov::Shape{32, 32, 3, 3} },
                                     }),
                                  ::testing::Values(format::bfyx),
                                  ::testing::ValuesIn(layouts_2d),
@@ -237,8 +231,8 @@ INSTANTIATE_TEST_SUITE_P(smoke_adaptive_avg_pooling_test_3d_all_formats,
                          adaptive_avg_pooling_test_f32,
                          ::testing::Combine(
                                  ::testing::ValuesIn(std::vector<AdaptiveAvgPoolingParams>{
-                                        { tensor(20, 20, 7, 3, 3), tensor(20, 20, 3, 3, 2) },
-                                        { tensor(32, 32, 7, 3, 3), tensor(32, 32, 3, 3, 2) },
+                                        { ov::Shape{20, 20, 3, 3, 7}, ov::Shape{20, 20, 2, 3, 3} },
+                                        { ov::Shape{32, 32, 3, 3, 7}, ov::Shape{32, 32, 2, 3, 3} },
                                     }),
                                  ::testing::Values(format::bfzyx),
                                  ::testing::ValuesIn(layouts_3d),
@@ -249,7 +243,7 @@ INSTANTIATE_TEST_SUITE_P(export_import,
                          adaptive_avg_pooling_test_f16,
                          ::testing::Combine(
                                  ::testing::ValuesIn(std::vector<AdaptiveAvgPoolingParams>{
-                                        { tensor(1, 2, 7, 3), tensor(1, 2, 3, 3) },
+                                        { ov::Shape{1, 2, 3, 7}, ov::Shape{1, 2, 3, 3} },
                                     }),
                                  ::testing::Values(format::bfyx),
                                  ::testing::Values(format::bfyx),
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/adaptive_max_pooling_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/adaptive_max_pooling_gpu_test.cpp
deleted file mode 100644
index 247a26c466ae6a..00000000000000
--- a/src/plugins/intel_gpu/tests/unit/test_cases/adaptive_max_pooling_gpu_test.cpp
+++ /dev/null
@@ -1,312 +0,0 @@
-// Copyright (C) 2021-2022 Intel Corporation
-// SPDX-License-Identifier: Apache-2.0
-//
-
-#include "test_utils.h"
-#include "random_generator.hpp"
-#include "openvino/reference/adaptive_avg_pool.hpp"
-#include "openvino/reference/adaptive_max_pool.hpp"
-
-#include <intel_gpu/primitives/input_layout.hpp>
-#include <intel_gpu/primitives/activation.hpp>
-#include <intel_gpu/primitives/adaptive_pooling.hpp>
-#include <intel_gpu/primitives/mutable_data.hpp>
-
-#include <cstddef>
-#include <string>
-
-using namespace cldnn;
-using namespace ::tests;
-
-namespace {
-struct AdaptiveMaxPoolingParams {
-    tensor inputTensor;
-    tensor outputTensor;
-};
-
-using AdaptiveMaxPoolingParamsWithLayout = std::tuple<
-    AdaptiveMaxPoolingParams,
-    format::type,   // source (plain) layout - bfyx or bfzyx
-    format::type,   // target (blocked) layout
-    bool            // is_caching_test
->;
-
-const std::vector<format::type> layouts_2d = {
-    format::bfyx,
-    format::b_fs_yx_fsv16,
-    format::b_fs_yx_fsv32,
-    format::bs_fs_yx_bsv16_fsv16,
-    format::bs_fs_yx_bsv32_fsv16,
-    format::bs_fs_yx_bsv32_fsv32
-};
-
-const std::vector<format::type> layouts_3d = {
-    format::bfzyx,
-    format::b_fs_zyx_fsv16,
-    format::b_fs_zyx_fsv32,
-    format::bs_fs_zyx_bsv16_fsv32,
-    format::bs_fs_zyx_bsv16_fsv16,
-    format::bs_fs_zyx_bsv32_fsv32,
-    format::bs_fs_zyx_bsv32_fsv16
-};
-
-template<typename T>
-std::vector<T> getValues(const std::vector<float>& values) {
-    std::vector<T> result(values.begin(), values.end());
-    return result;
-}
-
-ov::Shape tensorToShape(const tensor& t, const format f)
-{
-    std::vector<int> vec(cldnn::format::dimension(f));
-    for (size_t i = 0; i < vec.size(); ++i) {
-        vec[i] = t.sizes()[i];
-    }
-    std::reverse(vec.begin() + 2, vec.end());
-
-    return ov::Shape(vec.begin(), vec.end());
-}
-
-template<typename T>
-void generateTestData(const AdaptiveMaxPoolingParams& p, const format fmt, const std::vector<float>& random_inputs,
-                      std::vector<T>& inputs, std::vector<T>& outputs, std::vector<int32_t>& indices) {
-    std::vector<float> out(p.outputTensor.count());
-    std::vector<int32_t> ind(p.outputTensor.count());
-
-    const auto inShape = tensorToShape(p.inputTensor, fmt);
-    const auto outShape = tensorToShape(p.outputTensor, fmt);
-
-    ov::reference::adaptive_max_pool<float, int32_t>(random_inputs.data(), out.data(), ind.data(), inShape, outShape);
-
-    inputs = getValues<T>(random_inputs);
-    outputs = getValues<T>(out);
-    indices = ind;
-}
-
-template <typename T> float getError();
-
-template<>
-float getError<float>() {
-    return 0.001;
-}
-
-template<>
-float getError<ov::float16>() {
-    return 0.5;
-}
-
-struct PrintToStringParamName {
-    std::string operator()(const testing::TestParamInfo<AdaptiveMaxPoolingParamsWithLayout>& param) {
-        std::stringstream buf;
-        AdaptiveMaxPoolingParams p;
-        format::type plain_layout;
-        format::type target_layout;
-        bool is_caching_test;
-        std::tie(p, plain_layout, target_layout, is_caching_test) = param.param;
-        buf << " input tensor " << p.inputTensor.to_string()
-            << " output tensor " << p.outputTensor.to_string()
-            << " plain layout " << plain_layout
-            << " target layout " << target_layout
-            << " is_caching_test " << is_caching_test;
-        return buf.str();
-    }
-};
-};  // namespace
-
-template<typename T>
-struct adaptive_max_pooling_test
-        : public ::testing::TestWithParam<AdaptiveMaxPoolingParamsWithLayout> {
-    tests::random_generator rg;
-
-    void SetUp() override {
-        rg.set_seed(GET_SUITE_NAME);
-    }
-
-public:
-    void test() {
-        const auto data_type = ov::element::from<T>();
-        AdaptiveMaxPoolingParams params;
-        format::type plain_layout;
-        format::type target_layout;
-        bool is_caching_test;
-        std::tie(params, plain_layout, target_layout, is_caching_test) = this->GetParam();
-        const bool need_reorder = target_layout != plain_layout;
-
-        std::vector<T> input_data;
-        std::vector<T> expected;
-        std::vector<int32_t> expected_indices;
-        auto random_in = rg.generate_random_1d<float>(params.inputTensor.count(), -127, 127, 8);
-        generateTestData<T>(params, plain_layout, random_in, input_data, expected, expected_indices);
-        auto& engine = get_test_engine();
-
-        auto input_mem = engine.allocate_memory({data_type, plain_layout, params.inputTensor});
-        const layout indices_layout{data_types::i32, target_layout, params.outputTensor};
-        auto indices_mem = engine.allocate_memory(indices_layout);
-
-        set_values(input_mem, input_data);
-
-        const std::string input_data_id = "adaptive_max_input_id";
-        const std::string adaptive_max_pooling_id = "adaptive_max_pooling_id";
-        const std::string indices_id = "indices_id";
-        topology topology;
-        topology.add(input_layout(input_data_id, input_mem->get_layout()));
-        topology.add(mutable_data(indices_id, indices_mem));
-
-        std::string input_id = input_data_id;
-        if (need_reorder) {
-            const std::string reorder_input_id = input_data_id + "_reordered";
-            topology.add(reorder(reorder_input_id, input_info(input_data_id), target_layout, data_type));
-            input_id = reorder_input_id;
-        }
-
-        topology.add(adaptive_pooling(adaptive_max_pooling_id, input_info(input_id), params.outputTensor, indices_id,
-                                      data_types::i32));
-
-        std::string result_id = adaptive_max_pooling_id;
-        if (need_reorder) {
-            const primitive_id reorder_result_id = adaptive_max_pooling_id + "_reordered";
-            topology.add(reorder(reorder_result_id, adaptive_max_pooling_id, plain_layout, data_type));
-            result_id = reorder_result_id;
-        }
-
-        cldnn::network::ptr network = get_network(engine, topology, get_test_default_config(engine), get_test_stream_ptr(), is_caching_test);
-
-        network->set_input_data(input_data_id, input_mem);
-
-        auto result = network->execute();
-
-        auto out_mem = result.at(result_id).get_memory();
-        cldnn::mem_lock<T> out_ptr(out_mem, get_test_stream());
-
-        ASSERT_EQ(params.outputTensor.count(), out_ptr.size());
-        ASSERT_EQ(params.outputTensor.count(), expected.size());
-        for (size_t i = 0; i < expected.size(); ++i) {
-            ASSERT_NEAR(expected[i], out_ptr[i], getError<T>())
-                << "i = " << i << ", format=" << fmt_to_str(target_layout);
-        }
-
-        if (is_caching_test)
-            return;
-
-        const auto block_sizes = format::traits(target_layout).block_sizes;
-        const auto index_offset = std::accumulate(block_sizes.begin(), block_sizes.end(), 1,
-                                                  [](int total, const std::pair<size_t, int>& b) {
-                                                      return total * b.second;
-                                                  }
-        );
-
-        const auto get_reordered_indices_mem = [&]() {
-            cldnn::topology reorder_topology;
-            reorder_topology.add(input_layout("indices", indices_layout));
-            reorder_topology.add(reorder("plane_indices", input_info("indices"), plain_layout, data_types::i32));
-            cldnn::network reorder_net{engine, reorder_topology, get_test_default_config(engine)};
-            reorder_net.set_input_data("indices", indices_mem);
-            const auto second_output_result = reorder_net.execute();
-            const auto plane_indices_mem = second_output_result.at("plane_indices").get_memory();
-            return plane_indices_mem;
-        };
-
-        cldnn::mem_lock<int32_t> indices_ptr(need_reorder ? get_reordered_indices_mem() : indices_mem, get_test_stream());
-        ASSERT_EQ(params.outputTensor.count(), indices_ptr.size());
-        ASSERT_EQ(params.outputTensor.count(), expected_indices.size());
-        for (size_t i = 0; i < expected_indices.size(); ++i) {
-            ASSERT_EQ(index_offset * expected_indices[i], indices_ptr[i])
-                << "i = " << i << ", format=" << fmt_to_str(target_layout);
-        }
-    }
-};
-
-
-using adaptive_max_pooling_test_f32 = adaptive_max_pooling_test<float>;
-using adaptive_max_pooling_test_f16 = adaptive_max_pooling_test<ov::float16>;
-
-TEST_P(adaptive_max_pooling_test_f32, adaptive_max_pooling_test_f32) {
-    ASSERT_NO_FATAL_FAILURE(test());
-}
-
-TEST_P(adaptive_max_pooling_test_f16, adaptive_max_pooling_test_f16) {
-    ASSERT_NO_FATAL_FAILURE(test());
-}
-
-INSTANTIATE_TEST_SUITE_P(smoke_adaptive_max_pooling_test_f32_2d,
-                         adaptive_max_pooling_test_f32,
-                         ::testing::Combine(
-                                 ::testing::ValuesIn(std::vector<AdaptiveMaxPoolingParams>{
-                                        { tensor(1, 2, 7, 3), tensor(1, 2, 3, 3) },
-                                        { tensor(2, 3, 7, 3), tensor(2, 3, 3, 3) },
-                                    }),
-                                 ::testing::Values(format::bfyx),
-                                 ::testing::Values(format::bfyx),
-                                 ::testing::Values(false)),
-                         PrintToStringParamName());
-
-INSTANTIATE_TEST_SUITE_P(smoke_adaptive_max_pooling_test_f32_3d,
-                         adaptive_max_pooling_test_f32,
-                         ::testing::Combine(
-                                 ::testing::ValuesIn(std::vector<AdaptiveMaxPoolingParams>{
-                                        { tensor(2, 2, 7, 3, 3), tensor(2, 2, 2, 2, 2) },
-                                        { tensor(2, 2, 8, 5, 4), tensor(2, 2, 3, 3, 3) },
-                                    }),
-                                 ::testing::Values(format::bfzyx),
-                                 ::testing::Values(format::bfzyx),
-                                 ::testing::Values(false)),
-                         PrintToStringParamName());
-
-INSTANTIATE_TEST_SUITE_P(smoke_adaptive_max_pooling_test_f16_2d,
-                         adaptive_max_pooling_test_f16,
-                         ::testing::Combine(
-                                 ::testing::ValuesIn(std::vector<AdaptiveMaxPoolingParams>{
-                                        { tensor(1, 2, 7, 3), tensor(1, 2, 3, 3) },
-                                        { tensor(2, 3, 7, 3), tensor(2, 3, 3, 3) },
-                                    }),
-                                 ::testing::Values(format::bfyx),
-                                 ::testing::Values(format::bfyx),
-                                 ::testing::Values(false)),
-                         PrintToStringParamName());
-
-INSTANTIATE_TEST_SUITE_P(smoke_adaptive_max_pooling_test_f16_3d,
-                         adaptive_max_pooling_test_f16,
-                         ::testing::Combine(
-                                 ::testing::ValuesIn(std::vector<AdaptiveMaxPoolingParams>{
-                                        { tensor(2, 2, 7, 3, 3), tensor(2, 2, 2, 2, 2) },
-                                        { tensor(2, 2, 8, 5, 4), tensor(2, 2, 3, 3, 3) },
-                                    }),
-                                 ::testing::Values(format::bfzyx),
-                                 ::testing::Values(format::bfzyx),
-                                 ::testing::Values(false)),
-                         PrintToStringParamName());
-
-INSTANTIATE_TEST_SUITE_P(smoke_adaptive_max_pooling_test_2d_all_formats,
-                         adaptive_max_pooling_test_f32,
-                         ::testing::Combine(
-                                 ::testing::ValuesIn(std::vector<AdaptiveMaxPoolingParams>{
-                                        { tensor(20, 20, 7, 3), tensor(20, 20, 3, 3) },
-                                        { tensor(32, 32, 7, 3), tensor(32, 32, 3, 3) },
-                                    }),
-                                 ::testing::Values(format::bfyx),
-                                 ::testing::ValuesIn(layouts_2d),
-                                 ::testing::Values(false)),
-                         PrintToStringParamName());
-
-INSTANTIATE_TEST_SUITE_P(smoke_adaptive_max_pooling_test_3d_all_formats,
-                         adaptive_max_pooling_test_f32,
-                         ::testing::Combine(
-                                 ::testing::ValuesIn(std::vector<AdaptiveMaxPoolingParams>{
-                                        { tensor(20, 20, 7, 3, 3), tensor(20, 20, 3, 3, 2) },
-                                        { tensor(32, 32, 7, 3, 3), tensor(32, 32, 3, 3, 2) },
-                                    }),
-                                 ::testing::Values(format::bfzyx),
-                                 ::testing::ValuesIn(layouts_3d),
-                                 ::testing::Values(false)),
-                         PrintToStringParamName());
-
-INSTANTIATE_TEST_SUITE_P(export_import,
-                         adaptive_max_pooling_test_f16,
-                         ::testing::Combine(
-                                 ::testing::ValuesIn(std::vector<AdaptiveMaxPoolingParams>{
-                                        { tensor(1, 2, 7, 3), tensor(1, 2, 3, 3) },
-                                    }),
-                                 ::testing::Values(format::bfyx),
-                                 ::testing::Values(format::bfyx),
-                                 ::testing::Values(true)),
-                         PrintToStringParamName());
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/add_reorders_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/add_reorders_gpu_test.cpp
index 5825807877198a..105b0ce5a3c27f 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/add_reorders_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/add_reorders_gpu_test.cpp
@@ -8,7 +8,6 @@
 #include <intel_gpu/primitives/reorder.hpp>
 #include <intel_gpu/primitives/data.hpp>
 #include <intel_gpu/primitives/activation.hpp>
-#include <intel_gpu/primitives/mutable_data.hpp>
 #include <intel_gpu/primitives/tile.hpp>
 #include <intel_gpu/primitives/reshape.hpp>
 #include <intel_gpu/primitives/concatenation.hpp>
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/arg_max_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/arg_max_gpu_test.cpp
index eb532b2357f1da..4b6fab3f007dbc 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/arg_max_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/arg_max_gpu_test.cpp
@@ -542,7 +542,7 @@ TEST(top_k_layer_tests, multiple_outputs) {
 
     ExecutionConfig config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::optimize_data(true));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
     network network(engine, topology, config);
 
@@ -898,7 +898,7 @@ TEST(arg_max_min_gpu, dynamic) {
     set_values(input, input_vec);
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     network network(engine, topology, config);
     network.set_input_data("input", input);
 
@@ -925,7 +925,7 @@ TEST(arg_max_min_test, check_second_output_data_type) {
     auto& engine = get_test_engine();
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
     cldnn::program prog(engine, config);
     std::vector<std::shared_ptr<primitive>> input_prims;
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/batch_to_space_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/batch_to_space_gpu_test.cpp
index fceba93f47c435..9559d64d52a574 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/batch_to_space_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/batch_to_space_gpu_test.cpp
@@ -34,10 +34,7 @@ TEST(batch_to_space_fp16_gpu, i8111_bs1222_cb0000_ce0000) {
 
     topology topology;
     topology.add(input_layout("Input", input->get_layout()));
-    topology.add(batch_to_space("batch_to_space", input_info("Input"), tensor(format::bfyx, {1,2,2,2}, 1),
-                                                                       tensor(format::bfyx, {0,0,0,0}, 0),
-                                                                       tensor(format::bfyx, {0,0,0,0}, 0),
-                                                                       tensor(format::bfyx, {1,2,2,2}, 1)));
+    topology.add(batch_to_space("batch_to_space", input_info("Input"), {1,2,2,2}, {0,0,0,0}, {0,0,0,0}));
     network network(engine, topology, get_test_default_config(engine));
 
     network.set_input_data("Input", input);
@@ -81,10 +78,7 @@ TEST(batch_to_space_fp16_gpu, i4321_bs1212_cb0000_ce0000) {
 
     topology topology;
     topology.add(input_layout("Input", input->get_layout()));
-    topology.add(batch_to_space("batch_to_space", input_info("Input"), tensor(format::bfyx, {1,2,1,2}, 1),
-                                                                       tensor(format::bfyx, {0,0,0,0}, 0),
-                                                                       tensor(format::bfyx, {0,0,0,0}, 0),
-                                                                       tensor(format::bfyx, {1,6,2,2}, 1)));
+    topology.add(batch_to_space("batch_to_space", input_info("Input"), {1,2,1,2}, {0,0,0,0}, {0,0,0,0}));
     network network(engine, topology, get_test_default_config(engine));
 
     network.set_input_data("Input", input);
@@ -131,10 +125,7 @@ TEST(batch_to_space_fp16_gpu, i4321_bs1212_cb0010_ce0101) {
 
     topology topology;
     topology.add(input_layout("Input", input->get_layout()));
-    topology.add(batch_to_space("batch_to_space", input_info("Input"), tensor(format::bfyx, {1,2,1,2}, 1),
-                                                                       tensor(format::bfyx, {0,0,1,0}, 0),
-                                                                       tensor(format::bfyx, {0,1,0,1}, 0),
-                                                                       tensor(format::bfyx, {1,5,1,1}, 1)));
+    topology.add(batch_to_space("batch_to_space", input_info("Input"), {1,2,1,2}, {0,0,1,0}, {0,1,0,1}));
     network network(engine, topology, get_test_default_config(engine));
 
     network.set_input_data("Input", input);
@@ -178,10 +169,7 @@ TEST(batch_to_space_fp16_gpu, i62121_bs12311_cb02000_ce00110) {
 
     topology topology;
     topology.add(input_layout("Input", input->get_layout()));
-    topology.add(batch_to_space("batch_to_space", input_info("Input"), tensor(format::bfzyx, {1,2,3,1,1}, 1),
-                                                                       tensor(format::bfzyx, {0,2,0,0,0}, 0),
-                                                                       tensor(format::bfzyx, {0,0,1,1,0}, 0),
-                                                                       tensor(format::bfzyx, {1,2,2,1,1}, 1)));
+    topology.add(batch_to_space("batch_to_space", input_info("Input"), {1,2,3,1,1}, {0,2,0,0,0}, {0,0,1,1,0}));
     network network(engine, topology, get_test_default_config(engine));
 
     network.set_input_data("Input", input);
@@ -227,10 +215,7 @@ TEST(batch_to_space_fp16_gpu, i1212112_bs112321_cb02000_ce00110) {
 
     topology topology;
     topology.add(input_layout("Input", input->get_layout()));
-    topology.add(batch_to_space("batch_to_space", input_info("Input"), tensor(format::bfwzyx, {1,1,2,3,2,1}, 1),
-                                                                       tensor(format::bfwzyx, {0,0,1,0,0,0}, 0),
-                                                                       tensor(format::bfwzyx, {0,0,0,2,0,0}, 0),
-                                                                       tensor(format::bfwzyx, {1,1,3,1,2,2}, 1)));
+    topology.add(batch_to_space("batch_to_space", input_info("Input"), {1,1,2,3,2,1}, {0,0,1,0,0,0}, {0,0,0,2,0,0}));
     network network(engine, topology, get_test_default_config(engine));
 
     network.set_input_data("Input", input);
@@ -275,10 +260,7 @@ TEST(batch_to_space_fp16_gpu, i21611_bs1112_cb0000_ce0000_b_fs_yx_fsv16) {
     topology topology;
     topology.add(input_layout("Input", input->get_layout()));
     topology.add(reorder("input_fsv", input_info("Input"), format::b_fs_yx_fsv16, data_types::f16));
-    topology.add(batch_to_space("batch_to_space", input_info("input_fsv"), tensor(format::bfyx, {1,1,1,2}, 1),
-                                                                           tensor(format::bfyx, {0,0,0,0}, 0),
-                                                                           tensor(format::bfyx, {0,0,0,0}, 0),
-                                                                           tensor(format::bfyx, {1,16,1,2}, 1)));
+    topology.add(batch_to_space("batch_to_space", input_info("input_fsv"), {1,1,1,2}, {0,0,0,0}, {0,0,0,0}));
     topology.add(reorder("bts_to_bfyx", input_info("batch_to_space"), format::bfyx, data_types::f16));
 
     network network(engine, topology, get_test_default_config(engine));
@@ -326,10 +308,7 @@ TEST(batch_to_space_fp16_gpu, i2812_bs1112_cb0000_ce0000_b_fs_yx_fsv16) {
     topology topology;
     topology.add(input_layout("Input", input->get_layout()));
     topology.add(reorder("input_fsv", input_info("Input"), format::b_fs_yx_fsv16, data_types::f16));
-    topology.add(batch_to_space("batch_to_space", input_info("input_fsv"), tensor(format::bfyx, {1,1,1,2}, 1),
-                                                                           tensor(format::bfyx, {0,2,0,0}, 0),
-                                                                           tensor(format::bfyx, {0,0,0,0}, 0),
-                                                                           tensor(format::bfyx, {1,6,1,4}, 1)));
+    topology.add(batch_to_space("batch_to_space", input_info("input_fsv"), {1,1,1,2}, {0,2,0,0}, {0,0,0,0}));
     topology.add(reorder("bts_to_bfyx", input_info("batch_to_space"), format::bfyx, data_types::f16));
 
     network network(engine, topology, get_test_default_config(engine));
@@ -373,10 +352,7 @@ TEST(batch_to_space_fp32_gpu, i8111_bs1222_cb0000_ce0000) {
 
     topology topology;
     topology.add(input_layout("Input", input->get_layout()));
-    topology.add(batch_to_space("batch_to_space", input_info("Input"), tensor(format::bfyx, {1,2,2,2}, 1),
-                                                                       tensor(format::bfyx, {0,0,0,0}, 0),
-                                                                       tensor(format::bfyx, {0,0,0,0}, 0),
-                                                                       tensor(format::bfyx, {1,2,2,2}, 1)));
+    topology.add(batch_to_space("batch_to_space", input_info("Input"), {1,2,2,2}, {0,0,0,0}, {0,0,0,0}));
     network network(engine, topology, get_test_default_config(engine));
 
     network.set_input_data("Input", input);
@@ -420,10 +396,7 @@ TEST(batch_to_space_fp32_gpu, i4321_bs1212_cb0000_ce0000) {
 
     topology topology;
     topology.add(input_layout("Input", input->get_layout()));
-    topology.add(batch_to_space("batch_to_space", input_info("Input"), tensor(format::bfyx, {1,2,1,2}, 1),
-                                                                       tensor(format::bfyx, {0,0,0,0}, 0),
-                                                                       tensor(format::bfyx, {0,0,0,0}, 0),
-                                                                       tensor(format::bfyx, {1,6,2,2}, 1)));
+    topology.add(batch_to_space("batch_to_space", input_info("Input"), {1,2,1,2}, {0,0,0,0}, {0,0,0,0}));
     network network(engine, topology, get_test_default_config(engine));
 
     network.set_input_data("Input", input);
@@ -470,10 +443,7 @@ TEST(batch_to_space_fp32_gpu, i4321_bs1212_cb0010_ce0101) {
 
     topology topology;
     topology.add(input_layout("Input", input->get_layout()));
-    topology.add(batch_to_space("batch_to_space", input_info("Input"), tensor(format::bfyx, {1,2,1,2}, 1),
-                                                                       tensor(format::bfyx, {0,0,1,0}, 0),
-                                                                       tensor(format::bfyx, {0,1,0,1}, 0),
-                                                                       tensor(format::bfyx, {1,5,1,1}, 1)));
+    topology.add(batch_to_space("batch_to_space", input_info("Input"), {1,2,1,2}, {0,0,1,0}, {0,1,0,1}));
     network network(engine, topology, get_test_default_config(engine));
 
     network.set_input_data("Input", input);
@@ -517,10 +487,7 @@ TEST(batch_to_space_fp32_gpu, i62121_bs12311_cb02000_ce00110) {
 
     topology topology;
     topology.add(input_layout("Input", input->get_layout()));
-    topology.add(batch_to_space("batch_to_space", input_info("Input"), tensor(format::bfzyx, {1,2,3,1,1}, 1),
-                                                                       tensor(format::bfzyx, {0,2,0,0,0}, 0),
-                                                                       tensor(format::bfzyx, {0,0,1,1,0}, 0),
-                                                                       tensor(format::bfzyx, {1,2,2,1,1}, 1)));
+    topology.add(batch_to_space("batch_to_space", input_info("Input"), {1,2,3,1,1}, {0,2,0,0,0}, {0,0,1,1,0}));
     network network(engine, topology, get_test_default_config(engine));
 
     network.set_input_data("Input", input);
@@ -566,10 +533,7 @@ TEST(batch_to_space_fp32_gpu, i1212112_bs112321_cb02000_ce00110) {
 
     topology topology;
     topology.add(input_layout("Input", input->get_layout()));
-    topology.add(batch_to_space("batch_to_space", input_info("Input"), tensor(format::bfwzyx, {1,1,2,3,2,1}, 1),
-                                                                       tensor(format::bfwzyx, {0,0,1,0,0,0}, 0),
-                                                                       tensor(format::bfwzyx, {0,0,0,2,0,0}, 0),
-                                                                       tensor(format::bfwzyx, {1,1,3,1,2,2}, 1)));
+    topology.add(batch_to_space("batch_to_space", input_info("Input"), {1,1,2,3,2,1}, {0,0,1,0,0,0}, {0,0,0,2,0,0}));
     network network(engine, topology, get_test_default_config(engine));
 
     network.set_input_data("Input", input);
@@ -618,10 +582,7 @@ TEST(batch_to_space_fp32_gpu, i21621_bs1112_cb0201_ce0810_b_fs_yx_fsv16) {
     topology topology;
     topology.add(input_layout("Input", input->get_layout()));
     topology.add(reorder("input_fsv", input_info("Input"), format::b_fs_yx_fsv16, data_types::f32));
-    topology.add(batch_to_space("batch_to_space", input_info("input_fsv"), tensor(format::bfyx, {1,1,1,2}, 1),
-                                                                           tensor(format::bfyx, {0,2,0,1}, 0),
-                                                                           tensor(format::bfyx, {0,8,1,0}, 0),
-                                                                           tensor(format::bfyx, {1,6,1,1}, 1)));
+    topology.add(batch_to_space("batch_to_space", input_info("input_fsv"), {1,1,1,2}, {0,2,0,1}, {0,8,1,0}));
     topology.add(reorder("bts_to_bfyx", input_info("batch_to_space"), format::bfyx, data_types::f32));
 
     network network(engine, topology, get_test_default_config(engine));
@@ -671,10 +632,7 @@ void test_batch_to_space_fp32_gpu_i41021_bs1221_cb0201_ce0810_b_fs_yx_fsv16(bool
     topology topology;
     topology.add(input_layout("Input", input->get_layout()));
     topology.add(reorder("input_fsv", input_info("Input"), format::b_fs_yx_fsv16, data_types::f32));
-    topology.add(batch_to_space("batch_to_space", input_info("input_fsv"), tensor(format::bfyx, {1,2,2,1}, 1),
-                                                                           tensor(format::bfyx, {0,8,1,0}, 0),
-                                                                           tensor(format::bfyx, {0,4,0,0}, 0),
-                                                                           tensor(format::bfyx, {1,8,3,1}, 1)));
+    topology.add(batch_to_space("batch_to_space", input_info("input_fsv"), {1,2,2,1}, {0,8,1,0}, {0,4,0,0}));
     topology.add(reorder("bts_to_bfyx", input_info("batch_to_space"), format::bfyx, data_types::f32));
 
     cldnn::network::ptr network = get_network(engine, topology, get_test_default_config(engine), get_test_stream_ptr(), is_caching_test);
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/border_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/border_gpu_test.cpp
index 68a4e409f0ce32..1ce8c445240328 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/border_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/border_gpu_test.cpp
@@ -1623,7 +1623,7 @@ TEST(border_gpu, basic_bfyx_2x1x2x3_1x2x3x4_border_constant_dynamic) {
     set_values(input, input_data);
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     network network(engine, topology, config);
     network.set_input_data("input", input);
 
@@ -1728,7 +1728,7 @@ class border_dynamic_test : public ::testing::TestWithParam<border_dynamic_test_
         set_values(input, input_data);
 
         ExecutionConfig config = get_test_default_config(engine);
-        config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
         network network(engine, topology, config);
         network.set_input_data("input", input);
 
@@ -1850,7 +1850,7 @@ TEST(border_gpu, basic_zero_input_dynamic) {
     };
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
     cldnn::network network(engine, topology, config);
     network.set_input_data("input", input);
@@ -1903,7 +1903,7 @@ TEST(border_gpu, basic_zero_input) {
     };
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
     cldnn::network network(engine, topology, config);
     network.set_input_data("input", input);
@@ -1963,7 +1963,7 @@ TEST(border_gpu, 3d_input) {
                                allow_negative_pads),
                         reorder("output", input_info("border"), cldnn::format::bfyx, data_types::f16));
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     network target_network(engine, target_topology, config);
     target_network.set_input_data("input", input);
     auto target_output = target_network.execute().at("output").get_memory();
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/broadcast_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/broadcast_gpu_test.cpp
index 184a5be5b1d81e..657cd7c2ca9713 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/broadcast_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/broadcast_gpu_test.cpp
@@ -2,6 +2,7 @@
 // SPDX-License-Identifier: Apache-2.0
 //
 
+#include "openvino/core/axis_set.hpp"
 #include "test_utils.h"
 #include "openvino/reference/tile.hpp"
 #include "openvino/reference/broadcast.hpp"
@@ -16,10 +17,24 @@
 using namespace cldnn;
 using namespace ::tests;
 
+static ov::AxisSet get_broadcast_axes(const ov::AxisSet& axes_mapping_val, const size_t target_shape_size) {
+    ov::AxisSet broadcast_axes;
+
+    std::vector<size_t> axes(target_shape_size);
+    std::iota(axes.begin(), axes.end(), 0);
+    for (auto i = axes_mapping_val.rbegin(); i != axes_mapping_val.rend(); ++i) {
+        axes.erase(axes.begin() + *i);
+    }
+    broadcast_axes.insert(axes.begin(), axes.end());
+
+    return broadcast_axes;
+}
+
+
 template<typename T>
-void start_broadcast_test(format cldnn_format, data_types cldnn_data_type, std::vector<size_t> output_shape,
-                          std::vector<size_t> input_shape, std::vector<size_t> broadcast_axes) {
-    size_t input_data_size = accumulate(input_shape.rbegin(), input_shape.rend(), (size_t)1, std::multiplies<size_t>());
+void start_broadcast_test(format cldnn_format, data_types cldnn_data_type, ov::Shape output_shape,
+                          ov::Shape input_shape, ov::AxisSet axes_mapping) {
+    size_t input_data_size = ov::shape_size(input_shape);
     ASSERT_GE(input_data_size, (size_t)1);
     std::vector<T> input_data = {};
     for (size_t i = 1; i <= input_data_size; ++i) {
@@ -31,40 +46,22 @@ void start_broadcast_test(format cldnn_format, data_types cldnn_data_type, std::
     std::vector<T> output_data(output_data_size);
     ov::reference::broadcast(reinterpret_cast<const char*>(input_data.data()),
                              reinterpret_cast<char*>(output_data.data()),
-                             ov::Shape(input_shape.begin(), input_shape.end()),
-                             ov::Shape(output_shape.begin(), output_shape.end()),
-                             ov::AxisSet(broadcast_axes),
+                             input_shape,
+                             output_shape,
+                             get_broadcast_axes(axes_mapping, output_shape.size()),
                              sizeof(T));
 
     ASSERT_EQ(output_data.size(), accumulate(output_shape.rbegin(), output_shape.rend(), (size_t)1, std::multiplies<size_t>()));
 
-    std::vector<tensor::value_type> output_4d(4, 1);
-    for (size_t i = 0; i < output_shape.size(); ++i) {
-        output_4d.at(4 - output_shape.size() + i) = (tensor::value_type)output_shape.at(i);
-    }
-    std::vector<tensor::value_type> input_4d(4, 1);
-    for (size_t i = 0; i < input_shape.size(); ++i) {
-        input_4d.at(4 - input_shape.size() + i) = (tensor::value_type)input_shape.at(i);
-    }
-    std::vector<uint16_t> fixed_b_axes;
-    size_t shift = 4 - output_shape.size();
-    for (size_t i = 0; i < shift; ++i) {
-        fixed_b_axes.push_back((uint16_t) i);
-    }
-    for (size_t i = 0; i < broadcast_axes.size(); ++i) {
-        fixed_b_axes.push_back((uint16_t) (broadcast_axes.at(i) + shift));
-    }
-
     auto& engine = get_test_engine();
-    auto input = engine.allocate_memory({cldnn_data_type, format::bfyx, {input_4d.at(0), input_4d.at(1), input_4d.at(3), input_4d.at(2)}});
+    auto input = engine.allocate_memory({input_shape, cldnn_data_type, format::bfyx});
 
     topology topology;
     topology.add(input_layout("input", input->get_layout()));
     topology.add(reorder("reorder", input_info("input"), cldnn_format, cldnn_data_type));
-    topology.add(broadcast("broadcast", input_info("reorder"), {output_4d.at(0), output_4d.at(1), output_4d.at(3), output_4d.at(2)}, fixed_b_axes));
+    topology.add(broadcast("broadcast", input_info("reorder"), output_shape, axes_mapping));
     topology.add(reorder("output", input_info("broadcast"), format::bfyx, cldnn_data_type));
 
-
     set_values(input, input_data);
 
     ExecutionConfig cfg = get_test_default_config(engine);
@@ -75,15 +72,8 @@ void start_broadcast_test(format cldnn_format, data_types cldnn_data_type, std::
     auto output = outputs.at("output").get_memory();
     cldnn::mem_lock<T> output_ptr(output, get_test_stream());
 
-    for (tensor::value_type b = 0; b < output_4d.at(0); ++b) {
-        for (tensor::value_type f = 0; f < output_4d.at(1); ++f) {
-            for (tensor::value_type y = 0; y < output_4d.at(2); ++y) {
-                for (tensor::value_type x = 0; x < output_4d.at(3); ++x) {
-                    auto output_off = ((b * output_4d.at(1) + f) * output_4d.at(2) + y) * output_4d.at(3) + x;
-                    ASSERT_EQ(output_ptr[output_off], output_data[output_off]);
-                }
-            }
-        }
+    for (size_t i = 0; i < ov::shape_size(output_shape); ++i) {
+        ASSERT_EQ(output_ptr[i], output_data[i]) << " i = " << i;
     }
 }
 template<typename inT, typename outT>
@@ -92,9 +82,9 @@ void start_broadcast_test_dynamic(format input_format,
                                   data_types output_data_type,
                                   ov::Shape output_shape,
                                   ov::Shape input_data_shape,
-                                  ov::AxisSet broadcast_axes,
+                                  ov::AxisSet axes_mapping,
                                   bool is_output_static = false,
-                                  impl_types impl_type = impl_types::any, 
+                                  impl_types impl_type = impl_types::any,
                                   bool optimize = false) {
     size_t input_data_size = accumulate(input_data_shape.rbegin(), input_data_shape.rend(), (size_t)1, std::multiplies<size_t>());
     ASSERT_GE(input_data_size, (size_t)1);
@@ -111,7 +101,7 @@ void start_broadcast_test_dynamic(format input_format,
                              reinterpret_cast<char*>(output_data_tmp.data()),
                              ov::Shape(input_data_shape.begin(), input_data_shape.end()),
                              ov::Shape(output_shape.begin(), output_shape.end()),
-                             ov::AxisSet(broadcast_axes),
+                             get_broadcast_axes(axes_mapping, output_shape.size()),
                              sizeof(inT));
 
     ASSERT_EQ(output_data_tmp.size(), accumulate(output_shape.rbegin(), output_shape.rend(), (size_t)1, std::multiplies<size_t>()));
@@ -120,7 +110,7 @@ void start_broadcast_test_dynamic(format input_format,
     }
 
     int64_t input_rank = input_data_shape.size();
-    ASSERT_EQ(input_rank, broadcast_axes.size());
+    ASSERT_EQ(input_rank, axes_mapping.size());
     auto fmt = format::get_default_format(input_rank);
 
     auto& engine = get_test_engine();
@@ -132,7 +122,7 @@ void start_broadcast_test_dynamic(format input_format,
         auto in_layout = layout(ov::PartialShape::dynamic(input_rank), input_data_type, fmt);
         topology.add(input_layout("input", in_layout));
         topology.add(reorder("reorder", input_info("input"), input_format, input_data_type));
-        topology.add(broadcast("broadcast", input_info("reorder"), output_shape, ov::AxisSet(broadcast_axes)));
+        topology.add(broadcast("broadcast", input_info("reorder"), output_shape, axes_mapping));
         topology.add(reorder("output",
                              input_info("broadcast"),
                              fmt,
@@ -149,7 +139,7 @@ void start_broadcast_test_dynamic(format input_format,
         topology.add(input_layout("target_shape", target_shape_layout));
         topology.add(reorder("reorder", input_info("input"), input_format, input_data_type));
         topology.add(
-            broadcast("broadcast", input_info("reorder"), input_info("target_shape"), ov::AxisSet(broadcast_axes)));
+            broadcast("broadcast", input_info("reorder"), input_info("target_shape"), axes_mapping));
         topology.add(reorder("output",
                              input_info("broadcast"),
                              fmt,
@@ -166,7 +156,6 @@ void start_broadcast_test_dynamic(format input_format,
     }
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
     if (optimize) {
         config.set_property(ov::intel_gpu::optimize_data(true));
     }
@@ -205,10 +194,10 @@ void start_broadcast_test_dynamic(format input_format,
 }
 
 template<typename T>
-void start_broadcast_test_5d(format cldnn_format, data_types cldnn_data_type, std::vector<size_t> output_shape,
-                             std::vector<size_t> input_shape, std::vector<size_t> broadcast_axes, bool is_caching_test=false)
+void start_broadcast_test_5d(format cldnn_format, data_types cldnn_data_type, ov::Shape output_shape,
+                             ov::Shape input_shape, ov::AxisSet axes_mapping, bool is_caching_test=false)
 {
-    size_t input_data_size = accumulate(input_shape.rbegin(), input_shape.rend(), (size_t)1, std::multiplies<size_t>());
+    size_t input_data_size = ov::shape_size(input_shape);
     ASSERT_GE(input_data_size, (size_t)1);
     std::vector<T> input_data = {};
     for (size_t i = 1; i <= input_data_size; ++i) {
@@ -220,40 +209,22 @@ void start_broadcast_test_5d(format cldnn_format, data_types cldnn_data_type, st
     std::vector<T> output_data(output_data_size);
     ov::reference::broadcast(reinterpret_cast<const char*>(input_data.data()),
                              reinterpret_cast<char*>(output_data.data()),
-                             ov::Shape(input_shape.begin(), input_shape.end()),
-                             ov::Shape(output_shape.begin(), output_shape.end()),
-                             ov::AxisSet(broadcast_axes),
+                             input_shape,
+                             output_shape,
+                             get_broadcast_axes(axes_mapping, output_shape.size()),
                              sizeof(T));
 
     ASSERT_EQ(output_data.size(), accumulate(output_shape.rbegin(), output_shape.rend(), (size_t)1, std::multiplies<size_t>()));
 
-    std::vector<tensor::value_type> output_5d(5, 1);
-    for (size_t i = 0; i < output_shape.size(); ++i) {
-        output_5d.at(5 - output_shape.size() + i) = (tensor::value_type)output_shape.at(i);
-    }
-    std::vector<tensor::value_type> input_5d(5, 1);
-    for (size_t i = 0; i < input_shape.size(); ++i) {
-        input_5d.at(5 - input_shape.size() + i) = (tensor::value_type)input_shape.at(i);
-    }
-    std::vector<uint16_t> fixed_b_axes;
-    size_t shift = 5 - output_shape.size();
-    for (size_t i = 0; i < shift; ++i) {
-        fixed_b_axes.push_back((uint16_t)i);
-    }
-    for (size_t i = 0; i < broadcast_axes.size(); ++i) {
-        fixed_b_axes.push_back((uint16_t)(broadcast_axes.at(i) + shift));
-    }
-
     auto& engine = get_test_engine();
-    auto input = engine.allocate_memory({ cldnn_data_type, format::bfzyx, { input_5d.at(0), input_5d.at(1), input_5d.at(4), input_5d.at(3), input_5d.at(2) } });
+    auto input = engine.allocate_memory({ input_shape, cldnn_data_type, format::bfzyx });
 
     topology topology;
     topology.add(input_layout("input", input->get_layout()));
     topology.add(reorder("reorder", input_info("input"), cldnn_format, cldnn_data_type));
-    topology.add(broadcast("broadcast", input_info("reorder"), { output_5d.at(0), output_5d.at(1), output_5d.at(4), output_5d.at(3), output_5d.at(2) }, fixed_b_axes));
+    topology.add(broadcast("broadcast", input_info("reorder"), output_shape, axes_mapping));
     topology.add(reorder("output", input_info("broadcast"), format::bfzyx, cldnn_data_type));
 
-
     set_values(input, input_data);
 
     cldnn::network::ptr network = get_network(engine, topology, get_test_default_config(engine), get_test_stream_ptr(), is_caching_test);
@@ -264,17 +235,8 @@ void start_broadcast_test_5d(format cldnn_format, data_types cldnn_data_type, st
     auto output = outputs.at("output").get_memory();
     cldnn::mem_lock<T> output_ptr(output, get_test_stream());
 
-    for (tensor::value_type b = 0; b < output_5d.at(0); ++b) {
-        for (tensor::value_type f = 0; f < output_5d.at(1); ++f) {
-            for (tensor::value_type z = 0; z < output_5d.at(2); ++z) {
-                for (tensor::value_type y = 0; y < output_5d.at(3); ++y) {
-                    for (tensor::value_type x = 0; x < output_5d.at(4); ++x) {
-                        auto output_off = (((b * output_5d.at(1) + f) * output_5d.at(2) + z) * output_5d.at(3) + y) * output_5d.at(4) + x;
-                        ASSERT_EQ(output_ptr[output_off], output_data[output_off]);
-                    }
-                }
-            }
-        }
+    for (size_t i = 0; i < ov::shape_size(output_shape); ++i) {
+        ASSERT_EQ(output_ptr[i], output_data[i]);
     }
 }
 
@@ -295,15 +257,15 @@ TEST(broadcast_gpu_int64_t, bfyx_1_to_5_w_b_axes_0) {
 /* Expected golden_data = {1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0,
                            1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0}; */
 TEST(broadcast_gpu_float, bfyx_1_to_4x5_w_b_axes_0x1) {
-    start_broadcast_test<float>(format::bfyx, data_types::f32, {4, 5}, {1}, {0, 1});
+    start_broadcast_test<float>(format::bfyx, data_types::f32, {4, 5}, {1}, {0});
 }
 
 TEST(broadcast_gpu_uint8_t, bfyx_1_to_4x5_w_b_axes_0x1) {
-    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {4, 5}, {1}, {0, 1});
+    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {4, 5}, {1}, {0});
 }
 
 TEST(broadcast_gpu_int64_t, bfyx_1_to_4x5_w_b_axes_0x1) {
-    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {4, 5}, {1}, {0, 1});
+    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {4, 5}, {1}, {0});
 }
 
 // dynamic kernel
@@ -355,15 +317,15 @@ TEST(broadcast_cpu_impl_int64_t, bfyx_1_to_4x5_w_b_axes_0x1x2x3_dynamic_with_sta
                            1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0,
                            1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0}; */
 TEST(broadcast_gpu_float, bfyx_1_to_3x4x5_w_b_axes_0x1x2) {
-    start_broadcast_test<float>(format::bfyx, data_types::f32, {3, 4, 5}, {1}, {0, 1, 2});
+    start_broadcast_test<float>(format::bfyx, data_types::f32, {3, 4, 5}, {1}, {1});
 }
 
 TEST(broadcast_gpu_uint8_t, bfyx_1_to_3x4x5_w_b_axes_0x1x2) {
-    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {3, 4, 5}, {1}, {0, 1, 2});
+    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {3, 4, 5}, {1}, {1});
 }
 
 TEST(broadcast_gpu_int64_t, bfyx_1_to_3x4x5_w_b_axes_0x1x2) {
-    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {3, 4, 5}, {1}, {0, 1, 2});
+    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {3, 4, 5}, {1}, {1});
 }
 
 
@@ -380,332 +342,164 @@ TEST(broadcast_gpu_int64_t, bfyx_1_to_3x4x5_w_b_axes_0x1x2) {
                            1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0,
                            1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0}; */
 TEST(broadcast_gpu_float, bfyx_1_to_2x3x4x5_w_b_axes_0x1x2x3) {
-    start_broadcast_test<float>(format::bfyx, data_types::f32, {2, 3, 4, 5}, {1}, {0, 1, 2, 3});
+    start_broadcast_test<float>(format::bfyx, data_types::f32, {2, 3, 4, 5}, {1}, {2});
 }
 
 TEST(broadcast_gpu_uint8_t, bfyx_1_to_2x3x4x5_w_b_axes_0x1x2x3) {
-    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {2, 3, 4, 5}, {1}, {0, 1, 2, 3});
+    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {2, 3, 4, 5}, {1}, {2});
 }
 
 TEST(broadcast_gpu_int64_t, bfyx_1_to_2x3x4x5_w_b_axes_0x1x2x3) {
-    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {2, 3, 4, 5}, {1}, {0, 1, 2, 3});
+    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {2, 3, 4, 5}, {1}, {2});
 }
 
 
 /* Expected golden_data = {1.0, 1.0, 1.0, 1.0, 1.0} */
 TEST(broadcast_gpu_float, bfyx_1_to_5_w_o_b_axes) {
-    start_broadcast_test<float>(format::bfyx, data_types::f32, {5}, {1}, {});
+    start_broadcast_test<float>(format::bfyx, data_types::f32, {5}, {1}, {0});
 }
 
 TEST(broadcast_gpu_uint8_t, bfyx_1_to_5_w_o_b_axes) {
-    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {5}, {1}, {});
+    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {5}, {1}, {0});
 }
 
 TEST(broadcast_gpu_int64_t, bfyx_1_to_5_w_o_b_axes) {
-    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {5}, {1}, {});
-}
-
-
-/* Expected golden_data = {1.0, 2.0, 3.0, 1.0, 2.0, 3.0, 1.0, 2.0, 3.0, 1.0, 2.0, 3.0} */
-TEST(broadcast_gpu_float, bfyx_3_to_12_w_o_b_axes) {
-    start_broadcast_test<float>(format::bfyx, data_types::f32, {12}, {3}, {});
-}
-
-TEST(broadcast_gpu_uint8_t, bfyx_3_to_12_w_o_b_axes) {
-    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {12}, {3}, {});
+    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {5}, {1}, {0});
 }
 
-TEST(broadcast_gpu_int64_t, bfyx_3_to_12_w_o_b_axes) {
-    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {12}, {3}, {});
-}
 
 
 /* Expected golden_data = {1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0,
                            1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0}; */
 TEST(broadcast_gpu_float, bfyx_1x1_to_4x5_w_o_b_axes) {
-    start_broadcast_test<float>(format::bfyx, data_types::f32, {4, 5}, {1, 1}, {});
+    start_broadcast_test<float>(format::bfyx, data_types::f32, {4, 5}, {1, 1}, {0, 1});
 }
 
 TEST(broadcast_gpu_uint8_t, bfyx_1x1_to_4x5_w_o_b_axes) {
-    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {4, 5}, {1, 1}, {});
+    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {4, 5}, {1, 1}, {0, 1});
 }
 
 TEST(broadcast_gpu_int64_t, bfyx_1x1_to_4x5_w_o_b_axes) {
-    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {4, 5}, {1, 1}, {});
-}
-
-
-/* Expected golden_data = {1.0, 2.0, 3.0, 1.0, 2.0, 3.0, 4.0, 5.0, 6.0, 4.0, 5.0, 6.0,
-                           1.0, 2.0, 3.0, 1.0, 2.0, 3.0, 4.0, 5.0, 6.0, 4.0, 5.0, 6.0,
-                           1.0, 2.0, 3.0, 1.0, 2.0, 3.0, 4.0, 5.0, 6.0, 4.0, 5.0, 6.0,
-                           1.0, 2.0, 3.0, 1.0, 2.0, 3.0, 4.0, 5.0, 6.0, 4.0, 5.0, 6.0}; */
-TEST(broadcast_gpu_float, bfyx_2x3_to_8x6_w_o_b_axes) {
-    start_broadcast_test<float>(format::bfyx, data_types::f32, {8, 6}, {2, 3}, {});
-}
-
-TEST(broadcast_gpu_uint8_t, bfyx_2x3_to_8x6_w_o_b_axes) {
-    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {8, 6}, {2, 3}, {});
-}
-
-TEST(broadcast_gpu_int64_t, bfyx_2x3_to_8x6_w_o_b_axes) {
-    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {8, 6}, {2, 3}, {});
-}
-
-
-/* Expected golden_data = {1.0,  2.0,  3.0,  4.0,  5.0,  6.0,  7.0,  8.0,  9.0,  10.0, 11.0, 12.0,
-                           1.0,  2.0,  3.0,  4.0,  5.0,  6.0,  7.0,  8.0,  9.0,  10.0, 11.0, 12.0,
-                           13.0, 14.0, 15.0, 16.0, 17.0, 18.0, 19.0, 20.0, 21.0, 22.0, 23.0, 24.0,
-                           13.0, 14.0, 15.0, 16.0, 17.0, 18.0, 19.0, 20.0, 21.0, 22.0, 23.0, 24.0,
-                           1.0,  2.0,  3.0,  4.0,  5.0,  6.0,  7.0,  8.0,  9.0,  10.0, 11.0, 12.0,
-                           1.0,  2.0,  3.0,  4.0,  5.0,  6.0,  7.0,  8.0,  9.0,  10.0, 11.0, 12.0,
-                           13.0, 14.0, 15.0, 16.0, 17.0, 18.0, 19.0, 20.0, 21.0, 22.0, 23.0, 24.0,
-                           13.0, 14.0, 15.0, 16.0, 17.0, 18.0, 19.0, 20.0, 21.0, 22.0, 23.0, 24.0,
-                           1.0,  2.0,  3.0,  4.0,  5.0,  6.0,  7.0,  8.0,  9.0,  10.0, 11.0, 12.0,
-                           1.0,  2.0,  3.0,  4.0,  5.0,  6.0,  7.0,  8.0,  9.0,  10.0, 11.0, 12.0,
-                           13.0, 14.0, 15.0, 16.0, 17.0, 18.0, 19.0, 20.0, 21.0, 22.0, 23.0, 24.0,
-                           13.0, 14.0, 15.0, 16.0, 17.0, 18.0, 19.0, 20.0, 21.0, 22.0, 23.0, 24.0}; */
-TEST(broadcast_gpu_float, bfyx_2x3x4_to_6x6x4_w_o_b_axes) {
-    start_broadcast_test<float>(format::bfyx, data_types::f32, {6, 6, 4}, {2, 3, 4}, {});
-}
-
-TEST(broadcast_gpu_uint8_t, bfyx_2x3x4_to_6x6x4_w_o_b_axes) {
-    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {6, 6, 4}, {2, 3, 4}, {});
-}
-
-TEST(broadcast_gpu_int64_t, bfyx_2x3x4_to_6x6x4_w_o_b_axes) {
-    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {6, 6, 4}, {2, 3, 4}, {});
-}
-
-
-/* Expected golden_data = {1.0, 2.0, 3.0, 4.0, 5.0, 6.0, 7.0, 8.0, 9.0, 10.0,
-                           11.0, 12.0, 13.0, 14.0, 15.0, 16.0, 17.0, 18.0, 19.0, 20.0,
-                           1.0, 2.0, 3.0, 4.0, 5.0, 6.0, 7.0, 8.0, 9.0, 10.0,
-                           11.0, 12.0, 13.0, 14.0, 15.0, 16.0, 17.0, 18.0, 19.0, 20.0,
-                           21.0, 22.0, 23.0, 24.0, 25.0, 26.0, 27.0, 28.0, 29.0, 30.0,
-                           31.0, 32.0, 33.0, 34.0, 35.0, 36.0, 37.0, 38.0, 39.0, 40.0,
-                           21.0, 22.0, 23.0, 24.0, 25.0, 26.0, 27.0, 28.0, 29.0, 30.0,
-                           31.0, 32.0, 33.0, 34.0, 35.0, 36.0, 37.0, 38.0, 39.0, 40.0,
-                           41.0, 42.0, 43.0, 44.0, 45.0, 46.0, 47.0, 48.0, 49.0, 50.0,
-                           51.0, 52.0, 53.0, 54.0, 55.0, 56.0, 57.0, 58.0, 59.0, 60.0,
-                           41.0, 42.0, 43.0, 44.0, 45.0, 46.0, 47.0, 48.0, 49.0, 50.0,
-                           51.0, 52.0, 53.0, 54.0, 55.0, 56.0, 57.0, 58.0, 59.0, 60.0,
-                           1.0, 2.0, 3.0, 4.0, 5.0, 6.0, 7.0, 8.0, 9.0, 10.0,
-                           11.0, 12.0, 13.0, 14.0, 15.0, 16.0, 17.0, 18.0, 19.0, 20.0,
-                           1.0, 2.0, 3.0, 4.0, 5.0, 6.0, 7.0, 8.0, 9.0, 10.0,
-                           11.0, 12.0, 13.0, 14.0, 15.0, 16.0, 17.0, 18.0, 19.0, 20.0,
-                           21.0, 22.0, 23.0, 24.0, 25.0, 26.0, 27.0, 28.0, 29.0, 30.0,
-                           31.0, 32.0, 33.0, 34.0, 35.0, 36.0, 37.0, 38.0, 39.0, 40.0,
-                           21.0, 22.0, 23.0, 24.0, 25.0, 26.0, 27.0, 28.0, 29.0, 30.0,
-                           31.0, 32.0, 33.0, 34.0, 35.0, 36.0, 37.0, 38.0, 39.0, 40.0,
-                           41.0, 42.0, 43.0, 44.0, 45.0, 46.0, 47.0, 48.0, 49.0, 50.0,
-                           51.0, 52.0, 53.0, 54.0, 55.0, 56.0, 57.0, 58.0, 59.0, 60.0,
-                           41.0, 42.0, 43.0, 44.0, 45.0, 46.0, 47.0, 48.0, 49.0, 50.0,
-                           51.0, 52.0, 53.0, 54.0, 55.0, 56.0, 57.0, 58.0, 59.0, 60.0,
-                           1.0, 2.0, 3.0, 4.0, 5.0, 6.0, 7.0, 8.0, 9.0, 10.0,
-                           11.0, 12.0, 13.0, 14.0, 15.0, 16.0, 17.0, 18.0, 19.0, 20.0,
-                           1.0, 2.0, 3.0, 4.0, 5.0, 6.0, 7.0, 8.0, 9.0, 10.0,
-                           11.0, 12.0, 13.0, 14.0, 15.0, 16.0, 17.0, 18.0, 19.0, 20.0,
-                           21.0, 22.0, 23.0, 24.0, 25.0, 26.0, 27.0, 28.0, 29.0, 30.0,
-                           31.0, 32.0, 33.0, 34.0, 35.0, 36.0, 37.0, 38.0, 39.0, 40.0,
-                           21.0, 22.0, 23.0, 24.0, 25.0, 26.0, 27.0, 28.0, 29.0, 30.0,
-                           31.0, 32.0, 33.0, 34.0, 35.0, 36.0, 37.0, 38.0, 39.0, 40.0,
-                           41.0, 42.0, 43.0, 44.0, 45.0, 46.0, 47.0, 48.0, 49.0, 50.0,
-                           51.0, 52.0, 53.0, 54.0, 55.0, 56.0, 57.0, 58.0, 59.0, 60.0,
-                           41.0, 42.0, 43.0, 44.0, 45.0, 46.0, 47.0, 48.0, 49.0, 50.0,
-                           51.0, 52.0, 53.0, 54.0, 55.0, 56.0, 57.0, 58.0, 59.0, 60.0,
-                           61.0, 62.0, 63.0, 64.0, 65.0, 66.0, 67.0, 68.0, 69.0, 70.0,
-                           71.0, 72.0, 73.0, 74.0, 75.0, 76.0, 77.0, 78.0, 79.0, 80.0,
-                           61.0, 62.0, 63.0, 64.0, 65.0, 66.0, 67.0, 68.0, 69.0, 70.0,
-                           71.0, 72.0, 73.0, 74.0, 75.0, 76.0, 77.0, 78.0, 79.0, 80.0,
-                           81.0, 82.0, 83.0, 84.0, 85.0, 86.0, 87.0, 88.0, 89.0, 90.0,
-                           91.0, 92.0, 93.0, 94.0, 95.0, 96.0, 97.0, 98.0, 99.0, 100.0,
-                           81.0, 82.0, 83.0, 84.0, 85.0, 86.0, 87.0, 88.0, 89.0, 90.0,
-                           91.0, 92.0, 93.0, 94.0, 95.0, 96.0, 97.0, 98.0, 99.0, 100.0,
-                           101.0, 102.0, 103.0, 104.0, 105.0, 106.0, 107.0, 108.0, 109.0, 110.0,
-                           111.0, 112.0, 113.0, 114.0, 115.0, 116.0, 117.0, 118.0, 119.0, 120.0,
-                           101.0, 102.0, 103.0, 104.0, 105.0, 106.0, 107.0, 108.0, 109.0, 110.0,
-                           111.0, 112.0, 113.0, 114.0, 115.0, 116.0, 117.0, 118.0, 119.0, 120.0,
-                           61.0, 62.0, 63.0, 64.0, 65.0, 66.0, 67.0, 68.0, 69.0, 70.0,
-                           71.0, 72.0, 73.0, 74.0, 75.0, 76.0, 77.0, 78.0, 79.0, 80.0,
-                           61.0, 62.0, 63.0, 64.0, 65.0, 66.0, 67.0, 68.0, 69.0, 70.0,
-                           71.0, 72.0, 73.0, 74.0, 75.0, 76.0, 77.0, 78.0, 79.0, 80.0,
-                           81.0, 82.0, 83.0, 84.0, 85.0, 86.0, 87.0, 88.0, 89.0, 90.0,
-                           91.0, 92.0, 93.0, 94.0, 95.0, 96.0, 97.0, 98.0, 99.0, 100.0,
-                           81.0, 82.0, 83.0, 84.0, 85.0, 86.0, 87.0, 88.0, 89.0, 90.0,
-                           91.0, 92.0, 93.0, 94.0, 95.0, 96.0, 97.0, 98.0, 99.0, 100.0,
-                           101.0, 102.0, 103.0, 104.0, 105.0, 106.0, 107.0, 108.0, 109.0, 110.0,
-                           111.0, 112.0, 113.0, 114.0, 115.0, 116.0, 117.0, 118.0, 119.0, 120.0,
-                           101.0, 102.0, 103.0, 104.0, 105.0, 106.0, 107.0, 108.0, 109.0, 110.0,
-                           111.0, 112.0, 113.0, 114.0, 115.0, 116.0, 117.0, 118.0, 119.0, 120.0,
-                           61.0, 62.0, 63.0, 64.0, 65.0, 66.0, 67.0, 68.0, 69.0, 70.0,
-                           71.0, 72.0, 73.0, 74.0, 75.0, 76.0, 77.0, 78.0, 79.0, 80.0,
-                           61.0, 62.0, 63.0, 64.0, 65.0, 66.0, 67.0, 68.0, 69.0, 70.0,
-                           71.0, 72.0, 73.0, 74.0, 75.0, 76.0, 77.0, 78.0, 79.0, 80.0,
-                           81.0, 82.0, 83.0, 84.0, 85.0, 86.0, 87.0, 88.0, 89.0, 90.0,
-                           91.0, 92.0, 93.0, 94.0, 95.0, 96.0, 97.0, 98.0, 99.0, 100.0,
-                           81.0, 82.0, 83.0, 84.0, 85.0, 86.0, 87.0, 88.0, 89.0, 90.0,
-                           91.0, 92.0, 93.0, 94.0, 95.0, 96.0, 97.0, 98.0, 99.0, 100.0,
-                           101.0, 102.0, 103.0, 104.0, 105.0, 106.0, 107.0, 108.0, 109.0, 110.0,
-                           111.0, 112.0, 113.0, 114.0, 115.0, 116.0, 117.0, 118.0, 119.0, 120.0,
-                           101.0, 102.0, 103.0, 104.0, 105.0, 106.0, 107.0, 108.0, 109.0, 110.0,
-                           111.0, 112.0, 113.0, 114.0, 115.0, 116.0, 117.0, 118.0, 119.0, 120.0}; */
-TEST(broadcast_gpu_float, bfyx_2x3x4x5_to_2x9x8x5_w_o_b_axes) {
-    start_broadcast_test<float>(format::bfyx, data_types::f32, {2, 9, 8, 5}, {2, 3, 4, 5}, {});
-}
-
-TEST(broadcast_gpu_uint8_t, bfyx_2x3x4x5_to_2x9x8x5_w_o_b_axes) {
-    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {2, 9, 8, 5}, {2, 3, 4, 5}, {});
-}
-
-TEST(broadcast_gpu_int64_t, bfyx_2x3x4x5_to_2x9x8x5_w_o_b_axes) {
-    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {2, 9, 8, 5}, {2, 3, 4, 5}, {});
+    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {4, 5}, {1, 1}, {0, 1});
 }
 
 
 /* Expected golden_data = {1.0, 2.0, 3.0, 1.0, 2.0, 3.0} */
 TEST(broadcast_gpu_float, bfyx_3_to_2x3_w_b_axes_0) {
-    start_broadcast_test<float>(format::bfyx, data_types::f32, {2, 3}, {3}, {0});
+    start_broadcast_test<float>(format::bfyx, data_types::f32, {2, 3}, {3}, {1});
 }
 
 TEST(broadcast_gpu_uint8_t, bfyx_3_to_2x3_w_b_axes_0) {
-    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {2, 3}, {3}, {0});
+    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {2, 3}, {3}, {1});
 }
 
 TEST(broadcast_gpu_int64_t, bfyx_3_to_2x3_w_b_axes_0) {
-    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {2, 3}, {3}, {0});
-}
-
-
-/* Expected golden_data = {1.0, 2.0, 3.0, 1.0, 2.0, 3.0, 1.0, 2.0, 3.0, 1.0, 2.0, 3.0} */
-TEST(broadcast_gpu_float, bfyx_3_to_2x6_w_b_axes_0) {
-    start_broadcast_test<float>(format::bfyx, data_types::f32, {2, 6}, {3}, {0});
-}
-
-TEST(broadcast_gpu_uint8_t, bfyx_3_to_2x6_w_b_axes_0) {
-    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {2, 6}, {3}, {0});
-}
-
-TEST(broadcast_gpu_int64_t, bfyx_3_to_2x6_w_b_axes_0) {
-    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {2, 6}, {3}, {0});
+    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {2, 3}, {3}, {1});
 }
 
 
 /* Expected golden_data = {1.0, 1.0, 1.0, 2.0, 2.0, 2.0} */
 TEST(broadcast_gpu_float, bfyx_2_to_2x3_w_b_axes_1) {
-    start_broadcast_test<float>(format::bfyx, data_types::f32, {2, 3}, {2}, {1});
+    start_broadcast_test<float>(format::bfyx, data_types::f32, {2, 3}, {2}, {0});
 }
 
 TEST(broadcast_gpu_uint8_t, bfyx_2_to_2x3_w_b_axes_1) {
-    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {2, 3}, {2}, {1});
+    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {2, 3}, {2}, {0});
 }
 
 TEST(broadcast_gpu_int64_t, bfyx_2_to_2x3_w_b_axes_1) {
-    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {2, 3}, {2}, {1});
-}
-
-
-/* Expected golden_data = {1.0, 1.0, 1.0, 2.0, 2.0, 2.0, 1.0, 1.0, 1.0,
-                           2.0, 2.0, 2.0, 1.0, 1.0, 1.0, 2.0, 2.0, 2.0}; */
-TEST(broadcast_gpu_float, bfyx_2_to_6x3_w_b_axes_1) {
-    start_broadcast_test<float>(format::bfyx, data_types::f32, {6, 3}, {2}, {1});
+    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {2, 3}, {2}, {0});
 }
 
-TEST(broadcast_gpu_uint8_t, bfyx_2_to_6x3_w_b_axes_1) {
-    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {6, 3}, {2}, {1});
-}
-
-TEST(broadcast_gpu_int64_t, bfyx_2_to_6x3_w_b_axes_1) {
-    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {6, 3}, {2}, {1});
-}
 
 
 /* Expected golden_data = {1.0, 2.0, 3.0, 4.0, 5.0, 6.0, 7.0, 8.0, 9.0, 10.0, 11.0, 12.0,
                            1.0, 2.0, 3.0, 4.0, 5.0, 6.0, 7.0, 8.0, 9.0, 10.0, 11.0, 12.0}; */
 TEST(broadcast_gpu_float, bfyx_3x4_to_2x3x4_w_b_axes_0) {
-    start_broadcast_test<float>(format::bfyx, data_types::f32, {2, 3, 4}, {3, 4}, {0});
+    start_broadcast_test<float>(format::bfyx, data_types::f32, {2, 3, 4}, {3, 4}, {1, 2});
 }
 
 TEST(broadcast_gpu_uint8_t, bfyx_3x4_to_2x3x4_w_b_axes_0) {
-    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {2, 3, 4}, {3, 4}, {0});
+    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {2, 3, 4}, {3, 4}, {1, 2});
 }
 
 TEST(broadcast_gpu_int64_t, bfyx_3x4_to_2x3x4_w_b_axes_0) {
-    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {2, 3, 4}, {3, 4}, {0});
+    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {2, 3, 4}, {3, 4}, {1, 2});
 }
 
 
 /* Expected golden_data = {1.0, 2.0, 3.0, 4.0, 1.0, 2.0, 3.0, 4.0, 1.0, 2.0, 3.0, 4.0,
                            5.0, 6.0, 7.0, 8.0, 5.0, 6.0, 7.0, 8.0, 5.0, 6.0, 7.0, 8.0}; */
 TEST(broadcast_gpu_float, bfyx_2x4_to_2x3x4_w_b_axes_1) {
-    start_broadcast_test<float>(format::bfyx, data_types::f32, {2, 3, 4}, {2, 4}, {1});
+    start_broadcast_test<float>(format::bfyx, data_types::f32, {2, 3, 4}, {2, 4}, {0, 2});
 }
 
 TEST(broadcast_gpu_uint8_t, bfyx_2x4_to_2x3x4_w_b_axes_1) {
-    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {2, 3, 4}, {2, 4}, {1});
+    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {2, 3, 4}, {2, 4}, {0, 2});
 }
 
 TEST(broadcast_gpu_int64_t, bfyx_2x4_to_2x3x4_w_b_axes_1) {
-    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {2, 3, 4}, {2, 4}, {1});
+    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {2, 3, 4}, {2, 4}, {0, 2});
 }
 
 
 /* Expected golden_data = {1.0, 1.0, 1.0, 1.0, 2.0, 2.0, 2.0, 2.0, 3.0, 3.0, 3.0, 3.0,
                            4.0, 4.0, 4.0, 4.0, 5.0, 5.0, 5.0, 5.0, 6.0, 6.0, 6.0, 6.0}; */
 TEST(broadcast_gpu_float, bfyx_2x3_to_2x3x4_w_b_axes_2) {
-    start_broadcast_test<float>(format::bfyx, data_types::f32, {2, 3, 4}, {2, 3}, {2});
+    start_broadcast_test<float>(format::bfyx, data_types::f32, {2, 3, 4}, {2, 3}, {0, 1});
 }
 
 TEST(broadcast_gpu_uint8_t, bfyx_2x3_to_2x3x4_w_b_axes_2) {
-    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {2, 3, 4}, {2, 3}, {2});
+    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {2, 3, 4}, {2, 3}, {0, 1});
 }
 
 TEST(broadcast_gpu_int64_t, bfyx_2x3_to_2x3x4_w_b_axes_2) {
-    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {2, 3, 4}, {2, 3}, {2});
+    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {2, 3, 4}, {2, 3}, {0, 1});
 }
 
 
 /* Expected golden_data = {1.0, 2.0, 3.0, 4.0, 1.0, 2.0, 3.0, 4.0, 1.0, 2.0, 3.0, 4.0,
                            1.0, 2.0, 3.0, 4.0, 1.0, 2.0, 3.0, 4.0, 1.0, 2.0, 3.0, 4.0} */
 TEST(broadcast_gpu_float, bfyx_4_to_2x3x4_w_b_axes_0_1) {
-    start_broadcast_test<float>(format::bfyx, data_types::f32, {2, 3, 4}, {4}, {0, 1});
+    start_broadcast_test<float>(format::bfyx, data_types::f32, {2, 3, 4}, {4}, {2});
 }
 
 TEST(broadcast_gpu_uint8_t, bfyx_4_to_2x3x4_w_b_axes_0_1) {
-    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {2, 3, 4}, {4}, {0, 1});
+    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {2, 3, 4}, {4}, {2});
 }
 
 TEST(broadcast_gpu_int64_t, bfyx_4_to_2x3x4_w_b_axes_0_1) {
-    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {2, 3, 4}, {4}, {0, 1});
+    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {2, 3, 4}, {4}, {2});
 }
 
 
 /* Expected golden_data = {1.0, 1.0, 1.0, 1.0, 2.0, 2.0, 2.0, 2.0, 3.0, 3.0, 3.0, 3.0,
                            1.0, 1.0, 1.0, 1.0, 2.0, 2.0, 2.0, 2.0, 3.0, 3.0, 3.0, 3.0} */
 TEST(broadcast_gpu_float, bfyx_3_to_2x3x4_w_b_axes_0_2) {
-    start_broadcast_test<float>(format::bfyx, data_types::f32, {2, 3, 4}, {3}, {0, 2});
+    start_broadcast_test<float>(format::bfyx, data_types::f32, {2, 3, 4}, {3}, {1});
 }
 
 TEST(broadcast_gpu_uint8_t, bfyx_3_to_2x3x4_w_b_axes_0_2) {
-    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {2, 3, 4}, {3}, {0, 2});
+    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {2, 3, 4}, {3}, {1});
 }
 
 TEST(broadcast_gpu_int64_t, bfyx_3_to_2x3x4_w_b_axes_0_2) {
-    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {2, 3, 4}, {3}, {0, 2});
+    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {2, 3, 4}, {3}, {1});
 }
 
 
 /* Expected golden_data = {1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0,
                            2.0, 2.0, 2.0, 2.0, 2.0, 2.0, 2.0, 2.0, 2.0, 2.0, 2.0, 2.0} */
 TEST(broadcast_gpu_float, bfyx_2_to_2x3x4_w_b_axes_1_2) {
-    start_broadcast_test<float>(format::bfyx, data_types::f32, {2, 3, 4}, {2}, {1, 2});
+    start_broadcast_test<float>(format::bfyx, data_types::f32, {2, 3, 4}, {2}, {0});
 }
 
 TEST(broadcast_gpu_uint8_t, bfyx_2_to_2x3x4_w_b_axes_1_2) {
-    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {2, 3, 4}, {2}, {1, 2});
+    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {2, 3, 4}, {2}, {0});
 }
 
 TEST(broadcast_gpu_int64_t, bfyx_2_to_2x3x4_w_b_axes_1_2) {
-    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {2, 3, 4}, {2}, {1, 2});
+    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {2, 3, 4}, {2}, {0});
 }
 
 
@@ -720,15 +514,15 @@ TEST(broadcast_gpu_int64_t, bfyx_2_to_2x3x4_w_b_axes_1_2) {
                            37.0, 38.0, 39.0, 40.0, 41.0, 42.0, 43.0, 44.0, 45.0, 46.0, 47.0, 48.0,
                            49.0, 50.0, 51.0, 52.0, 53.0, 54.0, 55.0, 56.0, 57.0, 58.0, 59.0, 60.0} */
 TEST(broadcast_gpu_float, bfyx_3x4x5_to_2x3x4x5_w_b_axes_0) {
-    start_broadcast_test<float>(format::bfyx, data_types::f32, {2, 3, 4, 5}, {3, 4, 5}, {0});
+    start_broadcast_test<float>(format::bfyx, data_types::f32, {2, 3, 4, 5}, {3, 4, 5}, {1, 2, 3});
 }
 
 TEST(broadcast_gpu_uint8_t, bfyx_3x4x5_to_2x3x4x5_w_b_axes_0) {
-    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {2, 3, 4, 5}, {3, 4, 5}, {0});
+    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {2, 3, 4, 5}, {3, 4, 5}, {1, 2, 3});
 }
 
 TEST(broadcast_gpu_int64_t, bfyx_3x4x5_to_2x3x4x5_w_b_axes_0) {
-    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {2, 3, 4, 5}, {3, 4, 5}, {0});
+    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {2, 3, 4, 5}, {3, 4, 5}, {1, 2, 3});
 }
 
 
@@ -745,15 +539,15 @@ TEST(broadcast_gpu_int64_t, bfyx_3x4x5_to_2x3x4x5_w_b_axes_0) {
                            21.0, 22.0, 23.0, 24.0, 25.0, 26.0, 27.0, 28.0, 29.0, 30.0,
                            31.0, 32.0, 33.0, 34.0, 35.0, 36.0, 37.0, 38.0, 39.0, 40.0} */
 TEST(broadcast_gpu_float, bfyx_2x4x5_to_2x3x4x5_w_b_axes_1) {
-    start_broadcast_test<float>(format::bfyx, data_types::f32, {2, 3, 4, 5}, {2, 4, 5}, {1});
+    start_broadcast_test<float>(format::bfyx, data_types::f32, {2, 3, 4, 5}, {2, 4, 5}, {0, 2, 3});
 }
 
 TEST(broadcast_gpu_uint8_t, bfyx_2x4x5_to_2x3x4x5_w_b_axes_1) {
-    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {2, 3, 4, 5}, {2, 4, 5}, {1});
+    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {2, 3, 4, 5}, {2, 4, 5}, {0, 2, 3});
 }
 
 TEST(broadcast_gpu_int64_t, bfyx_2x4x5_to_2x3x4x5_w_b_axes_1) {
-    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {2, 3, 4, 5}, {2, 4, 5}, {1});
+    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {2, 3, 4, 5}, {2, 4, 5}, {0, 2, 3});
 }
 
 
@@ -770,15 +564,15 @@ TEST(broadcast_gpu_int64_t, bfyx_2x4x5_to_2x3x4x5_w_b_axes_1) {
                            26.0, 27.0, 28.0, 29.0, 30.0, 26.0, 27.0, 28.0, 29.0, 30.0,
                            26.0, 27.0, 28.0, 29.0, 30.0, 26.0, 27.0, 28.0, 29.0, 30.0} */
 TEST(broadcast_gpu_float, bfyx_2x3x5_to_2x3x4x5_w_b_axes_2) {
-    start_broadcast_test<float>(format::bfyx, data_types::f32, {2, 3, 4, 5}, {2, 3, 5}, {2});
+    start_broadcast_test<float>(format::bfyx, data_types::f32, {2, 3, 4, 5}, {2, 3, 5}, {0, 1, 3});
 }
 
 TEST(broadcast_gpu_uint8_t, bfyx_2x3x5_to_2x3x4x5_w_b_axes_2) {
-    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {2, 3, 4, 5}, {2, 3, 5}, {2});
+    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {2, 3, 4, 5}, {2, 3, 5}, {0, 1, 3});
 }
 
 TEST(broadcast_gpu_int64_t, bfyx_2x3x5_to_2x3x4x5_w_b_axes_2) {
-    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {2, 3, 4, 5}, {2, 3, 5}, {2});
+    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {2, 3, 4, 5}, {2, 3, 5}, {0, 1, 3});
 }
 
 
@@ -795,15 +589,15 @@ TEST(broadcast_gpu_int64_t, bfyx_2x3x5_to_2x3x4x5_w_b_axes_2) {
                            21.0, 21.0, 21.0, 21.0, 21.0, 22.0, 22.0, 22.0, 22.0, 22.0,
                            23.0, 23.0, 23.0, 23.0, 23.0, 24.0, 24.0, 24.0, 24.0, 24.0} */
 TEST(broadcast_gpu_float, bfyx_2x3x4_to_2x3x4x5_w_b_axes_3) {
-    start_broadcast_test<float>(format::bfyx, data_types::f32, {2, 3, 4, 5}, {2, 3, 4}, {3});
+    start_broadcast_test<float>(format::bfyx, data_types::f32, {2, 3, 4, 5}, {2, 3, 4}, {0, 1, 2});
 }
 
 TEST(broadcast_gpu_uint8_t, bfyx_2x3x4_to_2x3x4x5_w_b_axes_3) {
-    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {2, 3, 4, 5}, {2, 3, 4}, {3});
+    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {2, 3, 4, 5}, {2, 3, 4}, {0, 1, 2});
 }
 
 TEST(broadcast_gpu_int64_t, bfyx_2x3x4_to_2x3x4x5_w_b_axes_3) {
-    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {2, 3, 4, 5}, {2, 3, 4}, {3});
+    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {2, 3, 4, 5}, {2, 3, 4}, {0, 1, 2});
 }
 
 
@@ -820,15 +614,15 @@ TEST(broadcast_gpu_int64_t, bfyx_2x3x4_to_2x3x4x5_w_b_axes_3) {
                                       1.0, 2.0, 3.0, 4.0, 5.0, 6.0, 7.0, 8.0, 9.0, 10.0,
                                       11.0, 12.0, 13.0, 14.0, 15.0, 16.0, 17.0, 18.0, 19.0, 20.0} */
 TEST(broadcast_gpu_float, bfyx_4x5_to_2x3x4x5_w_b_axes_0_1) {
-    start_broadcast_test<float>(format::bfyx, data_types::f32, {2, 3, 4, 5}, {4, 5}, {0, 1});
+    start_broadcast_test<float>(format::bfyx, data_types::f32, {2, 3, 4, 5}, {4, 5}, {2, 3});
 }
 
 TEST(broadcast_gpu_uint8_t, bfyx_4x5_to_2x3x4x5_w_b_axes_0_1) {
-    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {2, 3, 4, 5}, {4, 5}, {0, 1});
+    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {2, 3, 4, 5}, {4, 5}, {2, 3});
 }
 
 TEST(broadcast_gpu_int64_t, bfyx_4x5_to_2x3x4x5_w_b_axes_0_1) {
-    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {2, 3, 4, 5}, {4, 5}, {0, 1});
+    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {2, 3, 4, 5}, {4, 5}, {2, 3});
 }
 
 
@@ -845,15 +639,15 @@ TEST(broadcast_gpu_int64_t, bfyx_4x5_to_2x3x4x5_w_b_axes_0_1) {
                            11.0, 12.0, 13.0, 14.0, 15.0, 11.0, 12.0, 13.0, 14.0, 15.0,
                            11.0, 12.0, 13.0, 14.0, 15.0, 11.0, 12.0, 13.0, 14.0, 15.0} */
 TEST(broadcast_gpu_float, bfyx_3x5_to_2x3x4x5_w_b_axes_0_2) {
-    start_broadcast_test<float>(format::bfyx, data_types::f32, {2, 3, 4, 5}, {3, 5}, {0, 2});
+    start_broadcast_test<float>(format::bfyx, data_types::f32, {2, 3, 4, 5}, {3, 5}, {1, 3});
 }
 
 TEST(broadcast_gpu_uint8_t, bfyx_3x5_to_2x3x4x5_w_b_axes_0_2) {
-    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {2, 3, 4, 5}, {3, 5}, {0, 2});
+    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {2, 3, 4, 5}, {3, 5}, {1, 3});
 }
 
 TEST(broadcast_gpu_int64_t, bfyx_3x5_to_2x3x4x5_w_b_axes_0_2) {
-    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {2, 3, 4, 5}, {3, 5}, {0, 2});
+    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {2, 3, 4, 5}, {3, 5}, {1, 3});
 }
 
 
@@ -870,15 +664,15 @@ TEST(broadcast_gpu_int64_t, bfyx_3x5_to_2x3x4x5_w_b_axes_0_2) {
                            9.0, 9.0, 9.0, 9.0, 9.0, 10.0, 10.0, 10.0, 10.0, 10.0,
                            11.0, 11.0, 11.0, 11.0, 11.0, 12.0, 12.0, 12.0, 12.0, 12.0 */
 TEST(broadcast_gpu_float, bfyx_3x4_to_2x3x4x5_w_b_axes_0_3) {
-    start_broadcast_test<float>(format::bfyx, data_types::f32, {2, 3, 4, 5}, {3, 4}, {0, 3});
+    start_broadcast_test<float>(format::bfyx, data_types::f32, {2, 3, 4, 5}, {3, 4}, {1, 2});
 }
 
 TEST(broadcast_gpu_uint8_t, bfyx_3x4_to_2x3x4x5_w_b_axes_0_3) {
-    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {2, 3, 4, 5}, {3, 4}, {0, 3});
+    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {2, 3, 4, 5}, {3, 4}, {1, 2});
 }
 
 TEST(broadcast_gpu_int64_t, bfyx_3x4_to_2x3x4x5_w_b_axes_0_3) {
-    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {2, 3, 4, 5}, {3, 4}, {0, 3});
+    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {2, 3, 4, 5}, {3, 4}, {1, 2});
 }
 
 
@@ -895,15 +689,15 @@ TEST(broadcast_gpu_int64_t, bfyx_3x4_to_2x3x4x5_w_b_axes_0_3) {
                            6.0, 7.0, 8.0, 9.0, 10.0, 6.0, 7.0, 8.0, 9.0, 10.0,
                            6.0, 7.0, 8.0, 9.0, 10.0, 6.0, 7.0, 8.0, 9.0, 10.0}; */
 TEST(broadcast_gpu_float, bfyx_2x5_to_2x3x4x5_w_b_axes_1_2) {
-    start_broadcast_test<float>(format::bfyx, data_types::f32, {2, 3, 4, 5}, {2, 5}, {1, 2});
+    start_broadcast_test<float>(format::bfyx, data_types::f32, {2, 3, 4, 5}, {2, 5}, {0, 3});
 }
 
 TEST(broadcast_gpu_uint8_t, bfyx_2x5_to_2x3x4x5_w_b_axes_1_2) {
-    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {2, 3, 4, 5}, {2, 5}, {1, 2});
+    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {2, 3, 4, 5}, {2, 5}, {0, 3});
 }
 
 TEST(broadcast_gpu_int64_t, bfyx_2x5_to_2x3x4x5_w_b_axes_1_2) {
-    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {2, 3, 4, 5}, {2, 5}, {1, 2});
+    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {2, 3, 4, 5}, {2, 5}, {0, 3});
 }
 
 
@@ -920,15 +714,15 @@ TEST(broadcast_gpu_int64_t, bfyx_2x5_to_2x3x4x5_w_b_axes_1_2) {
                            5.0, 5.0, 5.0, 5.0, 5.0, 6.0, 6.0, 6.0, 6.0, 6.0,
                            7.0, 7.0, 7.0, 7.0, 7.0, 8.0, 8.0, 8.0, 8.0, 8.0} */
 TEST(broadcast_gpu_float, bfyx_2x4_to_2x3x4x5_w_b_axes_1_3) {
-    start_broadcast_test<float>(format::bfyx, data_types::f32, {2, 3, 4, 5}, {2, 4}, {1, 3});
+    start_broadcast_test<float>(format::bfyx, data_types::f32, {2, 3, 4, 5}, {2, 4}, {0, 2});
 }
 
 TEST(broadcast_gpu_uint8_t, bfyx_2x4_to_2x3x4x5_w_b_axes_1_3) {
-    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {2, 3, 4, 5}, {2, 4}, {1, 3});
+    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {2, 3, 4, 5}, {2, 4}, {0, 2});
 }
 
 TEST(broadcast_gpu_int64_t, bfyx_2x4_to_2x3x4x5_w_b_axes_1_3) {
-    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {2, 3, 4, 5}, {2, 4}, {1, 3});
+    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {2, 3, 4, 5}, {2, 4}, {0, 2});
 }
 
 
@@ -945,15 +739,15 @@ TEST(broadcast_gpu_int64_t, bfyx_2x4_to_2x3x4x5_w_b_axes_1_3) {
                            6.0, 6.0, 6.0, 6.0, 6.0, 6.0, 6.0, 6.0, 6.0, 6.0,
                            6.0, 6.0, 6.0, 6.0, 6.0, 6.0, 6.0, 6.0, 6.0, 6.0}; */
 TEST(broadcast_gpu_float, bfyx_2x3_to_2x3x4x5_w_b_axes_2_3) {
-    start_broadcast_test<float>(format::bfyx, data_types::f32, {2, 3, 4, 5}, {2, 3}, {2, 3});
+    start_broadcast_test<float>(format::bfyx, data_types::f32, {2, 3, 4, 5}, {2, 3}, {0, 1});
 }
 
 TEST(broadcast_gpu_uint8_t, bfyx_2x3_to_2x3x4x5_w_b_axes_2_3) {
-    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {2, 3, 4, 5}, {2, 3}, {2, 3});
+    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {2, 3, 4, 5}, {2, 3}, {0, 1});
 }
 
 TEST(broadcast_gpu_int64_t, bfyx_2x3_to_2x3x4x5_w_b_axes_2_3) {
-    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {2, 3, 4, 5}, {2, 3}, {2, 3});
+    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {2, 3, 4, 5}, {2, 3}, {0, 1});
 }
 
 
@@ -970,15 +764,15 @@ TEST(broadcast_gpu_int64_t, bfyx_2x3_to_2x3x4x5_w_b_axes_2_3) {
                            1.0, 2.0, 3.0, 4.0, 5.0, 1.0, 2.0, 3.0, 4.0, 5.0,
                            1.0, 2.0, 3.0, 4.0, 5.0, 1.0, 2.0, 3.0, 4.0, 5.0} */
 TEST(broadcast_gpu_float, bfyx_5_to_2x3x4x5_w_b_axes_0_1_2) {
-    start_broadcast_test<float>(format::bfyx, data_types::f32, {2, 3, 4, 5}, {5}, {0, 1, 2});
+    start_broadcast_test<float>(format::bfyx, data_types::f32, {2, 3, 4, 5}, {5}, {3});
 }
 
 TEST(broadcast_gpu_uint8_t, bfyx_5_to_2x3x4x5_w_b_axes_0_1_2) {
-    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {2, 3, 4, 5}, {5}, {0, 1, 2});
+    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {2, 3, 4, 5}, {5}, {3});
 }
 
 TEST(broadcast_gpu_int64_t, bfyx_5_to_2x3x4x5_w_b_axes_0_1_2) {
-    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {2, 3, 4, 5}, {5}, {0, 1, 2});
+    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {2, 3, 4, 5}, {5}, {3});
 }
 
 
@@ -995,15 +789,15 @@ TEST(broadcast_gpu_int64_t, bfyx_5_to_2x3x4x5_w_b_axes_0_1_2) {
                            1.0, 1.0, 1.0, 1.0, 1.0, 2.0, 2.0, 2.0, 2.0, 2.0,
                            3.0, 3.0, 3.0, 3.0, 3.0, 4.0, 4.0, 4.0, 4.0, 4.0} */
 TEST(broadcast_gpu_float, bfyx_4_to_2x3x4x5_w_b_axes_0_1_3) {
-    start_broadcast_test<float>(format::bfyx, data_types::f32, {2, 3, 4, 5}, {4}, {0, 1, 3});
+    start_broadcast_test<float>(format::bfyx, data_types::f32, {2, 3, 4, 5}, {4}, {2});
 }
 
 TEST(broadcast_gpu_uint8_t, bfyx_4_to_2x3x4x5_w_b_axes_0_1_3) {
-    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {2, 3, 4, 5}, {4}, {0, 1, 3});
+    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {2, 3, 4, 5}, {4}, {2});
 }
 
 TEST(broadcast_gpu_int64_t, bfyx_4_to_2x3x4x5_w_b_axes_0_1_3) {
-    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {2, 3, 4, 5}, {4}, {0, 1, 3});
+    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {2, 3, 4, 5}, {4}, {2});
 }
 
 
@@ -1020,15 +814,15 @@ TEST(broadcast_gpu_int64_t, bfyx_4_to_2x3x4x5_w_b_axes_0_1_3) {
                            3.0, 3.0, 3.0, 3.0, 3.0, 3.0, 3.0, 3.0, 3.0, 3.0,
                            3.0, 3.0, 3.0, 3.0, 3.0, 3.0, 3.0, 3.0, 3.0, 3.0} */
 TEST(broadcast_gpu_float, bfyx_3_to_2x3x4x5_w_b_axes_0_2_3) {
-    start_broadcast_test<float>(format::bfyx, data_types::f32, {2, 3, 4, 5}, {3}, {0, 2, 3});
+    start_broadcast_test<float>(format::bfyx, data_types::f32, {2, 3, 4, 5}, {3}, {1});
 }
 
 TEST(broadcast_gpu_uint8_t, bfyx_3_to_2x3x4x5_w_b_axes_0_2_3) {
-    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {2, 3, 4, 5}, {3}, {0, 2, 3});
+    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {2, 3, 4, 5}, {3}, {1});
 }
 
 TEST(broadcast_gpu_int64_t, bfyx_3_to_2x3x4x5_w_b_axes_0_2_3) {
-    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {2, 3, 4, 5}, {3}, {0, 2, 3});
+    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {2, 3, 4, 5}, {3}, {1});
 }
 
 
@@ -1045,99 +839,15 @@ TEST(broadcast_gpu_int64_t, bfyx_3_to_2x3x4x5_w_b_axes_0_2_3) {
                            2.0, 2.0, 2.0, 2.0, 2.0, 2.0, 2.0, 2.0, 2.0, 2.0,
                            2.0, 2.0, 2.0, 2.0, 2.0, 2.0, 2.0, 2.0, 2.0, 2.0} */
 TEST(broadcast_gpu_float, bfyx_2_to_2x3x4x5_w_b_axes_1_2_3) {
-    start_broadcast_test<float>(format::bfyx, data_types::f32, {2, 3, 4, 5}, {2}, {1, 2, 3});
+    start_broadcast_test<float>(format::bfyx, data_types::f32, {2, 3, 4, 5}, {2}, {0});
 }
 
 TEST(broadcast_gpu_uint8_t, bfyx_2_to_2x3x4x5_w_b_axes_1_2_3) {
-    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {2, 3, 4, 5}, {2}, {1, 2, 3});
+    start_broadcast_test<uint8_t>(format::bfyx, data_types::u8, {2, 3, 4, 5}, {2}, {0});
 }
 
 TEST(broadcast_gpu_int64_t, bfyx_2_to_2x3x4x5_w_b_axes_1_2_3) {
-    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {2, 3, 4, 5}, {2}, {1, 2, 3});
-}
-
-TEST(broadcast_gpu, basic_error_wrong_b_axes_size) {
-    auto& engine = get_test_engine();
-    auto input = engine.allocate_memory({data_types::f32, format::bfyx, {1, 1, 1, 1}});
-
-    topology topology;
-    topology.add(input_layout("input", input->get_layout()));
-    topology.add(broadcast("output", input_info("input"), tensor{2, 3, 4, 5}, {0, 1, 2, 3, 4}));
-
-    std::string msg_to_find = "Incorrect parameters configuration: broadcast_axes size should be less or equal 4.";
-    EXPECT_ANY_THROW(check_exception_massage(engine, topology, msg_to_find));
-}
-
-TEST(broadcast_gpu, basic_error_wrong_b_axis_value) {
-    auto& engine = get_test_engine();
-    auto input = engine.allocate_memory({data_types::f32, format::bfyx, {1, 1, 1, 1}});
-
-    topology topology;
-    topology.add(input_layout("input", input->get_layout()));
-    topology.add(broadcast("output", input_info("input"), tensor{2, 3, 4, 5}, {0, 4}));
-
-    std::string msg_to_find = "Incorrect parameters configuration: broadcast_axes index should be within broadcast_sizes range.";
-    EXPECT_ANY_THROW(check_exception_massage(engine, topology, msg_to_find));
-}
-
-TEST(broadcast_gpu, basic_error_duplicate_b_axis_values) {
-    auto& engine = get_test_engine();
-    auto input = engine.allocate_memory({data_types::f32, format::bfyx, {1, 1, 1, 1}});
-
-    topology topology;
-    topology.add(input_layout("input", input->get_layout()));
-    topology.add(broadcast("output", input_info("input"), tensor{2, 3, 4, 5}, {0, 1, 1}));
-
-    std::string msg_to_find = "Incorrect parameters configuration: Duplicate axes numbers was found in broadcast_axes.";
-    EXPECT_ANY_THROW(check_exception_massage(engine, topology, msg_to_find));
-}
-
-TEST(broadcast_gpu, basic_error_wrong_input_dimension_0) {
-    auto& engine = get_test_engine();
-    auto input = engine.allocate_memory({data_types::f32, format::bfyx, {2, 3, 4, 5}});
-
-    topology topology;
-    topology.add(input_layout("input", input->get_layout()));
-    topology.add(broadcast("output", input_info("input"), tensor{2, 3, 4, 5}, {1}));
-
-    std::string msg_to_find = "Input size on dimension number 0(=2) is not equal to: (=1)";
-    EXPECT_ANY_THROW(check_exception_massage(engine, topology, msg_to_find));
-}
-
-TEST(broadcast_gpu, basic_error_not_dividable_2x3x4x5_to_3x3x4x5) {
-    auto& engine = get_test_engine();
-    auto input = engine.allocate_memory({data_types::f32, format::bfyx, {2, 3, 4, 5}});
-
-    topology topology;
-    topology.add(input_layout("input", input->get_layout()));
-    topology.add(broadcast("output", input_info("input"), tensor{3, 3, 4, 5}, {}));
-
-    std::string msg_to_find = "Invalid broadcast size: not dividable by input size";
-    EXPECT_ANY_THROW(check_exception_massage(engine, topology, msg_to_find));
-}
-
-TEST(broadcast_gpu, basic_error_not_dividable_3_to_2x3x4x5_w_b_axes_0x1x3) {
-    auto& engine = get_test_engine();
-    auto input = engine.allocate_memory({data_types::f32, format::bfyx, {1, 1, 3, 1}});
-
-    topology topology;
-    topology.add(input_layout("input", input->get_layout()));
-    topology.add(broadcast("output", input_info("input"), tensor{2, 3, 4, 5}, {0, 1, 3}));
-
-    std::string msg_to_find = "Invalid broadcast size: not dividable by input size";
-    EXPECT_ANY_THROW(check_exception_massage(engine, topology, msg_to_find));
-}
-
-TEST(broadcast_gpu, basic_error_not_dividable_4x5_to_3x4x5_w_b_axes_1) {
-    auto& engine = get_test_engine();
-    auto input = engine.allocate_memory({data_types::f32, format::bfyx, {1, 3, 5, 4}});
-
-    topology topology;
-    topology.add(input_layout("input", input->get_layout()));
-    topology.add(broadcast("output", input_info("input"), tensor{2, 3, 4, 5}, {1}));
-
-    std::string msg_to_find = "Invalid broadcast size: not dividable by input size";
-    EXPECT_ANY_THROW(check_exception_massage(engine, topology, msg_to_find));
+    start_broadcast_test<int64_t>(format::bfyx, data_types::i64, {2, 3, 4, 5}, {2}, {0});
 }
 
 /* Expected golden_data = { 1.0, 1.0, 1.0, 1.0, 1.0 } */
@@ -1157,15 +867,15 @@ TEST(broadcast_gpu_int64_t, bfzyx_1_to_5_w_b_axes_0) {
 /* Expected golden_data = { 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0,
                             1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0 } */
 TEST(broadcast_gpu_float, bfzyx_1_to_4x5_w_b_axes_0x1) {
-    start_broadcast_test_5d<float>(format::bfzyx, data_types::f32, { 4, 5 }, { 1 }, { 0, 1 });
+    start_broadcast_test_5d<float>(format::bfzyx, data_types::f32, { 4, 5 }, { 1 }, { 1 });
 }
 
 TEST(broadcast_gpu_uint8_t, bfzyx_1_to_4x5_w_b_axes_0x1) {
-    start_broadcast_test_5d<uint8_t>(format::bfzyx, data_types::u8, { 4, 5 }, { 1 }, { 0, 1 });
+    start_broadcast_test_5d<uint8_t>(format::bfzyx, data_types::u8, { 4, 5 }, { 1 }, { 1 });
 }
 
 TEST(broadcast_gpu_int64_t, bfzyx_1_to_4x5_w_b_axes_0x1) {
-    start_broadcast_test_5d<int64_t>(format::bfzyx, data_types::i64, { 4, 5 }, { 1 }, { 0, 1 });
+    start_broadcast_test_5d<int64_t>(format::bfzyx, data_types::i64, { 4, 5 }, { 1 }, { 1 });
 }
 
 
@@ -1194,1074 +904,792 @@ TEST(broadcast_gpu_int64_t, bfzyx_1_to_4x5_w_b_axes_0x1) {
                             1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0,
                             1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0 } */
 TEST(broadcast_gpu_float, bfyx_1_to_2x3x4x5x2_w_b_axes_0x1x2x3x4) {
-    start_broadcast_test_5d<float>(format::bfzyx, data_types::f32, { 2, 3, 4, 5, 2 }, { 1 }, { 0, 1, 2, 3, 4 });
+    start_broadcast_test_5d<float>(format::bfzyx, data_types::f32, { 2, 3, 4, 5, 2 }, { 1 }, { 2 });
 }
 
 TEST(broadcast_gpu_uint8_t, bfyx_1_to_2x3x4x5x2_w_b_axes_0x1x2x3x4) {
-    start_broadcast_test_5d<uint8_t>(format::bfzyx, data_types::u8, { 2, 3, 4, 5, 2 }, { 1 }, { 0, 1, 2, 3, 4 });
+    start_broadcast_test_5d<uint8_t>(format::bfzyx, data_types::u8, { 2, 3, 4, 5, 2 }, { 1 }, { 2 });
 }
 
 TEST(broadcast_gpu_int64_t, bfyx_1_to_2x3x4x5x2_w_b_axes_0x1x2x3x4) {
-    start_broadcast_test_5d<int64_t>(format::bfzyx, data_types::i64, { 2, 3, 4, 5, 2 }, { 1 }, { 0, 1, 2, 3, 4 });
+    start_broadcast_test_5d<int64_t>(format::bfzyx, data_types::i64, { 2, 3, 4, 5, 2 }, { 1 }, { 2 });
 }
 
 
 /* BLOCKED FORMAT TEST CASES */
 TEST(broadcast_gpu_float, b_fs_yx_fsv16_1x38x1x1_to_1x38x1x5_w_b_axes_0) {
-    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {1, 38, 1, 5}, {1, 38, 1, 1}, {0});
+    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {1, 38, 1, 5}, {1, 38, 1, 1}, {0, 1, 2, 3});
 }
 
 TEST(broadcast_gpu_float, bs_fs_yx_bsv32_fsv16_1x38x1x1_to_1x38x1x5_w_b_axes_0) {
-    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {1, 38, 1, 5}, {1, 38, 1, 1}, {0});
+    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {1, 38, 1, 5}, {1, 38, 1, 1}, {0, 1, 2, 3});
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_yx_fsv16_1x38x1x1_to_1x38x1x5_w_b_axes_0) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {1, 38, 1, 5}, {1, 38, 1, 1}, {0});
+    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {1, 38, 1, 5}, {1, 38, 1, 1}, {0, 1, 2, 3});
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_yx_fsv32_1x38x1x1_to_1x38x1x5_w_b_axes_0) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {1, 38, 1, 5}, {1, 38, 1, 1}, {0});
+    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {1, 38, 1, 5}, {1, 38, 1, 1}, {0, 1, 2, 3});
 }
 
 TEST(broadcast_gpu_int8_t, bs_fs_yx_bsv32_fsv32_1x38x1x1_to_1x38x1x5_w_b_axes_0) {
-    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {1, 38, 1, 5}, {1, 38, 1, 1}, {0});
+    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {1, 38, 1, 5}, {1, 38, 1, 1}, {0, 1, 2, 3});
 }
 
 TEST(broadcast_gpu_fp16, b_fs_yx_fsv16_1x38x1x1_to_1x38x1x5_w_b_axes_0) {
-    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {1, 38, 1, 5}, {1, 38, 1, 1}, {0});
+    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {1, 38, 1, 5}, {1, 38, 1, 1}, {0, 1, 2, 3});
 }
 
 TEST(broadcast_gpu_fp16, bs_fs_yx_bsv32_fsv16_1x38x1x1_to_1x38x1x5_w_b_axes_0) {
-    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {1, 38, 1, 5}, {1, 38, 1, 1}, {0});
+    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {1, 38, 1, 5}, {1, 38, 1, 1}, {0, 1, 2, 3});
 }
 
 
 TEST(broadcast_gpu_float, b_fs_yx_fsv16_1_to_4x5_w_b_axes_0x1) {
-    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {4, 5}, {1}, {0, 1});
+    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {4, 5}, {1}, {0});
 }
 
 TEST(broadcast_gpu_float, bs_fs_yx_bsv32_fsv16_1_to_4x5_w_b_axes_0x1) {
-    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {4, 5}, {1}, {0, 1});
+    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {4, 5}, {1}, {0});
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_yx_fsv16_1_to_4x5_w_b_axes_0x1) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {4, 5}, {1}, {0, 1});
+    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {4, 5}, {1}, {0});
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_yx_fsv32_1_to_4x5_w_b_axes_0x1) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {4, 5}, {1}, {0, 1});
+    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {4, 5}, {1}, {0});
 }
 
 TEST(broadcast_gpu_int8_t, bs_fs_yx_bsv32_fsv32_1_to_4x5_w_b_axes_0x1) {
-    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {4, 5}, {1}, {0, 1});
+    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {4, 5}, {1}, {0});
 }
 
 TEST(broadcast_gpu_fp16, b_fs_yx_fsv16_1_to_4x5_w_b_axes_0x1) {
-    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {4, 5}, {1}, {0, 1});
+    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {4, 5}, {1}, {0});
 }
 
 TEST(broadcast_gpu_fp16, bs_fs_yx_bsv32_fsv16_1_to_4x5_w_b_axes_0x1) {
-    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {4, 5}, {1}, {0, 1});
+    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {4, 5}, {1}, {0});
 }
 
 
 TEST(broadcast_gpu_float, b_fs_yx_fsv16_1_to_3x4x5_w_b_axes_0x1x2) {
-    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {3, 4, 5}, {1}, {0, 1, 2});
+    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {3, 4, 5}, {1}, {2});
 }
 
 TEST(broadcast_gpu_float, bs_fs_yx_bsv32_fsv16_1_to_3x4x5_w_b_axes_0x1x2) {
-    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {3, 4, 5}, {1}, {0, 1, 2});
+    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {3, 4, 5}, {1}, {2});
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_yx_fsv16_1_to_3x4x5_w_b_axes_0x1x2) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {3, 4, 5}, {1}, {0, 1, 2});
+    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {3, 4, 5}, {1}, {2});
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_yx_fsv32_1_to_3x4x5_w_b_axes_0x1x2) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {3, 4, 5}, {1}, {0, 1, 2});
+    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {3, 4, 5}, {1}, {2});
 }
 
 TEST(broadcast_gpu_int8_t, bs_fs_yx_bsv32_fsv32_1_to_3x4x5_w_b_axes_0x1x2) {
-    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {3, 4, 5}, {1}, {0, 1, 2});
+    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {3, 4, 5}, {1}, {2});
 }
 
 TEST(broadcast_gpu_fp16, b_fs_yx_fsv16_1_to_3x4x5_w_b_axes_0x1x2) {
-    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {3, 4, 5}, {1}, {0, 1, 2});
+    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {3, 4, 5}, {1}, {2});
 }
 
 TEST(broadcast_gpu_fp16, bs_fs_yx_bsv32_fsv16_1_to_3x4x5_w_b_axes_0x1x2) {
-    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {3, 4, 5}, {1}, {0, 1, 2});
+    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {3, 4, 5}, {1}, {2});
 }
 
 
 TEST(broadcast_gpu_float, b_fs_yx_fsv16_1_to_2x3x4x5_w_b_axes_0x1x2x3) {
-    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {2, 3, 4, 5}, {1}, {0, 1, 2, 3});
+    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {2, 3, 4, 5}, {1}, {3});
 }
 
 TEST(broadcast_gpu_float, bs_fs_yx_bsv32_fsv16_1_to_2x3x4x5_w_b_axes_0x1x2x3) {
-    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {2, 3, 4, 5}, {1}, {0, 1, 2, 3});
+    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {2, 3, 4, 5}, {1}, {3});
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_yx_fsv16_1_to_2x3x4x5_w_b_axes_0x1x2x3) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {2, 3, 4, 5}, {1}, {0, 1, 2, 3});
+    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {2, 3, 4, 5}, {1}, {3});
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_yx_fsv32_1_to_2x3x4x5_w_b_axes_0x1x2x3) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {2, 3, 4, 5}, {1}, {0, 1, 2, 3});
+    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {2, 3, 4, 5}, {1}, {3});
 }
 
 TEST(broadcast_gpu_int8_t, bs_fs_yx_bsv32_fsv16_1_to_2x3x4x5_w_b_axes_0x1x2x3) {
-    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv16, data_types::i8, {2, 3, 4, 5}, {1}, {0, 1, 2, 3});
+    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv16, data_types::i8, {2, 3, 4, 5}, {1}, {3});
 }
 
 TEST(broadcast_gpu_fp16, b_fs_yx_fsv16_1_to_2x3x4x5_w_b_axes_0x1x2x3) {
-    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {2, 3, 4, 5}, {1}, {0, 1, 2, 3});
+    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {2, 3, 4, 5}, {1}, {3});
 }
 
 TEST(broadcast_gpu_fp16, bs_fs_yx_bsv32_fsv16_1_to_2x3x4x5_w_b_axes_0x1x2x3) {
-    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {2, 3, 4, 5}, {1}, {0, 1, 2, 3});
+    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {2, 3, 4, 5}, {1}, {3});
 }
 
 
 TEST(broadcast_gpu_float, b_fs_yx_fsv16_42x36x1x1_to_42x36x1x5_w_o_b_axes) {
-    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {42, 36, 1, 5}, {42, 36, 1, 1}, {});
+    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {42, 36, 1, 5}, {42, 36, 1, 1}, {0, 1, 2, 3});
 }
 
 TEST(broadcast_gpu_float, bs_fs_yx_bsv32_fsv16_42x36x1x1_to_42x36x1x5_w_o_b_axes) {
-    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {42, 36, 1, 5}, {42, 36, 1, 1}, {});
+    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {42, 36, 1, 5}, {42, 36, 1, 1}, {0, 1, 2, 3});
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_yx_fsv16_42x36x1x1_to_42x36x1x5_w_o_b_axes) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {42, 36, 1, 5}, {42, 36, 1, 1}, {});
+    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {42, 36, 1, 5}, {42, 36, 1, 1}, {0, 1, 2, 3});
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_yx_fsv32_42x36x1x1_to_42x36x1x5_w_o_b_axes) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {42, 36, 1, 5}, {42, 36, 1, 1}, {});
+    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {42, 36, 1, 5}, {42, 36, 1, 1}, {0, 1, 2, 3});
 }
 
 TEST(broadcast_gpu_int8_t, bs_fs_yx_bsv32_fsv32_42x36x1x1_to_42x36x1x5_w_o_b_axes) {
-    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {42, 36, 1, 5}, {42, 36, 1, 1}, {});
+    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {42, 36, 1, 5}, {42, 36, 1, 1}, {0, 1, 2, 3});
 }
 
 TEST(broadcast_gpu_fp16, b_fs_yx_fsv16_42x36x1x1_to_42x36x1x5_w_o_b_axes) {
-    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {42, 36, 1, 5}, {42, 36, 1, 1}, {});
+    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {42, 36, 1, 5}, {42, 36, 1, 1}, {0, 1, 2, 3});
 }
 
 TEST(broadcast_gpu_fp16, bs_fs_yx_bsv32_fsv16_42x36x1x1_to_42x36x1x5_w_o_b_axes) {
-    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {42, 36, 1, 5}, {42, 36, 1, 1}, {});
-}
-
-
-TEST(broadcast_gpu_float, b_fs_yx_fsv16_35x32x1x3_to_140x128x1x12_w_o_b_axes) {
-    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {140, 128, 1, 12}, {35, 32, 1, 3}, {});
-}
-
-TEST(broadcast_gpu_float, bs_fs_yx_bsv32_fsv16_35x32x1x3_to_140x128x1x12_w_o_b_axes) {
-    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {140, 128, 1, 12}, {35, 32, 1, 3}, {});
-}
-
-TEST(broadcast_gpu_int8_t, b_fs_yx_fsv16_35x32x1x3_to_140x128x1x12_w_o_b_axes) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {140, 128, 1, 12}, {35, 32, 1, 3}, {});
-}
-
-TEST(broadcast_gpu_int8_t, b_fs_yx_fsv32_35x32x1x3_to_140x128x1x12_w_o_b_axes) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {140, 128, 1, 12}, {35, 32, 1, 3}, {});
-}
-
-TEST(broadcast_gpu_int8_t, bs_fs_yx_bsv32_fsv32_35x32x1x3_to_140x128x1x12_w_o_b_axes) {
-    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {140, 128, 1, 12}, {35, 32, 1, 3}, {});
-}
-
-TEST(broadcast_gpu_fp16, b_fs_yx_fsv16_35x32x1x3_to_140x128x1x12_w_o_b_axes) {
-    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {140, 128, 1, 12}, {35, 32, 1, 3}, {});
-}
-
-TEST(broadcast_gpu_fp16, bs_fs_yx_bsv32_fsv16_35x32x1x3_to_140x128x1x12_w_o_b_axes) {
-    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {140, 128, 1, 12}, {35, 32, 1, 3}, {});
-}
-
-
-TEST(broadcast_gpu_float, b_fs_yx_fsv16_42x64x1x1_to_84x128x4x5_w_o_b_axes) {
-    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {84, 128, 4, 5}, {42, 64, 1, 1}, {});
-}
-
-TEST(broadcast_gpu_float, bs_fs_yx_bsv32_fsv16_42x64x1x1_to_84x128x4x5_w_o_b_axes) {
-    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {84, 128, 4, 5}, {42, 64, 1, 1}, {});
-}
-
-TEST(broadcast_gpu_int8_t, b_fs_yx_fsv16_42x64x1x1_to_84x128x4x5_w_o_b_axes) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {84, 128, 4, 5}, {42, 64, 1, 1}, {});
-}
-
-TEST(broadcast_gpu_int8_t, b_fs_yx_fsv32_42x64x1x1_to_84x128x4x5_w_o_b_axes) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {84, 128, 4, 5}, {42, 64, 1, 1}, {});
-}
-
-TEST(broadcast_gpu_int8_t, bs_fs_yx_bsv32_fsv32_42x64x1x1_to_84x128x4x5_w_o_b_axes) {
-    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {84, 128, 4, 5}, {42, 64, 1, 1}, {});
-}
-
-TEST(broadcast_gpu_fp16, b_fs_yx_fsv16_42x64x1x1_to_84x128x4x5_w_o_b_axes) {
-    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {84, 128, 4, 5}, {42, 64, 1, 1}, {});
-}
-
-TEST(broadcast_gpu_fp16, bs_fs_yx_bsv32_fsv16_42x64x1x1_to_84x128x4x5_w_o_b_axes) {
-    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {84, 128, 4, 5}, {42, 64, 1, 1}, {});
-}
-
-
-TEST(broadcast_gpu_float, b_fs_yx_fsv16_156x78x2x3_to_156x156x8x6_w_o_b_axes) {
-    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {156, 156, 8, 6}, {156, 78, 2, 3}, {});
-}
-
-TEST(broadcast_gpu_float, bs_fs_yx_bsv32_fsv16_156x78x2x3_to_156x156x8x6_w_o_b_axes) {
-    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {156, 156, 8, 6}, {156, 78, 2, 3}, {});
-}
-
-TEST(broadcast_gpu_int8_t, b_fs_yx_fsv16_156x78x2x3_to_156x156x8x6_w_o_b_axes) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {156, 156, 8, 6}, {156, 78, 2, 3}, {});
-}
-
-TEST(broadcast_gpu_int8_t, b_fs_yx_fsv32_156x78x2x3_to_156x156x8x6_w_o_b_axes) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {156, 156, 8, 6}, {156, 78, 2, 3}, {});
-}
-
-TEST(broadcast_gpu_int8_t, bs_fs_yx_bsv32_fsv32_156x78x2x3_to_156x156x8x6_w_o_b_axes) {
-    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {156, 156, 8, 6}, {156, 78, 2, 3}, {});
-}
-
-TEST(broadcast_gpu_fp16, b_fs_yx_fsv16_156x78x2x3_to_156x156x8x6_w_o_b_axes) {
-    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {156, 156, 8, 6}, {156, 78, 2, 3}, {});
-}
-
-TEST(broadcast_gpu_fp16, bs_fs_yx_bsv32_fsv16_156x78x2x3_to_156x156x8x6_w_o_b_axes) {
-    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {156, 156, 8, 6}, {156, 78, 2, 3}, {});
-}
-
-
-TEST(broadcast_gpu_float, b_fs_yx_fsv16_42x2x3x4_to_126x6x6x4_w_o_b_axes) {
-    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {126, 6, 6, 4}, {42, 2, 3, 4}, {});
-}
-
-TEST(broadcast_gpu_float, bs_fs_yx_bsv32_fsv16_42x2x3x4_to_126x6x6x4_w_o_b_axes) {
-    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {126, 6, 6, 4}, {42, 2, 3, 4}, {});
-}
-
-TEST(broadcast_gpu_int8_t, b_fs_yx_fsv16_42x2x3x4_to_126x6x6x4_w_o_b_axes) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {126, 6, 6, 4}, {42, 2, 3, 4}, {});
-}
-
-TEST(broadcast_gpu_int8_t, b_fs_yx_fsv32_42x2x3x4_to_126x6x6x4_w_o_b_axes) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {126, 6, 6, 4}, {42, 2, 3, 4}, {});
-}
-
-TEST(broadcast_gpu_int8_t, bs_fs_yx_bsv32_fsv32_42x2x3x4_to_126x6x6x4_w_o_b_axes) {
-    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {126, 6, 6, 4}, {42, 2, 3, 4}, {});
-}
-
-TEST(broadcast_gpu_fp16, b_fs_yx_fsv16_42x2x3x4_to_126x6x6x4_w_o_b_axes) {
-    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {126, 6, 6, 4}, {42, 2, 3, 4}, {});
-}
-
-TEST(broadcast_gpu_fp16, bs_fs_yx_bsv32_fsv16_42x2x3x4_to_126x6x6x4_w_o_b_axes) {
-    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {126, 6, 6, 4}, {42, 2, 3, 4}, {});
-}
-
-
-TEST(broadcast_gpu_float, b_fs_yx_fsv16_256x91x4x5_to_256x273x8x5_w_o_b_axes) {
-    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {256, 273, 8, 5}, {256, 91, 4, 5}, {});
-}
-
-TEST(broadcast_gpu_float, bs_fs_yx_bsv32_fsv16_256x91x4x5_to_256x273x8x5_w_o_b_axes) {
-    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {256, 273, 8, 5}, {256, 91, 4, 5}, {});
-}
-
-TEST(broadcast_gpu_int8_t, b_fs_yx_fsv16_256x91x4x5_to_256x273x8x5_w_o_b_axes) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {256, 273, 8, 5}, {256, 91, 4, 5}, {});
-}
-
-TEST(broadcast_gpu_int8_t, b_fs_yx_fsv32_256x91x4x5_to_256x273x8x5_w_o_b_axes) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {256, 273, 8, 5}, {256, 91, 4, 5}, {});
-}
-
-TEST(broadcast_gpu_int8_t, bs_fs_yx_bsv32_fsv32_256x91x4x5_to_256x273x8x5_w_o_b_axes) {
-    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {256, 273, 8, 5}, {256, 91, 4, 5}, {});
-}
-
-TEST(broadcast_gpu_fp16, b_fs_yx_fsv16_256x91x4x5_to_256x273x8x5_w_o_b_axes) {
-    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {256, 273, 8, 5}, {256, 91, 4, 5}, {});
-}
-
-TEST(broadcast_gpu_fp16, bs_fs_yx_bsv32_fsv16_256x91x4x5_to_256x273x8x5_w_o_b_axes) {
-    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {256, 273, 8, 5}, {256, 91, 4, 5}, {});
+    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {42, 36, 1, 5}, {42, 36, 1, 1}, {0, 1, 2, 3});
 }
 
-
 TEST(broadcast_gpu_float, b_fs_yx_fsv16_1x45x1x3_to_1x45x2x3_w_b_axes_0) {
-    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {1, 45, 2, 3}, {1, 45, 1, 3}, {0});
+    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {1, 45, 2, 3}, {1, 45, 1, 3}, {0, 1, 2, 3});
 }
 
 TEST(broadcast_gpu_float, bs_fs_yx_bsv32_fsv166_1x45x1x3_to_1x45x2x3_w_b_axes_0) {
-    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {1, 45, 2, 3}, {1, 45, 1, 3}, {0});
+    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {1, 45, 2, 3}, {1, 45, 1, 3}, {0, 1, 2, 3});
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_yx_fsv166_1x45x1x3_to_1x45x2x3_w_b_axes_0) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {1, 45, 2, 3}, {1, 45, 1, 3}, {0});
+    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {1, 45, 2, 3}, {1, 45, 1, 3}, {0, 1, 2, 3});
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_yx_fsv326_1x45x1x3_to_1x45x2x3_w_b_axes_0) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {1, 45, 2, 3}, {1, 45, 1, 3}, {0});
+    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {1, 45, 2, 3}, {1, 45, 1, 3}, {0, 1, 2, 3});
 }
 
 TEST(broadcast_gpu_int8_t, bs_fs_yx_bsv32_fsv326_1x45x1x3_to_1x45x2x3_w_b_axes_0) {
-    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {1, 45, 2, 3}, {1, 45, 1, 3}, {0});
+    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {1, 45, 2, 3}, {1, 45, 1, 3}, {0, 1, 2, 3});
 }
 
 TEST(broadcast_gpu_fp16, b_fs_yx_fsv166_1x45x1x3_to_1x45x2x3_w_b_axes_0) {
-    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {1, 45, 2, 3}, {1, 45, 1, 3}, {0});
+    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {1, 45, 2, 3}, {1, 45, 1, 3}, {0, 1, 2, 3});
 }
 
 TEST(broadcast_gpu_fp16, bs_fs_yx_bsv32_fsv166_1x45x1x3_to_1x45x2x3_w_b_axes_0) {
     start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {1, 45, 2, 3}, {1, 45, 1, 3}, {0});
 }
 
-
-TEST(broadcast_gpu_float, b_fs_yx_fsv16_1x62x1x3_to_1x62x2x6_w_b_axes_0) {
-    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {1, 62, 2, 6}, {1, 62, 1, 3}, {0});
-}
-
-TEST(broadcast_gpu_float, bs_fs_yx_bsv32_fsv16_1x62x1x3_to_1x62x2x6_w_b_axes_0) {
-    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {1, 62, 2, 6}, {1, 62, 1, 3}, {0});
-}
-
-TEST(broadcast_gpu_int8_t, b_fs_yx_fsv16_1x62x1x3_to_1x62x2x6_w_b_axes_0) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {1, 62, 2, 6}, {1, 62, 1, 3}, {0});
-}
-
-TEST(broadcast_gpu_int8_t, b_fs_yx_fsv32_1x62x1x3_to_1x62x2x6_w_b_axes_0) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {1, 62, 2, 6}, {1, 62, 1, 3}, {0});
-}
-
-TEST(broadcast_gpu_int8_t, bs_fs_yx_bsv32_fsv32_1x62x1x3_to_1x62x2x6_w_b_axes_0) {
-    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {1, 62, 2, 6}, {1, 62, 1, 3}, {0});
-}
-
-TEST(broadcast_gpu_fp16, b_fs_yx_fsv16_1x62x1x3_to_1x62x2x6_w_b_axes_0) {
-    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {1, 62, 2, 6}, {1, 62, 1, 3}, {0});
-}
-
-TEST(broadcast_gpu_fp16, bs_fs_yx_bsv32_fsv16_1x62x1x3_to_1x62x2x6_w_b_axes_0) {
-    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {1, 62, 2, 6}, {1, 62, 1, 3}, {0});
-}
-
-
 TEST(broadcast_gpu_float, b_fs_yx_fsv16_2_to_2x3_w_b_axes_1) {
-    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {2, 3}, {2}, {1});
+    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {2, 3}, {2}, {0});
 }
 
 TEST(broadcast_gpu_float, bs_fs_yx_bsv32_fsv16_2_to_2x3_w_b_axes_1) {
-    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {2, 3}, {2}, {1});
+    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {2, 3}, {2}, {0});
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_yx_fsv16_2_to_2x3_w_b_axes_1) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {2, 3}, {2}, {1});
+    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {2, 3}, {2}, {0});
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_yx_fsv32_2_to_2x3_w_b_axes_1) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {2, 3}, {2}, {1});
+    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {2, 3}, {2}, {0});
 }
 
 TEST(broadcast_gpu_int8_t, bs_fs_yx_bsv32_fsv32_2_to_2x3_w_b_axes_1) {
-    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {2, 3}, {2}, {1});
+    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {2, 3}, {2}, {0});
 }
 
 TEST(broadcast_gpu_fp16, b_fs_yx_fsv16_2_to_2x3_w_b_axes_1) {
-    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {2, 3}, {2}, {1});
+    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {2, 3}, {2}, {0});
 }
 
 TEST(broadcast_gpu_fp16, bs_fs_yx_bsv32_fsv16_2_to_2x3_w_b_axes_1) {
-    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {2, 3}, {2}, {1});
-}
-
-
-TEST(broadcast_gpu_float, b_fs_yx_fsv16_2_to_6x3_w_b_axes_1) {
-    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {6, 3}, {2}, {1});
-}
-
-TEST(broadcast_gpu_float, bs_fs_yx_bsv32_fsv16_2_to_6x3_w_b_axes_1) {
-    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {6, 3}, {2}, {1});
-}
-
-TEST(broadcast_gpu_int8_t, b_fs_yx_fsv16_2_to_6x3_w_b_axes_1) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {6, 3}, {2}, {1});
-}
-
-TEST(broadcast_gpu_int8_t, b_fs_yx_fsv32_2_to_6x3_w_b_axes_1) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {6, 3}, {2}, {1});
-}
-
-TEST(broadcast_gpu_int8_t, bs_fs_yx_bsv32_fsv32_2_to_6x3_w_b_axes_1) {
-    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {6, 3}, {2}, {1});
-}
-
-TEST(broadcast_gpu_fp16, b_fs_yx_fsv16_2_to_6x3_w_b_axes_1) {
-    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {6, 3}, {2}, {1});
-}
-
-TEST(broadcast_gpu_fp16, bs_fs_yx_bsv32_fsv16_2_to_6x3_w_b_axes_1) {
-    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {6, 3}, {2}, {1});
-}
-
-
-TEST(broadcast_gpu_float, b_fs_yx_fsv16_1x76x3x4_to_1x152x3x4_w_b_axes_0) {
-    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {1, 152, 3, 4}, {1, 76, 3, 4}, {0});
-}
-
-TEST(broadcast_gpu_float, bs_fs_yx_bsv32_fsv16_1x76x3x4_to_1x152x3x4_w_b_axes_0) {
-    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {1, 152, 3, 4}, {1, 76, 3, 4}, {0});
+    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {2, 3}, {2}, {0});
 }
 
-TEST(broadcast_gpu_int8_t, b_fs_yx_fsv16_1x76x3x4_to_1x152x3x4_w_b_axes_0) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {1, 152, 3, 4}, {1, 76, 3, 4}, {0});
-}
-
-TEST(broadcast_gpu_int8_t, b_fs_yx_fsv32_1x76x3x4_to_1x152x3x4_w_b_axes_0) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {1, 152, 3, 4}, {1, 76, 3, 4}, {0});
-}
-
-TEST(broadcast_gpu_int8_t, bs_fs_yx_bsv32_fsv32_1x76x3x4_to_1x152x3x4_w_b_axes_0) {
-    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {1, 152, 3, 4}, {1, 76, 3, 4}, {0});
-}
-
-TEST(broadcast_gpu_fp16, b_fs_yx_fsv16_1x76x3x4_to_1x152x3x4_w_b_axes_0) {
-    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {1, 152, 3, 4}, {1, 76, 3, 4}, {0});
-}
-
-TEST(broadcast_gpu_fp16, bs_fs_yx_bsv32_fsv16_1x76x3x4_to_1x152x3x4_w_b_axes_0) {
-    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {1, 152, 3, 4}, {1, 76, 3, 4}, {0});
-}
-
-
 TEST(broadcast_gpu_float, b_fs_yx_fsv16_2x4_to_2x3x4_w_b_axes_1) {
-    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {2, 3, 4}, {2, 4}, {1});
+    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {2, 3, 4}, {2, 4}, {0, 2});
 }
 
 TEST(broadcast_gpu_float, bs_fs_yx_bsv32_fsv16_2x4_to_2x3x4_w_b_axes_1) {
-    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {2, 3, 4}, {2, 4}, {1});
+    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {2, 3, 4}, {2, 4}, {0, 2});
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_yx_fsv16_2x4_to_2x3x4_w_b_axes_1) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {2, 3, 4}, {2, 4}, {1});
+    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {2, 3, 4}, {2, 4}, {0, 2});
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_yx_fsv32_2x4_to_2x3x4_w_b_axes_1) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {2, 3, 4}, {2, 4}, {1});
+    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {2, 3, 4}, {2, 4}, {0, 2});
 }
 
 TEST(broadcast_gpu_int8_t, bs_fs_yx_bsv32_fsv32_2x4_to_2x3x4_w_b_axes_1) {
-    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {2, 3, 4}, {2, 4}, {1});
+    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {2, 3, 4}, {2, 4}, {0, 2});
 }
 
 TEST(broadcast_gpu_fp16, b_fs_yx_fsv16_2x4_to_2x3x4_w_b_axes_1) {
-    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {2, 3, 4}, {2, 4}, {1});
+    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {2, 3, 4}, {2, 4}, {0, 2});
 }
 
 TEST(broadcast_gpu_fp16, bs_fs_yx_bsv32_fsv16_2x4_to_2x3x4_w_b_axes_1) {
-    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {2, 3, 4}, {2, 4}, {1});
+    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {2, 3, 4}, {2, 4}, {0, 2});
 }
 
 
 TEST(broadcast_gpu_float, b_fs_yx_fsv16_2x3_to_2x3x4_w_b_axes_2) {
-    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {2, 3, 4}, {2, 3}, {2});
+    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {2, 3, 4}, {2, 3}, {0, 1});
 }
 
 TEST(broadcast_gpu_float, bs_fs_yx_bsv32_fsv16_2x3_to_2x3x4_w_b_axes_2) {
-    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {2, 3, 4}, {2, 3}, {2});
+    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {2, 3, 4}, {2, 3}, {0, 1});
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_yx_fsv16_2x3_to_2x3x4_w_b_axes_2) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {2, 3, 4}, {2, 3}, {2});
+    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {2, 3, 4}, {2, 3}, {0, 1});
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_yx_fsv32_2x3_to_2x3x4_w_b_axes_2) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {2, 3, 4}, {2, 3}, {2});
+    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {2, 3, 4}, {2, 3}, {0, 1});
 }
 
 TEST(broadcast_gpu_int8_t, bs_fs_yx_bsv32_fsv32_2x3_to_2x3x4_w_b_axes_2) {
-    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {2, 3, 4}, {2, 3}, {2});
+    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {2, 3, 4}, {2, 3}, {0, 1});
 }
 
 TEST(broadcast_gpu_fp16, b_fs_yx_fsv16_2x3_to_2x3x4_w_b_axes_2) {
-    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {2, 3, 4}, {2, 3}, {2});
+    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {2, 3, 4}, {2, 3}, {0, 1});
 }
 
 TEST(broadcast_gpu_fp16, bs_fs_yx_bsv32_fsv16_2x3_to_2x3x4_w_b_axes_2) {
-    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {2, 3, 4}, {2, 3}, {2});
+    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {2, 3, 4}, {2, 3}, {0, 1});
 }
 
 
 TEST(broadcast_gpu_float, b_fs_yx_fsv16_4_to_2x3x4_w_b_axes_0_1) {
-    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {2, 3, 4}, {4}, {0, 1});
+    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {2, 3, 4}, {4}, {2});
 }
 
 TEST(broadcast_gpu_float, bs_fs_yx_bsv32_fsv16_4_to_2x3x4_w_b_axes_0_1) {
-    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {2, 3, 4}, {4}, {0, 1});
+    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {2, 3, 4}, {4}, {2});
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_yx_fsv16_4_to_2x3x4_w_b_axes_0_1) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {2, 3, 4}, {4}, {0, 1});
+    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {2, 3, 4}, {4}, {2});
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_yx_fsv32_4_to_2x3x4_w_b_axes_0_1) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {2, 3, 4}, {4}, {0, 1});
+    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {2, 3, 4}, {4}, {2});
 }
 
 TEST(broadcast_gpu_int8_t, bs_fs_yx_bsv32_fsv32_4_to_2x3x4_w_b_axes_0_1) {
-    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {2, 3, 4}, {4}, {0, 1});
+    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {2, 3, 4}, {4}, {2});
 }
 
 TEST(broadcast_gpu_fp16, b_fs_yx_fsv16_4_to_2x3x4_w_b_axes_0_1) {
-    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {2, 3, 4}, {4}, {0, 1});
+    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {2, 3, 4}, {4}, {2});
 }
 
 TEST(broadcast_gpu_fp16, bs_fs_yx_bsv32_fsv16_4_to_2x3x4_w_b_axes_0_1) {
-    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {2, 3, 4}, {4}, {0, 1});
+    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {2, 3, 4}, {4}, {2});
 }
 
 
 TEST(broadcast_gpu_float, b_fs_yx_fsv16_3_to_2x3x4_w_b_axes_0_2) {
-    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {2, 3, 4}, {3}, {0, 2});
+    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {2, 3, 4}, {3}, {1});
 }
 
 TEST(broadcast_gpu_float, bs_fs_yx_bsv32_fsv16_3_to_2x3x4_w_b_axes_0_2) {
-    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {2, 3, 4}, {3}, {0, 2});
+    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {2, 3, 4}, {3}, {1});
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_yx_fsv16_3_to_2x3x4_w_b_axes_0_2) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {2, 3, 4}, {3}, {0, 2});
+    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {2, 3, 4}, {3}, {1});
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_yx_fsv32_3_to_2x3x4_w_b_axes_0_2) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {2, 3, 4}, {3}, {0, 2});
+    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {2, 3, 4}, {3}, {1});
 }
 
 TEST(broadcast_gpu_int8_t, bs_fs_yx_bsv32_fsv32_3_to_2x3x4_w_b_axes_0_2) {
-    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {2, 3, 4}, {3}, {0, 2});
+    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {2, 3, 4}, {3}, {1});
 }
 
 TEST(broadcast_gpu_fp16, b_fs_yx_fsv16_3_to_2x3x4_w_b_axes_0_2) {
-    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {2, 3, 4}, {3}, {0, 2});
+    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {2, 3, 4}, {3}, {1});
 }
 
 TEST(broadcast_gpu_fp16, bs_fs_yx_bsv32_fsv16_3_to_2x3x4_w_b_axes_0_2) {
-    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {2, 3, 4}, {3}, {0, 2});
+    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {2, 3, 4}, {3}, {1});
 }
 
 
 TEST(broadcast_gpu_float, b_fs_yx_fsv16_2_to_2x3x4_w_b_axes_1_2) {
-    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {2, 3, 4}, {2}, {1, 2});
+    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {2, 3, 4}, {2}, {0});
 }
 
 TEST(broadcast_gpu_float, bs_fs_yx_bsv32_fsv16_2_to_2x3x4_w_b_axes_1_2) {
-    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {2, 3, 4}, {2}, {1, 2});
+    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {2, 3, 4}, {2}, {0});
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_yx_fsv16_2_to_2x3x4_w_b_axes_1_2) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {2, 3, 4}, {2}, {1, 2});
+    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {2, 3, 4}, {2}, {0});
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_yx_fsv32_2_to_2x3x4_w_b_axes_1_2) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {2, 3, 4}, {2}, {1, 2});
+    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {2, 3, 4}, {2}, {0});
 }
 
 TEST(broadcast_gpu_int8_t, bs_fs_yx_bsv32_fsv16_2_to_2x3x4_w_b_axes_1_2) {
-    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {2, 3, 4}, {2}, {1, 2});
+    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {2, 3, 4}, {2}, {0});
 }
 
 TEST(broadcast_gpu_fp16, b_fs_yx_fsv16_2_to_2x3x4_w_b_axes_1_2) {
-    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {2, 3, 4}, {2}, {1, 2});
+    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {2, 3, 4}, {2}, {0});
 }
 
 TEST(broadcast_gpu_fp16, bs_fs_yx_bsv32_fsv16_2_to_2x3x4_w_b_axes_1_2) {
-    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {2, 3, 4}, {2}, {1, 2});
-}
-
-
-TEST(broadcast_gpu_float, b_fs_yx_fsv16_1x128x4x5_to_2x256x4x5_w_b_axes_0) {
-    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {2, 256, 4, 5}, {1, 128, 4, 5}, {0});
-}
-
-TEST(broadcast_gpu_float, bs_fs_yx_bsv32_fsv16_1x128x4x5_to_2x256x4x5_w_b_axes_0) {
-    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {2, 256, 4, 5}, {1, 128, 4, 5}, {0});
-}
-
-TEST(broadcast_gpu_int8_t, b_fs_yx_fsv16_1x128x4x5_to_2x256x4x5_w_b_axes_0) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {2, 256, 4, 5}, {1, 128, 4, 5}, {0});
-}
-
-TEST(broadcast_gpu_int8_t, b_fs_yx_fsv32_1x128x4x5_to_2x256x4x5_w_b_axes_0) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {2, 256, 4, 5}, {1, 128, 4, 5}, {0});
-}
-
-TEST(broadcast_gpu_int8_t, bs_fs_yx_bsv32_fsv32_1x128x4x5_to_2x256x4x5_w_b_axes_0) {
-    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {2, 256, 4, 5}, {1, 128, 4, 5}, {0});
-}
-
-TEST(broadcast_gpu_fp16, b_fs_yx_fsv16_1x128x4x5_to_2x256x4x5_w_b_axes_0) {
-    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {2, 256, 4, 5}, {1, 128, 4, 5}, {0});
-}
-
-TEST(broadcast_gpu_fp16, bs_fs_yx_bsv32_fsv16_1x128x4x5_to_2x256x4x5_w_b_axes_0) {
-    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {2, 256, 4, 5}, {1, 128, 4, 5}, {0});
+    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {2, 3, 4}, {2}, {0});
 }
 
 
 TEST(broadcast_gpu_float, b_fs_yx_fsv16_2x4x5_to_2x3x4x5_w_b_axes_1) {
-    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {2, 3, 4, 5}, {2, 4, 5}, {1});
+    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {2, 3, 4, 5}, {2, 4, 5}, {0, 2, 3});
 }
 
 TEST(broadcast_gpu_float, bs_fs_yx_bsv32_fsv16_2x4x5_to_2x3x4x5_w_b_axes_1) {
-    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {2, 3, 4, 5}, {2, 4, 5}, {1});
+    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {2, 3, 4, 5}, {2, 4, 5}, {0, 2, 3});
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_yx_fsv16_2x4x5_to_2x3x4x5_w_b_axes_1) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {2, 3, 4, 5}, {2, 4, 5}, {1});
+    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {2, 3, 4, 5}, {2, 4, 5}, {0, 2, 3});
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_yx_fsv32_2x4x5_to_2x3x4x5_w_b_axes_1) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {2, 3, 4, 5}, {2, 4, 5}, {1});
+    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {2, 3, 4, 5}, {2, 4, 5}, {0, 2, 3});
 }
 
 TEST(broadcast_gpu_int8_t, bs_fs_yx_bsv32_fsv32_2x4x5_to_2x3x4x5_w_b_axes_1) {
-    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {2, 3, 4, 5}, {2, 4, 5}, {1});
+    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {2, 3, 4, 5}, {2, 4, 5}, {0, 2, 3});
 }
 
 TEST(broadcast_gpu_fp16, b_fs_yx_fsv16_2x4x5_to_2x3x4x5_w_b_axes_1) {
-    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {2, 3, 4, 5}, {2, 4, 5}, {1});
+    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {2, 3, 4, 5}, {2, 4, 5}, {0, 2, 3});
 }
 
 TEST(broadcast_gpu_fp16, bs_fs_yx_bsv32_fsv16_2x4x5_to_2x3x4x5_w_b_axes_1) {
-    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {2, 3, 4, 5}, {2, 4, 5}, {1});
+    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {2, 3, 4, 5}, {2, 4, 5}, {0, 2, 3});
 }
 
 
 TEST(broadcast_gpu_float, b_fs_yx_fsv16_2x3x5_to_2x3x4x5_w_b_axes_2) {
-    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {2, 3, 4, 5}, {2, 3, 5}, {2});
+    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {2, 3, 4, 5}, {2, 3, 5}, {0, 1, 3});
 }
 
 TEST(broadcast_gpu_float, bs_fs_yx_bsv32_fsv16_2x3x5_to_2x3x4x5_w_b_axes_2) {
-    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {2, 3, 4, 5}, {2, 3, 5}, {2});
+    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {2, 3, 4, 5}, {2, 3, 5}, {0, 1, 3});
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_yx_fsv16_2x3x5_to_2x3x4x5_w_b_axes_2) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {2, 3, 4, 5}, {2, 3, 5}, {2});
+    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {2, 3, 4, 5}, {2, 3, 5}, {0, 1, 3});
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_yx_fsv32_2x3x5_to_2x3x4x5_w_b_axes_2) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {2, 3, 4, 5}, {2, 3, 5}, {2});
+    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {2, 3, 4, 5}, {2, 3, 5}, {0, 1, 3});
 }
 
 TEST(broadcast_gpu_int8_t, bs_fs_yx_bsv32_fsv32_2x3x5_to_2x3x4x5_w_b_axes_2) {
-    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {2, 3, 4, 5}, {2, 3, 5}, {2});
+    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {2, 3, 4, 5}, {2, 3, 5}, {0, 1, 3});
 }
 
 TEST(broadcast_gpu_fp16, b_fs_yx_fsv16_2x3x5_to_2x3x4x5_w_b_axes_2) {
-    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {2, 3, 4, 5}, {2, 3, 5}, {2});
+    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {2, 3, 4, 5}, {2, 3, 5}, {0, 1, 3});
 }
 
 TEST(broadcast_gpu_fp16, bs_fs_yx_bsv32_fsv16_2x3x5_to_2x3x4x5_w_b_axes_2) {
-    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {2, 3, 4, 5}, {2, 3, 5}, {2});
+    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {2, 3, 4, 5}, {2, 3, 5}, {0, 1, 3});
 }
 
 
 TEST(broadcast_gpu_float, b_fs_yx_fsv16_2x3x4_to_2x3x4x5_w_b_axes_3) {
-    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {2, 3, 4, 5}, {2, 3, 4}, {3});
+    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {2, 3, 4, 5}, {2, 3, 4}, {0, 1, 2});
 }
 
 TEST(broadcast_gpu_float, bs_fs_yx_bsv32_fsv16_2x3x4_to_2x3x4x5_w_b_axes_3) {
-    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {2, 3, 4, 5}, {2, 3, 4}, {3});
+    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {2, 3, 4, 5}, {2, 3, 4}, {0, 1, 2});
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_yx_fsv16_2x3x4_to_2x3x4x5_w_b_axes_3) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {2, 3, 4, 5}, {2, 3, 4}, {3});
+    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {2, 3, 4, 5}, {2, 3, 4}, {0, 1, 2});
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_yx_fsv32_2x3x4_to_2x3x4x5_w_b_axes_3) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {2, 3, 4, 5}, {2, 3, 4}, {3});
+    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {2, 3, 4, 5}, {2, 3, 4}, {0, 1, 2});
 }
 
 TEST(broadcast_gpu_int8_t, bs_fs_yx_bsv32_fsv32_2x3x4_to_2x3x4x5_w_b_axes_3) {
-    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {2, 3, 4, 5}, {2, 3, 4}, {3});
+    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {2, 3, 4, 5}, {2, 3, 4}, {0, 1, 2});
 }
 
 TEST(broadcast_gpu_fp16, b_fs_yx_fsv16_2x3x4_to_2x3x4x5_w_b_axes_3) {
-    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {2, 3, 4, 5}, {2, 3, 4}, {3});
+    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {2, 3, 4, 5}, {2, 3, 4}, {0, 1, 2});
 }
 
 TEST(broadcast_gpu_fp16, bs_fs_yx_bsv32_fsv16_2x3x4_to_2x3x4x5_w_b_axes_3) {
-    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {2, 3, 4, 5}, {2, 3, 4}, {3});
+    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {2, 3, 4, 5}, {2, 3, 4}, {0, 1, 2});
 }
 
 
 TEST(broadcast_gpu_float, b_fs_yx_fsv16_4x5_to_2x3x4x5_w_b_axes_0_1) {
-    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {2, 3, 4, 5}, {4, 5}, {0, 1});
+    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {2, 3, 4, 5}, {4, 5}, {2, 3});
 }
 
 TEST(broadcast_gpu_float, bs_fs_yx_bsv32_fsv16_4x5_to_2x3x4x5_w_b_axes_0_1) {
-    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {2, 3, 4, 5}, {4, 5}, {0, 1});
+    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {2, 3, 4, 5}, {4, 5}, {2, 3});
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_yx_fsv16_4x5_to_2x3x4x5_w_b_axes_0_1) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {2, 3, 4, 5}, {4, 5}, {0, 1});
+    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {2, 3, 4, 5}, {4, 5}, {2, 3});
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_yx_fsv32_4x5_to_2x3x4x5_w_b_axes_0_1) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {2, 3, 4, 5}, {4, 5}, {0, 1});
+    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {2, 3, 4, 5}, {4, 5}, {2, 3});
 }
 
 TEST(broadcast_gpu_int8_t, bs_fs_yx_bsv32_fsv16_4x5_to_2x3x4x5_w_b_axes_0_1) {
-    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv16, data_types::i8, {2, 3, 4, 5}, {4, 5}, {0, 1});
+    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv16, data_types::i8, {2, 3, 4, 5}, {4, 5}, {2, 3});
 }
 
 TEST(broadcast_gpu_fp16, b_fs_yx_fsv16_4x5_to_2x3x4x5_w_b_axes_0_1) {
-    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {2, 3, 4, 5}, {4, 5}, {0, 1});
+    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {2, 3, 4, 5}, {4, 5}, {2, 3});
 }
 
 TEST(broadcast_gpu_fp16, bs_fs_yx_bsv32_fsv16_4x5_to_2x3x4x5_w_b_axes_0_1) {
-    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {2, 3, 4, 5}, {4, 5}, {0, 1});
+    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {2, 3, 4, 5}, {4, 5}, {2, 3});
 }
 
 
 TEST(broadcast_gpu_float, b_fs_yx_fsv16_3x5_to_2x3x4x5_w_b_axes_0_2) {
-    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {2, 3, 4, 5}, {3, 5}, {0, 2});
+    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {2, 3, 4, 5}, {3, 5}, {1, 3});
 }
 
 TEST(broadcast_gpu_float, bs_fs_yx_bsv32_fsv16_3x5_to_2x3x4x5_w_b_axes_0_2) {
-    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {2, 3, 4, 5}, {3, 5}, {0, 2});
+    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {2, 3, 4, 5}, {3, 5}, {1, 3});
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_yx_fsv16_3x5_to_2x3x4x5_w_b_axes_0_2) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {2, 3, 4, 5}, {3, 5}, {0, 2});
+    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {2, 3, 4, 5}, {3, 5}, {1, 3});
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_yx_fsv32_3x5_to_2x3x4x5_w_b_axes_0_2) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {2, 3, 4, 5}, {3, 5}, {0, 2});
+    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {2, 3, 4, 5}, {3, 5}, {1, 3});
 }
 
 TEST(broadcast_gpu_int8_t, bs_fs_yx_bsv32_fsv32_3x5_to_2x3x4x5_w_b_axes_0_2) {
-    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {2, 3, 4, 5}, {3, 5}, {0, 2});
+    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {2, 3, 4, 5}, {3, 5}, {1, 3});
 }
 
 TEST(broadcast_gpu_fp16, b_fs_yx_fsv16_3x5_to_2x3x4x5_w_b_axes_0_2) {
-    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {2, 3, 4, 5}, {3, 5}, {0, 2});
+    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {2, 3, 4, 5}, {3, 5}, {1, 3});
 }
 
 TEST(broadcast_gpu_fp16, bs_fs_yx_bsv32_fsv16_3x5_to_2x3x4x5_w_b_axes_0_2) {
-    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {2, 3, 4, 5}, {3, 5}, {0, 2});
+    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {2, 3, 4, 5}, {3, 5}, {1, 3});
 }
 
 
 TEST(broadcast_gpu_float, b_fs_yx_fsv16_3x4_to_2x3x4x5_w_b_axes_0_3) {
-    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {2, 3, 4, 5}, {3, 4}, {0, 3});
+    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {2, 3, 4, 5}, {3, 4}, {1, 2});
 }
 
 TEST(broadcast_gpu_float, bs_fs_yx_bsv32_fsv16_3x4_to_2x3x4x5_w_b_axes_0_3) {
-    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {2, 3, 4, 5}, {3, 4}, {0, 3});
+    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {2, 3, 4, 5}, {3, 4}, {1, 2});
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_yx_fsv16_3x4_to_2x3x4x5_w_b_axes_0_3) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {2, 3, 4, 5}, {3, 4}, {0, 3});
+    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {2, 3, 4, 5}, {3, 4}, {1, 2});
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_yx_fsv32_3x4_to_2x3x4x5_w_b_axes_0_3) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {2, 3, 4, 5}, {3, 4}, {0, 3});
+    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {2, 3, 4, 5}, {3, 4}, {1, 2});
 }
 
 TEST(broadcast_gpu_int8_t, bs_fs_yx_bsv32_fsv32_3x4_to_2x3x4x5_w_b_axes_0_3) {
-    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {2, 3, 4, 5}, {3, 4}, {0, 3});
+    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {2, 3, 4, 5}, {3, 4}, {1, 2});
 }
 
 TEST(broadcast_gpu_fp16, b_fs_yx_fsv16_3x4_to_2x3x4x5_w_b_axes_0_3) {
-    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {2, 3, 4, 5}, {3, 4}, {0, 3});
+    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {2, 3, 4, 5}, {3, 4}, {1, 2});
 }
 
 TEST(broadcast_gpu_fp16, bs_fs_yx_bsv32_fsv16_3x4_to_2x3x4x5_w_b_axes_0_3) {
-    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {2, 3, 4, 5}, {3, 4}, {0, 3});
+    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {2, 3, 4, 5}, {3, 4}, {1, 2});
 }
 
 
 TEST(broadcast_gpu_float, b_fs_yx_fsv16_2x5_to_2x3x4x5_w_b_axes_1_2) {
-    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {2, 3, 4, 5}, {2, 5}, {1, 2});
+    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {2, 3, 4, 5}, {2, 5}, {0, 3});
 }
 
 TEST(broadcast_gpu_float, bs_fs_yx_bsv32_fsv16_2x5_to_2x3x4x5_w_b_axes_1_2) {
-    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {2, 3, 4, 5}, {2, 5}, {1, 2});
+    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {2, 3, 4, 5}, {2, 5}, {0, 3});
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_yx_fsv16_2x5_to_2x3x4x5_w_b_axes_1_2) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {2, 3, 4, 5}, {2, 5}, {1, 2});
+    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {2, 3, 4, 5}, {2, 5}, {0, 3});
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_yx_fsv32_2x5_to_2x3x4x5_w_b_axes_1_2) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {2, 3, 4, 5}, {2, 5}, {1, 2});
+    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {2, 3, 4, 5}, {2, 5}, {0, 3});
 }
 
 TEST(broadcast_gpu_int8_t, bs_fs_yx_bsv32_fsv32_2x5_to_2x3x4x5_w_b_axes_1_2) {
-    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {2, 3, 4, 5}, {2, 5}, {1, 2});
+    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {2, 3, 4, 5}, {2, 5}, {0, 3});
 }
 
 TEST(broadcast_gpu_fp16, b_fs_yx_fsv16_2x5_to_2x3x4x5_w_b_axes_1_2) {
-    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {2, 3, 4, 5}, {2, 5}, {1, 2});
+    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {2, 3, 4, 5}, {2, 5}, {0, 3});
 }
 
 TEST(broadcast_gpu_fp16, bs_fs_yx_bsv32_fsv16_2x5_to_2x3x4x5_w_b_axes_1_2) {
-    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {2, 3, 4, 5}, {2, 5}, {1, 2});
+    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {2, 3, 4, 5}, {2, 5}, {0, 3});
 }
 
 
 TEST(broadcast_gpu_float, b_fs_yx_fsv16_2x4_to_2x3x4x5_w_b_axes_1_3) {
-    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {2, 3, 4, 5}, {2, 4}, {1, 3});
+    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {2, 3, 4, 5}, {2, 4}, {0, 2});
 }
 
 TEST(broadcast_gpu_float, bs_fs_yx_bsv32_fsv16_2x4_to_2x3x4x5_w_b_axes_1_3) {
-    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {2, 3, 4, 5}, {2, 4}, {1, 3});
+    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {2, 3, 4, 5}, {2, 4}, {0, 2});
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_yx_fsv16_2x4_to_2x3x4x5_w_b_axes_1_3) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {2, 3, 4, 5}, {2, 4}, {1, 3});
+    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {2, 3, 4, 5}, {2, 4}, {0, 2});
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_yx_fsv32_2x4_to_2x3x4x5_w_b_axes_1_3) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {2, 3, 4, 5}, {2, 4}, {1, 3});
+    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {2, 3, 4, 5}, {2, 4}, {0, 2});
 }
 
 TEST(broadcast_gpu_int8_t, bs_fs_yx_bsv32_fsv32_2x4_to_2x3x4x5_w_b_axes_1_3) {
-    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {2, 3, 4, 5}, {2, 4}, {1, 3});
+    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {2, 3, 4, 5}, {2, 4}, {0, 2});
 }
 
 TEST(broadcast_gpu_fp16, b_fs_yx_fsv16_2x4_to_2x3x4x5_w_b_axes_1_3) {
-    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {2, 3, 4, 5}, {2, 4}, {1, 3});
+    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {2, 3, 4, 5}, {2, 4}, {0, 2});
 }
 
 TEST(broadcast_gpu_fp16, bs_fs_yx_bsv32_fsv16_2x4_to_2x3x4x5_w_b_axes_1_3) {
-    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {2, 3, 4, 5}, {2, 4}, {1, 3});
+    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {2, 3, 4, 5}, {2, 4}, {0, 2});
 }
 
 
 TEST(broadcast_gpu_float, b_fs_yx_fsv16_2x3_to_2x3x4x5_w_b_axes_2_3) {
-    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {2, 3, 4, 5}, {2, 3}, {2, 3});
+    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {2, 3, 4, 5}, {2, 3}, {0, 1});
 }
 
 TEST(broadcast_gpu_float, bs_fs_yx_bsv32_fsv16_2x3_to_2x3x4x5_w_b_axes_2_3) {
-    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {2, 3, 4, 5}, {2, 3}, {2, 3});
+    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {2, 3, 4, 5}, {2, 3}, {0, 1});
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_yx_fsv16_2x3_to_2x3x4x5_w_b_axes_2_3) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {2, 3, 4, 5}, {2, 3}, {2, 3});
+    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {2, 3, 4, 5}, {2, 3}, {0, 1});
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_yx_fsv32_2x3_to_2x3x4x5_w_b_axes_2_3) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {2, 3, 4, 5}, {2, 3}, {2, 3});
+    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {2, 3, 4, 5}, {2, 3}, {0, 1});
 }
 
 TEST(broadcast_gpu_int8_t, bs_fs_yx_bsv32_fsv32_2x3_to_2x3x4x5_w_b_axes_2_3) {
-    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {2, 3, 4, 5}, {2, 3}, {2, 3});
+    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {2, 3, 4, 5}, {2, 3}, {0, 1});
 }
 
 TEST(broadcast_gpu_fp16, b_fs_yx_fsv16_2x3_to_2x3x4x5_w_b_axes_2_3) {
-    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {2, 3, 4, 5}, {2, 3}, {2, 3});
+    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {2, 3, 4, 5}, {2, 3}, {0, 1});
 }
 
 TEST(broadcast_gpu_fp16, bs_fs_yx_bsv32_fsv16_2x3_to_2x3x4x5_w_b_axes_2_3) {
-    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {2, 3, 4, 5}, {2, 3}, {2, 3});
+    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {2, 3, 4, 5}, {2, 3}, {0, 1});
 }
 
 
 TEST(broadcast_gpu_float, b_fs_yx_fsv16_5_to_2x3x4x5_w_b_axes_0_1_2) {
-    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {2, 3, 4, 5}, {5}, {0, 1, 2});
+    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {2, 3, 4, 5}, {5}, {3});
 }
 
 TEST(broadcast_gpu_float, bs_fs_yx_bsv32_fsv16_5_to_2x3x4x5_w_b_axes_0_1_2) {
-    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {2, 3, 4, 5}, {5}, {0, 1, 2});
+    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {2, 3, 4, 5}, {5}, {3});
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_yx_fsv16_5_to_2x3x4x5_w_b_axes_0_1_2) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {2, 3, 4, 5}, {5}, {0, 1, 2});
+    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {2, 3, 4, 5}, {5}, {3});
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_yx_fsv32_5_to_2x3x4x5_w_b_axes_0_1_2) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {2, 3, 4, 5}, {5}, {0, 1, 2});
+    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {2, 3, 4, 5}, {5}, {3});
 }
 
 TEST(broadcast_gpu_int8_t, bs_fs_yx_bsv32_fsv32_5_to_2x3x4x5_w_b_axes_0_1_2) {
-    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {2, 3, 4, 5}, {5}, {0, 1, 2});
+    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {2, 3, 4, 5}, {5}, {3});
 }
 
 TEST(broadcast_gpu_fp16, b_fs_yx_fsv16_5_to_2x3x4x5_w_b_axes_0_1_2) {
-    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {2, 3, 4, 5}, {5}, {0, 1, 2});
+    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {2, 3, 4, 5}, {5}, {3});
 }
 
 TEST(broadcast_gpu_fp16, bs_fs_yx_bsv32_fsv16_5_to_2x3x4x5_w_b_axes_0_1_2) {
-    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {2, 3, 4, 5}, {5}, {0, 1, 2});
+    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {2, 3, 4, 5}, {5}, {3});
 }
 
 
 TEST(broadcast_gpu_float, b_fs_yx_fsv16_4_to_2x3x4x5_w_b_axes_0_1_3) {
-    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {2, 3, 4, 5}, {4}, {0, 1, 3});
+    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {2, 3, 4, 5}, {4}, {2});
 }
 
 TEST(broadcast_gpu_float, bs_fs_yx_bsv32_fsv16_4_to_2x3x4x5_w_b_axes_0_1_3) {
-    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {2, 3, 4, 5}, {4}, {0, 1, 3});
+    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {2, 3, 4, 5}, {4}, {2});
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_yx_fsv16_4_to_2x3x4x5_w_b_axes_0_1_3) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {2, 3, 4, 5}, {4}, {0, 1, 3});
+    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {2, 3, 4, 5}, {4}, {2});
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_yx_fsv32_4_to_2x3x4x5_w_b_axes_0_1_3) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {2, 3, 4, 5}, {4}, {0, 1, 3});
+    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {2, 3, 4, 5}, {4}, {2});
 }
 
 TEST(broadcast_gpu_int8_t, bs_fs_yx_bsv32_fsv32_4_to_2x3x4x5_w_b_axes_0_1_3) {
-    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {2, 3, 4, 5}, {4}, {0, 1, 3});
+    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {2, 3, 4, 5}, {4}, {2});
 }
 
 TEST(broadcast_gpu_fp16, b_fs_yx_fsv16_4_to_2x3x4x5_w_b_axes_0_1_3) {
-    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {2, 3, 4, 5}, {4}, {0, 1, 3});
+    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {2, 3, 4, 5}, {4}, {2});
 }
 
 TEST(broadcast_gpu_fp16, bs_fs_yx_bsv32_fsv16_4_to_2x3x4x5_w_b_axes_0_1_3) {
-    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {2, 3, 4, 5}, {4}, {0, 1, 3});
+    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {2, 3, 4, 5}, {4}, {2});
 }
 
 
 TEST(broadcast_gpu_float, b_fs_yx_fsv16_3_to_2x3x4x5_w_b_axes_0_2_3) {
-    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {2, 3, 4, 5}, {3}, {0, 2, 3});
+    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {2, 3, 4, 5}, {3}, {1});
 }
 
 TEST(broadcast_gpu_float, bs_fs_yx_bsv32_fsv16_3_to_2x3x4x5_w_b_axes_0_2_3) {
-    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {2, 3, 4, 5}, {3}, {0, 2, 3});
+    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {2, 3, 4, 5}, {3}, {1});
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_yx_fsv16_3_to_2x3x4x5_w_b_axes_0_2_3) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {2, 3, 4, 5}, {3}, {0, 2, 3});
+    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {2, 3, 4, 5}, {3}, {1});
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_yx_fsv32_3_to_2x3x4x5_w_b_axes_0_2_3) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {2, 3, 4, 5}, {3}, {0, 2, 3});
+    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {2, 3, 4, 5}, {3}, {1});
 }
 
 TEST(broadcast_gpu_int8_t, bs_fs_yx_bsv32_fsv32_3_to_2x3x4x5_w_b_axes_0_2_3) {
-    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {2, 3, 4, 5}, {3}, {0, 2, 3});
+    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {2, 3, 4, 5}, {3}, {1});
 }
 
 TEST(broadcast_gpu_fp16, b_fs_yx_fsv16_3_to_2x3x4x5_w_b_axes_0_2_3) {
-    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {2, 3, 4, 5}, {3}, {0, 2, 3});
+    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {2, 3, 4, 5}, {3}, {1});
 }
 
 TEST(broadcast_gpu_fp16, bs_fs_yx_bsv32_fsv16_3_to_2x3x4x5_w_b_axes_0_2_3) {
-    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {2, 3, 4, 5}, {3}, {0, 2, 3});
+    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {2, 3, 4, 5}, {3}, {1});
 }
 
 
 TEST(broadcast_gpu_float, b_fs_yx_fsv16_2_to_2x3x4x5_w_b_axes_1_2_3) {
-    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {2, 3, 4, 5}, {2}, {1, 2, 3});
+    start_broadcast_test<float>(format::b_fs_yx_fsv16, data_types::f32, {2, 3, 4, 5}, {2}, {0});
 }
 
 TEST(broadcast_gpu_float, bs_fs_yx_bsv32_fsv16_2_to_2x3x4x5_w_b_axes_1_2_3) {
-    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {2, 3, 4, 5}, {2}, {1, 2, 3});
+    start_broadcast_test<float>(format::bs_fs_yx_bsv32_fsv16, data_types::f32, {2, 3, 4, 5}, {2}, {0});
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_yx_fsv16_2_to_2x3x4x5_w_b_axes_1_2_3) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {2, 3, 4, 5}, {2}, {1, 2, 3});
+    start_broadcast_test<int8_t>(format::b_fs_yx_fsv16, data_types::i8, {2, 3, 4, 5}, {2}, {0});
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_yx_fsv32_2_to_2x3x4x5_w_b_axes_1_2_3) {
-    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {2, 3, 4, 5}, {2}, {1, 2, 3});
+    start_broadcast_test<int8_t>(format::b_fs_yx_fsv32, data_types::i8, {2, 3, 4, 5}, {2}, {0});
 }
 
 TEST(broadcast_gpu_int8_t, bs_fs_yx_bsv32_fsv32_2_to_2x3x4x5_w_b_axes_1_2_3) {
-    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {2, 3, 4, 5}, {2}, {1, 2, 3});
+    start_broadcast_test<int8_t>(format::bs_fs_yx_bsv32_fsv32, data_types::i8, {2, 3, 4, 5}, {2}, {0});
 }
 
 TEST(broadcast_gpu_fp16, b_fs_yx_fsv16_2_to_2x3x4x5_w_b_axes_1_2_3) {
-    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {2, 3, 4, 5}, {2}, {1, 2, 3});
+    start_broadcast_test<ov::float16>(format::b_fs_yx_fsv16, data_types::f16, {2, 3, 4, 5}, {2}, {0});
 }
 
 TEST(broadcast_gpu_fp16, bs_fs_yx_bsv32_fsv16_2_to_2x3x4x5_w_b_axes_1_2_3) {
-    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {2, 3, 4, 5}, {2}, {1, 2, 3});
+    start_broadcast_test<ov::float16>(format::bs_fs_yx_bsv32_fsv16, data_types::f16, {2, 3, 4, 5}, {2}, {0});
 }
 
 
 TEST(broadcast_gpu_float, b_fs_zyx_fsv16_1x48x1x1_to_1x48x1x5_w_b_axes_0) {
-    start_broadcast_test_5d<float>(format::b_fs_zyx_fsv16, data_types::f32, { 1, 48, 1, 5 }, { 1, 48, 1, 1 }, { 0 });
+    start_broadcast_test_5d<float>(format::b_fs_zyx_fsv16, data_types::f32, { 1, 48, 1, 5 }, { 1, 48, 1, 1 }, { 0, 1, 2, 3});
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_zyx_fsv16_1x48x1x1_to_1x48x1x5_w_b_axes_0) {
-    start_broadcast_test_5d<int8_t>(format::b_fs_zyx_fsv16, data_types::i8, { 1, 48, 1, 5 }, { 1, 48, 1, 1 }, { 0 });
+    start_broadcast_test_5d<int8_t>(format::b_fs_zyx_fsv16, data_types::i8, { 1, 48, 1, 5 }, { 1, 48, 1, 1 }, { 0, 1, 2, 3});
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_zyx_fsv32_1x48x1x1_to_1x48x1x5_w_b_axes_0) {
-    start_broadcast_test_5d<int8_t>(format::b_fs_zyx_fsv32, data_types::i8, { 1, 48, 1, 5 }, { 1, 48, 1, 1 }, { 0 });
+    start_broadcast_test_5d<int8_t>(format::b_fs_zyx_fsv32, data_types::i8, { 1, 48, 1, 5 }, { 1, 48, 1, 1 }, { 0, 1, 2, 3});
 }
 
 TEST(broadcast_gpu_fp16, b_fs_zyx_fsv16_1x48x1x1_to_1x48x1x5_w_b_axes_0) {
-    start_broadcast_test_5d<ov::float16>(format::b_fs_zyx_fsv16, data_types::f16, { 1, 48, 1, 5 }, { 1, 48, 1, 1 }, { 0 });
-}
-
-
-TEST(broadcast_gpu_float, b_fs_zyx_fsv16_64x256x2x1_to_128x256x4x5_w_b_axes_0x1) {
-    start_broadcast_test_5d<float>(format::b_fs_zyx_fsv16, data_types::f32, { 128, 256, 4, 5 }, { 64, 256, 2, 1}, {});
-}
-
-TEST(broadcast_gpu_int8_t, b_fs_zyx_fsv16_64x256x2x1_to_128x256x4x5_w_b_axes_0x1) {
-    start_broadcast_test_5d<int8_t>(format::b_fs_zyx_fsv16, data_types::i8, { 128, 256, 4, 5 }, { 64, 256, 2, 1}, {});
-}
-
-TEST(broadcast_gpu_int8_t, b_fs_zyx_fsv32_64x256x2x1_to_128x256x4x5_w_b_axes_0x1) {
-    start_broadcast_test_5d<int8_t>(format::b_fs_zyx_fsv32, data_types::i8, { 128, 256, 4, 5 }, { 64, 256, 2, 1}, {});
+    start_broadcast_test_5d<ov::float16>(format::b_fs_zyx_fsv16, data_types::f16, { 1, 48, 1, 5 }, { 1, 48, 1, 1 }, { 0, 1, 2, 3});
 }
 
-TEST(broadcast_gpu_fp16, b_fs_zyx_fsv16_64x256x2x1_to_128x256x4x5_w_b_axes_0x1) {
-    start_broadcast_test_5d<ov::float16>(format::b_fs_zyx_fsv16, data_types::f16, { 128, 256, 4, 5 }, { 64, 256, 2, 1}, {});
-}
-
-
 TEST(broadcast_gpu_float, b_fs_zyx_fsv16_1_to_4x5_w_b_axes_0x1) {
-    start_broadcast_test_5d<float>(format::b_fs_zyx_fsv16, data_types::f32, { 4, 5 }, { 1 }, { 0, 1 });
+    start_broadcast_test_5d<float>(format::b_fs_zyx_fsv16, data_types::f32, { 4, 5 }, { 1 }, { 0 });
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_zyx_fsv16_1_to_4x5_w_b_axes_0x1) {
-    start_broadcast_test_5d<int8_t>(format::b_fs_zyx_fsv16, data_types::i8, { 4, 5 }, { 1 }, { 0, 1 });
+    start_broadcast_test_5d<int8_t>(format::b_fs_zyx_fsv16, data_types::i8, { 4, 5 }, { 1 }, { 0 });
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_zyx_fsv32_1_to_4x5_w_b_axes_0x1) {
-    start_broadcast_test_5d<int8_t>(format::b_fs_zyx_fsv32, data_types::i8, { 4, 5 }, { 1 }, { 0, 1 });
+    start_broadcast_test_5d<int8_t>(format::b_fs_zyx_fsv32, data_types::i8, { 4, 5 }, { 1 }, { 0 });
 }
 
 TEST(broadcast_gpu_fp16, b_fs_zyx_fsv16_1_to_4x5_w_b_axes_0x1) {
-    start_broadcast_test_5d<ov::float16>(format::b_fs_zyx_fsv16, data_types::f16, { 4, 5 }, { 1 }, { 0, 1 });
+    start_broadcast_test_5d<ov::float16>(format::b_fs_zyx_fsv16, data_types::f16, { 4, 5 }, { 1 }, { 0 });
 }
 
 
 TEST(broadcast_gpu_float, b_fs_zyx_fsv16_1_to_2x3x4x5x2_w_b_axes_0x1x2x3x4) {
-    start_broadcast_test_5d<float>(format::b_fs_zyx_fsv16, data_types::f32, { 2, 3, 4, 5, 2 }, { 1 }, { 0, 1, 2, 3, 4 });
+    start_broadcast_test_5d<float>(format::b_fs_zyx_fsv16, data_types::f32, { 2, 3, 4, 5, 2 }, { 1 }, { 2});
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_zyx_fsv16_1_to_2x3x4x5x2_w_b_axes_0x1x2x3x4) {
-    start_broadcast_test_5d<int8_t>(format::b_fs_zyx_fsv16, data_types::i8, { 2, 3, 4, 5, 2 }, { 1 }, { 0, 1, 2, 3, 4 });
+    start_broadcast_test_5d<int8_t>(format::b_fs_zyx_fsv16, data_types::i8, { 2, 3, 4, 5, 2 }, { 1 }, { 2});
 }
 
 TEST(broadcast_gpu_int8_t, b_fs_zyx_fsv32_1_to_2x3x4x5x2_w_b_axes_0x1x2x3x4) {
-    start_broadcast_test_5d<int8_t>(format::b_fs_zyx_fsv32, data_types::i8, { 2, 3, 4, 5, 2 }, { 1 }, { 0, 1, 2, 3, 4 });
+    start_broadcast_test_5d<int8_t>(format::b_fs_zyx_fsv32, data_types::i8, { 2, 3, 4, 5, 2 }, { 1 }, { 2});
 }
 
 TEST(broadcast_gpu_fp16, b_fs_zyx_fsv16_1_to_2x3x4x5x2_w_b_axes_0x1x2x3x4) {
-    start_broadcast_test_5d<ov::float16>(format::b_fs_zyx_fsv16, data_types::f16, { 2, 3, 4, 5, 2 }, { 1 }, { 0, 1, 2, 3, 4 });
+    start_broadcast_test_5d<ov::float16>(format::b_fs_zyx_fsv16, data_types::f16, { 2, 3, 4, 5, 2 }, { 1 }, { 2});
 }
 
 TEST(export_import_broadcast_gpu_fp16, b_fs_zyx_fsv16_1_to_2x3x4x5x2_w_b_axes_0x1x2x3x4) {
-    start_broadcast_test_5d<ov::float16>(format::b_fs_zyx_fsv16, data_types::f16, { 2, 3, 4, 5, 2 }, { 1 }, { 0, 1, 2, 3, 4 }, true);
+    start_broadcast_test_5d<ov::float16>(format::b_fs_zyx_fsv16, data_types::f16, { 2, 3, 4, 5, 2 }, { 1 }, { 2}, true);
 }
 
 static void run_broadcast_gpu_opt_y_axis(std::vector<ov::Dimension::value_type> in_static_shape,
@@ -2272,7 +1700,7 @@ static void run_broadcast_gpu_opt_y_axis(std::vector<ov::Dimension::value_type>
     auto& engine = get_test_engine();
     auto config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::optimize_data(true));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
     auto input_static_layout = cldnn::layout{ov::PartialShape{in_static_shape}, data_types::f16, format::bfzyx};
     auto input_dynamic_layout = cldnn::layout{ov::PartialShape{in_dynamic_shape}, data_types::f16, format::bfzyx};
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/canonicalization_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/canonicalization_gpu_test.cpp
index 35c9abf9d2b77d..7dfedfde426e76 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/canonicalization_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/canonicalization_gpu_test.cpp
@@ -29,8 +29,7 @@ void canonicalization_test(cldnn::topology topology, std::string prim_name,
                            bool enable_fusing = false) {
     auto& engine = get_test_engine();
 
-    ExecutionConfig config({ov::intel_gpu::optimize_data(true),
-                            ov::intel_gpu::allow_new_shape_infer(true)});
+    ExecutionConfig config({ov::intel_gpu::optimize_data(true)});
 
     auto prog = program::build_program(engine, topology, config, false, true);
     if (enable_fusing) {
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/concatenation_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/concatenation_gpu_test.cpp
index 8e3da9692dcb45..bc42745c896675 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/concatenation_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/concatenation_gpu_test.cpp
@@ -113,7 +113,7 @@ void start_concat_test_dynamic(impl_types impl_type) {
 
     ExecutionConfig config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::optimize_data(true));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     if (impl_type != impl_types::any) {
         auto force_impl = ov::intel_gpu::ImplementationDesc{ format::bfyx, "", impl_type };
         config.set_property(ov::intel_gpu::force_implementations(ov::intel_gpu::ImplForcingMap{ {primitive_id("concat"), force_impl} }));
@@ -334,7 +334,7 @@ TEST(concat_gpu, dynamic_6d_f) {
                           data_types::f32)
     );
 
-    ExecutionConfig config{ov::intel_gpu::allow_new_shape_infer(true)};
+    ExecutionConfig config;
 
     auto network = cldnn::network::build_network(engine, topology, config);
 
@@ -533,7 +533,7 @@ TEST(concat_gpu, pooling_dynamic_input_no_exception) {
                       reorder("reorder", input_info("concat"), reorder_layout));
     ov::intel_gpu::ExecutionConfig config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::optimize_data(true));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
     network network(engine, topology, config);
     network.set_input_data("input0", input0);
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/condition_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/condition_gpu_test.cpp
index a6bb71e1653375..1d8221ce8e0fd5 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/condition_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/condition_gpu_test.cpp
@@ -255,7 +255,7 @@ class condition_gpu_tests: public ::testing::Test {
         auto& engine = get_test_engine();
         ExecutionConfig config = get_test_default_config(engine);
         config.set_property(ov::intel_gpu::optimize_data(true));
-        config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
         const int64_t d1 = 2;
         const int64_t d2 = 4;
         layout input_lay = {{-1, d1, -1, d2}, data_types::f32, format::bfyx};
@@ -354,7 +354,7 @@ class condition_gpu_tests: public ::testing::Test {
         auto& engine = get_test_engine();
         ExecutionConfig config = get_test_default_config(engine);
         config.set_property(ov::intel_gpu::optimize_data(true));
-        config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
         const int64_t d1 = 2;
         const int64_t d2 = 4;
         layout input_lay = {{-1, d1, -1, d2}, data_types::f32, format::bfyx};
@@ -904,7 +904,7 @@ TEST(condition_gpu, empty_body_with_different_shapes) {
     auto& engine = get_test_engine();
     ExecutionConfig config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::optimize_data(true));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     auto input_mem = engine.allocate_memory({ oned_pshape, data_types::f32, format::bfyx });
     auto predicate_mem = engine.allocate_memory({ oned_pshape, data_types::u8, format::bfyx });
     auto const_mem = engine.allocate_memory({ oned_pshape, data_types::f32, format::bfyx });
@@ -977,7 +977,7 @@ TEST(condition_gpu, set_empty_tensor) {
     auto& engine = get_test_engine();
     ExecutionConfig config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::optimize_data(true));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     auto empty_mem = engine.allocate_memory({ { 1, 1, 1, 1 }, data_types::f16, format::bfyx });
     auto empty_input_mem = engine.reinterpret_buffer(*empty_mem, { { 1, 1, 0, 1 }, data_types::f16, format::bfyx });
     auto input_mem = engine.allocate_memory({ { 1, 1, 4, 1 }, data_types::f32, format::bfyx });
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/convolution_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/convolution_gpu_test.cpp
index ce07bffe3666f3..98ce1a4f5291c4 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/convolution_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/convolution_gpu_test.cpp
@@ -878,7 +878,7 @@ TEST(convolution_f32_fw_gpu, basic_convolution_no_bias_dynamic) {
         convolution("conv", input_info("input"), "weights", no_bias, 1, { 2, 1 }, {1, 1}, {0, 0}, {0, 0}, false));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     network network(engine, topology, config);
 
     // first execute
@@ -1473,7 +1473,7 @@ TEST(convolution_f32_fw_gpu, basic_convolution3D_group2_dynamic) {
         convolution("conv", input_info("input"), "weights", "biases", 2, {1, 1, 1}, {1, 1, 1}, {0, 0, 0}, {0, 0, 0}, true));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     network network(engine, topology, config);
 
     network.set_input_data("input", input0);
@@ -9770,13 +9770,11 @@ TEST(convolution_gpu_onednn, spatial_1d) {
     ov::intel_gpu::ImplementationDesc conv_impl_test = { format::b_fs_yx_fsv16, "", impl_types::onednn };
     config_test.set_property(ov::intel_gpu::force_implementations(ov::intel_gpu::ImplForcingMap{ { "conv", conv_impl_test } }));
     config_test.set_property(ov::intel_gpu::optimize_data(true));
-    config_test.set_property(ov::intel_gpu::allow_new_shape_infer(true));
 
     ExecutionConfig config_ref = get_test_default_config(engine);
     ov::intel_gpu::ImplementationDesc conv_impl_ref = { format::bfyx, "", impl_types::ocl };
     config_ref.set_property(ov::intel_gpu::force_implementations(ov::intel_gpu::ImplForcingMap{{ "conv", conv_impl_ref } }));
     config_ref.set_property(ov::intel_gpu::optimize_data(true));
-    config_ref.set_property(ov::intel_gpu::allow_new_shape_infer(true));
 
     network network_test(engine, t, config_test);
     network network_ref(engine, t, config_ref);
@@ -10127,7 +10125,6 @@ TEST(convolution_gpu_onednn, has_proper_synchronization) {
 
     auto config_ref = get_test_default_config(engine);
     config_ref.set_property(ov::intel_gpu::queue_type(QueueTypes::in_order));
-    config_ref.set_property(ov::intel_gpu::allow_new_shape_infer(true));
 
     auto config_test = config_ref;
     config_test.set_property(ov::intel_gpu::force_implementations(impl_forcing_map));
@@ -10463,7 +10460,7 @@ TEST_P(conv_dyn_test, convolution_gpu_bfyx_os_iyx_osv16_no_bias) {
     ExecutionConfig config = get_test_default_config(engine);
     ov::intel_gpu::ImplementationDesc conv_impl = { format::bfyx, "convolution_gpu_bfyx_os_iyx_osv16", impl_types::ocl };
     config.set_property(ov::intel_gpu::force_implementations(ov::intel_gpu::ImplForcingMap{ { "conv", conv_impl } }));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     config.set_property(ov::enable_profiling(true));
 
     network network(engine, topology, config);
@@ -10566,7 +10563,6 @@ TEST_P(conv_dyn_test, convolution_gpu_bfyx_os_iyx_osv32_no_bias) {
     ExecutionConfig config = get_test_default_config(engine);
     ov::intel_gpu::ImplementationDesc conv_impl = { format::bfyx, "convolution_gpu_bfyx_os_iyx_osv32", impl_types::ocl };
     config.set_property(ov::intel_gpu::force_implementations(ov::intel_gpu::ImplForcingMap{ { "conv", conv_impl } }));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
     config.set_property(ov::enable_profiling(true));
 
     network network(engine, topology, config);
@@ -10689,7 +10685,6 @@ TEST_P(conv_dyn_test, convolution_gpu_fsv16_1x1_no_bias) {
     ExecutionConfig config = get_test_default_config(engine);
     ov::intel_gpu::ImplementationDesc conv_impl = { format::b_fs_yx_fsv16, "convolution_gpu_bfyx_f16_1x1", impl_types::ocl };
     config.set_property(ov::intel_gpu::force_implementations(ov::intel_gpu::ImplForcingMap{ { "conv", conv_impl } }));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
     config.set_property(ov::enable_profiling(true));
 
     network network(engine, topology, config);
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/crop_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/crop_gpu_test.cpp
index 1b9e52d1e7ef2b..f23868776b403f 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/crop_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/crop_gpu_test.cpp
@@ -1293,7 +1293,6 @@ TEST_P(crop_gpu_dynamic, i32_in2x3x2x2_crop_offsets) {
                                     3.f, 50.f, 7.f, 12.f, 4.f, -5.f, 8.f, 8.f,  -14.f, -15.f, -16.f, -17.f};
     set_values(input, input_vec);
     ExecutionConfig config1 = get_test_default_config(engine);
-    config1.set_property(ov::intel_gpu::allow_new_shape_infer(true));
     ExecutionConfig config2 = config1;
 
     if (impl_type != impl_types::any) {
@@ -1379,7 +1378,7 @@ TEST(crop_gpu, dynamic_in1x4x1x1_split) {
     std::vector<float> out2 = { -3.0f, 4.0f };
     set_values(input_mem, input_vec);
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     config.set_property(ov::intel_gpu::optimize_data(true));
     config.set_property(ov::intel_gpu::custom_outputs(topology.get_primitives_ids()));
 
@@ -1449,7 +1448,7 @@ TEST(crop_gpu, dynamic_in1x4x1x1_varaidic_split) {
     set_values(splits_length_mem, splits_vec);
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     config.set_property(ov::intel_gpu::optimize_data(true));
     config.set_property(ov::intel_gpu::custom_outputs(topology.get_primitives_ids()));
 
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/cum_sum_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/cum_sum_gpu_test.cpp
index 7f2f1c2ae4800d..5c26599d3f2c2d 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/cum_sum_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/cum_sum_gpu_test.cpp
@@ -324,7 +324,7 @@ TEST(cum_sum_gpu_fp32, dynamic) {
     topology.add(cum_sum("cum_sum", input_info("input")));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     network network(engine, topology, config);
     network.set_input_data("input", input);
 
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/data_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/data_gpu_test.cpp
index c40f1545a6da31..1ad1f48ba890d6 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/data_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/data_gpu_test.cpp
@@ -38,7 +38,7 @@ TEST(data_gpu, attach_host_buffer) {
 
     ExecutionConfig config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::optimize_data(true));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     network network(engine, topology, config);
     network.set_input_data("input", input_memory);
 
@@ -87,7 +87,7 @@ TEST(data_gpu, usm_device_buffer) {
 
     ExecutionConfig config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::optimize_data(true));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     network network(engine, topology, config);
     network.set_input_data("input", input_memory);
 
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/deconvolution_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/deconvolution_gpu_test.cpp
index f5c890390da099..e074bd53d97a23 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/deconvolution_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/deconvolution_gpu_test.cpp
@@ -305,7 +305,7 @@ TYPED_TEST(deconvolution_basic, no_bias_basic_wsiz2x2_in2x2x1x1_nopad_exclude_fu
     );
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     config.set_property(ov::intel_gpu::optimize_data(true));
 
     network network(engine, topology, config);
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/eltwise_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/eltwise_gpu_test.cpp
index fa529293b923b6..d94fe0dd7c05fe 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/eltwise_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/eltwise_gpu_test.cpp
@@ -1369,7 +1369,7 @@ TEST(eltwise_gpu_f32, dynamic_kernel_no_broadcast) {
         -2.f,  6.5f,  -0.5f, -2.5f });
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     network network(engine, topology, config);
     network.set_input_data("input1", input1);
     network.set_input_data("input2", input2);
@@ -1425,7 +1425,7 @@ TEST(eltwise_gpu_f32, dynamic_kernel_broadcast) {
     set_values(input2, { 0.5f, -0.5f });
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     network network(engine, topology, config);
     network.set_input_data("input1", input1);
     network.set_input_data("input2", input2);
@@ -1480,7 +1480,7 @@ TEST(eltwise_gpu_f32, dynamic_kernel_broadcast_mixed_ranks_3d_2d) {
     set_values(input2, { 0.5f, -0.5f, 1.0f, -1.0f, 2.f });
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     network network(engine, topology, config);
     network.set_input_data("input1", input1);
     network.set_input_data("input2", input2);
@@ -1539,7 +1539,7 @@ TEST(eltwise_gpu_f32, dynamic_kernel_broadcast_mixed_ranks_5d_2d) {
     set_values(input2, { 0.5f, -0.5f, 1.0f, -1.0f, 2.f });
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     network network(engine, topology, config);
     network.set_input_data("input1", input1);
     network.set_input_data("input2", input2);
@@ -1598,7 +1598,7 @@ TEST(eltwise_cpu_impl_f32, dynamic_kernel_broadcast_mixed_ranks_5d_2d) {
     set_values(input2, { 0.5f, -0.5f, 1.0f, -1.0f, 2.f });
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     config.set_property(ov::intel_gpu::force_implementations(ov::intel_gpu::ImplForcingMap{{"eltwise", {format::bfzyx, "", impl_types::cpu}}}));
 
     network network(engine, topology, config);
@@ -1730,7 +1730,7 @@ TEST(eltwise_gpu_f32, add_basic_8d) {
     }
 
     auto config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     network network(engine, topology, config);
 
     network.set_input_data("input1", input1);
@@ -1773,7 +1773,7 @@ TEST(eltwise_cpu_impl_f32, add_basic_8d) {
     auto config = get_test_default_config(engine);
     auto forcing_map = ov::intel_gpu::ImplForcingMap{ {"eltwise", {format::bfvuwzyx, "", impl_types::cpu}} };
     config.set_property(ov::intel_gpu::force_implementations(forcing_map));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     network network(engine, topology, config);
 
     network.set_input_data("input1", input1);
@@ -3372,7 +3372,7 @@ TEST(eltwise_gpu_f32, broadcast_test_dim3_dim4) {
     };
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
     // in1:dim3, int2:dim4
     {
@@ -3406,7 +3406,7 @@ TEST(eltwise_gpu_f32, broadcast_test_dim3_dim4) {
     }
 
     // in1:extended_dim4_from_dim3, int2:dim4
-    // in1_shape = {2, 4, 2} is extended to {1, 2, 4, 2} internally in case allow_new_shape_infer true.
+    // in1_shape = {2, 4, 2} is extended to {1, 2, 4, 2} internally.
     // So explicit 4d input shpae {1, 2, 4, 2} should have same result from input{2, 4, 2}
     {
         ov::Shape in1_shape = {1, 2, 4, 2};
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/embedding_bag_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/embedding_bag_gpu_test.cpp
deleted file mode 100644
index a661294ee5b226..00000000000000
--- a/src/plugins/intel_gpu/tests/unit/test_cases/embedding_bag_gpu_test.cpp
+++ /dev/null
@@ -1,1427 +0,0 @@
-// Copyright (C) 2018-2024 Intel Corporation
-// SPDX-License-Identifier: Apache-2.0
-//
-
-#include "test_utils.h"
-
-#include <intel_gpu/primitives/data.hpp>
-#include <intel_gpu/primitives/embedding_bag.hpp>
-#include <intel_gpu/primitives/input_layout.hpp>
-
-#include <cstddef>
-
-using namespace cldnn;
-using namespace ::tests;
-
-TEST(embedding_bag_fp16_gpu, packed_sum_basic) {
-    //  emb_table : 5x2
-    //  indices : 3x2
-    //  per_sample_weights : 3x2
-    //  Output : 3x2
-    //  Input values in fp16
-    auto& engine = get_test_engine();
-
-    auto emb_table = engine.allocate_memory({ data_types::f16, format::bfyx, { 5, 2, 1, 1 } });
-    auto indices = engine.allocate_memory({ data_types::i32, format::bfyx, { 3, 2, 1, 1 } });
-    auto per_sample_weights = engine.allocate_memory({ data_types::f16, format::bfyx, { 3, 2, 1, 1 } });
-    tensor output_shape = {3, 2, 1, 1};
-
-    set_values(emb_table, {
-            ov::float16(-0.2f), ov::float16(-0.6f),
-            ov::float16(-0.1f), ov::float16(-0.4f),
-            ov::float16(-1.9f), ov::float16(-1.8f),
-            ov::float16(-1.0f), ov::float16(1.5f),
-            ov::float16(0.8f), ov::float16(-0.7f)
-    });
-    set_values<int32_t>(indices, {
-            0, 2,
-            1, 2,
-            3, 4
-    });
-    set_values(per_sample_weights, {
-            ov::float16(0.5f), ov::float16(0.5f),
-            ov::float16(0.5f), ov::float16(0.5f),
-            ov::float16(0.5f), ov::float16(0.5f)
-    });
-
-    auto type = embedding_bag::packed_sum;
-    topology topology;
-    topology.add(input_layout("Input0", emb_table->get_layout()));
-    topology.add(input_layout("Input1", indices->get_layout()));
-    topology.add(data("Input2", per_sample_weights));
-    topology.add(
-            embedding_bag("embedding_bag", { input_info("Input0"), input_info("Input1"), input_info("Input2") }, type, output_shape)
-    );
-
-    network network(engine, topology, get_test_default_config(engine));
-
-    network.set_input_data("Input0", emb_table);
-    network.set_input_data("Input1", indices);
-
-    auto outputs = network.execute();
-
-    auto output = outputs.at("embedding_bag").get_memory();
-    cldnn::mem_lock<uint16_t> output_ptr(output, get_test_stream());
-
-    std::vector<float> expected_results = {
-            -1.05f, -1.2f,
-            -1.f, -1.1f,
-            -0.1f, 0.4f
-    };
-
-    for (size_t i = 0; i < expected_results.size(); ++i) {
-        ASSERT_TRUE(are_equal(expected_results[i], half_to_float(output_ptr[i]))) << i;
-    }
-}
-
-TEST(embedding_bag_fp16_gpu, packed_sum_basic_without_weights) {
-    //  emb_table : 5x2
-    //  indices : 3x2
-    //  Output : 3x2
-    //  Input values in fp16
-    auto& engine = get_test_engine();
-
-    auto emb_table = engine.allocate_memory({ data_types::f16, format::bfyx, { 5, 2, 1, 1 } });
-    auto indices = engine.allocate_memory({ data_types::i32, format::bfyx, { 3, 2, 1, 1 } });
-    tensor output_shape = {3, 2, 1, 1};
-
-    set_values(emb_table, {
-            ov::float16(-0.2f), ov::float16(-0.6f),
-            ov::float16(-0.1f), ov::float16(-0.4f),
-            ov::float16(-1.9f), ov::float16(-1.8f),
-            ov::float16(-1.0f), ov::float16(1.5f),
-            ov::float16(0.8f), ov::float16(-0.7f)
-    });
-    set_values<int32_t>(indices, {
-            0, 2,
-            1, 2,
-            3, 4
-    });
-
-    auto type = embedding_bag::packed_sum;
-    topology topology;
-    topology.add(input_layout("Input0", emb_table->get_layout()));
-    topology.add(input_layout("Input1", indices->get_layout()));
-    topology.add(
-            embedding_bag("embedding_bag", { input_info("Input0"), input_info("Input1") }, type, output_shape)
-    );
-
-    network network(engine, topology, get_test_default_config(engine));
-
-    network.set_input_data("Input0", emb_table);
-    network.set_input_data("Input1", indices);
-
-    auto outputs = network.execute();
-
-    auto output = outputs.at("embedding_bag").get_memory();
-    cldnn::mem_lock<uint16_t> output_ptr(output, get_test_stream());
-
-    std::vector<float> expected_results = {
-            -2.1f, -2.4f,
-            -2.f, -2.2f,
-            -0.2f, 0.8f
-    };
-
-    for (size_t i = 0; i < expected_results.size(); ++i) {
-        ASSERT_TRUE(are_equal(expected_results[i], half_to_float(output_ptr[i]))) << i;
-    }
-}
-
-TEST(embedding_bag_fp16_gpu, packed_sum_dim2) {
-    //  emb_table : 5x2x2
-    //  indices : 3x2
-    //  per_sample_weights : 3x2
-    //  Output : 3x2x2
-    //  Input values in fp16
-    //  Input values in fp16
-    auto& engine = get_test_engine();
-
-    auto emb_table = engine.allocate_memory({ data_types::f16, format::bfyx, { 5, 2, 2, 1 } });
-    auto indices = engine.allocate_memory({ data_types::i32, format::bfyx, { 3, 2, 1, 1 } });
-    auto per_sample_weights = engine.allocate_memory({ data_types::f16, format::bfyx, { 3, 2, 1, 1 } });
-    tensor output_shape = {3, 2, 2, 1};
-
-    /*
-     * [ 5
-     *   [ 2
-     *       [ -0.2, 1.3 ], [ 0.5, -0.3 ]
-     *   ],
-     *   [ 2
-     *       [ 2.3, 1.3 ], [ -0.4, -0.7 ]
-     *   ],
-     *   [ 2
-     *       [ 3.3, -4.1 ], [ 2.1, 0.8 ]
-     *   ],
-     *   [ 2
-     *       [ 3.5, -5.7 ], [ -0.1, 0.3 ]
-     *   ],
-     *   [ 2
-     *       [ 0.3, 1.0 ], [ 2.3, -4.1 ]
-     *   ]
-     * ]
-     */
-    set_values(emb_table, {
-            ov::float16(-0.2f), ov::float16( 1.3f), ov::float16( 0.5f), ov::float16(-0.3f),
-            ov::float16( 2.3f), ov::float16( 1.3f), ov::float16(-0.4f), ov::float16(-0.7f),
-            ov::float16( 3.3f), ov::float16(-4.1f), ov::float16( 2.1f), ov::float16( 0.8f),
-            ov::float16( 3.5f), ov::float16(-5.7f), ov::float16(-0.1f), ov::float16( 0.3f),
-            ov::float16( 0.3f), ov::float16( 1.0f), ov::float16( 2.3f), ov::float16(-4.1f)
-    });
-    set_values<int32_t>(indices, {
-            0, 2,
-            1, 2,
-            3, 4
-    });
-    set_values(per_sample_weights, {
-            ov::float16(0.5f), ov::float16(0.5f),
-            ov::float16(0.5f), ov::float16(0.5f),
-            ov::float16(0.5f), ov::float16(0.5f)
-    });
-
-    auto type = embedding_bag::packed_sum;
-    topology topology;
-    topology.add(input_layout("Input0", emb_table->get_layout()));
-    topology.add(input_layout("Input1", indices->get_layout()));
-    topology.add(data("Input2", per_sample_weights));
-    topology.add(
-            embedding_bag("embedding_bag", { input_info("Input0"), input_info("Input1"), input_info("Input2") }, type, output_shape)
-    );
-
-    network network(engine, topology, get_test_default_config(engine));
-
-    network.set_input_data("Input0", emb_table);
-    network.set_input_data("Input1", indices);
-
-    auto outputs = network.execute();
-
-    auto output = outputs.at("embedding_bag").get_memory();
-    cldnn::mem_lock<uint16_t> output_ptr(output, get_test_stream());
-
-    /*
-     * [ 3
-     *   [ 2
-     *       [ 1.55, -1.4 ], [ 1.3, 0.25 ]
-     *   ],
-     *   [ 2
-     *       [ 2.8, -1.4 ], [ 0.85, 0.05 ]
-     *   ],
-     *   [ 2
-     *       [ 1.9, -2.35 ], [ 1.1, -1.9 ]
-     *   ],
-     * ]
-     */
-    std::vector<float> expected_results = {
-            1.55f,  -1.4f,  1.3f,  0.25f,
-             2.8f,  -1.4f, 0.85f,  0.05f,
-             1.9f, -2.35f,  1.1f,  -1.9f
-    };
-
-    for (size_t i = 0; i < expected_results.size(); ++i) {
-        ASSERT_TRUE(are_equal(expected_results[i], half_to_float(output_ptr[i]), static_cast<float>(1e-2))) << i;
-    }
-}
-
-TEST(embedding_bag_fp16_gpu, packed_sum_dim3) {
-    //  emb_table : 5x2x3x2
-    //  indices : 3x2
-    //  per_sample_weights : 3x2
-    //  Output : 3x2x3x2
-    //  Input values in fp16
-    auto& engine = get_test_engine();
-
-    auto emb_table = engine.allocate_memory({ data_types::f16, format::bfyx, { 5, 2, 3, 2 } });
-    auto indices = engine.allocate_memory({ data_types::i32, format::bfyx, { 3, 2, 1, 1 } });
-    auto per_sample_weights = engine.allocate_memory({ data_types::f16, format::bfyx, { 3, 2, 1, 1 } });
-    tensor output_shape = {3, 2, 3, 2};
-
-    /*
-     * [ 5
-     *   [ 2
-     *     [ 3
-     *       [ -0.2, 1.3 ], [ 0.5, -0.3 ], [ 0.4, -0.4 ]
-     *     ],
-     *     [ 3
-     *       [ -0.1, 1.0 ], [ 2.1, 0.7 ], [ -0.2, -0.7 ]
-     *     ],
-     *   ],
-     *   [ 2
-     *     [ 3
-     *       [ 1.9, -2.4 ], [ 3.4, -0.7 ], [ -0.4, 0.5 ]
-     *     ],
-     *     [ 3
-     *       [ 2.3, 1.3 ], [ -0.4, -0.7 ], [ 1.8, -0.9 ]
-     *     ],
-     *   ],
-     *   [ 2
-     *     [ 3
-     *       [ 1.5, -2.4 ], [ 4.2, 3.2 ], [ -0.6, 0.9 ]
-     *     ],
-     *     [ 3
-     *       [ 3.3, -4.1 ], [ 2.1, 0.8 ], [ 5.2, -2.5 ]
-     *     ],
-     *   ],
-     *   [ 2
-     *     [ 3
-     *       [ 0.8, -1.9 ], [ 0.7, 3.4 ], [ -3.3, 0.1 ]
-     *     ],
-     *     [ 3
-     *       [ 3.5, -5.7 ], [ -0.1, 0.3 ], [ 0.4, 3.3 ]
-     *     ],
-     *   ],
-     *   [ 2
-     *     [ 3
-     *       [ 6.1, 8.3 ], [ 0.4, -4.4 ], [ -5.2, 0.9 ]
-     *     ],
-     *     [ 3
-     *       [ 0.3, 1.0 ], [ 2.3, -4.1 ], [ 2.0, -5.7 ]
-     *     ],
-     *   ]
-     * ]
-     */
-    set_values(emb_table, {
-            ov::float16(-0.2f), ov::float16( 1.3f), ov::float16( 0.5f), ov::float16(-0.3f), ov::float16( 0.4f), ov::float16(-0.4f),
-            ov::float16(-0.1f), ov::float16( 1.0f), ov::float16( 2.1f), ov::float16( 0.7f), ov::float16(-0.2f), ov::float16(-0.7f),
-            ov::float16( 1.9f), ov::float16(-2.4f), ov::float16( 3.4f), ov::float16(-0.7f), ov::float16(-0.4f), ov::float16( 0.5f),
-            ov::float16( 2.3f), ov::float16( 1.3f), ov::float16(-0.4f), ov::float16(-0.7f), ov::float16( 1.8f), ov::float16(-0.9f),
-            ov::float16( 1.5f), ov::float16(-2.4f), ov::float16( 4.2f), ov::float16( 3.2f), ov::float16(-0.6f), ov::float16( 0.9f),
-            ov::float16( 3.3f), ov::float16(-4.1f), ov::float16( 2.1f), ov::float16( 0.8f), ov::float16( 5.2f), ov::float16(-2.5f),
-            ov::float16( 0.8f), ov::float16(-1.9f), ov::float16( 0.7f), ov::float16( 3.4f), ov::float16(-3.3f), ov::float16( 0.1f),
-            ov::float16( 3.5f), ov::float16(-5.7f), ov::float16(-0.1f), ov::float16( 0.3f), ov::float16( 0.4f), ov::float16( 3.3f),
-            ov::float16( 6.1f), ov::float16( 8.3f), ov::float16( 0.4f), ov::float16(-4.4f), ov::float16(-5.2f), ov::float16( 0.9f),
-            ov::float16( 0.3f), ov::float16( 1.0f), ov::float16( 2.3f), ov::float16(-4.1f), ov::float16( 2.0f), ov::float16(-5.7f)
-    });
-    set_values<int32_t>(indices, {
-            0, 2,
-            1, 2,
-            3, 4
-    });
-    set_values(per_sample_weights, {
-            ov::float16(0.5f), ov::float16(0.5f),
-            ov::float16(0.5f), ov::float16(0.5f),
-            ov::float16(0.5f), ov::float16(0.5f)
-    });
-
-    auto type = embedding_bag::packed_sum;
-    topology topology;
-    topology.add(input_layout("Input0", emb_table->get_layout()));
-    topology.add(input_layout("Input1", indices->get_layout()));
-    topology.add(data("Input2", per_sample_weights));
-    topology.add(
-            embedding_bag("embedding_bag", { input_info("Input0"), input_info("Input1"), input_info("Input2") }, type, output_shape)
-    );
-
-    network network(engine, topology, get_test_default_config(engine));
-
-    network.set_input_data("Input0", emb_table);
-    network.set_input_data("Input1", indices);
-
-    auto outputs = network.execute();
-
-    auto output = outputs.at("embedding_bag").get_memory();
-    cldnn::mem_lock<uint16_t> output_ptr(output, get_test_stream());
-
-    /*
-     * [ 3
-     *   [ 2
-     *     [ 3
-     *       [ 0.65, -0.55 ], [ 2.35, 1.45 ], [ -0.1, 0.25 ]
-     *     ],
-     *     [ 3
-     *       [ 1.6, -1.55 ], [ 2.1, 0.75 ], [ 2.5, -1.6 ]
-     *     ],
-     *   ],
-     *   [ 2
-     *     [ 3
-     *       [ 1.7, -2.4 ], [ 3.8, 1.25 ], [ -0.5, 0.7 ]
-     *     ],
-     *     [ 3
-     *       [ 2.8, -1.4 ], [ 0.85, 0.05 ], [ 3.5, -1.7 ]
-     *     ],
-     *   ],
-     *   [ 2
-     *     [ 3
-     *       [ 3.45, 3.2 ], [ 0.55, -0.5 ], [ -4.25, 0.5 ]
-     *     ],
-     *     [ 3
-     *       [ 1.9, -2.35 ], [ 1.1, -1.9 ], [ 1.2, -1.2 ]
-     *     ],
-     *   ]
-     * ]
-     */
-    std::vector<float> expected_results = {
-        0.65f, -0.55f, 2.35f, 1.45f,  -0.1f, 0.25f,
-         1.6f, -1.55f,  2.1f, 0.75f,   2.5f, -1.6f,
-         1.7f,  -2.4f,  3.8f, 1.25f,  -0.5f,  0.7f,
-         2.8f,  -1.4f, 0.85f, 0.05f,   3.5f, -1.7f,
-        3.45f,   3.2f, 0.55f, -0.5f, -4.25f,  0.5f,
-         1.9f, -2.35f,  1.1f, -1.9f,   1.2f, -1.2f
-    };
-
-    for (size_t i = 0; i < expected_results.size(); ++i) {
-        ASSERT_TRUE(are_equal(expected_results[i], half_to_float(output_ptr[i]), static_cast<float>(1e-2))) << i;
-    }
-}
-
-TEST(embedding_bag_fp16_gpu, offsets_sum_basic) {
-    //  emb_table : 5x2
-    //  indices : 4x1
-    //  offsets : 3x1
-    //  per_sample_weights : 4x1
-    //  default_index : 1x1
-    //  Output : 3x2
-    //  Input values in fp16
-    auto& engine = get_test_engine();
-
-    auto emb_table = engine.allocate_memory({ data_types::f16, format::bfyx, { 5, 2, 1, 1 } });
-    auto indices = engine.allocate_memory({ data_types::i32, format::bfyx, { 4, 1, 1, 1 } });
-    auto offsets = engine.allocate_memory({ data_types::i32, format::bfyx, { 3, 1, 1, 1 } });
-    auto per_sample_weights = engine.allocate_memory({ data_types::f16, format::bfyx, { 4, 1, 1, 1 } });
-    tensor output_shape = {3, 2, 1, 1};
-
-    set_values(emb_table, {
-            ov::float16(-0.2f), ov::float16(-0.6f),
-            ov::float16(-0.1f), ov::float16(-0.4f),
-            ov::float16(-1.9f), ov::float16(-1.8f),
-            ov::float16(-1.0f), ov::float16(1.5f),
-            ov::float16(0.8f), ov::float16(-0.7f)
-    });
-    set_values<int32_t>(indices, {
-            0, 2, 3, 4
-    });
-    set_values<int32_t>(offsets, {
-            0, 2, 2
-    });
-    set_values(per_sample_weights, {
-            ov::float16(0.5f), ov::float16(0.5f), ov::float16(0.5f), ov::float16(0.5f)
-    });
-
-    auto type = embedding_bag::offsets_sum;
-    topology topology;
-    topology.add(input_layout("Input0", emb_table->get_layout()));
-    topology.add(input_layout("Input1", indices->get_layout()));
-    topology.add(input_layout("Input2", offsets->get_layout()));
-    topology.add(data("Input3", per_sample_weights));
-    topology.add(
-            embedding_bag("embedding_bag", { input_info("Input0"), input_info("Input1"), input_info("Input2"), input_info("Input3") }, type, output_shape, 0)
-    );
-    network network(engine, topology, get_test_default_config(engine));
-
-    network.set_input_data("Input0", emb_table);
-    network.set_input_data("Input1", indices);
-    network.set_input_data("Input2", offsets);
-
-    auto outputs = network.execute();
-
-    auto output = outputs.at("embedding_bag").get_memory();
-    cldnn::mem_lock<uint16_t> output_ptr(output, get_test_stream());
-
-    std::vector<float> expected_results = {
-            -1.05f, -1.2f,
-            -0.2f, -0.6f,
-            -0.1f, 0.4f
-    };
-
-    for (size_t i = 0; i < expected_results.size(); ++i) {
-        ASSERT_TRUE(are_equal(expected_results[i], half_to_float(output_ptr[i]))) << i;
-    }
-}
-
-TEST(embedding_bag_fp16_gpu, offsets_sum_basic_first_empty) {
-    //  emb_table : 5x2
-    //  indices : 4x1
-    //  offsets : 3x1
-    //  per_sample_weights : 4x1
-    //  default_index : 1x1
-    //  Output : 3x2
-    //  Input values in fp16
-    auto& engine = get_test_engine();
-
-    auto emb_table = engine.allocate_memory({ data_types::f16, format::bfyx, { 5, 2, 1, 1 } });
-    auto indices = engine.allocate_memory({ data_types::i32, format::bfyx, { 4, 1, 1, 1 } });
-    auto offsets = engine.allocate_memory({ data_types::i32, format::bfyx, { 3, 1, 1, 1 } });
-    auto per_sample_weights = engine.allocate_memory({ data_types::f16, format::bfyx, { 4, 1, 1, 1 } });
-    tensor output_shape = {3, 2, 1, 1};
-
-    set_values(emb_table, {
-            ov::float16(-0.2f), ov::float16(-0.6f),
-            ov::float16(-0.1f), ov::float16(-0.4f),
-            ov::float16(-1.9f), ov::float16(-1.8f),
-            ov::float16(-1.0f), ov::float16(1.5f),
-            ov::float16(0.8f), ov::float16(-0.7f)
-    });
-    set_values<int32_t>(indices, {
-            0, 2, 3, 4
-    });
-    set_values<int32_t>(offsets, {
-            0, 0, 2
-    });
-    set_values(per_sample_weights, {
-            ov::float16(0.5f), ov::float16(0.5f), ov::float16(0.5f), ov::float16(0.5f)
-    });
-
-    auto type = embedding_bag::offsets_sum;
-    topology topology;
-    topology.add(input_layout("Input0", emb_table->get_layout()));
-    topology.add(input_layout("Input1", indices->get_layout()));
-    topology.add(input_layout("Input2", offsets->get_layout()));
-    topology.add(data("Input3", per_sample_weights));
-    topology.add(
-            embedding_bag("embedding_bag", { input_info("Input0"), input_info("Input1"), input_info("Input2"), input_info("Input3") }, type, output_shape, 2)
-    );
-
-    network network(engine, topology, get_test_default_config(engine));
-
-    network.set_input_data("Input0", emb_table);
-    network.set_input_data("Input1", indices);
-    network.set_input_data("Input2", offsets);
-
-    auto outputs = network.execute();
-
-    auto output = outputs.at("embedding_bag").get_memory();
-    cldnn::mem_lock<uint16_t> output_ptr(output, get_test_stream());
-
-    std::vector<float> expected_results = {
-            -1.9f, -1.8f,
-            -1.05f, -1.2f,
-            -0.1f, 0.4f
-    };
-
-    for (size_t i = 0; i < expected_results.size(); ++i) {
-        ASSERT_TRUE(are_equal(expected_results[i], half_to_float(output_ptr[i]))) << i;
-    }
-}
-
-TEST(embedding_bag_fp16_gpu, offsets_sum_basic_last_empty) {
-    //  emb_table : 5x2
-    //  indices : 4x1
-    //  offsets : 3x1
-    //  per_sample_weights : 4x1
-    //  default_index : 1x1
-    //  Output : 3x2
-    //  Input values in fp16
-    auto& engine = get_test_engine();
-
-    auto emb_table = engine.allocate_memory({ data_types::f16, format::bfyx, { 5, 2, 1, 1 } });
-    auto indices = engine.allocate_memory({ data_types::i32, format::bfyx, { 4, 1, 1, 1 } });
-    auto offsets = engine.allocate_memory({ data_types::i32, format::bfyx, { 3, 1, 1, 1 } });
-    auto per_sample_weights = engine.allocate_memory({ data_types::f16, format::bfyx, { 4, 1, 1, 1 } });
-    tensor output_shape = {3, 2, 1, 1};
-
-    set_values(emb_table, {
-            ov::float16(-0.2f), ov::float16(-0.6f),
-            ov::float16(-0.1f), ov::float16(-0.4f),
-            ov::float16(-1.9f), ov::float16(-1.8f),
-            ov::float16(-1.0f), ov::float16(1.5f),
-            ov::float16(0.8f), ov::float16(-0.7f)
-    });
-    set_values<int32_t>(indices, {
-            0, 2, 3, 4
-    });
-    set_values<int32_t>(offsets, {
-            0, 2, 4
-    });
-    set_values(per_sample_weights, {
-            ov::float16(0.5f), ov::float16(0.5f), ov::float16(0.5f), ov::float16(0.5f)
-    });
-
-    auto type = embedding_bag::offsets_sum;
-    topology topology;
-    topology.add(input_layout("Input0", emb_table->get_layout()));
-    topology.add(input_layout("Input1", indices->get_layout()));
-    topology.add(input_layout("Input2", offsets->get_layout()));
-    topology.add(data("Input3", per_sample_weights));
-    topology.add(
-            embedding_bag("embedding_bag", { input_info("Input0"), input_info("Input1"), input_info("Input2"), input_info("Input3") }, type, output_shape, 2)
-    );
-
-    network network(engine, topology, get_test_default_config(engine));
-
-    network.set_input_data("Input0", emb_table);
-    network.set_input_data("Input1", indices);
-    network.set_input_data("Input2", offsets);
-
-    auto outputs = network.execute();
-
-    auto output = outputs.at("embedding_bag").get_memory();
-    cldnn::mem_lock<uint16_t> output_ptr(output, get_test_stream());
-
-    std::vector<float> expected_results = {
-            -1.05f, -1.2f,
-            -0.1f, 0.4f,
-            -1.9f, -1.8f
-    };
-
-    for (size_t i = 0; i < expected_results.size(); ++i) {
-        ASSERT_TRUE(are_equal(expected_results[i], half_to_float(output_ptr[i]))) << i;
-    }
-}
-
-TEST(embedding_bag_fp16_gpu, offsets_sum_without_weights_and_def_index) {
-    //  emb_table : 5x2
-    //  indices : 4x1
-    //  offsets : 3x1
-    //  Output : 3x2
-    //  Input values in fp16
-    auto& engine = get_test_engine();
-
-    auto emb_table = engine.allocate_memory({ data_types::f16, format::bfyx, { 5, 2, 1, 1 } });
-    auto indices = engine.allocate_memory({ data_types::i32, format::bfyx, { 4, 1, 1, 1 } });
-    auto offsets = engine.allocate_memory({ data_types::i32, format::bfyx, { 3, 1, 1, 1 } });
-    tensor output_shape = {3, 2, 1, 1};
-
-    set_values(emb_table, {
-            ov::float16(-0.2f), ov::float16(-0.6f),
-            ov::float16(-0.1f), ov::float16(-0.4f),
-            ov::float16(-1.9f), ov::float16(-1.8f),
-            ov::float16(-1.0f), ov::float16(1.5f),
-            ov::float16(0.8f), ov::float16(-0.7f)
-    });
-    set_values<int32_t>(indices, {
-            0, 2, 3, 4
-    });
-    set_values<int32_t>(offsets, {
-            0, 2, 2
-    });
-
-    auto type = embedding_bag::offsets_sum;
-    topology topology;
-    topology.add(input_layout("Input0", emb_table->get_layout()));
-    topology.add(input_layout("Input1", indices->get_layout()));
-    topology.add(input_layout("Input2", offsets->get_layout()));
-    topology.add(
-            embedding_bag("embedding_bag", { input_info("Input0"), input_info("Input1"), input_info("Input2") }, type, output_shape)
-    );
-
-    network network(engine, topology, get_test_default_config(engine));
-
-    network.set_input_data("Input0", emb_table);
-    network.set_input_data("Input1", indices);
-    network.set_input_data("Input2", offsets);
-
-    auto outputs = network.execute();
-
-    auto output = outputs.at("embedding_bag").get_memory();
-    cldnn::mem_lock<uint16_t> output_ptr(output, get_test_stream());
-
-    std::vector<float> expected_results = {
-            -2.1f, -2.4f,
-                0,     0,
-            -0.2f,  0.8f
-    };
-
-    for (size_t i = 0; i < expected_results.size(); ++i) {
-        ASSERT_TRUE(are_equal(expected_results[i], half_to_float(output_ptr[i]))) << i;
-    }
-}
-
-TEST(embedding_bag_fp16_gpu, offsets_sum_dim3) {
-    //  emb_table : 5x2x3x2
-    //  indices : 4x1
-    //  offsets : 3x1
-    //  per_sample_weights : 4x1
-    //  default_index : 1x1
-    //  Output : 3x2x3x2
-    //  Input values in fp16
-    auto& engine = get_test_engine();
-
-    auto emb_table = engine.allocate_memory({ data_types::f16, format::bfyx, { 5, 2, 3, 2 } });
-    auto indices = engine.allocate_memory({ data_types::i32, format::bfyx, { 4, 1, 1, 1 } });
-    auto offsets = engine.allocate_memory({ data_types::i32, format::bfyx, { 3, 1, 1, 1 } });
-    auto per_sample_weights = engine.allocate_memory({ data_types::f16, format::bfyx, { 4, 1, 1, 1 } });
-    tensor output_shape = {3, 2, 3, 2};
-
-    /*
-     * [ 5
-     *   [ 2
-     *     [ 3
-     *       [ -0.2, 1.3 ], [ 0.5, -0.3 ], [ 0.4, -0.4 ]
-     *     ],
-     *     [ 3
-     *       [ -0.1, 1.0 ], [ 2.1, 0.7 ], [ -0.2, -0.7 ]
-     *     ],
-     *   ],
-     *   [ 2
-     *     [ 3
-     *       [ 1.9, -2.4 ], [ 3.4, -0.7 ], [ -0.4, 0.5 ]
-     *     ],
-     *     [ 3
-     *       [ 2.3, 1.3 ], [ -0.4, -0.7 ], [ 1.8, -0.9 ]
-     *     ],
-     *   ],
-     *   [ 2
-     *     [ 3
-     *       [ 1.5, -2.4 ], [ 4.2, 3.2 ], [ -0.6, 0.9 ]
-     *     ],
-     *     [ 3
-     *       [ 3.3, -4.1 ], [ 2.1, 0.8 ], [ 5.2, -2.5 ]
-     *     ],
-     *   ],
-     *   [ 2
-     *     [ 3
-     *       [ 0.8, -1.9 ], [ 0.7, 3.4 ], [ -3.3, 0.1 ]
-     *     ],
-     *     [ 3
-     *       [ 3.5, -5.7 ], [ -0.1, 0.3 ], [ 0.4, 3.3 ]
-     *     ],
-     *   ],
-     *   [ 2
-     *     [ 3
-     *       [ 6.1, 8.3 ], [ 0.4, -4.4 ], [ -5.2, 0.9 ]
-     *     ],
-     *     [ 3
-     *       [ 0.3, 1.0 ], [ 2.3, -4.1 ], [ 2.0, -5.7 ]
-     *     ],
-     *   ]
-     * ]
-     */
-    set_values(emb_table, {
-            ov::float16(-0.2f), ov::float16( 1.3f), ov::float16( 0.5f), ov::float16(-0.3f), ov::float16( 0.4f), ov::float16(-0.4f),
-            ov::float16(-0.1f), ov::float16( 1.0f), ov::float16( 2.1f), ov::float16( 0.7f), ov::float16(-0.2f), ov::float16(-0.7f),
-            ov::float16( 1.9f), ov::float16(-2.4f), ov::float16( 3.4f), ov::float16(-0.7f), ov::float16(-0.4f), ov::float16( 0.5f),
-            ov::float16( 2.3f), ov::float16( 1.3f), ov::float16(-0.4f), ov::float16(-0.7f), ov::float16( 1.8f), ov::float16(-0.9f),
-            ov::float16( 1.5f), ov::float16(-2.4f), ov::float16( 4.2f), ov::float16( 3.2f), ov::float16(-0.6f), ov::float16( 0.9f),
-            ov::float16( 3.3f), ov::float16(-4.1f), ov::float16( 2.1f), ov::float16( 0.8f), ov::float16( 5.2f), ov::float16(-2.5f),
-            ov::float16( 0.8f), ov::float16(-1.9f), ov::float16( 0.7f), ov::float16( 3.4f), ov::float16(-3.3f), ov::float16( 0.1f),
-            ov::float16( 3.5f), ov::float16(-5.7f), ov::float16(-0.1f), ov::float16( 0.3f), ov::float16( 0.4f), ov::float16( 3.3f),
-            ov::float16( 6.1f), ov::float16( 8.3f), ov::float16( 0.4f), ov::float16(-4.4f), ov::float16(-5.2f), ov::float16( 0.9f),
-            ov::float16( 0.3f), ov::float16( 1.0f), ov::float16( 2.3f), ov::float16(-4.1f), ov::float16( 2.0f), ov::float16(-5.7f)
-    });
-    set_values<int32_t>(indices, {
-            0, 2, 3, 4
-    });
-    set_values<int32_t>(offsets, {
-            0, 2, 2
-    });
-    set_values(per_sample_weights, {
-            ov::float16(0.5f), ov::float16(0.5f),
-            ov::float16(0.5f), ov::float16(0.5f)
-    });
-
-    auto type = embedding_bag::offsets_sum;
-    topology topology;
-    topology.add(input_layout("Input0", emb_table->get_layout()));
-    topology.add(input_layout("Input1", indices->get_layout()));
-    topology.add(input_layout("Input2", offsets->get_layout()));
-    topology.add(data("Input3", per_sample_weights));
-    topology.add(
-            embedding_bag("embedding_bag", { input_info("Input0"), input_info("Input1"), input_info("Input2"), input_info("Input3") }, type, output_shape, 0)
-    );
-
-    network network(engine, topology, get_test_default_config(engine));
-
-    network.set_input_data("Input0", emb_table);
-    network.set_input_data("Input1", indices);
-    network.set_input_data("Input2", offsets);
-
-    auto outputs = network.execute();
-
-    auto output = outputs.at("embedding_bag").get_memory();
-    cldnn::mem_lock<uint16_t> output_ptr(output, get_test_stream());
-
-    /*
-     * [ 3
-     *   [ 2
-     *     [ 3
-     *       [ 0.65, -0.55 ], [ 2.35, 1.45 ], [ -0.1, 0.25 ]
-     *     ],
-     *     [ 3
-     *       [ 1.6, -1.55 ], [ 2.1, 0.75 ], [ 2.5, -1.6 ]
-     *     ],
-     *   ],
-     *   [ 2
-     *     [ 3
-     *       [ -0.2, 1.3 ], [ 0.5, -0.3 ], [ 0.4, -0.4 ]
-     *     ],
-     *     [ 3
-     *       [ -0.1, 1.0 ], [ 2.1, 0.7 ], [ -0.2, -0.7 ]
-     *     ],
-     *   ],
-     *   [ 2
-     *     [ 3
-     *       [ 3.45, 3.2 ], [ 0.55, -0.5 ], [ -4.25, 0.5 ]
-     *     ],
-     *     [ 3
-     *       [ 1.9, -2.35 ], [ 1.1, -1.9 ], [ 1.2, -1.2 ]
-     *     ],
-     *   ]
-     * ]
-     */
-    std::vector<float> expected_results = {
-        0.65f, -0.55f, 2.35f, 1.45f,  -0.1f, 0.25f,
-         1.6f, -1.55f,  2.1f, 0.75f,   2.5f, -1.6f,
-        -0.2f,   1.3f,  0.5f, -0.3f,   0.4f, -0.4f,
-        -0.1f,   1.0f,  2.1f,  0.7f,  -0.2f, -0.7f,
-        3.45f,   3.2f, 0.55f, -0.5f, -4.25f,  0.5f,
-         1.9f, -2.35f,  1.1f, -1.9f,   1.2f, -1.2f
-    };
-
-    for (size_t i = 0; i < expected_results.size(); ++i) {
-        ASSERT_TRUE(are_equal(expected_results[i], half_to_float(output_ptr[i]), static_cast<float>(1e-2))) << i;
-    }
-}
-
-TEST(embedding_bag_fp16_gpu, segments_sum_basic) {
-    //  emb_table : 5x2
-    //  indices : 4x1
-    //  segment_ids : 4x1
-    //  per_sample_weights : 4x1
-    //  default_index : 1x1
-    //  Output : 3x2
-    //  Input values in fp16
-    auto& engine = get_test_engine();
-
-    auto emb_table = engine.allocate_memory({ data_types::f16, format::bfyx, { 5, 2, 1, 1 } });
-    auto indices = engine.allocate_memory({ data_types::i32, format::bfyx, { 4, 1, 1, 1 } });
-    auto segment_ids = engine.allocate_memory({ data_types::i32, format::bfyx, { 4, 1, 1, 1 } });
-    auto per_sample_weights = engine.allocate_memory({ data_types::f16, format::bfyx, { 4, 1, 1, 1 } });
-    tensor output_shape = {3, 2, 1, 1};
-
-    set_values(emb_table, {
-            ov::float16(-0.2f), ov::float16(-0.6f),
-            ov::float16(-0.1f), ov::float16(-0.4f),
-            ov::float16(-1.9f), ov::float16(-1.8f),
-            ov::float16(-1.0f), ov::float16(1.5f),
-            ov::float16(0.8f), ov::float16(-0.7f)
-    });
-    set_values<int32_t>(indices, {
-            0, 2, 3, 4
-    });
-    set_values<int32_t>(segment_ids, {
-            0, 0, 2, 2
-    });
-    set_values(per_sample_weights, {
-            ov::float16(0.5f), ov::float16(0.5f), ov::float16(0.5f), ov::float16(0.5f)
-    });
-
-    auto type = embedding_bag::segments_sum;
-    topology topology;
-    topology.add(input_layout("Input0", emb_table->get_layout()));
-    topology.add(input_layout("Input1", indices->get_layout()));
-    topology.add(input_layout("Input2", segment_ids->get_layout()));
-    topology.add(data("Input3", per_sample_weights));
-    topology.add(
-            embedding_bag("embedding_bag", { input_info("Input0"), input_info("Input1"), input_info("Input2"), input_info("Input3") }, type, output_shape, 0)
-    );
-
-    network network(engine, topology, get_test_default_config(engine));
-
-    network.set_input_data("Input0", emb_table);
-    network.set_input_data("Input1", indices);
-    network.set_input_data("Input2", segment_ids);
-
-    auto outputs = network.execute();
-
-    auto output = outputs.at("embedding_bag").get_memory();
-    cldnn::mem_lock<uint16_t> output_ptr(output, get_test_stream());
-
-    std::vector<float> expected_results = {
-            -1.05f, -1.2f,
-            -0.2f, -0.6f,
-            -0.1f, 0.4f
-    };
-
-    for (size_t i = 0; i < expected_results.size(); ++i) {
-        ASSERT_TRUE(are_equal(expected_results[i], half_to_float(output_ptr[i]))) << i;
-    }
-}
-
-TEST(embedding_bag_fp16_gpu, segments_sum_basic_first_empty) {
-    //  emb_table : 5x2
-    //  indices : 4x1
-    //  segment_ids : 4x1
-    //  per_sample_weights : 4x1
-    //  default_index : 1x1
-    //  Output : 3x2
-    //  Input values in fp16
-    auto& engine = get_test_engine();
-
-    auto emb_table = engine.allocate_memory({ data_types::f16, format::bfyx, { 5, 2, 1, 1 } });
-    auto indices = engine.allocate_memory({ data_types::i32, format::bfyx, { 4, 1, 1, 1 } });
-    auto segment_ids = engine.allocate_memory({ data_types::i32, format::bfyx, { 4, 1, 1, 1 } });
-    auto per_sample_weights = engine.allocate_memory({ data_types::f16, format::bfyx, { 4, 1, 1, 1 } });
-    tensor output_shape = {3, 2, 1, 1};
-
-    set_values(emb_table, {
-            ov::float16(-0.2f), ov::float16(-0.6f),
-            ov::float16(-0.1f), ov::float16(-0.4f),
-            ov::float16(-1.9f), ov::float16(-1.8f),
-            ov::float16(-1.0f), ov::float16(1.5f),
-            ov::float16(0.8f), ov::float16(-0.7f)
-    });
-    set_values<int32_t>(indices, {
-            0, 2, 3, 4
-    });
-    set_values<int32_t>(segment_ids, {
-            1, 1, 2, 2
-    });
-    set_values(per_sample_weights, {
-            ov::float16(0.5f), ov::float16(0.5f), ov::float16(0.5f), ov::float16(0.5f)
-    });
-
-    auto type = embedding_bag::segments_sum;
-    topology topology;
-    topology.add(input_layout("Input0", emb_table->get_layout()));
-    topology.add(input_layout("Input1", indices->get_layout()));
-    topology.add(input_layout("Input2", segment_ids->get_layout()));
-    topology.add(data("Input3", per_sample_weights));
-    topology.add(
-            embedding_bag("embedding_bag", { input_info("Input0"), input_info("Input1"), input_info("Input2"), input_info("Input3") }, type, output_shape, 2)
-    );
-
-    network network(engine, topology, get_test_default_config(engine));
-
-    network.set_input_data("Input0", emb_table);
-    network.set_input_data("Input1", indices);
-    network.set_input_data("Input2", segment_ids);
-
-    auto outputs = network.execute();
-
-    auto output = outputs.at("embedding_bag").get_memory();
-    cldnn::mem_lock<uint16_t> output_ptr(output, get_test_stream());
-
-    std::vector<float> expected_results = {
-            -1.9f, -1.8f,
-            -1.05f, -1.2f,
-            -0.1f, 0.4f
-    };
-
-    for (size_t i = 0; i < expected_results.size(); ++i) {
-        ASSERT_TRUE(are_equal(expected_results[i], half_to_float(output_ptr[i]))) << i;
-    }
-}
-
-TEST(embedding_bag_fp16_gpu, segments_sum_basic_last_empty) {
-    //  emb_table : 5x2
-    //  indices : 4x1
-    //  segment_ids : 4x1
-    //  per_sample_weights : 4x1
-    //  default_index : 1x1
-    //  Output : 3x2
-    //  Input values in fp16
-    auto& engine = get_test_engine();
-
-    auto emb_table = engine.allocate_memory({ data_types::f16, format::bfyx, { 5, 2, 1, 1 } });
-    auto indices = engine.allocate_memory({ data_types::i32, format::bfyx, { 4, 1, 1, 1 } });
-    auto segment_ids = engine.allocate_memory({ data_types::i32, format::bfyx, { 4, 1, 1, 1 } });
-    auto per_sample_weights = engine.allocate_memory({ data_types::f16, format::bfyx, { 4, 1, 1, 1 } });
-    tensor output_shape = {3, 2, 1, 1};
-
-    set_values(emb_table, {
-            ov::float16(-0.2f), ov::float16(-0.6f),
-            ov::float16(-0.1f), ov::float16(-0.4f),
-            ov::float16(-1.9f), ov::float16(-1.8f),
-            ov::float16(-1.0f), ov::float16(1.5f),
-            ov::float16(0.8f), ov::float16(-0.7f)
-    });
-    set_values<int32_t>(indices, {
-            0, 2, 3, 4
-    });
-    set_values<int32_t>(segment_ids, {
-            0, 0, 1, 1
-    });
-    set_values(per_sample_weights, {
-            ov::float16(0.5f), ov::float16(0.5f), ov::float16(0.5f), ov::float16(0.5f)
-    });
-
-    auto type = embedding_bag::segments_sum;
-    topology topology;
-    topology.add(input_layout("Input0", emb_table->get_layout()));
-    topology.add(input_layout("Input1", indices->get_layout()));
-    topology.add(input_layout("Input2", segment_ids->get_layout()));
-    topology.add(data("Input3", per_sample_weights));
-    topology.add(
-            embedding_bag("embedding_bag", { input_info("Input0"), input_info("Input1"), input_info("Input2"), input_info("Input3") }, type, output_shape, 2)
-    );
-
-    network network(engine, topology, get_test_default_config(engine));
-
-    network.set_input_data("Input0", emb_table);
-    network.set_input_data("Input1", indices);
-    network.set_input_data("Input2", segment_ids);
-
-    auto outputs = network.execute();
-
-    auto output = outputs.at("embedding_bag").get_memory();
-    cldnn::mem_lock<uint16_t> output_ptr(output, get_test_stream());
-
-    std::vector<float> expected_results = {
-            -1.05f, -1.2f,
-            -0.1f, 0.4f,
-            -1.9f, -1.8f
-    };
-
-    for (size_t i = 0; i < expected_results.size(); ++i) {
-        ASSERT_TRUE(are_equal(expected_results[i], half_to_float(output_ptr[i]))) << i;
-    }
-}
-
-TEST(embedding_bag_fp16_gpu, segments_sum_without_weights_and_def_index) {
-    //  emb_table : 5x2
-    //  indices : 4x1
-    //  segment_ids : 4x1
-    //  Output : 3x2
-    //  Input values in fp16
-    auto& engine = get_test_engine();
-
-    auto emb_table = engine.allocate_memory({ data_types::f16, format::bfyx, { 5, 2, 1, 1 } });
-    auto indices = engine.allocate_memory({ data_types::i32, format::bfyx, { 4, 1, 1, 1 } });
-    auto segment_ids = engine.allocate_memory({ data_types::i32, format::bfyx, { 4, 1, 1, 1 } });
-    tensor output_shape = {3, 2, 1, 1};
-
-    set_values(emb_table, {
-            ov::float16(-0.2f), ov::float16(-0.6f),
-            ov::float16(-0.1f), ov::float16(-0.4f),
-            ov::float16(-1.9f), ov::float16(-1.8f),
-            ov::float16(-1.0f), ov::float16(1.5f),
-            ov::float16(0.8f), ov::float16(-0.7f)
-    });
-    set_values<int32_t>(indices, {
-            0, 2, 3, 4
-    });
-    set_values<int32_t>(segment_ids, {
-            0, 0, 2, 2
-    });
-
-    auto type = embedding_bag::segments_sum;
-    topology topology;
-    topology.add(input_layout("Input0", emb_table->get_layout()));
-    topology.add(input_layout("Input1", indices->get_layout()));
-    topology.add(input_layout("Input2", segment_ids->get_layout()));
-    topology.add(
-            embedding_bag("embedding_bag", { input_info("Input0"), input_info("Input1"), input_info("Input2") }, type, output_shape)
-    );
-
-    network network(engine, topology, get_test_default_config(engine));
-
-    network.set_input_data("Input0", emb_table);
-    network.set_input_data("Input1", indices);
-    network.set_input_data("Input2", segment_ids);
-
-    auto outputs = network.execute();
-
-    auto output = outputs.at("embedding_bag").get_memory();
-    cldnn::mem_lock<uint16_t> output_ptr(output, get_test_stream());
-
-    std::vector<float> expected_results = {
-            -2.1f, -2.4f,
-                0,     0,
-            -0.2f,  0.8f
-    };
-
-    for (size_t i = 0; i < expected_results.size(); ++i) {
-        ASSERT_TRUE(are_equal(expected_results[i], half_to_float(output_ptr[i]))) << i;
-    }
-}
-
-TEST(embedding_bag_fp16_gpu, segments_sum_dim3) {
-    //  emb_table : 5x2x3x2
-    //  indices : 4x1
-    //  segment_ids : 4x1
-    //  per_sample_weights : 4x1
-    //  default_index : 1x1
-    //  Output : 3x2x3x2
-    //  Input values in fp16
-    auto& engine = get_test_engine();
-
-    auto emb_table = engine.allocate_memory({ data_types::f16, format::bfyx, { 5, 2, 3, 2 } });
-    auto indices = engine.allocate_memory({ data_types::i32, format::bfyx, { 4, 1, 1, 1 } });
-    auto segment_ids = engine.allocate_memory({ data_types::i32, format::bfyx, { 4, 1, 1, 1 } });
-    auto per_sample_weights = engine.allocate_memory({ data_types::f16, format::bfyx, { 4, 1, 1, 1 } });
-    tensor output_shape = {3, 2, 3, 2};
-
-    /*
-     * [ 5
-     *   [ 2
-     *     [ 3
-     *       [ -0.2, 1.3 ], [ 0.5, -0.3 ], [ 0.4, -0.4 ]
-     *     ],
-     *     [ 3
-     *       [ -0.1, 1.0 ], [ 2.1, 0.7 ], [ -0.2, -0.7 ]
-     *     ],
-     *   ],
-     *   [ 2
-     *     [ 3
-     *       [ 1.9, -2.4 ], [ 3.4, -0.7 ], [ -0.4, 0.5 ]
-     *     ],
-     *     [ 3
-     *       [ 2.3, 1.3 ], [ -0.4, -0.7 ], [ 1.8, -0.9 ]
-     *     ],
-     *   ],
-     *   [ 2
-     *     [ 3
-     *       [ 1.5, -2.4 ], [ 4.2, 3.2 ], [ -0.6, 0.9 ]
-     *     ],
-     *     [ 3
-     *       [ 3.3, -4.1 ], [ 2.1, 0.8 ], [ 5.2, -2.5 ]
-     *     ],
-     *   ],
-     *   [ 2
-     *     [ 3
-     *       [ 0.8, -1.9 ], [ 0.7, 3.4 ], [ -3.3, 0.1 ]
-     *     ],
-     *     [ 3
-     *       [ 3.5, -5.7 ], [ -0.1, 0.3 ], [ 0.4, 3.3 ]
-     *     ],
-     *   ],
-     *   [ 2
-     *     [ 3
-     *       [ 6.1, 8.3 ], [ 0.4, -4.4 ], [ -5.2, 0.9 ]
-     *     ],
-     *     [ 3
-     *       [ 0.3, 1.0 ], [ 2.3, -4.1 ], [ 2.0, -5.7 ]
-     *     ],
-     *   ]
-     * ]
-     */
-    set_values(emb_table, {
-            ov::float16(-0.2f), ov::float16( 1.3f), ov::float16( 0.5f), ov::float16(-0.3f), ov::float16( 0.4f), ov::float16(-0.4f),
-            ov::float16(-0.1f), ov::float16( 1.0f), ov::float16( 2.1f), ov::float16( 0.7f), ov::float16(-0.2f), ov::float16(-0.7f),
-            ov::float16( 1.9f), ov::float16(-2.4f), ov::float16( 3.4f), ov::float16(-0.7f), ov::float16(-0.4f), ov::float16( 0.5f),
-            ov::float16( 2.3f), ov::float16( 1.3f), ov::float16(-0.4f), ov::float16(-0.7f), ov::float16( 1.8f), ov::float16(-0.9f),
-            ov::float16( 1.5f), ov::float16(-2.4f), ov::float16( 4.2f), ov::float16( 3.2f), ov::float16(-0.6f), ov::float16( 0.9f),
-            ov::float16( 3.3f), ov::float16(-4.1f), ov::float16( 2.1f), ov::float16( 0.8f), ov::float16( 5.2f), ov::float16(-2.5f),
-            ov::float16( 0.8f), ov::float16(-1.9f), ov::float16( 0.7f), ov::float16( 3.4f), ov::float16(-3.3f), ov::float16( 0.1f),
-            ov::float16( 3.5f), ov::float16(-5.7f), ov::float16(-0.1f), ov::float16( 0.3f), ov::float16( 0.4f), ov::float16( 3.3f),
-            ov::float16( 6.1f), ov::float16( 8.3f), ov::float16( 0.4f), ov::float16(-4.4f), ov::float16(-5.2f), ov::float16( 0.9f),
-            ov::float16( 0.3f), ov::float16( 1.0f), ov::float16( 2.3f), ov::float16(-4.1f), ov::float16( 2.0f), ov::float16(-5.7f)
-    });
-    set_values<int32_t>(indices, {
-            0, 2, 3, 4
-    });
-    set_values<int32_t>(segment_ids, {
-            0, 0, 2, 2
-    });
-    set_values(per_sample_weights, {
-            ov::float16(0.5f), ov::float16(0.5f),
-            ov::float16(0.5f), ov::float16(0.5f)
-    });
-
-    auto type = embedding_bag::segments_sum;
-    topology topology;
-    topology.add(input_layout("Input0", emb_table->get_layout()));
-    topology.add(input_layout("Input1", indices->get_layout()));
-    topology.add(input_layout("Input2", segment_ids->get_layout()));
-    topology.add(data("Input3", per_sample_weights));
-    topology.add(
-            embedding_bag("embedding_bag", { input_info("Input0"), input_info("Input1"), input_info("Input2"), input_info("Input3") }, type, output_shape, 0)
-    );
-
-    network network(engine, topology, get_test_default_config(engine));
-
-    network.set_input_data("Input0", emb_table);
-    network.set_input_data("Input1", indices);
-    network.set_input_data("Input2", segment_ids);
-
-    auto outputs = network.execute();
-
-    auto output = outputs.at("embedding_bag").get_memory();
-    cldnn::mem_lock<uint16_t> output_ptr(output, get_test_stream());
-
-    /*
-     * [ 3
-     *   [ 2
-     *     [ 3
-     *       [ 0.65, -0.55 ], [ 2.35, 1.45 ], [ -0.1, 0.25 ]
-     *     ],
-     *     [ 3
-     *       [ 1.6, -1.55 ], [ 2.1, 0.75 ], [ 2.5, -1.6 ]
-     *     ],
-     *   ],
-     *   [ 2
-     *     [ 3
-     *       [ -0.2, 1.3 ], [ 0.5, -0.3 ], [ 0.4, -0.4 ]
-     *     ],
-     *     [ 3
-     *       [ -0.1, 1.0 ], [ 2.1, 0.7 ], [ -0.2, -0.7 ]
-     *     ],
-     *   ],
-     *   [ 2
-     *     [ 3
-     *       [ 3.45, 3.2 ], [ 0.55, -0.5 ], [ -4.25, 0.5 ]
-     *     ],
-     *     [ 3
-     *       [ 1.9, -2.35 ], [ 1.1, -1.9 ], [ 1.2, -1.2 ]
-     *     ],
-     *   ]
-     * ]
-     */
-    std::vector<float> expected_results = {
-        0.65f, -0.55f, 2.35f, 1.45f,  -0.1f, 0.25f,
-         1.6f, -1.55f,  2.1f, 0.75f,   2.5f, -1.6f,
-        -0.2f,   1.3f,  0.5f, -0.3f,   0.4f, -0.4f,
-        -0.1f,   1.0f,  2.1f,  0.7f,  -0.2f, -0.7f,
-        3.45f,   3.2f, 0.55f, -0.5f, -4.25f,  0.5f,
-         1.9f, -2.35f,  1.1f, -1.9f,   1.2f, -1.2f
-    };
-
-    for (size_t i = 0; i < expected_results.size(); ++i) {
-        ASSERT_TRUE(are_equal(expected_results[i], half_to_float(output_ptr[i]), static_cast<float>(1e-2))) << i;
-    }
-}
-
-TEST(embedding_bag_fp32_gpu, packed_sum_basic) {
-    //  emb_table : 5x2
-    //  indices : 3x2
-    //  per_sample_weights : 3x2
-    //  Output : 3x2
-    //  Input values in fp16
-    auto& engine = get_test_engine();
-
-    auto emb_table = engine.allocate_memory({ data_types::f32, format::bfyx, { 5, 2, 1, 1 } });
-    auto indices = engine.allocate_memory({ data_types::i32, format::bfyx, { 3, 2, 1, 1 } });
-    auto per_sample_weights = engine.allocate_memory({ data_types::f32, format::bfyx, { 3, 2, 1, 1 } });
-    tensor output_shape = {3, 2, 1, 1};
-
-    set_values(emb_table, {
-            -0.2f, -0.6f,
-            -0.1f, -0.4f,
-            -1.9f, -1.8f,
-            -1.0f, 1.5f,
-            0.8f, -0.7f
-    });
-    set_values<int32_t>(indices, {
-            0, 2,
-            1, 2,
-            3, 4
-    });
-    set_values(per_sample_weights, {
-            0.5f, 0.5f,
-            0.5f, 0.5f,
-            0.5f, 0.5f
-    });
-
-    auto type = embedding_bag::packed_sum;
-    topology topology;
-    topology.add(input_layout("Input0", emb_table->get_layout()));
-    topology.add(input_layout("Input1", indices->get_layout()));
-    topology.add(data("Input2", per_sample_weights));
-    topology.add(
-            embedding_bag("embedding_bag", { input_info("Input0"), input_info("Input1"), input_info("Input2") }, type, output_shape)
-    );
-
-    network network(engine, topology, get_test_default_config(engine));
-
-    network.set_input_data("Input0", emb_table);
-    network.set_input_data("Input1", indices);
-
-    auto outputs = network.execute();
-
-    auto output = outputs.at("embedding_bag").get_memory();
-    cldnn::mem_lock<float> output_ptr(output, get_test_stream());
-
-    std::vector<float> expected_results = {
-            -1.05f, -1.2f,
-            -1.f, -1.1f,
-            -0.1f, 0.4f
-    };
-
-    for (size_t i = 0; i < expected_results.size(); ++i) {
-        ASSERT_TRUE(are_equal(expected_results[i], output_ptr[i])) << i;
-    }
-}
-
-TEST(embedding_bag_fp32_gpu, packed_sum_dim3) {
-    //  emb_table : 5x2x3x2
-    //  indices : 3x2
-    //  per_sample_weights : 3x2
-    //  Output : 3x2x3x2
-    //  Input values in fp16
-    auto& engine = get_test_engine();
-
-    auto emb_table = engine.allocate_memory({ data_types::f32, format::bfyx, { 5, 2, 3, 2 } });
-    auto indices = engine.allocate_memory({ data_types::i32, format::bfyx, { 3, 2, 1, 1 } });
-    auto per_sample_weights = engine.allocate_memory({ data_types::f32, format::bfyx, { 3, 2, 1, 1 } });
-    tensor output_shape = {3, 2, 3, 2};
-
-    /*
-     * [ 5
-     *   [ 2
-     *     [ 3
-     *       [ -0.2, 1.3 ], [ 0.5, -0.3 ], [ 0.4, -0.4 ]
-     *     ],
-     *     [ 3
-     *       [ -0.1, 1.0 ], [ 2.1, 0.7 ], [ -0.2, -0.7 ]
-     *     ],
-     *   ],
-     *   [ 2
-     *     [ 3
-     *       [ 1.9, -2.4 ], [ 3.4, -0.7 ], [ -0.4, 0.5 ]
-     *     ],
-     *     [ 3
-     *       [ 2.3, 1.3 ], [ -0.4, -0.7 ], [ 1.8, -0.9 ]
-     *     ],
-     *   ],
-     *   [ 2
-     *     [ 3
-     *       [ 1.5, -2.4 ], [ 4.2, 3.2 ], [ -0.6, 0.9 ]
-     *     ],
-     *     [ 3
-     *       [ 3.3, -4.1 ], [ 2.1, 0.8 ], [ 5.2, -2.5 ]
-     *     ],
-     *   ],
-     *   [ 2
-     *     [ 3
-     *       [ 0.8, -1.9 ], [ 0.7, 3.4 ], [ -3.3, 0.1 ]
-     *     ],
-     *     [ 3
-     *       [ 3.5, -5.7 ], [ -0.1, 0.3 ], [ 0.4, 3.3 ]
-     *     ],
-     *   ],
-     *   [ 2
-     *     [ 3
-     *       [ 6.1, 8.3 ], [ 0.4, -4.4 ], [ -5.2, 0.9 ]
-     *     ],
-     *     [ 3
-     *       [ 0.3, 1.0 ], [ 2.3, -4.1 ], [ 2.0, -5.7 ]
-     *     ],
-     *   ]
-     * ]
-     */
-    set_values(emb_table, {
-            -0.2f,  1.3f,  0.5f, -0.3f,  0.4f, -0.4f,
-            -0.1f,  1.0f,  2.1f,  0.7f, -0.2f, -0.7f,
-             1.9f, -2.4f,  3.4f, -0.7f, -0.4f,  0.5f,
-             2.3f,  1.3f, -0.4f, -0.7f,  1.8f, -0.9f,
-             1.5f, -2.4f,  4.2f,  3.2f, -0.6f,  0.9f,
-             3.3f, -4.1f,  2.1f,  0.8f,  5.2f, -2.5f,
-             0.8f, -1.9f,  0.7f,  3.4f, -3.3f,  0.1f,
-             3.5f, -5.7f, -0.1f,  0.3f,  0.4f,  3.3f,
-             6.1f,  8.3f,  0.4f, -4.4f, -5.2f,  0.9f,
-             0.3f,  1.0f,  2.3f, -4.1f,  2.0f, -5.7f
-    });
-    set_values<int32_t>(indices, {
-            0, 2,
-            1, 2,
-            3, 4
-    });
-    set_values(per_sample_weights, {
-            0.5f, 0.5f,
-            0.5f, 0.5f,
-            0.5f, 0.5f
-    });
-
-    auto type = embedding_bag::packed_sum;
-    topology topology;
-    topology.add(input_layout("Input0", emb_table->get_layout()));
-    topology.add(input_layout("Input1", indices->get_layout()));
-    topology.add(data("Input2", per_sample_weights));
-    topology.add(
-            embedding_bag("embedding_bag", { input_info("Input0"), input_info("Input1"), input_info("Input2") }, type, output_shape)
-    );
-
-    network network(engine, topology, get_test_default_config(engine));
-
-    network.set_input_data("Input0", emb_table);
-    network.set_input_data("Input1", indices);
-
-    auto outputs = network.execute();
-
-    auto output = outputs.at("embedding_bag").get_memory();
-    cldnn::mem_lock<float> output_ptr(output, get_test_stream());
-
-    /*
-     * [ 3
-     *   [ 2
-     *     [ 3
-     *       [ 0.65, -0.55 ], [ 2.35, 1.45 ], [ -0.1, 0.25 ]
-     *     ],
-     *     [ 3
-     *       [ 1.6, -1.55 ], [ 2.1, 0.75 ], [ 2.5, -1.6 ]
-     *     ],
-     *   ],
-     *   [ 2
-     *     [ 3
-     *       [ 1.7, -2.4 ], [ 3.8, 1.25 ], [ -0.5, 0.7 ]
-     *     ],
-     *     [ 3
-     *       [ 2.8, -1.4 ], [ 0.85, 0.05 ], [ 3.5, -1.7 ]
-     *     ],
-     *   ],
-     *   [ 2
-     *     [ 3
-     *       [ 3.45, 3.2 ], [ 0.55, -0.5 ], [ -4.25, 0.5 ]
-     *     ],
-     *     [ 3
-     *       [ 1.9, -2.35 ], [ 1.1, -1.9 ], [ 1.2, -1.2 ]
-     *     ],
-     *   ]
-     * ]
-     */
-    std::vector<float> expected_results = {
-        0.65f, -0.55f, 2.35f, 1.45f,  -0.1f, 0.25f,
-         1.6f, -1.55f,  2.1f, 0.75f,   2.5f, -1.6f,
-         1.7f,  -2.4f,  3.8f, 1.25f,  -0.5f,  0.7f,
-         2.8f,  -1.4f, 0.85f, 0.05f,   3.5f, -1.7f,
-        3.45f,   3.2f, 0.55f, -0.5f, -4.25f,  0.5f,
-         1.9f, -2.35f,  1.1f, -1.9f,   1.2f, -1.2f
-    };
-
-    for (size_t i = 0; i < expected_results.size(); ++i) {
-        ASSERT_TRUE(are_equal(expected_results[i], output_ptr[i])) << i;
-    }
-}
-
-template <typename T>
-void test_embedding_bag_fp32_gpu_extended5_6(bool is_caching_test) {
-    //  emb_table : 5x2
-    //  indices : 3x2
-    //  per_sample_weights : 3x2
-    //  Output : 3x2
-    //  Input values in fp16
-    auto& engine = get_test_engine();
-
-    auto emb_table = engine.allocate_memory({ data_types::f32, format::bfyx, { 5, 6, 1, 1 } });
-    auto indices = engine.allocate_memory({ data_types::i32, format::bfyx, { 5, 1, 1, 1 } });
-    auto segment_ids = engine.allocate_memory({ data_types::i32, format::bfyx, { 5, 1, 1, 1 } });
-    tensor output_shape = {5, 6, 1, 1};
-
-    set_values(emb_table, {
-            0.f, 1.f, 8.f,  5.f, 5.f,  2.f,
-            0.f, 7.f, 7.f, 10.f, 4.f,  5.f,
-            9.f, 0.f, 0.f,  5.f, 7.f,  0.f,
-            4.f, 0.f, 4.f,  7.f, 6.f, 10.f,
-            9.f, 5.f, 1.f,  7.f, 4.f,  7.f
-    });
-    set_values<int32_t>(indices, { 0, 1, 2, 2, 3 });
-    set_values<int32_t>(segment_ids, { 0, 0, 2, 2, 4 });
-
-    auto type = embedding_bag::segments_sum;
-    topology topology;
-    topology.add(input_layout("Input0", emb_table->get_layout()));
-    topology.add(input_layout("Input1", indices->get_layout()));
-    topology.add(input_layout("Input2", segment_ids->get_layout()));
-    topology.add(
-            embedding_bag("embedding_bag", { input_info("Input0"), input_info("Input1"), input_info("Input2") }, type, output_shape)
-    );
-
-    cldnn::network::ptr network = get_network(engine, topology, get_test_default_config(engine), get_test_stream_ptr(), is_caching_test);
-
-    network->set_input_data("Input0", emb_table);
-    network->set_input_data("Input1", indices);
-    network->set_input_data("Input2", segment_ids);
-
-    auto outputs = network->execute();
-
-    auto output = outputs.at("embedding_bag").get_memory();
-    cldnn::mem_lock<T> output_ptr(output, get_test_stream());
-
-    std::vector<T> expected_results = {
-            0, 8, 15,  15, 9,  7,
-            0, 0, 0, 0, 0,  0,
-            18, 0, 0,  10, 14,  0,
-            0, 0, 0,  0, 0,  0,
-            4, 0, 4,  7, 6, 10,
-    };
-
-    for (size_t i = 0; i < expected_results.size(); ++i) {
-        ASSERT_TRUE(are_equal(expected_results[i], output_ptr[i])) << i;
-    }
-}
-
-TEST(embedding_bag_fp32_gpu, extended5_6) {
-    test_embedding_bag_fp32_gpu_extended5_6<float>(false);
-}
-
-TEST(export_import_embedding_bag_fp32_gpu, extended5_6) {
-    test_embedding_bag_fp32_gpu_extended5_6<float>(true);
-}
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/empty_tensor_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/empty_tensor_gpu_test.cpp
index 0f377c40824275..a33455e9aa9b68 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/empty_tensor_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/empty_tensor_gpu_test.cpp
@@ -47,7 +47,7 @@ TEST_P(test_empty_tensor, concat_two_inputs) {
 
     ExecutionConfig config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::optimize_data(true));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     network network(engine, topology, config);
 
     std::vector<int32_t> nonzero_input_with_all_zero(p.nonzero_input_layout.count());
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/experimental_detectron_detection_output_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/experimental_detectron_detection_output_gpu_test.cpp
deleted file mode 100644
index 877d0e621b09bc..00000000000000
--- a/src/plugins/intel_gpu/tests/unit/test_cases/experimental_detectron_detection_output_gpu_test.cpp
+++ /dev/null
@@ -1,456 +0,0 @@
-// Copyright (C) 2022 Intel Corporation
-// SPDX-License-Identifier: Apache-2.0
-//
-
-#include <intel_gpu/primitives/experimental_detectron_detection_output.hpp>
-#include <intel_gpu/primitives/input_layout.hpp>
-#include <intel_gpu/primitives/mutable_data.hpp>
-
-#include "test_utils.h"
-
-using namespace cldnn;
-using namespace ::tests;
-
-namespace {
-
-template <typename T>
-std::vector<T> getValues(const std::vector<float>& values) {
-    std::vector<T> result(values.begin(), values.end());
-    return result;
-}
-
-template <typename T>
-float getError();
-
-template <>
-float getError<float>() {
-    return 0.001;
-}
-
-template <>
-float getError<ov::float16>() {
-    return 0.2;
-}
-
-};  // namespace
-
-template <typename T>
-struct ExperimentalDetectronDetectionOutputParams {
-    float score_threshold;
-    float nms_threshold;
-    float max_delta_log_wh;
-    int num_classes;
-    int post_nms_count;
-    int max_detections_per_image;
-    bool class_agnostic_box_regression;
-    std::vector<float> deltas_weights;
-
-    size_t roi_count;
-
-    std::vector<T> boxes;
-    std::vector<T> deltas;
-    std::vector<T> scores;
-    std::vector<T> im_info;
-
-    std::vector<T> expected_boxes;
-    std::vector<int32_t> expected_classes;
-    std::vector<T> expected_scores;
-};
-
-template <typename T>
-using ExperimentalDetectronDetectionOutputParamsWithLayout =
-        std::tuple<ExperimentalDetectronDetectionOutputParams<T>, format::type, bool>;
-
-template <typename T>
-struct experimental_detectron_detection_output_test
-    : public ::testing::TestWithParam<ExperimentalDetectronDetectionOutputParamsWithLayout<T>> {
-public:
-    void test() {
-        ExperimentalDetectronDetectionOutputParams<T> param;
-        format::type fmt;
-        bool is_caching_test;
-        std::tie(param, fmt, is_caching_test) = this->GetParam();
-        auto data_type = ov::element::from<T>();
-
-        auto& engine = get_test_engine();
-
-        const primitive_id input_boxes_id = "InputBoxes";
-        const auto input_boxes =
-            engine.allocate_memory({data_type, format::bfyx, tensor{batch(param.roi_count), feature(4)}});
-        set_values(input_boxes, param.boxes);
-
-        const primitive_id input_deltas_id = "InputDeltas";
-        auto input_deltas = engine.allocate_memory(
-            {data_type, format::bfyx, tensor{batch(param.roi_count), feature(param.num_classes * 4)}});
-        set_values(input_deltas, param.deltas);
-
-        const primitive_id input_scores_id = "InputScores";
-        auto input_scores = engine.allocate_memory(
-            {data_type, format::bfyx, tensor{batch(param.roi_count), feature(param.num_classes)}});
-        set_values(input_scores, param.scores);
-
-        const primitive_id input_im_info_id = "InputImInfo";
-        const auto input_im_info = engine.allocate_memory({data_type, format::bfyx, tensor{batch(1), feature(3)}});
-        set_values(input_im_info, param.im_info);
-
-        topology topology;
-
-        topology.add(input_layout(input_boxes_id, input_boxes->get_layout()));
-        topology.add(input_layout(input_deltas_id, input_deltas->get_layout()));
-        topology.add(input_layout(input_scores_id, input_scores->get_layout()));
-        topology.add(input_layout(input_im_info_id, input_im_info->get_layout()));
-
-        const primitive_id b_input_boxes_id = "BlockedInputBoxes";
-        const primitive_id b_input_deltas_id = "BlockedInputDeltas";
-        const primitive_id b_input_scores_id = "BlockedInputScores";
-        const primitive_id b_input_im_info_id = "BlockedInputImInfo";
-
-        topology.add(reorder(b_input_boxes_id, input_info(input_boxes_id), fmt, data_type));
-        topology.add(reorder(b_input_deltas_id, input_info(input_deltas_id), fmt, data_type));
-        topology.add(reorder(b_input_scores_id, input_info(input_scores_id), fmt, data_type));
-        topology.add(reorder(b_input_im_info_id, input_info(input_im_info_id), fmt, data_type));
-
-        const primitive_id b_output_scores_id = "BlockedOutputScores";
-        const primitive_id b_output_classes_id = "BlockedOutputClasses";
-        const layout output_scores_layout = {data_type, fmt, tensor{batch(param.max_detections_per_image)}};
-        auto b_output_scores = engine.allocate_memory(output_scores_layout);
-        const layout output_classes_layout = {data_types::i32, fmt, tensor{batch(param.max_detections_per_image)}};
-        auto b_output_classes = engine.allocate_memory(output_classes_layout);
-
-        topology.add(mutable_data(b_output_classes_id, b_output_classes));
-        topology.add(mutable_data(b_output_scores_id, b_output_scores));
-
-        const primitive_id b_eddo_id = "blocked_experimental_detectron_detection_output";
-        const auto b_eddo_primitive = experimental_detectron_detection_output{
-            b_eddo_id,
-            input_info(b_input_boxes_id),
-            input_info(b_input_deltas_id),
-            input_info(b_input_scores_id),
-            input_info(b_input_im_info_id),
-            input_info(b_output_classes_id),
-            input_info(b_output_scores_id),
-            param.score_threshold,
-            param.nms_threshold,
-            param.num_classes,
-            param.post_nms_count,
-            param.max_detections_per_image,
-            param.class_agnostic_box_regression,
-            param.max_delta_log_wh,
-            param.deltas_weights,
-        };
-
-        topology.add(b_eddo_primitive);
-        const primitive_id eddo_id = "experimental_detectron_detection_output";
-        topology.add(reorder(eddo_id, input_info(b_eddo_primitive) /*b_eddo_id*/, format::bfyx, data_type));
-
-        cldnn::network::ptr network = get_network(engine, topology, get_test_default_config(engine), get_test_stream_ptr(), is_caching_test);
-
-        network->set_input_data(input_boxes_id, input_boxes);
-        network->set_input_data(input_deltas_id, input_deltas);
-        network->set_input_data(input_scores_id, input_scores);
-        network->set_input_data(input_im_info_id, input_im_info);
-        const auto outputs = network->execute();
-
-        const auto output_boxes = outputs.at(eddo_id).get_memory();
-        const cldnn::mem_lock<T> output_boxes_ptr(output_boxes, get_test_stream());
-        ASSERT_EQ(output_boxes_ptr.size(), param.max_detections_per_image * 4);
-
-        const primitive_id output_scores_id = "OutputScores";
-        cldnn::topology reorder_score_topology;
-        reorder_score_topology.add(input_layout(b_output_scores_id, output_scores_layout));
-        reorder_score_topology.add(reorder(output_scores_id, input_info(b_output_scores_id), format::bfyx, data_type));
-        cldnn::network reorder_score_net{engine, reorder_score_topology, get_test_default_config(engine)};
-        reorder_score_net.set_input_data(b_output_scores_id, b_output_scores);
-        const auto score_result = reorder_score_net.execute();
-        const auto output_scores = score_result.at(output_scores_id).get_memory();
-        const cldnn::mem_lock<T> output_scores_ptr(output_scores, get_test_stream());
-        ASSERT_EQ(output_scores_ptr.size(), param.max_detections_per_image);
-
-        const primitive_id output_classes_id = "OutputClasses";
-        cldnn::topology reorder_classes_topology;
-        reorder_classes_topology.add(input_layout(b_output_classes_id, output_classes_layout));
-        reorder_classes_topology.add(reorder(output_classes_id, input_info(b_output_classes_id), format::bfyx, data_types::i32));
-        cldnn::network reorder_classes_net{engine, reorder_classes_topology, get_test_default_config(engine)};
-        reorder_classes_net.set_input_data(b_output_classes_id, b_output_classes);
-        const auto classes_result = reorder_classes_net.execute();
-        const auto output_classes = classes_result.at(output_classes_id).get_memory();
-        const cldnn::mem_lock<int32_t> output_classes_ptr(output_classes, get_test_stream());
-        ASSERT_EQ(output_classes_ptr.size(), param.max_detections_per_image);
-
-        const auto& expected_boxes = param.expected_boxes;
-        const auto& expected_classes = param.expected_classes;
-        const auto& expected_scores = param.expected_scores;
-        for (int i = 0; i < param.max_detections_per_image; ++i) {
-            if (!is_caching_test) {
-                ASSERT_NEAR(expected_scores[i], output_scores_ptr[i], 0.001) << "i=" << i;
-            }
-            for (size_t coord = 0; coord < 4; ++coord) {
-                const auto roi_idx = i * 4 + coord;
-                ASSERT_NEAR(expected_boxes[roi_idx], output_boxes_ptr[roi_idx], getError<T>())
-                    << "i=" << i << ", coord=" << coord;
-            }
-            if (!is_caching_test) {
-                ASSERT_EQ(expected_classes[i], output_classes_ptr[i]) << "i=" << i;
-            }
-        }
-    }
-};
-
-using experimental_detectron_detection_output_test_f32 = experimental_detectron_detection_output_test<float>;
-using experimental_detectron_detection_output_test_f16 = experimental_detectron_detection_output_test<ov::float16>;
-
-TEST_P(experimental_detectron_detection_output_test_f32, basic) {
-    ASSERT_NO_FATAL_FAILURE(test());
-}
-
-TEST_P(experimental_detectron_detection_output_test_f16, basic) {
-    ASSERT_NO_FATAL_FAILURE(test());
-}
-
-const std::vector<format::type> layouts{
-        format::bfyx,
-        format::b_fs_yx_fsv16,
-        format::b_fs_yx_fsv32,
-        format::bs_fs_yx_bsv16_fsv16,
-        format::bs_fs_yx_bsv32_fsv16,
-        format::bs_fs_yx_bsv32_fsv32};
-
-template <typename T>
-std::vector<ExperimentalDetectronDetectionOutputParams<T>> getExperimentalDetectronDetectionOutputParams() {
-    std::vector<ExperimentalDetectronDetectionOutputParams<T>> params = {
-        {
-            0.01000000074505806f,       // score_threshold
-            0.2f,                       // nms_threshold
-            2.0f,                       // max_delta_log_wh
-            2,                          // num_classes
-            500,                        // post_nms_count
-            5,                          // max_detections_per_image
-            true,                       // class_agnostic_box_regression
-            {10.0f, 10.0f, 5.0f, 5.0f}, // deltas_weights
-            16,                         // roi count
-
-            // boxes
-            getValues<T>({1.0f, 1.0f, 10.0f, 10.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f,
-                          1.0f, 1.0f, 1.0f, 4.0f, 1.0f, 8.0f, 5.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f,
-                          1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f,
-                          1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f,
-                          1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f}),
-
-            // deltas
-            getValues<T>(
-                {5.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f,
-                 1.0f, 1.0f, 1.0f, 1.0f, 4.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f,
-                 1.0f, 1.0f, 8.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f,
-                 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f,
-
-                 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f,
-                 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f,
-                 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f,
-                 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f}),
-
-            // scores
-            getValues<T>({1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f,
-                          1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f,
-                          1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f}),
-
-            // im_info
-            getValues<T>({1.0f, 1.0f, 1.0f}),
-
-            // out_boxes
-            getValues<T>({0.8929862f,
-                          0.892986297607421875,
-                          12.10701370239257812,
-                          12.10701370239257812,
-                          0.0f,
-                          0.0f,
-                          0.0f,
-                          0.0f,
-                          0.0f,
-                          0.0f,
-                          0.0f,
-                          0.0f,
-                          0.0f,
-                          0.0f,
-                          0.0f,
-                          0.0f,
-                          0.0f,
-                          0.0f,
-                          0.0f,
-                          0.0}),
-
-            // out_classes
-            std::vector<int32_t>{1, 0, 0, 0, 0},
-
-            // out_scores
-            getValues<T>({1.0f, 0.0f, 0.0f, 0.0f, 0.0f})
-        },
-        {
-            0.01000000074505806f,        // score_threshold
-            0.2f,                        // nms_threshold
-            2.0f,                        // max_delta_log_wh
-            2,                           // num_classes
-            500,                         // post_nms_count
-            5,                           // max_detections_per_image
-            true,                        // class_agnostic_box_regression
-            {10.0f, 10.0f, 5.0f, 5.0f},  // deltas_weights
-            16,                          // roi count
-
-            // boxes
-            getValues<T>({1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f,  1.0f,  1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 4.0f,
-                          1.0f, 8.0f, 5.0f, 1.0f, 1.0f, 10.0f, 10.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f,
-                          1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f,  1.0f,  1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f,
-                          1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f,  1.0f,  1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f,
-                          1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f,  1.0f,  1.0f, 1.0f, 1.0f, 1.0f, 1.0f}),
-
-            // deltas
-            getValues<T>({1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f,  1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 4.0f, 1.0f, 1.0f,
-                          1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f,  1.0f, 1.0f, 1.0f, 1.0f, 8.0f, 1.0f, 1.0f, 1.0f,
-                          1.0f, 1.0f, 5.0f, 1.0f, 1.0f, 1.0f, -1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f,
-                          1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f,  1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f,
-                          1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f,  1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f,
-                          1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f,  1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f,
-                          1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f,  1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f,
-                          1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f,  1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f,
-                          1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f, 1.0f,  1.0f}),
-
-            // scores
-            getValues<T>({0.5f, 0.5f, 0.5f, 0.5f, 0.5f, 0.5f, 0.5f, 0.5f, 0.8f, 0.9f, 0.5f,
-                          0.5f, 0.5f, 0.5f, 0.5f, 0.5f, 0.5f, 0.5f, 0.5f, 0.5f, 0.5f, 0.5f,
-                          0.5f, 0.5f, 0.5f, 0.5f, 0.5f, 0.5f, 0.5f, 0.5f, 0.5f, 0.5f}),
-
-            // im_info
-            getValues<T>({16.0f, 12.0f, 1.0f}),
-
-            // out_boxes
-            getValues<T>({ 0.0f, 0.892987f, 10.107f, 12.107f, 0.0f, 0.0f, 0.0f, 0.0f,
-                           0.0f, 0.0f,       0.0f,    0.0f,   0.0f, 0.0f, 0.0f, 0.0f,
-                           0.0f, 0.0f,       0.0f,    0.0f}),
-
-            // out_classes
-            std::vector<int32_t>{1, 0, 0, 0, 0},
-
-            // out_scores
-            getValues<T>({0.9f, 0.0f, 0.0f, 0.0f, 0.0f}),
-        },
-        {
-            0.0500000007,                // score_threshold
-            0.5,                         // nms_threshold
-            4.13516665,                  // max_delta_log_wh
-            5,                           // num_classes
-            10,                          // post_nms_count
-            10,                          // max_detections_per_image
-            false,                       // class_agnostic_box_regression
-            {10.0f, 10.0f, 5.0f, 5.0f},  // deltas_weights
-            10,                          // roi count
-
-            // boxes
-            getValues<T>({
-                4.90234,  6.57812, 5.23828,  9.19531, 8.51172, 2,       8.22266,  0.492188, 9.87109,  4.17188,
-                6.95703,  8.53906, 0.980469, 9.09375, 3.44141, 5.33594, 9.83984,  6.76562,  1.67578,  6.88281,
-                0.449219, 9.1875,  7.66016,  7.17969, 8.80859, 2.35938, 5.39453,  8.22656,  0.917969, 0.28125,
-                6.87891,  6.02344, 6.77734,  6.95312, 6.11328, 6.57031, 0.386719, 8.375,    5.09766,  9.86719,
-            }),
-
-            // deltas
-            getValues<T>({
-                4.90234,  6.57812,  5.23828,  9.19531,   8.51172,  2,        8.22266,   0.492188, 9.87109,  4.17188,
-                6.95703,  8.53906,  0.980469, 9.09375,   3.44141,  5.33594,  9.83984,   6.76562,  1.67578,  6.88281,
-                0.449219, 9.1875,   7.66016,  7.17969,   8.80859,  2.35938,  5.39453,   8.22656,  0.917969, 0.28125,
-                6.87891,  6.02344,  6.77734,  6.95312,   6.11328,  6.57031,  0.386719,  8.375,    5.09766,  9.86719,
-                3.74609,  4.54688,  5.83203,  5.91406,   2.85547,  7.46875,  4.31641,   2.71094,  9.71484,  1.14062,
-                6.55078,  0.257812, 4.32422,  9.5625,    8.53516,  0.554688, 8.68359,   2.73438,  6.26953,  5.60156,
-                2.79297,  8.65625,  5.75391,  5.39844,   2.65234,  7.32812,  8.98828,   7.94531,  6.26172,  4.75,
-                7.97266,  1.24219,  5.62109,  8.92188,   2.70703,  1.28906,  4.73047,   7.84375,  5.19141,  6.08594,
-                7.58984,  9.51562,  7.42578,  5.63281,   6.19922,  7.9375,   5.41016,   9.92969,  2.55859,  1.10938,
-                1.14453,  8.97656,  4.66797,  9.03125,   4.62891,  0.773438, 4.52734,   1.70312,  9.86328,  1.32031,
-                0.136719, 9.125,    2.84766,  4.61719,   9.49609,  5.29688,  5.58203,   0.664062, 2.60547,  6.21875,
-                8.06641,  5.46094,  1.46484,  7.89062,   0.300781, 5.00781,  0.0742188, 0.3125,   6.28516,  3.30469,
-                4.43359,  1.48438,  2.01953,  8.35156,   8.54297,  7.40625,  9.50391,   2.14844,  2.40234,  2.07812,
-                2.73828,  2.69531,  4.01172,  9.5,       7.72266,  9.99219,  1.37109,   3.67188,  2.45703,  2.03906,
-                0.480469, 4.59375,  2.94141,  4.83594,   1.33984,  0.265625, 1.17578,   4.38281,  5.94922,  8.6875,
-                5.16016,  0.679688, 4.30859,  5.85938,   4.89453,  7.72656,  4.41797,   5.78125,  4.37891,  1.52344,
-                8.27734,  4.45312,  3.61328,  4.07031,   7.88672,  9.875,    4.59766,   1.36719,  7.24609,  8.04688,
-                5.33203,  5.41406,  4.35547,  0.96875,   1.81641,  8.21094,  3.21484,   4.64062,  4.05078,  9.75781,
-                7.82422,  3.0625,   4.03516,  0.0546875, 8.18359,  8.23438,  1.76953,   1.10156,  2.29297,  8.15625,
-                9.25391,  0.898438, 6.15234,  8.82812,   6.48828,  7.44531,  1.76172,   2.25,     9.47266,  0.742188,
-            }),
-
-            // scores
-            getValues<T>({
-                4.90234,  6.57812, 5.23828,  9.19531, 8.51172, 2,       8.22266,  0.492188, 9.87109,  4.17188,
-                6.95703,  8.53906, 0.980469, 9.09375, 3.44141, 5.33594, 9.83984,  6.76562,  1.67578,  6.88281,
-                0.449219, 9.1875,  7.66016,  7.17969, 8.80859, 2.35938, 5.39453,  8.22656,  0.917969, 0.28125,
-                6.87891,  6.02344, 6.77734,  6.95312, 6.11328, 6.57031, 0.386719, 8.375,    5.09766,  9.86719,
-                3.74609,  4.54688, 5.83203,  5.91406, 2.85547, 7.46875, 4.31641,  2.71094,  9.71484,  1.14062,
-            }),
-
-            // im_info
-            getValues<T>({
-                4.90234,
-                6.57812,
-                5.23828,
-            }),
-
-            // out_boxes
-            getValues<T>({ 0.0f,     2.97829f, 14.8295f,  11.1221f, 0.0f,     6.29737f, 16.2088f,  16.3451f,
-                           4.37184f, 6.41816f,  6.03075f, 15.934f,  5.95092f, 3.66966f,  6.81878f, 16.9983f,
-                           0.0f,     5.64766f, 17.3085f,  12.3716f, 1.31074f, 9.12453f, 13.1104f,  10.6441f,
-                           3.24828f, 7.11447f,  9.16656f, 10.1058f, 0.0f,     0.0f,     10.0008f,  14.6173f,
-                           4.20346f, 0.0f,      8.5746f,  18.8736f, 0.0f,     0.0f,     15.661f,   22.4114f}
-            ),
-
-            // out_classes
-            std::vector<int32_t>({
-                4,
-                3,
-                3,
-                4,
-                2,
-                0,
-                1,
-                0,
-                2,
-                3,
-            }),
-
-            // out_scores
-            getValues<T>({
-                9.86719,
-                9.71484,
-                9.19531,
-                8.51172,
-                8.375,
-                7.46875,
-                6.57812,
-                6.57031,
-                5.23828,
-                5.09766,
-            }),
-        },
-    };
-    return params;
-}
-
-INSTANTIATE_TEST_SUITE_P(experimental_detectron_detection_output_gpu_test,
-                         experimental_detectron_detection_output_test_f32,
-                         testing::Combine(
-                             ::testing::ValuesIn(getExperimentalDetectronDetectionOutputParams<float>()),
-                             ::testing::ValuesIn(layouts),
-                             ::testing::Values(false)
-                         ));
-
-INSTANTIATE_TEST_SUITE_P(experimental_detectron_detection_output_gpu_test,
-                         experimental_detectron_detection_output_test_f16,
-                         testing::Combine(
-                             ::testing::ValuesIn(getExperimentalDetectronDetectionOutputParams<ov::float16>()),
-                             ::testing::ValuesIn(layouts),
-                             ::testing::Values(false)
-                         ));
-
-INSTANTIATE_TEST_SUITE_P(export_import,
-                         experimental_detectron_detection_output_test_f16,
-                         testing::Combine(
-                             ::testing::Values(getExperimentalDetectronDetectionOutputParams<ov::float16>()[0]),
-                             ::testing::Values(layouts[0]),
-                             ::testing::Values(true)
-                         ));
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/experimental_detectron_generate_proposals_single_image_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/experimental_detectron_generate_proposals_single_image_gpu_test.cpp
deleted file mode 100644
index 14a847c8e25064..00000000000000
--- a/src/plugins/intel_gpu/tests/unit/test_cases/experimental_detectron_generate_proposals_single_image_gpu_test.cpp
+++ /dev/null
@@ -1,359 +0,0 @@
-// Copyright (C) 2022 Intel Corporation
-// SPDX-License-Identifier: Apache-2.0
-//
-
-#include "test_utils.h"
-
-#include <intel_gpu/primitives/input_layout.hpp>
-#include <intel_gpu/primitives/mutable_data.hpp>
-#include <intel_gpu/primitives/experimental_detectron_generate_proposals_single_image.hpp>
-
-using namespace cldnn;
-using namespace ::tests;
-
-namespace {
-template <typename T>
-struct ExperimentalDetectronGenerateProposalsSingleImageParams {
-    float min_size;
-    float nms_threshold;
-    int64_t pre_nms_count;
-    int64_t post_nms_count;
-    std::vector<T> expected_rois;
-    std::vector<T> expected_roi_scores;
-};
-
-template <typename T>
-using ExperimentalDetectronGenerateProposalsSingleImageParamsWithLayout =
-        std::tuple<ExperimentalDetectronGenerateProposalsSingleImageParams<T>, format::type, bool>;
-
-constexpr size_t image_height = 150;
-constexpr size_t image_width = 150;
-constexpr float image_scale = 1.0f;
-constexpr size_t height = 2;
-constexpr size_t width = 6;
-constexpr size_t number_of_channels = 3;
-
-const std::vector<float> im_info{image_height, image_width, image_scale};
-
-const std::vector<float> anchors{
-        12.0, 68.0, 102.0, 123.0, 46.0, 80.0, 79.0, 128.0, 33.0, 71.0, 127.0, 86.0, 33.0, 56.0, 150.0, 73.0,
-        5.0, 41.0, 93.0, 150.0, 74.0, 66.0, 106.0, 115.0, 17.0, 37.0, 87.0, 150.0, 31.0, 27.0, 150.0, 39.0,
-        29.0, 23.0, 112.0, 123.0, 41.0, 37.0, 103.0, 150.0, 8.0, 46.0, 98.0, 111.0, 7.0, 69.0, 114.0, 150.0,
-        70.0, 21.0, 150.0, 125.0, 54.0, 19.0, 132.0, 68.0, 62.0, 8.0, 150.0, 101.0, 57.0, 81.0, 150.0, 97.0,
-        79.0, 29.0, 109.0, 130.0, 12.0, 63.0, 100.0, 150.0, 17.0, 33.0, 113.0, 150.0, 90.0, 78.0, 150.0, 111.0,
-        47.0, 68.0, 150.0, 71.0, 66.0, 103.0, 111.0, 150.0, 4.0, 17.0, 112.0, 94.0, 12.0, 8.0, 119.0, 98.0,
-        54.0, 56.0, 120.0, 150.0, 56.0, 29.0, 150.0, 31.0, 42.0, 3.0, 139.0, 92.0, 41.0, 65.0, 150.0, 130.0,
-        49.0, 13.0, 143.0, 30.0, 40.0, 60.0, 150.0, 150.0, 23.0, 73.0, 24.0, 115.0, 56.0, 84.0, 107.0, 108.0,
-        63.0, 8.0, 142.0, 125.0, 78.0, 37.0, 93.0, 144.0, 40.0, 34.0, 150.0, 46.0, 30.0, 21.0, 150.0, 120.0};
-
-const std::vector<float> deltas{
-        9.062256, 10.883133, 9.8441105, 12.694285, 0.41781136, 8.749107, 14.990341, 6.587644, 1.4206103,
-        13.299262, 12.432549, 2.736371, 0.22732796, 6.3361835, 12.268727, 2.1009045, 4.771589, 2.5131326,
-        5.610736, 9.3604145, 4.27379, 8.317948, 0.60510135, 6.7446275, 1.0207708, 1.1352817, 1.5785321,
-        1.718335, 1.8093798, 0.99247587, 1.3233583, 1.7432803, 1.8534478, 1.2593061, 1.7394226, 1.7686696,
-        1.647999, 1.7611449, 1.3119122, 0.03007332, 1.1106564, 0.55669737, 0.2546148, 1.9181818, 0.7134989,
-        2.0407224, 1.7211134, 1.8565536, 14.562747, 2.8786168, 0.5927796, 0.2064463, 7.6794515, 8.672126,
-        10.139171, 8.002429, 7.002932, 12.6314945, 10.550842, 0.15784842, 0.3194304, 10.752157, 3.709805,
-        11.628928, 0.7136225, 14.619964, 15.177284, 2.2824087, 15.381494, 0.16618137, 7.507227, 11.173228,
-        0.4923559, 1.8227729, 1.4749299, 1.7833921, 1.2363617, -0.23659119, 1.5737582, 1.779316, 1.9828427,
-        1.0482665, 1.4900246, 1.3563544, 1.5341306, 0.7634312, 4.6216766e-05, 1.6161222, 1.7512476, 1.9363779,
-        0.9195784, 1.4906164, -0.03244795, 0.681073, 0.6192401, 1.8033613, 14.146055, 3.4043705, 15.292292,
-        3.5295358, 11.138999, 9.952057, 5.633434, 12.114562, 9.427372, 12.384038, 9.583308, 8.427233,
-        15.293704, 3.288159, 11.64898, 9.350885, 2.0037227, 13.523184, 4.4176426, 6.1057625, 14.400079,
-        8.248259, 11.815807, 15.713364, 1.0023532, 1.3203261, 1.7100681, 0.7407832, 1.09448, 1.7188418,
-        1.4412547, 1.4862992, 0.74790007, 0.31571656, 0.6398838, 2.0236106, 1.1869069, 1.7265586, 1.2624544,
-        0.09934269, 1.3508598, 0.85212964, -0.38968498, 1.7059708, 1.6533034, 1.7400402, 1.8123854, -0.43063712};
-
-const std::vector<float> scores{
-        0.7719922, 0.35906568, 0.29054508, 0.18124384, 0.5604661, 0.84750974, 0.98948747, 0.009793862, 0.7184191,
-        0.5560748, 0.6952493, 0.6732593, 0.3306898, 0.6790913, 0.41128764, 0.34593266, 0.94296855, 0.7348507,
-        0.24478768, 0.94024557, 0.05405676, 0.06466125, 0.36244348, 0.07942984, 0.10619422, 0.09412837, 0.9053611,
-        0.22870538, 0.9237487, 0.20986171, 0.5067282, 0.29709867, 0.53138554, 0.189101, 0.4786443, 0.88421875};
-
-const std::vector<format::type> layouts{
-        format::bfyx,
-        format::b_fs_yx_fsv16,
-        format::b_fs_yx_fsv32,
-        format::bs_fs_yx_bsv16_fsv16,
-        format::bs_fs_yx_bsv16_fsv32,
-        format::bs_fs_yx_bsv32_fsv16,
-        format::bs_fs_yx_bsv32_fsv32};
-
-template <typename T>
-std::vector<T> getValues(const std::vector<float>& values) {
-    std::vector<T> result(values.begin(), values.end());
-    return result;
-}
-
-template <typename T> float getError();
-
-template<>
-float getError<float>() {
-    return 0.001;
-}
-
-template<>
-float getError<ov::float16>() {
-    return 0.25;
-}
-
-template <typename T>
-std::vector<ExperimentalDetectronGenerateProposalsSingleImageParams<T>> getExperimentalDetectronGenerateProposalsSingleImageParams() {
-    std::vector<ExperimentalDetectronGenerateProposalsSingleImageParams<T>> params = {
-            {
-                    0.0f, 0.7f, 1000, 6,
-                    getValues<T>({149.0, 149.0, 149.0, 149.0,
-                                  149.0, 0.0, 149.0, 149.0,
-                                  149.0, 60.8744, 149.0, 149.0,
-                                  149.0, 61.8950, 149.0, 149.0,
-                                  149.0, 149.0, 149.0, 149.0,
-                                  149.0, 149.0, 149.0, 149.0}),
-                    getValues<T>({0.989487, 0.942969, 0.940246, 0.923749, 0.905361, 0.884219})
-            },
-            {
-                    1.5f, 0.4f, 1000, 10,
-                    getValues<T>({43.171, 0.31823, 53.5592, 149,
-                                  0, 75.2272, 149, 87.2278,
-                                  141.058, 114.876, 149, 149,
-                                  0, 146.297, 149, 149,
-                                  0.0, 0.0, 0.0, 0.0,
-                                  0.0, 0.0, 0.0, 0.0,
-                                  0.0, 0.0, 0.0, 0.0,
-                                  0.0, 0.0, 0.0, 0.0,
-                                  0.0, 0.0, 0.0, 0.0,
-                                  0.0, 0.0, 0.0, 0.0,
-                                  0.0, 0.0, 0.0, 0.0}),
-                    getValues<T>({0.695249, 0.411288, 0.0941284, 0.0794298, 0.0,
-                                  0.0, 0.0, 0.0, 0.0, 0.0})
-            },
-            {
-                    5.0f, 0.71f, 10, 15,
-                    getValues<T>({43.171, 0.31823, 53.5592, 149,
-                                  0, 75.2272, 149, 87.2278,
-                                  141.058, 114.876, 149, 149,
-                                  149, 149, 149, 149,
-                                  30.2866, 149, 149, 149,
-                                  149, 149, 149, 149,
-                                  149, 126.679, 149, 149,
-                                  149, 6.53844, 149, 149,
-                                  149, 0, 149, 149,
-                                  149, 149, 149, 149,
-                                  0, 0, 0, 0,
-                                  0, 0, 0, 0,
-                                  0, 0, 0, 0,
-                                  0, 0, 0, 0,
-                                  0, 0, 0, 0}),
-                    getValues<T>({0.695249, 0.411288, 0.0941284, 0.0, 0.0, 0.0,
-                                  0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0})
-            }
-    };
-    return params;
-}
-
-struct PrintToStringParamName {
-    template<class T>
-    std::string operator()(const testing::TestParamInfo<ExperimentalDetectronGenerateProposalsSingleImageParamsWithLayout<T> > &param) {
-        std::stringstream buf;
-        ExperimentalDetectronGenerateProposalsSingleImageParams<T> p;
-        format::type layout;
-        bool is_caching_test;
-        std::tie(p, layout, is_caching_test) = param.param;
-
-        buf << "min_size=" << p.min_size << "_";
-        buf << "nms_threshold=" << p.nms_threshold << "_";
-        buf << "pre_nms_count=" << p.pre_nms_count << "_";
-        buf << "post_nms_count=" << p.post_nms_count << "_";
-        buf << "layout=" << fmt_to_str(layout);
-        buf << "is_caching_test=" << is_caching_test;
-        return buf.str();
-    }
-};
-};  // namespace
-
-template <typename T>
-struct experimental_detectron_generate_proposals_single_image_test
-        : public ::testing::TestWithParam<ExperimentalDetectronGenerateProposalsSingleImageParamsWithLayout<T> > {
-public:
-    void test() {
-        ExperimentalDetectronGenerateProposalsSingleImageParams<T> param;
-        format::type data_layout;
-        bool is_caching_test;
-        std::tie(param, data_layout, is_caching_test) = this->GetParam();
-        const auto data_type = ov::element::from<T>();
-
-        auto &engine = get_test_engine();
-
-        const primitive_id input_im_info_id = "InputImInfo";
-        const auto input_im_info = engine.allocate_memory({data_type, format::bfyx, tensor{batch(3)}});
-        set_values(input_im_info, getValues<T>(im_info));
-
-        const primitive_id input_anchors_id = "InputAnchors";
-        auto input_anchors = engine.allocate_memory(
-                {data_type, format::bfyx, tensor{batch(height * width * number_of_channels), feature(4)}});
-        set_values(input_anchors, getValues<T>(anchors));
-
-        const primitive_id input_deltas_id = "InputDeltas";
-        auto input_deltas = engine.allocate_memory(
-                {data_type, format::bfyx,
-                 tensor{batch(number_of_channels * 4), feature(height), spatial(1, width)}});
-        set_values(input_deltas, getValues<T>(deltas));
-
-        const primitive_id input_scores_id = "InputScores";
-        auto input_scores = engine.allocate_memory(
-                {data_type, format::bfyx, tensor{batch(number_of_channels), feature(height), spatial(1, width)}});
-        set_values(input_scores, getValues<T>(scores));
-
-        const primitive_id output_roi_scores_id = "OutputRoiScores";
-        const layout rois_scores_layout{data_type, data_layout, tensor{batch(param.post_nms_count)}};
-        auto output_roi_scores = engine.allocate_memory(rois_scores_layout);
-
-        const primitive_id reorder_im_info_id = input_im_info_id + "Reordered";
-        const primitive_id reorder_anchors_id = input_anchors_id + "Reordered";
-        const primitive_id reorder_deltas_id = input_deltas_id + "Reordered";
-        const primitive_id reorder_scores_id = input_scores_id + "Reordered";
-
-        topology topology;
-
-        topology.add(input_layout(input_im_info_id, input_im_info->get_layout()));
-        topology.add(input_layout(input_anchors_id, input_anchors->get_layout()));
-        topology.add(input_layout(input_deltas_id, input_deltas->get_layout()));
-        topology.add(input_layout(input_scores_id, input_scores->get_layout()));
-        topology.add(mutable_data(output_roi_scores_id, output_roi_scores));
-
-        topology.add(reorder(reorder_im_info_id, input_info(input_im_info_id), data_layout, data_type));
-        topology.add(reorder(reorder_anchors_id, input_info(input_anchors_id), data_layout, data_type));
-        topology.add(reorder(reorder_deltas_id, input_info(input_deltas_id), data_layout, data_type));
-        topology.add(reorder(reorder_scores_id, input_info(input_scores_id), data_layout, data_type));
-
-        const primitive_id edgpsi_id = "experimental_detectron_generate_proposals_single_image";
-        const auto edgpsi_primitive = experimental_detectron_generate_proposals_single_image{edgpsi_id,
-                                                                                             input_info(reorder_im_info_id),
-                                                                                             input_info(reorder_anchors_id),
-                                                                                             input_info(reorder_deltas_id),
-                                                                                             input_info(reorder_scores_id),
-                                                                                             input_info(output_roi_scores_id),
-                                                                                             param.min_size,
-                                                                                             param.nms_threshold,
-                                                                                             param.pre_nms_count,
-                                                                                             param.post_nms_count};
-        topology.add(edgpsi_primitive);
-
-        const primitive_id reorder_result_id = edgpsi_id + "Reordered";
-        topology.add(reorder(reorder_result_id, input_info(edgpsi_primitive), format::bfyx, data_type));
-
-        cldnn::network::ptr network = get_network(engine, topology, get_test_default_config(engine), get_test_stream_ptr(), is_caching_test);
-
-        network->set_input_data(input_im_info_id, input_im_info);
-        network->set_input_data(input_anchors_id, input_anchors);
-        network->set_input_data(input_deltas_id, input_deltas);
-        network->set_input_data(input_scores_id, input_scores);
-
-        const auto outputs = network->execute();
-
-        const auto rois = outputs.at(reorder_result_id).get_memory();
-
-        const cldnn::mem_lock<T> rois_ptr(rois, get_test_stream());
-        ASSERT_EQ(rois_ptr.size(), param.post_nms_count * 4);
-
-        cldnn::topology reorder_topology;
-        reorder_topology.add(input_layout("scores", rois_scores_layout));
-        reorder_topology.add(reorder("plane_scores", input_info("scores"), format::bfyx, data_type));
-        cldnn::network reorder_net{engine, reorder_topology, get_test_default_config(engine)};
-        reorder_net.set_input_data("scores", output_roi_scores);
-        const auto second_output_result = reorder_net.execute();
-        const auto plane_data_mem = second_output_result.at("plane_scores").get_memory();
-
-        const cldnn::mem_lock<T> roi_scores_ptr(plane_data_mem, get_test_stream());
-        ASSERT_EQ(roi_scores_ptr.size(), param.post_nms_count);
-
-        const auto &expected_roi_scores = param.expected_roi_scores;
-        const auto &expected_rois = param.expected_rois;
-        for (int64_t i = 0; i < param.post_nms_count; ++i) {
-            if (!is_caching_test) {
-                ASSERT_NEAR(expected_roi_scores[i], roi_scores_ptr[i], 0.001) << "i=" << i;
-            }
-
-            // order of proposals with zero scores is not guaranteed (to be precise,
-            // it is not guaranteed for any equal score values)
-            if (static_cast<float>(expected_roi_scores[i]) != 0.0f) {
-                for (size_t coord = 0; coord < 4; ++coord) {
-                    const auto roi_idx = i * 4 + coord;
-                    ASSERT_NEAR(expected_rois[roi_idx], rois_ptr[roi_idx], getError<T>()) << "i=" << i << ", coord=" << coord;
-                }
-            }
-        }
-    }
-};
-
-using experimental_detectron_generate_proposals_single_image_test_f32 = experimental_detectron_generate_proposals_single_image_test<float>;
-TEST_P(experimental_detectron_generate_proposals_single_image_test_f32, basic) {
-    ASSERT_NO_FATAL_FAILURE(test());
-}
-using experimental_detectron_generate_proposals_single_image_test_f16 = experimental_detectron_generate_proposals_single_image_test<ov::float16>;
-TEST_P(experimental_detectron_generate_proposals_single_image_test_f16, basic) {
-    ASSERT_NO_FATAL_FAILURE(test());
-}
-
-INSTANTIATE_TEST_SUITE_P(
-        experimental_detectron_generate_proposals_single_image_gpu_test,
-        experimental_detectron_generate_proposals_single_image_test_f32,
-        ::testing::Combine(
-                ::testing::ValuesIn(getExperimentalDetectronGenerateProposalsSingleImageParams<float>()),
-                ::testing::Values(format::bfyx),
-                ::testing::Values(false)
-        ),
-        PrintToStringParamName()
-);
-
-INSTANTIATE_TEST_SUITE_P(
-        experimental_detectron_generate_proposals_single_image_gpu_test,
-        experimental_detectron_generate_proposals_single_image_test_f16,
-        ::testing::Combine(
-                ::testing::ValuesIn(getExperimentalDetectronGenerateProposalsSingleImageParams<ov::float16>()),
-                ::testing::Values(format::bfyx),
-                ::testing::Values(false)
-        ),
-        PrintToStringParamName()
-);
-
-INSTANTIATE_TEST_SUITE_P(
-        export_import,
-        experimental_detectron_generate_proposals_single_image_test_f16,
-        ::testing::Combine(
-                ::testing::Values(getExperimentalDetectronGenerateProposalsSingleImageParams<ov::float16>()[0]),
-                ::testing::Values(format::bfyx),
-                ::testing::Values(true)
-        ),
-        PrintToStringParamName()
-);
-
-INSTANTIATE_TEST_SUITE_P(
-        experimental_detectron_generate_proposals_single_image_gpu_test_all_formats,
-        experimental_detectron_generate_proposals_single_image_test_f32,
-        ::testing::Combine(
-                ::testing::Values(
-                    ExperimentalDetectronGenerateProposalsSingleImageParams<float>{
-                        5.0f, 0.71f, 10, 15,
-                        {43.171, 0.31823, 53.5592, 149,
-                         0, 75.2272, 149, 87.2278,
-                         141.058, 114.876, 149, 149,
-                         149, 149, 149, 149,
-                         30.2866, 149, 149, 149,
-                         149, 149, 149, 149,
-                         149, 126.679, 149, 149,
-                         149, 6.53844, 149, 149,
-                         149, 0, 149, 149,
-                         149, 149, 149, 149,
-                         0, 0, 0, 0,
-                         0, 0, 0, 0,
-                         0, 0, 0, 0,
-                         0, 0, 0, 0,
-                         0, 0, 0, 0},
-                        {0.695249, 0.411288, 0.0941284, 0.0, 0.0, 0.0,
-                         0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0}}
-                    ),
-                ::testing::ValuesIn(layouts),
-                ::testing::Values(false)
-        ),
-        PrintToStringParamName()
-);
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/experimental_detectron_prior_grid_generator_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/experimental_detectron_prior_grid_generator_gpu_test.cpp
deleted file mode 100644
index 87b806d67ff937..00000000000000
--- a/src/plugins/intel_gpu/tests/unit/test_cases/experimental_detectron_prior_grid_generator_gpu_test.cpp
+++ /dev/null
@@ -1,239 +0,0 @@
-// Copyright (C) 2022 Intel Corporation
-// SPDX-License-Identifier: Apache-2.0
-//
-
-#include <cstddef>
-#include <intel_gpu/primitives/activation.hpp>
-#include <intel_gpu/primitives/experimental_detectron_prior_grid_generator.hpp>
-#include <intel_gpu/primitives/input_layout.hpp>
-#include <string>
-
-#include "test_utils.h"
-
-using namespace cldnn;
-using namespace ::tests;
-
-template <typename T>
-struct ExperimentalDetectronPriorGridGeneratorParams {
-    std::vector<T> priors;
-    tensor priorsTensor;
-    int h;
-    int w;
-    float strideX;
-    float strideY;
-    bool flatten;
-    std::pair<int, int> featureShape;
-    std::pair<int, int> imageShape;
-    tensor outputTensor;
-    std::vector<T> expectedOutput;
-    bool is_caching_test;
-};
-
-template <typename T>
-struct experimental_detectron_prior_grid_generator_test
-    : public ::testing::TestWithParam<ExperimentalDetectronPriorGridGeneratorParams<T>> {
-public:
-    void test() {
-        auto data_type = ov::element::from<T>();
-        ExperimentalDetectronPriorGridGeneratorParams<T> params =
-            testing::TestWithParam<ExperimentalDetectronPriorGridGeneratorParams<T>>::GetParam();
-        auto& engine = get_test_engine();
-
-        auto prior_input = engine.allocate_memory({data_type, format::bfyx, params.priorsTensor});
-
-        set_values(prior_input, params.priors);
-
-        const std::string priors_id = "priors";
-        const std::string experimental_detectron_prior_grid_generator_id =
-            "experimental_detectron_prior_grid_generator";
-        topology topology;
-        topology.add(input_layout(priors_id, prior_input->get_layout()));
-
-        cldnn::layout outLayout{data_type, cldnn::format::bfyx, params.outputTensor};
-        topology.add(experimental_detectron_prior_grid_generator(experimental_detectron_prior_grid_generator_id,
-                                                                 { input_info(priors_id) },
-                                                                 params.flatten,
-                                                                 params.h,
-                                                                 params.w,
-                                                                 params.strideX,
-                                                                 params.strideY,
-                                                                 params.featureShape.first,
-                                                                 params.featureShape.second,
-                                                                 params.imageShape.first,
-                                                                 params.imageShape.second));
-
-        cldnn::network::ptr network = get_network(engine, topology, get_test_default_config(engine), get_test_stream_ptr(), params.is_caching_test);
-
-        network->set_input_data(priors_id, prior_input);
-
-        auto result = network->execute();
-
-        auto out_mem = result.at(experimental_detectron_prior_grid_generator_id).get_memory();
-        cldnn::mem_lock<T> out_ptr(out_mem, get_test_stream());
-
-        ASSERT_EQ(params.outputTensor.count(), out_ptr.size());
-        for (size_t i = 0; i < params.expectedOutput.size(); ++i) {
-            ASSERT_NEAR(params.expectedOutput[i], out_ptr[i], 0.0001) << "at i = " << i;
-        }
-    }
-};
-
-template <typename T>
-std::vector<T> getValues(const std::vector<float>& values) {
-    std::vector<T> result(values.begin(), values.end());
-    return result;
-}
-
-template <typename T>
-std::vector<ExperimentalDetectronPriorGridGeneratorParams<T>> generateExperimentalPGGParams(bool is_caching_test=false) {
-    std::vector<ExperimentalDetectronPriorGridGeneratorParams<T>> experimentalPGGParams{
-        {getValues<T>({-24.5, -12.5, 24.5, 12.5, -16.5, -16.5, 16.5, 16.5, -12.5, -24.5, 12.5, 24.5}),
-         tensor(batch(3), feature(4)),
-         0,
-         0,
-         4.0,
-         4.0,
-         true,
-         {4, 5},
-         {100, 200},
-         tensor(1, 1, 4, 60),
-         getValues<T>(
-             {-22.5, -10.5, 26.5, 14.5, -14.5, -14.5, 18.5, 18.5, -10.5, -22.5, 14.5, 26.5, -18.5, -10.5, 30.5, 14.5,
-              -10.5, -14.5, 22.5, 18.5, -6.5,  -22.5, 18.5, 26.5, -14.5, -10.5, 34.5, 14.5, -6.5,  -14.5, 26.5, 18.5,
-              -2.5,  -22.5, 22.5, 26.5, -10.5, -10.5, 38.5, 14.5, -2.5,  -14.5, 30.5, 18.5, 1.5,   -22.5, 26.5, 26.5,
-              -6.5,  -10.5, 42.5, 14.5, 1.5,   -14.5, 34.5, 18.5, 5.5,   -22.5, 30.5, 26.5, -22.5, -6.5,  26.5, 18.5,
-              -14.5, -10.5, 18.5, 22.5, -10.5, -18.5, 14.5, 30.5, -18.5, -6.5,  30.5, 18.5, -10.5, -10.5, 22.5, 22.5,
-              -6.5,  -18.5, 18.5, 30.5, -14.5, -6.5,  34.5, 18.5, -6.5,  -10.5, 26.5, 22.5, -2.5,  -18.5, 22.5, 30.5,
-              -10.5, -6.5,  38.5, 18.5, -2.5,  -10.5, 30.5, 22.5, 1.5,   -18.5, 26.5, 30.5, -6.5,  -6.5,  42.5, 18.5,
-              1.5,   -10.5, 34.5, 22.5, 5.5,   -18.5, 30.5, 30.5, -22.5, -2.5,  26.5, 22.5, -14.5, -6.5,  18.5, 26.5,
-              -10.5, -14.5, 14.5, 34.5, -18.5, -2.5,  30.5, 22.5, -10.5, -6.5,  22.5, 26.5, -6.5,  -14.5, 18.5, 34.5,
-              -14.5, -2.5,  34.5, 22.5, -6.5,  -6.5,  26.5, 26.5, -2.5,  -14.5, 22.5, 34.5, -10.5, -2.5,  38.5, 22.5,
-              -2.5,  -6.5,  30.5, 26.5, 1.5,   -14.5, 26.5, 34.5, -6.5,  -2.5,  42.5, 22.5, 1.5,   -6.5,  34.5, 26.5,
-              5.5,   -14.5, 30.5, 34.5, -22.5, 1.5,   26.5, 26.5, -14.5, -2.5,  18.5, 30.5, -10.5, -10.5, 14.5, 38.5,
-              -18.5, 1.5,   30.5, 26.5, -10.5, -2.5,  22.5, 30.5, -6.5,  -10.5, 18.5, 38.5, -14.5, 1.5,   34.5, 26.5,
-              -6.5,  -2.5,  26.5, 30.5, -2.5,  -10.5, 22.5, 38.5, -10.5, 1.5,   38.5, 26.5, -2.5,  -2.5,  30.5, 30.5,
-              1.5,   -10.5, 26.5, 38.5, -6.5,  1.5,   42.5, 26.5, 1.5,   -2.5,  34.5, 30.5, 5.5,   -10.5, 30.5, 38.5}),
-         is_caching_test},
-        {getValues<T>({-44.5, -24.5, 44.5, 24.5, -32.5, -32.5, 32.5, 32.5, -24.5, -44.5, 24.5, 44.5}),
-         tensor(batch(3), feature(4)),
-         0,
-         0,
-         8.0,
-         8.0,
-         false,
-         {3, 7},
-         {100, 200},
-         tensor(3, 7, 4, 3),
-         getValues<T>(
-             {-40.5, -20.5, 48.5, 28.5, -28.5, -28.5, 36.5, 36.5, -20.5, -40.5, 28.5, 48.5, -32.5, -20.5, 56.5, 28.5,
-              -20.5, -28.5, 44.5, 36.5, -12.5, -40.5, 36.5, 48.5, -24.5, -20.5, 64.5, 28.5, -12.5, -28.5, 52.5, 36.5,
-              -4.5,  -40.5, 44.5, 48.5, -16.5, -20.5, 72.5, 28.5, -4.5,  -28.5, 60.5, 36.5, 3.5,   -40.5, 52.5, 48.5,
-              -8.5,  -20.5, 80.5, 28.5, 3.5,   -28.5, 68.5, 36.5, 11.5,  -40.5, 60.5, 48.5, -0.5,  -20.5, 88.5, 28.5,
-              11.5,  -28.5, 76.5, 36.5, 19.5,  -40.5, 68.5, 48.5, 7.5,   -20.5, 96.5, 28.5, 19.5,  -28.5, 84.5, 36.5,
-              27.5,  -40.5, 76.5, 48.5, -40.5, -12.5, 48.5, 36.5, -28.5, -20.5, 36.5, 44.5, -20.5, -32.5, 28.5, 56.5,
-              -32.5, -12.5, 56.5, 36.5, -20.5, -20.5, 44.5, 44.5, -12.5, -32.5, 36.5, 56.5, -24.5, -12.5, 64.5, 36.5,
-              -12.5, -20.5, 52.5, 44.5, -4.5,  -32.5, 44.5, 56.5, -16.5, -12.5, 72.5, 36.5, -4.5,  -20.5, 60.5, 44.5,
-              3.5,   -32.5, 52.5, 56.5, -8.5,  -12.5, 80.5, 36.5, 3.5,   -20.5, 68.5, 44.5, 11.5,  -32.5, 60.5, 56.5,
-              -0.5,  -12.5, 88.5, 36.5, 11.5,  -20.5, 76.5, 44.5, 19.5,  -32.5, 68.5, 56.5, 7.5,   -12.5, 96.5, 36.5,
-              19.5,  -20.5, 84.5, 44.5, 27.5,  -32.5, 76.5, 56.5, -40.5, -4.5,  48.5, 44.5, -28.5, -12.5, 36.5, 52.5,
-              -20.5, -24.5, 28.5, 64.5, -32.5, -4.5,  56.5, 44.5, -20.5, -12.5, 44.5, 52.5, -12.5, -24.5, 36.5, 64.5,
-              -24.5, -4.5,  64.5, 44.5, -12.5, -12.5, 52.5, 52.5, -4.5,  -24.5, 44.5, 64.5, -16.5, -4.5,  72.5, 44.5,
-              -4.5,  -12.5, 60.5, 52.5, 3.5,   -24.5, 52.5, 64.5, -8.5,  -4.5,  80.5, 44.5, 3.5,   -12.5, 68.5, 52.5,
-              11.5,  -24.5, 60.5, 64.5, -0.5,  -4.5,  88.5, 44.5, 11.5,  -12.5, 76.5, 52.5, 19.5,  -24.5, 68.5, 64.5,
-              7.5,   -4.5,  96.5, 44.5, 19.5,  -12.5, 84.5, 52.5, 27.5,  -24.5, 76.5, 64.5}),
-         is_caching_test
-        },
-        {getValues<T>({-364.5, -184.5, 364.5, 184.5, -256.5, -256.5, 256.5, 256.5, -180.5, -360.5, 180.5, 360.5}),
-         tensor(batch(3), feature(4)),
-         3,
-         6,
-         64.0,
-         64.0,
-         true,
-         {100, 100},
-         {100, 200},
-         tensor(1, 1, 4, 30000),
-         getValues<T>({-332.5, -152.5, 396.5, 216.5, -224.5, -224.5, 288.5, 288.5, -148.5, -328.5, 212.5, 392.5,
-                       -268.5, -152.5, 460.5, 216.5, -160.5, -224.5, 352.5, 288.5, -84.5,  -328.5, 276.5, 392.5,
-                       -204.5, -152.5, 524.5, 216.5, -96.5,  -224.5, 416.5, 288.5, -20.5,  -328.5, 340.5, 392.5,
-                       -140.5, -152.5, 588.5, 216.5, -32.5,  -224.5, 480.5, 288.5, 43.5,   -328.5, 404.5, 392.5,
-                       -76.5,  -152.5, 652.5, 216.5, 31.5,   -224.5, 544.5, 288.5, 107.5,  -328.5, 468.5, 392.5,
-                       -12.5,  -152.5, 716.5, 216.5, 95.5,   -224.5, 608.5, 288.5, 171.5,  -328.5, 532.5, 392.5,
-                       -332.5, -88.5,  396.5, 280.5, -224.5, -160.5, 288.5, 352.5, -148.5, -264.5, 212.5, 456.5,
-                       -268.5, -88.5,  460.5, 280.5, -160.5, -160.5, 352.5, 352.5, -84.5,  -264.5, 276.5, 456.5,
-                       -204.5, -88.5,  524.5, 280.5, -96.5,  -160.5, 416.5, 352.5, -20.5,  -264.5, 340.5, 456.5,
-                       -140.5, -88.5,  588.5, 280.5, -32.5,  -160.5, 480.5, 352.5, 43.5,   -264.5, 404.5, 456.5,
-                       -76.5,  -88.5,  652.5, 280.5, 31.5,   -160.5, 544.5, 352.5, 107.5,  -264.5, 468.5, 456.5,
-                       -12.5,  -88.5,  716.5, 280.5, 95.5,   -160.5, 608.5, 352.5, 171.5,  -264.5, 532.5, 456.5,
-                       -332.5, -24.5,  396.5, 344.5, -224.5, -96.5,  288.5, 416.5, -148.5, -200.5, 212.5, 520.5,
-                       -268.5, -24.5,  460.5, 344.5, -160.5, -96.5,  352.5, 416.5, -84.5,  -200.5, 276.5, 520.5,
-                       -204.5, -24.5,  524.5, 344.5, -96.5,  -96.5,  416.5, 416.5, -20.5,  -200.5, 340.5, 520.5,
-                       -140.5, -24.5,  588.5, 344.5, -32.5,  -96.5,  480.5, 416.5, 43.5,   -200.5, 404.5, 520.5,
-                       -76.5,  -24.5,  652.5, 344.5, 31.5,   -96.5,  544.5, 416.5, 107.5,  -200.5, 468.5, 520.5,
-                       -12.5,  -24.5,  716.5, 344.5, 95.5,   -96.5,  608.5, 416.5, 171.5,  -200.5, 532.5, 520.5}),
-         is_caching_test},
-        {getValues<T>({-180.5, -88.5, 180.5, 88.5, -128.5, -128.5, 128.5, 128.5, -92.5, -184.5, 92.5, 184.5}),
-         tensor(batch(3), feature(4)),
-         5,
-         3,
-         32.0,
-         32.0,
-         false,
-         {100, 100},
-         {100, 200},
-         tensor(100, 100, 4, 3),
-         getValues<T>({-164.5, -72.5, 196.5, 104.5, -112.5, -112.5, 144.5, 144.5, -76.5, -168.5, 108.5, 200.5,
-                       -132.5, -72.5, 228.5, 104.5, -80.5,  -112.5, 176.5, 144.5, -44.5, -168.5, 140.5, 200.5,
-                       -100.5, -72.5, 260.5, 104.5, -48.5,  -112.5, 208.5, 144.5, -12.5, -168.5, 172.5, 200.5,
-                       -164.5, -40.5, 196.5, 136.5, -112.5, -80.5,  144.5, 176.5, -76.5, -136.5, 108.5, 232.5,
-                       -132.5, -40.5, 228.5, 136.5, -80.5,  -80.5,  176.5, 176.5, -44.5, -136.5, 140.5, 232.5,
-                       -100.5, -40.5, 260.5, 136.5, -48.5,  -80.5,  208.5, 176.5, -12.5, -136.5, 172.5, 232.5,
-                       -164.5, -8.5,  196.5, 168.5, -112.5, -48.5,  144.5, 208.5, -76.5, -104.5, 108.5, 264.5,
-                       -132.5, -8.5,  228.5, 168.5, -80.5,  -48.5,  176.5, 208.5, -44.5, -104.5, 140.5, 264.5,
-                       -100.5, -8.5,  260.5, 168.5, -48.5,  -48.5,  208.5, 208.5, -12.5, -104.5, 172.5, 264.5,
-                       -164.5, 23.5,  196.5, 200.5, -112.5, -16.5,  144.5, 240.5, -76.5, -72.5,  108.5, 296.5,
-                       -132.5, 23.5,  228.5, 200.5, -80.5,  -16.5,  176.5, 240.5, -44.5, -72.5,  140.5, 296.5,
-                       -100.5, 23.5,  260.5, 200.5, -48.5,  -16.5,  208.5, 240.5, -12.5, -72.5,  172.5, 296.5,
-                       -164.5, 55.5,  196.5, 232.5, -112.5, 15.5,   144.5, 272.5, -76.5, -40.5,  108.5, 328.5,
-                       -132.5, 55.5,  228.5, 232.5, -80.5,  15.5,   176.5, 272.5, -44.5, -40.5,  140.5, 328.5,
-                       -100.5, 55.5,  260.5, 232.5, -48.5,  15.5,   208.5, 272.5, -12.5, -40.5,  172.5, 328.5}),
-         is_caching_test}};
-    return experimentalPGGParams;
-}
-
-struct PrintToStringParamName {
-    template <class T>
-    std::string operator()(const testing::TestParamInfo<ExperimentalDetectronPriorGridGeneratorParams<T>>& param) {
-        std::stringstream buf;
-        buf << " priors tensor " << param.param.priorsTensor.to_string() << " h " << param.param.h << " w "
-            << param.param.w << " strideX " << param.param.strideX << " strideY " << param.param.strideY << " flatten "
-            << param.param.flatten << " is_caching_test " << param.param.is_caching_test;
-        return buf.str();
-    }
-};
-
-using experimental_detectron_prior_grid_generator_test_f32 = experimental_detectron_prior_grid_generator_test<float>;
-using experimental_detectron_prior_grid_generator_test_f16 = experimental_detectron_prior_grid_generator_test<ov::float16>;
-
-TEST_P(experimental_detectron_prior_grid_generator_test_f32, experimental_detectron_prior_grid_generator_test_f32) {
-    ASSERT_NO_FATAL_FAILURE(test());
-}
-
-TEST_P(experimental_detectron_prior_grid_generator_test_f16, experimental_detectron_prior_grid_generator_test_f16) {
-    ASSERT_NO_FATAL_FAILURE(test());
-}
-
-INSTANTIATE_TEST_SUITE_P(smoke_experimental_detectron_prior_grid_generator_test_f32,
-                         experimental_detectron_prior_grid_generator_test_f32,
-                         ::testing::ValuesIn(generateExperimentalPGGParams<float>()),
-                         PrintToStringParamName());
-
-INSTANTIATE_TEST_SUITE_P(smoke_experimental_detectron_prior_grid_generator_test_f16,
-                         experimental_detectron_prior_grid_generator_test_f16,
-                         ::testing::ValuesIn(generateExperimentalPGGParams<ov::float16>()),
-                         PrintToStringParamName());
-
-INSTANTIATE_TEST_SUITE_P(export_import,
-                         experimental_detectron_prior_grid_generator_test_f16,
-                         ::testing::Values(generateExperimentalPGGParams<ov::float16>(true)[0]),
-                         PrintToStringParamName());
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/experimental_detectron_roi_feature_extractor_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/experimental_detectron_roi_feature_extractor_gpu_test.cpp
deleted file mode 100644
index 85d45ad22ae615..00000000000000
--- a/src/plugins/intel_gpu/tests/unit/test_cases/experimental_detectron_roi_feature_extractor_gpu_test.cpp
+++ /dev/null
@@ -1,306 +0,0 @@
-// Copyright (C) 2021-2022 Intel Corporation
-// SPDX-License-Identifier: Apache-2.0
-//
-
-#include "test_utils.h"
-
-#include <intel_gpu/primitives/input_layout.hpp>
-#include <intel_gpu/primitives/mutable_data.hpp>
-#include <intel_gpu/primitives/activation.hpp>
-#include <intel_gpu/primitives/experimental_detectron_roi_feature_extractor.hpp>
-
-#include <cstddef>
-#include <iostream>
-#include <string>
-
-using namespace cldnn;
-using namespace ::tests;
-
-template <typename T>
-void test_experimental_detectron_roi_feature_extractor_gpu_fp32_one_level(bool is_caching_test) {
-    auto& engine = get_test_engine();
-
-    const int rois_num = 2;
-    const int rois_feature_dim = 4;
-    const int output_dim = 3;
-    const std::vector<int64_t> pyramid_scales = {4};
-    const int sampling_ratio = 2;
-    const bool aligned = false;
-    auto roi_input = engine.allocate_memory({data_types::f32, format::bfyx, tensor(batch(rois_num), feature(rois_feature_dim))});
-    auto level_1 = engine.allocate_memory({data_types::f32, format::bfyx, {1, 2, 3, 2}});
-    auto second_output = engine.allocate_memory({ data_types::f32, format::bfyx, tensor(batch(rois_num), feature(rois_feature_dim))});
-
-    std::vector<T> rois {0.0f, 1.0f, 2.0f, 3.0f, 4.0f, 5.0f, 6.0f, 7.0f};
-    set_values(roi_input, rois);
-    set_values(level_1, {0.0f, 1.0f, 2.0f, 3.0f, 4.0f, 5.0f, 6.0f, 7.0f, 8.0f, 9.0f, 10.0f, 11.0f});
-
-    const std::string input_rois_id = "InputRois";
-    const std::string input_level_1_id = "InputLevel1";
-    const std::string second_output_w_id = "second_output_w";
-    const std::string second_output_r_id = "second_output_r";
-    const std::string feature_extractor_id = "experimental_detectron_roi_feature_extractor";
-    const std::string activation_abs_id = "activation_abs";
-    topology topology;
-    topology.add(input_layout(input_rois_id, roi_input->get_layout()));
-    topology.add(input_layout(input_level_1_id, level_1->get_layout()));
-    topology.add(mutable_data(second_output_w_id, second_output));
-    topology.add(experimental_detectron_roi_feature_extractor(feature_extractor_id,
-                                                              { input_info(input_rois_id), input_info(input_level_1_id), input_info(second_output_w_id) },
-                                                              output_dim,
-                                                              pyramid_scales,
-                                                              sampling_ratio,
-                                                              aligned));
-    topology.add(activation(activation_abs_id, feature_extractor_id,  activation_func::abs));
-    topology.add(mutable_data(second_output_r_id, {feature_extractor_id}, second_output));
-
-    cldnn::network::ptr network = get_network(engine, topology, get_test_default_config(engine), get_test_stream_ptr(), is_caching_test);
-
-    network->set_input_data(input_rois_id, roi_input);
-    network->set_input_data(input_level_1_id, level_1);
-
-    auto outputs = network->execute();
-
-    std::vector<T> expected_first_output {1.416667f, 1.75f, 2.083333f, 2.416667f, 2.75f, 3.083333f, 3.166667f, 3.5f,  3.833333f,
-                                              7.416667f, 7.75f, 8.083333f, 8.416667f, 8.75f, 9.083334f, 9.166666f, 9.5f,  9.833334f,
-                                              4.166667f, 4.5f,  4.833333f, 4.166667f, 4.5f,  4.833333f, 2.083333f, 2.25f, 2.416667f,
-                                              10.16667f, 10.5f, 10.83333f, 10.16667f, 10.5f, 10.83333f, 5.083333f, 5.25f, 5.416667f};
-
-    auto first_network_output = outputs.at(activation_abs_id).get_memory();
-    cldnn::mem_lock<T> first_output_ptr(first_network_output, get_test_stream());
-
-    ASSERT_EQ(expected_first_output.size(), first_output_ptr.size());
-    for (std::size_t i = 0; i < expected_first_output.size(); i++) {
-        ASSERT_FLOAT_EQ(expected_first_output[i], first_output_ptr[i]);
-    }
-
-    if (is_caching_test)
-        return;
-
-    std::vector<T>& expected_second_output = rois;
-
-    auto second_network_output = outputs.at(second_output_r_id).get_memory();
-    ASSERT_TRUE(engine.is_the_same_buffer(*second_output, *second_network_output));
-    cldnn::mem_lock<T> second_output_ptr(second_network_output, get_test_stream());
-
-    ASSERT_EQ(expected_second_output.size(), second_output_ptr.size());
-    for (std::size_t i = 0; i < expected_second_output.size(); i++) {
-        ASSERT_FLOAT_EQ(expected_second_output[i], second_output_ptr[i]);
-    }
-}
-
-TEST(experimental_detectron_roi_feature_extractor_gpu_fp32, one_level) {
-    test_experimental_detectron_roi_feature_extractor_gpu_fp32_one_level<float>(false);
-}
-
-TEST(export_import_experimental_detectron_roi_feature_extractor_gpu_fp32, one_level) {
-    test_experimental_detectron_roi_feature_extractor_gpu_fp32_one_level<float>(true);
-}
-
-TEST(experimental_detectron_roi_feature_extractor_gpu_fp32, two_levels) {
-    auto& engine = get_test_engine();
-
-    const int rois_num = 2;
-    const int rois_feature_dim = 4;
-    const int output_dim = 3;
-    const std::vector<int64_t> pyramid_scales = {4, 224};
-    const int sampling_ratio = 2;
-    const bool aligned = false;
-    auto level_1_layout = layout{data_types::f32, format::bfyx, {1, 2, 3, 2}};
-    auto level_2_layout = layout{data_types::f32, format::bfyx, {1, 2, 3, 2}};
-    auto roi_input = engine.allocate_memory({data_types::f32, format::bfyx, tensor(batch(rois_num), feature(rois_feature_dim))});
-    auto level_1 = engine.allocate_memory(level_1_layout);
-    auto level_2 = engine.allocate_memory(level_2_layout);
-    auto second_output = engine.allocate_memory({ data_types::f32, format::bfyx, tensor(batch(rois_num), feature(rois_feature_dim))});
-
-    auto level_1_padded_layout = level_1_layout;
-    level_1_padded_layout.data_padding = padding({0, 0, 1, 1}, {0, 0, 1, 1});
-    auto level_2_padded_layout = level_2_layout;
-    level_2_padded_layout.data_padding = padding({0, 1, 1, 1}, {0, 1, 1, 1});
-
-    std::vector<float> rois {0.0f, 56.0f, 112.0f, 168.0f, 4.0f, 5.0f, 6.0f, 7.0f};
-    set_values(roi_input, rois);
-    set_values(level_1, {0.0f, 1.0f, 2.0f, 3.0f, 4.0f, 5.0f, 6.0f, 7.0f, 8.0f, 9.0f, 10.0f, 11.0f});
-    set_values(level_2, {6.0f, 7.0f, 8.0f, 9.0f, 10.0f, 11.0f, 0.0f, 1.0f, 2.0f, 3.0f, 4.0f, 5.0f});
-
-    const std::string input_rois_id = "InputRois";
-    const std::string input_level_1_id = "InputLevel1";
-    const std::string input_level_2_id = "InputLevel2";
-    const std::string input_level_1_pad_id = "InputLevel1_padding";
-    const std::string input_level_2_pad_id = "InputLevel2_padding";
-    const std::string second_output_w_id = "second_output_w";
-    const std::string second_output_r_id = "second_output_r";
-    const std::string feature_extractor_id = "experimental_detectron_roi_feature_extractor";
-    const std::string activation_abs_id = "activation_abs";
-    topology topology;
-    topology.add(input_layout(input_rois_id, roi_input->get_layout()));
-    topology.add(input_layout(input_level_1_id, level_1->get_layout()));
-    topology.add(input_layout(input_level_2_id, level_2->get_layout()));
-    topology.add(reorder(input_level_1_pad_id, input_info(input_level_1_id), level_1_padded_layout));
-    topology.add(reorder(input_level_2_pad_id, input_info(input_level_2_id), level_2_padded_layout));
-    topology.add(mutable_data(second_output_w_id, second_output));
-    topology.add(experimental_detectron_roi_feature_extractor(feature_extractor_id,
-                                                              { input_info(input_rois_id),
-                                                                input_info(input_level_1_pad_id),
-                                                                input_info(input_level_2_pad_id),
-                                                                input_info(second_output_w_id) },
-                                                              output_dim,
-                                                              pyramid_scales,
-                                                              sampling_ratio,
-                                                              aligned));
-    topology.add(activation(activation_abs_id, feature_extractor_id, activation_func::abs));
-    topology.add(mutable_data(second_output_r_id, {feature_extractor_id}, second_output));
-
-    network network(engine, topology, get_test_default_config(engine));
-
-    network.set_input_data(input_rois_id, roi_input);
-    network.set_input_data(input_level_1_id, level_1);
-    network.set_input_data(input_level_2_id, level_2);
-
-    auto outputs = network.execute();
-
-    std::vector<float> expected_first_output {7.41662f,   7.7499523f, 8.0832853f,  8.41662f,   8.74995f,   9.0832853f, 9.16664f,   9.49998f,   9.83331f,
-                                              1.4166187f, 1.7499521f, 2.0832853f,  2.4166186f, 2.7499518f, 3.0832853f, 3.1666427f, 3.4999762f, 3.83331f,
-                                              4.166667f,  4.5f,       4.833333f,   4.166667f,  4.5f,       4.833333f,  2.083333f,  2.25f,      2.416667f,
-                                              10.16667f,  10.5f,      10.83333f,   10.16667f,  10.5f,      10.83333f,  5.083333f,  5.25f,      5.416667f};
-
-    auto first_network_output = outputs.at(activation_abs_id).get_memory();
-    cldnn::mem_lock<float> first_output_ptr(first_network_output, get_test_stream());
-
-    ASSERT_EQ(expected_first_output.size(), first_output_ptr.size());
-    for (std::size_t i = 0; i < expected_first_output.size(); i++) {
-        ASSERT_FLOAT_EQ(expected_first_output[i], first_output_ptr[i]);
-    }
-
-    std::vector<float>& expected_second_output = rois;
-
-    auto second_network_output = outputs.at(second_output_r_id).get_memory();
-    ASSERT_TRUE(engine.is_the_same_buffer(*second_output, *second_network_output));
-    cldnn::mem_lock<float> second_output_ptr(second_network_output, get_test_stream());
-
-    ASSERT_EQ(expected_second_output.size(), second_output_ptr.size());
-    for (std::size_t i = 0; i < expected_second_output.size(); i++) {
-        ASSERT_FLOAT_EQ(expected_second_output[i], second_output_ptr[i]);
-    }
-}
-
-TEST(experimental_detectron_roi_feature_extractor_gpu_fp32, multiple_feature_extractor_op_with_different_number_of_inputs) {
-    auto& engine = get_test_engine();
-
-    const int rois_num = 2;
-    const int rois_feature_dim = 4;
-    const int output_dim = 3;
-    const std::vector<int64_t> pyramid_scales_first_instance = {4};
-    const std::vector<int64_t> pyramid_scales_second_instance = {4, 224};
-    const int sampling_ratio = 2;
-    const bool aligned = false;
-    auto roi_input_first_instance = engine.allocate_memory({data_types::f32, format::bfyx, tensor(batch(rois_num), feature(rois_feature_dim))});
-    auto roi_input_second_instance = engine.allocate_memory({data_types::f32, format::bfyx, tensor(batch(rois_num), feature(rois_feature_dim))});
-    auto level_1 = engine.allocate_memory({data_types::f32, format::bfyx, {1, 2, 3, 2}});
-    auto level_2 = engine.allocate_memory({data_types::f32, format::bfyx, {1, 2, 3, 2}});
-    auto second_output_first_instance = engine.allocate_memory({ data_types::f32, format::bfyx, tensor(batch(rois_num), feature(rois_feature_dim))});
-    auto second_output_second_instance = engine.allocate_memory({ data_types::f32, format::bfyx, tensor(batch(rois_num), feature(rois_feature_dim))});
-
-    std::vector<float> rois_first_instance {0.0f, 1.0f, 2.0f, 3.0f, 4.0f, 5.0f, 6.0f, 7.0f};
-    std::vector<float> rois_second_instance {0.0f, 56.0f, 112.0f, 168.0f, 4.0f, 5.0f, 6.0f, 7.0f};
-    set_values(roi_input_first_instance, rois_first_instance);
-    set_values(roi_input_second_instance, rois_second_instance);
-    set_values(level_1, {0.0f, 1.0f, 2.0f, 3.0f, 4.0f, 5.0f, 6.0f, 7.0f, 8.0f, 9.0f, 10.0f, 11.0f});
-    set_values(level_2, {6.0f, 7.0f, 8.0f, 9.0f, 10.0f, 11.0f, 0.0f, 1.0f, 2.0f, 3.0f, 4.0f, 5.0f});
-
-    const std::string input_rois_first_instance_id = "InputRois1";
-    const std::string input_level_1_first_instance_id = "InputLevel_first_instance";
-    const std::string second_output_w_first_instance_id = "second_output_w_first_instance";
-    const std::string second_output_r_first_instance_id = "second_output_r_first_instance";
-    const std::string feature_extractor_first_instance_id = "experimental_detectron_roi_feature_extractor_1";
-    const std::string activation_abs_first_instance_id = "activation_abs_first_instance";
-    topology topology;
-    topology.add(input_layout(input_rois_first_instance_id, roi_input_first_instance->get_layout()));
-    topology.add(input_layout(input_level_1_first_instance_id, level_1->get_layout()));
-    topology.add(mutable_data(second_output_w_first_instance_id, second_output_first_instance));
-    topology.add(experimental_detectron_roi_feature_extractor(feature_extractor_first_instance_id,
-                                                              { input_info(input_rois_first_instance_id), input_info(input_level_1_first_instance_id), input_info(second_output_w_first_instance_id) },
-                                                              output_dim,
-                                                              pyramid_scales_first_instance,
-                                                              sampling_ratio,
-                                                              aligned));
-    topology.add(activation(activation_abs_first_instance_id, feature_extractor_first_instance_id,  activation_func::abs));
-    topology.add(mutable_data(second_output_r_first_instance_id, {feature_extractor_first_instance_id}, second_output_first_instance));
-
-    const std::string input_rois_second_instance_id = "InputRois2";
-    const std::string input_level_1_second_instance_id = "InputLevel1_second_instance";
-    const std::string input_level_2_second_instance_id = "InputLevel2_second_instance";
-    const std::string second_output_w_second_instance_id = "second_output_w_second_instance";
-    const std::string second_output_r_second_instance_id = "second_output_r_second_instance";
-    const std::string feature_extractor_second_instance_id = "experimental_detectron_roi_feature_extractor_2";
-    const std::string activation_abs_second_instance_id = "activation_abs_second_instance";
-    topology.add(input_layout(input_rois_second_instance_id, roi_input_second_instance->get_layout()));
-    topology.add(input_layout(input_level_1_second_instance_id, level_1->get_layout()));
-    topology.add(input_layout(input_level_2_second_instance_id, level_2->get_layout()));
-    topology.add(mutable_data(second_output_w_second_instance_id, second_output_second_instance));
-    topology.add(experimental_detectron_roi_feature_extractor(feature_extractor_second_instance_id,
-                                                              { input_info(input_rois_second_instance_id), input_info(input_level_1_second_instance_id), input_info(input_level_2_second_instance_id), input_info(second_output_w_second_instance_id) },
-                                                              output_dim,
-                                                              pyramid_scales_second_instance,
-                                                              sampling_ratio,
-                                                              aligned));
-    topology.add(activation(activation_abs_second_instance_id, input_info(feature_extractor_second_instance_id),  activation_func::abs));
-    topology.add(mutable_data(second_output_r_second_instance_id, { input_info(feature_extractor_second_instance_id) }, second_output_second_instance));
-
-    network network(engine, topology, get_test_default_config(engine));
-
-    network.set_input_data(input_rois_first_instance_id, roi_input_first_instance);
-    network.set_input_data(input_rois_second_instance_id, roi_input_second_instance);
-    network.set_input_data(input_level_1_first_instance_id, level_1);
-    network.set_input_data(input_level_1_second_instance_id, level_1);
-    network.set_input_data(input_level_2_second_instance_id, level_2);
-
-    auto outputs = network.execute();
-
-    std::vector<float> expected_first_output_first_instance {1.416667f, 1.75f, 2.083333f, 2.416667f, 2.75f, 3.083333f, 3.166667f, 3.5f,  3.833333f,
-                                                             7.416667f, 7.75f, 8.083333f, 8.416667f, 8.75f, 9.083334f, 9.166666f, 9.5f,  9.833334f,
-                                                             4.166667f, 4.5f,  4.833333f, 4.166667f, 4.5f,  4.833333f, 2.083333f, 2.25f, 2.416667f,
-                                                             10.16667f, 10.5f, 10.83333f, 10.16667f, 10.5f, 10.83333f, 5.083333f, 5.25f, 5.416667f};
-
-    auto first_network_output_first_instance = outputs.at(activation_abs_first_instance_id).get_memory();
-    cldnn::mem_lock<float> first_output_ptr_first_instance(first_network_output_first_instance, get_test_stream());
-
-    ASSERT_EQ(expected_first_output_first_instance.size(), first_output_ptr_first_instance.size());
-    for (std::size_t i = 0; i < expected_first_output_first_instance.size(); i++) {
-        ASSERT_FLOAT_EQ(expected_first_output_first_instance[i], first_output_ptr_first_instance[i]);
-    }
-
-    std::vector<float>& expected_second_output_first_instance = rois_first_instance;
-
-    auto second_network_output_first_instance = outputs.at(second_output_r_first_instance_id).get_memory();
-    ASSERT_TRUE(engine.is_the_same_buffer(*second_output_first_instance, *second_network_output_first_instance));
-    cldnn::mem_lock<float> second_output_ptr_first_instance(second_network_output_first_instance, get_test_stream());
-
-    ASSERT_EQ(expected_second_output_first_instance.size(), second_output_ptr_first_instance.size());
-    for (std::size_t i = 0; i < expected_second_output_first_instance.size(); i++) {
-        ASSERT_FLOAT_EQ(expected_second_output_first_instance[i], second_output_ptr_first_instance[i]);
-    }
-
-    std::vector<float> expected_first_output_second_instance {7.41662f,   7.7499523f, 8.0832853f,  8.41662f,   8.74995f,   9.0832853f, 9.16664f,   9.49998f,   9.83331f,
-                                                              1.4166187f, 1.7499521f, 2.0832853f,  2.4166186f, 2.7499518f, 3.0832853f, 3.1666427f, 3.4999762f, 3.83331f,
-                                                              4.166667f,  4.5f,       4.833333f,   4.166667f,  4.5f,       4.833333f,  2.083333f,  2.25f,      2.416667f,
-                                                              10.16667f,  10.5f,      10.83333f,   10.16667f,  10.5f,      10.83333f,  5.083333f,  5.25f,      5.416667f};
-
-    auto first_network_output_second_instance = outputs.at(activation_abs_second_instance_id).get_memory();
-    cldnn::mem_lock<float> first_output_ptr_second_instance(first_network_output_second_instance, get_test_stream());
-
-    ASSERT_EQ(expected_first_output_second_instance.size(), first_output_ptr_second_instance.size());
-    for (std::size_t i = 0; i < expected_first_output_second_instance.size(); i++) {
-        ASSERT_FLOAT_EQ(expected_first_output_second_instance[i], first_output_ptr_second_instance[i]);
-    }
-
-    std::vector<float>& expected_second_output_second_instance = rois_second_instance;
-
-    auto second_network_output_second_instance = outputs.at(second_output_r_second_instance_id).get_memory();
-    ASSERT_TRUE(engine.is_the_same_buffer(*second_output_second_instance, *second_network_output_second_instance));
-    cldnn::mem_lock<float> second_output_ptr_second_instance(second_network_output_second_instance, get_test_stream());
-
-    ASSERT_EQ(expected_second_output_second_instance.size(), second_output_ptr_second_instance.size());
-    for (std::size_t i = 0; i < expected_second_output_second_instance.size(); i++) {
-        ASSERT_FLOAT_EQ(expected_second_output_second_instance[i], second_output_ptr_second_instance[i]);
-    }
-}
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/experimental_detectron_topk_rois_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/experimental_detectron_topk_rois_gpu_test.cpp
deleted file mode 100644
index 435f7fd2add660..00000000000000
--- a/src/plugins/intel_gpu/tests/unit/test_cases/experimental_detectron_topk_rois_gpu_test.cpp
+++ /dev/null
@@ -1,176 +0,0 @@
-// Copyright (C) 2021-2022 Intel Corporation
-// SPDX-License-Identifier: Apache-2.0
-//
-
-#include <cstddef>
-#include <intel_gpu/primitives/activation.hpp>
-#include <intel_gpu/primitives/experimental_detectron_topk_rois.hpp>
-#include <intel_gpu/primitives/input_layout.hpp>
-#include <string>
-
-#include "test_utils.h"
-
-using namespace cldnn;
-using namespace ::tests;
-
-template <format::type layoutFormat, typename DataType>
-struct experimental_detectron_topk_rois_input_types {
-    static const auto format = layoutFormat;
-    using type = DataType;
-};
-
-template <typename EdTopkRoisInput>
-struct experimental_detectron_topk_rois_gpu_test : public testing::Test {
-    static const auto format = EdTopkRoisInput::format;
-    using input_type = typename EdTopkRoisInput::type;
-    const ov::element::Type data_type = ov::element::from<input_type>();
-
-    std::vector<input_type> getTypedVector(const std::vector<float>& input) {
-        return std::vector<input_type>(input.begin(), input.end());
-    }
-
-    void checkOutput(std::shared_ptr<memory> mem, const std::vector<float>& expected_output) {
-        cldnn::mem_lock<input_type> out_ptr(mem, get_test_stream());
-        ASSERT_EQ(expected_output.size(), out_ptr.size());
-        for (size_t i = 0; i < expected_output.size(); ++i) {
-            ASSERT_NEAR(static_cast<input_type>(expected_output[i]), out_ptr[i], 0.0001) << "at i = " << i;
-        }
-    }
-};
-
-using format_types = testing::Types<experimental_detectron_topk_rois_input_types<format::bfyx, float>,
-                                    experimental_detectron_topk_rois_input_types<format::b_fs_yx_fsv16, float>,
-                                    experimental_detectron_topk_rois_input_types<format::b_fs_yx_fsv32, float>,
-                                    experimental_detectron_topk_rois_input_types<format::bs_fs_yx_bsv16_fsv16, float>,
-                                    experimental_detectron_topk_rois_input_types<format::bs_fs_yx_bsv32_fsv16, float>,
-                                    experimental_detectron_topk_rois_input_types<format::bs_fs_yx_bsv32_fsv32, float>,
-                                    experimental_detectron_topk_rois_input_types<format::bfyx, ov::float16>,
-                                    experimental_detectron_topk_rois_input_types<format::b_fs_yx_fsv16, ov::float16>,
-                                    experimental_detectron_topk_rois_input_types<format::b_fs_yx_fsv32, ov::float16>,
-                                    experimental_detectron_topk_rois_input_types<format::bs_fs_yx_bsv16_fsv16, ov::float16>,
-                                    experimental_detectron_topk_rois_input_types<format::bs_fs_yx_bsv32_fsv16, ov::float16>,
-                                    experimental_detectron_topk_rois_input_types<format::bs_fs_yx_bsv32_fsv32, ov::float16>>;
-
-TYPED_TEST_SUITE(experimental_detectron_topk_rois_gpu_test, format_types);
-
-TYPED_TEST(experimental_detectron_topk_rois_gpu_test, check_set_indices_layer) {
-    auto& engine = get_test_engine();
-
-    const int rois_num = 2;
-
-    auto roi_input = engine.allocate_memory({this->data_type, format::bfyx, tensor(batch(4), feature(4))});
-    auto roi_indices = engine.allocate_memory({data_types::i32, format::bfyx, tensor(batch(rois_num), feature(1))});
-
-    std::vector<float>
-        rois{1.0f, 1.0f, 4.0f, 5.0f, 3.0f, 2.0f, 7.0f, 9.0f, 10.0f, 15.0f, 13.0f, 17.0f, 13.0f, 10.0f, 18.0f, 15.0f};
-    set_values(roi_input, this->getTypedVector(rois));
-    set_values(roi_indices, {3, 1});
-
-    const std::string input_rois_id = "InputRois";
-    const std::string input_indices_id = "InputIndices";
-    const std::string experimental_detectron_topk_rois_id = "experimental_detectron_topk_rois";
-    topology topology;
-    topology.add(input_layout(input_rois_id, roi_input->get_layout()));
-    topology.add(input_layout(input_indices_id, roi_indices->get_layout()));
-    topology.add(reorder("reordered_input", input_info(input_rois_id), this->format, this->data_type));
-    topology.add(reorder("reordered_indices", input_info(input_indices_id), this->format, data_types::i32));
-    topology.add(experimental_detectron_topk_rois(experimental_detectron_topk_rois_id,
-                                                  { input_info("reordered_input"), input_info("reordered_indices") },
-                                                  rois_num));
-    topology.add(reorder("plane_output", experimental_detectron_topk_rois_id, format::bfyx, this->data_type));
-
-    network network(engine, topology, get_test_default_config(engine));
-
-    network.set_input_data(input_rois_id, roi_input);
-    network.set_input_data(input_indices_id, roi_indices);
-
-    auto result = network.execute();
-
-    std::vector<float> expected_output = {13.0f, 10.0f, 18.0f, 15.0f, 3.0f, 2.0f, 7.0f, 9.0f};
-
-    auto out_mem = result.at("plane_output").get_memory();
-    this->checkOutput(out_mem, expected_output);
-}
-
-TYPED_TEST(experimental_detectron_topk_rois_gpu_test, check_set_indices_layer_model_less_than_k) {
-    auto& engine = get_test_engine();
-    // topk is more than model size
-    const int rois_num = 3;
-
-    auto roi_input = engine.allocate_memory({this->data_type, format::bfyx, tensor(batch(2), feature(4))});
-    auto roi_indices = engine.allocate_memory({data_types::i32, format::bfyx, tensor(batch(2), feature(1))});
-
-    std::vector<float> rois{1.0f, 1.0f, 4.0f, 5.0f, 3.0f, 2.0f, 7.0f, 9.0f};
-    set_values(roi_input, this->getTypedVector(rois));
-    set_values(roi_indices, {1, 0});
-
-    const std::string input_rois_id = "InputRois";
-    const std::string input_indices_id = "InputIndices";
-    const std::string experimental_detectron_topk_rois_id = "experimental_detectron_topk_rois";
-    topology topology;
-    topology.add(input_layout(input_rois_id, roi_input->get_layout()));
-    topology.add(input_layout(input_indices_id, roi_indices->get_layout()));
-    topology.add(reorder("reordered_input", input_info(input_rois_id), this->format, this->data_type));
-    topology.add(reorder("reordered_indices", input_info(input_indices_id), this->format, data_types::i32));
-    topology.add(experimental_detectron_topk_rois(experimental_detectron_topk_rois_id,
-                                                  { input_info("reordered_input"), input_info("reordered_indices") },
-                                                  rois_num));
-    topology.add(reorder("plane_output", input_info(experimental_detectron_topk_rois_id), format::bfyx, this->data_type));
-
-    network network(engine, topology, get_test_default_config(engine));
-
-    network.set_input_data(input_rois_id, roi_input);
-    network.set_input_data(input_indices_id, roi_indices);
-
-    auto result = network.execute();
-
-    std::vector<float> expected_output{3.0f, 2.0f, 7.0f, 9.0f, 1.0f, 1.0f, 4.0f, 5.0f};
-
-    auto out_mem = result.at("plane_output").get_memory();
-    this->checkOutput(out_mem, expected_output);
-}
-
-TEST(experimental_detectron_topk_rois_gpu_test, export_import) {
-    const auto test_format = format::bs_fs_yx_bsv32_fsv16;
-    const data_types test_data_type = ov::element::from<float>();
-
-    auto& engine = get_test_engine();
-    // topk is more than model size
-    const int rois_num = 3;
-
-    auto roi_input = engine.allocate_memory({test_data_type, format::bfyx, tensor(batch(2), feature(4))});
-    auto roi_indices = engine.allocate_memory({data_types::i32, format::bfyx, tensor(batch(2), feature(1))});
-
-    std::vector<float> rois{1.0f, 1.0f, 4.0f, 5.0f, 3.0f, 2.0f, 7.0f, 9.0f};
-    set_values(roi_input, std::vector<float>(rois.begin(), rois.end()));
-    set_values(roi_indices, {1, 0});
-
-    const std::string input_rois_id = "InputRois";
-    const std::string input_indices_id = "InputIndices";
-    const std::string experimental_detectron_topk_rois_id = "experimental_detectron_topk_rois";
-    topology topology;
-    topology.add(input_layout(input_rois_id, roi_input->get_layout()));
-    topology.add(input_layout(input_indices_id, roi_indices->get_layout()));
-    topology.add(reorder("reordered_input", input_info(input_rois_id), test_format, test_data_type));
-    topology.add(reorder("reordered_indices", input_info(input_indices_id), test_format, data_types::i32));
-    topology.add(experimental_detectron_topk_rois(experimental_detectron_topk_rois_id,
-                                                  { input_info("reordered_input"), input_info("reordered_indices") },
-                                                  rois_num));
-    topology.add(reorder("plane_output", input_info(experimental_detectron_topk_rois_id), format::bfyx, test_data_type));
-
-    cldnn::network::ptr network = get_network(engine, topology, get_test_default_config(engine), get_test_stream_ptr(), true);
-
-    network->set_input_data(input_rois_id, roi_input);
-    network->set_input_data(input_indices_id, roi_indices);
-
-    auto result = network->execute();
-
-    std::vector<float> expected_output{3.0f, 2.0f, 7.0f, 9.0f, 1.0f, 1.0f, 4.0f, 5.0f};
-
-    auto out_mem = result.at("plane_output").get_memory();
-    cldnn::mem_lock<float> out_ptr(out_mem, get_test_stream());
-    ASSERT_EQ(expected_output.size(), out_ptr.size());
-    for (size_t i = 0; i < expected_output.size(); ++i) {
-        ASSERT_NEAR(static_cast<float>(expected_output[i]), out_ptr[i], 0.0001) << "at i = " << i;
-    }
-}
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/extract_image_patches_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/extract_image_patches_gpu_test.cpp
deleted file mode 100644
index 12b9f66aca3ea0..00000000000000
--- a/src/plugins/intel_gpu/tests/unit/test_cases/extract_image_patches_gpu_test.cpp
+++ /dev/null
@@ -1,571 +0,0 @@
-// Copyright (C) 2018-2024 Intel Corporation
-// SPDX-License-Identifier: Apache-2.0
-//
-
-#include "openvino/op/util/attr_types.hpp"
-#include "test_utils.h"
-
-#include <intel_gpu/primitives/input_layout.hpp>
-#include <intel_gpu/primitives/extract_image_patches.hpp>
-#include <intel_gpu/primitives/data.hpp>
-
-
-using namespace cldnn;
-using namespace ::tests;
-
-TEST(extract_image_patches_gpu, basic) {
-    //  Input  : 1x1x10x10
-    //  Output : 1x9x2x2
-
-    tensor output_shape = {1, 9, 2, 2};
-    auto& engine = get_test_engine();
-    auto batch = 1;
-    auto depth = 1;
-    auto in_rows = 10;
-    auto in_cols = 10;
-    ov::Shape sizes = {3, 3};
-    ov::Strides strides = {5, 5};
-    ov::Shape rates = {1, 1};
-    ov::op::PadType auto_pad = ov::op::PadType::VALID;
-
-    auto input = engine.allocate_memory({ data_types::f32, format::bfyx, { batch, depth, in_cols, in_rows } });
-
-    std::vector<float> inputVals(batch * depth * in_rows * in_cols);
-    std::generate(inputVals.begin(), inputVals.end(), []() {
-        static float n = 1;
-        return n++;
-    });
-
-    set_values(input, inputVals);
-
-    topology topology;
-    topology.add(input_layout("Input0", input->get_layout()));
-    topology.add(extract_image_patches("extract_image_patches", input_info("Input0"), sizes, strides, rates, auto_pad, output_shape));
-
-    network network(engine, topology, get_test_default_config(engine));
-    network.set_input_data("Input0", input);
-    auto outputs = network.execute();
-
-    ASSERT_EQ(outputs.size(), size_t(1));
-    ASSERT_EQ(outputs.begin()->first, "extract_image_patches");
-
-    auto output = outputs.at("extract_image_patches").get_memory();
-    cldnn::mem_lock<float> output_ptr(output, get_test_stream());
-
-    std::vector<float> answers = {
-         1,  6,
-        51, 56,
-
-         2,  7,
-        52, 57,
-
-         3,  8,
-        53, 58,
-
-        11, 16,
-        61, 66,
-
-        12, 17,
-        62, 67,
-
-        13, 18,
-        63, 68,
-
-        21, 26,
-        71, 76,
-
-        22, 27,
-        72, 77,
-
-        23, 28,
-        73, 78
-    };
-
-    ASSERT_EQ(answers.size(), output_ptr.size());
-    for (size_t i = 0; i < answers.size(); ++i) {
-        ASSERT_TRUE(are_equal(answers[i], output_ptr[i])) << i;
-    }
-}
-
-TEST(extract_image_patches_gpu, basic2) {
-    //  Input  : 1x1x10x10
-    //  Output : 1x16x1x1
-
-    auto& engine = get_test_engine();
-    auto batch = 1;
-    auto depth = 1;
-    auto in_rows = 10;
-    auto in_cols = 10;
-    ov::Shape sizes = {4, 4};
-    ov::Strides strides = {8, 8};
-    ov::Shape rates = {1, 1};
-    ov::op::PadType auto_pad = ov::op::PadType::VALID;
-    tensor output_shape = {1, 16, 1, 1};
-
-    auto input = engine.allocate_memory({ data_types::f32, format::bfyx, { batch, depth, in_cols, in_rows } });
-
-    std::vector<float> inputVals(batch * depth * in_rows * in_cols);
-    std::generate(inputVals.begin(), inputVals.end(), []() {
-        static float n = 1;
-        return n++;
-    });
-
-    set_values(input, inputVals);
-
-    topology topology;
-    topology.add(input_layout("Input0", input->get_layout()));
-    topology.add(extract_image_patches("extract_image_patches", input_info("Input0"), sizes, strides, rates, auto_pad, output_shape));
-
-    network network(engine, topology, get_test_default_config(engine));
-    network.set_input_data("Input0", input);
-    auto outputs = network.execute();
-
-    ASSERT_EQ(outputs.size(), size_t(1));
-    ASSERT_EQ(outputs.begin()->first, "extract_image_patches");
-
-    auto output = outputs.at("extract_image_patches").get_memory();
-    cldnn::mem_lock<float> output_ptr(output, get_test_stream());
-
-    std::vector<float> answers = {
-         1,
-         2,
-         3,
-         4,
-        11,
-        12,
-        13,
-        14,
-        21,
-        22,
-        23,
-        24,
-        31,
-        32,
-        33,
-        34
-    };
-
-    ASSERT_EQ(answers.size(), output_ptr.size());
-    for (size_t i = 0; i < answers.size(); ++i) {
-        ASSERT_TRUE(are_equal(answers[i], output_ptr[i])) << i;
-    }
-}
-
-TEST(extract_image_patches_gpu, basic3) {
-    //  Input  : 1x1x10x10
-    //  Output : 1x16x2x2
-
-    auto& engine = get_test_engine();
-    auto batch = 1;
-    auto depth = 1;
-    auto in_rows = 10;
-    auto in_cols = 10;
-    ov::Shape sizes = {4, 4};
-    ov::Strides strides = {9, 9};
-    ov::Shape rates = {1, 1};
-    ov::op::PadType auto_pad = ov::op::PadType::SAME_UPPER;
-    tensor output_shape = {1, 16, 2, 2};
-
-    auto input = engine.allocate_memory({ data_types::f32, format::bfyx, { batch, depth, in_cols, in_rows } });
-
-    std::vector<float> inputVals(batch * depth * in_rows * in_cols);
-    std::generate(inputVals.begin(), inputVals.end(), []() {
-        static float n = 1;
-        return n++;
-    });
-
-    set_values(input, inputVals);
-
-    topology topology;
-    topology.add(input_layout("Input0", input->get_layout()));
-    topology.add(extract_image_patches("extract_image_patches", input_info("Input0"), sizes, strides, rates, auto_pad, output_shape));
-
-    network network(engine, topology, get_test_default_config(engine));
-    network.set_input_data("Input0", input);
-    auto outputs = network.execute();
-
-    ASSERT_EQ(outputs.size(), size_t(1));
-    ASSERT_EQ(outputs.begin()->first, "extract_image_patches");
-
-    auto output = outputs.at("extract_image_patches").get_memory();
-    cldnn::mem_lock<float> output_ptr(output, get_test_stream());
-
-    std::vector<float> answers = {
-         0,   0,
-         0,  89,
-
-         0,   0,
-        81,  90,
-
-         0,   0,
-        82,   0,
-
-         0,   0,
-        83,   0,
-
-         0,   9,
-         0,  99,
-
-         1,  10,
-        91, 100,
-
-         2,   0,
-        92,   0,
-
-         3,   0,
-        93,   0,
-
-         0,  19,
-         0,   0,
-
-        11,  20,
-         0,   0,
-
-        12,   0,
-         0,   0,
-
-        13,   0,
-         0,   0,
-
-         0,  29,
-         0,   0,
-
-        21,  30,
-         0,   0,
-
-        22,   0,
-         0,   0,
-
-        23,   0,
-         0,   0,
-    };
-
-    ASSERT_EQ(answers.size(), output_ptr.size());
-    for (size_t i = 0; i < answers.size(); ++i) {
-        ASSERT_TRUE(are_equal(answers[i], output_ptr[i])) << i;
-    }
-}
-
-TEST(extract_image_patches_gpu, basic3_same_lower) {
-    //  Input  : 1x1x10x10
-    //  Output : 1x16x2x2
-
-    auto& engine = get_test_engine();
-    auto batch = 1;
-    auto depth = 1;
-    auto in_rows = 10;
-    auto in_cols = 10;
-    ov::Shape sizes = {4, 4};
-    ov::Strides strides = {9, 9};
-    ov::Shape rates = {1, 1};
-    ov::op::PadType auto_pad = ov::op::PadType::SAME_LOWER;
-    tensor output_shape = {1, 16, 2, 2};
-
-    auto input = engine.allocate_memory({ data_types::f32, format::bfyx, { batch, depth, in_cols, in_rows } });
-
-    std::vector<float> inputVals(batch * depth * in_rows * in_cols);
-    std::generate(inputVals.begin(), inputVals.end(), []() {
-        static float n = 1;
-        return n++;
-    });
-
-    set_values(input, inputVals);
-
-    topology topology;
-    topology.add(input_layout("Input0", input->get_layout()));
-    topology.add(extract_image_patches("extract_image_patches", input_info("Input0"), sizes, strides, rates, auto_pad, output_shape));
-
-    network network(engine, topology, get_test_default_config(engine));
-    network.set_input_data("Input0", input);
-    auto outputs = network.execute();
-
-    ASSERT_EQ(outputs.size(), size_t(1));
-    ASSERT_EQ(outputs.begin()->first, "extract_image_patches");
-
-    auto output = outputs.at("extract_image_patches").get_memory();
-    cldnn::mem_lock<float> output_ptr(output, get_test_stream());
-
-    std::vector<float> answers = {
-         0,   0,
-         0,  78,
-
-         0,   0,
-         0,  79,
-
-         0,   0,
-        71,  80,
-
-         0,   0,
-        72,   0,
-
-         0,   0,
-         0,  88,
-
-         0,   0,
-         0,  89,
-
-         0,   0,
-        81,  90,
-
-         0,   0,
-        82,   0,
-
-         0,   8,
-         0,  98,
-
-         0,   9,
-         0,  99,
-
-         1,  10,
-        91, 100,
-
-         2,   0,
-        92,   0,
-
-         0,  18,
-         0,   0,
-
-         0,  19,
-         0,   0,
-
-        11,  20,
-         0,   0,
-
-        12,   0,
-         0,   0,
-    };
-
-    ASSERT_EQ(answers.size(), output_ptr.size());
-    for (size_t i = 0; i < answers.size(); ++i) {
-        ASSERT_TRUE(are_equal(answers[i], output_ptr[i])) << i;
-    }
-}
-
-TEST(extract_image_patches_gpu, basic3_enough_space) {
-    //  Input  : 1x1x10x10
-    //  Output : 1x9x2x2
-
-    auto& engine = get_test_engine();
-    auto batch = 1;
-    auto depth = 1;
-    auto in_rows = 10;
-    auto in_cols = 10;
-    ov::Shape sizes = {3, 3};
-    ov::Strides strides = {7, 7};
-    ov::Shape rates = {1, 1};
-    ov::op::PadType auto_pad = ov::op::PadType::SAME_UPPER;
-    tensor output_shape = {1, 9, 2, 2};
-
-    auto input = engine.allocate_memory({ data_types::f32, format::bfyx, { batch, depth, in_cols, in_rows } });
-
-    std::vector<float> inputVals(batch * depth * in_rows * in_cols);
-    std::generate(inputVals.begin(), inputVals.end(), []() {
-        static float n = 1;
-        return n++;
-    });
-
-    set_values(input, inputVals);
-
-    topology topology;
-    topology.add(input_layout("Input0", input->get_layout()));
-    topology.add(extract_image_patches("extract_image_patches", input_info("Input0"), sizes, strides, rates, auto_pad, output_shape));
-
-    network network(engine, topology, get_test_default_config(engine));
-    network.set_input_data("Input0", input);
-    auto outputs = network.execute();
-
-    ASSERT_EQ(outputs.size(), size_t(1));
-    ASSERT_EQ(outputs.begin()->first, "extract_image_patches");
-
-    auto output = outputs.at("extract_image_patches").get_memory();
-    cldnn::mem_lock<float> output_ptr(output, get_test_stream());
-
-    std::vector<float> answers = {
-         1,   8,
-        71,  78,
-
-         2,   9,
-        72,  79,
-
-         3,  10,
-        73,  80,
-
-        11,  18,
-        81,  88,
-
-        12,  19,
-        82,  89,
-
-        13,  20,
-        83,  90,
-
-        21,  28,
-        91,  98,
-
-        22,  29,
-        92,  99,
-
-        23,  30,
-        93, 100,
-    };
-
-    ASSERT_EQ(answers.size(), output_ptr.size());
-    for (size_t i = 0; i < answers.size(); ++i) {
-        ASSERT_TRUE(are_equal(answers[i], output_ptr[i])) << i;
-    }
-}
-
-TEST(extract_image_patches_gpu, basic4) {
-    //  Input  : 1x1x10x10
-    //  Output : 1x9x2x2
-
-    auto& engine = get_test_engine();
-    auto batch = 1;
-    auto depth = 1;
-    auto in_rows = 10;
-    auto in_cols = 10;
-    ov::Shape sizes = {3, 3};
-    ov::Strides strides = {5, 5};
-    ov::Shape rates = {2, 2};
-    ov::op::PadType auto_pad = ov::op::PadType::VALID;
-    tensor output_shape = {1, 9, 2, 2};
-
-    auto input = engine.allocate_memory({ data_types::f32, format::bfyx, { batch, depth, in_cols, in_rows } });
-
-    std::vector<float> inputVals(batch * depth * in_rows * in_cols);
-    std::generate(inputVals.begin(), inputVals.end(), []() {
-        static float n = 1;
-        return n++;
-    });
-
-    set_values(input, inputVals);
-
-    topology topology;
-    topology.add(input_layout("Input0", input->get_layout()));
-    topology.add(extract_image_patches("extract_image_patches", input_info("Input0"), sizes, strides, rates, auto_pad, output_shape));
-
-    network network(engine, topology, get_test_default_config(engine));
-    network.set_input_data("Input0", input);
-    auto outputs = network.execute();
-
-    ASSERT_EQ(outputs.size(), size_t(1));
-    ASSERT_EQ(outputs.begin()->first, "extract_image_patches");
-
-    auto output = outputs.at("extract_image_patches").get_memory();
-    cldnn::mem_lock<float> output_ptr(output, get_test_stream());
-
-    std::vector<float> answers = {
-         1,   6,
-        51,  56,
-
-         3,   8,
-        53,  58,
-
-         5,  10,
-        55,  60,
-
-        21,  26,
-        71,  76,
-
-        23,  28,
-        73,  78,
-
-        25,  30,
-        75,  80,
-
-        41,  46,
-        91,  96,
-
-        43,  48,
-        93,  98,
-
-        45,  50,
-        95, 100
-    };
-
-    ASSERT_EQ(answers.size(), output_ptr.size());
-    for (size_t i = 0; i < answers.size(); ++i) {
-        ASSERT_TRUE(are_equal(answers[i], output_ptr[i])) << i;
-    }
-}
-
-template <typename T>
-void test_extract_image_patches_gpu_basic5(bool is_caching_test) {
-    //  Input  : 1x2x5x5
-    //  Output : 1x8x2x2
-
-    auto& engine = get_test_engine();
-    auto batch = 1;
-    auto depth = 2;
-    auto in_rows = 5;
-    auto in_cols = 5;
-    ov::Shape sizes = {2, 2};
-    ov::Strides strides = {3, 3};
-    ov::Shape rates = {1, 1};
-    ov::op::PadType auto_pad = ov::op::PadType::VALID;
-    tensor output_shape = {1, 8, 2, 2};
-
-    auto input = engine.allocate_memory({ data_types::f32, format::bfyx, { batch, depth, in_cols, in_rows } });
-
-    std::vector<T> inputVals(batch * depth * in_rows * in_cols);
-    float n = 1;
-    for (auto& val : inputVals) {
-        val = n++;
-    }
-
-    set_values(input, inputVals);
-
-    topology topology;
-    topology.add(input_layout("Input0", input->get_layout()));
-    topology.add(extract_image_patches("extract_image_patches", input_info("Input0"), sizes, strides, rates, auto_pad, output_shape));
-
-    cldnn::network::ptr network = get_network(engine, topology, get_test_default_config(engine), get_test_stream_ptr(), is_caching_test);
-
-    network->set_input_data("Input0", input);
-    auto outputs = network->execute();
-
-    ASSERT_EQ(outputs.size(), size_t(1));
-    ASSERT_EQ(outputs.begin()->first, "extract_image_patches");
-
-    auto output = outputs.at("extract_image_patches").get_memory();
-    cldnn::mem_lock<T> output_ptr(output, get_test_stream());
-
-    std::vector<T> answers = {
-         1,  4,
-        16, 19,
-
-        26, 29,
-        41, 44,
-
-         2,  5,
-        17, 20,
-
-        27, 30,
-        42, 45,
-
-         6,  9,
-        21, 24,
-
-        31, 34,
-        46, 49,
-
-         7, 10,
-        22, 25,
-
-        32, 35,
-        47, 50
-    };
-
-    ASSERT_EQ(answers.size(), output_ptr.size());
-    for (size_t i = 0; i < answers.size(); ++i) {
-        ASSERT_TRUE(are_equal(answers[i], output_ptr[i])) << i;
-    }
-}
-
-TEST(extract_image_patches_gpu, basic5) {
-    test_extract_image_patches_gpu_basic5<float>(false);
-}
-
-TEST(extract_image_patches_gpu, export_import) {
-    test_extract_image_patches_gpu_basic5<float>(true);
-}
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/eye.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/eye.cpp
deleted file mode 100644
index d3545e89935739..00000000000000
--- a/src/plugins/intel_gpu/tests/unit/test_cases/eye.cpp
+++ /dev/null
@@ -1,229 +0,0 @@
-// Copyright (C) 2022 Intel Corporation
-// SPDX-License-Identifier: Apache-2.0
-//
-#include <algorithm>
-#include <intel_gpu/primitives/data.hpp>
-#include <intel_gpu/primitives/eye.hpp>
-#include <intel_gpu/primitives/input_layout.hpp>
-#include <random>
-#include <vector>
-
-#include "test_utils.h"
-
-using namespace cldnn;
-using namespace ::tests;
-
-namespace {
-
-template <class OutputType, class InputType>
-using eye_test_param = std::tuple<format,                    // Input and output format
-                                  InputType,                 // columns number
-                                  InputType,                 // rows number
-                                  InputType,                 // diagonal index
-                                  std::vector<InputType>,    // batch shape
-                                  std::vector<int32_t>,      // output shape
-                                  std::vector<OutputType>,   // expected values
-                                  bool>;                     // is_caching_test
-
-template <class OutputType, class InputType>
-class EyeTest : public ::testing::TestWithParam<eye_test_param<OutputType, InputType>> {
-public:
-    void SetUp() override {
-        format fmt{format::bfyx};
-        InputType cols{};
-        InputType rows{};
-        InputType diag{};
-        std::vector<InputType> batch_shape;
-        std::vector<int32_t> output_shape;
-        std::vector<OutputType> expected_values;
-        bool is_caching_test;
-        std::tie(fmt, cols, rows, diag, batch_shape, output_shape, expected_values, is_caching_test) = this->GetParam();
-
-        auto num_rows = engine_.allocate_memory({ov::element::from<InputType>(), fmt, tensor{1}});
-        set_values<InputType>(num_rows, {rows});
-        auto num_coloms = engine_.allocate_memory({ov::element::from<InputType>(), fmt, tensor{1}});
-        set_values<InputType>(num_coloms, {cols});
-        auto diagonal_index = engine_.allocate_memory({ov::element::from<InputType>(), fmt, tensor{1}});
-        set_values<InputType>(diagonal_index, {diag});
-
-        topology tp;
-        tp.add(data("num_rows", num_rows));
-        tp.add(data("num_columns", num_coloms));
-        tp.add(data("diagonal_index", diagonal_index));
-
-        auto batch_rank = batch_shape.size() == 3 ? 3 : 2;
-        auto oupput_fmt = batch_rank == 3 ? format::bfzyx : format::bfyx;
-        if (!batch_shape.empty()) {
-            auto batch = engine_.allocate_memory({ov::element::from<InputType>(), fmt, tensor{batch_rank}});
-            set_values<InputType>(batch, batch_shape);
-            tp.add(data("batch", batch));
-        }
-
-        std::string ouput_op_name;
-        if (fmt == format::bfyx || fmt == format::bfzyx) {
-            auto inputs = batch_shape.empty()
-                              ? std::vector<input_info>{ input_info("num_rows"), input_info("num_columns"), input_info("diagonal_index") }
-                              : std::vector<input_info>{ input_info("num_rows"), input_info("num_columns"), input_info("diagonal_index"), input_info("batch") };
-            ouput_op_name = "eye";
-            auto eye_primitive =
-                eye("eye", inputs, tensor{output_shape}, diag, ov::element::from<OutputType>());
-            tp.add(std::move(eye_primitive));
-        } else {
-            tp.add(reorder("r_num_rows", input_info("num_rows"), fmt, ov::element::from<InputType>()));
-            tp.add(reorder("r_num_columns", input_info("num_columns"), fmt, ov::element::from<InputType>()));
-            tp.add(reorder("r_diagonal_index", input_info("diagonal_index"), fmt, ov::element::from<InputType>()));
-            if (!batch_shape.empty()) {
-                tp.add(reorder("r_batch", input_info("batch"), fmt, ov::element::from<InputType>()));
-            }
-            auto inputs = batch_shape.empty()
-                              ? std::vector<input_info>{ input_info("r_num_rows"), input_info("r_num_columns"), input_info("r_diagonal_index") }
-                              : std::vector<input_info>{ input_info("r_num_rows"), input_info("r_num_columns"), input_info("r_diagonal_index"), input_info("r_batch") };
-            auto eye_primitive =
-                eye("eye", inputs, tensor{output_shape}, diag, ov::element::from<OutputType>());
-            tp.add(std::move(eye_primitive));
-            ouput_op_name = "output";
-            tp.add(reorder("output", input_info("eye"), oupput_fmt, ov::element::from<OutputType>()));
-        }
-
-        cldnn::network::ptr network = get_network(engine_, tp, get_test_default_config(engine_), get_test_stream_ptr(), is_caching_test);
-
-        auto outputs = network->execute();
-
-        ASSERT_EQ(outputs.size(), size_t(1));
-        ASSERT_EQ(outputs.begin()->first, ouput_op_name);
-
-        auto output = outputs.at(ouput_op_name).get_memory();
-
-        cldnn::mem_lock<OutputType> output_ptr(output, get_test_stream());
-
-        ASSERT_EQ(output_ptr.size(), expected_values.size());
-        for (size_t i = 0; i < output_ptr.size(); ++i)
-            ASSERT_TRUE(are_equal(expected_values[i], output_ptr[i], 2e-3));
-    }
-
-protected:
-    engine& engine_ = get_test_engine();
-};
-
-std::vector<format> four_d_formats{
-    format::bfyx,
-    format::b_fs_yx_fsv16,
-    format::b_fs_yx_fsv32,
-    format::bs_fs_yx_bsv16_fsv16,
-    format::bs_fs_yx_bsv32_fsv32,
-    format::bs_fs_yx_bsv32_fsv16,
-};
-
-using eye_test_4d_float_int32 = EyeTest<float, int32_t>;
-TEST_P(eye_test_4d_float_int32, eye_test_4d_float_int32) {}
-INSTANTIATE_TEST_SUITE_P(
-    eye_test_4d_float_int32,
-    eye_test_4d_float_int32,
-    testing::Combine(testing::ValuesIn(four_d_formats),
-                     testing::Values(2),
-                     testing::Values(3),
-                     testing::Values(0),
-                     testing::ValuesIn(std::vector<std::vector<int32_t>>{{}, {1}, {1, 1}, {1, 1, 1}}),
-                     testing::Values(std::vector<int32_t>{1, 1, 2, 3}),
-                     testing::Values(std::vector<float>{1, 0, 0, 1, 0, 0}),
-                     testing::Values(false)));
-
-using eye_test_4d_int64_int32 = EyeTest<int64_t, int32_t>;
-TEST_P(eye_test_4d_int64_int32, eye_test_4d_int64_int32) {}
-INSTANTIATE_TEST_SUITE_P(
-    eye_test_4d_int64_int32,
-    eye_test_4d_int64_int32,
-    testing::Combine(testing::ValuesIn(four_d_formats),
-                     testing::Values(2),
-                     testing::Values(3),
-                     testing::Values(0),
-                     testing::ValuesIn(std::vector<std::vector<int32_t>>{{}, {1}, {1, 1}, {1, 1, 1}}),
-                     testing::Values(std::vector<int32_t>{1, 1, 2, 3}),
-                     testing::Values(std::vector<int64_t>{1, 0, 0, 1, 0, 0}),
-                     testing::Values(false)));
-
-using eye_test_4d_u8_int64 = EyeTest<uint8_t, int64_t>;
-TEST_P(eye_test_4d_u8_int64, eye_test_4d_u8_int64) {}
-INSTANTIATE_TEST_SUITE_P(
-    eye_test_4d_u8_int64,
-    eye_test_4d_u8_int64,
-    testing::Combine(testing::ValuesIn(four_d_formats),
-                     testing::Values(4),
-                     testing::Values(3),
-                     testing::Values(-1),
-                     testing::ValuesIn(std::vector<std::vector<int64_t>>{{}, {1}, {1, 1}, {1, 1, 1}}),
-                     testing::Values(std::vector<int32_t>{1, 1, 4, 3}),
-                     testing::Values(std::vector<uint8_t>{0, 0, 0, 0, 1, 0, 0, 0, 0, 1, 0, 0}),
-                     testing::Values(false)));
-
-using eye_test_4d_i8_int64_no_diag = EyeTest<int8_t, int64_t>;
-TEST_P(eye_test_4d_i8_int64_no_diag, eye_test_4d_i8_int64_no_diag) {}
-INSTANTIATE_TEST_SUITE_P(
-    eye_test_4d_i8_int64_no_diag,
-    eye_test_4d_i8_int64_no_diag,
-    testing::Combine(testing::ValuesIn(four_d_formats),
-                     testing::Values(4),
-                     testing::Values(3),
-                     testing::Values(4),
-                     testing::ValuesIn(std::vector<std::vector<int64_t>>{{}, {1}, {1, 1}, {1, 1, 1}}),
-                     testing::Values(std::vector<int32_t>{1, 1, 4, 3}),
-                     testing::Values(std::vector<int8_t>{0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0}),
-                     testing::Values(false)));
-
-using eye_test_4d_int32_int32_batch = EyeTest<int32_t, int32_t>;
-TEST_P(eye_test_4d_int32_int32_batch, eye_test_4d_int32_int32_batch) {}
-INSTANTIATE_TEST_SUITE_P(
-    eye_test_4d_int32_int32_batch,
-    eye_test_4d_int32_int32_batch,
-    testing::Combine(testing::ValuesIn(four_d_formats),
-                     testing::Values(2),
-                     testing::Values(2),
-                     testing::Values(1),
-                     testing::ValuesIn(std::vector<std::vector<int32_t>>{{2, 2}}),
-                     testing::Values(std::vector<int32_t>{2, 2, 2, 2}),
-                     testing::Values(std::vector<int32_t>{0, 1, 0, 0, 0, 1, 0, 0, 0, 1, 0, 0, 0, 1, 0, 0}),
-                     testing::Values(false)));
-
-std::vector<format> five_d_formats{
-    format::bfzyx,
-    format::b_fs_zyx_fsv16,
-    format::b_fs_zyx_fsv32,
-    format::bs_fs_zyx_bsv16_fsv32,
-    format::bs_fs_zyx_bsv16_fsv16,
-    format::bs_fs_zyx_bsv32_fsv32,
-    format::bs_fs_zyx_bsv32_fsv16,
-};
-
-using eye_test_5d_float_int32 = EyeTest<float, int32_t>;
-TEST_P(eye_test_5d_float_int32, eye_test_5d_float_int32) {}
-INSTANTIATE_TEST_SUITE_P(eye_test_5d_float_int32,
-                         eye_test_5d_float_int32,
-                         testing::Combine(testing::Values(five_d_formats[0]),
-                                          testing::Values(2),
-                                          testing::Values(2),
-                                          testing::Values(0),
-                                          testing::ValuesIn(std::vector<std::vector<int32_t>>{{2, 2, 2}}),
-                                          testing::Values(std::vector<int32_t>{2, 2, 2, 2, 2}),
-                                          testing::Values(std::vector<float>{
-                                              1, 0, 0, 1, 1, 0, 0, 1, 1, 0, 0, 1, 1, 0, 0, 1,
-
-                                              1, 0, 0, 1, 1, 0, 0, 1, 1, 0, 0, 1, 1, 0, 0, 1,
-                                          }),
-                                          testing::Values(false)));
-
-INSTANTIATE_TEST_SUITE_P(export_import,
-                         eye_test_5d_float_int32,
-                         testing::Combine(testing::Values(five_d_formats[0]),
-                                          testing::Values(2),
-                                          testing::Values(2),
-                                          testing::Values(0),
-                                          testing::ValuesIn(std::vector<std::vector<int32_t>>{{2, 2, 2}}),
-                                          testing::Values(std::vector<int32_t>{2, 2, 2, 2, 2}),
-                                          testing::Values(std::vector<float>{
-                                              1, 0, 0, 1, 1, 0, 0, 1, 1, 0, 0, 1, 1, 0, 0, 1,
-
-                                              1, 0, 0, 1, 1, 0, 0, 1, 1, 0, 0, 1, 1, 0, 0, 1,
-                                          }),
-                                          testing::Values(true)));
-
-}  // anonymous namespace
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/fully_connected_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/fully_connected_gpu_test.cpp
index 30b15f0c25a08b..17a9cacd213376 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/fully_connected_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/fully_connected_gpu_test.cpp
@@ -346,7 +346,6 @@ TEST(fully_connected_gpu, no_biases_fc_i32) {
 
     ExecutionConfig config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::optimize_data(true));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
 
     cldnn::network network(engine, topology, config);
 
@@ -1269,7 +1268,7 @@ class fully_connected_gpu_tests: public ::testing::Test {
         );
 
         auto config = get_test_default_config(engine);
-        config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
         network::ptr network = get_network(engine, topology, config, get_test_stream_ptr(), is_caching_test);
         network->set_input_data("input", input_mem);
@@ -1343,7 +1342,6 @@ class fully_connected_gpu_tests: public ::testing::Test {
             );
 
             auto config = get_test_default_config(engine);
-            config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
             ov::intel_gpu::ImplementationDesc fc_impl_desc = { format::bfyx, "fully_connected_gpu_bfyx_ref", impl_types::ocl };
             config.set_property(ov::intel_gpu::force_implementations(ov::intel_gpu::ImplForcingMap{ {"fc_prim", fc_impl_desc} }));
 
@@ -1368,7 +1366,6 @@ class fully_connected_gpu_tests: public ::testing::Test {
         );
 
         auto config = get_test_default_config(engine);
-        config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
         config.set_property(ov::intel_gpu::optimize_data(true));
         config.set_property(ov::hint::dynamic_quantization_group_size(32));
 
@@ -1455,7 +1452,6 @@ class fully_connected_gpu_tests: public ::testing::Test {
             );
 
             auto config = get_test_default_config(engine);
-            config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
             ov::intel_gpu::ImplementationDesc fc_impl_desc = { format::bfyx, "fully_connected_gpu_bfyx_ref", impl_types::ocl };
             config.set_property(ov::intel_gpu::force_implementations(ov::intel_gpu::ImplForcingMap{ {"fc_prim", fc_impl_desc} }));
 
@@ -1481,7 +1477,7 @@ class fully_connected_gpu_tests: public ::testing::Test {
         );
 
         auto config = get_test_default_config(engine);
-        config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
         config.set_property(ov::intel_gpu::optimize_data(true));
 
         network::ptr network = get_network(engine, topology, config, get_test_stream_ptr(), is_caching_test);
@@ -1546,7 +1542,6 @@ class fully_connected_gpu_tests: public ::testing::Test {
         );
 
         auto config = get_test_default_config(engine);
-        config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
         config.set_property(ov::intel_gpu::optimize_data(true));
         network::ptr network = get_network(engine, topology, config, get_test_stream_ptr(), is_caching_test);
 
@@ -1619,7 +1614,6 @@ class fully_connected_gpu_tests: public ::testing::Test {
             );
 
             auto config = get_test_default_config(engine);
-            config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
             ov::intel_gpu::ImplementationDesc fc_impl = { in_layout.format, "", impl_types::ocl };
             config.set_property(ov::intel_gpu::force_implementations(ov::intel_gpu::ImplForcingMap{ { "fc_prim1", fc_impl }, { "fc_prim2", fc_impl }  }));
 
@@ -1648,7 +1642,6 @@ class fully_connected_gpu_tests: public ::testing::Test {
         );
 
         auto config = get_test_default_config(engine);
-        config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
         config.set_property(ov::intel_gpu::optimize_data(true));
 
         network::ptr network = get_network(engine, topology, config, get_test_stream_ptr(), is_caching_test);
@@ -1723,7 +1716,7 @@ class fully_connected_gpu_tests: public ::testing::Test {
         );
 
         auto config = get_test_default_config(engine);
-        config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
         config.set_property(ov::intel_gpu::optimize_data(true));
 
         network::ptr network = get_network(engine, topology, config, get_test_stream_ptr(), is_caching_test);
@@ -1795,7 +1788,7 @@ class fully_connected_gpu_tests: public ::testing::Test {
 
         auto get_ref_results = [&]() {
             auto config = get_test_default_config(engine);
-            config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
             topology topology(
                 input_layout("input", in_layout),
@@ -1829,7 +1822,7 @@ class fully_connected_gpu_tests: public ::testing::Test {
         );
 
         auto config = get_test_default_config(engine);
-        config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
         config.set_property(ov::intel_gpu::optimize_data(true));
 
         network::ptr network = get_network(engine, topology, config, get_test_stream_ptr(), is_caching_test);
@@ -1883,7 +1876,7 @@ class fully_connected_gpu_tests: public ::testing::Test {
         );
 
         auto config = get_test_default_config(engine);
-        config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
         network::ptr network = get_network(engine, topology, config, get_test_stream_ptr(), is_caching_test);
         network->set_input_data("input", input_mem);
@@ -1934,7 +1927,7 @@ class fully_connected_gpu_tests: public ::testing::Test {
         );
 
         auto config = get_test_default_config(engine);
-        config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
         network::ptr network = get_network(engine, topology, config, get_test_stream_ptr(), is_caching_test);
         network->set_input_data("input", input_mem);
@@ -1999,7 +1992,6 @@ class fully_connected_gpu_tests: public ::testing::Test {
         );
 
         auto config = get_test_default_config(engine);
-        config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
         config.set_property(ov::intel_gpu::optimize_data(true));
 
         network::ptr network = get_network(engine, topology, config, get_test_stream_ptr(), is_caching_test);
@@ -2042,7 +2034,7 @@ class fully_connected_gpu_tests: public ::testing::Test {
 
         ExecutionConfig config = get_test_default_config(engine);
         config.set_property(ov::intel_gpu::optimize_data(true));
-        config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
         network::ptr network = get_network(engine, topology, config, get_test_stream_ptr(), is_caching_test);
         network->set_input_data("input", input_data);
 
@@ -2091,7 +2083,7 @@ class fully_connected_gpu_tests: public ::testing::Test {
 
         ExecutionConfig config = get_test_default_config(engine);
         config.set_property(ov::intel_gpu::optimize_data(true));
-        config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
         network::ptr network = get_network(engine, topology, config, get_test_stream_ptr(), is_caching_test);
         network->set_input_data("input", input_data);
 
@@ -2197,7 +2189,7 @@ class fully_connected_gpu_tests: public ::testing::Test {
 
         ExecutionConfig config = get_test_default_config(engine);
         config.set_property(ov::intel_gpu::optimize_data(true));
-        config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
         network::ptr network = get_network(engine, topology, config, get_test_stream_ptr(), is_caching_test);
 
         {
@@ -2278,7 +2270,7 @@ class fully_connected_gpu_tests: public ::testing::Test {
 
         ExecutionConfig config = get_test_default_config(engine);
         config.set_property(ov::intel_gpu::optimize_data(true));
-        config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
         network::ptr network = get_network(engine, topology, config, get_test_stream_ptr(), is_caching_test);
 
         auto inst = network->get_primitive("fc");
@@ -2367,7 +2359,7 @@ class fully_connected_gpu_tests: public ::testing::Test {
 
         ExecutionConfig config = get_test_default_config(engine);
         config.set_property(ov::intel_gpu::optimize_data(true));
-        config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
         network::ptr network = get_network(engine, topology, config, get_test_stream_ptr(), is_caching_test);
 
         // Call different shape multiple times to ensure caching works fine
@@ -2449,8 +2441,8 @@ class fully_connected_gpu_tests: public ::testing::Test {
         ov::intel_gpu::ImplementationDesc fc_impl_desc = { format::bfyx, "fully_connected_gpu_bf_tiled", impl_types::ocl };
         ExecutionConfig config = get_test_default_config(engine);
         config.set_property(ov::intel_gpu::optimize_data(true));
-        config.set_property(ov::intel_gpu::force_implementations(ov::intel_gpu::ImplForcingMap{ {"fc", fc_impl_desc} })),
-        config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+        config.set_property(ov::intel_gpu::force_implementations(ov::intel_gpu::ImplForcingMap{ {"fc", fc_impl_desc} }));
+
         network::ptr network = get_network(engine, topology, config, get_test_stream_ptr(), is_caching_test);
         network->set_input_data("input", input_data);
 
@@ -2511,7 +2503,7 @@ class fully_connected_gpu_tests: public ::testing::Test {
 
         ExecutionConfig config = get_test_default_config(engine);
         config.set_property(ov::intel_gpu::optimize_data(true));
-        config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
         network::ptr network = get_network(engine, topology, config, get_test_stream_ptr(), is_caching_test);
         network->set_input_data("input", input_data);
 
@@ -3855,7 +3847,7 @@ struct dynamic_fully_connected_gpu : ::testing::TestWithParam<fully_connected_dy
 
         ExecutionConfig config = get_test_default_config(engine);
         config.set_property(ov::intel_gpu::optimize_data(true));
-        config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
         network::ptr network = get_network(engine, topology, config, get_test_stream_ptr(), is_caching_test);
 
         for (const auto& batch_size : batch_sizes) {
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/gather_elements_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/gather_elements_gpu_test.cpp
index 4d10a54152e97f..2ec13d6da12edb 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/gather_elements_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/gather_elements_gpu_test.cpp
@@ -1295,7 +1295,7 @@ TEST(gather_elements_gpu, dynamic) {
     topology.add(gather_elements("gather_elements", input_info("InputData"), input_info("InputIndices"), axis));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     network network(engine, topology, config);
 
     network.set_input_data("InputData", input0);
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/gather_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/gather_gpu_test.cpp
index 6f83e3affceff4..dc2eef723ef8f7 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/gather_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/gather_gpu_test.cpp
@@ -95,7 +95,7 @@ class gather8_test : public ::testing::TestWithParam<gather8_test_param> {
         reorder_topo.add(reorder("reorder2", input_info("gather"), format::type::bfwzyx, T_dat_dt));
         auto config = get_test_default_config(engine);
         if (impl_type != impl_types::any) {
-            config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
             config.set_property(ov::intel_gpu::force_implementations(ov::intel_gpu::ImplForcingMap{ {"gather", {format::bfyx, "", impl_types::cpu}} }));
         }
 
@@ -1944,7 +1944,7 @@ TEST(gather_gpu_fp32, dynamic_322_axisF) {
     topology.add(gather("gather", input_info("input1"), input_info("input2"), axis, 0, ov::Shape{}));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     network network(engine, topology, config);
     network.set_input_data("input1", input1);
     network.set_input_data("input2", input2);
@@ -1987,7 +1987,7 @@ TEST(gather_gpu_fp32, indice_out_of_bound) {
     topology.add(gather("gather", input_info("input1"), input_info("input2"), axis, 0, ov::Shape{}, 0, true));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     network network(engine, topology, config);
     network.set_input_data("input1", input1);
     network.set_input_data("input2", input2);
@@ -2025,7 +2025,7 @@ TEST(gather_cpu_impl_fp32, dynamic_322_axisF) {
     topology.add(gather("gather", input_info("input1"), input_info("input2"), axis, 0, ov::Shape{}));
 
     auto config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     config.set_property(ov::intel_gpu::force_implementations(ov::intel_gpu::ImplForcingMap{ {"gather", {format::bfyx, "", impl_types::cpu}} }));
     network network(engine, topology, config);
     network.set_input_data("input1", input1);
@@ -2189,7 +2189,7 @@ class gather_gpu_tests: public ::testing::Test {
         );
 
         auto config = get_test_default_config(engine);
-        config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
         network::ptr network = get_network(engine, topology, config, get_test_stream_ptr(), is_caching_test);
         network->set_input_data("input", input_mem);
@@ -2234,7 +2234,7 @@ class gather_gpu_tests: public ::testing::Test {
         );
 
         auto config = get_test_default_config(engine);
-        config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
         network::ptr network = get_network(engine, topology, config, get_test_stream_ptr(), is_caching_test);
         network->set_input_data("input", input_mem);
@@ -2279,7 +2279,7 @@ class gather_gpu_tests: public ::testing::Test {
         );
 
         auto config = get_test_default_config(engine);
-        config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
         network::ptr network = get_network(engine, topology, config, get_test_stream_ptr(), is_caching_test);
         network->set_input_data("input", input_mem);
@@ -2350,7 +2350,7 @@ TEST(gather_gpu_fp32, dynamic_support_neg_ind) {
     topology.add(gather("gather", input_info("data"), input_info("indices"), axis, data_shape.size(), ov::Shape{}, 0, true));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     network network(engine, topology, config);
 
     network.set_input_data("data", data_mem);
@@ -2395,7 +2395,6 @@ TEST(gather_gpu_fp32, dynamic_support_scalar_indice_empty_memory) {
     topology.add(gather("gather", input_info("data"), input_info("indices"), axis, data_shape.size(), ov::Shape{}, 0, true));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
     network network(engine, topology, config);
 
     network.set_input_data("data", data_mem);
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/gather_nd_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/gather_nd_gpu_test.cpp
index 3f2919fd8011ec..e1f38ed812955d 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/gather_nd_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/gather_nd_gpu_test.cpp
@@ -839,7 +839,7 @@ TEST(gather_nd_gpu_fp16, dynamic_r4) {
     topology.add(gather_nd("gather_nd", input_info("input1"), input_info("input2"), static_cast<uint8_t>(in1_shape.size()), static_cast<uint8_t>(in2_shape.size()), batch_dims, true));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     network network(engine, topology, config);
     network.set_input_data("input1", input1);
     network.set_input_data("input2", input2);
@@ -921,7 +921,7 @@ TEST(gather_nd_gpu_fp16, dynamic_r5) {
     topology.add(gather_nd("gather_nd", input_info("input1"), input_info("input2"), static_cast<uint8_t>(in1_shape.size()), static_cast<uint8_t>(in2_shape.size()), batch_dims, false));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     network network(engine, topology, config);
     network.set_input_data("input1", input1);
     network.set_input_data("input2", input2);
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/gemm_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/gemm_gpu_test.cpp
index b61d05767fee66..4360124d34f01e 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/gemm_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/gemm_gpu_test.cpp
@@ -341,7 +341,7 @@ class gemm_gpu_tests: public ::testing::Test {
 
         ExecutionConfig config = get_test_default_config(engine);
         config.set_property(ov::intel_gpu::optimize_data(true));
-        config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
         network::ptr network = get_network(engine, topology, config, get_test_stream_ptr(), is_caching_test);
         network->set_input_data("input1", input1);
         network->set_input_data("input2", input2);
@@ -470,7 +470,7 @@ class gemm_gpu_tests: public ::testing::Test {
 
             auto config = get_test_default_config(engine);
             config.set_property(ov::intel_gpu::optimize_data(true));
-            config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
             network network(engine, topology, config);
             network.set_input_data("input1", input1_mem);
@@ -496,7 +496,7 @@ class gemm_gpu_tests: public ::testing::Test {
 
         ExecutionConfig config = get_test_default_config(engine);
         config.set_property(ov::intel_gpu::optimize_data(true));
-        config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
         network::ptr network = get_network(engine, topology, config, get_test_stream_ptr(), is_caching_test);
         network->set_input_data("input1", input1_mem);
         network->set_input_data("input2", input2_mem);
@@ -570,7 +570,7 @@ class gemm_gpu_tests: public ::testing::Test {
 
         ExecutionConfig config = get_test_default_config(engine);
         config.set_property(ov::intel_gpu::optimize_data(true));
-        config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
         network::ptr network = get_network(engine, topology, config, get_test_stream_ptr(), is_caching_test);
 
         {
@@ -659,7 +659,7 @@ class gemm_gpu_tests: public ::testing::Test {
 
         ExecutionConfig config = get_test_default_config(engine);
         config.set_property(ov::intel_gpu::optimize_data(true));
-        config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
         network::ptr network = get_network(engine, topology, config, get_test_stream_ptr(), is_caching_test);
 
         {
@@ -767,7 +767,7 @@ class gemm_gpu_tests: public ::testing::Test {
 
         ExecutionConfig config = get_test_default_config(engine);
         config.set_property(ov::intel_gpu::optimize_data(true));
-        config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
         network::ptr network = get_network(engine, topology, config, get_test_stream_ptr(), is_caching_test);
         network->set_input_data("input0", input0_mem);
         network->set_input_data("input1", input1_mem);
@@ -909,7 +909,7 @@ class gemm_gpu_tests: public ::testing::Test {
 
         ExecutionConfig config = get_test_default_config(engine);
         config.set_property(ov::intel_gpu::optimize_data(true));
-        config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
         network::ptr network = get_network(engine, topology, config, get_test_stream_ptr(), is_caching_test);
         network->set_input_data("input0", input0_mem);
         network->set_input_data("input1", input1_mem);
@@ -1078,7 +1078,7 @@ class gemm_gpu_tests: public ::testing::Test {
 
         ExecutionConfig config = get_test_default_config(engine);
         config.set_property(ov::intel_gpu::optimize_data(true));
-        config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
         network::ptr network = get_network(engine, topology, config, get_test_stream_ptr(), is_caching_test);
         network->set_input_data("input0", input0_mem);
         network->set_input_data("input1", input1_mem);
@@ -1251,7 +1251,7 @@ class gemm_gpu_tests: public ::testing::Test {
 
         ExecutionConfig config = get_test_default_config(engine);
         config.set_property(ov::intel_gpu::optimize_data(true));
-        config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
         network::ptr network = get_network(engine, topology, config, get_test_stream_ptr(), is_caching_test);
         network->set_input_data("input0", input0_mem);
         network->set_input_data("input1", input1_mem);
@@ -1365,7 +1365,7 @@ class gemm_gpu_tests: public ::testing::Test {
 
         ExecutionConfig config = get_test_default_config(engine);
         config.set_property(ov::intel_gpu::optimize_data(true));
-        config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
         network::ptr network = get_network(engine, topology, config, get_test_stream_ptr(), is_caching_test);
         network->set_input_data("input0", input0_mem);
         network->set_input_data("input1", input1_mem);
@@ -2579,8 +2579,7 @@ class gemm_onednn: public ::testing::Test {
         );
 
         ExecutionConfig cfg{ ov::intel_gpu::queue_type(QueueTypes::in_order),
-                             ov::intel_gpu::optimize_data(true),
-                             ov::intel_gpu::allow_new_shape_infer(true) };
+                             ov::intel_gpu::optimize_data(true) };
 
         network network(engine, topology, cfg);
         network.set_input_data("input1", input1);
@@ -2633,8 +2632,7 @@ class gemm_onednn: public ::testing::Test {
         ov::intel_gpu::ImplementationDesc impl = { format::bfyx, "", impl_types::onednn };
         ExecutionConfig config{ ov::intel_gpu::queue_type(QueueTypes::in_order),
                                 ov::intel_gpu::force_implementations(ov::intel_gpu::ImplForcingMap{ {"gemm", impl} }),
-                                ov::intel_gpu::optimize_data(true),
-                                ov::intel_gpu::allow_new_shape_infer(false) };
+                                ov::intel_gpu::optimize_data(true) };
         network network(engine, topology, config);
 
         auto input0_data = rg.generate_random_1d<ov::float16>(input0->get_layout().count(), -1, 1);
@@ -2763,8 +2761,7 @@ class gemm_onednn: public ::testing::Test {
             ov::intel_gpu::ImplementationDesc gemm_impl = { format::bfyx, std::string(""), impl_types::onednn };
             ExecutionConfig cfg{ ov::intel_gpu::queue_type(QueueTypes::in_order),
                                  ov::intel_gpu::force_implementations(ov::intel_gpu::ImplForcingMap{ {"gemm_ref", gemm_impl} }),
-                                 ov::intel_gpu::optimize_data(true),
-                                 ov::intel_gpu::allow_new_shape_infer(true) };
+                                 ov::intel_gpu::optimize_data(true) };
 
             network network(engine, topology, cfg);
             network.set_input_data("input1", input1_mem);
@@ -2793,8 +2790,7 @@ class gemm_onednn: public ::testing::Test {
         ov::intel_gpu::ImplementationDesc gemm_impl = { format::bfyx, std::string(""), impl_types::onednn };
         ExecutionConfig cfg{ ov::intel_gpu::queue_type(QueueTypes::in_order),
                              ov::intel_gpu::force_implementations(ov::intel_gpu::ImplForcingMap{ {"gemm", gemm_impl} }),
-                             ov::intel_gpu::optimize_data(true),
-                             ov::intel_gpu::allow_new_shape_infer(true) };
+                             ov::intel_gpu::optimize_data(true) };
         network network(engine, topology, cfg);
         network.set_input_data("input1", input1_mem);
         network.set_input_data("input2", input2_mem);
@@ -2899,8 +2895,7 @@ class gemm_onednn: public ::testing::Test {
             ov::intel_gpu::ImplementationDesc gemm_impl = { format::bfyx, std::string(""), impl_types::onednn };
             ExecutionConfig cfg{ ov::intel_gpu::queue_type(QueueTypes::in_order),
                                  ov::intel_gpu::force_implementations(ov::intel_gpu::ImplForcingMap{ {"gemm", gemm_impl} }),
-                                 ov::intel_gpu::optimize_data(true),
-                                 ov::intel_gpu::allow_new_shape_infer(true) };
+                                 ov::intel_gpu::optimize_data(true) };
 
             network network(engine, topology, cfg);
             network.set_input_data("input1", input1_mem);
@@ -2929,8 +2924,7 @@ class gemm_onednn: public ::testing::Test {
         ov::intel_gpu::ImplementationDesc gemm_impl = { format::bfyx, std::string(""), impl_types::onednn };
         ExecutionConfig cfg{ ov::intel_gpu::queue_type(QueueTypes::in_order),
                              ov::intel_gpu::force_implementations(ov::intel_gpu::ImplForcingMap{ {"gemm", gemm_impl} }),
-                             ov::intel_gpu::optimize_data(true),
-                             ov::intel_gpu::allow_new_shape_infer(true) };
+                             ov::intel_gpu::optimize_data(true) };
         network network(engine, topology, cfg);
         network.set_input_data("input1", input1_mem);
         network.set_input_data("input2", input2_mem);
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/generate_proposals_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/generate_proposals_gpu_test.cpp
deleted file mode 100644
index 10e5dd3d27c141..00000000000000
--- a/src/plugins/intel_gpu/tests/unit/test_cases/generate_proposals_gpu_test.cpp
+++ /dev/null
@@ -1,478 +0,0 @@
-// Copyright (C) 2022 Intel Corporation
-// SPDX-License-Identifier: Apache-2.0
-//
-
-#include "intel_gpu/runtime/execution_config.hpp"
-#include "test_utils.h"
-
-#include <intel_gpu/primitives/generate_proposals.hpp>
-#include <intel_gpu/primitives/input_layout.hpp>
-#include <intel_gpu/primitives/mutable_data.hpp>
-
-using namespace cldnn;
-using namespace ::tests;
-
-namespace {
-template <typename T>
-struct GenerateProposalsParams {
-    float min_size;
-    float nms_threshold;
-    int64_t pre_nms_count;
-    int64_t post_nms_count;
-    bool normalized;
-    float nms_eta;
-    std::vector<T> expected_rois;
-    std::vector<T> expected_roi_scores;
-    std::vector<size_t> expected_rois_num;
-};
-
-template <typename T>
-using GenerateProposalsParamsWithLayout = std::tuple<GenerateProposalsParams<T>, format::type, bool>;
-
-constexpr size_t num_batches = 2;
-constexpr size_t image_height = 200;
-constexpr size_t image_width = 200;
-constexpr float image_scale = 4.0f;
-constexpr size_t height = 2;
-constexpr size_t width = 6;
-constexpr size_t number_of_anchors = 3;
-
-const std::vector<float> im_info{image_height, image_width, image_scale, image_height, image_width, image_scale};
-
-const std::vector<float> anchors{
-        0.0f,  1.0f,  2.0f,  3.0f,
-        4.0f,  5.0f,  6.0f,  7.0f,
-        8.0f,  9.0f, 10.0f, 11.0f,
-        12.0f, 13.0f, 14.0f, 15.0f,
-        16.0f, 17.0f, 18.0f, 19.0f,
-        20.0f, 21.0f, 22.0f, 23.0f,
-        24.0f, 25.0f, 26.0f, 27.0f,
-        28.0f, 29.0f, 30.0f, 31.0f,
-        32.0f, 33.0f, 34.0f, 35.0f,
-        36.0f, 37.0f, 38.0f, 39.0f,
-        40.0f, 41.0f, 42.0f, 43.0f,
-        44.0f, 45.0f, 46.0f, 47.0f,
-        48.0f, 49.0f, 50.0f, 51.0f,
-        52.0f, 53.0f, 54.0f, 55.0f,
-        56.0f, 57.0f, 58.0f, 59.0f,
-        60.0f, 61.0f, 62.0f, 63.0f,
-        64.0f, 65.0f, 66.0f, 67.0f,
-        68.0f, 69.0f, 70.0f, 71.0f,
-        72.0f, 73.0f, 74.0f, 75.0f,
-        76.0f, 77.0f, 78.0f, 79.0f,
-        80.0f, 81.0f, 82.0f, 83.0f,
-        84.0f, 85.0f, 86.0f, 87.0f,
-        88.0f, 89.0f, 90.0f, 91.0f,
-        92.0f, 93.0f, 94.0f, 95.0f,
-        96.0f,  97.0f,  98.0f,  99.0f,
-        100.0f, 101.0f, 102.0f, 103.0f,
-        104.0f, 105.0f, 106.0f, 107.0f,
-        108.0f, 109.0f, 110.0f, 111.0f,
-        112.0f, 113.0f, 114.0f, 115.0f,
-        116.0f, 117.0f, 118.0f, 119.0f,
-        120.0f, 121.0f, 122.0f, 123.0f,
-        124.0f, 125.0f, 126.0f, 127.0f,
-        128.0f, 129.0f, 130.0f, 131.0f,
-        132.0f, 133.0f, 134.0f, 135.0f,
-        136.0f, 137.0f, 138.0f, 139.0f,
-        140.0f, 141.0f, 142.0f, 143.0f};
-
-const std::vector<float> deltas{
-        0.5337073,  0.86607957, 0.55151343, 0.21626699, 0.4462629,  0.03985678,
-        0.5157072,  0.9932138,  0.7565954,  0.43803605, 0.802818,   0.14834064,
-        0.53932905, 0.14314,    0.3817048,  0.95075196, 0.05516243, 0.2567484,
-        0.25508744, 0.77438325, 0.43561,    0.2094628,  0.8299043,  0.44982538,
-        0.95615596, 0.5651084,  0.11801951, 0.05352486, 0.9774733,  0.14439464,
-        0.62644225, 0.14370479, 0.54161614, 0.557915,   0.53102225, 0.0840179,
-        0.7249888,  0.9843559,  0.5490522,  0.53788143, 0.822474,   0.3278008,
-        0.39688024, 0.3286012,  0.5117038,  0.04743988, 0.9408995,  0.29885054,
-        0.81039643, 0.85277915, 0.06807619, 0.86430097, 0.36225632, 0.16606331,
-        0.5401001,  0.7541649,  0.11998601, 0.5131829,  0.40606487, 0.327888,
-        0.27721855, 0.6378373,  0.22795396, 0.4961256,  0.3215895,  0.15607187,
-        0.14782153, 0.8908137,  0.8835288,  0.834191,   0.29907143, 0.7983525,
-        0.755875,   0.30837986, 0.0839176,  0.26624718, 0.04371626, 0.09472824,
-        0.20689541, 0.37622106, 0.1083321,  0.1342548,  0.05815459, 0.7676379,
-        0.8105144,  0.92348766, 0.26761323, 0.7183306,  0.8947588,  0.19020908,
-        0.42731014, 0.7473663,  0.85775334, 0.9340091,  0.3278848,  0.755993,
-        0.05307213, 0.39705503, 0.21003333, 0.5625373,  0.66188884, 0.80521655,
-        0.6125863,  0.44678232, 0.97802377, 0.0204936,  0.02686367, 0.7390654,
-        0.74631,    0.58399844, 0.5988792,  0.37413648, 0.5946692,  0.6955776,
-        0.36377597, 0.7891322,  0.40900692, 0.99139464, 0.50169915, 0.41435778,
-        0.17142445, 0.26761186, 0.31591868, 0.14249913, 0.12919712, 0.5418711,
-        0.6523203,  0.50259084, 0.7379765,  0.01171071, 0.94423133, 0.00841132,
-        0.97486794, 0.2921785,  0.7633071,  0.88477814, 0.03563205, 0.50833166,
-        0.01354555, 0.535081,   0.41366324, 0.0694767,  0.9944055,  0.9981207,
-        0.5337073,  0.86607957, 0.55151343, 0.21626699, 0.4462629,  0.03985678,
-        0.5157072,  0.9932138,  0.7565954,  0.43803605, 0.802818,   0.14834064,
-        0.53932905, 0.14314,    0.3817048,  0.95075196, 0.05516243, 0.2567484,
-        0.25508744, 0.77438325, 0.43561,    0.2094628,  0.8299043,  0.44982538,
-        0.95615596, 0.5651084,  0.11801951, 0.05352486, 0.9774733,  0.14439464,
-        0.62644225, 0.14370479, 0.54161614, 0.557915,   0.53102225, 0.0840179,
-        0.7249888,  0.9843559,  0.5490522,  0.53788143, 0.822474,   0.3278008,
-        0.39688024, 0.3286012,  0.5117038,  0.04743988, 0.9408995,  0.29885054,
-        0.81039643, 0.85277915, 0.06807619, 0.86430097, 0.36225632, 0.16606331,
-        0.5401001,  0.7541649,  0.11998601, 0.5131829,  0.40606487, 0.327888,
-        0.27721855, 0.6378373,  0.22795396, 0.4961256,  0.3215895,  0.15607187,
-        0.14782153, 0.8908137,  0.8835288,  0.834191,   0.29907143, 0.7983525,
-        0.755875,   0.30837986, 0.0839176,  0.26624718, 0.04371626, 0.09472824,
-        0.20689541, 0.37622106, 0.1083321,  0.1342548,  0.05815459, 0.7676379,
-        0.8105144,  0.92348766, 0.26761323, 0.7183306,  0.8947588,  0.19020908,
-        0.42731014, 0.7473663,  0.85775334, 0.9340091,  0.3278848,  0.755993,
-        0.05307213, 0.39705503, 0.21003333, 0.5625373,  0.66188884, 0.80521655,
-        0.6125863,  0.44678232, 0.97802377, 0.0204936,  0.02686367, 0.7390654,
-        0.74631,    0.58399844, 0.5988792,  0.37413648, 0.5946692,  0.6955776,
-        0.36377597, 0.7891322,  0.40900692, 0.99139464, 0.50169915, 0.41435778,
-        0.17142445, 0.26761186, 0.31591868, 0.14249913, 0.12919712, 0.5418711,
-        0.6523203,  0.50259084, 0.7379765,  0.01171071, 0.94423133, 0.00841132,
-        0.97486794, 0.2921785,  0.7633071,  0.88477814, 0.03563205, 0.50833166,
-        0.01354555, 0.535081,   0.41366324, 0.0694767,  0.9944055,  0.9981207};
-
-const std::vector<float> scores{
-        0.56637216, 0.90457034, 0.69827306, 0.4353543,  0.47985056, 0.42658508,
-        0.14516132, 0.08081771, 0.1799732,  0.9229515,  0.42420176, 0.50857586,
-        0.82664067, 0.4972319,  0.3752427,  0.56731623, 0.18241242, 0.33252355,
-        0.30608943, 0.6572437,  0.69185436, 0.88646156, 0.36985755, 0.5590753,
-        0.5256446,  0.03342898, 0.1344396,  0.68642473, 0.37953874, 0.32575172,
-        0.21108444, 0.5661886,  0.45378175, 0.62126315, 0.26799858, 0.37272978,
-        0.56637216, 0.90457034, 0.69827306, 0.4353543,  0.47985056, 0.42658508,
-        0.14516132, 0.08081771, 0.1799732,  0.9229515,  0.42420176, 0.50857586,
-        0.82664067, 0.4972319,  0.3752427,  0.56731623, 0.18241242, 0.33252355,
-        0.30608943, 0.6572437,  0.69185436, 0.88646156, 0.36985755, 0.5590753,
-        0.5256446,  0.03342898, 0.1344396,  0.68642473, 0.37953874, 0.32575172,
-        0.21108444, 0.5661886,  0.45378175, 0.62126315, 0.26799858, 0.37272978};
-
-const std::vector<format::type> layouts{
-    format::bfyx,
-    format::b_fs_yx_fsv16,
-    format::b_fs_yx_fsv32,
-    format::bs_fs_yx_bsv16_fsv16,
-    format::bs_fs_yx_bsv32_fsv16,
-    format::bs_fs_yx_bsv32_fsv32};
-
-template <typename T>
-std::vector<T> getValues(const std::vector<float>& values) {
-    std::vector<T> result(values.begin(), values.end());
-    return result;
-}
-template <typename T> float getError();
-
-template<>
-float getError<float>() {
-    return 0.001;
-}
-
-template<>
-float getError<ov::float16>() {
-    return 0.2;
-}
-
-template <typename T>
-std::vector<GenerateProposalsParams<T>> getGenerateProposalsParams() {
-    std::vector<GenerateProposalsParams<T>> params = {
-            {
-                    1.0f, 0.7f, 14, 6, true, 1.0,
-                    getValues<T>({4.49132, 4.30537, 8.75027, 8.8035,
-                                  0, 1.01395, 4.66909, 5.14337,
-                                  135.501, 137.467, 139.81, 141.726,
-                                  4.49132, 4.30537, 8.75027, 8.8035,
-                                  0, 1.01395, 4.66909, 5.14337,
-                                  135.501, 137.467, 139.81, 141.726}),
-                    getValues<T>({0.826641, 0.566372, 0.559075,
-                                  0.826641, 0.566372, 0.559075}),
-                    {3, 3}
-            },
-            {
-                    1.0f, 0.7f, 1000, 6, true, 1.0,
-                    getValues<T>({4.49132, 4.30537, 8.75027, 8.8035,
-                                  0, 1.01395, 4.66909, 5.14337,
-                                  135.501, 137.467, 139.81, 141.726,
-                                  47.2348, 47.8342, 52.5503, 52.3864,
-                                  126.483, 128.3, 131.625, 133.707,
-                                  4.49132, 4.30537, 8.75027, 8.8035,
-                                  0, 1.01395, 4.66909, 5.14337,
-                                  135.501, 137.467, 139.81, 141.726,
-                                  47.2348, 47.8342, 52.5503, 52.3864,
-                                  126.483, 128.3, 131.625, 133.707}),
-                    getValues<T>({0.826641, 0.566372, 0.559075, 0.479851, 0.267999,
-                                  0.826641, 0.566372, 0.559075, 0.479851, 0.267999}),
-                    {5, 5}
-            },
-            {
-                    0.0f, 0.7f, 14, 6, true, 1.0,
-                    getValues<T>({108.129, 109.37, 111.623, 111.468,
-                                  12.9725, 11.6102, 16.4918, 16.9624,
-                                  112.883, 113.124, 115.17, 118.213,
-                                  4.49132, 4.30537, 8.75027, 8.8035,
-                                  24.9778, 25.0318, 27.2283, 28.495,
-                                  100.126, 101.409, 102.354, 106.125,
-                                  108.129, 109.37, 111.623, 111.468,
-                                  12.9725, 11.6102, 16.4918, 16.9624,
-                                  112.883, 113.124, 115.17, 118.213,
-                                  4.49132, 4.30537, 8.75027, 8.8035,
-                                  24.9778, 25.0318, 27.2283, 28.495,
-                                  100.126, 101.409, 102.354, 106.125}),
-                    getValues<T>({0.922952, 0.90457, 0.886462, 0.826641, 0.698273, 0.691854,
-                                  0.922952, 0.90457, 0.886462, 0.826641, 0.698273, 0.691854}),
-                    {6, 6}
-            },
-
-            {
-                    0.1f, 0.7f, 1000, 6, true, 1.0,
-                    getValues<T>({108.129, 109.37, 111.623, 111.468,
-                                  12.9725, 11.6102, 16.4918, 16.9624,
-                                  112.883, 113.124, 115.17, 118.213,
-                                  4.49132, 4.30537, 8.75027, 8.8035,
-                                  24.9778, 25.0318, 27.2283, 28.495,
-                                  100.126, 101.409, 102.354, 106.125,
-                                  108.129, 109.37, 111.623, 111.468,
-                                  12.9725, 11.6102, 16.4918, 16.9624,
-                                  112.883, 113.124, 115.17, 118.213,
-                                  4.49132, 4.30537, 8.75027, 8.8035,
-                                  24.9778, 25.0318, 27.2283, 28.495,
-                                  100.126, 101.409, 102.354, 106.125}),
-                    getValues<T>({0.922952, 0.90457, 0.886462, 0.826641, 0.698273, 0.691854,
-                                  0.922952, 0.90457, 0.886462, 0.826641, 0.698273, 0.691854}),
-                    {6, 6}
-            },
-            {
-                    1.0f, 0.7f, 14, 6, false, 1.0,
-                    getValues<T>({13.4588, 10.9153, 17.7377, 17.9436,
-                                  4.73698, 3.95806, 10.1254, 9.70525,
-                                  89.5773, 90.0053, 92.9476, 95.3396,
-                                  0, 1.02093, 6.00364, 6.21505,
-                                  92.3608, 94.306, 96.3198, 98.4288,
-                                  135.252, 137.7, 140.716, 143.09,
-                                  13.4588, 10.9153, 17.7377, 17.9436,
-                                  4.73698, 3.95806, 10.1254, 9.70525,
-                                  89.5773, 90.0053, 92.9476, 95.3396,
-                                  0, 1.02093, 6.00364, 6.21505,
-                                  92.3608, 94.306, 96.3198, 98.4288,
-                                  135.252, 137.7, 140.716, 143.09}),
-                    getValues<T>({0.90457, 0.826641, 0.657244, 0.566372, 0.566189, 0.559075,
-                                  0.90457, 0.826641, 0.657244, 0.566372, 0.566189, 0.559075}),
-                    {6, 6}
-            },
-            {
-                    0.0f, 0.7f, 1000, 6, false, 1.0,
-                    getValues<T>({108.194, 109.556, 112.435, 111.701,
-                                  13.4588, 10.9153, 17.7377, 17.9436,
-                                  113.324, 113.186, 115.755, 119.82,
-                                  4.73698, 3.95806, 10.1254, 9.70525,
-                                  25.4666, 25.0477, 27.8424, 29.2425,
-                                  100.188, 101.614, 102.532, 107.687,
-                                  108.194, 109.556, 112.435, 111.701,
-                                  13.4588, 10.9153, 17.7377, 17.9436,
-                                  113.324, 113.186, 115.755, 119.82,
-                                  4.73698, 3.95806, 10.1254, 9.70525,
-                                  25.4666, 25.0477, 27.8424, 29.2425,
-                                  100.188, 101.614, 102.532, 107.687}),
-                    getValues<T>({0.922952, 0.90457, 0.886462, 0.826641, 0.698273, 0.691854,
-                                  0.922952, 0.90457, 0.886462, 0.826641, 0.698273, 0.691854}),
-                    {6, 6}
-            }
-    };
-    return params;
-}
-};  // namespace
-
-template <typename T, typename ROIS_NUM_T>
-struct generate_proposals_test
-        : public ::testing::TestWithParam<GenerateProposalsParamsWithLayout<T> > {
-public:
-    void test() {
-        GenerateProposalsParams<T> param;
-        format::type data_layout;
-        bool is_caching_test;
-        std::tie(param, data_layout, is_caching_test) = this->GetParam();
-        const bool need_reorder = data_layout != format::bfyx;
-
-        const auto data_type = ov::element::from<T>();
-        const auto rois_num_type = ov::element::from<ROIS_NUM_T>();
-
-        auto& engine = get_test_engine();
-        std::shared_ptr<cldnn::stream> stream = get_test_stream_ptr();;
-        const primitive_id input_im_info_id = "InputImInfo";
-        const auto input_im_info = engine.allocate_memory({data_type, format::bfyx, tensor{batch(num_batches), feature(3)}});
-        set_values(input_im_info, getValues<T>(im_info));
-
-        const primitive_id input_anchors_id = "InputAnchors";
-        auto input_anchors = engine.allocate_memory(
-                {data_type, format::bfyx, tensor{batch(height), feature(width), spatial(4, number_of_anchors)}});
-        set_values(input_anchors, getValues<T>(anchors));
-
-        const primitive_id input_deltas_id = "InputDeltas";
-        auto input_deltas = engine.allocate_memory(
-                {data_type, format::bfyx,
-                 tensor{batch(num_batches), feature(number_of_anchors * 4), spatial(width, height)}});
-        set_values(input_deltas, getValues<T>(deltas));
-
-        const primitive_id input_scores_id = "InputScores";
-        auto input_scores = engine.allocate_memory(
-                {data_type, format::bfyx, tensor{batch(num_batches), feature(number_of_anchors), spatial(width, height)}});
-        set_values(input_scores, getValues<T>(scores));
-
-        const primitive_id output_roi_scores_id = "OutputRoiScores";
-        const layout rois_scores_layout{data_type, data_layout, tensor{batch(num_batches * param.post_nms_count)}};
-        auto output_roi_scores = engine.allocate_memory(rois_scores_layout);
-
-        const primitive_id output_rois_num_id = "OutputRoisNum";
-        const layout rois_num_layout{rois_num_type, data_layout, tensor{batch(num_batches)}};
-        auto output_rois_num = engine.allocate_memory(rois_num_layout);
-
-        const primitive_id reorder_im_info_id = input_im_info_id + "Reordered";
-        const primitive_id reorder_anchors_id = input_anchors_id + "Reordered";
-        const primitive_id reorder_deltas_id = input_deltas_id + "Reordered";
-        const primitive_id reorder_scores_id = input_scores_id + "Reordered";
-
-        topology topology;
-
-        topology.add(input_layout{input_im_info_id, input_im_info->get_layout()});
-        topology.add(input_layout{input_anchors_id, input_anchors->get_layout()});
-        topology.add(input_layout{input_deltas_id, input_deltas->get_layout()});
-        topology.add(input_layout{input_scores_id, input_scores->get_layout()});
-        topology.add(mutable_data{output_roi_scores_id, output_roi_scores});
-        topology.add(mutable_data{output_rois_num_id, output_rois_num});
-
-        topology.add(reorder(reorder_im_info_id, input_info(input_im_info_id), data_layout, data_type));
-        topology.add(reorder(reorder_anchors_id, input_info(input_anchors_id), data_layout, data_type));
-        topology.add(reorder(reorder_deltas_id, input_info(input_deltas_id), data_layout, data_type));
-        topology.add(reorder(reorder_scores_id, input_info(input_scores_id), data_layout, data_type));
-
-        const primitive_id generate_proposals_id = "generate_proposals";
-        const std::vector<input_info> inputs{ input_info(reorder_im_info_id), input_info(reorder_anchors_id), input_info(reorder_deltas_id),
-                                              input_info(reorder_scores_id), input_info(output_roi_scores_id), input_info(output_rois_num_id) };
-        const auto generate_proposals_primitive = generate_proposals{
-            generate_proposals_id,
-            inputs,
-            param.min_size,
-            param.nms_threshold,
-            param.pre_nms_count,
-            param.post_nms_count,
-            param.normalized,
-            param.nms_eta,
-            rois_num_type};
-
-        topology.add(generate_proposals_primitive);
-        const primitive_id reorder_result_id = generate_proposals_id + "Reordered";
-        topology.add(reorder(reorder_result_id, input_info(generate_proposals_id), format::bfyx, data_type));
-
-        cldnn::network::ptr network = get_network(engine, topology, get_test_default_config(engine), stream, is_caching_test);
-
-        network->set_input_data(input_im_info_id, input_im_info);
-        network->set_input_data(input_anchors_id, input_anchors);
-        network->set_input_data(input_deltas_id, input_deltas);
-        network->set_input_data(input_scores_id, input_scores);
-
-        const auto outputs = network->execute();
-
-        const auto rois = outputs.at(reorder_result_id).get_memory();
-
-        const cldnn::mem_lock<T> rois_ptr(rois, *stream);
-        ASSERT_EQ(rois_ptr.size(), num_batches * param.post_nms_count * 4);
-
-        const auto get_plane_data = [&](const memory::ptr& mem, const data_types data_type, const layout& from_layout) {
-            if (!need_reorder) {
-                return mem;
-            }
-            cldnn::topology reorder_topology;
-            reorder_topology.add(input_layout("data", from_layout));
-            reorder_topology.add(reorder("plane_data", input_info("data"), format::bfyx, data_type));
-            cldnn::network reorder_net{engine, reorder_topology, get_test_default_config(engine)};
-            reorder_net.set_input_data("data", mem);
-            const auto second_output_result = reorder_net.execute();
-            const auto plane_data_mem = second_output_result.at("plane_data").get_memory();
-            return plane_data_mem;
-        };
-
-        const cldnn::mem_lock<T> roi_scores_ptr(
-                get_plane_data(output_roi_scores, data_type, rois_scores_layout), *stream);
-        ASSERT_EQ(roi_scores_ptr.size(), num_batches * param.post_nms_count);
-
-        const cldnn::mem_lock<ROIS_NUM_T> rois_num_ptr(
-                get_plane_data(output_rois_num, rois_num_type, rois_num_layout), *stream);
-        ASSERT_EQ(rois_num_ptr.size(), num_batches);
-
-        const auto& expected_rois = param.expected_rois;
-        const auto& expected_roi_scores = param.expected_roi_scores;
-        const auto& expected_rois_num = param.expected_rois_num;
-
-        if (!is_caching_test) {
-            for (size_t j = 0; j < expected_rois_num.size(); ++j) {
-                ASSERT_EQ(expected_rois_num[j], rois_num_ptr[j]) << "j=" << j;
-            }
-        }
-
-        for (auto i = 0; i < param.post_nms_count; ++i) {
-            if (!is_caching_test) {
-                ASSERT_NEAR(expected_roi_scores[i], roi_scores_ptr[i], getError<T>()) << "i=" << i;
-            }
-            if (static_cast<float>(expected_roi_scores[i]) != 0.0f) {
-                for (size_t coord = 0; coord < 4; ++coord) {
-                    const auto roi_idx = i * 4 + coord;
-                    ASSERT_NEAR(expected_rois[roi_idx], rois_ptr[roi_idx], getError<T>()) << "i=" << i << ", coord=" << coord;
-                }
-            }
-        }
-    }
-};
-
-using f32_i32 = generate_proposals_test<float, int32_t>;
-TEST_P(f32_i32, f32_i32) {
-    test();
-}
-INSTANTIATE_TEST_SUITE_P(
-        generate_proposals_gpu_test,
-        f32_i32,
-        ::testing::Combine(
-            ::testing::ValuesIn(getGenerateProposalsParams<float>()),
-            ::testing::ValuesIn(layouts),
-            ::testing::Values(false)
-            ));
-
-using f32_i64 = generate_proposals_test<float, int64_t>;
-TEST_P(f32_i64, f32_i64) {
-    test();
-}
-INSTANTIATE_TEST_SUITE_P(
-        generate_proposals_gpu_test,
-        f32_i64,
-        ::testing::Combine(
-                ::testing::ValuesIn(getGenerateProposalsParams<float>()),
-                ::testing::ValuesIn(layouts),
-                ::testing::Values(false)
-        ));
-
-using f16_i32 = generate_proposals_test<ov::float16, int32_t>;
-TEST_P(f16_i32, f16_i32) {
-    test();
-}
-INSTANTIATE_TEST_SUITE_P(
-        generate_proposals_gpu_test,
-        f16_i32,
-        ::testing::Combine(
-                ::testing::ValuesIn(getGenerateProposalsParams<ov::float16>()),
-                ::testing::ValuesIn(layouts),
-                ::testing::Values(false)
-        ));
-
-using f16_i64 = generate_proposals_test<ov::float16, int64_t>;
-TEST_P(f16_i64, f16_i64) {
-    test();
-}
-INSTANTIATE_TEST_SUITE_P(
-        generate_proposals_gpu_test,
-        f16_i64,
-        ::testing::Combine(
-                ::testing::ValuesIn(getGenerateProposalsParams<ov::float16>()),
-                ::testing::ValuesIn(layouts),
-                ::testing::Values(false)
-        ));
-
-INSTANTIATE_TEST_SUITE_P(
-        export_import_generate_proposals_gpu_test,
-        f16_i64,
-        ::testing::Combine(
-                ::testing::Values(getGenerateProposalsParams<ov::float16>()[0]),
-                ::testing::Values(layouts[0]),
-                ::testing::Values(true)
-        ));
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/grid_sample_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/grid_sample_gpu_test.cpp
index ec8cf82d9750ef..eeb61ebfd5b8ee 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/grid_sample_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/grid_sample_gpu_test.cpp
@@ -741,7 +741,7 @@ TEST_P(grid_sample_gpu_dynamic, basic) {
 
     ExecutionConfig config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::optimize_data(true));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
     network network(engine, topology, config);
     network.set_input_data("data", input0);
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/loop_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/loop_gpu_test.cpp
index df403b4001e2c2..9de4bffb056d93 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/loop_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/loop_gpu_test.cpp
@@ -35,8 +35,7 @@ static program::ptr build_program(engine& engine,
                                     topology& body_topology,
                                     primitive_id execution_condition_id,
                                     std::vector<loop::io_primitive_map> output_primitive_maps,
-                                    std::vector<loop::backedge_mapping> back_edges,
-                                    bool allow_new_shape_infer = false) {
+                                    std::vector<loop::backedge_mapping> back_edges) {
     std::vector<cldnn::primitive_id> output_names_vec;
     for (auto out_map : output_primitive_maps) {
         output_names_vec.push_back(out_map.internal_id.pid);
@@ -56,7 +55,6 @@ static program::ptr build_program(engine& engine,
     config.set_property(ov::intel_gpu::optimize_data(true));
     config.set_property(ov::intel_gpu::custom_outputs(output_names_vec));
     config.set_property(ov::intel_gpu::max_dynamic_batch(1));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(allow_new_shape_infer));
 
     return program::build_program(engine, body_topology, config, false, false, true);
 }
@@ -498,7 +496,7 @@ static void test_loop_gpu_wo_trip_count(ov::PartialShape body_input_layout,
     std::vector<loop::backedge_mapping> back_edges {
         loop::backedge_mapping("b_index_update", body_current_iteration_id) };
 
-    auto body_program = build_program(engine, body, body_execution_condition_id, output_primitive_maps, back_edges, true);
+    auto body_program = build_program(engine, body, body_execution_condition_id, output_primitive_maps, back_edges);
 
     cldnn::topology topology(
         input_layout("input", e_input_layout),
@@ -512,7 +510,7 @@ static void test_loop_gpu_wo_trip_count(ov::PartialShape body_input_layout,
     );
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
     cldnn::network::ptr network = get_network(engine, topology, config, get_test_stream_ptr(), is_caching_test);
     network->set_input_data("input", e_input_mem);
@@ -666,7 +664,7 @@ static void test_loop_gpu_wo_trip_count_w_multiple_shapes(ov::PartialShape body_
     std::vector<loop::backedge_mapping> back_edges {
         loop::backedge_mapping("b_index_update", body_current_iteration_id) };
 
-    auto body_program = build_program(engine, body, body_execution_condition_id, output_primitive_maps, back_edges, true);
+    auto body_program = build_program(engine, body, body_execution_condition_id, output_primitive_maps, back_edges);
 
     auto const_shape = engine.allocate_memory({ov::PartialShape{4}, data_types::i32, format::bfyx});
     std::vector<int32_t> body_input_layouts;
@@ -696,7 +694,6 @@ static void test_loop_gpu_wo_trip_count_w_multiple_shapes(ov::PartialShape body_
         eltwise("out_sum", input_info("loop", 0), input_info("loop", 1), eltwise_mode::sum));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
 
     cldnn::network::ptr network = get_network(engine, topology, config, get_test_stream_ptr(), is_caching_test);
 
@@ -816,7 +813,7 @@ static void test_loop_gpu_multiple_shapes(ov::PartialShape body_input_layout,
     std::vector<loop::backedge_mapping> back_edges {
         loop::backedge_mapping("b_index_update", body_current_iteration_id) };
 
-    auto body_program = build_program(engine, body, body_execution_condition_id, output_primitive_maps, back_edges, true);
+    auto body_program = build_program(engine, body, body_execution_condition_id, output_primitive_maps, back_edges);
 
     auto const_shape = engine.allocate_memory({ov::PartialShape{4}, data_types::i32, format::bfyx});
     std::vector<int32_t> body_input_layouts;
@@ -837,14 +834,13 @@ static void test_loop_gpu_multiple_shapes(ov::PartialShape body_input_layout,
         permute("permute1", input_info("input_origin"), {0, 1, 2, 3}),
         concatenation("input1", {input_info("permute1"), input_info("input_origin")}, 0),
         loop("loop",
-             {input_info(actual_iteration_count_id), input_info(initial_condition_id), input_info("input1"), input_info("input2")}, 
+             {input_info(actual_iteration_count_id), input_info(initial_condition_id), input_info("input1"), input_info("input2")},
              body_program, trip_count_id, initial_condition_id, actual_iteration_count_id,
              input_primitive_maps, output_primitive_maps, back_edges,
              num_iterations, body_current_iteration_id, body_execution_condition_id, 2),
         eltwise("out_sum", input_info("loop", 0), input_info("loop", 1), eltwise_mode::sum));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
 
     network network(engine, topology, config);
     for (size_t i = 0 ; i < whole_layouts.size(); i++) {
@@ -927,7 +923,7 @@ static void test_loop_gpu_multiple_shapes_single_shared(ov::PartialShape body_in
         loop::backedge_mapping("b_result", "b_parameter"),
         loop::backedge_mapping("b_index_update", body_current_iteration_id) };
 
-    auto body_program = build_program(engine, body, body_execution_condition_id, output_primitive_maps, back_edges, true);
+    auto body_program = build_program(engine, body, body_execution_condition_id, output_primitive_maps, back_edges);
 
     auto const_shape = engine.allocate_memory({ov::PartialShape{4}, data_types::i32, format::bfyx});
     std::vector<int32_t> body_input_layouts;
@@ -955,7 +951,6 @@ static void test_loop_gpu_multiple_shapes_single_shared(ov::PartialShape body_in
         permute("result", input_info("loop"), {0, 1, 2, 3}));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
 
     network network(engine, topology, config);
     for (size_t i = 0 ; i < whole_layouts.size(); i++) {
@@ -1102,10 +1097,10 @@ static void test_loop_gpu_wo_trip_count_update_primitive_id(ov::PartialShape bod
     std::vector<loop::backedge_mapping> back_edges {
         loop::backedge_mapping("b_index_update", body_current_iteration_id) };
 
-    auto body_program = build_program(engine, body, body_execution_condition_id, output_primitive_maps, back_edges, true);
+    auto body_program = build_program(engine, body, body_execution_condition_id, output_primitive_maps, back_edges);
 
     auto const_shape = engine.allocate_memory({ov::PartialShape{4}, data_types::i32, format::bfyx});
-    
+
 
     std::vector<int32_t> body_input_layouts;
     for (size_t i = 0; i < body_input_layout.size(); i++) {
@@ -1138,7 +1133,6 @@ static void test_loop_gpu_wo_trip_count_update_primitive_id(ov::PartialShape bod
         eltwise("out_sum", input_info("loop", 0), input_info("loop", 1), eltwise_mode::sum));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
 
     cldnn::network::ptr network = get_network(engine, topology, config, get_test_stream_ptr(), is_caching_test);
 
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/matrix_nms_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/matrix_nms_gpu_test.cpp
deleted file mode 100644
index 209d98921a0745..00000000000000
--- a/src/plugins/intel_gpu/tests/unit/test_cases/matrix_nms_gpu_test.cpp
+++ /dev/null
@@ -1,695 +0,0 @@
-// Copyright (C) 2018-2024 Intel Corporation
-// SPDX-License-Identifier: Apache-2.0
-//
-
-#include <intel_gpu/graph/network.hpp>
-#include <intel_gpu/graph/topology.hpp>
-#include <intel_gpu/primitives/input_layout.hpp>
-#include <intel_gpu/primitives/matrix_nms.hpp>
-#include <intel_gpu/primitives/mutable_data.hpp>
-#include <intel_gpu/runtime/memory.hpp>
-
-#include "test_utils.h"
-
-using namespace cldnn;
-using namespace tests;
-
-namespace {
-
-#define PAD       -1.0
-#define PADI      -1
-#define THRESHOLD 1e-3f
-
-template <class T>
-std::vector<T> convert(const std::vector<float>& v) {
-    return {v.begin(), v.end()};
-}
-
-struct matrix_nms_test_inputs {
-    int num_butches;
-    int num_boxes;
-    int num_classes;
-    int num_selected_boxes;
-    bool sort_result_across_batch;
-    float score_threshold;
-    int nms_top_k;
-    int keep_top_k;
-    int background_class;
-    float gaussian_sigma;
-    float post_threshold;
-    bool normalized;
-    std::vector<float> boxes_values;
-    std::vector<float> scores_values;
-    std::vector<float> expected_output;
-    std::vector<int> expected_selected_boxes;
-    std::vector<int> expected_valid_outputs;
-    ov::op::v8::MatrixNms::SortResultType sort_result_type;
-    ov::op::v8::MatrixNms::DecayFunction decay_function;
-    std::string test_name;
-};
-
-using matrix_nms_test_params = std::tuple<matrix_nms_test_inputs, format::type, bool>;
-
-template <class T>
-struct matrix_nms_gpu_test : public testing::TestWithParam<matrix_nms_test_params> {
-public:
-    void test() {
-        format::type blocked_format;
-        matrix_nms_test_inputs test_inputs;
-        bool is_caching_test;
-        std::tie(test_inputs, blocked_format, is_caching_test) = testing::TestWithParam<matrix_nms_test_params>::GetParam();
-
-        const auto data_type = ov::element::from<T>();
-        const auto plain_format = format::bfyx;
-
-        auto& engine = get_test_engine();
-
-        auto boxes = engine.allocate_memory(
-            {data_type, plain_format, tensor{test_inputs.num_butches, test_inputs.num_boxes, 1, 4}});
-        auto scores = engine.allocate_memory(
-            {data_type,
-             plain_format,
-             tensor{test_inputs.num_butches, test_inputs.num_classes, 1, test_inputs.num_boxes}});
-
-        auto selected_boxes =
-            engine.allocate_memory({data_types::i32, plain_format, tensor{test_inputs.num_selected_boxes, 1, 1, 1}});
-        auto valid_outputs =
-            engine.allocate_memory({data_types::i32, plain_format, tensor{test_inputs.num_butches, 1, 1, 1}});
-
-        set_values(boxes, convert<T>(test_inputs.boxes_values));
-        set_values(scores, convert<T>(test_inputs.scores_values));
-
-        const ov::op::v8::MatrixNms::Attributes attrs(test_inputs.sort_result_type,
-                                                      test_inputs.sort_result_across_batch,
-                                                      ov::element::i32,
-                                                      test_inputs.score_threshold,
-                                                      test_inputs.nms_top_k,
-                                                      test_inputs.keep_top_k,
-                                                      test_inputs.background_class,
-                                                      test_inputs.decay_function,
-                                                      test_inputs.gaussian_sigma,
-                                                      test_inputs.post_threshold,
-                                                      test_inputs.normalized);
-
-        topology topology;
-        topology.add(input_layout("boxes", boxes->get_layout()));
-        topology.add(input_layout("scores", scores->get_layout()));
-        topology.add(mutable_data("selected_boxes", selected_boxes));
-        topology.add(mutable_data("valid_outputs", valid_outputs));
-
-        topology.add(reorder("reordered_boxes", input_info("boxes"), blocked_format, data_type));
-        topology.add(reorder("reordered_scores", input_info("scores"), blocked_format, data_type));
-
-        topology.add(matrix_nms("reordered_matrix_nms",
-                                input_info("reordered_boxes"),
-                                input_info("reordered_scores"),
-                                input_info("selected_boxes"),
-                                input_info("valid_outputs"),
-                                attrs));
-        topology.add(reorder("matrix_nms", input_info("reordered_matrix_nms"), plain_format, data_type));
-
-        cldnn::network::ptr network = get_network(engine, topology, get_test_default_config(engine), get_test_stream_ptr(), is_caching_test);
-
-        network->set_input_data("boxes", boxes);
-        network->set_input_data("scores", scores);
-
-        auto outputs = network->execute();
-
-        auto output = outputs.at("matrix_nms").get_memory();
-        cldnn::mem_lock<T> output_ptr(output, get_test_stream());
-
-        cldnn::mem_lock<int> selected_boxes_ptr(selected_boxes, get_test_stream());
-        cldnn::mem_lock<int> valid_outputs_ptr(valid_outputs, get_test_stream());
-
-        const auto expected_output = convert<T>(test_inputs.expected_output);
-        ASSERT_EQ(expected_output.size(), output_ptr.size());
-        for (size_t i = 0; i < expected_output.size(); ++i) {
-            ASSERT_NEAR(expected_output[i], output_ptr[i], THRESHOLD);
-        }
-
-        if (!is_caching_test) {
-            ASSERT_EQ(test_inputs.expected_selected_boxes.size(), selected_boxes_ptr.size());
-            for (size_t i = 0; i < test_inputs.expected_selected_boxes.size(); ++i) {
-                ASSERT_EQ(test_inputs.expected_selected_boxes[i], selected_boxes_ptr[i]);
-            }
-
-            ASSERT_EQ(test_inputs.expected_valid_outputs.size(), valid_outputs_ptr.size());
-            for (size_t i = 0; i < test_inputs.expected_valid_outputs.size(); ++i) {
-                ASSERT_EQ(test_inputs.expected_valid_outputs[i], valid_outputs_ptr[i]);
-            }
-        }
-    }
-
-    static std::string PrintToStringParamName(const testing::TestParamInfo<matrix_nms_test_params>& info) {
-        auto& test_inputs = std::get<0>(info.param);
-        std::ostringstream result;
-
-        auto sort_res_type_str =
-            test_inputs.sort_result_type == ov::op::v8::MatrixNms::SortResultType::SCORE
-                ? "score"
-                : test_inputs.sort_result_type == ov::op::v8::MatrixNms::SortResultType::CLASSID ? "class_id" : "none";
-        auto decay_function_str =
-            test_inputs.decay_function == ov::op::v8::MatrixNms::DecayFunction::LINEAR
-                ? "linear"
-                : test_inputs.decay_function == ov::op::v8::MatrixNms::DecayFunction::GAUSSIAN ? "gaussian" : "none";
-
-        result << "SortResultAcrossBatch=" << bool_to_str(test_inputs.sort_result_across_batch) << "_";
-        result << "ScoreThreshold=" << test_inputs.score_threshold << "_";
-        result << "NmsTopK=" << test_inputs.nms_top_k << "_";
-        result << "KeepTopK=" << test_inputs.keep_top_k << "_";
-        result << "BackgroundClass=" << test_inputs.background_class << "_";
-        result << "GaussianSigma=" << test_inputs.gaussian_sigma << "_";
-        result << "PostThreshold=" << test_inputs.post_threshold << "_";
-        result << "Normalized=" << bool_to_str(test_inputs.normalized) << "_";
-        result << "sort_result_type=" << sort_res_type_str << "_";
-        result << "decay_function=" << decay_function_str << "_";
-        result << "Format=" << fmt_to_str(std::get<1>(info.param)) << "_";
-        result << "Cached=" << bool_to_str(std::get<2>(info.param));
-
-        if (!test_inputs.test_name.empty())
-            result << "_TN=" << test_inputs.test_name;
-
-        return result.str();
-    }
-};
-
-matrix_nms_test_inputs get_matrix_nms_smoke_inputs() {
-    return {1,      // num_butches
-            6,      // num_boxes
-            2,      // num_classes
-            3,      // num_selected_boxes
-            false,  // sort_result_across_bch
-            0.0f,   // score_threshold
-            3,      // nms_top_k
-            -1,     // keep_top_k
-            0,      // background_class
-            2.0f,   // gaussian_sigma
-            0.0f,   // post_threshold
-            true,   // normalized
-            std::vector<float>{0.0, 0.0,  1.0, 1.0,  0.0, 0.1,  1.0, 1.1,  0.0, -0.1,  1.0, 0.9,  // boxes
-                               0.0, 10.0, 1.0, 11.0, 0.0, 10.1, 1.0, 11.1, 0.0, 100.0, 1.0, 101.0},
-            std::vector<float>{0.9, 0.75, 0.6, 0.95, 0.5, 0.3, 0.95, 0.75, 0.6, 0.80, 0.5, 0.3},  // scores
-            std::vector<float>{1.00,                                                              // expected_output
-                               0.95,
-                               0.00,
-                               0.00,
-                               1.00,
-                               1.00,
-                               1.00,
-                               0.8,
-                               0.00,
-                               10.00,
-                               1.00,
-                               11.00,
-                               1.00,
-                               0.13636364,
-                               0.0,
-                               0.1,
-                               1.0,
-                               1.1},
-            std::vector<int>{0, 3, 1},          // expected_selected_boxes
-            std::vector<int>{3},                // expected_valid_output
-            ov::op::v8::MatrixNms::SortResultType::SCORE,  // sort_result_type
-            ov::op::v8::MatrixNms::DecayFunction::LINEAR,  // decay_function
-            "smoke"};
-}
-
-matrix_nms_test_inputs get_matrix_nms_gaussian_inputs() {
-    return {1,      // num_butches
-            6,      // num_boxes
-            2,      // num_classes
-            3,      // num_selected_boxes
-            false,  // sort_result_across_bch
-            0.0f,   // score_threshold
-            3,      // nms_top_k
-            -1,     // keep_top_k
-            0,      // background_class
-            2.0f,   // gaussian_sigma
-            0.0f,   // post_threshold
-            true,   // normalized
-            std::vector<float>{0.0, 0.0,  1.0, 1.0,  0.0, 0.1,  1.0, 1.1,  0.0, -0.1,  1.0, 0.9,  // boxes
-                               0.0, 10.0, 1.0, 11.0, 0.0, 10.1, 1.0, 11.1, 0.0, 100.0, 1.0, 101.0},
-            std::vector<float>{0.9, 0.75, 0.6, 0.95, 0.5, 0.3, 0.95, 0.75, 0.6, 0.80, 0.5, 0.3},  // scores
-            std::vector<float>{1.00,                                                              // expected_output
-                               0.95,
-                               0.00,
-                               0.00,
-                               1.00,
-                               1.00,
-                               1.00,
-                               0.8,
-                               0.00,
-                               10.00,
-                               1.00,
-                               11.00,
-                               1.00,
-                               0.1966116,
-                               0.0,
-                               0.1,
-                               1.0,
-                               1.1},
-            std::vector<int>{0, 3, 1},            // expected_selected_boxes
-            std::vector<int>{3},                  // expected_valid_output
-            ov::op::v8::MatrixNms::SortResultType::SCORE,    // sort_result_type
-            ov::op::v8::MatrixNms::DecayFunction::GAUSSIAN,  // decay_function
-            "gaussian"};
-}
-
-matrix_nms_test_inputs get_matrix_nms_two_batches_two_classes_inputs() {
-    return {2,      // num_butches
-            6,      // num_boxes
-            2,      // num_classes
-            6,      // num_selected_boxes
-            false,  // sort_result_across_bch
-            0.0f,   // score_threshold
-            3,      // nms_top_k
-            -1,     // keep_top_k
-            0,      // background_class
-            2.0f,   // gaussian_sigma
-            0.0f,   // post_threshold
-            true,   // normalized
-            std::vector<float>{0.0, 0.0,  1.0, 1.0,  0.0, 0.1,  1.0, 1.1,  0.0, -0.1,  1.0, 0.9,  // boxes
-                               0.0, 10.0, 1.0, 11.0, 0.0, 10.1, 1.0, 11.1, 0.0, 100.0, 1.0, 101.0,
-                               0.0, 0.0,  1.0, 1.0,  0.0, 0.1,  1.0, 1.1,  0.0, -0.1,  1.0, 0.9,
-                               0.0, 10.0, 1.0, 11.0, 0.0, 10.1, 1.0, 11.1, 0.0, 100.0, 1.0, 101.0},
-            std::vector<float>{0.9, 0.75, 0.6, 0.95, 0.5, 0.3, 0.95, 0.75, 0.6, 0.80, 0.5, 0.3,  // scores
-                               0.9, 0.75, 0.6, 0.95, 0.5, 0.3, 0.95, 0.75, 0.6, 0.80, 0.5, 0.3},
-            std::vector<float>{1.00, 0.95,  0.00, 0.00,  1.00, 1.00,  // expected_output
-                               1.00, 0.8,   0.00, 10.00, 1.00, 11.00,      1.00, 0.13636364, 0.0,  0.1,
-                               1.0,  1.1,   1.00, 0.95,  0.00, 0.00,       1.00, 1.00,       1.00, 0.8,
-                               0.00, 10.00, 1.00, 11.00, 1.00, 0.13636364, 0.0,  0.1,        1.0,  1.1},
-            std::vector<int>{0, 3, 1, 6, 9, 7},  // expected_selected_boxes
-            std::vector<int>{3, 3},              // expected_valid_output
-            ov::op::v8::MatrixNms::SortResultType::SCORE,   // sort_result_type
-            ov::op::v8::MatrixNms::DecayFunction::LINEAR,   // decay_function
-            "two_batches_two_classes"};
-}
-
-matrix_nms_test_inputs get_matrix_nms_two_batches_two_classes_by_score_cross_batch_inputs() {
-    return {2,     // num_butches
-            6,     // num_boxes
-            2,     // num_classes
-            12,    // num_selected_boxes
-            true,  // sort_result_across_bch
-            0.0f,  // score_threshold
-            3,     // nms_top_k
-            -1,    // keep_top_k
-            -1,    // background_class
-            2.0f,  // gaussian_sigma
-            0.5f,  // post_threshold
-            true,  // normalized
-            std::vector<float>{0.0, 0.0,  1.0, 1.0,  0.0, 0.1,  1.0, 1.1,  0.0, -0.1,  1.0, 0.9,  // boxes
-                               0.0, 10.0, 1.0, 11.0, 0.0, 10.1, 1.0, 11.1, 0.0, 100.0, 1.0, 101.0,
-                               0.0, 0.0,  1.0, 1.0,  0.0, 0.1,  1.0, 1.1,  0.0, -0.1,  1.0, 0.9,
-                               0.0, 10.0, 1.0, 11.0, 0.0, 10.1, 1.0, 11.1, 0.0, 100.0, 1.0, 101.0},
-            std::vector<float>{0.9, 0.75, 0.6, 0.95, 0.5, 0.3, 0.95, 0.75, 0.6, 0.80, 0.5, 0.3,  // scores
-                               0.9, 0.75, 0.6, 0.95, 0.5, 0.3, 0.95, 0.75, 0.6, 0.80, 0.5, 0.3},
-            std::vector<float>{0.00, 0.95, 0.00, 10.00, 1.00, 11.00,  // expected_output
-                               1.00, 0.95, 0.00, 0.00,  1.00, 1.00,  0.00, 0.95, 0.00, 10.00, 1.00, 11.00, 1.00, 0.95,
-                               0.00, 0.00, 1.00, 1.00,  PAD,  PAD,   PAD,  PAD,  PAD,  PAD,   PAD,  PAD,   PAD,  PAD,
-                               PAD,  PAD,  0.00, 0.90,  0.00, 0.00,  1.00, 1.00, 0.00, 0.90,  0.00, 0.00,  1.00, 1.00,
-                               1.00, 0.80, 0.00, 10.00, 1.00, 11.00, 1.00, 0.80, 0.00, 10.00, 1.00, 11.00, PAD,  PAD,
-                               PAD,  PAD,  PAD,  PAD,   PAD,  PAD,   PAD,  PAD,  PAD,  PAD},
-            std::vector<int>{3, 0, 9, 6, PADI, PADI, 0, 6, 3, 9, PADI, PADI},  // expected_selected_boxes
-            std::vector<int>{4, 4},                                            // expected_valid_output
-            ov::op::v8::MatrixNms::SortResultType::SCORE,                                 // sort_result_type
-            ov::op::v8::MatrixNms::DecayFunction::LINEAR,                                 // decay_function
-            "two_batches_two_classes_by_score_cross_batch"};
-}
-
-matrix_nms_test_inputs get_matrix_nms_two_batches_two_classes_by_classid_cross_batch_inputs() {
-    return {2,     // num_butches
-            6,     // num_boxes
-            2,     // num_classes
-            12,    // num_selected_boxes
-            true,  // sort_result_across_bch
-            0.0f,  // score_threshold
-            3,     // nms_top_k
-            -1,    // keep_top_k
-            -1,    // background_class
-            2.0f,  // gaussian_sigma
-            0.5f,  // post_threshold
-            true,  // normalized
-            std::vector<float>{0.0, 0.0,  1.0, 1.0,  0.0, 0.1,  1.0, 1.1,  0.0, -0.1,  1.0, 0.9,  // boxes
-                               0.0, 10.0, 1.0, 11.0, 0.0, 10.1, 1.0, 11.1, 0.0, 100.0, 1.0, 101.0,
-                               0.0, 0.0,  1.0, 1.0,  0.0, 0.1,  1.0, 1.1,  0.0, -0.1,  1.0, 0.9,
-                               0.0, 10.0, 1.0, 11.0, 0.0, 10.1, 1.0, 11.1, 0.0, 100.0, 1.0, 101.0},
-            std::vector<float>{0.9, 0.75, 0.6, 0.95, 0.5, 0.3, 0.95, 0.75, 0.6, 0.80, 0.5, 0.3,  // scores
-                               0.9, 0.75, 0.6, 0.95, 0.5, 0.3, 0.95, 0.75, 0.6, 0.80, 0.5, 0.3},
-            std::vector<float>{0.00, 0.95, 0.00, 10.00, 1.00, 11.00,  // expected_output
-                               0.00, 0.90, 0.00, 0.00,  1.00, 1.00,  0.00, 0.95, 0.00, 10.00, 1.00, 11.00, 0.00, 0.90,
-                               0.00, 0.00, 1.00, 1.00,  PAD,  PAD,   PAD,  PAD,  PAD,  PAD,   PAD,  PAD,   PAD,  PAD,
-                               PAD,  PAD,  1.00, 0.95,  0.00, 0.00,  1.00, 1.00, 1.00, 0.80,  0.00, 10.00, 1.00, 11.00,
-                               1.00, 0.95, 0.00, 0.00,  1.00, 1.00,  1.00, 0.80, 0.00, 10.00, 1.00, 11.00, PAD,  PAD,
-                               PAD,  PAD,  PAD,  PAD,   PAD,  PAD,   PAD,  PAD,  PAD,  PAD},
-            std::vector<int>{3, 0, 9, 6, PADI, PADI, 0, 3, 6, 9, PADI, PADI},  // expected_selected_boxes
-            std::vector<int>{4, 4},                                            // expected_valid_output
-            ov::op::v8::MatrixNms::SortResultType::CLASSID,                              // sort_result_type
-            ov::op::v8::MatrixNms::DecayFunction::LINEAR,                                 // decay_function
-            "matrix_nms_two_batches_two_classes_by_classid_cross_batch"};
-}
-
-matrix_nms_test_inputs get_matrix_nms_by_keep_top_k_inputs() {
-    return {2,      // num_butches
-            6,      // num_boxes
-            2,      // num_classes
-            6,      // num_selected_boxes
-            false,  // sort_result_across_bch
-            0.0f,   // score_threshold
-            3,      // nms_top_k
-            3,      // keep_top_k
-            0,      // background_class
-            2.0f,   // gaussian_sigma
-            0.0f,   // post_threshold
-            true,   // normalized
-            std::vector<float>{0.0, 0.0,  1.0, 1.0,  0.0, 0.1,  1.0, 1.1,  0.0, -0.1,  1.0, 0.9,  // boxes
-                               0.0, 10.0, 1.0, 11.0, 0.0, 10.1, 1.0, 11.1, 0.0, 100.0, 1.0, 101.0,
-                               0.0, 0.0,  1.0, 1.0,  0.0, 0.1,  1.0, 1.1,  0.0, -0.1,  1.0, 0.9,
-                               0.0, 10.0, 1.0, 11.0, 0.0, 10.1, 1.0, 11.1, 0.0, 100.0, 1.0, 101.0},
-            std::vector<float>{0.9, 0.75, 0.6, 0.95, 0.5, 0.3, 0.95, 0.75, 0.6, 0.80, 0.5, 0.3,  // scores
-                               0.9, 0.75, 0.6, 0.95, 0.5, 0.3, 0.95, 0.75, 0.6, 0.80, 0.5, 0.3},
-            std::vector<float>{1.00, 0.95,  0.00, 0.00,  1.00, 1.00,  // expected_output
-                               1.00, 0.8,   0.00, 10.00, 1.00, 11.00,      1.00, 0.13636364, 0.0,  0.1,
-                               1.0,  1.1,   1.00, 0.95,  0.00, 0.00,       1.00, 1.00,       1.00, 0.8,
-                               0.00, 10.00, 1.00, 11.00, 1.00, 0.13636364, 0.0,  0.1,        1.0,  1.1},
-            std::vector<int>{0, 3, 1, 6, 9, 7},    // expected_selected_boxes
-            std::vector<int>{3, 3},                // expected_valid_output
-            ov::op::v8::MatrixNms::SortResultType::CLASSID,  // sort_result_type
-            ov::op::v8::MatrixNms::DecayFunction::LINEAR,     // decay_function
-            "matrix_nms_by_keep_top_k"};
-}
-
-matrix_nms_test_inputs get_matrix_nms_background_inputs() {
-    return {1,      // num_butches
-            6,      // num_boxes
-            2,      // num_classes
-            6,      // num_selected_boxes
-            false,  // sort_result_across_bch
-            0.0f,   // score_threshold
-            3,      // nms_top_k
-            -1,     // keep_top_k
-            -1,     // background_class
-            2.0f,   // gaussian_sigma
-            0.0f,   // post_threshold
-            true,   // normalized
-            std::vector<float>{0.0, 0.0,  1.0, 1.0,  0.0, 0.1,  1.0, 1.1,  0.0, -0.1,  1.0, 0.9,  // boxes
-                               0.0, 10.0, 1.0, 11.0, 0.0, 10.1, 1.0, 11.1, 0.0, 100.0, 1.0, 101.0},
-            std::vector<float>{0.9, 0.75, 0.6, 0.95, 0.5, 0.3, 0.95, 0.75, 0.6, 0.80, 0.5, 0.3},  // scores
-            std::vector<float>{0.00, 0.95, 0.0,  10.0, 1.0,  11.0,                                // expected_output
-                               1.00, 0.95, 0.0,  0.0,  1.0,  1.0,        0.00, 0.9,  0.0,  0.0,
-                               1.0,  1.0,  1.00, 0.8,  0.0,  10.0,       1.0,  11.0, 0.00, 0.13636364,
-                               0.0,  0.1,  1.0,  1.1,  1.00, 0.13636364, 0.0,  0.1,  1.0,  1.1},
-            std::vector<int>{3, 0, 0, 3, 1, 1},  // expected_selected_boxes
-            std::vector<int>{6},                 // expected_valid_output
-            ov::op::v8::MatrixNms::SortResultType::SCORE,   // sort_result_type
-            ov::op::v8::MatrixNms::DecayFunction::LINEAR,   // decay_function
-            "matrix_nms_background"};
-}
-
-matrix_nms_test_inputs get_matrix_nms_flipped_coordinates_inputs() {
-    return {1,      // num_butches
-            6,      // num_boxes
-            1,      // num_classes
-            3,      // num_selected_boxes
-            false,  // sort_result_across_bch
-            0.0f,   // score_threshold
-            3,      // nms_top_k
-            -1,     // keep_top_k
-            -1,     // background_class
-            2.0f,   // gaussian_sigma
-            0.0f,   // post_threshold
-            true,   // normalized
-            std::vector<float>{1.0, 1.0,  0.0, 0.0,  0.0, 0.1,  1.0, 1.1,  0.0, 0.9,   1.0, -0.1,  // boxes
-                               0.0, 10.0, 1.0, 11.0, 1.0, 10.1, 0.0, 11.1, 1.0, 101.0, 0.0, 100.0},
-            std::vector<float>{0.9, 0.75, 0.6, 0.95, 0.5, 0.3},  // scores
-            std::vector<float>{0.00,
-                               0.95,
-                               0.0,
-                               10.0,
-                               1.0,
-                               11.0,  // expected_output
-                               0.00,
-                               0.9,
-                               1.0,
-                               1.0,
-                               0.0,
-                               0.0,
-                               0.00,
-                               0.75,
-                               0.0,
-                               0.1,
-                               1.0,
-                               1.1},
-            std::vector<int>{3, 0, 1},          // expected_selected_boxes
-            std::vector<int>{3},                // expected_valid_output
-            ov::op::v8::MatrixNms::SortResultType::SCORE,  // sort_result_type
-            ov::op::v8::MatrixNms::DecayFunction::LINEAR,  // decay_function
-            "flipped_coordinates"};
-}
-
-matrix_nms_test_inputs get_matrix_nms_post_threshold_inputs() {
-    return {1,      // num_butches
-            6,      // num_boxes
-            1,      // num_classes
-            3,      // num_selected_boxes
-            false,  // sort_result_across_bch
-            0.0f,   // score_threshold
-            3,      // nms_top_k
-            -1,     // keep_top_k
-            -1,     // background_class
-            2.0f,   // gaussian_sigma
-            0.8f,   // post_threshold
-            true,   // normalized
-            std::vector<float>{0.0, 0.0,  1.0, 1.0,  0.0, 0.1,  1.0, 1.1,  0.0, -0.1,  1.0, 0.9,  // boxes
-                               0.0, 10.0, 1.0, 11.0, 0.0, 10.1, 1.0, 11.1, 0.0, 100.0, 1.0, 101.0},
-            std::vector<float>{0.9, 0.75, 0.6, 0.95, 0.5, 0.3},  // scores
-            std::vector<float>{0.00,
-                               0.95,
-                               0.00,
-                               10.00,
-                               1.00,
-                               11.00,  // expected_output
-                               0.00,
-                               0.9,
-                               0.00,
-                               0.00,
-                               1.00,
-                               1.00,
-                               PAD,
-                               PAD,
-                               PAD,
-                               PAD,
-                               PAD,
-                               PAD},
-            std::vector<int>{3, 0, PADI},       // expected_selected_boxes
-            std::vector<int>{2},                // expected_valid_output
-            ov::op::v8::MatrixNms::SortResultType::SCORE,  // sort_result_type
-            ov::op::v8::MatrixNms::DecayFunction::LINEAR,  // decay_function
-            "post_threshold"};
-}
-
-matrix_nms_test_inputs get_matrix_nms_identical_boxes_inputs() {
-    return {1,      // num_butches
-            10,     // num_boxes
-            1,      // num_classes
-            3,      // num_selected_boxes
-            false,  // sort_result_across_bch
-            0.0f,   // score_threshold
-            3,      // nms_top_k
-            -1,     // keep_top_k
-            -1,     // background_class
-            2.0f,   // gaussian_sigma
-            0.3f,   // post_threshold
-            true,   // normalized
-            std::vector<float>{0.0, 0.0, 1.0, 1.0, 0.0, 0.0, 1.0, 1.0, 0.0, 0.0, 1.0, 1.0, 0.0, 0.0,  // boxes
-                               1.0, 1.0, 0.0, 0.0, 1.0, 1.0, 0.0, 0.0, 1.0, 1.0, 0.0, 0.0, 1.0, 1.0,
-                               0.0, 0.0, 1.0, 1.0, 0.0, 0.0, 1.0, 1.0, 0.0, 0.0, 1.0, 1.0},
-            std::vector<float>{0.4, 0.01, 0.2, 0.09, 0.15, 0.05, 0.02, 0.03, 0.05, 0.0},  // scores
-            std::vector<float>{0.00,
-                               0.40,
-                               0.00,
-                               0.00,
-                               1.00,
-                               1.00,  // expected_output
-                               PAD,
-                               PAD,
-                               PAD,
-                               PAD,
-                               PAD,
-                               PAD,
-                               PAD,
-                               PAD,
-                               PAD,
-                               PAD,
-                               PAD,
-                               PAD},
-            std::vector<int>{0, PADI, PADI},    // expected_selected_boxes
-            std::vector<int>{1},                // expected_valid_output
-            ov::op::v8::MatrixNms::SortResultType::SCORE,  // sort_result_type
-            ov::op::v8::MatrixNms::DecayFunction::LINEAR,  // decay_function
-            "identical_boxes"};
-};
-
-matrix_nms_test_inputs get_matrix_nms_top_k_inputs() {
-    return {1,      // num_butches
-            6,      // num_boxes
-            1,      // num_classes
-            2,      // num_selected_boxes
-            false,  // sort_result_across_bch
-            0.0f,   // score_threshold
-            2,      // nms_top_k
-            -1,     // keep_top_k
-            -1,     // background_class
-            2.0f,   // gaussian_sigma
-            0.0f,   // post_threshold
-            true,   // normalized
-            std::vector<float>{0.0, 0.0,  1.0, 1.0,  0.0, 0.1,  1.0, 1.1,  0.0, -0.1,  1.0, 0.9,  // boxes
-                               0.0, 10.0, 1.0, 11.0, 0.0, 10.1, 1.0, 11.1, 0.0, 100.0, 1.0, 101.0},
-            std::vector<float>{0.9, 0.75, 0.6, 0.95, 0.5, 0.3},  // scores
-            std::vector<float>{0.00,
-                               0.95,
-                               0.00,
-                               10.00,
-                               1.00,
-                               11.00,  // expected_output
-                               0.00,
-                               0.90,
-                               0.00,
-                               0.00,
-                               1.00,
-                               1.00},
-            std::vector<int>{3, 0},             // expected_selected_boxes
-            std::vector<int>{2},                // expected_valid_output
-            ov::op::v8::MatrixNms::SortResultType::SCORE,  // sort_result_type
-            ov::op::v8::MatrixNms::DecayFunction::LINEAR,  // decay_function
-            "matrix_nms_nms_top_k"};
-}
-
-matrix_nms_test_inputs get_matrix_nms_single_box_inputs() {
-    return {1,                                                       // num_butches
-            1,                                                       // num_boxes
-            1,                                                       // num_classes
-            1,                                                       // num_selected_boxes
-            false,                                                   // sort_result_across_bch
-            0.0f,                                                    // score_threshold
-            3,                                                       // nms_top_k
-            -1,                                                      // keep_top_k
-            -1,                                                      // background_class
-            2.0f,                                                    // gaussian_sigma
-            0.0f,                                                    // post_threshold
-            true,                                                    // normalized
-            std::vector<float>{0.0, 0.0, 1.0, 1.0},                  // boxes
-            std::vector<float>{0.9},                                 // scores
-            std::vector<float>{0.00, 0.90, 0.00, 0.00, 1.00, 1.00},  // expected_output
-            std::vector<int>{0},                                     // expected_selected_boxes
-            std::vector<int>{1},                                     // expected_valid_output
-            ov::op::v8::MatrixNms::SortResultType::SCORE,                       // sort_result_type
-            ov::op::v8::MatrixNms::DecayFunction::LINEAR,                       // decay_function
-            "matrix_nms_single_box"};
-}
-
-matrix_nms_test_inputs get_matrix_nms_no_output_inputs() {
-    return {1,      // num_butches
-            6,      // num_boxes
-            1,      // num_classes
-            3,      // num_selected_boxes
-            false,  // sort_result_across_bch
-            2.0f,   // score_threshold
-            3,      // nms_top_k
-            -1,     // keep_top_k
-            -1,     // background_class
-            2.0f,   // gaussian_sigma
-            0.0f,   // post_threshold
-            true,   // normalized
-            std::vector<float>{0.0, 0.0,  1.0, 1.0,  0.0, 0.1,  1.0, 1.1,  0.0, -0.1,  1.0, 0.9,  // boxes
-                               0.0, 10.0, 1.0, 11.0, 0.0, 10.1, 1.0, 11.1, 0.0, 100.0, 1.0, 101.0},
-            std::vector<float>{0.9, 0.75, 0.6, 0.95, 0.5, 0.3},  // scores
-            std::vector<float>{PAD,
-                               PAD,
-                               PAD,
-                               PAD,
-                               PAD,
-                               PAD,  // expected_output
-                               PAD,
-                               PAD,
-                               PAD,
-                               PAD,
-                               PAD,
-                               PAD,
-                               PAD,
-                               PAD,
-                               PAD,
-                               PAD,
-                               PAD,
-                               PAD},
-            std::vector<int>{PADI, PADI, PADI},  // expected_selected_boxes
-            std::vector<int>{0},                 // expected_valid_output
-            ov::op::v8::MatrixNms::SortResultType::SCORE,   // sort_result_type
-            ov::op::v8::MatrixNms::DecayFunction::LINEAR,   // decay_function
-            "matrix_nms_no_output"};
-}
-
-const std::vector<format::type> layout_formats = {format::bfyx,
-                                                  format::b_fs_yx_fsv16,
-                                                  format::b_fs_yx_fsv32,
-                                                  format::bs_fs_yx_bsv16_fsv16,
-                                                  format::bs_fs_yx_bsv32_fsv32,
-                                                  format::bs_fs_yx_bsv32_fsv16};
-
-#ifdef RUN_ALL_MODEL_CACHING_TESTS
-const std::vector<bool> run_caching_test = {false, true};
-#else
-const std::vector<bool> run_caching_test = {false};
-#endif
-
-#define INSTANTIATE_MATRIX_NMS_TEST_SUITE(input_type, func)                                                \
-    using matrix_nms_gpu_test_##input_type##func = matrix_nms_gpu_test<input_type>;                        \
-    TEST_P(matrix_nms_gpu_test_##input_type##func, test) {                                                 \
-        test();                                                                                            \
-    }                                                                                                      \
-    INSTANTIATE_TEST_SUITE_P(matrix_nms_test_##input_type##func,                                           \
-                             matrix_nms_gpu_test_##input_type##func,                                       \
-                             testing::Combine(testing::Values(func()), testing::ValuesIn(layout_formats),  \
-                                              testing::ValuesIn(run_caching_test)),                        \
-                             matrix_nms_gpu_test_##input_type##func::PrintToStringParamName);
-
-INSTANTIATE_MATRIX_NMS_TEST_SUITE(float, get_matrix_nms_smoke_inputs)
-INSTANTIATE_MATRIX_NMS_TEST_SUITE(float, get_matrix_nms_gaussian_inputs)
-INSTANTIATE_MATRIX_NMS_TEST_SUITE(float, get_matrix_nms_two_batches_two_classes_inputs)
-INSTANTIATE_MATRIX_NMS_TEST_SUITE(float, get_matrix_nms_two_batches_two_classes_by_classid_cross_batch_inputs)
-INSTANTIATE_MATRIX_NMS_TEST_SUITE(float, get_matrix_nms_two_batches_two_classes_by_score_cross_batch_inputs)
-INSTANTIATE_MATRIX_NMS_TEST_SUITE(float, get_matrix_nms_by_keep_top_k_inputs)
-INSTANTIATE_MATRIX_NMS_TEST_SUITE(float, get_matrix_nms_background_inputs)
-INSTANTIATE_MATRIX_NMS_TEST_SUITE(float, get_matrix_nms_flipped_coordinates_inputs)
-INSTANTIATE_MATRIX_NMS_TEST_SUITE(float, get_matrix_nms_post_threshold_inputs)
-INSTANTIATE_MATRIX_NMS_TEST_SUITE(float, get_matrix_nms_identical_boxes_inputs)
-INSTANTIATE_MATRIX_NMS_TEST_SUITE(float, get_matrix_nms_top_k_inputs)
-INSTANTIATE_MATRIX_NMS_TEST_SUITE(float, get_matrix_nms_single_box_inputs)
-INSTANTIATE_MATRIX_NMS_TEST_SUITE(float, get_matrix_nms_no_output_inputs)
-
-using ov::float16;
-INSTANTIATE_MATRIX_NMS_TEST_SUITE(float16, get_matrix_nms_smoke_inputs)
-INSTANTIATE_MATRIX_NMS_TEST_SUITE(float16, get_matrix_nms_gaussian_inputs)
-INSTANTIATE_MATRIX_NMS_TEST_SUITE(float16, get_matrix_nms_two_batches_two_classes_inputs)
-INSTANTIATE_MATRIX_NMS_TEST_SUITE(float16, get_matrix_nms_by_keep_top_k_inputs)
-INSTANTIATE_MATRIX_NMS_TEST_SUITE(float16, get_matrix_nms_two_batches_two_classes_by_classid_cross_batch_inputs)
-INSTANTIATE_MATRIX_NMS_TEST_SUITE(float16, get_matrix_nms_two_batches_two_classes_by_score_cross_batch_inputs)
-INSTANTIATE_MATRIX_NMS_TEST_SUITE(float16, get_matrix_nms_background_inputs)
-INSTANTIATE_MATRIX_NMS_TEST_SUITE(float16, get_matrix_nms_flipped_coordinates_inputs)
-INSTANTIATE_MATRIX_NMS_TEST_SUITE(float16, get_matrix_nms_post_threshold_inputs)
-INSTANTIATE_MATRIX_NMS_TEST_SUITE(float16, get_matrix_nms_identical_boxes_inputs)
-INSTANTIATE_MATRIX_NMS_TEST_SUITE(float16, get_matrix_nms_top_k_inputs)
-INSTANTIATE_MATRIX_NMS_TEST_SUITE(float16, get_matrix_nms_single_box_inputs)
-INSTANTIATE_MATRIX_NMS_TEST_SUITE(float16, get_matrix_nms_no_output_inputs)
-
-#ifndef RUN_ALL_MODEL_CACHING_TESTS
-INSTANTIATE_TEST_SUITE_P(matrix_nms_test_float16get_matrix_nms_smoke_inputs_cached,
-                         matrix_nms_gpu_test_float16get_matrix_nms_smoke_inputs,
-                         testing::Combine(testing::Values(get_matrix_nms_smoke_inputs()), testing::ValuesIn(layout_formats),
-                                          testing::Values(true)),
-                         matrix_nms_gpu_test_float16get_matrix_nms_smoke_inputs::PrintToStringParamName);
-#endif
-
-#undef INSTANTIATE_MATRIX_NMS_TEST_SUITE
-
-}  // namespace
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/memory_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/memory_test.cpp
index 52af896e4a0611..4717da06af385c 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/memory_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/memory_test.cpp
@@ -575,7 +575,7 @@ class memory_pool: public ::testing::Test {
 
         ExecutionConfig config = get_test_default_config(engine);
         config.set_property(ov::intel_gpu::optimize_data(true));
-        config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
         network network(engine, topology, config);
 
         {
@@ -583,7 +583,7 @@ class memory_pool: public ::testing::Test {
 
             auto outputs = network.execute();
 
-            ASSERT_EQ(std::static_pointer_cast<fully_connected_inst>(network.get_primitive("relu1"))->output_memory_ptr()->buffer_ptr(), 
+            ASSERT_EQ(std::static_pointer_cast<fully_connected_inst>(network.get_primitive("relu1"))->output_memory_ptr()->buffer_ptr(),
                       std::static_pointer_cast<fully_connected_inst>(network.get_primitive("relu2"))->output_memory_ptr()->buffer_ptr());
         }
 
@@ -592,7 +592,7 @@ class memory_pool: public ::testing::Test {
 
             auto outputs = network.execute();
 
-            ASSERT_EQ(std::static_pointer_cast<fully_connected_inst>(network.get_primitive("relu1"))->output_memory_ptr()->buffer_ptr(), 
+            ASSERT_EQ(std::static_pointer_cast<fully_connected_inst>(network.get_primitive("relu1"))->output_memory_ptr()->buffer_ptr(),
                       std::static_pointer_cast<fully_connected_inst>(network.get_primitive("relu2"))->output_memory_ptr()->buffer_ptr());
         }
     }
@@ -628,7 +628,7 @@ class memory_pool: public ::testing::Test {
 
         ExecutionConfig config = get_test_default_config(engine);
         config.set_property(ov::intel_gpu::optimize_data(true));
-        config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
         network network(engine, topology, config);
 
         {
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/multiclass_nms_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/multiclass_nms_gpu_test.cpp
deleted file mode 100644
index b39c13c209f434..00000000000000
--- a/src/plugins/intel_gpu/tests/unit/test_cases/multiclass_nms_gpu_test.cpp
+++ /dev/null
@@ -1,877 +0,0 @@
-// Copyright (C) 2022 Intel Corporation
-// SPDX-License-Identifier: Apache-2.0
-//
-
-#include <intel_gpu/primitives/input_layout.hpp>
-#include <intel_gpu/primitives/multiclass_nms.hpp>
-#include <intel_gpu/primitives/mutable_data.hpp>
-
-#include "test_utils.h"
-
-using namespace cldnn;
-using namespace ::tests;
-
-namespace {
-template<typename T>
-std::vector<T> getValues(const std::vector<float>& values) {
-    std::vector<T> result(values.begin(), values.end());
-    return result;
-}
-
-template<typename T>
-float getError();
-
-template<>
-float getError<float>() {
-    return 0.001;
-}
-
-template<>
-float getError<ov::float16>() {
-    return 0.2;
-}
-
-template<typename T, typename T_IND>
-struct MulticlassNmsParams {
-    std::string test_name;
-
-    ov::op::util::MulticlassNmsBase::SortResultType sort_result_type;
-    bool sort_result_across_batch;
-    float iou_threshold;
-    float score_threshold;
-    int nms_top_k;
-    int keep_top_k;
-    int background_class;
-    bool normalized;
-    float nms_eta;
-    bool has_roisnum;
-
-    size_t num_batches;
-    size_t num_classes;
-    size_t num_boxes;
-
-    std::vector<T> boxes;
-    std::vector<T> scores;
-    std::vector<T_IND> roisnum;
-
-    std::vector<T> expected_selected_outputs;
-    std::vector<T_IND> expected_selected_indices;
-    std::vector<T_IND> expected_selected_num;
-
-    bool is_caching_test;
-};
-
-template<typename T, typename T_IND>
-struct multiclass_nms_test : public ::testing::TestWithParam<MulticlassNmsParams<T, T_IND>> {
-public:
-    void test(const std::vector<format::type>& formats = {format::bfyx}) {
-        const MulticlassNmsParams<T, T_IND> param = testing::TestWithParam<MulticlassNmsParams<T, T_IND>>::GetParam();
-        auto data_type = ov::element::from<T>();
-        auto index_data_type = ov::element::from<T_IND>();
-        constexpr auto plain_format = format::bfyx;
-
-        for (const auto target_format : formats) {
-
-            auto& engine = get_test_engine();
-
-            const auto input_boxes =
-                    !param.has_roisnum
-                    ? engine.allocate_memory({data_type,
-                                              plain_format,
-                                              tensor{batch(param.num_batches), feature(param.num_boxes),
-                                                     spatial(1, 4)}})
-                    : engine.allocate_memory({data_type,
-                                              plain_format,
-                                              tensor{batch(param.num_classes), feature(param.num_boxes),
-                                                     spatial(1, 4)}});
-            set_values(input_boxes, param.boxes);
-
-            const auto input_scores =
-                    !param.has_roisnum
-                    ? engine.allocate_memory(
-                            {data_type,
-                             plain_format,
-                             tensor{batch(param.num_batches), feature(param.num_classes),
-                                    spatial(1, param.num_boxes)}})
-                    : engine.allocate_memory(
-                            {data_type, plain_format, tensor{batch(param.num_classes), feature(param.num_boxes)}});
-            set_values(input_scores, param.scores);
-
-            const auto input_roisnum =
-                    param.has_roisnum
-                    ? engine.allocate_memory({index_data_type, plain_format, tensor{batch(param.num_batches)}})
-                    : nullptr;
-            if (input_roisnum) {
-                set_values(input_roisnum, param.roisnum);
-            }
-
-            auto real_num_classes = param.num_classes;
-            if (param.background_class >= 0 && static_cast<size_t>(param.background_class) < param.num_classes) {
-                real_num_classes = std::max(static_cast<size_t>(1), param.num_classes - 1);
-            }
-            int64_t max_output_boxes_per_class = 0;
-            if (param.nms_top_k >= 0)
-                max_output_boxes_per_class = std::min(static_cast<int>(param.num_boxes), param.nms_top_k);
-            else
-                max_output_boxes_per_class = param.num_boxes;
-
-            auto max_output_boxes_per_batch = max_output_boxes_per_class * real_num_classes;
-            if (param.keep_top_k >= 0)
-                max_output_boxes_per_batch = std::min(static_cast<int>(max_output_boxes_per_batch), param.keep_top_k);
-
-            const auto dim = max_output_boxes_per_batch * param.num_batches;
-
-            const layout output_selected_indices_layout{index_data_type, target_format,
-                                                        tensor{batch(dim), feature(1)}};
-            const auto output_selected_indices = engine.allocate_memory(output_selected_indices_layout);
-            const layout output_selected_num_layout{index_data_type, target_format,
-                                                    tensor{batch(param.num_batches)}};
-            const auto output_selected_num = engine.allocate_memory(output_selected_num_layout);
-
-            topology topology;
-
-            topology.add(input_layout("input_boxes", input_boxes->get_layout()));
-            topology.add(input_layout("input_scores", input_scores->get_layout()));
-            if (param.has_roisnum) {
-                topology.add(input_layout("input_roisnum", input_roisnum->get_layout()));
-            }
-
-            topology.add(mutable_data("output_selected_indices", output_selected_indices));
-            topology.add(mutable_data("output_selected_num", output_selected_num));
-
-            topology.add(reorder("input_boxes_reordered", input_info("input_boxes"), target_format, data_type));
-            topology.add(reorder("input_scores_reordered", input_info("input_scores"), target_format, data_type));
-            if (param.has_roisnum) {
-                topology.add(reorder("input_roisnum_reordered", input_info("input_roisnum"), target_format, index_data_type));
-            }
-
-            ov::op::util::MulticlassNmsBase::Attributes attrs;
-            attrs.sort_result_type = param.sort_result_type;
-            attrs.sort_result_across_batch = param.sort_result_across_batch;
-            attrs.output_type = index_data_type;
-            attrs.iou_threshold = param.iou_threshold;
-            attrs.score_threshold = param.score_threshold;
-            attrs.nms_top_k = param.nms_top_k;
-            attrs.keep_top_k = param.keep_top_k;
-            attrs.background_class = param.background_class;
-            attrs.nms_eta = param.nms_eta;
-            attrs.normalized = param.normalized;
-
-
-            const auto primitive = multiclass_nms{
-                    "multiclass_nms_reordered",
-                    std::vector<cldnn::input_info>{
-                        input_info("input_boxes_reordered"),
-                        input_info("input_scores_reordered"),
-                        param.has_roisnum ? input_info("input_roisnum_reordered") : input_info(""),
-                        input_info("output_selected_indices"),
-                        input_info("output_selected_num")
-                    },
-                    attrs
-            };
-
-            topology.add(primitive);
-            topology.add(reorder("multiclass_nms", input_info("multiclass_nms_reordered"), plain_format, data_type));
-            ExecutionConfig config = get_test_default_config(engine);
-            config.set_property(ov::intel_gpu::optimize_data(false));
-
-            cldnn::network::ptr network = get_network(engine, topology, config, get_test_stream_ptr(), param.is_caching_test);
-
-            network->set_input_data("input_boxes", input_boxes);
-            network->set_input_data("input_scores", input_scores);
-            if (param.has_roisnum) {
-                network->set_input_data("input_roisnum", input_roisnum);
-            }
-
-            const auto outputs = network->execute();
-
-            const auto output_boxes = outputs.at("multiclass_nms").get_memory();
-            const cldnn::mem_lock<T> output_boxes_ptr(output_boxes, get_test_stream());
-            ASSERT_EQ(output_boxes_ptr.size(), dim * 6) << "format=" << fmt_to_str(target_format);
-
-            const auto get_plane_data = [&](const memory::ptr& mem, const data_types data_type,
-                                            const layout& from_layout) {
-                if (from_layout.format == plain_format) {
-                    return mem;
-                }
-                cldnn::topology reorder_topology;
-                reorder_topology.add(input_layout("data", from_layout));
-                reorder_topology.add(reorder("plane_data", input_info("data"), plain_format, data_type));
-                cldnn::network reorder_net{engine, reorder_topology, get_test_default_config(engine)};
-                reorder_net.set_input_data("data", mem);
-                const auto second_output_result = reorder_net.execute();
-                const auto plane_data_mem = second_output_result.at("plane_data").get_memory();
-                return plane_data_mem;
-            };
-
-            const cldnn::mem_lock<T_IND> output_selected_indices_ptr(
-                    get_plane_data(output_selected_indices, index_data_type, output_selected_indices_layout),
-                    get_test_stream());
-            ASSERT_EQ(output_selected_indices_ptr.size(), dim) << "format=" << fmt_to_str(target_format);
-
-            const cldnn::mem_lock<T_IND> output_selected_num_ptr(
-                    get_plane_data(output_selected_num, index_data_type, output_selected_num_layout),
-                    get_test_stream());
-            ASSERT_EQ(output_selected_num_ptr.size(), param.num_batches) << "format=" << fmt_to_str(target_format);
-
-            if (!param.is_caching_test) {
-                for (size_t i = 0; i < param.num_batches; ++i) {
-                    ASSERT_EQ(param.expected_selected_num[i], output_selected_num_ptr[i])
-                                        << "format=" << fmt_to_str(target_format) << " i=" << i;
-                }
-            }
-
-            for (size_t box = 0; box < dim; ++box) {
-                if (!param.is_caching_test) {
-                    ASSERT_EQ(param.expected_selected_indices[box], output_selected_indices_ptr[box]) << "box=" << box;
-                }
-
-                for (size_t j = 0; j < 6; ++j) {
-                    const auto idx = box * 6 + j;
-                    ASSERT_NEAR(param.expected_selected_outputs[idx], output_boxes_ptr[idx], getError<T>())
-                                        << "format=" << fmt_to_str(target_format) << " box=" << box << ", j=" << j;
-                }
-            }
-        }
-    }
-};
-
-struct PrintToStringParamName {
-    template<class T, class T_IND>
-    std::string operator()(const testing::TestParamInfo<MulticlassNmsParams<T, T_IND>> &info) {
-        const auto &p = info.param;
-        std::ostringstream result;
-        result << p.test_name << "_";
-        result << "InputType=" << ov::element::Type(ov::element::from<T_IND>()) << "_";
-        result << "DataType=" << ov::element::Type(ov::element::from<T>());
-        return result.str();
-    }
-};
-
-using multiclass_nms_test_f32_i32 = multiclass_nms_test<float, int32_t>;
-using multiclass_nms_test_f16_i64 = multiclass_nms_test<ov::float16, int64_t>;
-using multiclass_nms_test_blocked = multiclass_nms_test<float, int32_t>;
-
-TEST_P(multiclass_nms_test_f32_i32, basic) {
-    ASSERT_NO_FATAL_FAILURE(test());
-}
-
-TEST_P(multiclass_nms_test_f16_i64, basic) {
-    ASSERT_NO_FATAL_FAILURE(test());
-}
-
-TEST_P(multiclass_nms_test_blocked, basic) {
-    const std::vector<format::type> formats = {
-            format::bfyx,
-            format::b_fs_yx_fsv16,
-            format::b_fs_yx_fsv32,
-            format::bs_fs_yx_bsv16_fsv16,
-            format::bs_fs_yx_bsv16_fsv32,
-            format::bs_fs_yx_bsv32_fsv16,
-            format::bs_fs_yx_bsv32_fsv32
-    };
-
-    ASSERT_NO_FATAL_FAILURE(test(formats));
-}
-
-template<typename T, typename T_IND>
-std::vector<MulticlassNmsParams<T, T_IND>> getMulticlassNmsParams(bool is_caching_test = false) {
-    std::vector<MulticlassNmsParams<T, T_IND>> params = {
-        {"by_score",
-         ov::op::util::MulticlassNmsBase::SortResultType::SCORE,
-         false,
-         0.5f,
-         0.0f,
-         3,
-         -1,
-         -1,
-         true,
-         1.0f,
-         false,
-
-         1,
-         2,
-         6,
-
-         getValues<T>({0.0, 0.0, 1.0, 1.0, 0.0, 0.1, 1.0, 1.1, 0.0, -0.1, 1.0, 0.9,
-                       0.0, 10.0, 1.0, 11.0, 0.0, 10.1, 1.0, 11.1, 0.0, 100.0, 1.0, 101.0}),
-         getValues<T>({0.9, 0.75, 0.6, 0.95, 0.5, 0.3, 0.95, 0.75, 0.6, 0.80, 0.5, 0.3}),
-         std::vector<T_IND>{},
-         getValues<T>({0.00, 0.95, 0.00, 10.00, 1.00, 11.00, 1.00, 0.95, 0.00, 0.00, 1.00, 1.00,
-                       0.00, 0.90, 0.00, 0.00, 1.00, 1.00, 1.00, 0.80, 0.00, 10.00, 1.00, 11.00,
-                       -1.0, -1.0, -1.0, -1.0, -1.0, -1.0, -1.0, -1.0, -1.0, -1.0, -1.0, -1.0}),
-         std::vector<T_IND>{3, 0, 0, 3, -1, -1},
-         std::vector<T_IND>{4},
-         is_caching_test},
-
-        {"by_class_id",
-         ov::op::util::MulticlassNmsBase::SortResultType::CLASSID,
-          false, 0.5f, 0.0f, 3, -1, -1, true, 1.0f, false,
-          1, 2, 6,
-            getValues<T>({0.0, 0.0, 1.0, 1.0, 0.0, 0.1, 1.0, 1.1, 0.0, -0.1, 1.0, 0.9,
-                          0.0, 10.0, 1.0, 11.0, 0.0, 10.1, 1.0, 11.1, 0.0, 100.0, 1.0, 101.0}),
-            getValues<T>({0.9, 0.75, 0.6, 0.95, 0.5, 0.3, 0.95, 0.75, 0.6, 0.80, 0.5, 0.3}),
-            std::vector<T_IND>{},
-            getValues<T>({0.00, 0.95, 0.00, 10.00, 1.00, 11.00, 0.00, 0.90, 0.00, 0.00, 1.00, 1.00,
-                          1.00, 0.95, 0.00, 0.00, 1.00, 1.00, 1.00, 0.80, 0.00, 10.00, 1.00, 11.00,
-                          -1.0, -1.0, -1.0, -1.0, -1.0, -1.0, -1.0, -1.0, -1.0, -1.0, -1.0, -1.0}),
-            std::vector<T_IND>{3, 0, 0, 3, -1, -1},
-            std::vector<T_IND>{4},
-            is_caching_test},
-
-        {"three_inputs",
-         ov::op::util::MulticlassNmsBase::SortResultType::SCORE,
-         false,
-         0.5f,
-         0.0f,
-         3,
-         -1,
-         -1,
-         true,
-         1.0f,
-         true,
-
-         2,
-         2,
-         6,
-
-         getValues<T>({0.0, 0.0, 1.0, 1.0, 0.0, 0.1, 1.0, 1.1, 0.0, -0.1, 1.0, 0.9, 0.0, 10.0, 1.0, 11.0,
-                       0.0, 10.1, 1.0, 11.1, 0.0, 100.0, 1.0, 101.0, 0.0, 0.0, 1.0, 1.0, 0.0, 0.1, 1.0,
-                       1.1,
-                       0.0, -0.1, 1.0, 0.9, 0.0, 10.0, 1.0, 11.0, 0.0, 10.1, 1.0, 11.1, 0.0, 100.0, 1.0,
-                       101.0}),
-         getValues<T>({0.9, 0.75, 0.6, 0.95, 0.5, 0.3, 0.95, 0.75, 0.6, 0.80, 0.5, 0.3}),
-         std::vector<T_IND>{1, 1},
-
-         getValues<T>({1.00, 0.95, 0.00, 0.00, 1.00, 1.00,
-                       0.00, 0.90, 0.00, 0.00, 1.00, 1.00,
-                       -1.0, -1.0, -1.0, -1.0, -1.0, -1.0,
-                       -1.0, -1.0, -1.0, -1.0, -1.0, -1.0,
-                       -1.0, -1.0, -1.0, -1.0, -1.0, -1.0,
-                       -1.0, -1.0, -1.0, -1.0, -1.0, -1.0,
-                       0.0, 0.75, 0.0, 0.1, 1.0, 1.1,
-                       1.0, 0.75, 0.0, 0.1, 1.0, 1.1,
-                       -1.0, -1.0, -1.0, -1.0, -1.0, -1.0,
-                       -1.0, -1.0, -1.0, -1.0, -1.0, -1.0,
-                       -1.0, -1.0, -1.0, -1.0, -1.0, -1.0,
-                       -1.0, -1.0, -1.0, -1.0, -1.0, -1.0}),
-        std::vector<T_IND>{1, 0, -1, -1, -1, -1,
-                           2, 3, -1, -1, -1, -1},
-        std::vector<T_IND>{2, 2},
-        is_caching_test},
-
-        {"across_batches_by_score",
-         ov::op::util::MulticlassNmsBase::SortResultType::SCORE,
-         true,
-         0.5f,
-         0.0f,
-         3,
-         -1,
-         -1,
-         true,
-         1.0f,
-         false,
-
-         2,
-         2,
-         6,
-
-         getValues<T>({0.0, 0.0, 1.0, 1.0, 0.0, 0.1, 1.0, 1.1, 0.0, -0.1, 1.0, 0.9, 0.0, 10.0, 1.0, 11.0,
-                       0.0, 10.1, 1.0, 11.1, 0.0, 100.0, 1.0, 101.0, 0.0, 0.0, 1.0, 1.0, 0.0, 0.1, 1.0, 1.1,
-                       0.0, -0.1, 1.0, 0.9, 0.0, 10.0, 1.0, 11.0, 0.0, 10.1, 1.0, 11.1, 0.0, 100.0, 1.0, 101.0}),
-        getValues<T>({0.9, 0.75, 0.6, 0.95, 0.5, 0.3, 0.95, 0.75, 0.6, 0.80, 0.5, 0.3,
-                      0.9, 0.75, 0.6, 0.95, 0.5, 0.3, 0.95, 0.75, 0.6, 0.80, 0.5, 0.3}),
-        std::vector<T_IND>{},
-
-        getValues<T>({0.00, 0.95, 0.00, 10.00, 1.00, 11.00,
-                      1.00, 0.95, 0.00, 0.00, 1.00, 1.00,
-                      1.00, 0.95, 0.00, 0.00, 1.00, 1.00,
-                      0.00, 0.90, 0.00, 0.00, 1.00, 1.00,
-                      -1.0, -1.0, -1.0, -1.0, -1.0, -1.0,
-                      -1.0, -1.0, -1.0, -1.0, -1.0, -1.0,
-                      1.00, 0.80, 0.00, 10.00, 1.00, 11.00,
-                      1.00, 0.80, 0.00, 10.00, 1.00, 11.00,
-                      1.0, 0.5, 0.0, 10.1, 1.0, 11.1,
-                      1.0, 0.3, 0.0, 100.0, 1.0, 101.0,
-                      -1.0, -1.0, -1.0, -1.0, -1.0, -1.0,
-                      -1.0, -1.0, -1.0, -1.0, -1.0, -1.0}),
-        std::vector<T_IND>{3, 0, 6, 0, -1, -1, 3, 9, 4, 5, -1, -1},
-        std::vector<T_IND>{4, 4},
-        is_caching_test},
-
-        {"across_batches_by_class_id",
-         ov::op::util::MulticlassNmsBase::SortResultType::CLASSID,
-         true,
-         0.5f,
-         0.0f,
-         3,
-         -1,
-         -1,
-         true,
-         1.0f,
-         false,
-
-         2,
-         2,
-         6,
-
-         getValues<T>({0.0, 0.0, 1.0, 1.0, 0.0, 0.1, 1.0, 1.1, 0.0, -0.1, 1.0, 0.9, 0.0, 10.0, 1.0, 11.0,
-                       0.0, 10.1, 1.0, 11.1, 0.0, 100.0, 1.0, 101.0, 0.0, 0.0, 1.0, 1.0, 0.0, 0.1, 1.0, 1.1,
-                       0.0, -0.1, 1.0, 0.9, 0.0, 10.0, 1.0, 11.0, 0.0, 10.1, 1.0, 11.1, 0.0, 100.0, 1.0, 101.0}),
-         getValues<T>({0.9, 0.75, 0.6, 0.95, 0.5, 0.3, 0.95, 0.75, 0.6, 0.80, 0.5, 0.3,
-                       0.9, 0.75, 0.6, 0.95, 0.5, 0.3, 0.95, 0.75, 0.6, 0.80, 0.5, 0.3}),
-         std::vector<T_IND>{},
-
-         getValues<T>({0.00, 0.95, 0.00, 10.00, 1.00, 11.00,
-                      0.00, 0.90, 0.00, 0.00, 1.00, 1.00,
-                      1.00, 0.95, 0.00, 0.00, 1.00, 1.00,
-                      1.00, 0.80, 0.00, 10.00, 1.00, 11.00,
-                      -1.0, -1.0, -1.0, -1.0, -1.0, -1.0,
-                      -1.0, -1.0, -1.0, -1.0, -1.0, -1.0,
-
-                      1.0, 0.5, 0.0, 10.1, 1.0, 11.1,
-                      1.0, 0.3, 0.0, 100.0, 1.0, 101.0,
-                      1.00, 0.95, 0.00, 0.00, 1.00, 1.00,
-                      1.00, 0.80, 0.00, 10.00, 1.00, 11.00,
-                      -1.0, -1.0, -1.0, -1.0, -1.0, -1.0,
-                      -1.0, -1.0, -1.0, -1.0, -1.0, -1.0}),
-         std::vector<T_IND>{3, 0, 0, 3, -1, -1, 4, 5, 6, 9, -1, -1},
-         std::vector<T_IND>{4, 4},
-         is_caching_test},
-
-        {"normalized",
-         ov::op::util::MulticlassNmsBase::SortResultType::SCORE,
-         false,
-         0.5f,
-         0.0f,
-         3,
-         -1,
-         -1,
-         true,
-         1.0f,
-         false,
-
-         1,
-         1,
-         6,
-
-         getValues<T>({1.0, 1.0, 0.0, 0.0, 0.0, 0.1, 1.0, 1.1, 0.0, 0.9, 1.0, -0.1,
-                       0.0, 10.0, 1.0, 11.0, 1.0, 10.1, 0.0, 11.1, 1.0, 101.0, 0.0, 100.0}),
-         getValues<T>({0.9, 0.75, 0.6, 0.95, 0.5, 0.3}),
-         std::vector<T_IND>{},
-
-         getValues<T>({0.00, 0.95, 0.00, 10.00, 1.00, 11.00, 0.00, 0.90, 1.00,
-                       1.00, 0.00, 0.00, 0.00, 0.75, 0.00, 0.10, 1.00, 1.10}),
-         std::vector<T_IND>{3, 0, 1},
-         std::vector<T_IND>{3},
-         is_caching_test},
-
-        {"identical_boxes",
-         ov::op::util::MulticlassNmsBase::SortResultType::SCORE,
-         false,
-         0.5f,
-         0.0f,
-         3,
-         -1,
-         -1,
-         true,
-         1.0f,
-         false,
-
-         1,
-         1,
-         10,
-
-         getValues<T>({0.0, 0.0, 1.0, 1.0, 0.0, 0.0, 1.0, 1.0, 0.0, 0.0, 1.0, 1.0, 0.0, 0.0,
-                       1.0, 1.0, 0.0, 0.0, 1.0, 1.0, 0.0, 0.0, 1.0, 1.0, 0.0, 0.0, 1.0, 1.0,
-                       0.0, 0.0, 1.0, 1.0, 0.0, 0.0, 1.0, 1.0, 0.0, 0.0, 1.0, 1.0}),
-         getValues<T>({0.9, 0.9, 0.9, 0.9, 0.9, 0.9, 0.9, 0.9, 0.9, 0.9}),
-         std::vector<T_IND>{},
-
-         getValues<T>({0.00, 0.90, 0.00, 0.00, 1.00, 1.00,
-                       -1.0, -1.0, -1.0, -1.0, -1.0, -1.0,
-                       -1.0, -1.0, -1.0, -1.0, -1.0, -1.0}),
-        std::vector<T_IND>{0, -1, -1},
-        std::vector<T_IND>{1},
-        is_caching_test},
-
-        {"limit_output_size",
-         ov::op::util::MulticlassNmsBase::SortResultType::SCORE,
-         false,
-         0.5f,
-         0.0f,
-         2,
-         -1,
-         -1,
-         true,
-         1.0f,
-         false,
-
-         1,
-         1,
-         6,
-
-         getValues<T>({0.0, 0.0, 1.0, 1.0, 0.0, 0.1, 1.0, 1.1, 0.0, -0.1, 1.0, 0.9,
-                       0.0, 10.0, 1.0, 11.0, 0.0, 10.1, 1.0, 11.1, 0.0, 100.0, 1.0, 101.0}),
-         getValues<T>({0.9, 0.75, 0.6, 0.95, 0.5, 0.3}),
-         std::vector<T_IND>{},
-         getValues<T>({0.00, 0.95, 0.00, 10.00, 1.00, 11.00, 0.00, 0.90, 0.00, 0.00, 1.00, 1.00}),
-         std::vector<T_IND>{3, 0},
-         std::vector<T_IND>{2},
-         is_caching_test},
-
-        {"single_box",
-         ov::op::util::MulticlassNmsBase::SortResultType::SCORE,
-         false,
-         0.5f,
-         0.0f,
-         3,
-         -1,
-         -1,
-         true,
-         1.0f,
-         false,
-
-         1,
-         1,
-         1,
-
-         getValues<T>({0.0, 0.0, 1.0, 1.0}),
-         getValues<T>({0.9}),
-         std::vector<T_IND>{},
-
-         getValues<T>({0.00, 0.90, 0.00, 0.00, 1.00, 1.00}),
-         std::vector<T_IND>{0},
-         std::vector<T_IND>{1},
-         is_caching_test},
-
-        {"iou_threshold",
-         ov::op::util::MulticlassNmsBase::SortResultType::SCORE,
-         false,
-         0.2f,
-         0.0f,
-         3,
-         -1,
-         -1,
-         true,
-         1.0f,
-         false,
-
-         1,
-         1,
-         6,
-
-         getValues<T>({0.0, 0.0, 1.0, 1.0, 0.0, 0.1, 1.0, 1.1, 0.0, -0.1, 1.0, 0.9,
-                       0.0, 10.0, 1.0, 11.0, 0.0, 10.1, 1.0, 11.1, 0.0, 100.0, 1.0, 101.0}),
-         getValues<T>({0.9, 0.75, 0.6, 0.95, 0.5, 0.3}),
-         std::vector<T_IND>{},
-
-         getValues<T>({0.00, 0.95, 0.00, 10.00, 1.00, 11.00, 0.00, 0.90, 0.00,
-                       0.00, 1.00, 1.00, -1.0, -1.0, -1.0, -1.0, -1.0, -1.0}),
-        std::vector<T_IND>{3, 0, -1},
-        std::vector<T_IND>{2},
-        is_caching_test},
-
-        {"iou_and_score_thresholds",
-         ov::op::util::MulticlassNmsBase::SortResultType::SCORE,
-         false,
-         0.5f,
-         0.95f,
-         3,
-         -1,
-         -1,
-         true,
-         1.0f,
-         false,
-
-         1,
-         1,
-         6,
-
-         getValues<T>({0.0, 0.0, 1.0, 1.0, 0.0, 0.1, 1.0, 1.1, 0.0, -0.1, 1.0, 0.9,
-                       0.0, 10.0, 1.0, 11.0, 0.0, 10.1, 1.0, 11.1, 0.0, 100.0, 1.0, 101.0}),
-         getValues<T>({0.9, 0.75, 0.6, 0.96, 0.5, 0.3}),
-         std::vector<T_IND>{},
-
-         getValues<T>({0.00, 0.96, 0.00, 10.00, 1.00, 11.00, -1.0, -1.0, -1.0,
-                       -1.0, -1.0, -1.0, -1.0, -1.0, -1.0, -1.0, -1.0, -1.0}),
-         std::vector<T_IND>{3, -1, -1},
-         std::vector<T_IND>{1},
-         is_caching_test},
-
-        {"no_output",
-         ov::op::util::MulticlassNmsBase::SortResultType::SCORE,
-         false,
-         0.5f,
-         2.0f,
-         3,
-         -1,
-         -1,
-         true,
-         1.0f,
-         false,
-
-         1,
-         1,
-         6,
-
-         getValues<T>({0.0, 0.0, 1.0, 1.0, 0.0, 0.1, 1.0, 1.1, 0.0, -0.1, 1.0, 0.9,
-                       0.0, 10.0, 1.0, 11.0, 0.0, 10.1, 1.0, 11.1, 0.0, 100.0, 1.0, 101.0}),
-         getValues<T>({0.9, 0.75, 0.6, 0.95, 0.5, 0.3}),
-         std::vector<T_IND>{},
-
-         getValues<T>({-1.0, -1.0, -1.0, -1.0, -1.0, -1.0,
-                      -1.0, -1.0, -1.0, -1.0, -1.0, -1.0,
-                      -1.0, -1.0, -1.0, -1.0, -1.0, -1.0,
-                      -1.0, -1.0, -1.0, -1.0, -1.0, -1.0,
-                      -1.0, -1.0, -1.0, -1.0, -1.0, -1.0,
-                      -1.0, -1.0, -1.0, -1.0, -1.0, -1.0}),
-         std::vector<T_IND>{-1, -1, -1, -1, -1, -1},
-         std::vector<T_IND>{0},
-         is_caching_test},
-
-        {"background_class",
-         ov::op::util::MulticlassNmsBase::SortResultType::CLASSID,
-         false,
-         0.5f,
-         0.0f,
-         3,
-         -1,
-         0,  // background class
-         true,
-         1.0f,
-         false,
-
-         2,
-         2,
-         6,
-
-         getValues<T>({0.0, 0.0, 1.0, 1.0,
-                       0.0, 0.1, 1.0, 1.1,
-                       0.0, -0.1, 1.0, 0.9,
-                       0.0, 10.0, 1.0, 11.0,
-                       0.0, 10.1, 1.0, 11.1,
-                       0.0, 100.0, 1.0, 101.0,
-                       0.0, 0.0, 1.0, 1.0,
-                       0.0, 0.1, 1.0, 1.1,
-                       0.0, -0.1, 1.0, 0.9,
-                       0.0, 10.0, 1.0, 11.0,
-                       0.0, 10.1, 1.0, 11.1,
-                       0.0, 100.0, 1.0, 101.0}),
-         getValues<T>({0.9, 0.75, 0.6, 0.95, 0.5, 0.3, 0.95, 0.75, 0.6, 0.80, 0.5, 0.3,
-                       0.9, 0.75, 0.6, 0.95, 0.5, 0.3, 0.95, 0.75, 0.6, 0.80, 0.5, 0.3}),
-         std::vector<T_IND>{},
-
-        getValues<T>({1.00, 0.95, 0.00, 0.00, 1.00, 1.00,
-                      1.00, 0.80, 0.00, 10.00, 1.00, 11.00,
-                      -1.0, -1.0, -1.0, -1.0, -1.0, -1.0,
-                      1.00, 0.95, 0.00, 0.00, 1.00, 1.00,
-                      1.00, 0.80, 0.00, 10.00, 1.00, 11.00,
-                      -1.0, -1.0, -1.0, -1.0, -1.0, -1.0}),
-        std::vector<T_IND>{0, 3, -1, 6, 9, -1},
-        std::vector<T_IND>{2, 2},
-        is_caching_test},
-
-        {"keep_top_k",
-         ov::op::util::MulticlassNmsBase::SortResultType::CLASSID,
-         false,
-         0.5f,
-         0.0f,
-         3,
-         3,
-         -1,
-         true,
-         1.0f,
-         false,
-
-         2,
-         2,
-         6,
-
-         getValues<T>({0.0, 0.0, 1.0, 1.0, 0.0, 0.1, 1.0, 1.1, 0.0, -0.1, 1.0, 0.9,
-                       0.0, 10.0, 1.0, 11.0, 0.0, 10.1, 1.0, 11.1, 0.0, 100.0, 1.0, 101.0,
-                       0.0, 0.0, 1.0, 1.0, 0.0, 0.1, 1.0, 1.1, 0.0, -0.1, 1.0, 0.9,
-                       0.0, 10.0, 1.0, 11.0, 0.0, 10.1, 1.0, 11.1, 0.0, 100.0, 1.0, 101.0}),
-         getValues<T>({0.9, 0.75, 0.6, 0.95, 0.5, 0.3, 0.95, 0.75, 0.6, 0.80, 0.5, 0.3,
-                       0.9, 0.75, 0.6, 0.95, 0.5, 0.3, 0.95, 0.75, 0.6, 0.80, 0.5, 0.3}),
-         std::vector<T_IND>{},
-
-         getValues<T>({0.00, 0.95, 0.00, 10.00, 1.00, 11.00,
-                       0.00, 0.90, 0.00, 0.00, 1.00, 1.00,
-                       1.00, 0.95, 0.00, 0.00, 1.00, 1.00,
-                       1.00, 0.5, 0.00, 10.1, 1.00, 11.1,
-                       1.00, 0.95, 0.00, 0.00, 1.00, 1.00,
-                       1.00, 0.80, 0.00, 10.00, 1.00, 11.00}),
-        std::vector<T_IND>{3, 0, 0, 4, 6, 9},
-        std::vector<T_IND>{3, 3},
-        is_caching_test},
-
-        {"normalized_by_classid",
-         ov::op::util::MulticlassNmsBase::SortResultType::CLASSID,
-         false,
-         1.0f,
-         0.0f,
-         -1,
-         -1,
-         -1,
-         true,
-         0.1f,
-         false,
-
-         2,
-         2,
-         6,
-
-         getValues<T>({0.0, 0.0, 1.0, 1.0, 0.0, 0.1, 1.0, 1.1, 0.0, -0.1, 1.0, 0.9,
-                       0.0, 10.0, 1.0, 11.0, 0.0, 10.1, 1.0, 11.1, 0.0, 100.0, 1.0, 101.0,
-                       0.0, 0.0, 1.0, 1.0, 0.0, 0.1, 1.0, 1.1, 0.0, -0.1, 1.0, 0.9,
-                       0.0, 10.0, 1.0, 11.0, 0.0, 10.1, 1.0, 11.1, 0.0, 100.0, 1.0, 101.0}),
-         getValues<T>({0.9, 0.75, 0.6, 0.95, 0.5, 0.3, 0.95, 0.75, 0.6, 0.80, 0.5, 0.3,
-                       0.9, 0.75, 0.6, 0.95, 0.5, 0.3, 0.95, 0.75, 0.6, 0.80, 0.5, 0.3}),
-         std::vector<T_IND>{},
-
-         getValues<T>({0.00, 0.95, 0.00, 10.00, 1.00, 11.00,
-                      0.00, 0.90, 0.00, 0.00, 1.00, 1.00,
-                      0.00, 0.30, 0.00, 100.00, 1.00, 101.00,
-                      1.00, 0.95, 0.00, 0.00, 1.00, 1.00,
-                      1.00, 0.80, 0.00, 10.00, 1.00, 11.00,
-                      1.00, 0.30, 0.00, 100.00, 1.00, 101.00,
-                      -1.0, -1.0, -1.0, -1.0, -1.0, -1.0,
-                      -1.0, -1.0, -1.0, -1.0, -1.0, -1.0,
-                      -1.0, -1.0, -1.0, -1.0, -1.0, -1.0,
-                      -1.0, -1.0, -1.0, -1.0, -1.0, -1.0,
-                      -1.0, -1.0, -1.0, -1.0, -1.0, -1.0,
-                      -1.0, -1.0, -1.0, -1.0, -1.0, -1.0,
-                      1.0, 0.6, 0.0, -0.1, 1.0, 0.9,
-                      1.0, 0.5, 0.0, 10.1, 1.0, 11.1,
-                      1.00, 0.30, 0.00, 100.00, 1.00, 101.00,
-                      1.00, 0.95, 0.00, 0.00, 1.00, 1.00,
-                      1.00, 0.80, 0.00, 10.00, 1.00, 11.00,
-                      1.00, 0.30, 0.00, 100.00, 1.00, 101.00,
-                      -1.0, -1.0, -1.0, -1.0, -1.0, -1.0,
-                      -1.0, -1.0, -1.0, -1.0, -1.0, -1.0,
-                      -1.0, -1.0, -1.0, -1.0, -1.0, -1.0,
-                      -1.0, -1.0, -1.0, -1.0, -1.0, -1.0,
-                      -1.0, -1.0, -1.0, -1.0, -1.0, -1.0,
-                      -1.0, -1.0, -1.0, -1.0, -1.0, -1.0}),
-         std::vector<T_IND>{3, 0, 5, 0, 3, 5,
-                            -1, -1, -1, -1, -1, -1,
-                            2, 4, 5, 6, 9, 11,
-                            -1, -1, -1, -1, -1, -1},
-         std::vector<T_IND>{6, 6},
-         is_caching_test},
-    };
-
-    return params;
-}
-
-template<typename T, typename T_IND>
-std::vector<MulticlassNmsParams<T, T_IND>> getParamsForBlockedLayout(bool is_caching_test = false) {
-    MulticlassNmsParams<T, T_IND> param = {
-        "blocked_format_three_inputs",
-        ov::op::util::MulticlassNmsBase::SortResultType::SCORE,
-        false,
-        0.5f,
-        0.0f,
-        3,
-        -1,
-        -1,
-        true,
-        1.0f,
-        true,
-
-        34, //batches
-        2,  //classes
-        6,  //boxes
-
-        getValues<T>({0.0, 0.0, 1.0, 1.0, 0.0, 0.1, 1.0, 1.1, 0.0, -0.1, 1.0, 0.9, 0.0, 10.0, 1.0, 11.0,
-                      0.0, 10.1, 1.0, 11.1, 0.0, 100.0, 1.0, 101.0, 0.0, 0.0, 1.0, 1.0, 0.0, 0.1, 1.0, 1.1,
-                      0.0, -0.1, 1.0, 0.9, 0.0, 10.0, 1.0, 11.0, 0.0, 10.1, 1.0, 11.1, 0.0, 100.0, 1.0, 101.0,
-                      0.0, 0.0, 1.0, 1.0, 0.0, 0.1, 1.0, 1.1, 0.0, -0.1, 1.0, 0.9, 0.0, 10.0, 1.0, 11.0,
-                      0.0, 10.1, 1.0, 11.1, 0.0, 100.0, 1.0, 101.0, 0.0, 0.0, 1.0, 1.0, 0.0, 0.1, 1.0, 1.1,
-                      0.0, -0.1, 1.0, 0.9, 0.0, 10.0, 1.0, 11.0, 0.0, 10.1, 1.0, 11.1, 0.0, 100.0, 1.0, 101.0,
-                      0.0, 0.0, 1.0, 1.0, 0.0, 0.1, 1.0, 1.1, 0.0, -0.1, 1.0, 0.9, 0.0, 10.0, 1.0, 11.0,
-                      0.0, 0.0, 1.0, 1.0, 0.0, 0.1, 1.0, 1.1, 0.0, -0.1, 1.0, 0.9, 0.0, 10.0, 1.0, 11.0,
-                      0.0, 0.0, 1.0, 1.0, 0.0, 0.1, 1.0, 1.1, 0.0, -0.1, 1.0, 0.9, 0.0, 10.0, 1.0, 11.0,
-                      0.0, 10.1, 1.0, 11.1, 0.0, 100.0, 1.0, 101.0, 0.0, 0.0, 1.0, 1.0, 0.0, 0.1, 1.0, 1.1,
-                      0.0, -0.1, 1.0, 0.9, 0.0, 10.0, 1.0, 11.0, 0.0, 10.1, 1.0, 11.1, 0.0, 100.0, 1.0, 101.0,
-                      0.0, 0.0, 1.0, 1.0, 0.0, 0.1, 1.0, 1.1, 0.0, -0.1, 1.0, 0.9, 0.0, 10.0, 1.0, 11.0,
-                      0.0, 10.1, 1.0, 11.1, 0.0, 100.0, 1.0, 101.0, 0.0, 0.0, 1.0, 1.0, 0.0, 0.1, 1.0, 1.1,
-                      0.0, -0.1, 1.0, 0.9, 0.0, 10.0, 1.0, 11.0, 0.0, 10.1, 1.0, 11.1, 0.0, 100.0, 1.0, 101.0,
-                      0.0, 0.0, 1.0, 1.0, 0.0, 0.1, 1.0, 1.1, 0.0, -0.1, 1.0, 0.9, 0.0, 10.0, 1.0, 11.0,
-                      0.0, 0.0, 1.0, 1.0, 0.0, 0.1, 1.0, 1.1, 0.0, -0.1, 1.0, 0.9, 0.0, 10.0, 1.0, 11.0,
-                      0.0, 0.0, 1.0, 1.0, 0.0, 0.1, 1.0, 1.1, 0.0, -0.1, 1.0, 0.9, 0.0, 10.0, 1.0, 11.0,
-                     }),
-        getValues<T>({0.9, 0.75, 0.6, 0.95, 0.5, 0.3, 0.95, 0.75, 0.6, 0.80, 0.5, 0.3}),
-        std::vector<T_IND>{1, 1},
-
-        getValues<T>({
-                             1.00, 0.95, 0.00, 0.00, 1.00, 1.00,
-                             0.00, 0.90, 0.00, 0.00, 1.00, 1.00,
-                             -1.0, -1.0, -1.0, -1.0, -1.0, -1.0,
-                             -1.0, -1.0, -1.0, -1.0, -1.0, -1.0,
-                             -1.0, -1.0, -1.0, -1.0, -1.0, -1.0,
-                             -1.0, -1.0, -1.0, -1.0, -1.0, -1.0,
-                             0.0, 0.75, 0.0, 0.1, 1.0, 1.1,
-                             1.0, 0.75, 0.0, 0.1, 1.0, 1.1,
-                             -1.0, -1.0, -1.0, -1.0, -1.0, -1.0,
-                             -1.0, -1.0, -1.0, -1.0, -1.0, -1.0,
-                             -1.0, -1.0, -1.0, -1.0, -1.0, -1.0,
-                             -1.0, -1.0, -1.0, -1.0, -1.0, -1.0,
-                     }),
-        std::vector<T_IND>{1, 0, -1, -1, -1, -1,
-                           2, 3, -1, -1, -1, -1},
-        std::vector<T_IND>{2, 2, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
-                           0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0},
-        is_caching_test
-    };
-
-    const auto indices_size = param.num_batches * param.num_boxes;
-    const auto filled_indices = param.expected_selected_indices.size();
-    param.expected_selected_indices.resize(indices_size);
-    for (auto i = filled_indices; i < indices_size; ++i) {
-        param.expected_selected_indices[i] = -1;
-    }
-
-    const auto outputs_size = param.num_batches * param.num_classes * param.num_boxes * 6;
-    const auto filled_outputs = param.expected_selected_outputs.size();
-    param.expected_selected_outputs.resize(outputs_size);
-    for (auto i = filled_outputs; i < outputs_size; ++i) {
-        param.expected_selected_outputs[i] = -1.0;
-    }
-
-    return {param};
-}
-
-INSTANTIATE_TEST_SUITE_P(multiclass_nms_gpu_test,
-                     multiclass_nms_test_f32_i32,
-                     ::testing::ValuesIn(getMulticlassNmsParams<float, int32_t>()),
-                     PrintToStringParamName());
-
-INSTANTIATE_TEST_SUITE_P(multiclass_nms_gpu_test,
-                     multiclass_nms_test_f16_i64,
-                     ::testing::ValuesIn(getMulticlassNmsParams<ov::float16, int64_t>()),
-                     PrintToStringParamName());
-
-INSTANTIATE_TEST_SUITE_P(multiclass_nms_gpu_test_blocked,
-                     multiclass_nms_test_blocked,
-                     ::testing::ValuesIn(getParamsForBlockedLayout<float, int32_t>()),
-                     PrintToStringParamName());
-
-#ifdef RUN_ALL_MODEL_CACHING_TESTS
-INSTANTIATE_TEST_SUITE_P(multiclass_nms_gpu_test_cached,
-                     multiclass_nms_test_f32_i32,
-                     ::testing::ValuesIn(getMulticlassNmsParams<float, int32_t>(true)),
-                     PrintToStringParamName());
-
-INSTANTIATE_TEST_SUITE_P(multiclass_nms_gpu_test_cached,
-                     multiclass_nms_test_f16_i64,
-                     ::testing::ValuesIn(getMulticlassNmsParams<ov::float16, int64_t>(true)),
-                     PrintToStringParamName());
-#endif
-INSTANTIATE_TEST_SUITE_P(multiclass_nms_gpu_test_blocked_cached,
-                     multiclass_nms_test_blocked,
-                     ::testing::ValuesIn(getParamsForBlockedLayout<float, int32_t>(true)),
-                     PrintToStringParamName());
-
-};  // namespace
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/multiple_streams_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/multiple_streams_gpu_test.cpp
index 2fb0a6518dd941..2929ad60b4281b 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/multiple_streams_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/multiple_streams_gpu_test.cpp
@@ -26,7 +26,7 @@ TEST(multistream_gpu, basic) {
     auto& engine = get_test_engine();
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
     auto input1_dyn_layout = layout{ ov::PartialShape::dynamic(3), data_types::f16,format::bfyx };
     auto input2_dyn_layout = layout{ ov::PartialShape::dynamic(3), data_types::f16,format::bfyx };
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/mvn_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/mvn_gpu_test.cpp
index 4b7a74ed094251..8ff2439965a4eb 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/mvn_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/mvn_gpu_test.cpp
@@ -307,7 +307,7 @@ TEST(mvn_gpu_test, dynamic_across_channels_inside_sqrt_bfyx_normalize_variance_f
     topology.add(mvn("mvn", input_info("input"), true, 1e-10f, true, {1, 2, 3}));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     network network(engine, topology, config);
     network.set_input_data("input", input);
 
@@ -558,7 +558,7 @@ TEST(mvn_gpu_test, dynamic_within_channels_inside_sqrt_bfyx_normalize_variance_f
     topology.add(mvn("mvn", input_info("input"), true, 1e-10f, true, {2, 3}));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     network network(engine, topology, config);
     network.set_input_data("input", input);
 
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/non_max_suppression_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/non_max_suppression_test.cpp
index 3d7647ee2f53f1..632238229d189c 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/non_max_suppression_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/non_max_suppression_test.cpp
@@ -6,6 +6,7 @@
 #include <intel_gpu/primitives/mutable_data.hpp>
 #include <intel_gpu/primitives/non_max_suppression.hpp>
 
+#include "intel_gpu/primitives/primitive.hpp"
 #include "test_utils.h"
 
 using namespace cldnn;
@@ -124,7 +125,7 @@ struct non_max_suppression_basic : public testing::Test {
         topo.add(input_layout("scores", this->scores_layout));
         topo.add(reorder("reformat_boxes", input_info("boxes"), this->layout_format, this->data_type));
         topo.add(reorder("reformat_scores", input_info("scores"), this->layout_format, this->data_type));
-        topo.add(non_max_suppression("nms", input_info("reformat_boxes"), input_info("reformat_scores"), 6, false, true));
+        topo.add(non_max_suppression("nms", { input_info("reformat_boxes"), input_info("reformat_scores") }, 6, false, true));
         topo.add(reorder("plane_nms", input_info("nms"), format::bfyx, cldnn::data_types::i32));
 
         ExecutionConfig config = get_test_default_config(engine);
@@ -180,12 +181,10 @@ struct non_max_suppression_basic : public testing::Test {
         topo.add(reorder("reformat_boxes", input_info("boxes"), this->layout_format, this->data_type),
                 reorder("reformat_scores", input_info("scores"), this->layout_format, this->data_type),
                 non_max_suppression("nms",
-                                    input_info("reformat_boxes"),
-                                    input_info("reformat_scores"),
+                                    { input_info("reformat_boxes"), input_info("reformat_scores"), input_info("num_per_class") },
                                     this->batch_size * this->classes_num * 1,
                                     false,
-                                    true,
-                                    "num_per_class"));
+                                    true));
         topo.add(reorder("plane_nms", input_info("nms"), format::bfyx, cldnn::data_types::i32));
 
         ExecutionConfig config = get_test_default_config(engine);
@@ -236,28 +235,16 @@ struct non_max_suppression_basic : public testing::Test {
         topo.add(input_layout("scores", this->scores_layout));
         topo.add(data("num_per_class", num_per_class_mem));
 
-        memory::ptr selected_scores_mem = this->get_selected_scores_mem(engine);
-        memory::ptr valid_outputs_mem = this->get_valid_outputs_mem(engine);
-
-        topo.add(mutable_data("selected_scores", selected_scores_mem));
-        topo.add(mutable_data("valid_outputs", valid_outputs_mem));
-
         topo.add(reorder("reformat_boxes", input_info("boxes"), this->layout_format, this->data_type),
                 reorder("reformat_scores", input_info("scores"), this->layout_format, this->data_type),
                 non_max_suppression("nms",
-                                    input_info("reformat_boxes"),
-                                    input_info("reformat_scores"),
+                                    { input_info("reformat_boxes"), input_info("reformat_scores"), input_info("num_per_class") },
                                     this->batch_size * this->classes_num * 1,
                                     false,
                                     true,
-                                    "num_per_class",
-                                    cldnn::primitive_id(),
-                                    cldnn::primitive_id(),
-                                    cldnn::primitive_id(),
-                                    "selected_scores",
-                                    "valid_outputs"));
+                                    3));
         topo.add(reorder("plane_nms", input_info("nms"), format::bfyx, cldnn::data_types::i32));
-        topo.add(reorder("plane_scores", input_info("selected_scores"), format::bfyx, this->data_type));
+        topo.add(reorder("plane_scores", input_info("nms", 1), format::bfyx, this->data_type));
 
         ExecutionConfig config = get_test_default_config(engine);
         config.set_property(ov::intel_gpu::optimize_data(true));
@@ -320,8 +307,6 @@ struct non_max_suppression_basic : public testing::Test {
         second_output_topology.add(reorder("plane_scores", input_info("selected_scores"), format::bfyx, this->data_type));
         second_output_topology.add(reorder("plane_num", input_info("num_outputs"), format::bfyx, cldnn::data_types::i32));
         network second_output_net{engine, second_output_topology, get_test_default_config(engine)};
-        second_output_net.set_input_data("selected_scores", selected_scores_mem);
-        second_output_net.set_input_data("num_outputs", valid_outputs_mem);
         auto second_output_result = second_output_net.execute();
         auto plane_scores_mem = second_output_result.at("plane_scores").get_memory();
         if (this->data_type == data_types::f32) {
@@ -357,17 +342,10 @@ struct non_max_suppression_basic : public testing::Test {
         topo.add(reorder("reformat_boxes", input_info("boxes"), this->layout_format, this->data_type),
                 reorder("reformat_scores", input_info("scores"), this->layout_format, this->data_type));
         auto nms = non_max_suppression("nms",
-                                    input_info("reformat_boxes"),
-                                    input_info("reformat_scores"),
+                                     { input_info("reformat_boxes"), input_info("reformat_scores"), input_info("num_per_class") },
                                     this->batch_size * this->classes_num * 1,
                                     false,
                                     true,
-                                    "num_per_class",
-                                    cldnn::primitive_id(),
-                                    cldnn::primitive_id(),
-                                    cldnn::primitive_id(),
-                                    cldnn::primitive_id(),
-                                    cldnn::primitive_id(),
                                     3);
         auto output_data_type = this->data_type;
         nms.output_data_types = {optional_data_type{}, optional_data_type{output_data_type}, optional_data_type{}};
@@ -379,7 +357,7 @@ struct non_max_suppression_basic : public testing::Test {
 
         ExecutionConfig config = get_test_default_config(engine);
         config.set_property(ov::intel_gpu::optimize_data(true));
-        config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
         cldnn::network::ptr net = get_network(engine, topo, config, get_test_stream_ptr(), is_caching_test);
 
@@ -478,13 +456,10 @@ struct non_max_suppression_basic : public testing::Test {
         topo.add(reorder("reformat_boxes", input_info("boxes"), this->layout_format, this->data_type),
                 reorder("reformat_scores", input_info("scores"), this->layout_format, this->data_type),
                 non_max_suppression("nms",
-                                    input_info("reformat_boxes"),
-                                    input_info("reformat_scores"),
+                                     { input_info("reformat_boxes"), input_info("reformat_scores"), input_info("num_per_class"), input_info("iou_threshold") },
                                     this->batch_size * this->classes_num * this->boxes_num,
                                     false,
-                                    true,
-                                    "num_per_class",
-                                    "iou_threshold"));
+                                    true));
         topo.add(reorder("plane_nms", input_info("nms"), format::bfyx, cldnn::data_types::i32));
 
         ExecutionConfig config = get_test_default_config(engine);
@@ -534,14 +509,10 @@ struct non_max_suppression_basic : public testing::Test {
         topo.add(reorder("reformat_boxes", input_info("boxes"), this->layout_format, this->data_type),
                 reorder("reformat_scores", input_info("scores"), this->layout_format, this->data_type),
                 non_max_suppression("nms",
-                                    input_info("reformat_boxes"),
-                                    input_info("reformat_scores"),
+                                    { input_info("reformat_boxes"), input_info("reformat_scores"), input_info("num_per_class"), input_info("iou_threshold"), input_info("score_threshold") },
                                     this->batch_size * this->classes_num * this->boxes_num,
                                     false,
-                                    true,
-                                    "num_per_class",
-                                    "iou_threshold",
-                                    "score_threshold"));
+                                    true));
         topo.add(reorder("plane_nms", input_info("nms"), format::bfyx, cldnn::data_types::i32));
 
         ExecutionConfig config = get_test_default_config(engine);
@@ -595,19 +566,19 @@ struct non_max_suppression_basic : public testing::Test {
         topo.add(reorder("reformat_scores", input_info("scores"), this->layout_format, this->data_type));
 
         auto nms = non_max_suppression("nms",
-                                    input_info("reformat_boxes"),
-                                    input_info("reformat_scores"),
+                                    { input_info("reformat_boxes"),
+                                      input_info("reformat_scores"),
+                                      input_info("num_per_class"),
+                                      input_info("iou_threshold"),
+                                      input_info("score_threshold") },
                                     this->batch_size * this->classes_num * this->boxes_num,
                                     false,
                                     true,
-                                    "num_per_class",
-                                    "iou_threshold",
-                                    "score_threshold",
-                                    "", "", "", 3);
+                                    3);
         auto output_data_type = this->data_type;
         nms.output_data_types = {optional_data_type{}, optional_data_type{output_data_type}, optional_data_type{}};
         nms.output_paddings = {padding(), padding(), padding()};
-        
+
         topo.add(nms);
         topo.add(non_max_suppression_gather("nms_gather",
                                             {input_info("nms", 0),
@@ -620,7 +591,6 @@ struct non_max_suppression_basic : public testing::Test {
 
         ExecutionConfig config = get_test_default_config(engine);
         config.set_property(ov::intel_gpu::optimize_data(true));
-        config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
 
         cldnn::network::ptr net = get_network(engine, topo, config, get_test_stream_ptr(), is_caching_test);
 
@@ -713,15 +683,15 @@ struct non_max_suppression_basic : public testing::Test {
         topo.add(reorder("reformat_boxes", input_info("boxes"), this->layout_format, this->data_type),
                 reorder("reformat_scores", input_info("scores"), this->layout_format, this->data_type),
                 non_max_suppression("nms",
-                                    input_info("reformat_boxes"),
-                                    input_info("reformat_scores"),
+                                    { input_info("reformat_boxes"),
+                                      input_info("reformat_scores"),
+                                      input_info("num_per_class"),
+                                      input_info("iou_threshold"),
+                                      input_info("score_threshold"),
+                                      input_info("soft_nms_sigma"), },
                                     this->batch_size * this->classes_num * this->boxes_num,
                                     false,
-                                    true,
-                                    "num_per_class",
-                                    "iou_threshold",
-                                    "score_threshold",
-                                    "soft_nms_sigma"));
+                                    true));
         topo.add(reorder("plane_nms", input_info("nms"), format::bfyx, cldnn::data_types::i32));
 
         ExecutionConfig config = get_test_default_config(engine);
@@ -898,33 +868,24 @@ struct nms_rotated_test : public ::testing::TestWithParam<NmsRotatedParams<T, T_
         const auto score_threshold_mem = engine.allocate_memory(layout(data_types::f32, format::bfyx, tensor(batch(1))));
         tests::set_values(score_threshold_mem, {param.score_threshold});
 
-        const auto selected_scores_mem = engine.allocate_memory(selected_scores_layout);
-        const auto valid_outputs_mem = engine.allocate_memory(valid_outputs_layout);
-
         topology topo;
         topo.add(input_layout("boxes", boxes_layout));
         topo.add(input_layout("scores", scores_layout));
         topo.add(data("num_per_class", num_per_class_mem));
         topo.add(data("iou_threshold", iou_threshold_mem));
         topo.add(data("score_threshold", score_threshold_mem));
-        topo.add(mutable_data("selected_scores", selected_scores_mem));
-        topo.add(mutable_data("valid_outputs", valid_outputs_mem));
+
         auto nms = non_max_suppression("nms",
-                                       input_info("boxes"),
-                                       input_info("scores"),
+                                       { input_info("boxes"), input_info("scores"), input_info("num_per_class"), input_info("iou_threshold"), input_info("score_threshold") },
                                        selected_indices_num,
                                        false,
-                                       param.sort_result_descending,
-                                       "num_per_class",
-                                       "iou_threshold",
-                                       "score_threshold",
-                                       "",
-                                       "selected_scores",
-                                       "valid_outputs");
+                                       param.sort_result_descending);
         nms.rotation = param.clockwise ? non_max_suppression::Rotation::CLOCKWISE :
                        non_max_suppression::Rotation::COUNTERCLOCKWISE;
 
         topo.add(nms);
+        topo.add(reorder("selected_scores", input_info("nms", 1), format::bfyx, ov::element::f32));
+        topo.add(reorder("valid_outputs",  input_info("nms", 2), format::bfyx, ov::element::f32));
 
         ExecutionConfig config = get_test_default_config(engine);
         config.set_property(ov::intel_gpu::optimize_data(true));
@@ -934,6 +895,8 @@ struct nms_rotated_test : public ::testing::TestWithParam<NmsRotatedParams<T, T_
         net->set_input_data("scores", scores_mem);
         const auto result = net->execute();
         const auto indices_mem = result.at("nms").get_memory();
+        const auto selected_scores_mem = result.at("selected_scores").get_memory();
+        const auto valid_outputs_mem = result.at("valid_outputs").get_memory();
         const cldnn::mem_lock<T_IND> indices_ptr(indices_mem, get_test_stream());
         const cldnn::mem_lock<T> selected_scores_ptr(selected_scores_mem, get_test_stream());
         const cldnn::mem_lock<int> valid_outputs_ptr(valid_outputs_mem, get_test_stream());
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/non_zero_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/non_zero_gpu_test.cpp
index 37a1ba8b982414..670a283e556491 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/non_zero_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/non_zero_gpu_test.cpp
@@ -132,7 +132,7 @@ TEST(test_count_non_zero, dynamic_2d_f32_bfyx) {
     topology.add(count_nonzero("count_nonzero", input_info("InputData")));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
     std::vector<size_t> input_shapes = {171, 531, 168, 169, 174, 172, 168, 167, 1169, 16, 677};
     dyn_nonzero_count_net _test;
@@ -295,7 +295,7 @@ TEST(non_zero_gpu, dynamic) {
 
     ExecutionConfig config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::optimize_data(true));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     network network(engine, topology, config);
     network.set_input_data("InputData", input);
 
@@ -509,7 +509,7 @@ TEST(non_zero_gpu, const_input) {
 
     ExecutionConfig config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::optimize_data(true));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     network network(engine, topology, config);
 
     auto count_nonzero_inst = network.get_primitive("count_nonzero");
@@ -547,7 +547,7 @@ TEST(non_zero_gpu, empty_input) {
 
     ExecutionConfig config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::optimize_data(true));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     network net(engine, topology, config);
 
     net.set_input_data("input", input_data_mem);
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/one_hot_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/one_hot_gpu_test.cpp
index ecb92fd90ff24d..d6f46cb2acae35 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/one_hot_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/one_hot_gpu_test.cpp
@@ -84,7 +84,7 @@ void generic_one_hot_test_int(cldnn::format test_input_fmt, int input_b, int inp
 
     topology topology;
     topology.add(input_layout("input", input->get_layout()));
-    topology.add(one_hot("output", input_info("input"), shape, one_hot_axis, one_hot_limit));
+    topology.add(one_hot("output", input_info("input"), ov::element::from<T>(), one_hot_axis, one_hot_limit));
 
     cldnn::network::ptr network = get_network(engine, topology, get_test_default_config(engine), get_test_stream_ptr(), is_caching_test);
     network->set_input_data("input", input);
@@ -181,7 +181,7 @@ TEST(one_hot_gpu_i32, bfzyx_ax4) {
     auto input = engine.allocate_memory({ data_types::i32, format::bfyx, input_tensor });
     topology topology;
     topology.add(input_layout("input", input->get_layout()));
-    topology.add(one_hot("output", input_info("input"), shape, one_hot_axis, 5));
+    topology.add(one_hot("output", input_info("input"), data_types::i32, one_hot_axis, 5));
 
     set_values(input, input_rnd_vec);
 
@@ -240,7 +240,7 @@ TEST(one_hot_gpu_i64, bfzyx_ax4) {
     auto input = engine.allocate_memory({ data_types::i64, format::bfyx, input_tensor });
     topology topology;
     topology.add(input_layout("input", input->get_layout()));
-    topology.add(one_hot("output", input_info("input"), shape, one_hot_axis, 5));
+    topology.add(one_hot("output", input_info("input"), data_types::i64, one_hot_axis, 5));
 
     set_values(input, input_rnd_vec);
 
@@ -289,9 +289,6 @@ TEST(one_hot_gpu_i32_to_f32, bfyx_ax4) {
     int in_x = 1;
     tensor shape(in_b, in_f, 5, in_x, in_y);
     uint16_t one_hot_axis = 4;
-    std::vector<tensor::value_type> output_dims = { shape.batch[0], shape.feature[0],
-                                                    shape.spatial[2], shape.spatial[1], shape.spatial[0] };
-
     VF<int32_t> input_rnd_vec = {0, 1};
 
     auto& engine = get_test_engine();
@@ -299,7 +296,7 @@ TEST(one_hot_gpu_i32_to_f32, bfyx_ax4) {
     auto input = engine.allocate_memory({ data_types::i32, format::bfyx, input_tensor });
     topology topology;
     topology.add(input_layout("input", input->get_layout()));
-    topology.add(one_hot("output", input_info("input"), shape, data_types::f32, one_hot_axis, 5));
+    topology.add(one_hot("output", input_info("input"), data_types::f32, one_hot_axis, 5));
 
     set_values(input, input_rnd_vec);
 
@@ -342,9 +339,6 @@ TEST(one_hot_gpu_i64_to_f32, bfyx_ax4) {
     int in_x = 1;
     tensor shape(in_b, in_f, 5, in_x, in_y);
     uint16_t one_hot_axis = 4;
-    std::vector<tensor::value_type> output_dims = { shape.batch[0], shape.feature[0],
-                                                    shape.spatial[2], shape.spatial[1], shape.spatial[0] };
-
     VF<int64_t> input_rnd_vec = {0, 1};
 
     auto& engine = get_test_engine();
@@ -352,7 +346,7 @@ TEST(one_hot_gpu_i64_to_f32, bfyx_ax4) {
     auto input = engine.allocate_memory({ data_types::i64, format::bfyx, input_tensor });
     topology topology;
     topology.add(input_layout("input", input->get_layout()));
-    topology.add(one_hot("output", input_info("input"), shape, data_types::f32, one_hot_axis, 5));
+    topology.add(one_hot("output", input_info("input"), data_types::f32, one_hot_axis, 5));
 
     set_values(input, input_rnd_vec);
 
@@ -393,9 +387,6 @@ TEST(one_hot_gpu_i32, bfzyx_ax0) {
     int in_x = 2;
     tensor shape(3, in_b, in_x, in_y, in_f);
     uint16_t one_hot_axis = 0;
-    std::vector<tensor::value_type> output_dims = { shape.batch[0], shape.feature[0],
-                                                    shape.spatial[2], shape.spatial[1], shape.spatial[0] };
-
     VF<int32_t> input_rnd_vec = {0, 1};
 
     auto& engine = get_test_engine();
@@ -403,7 +394,7 @@ TEST(one_hot_gpu_i32, bfzyx_ax0) {
     auto input = engine.allocate_memory({ data_types::i32, format::bfyx, input_tensor });
     topology topology;
     topology.add(input_layout("input", input->get_layout()));
-    topology.add(one_hot("output", input_info("input"), shape, one_hot_axis, 3));
+    topology.add(one_hot("output", input_info("input"), data_types::i32, one_hot_axis, 3));
 
     set_values(input, input_rnd_vec);
 
@@ -448,8 +439,6 @@ TEST(one_hot_gpu_i64, bfzyx_ax0) {
     int in_x = 2;
     tensor shape(3, in_b, in_x, in_y, in_f);
     uint16_t one_hot_axis = 0;
-    std::vector<tensor::value_type> output_dims = { shape.batch[0], shape.feature[0],
-                                                    shape.spatial[2], shape.spatial[1], shape.spatial[0] };
 
     VF<int64_t> input_rnd_vec = {0, 1};
 
@@ -458,7 +447,7 @@ TEST(one_hot_gpu_i64, bfzyx_ax0) {
     auto input = engine.allocate_memory({ data_types::i64, format::bfyx, input_tensor });
     topology topology;
     topology.add(input_layout("input", input->get_layout()));
-    topology.add(one_hot("output", input_info("input"), shape, one_hot_axis, 3));
+    topology.add(one_hot("output", input_info("input"), data_types::i64, one_hot_axis, 3));
 
     set_values(input, input_rnd_vec);
 
@@ -503,8 +492,6 @@ TEST(one_hot_gpu_i32, bfzyx_ax1) {
     int in_x = 2;
     tensor shape(in_b, 3, in_x, in_y, in_f);
     uint16_t one_hot_axis = 1;
-    std::vector<tensor::value_type> output_dims = { shape.batch[0], shape.feature[0],
-                                                    shape.spatial[2], shape.spatial[1], shape.spatial[0] };
 
     VF<int32_t> input_rnd_vec = {0, 1};
 
@@ -513,7 +500,7 @@ TEST(one_hot_gpu_i32, bfzyx_ax1) {
     auto input = engine.allocate_memory({ data_types::i32, format::bfyx, input_tensor });
     topology topology;
     topology.add(input_layout("input", input->get_layout()));
-    topology.add(one_hot("output", input_info("input"), shape, one_hot_axis, 3));
+    topology.add(one_hot("output", input_info("input"), data_types::i32, one_hot_axis, 3));
 
     set_values(input, input_rnd_vec);
 
@@ -558,8 +545,6 @@ TEST(one_hot_gpu_i64, bfzyx_ax1) {
     int in_x = 2;
     tensor shape(in_b, 3, in_x, in_y, in_f);
     uint16_t one_hot_axis = 1;
-    std::vector<tensor::value_type> output_dims = { shape.batch[0], shape.feature[0],
-                                                    shape.spatial[2], shape.spatial[1], shape.spatial[0] };
 
     VF<int64_t> input_rnd_vec = {0, 1};
 
@@ -568,7 +553,7 @@ TEST(one_hot_gpu_i64, bfzyx_ax1) {
     auto input = engine.allocate_memory({ data_types::i64, format::bfyx, input_tensor });
     topology topology;
     topology.add(input_layout("input", input->get_layout()));
-    topology.add(one_hot("output", input_info("input"), shape, one_hot_axis, 3));
+    topology.add(one_hot("output", input_info("input"), data_types::i64, one_hot_axis, 3));
 
     set_values(input, input_rnd_vec);
 
@@ -613,8 +598,6 @@ TEST(one_hot_gpu_i32, bfzyx_ax2) {
     int in_x = 2;
     tensor shape(in_b, in_f, in_x, in_y, 3);
     uint16_t one_hot_axis = 2;
-    std::vector<tensor::value_type> output_dims = { shape.batch[0], shape.feature[0],
-                                                    shape.spatial[2], shape.spatial[1], shape.spatial[0] };
 
     VF<int32_t> input_rnd_vec = {0, 1};
 
@@ -623,7 +606,7 @@ TEST(one_hot_gpu_i32, bfzyx_ax2) {
     auto input = engine.allocate_memory({ data_types::i32, format::bfyx, input_tensor });
     topology topology;
     topology.add(input_layout("input", input->get_layout()));
-    topology.add(one_hot("output", input_info("input"), shape, one_hot_axis, 3));
+    topology.add(one_hot("output", input_info("input"), data_types::i32, one_hot_axis, 3));
 
     set_values(input, input_rnd_vec);
 
@@ -668,8 +651,6 @@ TEST(one_hot_gpu_i64, bfzyx_ax2) {
     int in_x = 2;
     tensor shape(in_b, in_f, in_x, in_y, 3);
     uint16_t one_hot_axis = 2;
-    std::vector<tensor::value_type> output_dims = { shape.batch[0], shape.feature[0],
-                                                    shape.spatial[2], shape.spatial[1], shape.spatial[0] };
 
     VF<int64_t> input_rnd_vec = {0, 1};
 
@@ -678,7 +659,7 @@ TEST(one_hot_gpu_i64, bfzyx_ax2) {
     auto input = engine.allocate_memory({ data_types::i64, format::bfyx, input_tensor });
     topology topology;
     topology.add(input_layout("input", input->get_layout()));
-    topology.add(one_hot("output", input_info("input"), shape, one_hot_axis, 3));
+    topology.add(one_hot("output", input_info("input"), data_types::i64, one_hot_axis, 3));
 
     set_values(input, input_rnd_vec);
 
@@ -723,8 +704,6 @@ TEST(one_hot_gpu_i32, bfzyx_ax3) {
     int in_x = 2;
     tensor shape(in_b, in_f, in_x, 3, in_y);
     uint16_t one_hot_axis = 3;
-    std::vector<tensor::value_type> output_dims = { shape.batch[0], shape.feature[0],
-                                                    shape.spatial[2], shape.spatial[1], shape.spatial[0] };
 
     VF<int32_t> input_rnd_vec = {0, 1};
 
@@ -733,7 +712,7 @@ TEST(one_hot_gpu_i32, bfzyx_ax3) {
     auto input = engine.allocate_memory({ data_types::i32, format::bfyx, input_tensor });
     topology topology;
     topology.add(input_layout("input", input->get_layout()));
-    topology.add(one_hot("output", input_info("input"), shape, one_hot_axis, 3));
+    topology.add(one_hot("output", input_info("input"), data_types::i32, one_hot_axis, 3));
 
     set_values(input, input_rnd_vec);
 
@@ -778,8 +757,6 @@ TEST(one_hot_gpu_i64, bfzyx_ax3) {
     int in_x = 2;
     tensor shape(in_b, in_f, in_x, 3, in_y);
     uint16_t one_hot_axis = 3;
-    std::vector<tensor::value_type> output_dims = { shape.batch[0], shape.feature[0],
-                                                    shape.spatial[2], shape.spatial[1], shape.spatial[0] };
 
     VF<int64_t> input_rnd_vec = {0, 1};
 
@@ -788,7 +765,7 @@ TEST(one_hot_gpu_i64, bfzyx_ax3) {
     auto input = engine.allocate_memory({ data_types::i64, format::bfyx, input_tensor });
     topology topology;
     topology.add(input_layout("input", input->get_layout()));
-    topology.add(one_hot("output", input_info("input"), shape, one_hot_axis, 3));
+    topology.add(one_hot("output", input_info("input"), data_types::i64, one_hot_axis, 3));
 
     set_values(input, input_rnd_vec);
 
@@ -831,7 +808,7 @@ TEST(one_hot_error, basic_error_wrong_axis) {
 
     topology topology;
     topology.add(input_layout("input", input->get_layout()));
-    topology.add(one_hot("output", input_info("input"), tensor(1, 1, 1, 50), 5, 2));
+    topology.add(one_hot("output", input_info("input"),data_types::i32, 5, 2));
 
     std::string msg_to_find = "Incorrect parameters configuration: one_hot_axis should be less or equal to 4.";
     EXPECT_ANY_THROW(check_exception_massage(engine, topology, msg_to_find));
@@ -843,7 +820,7 @@ TEST(one_hot_error, basic_error_bad_shape) {
 
     topology topology;
     topology.add(input_layout("input", input->get_layout()));
-    topology.add(one_hot("output", input_info("input"), tensor(1, 5, 1, 50), 2, 2));
+    topology.add(one_hot("output", input_info("input"), data_types::i32, 2, 2));
 
     std::string msg_to_find = "Incorrect parameters configuration: shape does not fit input size.";
     EXPECT_ANY_THROW(check_exception_massage(engine, topology, msg_to_find));
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/permute_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/permute_gpu_test.cpp
index 9688ebe227071f..5e61d84606fae5 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/permute_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/permute_gpu_test.cpp
@@ -1170,7 +1170,7 @@ TEST(permute_gpu_f32_tile_8x8_4x4_dynamic, normal_bfyx_0_2_3_1) {
         permute("permute", input_info("input"), { 0, 2, 3, 1 }));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     network network(engine, topology, config);
     network.set_input_data("input", input);
 
@@ -1233,7 +1233,7 @@ TEST(permute_gpu_f32_tile_8x8_4x4_dynamic, f_remainder_bfyx_0_2_3_1) {
         permute("permute", input_info("input"), { 0, 2, 3, 1 }));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     network network(engine, topology, config);
     network.set_input_data("input", input);
 
@@ -1296,7 +1296,7 @@ TEST(permute_gpu_f32_tile_8x8_4x4_dynamic, x_remainder_bfyx_0_2_3_1) {
         permute("permute", input_info("input"), { 0, 2, 3, 1 }));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     network network(engine, topology, config);
     network.set_input_data("input", input);
 
@@ -1353,7 +1353,7 @@ TEST(permute_gpu_f32_tile_8x8_4x4_dynamic, xf_remainder_bfyx_0_2_3_1) {
         permute("permute", input_info("input"), { 0, 2, 3, 1 }));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     network network(engine, topology, config);
     network.set_input_data("input", input);
 
@@ -2141,7 +2141,7 @@ TEST(permute_gpu_f32_dynamic, bfyx_0_2_3_1) {
         permute("permute", input_info("input"), { 0, 2, 3, 1 }));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     network network(engine, topology, config);
     network.set_input_data("input", input);
 
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/quantize_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/quantize_gpu_test.cpp
index 42dbfa10903f6b..da396e83d01040 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/quantize_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/quantize_gpu_test.cpp
@@ -723,7 +723,7 @@ TEST(quantize_gpu, dynamic) {
     );
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     config.set_property(ov::intel_gpu::optimize_data(true));
     network network(engine, topology, config);
     network.set_input_data("input", input);
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/range_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/range_gpu_test.cpp
index b163244894c492..da15dcf23fe409 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/range_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/range_gpu_test.cpp
@@ -37,7 +37,7 @@ struct RangeArgs {
     RangeArg step { dt, "step" };
     explicit RangeArgs(data_types dt) : dt { dt } {}
 
-    memory::ptr run(int outLen, bool use_new_shape_infer) const {
+    memory::ptr run(int outLen) const {
         topology topology;
         start.addTo(topology);
         stop.addTo(topology);
@@ -46,7 +46,6 @@ struct RangeArgs {
 
         auto& engine = get_test_engine();
         ExecutionConfig config = get_test_default_config(engine);
-        config.set_property(ov::intel_gpu::allow_new_shape_infer(use_new_shape_infer));
 
         network network { engine, topology, config };
 
@@ -64,13 +63,11 @@ struct range_test_params {
     double start;
     double stop;
     double step;
-    bool use_new_shape_infer;
 };
 
 std::ostream& operator<<(std::ostream& ost, const range_test_params& params) {
     ost << ov::element::Type(params.d_types) << ",";
     ost << "{start:" << params.start << ",stop:" << params.stop << ",step:" << params.step << "},";
-    ost << " use_new_shape_infer(" << (params.use_new_shape_infer?"True":"False") << ")";
     return ost;
 }
 
@@ -89,7 +86,7 @@ void doSmokeRange(range_test_params& params) {
 
     T outLen = (stop_val - start_val) / step_val;
 
-    auto output = args.run(outLen, params.use_new_shape_infer);
+    auto output = args.run(outLen);
     mem_lock<T> output_ptr { output, tests::get_test_stream() };
 
     for (std::size_t i = 0; i < static_cast<size_t>(outLen); ++i) {
@@ -111,7 +108,7 @@ void doSmokeRange_fp16(range_test_params& params) {
 
     auto outLen = (stop_val - start_val) / step_val;
 
-    auto output = args.run(outLen, params.use_new_shape_infer);
+    auto output = args.run(outLen);
     mem_lock<uint16_t> output_ptr { output, tests::get_test_stream() };
 
     for (std::size_t i = 0; i < static_cast<size_t>(outLen); ++i) {
@@ -156,11 +153,8 @@ struct range_test_param_generator : std::vector<range_test_params> {
     }
 
     range_test_param_generator& simple_params(std::vector<data_types>& data_types_list, double start, double stop, double step) {
-        std::vector<bool> flags_use_new_si = {true, false};
-        for (auto use_new_si : flags_use_new_si) {
-            for (auto type : data_types_list) {
-                push_back(range_test_params{ type, start, stop, step, use_new_si});
-            }
+        for (auto type : data_types_list) {
+            push_back(range_test_params{ type, start, stop, step});
         }
         return *this;
     }
@@ -210,7 +204,7 @@ TEST(range_gpu_test, range_with_select) {
     set_values<int32_t>(input2, {step_val});
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
     network network { tests::get_test_engine(), topology, config };
 
@@ -246,7 +240,7 @@ TEST(range_gpu_test, constant_folding) {
     topology.add(range{ "range", { input_info("input0"), input_info("input1"), input_info("input2") }, data_types::i32});
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
     network network(engine, topology, config);
 
@@ -284,7 +278,7 @@ TEST(range_gpu_test, dynamic_all) {
     topology.add(range{ "range", { input_info("input0"), input_info("input1"), input_info("input2") }, data_types::i32});
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
     network network(engine, topology, config);
     network.set_input_data("input0", input0);
@@ -330,7 +324,7 @@ TEST(range_gpu_test, dynamic_stop) {
     topology.add(range{ "range", { input_info("input0"), input_info("input1"), input_info("input2") }, data_types::i32});
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
     network network(engine, topology, config);
     network.set_input_data("input1", input1);
@@ -374,7 +368,7 @@ TEST(range_cpu_impl_test, dynamic_all) {
     topology.add(range{ "range", { input_info("input0"), input_info("input1"), input_info("input2") }, data_types::i32});
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     config.set_property(ov::intel_gpu::force_implementations(ov::intel_gpu::ImplForcingMap{ {"range", {format::bfyx, "", impl_types::cpu}} }));
 
     network network(engine, topology, config);
@@ -421,7 +415,7 @@ TEST(range_cpu_impl_test, dynamic_stop) {
     topology.add(range{ "range", { input_info("input0"), input_info("input1"), input_info("input2") }, data_types::i32});
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     config.set_property(ov::intel_gpu::force_implementations(ov::intel_gpu::ImplForcingMap{ {"range", {format::bfyx, "", impl_types::cpu}} }));
 
     network network(engine, topology, config);
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/reduce_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/reduce_gpu_test.cpp
index fde0c0e1e31a16..73023010affa54 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/reduce_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/reduce_gpu_test.cpp
@@ -1697,7 +1697,7 @@ TEST(reduce_gpu, dynamic) {
     topology.add(reduce("reduce", input_info("input"), reduce_mode::prod, {1, 2}, 1));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     network network(engine, topology, config);
     network.set_input_data("input", input);
 
@@ -1754,7 +1754,7 @@ TEST(reduce_gpu, b_fs_yx_fsv16_min_dynamic) {
     topology.add(reduce("reduce", input_info("reorder"), reduce_mode::min, {1}, 0));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
     network network(engine, topology, config);
 
@@ -1809,7 +1809,7 @@ TEST(reduce_gpu, b_fs_yx_fsv16_max_dynamic) {
     topology.add(reduce("reduce", input_info("reorder"), reduce_mode::max, {1}, 0));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
     network network(engine, topology, config);
 
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/reorder_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/reorder_gpu_test.cpp
index 257812352e8021..1400229f67831e 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/reorder_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/reorder_gpu_test.cpp
@@ -1358,7 +1358,7 @@ TEST(reorder_gpu_f32, dynamic_bfyx_to_bfyx_dynamic_padding_x) {
 
     ExecutionConfig config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::optimize_data(false));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     network network(engine, topology, config);
     auto input_mem = engine.allocate_memory({ov::PartialShape(in_shape),
                                              data_types::f16,
@@ -1420,7 +1420,7 @@ TEST(reorder_gpu_f32, dynamic_bfyx_to_bfyx_dynamic_padding_f) {
 
     ExecutionConfig config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::optimize_data(false));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     network network(engine, topology, config);
     auto input_mem = engine.allocate_memory({ov::PartialShape(in_shape),
                                              data_types::f16,
@@ -1485,7 +1485,7 @@ TEST(reorder_gpu_f32, dynamic_bfyx_to_bfzyx) {
 
     ExecutionConfig config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::optimize_data(true));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     network network(engine, topology, config);
 
     auto inst = network.get_primitive("reorder");
@@ -3465,7 +3465,6 @@ TEST(reorder_gpu_fp32, test_needs_completion_events) {
     ExecutionConfig config = get_test_default_config(engine);
     auto force_impl = ov::intel_gpu::ImplementationDesc{ format::bfyx, "", impl_types::cpu };
     config.set_property(ov::intel_gpu::force_implementations(ov::intel_gpu::ImplForcingMap{ {primitive_id("reorder2"), force_impl} }));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
     network network(engine, topology, config);
 
     network.set_input_data("input1", input1);
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/resample_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/resample_gpu_test.cpp
index 181beb1f5309dc..defa37f1a2680c 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/resample_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/resample_gpu_test.cpp
@@ -740,7 +740,7 @@ TEST(resample_gpu, interpolate_in2x2x3x2_nearest1) {
 
     auto& engine = get_test_engine();
     ov::intel_gpu::ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
     int b = 2;
     int f = 2;
@@ -830,7 +830,7 @@ TEST(resample_gpu, interpolate_in2x2x3x2_nearest2) {
 
     auto& engine = get_test_engine();
     ov::intel_gpu::ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
     int b = 2;
     int f = 2;
@@ -920,7 +920,7 @@ TEST(resample_gpu, interpolate_in2x2x3x2_nearest3) {
 
     auto& engine = get_test_engine();
     ov::intel_gpu::ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
     int b = 2;
     int f = 2;
@@ -1010,7 +1010,7 @@ TEST(resample_gpu, interpolate_in2x2x3x2_nearest4) {
 
     auto& engine = get_test_engine();
     ov::intel_gpu::ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
     int b = 2;
     int f = 2;
@@ -1100,7 +1100,7 @@ TEST(resample_gpu, interpolate_in2x2x3x2_nearest5) {
 
     auto& engine = get_test_engine();
     ov::intel_gpu::ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
     int b = 2;
     int f = 2;
@@ -1190,7 +1190,7 @@ TEST(resample_gpu, interpolate_in2x2x3x2_coord_transform_mode1) {
 
     auto& engine = get_test_engine();
     ov::intel_gpu::ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
     int b = 2;
     int f = 2;
@@ -1260,7 +1260,7 @@ TEST(resample_gpu, interpolate_in2x2x3x2_coord_transform_mode2) {
 
     auto& engine = get_test_engine();
     ov::intel_gpu::ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
     int b = 2;
     int f = 2;
@@ -1324,7 +1324,7 @@ TEST(resample_gpu, interpolate_in2x2x3x2_coord_transform_mode3) {
 
     auto& engine = get_test_engine();
     ov::intel_gpu::ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
     int b = 2;
     int f = 2;
@@ -1394,7 +1394,7 @@ TEST(resample_gpu, interpolate_in2x2x3x2_coord_transform_mode4) {
 
     auto& engine = get_test_engine();
     ov::intel_gpu::ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
     int b = 2;
     int f = 2;
@@ -1464,7 +1464,7 @@ TEST(resample_gpu, interpolate_in2x2x3x2_coord_transform_mode5) {
 
     auto& engine = get_test_engine();
     ov::intel_gpu::ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
     int b = 2;
     int f = 2;
@@ -1534,7 +1534,7 @@ TEST(resample_gpu, interpolate_in2x2x3x2_cubic) {
 
     auto& engine = get_test_engine();
     ov::intel_gpu::ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
     int b = 2;
     int f = 2;
@@ -1602,7 +1602,7 @@ TEST(resample_gpu, interpolate_in2x2x3x2_cubic2) {
 
     auto& engine = get_test_engine();
     ov::intel_gpu::ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
     int b = 1;
     int f = 1;
@@ -1655,7 +1655,7 @@ TEST(resample_gpu, interpolate_in2x2x3x2_linear) {
 
     auto& engine = get_test_engine();
     ov::intel_gpu::ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
     int b = 2;
     int f = 2;
@@ -1882,7 +1882,7 @@ TEST(resample_gpu, interpolate_in1x1x2x4_linear_scale) {
 
     auto& engine = get_test_engine();
     ov::intel_gpu::ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
     int b = 1;
     int f = 1;
@@ -1949,7 +1949,7 @@ TEST(resample_gpu, downsampling_u8) {
     });
 
     ov::intel_gpu::ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     cldnn::network net{ engine, topology, config };
     net.set_input_data("input", input);
 
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/reshape_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/reshape_gpu_test.cpp
index 094e7ffc2d49c0..f5e5a2e2ae3d5e 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/reshape_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/reshape_gpu_test.cpp
@@ -822,7 +822,7 @@ TEST(reshape_gpu_f32, basic_runtime_static_shape) {
     set_values(input, input_data);
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     network network(engine, topology, config);
     network.set_input_data("input", input);
     auto outputs = network.execute();
@@ -870,7 +870,7 @@ TEST(reshape_gpu_f32, basic_runtime_dynamic_shape) {
     set_values(input, input_data);
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     config.set_property(ov::intel_gpu::optimize_data(true));
     network network(engine, topology, config);
     network.set_input_data("input", input);
@@ -921,7 +921,7 @@ TEST(reshape_gpu_f32, basic_runtime_dynamic_shape_with_const) {
     set_values(input, input_data);
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     config.set_property(ov::intel_gpu::optimize_data(true));
     network network(engine, topology, config);
     network.set_input_data("input", input);
@@ -978,7 +978,7 @@ TEST(reshape_gpu_f32, basic_runtime_dynamic_shape_with_const_optimized_out) {
     set_values(input, input_data);
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     config.set_property(ov::intel_gpu::optimize_data(true));
     network network(engine, topology, config);
     network.set_input_data("input", input);
@@ -1024,7 +1024,7 @@ TEST(reshape_gpu_f32, basic_dynamic_shape_to_static_optimized_out) {
     set_values(input, input_data);
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     config.set_property(ov::intel_gpu::optimize_data(true));
     network network(engine, topology, config);
     network.set_input_data("input", input);
@@ -1074,7 +1074,7 @@ TEST(reshape_gpu_f32, basic_dynamic_shape_to_static_optimized_out_static_optimiz
     set_values(input, input_data);
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     config.set_property(ov::intel_gpu::optimize_data(true));
     network network(engine, topology, config);
     network.set_input_data("input", input);
@@ -1127,7 +1127,7 @@ TEST(reshape_gpu_f32, basic_runtime_dynamic_shape_activation_fusion) {
     set_values(input, input_data);
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     config.set_property(ov::intel_gpu::optimize_data(true));
     network network(engine, topology, config);
     network.set_input_data("input", input);
@@ -1603,7 +1603,6 @@ TEST(reshape_gpu_f32, followed_by_convolution_dynamic) {
         convolution("conv", input_info("reshape"), "weights", "", 1, { 2, 1 }, {1, 1}, {0, 0}, {0, 0}, false));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
     network network(engine, topology, config);
 
     // first execute
@@ -1726,7 +1725,6 @@ TEST(reshape_gpu_f32, followed_by_convolution_dynamic_w_pad) {
     );
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
     config.set_property(ov::intel_gpu::allow_static_input_reorder(true));
 
     network network(engine, topology, config);
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/reverse_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/reverse_gpu_test.cpp
index c58f448d0d6662..c28c194bfd8170 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/reverse_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/reverse_gpu_test.cpp
@@ -13,17 +13,17 @@
 using namespace cldnn;
 using namespace ::tests;
 
-template <reverse_mode mode>
+template <ov::op::v1::Reverse::Mode mode>
 struct ReverseModeTraits;
 
 template <>
-struct ReverseModeTraits<reverse_mode::index> {
+struct ReverseModeTraits<ov::op::v1::Reverse::Mode::INDEX> {
     using axis_type = int32_t;
     static const data_types data_type = data_types::i32;
 };
 
 template <>
-struct ReverseModeTraits<reverse_mode::mask> {
+struct ReverseModeTraits<ov::op::v1::Reverse::Mode::MASK> {
     using axis_type = bool;
     static const data_types data_type = data_types::u8;
 };
@@ -31,7 +31,7 @@ struct ReverseModeTraits<reverse_mode::mask> {
 /**
  * Specific Reverse params to define the tests. Input and output should be the same type
  */
-template <typename T, reverse_mode mode>
+template <typename T, ov::op::v1::Reverse::Mode mode>
 struct ReverseParams {
     tensor input_tensor;
     format input_format;
@@ -40,7 +40,7 @@ struct ReverseParams {
     std::vector<T> expected_out;
 };
 
-template <typename T, reverse_mode mode>
+template <typename T, ov::op::v1::Reverse::Mode mode>
 struct reverse_gpu_test : public ::testing::TestWithParam<ReverseParams<T, mode>> {
 public:
     void test(bool is_caching_test = false) {
@@ -92,7 +92,7 @@ struct reverse_gpu_test : public ::testing::TestWithParam<ReverseParams<T, mode>
 };
 
 struct PrintToStringParamName {
-    template <class T, reverse_mode mode>
+    template <class T, ov::op::v1::Reverse::Mode mode>
     std::string operator()(const testing::TestParamInfo<ReverseParams<T, mode>>& param) {
         std::stringstream buf;
         buf << "input tensor " << param.param.input_tensor.to_string();
@@ -105,18 +105,18 @@ struct PrintToStringParamName {
     }
 };
 
-using reverse_gpu_test_int32_mask = reverse_gpu_test<int32_t, reverse_mode::mask>;
-using reverse_gpu_test_int32_index = reverse_gpu_test<int32_t, reverse_mode::index>;
-using reverse_gpu_test_int64_mask = reverse_gpu_test<int64_t, reverse_mode::mask>;
-using reverse_gpu_test_int64_index = reverse_gpu_test<int64_t, reverse_mode::index>;
-using reverse_gpu_test_float_mask = reverse_gpu_test<float, reverse_mode::mask>;
-using reverse_gpu_test_float_index = reverse_gpu_test<float, reverse_mode::index>;
-using reverse_gpu_test_int8_mask = reverse_gpu_test<int8_t, reverse_mode::mask>;
-using reverse_gpu_test_int8_index = reverse_gpu_test<int8_t, reverse_mode::index>;
-using reverse_gpu_test_uint8_mask = reverse_gpu_test<uint8_t, reverse_mode::mask>;
-using reverse_gpu_test_uint8_index = reverse_gpu_test<uint8_t, reverse_mode::index>;
-using reverse_gpu_test_f16_mask = reverse_gpu_test<ov::float16, reverse_mode::mask>;
-using reverse_gpu_test_f16_index = reverse_gpu_test<ov::float16, reverse_mode::index>;
+using reverse_gpu_test_int32_mask = reverse_gpu_test<int32_t, ov::op::v1::Reverse::Mode::MASK>;
+using reverse_gpu_test_int32_index = reverse_gpu_test<int32_t, ov::op::v1::Reverse::Mode::INDEX>;
+using reverse_gpu_test_int64_mask = reverse_gpu_test<int64_t, ov::op::v1::Reverse::Mode::MASK>;
+using reverse_gpu_test_int64_index = reverse_gpu_test<int64_t, ov::op::v1::Reverse::Mode::INDEX>;
+using reverse_gpu_test_float_mask = reverse_gpu_test<float, ov::op::v1::Reverse::Mode::MASK>;
+using reverse_gpu_test_float_index = reverse_gpu_test<float, ov::op::v1::Reverse::Mode::INDEX>;
+using reverse_gpu_test_int8_mask = reverse_gpu_test<int8_t, ov::op::v1::Reverse::Mode::MASK>;
+using reverse_gpu_test_int8_index = reverse_gpu_test<int8_t, ov::op::v1::Reverse::Mode::INDEX>;
+using reverse_gpu_test_uint8_mask = reverse_gpu_test<uint8_t, ov::op::v1::Reverse::Mode::MASK>;
+using reverse_gpu_test_uint8_index = reverse_gpu_test<uint8_t, ov::op::v1::Reverse::Mode::INDEX>;
+using reverse_gpu_test_f16_mask = reverse_gpu_test<ov::float16, ov::op::v1::Reverse::Mode::MASK>;
+using reverse_gpu_test_f16_index = reverse_gpu_test<ov::float16, ov::op::v1::Reverse::Mode::INDEX>;
 
 TEST_P(reverse_gpu_test_int32_mask, reverse_i32_mask) {
     ASSERT_NO_FATAL_FAILURE(test());
@@ -189,8 +189,8 @@ const auto five_d_formats = {
 }  // namespace
 
 template <typename T>
-std::vector<ReverseParams<T, reverse_mode::mask>> generateMaskParams() {
-    std::vector<ReverseParams<T, reverse_mode::mask>> params;
+std::vector<ReverseParams<T, ov::op::v1::Reverse::Mode::MASK>> generateMaskParams() {
+    std::vector<ReverseParams<T, ov::op::v1::Reverse::Mode::MASK>> params;
     for (const auto f : four_d_formats) {
         params.push_back({tensor(batch(4), feature(3)),
                           f,
@@ -213,10 +213,10 @@ std::vector<ReverseParams<T, reverse_mode::mask>> generateMaskParams() {
 }
 
 template <typename T>
-std::vector<ReverseParams<T, reverse_mode::index>> generateIndexParams() {
-    std::vector<ReverseParams<T, reverse_mode::index>> params;
+std::vector<ReverseParams<T, ov::op::v1::Reverse::Mode::INDEX>> generateIndexParams() {
+    std::vector<ReverseParams<T, ov::op::v1::Reverse::Mode::INDEX>> params;
     for (const auto fmt : four_d_formats) {
-        std::vector<ReverseParams<T, reverse_mode::index>> local_params{
+        std::vector<ReverseParams<T, ov::op::v1::Reverse::Mode::INDEX>> local_params{
             //{tensor(batch(8)), format::bfyx, std::vector<T>{0, 1, 2, 3, 4, 5, 6, 7}, {},
             // std::vector<T>{0, 1, 2, 3, 4, 5, 6, 7}},
             {tensor(batch(8)),
@@ -268,7 +268,7 @@ std::vector<ReverseParams<T, reverse_mode::index>> generateIndexParams() {
     }
 
     for (const auto fmt : five_d_formats) {
-        std::vector<ReverseParams<T, reverse_mode::index>> local_params{
+        std::vector<ReverseParams<T, ov::op::v1::Reverse::Mode::INDEX>> local_params{
             {tensor{1, 1, 3, 4, 2},
              fmt,
              std::vector<T>{0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23},
@@ -291,8 +291,8 @@ std::vector<ReverseParams<T, reverse_mode::index>> generateIndexParams() {
 }
 
 template <>
-std::vector<ReverseParams<ov::float16, reverse_mode::mask>> generateMaskParams() {
-    std::vector<ReverseParams<ov::float16, reverse_mode::mask>> params;
+std::vector<ReverseParams<ov::float16, ov::op::v1::Reverse::Mode::MASK>> generateMaskParams() {
+    std::vector<ReverseParams<ov::float16, ov::op::v1::Reverse::Mode::MASK>> params;
     for (const auto fmt : four_d_formats) {
         // reverse_2d_1_mask
         params.push_back({tensor(batch(4), feature(3)),
@@ -328,8 +328,8 @@ std::vector<ReverseParams<ov::float16, reverse_mode::mask>> generateMaskParams()
 }
 
 template <>
-std::vector<ReverseParams<ov::float16, reverse_mode::index>> generateIndexParams() {
-    std::vector<ReverseParams<ov::float16, reverse_mode::index>> params;
+std::vector<ReverseParams<ov::float16, ov::op::v1::Reverse::Mode::INDEX>> generateIndexParams() {
+    std::vector<ReverseParams<ov::float16, ov::op::v1::Reverse::Mode::INDEX>> params;
     for (const auto fmt : four_d_formats) {
         // reverse_2d_1_mask
         params.push_back({tensor(batch(4), feature(3)),
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/rms_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/rms_gpu_test.cpp
index 15dfa2398c3a27..293fcf653941cd 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/rms_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/rms_gpu_test.cpp
@@ -203,7 +203,6 @@ TEST(rms_gpu_test, rms_test_bfyx_opt_dyn) {
     topology.add(rms("rms", input_info("input"), input_info("gamma"), 1e-5f));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
 
     network network(engine, topology, config);
 
@@ -248,7 +247,6 @@ TEST(rms_gpu_test, rms_test_bfyx_opt_leftovers_dyn) {
     topology.add(rms("rms", input_info("input"), input_info("gamma"), 1e-5f));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
 
     network network(engine, topology, config);
 
@@ -293,7 +291,6 @@ TEST(rms_gpu_test, rms_test_bfyx_opt_unaligned_dyn) {
     topology.add(rms("rms", input_info("input"), input_info("gamma"), 1e-5f));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
 
     network network(engine, topology, config);
 
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/roll_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/roll_gpu_test.cpp
index 5a52754d7cb122..3278f610c7e0ea 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/roll_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/roll_gpu_test.cpp
@@ -51,7 +51,7 @@ struct roll_test : testing::TestWithParam<roll_test_params<T>> {
         topology topology;
         topology.add(input_layout("input", input->get_layout()));
         topology.add(reorder("reordered_input", input_info("input"), input_format, ov::element::from<T>()));
-        topology.add(roll("roll", input_info("reordered_input"), tensor(input_format, p.shift)));
+        topology.add(roll("roll", input_info("reordered_input"), p.shift, {0}));
         topology.add(reorder("reordered_roll", input_info("roll"), plane_format, ov::element::from<T>()));
 
         cldnn::network::ptr network = get_network(engine, topology, get_test_default_config(engine), get_test_stream_ptr(), is_caching_test);
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/scatter_nd_update_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/scatter_nd_update_gpu_test.cpp
index 3cecb245e0f408..96165b2ff6ff3e 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/scatter_nd_update_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/scatter_nd_update_gpu_test.cpp
@@ -4429,7 +4429,7 @@ TEST(scatter_nd_update_gpu, dynamic) {
     );
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     network network(engine, topology, config);
 
     network.set_input_data("InputData", input1);
@@ -4490,7 +4490,7 @@ TEST(scatter_nd_update_gpu, dynamic_padded_output) {
     topology.add(scatter_nd_upd);
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     network network(engine, topology, config);
 
     network.set_input_data("InputData", input1);
@@ -4536,7 +4536,7 @@ TEST(scatter_nd_update_gpu, dynamic_5d) {
     topology.add(scatter_nd_update("scatter_nd_update", input_info("data"), input_info("indices"), input_info("updates"), 5));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     network network(engine, topology, config);
 
     auto get_expected_res = [](const std::vector<float>& input,
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/scatter_update_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/scatter_update_gpu_test.cpp
index 238b87924ee093..997fa56d9cedfc 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/scatter_update_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/scatter_update_gpu_test.cpp
@@ -1657,7 +1657,7 @@ TEST(scatter_update_gpu_fp32, dynamic) {
     topology.add(reorder("out", input_info("scatter_update"), format::bfyx, data_types::f32));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     network network(engine, topology, config);
 
     network.set_input_data("InputDictionary", input1);
@@ -1739,7 +1739,7 @@ TEST(scatter_update_gpu_fp32, mixed_input_with_dynamic_static) {
     topology.add(reorder("out", input_info("scatter_update"), format::bfyx, data_types::f32));
 
     ExecutionConfig config;
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     network network(engine, topology, config);
 
     network.set_input_data("InputDictionary", input1);
@@ -1821,7 +1821,7 @@ TEST(scatter_update_cpu_impl_fp32, dynamic) {
     topology.add(reorder("out", input_info("scatter_update"), format::bfyx, data_types::f32));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     config.set_property(ov::intel_gpu::force_implementations(ov::intel_gpu::ImplForcingMap{ {"scatter_update", {format::bfyx, "", impl_types::cpu}} }));
     network network(engine, topology, config);
 
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/select_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/select_gpu_test.cpp
index 0789a6c388aa28..245919130533cd 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/select_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/select_gpu_test.cpp
@@ -2420,7 +2420,7 @@ TEST(select_gpu_f32, dynamic) {
     topology.add(cldnn::select("select", input_info("mask"), input_info("input1"), input_info("input2")));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     network network(engine, topology, config);
 
     network.set_input_data("input1", input1);
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/shape_of_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/shape_of_gpu_test.cpp
index 4524e08b606c0c..bec51d92e5d12b 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/shape_of_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/shape_of_gpu_test.cpp
@@ -158,7 +158,7 @@ TEST(shape_of_gpu, dynamic) {
     topology.add(shape_of("shape_of", input_info("input"), data_types::i32));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     network network(engine, topology, config);
 
     auto inst = network.get_primitive("shape_of");
@@ -207,7 +207,7 @@ TEST(shape_of_gpu, shape_infer_optimization_dynamic) {
     topology.add(shape_of("shape_of", input_info("input"), data_types::i32));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     network network(engine, topology, config);
 
     auto inst = network.get_primitive("shape_of");
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/slice_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/slice_gpu_test.cpp
index e1f8d74989b69e..17e934b34a8d2c 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/slice_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/slice_gpu_test.cpp
@@ -66,7 +66,7 @@ class SliceTest : public ::testing::Test {
 
     // Allocates tensoer with given shape and data.
     template<typename TDataType>
-    memory::ptr AllocateTensor(ov::PartialShape shape, cldnn::format fmt, 
+    memory::ptr AllocateTensor(ov::PartialShape shape, cldnn::format fmt,
                                 const std::vector<TDataType>& data) {
         const layout lo = {shape, helpers::ToDataType<TDataType>(), fmt};
         EXPECT_EQ(lo.get_linear_size(), data.size());
@@ -89,7 +89,7 @@ class SliceTest : public ::testing::Test {
         params.axes = this->template AllocateTensor<int64_t>(
             ov::PartialShape{ 3 }, format::bfyx, { 1, 3, 2 });
         params.wanted_output = this->template AllocateTensor<TypeParam>(
-            ov::PartialShape{ 1, 1, 5, 10 }, format::bfyx, { 
+            ov::PartialShape{ 1, 1, 5, 10 }, format::bfyx, {
                 1201, 1211, 1221, 1231, 1241, 1251, 1261, 1271, 1281, 1291,
                 1301, 1311, 1321, 1331, 1341, 1351, 1361, 1371, 1381, 1391,
                 1401, 1411, 1421, 1431, 1441, 1451, 1461, 1471, 1481, 1491,
@@ -135,7 +135,7 @@ class SliceTest : public ::testing::Test {
         topology.add(slice("slice", inputs));
 
         ExecutionConfig config = get_test_default_config(engine_);
-        config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
         cldnn::network::ptr network =
             get_network(engine_, topology, config, get_test_stream_ptr(), params.is_caching_test);
@@ -291,7 +291,7 @@ TYPED_TEST(SliceTest, bfyx_negative_step) {
     params.step = this->template AllocateTensor<int64_t>(
         ov::PartialShape{ 4 }, format::bfyx, { 1, -1, -1, -10 });
     params.wanted_output = this->template AllocateTensor<TypeParam>(
-        ov::PartialShape{ 1, 1, 5, 8 }, format::bfyx, { 
+        ov::PartialShape{ 1, 1, 5, 8 }, format::bfyx, {
             1789, 1779, 1769, 1759, 1749, 1739, 1729, 1719,
             1689, 1679, 1669, 1659, 1649, 1639, 1629, 1619,
             1589, 1579, 1569, 1559, 1549, 1539, 1529, 1519,
@@ -314,7 +314,7 @@ TYPED_TEST(SliceTest, bfzyx) {
     params.step = this->template AllocateTensor<int64_t>(
         ov::PartialShape{ 5 }, format::bfzyx, { 1, 1, 1, 1, 1 });
     params.wanted_output = this->template AllocateTensor<TypeParam>(
-        ov::PartialShape{ 1, 2, 2, 2, 2 }, format::bfzyx, { 
+        ov::PartialShape{ 1, 2, 2, 2, 2 }, format::bfzyx, {
             0,   1,   5,   6,   60,  61,  65,  66,
             600, 601, 605, 606, 660, 661, 665, 666
         });
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/softmax_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/softmax_gpu_test.cpp
index 047f0e5fde3009..7443e6bb501be3 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/softmax_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/softmax_gpu_test.cpp
@@ -1052,7 +1052,7 @@ TEST(softmax_gpu_bfyx_f32, normalize_f_dynamic) {
     };
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     network network(engine, topology, config);
     network.set_input_data("input", input);
 
@@ -1157,7 +1157,7 @@ TEST(softmax_gpu_bfyx_f32, bf_opt_normalize_f_dynamic) {
     };
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     network network(engine, topology, config);
     network.set_input_data("input", input);
 
@@ -1210,7 +1210,7 @@ static void run_softmax_bfyx_opt(const int64_t b, const int64_t f, const int64_t
     auto& engine = get_test_engine();
     auto config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::optimize_data(true));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
     ov::intel_gpu::ImplementationDesc softmax_bf_kernel = {format::bfyx, "softmax_gpu_bf"};
     config.set_property(ov::intel_gpu::force_implementations(ov::intel_gpu::ImplForcingMap{{"softmax", softmax_bf_kernel}}));
 
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/space_to_batch_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/space_to_batch_gpu_test.cpp
index b04b2eb243d97a..a34940783f8a49 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/space_to_batch_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/space_to_batch_gpu_test.cpp
@@ -35,10 +35,7 @@ class space_to_batch_fp16_gpu: public ::testing::Test {
 
         topology topology;
         topology.add(input_layout("Input", input->get_layout()));
-        topology.add(space_to_batch("space_to_batch", input_info("Input"), tensor(format::bfyx, {1,2,2,2}, 1),
-                                                                        tensor(format::bfyx, {0,0,0,0}, 0),
-                                                                        tensor(format::bfyx, {0,0,0,0}, 0),
-                                                                        tensor(format::bfyx, {8,1,1,1}, 1)));
+        topology.add(space_to_batch("space_to_batch", input_info("Input"), {1,2,2,2}, {0,0,0,0}, {0,0,0,0}));
 
         cldnn::network::ptr network = get_network(engine, topology, get_test_default_config(engine), get_test_stream_ptr(), is_caching_test);
 
@@ -80,10 +77,7 @@ class space_to_batch_fp16_gpu: public ::testing::Test {
 
         topology topology;
         topology.add(input_layout("Input", input->get_layout()));
-        topology.add(space_to_batch("space_to_batch", input_info("Input"), tensor(format::bfyx, {1,2,2,1}, 1),
-                                                                        tensor(format::bfyx, {0,0,2,0}, 0),
-                                                                        tensor(format::bfyx, {0,0,0,0}, 0),
-                                                                        tensor(format::bfyx, {4,1,3,2}, 1)));
+        topology.add(space_to_batch("space_to_batch", input_info("Input"), {1,2,2,1}, {0,0,2,0}, {0,0,0,0}));
         cldnn::network::ptr network = get_network(engine, topology, get_test_default_config(engine), get_test_stream_ptr(), is_caching_test);
 
         network->set_input_data("Input", input);
@@ -126,10 +120,7 @@ class space_to_batch_fp16_gpu: public ::testing::Test {
 
         topology topology;
         topology.add(input_layout("Input", input->get_layout()));
-        topology.add(space_to_batch("space_to_batch", input_info("Input"), tensor(format::bfyx, {1,2,2,2}, 1),
-                                                                        tensor(format::bfyx, {0,0,1,0}, 0),
-                                                                        tensor(format::bfyx, {0,1,0,0}, 0),
-                                                                        tensor(format::bfyx, {16,1,2,1}, 1)));
+        topology.add(space_to_batch("space_to_batch", input_info("Input"), {1,2,2,2}, {0,0,1,0}, {0,1,0,0}));
         cldnn::network::ptr network = get_network(engine, topology, get_test_default_config(engine), get_test_stream_ptr(), is_caching_test);
 
         network->set_input_data("Input", input);
@@ -172,10 +163,7 @@ class space_to_batch_fp16_gpu: public ::testing::Test {
 
         topology topology;
         topology.add(input_layout("Input", input->get_layout()));
-        topology.add(space_to_batch("space_to_batch", input_info("Input"), tensor(format::bfzyx, {1,2,1,2,2}, 1),
-                                                                        tensor(format::bfzyx, {0,0,0,1,0}, 0),
-                                                                        tensor(format::bfzyx, {0,0,0,0,0}, 0),
-                                                                        tensor(format::bfzyx, {8,1,1,2,1}, 1)));
+        topology.add(space_to_batch("space_to_batch", input_info("Input"), {1,2,1,2,2}, {0,0,0,1,0}, {0,0,0,0,0}));
         cldnn::network::ptr network = get_network(engine, topology, get_test_default_config(engine), get_test_stream_ptr(), is_caching_test);
 
         network->set_input_data("Input", input);
@@ -220,10 +208,7 @@ class space_to_batch_fp16_gpu: public ::testing::Test {
 
         topology topology;
         topology.add(input_layout("Input", input->get_layout()));
-        topology.add(space_to_batch("space_to_batch", input_info("Input"), tensor(format::bfwzyx, {1,4,2,1,2,1}, 1),
-                                                                        tensor(format::bfwzyx, {0,1,0,1,0,0}, 0),
-                                                                        tensor(format::bfwzyx, {0,0,0,0,0,0}, 0),
-                                                                        tensor(format::bfwzyx, {16,1,2,2,1,1}, 1)));
+        topology.add(space_to_batch("space_to_batch", input_info("Input"), {1,4,2,1,2,1}, {0,1,0,1,0,0}, {0,0,0,0,0,0}));
         cldnn::network::ptr network = get_network(engine, topology, get_test_default_config(engine), get_test_stream_ptr(), is_caching_test);
 
         network->set_input_data("Input", input);
@@ -272,10 +257,7 @@ class space_to_batch_fp16_gpu: public ::testing::Test {
         topology topology;
         topology.add(input_layout("Input", input->get_layout()));
         topology.add(reorder("input_fsv", input_info("Input"), format::b_fs_yx_fsv16, data_types::f16));
-        topology.add(space_to_batch("space_to_batch", input_info("input_fsv"), tensor(format::bfyx, {1,2,2,2}, 1),
-                                                                            tensor(format::bfyx, {0,0,1,0}, 0),
-                                                                            tensor(format::bfyx, {0,0,0,1}, 0),
-                                                                            tensor(format::bfyx, {8,8,1,1}, 1)));
+        topology.add(space_to_batch("space_to_batch", input_info("input_fsv"), {1,2,2,2}, {0,0,1,0}, {0,0,0,1}));
         topology.add(reorder("stb_to_bfyx", input_info("space_to_batch"), format::bfyx, data_types::f16));
         cldnn::network::ptr network = get_network(engine, topology, get_test_default_config(engine), get_test_stream_ptr(), is_caching_test);
 
@@ -325,10 +307,7 @@ class space_to_batch_fp16_gpu: public ::testing::Test {
         topology topology;
         topology.add(input_layout("Input", input->get_layout()));
         topology.add(reorder("input_fsv", input_info("Input"), format::b_fs_yx_fsv16, data_types::f16));
-        topology.add(space_to_batch("space_to_batch", input_info("input_fsv"), tensor(format::bfyx, {1,2,2,1}, 1),
-                                                                            tensor(format::bfyx, {0,0,1,0}, 0),
-                                                                            tensor(format::bfyx, {0,2,0,0}, 0),
-                                                                            tensor(format::bfyx, {4,5,1,2}, 1)));
+        topology.add(space_to_batch("space_to_batch", input_info("input_fsv"), {1,2,2,1}, {0,0,1,0}, {0,2,0,0}));
         topology.add(reorder("stb_to_bfyx", input_info("space_to_batch"), format::bfyx, data_types::f16));
         cldnn::network::ptr network = get_network(engine, topology, get_test_default_config(engine), get_test_stream_ptr(), is_caching_test);
 
@@ -402,10 +381,7 @@ class space_to_batch_fp32_gpu: public ::testing::Test {
 
         topology topology;
         topology.add(input_layout("Input", input->get_layout()));
-        topology.add(space_to_batch("space_to_batch", input_info("Input"), tensor(format::bfyx, {1,2,2,2}, 1),
-                                                                        tensor(format::bfyx, {0,0,0,0}, 0),
-                                                                        tensor(format::bfyx, {0,0,0,0}, 0),
-                                                                        tensor(format::bfyx, {8,1,1,1}, 1)));
+        topology.add(space_to_batch("space_to_batch", input_info("Input"), {1,2,2,2}, {0,0,0,0}, {0,0,0,0}));
         cldnn::network::ptr network = get_network(engine, topology, get_test_default_config(engine), get_test_stream_ptr(), is_caching_test);
 
         network->set_input_data("Input", input);
@@ -446,10 +422,7 @@ class space_to_batch_fp32_gpu: public ::testing::Test {
 
         topology topology;
         topology.add(input_layout("Input", input->get_layout()));
-        topology.add(space_to_batch("space_to_batch", input_info("Input"), tensor(format::bfyx, {1,2,2,1}, 1),
-                                                                        tensor(format::bfyx, {0,0,2,0}, 0),
-                                                                        tensor(format::bfyx, {0,0,0,0}, 0),
-                                                                        tensor(format::bfyx, {4,1,3,2}, 1)));
+        topology.add(space_to_batch("space_to_batch", input_info("Input"), {1,2,2,1}, {0,0,2,0}, {0,0,0,0}));
         cldnn::network::ptr network = get_network(engine, topology, get_test_default_config(engine), get_test_stream_ptr(), is_caching_test);
 
         network->set_input_data("Input", input);
@@ -492,10 +465,7 @@ class space_to_batch_fp32_gpu: public ::testing::Test {
 
         topology topology;
         topology.add(input_layout("Input", input->get_layout()));
-        topology.add(space_to_batch("space_to_batch", input_info("Input"), tensor(format::bfyx, {1,2,2,2}, 1),
-                                                                        tensor(format::bfyx, {0,0,1,0}, 0),
-                                                                        tensor(format::bfyx, {0,1,0,0}, 0),
-                                                                        tensor(format::bfyx, {16,1,2,1}, 1)));
+        topology.add(space_to_batch("space_to_batch", input_info("Input"), {1,2,2,2}, {0,0,1,0}, {0,1,0,0}));
         cldnn::network::ptr network = get_network(engine, topology, get_test_default_config(engine), get_test_stream_ptr(), is_caching_test);
 
         network->set_input_data("Input", input);
@@ -538,10 +508,7 @@ class space_to_batch_fp32_gpu: public ::testing::Test {
 
         topology topology;
         topology.add(input_layout("Input", input->get_layout()));
-        topology.add(space_to_batch("space_to_batch", input_info("Input"), tensor(format::bfzyx, {1,2,1,2,2}, 1),
-                                                                        tensor(format::bfzyx, {0,0,0,1,0}, 0),
-                                                                        tensor(format::bfzyx, {0,0,0,0,0}, 0),
-                                                                        tensor(format::bfzyx, {8,1,1,2,1}, 1)));
+        topology.add(space_to_batch("space_to_batch", input_info("Input"), {1,2,1,2,2}, {0,0,0,1,0}, {0,0,0,0,0}));
         cldnn::network::ptr network = get_network(engine, topology, get_test_default_config(engine), get_test_stream_ptr(), is_caching_test);
 
         network->set_input_data("Input", input);
@@ -584,10 +551,7 @@ class space_to_batch_fp32_gpu: public ::testing::Test {
 
         topology topology;
         topology.add(input_layout("Input", input->get_layout()));
-        topology.add(space_to_batch("space_to_batch", input_info("Input"), tensor(format::bfwzyx, {1,4,2,1,2,1}, 1),
-                                                                        tensor(format::bfwzyx, {0,1,0,1,0,0}, 0),
-                                                                        tensor(format::bfwzyx, {0,0,0,0,0,0}, 0),
-                                                                        tensor(format::bfwzyx, {16,1,2,2,1,1}, 1)));
+        topology.add(space_to_batch("space_to_batch", input_info("Input"), {1,4,2,1,2,1}, {0,1,0,1,0,0}, {0,0,0,0,0,0}));
         cldnn::network::ptr network = get_network(engine, topology, get_test_default_config(engine), get_test_stream_ptr(), is_caching_test);
 
         network->set_input_data("Input", input);
@@ -640,10 +604,7 @@ class space_to_batch_fp32_gpu: public ::testing::Test {
         topology topology;
         topology.add(input_layout("Input", input->get_layout()));
         topology.add(reorder("input_fsv", input_info("Input"), format::b_fs_yx_fsv16, data_types::f32));
-        topology.add(space_to_batch("space_to_batch", input_info("input_fsv"), tensor(format::bfyx, {1,4,2,1}, 1),
-                                                                            tensor(format::bfyx, {0,0,0,0}, 0),
-                                                                            tensor(format::bfyx, {0,0,0,0}, 0),
-                                                                            tensor(format::bfyx, {8,4,1,2}, 1)));
+        topology.add(space_to_batch("space_to_batch", input_info("input_fsv"), {1,4,2,1}, {0,0,0,0}, {0,0,0,0}));
         topology.add(reorder("stb_to_bfyx", input_info("space_to_batch"), format::bfyx, data_types::f32));
         cldnn::network::ptr network = get_network(engine, topology, get_test_default_config(engine), get_test_stream_ptr(), is_caching_test);
 
@@ -694,10 +655,7 @@ class space_to_batch_fp32_gpu: public ::testing::Test {
         topology topology;
         topology.add(input_layout("Input", input->get_layout()));
         topology.add(reorder("input_fsv", input_info("Input"), format::b_fs_yx_fsv16, data_types::f32));
-        topology.add(space_to_batch("space_to_batch", input_info("input_fsv"), tensor(format::bfyx, {1,3,1,2}, 1),
-                                                                            tensor(format::bfyx, {0,0,0,1}, 0),
-                                                                            tensor(format::bfyx, {0,0,0,0}, 0),
-                                                                            tensor(format::bfyx, {6,2,2,2}, 1)));
+        topology.add(space_to_batch("space_to_batch", input_info("input_fsv"), {1,3,1,2}, {0,0,0,1}, {0,0,0,0}));
         topology.add(reorder("stb_to_bfyx", input_info("space_to_batch"), format::bfyx, data_types::f32));
         cldnn::network::ptr network = get_network(engine, topology, get_test_default_config(engine), get_test_stream_ptr(), is_caching_test);
 
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/strided_slice_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/strided_slice_gpu_test.cpp
index ad62e51b3be7c8..3cb527e3fb04a5 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/strided_slice_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/strided_slice_gpu_test.cpp
@@ -48,7 +48,7 @@ class strided_slice_gpu: public ::testing::Test {
 
         auto config = get_test_default_config(engine);
         config.set_property(ov::intel_gpu::optimize_data(true));
-        config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
         cldnn::network::ptr network = get_network(engine, topology, config, get_test_stream_ptr(), is_caching_test);
 
@@ -961,7 +961,7 @@ class strided_slice_gpu: public ::testing::Test {
         topology.add(strided_slice("strided_slice", input_info("input"), input_info("input2"), input_info("input3"), input_info("input4"), {}, {}, {}, {}, {}, {}));
 
         ExecutionConfig config = get_test_default_config(engine);
-        config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
         if (impl_type != impl_types::any)
             config.set_property(ov::intel_gpu::force_implementations(ov::intel_gpu::ImplForcingMap{ {"strided_slice", {format::bfyx, "", impl_types::cpu}} }));
 
@@ -1014,7 +1014,7 @@ class strided_slice_gpu: public ::testing::Test {
         topology.add(strided_slice("strided_slice", input_info("input"), input_info("input2"), input_info("input3"), input_info("input4"), {}, {}, {}, {}, {}, {}));
 
         ExecutionConfig config = get_test_default_config(engine);
-        config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
         if (impl_type != impl_types::any)
             config.set_property(ov::intel_gpu::force_implementations(ov::intel_gpu::ImplForcingMap{ {"strided_slice", {format::bfyx, "", impl_types::cpu}} }));
 
@@ -1069,7 +1069,7 @@ class strided_slice_gpu: public ::testing::Test {
         topology.add(strided_slice("strided_slice", input_info("input"), input_info("input2"), input_info("input3"), input_info("input4"), {}, {}, {}, {}, {}, {}));
 
         ExecutionConfig config = get_test_default_config(engine);
-        config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
         if (impl_type != impl_types::any)
             config.set_property(ov::intel_gpu::force_implementations(ov::intel_gpu::ImplForcingMap{ {"strided_slice", {format::bfyx, "", impl_types::cpu}} }));
 
@@ -1124,7 +1124,7 @@ class strided_slice_gpu: public ::testing::Test {
         );
 
         ExecutionConfig config = get_test_default_config(engine);
-        config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
         auto program = program::build_program(engine, topology, config, false, false, false);
         ASSERT_NE(program, nullptr);
@@ -1158,7 +1158,7 @@ class strided_slice_gpu: public ::testing::Test {
         );
 
         ExecutionConfig config = get_test_default_config(engine);
-        config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
         auto program = program::build_program(engine, topology, config, false, false, false);
         ASSERT_NE(program, nullptr);
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/swiglu_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/swiglu_gpu_test.cpp
index 2f24dba140d266..d6aae9da4d10a0 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/swiglu_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/swiglu_gpu_test.cpp
@@ -63,10 +63,10 @@ TEST(swiglu_gpu_test, swiglu_test_bfyx_dyn) {
 
     topology topology;
     topology.add(input_layout("input", input_layout_dynamic));
-    topology.add(swiglu("swiglu", input_info("input"), -1, 3, ov::intel_gpu::op::SwiGLU::GluType::Swish, 0, tensor()));
+    topology.add(swiglu("swiglu", input_info("input"), -1, 3, ov::intel_gpu::op::SwiGLU::GluType::Swish, 0));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
 
     network network(engine, topology, config);
 
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/tile_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/tile_gpu_test.cpp
index 051bb15cf90700..9f5f17536aedf2 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/tile_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/tile_gpu_test.cpp
@@ -292,7 +292,7 @@ class tile_gpu: public ::testing::Test {
         topology.add(tile("tile", input_info("input"), std::vector<int64_t>{ 1, 2, 1, 1 }));
 
         ExecutionConfig config = get_test_default_config(engine);
-        config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
         if (impl_type != impl_types::any)
             config.set_property(ov::intel_gpu::force_implementations(ov::intel_gpu::ImplForcingMap{ {"tile", {format::bfyx, "", impl_types::cpu}} }));
 
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/unique_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/unique_gpu_test.cpp
index 5bfee149d6f587..5a84021bfbe588 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/unique_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/unique_gpu_test.cpp
@@ -76,7 +76,7 @@ struct unique_gpu_test : public testing::TestWithParam<unique_test_params<ElemT,
         topology.add(reorder("expected_counts", input_info("unique_gather", 3), plain_format, count_data_type));
 
         auto config = get_test_default_config(engine);
-        config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
+
         network network(engine, topology, config);
         network.set_input_data("input", input);
 

From d507c2446f94884ec8b56507ac7e673dc45f4951 Mon Sep 17 00:00:00 2001
From: Vladimir Paramuzov <vladimir.paramuzov@intel.com>
Date: Wed, 17 Jul 2024 17:19:17 +0400
Subject: [PATCH 2/2] cleanup

---
 .../intel_gpu/plugin/program_builder.hpp      |   1 -
 .../graph/graph_optimizer/prepare_padding.cpp | 113 ++++++++----------
 .../graph/impls/ocl/kernel_selector_helper.h  |   1 -
 .../intel_gpu/src/plugin/ops/gather tree.cpp  |  29 +----
 .../intel_gpu/src/plugin/ops/gather.cpp       |  25 ----
 .../intel_gpu/src/plugin/program_builder.cpp  |  31 -----
 .../fusions/fully_connected_fusion_test.cpp   |   1 -
 .../tests/unit/passes/kernels_cache_test.cpp  |   1 -
 .../unit/passes/post_optimize_weights.cpp     |   1 -
 .../passes/prepare_buffer_fusing_test.cpp     |   4 -
 .../passes/select_preferred_formats_test.cpp  |   1 -
 .../test_cases/concatenation_gpu_test.cpp     |   2 -
 .../unit/test_cases/convolution_gpu_test.cpp  |   2 -
 .../test_cases/dynamic_quantize_gpu_test.cpp  |   2 -
 .../unit/test_cases/eltwise_gpu_test.cpp      |   5 +-
 .../test_cases/fully_connected_gpu_test.cpp   |   2 -
 .../unit/test_cases/quantize_gpu_test.cpp     |   1 -
 .../unit/test_cases/reorder_gpu_test.cpp      |   1 -
 18 files changed, 56 insertions(+), 167 deletions(-)

diff --git a/src/plugins/intel_gpu/include/intel_gpu/plugin/program_builder.hpp b/src/plugins/intel_gpu/include/intel_gpu/plugin/program_builder.hpp
index e0b94070249524..2e094fa71f8771 100644
--- a/src/plugins/intel_gpu/include/intel_gpu/plugin/program_builder.hpp
+++ b/src/plugins/intel_gpu/include/intel_gpu/plugin/program_builder.hpp
@@ -138,7 +138,6 @@ class ProgramBuilder final {
 
     void add_primitive(const ov::Node& op, std::shared_ptr<cldnn::primitive> prim, std::vector<std::string> aliases = {});
 
-    bool requires_new_shape_infer(const std::shared_ptr<ov::Node>& op) const;
     bool is_inner_program() const { return m_is_inner_program; }
     bool is_query_mode() { return queryMode; }
 
diff --git a/src/plugins/intel_gpu/src/graph/graph_optimizer/prepare_padding.cpp b/src/plugins/intel_gpu/src/graph/graph_optimizer/prepare_padding.cpp
index 0daffb74fdf0b5..6aeac050714a8e 100644
--- a/src/plugins/intel_gpu/src/graph/graph_optimizer/prepare_padding.cpp
+++ b/src/plugins/intel_gpu/src/graph/graph_optimizer/prepare_padding.cpp
@@ -13,6 +13,53 @@
 using namespace cldnn;
 using namespace ov::intel_gpu;
 
+namespace {
+
+template<typename T>
+padding convert_paddings(const padding& current_pad, const T& pad_begin, const T& pad_end, size_t spatial_rank) {
+    tensor::value_type pb_z = std::max<std::ptrdiff_t>(pad_begin.size() >= 3 ? pad_begin[pad_begin.size() - 3] : 0, 0);
+    tensor::value_type pb_y = std::max<std::ptrdiff_t>(pad_begin.size() >= 2 ? pad_begin[pad_begin.size() - 2] : 0, 0);
+    tensor::value_type pb_x = std::max<std::ptrdiff_t>(pad_begin.size() >= 1 ? pad_begin[pad_begin.size() - 1] : 0, 0);
+
+    tensor::value_type pe_z = std::max<std::ptrdiff_t>(pad_end.size() >= 3 ? pad_end[pad_end.size() - 3] : 0, 0);
+    tensor::value_type pe_y = std::max<std::ptrdiff_t>(pad_end.size() >= 2 ? pad_end[pad_end.size() - 2] : 0, 0);
+    tensor::value_type pe_x = std::max<std::ptrdiff_t>(pad_end.size() >= 1 ? pad_end[pad_end.size() - 1] : 0, 0);
+
+    const auto& lower_sizes = current_pad._lower_size;
+    const auto& upper_sizes = current_pad._upper_size;
+
+    std::vector<int32_t> needed_lpad, needed_upad;
+    needed_lpad.push_back(lower_sizes[0]);
+    needed_lpad.push_back(lower_sizes[1]);
+
+    needed_upad.push_back(upper_sizes[0]);
+    needed_upad.push_back(upper_sizes[1]);
+    if (spatial_rank == 3) {
+        needed_lpad.push_back(std::max(pb_z, lower_sizes[2]));
+        needed_lpad.push_back(std::max(pb_y, lower_sizes[3]));
+        needed_lpad.push_back(std::max(pb_x, lower_sizes[4]));
+
+        needed_upad.push_back(std::max(pe_z, upper_sizes[2]));
+        needed_upad.push_back(std::max(pe_y, upper_sizes[3]));
+        needed_upad.push_back(std::max(pe_x, upper_sizes[4]));
+    } else if (spatial_rank == 2) {
+        needed_lpad.push_back(std::max(pb_y, lower_sizes[2]));
+        needed_lpad.push_back(std::max(pb_x, lower_sizes[3]));
+
+        needed_upad.push_back(std::max(pe_y, upper_sizes[2]));
+        needed_upad.push_back(std::max(pe_x, upper_sizes[3]));
+    } else {
+        needed_lpad.push_back(std::max(pb_x, lower_sizes[2]));
+        needed_upad.push_back(std::max(pb_x, upper_sizes[2]));
+    }
+
+    padding needed_padding(needed_lpad, needed_upad);
+
+    return needed_padding;
+}
+
+} // namespace
+
 void prepare_padding::run(program& p) {
     if (output_size_handling_enabled) {
         // Prepare upper padding for primitives that support output_size parameter.
@@ -66,43 +113,7 @@ void prepare_padding::run(program& p) {
                 auto padding_begin = prim->padding_begin;
                 auto padding_end = prim->padding_end;
 
-                tensor::value_type pb_z = std::max<std::ptrdiff_t>(padding_begin.size() >= 3 ? padding_begin[padding_begin.size() - 3] : 0, 0);
-                tensor::value_type pb_y = std::max<std::ptrdiff_t>(padding_begin.size() >= 2 ? padding_begin[padding_begin.size() - 2] : 0, 0);
-                tensor::value_type pb_x = std::max<std::ptrdiff_t>(padding_begin.size() >= 1 ? padding_begin[padding_begin.size() - 1] : 0, 0);
-
-                tensor::value_type pe_z = std::max<std::ptrdiff_t>(padding_end.size() >= 3 ? padding_end[padding_end.size() - 3] : 0, 0);
-                tensor::value_type pe_y = std::max<std::ptrdiff_t>(padding_end.size() >= 2 ? padding_end[padding_end.size() - 2] : 0, 0);
-                tensor::value_type pe_x = std::max<std::ptrdiff_t>(padding_end.size() >= 1 ? padding_end[padding_end.size() - 1] : 0, 0);
-
-                const auto& lower_sizes = in_layout.data_padding._lower_size;
-                const auto& upper_sizes = in_layout.data_padding._upper_size;
-
-                std::vector<int32_t> needed_lpad, needed_upad;
-                needed_lpad.push_back(lower_sizes[0]);
-                needed_lpad.push_back(lower_sizes[1]);
-
-                needed_upad.push_back(upper_sizes[0]);
-                needed_upad.push_back(upper_sizes[1]);
-                if (spatial_rank == 3) {
-                    needed_lpad.push_back(std::max(pb_z, lower_sizes[2]));
-                    needed_lpad.push_back(std::max(pb_y, lower_sizes[3]));
-                    needed_lpad.push_back(std::max(pb_x, lower_sizes[4]));
-
-                    needed_upad.push_back(std::max(pe_z, upper_sizes[2]));
-                    needed_upad.push_back(std::max(pe_y, upper_sizes[3]));
-                    needed_upad.push_back(std::max(pe_x, upper_sizes[4]));
-                } else if (spatial_rank == 2) {
-                    needed_lpad.push_back(std::max(pb_y, lower_sizes[2]));
-                    needed_lpad.push_back(std::max(pb_x, lower_sizes[3]));
-
-                    needed_upad.push_back(std::max(pe_y, upper_sizes[2]));
-                    needed_upad.push_back(std::max(pe_x, upper_sizes[3]));
-                } else {
-                    needed_lpad.push_back(std::max(pb_x, lower_sizes[2]));
-                    needed_upad.push_back(std::max(pb_x, upper_sizes[2]));
-                }
-
-                padding needed_padding(needed_lpad, needed_upad);
+                auto needed_padding = convert_paddings(in_layout.data_padding, padding_begin, padding_end, spatial_rank);
 
                 add_required_padding(prim_node, needed_padding);
             } else if (node->is_type<deconvolution>()) {
@@ -131,33 +142,9 @@ void prepare_padding::run(program& p) {
                 auto padding_begin = prim->pads_begin;
                 auto padding_end = prim->pads_end;
 
-                tensor::value_type pb_z = std::max<std::ptrdiff_t>(padding_begin.size() >= 3 ? padding_begin[padding_begin.size() - 3] : 0, 0);
-                tensor::value_type pb_y = std::max<std::ptrdiff_t>(padding_begin.size() >= 2 ? padding_begin[padding_begin.size() - 2] : 0, 0);
-                tensor::value_type pb_x = std::max<std::ptrdiff_t>(padding_begin.size() >= 1 ? padding_begin[padding_begin.size() - 1] : 0, 0);
-
-                tensor::value_type pe_z = std::max<std::ptrdiff_t>(padding_end.size() >= 3 ? padding_end[padding_end.size() - 3] : 0, 0);
-                tensor::value_type pe_y = std::max<std::ptrdiff_t>(padding_end.size() >= 2 ? padding_end[padding_end.size() - 2] : 0, 0);
-                tensor::value_type pe_x = std::max<std::ptrdiff_t>(padding_end.size() >= 1 ? padding_end[padding_end.size() - 1] : 0, 0);
-
-                tensor pad_l = tensor(0);
-                tensor pad_u = tensor(0);
-                pad_l.spatial[0] = pb_x;
-                pad_l.spatial[1] = pb_y;
-                pad_l.spatial[2] = pb_z;
-
-                pad_u.spatial[0] = pe_x;
-                pad_u.spatial[1] = pe_y;
-                pad_u.spatial[2] = pe_z;
-
                 auto in_layout = prim_node.get_input_layout();
-
-                const auto& actual_lpad = in_layout.data_padding.lower_size();
-                const auto& actual_upad = in_layout.data_padding.upper_size();
-
-                auto needed_lpad = tensor::max(pad_l, actual_lpad);
-                auto needed_upad = tensor::max(pad_u, actual_upad);
-
-                padding needed_padding(needed_lpad.sizes(), needed_upad.sizes());
+                const auto spatial_rank = in_layout.get_spatial_rank();
+                auto needed_padding = convert_paddings(in_layout.data_padding, padding_begin, padding_end, spatial_rank);
 
                 add_required_padding(prim_node, needed_padding);
             }
diff --git a/src/plugins/intel_gpu/src/graph/impls/ocl/kernel_selector_helper.h b/src/plugins/intel_gpu/src/graph/impls/ocl/kernel_selector_helper.h
index 4229cd57128ebb..e63cf59a6f36c8 100644
--- a/src/plugins/intel_gpu/src/graph/impls/ocl/kernel_selector_helper.h
+++ b/src/plugins/intel_gpu/src/graph/impls/ocl/kernel_selector_helper.h
@@ -117,7 +117,6 @@ kernel_selector::dim_tensor<T> convert_dim_vector(const tensor& t) {
             static_cast<T>(sizes[5])};
 }
 
-
 inline kernel_selector::DimTensor<uint32_t> convert_vec_to_dim_tensor(const std::vector<int32_t>& p, size_t out_rank, int32_t default_value) {
     auto sizes = p;
     auto format = cldnn::format::get_default_format(out_rank);
diff --git a/src/plugins/intel_gpu/src/plugin/ops/gather tree.cpp b/src/plugins/intel_gpu/src/plugin/ops/gather tree.cpp
index 1c81d311975916..2f1e7faf0b9de3 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/gather tree.cpp	
+++ b/src/plugins/intel_gpu/src/plugin/ops/gather tree.cpp	
@@ -18,32 +18,11 @@ static void CreateGatherTreeOp(ProgramBuilder& p, const std::shared_ptr<ov::op::
     auto inputs = p.GetInputInfo(op);
     std::string layerName = layer_type_name_ID(op);
 
-    std::vector<cldnn::input_info> reordered_inputs;
-    reordered_inputs.resize(inputs.size());
-
-    for (size_t portIndex = 0; portIndex < inputs.size(); portIndex++) {
-        auto inputDataType = cldnn::element_type_to_data_type(op->get_input_element_type(portIndex));
-        if (inputDataType == cldnn::data_types::i64) {
-            // GPU primitive does not support i64 inputs,
-            // so we need additional reorders to convert them to i32
-            auto reorderPrimName = inputs[portIndex].pid + "_" + op->get_friendly_name() + ProgramBuilder::m_preProcessTag;
-            auto targetFormat = cldnn::format::get_default_format(op->get_input_shape(portIndex).size());
-            auto preprocessPrim = cldnn::reorder(reorderPrimName,
-                                                 inputs[portIndex],
-                                                 targetFormat,
-                                                 cldnn::data_types::i32);
-            p.add_primitive(*op, preprocessPrim);
-            reordered_inputs[portIndex] = cldnn::input_info(reorderPrimName);
-        } else {
-            reordered_inputs[portIndex] = inputs[portIndex];
-        }
-    }
-
     auto gatherTreePrim = cldnn::gather_tree(layerName,
-                                             reordered_inputs[0],
-                                             reordered_inputs[1],
-                                             reordered_inputs[2],
-                                             reordered_inputs[3]);
+                                             inputs[0],
+                                             inputs[1],
+                                             inputs[2],
+                                             inputs[3]);
 
     p.add_primitive(*op, gatherTreePrim);
 }
diff --git a/src/plugins/intel_gpu/src/plugin/ops/gather.cpp b/src/plugins/intel_gpu/src/plugin/ops/gather.cpp
index 31458e54f760c5..01924850e6e07b 100644
--- a/src/plugins/intel_gpu/src/plugin/ops/gather.cpp
+++ b/src/plugins/intel_gpu/src/plugin/ops/gather.cpp
@@ -39,7 +39,6 @@ void CreateGatherOpBase(ProgramBuilder& p, const std::shared_ptr<T>& op, const i
     ov::Shape out_shape = is_static ? op->get_output_shape(0) : ov::Shape{};
 
     // Update output_shape in case of scalar indice
-    bool need_reshape = false;
     auto out_shape_original = out_shape;
 
     // WA for NMS->Gather construction. NMS fills part of the output blob by the -1 if these values
@@ -55,9 +54,6 @@ void CreateGatherOpBase(ProgramBuilder& p, const std::shared_ptr<T>& op, const i
 
     // Set layer name for Gather
     auto reshapeName = layerName + "";
-    if (need_reshape) {
-        layerName = layerName + "_reshape_output";
-    }
 
     // Check if Gather could be converted to other primitive
     const auto input_shape = op->get_input_partial_shape(0);
@@ -140,27 +136,6 @@ void CreateGatherOpBase(ProgramBuilder& p, const std::shared_ptr<T>& op, const i
             p.add_primitive(*op, gatherPrim);
         }
     }
-
-    // Add reorder and reshape for scalar indice
-    if (need_reshape) {
-        auto input = inputs[0];
-        input.pid = layerName;
-
-        auto targetFormat = cldnn::format::get_default_format(out_shape_original.size());
-        if (targetFormat.value != cldnn::format::get_default_format(out_shape.size()).value) {
-            auto reorderName = layerName + "_cldnn_in_reorder";
-            auto targetDatatype = cldnn::element_type_to_data_type(op->get_input_element_type(0));
-            auto reorderPrim = cldnn::reorder(reorderName,
-                                              input,
-                                              targetFormat,
-                                              targetDatatype);
-            p.add_primitive(*op, reorderPrim);
-            input.pid = reorderName;
-        }
-
-        auto reshapePrim = cldnn::reshape(reshapeName, input, tensor_from_dims(out_shape_original));
-        p.add_primitive(*op, reshapePrim);
-    }
 }
 
 static void CreateGatherOp(ProgramBuilder& p, const std::shared_ptr<ov::op::v1::Gather>& op) {
diff --git a/src/plugins/intel_gpu/src/plugin/program_builder.cpp b/src/plugins/intel_gpu/src/plugin/program_builder.cpp
index 263a7b92c0c771..1a6c1ebcbb4027 100644
--- a/src/plugins/intel_gpu/src/plugin/program_builder.cpp
+++ b/src/plugins/intel_gpu/src/plugin/program_builder.cpp
@@ -315,37 +315,6 @@ void ProgramBuilder::add_primitive(const ov::Node& op, std::shared_ptr<cldnn::pr
     m_topology->add_primitive(prim);
 }
 
-bool ProgramBuilder::requires_new_shape_infer(const std::shared_ptr<ov::Node>& op) const {
-    if (op->is_dynamic()) {
-        return true;
-    }
-
-    if (ov::is_type<ov::op::v5::Loop>(op)) {
-        const auto body_function = std::static_pointer_cast<ov::op::v5::Loop>(op)->get_function();
-        if (body_function->is_dynamic())
-            return true;
-    }
-    // When input node has dynamic shape with 4 dimension, this function return false
-    // because op.is_dynamic() which only checks input shapes return false.
-    // So, in the case of input data, we need to check output shape.
-    for (size_t i = 0; i < op->get_output_size(); i++) {
-        if (op->get_output_partial_shape(i).is_dynamic())
-            return true;
-    }
-
-    for (size_t i = 0; i < op->get_output_size(); i++) {
-        if (op->get_output_partial_shape(i).size() > 6)
-            return true;
-    }
-
-    for (size_t i = 0; i < op->get_input_size(); i++) {
-        if (op->get_input_partial_shape(i).size() > 6)
-            return true;
-    }
-
-    return false;
-}
-
 int64_t ProgramBuilder::get_parameter_index(const std::shared_ptr<ov::op::v0::Parameter>& parameter) const {
     return m_model->get_parameter_index(parameter);
 }
diff --git a/src/plugins/intel_gpu/tests/unit/fusions/fully_connected_fusion_test.cpp b/src/plugins/intel_gpu/tests/unit/fusions/fully_connected_fusion_test.cpp
index fecd9ec941c2a2..1adeaa41615eda 100644
--- a/src/plugins/intel_gpu/tests/unit/fusions/fully_connected_fusion_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/fusions/fully_connected_fusion_test.cpp
@@ -614,7 +614,6 @@ TEST_P(fc_fp16_eltwise_prod_unfused_dynamic, basic) {
     );
 
     bool is_dynamic = true;
-    cfg_not_fused.set_property(ov::intel_gpu::allow_new_shape_infer(is_dynamic));
     tolerance = 1e-2f;
     execute(p, false, is_dynamic);
 }
diff --git a/src/plugins/intel_gpu/tests/unit/passes/kernels_cache_test.cpp b/src/plugins/intel_gpu/tests/unit/passes/kernels_cache_test.cpp
index 07ef9381c62ab2..1d29dc56ce5665 100644
--- a/src/plugins/intel_gpu/tests/unit/passes/kernels_cache_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/passes/kernels_cache_test.cpp
@@ -164,7 +164,6 @@ TEST(kernels_cache, reuse_kernels_property) {
                       reorder("output", input_info("sum"), {{3, 2}, data_types::f16, format::bfyx}));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
     config.set_property(ov::intel_gpu::hint::enable_kernels_reuse(true));
     auto prog = program::build_program(engine, topology, config, false, false);
     auto& cache = prog->get_kernels_cache();
diff --git a/src/plugins/intel_gpu/tests/unit/passes/post_optimize_weights.cpp b/src/plugins/intel_gpu/tests/unit/passes/post_optimize_weights.cpp
index 25ee021e95d3bc..2b18676421ba92 100644
--- a/src/plugins/intel_gpu/tests/unit/passes/post_optimize_weights.cpp
+++ b/src/plugins/intel_gpu/tests/unit/passes/post_optimize_weights.cpp
@@ -265,7 +265,6 @@ TEST(post_optimize_weights, onednn_group_conv_weights_reorder_test) {
 
     ExecutionConfig config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::optimize_data(true));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
 
     if (engine.get_device_info().supports_immad) {
         ov::intel_gpu::ImplementationDesc conv_impl = { format::b_fs_yx_fsv16, std::string(""), impl_types::onednn };
diff --git a/src/plugins/intel_gpu/tests/unit/passes/prepare_buffer_fusing_test.cpp b/src/plugins/intel_gpu/tests/unit/passes/prepare_buffer_fusing_test.cpp
index 04f9d330be1ac5..8a244edb339c85 100644
--- a/src/plugins/intel_gpu/tests/unit/passes/prepare_buffer_fusing_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/passes/prepare_buffer_fusing_test.cpp
@@ -834,7 +834,6 @@ TEST(prepare_buffer_fusing, in_place_crop_dynamic_reshape_unsqueeze) {
     );
 
     auto config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
     config.set_property(ov::intel_gpu::optimize_data(true));
     network network(engine, topology, config);
 
@@ -904,7 +903,6 @@ TEST(prepare_buffer_fusing, in_place_crop_dynamic_reshape_squeeze_crop_axis) {
     );
 
     auto config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
     config.set_property(ov::intel_gpu::optimize_data(true));
     network network(engine, topology, config);
 
@@ -986,7 +984,6 @@ TEST(prepare_buffer_fusing, in_place_crop_dynamic_split_lengths) {
     );
 
     auto config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
     config.set_property(ov::intel_gpu::optimize_data(true));
     network network(engine, topology, config);
 
@@ -1068,7 +1065,6 @@ TEST(prepare_buffer_fusing, in_place_crop_dynamic_mvn) {
     );
 
     auto config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
     config.set_property(ov::intel_gpu::optimize_data(true));
     network network(engine, topology, config);
 
diff --git a/src/plugins/intel_gpu/tests/unit/passes/select_preferred_formats_test.cpp b/src/plugins/intel_gpu/tests/unit/passes/select_preferred_formats_test.cpp
index eed75e26234040..bda86a2053f533 100644
--- a/src/plugins/intel_gpu/tests/unit/passes/select_preferred_formats_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/passes/select_preferred_formats_test.cpp
@@ -83,7 +83,6 @@ TEST(test_select_preferred_formats, fsv2_fallback_to_byxf) {
     topology.add(convolution("conv1", input_info("reorder"), "weights", "", 2, {1, 1}, {1, 1}, {2, 1}, {0, 1}, true));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
     ov::intel_gpu::ImplementationDesc impl = { format::b_fs_yx_fsv16, std::string(""), impl_types::onednn };
     config.set_property(ov::intel_gpu::force_implementations(ov::intel_gpu::ImplForcingMap{ {"conv1", impl} }));
 
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/concatenation_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/concatenation_gpu_test.cpp
index bc42745c896675..6ae8b13e98cd87 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/concatenation_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/concatenation_gpu_test.cpp
@@ -224,7 +224,6 @@ TEST(concat_gpu, dynamic_2d_bfyx_and_b_fs_yx_fsv32) {
 
     ExecutionConfig config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::optimize_data(false));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
     ov::intel_gpu::ImplementationDesc impl = { format::bfyx, "", impl_types::ocl };
     config.set_property(ov::intel_gpu::force_implementations(ov::intel_gpu::ImplForcingMap{ { "concat", impl } }));
 
@@ -277,7 +276,6 @@ TEST(concat_gpu, dynamic_4d_bfyx_and_b_fs_yx_fsv32) {
 
     ExecutionConfig config = get_test_default_config(engine);
     config.set_property(ov::intel_gpu::optimize_data(false));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
     ov::intel_gpu::ImplementationDesc impl = { format::bfyx, "", impl_types::ocl };
     config.set_property(ov::intel_gpu::force_implementations(ov::intel_gpu::ImplForcingMap{ { "concat", impl } }));
 
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/convolution_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/convolution_gpu_test.cpp
index 98ce1a4f5291c4..e6182a3954ad1a 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/convolution_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/convolution_gpu_test.cpp
@@ -4673,7 +4673,6 @@ TEST(convolution_int8_fw_gpu, quantized_convolution_u8s8f32_asymmetric_activatio
         reorder("out", input_info("conv"), format::bfyx, data_types::f32));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
     ov::intel_gpu::ImplementationDesc conv_impl;
     if (engine.get_device_info().supports_immad) {
         conv_impl = { format::b_fs_yx_fsv16, "", impl_types::onednn };
@@ -10823,7 +10822,6 @@ TEST_P(conv_dyn_test, convolution_gpu_fsv16_depthwise_quantized) {
     ExecutionConfig config = get_test_default_config(engine);
     ov::intel_gpu::ImplementationDesc conv_impl = { format::b_fs_yx_fsv16, "convolution_gpu_b_fs_yx_fsv_16_32_imad_dw", impl_types::ocl };
     config.set_property(ov::intel_gpu::force_implementations(ov::intel_gpu::ImplForcingMap{ { "conv", conv_impl } }));
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
     config.set_property(ov::enable_profiling(true));
 
     network network(engine, topology, config);
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/dynamic_quantize_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/dynamic_quantize_gpu_test.cpp
index c1686e359e91a0..6075fabf20158c 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/dynamic_quantize_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/dynamic_quantize_gpu_test.cpp
@@ -62,7 +62,6 @@ class dynamic_quantization_gpu_tests: public ::testing::Test {
             );
 
             auto config = get_test_default_config(engine);
-            config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
             config.set_property(ov::intel_gpu::optimize_data(true));
 
             ov::intel_gpu::ImplementationDesc dyn_quan_impl_desc = { format::bfyx, "dynamic_quantize_gpu_ref", impl_types::ocl };
@@ -87,7 +86,6 @@ class dynamic_quantization_gpu_tests: public ::testing::Test {
         );
 
         auto config = get_test_default_config(engine);
-        config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
         config.set_property(ov::intel_gpu::optimize_data(true));
 
         network::ptr network = get_network(engine, topology, config, get_test_stream_ptr(), is_caching_test);
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/eltwise_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/eltwise_gpu_test.cpp
index d94fe0dd7c05fe..85f971a448e637 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/eltwise_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/eltwise_gpu_test.cpp
@@ -249,7 +249,7 @@ void generic_eltwise_int_test(cldnn::format test_input_fmt,
                               int input2_max_val) {
     static_assert(std::is_integral<T>::value, "T must be an integral type");
     static_assert(std::is_integral<TOut>::value, "TOut must be an integral type");
-    
+
     tests::random_generator rg(GET_SUITE_NAME);
 
     VVVVF<T> input1_rnd = rg.generate_random_4d<T>(input_b, input_f, input_y, input_x, input1_min_val, input1_max_val);
@@ -299,7 +299,7 @@ void generic_eltwise_int_test(cldnn::format test_input_fmt,
     bool test_is_correct = true;
     VF<TOut> output_cpu_vec = flatten_4d<TOut>(test_input_fmt, output_cpu);
     for (size_t i = 0; i < output_cpu_vec.size(); ++i) {
-        const TOut cpu_val = output_cpu_vec[i]; 
+        const TOut cpu_val = output_cpu_vec[i];
         const TOut gpu_val = output_ptr[i];
         if (cpu_val != gpu_val) {
             test_is_correct = false;
@@ -1680,7 +1680,6 @@ TEST(eltwise_gpu_f32, dynamic_padding) {
         0.5f,   2.5f });
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
     // config.set_property(ov::intel_gpu::optimize_data(true));
     network network(engine, topology, config);
     network.set_input_data("input1", input1);
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/fully_connected_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/fully_connected_gpu_test.cpp
index 17a9cacd213376..be9aeeed651d52 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/fully_connected_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/fully_connected_gpu_test.cpp
@@ -2574,7 +2574,6 @@ class fully_connected_gpu_tests: public ::testing::Test {
             );
 
             auto config = get_test_default_config(engine);
-            config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
             ov::intel_gpu::ImplementationDesc fc_impl_desc = { format::bfyx, "fully_connected_gpu_bf_tiled", impl_types::ocl };
             config.set_property(ov::intel_gpu::force_implementations(ov::intel_gpu::ImplForcingMap{ {"fc_prim", fc_impl_desc} }));
             config.set_property(ov::hint::dynamic_quantization_group_size(0));
@@ -2600,7 +2599,6 @@ class fully_connected_gpu_tests: public ::testing::Test {
         );
 
         auto config = get_test_default_config(engine);
-        config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
         config.set_property(ov::intel_gpu::optimize_data(true));
         config.set_property(ov::hint::dynamic_quantization_group_size(quantize_group_size));
 
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/quantize_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/quantize_gpu_test.cpp
index da396e83d01040..560f4f90812991 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/quantize_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/quantize_gpu_test.cpp
@@ -827,7 +827,6 @@ TEST(quantize_gpu, dynamic_fsv16) {
     );
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
     network network(engine, topology, config);
     network.set_input_data("input", input);
 
diff --git a/src/plugins/intel_gpu/tests/unit/test_cases/reorder_gpu_test.cpp b/src/plugins/intel_gpu/tests/unit/test_cases/reorder_gpu_test.cpp
index 1400229f67831e..7356e974b10ee0 100644
--- a/src/plugins/intel_gpu/tests/unit/test_cases/reorder_gpu_test.cpp
+++ b/src/plugins/intel_gpu/tests/unit/test_cases/reorder_gpu_test.cpp
@@ -1553,7 +1553,6 @@ TEST(reorder_gpu_f32, dynamic_bfyx_to_fsv16) {
         reorder("output_reorder", input_info("relu"), format::bfyx, data_types::f32));
 
     ExecutionConfig config = get_test_default_config(engine);
-    config.set_property(ov::intel_gpu::allow_new_shape_infer(true));
     network network(engine, topology, config);
 
     auto fsv16_reorder_inst = network.get_primitive("reorder");