comments and ready

Rachel Chen · Rachel Chen · commit 5ca02ece2768 · 2025-03-20T15:38:00.000-07:00
diff --git a/snuba/datasets/entities/storage_selectors/eap_items.py b/snuba/datasets/entities/storage_selectors/eap_items.py
@@ -20,7 +20,7 @@ def select_storage(
 
         tier = query_settings.get_sampling_tier()
 
-        if tier == Tier.TIER_1:
+        if tier == Tier.TIER_1 or tier == Tier.TIER_NO_TIER:
             storage_key = StorageKey.EAP_ITEMS
         else:
             storage_key = getattr(StorageKey, f"EAP_ITEMS_DOWNSAMPLE_{tier.value}")
diff --git a/snuba/downsampled_storage_tiers.py b/snuba/downsampled_storage_tiers.py
@@ -2,6 +2,7 @@
 
 
 class Tier(Enum):
+    TIER_NO_TIER = -1
     TIER_1 = 1
     TIER_8 = 8
     TIER_64 = 64
diff --git a/snuba/query/query_settings.py b/snuba/query/query_settings.py
@@ -87,7 +87,7 @@ def __init__(
         apply_default_subscriptable_mapping: bool = True,
     ) -> None:
         super().__init__()
-        self.__tier = Tier.TIER_1
+        self.__tier = Tier.TIER_NO_TIER
         self.__turbo = turbo
         self.__consistent = consistent
         self.__debug = debug
diff --git a/snuba/web/db_query.py b/snuba/web/db_query.py
@@ -67,6 +67,9 @@
     SerializableExceptionDict,
 )
 from snuba.web import QueryException, QueryResult, constants
+from snuba.web.rpc.v1.resolvers.R_eap_spans.common.sampling_in_storage_util import (
+    add_sampling_tier_to_query_stats,
+)
 
 metrics = MetricsWrapper(environment.metrics, "db_query")
 
@@ -732,6 +735,9 @@ def db_query(
             metrics.increment("cache_miss", tags={"dataset": dataset_name})
         if stats.get("cache_hit_simple"):
             metrics.increment("cache_hit_simple", tags={"dataset": dataset_name})
+
+        add_sampling_tier_to_query_stats(result, query_settings)
+
         if result:
             return result
         raise error or Exception(
diff --git a/snuba/web/rpc/common/debug_info.py b/snuba/web/rpc/common/debug_info.py
@@ -15,6 +15,29 @@
 from snuba.web import QueryResult
 
 
+def _construct_meta_if_downsampled(
+    query_results: List[QueryResult],
+) -> DownsampledStorageMeta | None:
+    highest_sampling_tier = Tier.TIER_NO_TIER
+
+    for query_result in query_results:
+        sampling_tier = query_result.extra.get("stats", {}).get("sampling_tier")
+        if sampling_tier:
+            if sampling_tier.value > highest_sampling_tier.value:
+                highest_sampling_tier = sampling_tier
+
+    return (
+        DownsampledStorageMeta(
+            tier=getattr(
+                DownsampledStorageMeta.SelectedTier,
+                "SELECTED_" + highest_sampling_tier.name,
+            ),
+        )
+        if highest_sampling_tier != Tier.TIER_NO_TIER
+        else None
+    )
+
+
 def extract_response_meta(
     request_id: str,
     debug: bool,
@@ -24,20 +47,7 @@ def extract_response_meta(
 ) -> ResponseMeta:
     query_info: List[QueryInfo] = []
 
-    downsampled_storage_meta = None
-
-    if extract_sampling_tier:
-        assert (
-            len(query_results) == 1
-        ), "we can only extract 1 result at a time for EndpointTimeSeres and EndpointTraceItemTable"
-        sampling_tier = (
-            query_results[0].extra.get("stats", {}).get("sampling_tier", Tier.TIER_1)
-        )
-        downsampled_storage_meta = DownsampledStorageMeta(
-            tier=getattr(
-                DownsampledStorageMeta.SelectedTier, "SELECTED_" + sampling_tier.name
-            ),
-        )
+    downsampled_storage_meta = _construct_meta_if_downsampled(query_results)
 
     if not debug:
         return (
diff --git a/snuba/web/rpc/v1/resolvers/R_eap_spans/common/sampling_in_storage_util.py b/snuba/web/rpc/v1/resolvers/R_eap_spans/common/sampling_in_storage_util.py
@@ -27,6 +27,7 @@ def construct_query_settings(
 def add_sampling_tier_to_query_stats(
     query_result: QueryResult, query_settings: HTTPQuerySettings
 ) -> None:
-    stats = dict(query_result.extra["stats"])
-    stats["sampling_tier"] = query_settings.get_sampling_tier()
-    query_result.extra["stats"] = stats
+    if query_settings.get_sampling_tier() != Tier.TIER_NO_TIER:
+        stats = dict(query_result.extra["stats"])
+        stats["sampling_tier"] = query_settings.get_sampling_tier()
+        query_result.extra["stats"] = stats
diff --git a/snuba/web/rpc/v1/resolvers/R_eap_spans/resolver_time_series.py b/snuba/web/rpc/v1/resolvers/R_eap_spans/resolver_time_series.py
@@ -55,7 +55,6 @@
     use_eap_items_table,
 )
 from snuba.web.rpc.v1.resolvers.R_eap_spans.common.sampling_in_storage_util import (
-    add_sampling_tier_to_query_stats,
     construct_query_settings,
 )
 
@@ -148,6 +147,7 @@ def _convert_result_timeseries(
     ]
 
     # this loop fill in our pre-computed dictionaries so that we can zerofill later
+    print("datainresultconverstion", data)
     for row in data:
         group_by_map = {}
 
@@ -399,7 +399,7 @@ def resolve(self, in_msg: TimeSeriesRequest) -> TimeSeriesResponse:
             request=snuba_request,
             timer=self._timer,
         )
-        add_sampling_tier_to_query_stats(res, query_settings)
+        # add_sampling_tier_to_query_stats(res, query_settings)
         response_meta = extract_response_meta(
             in_msg.meta.request_id,
             in_msg.meta.debug,
diff --git a/snuba/web/rpc/v1/resolvers/R_eap_spans/resolver_trace_item_table.py b/snuba/web/rpc/v1/resolvers/R_eap_spans/resolver_trace_item_table.py
@@ -56,7 +56,6 @@
     use_eap_items_table,
 )
 from snuba.web.rpc.v1.resolvers.R_eap_spans.common.sampling_in_storage_util import (
-    add_sampling_tier_to_query_stats,
     construct_query_settings,
 )
 
@@ -370,7 +369,7 @@ def resolve(self, in_msg: TraceItemTableRequest) -> TraceItemTableResponse:
             request=snuba_request,
             timer=self._timer,
         )
-        add_sampling_tier_to_query_stats(res, query_settings)
+        # add_sampling_tier_to_query_stats(res, query_settings)
         column_values = convert_results(in_msg, res.result.get("data", []))
         response_meta = extract_response_meta(
             in_msg.meta.request_id,
diff --git a/tests/conftest.py b/tests/conftest.py
@@ -13,7 +13,7 @@
 )
 from snuba.core.initialize import initialize_snuba
 from snuba.datasets.factory import reset_dataset_factory
-from snuba.datasets.schemas.tables import WritableTableSchema
+from snuba.datasets.schemas.tables import TableSchema
 from snuba.datasets.storages.factory import get_all_storage_keys, get_storage
 from snuba.environment import setup_sentry
 from snuba.redis import all_redis_clients
@@ -189,15 +189,20 @@ def _clear_db() -> None:
         database = cluster.get_database()
 
         schema = storage.get_schema()
-        if isinstance(schema, WritableTableSchema):
+        if isinstance(schema, TableSchema):
             table_name = schema.get_local_table_name()
 
             nodes = [*cluster.get_local_nodes(), *cluster.get_distributed_nodes()]
             for node in nodes:
                 connection = cluster.get_node_connection(
                     ClickhouseClientSettings.MIGRATE, node
                 )
-                connection.execute(f"TRUNCATE TABLE IF EXISTS {database}.{table_name}")
+                try:
+                    connection.execute(
+                        f"TRUNCATE TABLE IF EXISTS {database}.{table_name}"
+                    )
+                except Exception:
+                    pass
 
 
 @pytest.fixture
diff --git a/tests/web/rpc/v1/test_endpoint_time_series/test_endpoint_time_series.py b/tests/web/rpc/v1/test_endpoint_time_series/test_endpoint_time_series.py
@@ -1293,6 +1293,17 @@ def test_preflight(self) -> None:
             metrics=[DummyMetric("test_preflight_metric", get_value=lambda x: 1)],
         )
 
+        aggregations = [
+            AttributeAggregation(
+                aggregate=Function.FUNCTION_SUM,
+                key=AttributeKey(
+                    type=AttributeKey.TYPE_FLOAT, name="test_preflight_metric"
+                ),
+                label="sum",
+                extrapolation_mode=ExtrapolationMode.EXTRAPOLATION_MODE_NONE,
+            ),
+        ]
+
         preflight_message = TimeSeriesRequest(
             meta=RequestMeta(
                 project_ids=[1, 2, 3],
@@ -1308,22 +1319,35 @@ def test_preflight(self) -> None:
                     mode=DownsampledStorageConfig.MODE_PREFLIGHT
                 ),
             ),
-            aggregations=[
-                AttributeAggregation(
-                    aggregate=Function.FUNCTION_SUM,
-                    key=AttributeKey(
-                        type=AttributeKey.TYPE_FLOAT, name="test_preflight_metric"
-                    ),
-                    label="sum",
-                    extrapolation_mode=ExtrapolationMode.EXTRAPOLATION_MODE_NONE,
+            aggregations=aggregations,
+            granularity_secs=granularity_secs,
+        )
+
+        message_to_non_downsampled_tier = TimeSeriesRequest(
+            meta=RequestMeta(
+                project_ids=[1, 2, 3],
+                organization_id=1,
+                cogs_category="something",
+                referrer="something",
+                start_timestamp=Timestamp(seconds=int(BASE_TIME.timestamp())),
+                end_timestamp=Timestamp(
+                    seconds=int(BASE_TIME.timestamp() + query_duration)
                 ),
-            ],
+                trace_item_type=TraceItemType.TRACE_ITEM_TYPE_SPAN,
+            ),
+            aggregations=aggregations,
             granularity_secs=granularity_secs,
         )
 
         preflight_response = EndpointTimeSeries().execute(preflight_message)
+        non_downsampled_tier_response = EndpointTimeSeries().execute(
+            message_to_non_downsampled_tier
+        )
 
-        assert preflight_response.result_timeseries == []
+        assert (
+            len(preflight_response.result_timeseries)
+            < len(non_downsampled_tier_response.result_timeseries) / 100
+        )
         assert (
             preflight_response.meta.downsampled_storage_meta
             == DownsampledStorageMeta(
diff --git a/tests/web/rpc/v1/test_endpoint_trace_item_table/test_endpoint_trace_item_table.py b/tests/web/rpc/v1/test_endpoint_trace_item_table/test_endpoint_trace_item_table.py
@@ -3114,13 +3114,17 @@ def test_preflight(self, setup_teardown: Any) -> None:
                 msg_timestamp,
                 tags={"preflighttag": "preflight"},
             )
-            for i in range(30)
+            for _ in range(30)
         ]
         write_raw_unprocessed_events(items_storage, messages)  # type: ignore
 
         ts = Timestamp(seconds=int(BASE_TIME.timestamp()))
         hour_ago = int((BASE_TIME - timedelta(hours=1)).timestamp())
-        message = TraceItemTableRequest(
+
+        columns = [
+            Column(key=AttributeKey(type=AttributeKey.TYPE_STRING, name="preflighttag"))
+        ]
+        preflight_message = TraceItemTableRequest(
             meta=RequestMeta(
                 project_ids=[1, 2, 3],
                 organization_id=1,
@@ -3134,14 +3138,38 @@ def test_preflight(self, setup_teardown: Any) -> None:
                     mode=DownsampledStorageConfig.MODE_PREFLIGHT
                 ),
             ),
+            columns=columns,
+        )
+
+        message_to_non_downsampled_tier = TraceItemTableRequest(
+            meta=RequestMeta(
+                project_ids=[1, 2, 3],
+                organization_id=1,
+                cogs_category="something",
+                referrer="something",
+                start_timestamp=Timestamp(seconds=hour_ago),
+                end_timestamp=ts,
+                request_id="be3123b3-2e5d-4eb9-bb48-f38eaa9e8480",
+                trace_item_type=TraceItemType.TRACE_ITEM_TYPE_SPAN,
+            ),
             columns=[
                 Column(
                     key=AttributeKey(type=AttributeKey.TYPE_STRING, name="preflighttag")
                 )
             ],
         )
-        response = EndpointTraceItemTable().execute(message)
-        assert response.column_values == []
-        assert response.meta.downsampled_storage_meta == DownsampledStorageMeta(
-            tier=DownsampledStorageMeta.SelectedTier.SELECTED_TIER_512
+
+        preflight_response = EndpointTraceItemTable().execute(preflight_message)
+        non_downsampled_tier_response = EndpointTraceItemTable().execute(
+            message_to_non_downsampled_tier
+        )
+        assert (
+            len(preflight_response.column_values)
+            < len(non_downsampled_tier_response.column_values) / 100
+        )
+        assert (
+            preflight_response.meta.downsampled_storage_meta
+            == DownsampledStorageMeta(
+                tier=DownsampledStorageMeta.SelectedTier.SELECTED_TIER_512
+            )
         )

Original file line number	Diff line number	Diff line change
`@@ -55,7 +55,6 @@`
`55`	`55`	`use_eap_items_table,`
`56`	`56`	`)`
`57`	`57`	`from snuba.web.rpc.v1.resolvers.R_eap_spans.common.sampling_in_storage_util import (`
`58`		`- add_sampling_tier_to_query_stats,`
`59`	`58`	`construct_query_settings,`
`60`	`59`	`)`
`61`	`60`
`@@ -148,6 +147,7 @@ def _convert_result_timeseries(`
`148`	`147`	`]`
`149`	`148`
`150`	`149`	`# this loop fill in our pre-computed dictionaries so that we can zerofill later`
	`150`	`+ print("datainresultconverstion", data)`
`151`	`151`	`for row in data:`
`152`	`152`	`group_by_map = {}`
`153`	`153`
`@@ -399,7 +399,7 @@ def resolve(self, in_msg: TimeSeriesRequest) -> TimeSeriesResponse:`
`399`	`399`	`request=snuba_request,`
`400`	`400`	`timer=self._timer,`
`401`	`401`	`)`
`402`		`- add_sampling_tier_to_query_stats(res, query_settings)`
	`402`	`+ # add_sampling_tier_to_query_stats(res, query_settings)`
`403`	`403`	`response_meta = extract_response_meta(`
`404`	`404`	`in_msg.meta.request_id,`
`405`	`405`	`in_msg.meta.debug,`
Original file line number	Diff line number	Diff line change
`@@ -56,7 +56,6 @@`
`56`	`56`	`use_eap_items_table,`
`57`	`57`	`)`
`58`	`58`	`from snuba.web.rpc.v1.resolvers.R_eap_spans.common.sampling_in_storage_util import (`
`59`		`- add_sampling_tier_to_query_stats,`
`60`	`59`	`construct_query_settings,`
`61`	`60`	`)`
`62`	`61`
`@@ -370,7 +369,7 @@ def resolve(self, in_msg: TraceItemTableRequest) -> TraceItemTableResponse:`
`370`	`369`	`request=snuba_request,`
`371`	`370`	`timer=self._timer,`
`372`	`371`	`)`
`373`		`- add_sampling_tier_to_query_stats(res, query_settings)`
	`372`	`+ # add_sampling_tier_to_query_stats(res, query_settings)`
`374`	`373`	`column_values = convert_results(in_msg, res.result.get("data", []))`
`375`	`374`	`response_meta = extract_response_meta(`
`376`	`375`	`in_msg.meta.request_id,`