CropToDataRange model implementation and use example #1090

ChrisLisbon · 2023-04-25T13:02:37Z

CropToDataRange model for regression and ts_prediction task which crop prediction to min and max data range with sigma uncertainty. This helps reduce error if is known that data belongs to range and cant be out of it.

Sigma_min and sigma_max - hyperparameters for optimization (if min and max not presented in train data).

Example demonstrates initial pipeline composing and tuning through methods (not API) for ice concentration prediction.

aim-pep8-bot · 2023-04-25T13:02:48Z

Hello @ChrisLisbon! Thanks for updating this PR. We checked the lines you've touched for PEP 8 issues, and found:

In the file examples/advanced/time_series_forecasting/ice_concentration_composing_tuning.py:

Line 15:1: F401 'fedot.core.repository.quality_metrics_repository.RegressionMetricsEnum' imported but unused
Line 114:38: E226 missing whitespace around arithmetic operator
Line 175:1: E265 block comment should start with '# '

Comment last updated at 2023-04-28 10:30:10 UTC

ChrisLisbon · 2023-04-25T13:09:42Z

fedot/core/repository/data/model_repository.json

+      "presets": ["fast_train", "ts"],
+      "tags": [
+        "simple",
+        "non_linear"


Поправьте меня, если этот дефолтный тег не подходит

Ну non_linear наверное можно убрать, а так вроде норм.

это просто дефолтный тег и какой-то из них нужно выбрать, иначе тест падает

nicl-nno · 2023-04-25T14:53:25Z

fedot/core/operations/evaluation/operation_implementations/models/post_processing.py

+
+        pass
+
+    def predict(self, input_data: InputData) -> OutputData:


Опиши хотя бы тут что имеется в виду по сигма.

valer1435 · 2023-04-25T18:30:12Z

examples/advanced/time_series_forecasting/ice_concentration_composing_tuning.py

+    lag2 = PipelineNode('lagged')
+    r1 = PipelineNode('ridge', nodes_from=[lag1])
+    r2 = PipelineNode('ridge', nodes_from=[lag2])
+    r3 = PipelineNode('ridge', nodes_from=[r1, r2])


Оставлю, как подсказку-пример, как такой пайплайн можно реализовать с помощью билдера:
pipeline= PipelineBuilder().add_node('lagged', branch_idx=1).add_node('ridge', branch_idx=1)
.add_node('lagged', branch_idx=2).add_node('ridge', branch_idx=2).join_branches('ridge').add_node('crop_range').build()

Что-то такое

спасибо, я оставила такую запись потому что она более интуитивно понятная и легко модифицируется

valer1435 · 2023-04-25T18:32:17Z

examples/advanced/time_series_forecasting/ice_concentration_composing_tuning.py

+    return rmse, mae
+
+
+def compose_pipeline(pipeline, train_data, task):


Почему все это не реализовать через апи федота? Не вижу параметров, которые нельзя добавить через апи

потому что через api падает. Мы это обсуждали, какие-то проблемы в големе в процессе фикса как я поняла

valer1435 · 2023-04-25T18:33:59Z

examples/advanced/time_series_forecasting/ice_concentration_composing_tuning.py

+    return tuned_pipeline
+
+
+df = pd.read_csv('../../data/ts/osisaf_ice_conc.csv')


Это лучше выделить в отдельную функцию main и вызывать через if name == 'main':

valer1435 · 2023-04-25T18:35:07Z

examples/advanced/time_series_forecasting/ice_concentration_composing_tuning.py

+prediction = pipeline.predict(predict_input)
+prediction_values = np.ravel(np.array(prediction.predict))
+
+rmse_tuning, mae_tuning = calculate_metrics(np.ravel(predict_input.target), prediction_values)


Подсчет метрик тоже упростился бы при использовании апи (используя get_metrics())

помню была дискуссия на тему того, какая метрика в этом методе используется и корректно ли она считается, поэтому лучше оставлю более прозрачный вариант

valer1435 · 2023-04-25T18:36:49Z

examples/advanced/time_series_forecasting/ice_concentration_composing_tuning.py

+rmse_tuning, mae_tuning = calculate_metrics(np.ravel(predict_input.target), prediction_values)
+plt.plot(np.ravel(predict_input.idx), np.ravel(predict_input.target), label='test')
+plt.plot(np.ravel(train_input.idx)[-1300:], np.ravel(train_input.target)[-1300:], label='history')
+plt.plot(np.ravel(predict_input.idx), prediction_values, label='prediction_after_tuning')


Тут тоже при использовании апи можно было бы вызвать plot_prediction

Он не позволяет отрезать диапазон так, как я это сделала для наглядности

valer1435 · 2023-04-25T18:39:20Z

fedot/core/operations/evaluation/operation_implementations/models/post_processing.py

+        sigma_min = self.params.get('sigma_min')
+        sigma_max = self.params.get('sigma_max')
+
+        min_value = self.params.get('min_value')


В какой момент параметры min_value и max_value приходят в self.params? Подозреваю, что это могут быть минимальные и максимальные значения трейн части.

А, увидел. Мы их сами задаем. Не особо очевидно. Почему вариант с минмаксом на трейн части может не прокатить?

Потому что пользователь может обладать экспертными знаниями о том, что параметр не выходит за рамки диапазона. В данном случае концентрация льда не может быть меньше 0 и больше 1

Если честно, пока не вижу смысла добавлять в таком виде модель в эволюцию. Сейчас получается так, что параметры границ ты задаешь извне, а при эволюции, когда мы добавляем ноду, она добавляется без параметров (ставятся дефолтные).

Да, если мы изначально добавим ноду в пайплайн - все ок, но если мы хотим, чтобы она автоматически добавилась - это работать не будет.

Там два варианта: 1) ты знаешь эти границы, задаешь их вручную и добавляешь ноду сам. 2) ты не знаешь границы, но данные сами по себе не выходят за диапазон и тогда мин и макс подбирается на основе данных с допуском в сигма, и тогда эта нода может быть уместна при эволюции. Внутри реализации 4 гиперпараметра.

valer1435 · 2023-04-25T18:41:50Z

fedot/core/operations/evaluation/operation_implementations/models/post_processing.py

+        max_value = self.params.get('max_value')
+
+        if not min_value:
+            min_value = np.nanmin(np.array(input_data.target))


Тут полноценный даталик - ты берешь информацию о свойствах таргета.

PS еще таргета может просто не быть, тогда работать не будет

valer1435 · 2023-04-25T18:48:01Z

fedot/core/repository/data/model_repository.json

@@ -230,6 +230,14 @@
        "non_linear"
      ]
    },
+    "crop_range": {


Проверь пж, что пайплайн с этой операцией имеет задуманные тобой ограничения. И что он вообще попадается в available_operations

Ограничения можно тут посмотреть

А почему он может не попадаться в available_operations? Эта модель задумана для любых табличных и векторных данных, на которых может применяться регрессия, вроде бы не вижу ничего особенного в ограничениях. На эволюции эта нода добавляется, значит available

maypink · 2023-04-25T19:07:24Z

examples/advanced/time_series_forecasting/ice_concentration_composing_tuning.py

+                        MutationTypesEnum.single_drop,
+                        MutationTypesEnum.single_add]
+    )
+    composer = ComposerBuilder(task=task). \


кажется, что стиль переносов должен быть единым. Например, как ниже в 68 строке с TunerBuilder

maypink · 2023-04-25T19:09:06Z

examples/advanced/time_series_forecasting/ice_concentration_composing_tuning.py

+    return tuned_pipeline
+
+
+df = pd.read_csv('../../data/ts/osisaf_ice_conc.csv')


относительные пути коварная штука, лучше поменять

valer1435 · 2023-05-02T14:43:00Z

После этого фикса работает в режиме api?

nicl-nno · 2024-05-07T14:30:35Z

Closed as obsolete

crop_to_range model implementation

042ca68

pep

5c8d779

ChrisLisbon commented Apr 25, 2023

View reviewed changes

ChrisLisbon requested a review from nicl-nno April 25, 2023 13:10

nicl-nno requested a review from valer1435 April 25, 2023 13:15

add strict parameters

d4d9111

nicl-nno reviewed Apr 25, 2023

View reviewed changes

nicl-nno approved these changes Apr 25, 2023

View reviewed changes

valer1435 requested changes Apr 25, 2023

View reviewed changes

maypink requested changes Apr 25, 2023

View reviewed changes

local experiments

42dae3b

nicl-nno closed this May 7, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

CropToDataRange model implementation and use example #1090

CropToDataRange model implementation and use example #1090

ChrisLisbon commented Apr 25, 2023

aim-pep8-bot commented Apr 25, 2023 •

edited

Loading

ChrisLisbon Apr 25, 2023

nicl-nno Apr 25, 2023

ChrisLisbon Apr 26, 2023

nicl-nno Apr 25, 2023

valer1435 Apr 25, 2023

ChrisLisbon Apr 26, 2023

valer1435 Apr 25, 2023

ChrisLisbon Apr 26, 2023

valer1435 Apr 25, 2023

valer1435 Apr 25, 2023

ChrisLisbon Apr 26, 2023

valer1435 Apr 25, 2023

ChrisLisbon Apr 26, 2023

valer1435 Apr 25, 2023

valer1435 Apr 25, 2023

ChrisLisbon Apr 26, 2023

valer1435 Apr 26, 2023

ChrisLisbon Apr 26, 2023

valer1435 Apr 25, 2023

valer1435 Apr 25, 2023

valer1435 Apr 26, 2023

ChrisLisbon Apr 26, 2023

maypink Apr 25, 2023

maypink Apr 25, 2023

valer1435 commented May 2, 2023 •

edited

Loading

nicl-nno commented May 7, 2024

		return rmse, mae


		def compose_pipeline(pipeline, train_data, task):

		return tuned_pipeline


		df = pd.read_csv('../../data/ts/osisaf_ice_conc.csv')

CropToDataRange model implementation and use example #1090

CropToDataRange model implementation and use example #1090

Conversation

ChrisLisbon commented Apr 25, 2023

aim-pep8-bot commented Apr 25, 2023 • edited Loading

Comment last updated at 2023-04-28 10:30:10 UTC

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

valer1435 commented May 2, 2023 • edited Loading

nicl-nno commented May 7, 2024

aim-pep8-bot commented Apr 25, 2023 •

edited

Loading

valer1435 commented May 2, 2023 •

edited

Loading