[Example] Add STAFNet Model for Air Quality Prediction #1070

dylan-yin · 2025-02-07T13:02:36Z

PR types

PR changes

Describe

CLAassistant · 2025-02-07T13:02:43Z

All committers have signed the CLA.

HydrogenSulfate

整体项目请使用pre-commit格式化一边

HydrogenSulfate · 2025-02-10T03:17:57Z

examples/demo/conf/stafnet.yaml

@@ -0,0 +1,136 @@
+hydra:


配置文件开头请加上以下字段：

PaddleScience/examples/ldc/conf/ldc_2d_Re3200_piratenet.yaml

Lines 1 to 9 in fad6927

defaults:

- ppsci_default

- TRAIN: train_default

- TRAIN/ema: ema_default

- TRAIN/swa: swa_default

- EVAL: eval_default

- INFER: infer_default

- hydra/job/config/override_dirname/exclude_keys: exclude_keys_default

- _self_

HydrogenSulfate · 2025-02-10T03:18:07Z

examples/demo/conf/stafnet.yaml

+    config:
+      override_dirname:
+        exclude_keys:
+          - TRAIN.checkpoint_path
+          - TRAIN.pretrained_model_path
+          - EVAL.pretrained_model_path
+          - mode
+          - output_dir
+          - log_freq


这个可以删了

HydrogenSulfate · 2025-02-10T03:18:45Z

examples/demo/conf/stafnet.yaml

+STAFNet_DATA_PATH: "/data6/home/yinhang2021/workspace/SATFNet/data/2020-2023_new/train_data.pkl" # 
+DATASET:
+  label_keys: ["label"]
+  data_dir: "/data6/home/yinhang2021/workspace/SATFNet/data/2020-2023_new/train_data.pkl"
+  STAFNet_DATA_args: {
+            "data_dir": "/data6/home/yinhang2021/workspace/SATFNet/data/2020-2023_new/train_data.pkl",
+            "batch_size": 1,
+            "shuffle": True,
+            "num_workers": 0,
+            "training": True
+        }
+
+
+
+# "data_dir": "data/2020-2023_new/train_data.pkl",
+#             "batch_size": 32,
+#             "shuffle": True,
+#             "num_workers": 0,
+#             "training": True
+# model settings
+# MODEL: # 
+


建议改为相对路径，以./data/...开头即可

HydrogenSulfate · 2025-02-10T03:19:04Z

examples/demo/conf/stafnet.yaml

+# "data_dir": "data/2020-2023_new/train_data.pkl",
+#             "batch_size": 32,
+#             "shuffle": True,
+#             "num_workers": 0,
+#             "training": True
+# model settings
+# MODEL: # 


这个注释如果没用的可以删除

HydrogenSulfate · 2025-02-10T03:19:16Z

examples/demo/conf/stafnet.yaml

+  # configs: {
+  #         "task_name": "forecast",
+  #         "output_attention": False,
+  #         "seq_len": 72,
+  #         "label_len": 24,
+  #         "pred_len": 48,
+
+  #         "aq_gat_node_features" : 7,
+  #         "aq_gat_node_num": 35,
+
+  #         "mete_gat_node_features" : 7,
+  #         "mete_gat_node_num": 18,
+
+  #         "gat_hidden_dim": 32,
+  #         "gat_edge_dim": 3,
+  #         "gat_embed_dim": 32,
+
+  #         "e_layers": 1,
+  #         "enc_in": 7,
+  #         "dec_in": 7,
+  #         "c_out": 7,
+  #         "d_model": 16 ,
+  #         "embed": "fixed",
+  #         "freq": "t",
+  #         "dropout": 0.05,
+  #         "factor": 3,
+  #         "n_heads": 4,
+
+  #         "d_ff": 32 ,
+  #         "num_kernels": 6,
+  #         "top_k": 4
+  #     }


同上，如果没用可以删除

HydrogenSulfate · 2025-02-10T03:22:09Z

examples/demo/demo.py

+
+
+
+


避免连续空行

HydrogenSulfate · 2025-02-10T03:22:59Z

examples/demo/demo.py

+    # set random seed for reproducibility
+    ppsci.utils.misc.set_random_seed(42)
+    # set output directory
+    OUTPUT_DIR = "./output_example"
+    # initialize logger
+    logger.init_logger("ppsci", f"{OUTPUT_DIR}/train.log", "info")


这个可以删除，output_dir会由ppsci.utils.callbacks.InitCallback自动创建:

PaddleScience/ppsci/utils/callbacks.py

Lines 90 to 96 in fad6927

logger.init_logger(

"ppsci",

osp.join(full_cfg.output_dir, f"{full_cfg.mode}.log")

if full_cfg.output_dir and full_cfg.mode not in ["export", "infer"]

else None,

full_cfg.log_level,

)

HydrogenSulfate · 2025-02-10T03:23:20Z

ppsci/arch/stafnet.py

+from typing import Tuple
+
+class Inception_Block_V1(paddle.nn.Layer):
+


冗余的空行请删除，下同

ppsci/arch/stafnet.py

ppsci/data/dataset/stafnet_dataset.py

HydrogenSulfate · 2025-02-12T05:31:51Z

examples/demo/conf/stafnet.yaml

+output_dir: ${hydra:run.dir}
+log_freq: 20
+# dataset setting
+STAFNet_DATA_PATH: "/data6/home/yinhang2021/dataset/chongqing_1921/train_data.pkl" # 


这里的路径是否能改成相对路径？比如 ./dataset/train_data.pkl，其余的路径字段也是，建议改为相对路径，并去掉用户名

STAFNet_DATA_PATH是否应该放到DATASET字段下？

HydrogenSulfate · 2025-02-12T05:33:02Z

examples/demo/conf/stafnet.yaml

+
+
+MODEL:
+  input_keys: ["aq_train_data","mete_train_data",]


Suggested change

input_keys: ["aq_train_data","mete_train_data",]

input_keys: [aq_train_data, mete_train_data]

HydrogenSulfate · 2025-02-12T05:33:06Z

examples/demo/conf/stafnet.yaml

+
+MODEL:
+  input_keys: ["aq_train_data","mete_train_data",]
+  output_keys: ["label"]


Suggested change

output_keys: ["label"]

output_keys: [label]

HydrogenSulfate · 2025-02-12T05:33:23Z

examples/demo/conf/stafnet.yaml

+  checkpoint_path: null 
+
+EVAL:
+  eval_data_path: "/data6/home/yinhang2021/dataset/chongqing_1921/val_data.pkl"


Suggested change

eval_data_path: "/data6/home/yinhang2021/dataset/chongqing_1921/val_data.pkl"

eval_data_path: ./dataset/val_data.pkl

HydrogenSulfate · 2025-02-12T05:34:06Z

examples/demo/conf/stafnet.yaml

+STAFNet_DATA_PATH: "/data6/home/yinhang2021/dataset/chongqing_1921/train_data.pkl" # 
+DATASET:
+  label_keys: ["label"]
+  data_dir: "/data6/home/yinhang2021/dataset/chongqing_1921/train_data.pkl"


data_dir为什么是具体文件路径而不是某个文件夹路径?

此处的路径是否跟STAFNet_DATA_PATH重复了？

HydrogenSulfate · 2025-02-12T05:37:13Z

examples/demo/demo.py

+        cfg.TRAIN.epochs,
+        ITERS_PER_EPOCH,
+        eval_during_train=cfg.TRAIN.eval_during_train,
+        seed=cfg.seed,


Suggested change

seed=cfg.seed,

HydrogenSulfate · 2025-02-12T05:37:30Z

examples/demo/demo.py

+    """
+    Validate after training an epoch
+
+    :param epoch: Integer, current training epoch.
+    :return: A log that contains information about validation
+    """


Suggested change

"""

Validate after training an epoch

:param epoch: Integer, current training epoch.

:return: A log that contains information about validation

"""

HydrogenSulfate · 2025-02-12T05:37:52Z

examples/demo/demo.py

+        "sampler": {
+            "name": "BatchSampler",
+            "drop_last": False,
+            "shuffle": True,
+        },


Suggested change

"sampler": {

"name": "BatchSampler",

"drop_last": False,

"shuffle": True,

},

HydrogenSulfate · 2025-02-12T05:38:01Z

examples/demo/demo.py

+    # set random seed for reproducibility
+    ppsci.utils.misc.set_random_seed(42)
+    # set output directory
+    OUTPUT_DIR = "./output_example"
+    # initialize logger
+    logger.init_logger("ppsci", f"{OUTPUT_DIR}/train.log", "info")


Suggested change

# set random seed for reproducibility

ppsci.utils.misc.set_random_seed(42)

# set output directory

OUTPUT_DIR = "./output_example"

# initialize logger

logger.init_logger("ppsci", f"{OUTPUT_DIR}/train.log", "info")

HydrogenSulfate · 2025-02-12T05:38:38Z

examples/demo/demo.py

+    OUTPUT_DIR = "./output_example"
+    # initialize logger
+    logger.init_logger("ppsci", f"{OUTPUT_DIR}/train.log", "info")
+    multiprocessing.set_start_method("spawn")


这句代码是什么作用？paddle的多卡训练不需要这样吧？

我这边如果不加 multiprocessing.set_start_method("spawn")，会出现cuda error（3）

我这边如果不加 multiprocessing.set_start_method("spawn")，会出现cuda error（3）

这是多卡训练时才会出现的吗？你的训练命令是什么呢？如果按照我们文档里给的数据并行命令，也会报错吗？

dylan-yin added 6 commits February 7, 2025 20:26

Add files via upload

f79a3f9

Add files via upload

68b23d1

Update __init__.py

d9d2b54

Add files via upload

bfa3e69

Merge branch 'PaddlePaddle:develop' into dev_model

2d9dc85

Update __init__.py

57dc7c2

paddle-bot bot added the contributor label Feb 7, 2025

HydrogenSulfate reviewed Feb 10, 2025

View reviewed changes

dylan-yin added 5 commits February 11, 2025 23:12

Merge branch 'PaddlePaddle:develop' into dev_model

fa1cdee

Update demo.py

ab1ae03

Update stafnet.yaml

d257a49

Update stafnet.py

b43c7f5

Update stafnet_dataset.py

757477a

HydrogenSulfate changed the title ~~Add STAFNet Model for Air Quality Prediction~~ [Example] Add STAFNet Model for Air Quality Prediction Feb 12, 2025

HydrogenSulfate reviewed Feb 12, 2025

View reviewed changes

dylan-yin added 5 commits February 14, 2025 21:39

Merge branch 'PaddlePaddle:develop' into dev_model

2b46497

Update stafnet.yaml

711cd36

Update demo.py

a79ad1d

Update stafnet.yaml

af96434

Update demo.py

86a9c0b

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[Example] Add STAFNet Model for Air Quality Prediction #1070

[Example] Add STAFNet Model for Air Quality Prediction #1070

dylan-yin commented Feb 7, 2025

CLAassistant commented Feb 7, 2025 •

edited

Loading

HydrogenSulfate left a comment

HydrogenSulfate Feb 10, 2025

HydrogenSulfate Feb 10, 2025

HydrogenSulfate Feb 10, 2025

HydrogenSulfate Feb 10, 2025

HydrogenSulfate Feb 10, 2025

HydrogenSulfate Feb 10, 2025

HydrogenSulfate Feb 10, 2025

HydrogenSulfate Feb 10, 2025

HydrogenSulfate Feb 12, 2025

HydrogenSulfate Feb 12, 2025

HydrogenSulfate Feb 12, 2025

HydrogenSulfate Feb 12, 2025

HydrogenSulfate Feb 12, 2025

HydrogenSulfate Feb 12, 2025

HydrogenSulfate Feb 12, 2025

HydrogenSulfate Feb 12, 2025

HydrogenSulfate Feb 12, 2025

HydrogenSulfate Feb 12, 2025

dylan-yin Feb 14, 2025

HydrogenSulfate Feb 17, 2025

	defaults:
	- ppsci_default
	- TRAIN: train_default
	- TRAIN/ema: ema_default
	- TRAIN/swa: swa_default
	- EVAL: eval_default
	- INFER: infer_default
	- hydra/job/config/override_dirname/exclude_keys: exclude_keys_default
	- _self_

	logger.init_logger(
	"ppsci",
	osp.join(full_cfg.output_dir, f"{full_cfg.mode}.log")
	if full_cfg.output_dir and full_cfg.mode not in ["export", "infer"]
	else None,
	full_cfg.log_level,
	)

		from typing import Tuple

		class Inception_Block_V1(paddle.nn.Layer):

	input_keys: ["aq_train_data","mete_train_data",]
	input_keys: [aq_train_data, mete_train_data]

	eval_data_path: "/data6/home/yinhang2021/dataset/chongqing_1921/val_data.pkl"
	eval_data_path: ./dataset/val_data.pkl

[Example] Add STAFNet Model for Air Quality Prediction #1070

Are you sure you want to change the base?

[Example] Add STAFNet Model for Air Quality Prediction #1070

Conversation

dylan-yin commented Feb 7, 2025

PR types

PR changes

Describe

CLAassistant commented Feb 7, 2025 • edited Loading

HydrogenSulfate left a comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

CLAassistant commented Feb 7, 2025 •

edited

Loading