[feat] clean up fg_encoded in doc (#287)

tiankongdeguiji · web-flow · commit ee3cb117af73 · 2025-10-15T10:06:52.000+08:00
diff --git a/docs/source/feature/data.md b/docs/source/feature/data.md
@@ -6,13 +6,13 @@ TorchEasyRec作为阿里云PAI的推荐算法包，可以无缝对接MaxCompute
 
 **一个最简单的data config的配置**
 
-这个配置里面，读取MaxCompute的表作为输入数据（OdpsDataset），并且输入数据已经编码好（fg_encoded），每个worker上以8192的batch_size，并行度为8来读取数据
+这个配置里面，读取MaxCompute的表作为输入数据（OdpsDataset），并且输入数据已经编码好，每个worker上以8192的batch_size，并行度为8来读取数据
 
 ```
 data_config {
     batch_size: 8192
     dataset_type: OdpsDataset
-    fg_encoded: true
+    fg_mode: FG_NONE
     label_fields: "clk"
     num_workers: 8
 }
@@ -249,7 +249,7 @@ sample_weight_fields: 'col_name'
 
 ### fg_encoded_multival_sep
 
-- fg_encoded=true时，数据的多值分割符，默认为chr(3)
+- fg_mode=FG_NONE 数据已经被FG编码好 时，数据的多值分割符，默认为chr(3)
 
 ### input_fields
 
diff --git a/docs/source/feature/feature.md b/docs/source/feature/feature.md
@@ -18,7 +18,7 @@ TorchEasyRec多种类型的特征，包括IdFeature、RawFeature、ComboFeature
 
 - **separator**: FG在输入为string类型时的多值分隔符，默认为`\x1d`。更建议用数组（ARRAY）类型来表示多值，训练和推理性能更好
 
-- **fg_encoded_default_value**: FG编码后的数据的默认值，当fg_encoded=true并且不是用pai-fg编码数据时，可以设置该参数填充空值
+- **fg_encoded_default_value**: FG编码后的数据的默认值，当fg_mode=FG_NONE并且不是用pai-fg编码数据时，可以设置该参数填充空值
 
 - **trainable**: Embedding Variable是否可训练，默认为true
 
@@ -34,7 +34,7 @@ TorchEasyRec多种类型的特征，包括IdFeature、RawFeature、ComboFeature
 feature_configs {
     id_feature {
         feature_name: "uid"
-        # fg_encoded=true的情况下，expression可以不写
+        # fg_mode=FG_NONE 数据已经被FG编号好的情况下，expression可以不写
         expression: "user:uid"
         embedding_dim: 32
         hash_bucket_size: 100000
diff --git a/docs/source/quick_start/local_tutorial.md b/docs/source/quick_start/local_tutorial.md
@@ -147,8 +147,8 @@ data_config {
     batch_size: 8192
     # 输入数据类型，还可以支持 CsvDataset | OdpsDataset 等
     dataset_type: ParquetDataset
-    # 数据是否已经进行FG编码，如果为false，将会进行训练时FG
-    fg_encoded: false
+    # 数据在训练时是否运行FG，fg_mode=FG_DAG时将会进行训练时FG
+    fg_mode: FG_DAG
     # Label的名称
     label_fields: "clk"
     # 每个proc上的读数据并行度