Home | About | Posts | English

Comment#6 Outcomes of a quantitative analysis of 48 soil chronosequence studies in humid mid and high latitudes: Importance of vegetation in driving podzolization

2021/07/24

Topic:
Zwanzig, L., Zwanzig, M., and Sauer, D. 2021. Outcomes of a quantitative analysis of 48 soil chronosequence studies in humid mid and high latitudes: Importance of vegetation in driving podzolization. Catena, 196, 104821.
https://doi.org/10.1016/j.catena.2020.104821

Introduction

本篇文章的目的是統整許多有關淋澱土 (Spodosols) 化育的文章,並使用統計方法去分析。一般而言有利淋澱土形成的條件包含下列數項:

本篇文章為了探討這些常見的淋澱土成因理論,使用統計方法分析已發表的許多淋澱土剖面,也因此introduction寫得很短,讓我們繼續看方法的部分。

Methods

資料來源
作者們在期刊資料庫中以”Chronosequence (時間序列)”、”dated profile”與各種不同定義上的淋澱土名稱 (Podzol與Spodosol) 為關鍵字搜尋,將時間限定在全新世 (Holocene, 1萬1千7百年前至今) 以迴避掉大規模的氣候、植被改變,且排除熱帶地區的淋澱土因為熱帶地區被定年的淋澱土相當少,故選定的剖面都在中高緯度。
在刪除不具環境資訊、實驗方法不一致及缺乏定年資料的文章之後,作者選定48個文章,包含259個剖面的資料進行後續的分析,這些文章的研究地點主要在北美、歐洲及大洋洲。

資料整合
許多重要的環境參數包含

作者不包含其他資料 (例如母質資料) 的原因是數量太少,或是他們的分布太不平均了,但我個人覺得這個解釋有點牽強。
至於為何選擇E層厚度作為反應變數,作者解釋雖然E層的厚度只是淋澱土生成的其中一個結果,但 (1) 在每個剖面中都有被描述並記錄;(2) 在淋澱土生成早期即可被發現,比Bhs可反應更早的生成過程;(3) 基本上沒有0的數值。我個人認為 (2) 是合理的原因,但 (3) 有點牽強,而且作者說在所有資料中仍舊有25%是0,且E層並不一定代表淋澱土,作者一定沒看過臺灣的薄膠層弱育土 (Inceptisol),若要我選的話鐵鋁化學抽出的結果,尤其是Feo及Alo是可以考慮的,但也要繼續考慮作者使用的統計方法。
在選擇完參數並剔除不完整的資料後剩下176個剖面,並使用R來進行後續分析。

探索式資料分析 (Exploratory data analysis)
使用Cleveland dotplot來辨識並刪除具離群值 (outlier) 的數據。使用盒狀圖 (boxplot) 展示了不同植被類別的土壤具有相近的範圍,並計算相關係數。使用主成分分析來展示多維度上的離群值,並且發現在加入植被類別資料時,PC1+PC2的解釋程度從70%降到了45%,不過沒有發現多維度上的離群值 (有興趣的人可以去看他們的附錄,詳細到連code都附了)。
有幾個變數的關係很大,具有共線 (collinear) 性質,例如frosttrange在PCA圖上的位置很近。在篩選變數時最好保持使用的變數不具太高的共線性,因此刪除了MAT (和trange負線性相關)、frost (和trange正線性相關) 及黏粒 (和砂粒含量負線性相關),最後只有MAP、trange及砂粒三個變數。

模型選擇
作者們選擇了廣義線性模型 (generalized linear model, GLM),這是線性迴歸模型的衍生,可以處理不同分布類型 (不一定是常態分佈) 的反應變數來建立迴歸模型,但在目的上跟線性迴歸是一樣的。作者使用的是混合後的廣義線性混合模型 (generalized linear mixed model, GLMM)。
為了應對有0值存在的E層厚度 (所以我就覺得一開始用別的就簡單多了),作者納入一個會產生0數值的二項決策過程,簡單來說應該是如何決定反應變數為0的方法,包含兩個模型的組合:

最終選定的Zero-altered gamma (ZAG) model由白努利 (Bernoulli) 項與Gamma項組成,白努利項以GLMM處理E層的有無,Gamma項則是以Gamma distribution預測E層厚度。因為將「E層有無」這件事情獨立出來,後面的Gamma項並不用將那些沒有E層的數值考慮進去模型,就可以專注在不同變數對E層厚度的影響。

Results and discussion

作者適配的白努利模型有78%的準確度 (交叉驗證那些就省略不寫),這代表所記錄的這些參數的確對E層的有無是有影響的,然而Gamma項卻無法準確預測E層的厚度,這可能是由於各參數的分布範圍過廣,例如所蒐集的年份多集中在250,但1000-2500年的資料卻很少。

植被影響
在有杜鵑-針葉林植被的地區,較易在100年內生成具E層的土壤,使用白努利項來預測時,若將其餘參數固定,在杜鵑-針葉林混合的植被種類下在100年內就有95%的機率生成E層,在針葉林種類下100年內有76%的機率生成E層,其餘種類的則平均為69%的機率,顯示杜鵑-針葉林最適合生成E層,然而,在杜鵑植被下100內生成E層的機率中位數只有30% (不過範圍很大,5-74%)。
而生成E層機率最低的是矮灌木/草本植物,在100年內生成E層的機率中位數只有3% (1-10%)。根據Gamma項的預測,植被是影響E層厚度的最主要因素,在100年內會生成3-16 cm厚的E層,2500年會生成3-16 cm厚的E層,而10000年則會生成4-24 cm厚的E層。在針葉林下的E層厚度增加速度稍慢於落葉植物,在杜鵑下則更慢,100年內生成1-7 cm,5000年生成2-8 cm。這部分論點的弱化在於,這些不同地區的植被,同時也可能有不同母質,作者沒有記錄這些母質導致我們可能不知道造成影響的是母質還是植被。

時間影響
時間是土壤化育的一大重要角色,即使是很弱的成土作用,經過長時間累積也會很可觀。時間是白努利項中預測E層有無的第二重要因素,僅次於植被,在某些地區時間的重要性也超過植被 (雖然兩者很難互相比較,一個是連續資料一個是類別資料)。

氣候影響
淋澱土一般都生成於冷涼潮濕的氣候,有機質的分解被氣溫限制,且有充分的水向下移動。在模型中,MAP及trange並沒有辦法很好的預測E層的生成,作者推測可能是因為缺少了蒸發散量,MAP - 蒸發散量可能是較好的推測方式,而融雪之類的事件也需要考慮,因此在白努利項及Gamma項的模型中氣候的影響低於植被與時間。MAP數據集中在600-1500 mm而缺少變化也可能是原因之一,在這方面並沒有太好的解釋。

母質影響
作者雖然沒有母質資料,但以砂粒含量作為推測,但因為樣品的砂粒含量都很高,這部分結果也不太好。

Comments

這篇最接近於我現在的想法,以數學模型的方法將淋澱化程度和不同的因子表現出來,但這篇的缺點也很明顯,奠基在這個內容上我覺得可以掌握的重點有:

但現在較為模糊的想法在於如何將化學資料放入:取哪一層、淋澱層和薄膠層如何區分才能展示特色?
能不能利用模型預測薄膠層生成的條件,怎樣的條件會生成薄膠層?