統(tǒng)計與數(shù)據(jù)科學(xué)學(xué)院 報道
近日,我校統(tǒng)計與數(shù)據(jù)科學(xué)學(xué)院博士生任陽完成的學(xué)術(shù)論文“Spectral Clustering for Functional Data with Asymptotic Properties”以南京審計大學(xué)為第一署名單位被統(tǒng)計學(xué)權(quán)威期刊Statistica Sinica接收。論文指導(dǎo)教師為我校統(tǒng)計與數(shù)據(jù)科學(xué)學(xué)院林金官教授,王江艷副教授與加拿大滑鐵盧大學(xué)桑培俊副教授。

傳統(tǒng)聚類方法主要是針對多元數(shù)據(jù)開發(fā)的,往往難以捕捉函數(shù)型數(shù)據(jù)的連續(xù)性與動態(tài)性,進而忽略了關(guān)鍵特征。針對這一問題,該論文提出一種兩階段函數(shù)型數(shù)據(jù)譜聚類(TSFDSC)方法,該方法可借助圖拉普拉斯算子,有效實現(xiàn)對稠密型和稀疏型函數(shù)數(shù)據(jù)的聚類。對于稠密函數(shù)型數(shù)據(jù),先將其投影至一組預(yù)設(shè)的基函數(shù)上,再對投影得到的系數(shù)進行譜聚類;對于稀疏函數(shù)型數(shù)據(jù),則改用函數(shù)主成分得分開展聚類。通過利用譜嵌入生成的低維表征,該方法實現(xiàn)了計算效率的提升。論文推導(dǎo)并證明了所提方法的漸近性質(zhì)。仿真實驗結(jié)果表明,在多種實驗設(shè)定下,TSFDSC的性能均優(yōu)于一些常用的函數(shù)型聚類方法。最后,通過兩個實際應(yīng)用案例,進一步驗證了該方法的有效性。











