色噜噜人体337p人体 I 超碰97观看 I 91久久香蕉国产日韩欧美9色 I 色婷婷我要去我去也 I 日本午夜a I 国产av高清怡春院 I 桃色精品 I 91香蕉国产 I 另类小说第一页 I 日操夜夜操 I 久久性色 I 日韩欧在线 I 国产深夜在线观看 I 免费的av I 18在线观看视频 I 他也色在线视频 I 亚洲熟女中文字幕男人总站 I 亚洲国产综合精品中文第一 I 人妻丰满熟av无码区hd I 新黄色网址 I 国产精品真实灌醉女在线播放 I 欧美巨大荫蒂茸毛毛人妖 I 国产一区欧美 I 欧洲亚洲1卡二卡三卡2021 I 国产亚洲欧美在线观看三区 I 97精品无人区乱码在线观看 I 欧美妇人 I 96精品在线视频 I 国产人免费视频在线观看 I 91麻豆国产福利在线观看

描述CRP模型中的聚類算法的論文

時(shí)間:2021-06-13 19:12:44 論文 我要投稿

關(guān)于描述CRP模型中的聚類算法的論文

  本文是由上傳的:基于CRP模型的聚類算法。

關(guān)于描述CRP模型中的聚類算法的論文

  【摘要】 關(guān)于聚類問(wèn)題現(xiàn)在已經(jīng)有很多方法可以實(shí)現(xiàn),但大多數(shù)基于有限混合模型的聚類方法需要預(yù)先估計(jì)聚類的個(gè)數(shù),因而聚類的準(zhǔn)確性和泛化性會(huì)受到一定影響。本文則提出了一種基于無(wú)線混合模型――中國(guó)餐館模型(CRP)的聚類方法,CRP模型是Dirichlet過(guò)程的一種表示方法,基于Dirichlet無(wú)線混合模型找出其后驗(yàn)分布,利用Gibbs采樣MCMC方法估計(jì)出模型中各個(gè)參數(shù)以及潛在的聚類個(gè)數(shù),并在MATLAB環(huán)境下進(jìn)行一個(gè)小實(shí)驗(yàn)來(lái)驗(yàn)證聚類的效果。

  【關(guān)鍵詞】 聚類 CRP模型 Dirichlet過(guò)程 MCMC采樣

  一、引言

  聚類顧名思義就是把事物按照特定的性質(zhì)或者相似性進(jìn)行區(qū)分和分類,在這一過(guò)程中不指導(dǎo),屬于無(wú)監(jiān)督分類。作為一種重要的數(shù)據(jù)分析方法,聚類分析問(wèn)題在很久以前就已經(jīng)為人們所研究,并且已經(jīng)取得了一定成果,目前的算法已經(jīng)能對(duì)一般簡(jiǎn)單的聚類問(wèn)題做出很好的聚類結(jié)果。但隨著大數(shù)據(jù)時(shí)代的到來(lái),實(shí)際應(yīng)用中的數(shù)據(jù)越來(lái)月復(fù)雜,如基因表達(dá)數(shù)據(jù),交通流數(shù)據(jù),web文檔等,有一些數(shù)據(jù)還存在著極大的不確定性,有的數(shù)據(jù)可以達(dá)到幾百維甚至上千維,受“維度效應(yīng)”的影響,很多在低維空間能得到很好結(jié)果的聚類算法在高維空間中并不是十分理想。

  關(guān)于高維數(shù)據(jù)的聚類近幾年一些基于有限混合模型的方法取得了很有效的成果。但是這些算法需要提前估計(jì)聚類個(gè)數(shù)的前提下,根據(jù)樣本的屬性進(jìn)行分析分類。本文采用了一種基于Dirichlet無(wú)線混合模型的方法,利用CRP模型和Gibbs采樣方法,在分析過(guò)程中找出潛在的聚類個(gè)數(shù),實(shí)現(xiàn)對(duì)數(shù)據(jù)的聚類。

  二、CRP模型

  2.1 關(guān)于CRP

  CRP模型是Dirichlet過(guò)程的一種表示方法,它是關(guān)于M個(gè)顧客到一家中國(guó)餐館如何就坐問(wèn)題的一個(gè)離散隨機(jī)過(guò)程。具體描述如下:有一家中國(guó)餐館,假設(shè)有無(wú)限個(gè)桌子,并且每張桌子上可以容納無(wú)限個(gè)顧客,每一個(gè)顧客到來(lái)時(shí)可以隨意選擇一個(gè)餐桌,也可以自己新開(kāi)一個(gè)餐桌。在CRP過(guò)程中,我們把每一位到來(lái)的顧客都當(dāng)作最后一位來(lái)看待,有如下分配過(guò)程:第一位顧客到來(lái),一定會(huì)開(kāi)一個(gè)桌子自己坐下,第二個(gè)顧客到來(lái)時(shí),以一定概率坐在第一個(gè)人開(kāi)的桌子上,一定概率新開(kāi)一張桌子,第三個(gè)顧客到來(lái)時(shí),有一定概率坐在第一、二個(gè)人開(kāi)的桌子上,也可以開(kāi)第三張桌子……以此類推,具體定義的概率如下:

  其中α是狄利克雷的先驗(yàn)參數(shù); c 是第m 個(gè)顧客選擇的餐桌上已有的顧客人數(shù)。顧客選擇餐桌時(shí)不僅與顧客對(duì)餐桌的個(gè)人情感有關(guān),還與該桌上在座的顧客關(guān)系有關(guān),如果是朋友或是認(rèn)識(shí)的人就算有更好的選擇顧客也可能選擇與朋友坐一桌。而在CRP模型中并未考慮到顧客的情感色彩因素。

  2.2 Gibbs Samping

  關(guān)于Dirichlet混合模型的Gibbs Sampling實(shí)際上就是根據(jù)先驗(yàn)求后驗(yàn)的過(guò)程,雖然中心思想一樣,但具體實(shí)現(xiàn)方法有很多種[1],這里根據(jù)CRP的情況,選擇其中一種算法,在下一節(jié)詳細(xì)講解。

  2.3 參數(shù)估計(jì)

  假設(shè)有一個(gè)整體的數(shù)據(jù)集D={xi}in=1,它的兩個(gè)參數(shù)為z=(z1,…,zn),zn∈{1,…,K},φ=(φ1…,φK)

  其中Z為隱變量,表示樣本聚類的標(biāo)簽,Zi=k代表當(dāng)前第i個(gè)類有k個(gè)成員,而φ則是該模型的每一類的成員參數(shù),根據(jù)貝葉斯理論,可以得出p(φ,z|D)∝p0(φ)p0(z)p(D|φ,z),因此,參數(shù)φ后驗(yàn)分布可以通過(guò)計(jì)算其先驗(yàn)分布及似然函數(shù)來(lái)實(shí)現(xiàn),在此基礎(chǔ)上計(jì)算出φ的后驗(yàn)分布,并通過(guò)Gibbs采樣的方法更新參數(shù)φ。

  其中nk代表當(dāng)前坐在第k個(gè)桌子上的其他人的總數(shù)。

  2.4 使用Gibbs采樣的算法

  假設(shè)待處理的數(shù)據(jù)是高斯隨機(jī)分布的,首先隨機(jī)初始化參數(shù)z,φ。

  對(duì)于每一個(gè)zi才用如下采樣方法:

  選擇已有桌子(第K個(gè))的概率:

  新開(kāi)一個(gè)桌子(第K+1)的概率:

  而對(duì)于參數(shù)φ,采用如下方式(每當(dāng)?shù)趉個(gè)桌子上加了人,這個(gè)類的參數(shù)φk就要更新):

  三、實(shí)驗(yàn)與結(jié)果

  本文以matlab為平臺(tái),對(duì)二維空間上一些隨機(jī)分布的點(diǎn)進(jìn)行模擬聚類測(cè)試。正如上一節(jié)所說(shuō),這里對(duì)測(cè)試數(shù)據(jù)采用高斯隨機(jī)來(lái)生成,為了簡(jiǎn)化處理,生成了300個(gè)各項(xiàng)同向高斯分布的.點(diǎn),具體代碼如下:

  這樣就默認(rèn)把這300個(gè)點(diǎn)分成了潛在的3個(gè)類,我們最后要求出的結(jié)果應(yīng)該就是K=3。實(shí)驗(yàn)結(jié)果發(fā)現(xiàn),真正的結(jié)果與Dirichlet過(guò)程CRP模型的集中度參數(shù)α有很大關(guān)系。α很大的時(shí)候會(huì)不準(zhǔn)確,我在這里讓?duì)岭S機(jī)選取,并重復(fù)了100次,最后一次的結(jié)果是k=4:

  而根據(jù)α的不同取值,100次的聚類結(jié)果在3-6之間,其中還是以3居多:

  由此可知,對(duì)于Dirichlet先驗(yàn)參數(shù)α的選擇會(huì)直接影響到最終的聚類效果。而Dirichlet過(guò)程作為一個(gè)無(wú)線混合模型,隨著數(shù)據(jù)的增多,模型的個(gè)數(shù)是呈現(xiàn)log 增加的,即模型的個(gè)數(shù)的增長(zhǎng)是比數(shù)據(jù)的增長(zhǎng)要緩慢得多的。同時(shí)也可以說(shuō)明Dirichlet過(guò)程是有一個(gè)馬太效應(yīng)在里面的,即“越富裕的人越來(lái)越富裕”,每個(gè)桌子已有的人越多,那么下一次被選中的概率越大,因?yàn)榕c在桌子上的個(gè)數(shù)成正比的,因而這種無(wú)線混合模型對(duì)于發(fā)現(xiàn)潛在的聚類個(gè)數(shù)會(huì)有很好的效果。

  四、總結(jié)

  基于CRP模型的聚類方法不同于先前的有限混合模型,無(wú)需預(yù)先估計(jì)聚類的個(gè)數(shù),而是在分析過(guò)程中自動(dòng)確定。聚類的結(jié)果與α有關(guān),所以選取合適的集中度參數(shù)很重要。關(guān)于CRP模型現(xiàn)在的研究還不是很廣泛,也有一些在主題模型中的應(yīng)用,比如基于CRP模型的詞匯分類,實(shí)現(xiàn)主題模型等。相信在不遠(yuǎn)的將來(lái),這種利用無(wú)線混合模型的聚類方法會(huì)有更多的開(kāi)拓空間。

  參 考 文 獻(xiàn)

  [4] 易瑩瑩. 基于Dirichlet過(guò)程的非參數(shù)貝葉斯方法研究綜述[J]. 統(tǒng)計(jì)與決策. 2012(04)

  [5] Pruteanu-Malinici I,Ren L,Paisley J,Wang E,Carin L.Hierarchical Bayesian modeling of topics in time-stamped documents. IEEE Transactions on Pattern Analysis and Ma-chine Intelligence . 2010

  [6] H. Ishwaran,M. Zarepour.Markov Chain Monte Carlo in approximate Dirichlet and beta two-parameter process hierarchical models. Biometrika . 2000

  [7] R Thibaux,M I Jordan.Hierarchical beta processes and the indian buffet process. Proceedings of International Conference on Artificial Intelligence and Statistics . 2007

【描述CRP模型中的聚類算法的論文】相關(guān)文章:

針對(duì)非均勻數(shù)據(jù)集自適應(yīng)聚類算法的研究論文04-14

《算法與描述》教學(xué)反思07-07

課程表的空間模型及排課算法分析的教育論文07-03

碰撞檢測(cè)中的KDOPS算法論文06-15

計(jì)量模型論文04-11

數(shù)學(xué)模型在銀行服務(wù)與信貸中的應(yīng)用論文06-20

最短路徑算法在線路搶修中的應(yīng)用論文02-20

有計(jì)量模型的論文04-11

淺談數(shù)學(xué)模型在銀行服務(wù)與信貸中的應(yīng)用論文06-20

主站蜘蛛池模板: 中文字幕无线码一区 | 99视频国产精品免费观看a | 成人啪精品视频网站午夜 | 狂野欧美性猛xxxx乱大交 | 在线观看中文字幕2021 | 人人妻久久人人澡人人爽人人精品 | 亚洲成人在线免费观看 | 亚洲高清视频免费看 | 日本免费视屏 | 中文字幕日韩欧美在线 | 伊人久久大香线蕉无码 | 成人理论片 | 三级视频中文字幕 | 97精品人妻一区二区三区香蕉 | 国产高清在线精品一区小说 | 国产诱惑av| 国精产品一区一区三区有限公司 | 成人羞羞视频播放网站 | 自偷自拍亚洲综合精品 | 欧美精品一区二区三区在线播放 | 国产在线视频第一页 | 久久久久久精品成人鲁丝电影 | 男女下面一进一出免费视频网站 | 俺来也俺去啦久久综合网 | av国产成人 | 免费吸乳羞羞网站视频 | 精品人妻一区二区三区浪潮在线 | 日日av拍夜夜添久久免费浪潮 | 中文字幕女教师julia视频 | 舔高中女生奶头内射视频 | 精品久久久久久久久久久久久久久 | 蜜桃麻豆www久久囤产精品 | 少妇午夜三级伦理影院播放器 | 欧美三级日本 | 日本欧美一区二区三区 | 天天躁夜夜躁av天天爽 | 国产日韩欧美一区二区 | 韩国少妇bbb毛毛片 婷婷色狠狠 | 亚洲成av人片一区二区梦乃 | 国产一级淫片a免费播放口欧美 | 啪啪网站视频 | 精品国产午夜肉伦伦影院 | 免费在线观看小视频 | 噜噜噜av久久 | 欧美特黄特色免费看 | 污黄视频在线免费观看 | 国色天香中文字幕在线视频 | 国产a级三级三级三级 | 国产一区二区黄色 | 综合精品久久久 | av爱爱| 中文字幕一区二区三区三州 | 午夜理论在线观看不卡大地影院 | 国产日韩欧美视频在线观看 | 一级在线看 | 久久久精品99 | 人妻无码中文久久久久专区 | 人人妻人人做人人爽精品 | 色综合亚洲一区二区小说性色aⅴ | 亚洲欭美日韩颜射在线二 | 精品国产亚洲一区二区三区在线观看 | av无码国产在线看岛国 | 91精品国产91久久久久久黑人 | 波多野结衣乱码中文字幕 | 狠狠色噜噜狠狠狠777米奇 | 亚洲日本成人在线观看 | 精品国产一区二区三区国产区 | 人妻va精品va欧美va | 中文字幕一区二区三区三州 | 欧美不卡视频在线观看 | 午夜人妻理论片天堂影院 | 久久成人综合网 | 99精品视频在线在线观看视频 | 日本手机在线 | 日本少妇又色又爽又高潮 | 欧美天堂在线 | 久久婷婷五月综合色一区二区 | 91精品国产高潮对白 | 四虎网站在线观看 | 精品国产一区二区三区久久久 | 亚洲国产成人精品久久久 | 国产午夜福利精品久久2021 | 中国xxxx做受视频 | 欧美精品一区二区三区四区 | 国产午夜片无码区在线观看爱情网 | 密桃av | 97香蕉久久超级碰碰高清版 | 男女日视频 | 含羞草www网址进入在线观看 | 尤物193在线人妻精品免费 | 在线视频观看免费 | a级毛片国产 | 日韩欧美高清片 | 国产精品久久久久久妇女6080 | 国产精品夜夜嗨视频免费视频 | 日本一本二本在线观看 | 精品国产一区二 | 精品国产美女福利在线不卡 | 日本猛少妇色xxxxx猛叫小说 |