最近一直在看Map/Reduce的東西,按照mapreduce
也實(shí)現(xiàn)了字?jǐn)?shù)統(tǒng)計(jì)的分布式處理,明白了其中的原理。于是想,能否將此方法用于文本聚類上來(我自己寫了一個(gè)簡單的文本聚類方法,依據(jù)2文檔中出現(xiàn)相同字符的頻率,效率不高,但是準(zhǔn)確度還是不錯(cuò)的),
以便能處理數(shù)量更為龐大的聚類。但是沒有想到將這二者結(jié)合的點(diǎn)。有沒有精通此道的,給點(diǎn)建議。。。。。。。。