微博情感信息挖掘系統
2018-01-13 10:33:28 來(lái)源:本站原創(chuàng ) 瀏覽:205次內容提要:編號jsp369:微博在我國發(fā)展已經(jīng)有很多年了,在微博用戶(hù)的不斷增加過(guò)程中,也出現了很多的情感微博,很多用戶(hù)通過(guò)微博抒發(fā)個(gè)人的情感,針對這種情況,我們可以開(kāi)發(fā)一款關(guān)于情感信息挖掘的軟件,一方面了解微博用戶(hù)的大數據,另一方面通過(guò)微博用戶(hù)的建立,分析相關(guān)的大數據。
經(jīng)過(guò)不完全統計,我國的微博用戶(hù)已經(jīng)達到了三億多,通過(guò)微博很多人能夠表達自己的情感以及一些其他的信息,如何能夠針對這種信息,敏感問(wèn)題進(jìn)行分析,是本課題所要解決的問(wèn)題。通過(guò)對微博的敏感話(huà)題,相關(guān)的熱點(diǎn)情感態(tài)度等分析,能夠了解一個(gè)人的情感動(dòng)向,防止不正當的信息進(jìn)行傳播,也對不穩定因素的分析有一定的主導作用。
本系統可以實(shí)現如下幾個(gè)功能:
1、針對微博的信息進(jìn)行格式化處理,主要是對微博的標題,內容,轉發(fā)數等信息進(jìn)行數據庫的存儲。等待后期的分析。
2、數據信息清洗:利用分詞系統針對當前熱門(mén)的微博進(jìn)行分析,去除特殊符號和停用詞等不常用詞語(yǔ)。
3、建立情感詞數據庫,建立消極情感詞庫和積極情感詞庫,為針對微博數據挖掘做準備。
4、利用蟻群算法針對微博的動(dòng)態(tài)情感信息進(jìn)行分析,主要是要實(shí)現如下幾個(gè)的關(guān)聯(lián):
a)事件與情感的關(guān)聯(lián),可以通過(guò)事件與情感的關(guān)聯(lián),發(fā)現引起積極情感和消極情感的事件。
b)通過(guò)用戶(hù)和情感的關(guān)聯(lián)來(lái)發(fā)現用戶(hù)在某個(gè)時(shí)間段與積極和消極情感的關(guān)聯(lián),并能給用戶(hù)一個(gè)情感變化的曲線(xiàn)。
5、以曲線(xiàn)的方式,能夠針對直觀(guān)的情感波動(dòng)進(jìn)行分析。