您的位置:新文秘網(wǎng)>>縣域/信息/規(guī)章制度/調(diào)研報(bào)告/畢業(yè)論文/>>正文

基于粗糙集的縣域經(jīng)濟(jì)信息關(guān)聯(lián)規(guī)則挖掘研究

發(fā)表時(shí)間:2015/4/12 8:19:20

基于粗糙集的縣域經(jīng)濟(jì)信息關(guān)聯(lián)規(guī)則挖掘研究

摘要:縣域經(jīng)濟(jì)作是中國(guó)一個(gè)重要的經(jīng)濟(jì)組成部分。目前國(guó)家大力倡導(dǎo)發(fā)展縣域經(jīng)濟(jì),而且以前對(duì)縣域經(jīng)的研究,多停留在定性研究。一些計(jì)算模型方法的應(yīng)用和研究也很少,而對(duì)于縣域經(jīng)濟(jì)信息的挖掘則更少。本文應(yīng)用粗糙集理論,以廣西各縣域經(jīng)濟(jì)單元做為樣本,選取了9個(gè)評(píng)價(jià)指標(biāo),應(yīng)用粗糙集軟件,提取了17條的縣域經(jīng)濟(jì)信息關(guān)聯(lián)規(guī)則。文章旨在一個(gè)初步探討,將粗糙集技術(shù)引入縣域經(jīng)濟(jì)評(píng)價(jià)中來。
關(guān)鍵詞:縣域經(jīng)濟(jì);粗糙集;關(guān)聯(lián)規(guī)則
The association rule data mining study of county economy information based on rough set
LiaoWei-Hua
(Department Of Mathematics And Infomation,Guang*i University Nanning 530004,China)
……(新文秘網(wǎng)http://www.jey722.cn省略649字,正式會(huì)員可完整閱讀)…… 
technology and theory into county territory economy application.
Key words: County territory economy;Rough set; Association rule
1 引言
縣域經(jīng)濟(jì)是以縣級(jí)行政區(qū)劃為地理空間,以縣級(jí)_為調(diào)控主體,以市場(chǎng)為導(dǎo)向,優(yōu)化配置資源,具有地域特色和功能完備的區(qū)域經(jīng)濟(jì)?h域經(jīng)濟(jì)在我國(guó)國(guó)民經(jīng)濟(jì)中的重要性至少有兩大方面:首先:從經(jīng)濟(jì)總量看,整個(gè)國(guó)家的GDP有相當(dāng)大的比重是由縣和縣以下的經(jīng)濟(jì)活動(dòng)創(chuàng)造的,其次,全國(guó)縣域范圍內(nèi)居住的人口總計(jì)約為10.8億人以上,占我國(guó)總?cè)丝诘?5%強(qiáng)。因此,目前國(guó)家大力提倡發(fā)展縣域經(jīng)濟(jì)。而在經(jīng)濟(jì)的發(fā)展過程中,有大量的經(jīng)濟(jì)、社會(huì)統(tǒng)計(jì)數(shù)據(jù),如何有效利用這些數(shù)據(jù),挖掘這些數(shù)據(jù)的有用信息,更好的為中國(guó)縣域經(jīng)濟(jì)服務(wù),就成為一個(gè)值得研究的課題。數(shù)據(jù)挖掘是從數(shù)據(jù)庫(kù)中發(fā)現(xiàn)經(jīng)濟(jì)知識(shí)模式的有效工具,應(yīng)當(dāng)把數(shù)據(jù)挖掘的方法技術(shù)引入和應(yīng)用到實(shí)證經(jīng)濟(jì)分析中去,以促進(jìn)經(jīng)濟(jì)學(xué)的現(xiàn)代化、科學(xué)化,提高經(jīng)濟(jì)決策水平[1]。
隨著各科研院所縣域經(jīng)濟(jì)的研究的開展,計(jì)量經(jīng)濟(jì)方法和社會(huì)統(tǒng)計(jì)方法也逐漸被運(yùn)用于縣域經(jīng)濟(jì)研究,各種定量化的方法和計(jì)量模型開始對(duì)縣域經(jīng)濟(jì)進(jìn)行研究探討。這些研究促進(jìn)了對(duì)縣域經(jīng)濟(jì)進(jìn)行定量研究的深度,充實(shí)了縣域經(jīng)濟(jì)的研究?jī)?nèi)容。這類定量研究文章主要包括,縣域經(jīng)濟(jì)競(jìng)爭(zhēng)力(或?qū)嵙?評(píng)價(jià)、縣域經(jīng)濟(jì)發(fā)展差距(包括省域內(nèi)差距和區(qū)域差距)、縣域內(nèi)組織(經(jīng)濟(jì)組織和政府機(jī)構(gòu))對(duì)縣域經(jīng)濟(jì)的影響作用等。而縱觀國(guó)內(nèi)外的研究,很少研究會(huì)注重縣域經(jīng)濟(jì)內(nèi)部知識(shí)的挖掘,提取有效的規(guī)則,形成知識(shí),從而為中國(guó)縣域經(jīng)濟(jì)的發(fā)展提供有效的參考。本文將從粗糙集技術(shù)出發(fā),探討粗糙集在縣域經(jīng)濟(jì)數(shù)據(jù)挖掘的中的應(yīng)用。
2、基本理論
本次研究采用波蘭數(shù)學(xué)家Z.Pawlak提出的粗糙集理論。粗糙集以等價(jià)關(guān)系(不可分辨關(guān)系)為基礎(chǔ),用于分類問題。它用上、下近似兩個(gè)集合來逼近任意一個(gè)集合,該集合的邊界線區(qū)域被定義為上近似集和下近似集之差集。目前,粗糙集理論用在數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn)主要體現(xiàn)在:
(1)利用等價(jià)關(guān)系對(duì)數(shù)據(jù)庫(kù)進(jìn)行屬性約簡(jiǎn)。
(2)利用集合的上、下近似關(guān)系獲取分類規(guī)則。
關(guān)聯(lián)規(guī)則(association rule)挖掘是發(fā)現(xiàn)大量數(shù)據(jù)庫(kù)中項(xiàng)集之間的關(guān)聯(lián)關(guān)系。隨著大量數(shù)據(jù)的增加和存儲(chǔ),大量事物中發(fā)現(xiàn)有趣的關(guān)聯(lián)關(guān)系,可以幫助許多決策的制定,如分類等。目前,關(guān)聯(lián)規(guī)則挖掘已經(jīng)成為數(shù)據(jù)挖掘領(lǐng)域重要的研究方向。關(guān)聯(lián)規(guī)則模式屬于描述型模式,發(fā)現(xiàn)關(guān)聯(lián)規(guī)則的算法屬于無監(jiān)督學(xué)習(xí)的方法,下面屬于關(guān)聯(lián)規(guī)則的定義。

定義1 設(shè)是項(xiàng)的集合,項(xiàng)集是的子集,即, ,這里等均為項(xiàng)編號(hào)(, ,)。設(shè)是的子集,則表示成。為了簡(jiǎn)單起見,一個(gè)項(xiàng)集也寫成。
定義2 一筆交易定義為,這里是交易號(hào),是項(xiàng)集。當(dāng)且僅當(dāng)時(shí),一筆交易包含。
定義3 交易數(shù)據(jù)庫(kù)是具有個(gè)交易的集合,在中包含項(xiàng)集的交易數(shù)目稱為的支持?jǐn)?shù),表示為;而交易中包含的百分?jǐn)?shù)稱為支持度。給定支持?jǐn)?shù)閾值(),如果,則項(xiàng)集是頻繁的。
頻繁模式挖掘?qū)嶋H上就是根據(jù)其最小支持度(或支持?jǐn)?shù))在給定的交易數(shù)據(jù)庫(kù)中發(fā)現(xiàn)頻繁模式的完全項(xiàng)集。
定義 4 設(shè)頻繁項(xiàng)集={},則規(guī)則的支持度和置信度定義如下:


定義5 設(shè)最小支持度閾值()和最小置信度(),則當(dāng),并且,稱為強(qiáng)規(guī) ……(未完,全文共5193字,當(dāng)前僅顯示1824字,請(qǐng)閱讀下面提示信息。收藏《基于粗糙集的縣域經(jīng)濟(jì)信息關(guān)聯(lián)規(guī)則挖掘研究》