數(shù)據(jù)挖掘論文答辯 數(shù)據(jù)挖掘論文3000字(4篇)

格式:DOC 上傳日期:2023-01-26 06:07:40
數(shù)據(jù)挖掘論文答辯 數(shù)據(jù)挖掘論文3000字(4篇)
時間:2023-01-26 06:07:40     小編:zdfb

在日常的學(xué)習(xí)、工作、生活中,肯定對各類范文都很熟悉吧。范文怎么寫才能發(fā)揮它最大的作用呢?接下來小編就給大家介紹一下優(yōu)秀的范文該怎么寫,我們一起來看一看吧。

數(shù)據(jù)挖掘論文答辯 數(shù)據(jù)挖掘論文3000字篇一

1.1數(shù)據(jù)挖掘技術(shù)概述

發(fā)現(xiàn)的是用戶感興趣的知識;發(fā)現(xiàn)的知識應(yīng)當(dāng)能夠被接受、理解和運(yùn)用。也就是發(fā)現(xiàn)全部相對的知識,是具有特定前提與條件,面向既定領(lǐng)域的,同時還容易被用戶接受。數(shù)據(jù)挖掘?qū)儆谝环N新型的商業(yè)信息處理技術(shù),其特點為抽取、轉(zhuǎn)化、分析商業(yè)數(shù)據(jù)庫中的大規(guī)模業(yè)務(wù)數(shù)據(jù),從中獲得有價值的商業(yè)數(shù)據(jù)。簡單來說,其實數(shù)據(jù)挖掘是一種對數(shù)據(jù)進(jìn)行深入分析的方法。因此,可以描述數(shù)據(jù)挖掘為:根據(jù)企業(yè)設(shè)定的工作目標(biāo),探索與分析企業(yè)大量數(shù)據(jù),充分揭示隱藏的、未知的規(guī)律性,并且將其轉(zhuǎn)變?yōu)榭茖W(xué)的方法。數(shù)據(jù)挖掘發(fā)現(xiàn)的最常見知識包括:

1.1.1廣義知識體現(xiàn)相同事物共同性質(zhì)的知識,是指類別特點的概括描述知識。按照數(shù)據(jù)的微觀特點對其表征的、具有普遍性的、極高概念層次的知識積極發(fā)現(xiàn),是對數(shù)據(jù)的高度精煉與抽象。發(fā)現(xiàn)廣義知識的方法與技術(shù)有很多,例如數(shù)據(jù)立方體和歸約等。

1.1.2關(guān)聯(lián)知識體現(xiàn)一個事件與其他事件之間形成的關(guān)聯(lián)知識。假如兩項或者更多項之間形成關(guān)聯(lián),則其中一項的屬性數(shù)值就能夠借助其他屬性數(shù)值實行預(yù)測。

1.1.3分類知識體現(xiàn)相同事物共同特點的屬性知識與不同事物之間差異特點知識。

1.2數(shù)據(jù)挖掘過程

1.2.1明確業(yè)務(wù)對象對業(yè)務(wù)問題清楚定義,了解數(shù)據(jù)挖掘的第一步是數(shù)據(jù)挖掘目的。挖掘結(jié)果是無法預(yù)測的,但是研究的問題是可預(yù)見的,僅為了數(shù)據(jù)挖掘而數(shù)據(jù)挖掘一般會體現(xiàn)出盲目性,通常也不會獲得成功。基于用戶特征的電子商務(wù)數(shù)據(jù)挖掘研究劉芬(惠州商貿(mào)旅游高級職業(yè)技術(shù)學(xué)校,廣東惠州516025)摘要:隨著互聯(lián)網(wǎng)的出現(xiàn),全球范圍內(nèi)電子商務(wù)正在迅速普及與發(fā)展,在這樣的環(huán)境下,電子商務(wù)數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生。電子商務(wù)數(shù)據(jù)挖掘技術(shù)是近幾年來數(shù)據(jù)挖掘領(lǐng)域中的研究熱點,基于用戶特征的電子商務(wù)數(shù)據(jù)挖掘技術(shù)研究將會解決大量現(xiàn)實問題,為企業(yè)確定目標(biāo)市場、完善決策、獲得最大競爭優(yōu)勢,其應(yīng)用前景廣闊,促使電子商務(wù)企業(yè)更具有競爭力。主要分析了電子商務(wù)內(nèi)容、數(shù)據(jù)挖掘技術(shù)和過程、用戶細(xì)分理論,以及基于用戶特征的電子商務(wù)數(shù)據(jù)挖掘。

1.2.2數(shù)據(jù)準(zhǔn)備第一選擇數(shù)據(jù):是按照用戶的挖掘目標(biāo),對全部業(yè)務(wù)內(nèi)外部數(shù)據(jù)信息積極搜索,從數(shù)據(jù)源中獲取和挖掘有關(guān)數(shù)據(jù)。第二預(yù)處理數(shù)據(jù):加工選取的數(shù)據(jù),具體對數(shù)據(jù)的完整性和一致性積極檢查,并且處理數(shù)據(jù)中的噪音,找出計算機(jī)丟失的數(shù)據(jù),清除重復(fù)記錄,轉(zhuǎn)化數(shù)據(jù)類型等。假如數(shù)據(jù)倉庫是數(shù)據(jù)挖掘的對象,則在產(chǎn)生數(shù)據(jù)庫過程中已經(jīng)形成了數(shù)據(jù)預(yù)處理。

1.2.3變換數(shù)據(jù)轉(zhuǎn)換數(shù)據(jù)為一個分析模型。這一分析模型是相對于挖掘算法構(gòu)建的。構(gòu)建一個與挖掘算法適合的分析模型是數(shù)據(jù)挖掘獲得成功的重點。可以利用投影數(shù)據(jù)庫的相關(guān)操作對數(shù)據(jù)維度有效降低,進(jìn)一步減少數(shù)據(jù)挖掘過程中數(shù)據(jù)量,提升挖掘算法效率。

1.2.4挖掘數(shù)據(jù)挖掘獲得的經(jīng)濟(jì)轉(zhuǎn)化的數(shù)據(jù)。除了對選擇科學(xué)挖掘算法積極完善之外,其余全部工作都自行完成。整體挖掘過程都是相互的,也就是用戶對某些挖掘參數(shù)能夠積極控制。

1.2.5評價挖掘結(jié)果這個過程劃分為兩個步驟:表達(dá)結(jié)果和評價結(jié)果。第一表達(dá)結(jié)果:用戶能夠理解數(shù)據(jù)挖掘得到的模式,可以通過可視化數(shù)據(jù)促使用戶對挖掘結(jié)果積極理解。第二評價結(jié)果:用戶與機(jī)器對數(shù)據(jù)挖掘獲得的模式有效評價,對冗余或者無關(guān)的模式及時刪除。假如用戶不滿意挖掘模式,可以重新挑選數(shù)據(jù)和挖掘算法對挖掘過程科學(xué)執(zhí)行,直到獲得用戶滿意為止。

用戶細(xì)分是指按照不同用戶的屬性劃分用戶集合。目前學(xué)術(shù)界和企業(yè)界一般接受的是基于用戶價值的細(xì)分理論,其不僅包含了用戶為企業(yè)貢獻(xiàn)歷史利潤,還包含未來利潤,也就是在未來用戶為企業(yè)可能帶來的利潤總和?;谟脩魞r值的細(xì)分理論選擇客戶當(dāng)前價值與客戶潛在價值兩個因素評價用戶。用戶當(dāng)前價值是指截止到目前用戶對企業(yè)貢獻(xiàn)的總體價值;用戶潛在價值是指未來用戶可能為企業(yè)創(chuàng)造的價值總和。每個因素還能夠劃分為兩個高低檔次,進(jìn)一步產(chǎn)生一個二維的矩陣,把用戶劃分為4組,價值用戶、次價值用戶、潛在價值用戶、低價值用戶。企業(yè)在推廣過程中根據(jù)不同用戶應(yīng)當(dāng)形成對應(yīng)的方法,投入不同的資源。很明顯對于企業(yè)來說價值用戶最重要,被認(rèn)為是企業(yè)的玉質(zhì)用戶;其次是次價值用戶,被認(rèn)為是金質(zhì)用戶,雖然數(shù)量有限,卻為企業(yè)創(chuàng)造了絕大部分的利潤;其他則是低價值用戶,對企業(yè)來說價值最小,成為鉛質(zhì)用戶,另外一類則是潛在價值用戶。雖然這兩類用戶擁有較多的數(shù)量,但是為企業(yè)創(chuàng)造的價值有限,甚至很小。需要我們注意的是潛在價值用戶利用再造用戶關(guān)系,將來極有可能變成價值用戶。從長期分析,潛在價值用戶可以是企業(yè)的隱形財富,是企業(yè)獲得利潤的基礎(chǔ)。將采用數(shù)據(jù)挖掘方法對這4類用戶特點有效挖掘。

3.1設(shè)計問卷

研究的關(guān)鍵是電子商務(wù)用戶特征的數(shù)據(jù)挖掘,具體包含了價值用戶特征、次價值用戶特征、潛在價值用戶特征,對電子商務(wù)用戶的認(rèn)知度、用戶的需求度分析。問卷內(nèi)容包括3部分:其一是為被調(diào)查者介紹電子商務(wù)的概念與背景;其二是具體調(diào)查被調(diào)查對象的個人信息,包含了性別、年齡、學(xué)歷、感情情況、職業(yè)、工作、生活地點、收入、上網(wǎng)購物經(jīng)歷;其三是問卷主要部分,是對用戶對電子商務(wù)的了解、需求、使用情況的指標(biāo)設(shè)計。

3.2調(diào)查方式

本次調(diào)查的問卷主體是電腦上網(wǎng)的人群,采用隨機(jī)抽象的方式進(jìn)行網(wǎng)上訪問。一方面采用大眾聊天工具,利用電子郵件和留言的方式發(fā)放問卷,另一方面在大眾論壇上邀請其填寫問卷。

3.3數(shù)據(jù)挖掘和結(jié)果

(1)選擇數(shù)據(jù)挖掘的算法利用clementine數(shù)據(jù)挖掘軟件,采用c5.o算法挖掘預(yù)處理之后數(shù)據(jù)。

(2)用戶數(shù)據(jù)分析

1)電子商務(wù)用戶認(rèn)知度分析按照調(diào)查問卷的問題“您知道電子商務(wù)嗎?”得到對電子商務(wù)用戶認(rèn)知情況的統(tǒng)計,十分了解20.4%,了解30.1%,聽過但不了解具體使用方法40.3%,從未聽過8.9%。很多人僅聽過電子商務(wù),但是并不清楚具體的功能與應(yīng)用方法,甚至有一小部分人沒有聽過電子商務(wù)。對調(diào)查問卷問題“您聽過電子商務(wù)的渠道是什么?”,大部分用戶是利用網(wǎng)了解電子商務(wù)的,占40.2%;僅有76人是利用紙質(zhì)報刊雜志上知道電子商務(wù)的并且對其進(jìn)行應(yīng)用;這也表明相較于網(wǎng)絡(luò)宣傳紙質(zhì)媒體推廣電子商務(wù)的方法缺乏有效性。

2)電子商務(wù)用戶需求用戶希求具體是指使用產(chǎn)品服務(wù)人員對應(yīng)用產(chǎn)品或服務(wù)形成的需求或者期望。按照問題“假如你曾經(jīng)使用電子商務(wù),你覺得其用途怎樣,假如沒有使用過,你覺得其對自己有用嗎?”得到了認(rèn)為需要和十分需要的數(shù)據(jù),覺得電子商務(wù)有用的用戶為40.7%,不清楚是否對自己有用的用戶為56.7%,認(rèn)為不需要的僅有2.4%。

3)電子商務(wù)用戶應(yīng)用意愿應(yīng)用意愿是指消費(fèi)者對某一產(chǎn)品服務(wù)進(jìn)行應(yīng)用或者購買的一種心理欲望。按照問題“假如可以滿足你所關(guān)心的因素,未來你會繼續(xù)應(yīng)用電子商務(wù)嗎?”獲得的數(shù)據(jù)可知,在滿足各種因素時,將來一年之內(nèi)會應(yīng)用電子商務(wù)的用戶為78.2%,一定不會應(yīng)用電子商務(wù)的用戶為1.4%。表明用戶形成了較為強(qiáng)烈的應(yīng)用電子商務(wù)欲望,電子商務(wù)發(fā)展前景很好?;谟脩籼卣鞯碾娮由虅?wù)數(shù)據(jù)研究,電子商務(wù)企業(yè)通過這一結(jié)果能夠更好地實行營銷和推廣,對潛在用戶積極定位,提高用戶體驗,積極挖掘用戶價值。分析為企業(yè)準(zhǔn)確營銷和推廣企業(yè)提供了一個有效的借鑒。

互聯(lián)網(wǎng)中數(shù)據(jù)是最寶貴的資源之一,大量數(shù)據(jù)中包含了很大的潛在價值,對這些數(shù)據(jù)深入挖掘?qū)ヂ?lián)網(wǎng)商務(wù)、企業(yè)推廣、傳播信息發(fā)揮了巨大的作用。近些年來,數(shù)據(jù)挖掘技術(shù)獲得了信息產(chǎn)業(yè)的極大重視,具體原因是出現(xiàn)了大量的數(shù)據(jù),能夠廣泛應(yīng)用,并且需要轉(zhuǎn)化數(shù)據(jù)成為有價值的信息知識。通過基于用戶特征的電子商務(wù)數(shù)據(jù)挖掘研究,促使電子商務(wù)獲得巨大發(fā)展機(jī)會,發(fā)現(xiàn)潛在用戶,促使電子商務(wù)企業(yè)精準(zhǔn)營銷。

數(shù)據(jù)挖掘論文答辯 數(shù)據(jù)挖掘論文3000字篇二

:數(shù)據(jù)挖掘是一種特殊的數(shù)據(jù)分析過程,其不僅在功能上具有多樣性,同時還具有著自動化、智能化處理以及抽象化分析判斷的特點,對于計算機(jī)犯罪案件中的信息取證有著非常大的幫助。本文結(jié)合數(shù)據(jù)挖掘技術(shù)的概念與功能,對其在計算機(jī)犯罪取證中的應(yīng)用進(jìn)行了分析。

:數(shù)據(jù)挖掘技術(shù);計算機(jī);犯罪取證

隨著信息技術(shù)與互聯(lián)網(wǎng)的不斷普及,計算機(jī)犯罪案件變得越來越多,同時由于計算機(jī)犯罪的隱蔽性、復(fù)雜性特點,案件偵破工作也具有著相當(dāng)?shù)碾y度,而數(shù)據(jù)挖掘技術(shù)不僅能夠?qū)τ嬎銠C(jī)犯罪案件中的原始數(shù)據(jù)進(jìn)行分析并提取出有效信息,同時還能夠?qū)崿F(xiàn)與其他案件的對比,而這些對于計算機(jī)犯罪案件的偵破都是十分有利的。

1.1數(shù)據(jù)挖掘技術(shù)的概念

數(shù)據(jù)挖掘技術(shù)是針對當(dāng)前信息時代下海量的網(wǎng)絡(luò)數(shù)據(jù)信息而言的,簡單來說,就是從大量的、不完全的、有噪聲的、模糊的隨機(jī)數(shù)據(jù)中對潛在的有效知識進(jìn)行自動提取,從而為判斷決策提供有利的信息支持。同時,從數(shù)據(jù)挖掘所能夠的得到的知識來看,主要可以分為廣義型知識、分類型知識、關(guān)聯(lián)性知識、預(yù)測性知識以及離型知識幾種。

1.2數(shù)據(jù)挖掘技術(shù)的功能

根據(jù)數(shù)據(jù)挖掘技術(shù)所能夠提取的不同類型知識,數(shù)據(jù)挖掘技術(shù)也可以在此基礎(chǔ)上進(jìn)行功能分類,如關(guān)聯(lián)分析、聚類分析、孤立點分析、時間序列分析以及分類預(yù)測等都是數(shù)據(jù)挖掘技術(shù)的重要功能之一,而其中又以關(guān)聯(lián)分析與分類預(yù)測最為主要。大量的數(shù)據(jù)中存在著多個項集,各個項集之間的取值往往存在著一定的規(guī)律性,而關(guān)聯(lián)分析則正是利用這一點,對各項集之間的關(guān)聯(lián)關(guān)系進(jìn)行挖掘,找到數(shù)據(jù)間隱藏的關(guān)聯(lián)網(wǎng),主要算法有fp-growth算法、apriori算法等。在計算機(jī)犯罪取證中,可以先對犯罪案件中的特征與行為進(jìn)行深度的挖掘,從而明確其中所存在的聯(lián)系,同時,在獲得審計數(shù)據(jù)后,就可以對其中的審計信息進(jìn)行整理并中存入到數(shù)據(jù)庫中進(jìn)行再次分析,從而達(dá)到案件樹立的效果,這樣,就能夠清晰的判斷出案件中的行為是否具有犯罪特征[1]。而分類分析則是對現(xiàn)有數(shù)據(jù)進(jìn)行分類整理,以明確所獲得數(shù)據(jù)中的相關(guān)性的一種數(shù)據(jù)挖掘功能。在分類分析的過程中,已知數(shù)據(jù)會被分為不同的數(shù)據(jù)組,并按照具體的數(shù)據(jù)屬性進(jìn)行明確分類,之后再通過對分組中數(shù)據(jù)屬性的具體分析,最終就可以得到數(shù)據(jù)屬性模型。在計算機(jī)犯罪案件中,可以將按照這種數(shù)據(jù)分類、分析的方法得到案件的數(shù)據(jù)屬性模型,之后將這一數(shù)據(jù)屬性模型與其他案件的數(shù)據(jù)屬性模型進(jìn)行對比,這樣就能夠判斷嫌疑人是否在作案動機(jī)、發(fā)生規(guī)律以及具體特征等方面與其他案件模型相符,也就是說,一旦這一案件的數(shù)據(jù)模型屬性與其他案件的數(shù)據(jù)模型屬性大多相符,那么這些數(shù)據(jù)就可以被確定為犯罪證據(jù)。此外,在不同案件間的共性與差異的基礎(chǔ)上,分類分析還可以實現(xiàn)對于未知數(shù)據(jù)信息或類似數(shù)據(jù)信息的有效預(yù)測,這對于計算機(jī)犯罪案件的處理也是很有幫助的。此外,數(shù)據(jù)挖掘分類預(yù)測功能的實現(xiàn)主要依賴決策樹、支持向量機(jī)、vsm、logisitic回歸、樸素貝葉斯等幾種,這些算法各有優(yōu)劣,在實際應(yīng)用中需要根據(jù)案件的實際情況進(jìn)行選擇,例如支持向量機(jī)具有很高的分類正確率,因此適合用于特征為線性不可分的案件,而決策樹更容易理解與解釋。

對于數(shù)據(jù)挖掘技術(shù),目前的計算機(jī)犯罪取證工作并未形成一個明確而統(tǒng)一的應(yīng)用步驟,因此,我們可以根據(jù)數(shù)據(jù)挖掘技術(shù)的特征與具體功能,對數(shù)據(jù)挖掘技術(shù)在計算機(jī)犯罪取證中的應(yīng)用提供一個較為可行的具體思路[2]。首先,當(dāng)案件發(fā)生后,一般能夠獲取到海量的原始數(shù)據(jù),面對這些數(shù)據(jù),可以利用fp-growth算法、apriori算法等算法進(jìn)行關(guān)聯(lián)分析,找到案件相關(guān)的潛在有用信息,如犯罪嫌疑人的犯罪動機(jī)、案發(fā)時間、作案嫌疑人的基本信息等等。在獲取這些基本信息后,雖然能夠?qū)Π讣幕咎卣饔幸欢ǖ牧私?,但犯罪嫌疑人卻難以通過這些簡單的信息進(jìn)行確定,因此還需利用決策樹、支持向量機(jī)等算法進(jìn)行分類預(yù)測分析,通過對原始信息的準(zhǔn)確分類,可以得到案件的犯罪行為模式(數(shù)據(jù)屬性模型),而通過與其他案件犯罪行為模式的對比,就能夠?qū)Ψ缸锵右扇说木唧w特征進(jìn)行進(jìn)一步的預(yù)測,如經(jīng)?;顒拥膱鏊?、行為習(xí)慣、分布區(qū)域等,從而縮小犯罪嫌疑人的鎖定范圍,為案件偵破工作帶來巨大幫助。此外,在計算機(jī)犯罪案件處理完畢后,所建立的嫌疑人犯罪行為模式以及通過關(guān)聯(lián)分析、分類預(yù)測分析得到的案件信息仍具有著很高的利用價值,因此不僅需要將這些信息存入到專門的數(shù)據(jù)庫中,同時還要根據(jù)案件的結(jié)果對數(shù)據(jù)進(jìn)行再次分析與修正,并做好犯罪行為模式的分類與標(biāo)記工作,為之后的案件偵破工作提供更加豐富、詳細(xì)的數(shù)據(jù)參考。

總而言之,數(shù)據(jù)挖掘技術(shù)自計算機(jī)犯罪取證中的應(yīng)用是借助以各種算法為基礎(chǔ)的關(guān)聯(lián)、分類預(yù)測功能來實現(xiàn)的,而隨著技術(shù)的不斷提升以及數(shù)據(jù)庫中的犯罪行為模式會不斷得到完善,在未來數(shù)據(jù)挖掘技術(shù)所能夠起到的作用也必將越來越大。

[1]李艷花。數(shù)據(jù)挖掘在計算機(jī)動態(tài)取證技術(shù)中的應(yīng)用[j]。信息與電腦(理論版),20xx(02):174-176.

作者:周永杰 單位:河南警察學(xué)院信息安全系

數(shù)據(jù)挖掘論文答辯 數(shù)據(jù)挖掘論文3000字篇三

摘要:大數(shù)據(jù)和智游都是當(dāng)下的熱點, 沒有大數(shù)據(jù)的智游無從談“智慧”, 數(shù)據(jù)挖掘是大數(shù)據(jù)應(yīng)用于智游的核心, 文章探究了在智游應(yīng)用中, 目前大數(shù)據(jù)挖掘存在的幾個問題。

隨著人民生活水平的進(jìn)一步提高, 旅游消費(fèi)的需求進(jìn)一步上升, 在云計算、互聯(lián)網(wǎng)、物聯(lián)網(wǎng)以及移動智能終端等信息通訊技術(shù)的飛速發(fā)展下, 智游應(yīng)運(yùn)而生。大數(shù)據(jù)作為當(dāng)下的熱點已經(jīng)成了智游發(fā)展的有力支撐, 沒有大數(shù)據(jù)提供的有利信息, 智游無法變得“智慧”。

旅游業(yè)是信息密、綜合性強(qiáng)、信息依存度高的產(chǎn)業(yè)[1], 這讓其與大數(shù)據(jù)自然產(chǎn)生了交匯。2010年, 江蘇省鎮(zhèn)江市首先提出“智游”的概念, 雖然至今國內(nèi)外對于智游還沒有一個統(tǒng)一的學(xué)術(shù)定義, 但在與大數(shù)據(jù)相關(guān)的描述中, 有學(xué)者從大數(shù)據(jù)挖掘在智游中的作用出發(fā), 把智游描述為:通過充分收集和管理所有類型和來源的旅游數(shù)據(jù), 并深入挖掘這些數(shù)據(jù)的潛在重要價值信息, 然后利用這些信息為相關(guān)部門或?qū)ο筇峁┓?wù)[2]。這一定義充分肯定了在發(fā)展智游中, 大數(shù)據(jù)挖掘所起的至關(guān)重要的作用, 指出了在智游的過程中, 數(shù)據(jù)的收集、儲存、管理都是為數(shù)據(jù)挖掘服務(wù), 智游最終所需要的是利用挖掘所得的有用信息。

2011年, 我國提出用十年時間基本實現(xiàn)智游的目標(biāo)[3], 過去幾年, 國家旅游局的相關(guān)動作均為了實現(xiàn)這一目標(biāo)。但是, 在借助大數(shù)據(jù)推動智游的可持續(xù)性發(fā)展中, 大數(shù)據(jù)所產(chǎn)生的價值卻亟待提高, 原因之一就是在收集、儲存了大量數(shù)據(jù)后, 對它們深入挖掘不夠, 沒有發(fā)掘出數(shù)據(jù)更多的價值。

智游的發(fā)展離不開移動網(wǎng)絡(luò)、物聯(lián)網(wǎng)、云平臺。隨著大數(shù)據(jù)的不斷發(fā)展, 國內(nèi)許多景區(qū)已經(jīng)實現(xiàn)wi-fi覆蓋, 部分景區(qū)也已實現(xiàn)人與人、人與物、人與景點之間的實時互動, 多省市已建有旅游產(chǎn)業(yè)監(jiān)測平臺或旅游大數(shù)據(jù)中心以及數(shù)據(jù)可視化平臺, 從中進(jìn)行數(shù)據(jù)統(tǒng)計、行為分析、監(jiān)控預(yù)警、服務(wù)質(zhì)量監(jiān)督等。通過這些平臺, 已基本能掌握跟游客和景點相關(guān)的數(shù)據(jù), 可以實現(xiàn)更好旅游監(jiān)控、產(chǎn)業(yè)宏觀監(jiān)控, 對該地的旅游管理和推廣都能發(fā)揮重要作用。

但從智慧化的發(fā)展來看, 我國的信息化建設(shè)還需加強(qiáng)。雖然通訊網(wǎng)絡(luò)已基本能保證, 但是大部分景區(qū)還無法實現(xiàn)對景區(qū)全面、透徹、及時的感知, 更為困難的是對平臺的建設(shè)。在數(shù)據(jù)共享平臺的建設(shè)上, 除了必備的硬件設(shè)施, 大數(shù)據(jù)實驗平臺還涉及大量部門, 如政府管理部門、氣象部門、交通、電子商務(wù)、旅行社、旅游網(wǎng)站等。如此多的部門相關(guān)聯(lián), 要想建立一個完整全面的大數(shù)據(jù)實驗平臺, 難度可想而知。

大數(shù)據(jù)時代缺的不是數(shù)據(jù), 而是方法。大數(shù)據(jù)在旅游行業(yè)的應(yīng)用前景非常廣闊, 但是面對大量的數(shù)據(jù), 不懂如何收集有用的數(shù)據(jù)、不懂如何對數(shù)據(jù)進(jìn)行挖掘和利用, 那么“大數(shù)據(jù)”猶如礦山之中的廢石。旅游行業(yè)所涉及的結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù), 通過云計算技術(shù), 對數(shù)據(jù)的收集、存儲都較為容易, 但對數(shù)據(jù)的挖掘分析則還在不斷探索中。大數(shù)據(jù)的挖掘常用的方法有關(guān)聯(lián)分析, 相似度分析, 距離分析, 聚類分析等等, 這些方法從不同的角度對數(shù)據(jù)進(jìn)行挖掘。其中, 相關(guān)性分析方法通過關(guān)聯(lián)多個數(shù)據(jù)來源, 挖掘數(shù)據(jù)價值。但針對旅游數(shù)據(jù), 采用這些方法挖掘數(shù)據(jù)的價值信息, 難度也很大, 因為旅游數(shù)據(jù)中冗余數(shù)據(jù)很多, 數(shù)據(jù)存在形式很復(fù)雜。在旅游非結(jié)構(gòu)化數(shù)據(jù)中, 一張圖片、一個天氣變化、一次輿情評價等都將會對游客的旅行計劃帶來影響。對這些數(shù)據(jù)完全挖掘分析, 對游客“行前、行中、行后”大數(shù)據(jù)的實時性挖掘都是很大的挑戰(zhàn)。

2017年, 數(shù)據(jù)安全事件屢見不鮮, 伴著大數(shù)據(jù)而來的數(shù)據(jù)安全問題日益凸顯出來。在大數(shù)據(jù)時代, 無處不在的數(shù)據(jù)收集技術(shù)使我們的個人信息在所關(guān)聯(lián)的數(shù)據(jù)中心留下痕跡, 如何保證這些信息被合法合理使用, 讓數(shù)據(jù)“可用不可見”[4], 這是亟待解決的問題。同時, 在大數(shù)據(jù)資源的開放性和共享性下, 個人隱私和公民權(quán)益受到嚴(yán)重威脅。這一矛盾的存在使數(shù)據(jù)共享程度與數(shù)據(jù)挖掘程度成反比。此外, 經(jīng)過大數(shù)據(jù)技術(shù)的分析、挖掘, 個人隱私更易被發(fā)現(xiàn)和暴露, 從而可能引發(fā)一系列社會問題。

大數(shù)據(jù)背景下的旅游數(shù)據(jù)當(dāng)然也避免不了數(shù)據(jù)的安全問題。如果游客“吃、住、行、游、娛、購”的數(shù)據(jù)被放入數(shù)據(jù)庫, 被完全共享、挖掘、分析, 那游客的人身財產(chǎn)安全將會受到嚴(yán)重影響, 最終降低旅游體驗。所以, 數(shù)據(jù)的安全管理是進(jìn)行大數(shù)據(jù)挖掘的前提。

大數(shù)據(jù)背景下的智游離不開人才的創(chuàng)新活動及技術(shù)支持, 然而與專業(yè)相銜接的大數(shù)據(jù)人才培養(yǎng)未能及時跟上行業(yè)需求, 加之創(chuàng)新型人才的外流, 以及數(shù)據(jù)統(tǒng)計未來3~5年大數(shù)據(jù)行業(yè)將面臨全球性的人才荒, 國內(nèi)智游的構(gòu)建還缺乏大量人才。

在信息化建設(shè)上, 加大政府投入, 加強(qiáng)基礎(chǔ)設(shè)施建設(shè), 整合結(jié)構(gòu)化數(shù)據(jù), 抓取非結(jié)構(gòu)化數(shù)據(jù), 打通各數(shù)據(jù)壁壘, 建設(shè)旅游大數(shù)據(jù)實驗平臺;在挖掘方法上, 對旅游大數(shù)據(jù)實時性數(shù)據(jù)的挖掘應(yīng)該被放在重要位置;在數(shù)據(jù)安全上, 從加強(qiáng)大數(shù)據(jù)安全立法、監(jiān)管執(zhí)法及強(qiáng)化技術(shù)手段建設(shè)等幾個方面著手, 提升大數(shù)據(jù)環(huán)境下數(shù)據(jù)安全保護(hù)水平。加強(qiáng)人才的培養(yǎng)與引進(jìn), 加強(qiáng)產(chǎn)學(xué)研合作, 培養(yǎng)智游大數(shù)據(jù)人才。

參考文獻(xiàn)

[1]翁凱。大數(shù)據(jù)在智游中的應(yīng)用研究[j]。信 https:/// 息技術(shù), 2015, 24:86-87.

[2]梁昌勇, 馬銀超, 路彩虹。大數(shù)據(jù)挖掘, 智游的核心[j]。開發(fā)研究, 2015, 5 (180) :134-139.

[3]張建濤, 王洋, 劉力剛。大數(shù)據(jù)背景下智游應(yīng)用模型體系構(gòu)建[j]。企業(yè)經(jīng)濟(jì), 2017, 5 (441) :116-123.

[4]王竹欣, 陳湉。保障大數(shù)據(jù), 從哪里入手?[n]。人民郵電究, 2017-11-30.

數(shù)據(jù)挖掘論文答辯 數(shù)據(jù)挖掘論文3000字篇四

摘要:主要通過對數(shù)據(jù)挖掘技術(shù)的探討,對職教多年累積的教學(xué)數(shù)據(jù)運(yùn)用分類、決策樹、關(guān)聯(lián)規(guī)則等技術(shù)進(jìn)行分析,從分析的結(jié)果中發(fā)現(xiàn)有價值的數(shù)據(jù)模式,科學(xué)合理地實現(xiàn)教學(xué)評估,讓教學(xué)管理者能夠從中發(fā)現(xiàn)教學(xué)活動中存在的主要問題以便及時改進(jìn),進(jìn)而輔助管理者決策做好教學(xué)管理。

關(guān)鍵詞:教學(xué)評估;數(shù)據(jù)挖掘;教學(xué)評估體系;層次分析法

1概述

近年來國家對中等職業(yè)教育的發(fā)展高度重視,在政策扶持與職教工作者的努力下,職業(yè)教育獲得了蓬勃的發(fā)展。如何提高教學(xué)質(zhì)量、培養(yǎng)合格的高技術(shù)人才成為職教工作者研究的課題。各種調(diào)查研究結(jié)果表明:加強(qiáng)師資隊伍的建設(shè),強(qiáng)化教師教學(xué)評估對教學(xué)質(zhì)量的提高尤為重要。

所謂教學(xué)評估,就是運(yùn)用系統(tǒng)科學(xué)的方法對教學(xué)活動或教育行為的價值、效果作出科學(xué)的判斷過程。教學(xué)評估方式要靈活多樣,要多途徑、多方位、多形式的發(fā)揮評估的導(dǎo)學(xué)作用,以鼓勵評估為主,充分發(fā)揮評估的激勵功能,促進(jìn)教學(xué)的健康發(fā)展。

在中等職業(yè)學(xué)校多年的教育教學(xué)工作中積累了大量的教務(wù)管理數(shù)據(jù)、教師檔案數(shù)據(jù)等,怎樣從龐雜大量的數(shù)據(jù)中挖掘出有效提高教學(xué)質(zhì)量的關(guān)鍵因素是個難題。數(shù)據(jù)挖掘技術(shù)卻可以從人工智能的角度很好地解決這一課題。通過數(shù)據(jù)挖掘技術(shù),得到隱藏在教學(xué)數(shù)據(jù)背后的有用信息,在一定程度上為教學(xué)部門提供決策支持信息促使更好地開展教學(xué)工作,提高教學(xué)質(zhì)量和教學(xué)管理水平,使之能在功能上更加清晰地認(rèn)識教師教與學(xué)生學(xué)的關(guān)系及促進(jìn)教育教學(xué)改革。

2數(shù)據(jù)挖掘技術(shù)

2.1數(shù)據(jù)挖掘的含義

數(shù)據(jù)挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。數(shù)據(jù)挖掘應(yīng)該更正確地命名為“從數(shù)據(jù)中挖掘知識”。即數(shù)據(jù)挖掘是對巨大的數(shù)據(jù)集進(jìn)行尋找和分析的計算機(jī)輔助處理過程,在這一過程中顯現(xiàn)先前未曾發(fā)現(xiàn)的模式,然后從這些數(shù)據(jù)中發(fā)掘某些內(nèi)涵信息,包括描述過去和預(yù)測未來趨勢的信息。人工智能領(lǐng)域習(xí)慣稱知識發(fā)現(xiàn),而數(shù)據(jù)庫領(lǐng)域習(xí)慣將其稱為數(shù)據(jù)挖掘。

2.2數(shù)據(jù)挖掘的基本過程

數(shù)據(jù)挖掘過程包括對問題的理解和提出、數(shù)據(jù)收集、數(shù)據(jù)處理、數(shù)據(jù)變換、數(shù)據(jù)挖掘、模式評估、知識表示等過程,以上的過程不是一次完成的,其中某些步驟或者全過程可能要反復(fù)進(jìn)行。對問題的理解和提出在開始數(shù)據(jù)挖掘之前,最基礎(chǔ)的工作就是理解數(shù)據(jù)和實際的業(yè)務(wù)問題,在這個基礎(chǔ)之上提出問題,對目標(biāo)作出明確的定義。

2.3數(shù)據(jù)挖掘常用的算法

2.3.1分類分析方法:是通過分析訓(xùn)練集中的數(shù)據(jù),為每個類別做出準(zhǔn)確的描述或建立分析模型或挖掘出分類規(guī)則,以便以后利用這個分類規(guī)則對其它數(shù)據(jù)庫中的記錄進(jìn)行分類的方法。2.3.2決策樹算法:是一種常用于分類、預(yù)測模型的算法,它通過將大量數(shù)據(jù)有目的的分類,從而找到一些有價值的、潛在的信息。它的主要優(yōu)點是描述簡單,分類速度快,特別適合大規(guī)模的數(shù)據(jù)處理。2.3.3聚類算法:聚類分析處理的數(shù)據(jù)對象的類是未知的。聚類分析就是將對象集合分組為由類似的對象組成的多個簇的過程。在同一個簇內(nèi)的對象之間具有較高的相似度,而不同簇內(nèi)的對象差別較大。2.3.4關(guān)聯(lián)規(guī)則算法:側(cè)重于確定數(shù)據(jù)中不同領(lǐng)域之間的關(guān)系,即尋找給定數(shù)據(jù)集中的有趣聯(lián)系。提取描述數(shù)據(jù)庫中數(shù)據(jù)項之間所存在的潛在關(guān)系的規(guī)則,找出滿足給定支持度和置信度閾值的多個域之間的依賴關(guān)系。

在以上各種算法的研究中,比較有影響的是關(guān)聯(lián)規(guī)則算法。

3教學(xué)評估體系

評價指標(biāo)體系是教學(xué)評估的基礎(chǔ)和依據(jù),對評估起著導(dǎo)向作用,因此制定一個科學(xué)全面的評價指標(biāo)體系就成為改革、完善評價的首要目標(biāo)。評價指標(biāo)應(yīng)以指導(dǎo)教學(xué)實踐為目的,通過評價使教師明確教學(xué)過程中應(yīng)該肯定的和需要改進(jìn)的地方;以及給出設(shè)計評價指標(biāo)的導(dǎo)向問題。

3.1教學(xué)評估體系的構(gòu)建方法

層次分析法(簡稱ahp法)是美國運(yùn)籌學(xué)家t·l·saaty教授在20世紀(jì)70年代初期提出的一種簡便、靈活而又實用的多準(zhǔn)則決策的系統(tǒng)分析方法,其原理是把一個復(fù)雜問題分解、轉(zhuǎn)化為定量分析的方法。它需要建立關(guān)于系統(tǒng)屬性的各因素多級遞階結(jié)構(gòu),然后對每一層次上的因素逐一進(jìn)行比較,得到判斷矩陣,通過計算判斷矩陣的特征值和特征向量,得到其關(guān)于上一層因素的相對權(quán)重,并可自上而下地用上一層次因素的相對權(quán)重加權(quán)求和,求出各層次因素關(guān)于系統(tǒng)整體屬性(總目標(biāo)層)的綜合重要度。

3.2構(gòu)建教學(xué)評估指標(biāo)體系的作用

3.2.1構(gòu)建的教學(xué)評估指標(biāo),作為挖掘庫選擇教學(xué)信息屬性的依據(jù)。

3.2.2通過ahp方法,能篩選出用來評價教學(xué)質(zhì)量的相關(guān)重要屬性,從而入選為挖掘庫字段,這樣就減去了挖掘庫中對于挖掘目標(biāo)來說影響較小的屬性,進(jìn)而大大減少了挖掘的工作量,提高挖掘效率。3.2.3通過構(gòu)建教學(xué)評估指標(biāo),減少了挖掘?qū)ο蟮淖侄危瑥亩苊庖蛲诰蜃侄芜^多,導(dǎo)致建立的決策樹過大,出現(xiàn)過度擬合挖掘?qū)ο螅M(jìn)而造成挖掘規(guī)則不具有很好的評價效果的現(xiàn)象。3.2.4提高教學(xué)質(zhì)量評估實施工作的效率。

4數(shù)據(jù)挖掘在教學(xué)評估中的應(yīng)用

4.1學(xué)習(xí)效果評價學(xué)習(xí)評價是教育工作者的重要職責(zé)之一。評價學(xué)生的學(xué)習(xí)情況,既對學(xué)生起到信息反饋和激發(fā)學(xué)習(xí)動機(jī)的作用,又是檢查課程計劃、教學(xué)程序以至教學(xué)目的的手段,也是考查學(xué)生個別差異、便于因材施教的途徑。評價要遵循“評價內(nèi)容要全面、評價方式要多元化、評價次數(shù)要多次化,注重自評與互評的有機(jī)結(jié)合”的原則。利用數(shù)據(jù)挖掘工具,對教師業(yè)務(wù)檔案數(shù)據(jù)庫、行為記錄數(shù)據(jù)庫、獎勵處罰數(shù)據(jù)庫等進(jìn)行分析處理,可以即時得到教師教學(xué)的評價結(jié)果,對教學(xué)過程出現(xiàn)的問題進(jìn)行及時指正。

另外,這種系統(tǒng)還能夠克服教師主觀評價的不公正、不客觀的弱點,減輕教師的工作量。

4.2課堂教學(xué)評價

課堂教學(xué)評價不僅對教學(xué)起著調(diào)節(jié)、控制、指導(dǎo)和推動作用,而且有很強(qiáng)的導(dǎo)向性,是學(xué)校教學(xué)管理的重要組成部分,是評價教學(xué)工作成績的主要手段。實現(xiàn)對任課教師及教學(xué)組織工作效果做出評價,但是更重要的目的是總結(jié)優(yōu)秀的教學(xué)經(jīng)驗,為教學(xué)質(zhì)量的穩(wěn)定提高制定科學(xué)的規(guī)范。學(xué)校每學(xué)期都要搞課堂教學(xué)評價調(diào)查,積累了大量的數(shù)據(jù)。利用數(shù)據(jù)挖掘技術(shù),從教學(xué)評價數(shù)據(jù)中進(jìn)行數(shù)據(jù)挖掘,將關(guān)聯(lián)規(guī)則應(yīng)用于教師教學(xué)評估系統(tǒng)中,探討教學(xué)效果的好壞與老師的年齡、職稱、學(xué)歷之間的聯(lián)系;確定教師的教學(xué)內(nèi)容的范圍和深度是否合適,選擇的教學(xué)媒體是否適合所選的教學(xué)內(nèi)容和教學(xué)對象;講解的時間是否恰到好處;教學(xué)策略是否得當(dāng)?shù)?。從而可以及時地將挖掘出的規(guī)則信息反饋給教師。管理部門據(jù)此能合理配置班級的上課教師,使學(xué)生能夠較好地保持良好的學(xué)習(xí)態(tài)度,從而為教學(xué)部門提供了決策支持信息,促使教學(xué)工作更好地開展。

結(jié)束語

數(shù)據(jù)挖掘作為一種工具,其技術(shù)日趨成熟,在許多領(lǐng)域取得了廣泛的應(yīng)用。在教育領(lǐng)域里,隨著數(shù)據(jù)的不斷累積,把數(shù)據(jù)挖掘技術(shù)應(yīng)用到教學(xué)評價系統(tǒng)中,讓領(lǐng)導(dǎo)者能夠從中發(fā)現(xiàn)教師教學(xué)活動中的主要問題,以便及時改進(jìn),進(jìn)而輔助領(lǐng)導(dǎo)決策做好學(xué)校管理,提高學(xué)校管理能力和水平,同時通過建立有效的教學(xué)激勵機(jī)制來達(dá)到提高教學(xué)質(zhì)量的目的。這一研究對發(fā)展中的職業(yè)教育教學(xué)管理提出了很好的建議,為教學(xué)管理工作的計算機(jī)輔助決策增添了新的內(nèi)容。將數(shù)據(jù)挖掘技術(shù)應(yīng)用于中職教學(xué)評估,設(shè)計開發(fā)一套行之有效的課堂教學(xué)評價系統(tǒng),是下一步要做的工作,必將有力推動職業(yè)教育的快速發(fā)展。

【本文地址:http://gzsthw.cn/zuowen/1181833.html】

全文閱讀已結(jié)束,如果需要下載本文請點擊

下載此文檔