軟件工程數(shù)據(jù)挖掘進(jìn)展分析論文

時間:2023-04-27 03:44:13 論文范文 我要投稿
  • 相關(guān)推薦

軟件工程數(shù)據(jù)挖掘進(jìn)展分析論文

  【摘要】隨著改革的開放,科技的飛速發(fā)展,科技的發(fā)展速度已經(jīng)超過了人們的腳步,近年來,我們國家的計算機(jī)技術(shù)越來越成熟,計算機(jī)軟件也越來越廣泛,人們從前獲取計算機(jī)軟件信息的方法是手動獲取,但手工獲取的信息量是有一定限度的,不能滿足現(xiàn)代軟件的需求,所以,為了解決這個問題,本文著重于軟件工程數(shù)據(jù)挖掘的研究進(jìn)展。分別從幾個不同的方面對軟件工程數(shù)據(jù)挖掘研究進(jìn)行了探討。

軟件工程數(shù)據(jù)挖掘進(jìn)展分析論文

  【關(guān)鍵詞】軟件工程;數(shù)據(jù)挖掘;數(shù)據(jù)表示;數(shù)據(jù)預(yù)處理;機(jī)器學(xué)習(xí)

  1前言

  軟件工程的數(shù)據(jù)挖掘指的是在大量的數(shù)據(jù)中發(fā)現(xiàn)有用的信息。因為軟件工程的發(fā)展前景很廣闊,而且軟件工程數(shù)據(jù)挖掘是軟件開發(fā)不可或缺的一部分,所以現(xiàn)在在軟件工程領(lǐng)域以及一些相關(guān)領(lǐng)域內(nèi)軟件工程數(shù)據(jù)挖掘的研究非;馃幔藗兌紶幦”M量提高軟件工程數(shù)據(jù)挖掘的速度,有用信息比率,以及智能識別等。從而讓軟件工程更具特色,為人們提供更大的便利。

  2基本概念與技術(shù)挑戰(zhàn)

  2.1基本概念

  軟件工程在軟件開發(fā)過程中會累計很多的數(shù)據(jù),包括文檔數(shù)據(jù),測試數(shù)據(jù)以及用戶數(shù)據(jù)和用戶反饋數(shù)據(jù),軟件工程的開發(fā)者為了獲取軟件的信息就要使用這些數(shù)據(jù),但是軟件工程開發(fā)的軟件越來越大,軟件工程的數(shù)據(jù)量不再是手工可以處理的數(shù)量級,而且及其復(fù)雜,所以人們使用傳統(tǒng)的方法來收集數(shù)據(jù)是非常困難的,基本上是不可能的,所以人們必須研究快速處理數(shù)據(jù)的方法,也就是軟件工程數(shù)據(jù)挖掘技術(shù)。

  2.2軟件工程開發(fā)的過程及其相關(guān)信息

  軟件工程開發(fā)時所需要的最重要的一條基本原則就是軟件工程學(xué),軟件工程學(xué)講的就是軟件工程開發(fā)。軟件工程開發(fā)的基本步驟如下,首先進(jìn)行可行性分析,需求分析,開發(fā)者需要先進(jìn)性調(diào)研,來確定用戶對軟件功能的需求,在確定了大致的軟件開發(fā)方向之后,開發(fā)者開始編寫軟件代碼,然后根據(jù)代碼的測試進(jìn)行修改完善,在軟件公布之后要持續(xù)地為軟件進(jìn)行維護(hù),升級。在軟件的開發(fā)階段,每個開發(fā)者都不完全了解整個開發(fā)的過程,同時又不知道軟件的整體信息,所以這些開發(fā)者如果缺少這些信息,他們就會無法進(jìn)行繼續(xù)開發(fā),從而導(dǎo)致停工。

  2.3軟件工程的數(shù)據(jù)挖掘過程與任務(wù)

  軟件工程數(shù)據(jù)挖掘主要有三項任務(wù),第一步是對數(shù)據(jù)進(jìn)行預(yù)處理,第二步是對數(shù)據(jù)進(jìn)行挖掘,第三步是對挖掘的結(jié)果進(jìn)行分析。①數(shù)據(jù)預(yù)處理,待挖掘的大量數(shù)據(jù)混雜在了一起,它們的格式和形式是否適合進(jìn)行數(shù)據(jù)挖掘,是否符合當(dāng)前任務(wù)的數(shù)據(jù)特征,這些都是未知的,需要對其進(jìn)行預(yù)處理,預(yù)處理就是將大量的數(shù)據(jù)進(jìn)行改造,使其都變成適合進(jìn)行挖掘的形式,并且變成符合任務(wù)的數(shù)據(jù),整個數(shù)據(jù)挖掘過程中,預(yù)處理是最費時費力的過程,主要的手段是將數(shù)據(jù)向量化和將數(shù)據(jù)降維處理。②數(shù)據(jù)的挖掘,數(shù)據(jù)的挖掘其實就是對預(yù)處理之后的數(shù)據(jù)進(jìn)行整體探索,找到其中一些有用的信息,所謂有用的信息,指的就是反應(yīng)本質(zhì)的數(shù)據(jù),還有比如一些具有一定的規(guī)律的數(shù)據(jù),將這些數(shù)據(jù)找出來就是軟件工程數(shù)據(jù)挖掘的目的,數(shù)據(jù)的挖掘主要分為幾種,又頻繁序列的整理,關(guān)聯(lián)規(guī)則的整理,還有對數(shù)據(jù)進(jìn)行分類等。③軟件工程數(shù)據(jù)挖掘的結(jié)果分析,結(jié)果分析像是對一項工程進(jìn)行檢測驗收一樣,對挖掘之后的數(shù)據(jù)信息進(jìn)行檢測,將有用的信息展示出來,也就完成了整個軟件工程數(shù)據(jù)挖掘過程,這些挖掘之后的數(shù)據(jù)很有價值,對計算機(jī)軟件和客戶的使用效果而言有著重要的意義。

  3軟件工程數(shù)據(jù)挖掘面臨的挑戰(zhàn)

  因為軟件工程的數(shù)據(jù)與其他的普通數(shù)據(jù)不同,所以軟件工程數(shù)據(jù)的處理有著很大的困難,其困難主要有三個方面:①軟件工程的數(shù)據(jù)復(fù)雜化;②軟件工程的數(shù)據(jù)處理非傳統(tǒng);③對于軟件工程數(shù)據(jù)挖掘的結(jié)果分析的標(biāo)準(zhǔn)非常嚴(yán)格。

  3.1數(shù)據(jù)復(fù)雜化

  軟件工程的數(shù)據(jù)主要分為兩大類:①結(jié)構(gòu)化數(shù)據(jù);②非結(jié)構(gòu)化數(shù)據(jù)了。首先結(jié)構(gòu)化的數(shù)據(jù)主要由缺陷報告和版本信息組成,而非結(jié)構(gòu)化的數(shù)據(jù)則是由代碼和文檔組成。這兩類數(shù)據(jù)不能使用同一種算法進(jìn)行計算,但是這兩類數(shù)據(jù)之間又包含者重要的對應(yīng)關(guān)系,比如一個版本信息中對應(yīng)包含著一定的文檔,而一個代碼中又有著缺陷報告,這種糾纏不清的關(guān)系讓人們很難對其進(jìn)行整體分析,所以人們?yōu)榱嗽跀?shù)據(jù)挖掘時將這兩種數(shù)據(jù)同時挖掘出來,必須開發(fā)與之對應(yīng)的新型算法,這樣才能保證不漏掉很多有著復(fù)雜關(guān)系的結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。

  3.2非傳統(tǒng)分析

  上文提到,軟件工程數(shù)據(jù)挖掘的過程最后的步驟就是對挖掘之后的數(shù)據(jù)信息進(jìn)行分析評估,而數(shù)據(jù)的處理結(jié)果最終要交到客戶手中,對于客戶的各種不同的數(shù)據(jù)需求,開發(fā)者要將挖掘之后的數(shù)據(jù)進(jìn)行格式上的轉(zhuǎn)變,這樣大大地降低了軟件工程數(shù)據(jù)挖掘的效率,而且往往客戶要求的信息遠(yuǎn)遠(yuǎn)不止一種信息,有時還會需要具體的事例,編程的代碼,缺陷的報告等等信息,所以,軟件工程數(shù)據(jù)挖掘技術(shù)還需要進(jìn)行新的完善,將要提交的信息進(jìn)行歸類,改變格式化,以及對各種需求都要滿足而且保證效率的技術(shù),做到讓客戶對數(shù)據(jù)挖掘結(jié)果滿意,開發(fā)者還能從中獲取最大利益的技術(shù)。3.3數(shù)據(jù)挖掘結(jié)果的評價標(biāo)準(zhǔn)在從前,傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)有著完善的對結(jié)果的分析標(biāo)準(zhǔn),而現(xiàn)在,面對海量的軟件工程數(shù)據(jù),這套規(guī)定已經(jīng)不再適用,對于不同的數(shù)據(jù)挖掘結(jié)果,對應(yīng)著不同的數(shù)據(jù)結(jié)果分析評價標(biāo)準(zhǔn),每個評價標(biāo)準(zhǔn)之間并沒有太多的聯(lián)系,這就需要開發(fā)者對不同類型的數(shù)據(jù)挖掘結(jié)果制定不同的分析標(biāo)準(zhǔn),同時也需要滿足客戶的要求,開發(fā)者要對數(shù)據(jù)的結(jié)果有著獨特的理解,才能對其結(jié)果是否滿足要求,挖掘的是否成功,這些不定量的問題進(jìn)行透徹的了解?偠灾浖こ虜(shù)據(jù)挖掘最終還是為了獲取信息,所以,整個軟件工程數(shù)據(jù)挖掘的結(jié)果是否將問題完美的解決的標(biāo)準(zhǔn)還是最終的數(shù)據(jù)是否滿足要求,所以,上述挑戰(zhàn)將會對數(shù)據(jù)挖掘的結(jié)果造成影響,為了解決這些問題,人們還需要開發(fā)新的技術(shù),最終達(dá)到軟件工程數(shù)據(jù)挖掘技術(shù)的完善。

  4對軟件工程數(shù)據(jù)挖掘的展望

  軟件工程數(shù)據(jù)挖掘技術(shù)對計算機(jī)軟件的開發(fā),用戶的完美體驗都有著重要的意義,所以以后軟件挖掘技術(shù)還會繼續(xù)的發(fā)展下去,要完成軟件工程數(shù)據(jù)挖掘技術(shù)的完善,要做到以下幾點:①對已經(jīng)發(fā)現(xiàn)的數(shù)據(jù)挖掘問題進(jìn)行開發(fā),就比如結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù)的捏合整理,這正是人們一直都沒做到的重點難點,要攻破這一難關(guān),人們必須在計算結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)挖掘時舍棄傳統(tǒng)的數(shù)據(jù)算法,開發(fā)新的適合這兩數(shù)據(jù)的算法,這樣才能一步到位將結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù)一起運算出來。②對將要面臨的軟件工程數(shù)據(jù)挖掘技術(shù)的難題進(jìn)行預(yù)案,對于這些問題要做好準(zhǔn)備,開發(fā)者要豐富自己的知識面,以免今后遇到問題時不知道怎么辦。比如惡意程序,電腦高手病毒的處理,這些在未來將會越來越多,也就需要開發(fā)者對其做好先前的準(zhǔn)備,從而在問題來臨的時候迎刃而解。

  5結(jié)束語

  隨著人們對事物的追求便利,軟件工程的應(yīng)用越來越廣泛,所以,對于軟件工程中的最重要部分軟件工程數(shù)據(jù)挖掘技術(shù)也要大力發(fā)展,現(xiàn)在有很多軟件工程數(shù)據(jù)挖掘技術(shù)正在興起。相信隨著研究的不斷深入,軟件工程數(shù)據(jù)挖掘工具將會越來越實用化、智能化,乃至實現(xiàn)真正的自動軟件挖掘。

  參考文獻(xiàn)

  [1]李新,張曉靜,米燕濤.軟件開發(fā)過程中的數(shù)據(jù)挖掘[J].石家莊職業(yè)技術(shù)學(xué)院學(xué)報,2012(02):10~12.

  [2]趙麗坤,陳立文,張國宗.基于數(shù)據(jù)挖掘技術(shù)的軟件項目管理體系[J].經(jīng)營與管理,2012(12):34~35.

  [3]鄒文東,張立厚.數(shù)據(jù)挖掘在水環(huán)境分析信息化中的應(yīng)用[J].圖書館論壇,2006(05).

【軟件工程數(shù)據(jù)挖掘進(jìn)展分析論文】相關(guān)文章:

數(shù)據(jù)挖掘論文04-29

空間數(shù)據(jù)挖掘的方法進(jìn)展及其問題分析05-02

數(shù)據(jù)挖掘論文[范例15篇]07-29

數(shù)據(jù)挖掘04-29

馬克威分析系統(tǒng)介紹(四)-數(shù)據(jù)挖掘05-02

地理作用和集聚演化:基于數(shù)據(jù)挖掘的分析04-29

基于數(shù)據(jù)挖掘技術(shù)的交通事故分析04-26

基于決策樹的我國農(nóng)業(yè)數(shù)據(jù)挖掘分析05-01

地理作用和集聚演化:基于數(shù)據(jù)挖掘的分析05-02

淺談數(shù)據(jù)挖掘05-02