国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于人工智能技術(shù)的大數(shù)據(jù)分析方法研究進(jìn)展

2023-01-14 14:49費(fèi)一鳴
電子測(cè)試 2022年6期
關(guān)鍵詞:機(jī)器深度人工智能

費(fèi)一鳴

(香港恒生大學(xué),香港,999077)

1 大數(shù)據(jù)分析方法問(wèn)題的提出

1.1 大數(shù)據(jù)分析的重要性

大數(shù)據(jù)是人類(lèi)發(fā)展過(guò)程中的重要資源,使我們必不可少的重要內(nèi)容。關(guān)注大數(shù)據(jù)技術(shù)的研究工作,可以充分挖掘大數(shù)據(jù)的內(nèi)在價(jià)值和科學(xué)知識(shí),認(rèn)識(shí)工業(yè)經(jīng)濟(jì)的快速發(fā)展。當(dāng)下數(shù)據(jù)無(wú)所不在:在我國(guó)經(jīng)濟(jì)發(fā)展中,可以科學(xué)控制工業(yè)生產(chǎn)過(guò)程[1],從而實(shí)現(xiàn)產(chǎn)業(yè)經(jīng)濟(jì)結(jié)構(gòu)的調(diào)整,為我國(guó)經(jīng)濟(jì)發(fā)展注入新的活力。此外,大數(shù)據(jù)技術(shù)的應(yīng)用有效結(jié)合人工智能技術(shù),將智能制造應(yīng)用于社會(huì)制造,為制造業(yè)轉(zhuǎn)型做出巨大貢獻(xiàn)。

1.2 技術(shù)路線

基于人工智能技術(shù)的大數(shù)據(jù)分析,智能是前提,離不開(kāi)高端的技術(shù)支持。利用大數(shù)據(jù)、人工智能等技術(shù)和硬件,實(shí)現(xiàn)信息的實(shí)時(shí)動(dòng)態(tài)采集,整合分析社會(huì)的需求,為社會(huì)決策作出最優(yōu)解。從收集數(shù)據(jù)到分析需求,再到數(shù)據(jù)整合、數(shù)據(jù)清洗、數(shù)據(jù)分析、深度培訓(xùn)、設(shè)計(jì)合適的方案,整個(gè)過(guò)程涉及大數(shù)據(jù)、人工智能等相關(guān)技術(shù)。

1.2.1 大數(shù)據(jù)與Hadoop

根據(jù)麥肯錫全球研究院的定義,大數(shù)據(jù)一般是指大到足以捕獲、存儲(chǔ)、分析和處理超出傳統(tǒng)數(shù)據(jù)管理工具能力的非結(jié)構(gòu)化數(shù)據(jù)的集合。大數(shù)據(jù)只是為了實(shí)現(xiàn)某些公司或其他利益相關(guān)者的某些目標(biāo)或運(yùn)營(yíng)策略而收集的大量數(shù)據(jù)。大數(shù)據(jù)技術(shù)在于將這些海里數(shù)據(jù)專(zhuān)業(yè)化處理成有價(jià)值的信息。

必須處理大量數(shù)據(jù)才能提取信息。首先要解決的問(wèn)題是數(shù)據(jù)存儲(chǔ)問(wèn)題。Hadoop工具具有分布式HDFS文件系統(tǒng)。初衷是在數(shù)百臺(tái)計(jì)算機(jī)上存儲(chǔ)大量數(shù)據(jù)。HDFS是提供的管理解決數(shù)據(jù)存儲(chǔ)問(wèn)題。

1.2.2 人工智能與Python

人工智能,英文縮寫(xiě)是AI,研究的重點(diǎn)是人類(lèi)的思維和意識(shí),這種人類(lèi)的行為是通過(guò)機(jī)器模擬,通過(guò)數(shù)學(xué)計(jì)算和分析來(lái)實(shí)現(xiàn)的。人工智能包括兩個(gè)非常重要的模塊:常用的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)。

創(chuàng)建模型需要使用Python爬蟲(chóng)技術(shù)從互聯(lián)網(wǎng)上獲取企業(yè)數(shù)據(jù)以外的數(shù)據(jù),這就需要用到Python中的Requests、Scrapy、Selenium、BeautifulSoup等庫(kù)。機(jī)器學(xué)習(xí)和深度學(xué)習(xí)只有在數(shù)據(jù)被抓取后才能進(jìn)行。機(jī)器學(xué)習(xí)和深度學(xué)習(xí)以及整個(gè)人工智能領(lǐng)域中的大多數(shù)模型和算法都使用Python作為基礎(chǔ)語(yǔ)言。

2 基于人工智能的大數(shù)據(jù)發(fā)現(xiàn)網(wǎng)絡(luò)技術(shù)設(shè)計(jì)

2.1 大數(shù)據(jù)的網(wǎng)絡(luò)掃描處理

網(wǎng)絡(luò)掃描是使用電子系統(tǒng)識(shí)別、讀取和記錄數(shù)據(jù)的過(guò)程,以便未經(jīng)授權(quán)的數(shù)據(jù)可以通過(guò)檢查。其作用是加快數(shù)據(jù)驗(yàn)證,保證數(shù)據(jù)安全,但對(duì)于人工智能技術(shù)平臺(tái)人員來(lái)說(shuō)[2],查找數(shù)據(jù)存在難度,所以要解決這個(gè)問(wèn)題,首先要對(duì)數(shù)據(jù)進(jìn)行網(wǎng)絡(luò)掃描。

數(shù)據(jù)采用大數(shù)據(jù)掃描處理,它是對(duì)瀏覽量數(shù)據(jù)進(jìn)行分類(lèi)和定性分類(lèi)的過(guò)程。這個(gè)過(guò)程中用到的參數(shù)叫做分辨率,是掃描的關(guān)鍵。

2.2 大數(shù)據(jù)信息的提取

大數(shù)據(jù)信息的提取旨在從人工智能技術(shù)平臺(tái)的頁(yè)面瀏覽數(shù)據(jù)中獲取有價(jià)值的信息。現(xiàn)在數(shù)字處理應(yīng)用于構(gòu)建基于人工智能的大數(shù)據(jù)識(shí)別網(wǎng)絡(luò)。其基本思路如下:首先對(duì)提取的客戶(hù)瀏覽量數(shù)據(jù)進(jìn)行預(yù)處理,然后確定大數(shù)據(jù)識(shí)別屬性,以便過(guò)濾他們出來(lái)。

2.3 數(shù)據(jù)分析方法

2.3.1 聚類(lèi)分析法

聚類(lèi)分析方法的主要特點(diǎn)是對(duì)通過(guò)相似性收集到的信息進(jìn)行分組和分類(lèi),使信息以分段的形式呈現(xiàn)。這種方法論對(duì)看似雜亂無(wú)章的數(shù)據(jù)進(jìn)行深入研究,根據(jù)分析的目標(biāo)將數(shù)據(jù)劃分為不同的組。然后利用數(shù)據(jù)之間的聯(lián)系提取有價(jià)值的信息,發(fā)現(xiàn)信息的潛在價(jià)值。聚類(lèi)分析方法有一定的缺點(diǎn),因?yàn)閿?shù)據(jù)信息本身的個(gè)性化,使得在計(jì)算統(tǒng)計(jì)時(shí)難以進(jìn)行數(shù)據(jù)分析,也難以識(shí)別數(shù)據(jù)。

2.3.2 人工神經(jīng)網(wǎng)絡(luò)分析方法

人工神經(jīng)網(wǎng)絡(luò)法是指試圖通過(guò)模擬大腦神經(jīng)網(wǎng)絡(luò)處理和存儲(chǔ)信息的方式,分析和抽象復(fù)雜而廣泛的數(shù)據(jù),接收和使用計(jì)算結(jié)果的方式來(lái)處理信息的方法。例如:人工神經(jīng)網(wǎng)絡(luò)法主要是在數(shù)學(xué)模型上建立算法,輸入神經(jīng)網(wǎng)絡(luò)的研究值都是數(shù)值型的。在收集相關(guān)數(shù)據(jù)時(shí)需要根據(jù)自身實(shí)際需要對(duì)相關(guān)數(shù)據(jù)進(jìn)行分析。最好是進(jìn)行數(shù)據(jù)分析,確保人工智能技術(shù)的應(yīng)用。

2.3.3 相關(guān)性分析方法

相關(guān)性分析法是一種利用大數(shù)據(jù)揭示數(shù)據(jù)庫(kù)中不同信息之間關(guān)系的分析技術(shù)。相關(guān)性分析方法可以對(duì)采集到的數(shù)據(jù)和不能直接應(yīng)用的信息進(jìn)行相關(guān)性分析,實(shí)現(xiàn)隱藏信息的挖掘和相應(yīng)的處理,識(shí)別數(shù)據(jù)的唯一性。這類(lèi)分析方法具有更好的準(zhǔn)確性和目的性,因此這類(lèi)分析方法更常用于數(shù)據(jù)的精確分析,例如:在管理文件信息方面。

2.3.4 特征數(shù)據(jù)分析方法

數(shù)據(jù)特征分析是一種基于數(shù)據(jù)質(zhì)量分析結(jié)果的數(shù)據(jù)分析方法.利用計(jì)算數(shù)據(jù)的特定相關(guān)特征集等方法,得到的人工智能結(jié)果可能更接近先前預(yù)期的數(shù)據(jù)分析結(jié)果或一致。所以使用這種方法進(jìn)行數(shù)據(jù)分析可以更好地實(shí)現(xiàn)大規(guī)模數(shù)據(jù)分析。大數(shù)據(jù)時(shí)代,海量數(shù)據(jù)和信息呈現(xiàn)快速增長(zhǎng)趨勢(shì),給數(shù)據(jù)整理和分析帶來(lái)信息的使用困難。

2.4 確定大數(shù)據(jù)發(fā)現(xiàn)的屬性

為了使大數(shù)據(jù)更容易識(shí)別,需要在識(shí)別描述中盡可能完整地描述大數(shù)據(jù)信息,但同時(shí)對(duì)大數(shù)據(jù)識(shí)別網(wǎng)絡(luò)本身的描述也很重要。另外,由于大數(shù)據(jù)的輸出結(jié)果是一個(gè)數(shù)據(jù)集,需要定義很多操作來(lái)滿(mǎn)足用戶(hù)的不同需求。因此,有必要明確大數(shù)據(jù)識(shí)別應(yīng)涵蓋的數(shù)據(jù)來(lái)源。

2.5 實(shí)現(xiàn)大數(shù)據(jù)檢測(cè)網(wǎng)絡(luò)的建設(shè)

在基于人工智能的大數(shù)據(jù)發(fā)現(xiàn)中,網(wǎng)絡(luò)發(fā)現(xiàn)處理可以加快數(shù)據(jù)驗(yàn)證速度,保證數(shù)據(jù)安全,然后根據(jù)大數(shù)據(jù)信息的提取確定大數(shù)據(jù)發(fā)現(xiàn)的屬性。

基于大數(shù)據(jù)發(fā)現(xiàn)完成大數(shù)據(jù)信息提?。灰揽看髷?shù)據(jù)檢測(cè)屬性的確定,使大數(shù)據(jù)檢測(cè)成為現(xiàn)實(shí)。完成關(guān)于構(gòu)建基于人工智能的大數(shù)據(jù)發(fā)現(xiàn)網(wǎng)絡(luò)的擬議研究。

3 基于人工智能技術(shù)的大數(shù)據(jù)分析方法研究方向

3.1 機(jī)器學(xué)習(xí)的大數(shù)據(jù)分析

機(jī)器學(xué)習(xí)是人工智能技術(shù)的組成部分之一,在當(dāng)前大數(shù)據(jù)分析技術(shù)的研究階段[3],應(yīng)用機(jī)器學(xué)習(xí)已經(jīng)成為大數(shù)據(jù)分析技術(shù)中最重要的部分。技術(shù)人員利用機(jī)器學(xué)習(xí)技術(shù)有效討論當(dāng)前大數(shù)據(jù)分析技術(shù),提高當(dāng)前工作質(zhì)量,將大數(shù)據(jù)技術(shù)應(yīng)用到日常生活中。研究人員對(duì)大數(shù)據(jù)的分析從四個(gè)主要方面開(kāi)始:大數(shù)據(jù)聚類(lèi)、大數(shù)據(jù)關(guān)聯(lián)分析、大數(shù)據(jù)分類(lèi)和大數(shù)據(jù)預(yù)測(cè)。研究人員在使用機(jī)器學(xué)習(xí)分析大數(shù)據(jù)技術(shù)時(shí),需要結(jié)合現(xiàn)階段機(jī)器學(xué)習(xí)技術(shù)的實(shí)際情況[4],才能有效地將機(jī)器學(xué)習(xí)技術(shù)應(yīng)用到日常生活中。

例如,當(dāng)研究人員使用機(jī)器學(xué)習(xí)分析大數(shù)據(jù)時(shí),他們使用傳統(tǒng)的聚類(lèi)算法對(duì)現(xiàn)階段的大量數(shù)據(jù)進(jìn)行阻塞和簡(jiǎn)化,然后將這些計(jì)算結(jié)果重新組合以實(shí)現(xiàn)大數(shù)據(jù)分析。其中,MapReduce是目前分布式計(jì)算的主流框架之一,研究人員可以使用該框架通過(guò)機(jī)器學(xué)習(xí)來(lái)實(shí)現(xiàn)數(shù)據(jù)分析。在研究傳統(tǒng)聚類(lèi)算法時(shí),由于現(xiàn)階段數(shù)據(jù)量較大,所有的研究工作都比較繁瑣。它是一種并行聚類(lèi)算法,可以有效提高計(jì)算機(jī)處理速度來(lái)分析經(jīng)典大數(shù)據(jù)。

3.2 深度學(xué)習(xí)的大數(shù)據(jù)分析

當(dāng)前的大數(shù)據(jù)研究強(qiáng)調(diào)使用深度學(xué)習(xí)技術(shù),并為提高計(jì)算機(jī)操作質(zhì)量做出相應(yīng)貢獻(xiàn)。深度學(xué)習(xí)代表了這一階段人工智能技術(shù)的關(guān)鍵技術(shù),它要求公司員工在模型訓(xùn)練過(guò)程中注意對(duì)各種閾值和參數(shù)的迭代計(jì)算[5],以實(shí)現(xiàn)這一階段的計(jì)算機(jī)智能并構(gòu)建為這些隱藏階段構(gòu)建深度網(wǎng)絡(luò),逐漸適應(yīng)當(dāng)前的工作質(zhì)量,并為大數(shù)據(jù)分析指明方向。

目前,深度學(xué)習(xí)技術(shù)研究取得了一定的進(jìn)展,有力地支撐了我國(guó)經(jīng)濟(jì)和產(chǎn)業(yè)的發(fā)展?;赟park的分布式平臺(tái)可以利用內(nèi)存計(jì)算訓(xùn)練模型參數(shù),逐步構(gòu)建深度網(wǎng)絡(luò),提高大數(shù)據(jù)分析效率,為當(dāng)前階段大數(shù)據(jù)探索指明方向。在深度神經(jīng)網(wǎng)絡(luò)分析中,研究人員重視算法工作,并借助信息論逐漸適應(yīng)當(dāng)前工作的發(fā)展,明確整體數(shù)據(jù)中隱藏神經(jīng)元的數(shù)量。然后將大數(shù)據(jù)劃分為塊,并根據(jù)深度學(xué)習(xí)-訓(xùn)練步驟實(shí)現(xiàn)對(duì)各種數(shù)據(jù)的迭代計(jì)算,從而改變當(dāng)前的工作質(zhì)量[6],提高深度學(xué)習(xí)模型的學(xué)習(xí)速度,提高相應(yīng)大數(shù)據(jù)分析技術(shù)的準(zhǔn)確性,從而實(shí)現(xiàn)大數(shù)據(jù)的構(gòu)建。

3.3 大數(shù)據(jù)分析的計(jì)算智能

在當(dāng)前人工智能的發(fā)展中,計(jì)算智能是計(jì)算機(jī)研究的一個(gè)重要分支,借助現(xiàn)有的計(jì)算智能研究方法,可以高效處理大數(shù)據(jù)。研究人員重視傳統(tǒng)優(yōu)化算法的使用,有效利用計(jì)算智能技術(shù)實(shí)現(xiàn)大數(shù)據(jù)的高效處理。

基于群體智能的大數(shù)據(jù)分析技術(shù)是這一階段實(shí)現(xiàn)具有動(dòng)態(tài)特性的大數(shù)據(jù)分析的重要手段。群體智能的大數(shù)據(jù)分析方法是這一階段分布式計(jì)算的一個(gè)重要分支,常用于大數(shù)據(jù)分析。目前的技術(shù)人員能夠基于粒子群優(yōu)化技術(shù)有效地處理大數(shù)據(jù)。該階段的研究人員基于數(shù)據(jù)拆分合并策略,實(shí)現(xiàn)了不同樣本的拆分,保持了原始數(shù)據(jù)之間的信息傳遞,有效地整合了不同的子集,從而提高了大數(shù)據(jù)分析的效率。目前,利用計(jì)算智能技術(shù),可以逐步建立起由數(shù)據(jù)存儲(chǔ)和并行計(jì)算組成的高效管理機(jī)制,為大數(shù)據(jù)技術(shù)的應(yīng)用做出重大貢獻(xiàn)。

4 結(jié)束語(yǔ)

本文研究的基于人工智能技術(shù)的大數(shù)據(jù)檢測(cè)網(wǎng)絡(luò)技術(shù)是在網(wǎng)絡(luò)掃描處理大數(shù)據(jù)的基礎(chǔ)上,提取瀏覽量數(shù)據(jù),確定大數(shù)據(jù)檢測(cè)的屬性,構(gòu)建大數(shù)據(jù)實(shí)現(xiàn)基于大數(shù)據(jù)的檢測(cè)網(wǎng)絡(luò)。最后,經(jīng)過(guò)驗(yàn)證,本文檢驗(yàn)的技術(shù)識(shí)別數(shù)據(jù)量與原始數(shù)據(jù)集匹配,證明了本文技術(shù)研究的有效性。希望本文的研究能為數(shù)據(jù)識(shí)別提供有效的技術(shù)幫助。

猜你喜歡
機(jī)器深度人工智能
機(jī)器狗
四增四減 深度推進(jìn)
機(jī)器狗
深度理解一元一次方程
簡(jiǎn)約教學(xué) 深度學(xué)習(xí)
2019:人工智能
人工智能與就業(yè)
未來(lái)機(jī)器城
數(shù)讀人工智能
下一幕,人工智能!
牡丹江市| 洮南市| 定安县| 鲁甸县| 泗水县| 花莲县| 武平县| 景泰县| 滕州市| 罗江县| 崇礼县| 泰州市| 五指山市| 焉耆| 鸡东县| 凯里市| 开阳县| 黄陵县| 和田县| 剑川县| 黄龙县| 岳阳县| 遂平县| 定襄县| 和田县| 孝感市| 法库县| 丽江市| 辽宁省| 汝城县| 洛浦县| 沙河市| 东阳市| 邵东县| 天峨县| 眉山市| 台北市| 宝坻区| 景泰县| 长沙县| 进贤县|