国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

Python在實驗室設(shè)備預(yù)約機時統(tǒng)計中的應(yīng)用

2020-01-08 02:22馬玲烏李瑛王英韓曉佳吳煒文
現(xiàn)代信息科技 2020年15期
關(guān)鍵詞:數(shù)據(jù)統(tǒng)計實驗室管理

馬玲 烏李瑛 王英 韓曉佳 吳煒文

摘 ?要:Python因其簡單易學(xué)及強大的第三方庫支持等優(yōu)點,逐漸在數(shù)據(jù)分析、圖像處理、數(shù)值計算和科學(xué)計算等眾多領(lǐng)域得到了越來越廣泛的應(yīng)用。通過使用Python,并借助其核心數(shù)據(jù)分析庫Pandas,實現(xiàn)了對實驗室設(shè)備預(yù)約機時記錄的便捷的數(shù)據(jù)導(dǎo)入、數(shù)據(jù)篩選、數(shù)據(jù)分析和結(jié)果輸出,并且該方法編程簡單、代碼簡潔、運行效率高,非常適用于實驗室管理中存在大量實驗記錄的數(shù)據(jù)統(tǒng)計相關(guān)工作。

關(guān)鍵詞:Python;Pandas;數(shù)據(jù)統(tǒng)計;實驗室管理

中圖分類號:TP311.1 ? ? ? 文獻(xiàn)標(biāo)識碼:A 文章編號:2096-4706(2020)15-0027-03

Abstract:Because of its easy-to-learn and powerful third-party library support,Python has gradually been widely used in many fields such as data analysis,image processing,numerical computing,and scientific computing. This paper uses Python and its core data analysis library Pandas to realize convenient data import,data screening,data analysis and result output of the records of laboratory equipment reservations. This method has simple programming,concise code,high operating efficiency,and is very suitable for data statistics related work in laboratory management which has a large number of experimental records.

Keywords:Python;Pandas;data statistics;laboratory management

0 ?引 ?言

常用的數(shù)據(jù)分析工具有SAS、SPSS、R語言、Python,MATLAB等[1],但Python因其具有的簡易性、實用性、大量的開源庫和分析框架,以及龐大的社區(qū)等特點,而逐漸成為大數(shù)據(jù)分析領(lǐng)域最受歡迎的主流程序語言之一[2]。Pandas是Python數(shù)據(jù)分析的核心庫,因納入了大量的庫和標(biāo)準(zhǔn)數(shù)據(jù)模型,故可提供大量的可快速方便處理數(shù)據(jù)的函數(shù),以及高效處理數(shù)據(jù)集所需的工具[3-6]。

上海交通大學(xué)先進(jìn)電子材料與器件校級平臺,是校級大型儀器設(shè)備共享平臺,平臺擁有電子束曝光系統(tǒng)、雙束聚焦離子束系統(tǒng)、深硅刻蝕系統(tǒng)、場發(fā)射掃描電子顯微鏡等大批先進(jìn)的微納加工及測試設(shè)備;并且在面向校內(nèi)用戶提供基礎(chǔ)實驗以及科研支撐的同時,也面向社會相關(guān)的科研院所和企業(yè)單位開放,故每天會產(chǎn)生大量的實驗預(yù)約記錄;如何方便快捷的根據(jù)需要統(tǒng)計的項目對這些實驗預(yù)約記錄進(jìn)行匯總統(tǒng)計,是實驗室管理統(tǒng)計工作的工作要點。

本文利用Python,結(jié)合Pandas庫,對實驗室設(shè)備預(yù)約機時匯總表的Excel文件進(jìn)行了數(shù)據(jù)導(dǎo)入、數(shù)據(jù)篩選、數(shù)據(jù)分組聚合以及數(shù)據(jù)寫入,最終方便快捷地得到了所需各設(shè)備的有效預(yù)約機時等相關(guān)參數(shù)的統(tǒng)計處理結(jié)果。

1 ?數(shù)據(jù)導(dǎo)入

Pandas常用的讀/寫數(shù)據(jù)源主要包括:文本文件、Excel文件、數(shù)據(jù)庫文件和JSON文件。

本文預(yù)導(dǎo)入的實驗室設(shè)備預(yù)約機時匯總表為Excel文件,包含總記錄條數(shù)為526條,涉及設(shè)備35臺;所需的統(tǒng)計項目及示例記錄如表1所示。

在執(zhí)行Pandas讀取和寫入Excel的操作時,需要提前安裝xlrd庫和xlwt庫,并在當(dāng)前的代碼中導(dǎo)入這兩個庫。安裝xlrd、xlwt庫的方法:進(jìn)入cmd狀態(tài),分別輸入命令“pip install xlrd”“pip install xlwt”即可。

Pandas提供了read_excel()函數(shù)來讀取Excel文件,將文件內(nèi)容讀取為DataFrame對象df。代碼為:

import pandas as pd #導(dǎo)入pandas庫

import xlrd #導(dǎo)入xlrd庫

import xlwt #導(dǎo)入xlwt庫

df=pd.read_excel('EquipmentStatistics_source.xlsx') #讀取原始設(shè)備機時匯總表單,默認(rèn)讀取第一個表單

2 ?數(shù)據(jù)篩選

因本實驗室設(shè)備預(yù)約機時匯總表的原始表單里存在一定量的不需要納入統(tǒng)計范疇的預(yù)約記錄,如“預(yù)約狀態(tài)”為“預(yù)約撤銷”或“預(yù)約終止”的預(yù)約記錄,故需要在作統(tǒng)計前進(jìn)行相應(yīng)的數(shù)據(jù)篩選,即僅篩選出“預(yù)約狀態(tài)”為“預(yù)約成功”的預(yù)約記錄做統(tǒng)計。

Pandas提供了isin()函數(shù),來篩選出DataFrame里滿足條件的行數(shù)據(jù)。

在開始進(jìn)行數(shù)據(jù)篩選前,我們先對篩選前的數(shù)據(jù),根據(jù)“預(yù)約狀態(tài)”進(jìn)行分類統(tǒng)計。Pandas提供了value_counts()函數(shù),可對數(shù)據(jù)按指定的條件進(jìn)行分類統(tǒng)計,即統(tǒng)計出條件數(shù)據(jù)出現(xiàn)的頻率。

數(shù)據(jù)篩選前,預(yù)約記錄條數(shù)按“預(yù)約狀態(tài)”的統(tǒng)計分布如表2所示。

接下來,開始進(jìn)行數(shù)據(jù)篩選,即從原始預(yù)約記錄中僅篩選出“預(yù)約狀態(tài)”為“預(yù)約成功”的預(yù)約記錄。代碼為:

print("\n開始進(jìn)行數(shù)據(jù)篩選:")

title = ['預(yù)約成功']

df2 = df[(df['預(yù)約狀態(tài)'].isin(title)) ] #篩選出“預(yù)約狀態(tài)”為“預(yù)約成功”的數(shù)據(jù),并將結(jié)果存儲在df2

print("\n數(shù)據(jù)篩選完成!")

在數(shù)據(jù)篩選完成后,預(yù)約記錄條數(shù)按“預(yù)約狀態(tài)”的統(tǒng)計分布如表3所示。可見,已成功將“預(yù)約狀態(tài)”為“預(yù)約成功”的預(yù)約記錄篩選出來。

3 ?數(shù)據(jù)分組聚合

數(shù)據(jù)篩選完成后,需要根據(jù)“設(shè)備名稱”來依次統(tǒng)計所有預(yù)約記錄的“預(yù)約機時、加工數(shù)量、預(yù)約次數(shù)”,并且除了“預(yù)約次數(shù)”是需要計數(shù)統(tǒng)計外,其余兩項統(tǒng)計項目均需要進(jìn)行求和統(tǒng)計。

Pandas提供了groupby()分組函數(shù),和agg()聚合函數(shù),可方便地對多維數(shù)據(jù)按分組分別進(jìn)行計數(shù)、求和、求均值、求方差,求標(biāo)準(zhǔn)差等的數(shù)據(jù)統(tǒng)計。

本次統(tǒng)計,先根據(jù)“設(shè)備名稱”進(jìn)行分組,再對分組后的數(shù)據(jù)對象依次進(jìn)行“預(yù)約機時、加工數(shù)量、預(yù)約次數(shù)”的“求和、求和、計數(shù)”聚合運算。代碼為:

df3 = df2.groupby(['設(shè)備名稱']).agg({'預(yù)約機時':'sum','加工數(shù)量':'sum','預(yù)約次數(shù)':'count'})#按“設(shè)備序列號”進(jìn)行多列數(shù)據(jù)的分組,并將列名稱為“預(yù)約機時、加工數(shù)量、預(yù)約次數(shù)”的數(shù)據(jù)分別按照“求和、求和、計數(shù)”進(jìn)行聚合運算;并將結(jié)果存儲在df3

df4 = df3.sort_values(by='預(yù)約機時',ascending=False)#將df3按“預(yù)約機時”的降序進(jìn)行排序,并將結(jié)果存儲在df4

print(df4) #在程序運行窗口打印出排序后的數(shù)據(jù)統(tǒng)計結(jié)果

在程序運行窗口里可查看到按“預(yù)約機時”的降序進(jìn)行排序的統(tǒng)計結(jié)果打印顯示,統(tǒng)計結(jié)果示例如表4所示??梢钥吹絇ython對所篩選出的記錄已根據(jù)“設(shè)備名稱”,分別按“預(yù)約機時、加工數(shù)量、預(yù)約次數(shù)”實現(xiàn)了相應(yīng)的“求和、求和、計數(shù)”統(tǒng)計要求,并已按照“預(yù)約機時”的降序進(jìn)行了排序。

4 ?數(shù)據(jù)寫入

屆于在程序運行窗口查看到的統(tǒng)計結(jié)果無法直接復(fù)制粘貼至Excel里,因為復(fù)制得到的每行的所有列的列內(nèi)容會存放在同一個單元格里,故為了更方便地存儲和查看統(tǒng)計結(jié)果,特補充了將統(tǒng)計結(jié)果新建Excel寫入的功能。Pandas提供了to_excel()函數(shù)來將DataFrame數(shù)據(jù)保存為Excel文件。代碼為:

writer = pd.ExcelWriter('EquipmentStatistics_result.xlsx') #在程序文件所在路徑下新建Excel

df4.to_excel(writer,sheet_name='統(tǒng)計結(jié)果')#將df3的內(nèi)容寫入新建的Excel里,并將工作表命名為“統(tǒng)計結(jié)果”

writer.save() #保存Excel

writer.close() #關(guān)閉Excel

運行結(jié)果:在程序文件所在的路徑下自動新建了一個命名為“EquipmentStatistics_result.xlsx”的Excel工作簿,此工作簿的工作表1被命名為“統(tǒng)計結(jié)果”,并且本次實驗室設(shè)備預(yù)約機時及相關(guān)參數(shù)的統(tǒng)計結(jié)果已成功的寫入到了此“統(tǒng)計結(jié)果”工作表中。

5 ?結(jié) ?論

綜上所述,通過利用數(shù)據(jù)分析工具Python及借助其Pandas庫,方便快捷地實現(xiàn)了對實驗室設(shè)備機時等相關(guān)數(shù)據(jù)的統(tǒng)計處理。處理步驟包括:數(shù)據(jù)寫入、數(shù)據(jù)篩選、數(shù)據(jù)分組聚合、數(shù)據(jù)寫入。每個步驟,Python都提供了相應(yīng)的數(shù)據(jù)調(diào)用接口,實現(xiàn)了對數(shù)據(jù)的快速精確計算及傳輸。對于越需要大量重復(fù)計算的工作內(nèi)容,Python的優(yōu)勢越能體現(xiàn),在保證計算準(zhǔn)確度、降低人工錯誤的同時,極大地節(jié)省了管理人員的時間成本、提升了工作效率。

參考文獻(xiàn):

[1] 盧甲戎,劉權(quán)盼.如何利用Python提高統(tǒng)計工作效率 [J].中國統(tǒng)計,2020(4):71-73.

[2] 鄭丹青.Python數(shù)據(jù)分析基礎(chǔ)教程 [M].北京:人民郵電出版社,2020:7-8.

[3] 劉新鵬,高斌.利用Python和Pandas進(jìn)行學(xué)生成績處理 [J].信息與電腦(理論版),2020,32(7):41-43.

[4] 吳琳.Pandas在工資數(shù)據(jù)年度匯總中的應(yīng)用 [J].現(xiàn)代信息科技,2020,4(10):87-88+91.

[5] 胡前防,連鵬偉,陳乾坤.Python在統(tǒng)計數(shù)據(jù)處理中的應(yīng)用 [J].市場研究,2019(8):33-35.

[6] 馬孝宗.Pandas在考勤分析中的應(yīng)用 [J].電腦編程技巧與維護(hù),2020(2):92-94.

作者簡介:馬玲(1985—),女,漢族,湖北荊門人,助理實驗師,碩士,主要研究方向:實驗室管理,預(yù)約系統(tǒng)管理。

猜你喜歡
數(shù)據(jù)統(tǒng)計實驗室管理
大數(shù)據(jù)與大數(shù)據(jù)經(jīng)濟學(xué)
關(guān)于實驗室管理的研究
基于SSH架構(gòu)的高職院校實驗室管理系統(tǒng)的實現(xiàn)
論高校電子實驗室的日常管理與維護(hù)
淺談實驗室管理與改革