朱家齊
摘 要:文章著重論述了大批量數(shù)據(jù)信息處理中的個(gè)別技巧及方法,給繁雜的信息數(shù)據(jù)處理帶來(lái)了便捷,提高了工作效率。
關(guān)鍵詞:數(shù)據(jù)處理;數(shù)據(jù)信息;VLOOKUP函數(shù)
在實(shí)際工作中大家都會(huì)碰到這樣那樣的一些小問(wèn)題。如何充分利用一些巧妙的辦法或者經(jīng)驗(yàn)把碰到的小問(wèn)題解決掉,有利于提高我們的工作效率以及工作積極性。作者結(jié)合自身工作經(jīng)驗(yàn)總結(jié)了在工作中碰到的問(wèn)題,并提出了行之有效的解決辦法。
作者所在部門每年開(kāi)學(xué)都要碰到處理大量的數(shù)據(jù)。其中,包涵了新生大量的個(gè)人信息、照片等等。在實(shí)際情況當(dāng)中,曾碰到這樣的一種情況。在新生班級(jí)中每個(gè)學(xué)生照片都按照學(xué)號(hào)加姓名的方式命名,中間有若干個(gè)空格。例如:“00001 王”、“00002 李”、“00003 張”,命名有規(guī)則,但又沒(méi)有規(guī)則。每個(gè)照片中間的空格都是不固定的。麻煩的是打印學(xué)生卡,中文名這個(gè)字段不能用在打卡軟件照片欄對(duì)應(yīng)的字段上。無(wú)法顯現(xiàn)學(xué)生照片。也就是學(xué)號(hào)后面姓名我們是用不到的。只能改照片名字,怎么去修改,不可能一張一張的去改,工作量太大,所以要想辦法把它批量改成我們所需要的樣式。打開(kāi)學(xué)生信息EXECL表,其中有學(xué)號(hào)、姓名、照片名(這是我們等會(huì)兒要獲取的,目前這列為空,字段名是我加上去的)。在第四列輸入="rename ""d:\picture\"&C2&".jpg"" "&A2&".jpg",注意在“rename”后有一個(gè)空格,語(yǔ)法檢測(cè)通過(guò),但批處理程序卻無(wú)法執(zhí)行。這也是我反復(fù)測(cè)試好長(zhǎng)時(shí)間發(fā)現(xiàn)的。這是一個(gè)rename函數(shù),在d盤(pán)創(chuàng)建一個(gè)picture的文件夾,把學(xué)生照片都放進(jìn)去。后面&連接符是每張照片的名字,空格,然后是所要改成學(xué)號(hào)樣式的名字。前面說(shuō)了我們每張照片的名字還沒(méi)獲取到。下面來(lái)獲取這些照片的名字,幾千張 “.jpg”格式的照片,每個(gè)名字又都不一樣。一個(gè)個(gè)手動(dòng)復(fù)制名字?那太慢了。在這里有個(gè)巧辦法。在開(kāi)始運(yùn)行里面打“cmd”,在彈出的dos窗口下執(zhí)行進(jìn)入d盤(pán)picture目錄的命令“cd picture”,然后執(zhí)行“dir/b>>1.txt”。如此就將picture目錄下的所有照片文件的名字寫(xiě)入到了新創(chuàng)建的1.txt文檔中。把1.txt文檔中的照片名復(fù)制到上面學(xué)生信息EXECL表照片名這一列當(dāng)中。把”rename”函數(shù)的運(yùn)行結(jié)果一直拖動(dòng)復(fù)制到底。將復(fù)制表格中剛得到的結(jié)果copy,復(fù)制粘貼到新建的txt文檔,并任意命名一個(gè)名字。保存退出并修改該文件后綴,.txt文檔改為.bat批處理執(zhí)行程序。并將執(zhí)行程序復(fù)制到picture目錄直接運(yùn)行,如此整個(gè)picture目錄中所有學(xué)生以學(xué)號(hào)加姓名的照片,全部改成了以學(xué)號(hào)命名的照片了。然后再導(dǎo)入到打卡軟件中,數(shù)據(jù)庫(kù)字段匹配,完成下面的打印工作。
在工作中會(huì)碰到大量數(shù)據(jù)信息的處理。在海量數(shù)據(jù)處理過(guò)程中找到一條方便快捷的方法將會(huì)為我們工作帶來(lái)極大的便利。作者曾碰到這樣的情況,在學(xué)生信息表中某些字段是代碼或者數(shù)字,然而我們卻需要轉(zhuǎn)換成需要的文本字符,完成下一步驟的操作。代碼是我們不需要的,而且不直觀。例如:專業(yè)代碼“04”,我們希望的是“計(jì)算機(jī)專業(yè)”這樣的字符。在EXECL中操作數(shù)據(jù)可以查找替換。利用查找替換我們可以完成整列當(dāng)中,對(duì)某一個(gè)專業(yè)代碼的全部替換。如此反復(fù),直到整列數(shù)據(jù)中所有不同專業(yè)代碼完成替換。專業(yè)代碼少還可以完成。如果,專業(yè)代碼有幾百、甚至幾千不同代碼。當(dāng)然,專業(yè)代碼不可能有這么多,但換成是其它我們需要類似操作的數(shù)據(jù),那個(gè)工作量就大了。一個(gè)代碼一個(gè)代碼反復(fù)查找替換。太耗時(shí)間也辛苦。因此,我們需要尋找另一條簡(jiǎn)便的途徑。在這里向大家推薦一個(gè)vlookup函數(shù),它是列向查找函數(shù)。該函數(shù)的語(yǔ)法規(guī)則如下:
vlookup(lookup_value,table_array,col_index_num,rang_lookup)。lookup_value你所需要查找的值,也就是我們所需要替換的專業(yè)代碼。table_array就是我們所需要查找的表數(shù)據(jù)范圍,這里對(duì)應(yīng)著我們專業(yè)表,它的專業(yè)代碼是中文文本的“計(jì)算機(jī)專業(yè)”。col_index_num在查找范圍中要返回給我們的數(shù)據(jù),這里希望返回給我們“計(jì)算機(jī)專業(yè)”。假如它在專業(yè)表中第3列,填入數(shù)字3。也就是希望返回?cái)?shù)據(jù)所在的列。rang_lookup是個(gè)邏輯值true和false,true為近似匹配。False為精確匹配。這樣,我們就能方便快捷的完成對(duì)學(xué)生信息表中專業(yè)代碼這一欄的匹配替換。
在工作當(dāng)中還會(huì)碰到各種各樣的問(wèn)題,找到一條方便快捷高效的經(jīng)驗(yàn)辦法能夠很好的解決我們工作當(dāng)中碰到一些問(wèn)題。既解決了問(wèn)題,又節(jié)約了時(shí)間。讓我們工作效率、工作積極性得到了提高。當(dāng)然,可能還有更多更方便快捷的辦法和經(jīng)驗(yàn),歡迎共同研討研究。
[參考文獻(xiàn)]
[1]百度百科.vlookup函數(shù)語(yǔ)法.