POI用戶(hù)模型的重構(gòu)與優(yōu)化

2019-10-08 06:43吉豪杰宋欣潮

軟件 2019年5期

吉豪杰宋欣潮

摘 ?要： Apache POI中的用戶(hù)模型是目前用于處理Excel數(shù)據(jù)的最為廣泛的應(yīng)用技術(shù)，但用戶(hù)模型存在許多明顯的弊端。本文將以一個(gè)學(xué)生檔案管理系統(tǒng)為例，對(duì)用戶(hù)模型中存在的問(wèn)題以及產(chǎn)生問(wèn)題的原因進(jìn)行分析，并針對(duì)這些問(wèn)題，借用面向過(guò)程的設(shè)計(jì)思想對(duì)用戶(hù)模型進(jìn)行優(yōu)化和改進(jìn)。使用不同規(guī)模的數(shù)據(jù)量對(duì)改進(jìn)前后的用戶(hù)模型進(jìn)行測(cè)試，并對(duì)測(cè)試結(jié)果進(jìn)行比較和分析，最終在一定程度上解決了用戶(hù)模型的弊端，提升了用戶(hù)模型的性能。

關(guān)鍵詞：用戶(hù)模型;生產(chǎn)者消費(fèi)者模型;POI技術(shù);數(shù)據(jù)優(yōu)化;內(nèi)存溢出;設(shè)計(jì)模式;java多線(xiàn)程

中圖分類(lèi)號(hào)： TP315 ? ?文獻(xiàn)標(biāo)識(shí)碼： A ? ?DOI：10.3969/j.issn.1003-6970.2019.05.038

本文著錄格式：吉豪杰，宋欣潮. POI用戶(hù)模型的重構(gòu)與優(yōu)化[J]. 軟件，2019，40（5）：193199

【Abstract】： The UserModel in Apache POI is the most widely used technology for processing Excel data at present， but the user model has many obvious disadvantages.This paper will take a student file management system as an example to analyze the problems existing in the UserModel and the causes of the problems. In view of these problems， the UserModel will be optimized and improved by using the process-oriented design idea.The data volumes of different scales were used to test the UserModel before and after the improvement， and the test results were compared and analyzed. Finally， the disadvantages of the UserModel were solved to some extent， and the performance of the UserModel was improved.

【Key words】： UserModel; Producer consumer model; POI; Data optimization; Out of memoryerror; Design mode; Java multithreading

0 ?引言

在當(dāng)前的軟件開(kāi)發(fā)中，越來(lái)越多的需求涉及到對(duì)MicroSoft Office文檔的處理，其中對(duì)Excel數(shù)據(jù)文檔的處理尤為普遍。因此，關(guān)于對(duì)Excel文件處理的討論與研究也愈演愈烈。到目前為止，已經(jīng)出現(xiàn)了許多關(guān)于處理Excel文件的技術(shù)和開(kāi)源項(xiàng)目，例如Java Excel Api（jxl），Apache POI[1]，Alibaba EasyExcel等。這些開(kāi)源項(xiàng)目各有特色，都能夠適用于不同的開(kāi)發(fā)場(chǎng)景，滿(mǎn)足了大多數(shù)不同的開(kāi)發(fā)需求，但也存在諸多問(wèn)題，其中對(duì)Apache POI相關(guān)技術(shù)所存在問(wèn)題的研究是本文討論的重點(diǎn)。本文的創(chuàng)新點(diǎn)在于將面向過(guò)程的生產(chǎn)者消費(fèi)者模型[2]的設(shè)計(jì)思想應(yīng)用到傳統(tǒng)的用戶(hù)模型當(dāng)中，以及采用多線(xiàn)程[3-9]的方式實(shí)現(xiàn)用戶(hù)模型，對(duì)傳統(tǒng)的用戶(hù)模型處理Excel數(shù)據(jù)的程序進(jìn)行重構(gòu)，使用戶(hù)模型在程序結(jié)構(gòu)上邏輯更加清晰、功能更加明確，在數(shù)據(jù)處理能力上更加高效。

1 ?POI用戶(hù)模型

1.1 ?用戶(hù)模型簡(jiǎn)介

POI是由Apache組織提供的用java編寫(xiě)的免費(fèi)開(kāi)源的跨平臺(tái)的 Java API，Apache POI提供API給Java程序?qū)icroSoft office格式檔案讀和寫(xiě)的功能[1]。POI中關(guān)于Excel數(shù)據(jù)處理的部分主要包括User API、Event API和Streaming UserModel API。本文將重點(diǎn)討論User API中的UserModel。

所謂的UserModel實(shí)際上就是基于Dom方式的解析，Dom解析就是將文件全部讀入內(nèi)存，對(duì)文件內(nèi)部的結(jié)構(gòu)進(jìn)行建模，形成一顆Dom樹(shù)的過(guò)程，如圖1用戶(hù)模型的Dom樹(shù)結(jié)構(gòu)。

從圖1中可以看出，用戶(hù)模型提供封裝好的Workbook、Sheet、Row、Cell等實(shí)例來(lái)完成對(duì)excel數(shù)據(jù)的讀寫(xiě)。

1.2 ?用戶(hù)模型的應(yīng)用

經(jīng)過(guò)對(duì)用戶(hù)模型的簡(jiǎn)單介紹，現(xiàn)在以文獻(xiàn)[4]中提到的學(xué)生檔案管理系統(tǒng)為例，對(duì)用戶(hù)模型的Excel數(shù)據(jù)解析功能進(jìn)行實(shí)現(xiàn)。該功能的業(yè)務(wù)處理過(guò)程為：①以流的方式接受excel文件;②根據(jù)接受的文件生成WorkBook對(duì)象;③根據(jù)Dom結(jié)構(gòu)，遍歷每個(gè)Sheet的每一個(gè)Row，將每一個(gè)Row中的Cell的值讀取出來(lái)，存放到list集合中;④對(duì)list中的數(shù)據(jù)進(jìn)行類(lèi)型轉(zhuǎn)換，并封裝到領(lǐng)域?qū)ο骃tudent中，生成存放Student對(duì)象的集合;⑤利用數(shù)據(jù)庫(kù)的批量添加操作，將Student集合持久化到數(shù)據(jù)庫(kù)中（涉及到多表操作）。

用戶(hù)模型代碼：

Student類(lèi)：

public class Student {

private BigInteger stuId;//學(xué)號(hào)

private Archive archive;//檔案

private Profession pro;//專(zhuān)業(yè)

private Department department;//院系

private String stuName;//姓名

private String stuSex;//性別

private String stuSendnum;//派遣證號(hào)

private String stuClass;//班級(jí)

private String stuLocation;//生源地

//省略部分屬性和set、get方法

}

用戶(hù)模型解析excel方法：

public static List> getListByExcel（InputStream in，String fileName） throws Exception{

List> list=null;

Workbook wb=getWorkBook（in，fileName）; //獲取WorkBook對(duì)象

if （wb！=null）{

Sheet sheet=null;

Row row=null;

Cell cell=null;

list=new ArrayList>（）;

for （int i=0;i

sheet=wb.getSheetAt（i）;

if （sheet==null）{continue;}

//遍歷每一行

for （int j=sheet.getFirstRowNum（）; j<=sheet.getLastRowNum（）;j++）{

row=sheet.getRow（j）;

Integer columns= （int）row. getLastCellNum（）;

//遍歷每一列

List

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

POI用戶(hù)模型的重構(gòu)與優(yōu)化