字符集
- 提煉和弘揚(yáng)教育家精神 推動傳統(tǒng)文化數(shù)字化傳播
重視并加強(qiáng)中文字符集建設(shè)的建議。提煉和弘揚(yáng)新時代教育家精神。華東師范大學(xué)依托教育學(xué)科優(yōu)勢,長期關(guān)注和研究教師隊伍建設(shè)領(lǐng)域的重點(diǎn)難點(diǎn)和前沿性問題。2022 年8 月,教育部部長懷進(jìn)鵬同志主持召開決策咨詢會,圍繞謀劃二十大教育事業(yè)發(fā)展聽取意見建議,我有幸受邀參加。會前,結(jié)合既往已有相關(guān)研究,我專門組織了學(xué)校國家教育宏觀政策研究院的智庫專家團(tuán)隊,通過查閱資料、組織一系列的座談研討,與北京、上海等地教育行政部門負(fù)責(zé)同志和全國各省市兄弟高校學(xué)者多次深入交流,最后形成
上海人大月刊 2023年4期2023-03-30
- 廣東省氣象業(yè)務(wù)網(wǎng)文件管理子系統(tǒng)設(shè)計與實(shí)現(xiàn)
不同節(jié)律、不同字符集的傳輸;系統(tǒng)實(shí)現(xiàn)了多種文件讀取的過濾、文件寫入的后處理、對Office文檔的轉(zhuǎn)換功能。具體功能詳見表1。表1 調(diào)度模塊功能說明2)文件搜索模塊。該模塊是基于Solr的搜索引擎實(shí)現(xiàn)。Solr是基于Lucene的全文搜索服務(wù)器,支持中文分詞算法。匹配度根據(jù)文件名命中數(shù)、文件內(nèi)容命中數(shù)、文件時間不同權(quán)重計算匹配度,最后根據(jù)匹配相關(guān)的排序顯示。顯示詞條包含文件的文件名、文件實(shí)體地址、源地址、目標(biāo)地址等信息。3)文件監(jiān)控模塊。該模塊實(shí)現(xiàn)了對數(shù)據(jù)流
廣東氣象 2022年3期2022-06-24
- 基于圖像識別的自動倉儲管理系統(tǒng)*
采用UTF-8字符集進(jìn)行表示。字符集是將二進(jìn)制數(shù)據(jù)轉(zhuǎn)換為字符的字典,儲存格式為鍵值對格式,不同的字符集有相對應(yīng)的編碼規(guī)則,目前使用相對較多的字符集有ASCII碼字符集、GBK字符集、UTF-8字符集。其中,UTF-8字符集囊括的字符范圍比較廣,涵蓋了英語字符、阿拉伯語字符、漢字、表情字符等。大家較為熟悉的ASCII碼字符集相比UTF-8字符集,雖然編碼規(guī)則較為簡單,但是囊括的字符很少,標(biāo)準(zhǔn)ASCII碼字符集總共的編碼為128個,包括32個通用控制符、10個
機(jī)械制造 2022年2期2022-06-09
- 基于出土文獻(xiàn)數(shù)據(jù)庫的集外字?jǐn)?shù)字化處理方法研究
語料庫中含較多字符集以外的文字,即集外字。該類文字由于無法被OCR識別或通過鍵盤直接錄入,在一定程度上影響了古籍的數(shù)字化及其轉(zhuǎn)換與檢索[2],因而成為古籍?dāng)?shù)字化的重點(diǎn)工作之一;又由于目前的集外字技術(shù)不能適用于計算機(jī)的自然語言信息處理技術(shù),也成為古籍?dāng)?shù)字化中漢字處理難點(diǎn)之一。出土文獻(xiàn)數(shù)據(jù)庫是關(guān)于中國出土文獻(xiàn)簡、牘、帛書的封閉式數(shù)據(jù)庫,如《簡帛金石資料庫(全文)》《引得市數(shù)據(jù)庫》《漢代簡牘數(shù)位典藏》《漢達(dá)文庫》《瀚唐典籍》等[3],其中存在大量的避諱字、異體字
商洛學(xué)院學(xué)報 2022年2期2022-05-11
- 幾類帶空轉(zhuǎn)移的n元偽加權(quán)自動機(jī)的關(guān)系*
有n個有限輸入字符集的偽加權(quán)有窮自動機(jī))、分明型n元偽加權(quán)有窮自動機(jī)(初始狀態(tài)與狀態(tài)轉(zhuǎn)移函數(shù)均是分明的n元偽加權(quán)有窮自動機(jī))與確定型n元偽加權(quán)有窮自動機(jī)(初始狀態(tài)與狀態(tài)轉(zhuǎn)移函數(shù)均是確定的n元偽加權(quán)有窮自動機(jī))的概念。在經(jīng)典的有窮自動機(jī)理論中,帶空轉(zhuǎn)移的非確定型有窮自動機(jī)、非確定型有窮自動機(jī)與確定型有窮自動機(jī)是等價的[24,25]。在基于格序半群的模糊自動機(jī)理論中,除初始狀態(tài)與接受狀態(tài)均是分明的非確定型格值自動機(jī)以外,其他類型的非確定型格值自動機(jī)與帶空轉(zhuǎn)移的
計算機(jī)工程與科學(xué) 2022年2期2022-03-22
- 一種多接口協(xié)議彈性緩沖器優(yōu)化設(shè)計方法
方法來實(shí)現(xiàn)控制字符集的添加與刪減。例如,文獻(xiàn)[4]基于USB3.0 協(xié)議,采用具有寫指針屏蔽與跳躍、斷點(diǎn)保存等功能的異步FIFO 來實(shí)現(xiàn)彈性緩沖器。文獻(xiàn)[5-6]則在文獻(xiàn)[4]的基礎(chǔ)上,設(shè)計出通過讀指針暫停實(shí)現(xiàn)控制字符集增添和寫指針暫停實(shí)現(xiàn)控制字符集刪減的結(jié)構(gòu)。文獻(xiàn)[1-2]基于10Gbase-KR/10Gbase-R 協(xié)議,通過控制寫指針插入和暫停實(shí)現(xiàn)字符集的增刪操作?;赑CIE2.0 協(xié)議,文獻(xiàn)[9]采用半滿檢查方式和半滿同步方法,簡化了邏輯結(jié)構(gòu),相
電子設(shè)計工程 2021年24期2022-01-06
- Java 18可以期待什么
F-8作為默認(rèn)字符集的建議。離正式發(fā)布Java 18還有6個月時間,但它已經(jīng)初具形態(tài),預(yù)計有4個功能提案,最新的是對矢量API的第三次孵化。截至9月20日,Java開發(fā)工具包(JDK)18的OpenJDK頁面列出了矢量API、代碼片段和UTF-8字符集。JEP也引用了JDK 18的記錄模式和數(shù)組模式的提議。預(yù)計在2022年3月發(fā)布的JDK 18將是一個短期功能版本,支持時間僅為6個月??梢栽贘ava.net上找到適用于Linux、Windows和MacOS
計算機(jī)與網(wǎng)絡(luò) 2021年20期2021-12-18
- 漢信碼技術(shù)優(yōu)勢與技術(shù)原理解析
碼在碼圖設(shè)計、字符集劃分、信息編碼等方面充分考慮了這一需求,從而提高了漢信碼的信息特別是漢字信息的表示效率,當(dāng)對大量漢字進(jìn)行編碼時,相同信息內(nèi)容的漢信碼符號面積只是QR碼符號面積的90%,是Data Matrix碼符號的63.7%。信息容量大漢信碼最多可以表示7829個數(shù)字、4350個ASCII字符、2174個漢字、3262個8位字節(jié)信息,支持照片、指紋、掌紋、簽字、聲音、文字等數(shù)字化信息的編碼。表達(dá)漢字能力強(qiáng)漢信碼是目前唯一全面支持我國漢字信息編碼強(qiáng)制性
中國自動識別技術(shù) 2021年5期2021-11-21
- MySQL數(shù)據(jù)庫系統(tǒng)中文亂碼問題及解決方案
,這就是計算機(jī)字符集產(chǎn)生的原因。這一套文字符號及其編碼、比較規(guī)則的集合[1]會直接影響數(shù)據(jù)庫中數(shù)據(jù)信息的顯示,可以以我們希望看的的樣式顯示,當(dāng)然也會以我們不希望看到的一種方式——亂碼來顯示給我們,接下來我們就來探討一下字符編碼為什么會影響字符的顯示以及亂碼出現(xiàn)的原因及其解決方式。2 字符編碼方式及應(yīng)用2.1 常用的字符編碼方式字符編碼(英文Character encoding)是為了方便文本在計算機(jī)中存儲并通過通信網(wǎng)絡(luò)進(jìn)行傳遞,把指定集合中某一對象字符集中
電子技術(shù)與軟件工程 2021年12期2021-09-23
- Oracle 數(shù)據(jù)庫醫(yī)療信息系統(tǒng)優(yōu)化設(shè)計研究
acle數(shù)據(jù)庫字符集和導(dǎo)入導(dǎo)出概念概述當(dāng)Oracle 數(shù)據(jù)庫創(chuàng)建完成后,所用的字符集無法改變,因此,在醫(yī)療信息系統(tǒng)構(gòu)建的初步階段就應(yīng)提前做好字符集種類的選定工作[7-8]。在Oracle 數(shù)據(jù)庫中,有與之關(guān)聯(lián)的NLS_LANG,其參數(shù)為NLS_LANG=language_territory.charset。其 中,language 代表系統(tǒng)所用語言,territory 則代表日期及數(shù)字格式,charset 代表指定字符集。Oracle 數(shù)據(jù)庫進(jìn)行imp/e
電子設(shè)計工程 2021年13期2021-07-11
- Base64編碼及其在AppInventor中的應(yīng)用
,這就是編碼。字符集(Character set)是多個字符的集合,字符集種類較多,每個字符集包含的字符個數(shù)不同,我們常見的字符集有ASCII字符集、GB2312字符集、BIG5字符集、 GB18030字符集、Unicode字符集等。計算機(jī)要準(zhǔn)確地處理各種字符集文字,必須進(jìn)行字符編碼,計算機(jī)才能識別和存儲各種文字,但要是把字符發(fā)送給對方,對方卻只能識別ASCII碼,其他字符集還需要再次進(jìn)行編碼,這就是Base64編碼誕生的原因。2.Base64編碼Base
電腦報 2021年4期2021-06-24
- 以交互方式生成正則表達(dá)式的算法及演示
要引導(dǎo)用戶輸入字符集范圍和重復(fù)限定的范圍才能生成結(jié)果。所以要生成正則表達(dá)式,需要兩種算法。由于這兩種算法最終都是生成正則表達(dá)式,所以那些無法用正則表達(dá)式記錄下的匹配要求是無法通過此算法生成正則表達(dá)式的。這兩種算法都是引導(dǎo)用戶思考正則表達(dá)式要思考的問題,而不用去關(guān)心如何寫出正則表達(dá)式。真正的正則表達(dá)式由算法生成,所以用戶可以在不掌握正則表達(dá)式的情況下,按照構(gòu)造正則表達(dá)式的思路去思考問題即可。算法不僅要關(guān)心正則表達(dá)式生成方面的問題,還要重視對用戶的引導(dǎo)作用。2
現(xiàn)代計算機(jī) 2021年10期2021-05-28
- 水力發(fā)電廠監(jiān)控系統(tǒng)小語種軟件國際化策略
用了“GBK”字符集,該字符集可支持所有的簡體中文、繁體中文、英文等字符,但無法兼容某些小語種中的一些特殊字符,如:ê、、?等等。實(shí)際上,在現(xiàn)在的軟件開發(fā)中,更為廣泛使用的是“UTF-8”字符集,這一字符集可以兼容幾乎所有的字符,包括小語種中的各種特殊字符。因此,如果需要兼容各種小語種,還需將軟件使用的字符集更改為“UTF-8”字符集。然而,傳統(tǒng)的軟件前后臺采用了不同的編程語言,前臺為JAVA語言,后臺為C語言,兩者之間的各類信息傳輸都使用了“GBK”字符
西北水電 2021年2期2021-05-19
- 銀行信息系統(tǒng)生僻字問題探究
征一、信息系統(tǒng)字符集情況介紹(一)字符集概述字符是各種文字和符號的總稱,包括各國文字、標(biāo)點(diǎn)符號、圖形符號、數(shù)字等。字符集(Character set)是多個字符的集合,字符集種類較多,每個字符集包含的字符個數(shù)不同,目前漢字字符集主要有:《信息交換用漢字編碼字符集 基本集》(GB2312-1980),《漢字內(nèi)碼擴(kuò)展規(guī)范》(GBK),《信息技術(shù) 信息交換用漢字編碼字符集 基本集的擴(kuò)充》(GB18030-2000),《信息技術(shù) 中文編碼字符集》(GB18030-
金融發(fā)展研究 2021年2期2021-04-12
- 折筆規(guī)范與《通用規(guī)范漢字表》的字序問題
——兼談漢字部首、部件、獨(dú)體字的排序
13000.1字符集漢字折筆規(guī)范》[1]107-110,這部規(guī)范由教育部語言文字信息管理司提出立項,由國家語言文字工作委員會語言文字規(guī)范(標(biāo)準(zhǔn))審定委員會審定。這部規(guī)范指出:“本規(guī)范主要適用于中文信息處理、漢字排序檢索,也可供漢字教學(xué)界參考?!辈贿^我們發(fā)現(xiàn),在這部規(guī)范之后發(fā)布的一些涉及筆畫序排序的語言文字規(guī)范,以及一些新出版的字典、教材,有的引用了這部規(guī)范而存有疏失,有的沒有引用這部規(guī)范而使其部分排序不合這部規(guī)范。我們認(rèn)為,國家發(fā)布的語言文字規(guī)范具有適用性
鹽城師范學(xué)院學(xué)報(人文社會科學(xué)版) 2020年4期2020-11-30
- 解決SYBASE數(shù)據(jù)庫中文亂碼
base數(shù)據(jù)庫字符集設(shè)置為“cp850”,數(shù)據(jù)庫語言設(shè)置為“us_english”。且在長達(dá)數(shù)年的實(shí)際使用中,并未有ERP系統(tǒng)的最終用戶反應(yīng)中文存在亂碼的問題。圖1 Sybase Central查詢結(jié)果中顯示亂碼為進(jìn)一步確定數(shù)據(jù)庫中的中文字符以何種編碼形式存儲,筆者使用Wireshark軟件對Sybase Central的查詢過程進(jìn)行抓包。通過分析數(shù)據(jù)包的載荷,可發(fā)現(xiàn)常見漢字均以雙字節(jié)形式存儲。(受限于測試條件,未能在數(shù)據(jù)庫中找到特別生僻的漢字——即GB1
網(wǎng)絡(luò)安全和信息化 2020年4期2020-04-15
- 信息技術(shù)藏文編碼字符集擴(kuò)充集A
,我國的藏文小字符集(基本字符集,簡稱基本集)被收入了國際標(biāo)準(zhǔn)ISO/IE 10646 《信息技術(shù) 通用多八位編碼字符集》(對應(yīng)的我國國家標(biāo)準(zhǔn)編號為GB 13000)。同年,我國發(fā)布了國家標(biāo)準(zhǔn)GB/T 16959-1997《信息技術(shù)信息交換用藏文編碼字符集基本集》。由于藏文本身的書寫特點(diǎn)和現(xiàn)階段我國技術(shù)水平的限制,僅靠藏文基本集,難以徹底解決 藏文信息處理和交換問題。為此,我國專家于2002年向國際標(biāo)準(zhǔn)化組織提交了藏文編碼字符集擴(kuò)充集提案(“大丁”字符集,
學(xué)校教育研究 2020年3期2020-02-18
- MySQL數(shù)據(jù)庫字符集的問題研究
1 MySQL字符集概述字符集是指一種從二進(jìn)制編碼到某類字符符號的映射,校對是指一組用于某個字符集的排序規(guī)則。并且每一類編碼字符都有其對應(yīng)的字符集和校對規(guī)則。只要涉及到中文的地方,就會存在字符集和編碼方式,MySQL可以支持很多種字符集,在同一臺服務(wù)器,同一個數(shù)據(jù)庫,甚至同一個表的不同字段都可以指定使用不同的字符集。相比其他數(shù)據(jù)庫管理系統(tǒng),MySQL 要更加靈活些。正是因?yàn)镸ySQL 的字符集的靈活性,也體現(xiàn)了MySQL 的字符集負(fù)責(zé)性和繁瑣性,使得我們在
電子技術(shù)與軟件工程 2020年12期2020-02-04
- Solaris11 下Oracle12C集成部署問題
PDB 數(shù)據(jù)庫字符集修改從Oracle 12.2 數(shù)據(jù)庫開始,創(chuàng)建完成的同一CDB容器數(shù)據(jù)庫中的各個PDB 字符集可以不同,這樣可以使數(shù)據(jù)庫字符集具有更好的擴(kuò)展性以及更適合應(yīng)用系統(tǒng)的多語言環(huán)境部署。通常,創(chuàng)建CDB 會默認(rèn)選擇“AL32UTF8”字符集,之后可以通過命令方式將該字符集所包含的子集字符集修改為PDB 數(shù)據(jù)庫字符集,但是修改過程需要用戶進(jìn)行手工完成。以下就以將PDB 數(shù)據(jù)庫字符集修改為“zhs16gbk”為例,過程如下:1.關(guān)閉數(shù)據(jù)庫并將數(shù)據(jù)庫
網(wǎng)絡(luò)安全和信息化 2019年11期2019-11-25
- ORACLE字符集問題的分析
.ORACLE字符集概述2.1 字符集定義字符集是一個字節(jié)數(shù)據(jù)的解釋的符號集合,有大小之分有相互的包括關(guān)系,如US7ASCII就是ZHS16GBK的子集,從US7ASCII到ZHS16GBK不會有數(shù)據(jù)解釋上的問題,不會有數(shù)據(jù)丟失,Oracle對這種問題也要求從子集到超集的導(dǎo)出受支持,反之不行。字符集決定數(shù)據(jù)庫所支持的語言標(biāo)準(zhǔn),也就是說,數(shù)據(jù)庫支持中文、日文或是英文不是有操作系統(tǒng)平臺決定的,而是由字符集決定的。字符集不僅需在服務(wù)器端存在,而且客戶端也必須有字
科學(xué)與財富 2019年24期2019-08-06
- ISO/IEC 10646國際編碼標(biāo)準(zhǔn)下的香港電腦漢字編碼及字形原則
為補(bǔ)充《大五碼字符集》的不足,香港政府建立了《香港增補(bǔ)字符集》。初版于1999年發(fā)布[2],在2016年前共更新三次[3-5]。但其中只收錄了ISO/IEC 10646國際編碼標(biāo)準(zhǔn)[6]未收錄、而香港需要使用的字符。即在與ISO/IEC 10646國際編碼標(biāo)準(zhǔn)接軌的機(jī)制上,僅包括“縱向擴(kuò)展”的方式。對于ISO/IEC 10646國際編碼標(biāo)準(zhǔn)已收錄、但須反映香港書寫習(xí)慣的字形,則未予以增收。隨著這方面的需求漸增,有必要增設(shè)相應(yīng)的擴(kuò)展機(jī)制,進(jìn)一步完善《香港增補(bǔ)
中文信息學(xué)報 2019年7期2019-08-05
- 虛擬機(jī)參數(shù)配置故障
參數(shù)設(shè)置為漢字字符集“zh_CN.GB18030”,在修改配置后,筆者就沒有使用過該虛擬機(jī)。而最近再次使用,就出現(xiàn)了報錯信息。因此可以確定造成報錯的原因,是筆者在Linux虛擬機(jī)系統(tǒng)中將i18n文件的LANG參數(shù)設(shè)置為漢字字符 集”zh_CN.GB18030”后,系統(tǒng)的中文配置和VMware Workstation軟件出現(xiàn)了沖突,造成了出現(xiàn)報錯信息,以及軟件圖形界面消失。使 用“zh_CN.GB18030”字符集會出現(xiàn)沖突,那么其他漢字字符集也會產(chǎn)生沖突嗎
網(wǎng)絡(luò)安全和信息化 2019年7期2019-07-10
- MYSQL數(shù)據(jù)查詢技巧
法。圖1 查看字符集無法插入中文數(shù)據(jù)的解決方法這個問題的發(fā)現(xiàn)是啟用一臺新的MYSQL服務(wù)器時發(fā)現(xiàn)的,之前我們在一臺老的MYSQL服務(wù)器進(jìn)行數(shù)據(jù)導(dǎo)入時一切正常,只是當(dāng)需要統(tǒng)計的數(shù)據(jù)量越來越大的時候,老的MYSQL服務(wù)器的硬件性能跟上不了,我們就啟用了一臺新的MYSQL服務(wù)器,這臺服務(wù)器的硬件性能要遠(yuǎn)遠(yuǎn)高于舊服務(wù)器,理論上運(yùn)行數(shù)據(jù)統(tǒng)計的速度要遠(yuǎn)遠(yuǎn)高于舊服務(wù)器,但是在導(dǎo)入數(shù)據(jù)的時候就出現(xiàn)了故障,無論是導(dǎo)入EXCEL格式還是CSV格式的數(shù)據(jù),發(fā)現(xiàn)導(dǎo)入到數(shù)據(jù)庫中的表
網(wǎng)絡(luò)安全和信息化 2019年5期2019-06-04
- PHP教學(xué)中的亂碼問題及解決方法
教學(xué)參考。1 字符集與編碼字符(character)是包括文字、數(shù)字、標(biāo)點(diǎn)符號、圖形符號等人類可以理解的各種符號的總稱。字符集(character set)是包含一定數(shù)量字符的集合。編碼字符集(coded character set)是每個字符對應(yīng)唯一整數(shù)編碼的字符集,編碼字符集中的字符所對應(yīng)的整數(shù)稱為碼點(diǎn)(code point)。編碼字符集常常被簡稱為字符集,要結(jié)合上下文語境來理解。常見字符集有:ASCII字符集、Unicode字符集、UCS字符集、GB
現(xiàn)代計算機(jī) 2018年16期2018-07-06
- 基于云計算的密碼恢復(fù)系統(tǒng)模型構(gòu)建
想是將構(gòu)成密碼字符集的字符看成是類n進(jìn)制數(shù),其基數(shù)是字符集的大小.所以,密碼就會被映射成一個類n進(jìn)制數(shù).當(dāng)劃分搜索空間時,我們只是對類n進(jìn)制數(shù)進(jìn)行操作.例如,如果字符集是{a,b,c,0,7,1,9,D},并且密碼由字符集中的字符組成,我們可以將字符視為類n進(jìn)制數(shù)的元素,相應(yīng)的集合是{0,1,2,3,4,5,6,7}.該模型通過逐步嘗試所有候選密碼來實(shí)現(xiàn)密碼恢復(fù).該模型可以均勻劃分出不同長度的密碼搜索空間,能夠?qū)崿F(xiàn)節(jié)點(diǎn)之間的數(shù)據(jù)獨(dú)立性,具有較小的通信開銷.
西安文理學(xué)院學(xué)報(自然科學(xué)版) 2018年2期2018-03-23
- MySQL數(shù)據(jù)庫課程教學(xué)難點(diǎn)教學(xué)分析
——以數(shù)據(jù)庫設(shè)計為例
;數(shù)據(jù)庫設(shè)計;字符集;校對規(guī)則MySQL是一款優(yōu)秀的DBMS軟件,是目前事實(shí)上的小型關(guān)系型數(shù)據(jù)庫范例之一。與其他關(guān)系型數(shù)據(jù)庫(Oracle、DB2、SQLServer、SQLite等)相比,它具有體積小、功能全、查詢快捷、完全免費(fèi)等特點(diǎn),加上目前廣泛流行的PHP+SQL Web開發(fā)架構(gòu),使得MySQL數(shù)據(jù)庫課程[1]逐漸走向了計算機(jī)科學(xué)與技術(shù)、網(wǎng)絡(luò)工程等專業(yè)的課堂,成為了承接“數(shù)據(jù)庫系統(tǒng)原理”[2]和“PHP Web開發(fā)”[3]的重要專業(yè)課程。然而,作為一
長春大學(xué)學(xué)報 2017年10期2017-12-05
- 基于部件組合的聯(lián)機(jī)手寫“藏文—梵文”樣本生成
域?qū)儆诖箢悇e的字符集,所以聯(lián)機(jī)手寫樣本采集是龐大而復(fù)雜的工程。鑒于此,提供了一種基于部件組合的“藏文—梵文”手寫樣本生成方法,主要包括: (1)確定“藏文—梵文”字符集和部件集;(2)獲取“藏文—梵文”字丁的部件位置信息;(3)采集聯(lián)機(jī)手寫“藏文—梵文”部件的樣本;(4)生成聯(lián)機(jī)手寫“藏文—梵文”字符集樣本庫。該文為聯(lián)機(jī)手寫“藏文—梵文”識別的研究提供字符訓(xùn)練樣本庫和測試樣本庫,提高了手寫梵音藏文樣本采集效率,解決了樣本數(shù)量及多樣性問題,降低了樣本采集成本
中文信息學(xué)報 2017年5期2017-11-27
- PHP+MySQL網(wǎng)站中關(guān)于上傳中文文件名照片亂碼問題的探討
問題,選用什么字符集。筆者近期使用PHP+Mysql在做一個B/S的信息處理系統(tǒng),頁面使用utf-8字符集,后臺mysql數(shù)據(jù)庫使用的也是utf8字符集,操作系統(tǒng)是gbk字符集,用戶在上傳并縮放含中文命名的照片文件到系統(tǒng)時,總是存在亂碼問題,下面是筆者對這一問題的一些不成熟的解決方法,總結(jié)出來,以期拋磚引玉。一、關(guān)于網(wǎng)站和mysql數(shù)據(jù)庫常用中文字符集據(jù)統(tǒng)計當(dāng)前主流網(wǎng)站使用的字符集主要有utf-8和gb2312,下表是統(tǒng)計結(jié)果。各網(wǎng)站所用字符集從這個統(tǒng)計可
福建質(zhì)量管理 2017年13期2017-09-15
- ORACLE數(shù)據(jù)庫字符集問題及解決方法
ACLE數(shù)據(jù)庫字符集問題及解決方法趙丹妮 遼寧錦州渤海大學(xué)信息科學(xué)與技術(shù)學(xué)院當(dāng)將數(shù)據(jù)導(dǎo)入以及導(dǎo)出到數(shù)據(jù)庫里面的過程中,數(shù)據(jù)要與存儲的數(shù)據(jù)保持一致性,這是一個需要引起重視的問題,數(shù)據(jù)的一致性與設(shè)置字符集有著直接的聯(lián)系。本文主要是先圍繞著轉(zhuǎn)化字符集的機(jī)理展開,聯(lián)系具體的現(xiàn)實(shí)中所存在的具體問題,著重對ORACLE數(shù)據(jù)庫字符集存在的問題進(jìn)行了分析,并且針對相關(guān)的問題提出了解決對策。ORACLE 字符集 解決作為現(xiàn)今數(shù)據(jù)庫平臺中最為流行的數(shù)據(jù)庫,在實(shí)際的工作運(yùn)用中,
數(shù)碼世界 2017年4期2017-04-25
- JSP頁面中文亂碼解決方法
問題。關(guān)鍵詞:字符集;字符編碼;中文亂碼中圖分類號:TP31 文獻(xiàn)標(biāo)識碼:A 文章編號:1007-9416(2017)01-0154-01在Java Web應(yīng)用開發(fā)中,JSP頁面顯示中文信息亂碼一般表現(xiàn)為:JSP編碼亂碼、HTML編碼亂碼、request獲取數(shù)據(jù)亂碼、response輸出信息亂碼等,本文主要針對出現(xiàn)的這些亂碼問題,提出一種行之有效的解決中文顯示亂碼的方法。1 字符集與字符編碼字符是各種文字和符號的總稱,包括各個國家的文字、標(biāo)點(diǎn)符號、圖形符號
數(shù)字技術(shù)與應(yīng)用 2017年1期2017-04-25
- 醫(yī)院信息系統(tǒng)Oracle數(shù)據(jù)庫中導(dǎo)入數(shù)據(jù)中文亂碼的解決技術(shù)
S7ASCII字符集使用受限的實(shí)際情況,將醫(yī)院信息系統(tǒng)(HIS)數(shù)據(jù)庫字符集轉(zhuǎn)換成為ZHS16GBK碼,保證導(dǎo)入數(shù)據(jù)庫文件后,漢字顯示正常。方法:在數(shù)據(jù)庫字符集和數(shù)據(jù)庫導(dǎo)入、導(dǎo)出程序功能的基礎(chǔ)上,使用該工具和文本編輯器完成數(shù)據(jù)庫字符集的轉(zhuǎn)換。結(jié)果:通過實(shí)際測試給出了一套字符集升級、避免中文顯示亂碼的解決方案。結(jié)論:HIS數(shù)據(jù)庫版本升級時,應(yīng)做好字符集選擇測試,避免引起漢字顯示亂碼的問題。數(shù)據(jù)庫字符集;Oracle數(shù)據(jù)庫;醫(yī)院信息系統(tǒng)[First-autho
中國醫(yī)學(xué)裝備 2017年2期2017-03-03
- 一種新盲文輸入法的設(shè)計與實(shí)現(xiàn)
還支持多種盲文字符集,便于用戶靈活選擇,適應(yīng)于不同版本的操作系統(tǒng),避免與其他盲文軟件沖突。盲文輸入法;盲文字符集;多模式輸入0 引言盲文是記錄語言的觸覺符號,是盲人基本的書面交流方式,廣泛存在于盲文圖書、盲文試卷、盲文筆記中。當(dāng)前使用的盲文是由法國盲人教師路易·布萊爾于19世紀(jì)創(chuàng)造的,因此國際上通稱為“布萊爾盲文(Braille)”。一個盲文字符由6個凸出的點(diǎn)組成,左側(cè)從上到下為1、2、3點(diǎn),右側(cè)為4、5、6點(diǎn),任意6個點(diǎn)的排列組合,稱為一方。每一方可以表
北京聯(lián)合大學(xué)學(xué)報 2016年4期2016-11-18
- FilterFA:一種基于字符集規(guī)約的模式串匹配算法
FA:一種基于字符集規(guī)約的模式串匹配算法張萍1,2,3,何慧敏4,張春燕1,3,曹聰1,3,劉燕兵1,3,譚建龍1,3(1.中國科學(xué)院信息工程研究所,北京 100093;2.中國科學(xué)院大學(xué),北京 100049;3.信息內(nèi)容安全技術(shù)國家工程實(shí)驗(yàn)室,北京 100093;4.中國移動(深圳)有限公司,深圳 518031)多模式串匹配技術(shù)是入侵檢測系統(tǒng)的核心技術(shù)之一,Aho-Corasick算法廣泛應(yīng)用于其中。針對AC自動機(jī)內(nèi)存開銷巨大影響算法性能的問題,提出一種
通信學(xué)報 2016年12期2016-06-21
- 基于小字符集藏文拉丁轉(zhuǎn)寫系統(tǒng)的設(shè)計與實(shí)現(xiàn)
082)基于小字符集藏文拉丁轉(zhuǎn)寫系統(tǒng)的設(shè)計與實(shí)現(xiàn)陳小瑩1,艾金勇2(1.西藏民族大學(xué) 信息工程學(xué)院,陜西 咸陽 712082;2.西藏民族大學(xué)圖書館,陜西 咸陽 712082)隨著藏語語言信息技術(shù)的迅速發(fā)展,藏文拉丁轉(zhuǎn)寫成為迫切需要解決的重要課題之一。該文在前人有關(guān)藏文拉丁轉(zhuǎn)寫研究的基礎(chǔ)上,設(shè)計并實(shí)現(xiàn)了基于小字符集方案的藏文拉丁轉(zhuǎn)寫系統(tǒng)。文章通過對小字符集編碼方案的特征分析,同時根據(jù)藏文正字法知識,提出了基于小字符集編碼的藏文拉丁轉(zhuǎn)寫算法,并對具體算法策略
中文信息學(xué)報 2016年3期2016-05-04
- .Net框架聯(lián)合Oracle字符集問題研究
合Oracle字符集問題研究莫佩宏,吳紫薇(中車長春軌道客車股份有限公司,長春 130062)本文通過大型國企軟件應(yīng)用中發(fā)現(xiàn)的漢字生僻字無法顯示問題,從開發(fā)工具到系統(tǒng)配置及數(shù)據(jù)庫連接方式等方面對問題發(fā)生的原因進(jìn)行了全方位的剖析,最終找到以升級Oracle數(shù)據(jù)庫字符集為最終解決方案,并對數(shù)據(jù)庫字符集升級方式進(jìn)行了全面測試,明確解決問題辦法,并在實(shí)際工作中進(jìn)行了實(shí)踐,為企業(yè)級Oracle數(shù)據(jù)庫的跨字符集升遷提供了良好的實(shí)踐經(jīng)驗(yàn)。漢字;生僻字;配置;數(shù)據(jù)庫;字符
鐵路計算機(jī)應(yīng)用 2016年6期2016-02-11
- 基于有限狀態(tài)機(jī)的UCC/EAN-128條碼編程實(shí)現(xiàn)
128條碼3種字符集的使用條件,3種編碼方式互相轉(zhuǎn)換的流程,展示了從信息字符串轉(zhuǎn)變成編碼字符串的處理過程,設(shè)計了一種鏈表結(jié)構(gòu)存儲編碼字符串,實(shí)現(xiàn)了條碼的最小編碼,為后續(xù)檢驗(yàn)碼計算和圖案生成提供了方便。整個模塊已經(jīng)應(yīng)用在醫(yī)院臨床用血管理系統(tǒng)中并獲得了良好效果。醫(yī)院信息系統(tǒng);臨床用血;UCC/EAN-128條碼;有限狀態(tài)機(jī);條碼編程0 引言UCC/EAN-128條碼[1]是一種可同時描述字母、數(shù)字的高密度條碼,該條碼的每個字符由3條和3空組成,總寬度為11個基
中國醫(yī)療設(shè)備 2016年9期2016-02-07
- 四電平互補(bǔ)序列的研究
是在比較大的大字符集上?,F(xiàn)實(shí)中,在小字符集上研究多電平序列更有實(shí)用價值。2010年,李旭東[4]就在小字符集上對四電平Z互補(bǔ)序列做了深入的研究。本文研究的重點(diǎn)也是小字符集上的四電平互補(bǔ)序列。1 定義四電平序列是指序列的元素取自于四個字符組成的字符集。本文研究的四電平序列是特指在字符集{± 1,±2}上定義的序列。定義1令a=(a0,a1,…,aN-1)和b=(b0,b1,…,bN-1)是周期為N的序列,他們的周期互相關(guān)函數(shù)被定義為以下形式:其中b*n+τ表
現(xiàn)代計算機(jī) 2015年10期2015-09-21
- 一種基于分段式字符集的彩虹表明文生成方式?
一種基于分段式字符集的彩虹表明文生成方式?張琛嶺(上海交通大學(xué)電子信息與電氣工程學(xué)院,上海200240)Oechslin提出的彩虹表應(yīng)用時間空間折中思想,是密碼學(xué)中逆轉(zhuǎn)單向函數(shù)的有效工具,但現(xiàn)在廣泛使用的單一字符集彩虹表,在明文位數(shù)較大時,因明文空間的迅速膨脹,消耗計算資源的迅速增加,其應(yīng)用遇到了瓶頸。為此,針對人為口令字符集構(gòu)成特點(diǎn),提出分段式字符集彩虹表明文生成方式,將取自不同字符集的不同位數(shù)明文拼接組成新的明文,可以有效地壓縮明文空間,增加覆蓋的最大
信息安全與通信保密 2015年1期2015-09-18
- 古籍?dāng)?shù)字化過程中字樣的提取與整理
——以《集韻》數(shù)據(jù)庫為例
編碼的集合就是字符集(Charset)。根據(jù)字符集編碼的范圍、結(jié)構(gòu)、方式及所含編碼字符的多寡可以分為不同的字符集,常見的字符集就有 GB2312、GBK、GB18030、ISO/IEC 10646等。我們在創(chuàng)建《集韻》數(shù)據(jù)庫時基于Windows 7操作系統(tǒng)和MS Access 2007數(shù)據(jù)庫,使用Unicode編碼規(guī)范,以ISO/IEC 10646為字符集標(biāo)準(zhǔn)。ISO/IEC 10646被譯為“通用多八位編碼字符集”,該通用字符集共定義了17個代碼平面(C
興義民族師范學(xué)院學(xué)報 2015年1期2015-03-01
- 關(guān)于軟件對字符編碼方式誤判的研究
件編碼屬于何種字符集,并將其正確的解碼成為不容忽視的問題。針對Windows記事本不能正常顯示“聯(lián)通”二字的Bug進(jìn)行分析,利用Winhex軟件解析文件獲得16進(jìn)制編碼,根據(jù)得到的編碼分析誤判原因,通過注釋記事本IsTextUTF8函數(shù)對分析得到的誤判原因進(jìn)行證實(shí),進(jìn)一步找到了更多Windows記事本無法正常顯示的漢字。關(guān)鍵詞:編碼方式;字符集;UTF-8;記事本;誤判中圖分類號:TP391.1 文獻(xiàn)標(biāo)識碼:A1 引言(Introduction)在Wind
軟件工程 2014年9期2014-09-26
- 中醫(yī)古籍?dāng)?shù)字化生僻字的處理
礙。本文分別從字符集、字庫、輸入法等方面,分析了集內(nèi)字缺字產(chǎn)生的原因和解決方案,并探討了集外字的處理方法。中醫(yī)古籍;數(shù)字化;生僻字中醫(yī)古籍承載著祖國醫(yī)學(xué)數(shù)千年文明的綿延,是中醫(yī)學(xué)傳承、發(fā)展、創(chuàng)新的源頭活水。中醫(yī)古籍?dāng)?shù)字化,可以通過全文錄入與網(wǎng)絡(luò)共享,解決中醫(yī)古籍作為一種不可再生資源而存在的借閱困難、容易損傷的問題,對比傳統(tǒng)的手工檢索,又極大地提升了查詢的效率,使中醫(yī)古籍得到了更廣泛和更有效的利用,近年來頗受重視,發(fā)展迅速。在數(shù)字化進(jìn)程中,對生僻字的處理
中國中醫(yī)藥圖書情報雜志 2014年3期2014-02-04
- “軍衛(wèi)一號”數(shù)據(jù)庫字符集升級
衛(wèi)一號”數(shù)據(jù)庫字符集升級莊紹燕,楊保衛(wèi)中國人民解放軍第一八零醫(yī)院信息科,福建 泉州 362000本文分析了“軍衛(wèi)一號”數(shù)據(jù)庫的US7ASCII字符集存在的不足,同時介紹了我院“軍衛(wèi)一號”數(shù)據(jù)庫升級字符集的總體設(shè)計方案和具體實(shí)施過程。軍衛(wèi)一號信息系統(tǒng);Oracle數(shù)據(jù)庫;ASCII編碼;GBK編碼“軍 衛(wèi) 一號 ” 系 統(tǒng) 自 1995 年 先 后 在 200 所軍 隊 醫(yī)院和 100 多家地方醫(yī)院成功運(yùn)行。最早部署數(shù)據(jù)庫時只支持US7ASCII字符集。隨著
中國醫(yī)療設(shè)備 2013年11期2013-07-31
- 古籍?dāng)?shù)字化中的集外字處理問題研究*
對概念,但是若字符集固定,集外字的范圍就是固定的;其二,在大規(guī)模古籍?dāng)?shù)字化項目中,集外字大量存在,集外字處理問題無法回避;其三,集外字無法直接輸入、處理和顯示,必須采用其他的技術(shù)和方法,相關(guān)的研究與實(shí)踐還存在很多的問題。1 字符集與集外字字符集是描述多個文字和符號的集合[2],在古籍?dāng)?shù)字化中最常用的是Unicode 字符集。 Unicode 是一個經(jīng)過字符寬度整合的編碼方式, 它是為文字及符號所建立的國際性編碼, 幾乎覆蓋世界上任何一種語言的字符[3]。目
圖書館研究 2013年5期2013-02-15
- 利用繁體字特征進(jìn)行兩岸三地地域性言語識別的研究
異、字形編碼和字符集等方面探討了兩岸三地繁體字的差異。地域性言語識別 兩岸三地 繁體字特征目前,隨著兩岸三地交流的日益增多,國保、刑偵等部門經(jīng)常會遇到一些使用繁體字形成的案件言語材料,準(zhǔn)確判斷這些案件材料的撰稿人是來自大陸還是港臺地區(qū),對于縮小案件偵查范圍、指明偵查方向有著重要的現(xiàn)實(shí)意義。在此類案件的地域性言語識別中,可用的特征包括方言語音、方言詞匯、方言語法等方言特征,地域性文字特征,地域性言語內(nèi)容特征等。本文主要探討地域性文字特征中的繁體字特征,著眼于
中國刑警學(xué)院學(xué)報 2013年1期2013-01-30
- 數(shù)據(jù)庫系統(tǒng)開發(fā)中字符編碼問題的研究
II與ANSI字符集關(guān)系Oracle數(shù)據(jù)庫的默認(rèn)編碼方式為ISO8859-1[6],即ASCII.ISO8859基本特點(diǎn)是:(1)與 ASCII 兼容;(2)碼位0x80-0x9F (或 128-159),保留給擴(kuò)充定義的 32 個控制碼,稱為 C1控制碼 (0-31 稱為C0控制碼);(3)每個字符集定義至多 95 個字符,其碼位都在 0xA1-0xFF(或 161-255).我國GB2312-80規(guī)定一個漢字由兩個擴(kuò)充ASCII碼0x80-0x9F拼成
陜西科技大學(xué)學(xué)報 2013年5期2013-01-29
- 計算機(jī)編目中393字段著錄分析
關(guān)記錄中出現(xiàn)的字符集所缺字符的附注”[1].而韋衣昶的《特種文獻(xiàn)的機(jī)讀書目數(shù)據(jù)》中更加明確地指出“393系統(tǒng)外字符注是用于古籍?dāng)?shù)據(jù)錄入時字符集里所缺字符的結(jié)構(gòu)和讀音”[2],并舉例說明.然就單純393字段出現(xiàn),并不是3——附注其他字段一樣配合相關(guān)字段使用,由此使393字段顯得更加抽象和孤立.其實(shí),該字段以附注形式出現(xiàn),并不是孤立的,在其他相關(guān)的必備字段是可以得到體現(xiàn)的.100通用處理數(shù)據(jù)字段中補(bǔ)充字符集,字符位30-33.《新版中國機(jī)讀目錄格式使用手冊》中
通化師范學(xué)院學(xué)報 2012年8期2012-12-27
- 應(yīng)用開發(fā)中的中文亂碼原因及其解決方案
日文SJIS等字符集。在簡體中文系統(tǒng)下,ANSI編碼代表GB2312編碼,在日文操作系統(tǒng)下,ANSI編碼代表JIS編碼。不同ANSI編碼之間互不兼容,當(dāng)信息在國際間交流時,無法將屬于兩種語言的文字,存儲在同一段ANSI編碼的文本中。這些從ASCII擴(kuò)展的編碼方式,英文部分都是兼容的,但擴(kuò)展部分的編碼由于采用不同的方式制定,它們是不兼容的,雖然很多字在3種體系中寫法一致(例如“中文”這兩個字),但在相應(yīng)字符集中的坐標(biāo)不一致,所以GB2312編碼的字符用BIG
成都信息工程大學(xué)學(xué)報 2012年5期2012-09-21
- 如何解決Tomcat的亂碼
控制的是GET字符集編碼,Request的CharacterEncoding控制的是POST字符集編碼。上面提到的<%@page contentType=“text/html;charset=UTF-8”%>,除了聲明返回給客戶端的流是text/html外,同時設(shè)置了Response的CharacterEncoding,相當(dāng)于執(zhí)行了Response.setCharacterEncoding (“UTF-8”)這段代碼。它保證了服務(wù)器端生成的動態(tài)內(nèi)容到達(dá)客戶
河北民族師范學(xué)院學(xué)報 2012年2期2012-08-15
- 基于VFOX的串口票據(jù)打印機(jī)系統(tǒng)設(shè)計
標(biāo)準(zhǔn)ASCII字符集,和國標(biāo)二級漢字字庫??纱蛴?X7標(biāo)準(zhǔn)字符,同時也可以打印12X12、16X16點(diǎn)陣漢字。打印機(jī)內(nèi)部設(shè)置有35個ESC/P控制命令,與IBM/EPSON ESC/P兼容,同時具有FS標(biāo)準(zhǔn)漢字控制指令集。25針串口引腳連接如下:1腳+5v(可選接)、2腳RXD(輸出:打印機(jī)向主機(jī)發(fā)送控制碼)、3腳TXD(輸入:打印機(jī)從主機(jī)接收數(shù)據(jù))、4腳CTS(輸出:信號“MARK”狀態(tài)高電平,表示打印機(jī)忙;信號“space”表示就緒可接收數(shù)據(jù)。5腳GN
電子世界 2012年18期2012-07-12
- 不依賴字符集的數(shù)據(jù)庫非標(biāo)字段檢測方法
賴于數(shù)據(jù)庫所用字符集的,檢測時要指定字符集名稱或使用其中的字符編碼,這就迫使DBA(Database Administrator,數(shù)據(jù)庫管理員)要對現(xiàn)有的字符集有一定程度的了解,增加了其額外工作量[3]。本文從數(shù)據(jù)表中字段的ASCII值和存儲空間角度,提出了兩種不依賴字符集的數(shù)據(jù)庫非標(biāo)字段檢測方法,實(shí)驗(yàn)表明,這兩種方法與依賴于數(shù)據(jù)庫所用字符集的非標(biāo)字段檢測方法取得了同樣的效果。1 基于字符集的檢測方法字符是各種文字和符號的總稱,包括數(shù)字、標(biāo)點(diǎn)符號、圖形符號
東北電力大學(xué)學(xué)報 2012年4期2012-06-13
- PHP與MySQL Web應(yīng)用平臺中文亂碼問題研究
的方法.亂碼;字符集;MySQLPHP和MySQL以其開源、免費(fèi)、高性能等眾多優(yōu)勢,在Web應(yīng)用領(lǐng)域占領(lǐng)了越來越多的市場份額.現(xiàn)在,PHP與MySQL的主流版本已經(jīng)能夠完全兼容中文信息,但是在進(jìn)行中文應(yīng)用程序開發(fā)的過程中會經(jīng)常出現(xiàn)一些亂碼問題.究其原因,是因?yàn)橛嬎銠C(jī)中漢字的編碼方式不統(tǒng)一.同一個漢字在不同字符集中的編碼是不一樣的,如果一些應(yīng)用程序默認(rèn)采用了不同的字符集又缺乏合理的轉(zhuǎn)換機(jī)制,在相互通信中就極有可能出現(xiàn)中文亂碼.1 常用包含中文編碼的字符集介紹
赤峰學(xué)院學(xué)報·自然科學(xué)版 2011年8期2011-10-16
- 解決JSP/Servlet開發(fā)中的中文亂碼問題
數(shù)據(jù)庫所使用的字符集標(biāo)準(zhǔn)不統(tǒng)一。因此,要解決中文亂碼,其基本原則就是:保持?jǐn)?shù)據(jù)傳輸?shù)钠瘘c(diǎn)、終點(diǎn)、傳輸通道上的編碼一致。1 幾種典型亂碼情形解決方案下面分幾種常見的情形給出中文亂碼的解決方案,這些解決方案統(tǒng)一使用UTF-8作為編碼字符集。1.1 瀏覽器顯示中文時的亂碼瀏覽器在顯示JSP頁面時,若頁面含中文內(nèi)容,可能會出現(xiàn)中文亂碼,其原因是:JSP頁面與瀏覽器的字符集不匹配。解決方案:讓JSP頁面與瀏覽器使用統(tǒng)一的編碼字符集。可在JSP中使用如下代碼實(shí)現(xiàn):<%
科技傳播 2011年1期2011-09-23
- OFDM中基于有限字符集特性的半盲信道估計
用信息符號有限字符集特性的信道盲可辨識條件和一種最小距離(MD)盲信道估計算法;文獻(xiàn)[9]又放寬了原有的充分條件,包含了所有可辨識的情況;文獻(xiàn)[10]提出了修正MD后的MMD算法。本文介紹了一種基于有限字符集特性的半盲信道估計方法,能有效減少計算的復(fù)雜度,并保持較好的估計精度。1 OFDM系統(tǒng)模型下面以一簡單的OFDM為例說明。經(jīng)過各種映射(如BPSK,QPSK,QAM等)的基帶調(diào)制之后的信息符號(n)被分割為長度為M的信號分組后,然后用離散傅里葉反變換(
電視技術(shù) 2011年17期2011-06-07
- Java Web開發(fā)中國際化問題的設(shè)計與實(shí)現(xiàn)
,本文在分析對字符集選擇的基礎(chǔ)上,介紹了一種高效的解決方案——使用J2SE資源綁定的方式。1 、引言世界經(jīng)濟(jì)日益全球化推動了人們對基于 Web 的軟件的需求,因?yàn)樵S多國家的用戶都能訪問Web軟件。然而,隨著信息的國際化,如何動態(tài)構(gòu)建一個具有各種不同語言的Web應(yīng)用程序,成為面向國際應(yīng)用的企業(yè)和個人需要考慮的問題。2 、字符集的應(yīng)用為了能在計算機(jī)中表示不同語言中字符,每個國家(或區(qū)域)都規(guī)定了計算機(jī)信息交換用的字符編碼集,如美國的ASCII,中國GB2312
中國科技信息 2010年20期2010-11-07
- “軍衛(wèi)一號”數(shù)據(jù)庫系統(tǒng)由Oracle8i手工升級至Oracle10g的方法
16GBK中文字符集,而“軍衛(wèi)一號”數(shù)據(jù)庫系統(tǒng)采用US7ASCII英文字符集,雖然通過編程的方法可以進(jìn)行字符集轉(zhuǎn)換,但程序使用過程中仍經(jīng)常會出現(xiàn)亂碼的情況,為了長遠(yuǎn)的需要,最好將“軍衛(wèi)一號”數(shù)據(jù)庫的字符集修改為簡體中文字符集。我院“軍衛(wèi)一號”數(shù)據(jù)庫系統(tǒng)為Oracle8.1.7.4,操作系統(tǒng)為Windows Server 2000,對于上述問題不是不能解決,但需要對Oracle8i的知識有深入的了解。目前,Oralce10g的推出已有一段時間,業(yè)界有關(guān)Ora
中國醫(yī)療設(shè)備 2010年2期2010-10-09
- 國際化軟件測試技術(shù)的實(shí)現(xiàn)
試環(huán)境的語言及字符集設(shè)置的選擇,如果缺乏這種選擇或者錯誤地進(jìn)行了選擇,則可能在具體測試過程中帶來系統(tǒng)由于碼制的切換錯誤而出現(xiàn)亂碼的問題。(3)多種語言顯示的測試問題,軟件的翻譯質(zhì)量包括翻譯的準(zhǔn)確性、完整性、一致性,以及特定區(qū)域市場的文化、傳統(tǒng)、習(xí)俗等內(nèi)容。如果要實(shí)現(xiàn)對翻譯的檢查,需要根據(jù)所測語言而準(zhǔn)備相應(yīng)的翻譯文件進(jìn)行對比。當(dāng)測試多種語言時,會增加測試人員的負(fù)擔(dān)。(4)多語言和字符集的測試數(shù)據(jù)的自動生成,為了測試軟件對接收、處理和發(fā)送不同字符集的能力,需要
網(wǎng)絡(luò)安全與數(shù)據(jù)管理 2010年15期2010-09-29
- 基于C#的字符編碼映射系統(tǒng)
312簡體中文字符集,日本有Shift-JIS字符集,國際上類似這樣一個國家對應(yīng)一套或數(shù)套字符集的現(xiàn)象很多.Unicode是國際組織制定的可以容納世界上所有文字和符號的字符編碼方案,它用數(shù)字0~0x10FFFF來映射這些字符,最多可以容納1 114 112個字符,或者說有1 114 112個碼位.碼位就是可以分配給字符的數(shù)字.UTF-8,UTF-16,UTF-32都是將數(shù)字轉(zhuǎn)換到程序數(shù)據(jù)的編碼方案.Unicode字符集簡寫為UCS(Unicode Char
陜西科技大學(xué)學(xué)報 2010年4期2010-02-23
- Java程序中亂碼的由來及解決方法
ava漢字編碼字符集在Java語言的應(yīng)用中,對字符的支持并非如同Java Soft的標(biāo)準(zhǔn)規(guī)范中所宣稱的那樣完美,尤其是中文字符集,所以在開發(fā)過程涉及到對漢字的處理時經(jīng)常會出現(xiàn)亂碼,給開發(fā)人員帶來諸多不便。1常見的字符編碼計算機(jī)中存儲、處理和傳送的數(shù)據(jù)是二進(jìn)制的形式。各種文字、符號也必須用二進(jìn)制數(shù)編碼來表示,因此出現(xiàn)了一些不同形式的字符編碼。(1)IS08859-1碼IS08859-1碼屬于單字節(jié)編碼,最多能表示的字符范圍是0-255,應(yīng)用于英文系列。由于是
智能計算機(jī)與應(yīng)用 2007年4期2007-08-25