国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

筆跡字間距特征量化檢驗的統(tǒng)計方法

2017-10-19 02:03:14王相臣王帥帥
四川警察學院學報 2017年4期
關鍵詞:假設檢驗檢材筆跡

王相臣,王帥帥

(中國刑警學院 遼寧沈陽 110035)

筆跡字間距特征量化檢驗的統(tǒng)計方法

王相臣,王帥帥

(中國刑警學院 遼寧沈陽 110035)

字間距特征是筆跡中可以進行客觀測量的一類特征,對字間距特征的比對檢驗可以轉(zhuǎn)化為雙樣本均值和方差的一致性檢驗問題。借助概率論和數(shù)理統(tǒng)計中的假設檢驗和方差分析等方法判斷檢材與樣本的字間距特征是否具有顯著性差別,從而實現(xiàn)對字間距特征的量化檢驗,并通過小樣本實驗對該方法進行實驗研究,經(jīng)實驗分析從10個樣本中排除掉7個樣本并保留了目標樣本,從而證明了該方法的可行性。

筆跡;字間距特征;量化;假設檢驗

筆跡特征是個人書寫技能和書寫習慣的表現(xiàn),是認識個人筆跡特性的客觀依據(jù)。由于筆跡具有反映性、自身同一性和總體特殊性等特性,目前,筆跡檢驗鑒定專家主要通過個人經(jīng)驗來分析筆跡特征,進行定性判斷,并最終做出鑒定意見。這種檢驗鑒定方法在鑒定的客觀性和科學性上存在一定不足,不同專家會因個人經(jīng)驗和認識上的差別對同一案件的筆跡特征有不同認識,最終可能導致作出的鑒定意見的差異。如何提高筆跡檢驗鑒定的客觀性和科學性也是筆跡檢驗領域現(xiàn)階段亟需解決的難題。目前,DNA鑒定技術已經(jīng)可以較好地使用概率表達其檢驗鑒定的可信度,其完整的量化體系與技術方法,給整個法庭科學檢驗帶來了革命性的變化[1]。在這種背景下,筆跡的量化檢驗鑒定受到人們的重視。本文借助計算機軟件和數(shù)理統(tǒng)計學相關方法,針對筆跡的字間距特征進行量化檢驗方法研究。在客觀精確測量字間距特征數(shù)據(jù)的基礎上對相關數(shù)據(jù)進行統(tǒng)計分析,有效解決這一特征的量化檢驗問題。

一、量化統(tǒng)計方法

數(shù)理統(tǒng)計中對正態(tài)總體的假設檢驗一般是對總體均值和方差的檢驗。對于未知來源的兩個樣本,若分別對其均值和方差的一致性進行檢驗,并分別得出肯定原假設的結論,則認為兩個樣本沒有顯著差異,具有相同的分布規(guī)律。由于不同人筆跡的字間距大小在一定范圍內(nèi)保持相對穩(wěn)定,理論上是符合正態(tài)分布的,這一點經(jīng)過小樣本實驗得到了證明。因此,對來源未知的筆跡材料的字間距特征進行統(tǒng)計分析,實質(zhì)上可轉(zhuǎn)化為對檢驗和樣本的假設檢驗問題 ,即:原假設是否成立。在精確測得檢材和樣本筆跡字間距數(shù)據(jù)的基礎上進行假設分析,判斷兩者在一定的顯著性水平上是否具有顯著性差異。

(一)方差的假設檢驗

假設檢驗中對兩正態(tài)總體方差的假設檢驗分為雙邊檢驗和單邊檢驗,又根據(jù)樣本總體均值已知和未知存在不同的檢驗統(tǒng)計量。刑事技術中極少使用單邊檢驗,常使用雙邊檢驗。同時,只有在樣本量足夠大時,根據(jù)中心極限定理可以獲得樣本總體均值,但實踐中很難實現(xiàn)。因此,對于總體均值未知的兩正態(tài)總體方差的假設檢驗的檢驗統(tǒng)計量為:, 其中S=為檢材字間距方差,為樣本字間距方差,n1為檢材字間距數(shù)量,n2為樣本字間距數(shù)量,顯著水平為α下雙邊檢驗拒絕域W為:

(二)均值的假設檢驗

對兩正態(tài)總體均值的假設檢驗也分為雙邊檢驗和單邊檢驗,又根據(jù)樣本總體方差已知和未知選擇不同的檢驗統(tǒng)計量。刑事技術中極少使用單邊檢驗,常使用雙邊檢驗。同時,也很難擁有足夠多樣本實現(xiàn)對樣本總體方差的估計。因此,對于方差未知且方差相等的兩個正態(tài)總體的均值常使用T檢驗法,其檢驗統(tǒng)計量T為:

當待檢樣本有多組時,對多個正態(tài)總體均值的假設檢驗,使用上述雙樣本T檢驗方法會極大增加工作量,特別是涉及樣本間兩兩比較時,弊端尤為突出。因此當樣本量多于兩組時,使用方差分析對均值進行一致性檢驗會更加方便快捷。假設有a組數(shù)據(jù)用i表示,第i組有個數(shù)據(jù)用j表示,方差分析的檢驗統(tǒng)計量Leneve F(和方差的假設檢驗中的F不同)為:其中為組間離差平方和,為組內(nèi)離差平方和,總體均值,單樣本均值,為第i組的第j個測量值,n為總數(shù)據(jù)量,在顯著水平α下,拒絕域為F≥Fα(a-1,n-a)[3]。

(三)假設檢驗的步驟

進行假設檢驗通常按照以下步驟進行:

1.提出原假設。通常原假設表示的內(nèi)容為“在給定的顯著性水平上兩個樣本所來自的總體不存在顯著性差異”,即H0∶μ1=μ2或σ1=σ2,相應的,對應假設即為H0∶μ1≠μ2或σ1≠σ2。

2.選擇統(tǒng)計量。根據(jù)檢驗內(nèi)容選擇合適的統(tǒng)計量,若進行方差齊性檢驗選擇F統(tǒng)計量,若檢驗均值選擇T統(tǒng)計量或方差分析。一般先進行方差齊性檢驗,對方差齊的樣本再進行均值檢驗。

3.計算檢驗統(tǒng)計量的觀測值和概率值。觀測值即為根據(jù)實際數(shù)據(jù)和統(tǒng)計量計算方法得到的具體數(shù)值,根據(jù)對應的概率分布類型確定對應的概率值。

4.給定顯著性水平,做出決策。通常進行檢驗假設選擇顯著性水平為0.05、0.01或0.001,顯著性水平越低,置信度就越高,結果越可靠。

在進行假設分析時,首先對待檢檢材和樣本字間距進行方差齊性檢驗,當兩者滿足σ1=σ2時再分析均值是否一致,如果均值檢驗的結果也接受原假設,則可以認為檢材和樣本字間距表現(xiàn)一致的分布規(guī)律。

二、實驗研究

依據(jù)以上統(tǒng)計學原理,設計模擬實驗,并且只從字間距特征的假設檢驗角度進行統(tǒng)計分析。

(一)收集實驗樣本

組織10名參與者,使用白色標準A4紙和同一品牌、型號的中性筆,全部以紙張為襯墊物進行正常書寫,書寫內(nèi)容由21個文字組成,為了保證結果的客觀并真實反映書寫人的書寫特點,要求對書寫內(nèi)容重復書寫6遍,每個人的書寫內(nèi)容作為一個樣本共10個樣本。在10名參與者中隨機抽取一人(樣本7的書寫者),在相同條件下書寫相同內(nèi)容一遍,作為檢材。本次實驗的目標樣本為樣本7。

(二)提取實驗數(shù)據(jù)

將待測筆跡文件在600dpi分辨率下掃描,首先對掃描圖片進行二值化處理,再計算二值化圖片中組成每個字的所有像素點的幾何中心點作為文字的質(zhì)心,如圖1所示為計算部分文字質(zhì)心的處理結果,紅點為單字質(zhì)心坐標點,并會輸出該點在圖片中的精確坐標。以上操作借助MATLAB計算機軟件實現(xiàn)。再使用距離公式計算相鄰字之間的距離即為相鄰字的字間距。

圖1 部分字跡質(zhì)心處理結果

實驗樣本中每人對書寫內(nèi)容書寫了6遍,得到6組數(shù)據(jù),每組21個字形成20個字間距數(shù)據(jù),將6×20個字間距作為樣本數(shù)據(jù),同時計算出檢材的字間距,部分數(shù)據(jù)如圖2所示。經(jīng)正態(tài)性檢驗,確認了各組數(shù)據(jù)均為正態(tài)總體的猜想。

(三)分析過程

1.方差的假設檢驗過程。首先進行方差齊性檢驗。假設顯著性水平α=0.05,檢材和樣本的方差齊。檢驗統(tǒng)計量拒絕域為:W=(F≦0.55∪F≧1.82)。分別計算各個樣本與檢材的檢驗統(tǒng)計量觀察值f,結果如表1所示:

圖2 部分實驗數(shù)據(jù)

表1 檢驗統(tǒng)計量F值

可以看出樣本1、4、5、10的統(tǒng)計量F值在拒絕域內(nèi),因此排除原假設H0,認為與檢材方差不齊,直接舍去;樣本2、3、6、7、8、9的統(tǒng)計量F值在拒絕域外,因此接受原假設,認為這六組樣本方差一致。對方差一致的六組樣本再進行均值的一致性檢驗。

2.均值的假設檢驗過程。假設顯著性水平α=0.05,檢材和樣本的均值一致。方差未知且相等時,均值檢驗統(tǒng)計量,拒絕域為:W=(∣T∣≥1.974)。 分別計算剩余樣本與檢材的均值檢驗統(tǒng)計量觀察值T,結果如表2所示:

表2 檢驗統(tǒng)計量T值

可以看出樣本2、6、9與檢材的均值檢驗統(tǒng)計量T值在拒絕域內(nèi),因此排除原假設,認為均值不一致。同時,認為樣本3、7、8與檢材服從相同的正態(tài)分布。

除T檢驗外,使用第二部分中介紹的方差分析的方法進行均值的一致性檢驗在樣本數(shù)量較多時更加方便,這里可以借助數(shù)據(jù)分析處理軟件SPSS進行操作。先將數(shù)據(jù)導入軟件內(nèi)并進行分組,選擇單因素方差分析,根據(jù)數(shù)據(jù)分析的需求設置好相關參數(shù)。在假設樣本方差一致時,常用的分析方法有LSD法和S-N-K法,其中LSD法又叫最小顯著性差異法是比較靈敏的方法,會將所有組別的數(shù)據(jù)都進行比較,S-N-K法是比較穩(wěn)健的方法,并且可以有效劃分相似子集。實驗中將兩種常用方法都進行選擇。

將與檢材方差一致的樣本數(shù)據(jù)和檢材數(shù)據(jù)導入SPSS軟件內(nèi),將檢材組別設為0,樣本組別設為對應的樣本號,設置顯著性水平α=0.05,勾選LSD和S-N-K兩種方法后,點擊確定進行檢驗。

方差分析的檢驗結果如表3所示,檢驗統(tǒng)計量F=340.443,顯著性水平sig=0.00<0.05,說明各組之間存在差異。具體的內(nèi)容如表4和表5所示。表4為LSD法的檢驗結果,可以看出所有組別的數(shù)據(jù)兩兩之間進行了多重比較。第一部分為檢材和各樣本之間的兩兩比較,可以看出:平均值左上角帶*號的樣本3、7、8的顯著性sig值均大于0.05,認為均值無顯著差異。表5為S-N-K法的檢驗結果,該方法將不同樣本劃分為不同的子集,相似度高的樣本在同一子集內(nèi)。結果顯示:檢材與樣本7被劃分為一組,同時檢材和樣本3和樣本8也被劃分為一組,說明檢材和樣本3、7、8均值無顯著差異,也說明樣本3和樣本8均值一致,但卻與樣本7不一致。方差分析和T檢驗對均值的檢驗結果一致。

表3 方差分析結果

表4 LSD法檢驗結果

6 0 5.80283.29800 .000 5.2178 6.3879 2 4.00817.15929 .000 3.6955 4.3209 3 5.59742.15929 .000 5.2847 5.9101 7 6.13767.15929 .000 5.8250 6.4504 8 5.64500.15929 .000 5.3323 5.9577 9 4.66492.15929 .000 4.3522 4.9776 7 LSD 0 -.33483 .29800 .262 -.9199 .2502 2 -2.12950.15929 .000 -2.4422 -1.8168 3 -.54025.15929 .001 -.8530 -.2275 6 -6.13767.15929 .000 -6.4504 -5.8250 8 -.49267.15929 .002 -.8054 -.1800 9 -1.47275.15929 .000 -1.7855 -1.1600 8 0 .15783 .29800 .597 -.4272 .7429 2 -1.63683.15929 .000 -1.9495 -1.3241 3 -.04758 .15929 .765 -.3603 .2651 6 -5.64500.15929 .000 -5.9577 -5.3323 7 .49267.15929 .002 .1800 .8054 9 -.98008.15929 .000 -1.2928 -.6674 9 0 1.13792.29800 .000 .5529 1.7229 2 -.65675.15929 .000 -.9695 -.3440 3 .93250.15929 .000 .6198 1.2452 6 -4.66492.15929 .000 -4.9776 -4.3522 7 1.47275.15929 .000 1.1600 1.7855 8 .98008.15929 .000 .6674 1.2928*.平均值差的顯著性水平 0.05。

表5 S-N-K法檢驗結果

Student-Newman-Keuls多重比較法 12.8233 sig .109 .587 1.000 1.000 1.000 2 120 8.8152 6 120

(四)實驗結果分析

在上述分析過程中,先對檢材和10個待檢樣本進行方差的一致性檢驗,在顯著性水平α=0.05下,通過計算檢驗統(tǒng)計量F值及其拒絕域來對比檢材和樣本方差之間的差異,結果顯示在顯著性水平α=0.05下,樣本2、3、6、7、8、9與檢材方差沒有顯著差異,樣本1、4、5、10與檢材方差存在顯著差異,因此予以排除。再對和檢材方差一致的樣本進行均值的一致性檢驗,這里有兩種方法:第一種適合雙樣本之間的兩兩比較,在顯著性水平α=0.05下,通過計算檢驗統(tǒng)計量T值及其拒絕域來分析檢材和樣本均值的一致性,結果顯示在顯著性水平α=0.05下,樣本3、7、8與檢材均值沒有顯著差異,樣本2、6、9與檢材均值存在顯著差異,予以排除;第二種方法適合待比對樣本數(shù)量為多組時使用,借助計算機軟件SPSS來進行,設置顯著性水平α=0.05及其他參數(shù)開始分析,常用的LSD法和S-N-K法分析結果均顯示,在顯著性水平α=0.05下,樣本3、7、8與檢材均值沒有顯著差異,樣本2、6、9與檢材均值存在顯著差異,與第一種方法的檢驗結果一致。經(jīng)過整個統(tǒng)計分析可以看出,檢材數(shù)據(jù)和樣本3、7、8數(shù)據(jù)具有相同的分布規(guī)律,從而縮小了檢驗鑒定的范圍,其中方差分析中S-N-K法特有的分組功能將檢材和目標樣本(樣本7)單獨列為一組,雖直接確定兩者來自同一正態(tài)總體具有較大風險,但具有一定參考意義。

字間距特征是筆跡特征之一,使用統(tǒng)計學分析方法可以很好的判斷檢材和樣本字間距特征是否具有顯著差別。這種筆跡特征的量化方法相對于傳統(tǒng)的憑借鑒定人個人經(jīng)驗主觀認識筆跡特征具有更加的科學、客觀和可靠的優(yōu)點。本文只研究了筆跡的字間距特征,若對筆跡中其他可測量的特征也使用這種方法進行統(tǒng)計研究,可為筆跡量化檢驗提供更多的量化依據(jù),從而為全面實現(xiàn)筆跡量化檢驗鑒定提供更多的統(tǒng)計學方法,這有待于進一步深入的探索研究。

[1]王相臣,胡 鑫.物證檢驗鑒定的數(shù)學原理與方法研究[J].中國刑警學院學報,2016,(3):27.

[2]許伯生,張 穎.概率論與數(shù)理統(tǒng)計[M].北京:清華大學出版社,2014:89.

[3]管 宇.實用多元統(tǒng)計分析[M].浙江:浙江大學出版社,2011:35.

A Statistical Method on Quantitative Examination of Word Spacing Feature in Handwriting

WANG Xiang-chen WANG Shuai-shuai

Word spacing feature is one of characteristics which can be measured objectively in handwriting.The comparative testing of double samples on word spacing feature can be converted to the problem of statistics theories with two-sample average and variance testing at the same time.By means of hypothesis test and variance analysis in probability theory and mathematical statistics,the experiment with small samples is made to test whether there is a significant difference between the word space features of two samples.The quantitative examination of handwriting word spacing feature is made.7 samples are excluded from the 10 samples and the target samples are retained.The feasibility of this method is proved by experiments.

handwriting;word spacing feature;quantitative examination;hypothesis test

D918.921 文獻標識碼:A 文章編號:1674-5612(2017)04-0087-07

(責任編輯:吳良培)

中國刑事警察學院研究生創(chuàng)新能力提升重點項目(2017jkf030)

2017-05-10

王相臣,(1964- ),男,黑龍江哈爾濱人,中國刑事警察學院文件檢驗技術系主任、教授,研究方向:文件檢驗;王帥帥,(1992- ),男,河南洛陽人,中國刑事警察學院碩士生,研究方向:文件檢驗。

猜你喜歡
假設檢驗檢材筆跡
巧克力能否去除桌上的油性筆筆跡
少兒科技(2021年3期)2021-01-20 13:18:34
統(tǒng)計推斷的研究
時代金融(2017年6期)2017-03-25 12:02:43
疑難生物檢材DNA的檢驗探究
雙冪變換下正態(tài)線性回歸模型參數(shù)的假設檢驗
Primary Question and Hypothesis Testing in Randomized Controlled Clinical Trials
統(tǒng)計學教學中關于假設檢驗問題探討
筆跡泄露大秘密
快樂語文(2016年7期)2016-11-07 09:43:56
微量接觸類生物檢材的游離DNA問題分析
直接擴增法提取脫落細胞DNA
海峽科學(2015年11期)2015-09-19 06:48:18
筆跡不說謊
永新县| 西昌市| 兴隆县| 五大连池市| 海门市| 博湖县| 荔浦县| 托克逊县| 高州市| 嘉义市| 集安市| 五莲县| 红桥区| 建平县| 宁化县| 弋阳县| 枣庄市| 阜阳市| 汝城县| 蕲春县| 襄樊市| 东山县| 开化县| 定南县| 莫力| 子洲县| 修水县| 普定县| 龙南县| 荣昌县| 乐亭县| 淮阳县| 平利县| 巴彦淖尔市| 清涧县| 顺平县| 三门县| 吉安县| 丹江口市| 安化县| 凌源市|