国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

對城鎮(zhèn)居民婚前性行為態(tài)度的影響因素分析

2017-09-25 03:26鄧心怡吳培莎
山西農(nóng)經(jīng) 2017年16期
關(guān)鍵詞:接受程度性行為戶口

□劉 彬 鄧心怡 吳培莎

(華南師范大學(xué)數(shù)學(xué)科學(xué)學(xué)院 廣東 廣州 510631)

對城鎮(zhèn)居民婚前性行為態(tài)度的影響因素分析

□劉 彬 鄧心怡 吳培莎

(華南師范大學(xué)數(shù)學(xué)科學(xué)學(xué)院 廣東 廣州 510631)

本文通過對中國國家調(diào)查數(shù)據(jù)庫的全國家庭綜合社會情況數(shù)據(jù)進(jìn)行研究,分析影響婚前性行為接受程度的主要因素,預(yù)測不同群體的人對婚前性行為接受程度的差異。首先,本文挑選了14個客觀指標(biāo),并對原始數(shù)據(jù)進(jìn)行預(yù)處理,通過獨(dú)立性檢驗(yàn)發(fā)現(xiàn)14個變量皆與解釋變量不互相獨(dú)立;然后利用隨機(jī)森林進(jìn)行因素重要性分析,結(jié)合單因素logistic回歸分析選取出重要變量作為解釋變量,剔除宗教、民族、戶口這三個變量;最后,我們通過建立多因素logistic回歸模型對變量做進(jìn)一步的分析發(fā)現(xiàn),隨著年齡、收入、父母學(xué)歷的增長,個體對婚前性行為的接受程度會越高;已婚者比未婚者接受程度更高等結(jié)論。

婚前性行為;影響因素;logistic回歸

目前,我國對婚前性行為接受程度的研究正處于發(fā)展階段。2014年《小康》曾發(fā)布“中國人性健康”報(bào)告,與1994年相比,2012年國人婚前性行為的比例提高了30%,達(dá)到了71.4%。研究證實(shí),對婚前性行為態(tài)度的差異,受出生年代,個體事業(yè)發(fā)展,個體父母教育,所處區(qū)域、社會環(huán)境的顯著影響。本文比較突出的地方有以下三點(diǎn):第一,本文數(shù)據(jù)來源可靠,調(diào)查區(qū)域、群體都比較廣泛;第二,在數(shù)據(jù)預(yù)處理階段,對于何種插補(bǔ)比較可靠做了一些探討;第三,本文綜合使用單因素和多因素logistic回歸對數(shù)據(jù)進(jìn)行了多方面分析。

1 建模準(zhǔn)備

1.1 數(shù)據(jù)來源及指標(biāo)選擇

數(shù)據(jù)來源于國家調(diào)查數(shù)據(jù)庫 (CNSDA)2013年度的中國綜合社會調(diào)查。該調(diào)查共收集10724個樣本,調(diào)查內(nèi)容包括:個體客觀屬性,比如性別、年齡、學(xué)歷、收入等;個體主觀屬性,比如對社會的認(rèn)知情況,婚前性行為接受情況,政治參與情況等。本文篩選出調(diào)查問卷中比較有可能對個體婚前性行為態(tài)度產(chǎn)生影響的客觀因素,分別是性別、年齡、宗教、民族、教育程度、收入、健康狀態(tài)、戶口情況、生活方式、工作狀態(tài)、婚姻情況、父親學(xué)歷、母親學(xué)歷。其中,因變量“對婚前行為態(tài)度”有五個類別,分別是“總是不對的”“大多數(shù)情況是不對的”。

1.2 數(shù)據(jù)預(yù)處理

1.2.1 異常值處理。首先,由于調(diào)查問卷中存在若干負(fù)值,不符合原先問卷問答的設(shè)定,又因?yàn)槌霈F(xiàn)負(fù)值的樣本只占原始樣本的7.56%,比重較小,所以刪除這些異常數(shù)據(jù)。

接著,我們發(fā)現(xiàn)年總收入列存在9 999 997~9 999 999這樣的異常值,占樣本總數(shù)的10%,問卷設(shè)定中,這些值分別表示年總收入高于100萬、不適用、不知道、拒絕回答。由于這些數(shù)據(jù)并不利于我們分析收入與婚前性生活態(tài)度之間的關(guān)系,所以先將它們替換為空值,后續(xù)將對其進(jìn)行插補(bǔ)。

計(jì)算剩下樣本的平均年總收入為24 217,與官方統(tǒng)計(jì)2012年全國人均總收入相近。我們繪出收入的箱線圖,發(fā)現(xiàn)高于平均收入的離群點(diǎn)非常多,這是中國社會貧富差距懸殊的一種體現(xiàn),所以并不對這些離群點(diǎn)做處理。

1.2.2 類別合并。由于問卷設(shè)置要綜合考慮答卷者的多種情況,故設(shè)置了多個類別。但是有一些類別的樣本量比較稀少,一方面不利于我們對稀少做出準(zhǔn)確的分析,一方面會使得模型復(fù)雜度加大,所以這里我們對稀少類進(jìn)行合并。

年齡合并成未成年人(<=17 歲),青年(18~45 歲),中年人(46~59 歲),老人(>=60 歲)四類;宗教合并成不信仰宗教,信仰佛教、伊斯蘭教、基督教,民間信仰,其他信仰六類;民族合并成漢族,回族,壯族,滿族和其他少數(shù)民族五類;教育程度合并為初中以下,初中,高中,大學(xué),研究生及以上五類;關(guān)于收入,低于插補(bǔ)后平均工資一半即0~11 915元為一類,高于平均工資一半但低于平均工資即11 915~23 830元為一類,高于平均工資三倍即71 490元以上的為一類,剩下23 830~71 590元為一類,共四類;戶口合并成農(nóng)業(yè)戶口,非農(nóng)業(yè)戶口,其他三類;工作狀態(tài)合并為農(nóng)民,不受雇與他人者,雇員,其他工作,無工作五類;婚姻狀態(tài)合并為未婚,已婚,離婚三類。

1.2.3 缺失值插補(bǔ)。由于在異常值處理中,我們將收入為9 999 996~9 999 999的點(diǎn)全部替換成空值,所以需要對其進(jìn)行缺失值插補(bǔ)。為了比較何種插補(bǔ)方法比較理想,本文先是將收入含缺失值的樣本剔除掉,從剩下的樣本中隨機(jī)抽取400個樣本替換成空值。接著用均方根誤差rmse來衡量插補(bǔ)的誤差,綜合考慮了年齡有無分段的kNN和隨機(jī)森林插補(bǔ)的誤差。計(jì)算得到年齡無分段的隨機(jī)森林插補(bǔ)的誤差是最小的,為29 904.06元,所以采用此方法對988個缺失值進(jìn)行插補(bǔ),最終得到收入的均值為23 830元,接近插補(bǔ)之前的收入平均值24 217元。

2 模型建立

2.1 獨(dú)立性檢驗(yàn)

首先,本文的第一步是做變量的相關(guān)性檢驗(yàn)。由于相關(guān)性分析的常用方法Pearson檢驗(yàn)只適用于連續(xù)變量,而我們的指標(biāo)多為多分類變量,所以這里我們采用獨(dú)立性檢驗(yàn),即交叉列聯(lián)表的卡方檢驗(yàn)。

計(jì)算結(jié)果顯示,這13個變量的獨(dú)立性檢驗(yàn)的p值均接近0,在顯著性為0.05的情況下都應(yīng)該拒絕原假設(shè),即拒絕變量和婚前性行為接受程度的獨(dú)立性。因此我們沒有理由剔除任何變量。

2.2 隨機(jī)森林重要變量分析

隨機(jī)森林指的是利用多顆樹對樣本進(jìn)行訓(xùn)練并預(yù)測的一種分類器。隨機(jī)森林幫助我們挑選出對婚前性行為態(tài)度有重要影響的變量,因?yàn)楫?dāng)冗余的特征變量進(jìn)入決策樹時,并不會提高模型的預(yù)測精度,甚至可能會降低模型預(yù)測的精度。

在用隨機(jī)森林進(jìn)行重要性分析之前,需要對數(shù)據(jù)做進(jìn)一步的處理。首先將收入單位改成萬,以便logistic回歸分析中得到一個比較大的系數(shù)。由于單因素logistic回歸中要求所有變量皆為二分類,所以在這部分刪除婚前性行為態(tài)度為“說不上對不對”的樣本,將婚前性行為態(tài)度為“總是不對的”“大多數(shù)情況是不對的”歸為不支持一類,將“有時是對的”“總是對的”歸為支持一類。

利用R語言編碼,建立隨機(jī)森林模型,隨機(jī)生成了500棵決策樹,并計(jì)算均方誤差和精度。結(jié)果顯示,無論是從均方誤差還是精度的角度,都顯示年齡和收入是影響婚前性行為最重要的因素,重要影響因素還包括健康狀況、教育程度等,而在這13個變量中,民族、宗教和戶口情況是最不重要的影響因素。

表1 logistic多因素分析結(jié)果

2.3 logistic回歸分析

為了進(jìn)一步探討對婚前性行為接受程度的影響因素,并降低混雜因素造成的偏差,先進(jìn)行l(wèi)ogistic單因素分析,再次基礎(chǔ)上講接受程度作為單變量,將單因素分析結(jié)果具有統(tǒng)計(jì)學(xué)意義(p<0.05)的相關(guān)變量作為自變量引入logistic回歸模型分析。

*logistic單因素分析結(jié)果

通過對這13個變量進(jìn)行l(wèi)ogistic單因素回歸,我們發(fā)現(xiàn),年齡、教育程度、收入、健康情況、父親學(xué)歷、母親學(xué)歷、性別、工作狀態(tài)、婚姻情況、生活方式這些都是在顯著水平情況下和對婚前性行為有顯著作用的變量,我們將其作為自變量,納入多元logistic回歸里,進(jìn)行下一部分討論。

而在單因素logistic回歸剔除的宗教、民族、戶口情況這三個變量中:

2.3.1 宗教的情況。單因素logistics回歸p值為0.062,在5%的顯著水平下認(rèn)為對婚前性行為的接受程度與宗教無關(guān)。但是在10%的顯著性水平下,我們會發(fā)現(xiàn)民間信仰相比無宗教更接受婚前性行為,而伊斯蘭教相比無宗教更不接受婚前性行為,這可能跟伊斯蘭教的“齋功”有關(guān),“寡欲清心,以近真主”,固然更難以接受婚前性行為。

2.3.2 民族的情況。單因素logistics回歸p值為0.098,在5%的顯著水平下認(rèn)為對婚前性行為的接受程度與民族無關(guān)。但是在10%的顯著性水平下,我們會發(fā)現(xiàn)回族相比漢族更不接受婚前性行為,這可能是因?yàn)榛刈逯饕欧钜了固m教,固守傳統(tǒng),遵循教規(guī),自然也難以接受婚前性行為。

2.3.3 戶口的情況。單因素logistics回歸p值為0.076,在5%的顯著水平下認(rèn)為對婚前性行為的接受程度與戶口情況無關(guān)。但是在10%的顯著性水平下,我們會發(fā)現(xiàn)非農(nóng)戶口相比農(nóng)業(yè)戶口更接受婚前性行為。

*logistic多因素回歸分析結(jié)果

通過上一步的logistic單因素分析我們剔除掉了宗教、民族、戶口情況等三個變量。我們將剩余變量年齡、教育程度、收入、健康狀況、父親學(xué)歷、母親學(xué)歷、性別、工作狀態(tài)、婚姻狀況和生活方式進(jìn)行l(wèi)ogistics多因素回歸。以納入標(biāo)準(zhǔn)為P<0.05,剔除標(biāo)準(zhǔn)為P>0.10的多因素logistic回歸,最終對婚前性行為接受程度的影響因素納入了性別、年齡、收入、生活方式、婚姻狀況以及母親學(xué)歷。

由表1中多元logistic回歸分析結(jié)果可以發(fā)現(xiàn),對婚前性行為接受程度大小受年齡、收入、性別、生活方式、婚姻狀況以及母親學(xué)歷影響。從結(jié)果中,我們可以看出以下結(jié)論:

(1)年齡方面,系數(shù)為-0.033,表明結(jié)果年齡越大對婚前性行為接受程度越低,p值接近0.00,該系數(shù)顯著??赡艿脑蚴?,年齡越大的人所接受的觀念越為保守,往往比較抗拒婚前性行為,而年輕一代生長在一個開放的年代,接受著多元化的信息,思想也更開放。綜其兩者,年齡越大者對婚前性行為接受的程度越低。

(2)收入方面,系數(shù)為0.043,表明收入越高對婚前性行為接受程度越高,p值接近0.00,該系數(shù)顯著??赡苁且?yàn)槭杖朐礁叩娜巳?,常是見多識廣文化程度較高的,往往有較為成熟的性觀念,認(rèn)為婚前性行為不是一件重要到需要討論的事情,從而對婚前性行為接受程度較高。

(3)性別方面,以女性為對照組,男性系數(shù)為0.387,表明男性比女性對婚前性行為接受程度更高,p值接近0.00,該系數(shù)顯著。由于東方女性較為含蓄的性格,以及許多家庭教育里對女生的安全教育更為嚴(yán)格,這可能是使得女性對婚前性行為接受程度比男性低的原因。

(4)生活方式方面,以互聯(lián)網(wǎng)為對照組,電視系數(shù)為-0.519,表明以互聯(lián)網(wǎng)為主要生活方式的人比以電視為主要生活方式的人對婚前性行為接受程度更高,p值接近0.00,該系數(shù)顯著。在我國,電視比較少涉及有關(guān)性知識的話題,即使是涉及到有關(guān)的話題,也是相對片面或是傳統(tǒng)的,而通過互聯(lián)網(wǎng)可以搜索到更多更全面的性知識形成更為成熟的性觀念,這在一定程度上使得以互聯(lián)網(wǎng)為主要生活方式的人比以電視為主要生活方式的人更能接受婚前性行為。

(5)婚姻狀況方面,以未婚為對照組,已婚系數(shù)為-0.251,表明未婚的人群比已婚人群對婚前性行為接受程度更高,p值為0.033,該系數(shù)在5%的顯著性水平下顯著。已婚的人會有較為成熟的觀念,相比之下更保守。而不少未婚的人還沒意識到后果的嚴(yán)重性,而是抱著新鮮感。

(6)母親學(xué)歷方面,系數(shù)為0.18,表明母親學(xué)歷越高,其對婚前性行為接受程度越高,p值為0.002,該系數(shù)顯著。母親的教育對孩子的認(rèn)知觀起到一個塑造的作用。學(xué)歷越高的母親對性的認(rèn)識越為全面,越能向其子女傳遞全面的性觀念,這就使得其子女對婚前性行為接受度較高。

3 模型評價(jià)與改進(jìn)

3.1 模型優(yōu)點(diǎn)

(1)本文在數(shù)據(jù)處理這塊考慮得比較周全,在比較了kNN和隨機(jī)森林的插補(bǔ)誤差后再選擇插補(bǔ)方法。在經(jīng)過數(shù)據(jù)預(yù)處理后,通過卡方檢驗(yàn)確保變量之間拒絕獨(dú)立性后才開始進(jìn)一步的建模分析。

(2)本文綜合隨機(jī)森林模型和單因素logistics回歸分析的結(jié)果,共同認(rèn)為可以剔除民族、宗教和戶口情況這三個變量,相互驗(yàn)證之下更具有說服力。

3.2 模型缺點(diǎn)及改進(jìn)

(1)本文直接主要探討對婚前性行為接受程度的影響因素,可能具體到某個重要變量下不同群體的最重要因素會有差異。

(2)本文采用的數(shù)據(jù)中,民族、宗教等分類變量的部分類別占比嚴(yán)重失衡,這可能是導(dǎo)致稀少類變量被剔除的部分原因。改進(jìn)的辦法可能是尋找更大的數(shù)據(jù)庫或者有更好的數(shù)據(jù)處理方法。

[1]朱安新.臺灣地區(qū)“90后”大學(xué)生異性交往觀念——以婚前性行為接受度為分析重點(diǎn)[J].青年研究,2014,(06):11-19+91.

[2]任偉偉.非婚性行為的亞文化分析[J].中國性科學(xué),2010,(01):36-39.

1004-7026(2017)16-0029-03

D669

A

10.16675/j.cnki.cn14-1065/f.2017.16.020

劉 彬(1995-),男,漢族,廣東省五華縣人,華南師范大學(xué)數(shù)學(xué)科學(xué)學(xué)院,2014級本科生,研究方向:金融數(shù)學(xué)。

吳培莎(1995-),女,漢族,廣東省汕頭人,華南師范大學(xué)數(shù)學(xué)科學(xué)學(xué)院,2014級本科生,研究方向:金融數(shù)學(xué)。

鄧心怡(1996-),女,漢族,廣東省惠州人;華南師范大學(xué)數(shù)學(xué)科學(xué)學(xué)院,2014級本科生,研究方向:金融數(shù)學(xué)。

猜你喜歡
接受程度性行為戶口
昆明市不同性角色MSM的性行為特征分析
給失管無名道路上“戶口”
關(guān)于公眾保肝護(hù)肝中藥認(rèn)識和接受程度的調(diào)查
我國15省大學(xué)生首次性行為發(fā)生年齡及影響因素
戶口
八類“黑戶”可登記戶口
淺析民族音樂在小學(xué)音樂中的教育作用
梁方程解的爆破及漸近性行為
航天項(xiàng)目風(fēng)險(xiǎn)管理——預(yù)先識別與控制風(fēng)險(xiǎn)到可接受程度
PICC置管患者居家護(hù)理接受程度調(diào)查及影響因素分析