楊 喆,林 芬,黃 斌,楊立業(yè)
(1.汕頭大學(xué)醫(yī)學(xué)院,廣東 汕頭 515000;2.南方醫(yī)科大學(xué)附屬潮州中心醫(yī)院,廣東 潮州 521000)
α地中海貧血(α地貧)是因珠蛋白基因突變或缺失使α珠蛋白鏈生成減少或缺如引起的一種遺傳性疾病。據(jù)世界衛(wèi)生組織報道全球約超過20%的人口以某種形式攜帶α地貧基因[1]。α地貧在分子水平上具異質(zhì)性,基因型具種族特征和地域差異,現(xiàn)就全球不同地區(qū)、種族間的α地貧基因型及分布特征給予綜述。
廣東及廣西α地貧發(fā)生率分別為15.35%及8.53%,福建、江蘇、貴州和四川1.5%~3.3%,海南黎族高達(dá)61.44%[2]。北方省市報道較少,隨著人口流動地貧有向北方擴散趨勢。--SEA、-α3.7、-α4.2、αCSα及αQSα這5種基因型約占我國人群突變的90%。關(guān)于中國南方地區(qū)常見的α地貧基因型眾多報道中,最常見α地貧缺失類型是--SEA,其次為-α4.2和-α3.7;常見的突變類型是αCSα和αQSα[2]。中國南方血紅蛋白H病基因型中,約76%為--SEA/-α3.7和--SEA/-α4.2,約24%為--SEA/αCSα和--SEA/αQSα[3]。深入探究華南人群α地貧,--THAI、HKαα、-α2.8、-α27.6、2種三聯(lián)體(αααanti3.7和αααanti4.2)以及4種變異型α地貧[CD74 GAC>CAC(Hb Q-Thailand)、CD30(-GAG)、CD31AGG>AAG和CD118(+TCA)]等罕見基因型可存在于該人群中,--THAI和HKαα在華南人群中出現(xiàn)頻率較高,尤其是HKαα[4]。華北代表城市之一北京,α地貧基因型及其頻率由高至低為--SEA、-α3.7、-α4.2、αCSα及αQSα,歸因于外來人口尤其來自地貧高發(fā)區(qū)域人群涌入[5]。
α地貧是印度最常見的血紅蛋白病,溫和的基因遺傳形式?jīng)Q定了α地貧在印度占主導(dǎo)地位但并不造成嚴(yán)重遺傳風(fēng)險。系統(tǒng)的印度α地貧基因型分析數(shù)據(jù)稀少,僅有散發(fā)的臨床嚴(yán)重程度各異的血紅蛋白H病病例報告,未見關(guān)于胎兒水腫綜合征相關(guān)報道[6]。印度α地貧流行率11%~71%[7]。Nadkarni等[6]對印度人不同種族α地貧分布進行大規(guī)模的調(diào)查,α地貧總患病率以古吉拉特邦最低5.0%,旁遮普邦最高26.3%,其他種族包括加拿達(dá)族、拉賈斯坦邦、中央邦等波動于7.2%~16.8%之間,α基因三倍體的患病率1%~5%。印度東部包括撒哈拉、古達(dá)、龔德人在內(nèi)的5個部落群體的α地貧患病率為50.84%,-α3.7和-α4.2等位基因頻率分別為0.33和0.04[8]。印度中央邦的表列種姓及表列部落的α地貧患病率懸殊,分別為9.0%和77.9%[9]。印度α地貧基因型中,-α3.7、-α4.2普遍存在于各部落人群中,αKoyaDoraα、αIVSI-117α、αPA3(AATA--)α、αcsα則零星分布[6]。
馬來西亞是多種族人群混合國家,馬來人和原住民約占67.4%,華裔、印裔及其他種族分別占總?cè)丝诒壤秊?4.6%、7.3%及0.7%。α地貧在馬來西亞這個多元化國家中普遍存在,基因型包括--SEA、--FIL、--THAI、-α3.7、-α4.2、αQSα、αCSα及αAdanaα;沙巴州人、馬來人、原住民及印裔-α3.7發(fā)病率最高,分別為29%、13.4%、13.5%及10.5%[10];--SEA最常見,-α3.7次之,華裔鼻祖多為中國華南地區(qū)移民,基因分布特征跟中國華南地區(qū)α地貧流行病學(xué)報道吻合[2,10]。馬來西亞東部州的砂拉越州人和沙巴州人的--FIL發(fā)病率矚目,高達(dá)12.2%和0.76%,--FIL在全球最常見于菲律賓人群,馬來西亞東部州在地理位置上與菲律賓隔海相鄰,--FIL在東部州的高發(fā)病率源于鄰國間的基因流動。除砂拉越州人和印裔外的各種族中,αCSα為最常見的突變基因,其中以阿利斯土著居民的發(fā)病率最高[10]。
泰國北部α地貧發(fā)病率高達(dá)15%~40%,三大語系及分支族裔間相差甚遠(yuǎn)。漢藏語系人缺失型α地貧的基因頻率最高,-α3.7作為唯一一種α地貧缺失型存在于漢藏語系人中,其分支族系Skaw Karen、Pwo Karen及Padong Karen中-α3.7分布規(guī)律相似,推測這三大族系起源相同,遺傳背景相似;突變基因αCSα僅在壯侗語族中發(fā)現(xiàn),--SEA在壯侗語族中基因頻率最高,壯侗語族鼻祖為我國西南喬遷居民[11-12];壯侗語族中Lue族人呈現(xiàn)-α3.7、-α4.2、--SEA及αCSα多種α貧血基因位點,該族的基因多態(tài)性歸因于跨種族間聯(lián)姻及老撾移徙期間的建立者效應(yīng)[11]。Kulaphisit等[11,13]對南亞語系人α地貧基因分布規(guī)律報道一致,南亞語系人的分支族系Lawa族人均未被發(fā)現(xiàn)攜帶α地貧基因,-α3.7作為唯一一個α珠蛋白基因存在于分支族系Palaung中,與其世代推崇族內(nèi)通婚有關(guān),這一風(fēng)俗使得α珠蛋白的其他異?;虻囊敫怕蕰?,保留族內(nèi)純粹血統(tǒng)。--THAI在泰國發(fā)病率僅0.18%,在泰國北部和東北部發(fā)病率較高;鄰國間的移民聯(lián)姻,菲律賓和馬來西亞人中高攜帶率的--FIL在泰國人中也可覓及,故--FIL在未來也需列入該國α地貧血基因常規(guī)檢查項目[14]。
伊朗地處“地中海貧血帶”[15],伊朗北部常見的α地貧基因型及發(fā)生率為-α3.7(45.6%)、αpolyA2α(15.27%)、--MED(6.86%)、-α4.2(6.17%)、αCSα(4.62%)及-α5nt(3.70%);-α3.7及-α4.2這兩個缺失基因在伊朗北部的分布呈有趣規(guī)律,發(fā)病率由東至西呈遞減趨勢,溯源可能是-α3.7及-α4.2這兩個缺失基因是從東部的霍拉桑和戈勒斯坦,遷徙到偏西的馬贊達(dá)蘭和吉蘭省。α3.7可見3種不同單倍體(為單倍體1、2和5),可見-α3.7基因位點在伊朗北的歷史源遠(yuǎn)流長,αpolyA2α在伊朗北部馬贊達(dá)蘭發(fā)病率均高于全球多數(shù)存在αpolyA2α基因位點的區(qū)域,證實了αpolyA2α基因在伊朗北部的創(chuàng)立者效應(yīng)[16]。伊朗南部常見α地貧基因型及發(fā)生率為-α3.7(43.84%)、- α5nt(4.91%)、αCSα(2.78%)、αpolyA2α(2.45%)、αcodon19α(2.33%)、- α4.2(2.32%),αpolyA1α(1.77%)、--MED(1.26%),其他基因型(-α20.5、TRIPELEa、codon14、αHbIcaria及codon16)的發(fā)生率較低[17]??坡∧芊从骋晾手胁康摩恋刎殸顩r,-α3.7為該區(qū)域α珠蛋白最常見的基因位點(83.8%),繼而為αcodon19α(5.7%)、-α5nt(4.2%)、-α4.2(3.7%)[18]。
在中東及地中海區(qū)域國家中沙特阿拉伯的α地貧基因攜帶率居首,高達(dá)50%,既往報道中-α3.7及αpolyA1α為最常見基因位點[19];2017年更新了阿拉伯東部α地貧基因分布狀況,-α3.7最常見(43.5%),αHphI次之(24.3%),-α4.2、αpolyA1α、-α20.5、--FIL及--MED非普遍分布,該區(qū)域出現(xiàn)新的α地貧基因型為α1α2/α1α2HphI、α1α2HphI/α1α2HphI、α1α2/α1α2HbHandsworth、- α3.7α2HphI/α1α2HphI、- α3.7α2/- α3.7α2HbVilliersleBel和--MED/α1α2HphI[20]。阿聯(lián)酋新生兒α地貧發(fā)病率高達(dá)49%,基因位點接近阿拉伯,中間型地貧及胎兒水腫綜合征逐年劇增,-α3.7/αpolyA1α、αpolyA1α/αpolyA1α及-α3.7/α-5ntα為中間型地貧的主要基因型[21-22]。
近期學(xué)者闡述阿曼人群中除中東常見基因型外,還發(fā)現(xiàn) αααanti3.7、-α21ntdup、-α3.7(-5C>T)及-α3.7+46(C>A)罕見基因型[17,23]。伊拉克東北部α地貧基因模式跟伊朗西部、土耳其及希臘更為貼近,某種程度上跟阿拉伯觀察到的模式迥然不同。在阿拉伯半島、伊朗等非廣泛分布的--MED及-α20.5在伊拉克東北部庫爾德人中的基因頻率更高,分別在阿拉伯及伊朗人普遍存在的突變基因αpolyA1α及αpolyA2α在該人群中卻無顯著基因優(yōu)勢,在伊拉克北部杜胡克省還發(fā)現(xiàn)罕見突變基因αEvanstonα/αα[24-25]。
中東大部分國家在地理位置上聚攏成一體,軍事動蕩及經(jīng)商貿(mào)易等因素使國家間交流密切,各國間α地貧基因譜相仿又存異,如阿曼α地貧基因模式分布與阿拉伯相似,阿拉伯游牧人口流動、兩國間貿(mào)易活躍及阿曼曾是葡萄牙殖民地的歷史背景等因素對兩國相似的基因模式貢獻很大[23];再如阿聯(lián)酋α地貧高發(fā)且持續(xù)上漲原因與阿聯(lián)酋為代表的中東國家近親聯(lián)姻風(fēng)俗密切相關(guān)[26]。
地中海東部黎巴嫩、以色列、塞浦路斯及土耳其等西亞國家為地貧基因活躍區(qū)域;地中海沿岸希臘、意大利、法國及西班牙等南歐國家與西亞銜接,但更接近瘧疾肆虐的非洲,兩地區(qū)間人口流動頻繁,理論上講血紅蛋白病會高于北歐和西歐,但50年來人口頻繁遷移及遷徙人群年輕化等因素改變了北歐及西歐血紅蛋白疾病的非廣泛流行原狀,至2008年累計統(tǒng)計顯示北歐、南歐及西歐的血紅蛋白疾病發(fā)病頻率基本相當(dāng)。與鐮刀狀貧血相比較,地貧對歐洲的沖擊會相對緩和,但影響也不容小覷[27]。
黎巴嫩是由背景異質(zhì)的族群組成的國度,族群間婚配罕見,伊斯蘭教信徒α地貧基因攜帶率(約9.6%)為基督教徒的2倍以上[28]。黎巴嫩α地貧基因及頻率為-α3.7(43%)、-α-5nt(37%)、--MED(14%)、αpolyA1α(3%)及αpolyA2α(2%),未檢測到-α20.5和-α4.2[29]。
土耳其最常見的3種α地貧基因缺失型是-α3.7、-α20.5及--MED,-α3.7在伊斯坦布爾、愛琴海、哈塔伊、伊斯帕爾塔及阿達(dá)納的基因頻率為5.5%~52.2%,--MED基因頻率在伊斯帕爾塔頻率位居上述五地區(qū)之首(27.7%)[30]。-α20.5基因頻率在土耳其庫庫洛瓦最高(22%),位列土耳其各城市之首,在全球范圍內(nèi)超過伊朗(1.8%~4.8%)、希臘(12.1%)和荷蘭(0.9%)等地[31]。土耳其較常見的α地貧基因型還包括α-5nt、αpolyA1α、αpolyA2α、-α4.2及αααanti3.7等[30-31]。中間型地貧常見基因型為-α3.7/-α20.5、-α3.7/--MEDII及-α3.7/--MEDI[32]。
塞浦路斯是地中海東部的一個島嶼,α地貧基因攜帶率高達(dá)20%[33]。Kountouris等[34]研究了20年來塞浦路斯的α地貧狀況,首次報道了αHbIcaria和 αHBStanleyville-II,α地貧基因頻率由高至低依次為-α3.7、--MEDI、-αIVSI(-5nt)、αPolyA2α、- α20.5、αααanti3.7、αPolyA1α; Hb Agrinio、Hb Setif及 CD 108(-C)等罕見基因在塞浦路斯人群中也可發(fā)現(xiàn)。
2008年調(diào)查顯示地中海沿岸歐洲國家居民α地貧基因攜帶率由高至低為法國(4.55%)、希臘(1.11%)、西班牙(0.51%)及意大利(0.39%)[27]。有史以來地貧未被公認(rèn)為意大利的地方病,翁布里亞為意大利中部代表區(qū)域,β地貧血人數(shù)有逐增趨勢,但α地貧發(fā)病率在意大利中部維持相對穩(wěn)定狀態(tài),58.0%的患者為意大利血統(tǒng),外來移民對α珠蛋白基因的遺傳背景并沒有產(chǎn)生廣泛影響[35]。意大利撒丁島α地貧發(fā)病率可高達(dá)38%,喬遷旅行等微弱改變了該區(qū)域的基因譜,-α3.7、--MEDI、αHphI、α1NcoI、α2NcoI占α地貧等位基因的89%,零星發(fā)現(xiàn)-α4.2、-α20.5、--SEA、--CAL等,αααanti3.7在意大利撒丁島較常見[36]。
移民對英國人群α地貧模式的影響更為深遠(yuǎn),英國α地貧基因譜幾乎囊括了全球常見基因型,可檢測出10種缺失和30種非缺失α地貧基因型,龐大的突變基因譜占全球已知α地貧類型的46%,--BRIT為英國人獨特的基因型[37]。英國的嶄新地貧基因位點層出不窮,如IVS-I-1,G4C、codon104、codon108 等[38]; --DUTCHI、--DUTCHII、αSacIIα、αHbGoudaα為荷蘭的特色基因位點[39]。
非洲α地貧等珠蛋白基因疾病的存在,是為了在某種程度上對抗惡性瘧疾的蹂躪[40]。非洲α地貧基因在地理位置分布上有兩個有趣的梯度,一個梯度為北非到赤道非洲,另一個梯度為赤道非洲至南非。赤道非洲頻率最高,至北非、南非遞減,如位于赤道非洲的剛果,-α3.7基因頻率為0.41,高于肯尼亞0.26,至北非突尼斯0.06,非洲南部納米比亞0.06~0.11。北非及南非氣候干旱,赤道非洲潮濕,瘧疾更容易在蚊蟲滋生的潮濕環(huán)境蔓延,使得α地貧呈梯度分布[41]。
馬格里布(摩洛哥、阿爾及利亞及突尼斯的代稱)是撒哈拉以南非洲、阿拉伯國家和歐洲之間的十字路口,是歷史、社會、經(jīng)濟及文化的活躍地帶,可謂混合人種的“大熔爐”,此外惡性瘧疾在瘧疾高發(fā)區(qū)的平衡選擇及該區(qū)域推崇的內(nèi)婚制更進一步增加了α珠蛋白基因頻率。北非突尼斯α地貧攜帶率為4.8%~5.48%,阿爾及利亞為9.0%,摩洛哥為2.2%[42]。突尼斯人群有6個α珠蛋白基因缺陷與α地貧有關(guān):-α3.7(1.13%)、αHphI(0.47%)、--MED(0.2%)、αt-Saudi(0.94%)、αcd23GAG→Stop(0.1%)、Hb Groene Hart:α119 CCT→TCT(0.1%)。--MED/-α3.7、αT-Saudiα/αT-Saudiα及αHphIα/--MED和突尼斯血紅蛋白H病有關(guān),胎兒水腫綜合征以突尼斯中部及東北部受累最重,發(fā)病率可達(dá)7.38%[43]。鄰國阿爾及利亞可見突尼斯人群中未發(fā)現(xiàn)的αNcoI和-α20.5基因[44]。-α3.7在南非東北部城市約翰內(nèi)斯堡廣泛分布,-α4.2的發(fā)生率較北非突尼斯及阿爾及利亞高,偶發(fā)--SEA、--MED、-α20.5[45]。于非洲零星報道的基因型還有-α3.7initGTG、-α3.7init(-2bp)、-α3.7Cd14T>G、αSealRockα[40]。
北美地區(qū)地貧趨勢逐漸變化,來自地中海區(qū)域的地貧病人出生率下降而生存率升高,來自希臘和意大利等國家的地貧人口老齡化,取而代之的是來自亞洲中東的年輕人口,加州和安大略省為北美地貧高發(fā)區(qū)[46]。安大略省是加拿大最多種族聚集省份,約1/4人口為血紅蛋白病高危人群,約100萬移民來自中國南方及東南亞等地貧高發(fā)地區(qū),其中-α3.7、--SEA、--FIL、-α4.2及--MEDI比例分別為55.64%、26.25%、5.39%、3.74%及0.58%,常見基因突變?yōu)棣?5nt(1.94%)和αCSα(0.92%)[47]。過去50年間美國移民比例由1960年5.4%激增至2010年的近13%,作為地貧高危人群的非裔及亞裔美國人在移民中所占比例不容小覷,拉丁美洲及亞洲移民占80%左右[48]。在美國加州α地貧是最常見的非鐮刀狀貧血,中間型α地貧占80%以上。加州新生兒血紅蛋白H病基因篩查中常見的基因型為-α3.7/--SEA、-α3.7/--FIL、αCSα/--SEA、-α4.2/--SEA[49]。一股覆蓋多種族的地貧新生力量在北美洲涌動,“地貧已不再是地中海區(qū)域貧血”的說法故得以流傳[46]。
墨西哥是民族大熔爐,印歐混血兒和印第安人占總?cè)丝?0%以上[50],-α3.7、--SEA、--FIL、-α5nt在混血兒中可檢測得到,也可見αααanti3.7,還有2個稀有缺失基因--Mex1和--Mex2,--Mex1為西班牙人α地貧基因,可能跟西班牙征戰(zhàn)墨西哥時期的基因流動有關(guān)[51]。墨西哥人血紅蛋白H病于1977年首次報道,后續(xù)確定了墨西哥人血紅蛋白H病基因型為-α3.7/--SEA和αHphα/--FIL[52]。巴西人基因庫為歐洲、非洲及美洲印第安人的混合模式,Zago等[53]早在1995年確認(rèn)美洲印第安人中無血紅蛋白疾病基因,至今尚無更新,印度安人部分部落可發(fā)現(xiàn)-α3.7三倍體,與東南亞和太平洋島嶼該基因分布特點有相似之處,說明兩者間具相當(dāng)高的遺傳親緣關(guān)系,但缺乏太平洋島民中一貫存在的α珠蛋白基因簇的典型特征,推測是古代共同祖先的結(jié)果。巴西亞馬遜地區(qū)人群可發(fā)現(xiàn)-α3.7基因,此基因推測為亞馬遜地區(qū)在葡萄牙殖民和非洲奴隸時期的外來基因[54]。
α地貧在分子水平上具有明顯的地域性和種族特異性,與眾多影響因素有關(guān),其中瘧疾選擇學(xué)說流傳廣泛,瘧疾對人類的自然選擇,即瘧疾抗性造成的選擇優(yōu)勢使珠蛋白缺陷基因在群體中保持一定頻率,至今瘧疾對細(xì)胞保護作用機制缺乏完整闡述,且在學(xué)術(shù)界尚存爭鳴;此外人群淵源、遷徙、遺傳漂變、近親婚配、突變和隔離等因素協(xié)同作用使α地貧更加多樣化[55]。人類起源進化過程歷史悠久,地貧基因規(guī)模宏大,未來多角度研究不同地區(qū)α地貧基因分布特征可以更深入地了解人類歷史演變。