張 浩,張 娟,劉 磊,鄭為民,芮 萍
(1. 中國科學院上海天文臺,上海 200030;2. 中國科學院大學,北京 100049;3. 中國科學院射電天文重點實驗室,江蘇 南京 210008; 4. 上海市導航定位重點實驗室,上海 200030)
甚長基線干涉測量技術(shù)是目前角分辨率最高的天文觀測技術(shù),在天文觀測、大地測量和深空探測等領(lǐng)域得到了廣泛的應用[1],其分辨率取決于天線的口徑和兩天線之間的基線長度。隨著甚長基線干涉測量科學研究與火星探測等工程任務的推進,對空間分辨率提出了越來越高的要求。為進一步提高甚長基線干涉測量網(wǎng)的空間分辨率,需要增加基線長度。受地球尺度的限制,地面VLBI基線長度無法超過地球直徑,因此,對空間甚長基線干涉測量(Space Very Long Baseline Interferometry, SVLBI)技術(shù)的研究變得越來越迫切。
早在20世紀80年代初,歐洲空間局和美國國家航空航天局聯(lián)合提出QUASAT(QUASARSATELLITE)計劃的立項建議,計劃在太空放置一個15 m口徑的天線,并在預研階段就空間甚長基線干涉測量的技術(shù)要求、觀測性能、數(shù)據(jù)分析成圖能力及預期科學目標等做了廣泛研究,為后來的空間甚長基線干涉測量發(fā)展提供了經(jīng)驗[2]。隨后1986~1988年間,美國國家航空航天局利用TDRSS(Tracking Data and Relay Satellite System)測控中繼衛(wèi)星上的4.9 m天線和地面上的兩個64 m射電望遠鏡對一批致密河外射電源在2.3 GHz和15 GHz頻率進行了3次甚長基線干涉測量,大部分源檢測到干涉條紋,證實了空間甚長基線干涉測量技術(shù)的可行性[2]。在此期間,前蘇聯(lián)提出RadioAstron計劃,受到蘇聯(lián)解體的影響,該項目曾中斷執(zhí)行,后于2010年恢復并正式進行空間甚長基線干涉測量發(fā)射及觀測任務。日本也于1997年2月提出HALCA(Highly Advanced Laboratory for Communications and Astronomy)空間干涉測量計劃,首次提供了空間甚長基線干涉測量多望遠鏡成圖觀測條件,旨在實現(xiàn)活動星系核和射電源的高分辨率成圖[2]。
目前只有日本和俄羅斯完成了正式的空間甚長基線干涉測量項目。上海天文臺正在推進我國空間甚長基線干涉測量發(fā)展,其中 “空間低頻射電天文臺” 項目,計劃發(fā)射兩個大口徑低頻射電望遠鏡至近地空間,形成地-空、空-空干涉能力。地月甚長基線干涉測量計劃也在推進中。由于空間與地面環(huán)境的巨大差異,空間甚長基線干涉測量研究存在一些亟待解決的問題,比如,怎樣保持空間射電望遠鏡和地面跟蹤站之間穩(wěn)定的信號鏈接,如何建立實用有效的空間甚長基線干涉測量時延模型等。本文主要討論空間甚長基線干涉測量數(shù)據(jù)終端記錄格式的問題,通過對RadioAstron原始觀測數(shù)據(jù)開展研究,解析其數(shù)據(jù)記錄格式,完成數(shù)據(jù)解碼,使之能夠與地面觀測數(shù)據(jù)進行相關(guān)處理。現(xiàn)階段,國際上使用的地基甚長基線干涉測量格式有很多種,而空間甚長基線干涉測量格式(如RDF)只有日本和俄羅斯在使用。
Mark5B數(shù)據(jù)格式是美國麻省理工學院Haystack天文臺設計的數(shù)據(jù)終端記錄格式,采用硬盤存儲數(shù)據(jù),存儲成本低,便于通過互聯(lián)網(wǎng)傳輸,并促進了e-VLBI技術(shù)的發(fā)展。Mark5B格式嚴格遵守VSI-H(The VLBI Standard Interface Hardware Interface Specification)規(guī)范,能夠兼容所有采用VSI接口的數(shù)據(jù)記錄格式,有效降低了數(shù)據(jù)記錄硬件設施更新的頻率[3]。Mark5B格式數(shù)據(jù)分為多個磁盤幀,每幀由固定大小的幀頭和緊隨其后的數(shù)據(jù)塊組成,幀頭包含同步字、循環(huán)冗余校驗碼(Cyclic Redundancy Check, CRC)、秒內(nèi)幀號和起始協(xié)調(diào)世界時等信息,能夠有效保證數(shù)據(jù)的安全性[4]。由于存在丟幀、亂幀的現(xiàn)象,為監(jiān)測數(shù)據(jù)的質(zhì)量,Mark5B需要每秒統(tǒng)計一次數(shù)據(jù)有效率,作為數(shù)據(jù)可靠性和網(wǎng)絡診斷的參考[4]。中國甚長基線干涉測量網(wǎng)的5個臺站均使用上海天文臺自行研制的中國數(shù)據(jù)獲取系統(tǒng)(ChinaData Acquirement System, CDAS)[5]。CDAS采用Mark5B格式記錄原始觀測數(shù)據(jù),已成功完成了中國探月工程任務。
VDIF(VLBI Data Interchange Format)是一種新的標準化數(shù)據(jù)交換格式,支持實時和準實時e-VLBI以及磁盤文件存儲[6]。VDIF格式基于自適應長度的數(shù)據(jù)幀制定,幀頭攜帶幀起始時間、幀長和線程號等關(guān)鍵信息,數(shù)據(jù)幀長度由幀頭中的幀長指定,用戶可以自由設定數(shù)據(jù)幀長度,以最佳地匹配所選擇的數(shù)據(jù)傳輸協(xié)議[6]。例如,在實時網(wǎng)絡傳輸情況下,適當選擇數(shù)據(jù)幀的長度使得每個線上數(shù)據(jù)包只攜帶一個數(shù)據(jù)幀。另外,VDIF還支持多線程。同一頻率通道的時間序列數(shù)據(jù)幀存儲在同一線程,不同頻率通道的數(shù)據(jù)存儲在多個并行的數(shù)據(jù)線程。對于通過串行網(wǎng)絡的數(shù)據(jù)傳輸,多個并行的數(shù)據(jù)線程合并為單個串行的數(shù)據(jù)流[6]。很明顯,VDIF的優(yōu)勢在于數(shù)據(jù)網(wǎng)絡交換和數(shù)據(jù)兼容性,但目前支持VDIF格式的設備不多,應用受到限制。
俄羅斯空間甚長基線干涉測量項目RadioAstron采用RDF格式用于地面數(shù)據(jù)采集。由于RadioAstron沒有搭載大容量存儲設備,采集的空間甚長基線干涉測量數(shù)據(jù)必須實時發(fā)送至地面。實際上,空間射電望遠鏡數(shù)據(jù)采集包含空間天線和地面跟蹤站兩部分??臻g天線負責接收原始觀測信號,地面跟蹤站負責鎖定空間天線的下行信號,實時采集空間天線發(fā)送的數(shù)據(jù)并以RDF格式記錄。
VSOP和RadioAstron的空間甚長基線干涉測量射電望遠鏡系統(tǒng),采用了不同于常規(guī)地面站的結(jié)構(gòu)(圖1)。為實現(xiàn)對空間天線橢圓軌道的全天候?qū)崟r跟蹤,必須在全球建立多個地面跟蹤站。地面跟蹤站的主要作用之一是為空間望遠鏡提供一個穩(wěn)定的頻率參考[7],確保精準控制空間天線的采樣率。此外,由于空間天線時間頻率系統(tǒng)的不穩(wěn)定性,為了確保數(shù)據(jù)接收時刻的準確性,地面跟蹤站記錄空間甚長基線干涉測量數(shù)據(jù)到達跟蹤站的時刻,該時刻隨著數(shù)據(jù)字段的增長而增加,相關(guān)處理時由處理機根據(jù)計算的光行時(光行時等于空間天線與地面跟蹤站的距離除以光速)反算出每個數(shù)據(jù)字段在空間天線上對應的時刻。出于科學需求基礎上數(shù)據(jù)格式最簡的考慮,一個RDF文件只需要在起始的文件頭打上時間標簽,后續(xù)的數(shù)據(jù)接收時刻根據(jù)數(shù)據(jù)采樣率依次推算??盏財?shù)據(jù)傳輸不支持復雜的數(shù)據(jù)格式,因此RDF結(jié)構(gòu)簡單,在未來的空間甚長基線干涉測量項目中或?qū)⒗^續(xù)使用。
RDF格式是由空間射電望遠鏡RadioAstron采集數(shù)據(jù)并以特定頻率實時發(fā)送至地面,由地面跟蹤站記錄并輸出的一種基于磁盤存儲的數(shù)據(jù)格式。
地面跟蹤站會在一組文件中記錄時間連續(xù)的射電天文數(shù)據(jù),除了最后一個文件外,每個文件的數(shù)據(jù)長度約為15分鐘的數(shù)據(jù)量。一個文件記錄到指定的數(shù)據(jù)量后,系統(tǒng)會新建一個文件記錄其后的數(shù)據(jù),直至達到指定數(shù)據(jù)量后再建立新的文件,這樣周而復始,直到數(shù)據(jù)記錄終止。
文件命名按照 “測站名 + 協(xié)調(diào)世界時” 的格式,以文件記錄的第1個甚長基線干涉測量數(shù)據(jù)對應的協(xié)調(diào)世界時為準,這個時間一定是整數(shù)秒。具體形式如下:
“station_YYYYDDDHHMMSS.rdf”
其中,station為測站名;YYYY為公歷年號;DDD為觀測當天的年積日;HH, MM和SS分別為協(xié)調(diào)世界時對應的時、分、秒。
圖1 甚長基線干涉測量空間射電望遠鏡系統(tǒng)組成結(jié)構(gòu)示意圖[7]
Fig.1 Schematic diagram of the composition of the VLBI space radio telescope system[7]
RDF的文件結(jié)構(gòu)不像Mark5B那樣分成若干個等長的磁盤幀,每一幀用固定格式的幀頭作為標識,幀頭包含該幀的相關(guān)信息。與之不同的是,單個RDF格式文件只包含一個文件頭,其后的所有數(shù)據(jù)都是原始觀測數(shù)據(jù),如圖2。
圖2 RDF文件結(jié)構(gòu)示意圖
Fig.2 Schematic diagram of RDF file structure
RDF文件頭固定占用256字節(jié),原始數(shù)據(jù)從第257字節(jié)開始不間斷記錄,直到停止數(shù)據(jù)采樣。文件頭記錄了數(shù)據(jù)起始協(xié)調(diào)世界時、數(shù)據(jù)傳輸速率和接收模式等重要信息。結(jié)構(gòu)如圖3。
圖3 RDF文件頭格式
Fig.3 The structure of RDF header
圖3標記了頭文件每個數(shù)據(jù)項的起始字節(jié)號和占用空間的大小。文件類型是一個由4個ASCII字符組成的同步字,用來識別射電天文數(shù)據(jù)文件,這里必須為 “RDF1”。頭文件大小一定是256字節(jié),用二進制數(shù) “00000001 00000000” 表示。UTC表示數(shù)據(jù)開始記錄的日期和時間,以 “YYYY DDD-hh:mm:ss” 的形式存儲為ASCII字符串,固定占用18字節(jié)空間。數(shù)據(jù)率即數(shù)據(jù)傳輸速率,按2字節(jié)的ASCII字符串存儲,RadioAstron的數(shù)據(jù)率為16 MB/s,故存為 “16”。接收模式用一個字符表示,有I、Q、A、R 4種,RadioAstron采用R模式。數(shù)據(jù)源存儲為3字節(jié)字符串,地面望遠鏡記作DAS,空間望遠鏡記作DEC。字節(jié)63~160由相關(guān)處理機填入,相關(guān)處理機從VEX文件中獲取這些參數(shù),其中望遠鏡坐標由軌道數(shù)據(jù)計算得到。字節(jié)161~256劃分為16個通道,每個通道占用6字節(jié)空間,記錄該通道的頻率、邊帶和極化。
數(shù)據(jù)采集終端從接收機送來的中頻信號中選出需要觀測的頻率通道,然后經(jīng)過頻率變換至基頻信號,再經(jīng)過數(shù)字化采樣和編碼后記錄在磁盤上[8]。實際使用中常常需要同時選出多個頻率通道[8]。
數(shù)據(jù)塊中數(shù)據(jù)流的記錄格式是由通道數(shù)和量化方式?jīng)Q定的,每個通道對應一條比特流。Mark5B硬盤記錄器能夠記錄的比特流數(shù)量只能是1, 2, 4, 8, 16, 32共6種[9],圖4列出了通道數(shù)為8或16、量化方式為1 bit或2 bit時的數(shù)據(jù)單元記錄格式。
圖4 數(shù)據(jù)塊中數(shù)據(jù)單元的格式
Fig.4 The format of single unit in a block
以16通道、1 bit量化為例,數(shù)據(jù)塊部分的第0, 16, 32, 48, 64, 80, …, bit的數(shù)據(jù)是按照先后順序依次記錄的通道0中的比特流,第1, 17, 33, 49, 65, 81, …, bit的數(shù)據(jù)是通道1中的比特流,依此類推可以得到其他通道的比特流。圖4只是一個示意圖,實際上各通道并不是如此規(guī)律地排布,多比特量化模式下通道內(nèi)的比特位也不一定是相鄰的。通道的數(shù)目以及數(shù)據(jù)單元中的比特位的排布由地面跟蹤站給出的VEX文件指定。
圖5為VEX文件中跟蹤站指定比特位排布的字段樣例。圖6給出了4通道、2比特量化下比特位排布的示意圖。
圖5 VEX文件中的比特位排布規(guī)則
Fig.5 Bit arrangement rules in VEX files
數(shù)據(jù)解碼是進行相關(guān)處理之前的數(shù)據(jù)預處理過程,對于不同的數(shù)據(jù)格式,采用的解碼算法也不同。設計解碼算法的關(guān)鍵在于了解數(shù)據(jù)存儲結(jié)構(gòu)。通過國際空間甚長基線干涉測量合作項目獲取了部分RDF數(shù)據(jù)源文件,研究并針對RDF設計了實用可行的解碼算法。
圖6 數(shù)據(jù)單元比特位排布示意圖
Fig.6 Schematic diagram ofbits layout in a data unit
解碼算法具體流程如圖7。由于RDF只有一個文件頭,首先讀取文件頭,提取數(shù)據(jù)解碼最為關(guān)鍵的兩個信息:起始協(xié)調(diào)世界時和數(shù)據(jù)率,再根據(jù)數(shù)據(jù)率計算每秒的數(shù)據(jù)量T,然后從數(shù)據(jù)塊中循環(huán)讀取數(shù)據(jù)量大小為T的數(shù)據(jù)到新建的以整秒?yún)f(xié)調(diào)世界時命名的文件當中,直至數(shù)據(jù)讀取完畢。
圖7 RDF文件數(shù)據(jù)解碼流程圖
Fig.7 Data-decoding flowchart of RDF file
通過對解碼后數(shù)據(jù)的相關(guān)處理,可以驗證上述解碼過程的正確性。采用的RDF數(shù)據(jù)來自2014年俄羅斯空間甚長基線干涉測量網(wǎng)對河外射電源0823 + 033的一次觀測試驗。參與此次觀測的望遠鏡除了RadioAstron之外,還有美國的Arecibo和荷蘭的Westerbork兩個地面射電望遠鏡,其中Arecibo數(shù)據(jù)記錄格式為Mark5A,Westerbork數(shù)據(jù)記錄格式為Mark5B。在上海天文臺甚長基線干涉測量中心進行相關(guān)處理之前,每個觀測臺站的數(shù)據(jù)都需經(jīng)過解碼,轉(zhuǎn)換為特定格式的預處理輸入數(shù)據(jù)。經(jīng)自行研制的軟件相關(guān)處理機SCORR處理后,成功獲得了清晰的干涉條紋(圖8)。
圖8 空間甚長基線干涉測量數(shù)據(jù)相關(guān)處理干涉條紋
Fig.8 Fringes after correlation-processing with space-VLBI data
圖8給出了空間甚長基線干涉測量數(shù)據(jù)相關(guān)處理結(jié)果,其中紅色表示相位譜,藍色表示幅度譜。Ar-Ra基線存在明顯的干涉條紋(Ar表示Arecibo, Ra表示RadioAstron)。結(jié)果說明參與相關(guān)處理的經(jīng)解碼得到的預處理數(shù)據(jù)是有效的,驗證了RDF格式數(shù)據(jù)解碼的正確性。Wb-Ra基線信噪比較低,可能的原因是兩望遠鏡口徑相對較小(Westerbork是由14個25 m網(wǎng)狀天線組成的綜合孔徑射電望遠鏡,等效口徑為66 m,綜合靈敏度沒有Arecibo高,空間射電望遠鏡RadioAstron口徑10 m),加之基線很長(約200 000 km),導致條紋較弱。Arecibo口徑相對較大(300 m),條紋較清晰。
經(jīng)計算,Wb-Ar基線條紋的信噪比為654.32,Wb-Ra基線條紋的信噪比為10.27,Ar-Ra基線條紋的信噪比為102.22。采用的信噪比計算方法與HOPS(1)https://www.haystack.mit.edu/tech/vlbi/hops.html(Haystack Observatory Postprocessing System)一致(見(1)式)。
(1)
其中,Amp為積分周期和通道內(nèi)所有頻點相加后求得的幅值(去除第1個頻點的直流分量);B為通道帶寬;Tap為單位積分周期;nlags為每通道的頻率點數(shù);nap為所有積分周期和通道的權(quán)值總和。權(quán)值從相關(guān)處理機的輸出文件中讀取。
表1列出了常用地面和空間甚長基線干涉測量使用的VDIF,Mark5B和RDF 3種數(shù)據(jù)格式的簡要特點。
RDF格式由于只有一個文件頭的額外數(shù)據(jù)記錄,其余的記錄都是原始甚長基線干涉測量數(shù)據(jù),相較而言RDF具有更高的記錄效率。為保證數(shù)據(jù)記錄的可靠性,RadioAstron項目采用了一個額外的解碼器,當解碼器檢測到數(shù)據(jù)丟失或者發(fā)生偏移,解碼器就會新建一個RDF文件開始記錄。由于數(shù)據(jù)丟失或偏移出現(xiàn)的頻率比較低,且RDF文件避免了其他兩種格式中幀頭數(shù)據(jù)的記錄,這種方法同時兼?zhèn)淞溯^好的數(shù)據(jù)記錄可靠性和記錄效率。
Mark5B格式將數(shù)據(jù)文件劃分成多個磁盤幀,每個磁盤幀幀長固定為10 000字節(jié),由額外的16字節(jié)幀頭引導。雖然不可避免地出現(xiàn)丟幀、幀號亂序和幀長不足等情況,但是通過幀頭中的協(xié)調(diào)世界時和秒內(nèi)幀號可以確定當前幀在時間序列中的位置,并采用相應的數(shù)據(jù)糾錯方法可以提高整個數(shù)據(jù)文件的有效率[4],因此,Mark5B格式具有較高的數(shù)據(jù)可靠性。此外,Mark5B格式完全按照VSI標準制定,與現(xiàn)有的甚長基線干涉測量系統(tǒng)保持廣泛的兼容性[10]。目前國際上使用最多的終端是MK系列終端系統(tǒng)[11],因此,Mark5B格式具有應用的廣泛性。
VDIF格式同樣采用多個數(shù)據(jù)幀的形式保存數(shù)據(jù),與Mark5B不同,VDIF采取可變幀長(可變幀長指的是針對不同的傳輸協(xié)議可以設定與其對應的幀長以適應單個數(shù)據(jù)包的容量,同一個觀測文件數(shù)據(jù)幀的長度是固定的)的機制以確保所采用的傳輸協(xié)議的數(shù)據(jù)包剛好容納一個VDIF數(shù)據(jù)幀[6],這樣在傳輸過程中如果發(fā)生丟包事件或者數(shù)據(jù)包未能按序交付,接收端也能夠通過數(shù)據(jù)包內(nèi)的幀頭信息恢復數(shù)據(jù)時序以及補足缺失數(shù)據(jù)(用0補足)。如果將Mark5B等傳統(tǒng)甚長基線干涉測量數(shù)據(jù)記錄格式用于網(wǎng)絡傳輸,可能會因為丟包使得數(shù)據(jù)位發(fā)生移位,而相關(guān)處理對數(shù)據(jù)位移位非常敏感[4],由此導致接收端接收的數(shù)據(jù)文件不可靠。相比之下,VDIF格式的網(wǎng)絡傳輸安全性更高。VDIF格式設計的目的是解決當前國際上數(shù)據(jù)終端記錄格式多樣化導致數(shù)據(jù)交換不便的問題,除了方便數(shù)據(jù)交換之外,VDIF格式也支持磁盤存儲[6]。隨著數(shù)據(jù)終端設備的更新?lián)Q代,VDIF將得到更加廣泛的應用,成為兼具數(shù)據(jù)記錄和數(shù)據(jù)網(wǎng)絡交換功能的寬帶甚長基線干涉測量通用數(shù)據(jù)格式。
表1 Mark5B, RDF和VDIF格式對比
綜上所述,RDF是一種應用于空間甚長基線干涉測量地面跟蹤站的數(shù)據(jù)記錄格式,Mark5B格式是現(xiàn)階段應用范圍最廣的地基甚長基線干涉測量數(shù)據(jù)記錄格式,而VDIF以其靈活的設計和較高的網(wǎng)絡傳輸安全性可能成為未來一段時間的通用數(shù)據(jù)格式。需要說明的是,Mark5B格式由Haystack天文臺于2005年前后設計完成[3],同樣基于磁盤的VLBI數(shù)據(jù)記錄格式Mark5A于2002年設計完成[10],而RDF格式于RadioAstron預研階段(20世紀80年代)研制成功,早于Mark5B和VDIF格式。隨著時間的推移,未來RDF也可能被更加先進的數(shù)據(jù)記錄格式取代。
本文在國內(nèi)首次分析了俄羅斯空間射電望遠鏡RadioAstron特有的數(shù)據(jù)記錄格式RDF,完成了RDF格式的實測空間甚長基線干涉測量數(shù)據(jù)解碼,在此基礎上利用SCORR軟件處理機成功進行了空間甚長基線干涉測量相關(guān)處理及驗證,掌握了RDF格式解碼方法。最后對比了RDF格式及RDF相關(guān)現(xiàn)有地基甚長基線干涉測量格式,分析了它們各自具有的特點,有助于后續(xù)深入分析處理更多的RadioAstron實測數(shù)據(jù),推進我國空間甚長基線干涉測量數(shù)據(jù)處理技術(shù)的研究。
致謝:在研究過程中,俄羅斯科學院列別捷夫物理所天文宇航中心Andrianov Andrey博士對RDF格式的一些細節(jié)問題在郵件中給予了熱心回復;上海天文臺國際訪問學者Tetsuro Kondo教授和童鋒賢博士對數(shù)據(jù)相關(guān)處理工作給予了大力支持,向他們表示感謝。