2024 年第54 卷第1 期
BEV-radar:毫米波雷達-相機雙向融合的三維目標檢測
趙園1,張露2,鄧家俊3,張燕詠1?
(1.中國科學技術大學計算機科學與技術學院,安徽合肥 230027;2.合肥綜合性國家科學中心人工智能研究院,安徽合肥 230088;3.悉尼大學電子工程系,澳大利亞南威爾士州 2006)
?通訊作者:張燕詠,E-mail: yanyongz@ustc.edu.cn
摘要:在自動駕駛場景下的3D 目標檢測任務中,探索毫米波雷達數據作為RGB 圖像輸入的補充正成為多模態(tài)融合的新興趨勢。然而,現有的毫米波雷達-相機融合方法高度依賴于相機的一階段檢測結果,導致整體性能不夠理想。本文提供了一種不依賴于相機檢測結果的鳥瞰圖下雙向融合方法 (BEV-radar) 。對于來自不同域的兩個模態(tài)的特征,BEV-radar 設計了一個雙向的基于注意力的融合策略。具體地,以基于BEV 的3D 目標檢測方法為基礎,我們的方法使用雙向轉換器嵌入來自兩種模態(tài)的信息,并根據后續(xù)的卷積塊強制執(zhí)行局部空間關系。嵌入特征后,BEV 特征在3D 對象預測頭中解碼。我們在nuScenes 數據集上評估了我們的方法,實現了48.2 mAP 和57.6 NDS。結果顯示,與僅使用相機的基礎模型相比,不僅在精度上有所提升,特別地,速度預測誤差項有了相當大的改進。代碼開源于https://github.com/Etah0409/BEV-Radar。
關鍵詞:三維目標檢測;傳感器融合;毫米波雷達
引用格式:JUSTC,2024,54(1): 0101
QGAE:用于生成問答對的端到端無答案問題生成模型
李林楓1,張立成2,朱池葦1,毛震東1?
(1.中國科學技術大學網絡空間安全學院,安徽合肥 230027;2.中國科學技術大學信息科學技術學院,安徽合肥 230027)
?通訊作者:毛震東,E-mail: zdmao@ustc.edu.cn
摘要:問題生成的目標是生成有意義且流暢的問題,以增加可用數據來解決問答類型標注語料庫的缺乏問題。以帶有可選答案的未注釋文本作為輸入內容,問題生成可以根據是否提供答案分為兩種類型:有答案型和無答案型。即使在提供答案的情況下,生成問題也是具有挑戰(zhàn)性的,更不用說在沒有提供答案的情況下,對于人類和機器來說生成高質量的問題更加困難。為了解決這個問題,我們提出了一種名為QGAE 的新型端到端模型,它能夠通過直接提取候選答案,將無答案的問題生成轉化為有答案的問題生成。這種方法有效地利用未標記的數據來生成高質量的問答對,其端到端的設計使其比多階段方法更加方便,后者需要至少兩個預訓練模型。此外,我們的模型獲得了更好的平均分數和更大的多樣性。我們的實驗結果表明,QGAE 在生成問答對方面取得了顯著的進展,成為了一種充滿潛力的問題生成方法。
關鍵詞:深度學習;自然語言處理;無答案問題生成;答案抽取
引用格式:JUSTC,2024,54(1): 0102
無監(jiān)督異常檢測模型的魯棒性基準
王培1,翟偉1,曹洋1,2?
(1.中國科學技術大學自動化系,安徽合肥 230027;2.合肥綜合性國家科學中心人工智能研究院,安徽合肥230088)
?通訊作者:曹洋,E-mail: forrest@ustc.edu.cn
摘要:由于生產環(huán)境的復雜性和多樣性,了解無監(jiān)督異常檢測模型對常見降質的魯棒性是至關重要的。為了系統(tǒng)地探索這個問題,我們提出一個名為MVTec-C 的數據集來評估無監(jiān)督異常檢測模型的魯棒性?;谶@個數據集,我們探索了五種不同范式的方法的魯棒性,包括基于重建的、基于表征相似度的、基于歸一化流的、基于自監(jiān)督表征學習的和基于知識蒸餾的范式。此外,我們還探討了兩種最佳的方法中不同模塊對魯棒性和準確性的影響,包括PatchCore 方法中的多尺度特征、鄰域大小、采樣比例和Reverse Distillation 方法中的多尺度特征、MMF 模塊與OCE 模塊、多尺度蒸餾。最后,我們提出了一個特征對齊模塊 (FAM),以減少降質帶來的特征偏移,并將PatchCore 和FAM 結合起來,得到一個同時具備高準確率和高魯棒性的模型。我們希望這項工作能夠作為一種魯棒性評估手段,并在將來為構建魯棒的異常檢測模型提供經驗。
關鍵詞:魯棒性基準;異常檢測;無監(jiān)督學習;自動光學檢測
引用格式:JUSTC,2024,54(1): 0103
基于秘密共享的隱私保護聯邦學習高效安全聚合方案
金旋1,姚遠志2?,俞能海1
(1.中國科學技術大學網絡空間安全學院,安徽合肥 230027;2.合肥工業(yè)大學計算機與信息學院,安徽合肥230601)
?通訊作者:姚遠志,E-mail: yaoyz@hfut.edu.cn
摘要:聯邦學習使得多個移動參與者在不透露其本地隱私數據的情況下聯合訓練全局模型。通信計算代價和隱私保護性能是聯邦學習的關鍵基礎問題。現有的基于秘密共享的聯邦學習安全聚合機制仍然存在引入顯著額外計算代價、隱私保護性能不足和應對參與者掉線能力脆弱等問題。本文致力于通過引入靈活高效的秘密共享機制解決上述問題。本文提出了兩種新穎的隱私保護聯邦學習方案,分別是基于單向秘密共享的聯邦學習(FLOSS)和基于多發(fā)秘密共享的聯邦學習 (FLMSS) 。與當前的相關工作相比,FLOSS 通過動態(tài)設計秘密共享的內容和對象,在顯著降低通信代價的同時保證高強度的隱私保護性能。FLMSS 進一步降低額外計算代價并且能夠提高聯邦學習應對參與者掉線的魯棒性,從而在隱私保護和通信計算代價之間取得令人滿意的平衡。安全性分析和基于真實數據集的性能評估證明了本文提出的方案在模型準確度、隱私保護性能和通信計算代價方面的優(yōu)勢。
關鍵詞:聯邦學習;隱私保護;秘密共享;安全聚合
引用格式:JUSTC,2024,54(1): 0104
基于雙模態(tài)智能鞋的偏癱患者下肢肌力定量評估
龍華君1,李潔2,李瑞2,劉新峰2,程敬原3?
(1.中國科學技術大學大數據學院,安徽合肥 230027;2.中國科學技術大學附屬第一醫(yī)院神經內科,安徽合肥 230001;3.中國科學技術大學計算機科學與技術學院,安徽合肥 230027)
?通訊作者:程敬原,E-mail: jingyuan@ustc.edu.cn
摘要:卒中可導致患者下肢運動能力受損和偏癱。準確評估下肢運動能力對診斷和康復很重要。為了使每次測試都可隨時追溯,并避免主觀性,我們使用配備有壓敏鞋墊和慣性傳感單元的雙模態(tài)智能鞋進行數字化評估,并設計了一個包括左轉彎和右轉彎的5 米步行測試方案。數據收集自23 名患者和17 名健康受試者。兩位醫(yī)生對所有患者的下肢的運動能力進行了觀察,并使用醫(yī)學研究委員會的五級肌肉檢查量表進行了評估。兩位醫(yī)生對同一患者的平均評分被用作真實值。使用我們開發(fā)的特征集,在對患者和健康受試者進行分類時達到了100%的準確性。對于患者的肌肉力量,使用我們的特征集和回歸方法獲得了0.143 的平均絕對誤差和0.395 的最大誤差,與每位醫(yī)生的評分相比 (平均絕對誤差:0.217,最大誤差:0.5),更接近實際情況。因此,我們驗證了使用這種智能鞋客觀準確地評估中風患者下肢肌肉力量的可能性。
關鍵詞:卒中;機器學習;智能鞋;下肢肌力
引用格式:JUSTC,2024,54(1): 0105
各向同性磁流變彈性體磁相關非線性動態(tài)力學行為的本構模型
汪伯潮1,李顏1,逄浩明1,徐振邦2,龔興龍1?
(1.中國科學院材料力學行為與設計重點實驗室,中國科學技術大學近代力學系,安徽合肥 230027;2.中國科學院空間光學系統(tǒng)在軌制造與集成重點實驗室,中國科學院光學精密機械與物理研究所,吉林長春 130033)
?通訊作者:龔興龍,E-mail: gongxl@ustc.edu.cn
摘要:各向同性磁流變彈性體是一種將磁性顆粒隨機摻入到聚合物基體中制備而成的智能材料。在磁場作用下,其模量發(fā)生快速、可逆、連續(xù)變化,在振動控制領域顯示出良好的應用前景。實驗結果表明,各向同性磁流變彈性體的動態(tài)力學行為具有很強的頻率、應變幅值和磁場相關性。盡管上述行為對于其潛在應用具有重要的影響,但目前關于各向同性磁流變彈性體磁相關非線性動態(tài)力學行為的理論研究則關注不夠。為準確評價各向同性磁流變彈性體的動態(tài)力磁耦合行為,并指導其相關產品的設計,本文建立了一個基于連續(xù)介質力學理論,反映各向同性磁流變彈性體磁相關非線性動態(tài)力學行為的本構模型。隨后,開發(fā)了和本構模型對應的數值實現算法,并對模型的預測能力進行了驗證。該模型有助于深入理解各向同性磁流變彈性體磁相關非線性動態(tài)力學行為的潛在力學機制。此外,該模型有助于指導基于各向同性磁流變彈性體產品的設計和應用。
關鍵詞:各向同性磁流變彈性體;頻率相關;應變幅值相關;磁相關;非線性粘彈;本構模型
引用格式:JUSTC,2024,54(1): 0106