機(jī)械專業(yè)外文文獻(xiàn)翻譯-外文翻譯--視覺跟蹤問題向魯棒非線性控制挑戰(zhàn)
《機(jī)械專業(yè)外文文獻(xiàn)翻譯-外文翻譯--視覺跟蹤問題向魯棒非線性控制挑戰(zhàn)》由會員分享,可在線閱讀,更多相關(guān)《機(jī)械專業(yè)外文文獻(xiàn)翻譯-外文翻譯--視覺跟蹤問題向魯棒非線性控制挑戰(zhàn)(15頁珍藏版)》請在裝配圖網(wǎng)上搜索。
國際性刊物 魯棒非線性控制 2000; 10:875覺跟蹤問題 :向魯棒非線性控制挑戰(zhàn) 艾倫 泰勒保蒙 美國亞特蘭大 0082號格魯吉亞工學(xué)院電子和計算機(jī)研究部門 視覺跟蹤問題 :向魯棒非線性控制挑戰(zhàn) 摘要 : 視覺跟蹤是在控制活動圖象中關(guān)鍵性問題之一。因?yàn)槟P椭写嬖诓豢煽啃院驮胍粜盘?、使它變成魯棒控制中一挑?zhàn)性問題。在此論文中、我們將概略一些涉及的關(guān)鍵問題和一些可能的解答方案,我們想需要聯(lián)系機(jī)器視覺和多刻度圖像處理技術(shù)來實(shí)現(xiàn)這個工作任務(wù)。 特別地,我們會概略一些必需的方法例如:計算機(jī)視覺和圖像處理包含光學(xué)流程圖在內(nèi)、活動的輪廓(橫向振蕩),和幾何學(xué)上的被驅(qū)動流程。該論文如此也便會有指導(dǎo)意義 。版權(quán) ?2000 約翰懷利和幾個有限公司 關(guān)鍵字 :目視跟蹤 魯棒控制 視覺運(yùn)動 活動輪廓 光學(xué)流程 通用換算圖像處理 1. 引言 在這論文里、我們考慮那些被控制的跟蹤眼運(yùn)動活動圖象問題。這個問題的解決方案需綜合控制理論、信號處理和計算機(jī)視覺等技術(shù)。我們想表明有可能由利用能適應(yīng)的魯棒控制與信號處理通用換算方法以及計算機(jī)視覺形狀識別理論協(xié)同一起來處理此問題,跟 蹤是一基點(diǎn)控制問題即我們需要的輸出的遵循或跟蹤基準(zhǔn)信號,或相當(dāng)于我們想使那跟蹤誤差相對于一些定義明確的標(biāo)準(zhǔn)(說能量、能力、峰值、等等 .)盡可能小的。即使鏡頭推進(jìn)存在的一些干擾是一典型控制問題、這個手頭上的問題是很難和挑戰(zhàn)性,因?yàn)橛蟹浅2淮_定的自然干擾性。一個可以認(rèn)為眼球運(yùn)動跟蹤問題是在一人機(jī)連接的環(huán)境之下。特別地,我們將推斷計算機(jī)用戶視覺運(yùn)動,哪個動作是用戶打算完成的。例如:在電腦熒屏上打開一個文件夾、展開一下拉菜單項等等。這類電腦跟蹤系統(tǒng)將作為包含我們的視覺跟蹤方法學(xué)一個具體的實(shí)例。重要強(qiáng)調(diào)是已經(jīng)有相當(dāng)多 在測量視覺運(yùn)動方面的研究已經(jīng)在被控制的實(shí)驗(yàn)室環(huán)境下完成、何況研究上已經(jīng)在應(yīng)用中用到此知識。從此我們將考慮接下來在大范圍中跟蹤問題的適應(yīng)性,包括機(jī)器人、遠(yuǎn)距操縱的車輛,并且飛行員帶瞄準(zhǔn)器的飛行帽當(dāng)前也正在發(fā)展中。后者是系統(tǒng)的結(jié)合鋼盔支柱頭和視覺跟蹤能力以分辯隸屬的正確的視線。顯而易見,正當(dāng)?shù)拈_發(fā)跟蹤觀察者眼睛的人類視覺系統(tǒng)的那動態(tài)特性將導(dǎo)致大大幅度削減傳輸中所需要的信息。關(guān)于視覺跟蹤和眼運(yùn)動(與大量的信息一樣)的討論多半被發(fā)現(xiàn)在參考 [1 . 我們應(yīng)該明白視覺跟蹤問題不同于標(biāo)準(zhǔn)追蹤問題,因?yàn)榉答佇盘柺怯?圖像感應(yīng)器測量的。尤其是,它必須在經(jīng)由計算機(jī)視覺運(yùn)算法提取而且在被用于控制回之前被一個推論運(yùn)算法解釋。反應(yīng)速度是關(guān)鍵性因素。因?yàn)槊黠@的理由、一視覺跟蹤系統(tǒng)應(yīng)該是盡可能的非侵入的。眼球運(yùn)動通過由灰度或紅外線照相機(jī)或由一系列感應(yīng)器得到的獲取圖象來完成跟蹤的 低能級數(shù)據(jù)獲取和識別的完成是經(jīng)由一通用換算技術(shù)得到的。此技術(shù)提供許多優(yōu)越性。第一,它使得信號處理的查找和醫(yī)學(xué)上的圖象獲取過程明朗化、它導(dǎo)致實(shí)時信號捕獲和了解程序快速化。識別將利用一通用換算方法和一新的計算理論形 式來完成。 因此、從該視頻信息交換窗的控制點(diǎn)出發(fā)、我們有一跟蹤問題在非常不可預(yù)測的干擾哪個我們想使其衰減的。注意到該不可靠應(yīng)歸于傳感器噪音(典型的)、該算法的構(gòu)成如上所述(不可測性求出起重要作用、各種各樣的假設(shè)的可能性、等等 .),和模型不定性。我們應(yīng)該注意到論文將擁有指導(dǎo)氣息。實(shí)際上,我們的一個關(guān)鍵目的是引進(jìn)從活動圖象到該魯棒控制共同體的一些核心概念。我們堅信共同體便會從研究彼此方法和問題得益。尤其是、因?yàn)橐曈X跟蹤和該眼球運(yùn)動跟蹤的特有的課題、該魯棒控制在明確地處理不可靠性的技術(shù)我們將要在接下來做相應(yīng)的討論 。 2. 視覺 跟 蹤 視覺跟蹤存在許多論文,通過利用視力在貨車交貨、特別是在機(jī)器人共同體(看例如、涉及 [1, 2, 5和那參考在那里面的 .)代表性地、該問題定位在本研究中是通過利用視覺跟蹤服務(wù)機(jī)械手(或一等值的難題)。該動機(jī)于使用視力在這一體制中是非常清晰的,那就是說,該綜合計算機(jī)視覺和控制可以是用到改善測量,因?yàn)楦纳茍D像處理技術(shù)和硬件中、機(jī)器人技術(shù)到達(dá)指向就是要視覺信息可以變成不可分割那部分反饋信號。因?yàn)閱栴}帶有少量不定性、單純的 且越來越用于嘈雜的系統(tǒng)、能適應(yīng)的方案以及隨機(jī)建 立的已經(jīng)使用的線性二次高斯控制器。 許多控制原理圖已經(jīng)建議使用視覺信息來控制回路。這已經(jīng)綿亙傳感零件到表征多級控制結(jié)構(gòu)應(yīng)用范圍而言、傅里葉描述符,和局部圖像分析法;看參考 [ 9和那里面的參考。以光學(xué)的流程為基礎(chǔ)的有好的方法已經(jīng)被當(dāng)作機(jī)械手的計算一個主要成份使用驅(qū)動信號(閱讀詳細(xì)的,請參考 [ 7, 8],和我們以下的論述)。的確,因?yàn)樵谝粋€圖像中的一個物體由光亮式樣組成 , 如同物體搬進(jìn)空間一樣光亮也是式樣。 光學(xué)的流程然后是光亮的明顯運(yùn)動式樣 ;參考 [12]。在標(biāo)準(zhǔn)的假定之下 , 被提供的一個靜態(tài)的目 標(biāo)和一臺感人的照相機(jī) ( 或相等地 ,一個靜態(tài)的物體和一臺感人的照相機(jī) ),一個可以在快速時寫下象平面上對象凸出點(diǎn)的時差。若干方法已經(jīng)討論適合于計算此速度。此知識也將能用來跟蹤圖像。 讓我們考慮追蹤一個計算機(jī)熒屏上的目標(biāo)具體問題。然后我們有唯一的一二維的跟蹤目標(biāo)點(diǎn),我們?yōu)楹唵纹鹨娂俣悄繕?biāo)周旋于原子能飛機(jī)垂直于光軸照相機(jī),如果那照相機(jī)移動然后帶有翻譯速度的移動 : ????????和旋轉(zhuǎn)速度盎司(就那照相機(jī)設(shè)計)而言、可能形成二維的跟蹤問題如同下述適合于一個目標(biāo)。讓電 壓互感器標(biāo)志目標(biāo)的投影在象平面區(qū)域, 那照相機(jī)設(shè)計)。有類似的描述適合于跟蹤的零件?,F(xiàn)在由此機(jī)構(gòu),就可以寫下運(yùn)動的照相機(jī)光流產(chǎn)生的 其控制變量是由包括照相機(jī)的跟蹤運(yùn)動在內(nèi)的流程所給定的。那可執(zhí)行代碼程序帶表格可能在參考 [ 13、 7]查到,并且無須涉及我們現(xiàn)在所討論的課題 (同那定時在 .. 之后接納那表格。 x(n+1)=x(n)+ n)=Td(n)+v(n) z(n)=x(n)+w(n) 這里 ,d 是外界產(chǎn)生的干擾 , v 是‘噪音 ',稱做適合于模型不定性, z 是是那量度與噪聲分量 w 一起。 ( 所有的矢量都包含在。 x , y 和搖晃因素形成的跟蹤誤差構(gòu)成的 )。 有許多重要的控制問題與這樣的設(shè)備有關(guān)系、當(dāng)然,一個人量度延遲(我們想工作實(shí)時)和抽樣時間選擇的問題。但是我們感覺有許多深刻地和很多難題,必須被編址合理可選擇的控制策略成功之前。換句話說 ,一般說來不定性( v w)是塑造成均 勻頻譜噪聲。這模型是保守的,沒有加入使用帳戶任何可能噪聲環(huán)境的結(jié)構(gòu)。現(xiàn)代魯棒控制一個關(guān)鍵貢獻(xiàn)考慮了的結(jié)構(gòu)不定性(參考 [ 14]和以及里面其他內(nèi)容)。在我們現(xiàn)在的情形中,我們倡導(dǎo)深刻的研究有關(guān)不定性方面的問題。這將導(dǎo)致信號處理的關(guān)鍵元素,尤其是,新的強(qiáng)大的計算機(jī)通用換算方法 雅各比理論為基準(zhǔn)將會起到一個關(guān)鍵角色。以下我們將討論此話題,尤其是討論更多明確地處理那眼球運(yùn)動信息并在反饋電路使用它的方法。 3、眼睛運(yùn)動信息 當(dāng)許多研究已經(jīng)完成眼睛運(yùn)動測量的時候,少量研究已經(jīng)在應(yīng)用中采 用這些知識。一些侵入的視覺跟蹤技術(shù)測量角膜和視網(wǎng)膜電勢差而其他的人正在使用 侵入的技術(shù)識別零件位于眼睛的圖像上,比如虹膜或瞳孔或那角膜的界限條件反射的眼睛敏感的光線,并且從此零件推論出運(yùn)動的眼睛,所以此零件的運(yùn)動還可以應(yīng)歸于頭部的運(yùn)動,重要的是跟蹤若干零件并求出此零件差速運(yùn)動。例如:、電學(xué)上近紅外眼睛跟蹤系統(tǒng)使用角膜表面反射的光的相對運(yùn)動而且反射視網(wǎng)膜跟隨用戶的目光。關(guān)于眼睛跟蹤技術(shù)的好的調(diào)查報告參考 [ 3, 15] 16]。 大部分從事利用眼球運(yùn)動知 識已經(jīng)集中于聯(lián)絡(luò)殘疾人使用者,例如,參考 [ 17, 18]。其他的研究強(qiáng)調(diào)應(yīng)用于類似于我們在考慮包含 [ 19的。這開創(chuàng)性研究嘗試通過利用眼球運(yùn)動在人機(jī)通信并且證明理論的可能性 . 他們也確定這些趨近于人機(jī)通信的實(shí)用真實(shí)問題和缺陷,其必須解決以便使其實(shí)用逼真以至可以對抗和補(bǔ)充其他的人機(jī)連接工具比如鼠標(biāo)、鋼筆和圖形輸入卡、駕駛桿以及鍵盤。 趨近于人機(jī)通信的視覺跟蹤幕后的理論基礎(chǔ)是目標(biāo)被一受支配的似人的結(jié)構(gòu)發(fā)現(xiàn)。如果是這樣,在視網(wǎng)膜成像的小的區(qū)域稱作小凹。因此使用者的眼睛位置提供有關(guān)他集中于屏蔽的區(qū)域的信 息。該信息是精確到內(nèi)部小凹角寬度的(大約一度)。此精度已經(jīng)被認(rèn)為是適宜于上述研究中的人機(jī)通信(好的精確度可能需要眼肌的研究,但是我們這里不討論 .)生物學(xué)研究者指出大量普遍的眼睛運(yùn)動分成二類∶掃視與定位。(參考 [3, 24, 4]與該參考中一些掃視與定影的論述以及他們和生物學(xué)幻像的關(guān)系。這些研究同時包含大規(guī)模視覺跟蹤的一些基本問題 .)掃視是突然運(yùn)動視覺從場景中的一個感興趣區(qū)到另一個。掃視通常伴隨間隔為 200到 600毫秒的定影,該視覺仍然完成包括小于一度的小的神經(jīng)過敏運(yùn)動。其他的形式的眼睛運(yùn)動可能在人機(jī)通信期中可能被忽略。 建立人機(jī)通信的視覺跟蹤的基本問題是確定定影周期(亦即,用戶感覺他在視覺上已經(jīng)定位在一目標(biāo)上的時間),然后在肌肉神經(jīng)過敏視覺運(yùn)動定位在目標(biāo)上。注意人類忽視這定影期間的神經(jīng)過敏視覺運(yùn)動,那就是說我們注視一個目標(biāo)我們以為我們是早看現(xiàn)場的單個斑點(diǎn)。也要注意到純理論的過濾器接近于除去該眼睛神經(jīng)過敏不是令人滿意地,既它也可能減緩正確位置掃視的響應(yīng)時間。 4. 數(shù)據(jù)獲得 有二基本對數(shù)據(jù)獲得的方法 : 與那一個類似的活躍方式藉著追蹤系統(tǒng)和圖 像技術(shù)的無源現(xiàn)在眼睛用。 在有效的方法中,一種無害近紅外線燈用來照明用 戶的臉。兩個來自眼睛的反射波被求得。是前者反射信號起因于角膜表面被稱作反射。后者反射發(fā)生來自視網(wǎng)膜被稱作明亮視覺成分。為最小化背景輻射效果,目前的系統(tǒng)一般需要暗淡的光。本文中,我們將鉆研無源的方法。 5. 追蹤及光學(xué) 流程 一旦我們想要跟蹤與對象相當(dāng)?shù)男畔⒁呀?jīng)確定,我們使用一個光學(xué)流程估計各零件從兩個連續(xù)圖象,只包含那個零件。該圖象是當(dāng)時和以前的 產(chǎn)生運(yùn)動判斷問題比用純理論的強(qiáng)度成像的傳統(tǒng)的流程判斷適應(yīng)度好了很多。該光學(xué)流程的計算機(jī)應(yīng)用已經(jīng)被用于解決活動幻像中出現(xiàn) 的問題的一個重要的工具。該光流域是一序列的成像的明亮圖像的視在運(yùn)動的速度矢量場 [ 41]。假定該明亮圖像是相對運(yùn)動的結(jié)果,足夠大的空間來寄存圖像上光亮度在空間分配方面的改變。因此,一個目標(biāo)和一架相機(jī)的相對運(yùn)動能夠引起光學(xué)流程。同樣地,一工人靜電照相機(jī)成像的場景中目標(biāo)的相對運(yùn)動可以引起光學(xué)流程。在我們光學(xué)流程的計算機(jī)應(yīng)用上,我們使用通用化粘性溶液的漢密爾頓 技術(shù)似乎理論上適于這種變化,歐拉拉格朗日接近于此問題(參見 [ 41面相關(guān)的內(nèi)容)。利用這種通用的方法,我們已能處理那些在光 學(xué)流程區(qū)域出現(xiàn)的若干相異的變分公式的奇異性和規(guī)律性問題。這類方法論已經(jīng)被用于描影法造型問題 [ 44, 45],和邊緣檢測 [ 46]。 ⒍分割和數(shù)據(jù)分析 從一數(shù)據(jù)列提取是有干擾的視覺軌跡,然后問題變?yōu)閿?shù)據(jù)斷片進(jìn)入掃視和定位間隙和測定預(yù)定注視點(diǎn)。一個非常接近的通用換算也被用于這些步驟中。該定位判斷問題由于若干干擾來源而變得復(fù)雜。特別地,眼光閃爍及其他人為現(xiàn)象可能沒有終止地發(fā)生在定位過程中。在這些人為現(xiàn)象有的能夠持久 200毫秒,數(shù)據(jù)可能丟失。為更好的目標(biāo)定位和分裂眼睛運(yùn)動跟蹤,可以使用點(diǎn)連續(xù)/離散最大概似法接近 于細(xì)化開始和結(jié)束間歇以及定點(diǎn)的測定可能值。該方式是結(jié)點(diǎn)連續(xù)/非連續(xù)的測定問題因?yàn)樽⒁朁c(diǎn)能夠取連續(xù)的值,然而分割成 '定位 '和 '非定位 '間隔是一個二元問題。它是建立在視覺活動定位和持續(xù)的統(tǒng)計學(xué)上的模型,它是建立在最理想的貝葉斯定理概念上的。它用一個預(yù)測步驟來填充在掃視過程中丟失的數(shù)據(jù)。該推算步驟以假設(shè)視覺或者在定位方式或者在掃視方式為基準(zhǔn)提出兩個推定量。該假設(shè)任何一個取舍是在監(jiān)視若干讀取信息后計算各可能性之后取舍的。延遲關(guān)聯(lián)文件這過程限于大約毫秒,這個過程將不會為用戶所注意到。 如上所述還可以容易地貝葉斯統(tǒng)計放 到遞減率蛇形線來處理抽取的輪廓;參考[ 50]。因此建立邊緣檢測算法的通用換算幾何學(xué)上的橫向振蕩很自然地變成其貝葉斯定理的框架。注意我們不需要發(fā)送有關(guān)掃視運(yùn)動的相關(guān)信息。當(dāng)注視點(diǎn)改變時,我們唯一的提供有關(guān)跟蹤程序初始的和最后的定點(diǎn)的信息。然而,加快人機(jī)通信過程,我們使用掃視運(yùn)動去推算下一個定點(diǎn)將會在哪。 掃視運(yùn)動可以由一隱藏的馬爾可夫模型描述參考 [ 51]中相關(guān)內(nèi)容。此外,馬爾可夫模型可能用來綜述在當(dāng)前上內(nèi)容可能的用戶操作。在隱藏的馬爾可夫模型描述的這掃視各狀態(tài)關(guān)聯(lián)到特別的運(yùn)動形式階段的隨機(jī)模型。經(jīng)結(jié)合用戶 意圖的隨機(jī)的描述是以呈現(xiàn)背景和掃視的隱藏的馬爾可夫模型為基準(zhǔn)的,我們可以導(dǎo)出一推算下一個注視點(diǎn)將在的位置的判斷法則。 ⒎結(jié)論 在論文中,我們考慮用一通用方法論來研究眼光跟蹤問題。我們應(yīng)該注意因?yàn)樾盘柡湍P椭械牟欢ㄐ?,此類問題為在魯棒控制方面的研究工作者提供了一個極其難得的機(jī)會。我們論述個綜合魯棒控制、計算機(jī)視覺,和信號處理通用換算的方法。最近、存在多種人員參加在研究幻像和控制。大部分研究到目前已經(jīng)分支。當(dāng)分支已經(jīng)結(jié)束時很多基本控制算法已經(jīng)用于混合的結(jié)果。利用視覺信息在反饋電路中能夠提供珍貴的新的研究來源,它 有潛力推動控制研究的一個新的領(lǐng)域。在本問中論述的視覺跟蹤問題可以作為一范例適合于活動圖象控制的整個范圍。的確,該問題向魯棒控制系統(tǒng)開啟了一次有力的挑戰(zhàn)。 感謝 我們要感謝明尼蘇達(dá)大學(xué)的加里 特費(fèi)科教授,他們提供了許多非常有用的關(guān)于視覺跟蹤的交談。該研究在某種程度上得到以下各單位的授權(quán)和支持:國家科學(xué)基金會電子計算機(jī)系統(tǒng) 家科學(xué)基金會局部信息處理系統(tǒng),自動跟蹤科學(xué)研究空軍辦公室/ 98 - 1 - 0168、軍隊 98 - 1 - 0169研究 室。 F J. 000; 10:875n a . is of in of in it a In we of as as We to in In we of ‘, a as 2000 . n we of of of We it is to by in is a in we to or a or we to as as to . in of a is a at is of of in of a In we to of of a to a on a a of as a of is in It is to in of in a on in we a of in a of in to a s of of of by of s to in of to be of an of be 1 We of in is In it to be by a in is a an be as as is by by or or by an of to of is a a of as is in it to be a a of of we a in of a we to is to in of , We a of is to to We by s In of of be as we 2. a of on of in in ( 1, 2, 5 in is of a or an in a is of be to of in is an of ID as as QG A of of in of to 9 A on as a in of s in 7, 8], an in an is up of as in so do is of 12]. a a or a a of a of of be to us of on a we a We in a is to of If : ????????to as an 13]. t on is of to q to t of of by of by of by s be 13, 7], us is be in on x(n+1)=x(n)+ T (n)=Td(n)+v(n) z(n)=x(n)+w(n) is d is v is a &z is w. (of up of x, y, of a of to a Of of we to in of we is a be a of be in v w) is as is of of of in of in 14] In we a of to of in of in a in as be We in of it in a 3. on of on in of on an of as of or or of a at of of of be to a of it is to of of to s A of be 3, 15]. 16]. of on on 17, 18]. to we 19 of in of of to be in to it a as to is an is by a if it is on a of a s of he is is of to of of to be by (be of is (3, 24, 4] of to on of A is a of of in to A is by a 00 00 ms of be in in is of he is at an of in of to do we an we we at a in a to is it to a 4. to an to by a In a is to s is- 1.請仔細(xì)閱讀文檔,確保文檔完整性,對于不預(yù)覽、不比對內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
6 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計者僅對作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 機(jī)械 專業(yè) 外文 文獻(xiàn) 翻譯 視覺 跟蹤 問題 非線性 控制 挑戰(zhàn)
鏈接地址:http://kudomayuko.com/p-18372.html