緒論:寫(xiě)作既是個(gè)人情感的抒發(fā),也是對(duì)學(xué)術(shù)真理的探索,歡迎閱讀由發(fā)表云整理的1篇高速公路交通狀態(tài)識(shí)別模型范文,希望它們能為您的寫(xiě)作提供參考和啟發(fā)。
0引言
高速公路交通狀態(tài)的精準(zhǔn)識(shí)別是提升其運(yùn)行效率的關(guān)鍵,早期的研究集中于雙指數(shù)平滑法、McMaster和貝葉斯算法等數(shù)理統(tǒng)計(jì)算法[1-3],后集中于模糊聚類(lèi)、人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等機(jī)器學(xué)習(xí)方法[4-6],以上研究多為利用單一參數(shù)或同等對(duì)待多元參數(shù),但高速公路交通流時(shí)空分布不均使不同參數(shù)的影響程度不同[7],如純主線路段干擾少,速度參數(shù)影響程度高;而匝道附近路段分、合流使車(chē)輛加減速頻繁,則流量參數(shù)的影響程度高,若不加以區(qū)分,會(huì)使?fàn)顟B(tài)識(shí)別結(jié)果存在一定誤差。為區(qū)分多元交通流參數(shù)影響差異性,如李曉璐等[7]和余慶等[8]引入熵權(quán)法區(qū)分參數(shù)的影響權(quán)重以改進(jìn)模糊聚類(lèi)算法并建立相應(yīng)的高速公路交通狀態(tài)識(shí)別模型。但熵權(quán)法需要人為設(shè)置評(píng)價(jià)指標(biāo)閾值以供其計(jì)算參數(shù)指標(biāo)權(quán)重,這使其存在一定主觀因素,且聚類(lèi)算法參數(shù)設(shè)置敏感可能會(huì)出現(xiàn)特征提取遺漏問(wèn)題,使多元參數(shù)特征不能有效融合,無(wú)法提供更多有效信息,狀態(tài)識(shí)別準(zhǔn)確性有待提升。而考慮多元交通流參數(shù)的狀態(tài)識(shí)別算法關(guān)鍵在于特征的有效提取和融合。Transformer模型利用自注意力機(jī)制強(qiáng)大的學(xué)習(xí)和表示能力能夠自主給予多元參數(shù)以合適權(quán)重,使其在特征提取過(guò)程中信息損失減少,精準(zhǔn)性高[9-12],同時(shí)并行化處理也可節(jié)約時(shí)間,近年來(lái)成為圖像、文本分類(lèi)的最新方法;且增強(qiáng)序列模型(EnhancedSequentialInferenceModel,ESIM)可以強(qiáng)化多元參數(shù)特征的相似性和差異性,進(jìn)一步加強(qiáng)了信息的有效融合,提高了分類(lèi)效率[13],但其不涉及多元交通流參數(shù)的高速公路狀態(tài)分類(lèi)識(shí)別研究。基于此,本文考慮多元交通流參數(shù)對(duì)于交通狀態(tài)影響差異性,基于Transformer-ESIM模型強(qiáng)大的自適應(yīng)學(xué)習(xí)能力給予多元交通參數(shù)以合適權(quán)重并實(shí)現(xiàn)有效融合,建立高速公路交通狀態(tài)分類(lèi)識(shí)別模型,通過(guò)實(shí)際交通流數(shù)據(jù)予以驗(yàn)證。
1狀態(tài)識(shí)別系統(tǒng)結(jié)構(gòu)
1.1系統(tǒng)結(jié)構(gòu)
本文構(gòu)建的多元交通流參數(shù)高速公路狀態(tài)分類(lèi)識(shí)別系統(tǒng)結(jié)構(gòu)如圖1所示。其中描述交通流特性的參數(shù)指標(biāo)包括車(chē)流量、平均速度和占有率。
1.2系統(tǒng)原理
基本原理如下:(1)信息采集子系統(tǒng)采集的流量、速度和占有率等參數(shù)數(shù)據(jù)存儲(chǔ)在數(shù)據(jù)庫(kù)中,并對(duì)數(shù)據(jù)進(jìn)行預(yù)處理以滿足交通狀態(tài)分類(lèi)識(shí)別和其他交通管理控制的需要。(2)將處理后的多元交通流參數(shù)輸入到Transformer編碼層并行化提取有效特征,其中編碼層主要由多頭注意力機(jī)制層和前饋神經(jīng)網(wǎng)絡(luò)層組成。(3)將編碼后的序列輸入到交叉注意力層,基于ESIM強(qiáng)化各交通流參數(shù)特征的相似性和差異性,緩解由于直接融合參數(shù)特征而忽略參數(shù)彼此間影響的問(wèn)題。(4)將經(jīng)過(guò)池化的有效信息特征輸入到分類(lèi)層中完成交通狀態(tài)的分類(lèi)識(shí)別。
2基于Transformer-ESIM交通狀態(tài)分類(lèi)識(shí)別模型
2.1Transformer編碼層
為實(shí)現(xiàn)多元交通流參數(shù)數(shù)據(jù)的并行化特征的有效提取,減少訓(xùn)練時(shí)間,本文通過(guò)構(gòu)建Transformer編碼層解決。Transformer編碼層由多頭自注意力機(jī)制層和前饋神經(jīng)網(wǎng)絡(luò)層組成。2.1.1多頭注意力機(jī)制。多頭注意力機(jī)制利用自注意力操作可以給予不同特征以不同的權(quán)重來(lái)有效獲取信息,流程如下:(1)輸入經(jīng)過(guò)預(yù)處理的流量、速度和占有率序列Xnn=(1,2,3),第n類(lèi)序列經(jīng)學(xué)習(xí)矩陣WQH、WKH、WVH完成線性變換見(jiàn)式(1)至式(3),生成一組Qn、Kn、Vn權(quán)重向量并進(jìn)行自注意力操作見(jiàn)式(4)。Qn=Xn?WHQ其中:SoftMax()?為非線性函數(shù);dk為Kn的維度。(2)對(duì)第m個(gè)注意力頭進(jìn)行自注意力操作,見(jiàn)式(5),每個(gè)頭對(duì)輸入的交通流序列數(shù)據(jù)信息的關(guān)注程度存在差異,學(xué)習(xí)到的關(guān)系不同,待各頭注意力計(jì)算完成后進(jìn)行多頭拼接可防止過(guò)擬合現(xiàn)象如式(6)所示,對(duì)比簡(jiǎn)單加權(quán)平均準(zhǔn)確性更高。其中:Attention()?為自注意力機(jī)制計(jì)算函數(shù);WmQn、WmKn、WmVn分別為Q、K、V線性變換后的權(quán)重矩陣;Wno為多頭注意力機(jī)制的權(quán)重系數(shù)矩陣;h為自注意力頭的數(shù)量;Concat()?為拼接多頭的函數(shù)。(3)使用殘差網(wǎng)絡(luò)并進(jìn)行層歸一化來(lái)加快收斂速度,減少訓(xùn)練時(shí)間,見(jiàn)式(7)。其中:LayerNorm()?為歸一化函數(shù),Res()?為殘差網(wǎng)絡(luò)函數(shù),yn為輸入序列,fyn()為映射關(guān)系,Yn為完成層殘差和歸一化的序列數(shù)據(jù)。2.1.2前饋神經(jīng)網(wǎng)絡(luò)層。由于前饋神經(jīng)網(wǎng)絡(luò)層的輸入和輸出不存在依賴(lài)關(guān)系,其一般由全連接層和激活函數(shù)層組成,全連接層增加模型的線性學(xué)習(xí)能力,激活函數(shù)增加非線性學(xué)習(xí)能力,將經(jīng)過(guò)多注意力機(jī)制處理后的向量Yn輸入到前饋神經(jīng)網(wǎng)絡(luò)層,見(jiàn)式(8),并進(jìn)行層殘差和歸一化完成最終編碼,見(jiàn)式(9),以避免過(guò)擬合現(xiàn)象。其中:SoftMax()?為全連接層所用函數(shù),Relu()?為激活函數(shù)層所用函數(shù),W1、W2為前饋神經(jīng)網(wǎng)絡(luò)層的權(quán)重矩陣,b1、b2為前饋神經(jīng)網(wǎng)絡(luò)層的偏置。
2.2ESIM-交叉注意力層
多元交通流參數(shù)融合可提高狀態(tài)識(shí)別準(zhǔn)確性。但現(xiàn)有研究主要是對(duì)多元交通流參數(shù)分別提取特征再輸入到一個(gè)特征融合層進(jìn)行直接融合,而忽略多元交通流參數(shù)間的狀態(tài)影響差和彼此間的相互作用。而ESIM交叉注意力機(jī)制可以強(qiáng)化不同交通流參數(shù)間的相似性和差異性,其流程如下:(1)相似性計(jì)算。計(jì)算不同交通流參數(shù)數(shù)據(jù)特征的相似度矩陣,獲取多元參數(shù)間的相似信息如式(10)至式(15)。其中:ai、bj、ck分別為流量、速度和占有率經(jīng)過(guò)多頭注意力機(jī)制和前饋神經(jīng)網(wǎng)絡(luò)處理后得到的特征向量;eij、eik、ejk分別為流量和速度、流量和占有率、速度和占有率的相似度矩陣;ai、bj、ck分別為利用注意力機(jī)制獲取的流量與速度和占有率的相似信息、速度與流量和占有率的相似信息以及占有率與流量和占有率的相似信息;l為向量?jī)?nèi)元素的個(gè)數(shù);αa、αb、αc分別為流量、速度和占有率向量的自適應(yīng)權(quán)重系數(shù)。(2)差異化增強(qiáng)。獲取流量、速度和占有率之間的差異特征,通過(guò)對(duì)<ai,ai>、<bj,bj>、<ck,ck>進(jìn)行差異操作和點(diǎn)積操作后拼接到原始向量后增強(qiáng)信息的差異性如式(16)至式(18)。其中:za、zb、zc分別后經(jīng)過(guò)信息差異化增強(qiáng)的流量、速度和占有率的特征。(3)池化操作。對(duì)增強(qiáng)后的流量、速度和占有率序列數(shù)據(jù)進(jìn)行池化操作來(lái)完成特征融合以提升模型魯棒性,見(jiàn)式(19)。由于拼接后可能會(huì)存在對(duì)序列長(zhǎng)度敏感,適應(yīng)能力降低,因此,對(duì)三個(gè)序列進(jìn)行平均池化和最大池化,并將最后的結(jié)果放入一組定長(zhǎng)向量中來(lái)獲得更好的效果。其中:pa,average、pb,average、pc,average分別為流量、速度和占有率的平均池化向量;pa,max、pb,max、pc,max分別為流量、速度和占有率的最大池化向量。
2.3分類(lèi)層
充分考慮多元參數(shù)間差異性,在完成流量、速度和占有率的特征信息加強(qiáng)后進(jìn)行暢通、穩(wěn)定、擁堵和擁塞4種交通狀態(tài)分類(lèi)識(shí)別,采用SoftMax分類(lèi)器輸出特征融合數(shù)據(jù)pi每個(gè)狀態(tài)類(lèi)別的概率值,最后選擇其中數(shù)值最大者的對(duì)應(yīng)類(lèi)別為預(yù)測(cè)的狀態(tài)類(lèi)別,見(jiàn)式(20)。其中:si為模型預(yù)測(cè)類(lèi)別的輸出概率;W3為全連接層的權(quán)重矩陣;b3為全連接層的偏置。選擇交叉熵為損失函數(shù)如式(21),來(lái)完成模型參數(shù)訓(xùn)練及動(dòng)態(tài)更新。其中:θ為模型要學(xué)習(xí)的所有參數(shù);T為訓(xùn)練數(shù)據(jù)集大小,C為狀態(tài)類(lèi)別;gji為第i個(gè)樣本所對(duì)應(yīng)的第j個(gè)類(lèi)別的實(shí)際輸出概率值,sji為第i個(gè)樣本所對(duì)應(yīng)的第j個(gè)類(lèi)別的預(yù)測(cè)輸出概率值;所有參數(shù)由Adam優(yōu)化器[14]完成。
3實(shí)驗(yàn)分析
3.1實(shí)驗(yàn)背景及設(shè)置
以京港澳高速保定互通→清苑為實(shí)驗(yàn)路段,該路段含5對(duì)出入口匝道和2座與其它高速互通立交橋,主線單向4車(chē)道,小、大車(chē)限速值分別為120km/h、100km/h,該路段為保定市繞城高速東環(huán)段,人們出行頻繁,有明顯高峰期特征,能呈現(xiàn)各種交通狀態(tài)。利用河北高速公路公司預(yù)處理后提供的2019年10月的流量、速度和占有率數(shù)據(jù)進(jìn)行實(shí)驗(yàn)。選擇每周一到周五6:00~21:00其中2周的交通流參數(shù)數(shù)據(jù),數(shù)據(jù)采集時(shí)間間隔為5min,參數(shù)數(shù)據(jù)正常,無(wú)異常點(diǎn),利用成熟的狀態(tài)評(píng)價(jià)體系,構(gòu)成由暢通、穩(wěn)定、擁堵和擁塞組成的4種狀態(tài)數(shù)據(jù)庫(kù)[15],每種類(lèi)別交通流參數(shù)包含1800條數(shù)據(jù),共包含5400條數(shù)據(jù),其中各類(lèi)別數(shù)據(jù)分布情況如表1所示,并將數(shù)據(jù)集按4:1分為訓(xùn)練集和測(cè)試集。實(shí)驗(yàn)基于TensorFlow1.15框架完成,Anaconda版本為5.1.1,Python版本為3.8,CUDA版本為11.3,Keras版本為2.1,設(shè)置學(xué)習(xí)率為0.001,Dropout為0.5,迭代100次。本文選擇正確率Accuracy作為模型的評(píng)價(jià)指標(biāo),見(jiàn)式(22)。
3.2實(shí)驗(yàn)結(jié)果及分析
為驗(yàn)證本文提出的狀態(tài)識(shí)別模型的有效性,將多元交通流參數(shù)進(jìn)行有效融合后的狀態(tài)識(shí)別結(jié)果和利用不同參數(shù)融合后進(jìn)行狀態(tài)識(shí)別的結(jié)果進(jìn)行對(duì)比,結(jié)果如表2所示。基于本模型,利用流量數(shù)據(jù)進(jìn)行實(shí)驗(yàn)為情景1,利用流量、占有率數(shù)據(jù)為情景2,利用流量、速度與占有率數(shù)據(jù)為情景3,得到不同情景下的損失曲線變化情況如圖2所示。由表2和圖2可以看出:(1)不同類(lèi)型的交通流參數(shù)對(duì)于狀態(tài)影響程度存在差異性。識(shí)別精度占有率最高,流量其次,速度最低。這是因?yàn)樵谝欢ǖ臅r(shí)間間隔內(nèi),相對(duì)流量和占有率而言,速度的波動(dòng)情況較頻繁,對(duì)于模型的學(xué)習(xí)能力產(chǎn)生一定干擾,但識(shí)別準(zhǔn)確性均在合理范圍內(nèi),表明了方法的有效性。(2)隨著融合交通流參數(shù)的類(lèi)別增加,模型的準(zhǔn)確性也在逐漸增加,對(duì)比單一參數(shù)數(shù)據(jù),多元參數(shù)數(shù)據(jù)能夠給予模型更多的有效信息,而Transformer模型利用多頭注意力機(jī)制給予合適權(quán)重實(shí)現(xiàn)并行化提取多元參數(shù)的特征信息,且多元參數(shù)的特征進(jìn)行相似性和差異性增強(qiáng)后,特征信息實(shí)現(xiàn)了有效融合,狀態(tài)識(shí)別的準(zhǔn)確性得以提升。(3)三種情景下,迭代開(kāi)始時(shí),損失函數(shù)值迅速下降,達(dá)到一定代數(shù),損失函數(shù)下降速度變緩,最后趨于穩(wěn)定,達(dá)到收斂,這表示本模型在不同情景下均有效,表明了模型的適應(yīng)能力較強(qiáng);情景1收斂速度最慢,約于50代實(shí)現(xiàn)收斂,期間波動(dòng)次數(shù)較多,情景2收斂速度適中,情景3收斂速度最快,約于40代收斂,波動(dòng)次數(shù)少,這是因?yàn)槎嘣獏?shù)能提供更多有效信息給予模型,且本方法充分考慮到不同交通流參數(shù)的相似性和差異性,信息特征能夠得到充分利用,因而能迅速達(dá)到收斂,減少了訓(xùn)練時(shí)間,這進(jìn)一步證明了本方法的有效性。
3.3與其他方法對(duì)比分析
為進(jìn)一步驗(yàn)證本方法的有效性,本文基于上述設(shè)置的三種情景,分別利用不同的方法進(jìn)行分類(lèi)識(shí)別。其中方法1為模糊聚類(lèi)算法;方法2為BP神經(jīng)網(wǎng)絡(luò)算法;方法3為支持向量機(jī)算法;方法4為本方法未進(jìn)行信息增強(qiáng)僅簡(jiǎn)單拼接;方法5為本方法。表3為不同情景下不同方法的狀態(tài)識(shí)別準(zhǔn)確率。由表3可以發(fā)現(xiàn):(1)在不同情景下,隨著交通流參數(shù)類(lèi)別增加,不同方法的交通狀態(tài)的識(shí)別準(zhǔn)確度呈現(xiàn)增加趨勢(shì),這是因?yàn)殡S著交通流參數(shù)類(lèi)別增加,各方法獲取更多有效信息的機(jī)會(huì)增加,機(jī)器學(xué)習(xí)的能力得以進(jìn)一步發(fā)揮,各方法能夠更充分理解不同交通流參數(shù)數(shù)據(jù)中的特征信息,有利于得出精準(zhǔn)的判別。(2)在不同情景下,對(duì)比模糊聚類(lèi)、BP神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)等傳統(tǒng)的機(jī)器學(xué)習(xí)算法,基于深度學(xué)習(xí)的Transformer模型的狀態(tài)識(shí)別精度較高,充分體現(xiàn)了Transformer模型的優(yōu)越性,其所用的注意力機(jī)制給予不同特征以合適權(quán)重使得信息傳遞的過(guò)程產(chǎn)生的損耗較少,學(xué)習(xí)能力更強(qiáng),并行化處理使更多有效信息被利用,訓(xùn)練時(shí)間更短,能夠滿足工程實(shí)際的需要。(3)對(duì)比方法4和方法5可以發(fā)現(xiàn),將多元交通流參數(shù)進(jìn)行簡(jiǎn)單拼接的狀態(tài)識(shí)別效果稍差,這是因?yàn)椴煌?lèi)別的交通流參數(shù)的影響程度并不同,若僅是簡(jiǎn)單拼接,雖然模型接收的信息量增加,但不能使模型接收到的有效信息量增加,Transformer模型處理非線性問(wèn)題的強(qiáng)大能力沒(méi)有得到充分發(fā)揮,而經(jīng)過(guò)ESIM交叉注意力層進(jìn)行信息相似性和差異性增強(qiáng)后進(jìn)行有效融合后使得該問(wèn)題得以解決。
4結(jié)束語(yǔ)
利用實(shí)際的多元交通流參數(shù)數(shù)據(jù)進(jìn)行實(shí)驗(yàn),本文提出基于Transformer-ESIM的高速公路交通狀態(tài)識(shí)別模型,實(shí)驗(yàn)結(jié)果表明:(1)在不同交通需求情景下,本方法的識(shí)別準(zhǔn)確性均在有效范圍內(nèi),特別是融合流量、速度和占有率后的準(zhǔn)確性最高,充分體現(xiàn)了本方法能夠充分利用多元交通流參數(shù)對(duì)狀態(tài)影響的差異性;(2)在不同交通需求情景下,對(duì)比其他傳統(tǒng)機(jī)器學(xué)習(xí)方法,本方法充分發(fā)揮Transformer對(duì)于非線性數(shù)據(jù)的處理能力,狀態(tài)識(shí)別的精準(zhǔn)度最高,充分體現(xiàn)了本方法的優(yōu)越性,能夠滿足工程實(shí)際需要。本研究?jī)H是初步研究,對(duì)大規(guī)模高速公路網(wǎng)絡(luò)的狀態(tài)預(yù)判以提升運(yùn)行效率有待進(jìn)一步研究。
作者:薛相全 龐明寶 單位:河北工業(yè)大學(xué) 土木與交通學(xué)院