Comet:基于 HTTP 長連接的“服務器推”技術(shù)
當前位置:點晴教程→知識管理交流
→『 技術(shù)文檔交流 』
很多應用譬如監(jiān)控、即時通信、即時報價系統(tǒng)都需要將后臺發(fā)生的變化實時傳送到客戶端而無須客戶端不停地刷新、發(fā)送請求。本文首先介紹、比較了常用的“服務器推”方案,著重介紹了 comet - 使用 http 長連接、無須瀏覽器安裝插件的兩種“服務器推”方案:基于 ajax 的長輪詢方式;基于 iframe 及 htmlfile 的流方式。最后分析了開發(fā) comet 應用需要注意的一些問題,以及如何借助開源的 comet 框架-pushlet 構(gòu)建自己的“服務器推”應用。 “服務器推”技術(shù)的應用 傳統(tǒng)模式的 web 系統(tǒng)以客戶端發(fā)出請求、服務器端響應的方式工作。這種方式并不能滿足很多現(xiàn)實應用的需求,譬如: 監(jiān)控系統(tǒng):后臺硬件熱插拔、led、溫度、電壓發(fā)生變化; 將“服務器推”應用在 web 程序中,首先考慮的是如何在功能有限的瀏覽器端接收、處理信息: 客戶端如何接收、處理信息,是否需要使用套接口或是使用遠程調(diào)用。客戶端呈現(xiàn)給用戶的是 html 頁面還是 java applet 或 flash 窗口。如果使用套接口和遠程調(diào)用,怎么和 javascript 結(jié)合修改 html 的顯示。 flash xmlsocket 如果 web 應用的用戶接受應用只有在安裝了 flash 播放器才能正常運行, 那么使用 flash 的 xmlsocket 也是一個可行的方案。 這種方案實現(xiàn)的基礎(chǔ)是: flash 提供了 xmlsocket 類。 關(guān)于如何去構(gòu)建充當了 javascript 與 flash xmlsocket 橋梁的 flash 程序,以及如何在 javascript 里調(diào)用 flash 提供的接口,我們可以參考 aflax(asynchronous flash and xml)項目提供的 socket demo 以及 socketjs(請參見 參考資源)。 javascript 與 flash 的緊密結(jié)合,極大增強了客戶端的處理能力。從 flash 播放器 v7.0.19 開始,已經(jīng)取消了 xmlsocket 的端口必須大于 1023 的限制。linux 平臺也支持 flash xmlsocket 方案。但此方案的缺點在于: 客戶端必須安裝 flash 播放器; java applet 套接口 在客戶端使用 java applet,通過 java.net.socket 或 java.net.datagramsocket 或 java.net.multicastsocket 建立與服務器端的套接口連接,從而實現(xiàn)“服務器推”。 這種方案最大的不足在于 java applet 在收到服務器端返回的信息后,無法通過 javascript 去更新 html 頁面的內(nèi)容。 基于 http 長連接的“服務器推”技術(shù) comet 簡介 瀏覽器作為 web 應用的前臺,自身的處理功能比較有限。瀏覽器的發(fā)展需要客戶端升級軟件,同時由于客戶端瀏覽器軟件的多樣性,在某種意義上,也影響了瀏覽器新技術(shù)的推廣。在 web 應用中,瀏覽器的主要工作是發(fā)送請求、解析服務器返回的信息以不同的風格顯示。ajax 是瀏覽器技術(shù)發(fā)展的成果,通過在瀏覽器端發(fā)送異步請求,提高了單用戶操作的響應性。但 web 本質(zhì)上是一個多用戶的系統(tǒng),對任何用戶來說,可以認為服務器是另外一個用戶?,F(xiàn)有 ajax 技術(shù)的發(fā)展并不能解決在一個多用戶的 web 應用中,將更新的信息實時傳送給客戶端,從而用戶可能在“過時”的信息下進行操作。而 ajax 的應用又使后臺數(shù)據(jù)更新更加頻繁成為可能。
下面將介紹兩種 comet 應用的實現(xiàn)模型。 基于 ajax 的長輪詢(long-polling)方式 如 圖 1 所示,ajax 的出現(xiàn)使得 javascript 可以調(diào)用 xmlhttprequest 對象發(fā)出 http 請求,javascript 響應處理函數(shù)根據(jù)服務器返回的信息對 html 頁面的顯示進行更新。使用 ajax 實現(xiàn)“服務器推”與傳統(tǒng)的 ajax 應用不同之處在于: 服務器端會阻塞請求直到有數(shù)據(jù)傳遞或超時才返回。 圖 2. 基于長輪詢的服務器推模型
在這種長輪詢方式下,客戶端是在 xmlhttprequest 的 readystate 為 4(即數(shù)據(jù)傳輸結(jié)束)時調(diào)用回調(diào)函數(shù),進行信息處理。當 readystate 為 4 時,數(shù)據(jù)傳輸結(jié)束,連接已經(jīng)關(guān)閉。mozilla firefox 提供了對 streaming ajax 的支持, 即 readystate 為 3 時(數(shù)據(jù)仍在傳輸中),客戶端可以讀取數(shù)據(jù),從而無須關(guān)閉連接,就能讀取處理服務器端返回的信息。ie 在 readystate 為 3 時,不能讀取服務器返回的數(shù)據(jù),目前 ie 不支持基于 streaming ajax。 基于 iframe 及 htmlfile 的流(streaming)方式 iframe 是很早就存在的一種 html 標記, 通過在 html 頁面里嵌入一個隱蔵幀,然后將這個隱蔵幀的 src 屬性設為對一個長連接的請求,服務器端就能源源不斷地往客戶端輸入數(shù)據(jù)。
從 圖 3 可以看到,每次數(shù)據(jù)傳送不會關(guān)閉連接,連接只會在通信出現(xiàn)錯誤時,或是連接重建時關(guān)閉(一些防火墻常被設置為丟棄過長的連接, 服務器端可以設置一個超時時間, 超時后通知客戶端重新建立連接,并關(guān)閉原來的連接)。 使用 iframe 請求一個長連接有一個很明顯的不足之處:ie、morzilla firefox 下端的進度欄都會顯示加載沒有完成,而且 ie 上方的圖標會不停的轉(zhuǎn)動,表示加載正在進行。google 的天才們使用一個稱為“htmlfile”的 activex 解決了在 ie 中的加載顯示問題,并將這種方法用到了 gmail+gtalk 產(chǎn)品中。alex russell 在 “what else is burried down in the depth's of google's amazing javascript?”文章中介紹了這種方法。zeitoun 網(wǎng)站提供的 comet-iframe.tar.gz,封裝了一個基于 iframe 和 htmlfile 的 javascript comet 對象,支持 ie、mozilla firefox 瀏覽器,可以作為參考。(請參見 參考資源) 使用 comet 模型開發(fā)自己的應用 上面介紹了兩種基于 http 長連接的“服務器推”架構(gòu),更多描述了客戶端處理長連接的技術(shù)。對于一個實際的應用而言,系統(tǒng)的穩(wěn)定性和性能是非常重要的。將 http 長連接用于實際應用,很多細節(jié)需要考慮。 不要在同一客戶端同時使用超過兩個的 http 長連接 我們使用 ie 下載文件時會有這樣的體驗,從同一個 web 服務器下載文件,最多只能有兩個文件同時被下載。第三個文件的下載會被阻塞,直到前面下載的文件下載完畢。這是因為 http 1.1 規(guī)范中規(guī)定,客戶端不應該與服務器端建立超過兩個的 http 連接, 新的連接會被阻塞。而 ie 在實現(xiàn)中嚴格遵守了這種規(guī)定。 http 1.1 對兩個長連接的限制,會對使用了長連接的 web 應用帶來如下現(xiàn)象:在客戶端如果打開超過兩個的 ie 窗口去訪問同一個使用了長連接的 web 服務器,第三個 ie 窗口的 http 請求被前兩個窗口的長連接阻塞。 所以在開發(fā)長連接的應用時, 必須注意在使用了多個 frame 的頁面中,不要為每個 frame 的頁面都建立一個 http 長連接,這樣會阻塞其它的 http 請求,在設計上考慮讓多個 frame 的更新共用一個長連接。 服務器端的性能和可擴展性 一般 web 服務器會為每個連接創(chuàng)建一個線程,如果在大型的商業(yè)應用中使用 comet,服務器端需要維護大量并發(fā)的長連接。在這種應用背景下,服務器端需要考慮負載均衡和集群技術(shù);或是在服務器端為長連接作一些改進。 應用和技術(shù)的發(fā)展總是帶來新的需求,從而推動新技術(shù)的發(fā)展。http 1.1 與 1.0 規(guī)范有一個很大的不同:1.0 規(guī)范下服務器在處理完每個 get/post 請求后會關(guān)閉套接口連接; 而 1.1 規(guī)范下服務器會保持這個連接,在處理兩個請求的間隔時間里,這個連接處于空閑狀態(tài)。 java 1.4 引入了支持異步 io 的 java.nio 包。當連接處于空閑時,為這個連接分配的線程資源會返還到線程池,可以供新的連接使用;當原來處于空閑的連接的客戶發(fā)出新的請求,會從線程池里分配一個線程資源處理這個請求。 這種技術(shù)在連接處于空閑的機率較高、并發(fā)連接數(shù)目很多的場景下對于降低服務器的資源負載非常有效。 但是 ajax 的應用使請求的出現(xiàn)變得頻繁,而 comet 則會長時間占用一個連接,上述的服務器模型在新的應用背景下會變得非常低效,線程池里有限的線程數(shù)甚至可能會阻塞新的連接。jetty 6 web 服務器針對 ajax、comet 應用的特點進行了很多創(chuàng)新的改進,請參考文章“ajax,comet and jetty”(請參見 參考資源)。 控制信息與數(shù)據(jù)信息使用不同的 http 連接 使用長連接時,存在一個很常見的場景:客戶端網(wǎng)頁需要關(guān)閉,而服務器端還處在讀取數(shù)據(jù)的堵塞狀態(tài),客戶端需要及時通知服務器端關(guān)閉數(shù)據(jù)連接。服務器在收到關(guān)閉請求后首先要從讀取數(shù)據(jù)的阻塞狀態(tài)喚醒,然后釋放為這個客戶端分配的資源,再關(guān)閉連接。 所以在設計上,我們需要使客戶端的控制請求和數(shù)據(jù)請求使用不同的 http 連接,才能使控制請求不會被阻塞。 在實現(xiàn)上,如果是基于 iframe 流方式的長連接,客戶端頁面需要使用兩個 iframe,一個是控制幀,用于往服務器端發(fā)送控制請求,控制請求能很快收到響應,不會被堵塞;一個是顯示幀,用于往服務器端發(fā)送長連接請求。如果是基于 ajax 的長輪詢方式,客戶端可以異步地發(fā)出一個 xmlhttprequest 請求,通知服務器端關(guān)閉數(shù)據(jù)連接。 在客戶和服務器之間保持“心跳”信息 在瀏覽器與服務器之間維持一個長連接會為通信帶來一些不確定性:因為數(shù)據(jù)傳輸是隨機的,客戶端不知道何時服務器才有數(shù)據(jù)傳送。服務器端需要確保當客戶端不再工作時,釋放為這個客戶端分配的資源,防止內(nèi)存泄漏。因此需要一種機制使雙方知道大家都在正常運行。在實現(xiàn)上: 服務器端在阻塞讀時會設置一個時限,超時后阻塞讀調(diào)用會返回,同時發(fā)給客戶端沒有新數(shù)據(jù)到達的心跳信息。此時如果客戶端已經(jīng)關(guān)閉,服務器往通道寫數(shù)據(jù)會出現(xiàn)異常,服務器端就會及時釋放為這個客戶端分配的資源。 pushlet 是一個開源的 comet 框架,在設計上有很多值得借鑒的地方,對于開發(fā)輕量級的 comet 應用很有參考價值。 觀察者模型 pushlet 使用了觀察者模型:客戶端發(fā)送請求,訂閱感興趣的事件;服務器端為每個客戶端分配一個會話 id 作為標記,事件源會把新產(chǎn)生的事件以多播的方式發(fā)送到訂閱者的事件隊列里。 客戶端 javascript 庫 pushlet 提供了基于 ajax 的 javascript 庫文件用于實現(xiàn)長輪詢方式的“服務器推”;還提供了基于 iframe 的 javascript 庫文件用于實現(xiàn)流方式的“服務器推”。 javascript 庫做了很多封裝工作: 定義客戶端的通信狀態(tài):state_error、state_abort、state_null、state_ready、state_joined、state_listening; 客戶端與服務器端通信信息格式 pushlet 定義了一套客戶與服務器通信的信息格式,使用 xml 格式。定義了客戶端發(fā)送請求的類型:join、leave、subscribe、unsubscribe、listen、refresh;以及響應的事件類型:data、join_ack、listen_ack、refresh、heartbeat、error、abort、subscribe_ack、unsubscribe_ack。 服務器端事件隊列管理 pushlet 在服務器端使用 java servlet 實現(xiàn),其數(shù)據(jù)結(jié)構(gòu)的設計框架仍可適用于 php、c 編寫的后臺客戶端。 pushlet 支持客戶端自己選擇使用流、拉(長輪詢)、輪詢方式。服務器端根據(jù)客戶選擇的方式在讀取事件隊列(fetchevents)時進行不同的處理?!拜喸儭蹦J较?fetchevents() 會馬上返回?!绷鳌昂汀崩澳J绞褂米枞姆绞阶x事件,如果超時,會發(fā)給客戶端發(fā)送一個沒有新信息收到的“heartbeat“事件,如果是“拉”模式,會把“heartbeat”與“refresh”事件一起傳給客戶端,通知客戶端重新發(fā)出請求、建立連接。 客戶服務器之間的會話管理 服務端在客戶端發(fā)送 join 請求時,會為客戶端分配一個會話 id, 并傳給客戶端,然后客戶端就通過此會話 id 標明身份發(fā)出 subscribe 和 listen 請求。服務器端會為每個會話維護一個訂閱的主題集合、事件隊列。 服務器端的事件源會把新產(chǎn)生的事件以多播的方式發(fā)送到每個會話(即訂閱者)的事件隊列里。 小結(jié) 本文介紹了如何在現(xiàn)有的技術(shù)基礎(chǔ)上選擇合適的方案開發(fā)一個“服務器推”的應用,最優(yōu)的方案還是取決于應用需求的本身。相對于傳統(tǒng)的 web 應用, 目前開發(fā) comet 應用還是具有一定的挑戰(zhàn)性。 “服務器推”存在廣泛的應用需求,為了使 comet 模型適用于大規(guī)模的商業(yè)應用,以及方便用戶構(gòu)建 comet 應用,最近幾年,無論是服務器還是瀏覽器都出現(xiàn)了很多新技術(shù),同時也出現(xiàn)了很多開源的 comet 框架、協(xié)議。需求推動技術(shù)的發(fā)展,相信 comet 的應用會變得和 ajax 一樣普及。 關(guān)于作者
周婷,軟件工程師,目前在 ibm 中國軟件開發(fā)技術(shù)實驗室從事刀片服務器管理固件的開發(fā)工作。您可以通過
本文來自csdn博客,轉(zhuǎn)載請標明出處: 該文章在 2023/12/17 23:58:04 編輯過 |
關(guān)鍵字查詢
相關(guān)文章
正在查詢... |