可擴展標記語言(XML)作為一種簡單的、中性的、易讀的數據表示形式已經變得越來越流行,許多軟體廠商宣布的「支持XML",意味著他們的產品將能生成或處理XML數據.XML也被看作再企業間交換數據最佳格式.它允許企業在所交換的數據的XML的文檔類型定義(Document Type Definitions,DTDs)或模式(Schema)上取得一致.這些DTDs或Schema是獨立於企業使用的資料庫模式的.
本文將用研究在不同計算機之間通訊與處理XML數據的分散式系統的構建方法,主要是運行在不同的虛擬機上的JAVA應用之間的XML通訊.
XML通訊
萬維網協會(World Wide Web Consortium, W3C)在XML規範中定義了XML的語法和語義.為了處理XML數據,XML文檔必須經過解析.W3C定義了文檔對象模型(DOM),它是應用程序員處理XML數據的介面.DOM已經有包括JAVA在內的許多語言的實現.JAVA應用程序可以通過DOM API來訪問XML數據.XML解析器將產生XML文檔的DOM表示.
圖1說明了處理XML文檔的JAVA分散式應用的簡單模型.這個模型假設數據可以從諸如關係資料庫之類的數據源得到.JAVA代碼處理數據並最終產生DOM表示,這些代碼表示為圖中的處理器.
處理器代碼將DOM代表的XML數據傳給發送者.發送者是與接收者進行XML數據通訊的JAVA代碼.接收者JAVA代碼來接受XML數據,產生DOM表示的數據並把它傳送給另一個處理器.簡而言之,發送者和接收者抽象了DOM表示的XML數據的通訊.
發送者和接收者不是在同一個JAVA虛擬機上執行的.他們是通過分散式系統的構件來相連的.無論是接收者還是發送者都既是客戶端又是伺服器端,兩者的數據傳輸都是雙向的.
Xbeans
就像將要看到的一樣,在本文中描述的發送者和接收者的三種實現方法都都是通過Xbeans來實現.Xbeans是一種接受XML數據作為輸入,處理這個輸入然後向下一個Xbeans輸出XML結果的軟體構件.Xbeans的輸入輸出都是XML的DOM文檔,亦即傳送給Xbeans的不是需要XML解析器解析的字元串,而是通過W3C的標準DOM API解析成了文檔對象.圖2說明了一個Xbeans.
Xbeans是JavaBeans,支持封裝、重用、連接和客戶化Java代碼.通過適當的一些Xbeans和JavaBeans的設計工具,我們就能編很少的代碼構建非常有用的分散式應用. Xbeans從IBM的XML的JAVA開發工具包而來,在其上作了少量修改以便更適合分散式的應用.Xbeans能夠從www.Xbeans.org的開放源碼項目中免費獲得.
下面將介紹用JAVA實現發送者和接收者的三種不同的方法.然後對每種方法作一個簡單的分析.
方法一:用標準的web 伺服器
這種方法將只是簡單的將XML作為文本發送給遠程計算機上的web伺服器.發送方必須將DOM表示的XML轉化為文本來與接收方進行通訊.然後,接受方必須將文本還原為DOM表示,如圖3:
以下代碼段用HTTP來實現發送者.這裡用到了IBM Java開發包中的DOMWriter類來實現DOM表示到文本XML表示的轉換.
public void documentReady(DOMEvent evt) throws XbeansException { try { URL receiver = new URL (getRemoteURL ()); URLConnection receiverConnection = receiver.openConnection(); receiverConnection.setDoOutput(true); //向發送者打開一個輸出流然後發送文本形式的XML數據 OutputStream out = receiverConnection.getOutputStream(); DOMWriter writer = new DOMWriter(); writer.setPrintWriter(new PrintWriter(out)); writer.documentReady( new com.ibm.xml.xpk4j.dom.DOMEvent( this,evt.getDocument())); out.close(); // 為結果打開一個輸入流 BufferedReader in = New BufferedReader( new InputStreamReader(receiverConnection.getInputStream())); // 處理結果:"OK" 表示成功;"Exception" 表示輸入流串列化異常 ... in.close(); } catch (Throwable e) { e.printStackTrace(System.err); } } |
注意到以上的documentReady()方法用remoteURL屬性得到伺服器上的CGI腳本的URL.為了與HTTP兼容,CGI腳本類用字元串」Content-type: text/html"封裝接收者的輸出.這個腳本然後調用伺服器上的the receiverMain()方法. Main()函數只是簡單的實例化接收者然後調用其receiveDocument()方法.
import org.xbeans.communication.stdio.receiver.*; public class receiverMain { static Bean theReceiver = new Bean(); public static void main(String[] args) { theReceiver.receiveDocument(); } } |
receiveDocument()方法的代碼段將重新生成DOM表示以便進一步處理.這裡用到了IBM的XML解析器.
DOMParser parser = new DOMParser(); // 構造解析器 try { // 調用解析器 parser.parse(new InputSource(System.in)); } catch (Throwable e) { throw new XbeansException("","receiver","io error parsing incoming document", "io error parsing incoming document " e); } //將文檔傳向下一個bean DOMListener.documentReady(new DOMEvent(this,parser.getDocument())); |
方法二:通過JAVA遠程方法調用串列化文檔
這個方法通過JAVA遠程方法調用(JAVA RMI)和DOM串列化(serialization)來從發送者向接收者傳輸XML DOM 文檔.如圖4:
public void documentReady(DOMEvent evt) throws XbeansException { if (DOMListener==null) { try { DOMListener = (DOMListener)Naming.lookup(getReceiverName()); } catch (Exception e) { throw new XbeansException( evt.getDocument().getNodeName(), "sender", "error obtaining remote receiver", "The name may be wrong or the network may be down."); } } DOMListener.documentReady(evt); } |
以下是接受方的JAVA 遠程方法調用的實現.setName()方法將接受這傳送給RMI註冊(registry),documentReady()方法僅僅將接收到的文檔傳送給下一個組件.
public void setReceiverName(String newName) { try { if (receiverName!=null) Naming.unbind(receiverName); receiverName = newName; Naming.rebind(receiverName, this ); } catch( Exception e ) { System.out.println( e ); } } public void documentReady(Document incomingDocument) throws RemoteException, XbeansException { if (DOMListener==null) { throw new XbeansException(incomingDocument.getNodeName(),"rmiReceiver", "next component not established", "The component needs to be configured."); } DOMListener.documentReady(new DOMEvent(this,incomingDocument)); } |
方法三:CORBA-IIOP
第三方法用CORBA-IIOP(CORBA over Internet Inter-ORB Protocol)來傳輸數據.對象管理組織(OMG)正在建議擴展介面定義語言(IDL)將XML數據類型包括進去.這樣,將來CORBA產品將能傳輸XML數據.如圖5所示:
以下的OMG IDL給出了發送者和接收者CORBA實現的介面.
exception RemoteReceiverException { string remoteIdentifier; string documentName; string componentName; string message; string moreMessage; }; typedef sequence byteArray; interface XMLReceiver { void documentReady(in byteArray serializedDocument) raises(RemoteReceiverException); }; |
以下代碼用JAVA串列化DOM和CORBA實現發送者.
public void documentReady(DOMEvent evt) throws XbeansException { Document documentToSend = evt.getDocument(); try { ByteArrayOutputStream bastream = new ByteArrayOutputStream(); ObjectOutputStream p = new ObjectOutputStream(bastream); p.writeObject(documentToSend); p.flush(); org.omg.CORBA.ORB orb = org.omg.CORBA.ORB.init( new String[0], System.getProperties()); XMLReceiver receiver = urlToObject(orb,getReceiverURL()); receiver.documentReady(bastream.toByteArray()); } catch (RemoteReceiverException rre) { throw new XbeansException(rre.remoteIdentifier, rre.documentName, rre.componentName, rre.message,rre.moreMessage); } catch (Throwable e) { throw new XbeansException("","sender", "error sending document " e, "error sending document " e); } } |
以下代碼用JAVA串列化DOM和CORBA實現接收者.
public void documentReady(byte[] serializedDocument)throws RemoteReceiverException { // 反串列化位元組流 ByteArrayInputStream bais = new ByteArrayInputStream(serializedDocument); Document theDocument; try { ObjectInputStream ois = new ObjectInputStream(bais); theDocument = (Document)ois.readObject(); } catch(Throwable e) { throw new RemoteReceiverException(corbaName,"incoming document","receiver", "error deserializing document","error deserializing document" e); } try { //將文檔傳向監聽者 local.DOMListener.documentReady(new DOMEvent(this,theDocument)); } catch (XbeansException xbe) { throw new RemoteReceiverException( xbe.remoteIdentifier(), xbe.documentName(),xbe.componentName(), xbe.message(),xbe.moreMessage()); } } |
分析:
測試表明,純文本表示的XML要比DOM串列化表示性能更好.同時,解析DOM和文本所用的時間也要比用JAVA直接串列化和法串列化所用的時間少.
標準的web伺服器方式的優勢是其應用基礎要廣泛許多.CGI腳本能夠在絕大多數web伺服器上運行,,接受方能夠很容易的通過URL標識.而對於RMI,則需要RMI註冊.CORBA的解決辦法則需要在伺服器上安裝對象請求代理(Object Request Broker,ORB ),,CORBA發送者的實現使用的是一個URL的命名模式而不是接收者的CORBA對象引用,用一個字元串與一個URL相聯繫,然後在客戶端轉化.
CORBA 和RMI支持JAVA 客戶端到JAVA伺服器的解決方案.沒有CGI腳本也不需要從標準輸入中讀取編碼異常.,不需要在發送者每次用XML通訊時都啟動一個JAVA虛擬機.他們兩則均支持接收者的自動激活.
JAVA RMI方式只能在JAVA代碼之間工作,對於web伺服器包括CORBA理論上能在任何編程語言之間通訊.對於JAVA串列化的DOM來說,即便是客戶端和伺服器端均需要是JAVA代碼的要求不是問題,它還存在另外一個困難,即JAVA串列化要求客戶端和伺服器運行的是相同的DOM實現.
結論
正如上面所述,有許多方法可以實現在JAVA分散式應用中發送XML數據,每一種方法的性能和互操作性都是不同的.重要的是應該把XML通訊從分散式應用邏輯中抽取出來.也就是,實現發送和接受XML的代碼應和應用邏輯的代碼中分離出來.通過把代碼打包成軟體組件,就能夠改變發送方和接受方的代碼而不會影響到應用其餘實現.
[火星人 ] 用JAVA和XML構建分散式系統已經有281次圍觀