史上最最靠谱,又双叒叒简单的基于MSXML的XML解析指南-C++

栏目: 编程语言 · XML · 发布时间: 5年前

内容简介:最近做C++相关的项目,遇到同时使用COM和MSXML来解析XML文件中信息的问题,这类问题如果做MFC开发也会经常用到。在网上搜了一整圈,确实很难找到可用的code,总算自己研究出高效而简单的方法,借此机会总结一下,并分享给大家。附 VS Project镜像:

史上最最靠谱,又双叒叒简单的基于MSXML的XML解析指南-C++

最近做C++相关的项目,遇到同时使用COM和MSXML来解析XML文件中信息的问题,这类问题如果做MFC开发也会经常用到。

在网上搜了一整圈,确实很难找到可用的code,总算自己研究出高效而简单的方法,借此机会总结一下,并分享给大家。

附 VS Project镜像:

SimpleParser4MSXML-cpp: C++语言写的MSXML的简单使用示例, COM 和 MFC 开发中比较常用。

https://github.com/yanglr/Sim...

点击”Raw”可看到源码,欢迎fork或star~

首先简要列举一下MSXML技术的基本特点。

基于 COM 的技术,用于处理 Windows 操作系统随附的 XML。
MSXML 提供 DOM 本机实现,同时支持 XPath 和 XSLT。
包含 SAX2 基于事件的分析器。

流程设计

首先简要介绍一下大概流程:

  • 初始化COM
  • 创建一个IDOMDocument对象xmlDoc,使用xmlDoc -> load() 或 loadXML()方法读入 XML源
  • 调用selectNodes()或者selectSingleNode()函数,选取指定的节点对象。
  • 通过IXMLDOMNode对象的属性和方法读取节点对象的内容。
  • 通过IXMLDOMNode对象的属性和方法设置节点对象的内容。
  • 通过调用xmlDoc -> save()保存XML文件。
  • 关闭COM

需要解决的问题:

  • xml信息有哪几种读取形式(xml文件或wchar)
  • 如何选取节点,and取节点属性有哪些方法?
  • IXMLDOMNode 与 IXMLDOMElement 接口有什么联系和区别?
  • 节点如果是数组,怎么操作?
  • 如何为属性插入属性
  • 字符串的转换

xml信息有哪几种读取形式(xml文件或wchar)

  • xml文件

从文件中导入xml内容,使用url或filePath

VARIANT_BOOL bSuccess = false;
HRESULT hr = iXMLDoc->load(CComVariant(L"./test.xml"), &bSuccess); // 此处的L可以省略

当已变量方式传人filePath时,需要使用c_str()函数转换一下,代码如下:

VARIANT_BOOL bSuccess = false;
filePath = "./test.xml";
HRESULT hr = iXMLDoc->load(CComVariant(filePath.c_str()), &bSuccess);
  • 已以字符串格式读入的xml完整代码

先定义一个 <font color=blue>BSTR 常量

const wchar_t *src = L""
L"<?xml version=\"1.0\" encoding=\"utf-16\"?>\r\n"
L"<root desc=\"Great\">\r\n"
L"  <text>Hey</text>\r\n"
L"    <layouts>\r\n"
L"    <lay index=\"15\" bold=\"true\"/>\r\n"
L"    <layoff index=\"12\"/>\r\n"
L"    <layin index=\"17\"/>\r\n"
L"  </layouts>\r\n"
L"</root>\r\n";

然后从 <font color=blue>BSTR 导入xml内容:

VARIANT_BOOL bSuccess = false;
iXMLDoc->loadXML(CComBSTR(src), &bSuccess);

注: BSTR字符串是用于COM组件对象模型的字符串格式, 字符串以表示字符串长度的4字节整数开始, 然后跟上UTF-16编码的wchar_t字符串(包括0结束标志)。BSTR类型的变量是一个指针, 指向字符串的第一个字符处。

如何选取节点,and取节点属性有哪些方法?

  • 搜索节点名字
CComBSTR sstrRoot(L"root"); // sstrRoot("root");
CComPtr<IXMLDOMNode> rootNode;
HRESULT hr = iXMLDoc->selectSingleNode(sstrRoot, &rootNode);
CComPtr<IXMLDOMNode> textNode;
hr = rootNode->selectSingleNode(CComBSTR(L"text"), &textNode); // 搜索第一个"text"节点

IXMLDOMNode 与 IXMLDOMElement 接口有什么联系和区别

IXMLDOMElement接口继承于IXMLDOMNode接口,但除了从IXMLDOMNode接口继承的方法之外,IXMLDOMElement接口还向外暴露以下方法:

方法 说明
get_tagName 检索元素名称(在tag之间的文本)。
getAttribute 检索所指定名字的属性的值。
getAttributeNode 检索所指定名字的属性的节点
getElementsByTagName 检索与提供的名称匹配的所有子元素的列表。
removeAttribute 移动或替换给定名称的属性
removeAttributeNode 从这个元素中移除指定的属性
setAttribute 为给定名称的属性设置值
setAttributeNode 在此元素上添加或替换提供的属性节点。

节点如果是数组,怎么操作?

先使用get_childNodes函数获得子节点列表,然后遍历之用get_item依次取出每一项进行处理。

CComPtr<IXMLDOMElement> pRootElement;
    CComPtr<IXMLDOMNodeList> pNodeList;
    pRootElement->get_childNodes(&pNodeList); // Child node list
    long nLen;
    pNodeList->get_length(&nLen);    // Child node list
    for (long index = 0; i != nLen; ++index) // Traverse
    {
        CComPtr<IXMLDOMNode> pCurNode;
        hr = pNodeList->get_item(index, &pCurNode);
        do();  // 此处可做任何你想做的事情
    }

如何为属性插入属性

使用Element->setAttribute()即可,具体如下:

CComPtr<IXMLDOMElement> imageElement;
xmlDocData->createElement(CComBSTR(L"Image"), &imageElement); // 创建节点"Image"
imageElement->setAttribute(CComBSTR(L"Type"), CComVariant(CComBSTR(imageType.c_str())));  // 添加属性"Type"

字符串的转换与输出

  • 直接使用 <font color=blue>printf 函数+“%ls”或 <font color=blue>wprintf 函数+“%s”打印 <font color=blue>BSTR 类字符串
CComBSTR ssName;
    printf("Node name:%ls\n", ssName);   // 用%ls打印BSTR字符串内容
    SysFreeString(ssName);               // 用完字符串后必须释放

CComBSTR ssName;
    wprintf(L"Node name:%s\n", ssName);   // 这里的L不能省略
    SysFreeString(ssName);
    • <font color=blue>CComBSTR 类字符串的内容复制到 <font color=blue>wstring 中,然后使用 <font color=blue>wcout 输出
    CComBSTR ssName;
       wstring bstrText(ssName);
       wcout << bstrText << endl;
    • 先将 <font color=blue>CComBSTR 类字符串强转为 <font color=blue>LPCTSTR 类型后,然后使用 <font color=blue>wcout 输出

    <font color=blue>CStringW 类字符串而言,这已经是一种比较简单的方式了。

    CComBSTR ssName;
       CString cstring(ssName);
       wcout << (LPCTSTR)cstring << endl;
    • <font color=blue>CComBSTR 类字符串的内容复制到 <font color=blue>CW2A 类字符串(多字节字符串)中,然后使用 <font color=blue>wcout 输出
    CComBSTR ssName;
    CW2A printstr(ssName);
    cout << printstr << endl;

    主要代码

    #include <msxml6.h>   // 含有 MSXML最新版
    #include <atlbase.h>
    #include "atlstr.h"  // 含有CString, CStringW和CW2A
    #include <iostream>  // 包含wcout函数
    #include <string>    // 包含 c_str()函数, wcout
    #include "comutil.h" // 包含_bstr_t
    using namespace std;
    
    const wchar_t *src = L""
    L"<?xml version=\"1.0\" encoding=\"utf-16\"?>\r\n"
    L"<root desc=\"Great\">\r\n"
    L"  <text>Hey</text>\r\n"
    L"    <layouts>\r\n"
    L"    <lay index=\"15\" bold=\"true\"/>\r\n"
    L"    <layoff index=\"12\"/>\r\n"
    L"    <layin index=\"17\"/>\r\n"
    L"  </layouts>\r\n"
    L"</root>\r\n";
    
    int main()
    {
        CoInitialize(NULL); // Initialize COM
    
        CComPtr<IXMLDOMDocument> iXMLDoc;  // Or use CComPtr<IXMLDOMDocument2>, CComPtr<IXMLDOMDocument3>
    
        try
        {
            HRESULT hr = iXMLDoc.CoCreateInstance(__uuidof(DOMDocument));
            //     iXMLDoc.CoCreateInstance(__uuidof(DOMDocument60));
    
            // Load the file. 
            VARIANT_BOOL bSuccess = false;
    
            // Load it from a url/filename...
            hr = iXMLDoc->load(CComVariant(L"./test.xml"), &bSuccess);
            // filePath = "./test.xml";
            // hr = iXMLDoc->load(CComVariant(filePath.c_str()), &bSuccess);
    
            // or from a BSTR...
            // iXMLDoc->loadXML(CComBSTR(src), &bSuccess);
    
            // Get a smart pointer (sp) to the root
            CComPtr<IXMLDOMElement> pRootElement;
            hr = iXMLDoc->get_documentElement(&pRootElement); // Root elements
    
            // Get Attribute value of the note "root"
            CComBSTR ssDesc("desc");
            CComVariant deVal(VT_EMPTY);
            hr = pRootElement->getAttribute(ssDesc, &deVal);
    
            CComBSTR sstrRoot(L"root"); // sstrRoot("root");
            CComPtr<IXMLDOMNode> rootNode;
            hr = iXMLDoc->selectSingleNode(sstrRoot, &rootNode);  // Search "root"
    
            CComBSTR rootText;
            hr = rootNode->get_text(&rootText);
            if (SUCCEEDED(hr))
            {
                wstring bstrText(rootText);
                wcout << "Text of root: " << bstrText << endl;
            }
    
            CComPtr<IXMLDOMNode> descAttribute;
            hr = rootNode->selectSingleNode(CComBSTR("@desc"), &descAttribute); // Atrribute需要用@, 而各个节点不能使用@作为前缀来搜索
            CComBSTR descVal;
            hr = descAttribute->get_text(&descVal);
            if (SUCCEEDED(hr))
            {
                wstring bstrText(descVal);
                wcout << "Desc Attribute: " << bstrText << endl;
            }
    
            if (!FAILED(hr))
            {
                wstring strVal;
                if (deVal.vt == VT_BSTR)
                    strVal = deVal.bstrVal;
    
                wcout << "desc: " << strVal << endl;
            }
    
            CComPtr<IXMLDOMNodeList> pNodeList;
            pRootElement->get_childNodes(&pNodeList); // Child node list
            long nLen;
            pNodeList->get_length(&nLen);    // Child node list
            for (long i = 0; i != nLen; ++i) // Traverse
            {
                CComPtr<IXMLDOMNode> pNode;
                hr = pNodeList->get_item(i, &pNode);
    
                CComBSTR ssName;
                CComVariant val(VT_EMPTY);
                hr = pNode->get_nodeName(&ssName);
                if (SUCCEEDED(hr))
                {
                    wstring bstrText(ssName);
                    wcout << "Name of node " << (i + 1) << ": " << bstrText << endl;
    
                    CString cstring(ssName);
                    // To display a CStringW correctly, use wcout and cast cstring to (LPCTSTR), an easier way to display wide character strings.
                    wcout << (LPCTSTR)cstring << endl;
    
                    // CW2A converts the string in ccombstr to a multi-byte string in printstr, used for display output.
                    CW2A printstr(ssName);
                    cout << printstr << endl;
                }
            }
    
            /// Add(Append) node
            CComPtr<IXMLDOMDocument>& xmlDocData(iXMLDoc);
            CComPtr<IXMLDOMElement> imageElement;
            CComPtr<IXMLDOMNode> newImageNode;
            string imageType = "jpeg";
            char buffer[MAX_PATH];
            GetCurrentDirectory(MAX_PATH, buffer);  //  Get Current Directory
            string path(buffer); // Copy content of char*, generate a string
            string imagePath = path + "\\com.jpg";
    
            xmlDocData->createElement(CComBSTR(L"Image"), &imageElement);
            imageElement->setAttribute(CComBSTR(L"Type"), CComVariant(CComBSTR(imageType.c_str()))); // 为当前节点添加属性
            imageElement->setAttribute(CComBSTR(L"FileName"), CComVariant(CComBSTR(imagePath.c_str())));
            rootNode->appendChild(imageElement, &newImageNode);
    
            /// Remove "text" node under "root" node
            CComPtr<IXMLDOMNode> xmlOldNode;
            CComPtr<IXMLDOMNode> textNode;
            hr = rootNode->selectSingleNode(CComBSTR(L"text"), &textNode); // Search "text" node        
            hr = rootNode->removeChild(textNode, &xmlOldNode);
    
            /// Update XML
            hr = iXMLDoc->save(CComVariant("updated.xml"));
        }
        catch (char* pStrErr) {
            // Some error...
            std::cout << pStrErr << std::endl << std::endl;
        } // catch
        catch (...) {
            // Unknown error...
            std::cout << "Unknown error..." << std::endl << std::endl;
        }
    
        // Release() - that gets done automatically, also can manually do for each opened node or elements.
        // iXMLDoc.Release();
    
        // Stop COM
        CoUninitialize();
    
        system("pause");
        return 0;
    }

    运行结果:

    史上最最靠谱,又双叒叒简单的基于MSXML的XML解析指南-C++

    运行完,得到的update.xml内容为:

    https://raw.githubusercontent...

    参考资料:

    1. IXMLDOMElement接口
    2. Using the MSXML Parser
    3. MFC C++ XML Parse - Using MSXML
    4. 如何:各种字符串类型之间转换 | Microsoft Docs

    本文原载于本人csdn博客 →

    https://blog.csdn.net/lzuacm/...

    以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

    查看所有标签

    猜你喜欢:

    本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

    部落:一呼百应的力量

    部落:一呼百应的力量

    高汀 (Godin.S.) / 刘晖 / 中信出版社 / 2009-7 / 26.00元

    部落指的是任何一群人,规模可大可小,他们因追随领导、志同道合而相互联系在一起。人类其实数百万年前就有部落的出现,随之还形成了宗教、种族、政治或甚至音乐。 互联网消除了地理隔离,降低了沟通成本并缩短了时间。博客和社交网站都有益于现有的部落扩张,并促进了网络部落的诞生——这些部落的人数从10个到1000万个不等,他们所关注的也许是iPhone,或一场政治运动,或阻止全球变暖的新方法。 那么......一起来看看 《部落:一呼百应的力量》 这本书的介绍吧!

    JSON 在线解析
    JSON 在线解析

    在线 JSON 格式化工具

    在线进制转换器
    在线进制转换器

    各进制数互转换器

    MD5 加密
    MD5 加密

    MD5 加密工具