parser:parseErrorOccurred31#parser:parseErrorOccur

//取XML文件的前40个字节
NSData*xmldata=[self.ItemDatasubdataWithRange:NSMakeRange(0,40)];

//以UTF-8编码进行解码
Nsstring*xmlstr=[[Nsstringalloc]initWithData:xmldataencoding:NSUTF8StringEncoding];
//NSLog(@"XMLHEADER:%@",xmlstr);
//搜索GB2312,如果找到,就对整个文件进行编码转换
if([xmlstrrangeOfString:@"\"GB2312\""options:NSCaseInsensitiveSearch].location!=NSNotFound)
{
//NSLog(@"GB2312encodingfounded.");

nsstringencodingenc=CFStringConvertEncodingTonsstringencoding(kcfStringEncodingGB_18030_2000);
Nsstring*utf8str=[[[Nsstringalloc]initWithData:self.ItemDataencoding:enc]autorelease];
utf8str=[utf8strstringByReplacingOccurrencesOfString:@"\"GB2312\""withString:@"\"utf-8\""options:NSCaseInsensitiveSearchrange:NSMakeRange(0,40)];
NSData*newData=[utf8strdataUsingEncoding:NSUTF8StringEncoding];
self.ItemData=newData;
}

GB2312或GBK编码的网页,要先用gb编码解码,然后替换其中的gb字符串,再用utf8编码成data给parser就能解析中文网页了。


NSXMLParser 将停止解析在遇到特殊字符后


我读一个 XML 文件从谷歌天气 api 和解析它使用 NSXMLParser。城市问题是巴黎。这是我得到的简短 xml 输出

<?xmlversion="1.0"?>
<xml_api_replyversion="1">
<weathermodule_id="0"tab_id="0"mobile_row="0"mobile_zipped="1"row="0"section="0"><forecast_information>
<citydata="Paris,Île-de-France"/>
<postal_codedata="Paris"/>
<latitude_e6data=""/>
<longitude_e6data=""/>
...
...

现在我用来削去此 xml 的代码

Nsstring*address=@"http://www.google.com/ig/api?weather=Paris";
NSURL*URL=[NSURLURLWithString:address];

NSXMLParser*parser=[[NSXMLParseralloc]initWithContentsOfURL:URL];
[parsersetDelegate:self];
[parserparse];
...

-(void)parser:(NSXMLParser*)parserdidStartElement:(Nsstring*)elementNamenamespaceURI:(Nsstring*)namespaceURIqualifiedname:(Nsstring*)qualifiednameattributes:(NSDictionary*)attributeDict
{

NSLog(@"XMLParser1...elementName...%@",elementName);

}

这是我获得上述 xml 的输出

XMLParser1...elementName...xml_api_reply
XMLParser1...elementName...weather
XMLParser1...elementName...forecast_information

问题是它分析的所有标记,直到它到达"城市数据"因为巴黎 î l e de 法国,然后它就会停止的名称中有非 ascii 字符。它不会处理之后像 postal_code 的标签。纬度、 经度等。

所以我的问题是,有什么办法可以从返回的 URL XML 字符串中删除所有非 ascii 字符吗?

解决方法 1:

还行。我已经解决了此问题。这是怎么弄来的工作。

我首先做的就是用特殊字符的 URL 的 XML。然后我去掉从 XML 字符串的所有特殊字符。然后我将字符串转换为 NSdata 然后把 nsdata 对象传递给我的 NSXMLParser。因为它有没有更多特殊字符 NSXMLParser 是快乐。

这里是为任何人在将来可能会遇到的代码。大感谢您对这篇文章作出了贡献的人 !

Nsstring*address=@"http://www.google.com/ig/api?weather=Paris";
NSURL*URL=[NSURLURLWithString:address];
NSError*error;
Nsstring*XML=[NsstringstringWithContentsOfURL:URLencoding:NSASCIIStringEncodingerror:&error];

//REMOVEALLNON-ASCIICHaraCTERS
NSMutableString*asciiCharacters=[NSMutableStringstring];
for(NSIntegeri=32;i<127;i++)
{
[asciiCharactersappendFormat:@"%c",i];
}

NSCharacterSet*nonAsciiCharacterSet=[[NSCharacterSetcharacterSetWithCharactersInString:asciiCharacters]invertedSet];

XML=[[XMLcomponentsSeparatedByCharactersInSet:nonAsciiCharacterSet]componentsJoinedByString:@""];

NSData*data=[XMLdataUsingEncoding:NSUTF8StringEncoding];
NSXMLParser*parser=[[NSXMLParseralloc]initWithData:data];
[parsersetDelegate:self];
[parserparse];

相关文章

软件简介:蓝湖辅助工具,减少移动端开发中控件属性的复制和粘...
现实生活中,我们听到的声音都是时间连续的,我们称为这种信...
前言最近在B站上看到一个漂亮的仙女姐姐跳舞视频,循环看了亿...
【Android App】实战项目之仿抖音的短视频分享App(附源码和...
前言这一篇博客应该是我花时间最多的一次了,从2022年1月底至...
因为我既对接过session、cookie,也对接过JWT,今年因为工作...