基于HttpWebRequest的通用请求和响应处理

作者:小菜 更新时间:2025-02-19 点击数:
简介:使用HttpWebRequest和HttpWebResponse在后台进行文件的提交,可以替代使用前台form提交的方式,HttpWebRequest用来测试某

【菜科解读】

使用HttpWebRequest和HttpWebResponse在后台进行文件的提交,可以替代使用前台form提交的方式,HttpWebRequest用来测试某网页的速度是500多毫秒,而IE速度很快只有不到100毫秒,如何才能提高HttpWebRequest的响应速度?------解决方案--------------------------------------------------------看看服务器是否支持压缩,如果服务器支持压缩可能是因为IE接收的是压缩数据,你的程序时接收未压缩数据,所以比IE慢。

Httpwebrequest 的速度应该比IE快才对, 它不用渲染,HttpWebRequest是经过层层封装后得到的东西,IE应该是直接调用系统底层的方法,所以会比较快。

我使用过程中遇到的最大挑战是以下几个问题:a. 如何处理chunked的页面b. 如何处理gzip过的页面c. 如何自动判断文本编码d. 如何使用CookieContainer我们一个一个来,先从第一个开始。

chunked是常用的web服务器设置,也经常与gzip一起使用,

a. 如何处理chunked的页面

(fiddler的Response Header视图截图)

chunked的好处最主要的是页面优化,浏览器通常会在接收完第一个chunked块之后开始解析页面,而不是等到整个页面加载完成。

关于chunked的传输细节有兴趣的朋友可以继续阅读以下两篇文章http 《chunked传输》 《HTTP chunked+gzip及浏览器兼容测试》

由于页面的chunked,我们必须通过stream方式来获得数据,且由于之后要对获得的Stream进行gzip解密,所以我们需要把Stream暂时保存到MemoryStream中,如下所示:

MemoryStream memory = null; int length = 0; if (res.ContentLength > 0) { length = (int)res.ContentLength; } else{ length = 8000; } memory = new MemoryStream(length); Byte[] buf = new byte[4096]; Stream resStream = res.GetResponseStream(); int count = 0; do{ count = resStream.Read(buf, 0, buf.Length); if (count != 0) { memory.Write(buf, 0, count); } } while (count > 0);

这里利用ContentLength获取实际大小,但在有些情况下,ContentLength取不到,就会有个默认大小8000。

当然这只是MemoryStream初始,如果Write的时候超过,它会自动增加大小(我记得是默认大小的两倍)。

b. 如何处理gzip

gzip的好处想必不用我说了吧,自然是传输大小更小,动态压缩,目前大部分门户都会打开这个选项,其平均压缩效果可以达到不开之前的40%左右,以下是处理gzip的代码:

Stream responseStream = null; //handle gzip or deflate stream if (res.ContentEncoding.ToLower().Contains("gzip")) { responseStream = new GZipStream(memory, CompressionMode.Decompress); } else if (res.ContentEncoding.ToLower().Contains("deflate")) { responseStream = new DeflateStream(memory, CompressionMode.Decompress); } else{ responseStream = memory; }

压缩方式可以通过ContentEncoding属性获得,这里同时也处理了deflate的压缩方式,不过目前我没遇到过这种网站,这代码是拷贝过来的,呵呵。

c. 如何自动判断文本编码

编码问题往往是让人头疼的问题,因为某些情况你拿到的数据会变成乱码,这就表示编码没有处理好。

页面的实际编码是保存在ContentType中的,如下所示

(fiddler的Response Header视图截图)

这里的charset就是我们需要的编码信息,编码的自动选择全靠它了,编码的真正作用发生在我们把刚才的responseStream转换为string,代码如下所示:

int charsetPos = res.ContentType.IndexOf("charset="); string encoding = "UTF-8"; if (charsetPos >= 0) { int semicolonPos = res.ContentType.IndexOf(";", charsetPos); encoding = res.ContentType.Substring(charsetPos + 8, semicolonPos > 0 ? semicolonPos - charsetPos - 8 : res.ContentType.Length - charsetPos - 8); } var oEncoding = Encoding.GetEncoding(encoding); using (StreamReader sr = new StreamReader(responseStream, oEncoding)) { content = sr.ReadToEnd(); }

我这边用了比较原始的方法,没有用正则表达式,如果你觉得这个方法很挫,你可以换成正则表达式。

看到没,StreamReader通过oEncoding得知该用哪种编码来把byte[]转换为String。

(这里牵扯到几年前我做过的一道面试题:String和byte[]如何进行转换?说说你的经验。

这道题虽然很多公司不面,但我倒觉得这道题是可以深入的,因为encoding其实是个很不错的面试话题,也很考基础知识。

d. 如何使用CookieContainer

通常呢,稍微有点防御的网站都会验cookie,或者放个身份认证的cookie,如何在请求中放cookie呢,自然是靠CookieContainer(其实也可以通过AddHttpHeader,但本文只讨论CookieContainer,好处等会儿说,先卖个关子。

)CookieContainer的接口有点搞,因为既有Add,也有SetCookie,我一开始就上了老当,用了Add,结果没有效果。

SetCookies才是正确的方法,这个方法即可以一次性设置完所有的cookie,也可以一个一个设置,如下:

CookieContainer cookieContainer = new CookieContainer(); cookieContainer.SetCookies(new Uri(hostname), new Cookie("aaa", "98d4c408-7923-443a-ba3f-99df3bea7792", "/", "a.com").ToString()); cookieContainer.SetCookies(new Uri(hostname), new Cookie("bbb", "0", "/", "a.com").ToString()); cookieContainer.SetCookies(new Uri(hostname), new Cookie("ccc", "0", "/", "a.com").ToString()); HttpWebRequest req = (HttpWebRequest)WebRequest.Create(url); req.Headers.Add(HttpRequestHeader.AcceptEncoding, "gzip,deflate"); req.AllowAutoRedirect = true; req.Accept = "text/html, application/xhtml+xml, */*"; req.Timeout = 50000; req.Method = "GET"; req.CookieContainer = cookieContainer; var response = (HttpWebResponse)req.GetResponse();

这里使用Cookie而非直接用字符串是出于安全考虑,因为Cookie对象的ToString自动帮我们把encoding做掉了,所以这么写会比直接用字符串来的安全,SetCookies是需要指定Url的,不过通常对于同一个网站host应该是一样的,比如www.a.com,不过目前还没遇到过跨域问题,等遇到了我单独写一篇讨论,跨域可又是另外一个头疼的问题了。

这里要说一下CookieContainer和AddHttpHeader的区别,首先这两个不能同时使用,只能用一个,其次CookieContainer毕竟是容器,所以理论上可以把另外一个请求的cookie一起带过来,然后实现cookie传递逻辑,而AddHttpHeader做不到这一点,这是最大的区别。

先写到这,大家有什么关于HttpWebRequest的其他心得可以发在回复中,我会整理后更新这个帖子。

基于,HttpWebRequest,的,通用,请,求和,响应

麦田怪圈的形成真相至今都是未解的谜团

关于麦田怪圈的成因,目前还不能得出确切的结论。

形状各异的麦田怪圈频频出现,人们对此进行了诸多猜测。

有人认为是人为的,也有人认为是外星人所为。

麦田怪圈的发现麦田怪圈是发生在农田里的神奇现象。

一些农作物被未知的力量压倒后,从空往下看,会形成形状各异的精美图案。

麦田怪圈最早是由英国人发现的,时间可以追溯到20世纪80年代左右。

这个神奇的现象被人们广为流传。

随着时间的推移,麦田怪圈的名气越来越大,甚至出现的频率也有了明显的提高,范围也逐渐扩散到世界各地,呈现的图案也变成了各种不规则的形状。

各种猜测很多研究者对麦田怪圈的出现很好奇。

这种神奇的现象也吸引了大量来自世界各地的游客,越来越多的人会来这里拍照。

麦田怪圈能否出现是人为的还是隐藏的,目前不得而知。

如果这个神奇的设计只是为了促进当地旅游业的发展,吸引游客前来观赏,那似乎就不太合理了。

无论科学专家尝试什么方法,他们都不能完美地复制出一个相同的麦田怪圈。

麦田怪圈的原因普通人要想在一夜之间完成这么大工作量的麦田怪圈,是绝对无法保证麦秸根部不被破坏的。

一些研究人员认为,麦田怪圈可能与龙卷风有关,一些作物因风的影响而自然倾斜。

从空的高度往下看,可以看到一个无与伦比的格局。

这些图案形成的原因是什么,科学界至今没有给出确切的答案。

霍金在生前做出的预言是对人类未来的警告吗?霍金临终

著名物理学家霍金先生生前的预言,更像是对人类的警告。

看似善意的提醒,但语气明显很严肃。

如果人们继续放任不管,人类文明很可能在未来被现实吞噬。

霍金先生的一生大多数人对霍金的印象是他坐在轮椅上。

当他第一次出现在银幕上时,他不能离开轮椅,所以人们一致认为他是一个科学怪人。

但实际上,霍金先生只是一个身患绝症多年,一直在与命运抗争的普通人。

与其他健康的科学家相比,霍金先生取得了许多科学成就。

其实都是在比较困难的情况下获得的。

他会表现出对这个世界的爱,他绝不会因为自己身患重病而浪费自己的时间。

相反,他付出了比常人多几百倍的努力。

霍金先生的预言霍金先生似乎有一种超验的观点。

他生前曾做过各种预言,总是向世人描述未来的可能性。

他的预言似乎与人类未来的发展息息相关,引起了人们的深思。

霍金先生认为人类应该尽快开发太空领域。

在宇宙中寻找新的家园,便于人类进行千禧年后的星际迁徙计划,否则人类文明将面临毁灭的危机。

霍金先生没有直接分析地球的寿命。

相反,它从长远发展的角度分析了全球灭绝的问题。

如今,地球上的生态环境正日益遭到破坏。

也许在未来,地球真的不再适合人类居住了。

这更像是一个警告,在分析了霍金先生的预测后,一些人仍然保持怀疑。

霍金先生的善意提醒似乎更像是一种警告。

他试图从科学的角度分析利害关系。

如果地球生态环境继续恶化,人类文明将难以正常延续。

加入收藏
               

基于HttpWebRequest的通用请求和响应处理

点击下载文档

格式为doc格式

  • 账号登录
社交账号登录