C#利用WebClient和WebRequest获取网页源代码
摘要:本文介绍了两种在.NET中获取网页源代码的方法。第一种使用WebClient类,通过DownloadData方法下载网页数据并转换为指定编码的字符串。第二种使用WebRequest/WebResponse模型,通过创建请求、获取响应流,并用StreamReader读取指定编码的内容。两种方法都需注意字符编码问题(GB2312或UTF-8),并提供了完整的代码示例,包括网络凭据设置和资源释放操
WebClient类获取网页源代码
WebClient类在System.Net命名空间下,WebClient类向URI标识的任何本地、Intranet或Internet资源发送数据以及从这些资源接收数据的方法。
using System.IO;
using System.Net;
using System.Text;
PageUrl = "http://www.webkaka.com"; //获取源代码的网页
WebClient wc = new WebClient(); // 创建WebClient实例提供向URI
wc.Credentials = CredentialCache.DefaultCredentials; // 获取或设置Internet 请求进行身份验证的网络凭据。
Encoding enc = Encoding.GetEncoding("GB2312"); // 乱码就改成 utf-8 或 GB2312
Byte[] pageData = wc.DownloadData(PageUrl);
ContentHtml.Text = enc.GetString(pageData); // 输出字符串HTML代码
WebRequest类获取网页源代码
WebRequest类是.NET Framework中“请求/响应”模型的abstract基类,用于访问Internet数据。应用程序处理WebRequest类的实例,而协议特定的子类则执行请求的具体细节,请求从应用程序发送到某个特定的URI。注册WebRequest子类通常是为了处理某个特定的协议(如HTTP或FTP),但是也可以注册它以处理对特定服务器或服务器上的路径的请求。
WebRequest类中最常用的是Create方法,为指定的URI方案初始化新的WebRequest实例。
public static WebRequest Create
(
string requestUriString
)
注意:Create方法将运行时 WebRequest 类的子类作为与requestUri最接近的注册匹配项返回。如,以http://的URI在requestUri中传递时,由Create返回HttpWebRequest。如果为传递以file://开头的URI,则Create将返回FileWebRequest实例。.
WebResponse类是abstract基类,特定的响应类从该抽象基类派生。而从WebResponse类派生的协议特定的类携带请求的详细信息。
public virtual WebResponse GetResponse ()
返回值:对Internet请求的响应的WebResponse。
using System.IO;
using System.Net;
using System.Text;
PageUrl = "http://www.webkaka.com"; //获取源代码的网页
WebRequest request = WebRequest.Create(PageUrl); //返回WebRequest的子类HttpWebRequest
WebResponse response = request.GetResponse(); //返回对 Internet 请求的响应
Stream resStream = response.GetResponseStream(); //从 Internet 资源返回数据流。
Encoding enc = Encoding.GetEncoding("GB2312"); // 乱码就改成 utf-8 / GB2312
StreamReader sr = new StreamReader(resStream, enc); //以一种特定的编码从字节流中读取字符。
ContentHtml.Text = sr.ReadToEnd(); //输出HTML代码
sr.Close();
更多推荐



所有评论(0)