设为首页
收藏本站
开启辅助访问
切换到窄版
登录
立即注册
中问网首页
我的收藏
站长博客
搜索
搜索
本版
帖子
用户
第一问答网
»
论坛
›
中问网
›
问答
›
c#.net中如何获取某HTM页面代码中内容
返回列表
发新帖
c#.net中如何获取某HTM页面代码中内容
[复制链接]
11
|
3
|
2016-11-1 19:50:46
|
显示全部楼层
|
阅读模式
我想从某个网页的htm代码中获取某些特定字符要如何获取
代码如下:
==============
? 驻守军队:
[img][/img]
11熊怪
[img][/img]
13食人魔
[img][/img]
6九头蛇怪
==============
我想要的效果就是,让网页中的显示出结果如下:
11熊怪
13食人魔
6九头蛇怪
===================
请各位高手指教,最好能给出详细的代码,我是新手如果只给思路估计我做不来!
获取的网页中代码是很长的,我只是取其中一段举例
回复
使用道具
举报
千问
|
2016-11-1 19:50:46
|
显示全部楼层
我知道 你只要知道网址就成 s中存放了那个网页的所有html代码,你只要修改那个方法 就能得到你要的数据 ,其中用到了 字符串拆分 合并 ,或者你手动给他值 都可以 比如 s.substring(1000,10)using System.IO; using System.Net; WebClient client = new WebClient(); //从http://www.dl.ro/index/utils.country/txtIp/xxx.xxx.xxx.xxx取出html码,再取得html码里区域的资讯 // Stream data = client.OpenRead("http://www.dl.ro/inde...
回复
使用道具
举报
千问
|
2016-11-1 19:50:46
|
显示全部楼层
你可以用正则,你上面的那个用这个正则就没有问题 (?i)(?\s*).+(?=\s*) 在.NET中的正则类如何用你可以到MSDN中查一下,然后接合上我给你的正则表达式就可以完成你想要的功能。补存:只要和你上面那个格式一样就没有问题。你可以改一下)span class=和,说...
回复
使用道具
举报
千问
|
2016-11-1 19:50:46
|
显示全部楼层
听起来有点不明白,你是想从别的网站抓取关键字在你自己的网站上取理吗?像新闻收集系统一样?还是在自己的网页中获取内容发回服务器取理,不过后者没有什么现实意义。如果是前者,你可以看作只读文件操作,读入流,转成字符串,之后字符串过滤...
回复
使用道具
举报
返回列表
发新帖
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
千问
主题
0
回帖
4882万
积分
论坛元老
论坛元老, 积分 48824836, 距离下一级还需 -38824837 积分
论坛元老, 积分 48824836, 距离下一级还需 -38824837 积分
积分
48824836
加好友
发消息
回复楼主
返回列表
问答
热门排行